Series comparison

-[PULL 00/63] riscv-to-apply queue
+[PULL v2 00/45] riscv-to-apply queue
-The following changes since commit 553cf5d7c47bee05a3dec9461c1f8430316d516b:
+The following changes since commit c5ea91da443b458352c1b629b490ee6631775cb4:
-  Merge remote-tracking branch 'remotes/pmaydell/tags/pull-target-arm-20200626' into staging (2020-06-26 18:22:36 +0100)
+  Merge tag 'pull-trivial-patches' of https://gitlab.com/mjt0k/qemu into staging (2023-09-08 10:06:25 -0400)
 are available in the Git repository at:
-  git@github.com:alistair23/qemu.git tags/pull-riscv-to-apply-20200626-1
+  https://github.com/alistair23/qemu.git tags/pull-riscv-to-apply-20230911
-for you to fetch changes up to b39d59434ea10649fdb9e0a339c30c76e38c5e17:
+for you to fetch changes up to e7a03409f29e2da59297d55afbaec98c96e43e3a:
-  target/riscv: configure and turn on vector extension from command line (2020-06-26 14:22:15 -0700)
+  target/riscv: don't read CSR in riscv_csrrw_do64 (2023-09-11 11:45:55 +1000)
 ----------------------------------------------------------------
-This PR contains two patches to improve PLIC support in QEMU.
+First RISC-V PR for 8.2
-The rest of the PR is adding support for the v0.7.1 RISC-V vector
+ * Remove 'host' CPU from TCG
-extensions. This is experimental support as the vector extensions are
+ * riscv_htif Fixup printing on big endian hosts
-still in a draft state.
+ * Add zmmul isa string
  * Add smepmp isa string
  * Fix page_check_range use in fault-only-first
  * Use existing lookup tables for MixColumns
  * Add RISC-V vector cryptographic instruction set support
  * Implement WARL behaviour for mcountinhibit/mcounteren
  * Add Zihintntl extension ISA string to DTS
  * Fix zfa fleq.d and fltq.d
  * Fix upper/lower mtime write calculation
  * Make rtc variable names consistent
  * Use abi type for linux-user target_ucontext
  * Add RISC-V KVM AIA Support
  * Fix riscv,pmu DT node path in the virt machine
  * Update CSR bits name for svadu extension
  * Mark zicond non-experimental
  * Fix satp_mode_finalize() when satp_mode.supported = 0
  * Fix non-KVM --enable-debug build
  * Add new extensions to hwprobe
  * Use accelerated helper for AES64KS1I
  * Allocate itrigger timers only once
  * Respect mseccfg.RLB for pmpaddrX changes
  * Align the AIA model to v1.0 ratified spec
  * Don't read the CSR in riscv_csrrw_do64
 ----------------------------------------------------------------
-Jessica Clarke (2):
+Akihiko Odaki (1):
-      riscv: plic: Honour source priorities
+      target/riscv: Allocate itrigger timers only once
       riscv: plic: Add a couple of mising sifive_plic_update calls
-LIU Zhiwei (61):
+Ard Biesheuvel (2):
-      target/riscv: add vector extension field in CPURISCVState
+      target/riscv: Use existing lookup tables for MixColumns
-      target/riscv: implementation-defined constant parameters
+      target/riscv: Use accelerated helper for AES64KS1I
       target/riscv: support vector extension csr
       target/riscv: add vector configure instruction
       target/riscv: add an internals.h header
       target/riscv: add vector stride load and store instructions
       target/riscv: add vector index load and store instructions
       target/riscv: add fault-only-first unit stride load
       target/riscv: add vector amo operations
       target/riscv: vector single-width integer add and subtract
       target/riscv: vector widening integer add and subtract
       target/riscv: vector integer add-with-carry / subtract-with-borrow instructions
       target/riscv: vector bitwise logical instructions
       target/riscv: vector single-width bit shift instructions
       target/riscv: vector narrowing integer right shift instructions
       target/riscv: vector integer comparison instructions
       target/riscv: vector integer min/max instructions
       target/riscv: vector single-width integer multiply instructions
       target/riscv: vector integer divide instructions
       target/riscv: vector widening integer multiply instructions
       target/riscv: vector single-width integer multiply-add instructions
       target/riscv: vector widening integer multiply-add instructions
       target/riscv: vector integer merge and move instructions
       target/riscv: vector single-width saturating add and subtract
       target/riscv: vector single-width averaging add and subtract
       target/riscv: vector single-width fractional multiply with rounding and saturation
       target/riscv: vector widening saturating scaled multiply-add
       target/riscv: vector single-width scaling shift instructions
       target/riscv: vector narrowing fixed-point clip instructions
       target/riscv: vector single-width floating-point add/subtract instructions
       target/riscv: vector widening floating-point add/subtract instructions
       target/riscv: vector single-width floating-point multiply/divide instructions
       target/riscv: vector widening floating-point multiply
       target/riscv: vector single-width floating-point fused multiply-add instructions
       target/riscv: vector widening floating-point fused multiply-add instructions
       target/riscv: vector floating-point square-root instruction
       target/riscv: vector floating-point min/max instructions
       target/riscv: vector floating-point sign-injection instructions
       target/riscv: vector floating-point compare instructions
       target/riscv: vector floating-point classify instructions
       target/riscv: vector floating-point merge instructions
       target/riscv: vector floating-point/integer type-convert instructions
       target/riscv: widening floating-point/integer type-convert instructions
       target/riscv: narrowing floating-point/integer type-convert instructions
       target/riscv: vector single-width integer reduction instructions
       target/riscv: vector wideing integer reduction instructions
       target/riscv: vector single-width floating-point reduction instructions
       target/riscv: vector widening floating-point reduction instructions
       target/riscv: vector mask-register logical instructions
       target/riscv: vector mask population count vmpopc
       target/riscv: vmfirst find-first-set mask bit
       target/riscv: set-X-first mask bit
       target/riscv: vector iota instruction
       target/riscv: vector element index instruction
       target/riscv: integer extract instruction
       target/riscv: integer scalar move instruction
       target/riscv: floating-point scalar move instructions
       target/riscv: vector slide instructions
       target/riscv: vector register gather instruction
       target/riscv: vector compress instruction
       target/riscv: configure and turn on vector extension from command line
- target/riscv/cpu.h                      |   82 +-
+Conor Dooley (1):
- target/riscv/cpu_bits.h                 |   15 +
+      hw/riscv: virt: Fix riscv,pmu DT node path
  target/riscv/helper.h                   | 1069 +++++++
  target/riscv/internals.h                |   41 +
  target/riscv/insn32-64.decode           |   11 +
  target/riscv/insn32.decode              |  372 +++
  hw/riscv/sifive_plic.c                  |   20 +-
  target/riscv/cpu.c                      |   50 +
  target/riscv/csr.c                      |   75 +-
  target/riscv/fpu_helper.c               |   33 +-
  target/riscv/insn_trans/trans_rvv.inc.c | 2888 ++++++++++++++++++
  target/riscv/translate.c                |   27 +-
  target/riscv/vector_helper.c            | 4899 +++++++++++++++++++++++++++++++
  target/riscv/Makefile.objs              |    2 +-
 files changed, 9534 insertions(+), 50 deletions(-)
  create mode 100644 target/riscv/internals.h
  create mode 100644 target/riscv/insn_trans/trans_rvv.inc.c
  create mode 100644 target/riscv/vector_helper.c
+Daniel Henrique Barboza (6):
+      target/riscv/cpu.c: do not run 'host' CPU with TCG
+      target/riscv/cpu.c: add zmmul isa string
+      target/riscv/cpu.c: add smepmp isa string
+      target/riscv: fix satp_mode_finalize() when satp_mode.supported = 0
+      hw/riscv/virt.c: fix non-KVM --enable-debug build
+      hw/intc/riscv_aplic.c fix non-KVM --enable-debug build
+Dickon Hood (2):
+      target/riscv: Refactor translation of vector-widening instruction
+      target/riscv: Add Zvbb ISA extension support
+Jason Chien (3):
+      target/riscv: Add Zihintntl extension ISA string to DTS
+      hw/intc: Fix upper/lower mtime write calculation
+      hw/intc: Make rtc variable names consistent
+Kiran Ostrolenk (4):
+      target/riscv: Refactor some of the generic vector functionality
+      target/riscv: Refactor vector-vector translation macro
+      target/riscv: Refactor some of the generic vector functionality
+      target/riscv: Add Zvknh ISA extension support
+LIU Zhiwei (3):
+      target/riscv: Fix page_check_range use in fault-only-first
+      target/riscv: Fix zfa fleq.d and fltq.d
+      linux-user/riscv: Use abi type for target_ucontext
+Lawrence Hunter (2):
+      target/riscv: Add Zvbc ISA extension support
+      target/riscv: Add Zvksh ISA extension support
+Leon Schuermann (1):
+      target/riscv/pmp.c: respect mseccfg.RLB for pmpaddrX changes
+Max Chou (3):
+      crypto: Create sm4_subword
+      crypto: Add SM4 constant parameter CK
+      target/riscv: Add Zvksed ISA extension support
+Nazar Kazakov (4):
+      target/riscv: Remove redundant "cpu_vl == 0" checks
+      target/riscv: Move vector translation checks
+      target/riscv: Add Zvkned ISA extension support
+      target/riscv: Add Zvkg ISA extension support
+Nikita Shubin (1):
+      target/riscv: don't read CSR in riscv_csrrw_do64
+Rob Bradford (1):
+      target/riscv: Implement WARL behaviour for mcountinhibit/mcounteren
+Robbin Ehn (1):
+      linux-user/riscv: Add new extensions to hwprobe
+Thomas Huth (2):
+      hw/char/riscv_htif: Fix printing of console characters on big endian hosts
+      hw/char/riscv_htif: Fix the console syscall on big endian hosts
+Tommy Wu (1):
+      target/riscv: Align the AIA model to v1.0 ratified spec
+Vineet Gupta (1):
+      riscv: zicond: make non-experimental
+Weiwei Li (1):
+      target/riscv: Update CSR bits name for svadu extension
+Yong-Xuan Wang (5):
+      target/riscv: support the AIA device emulation with KVM enabled
+      target/riscv: check the in-kernel irqchip support
+      target/riscv: Create an KVM AIA irqchip
+      target/riscv: update APLIC and IMSIC to support KVM AIA
+      target/riscv: select KVM AIA in riscv virt machine
+ include/crypto/aes.h                      |   7 +
+ include/crypto/sm4.h                      |   9 +
+ target/riscv/cpu_bits.h                   |   8 +-
+ target/riscv/cpu_cfg.h                    |   9 +
+ target/riscv/debug.h                      |   3 +-
+ target/riscv/helper.h                     |  98 +++
+ target/riscv/kvm_riscv.h                  |   5 +
+ target/riscv/vector_internals.h           | 228 +++++++
+ target/riscv/insn32.decode                |  58 ++
+ crypto/aes.c                              |   4 +-
+ crypto/sm4.c                              |  10 +
+ hw/char/riscv_htif.c                      |  12 +-
+ hw/intc/riscv_aclint.c                    |  11 +-
+ hw/intc/riscv_aplic.c                     |  52 +-
+ hw/intc/riscv_imsic.c                     |  25 +-
+ hw/riscv/virt.c                           | 374 ++++++------
+ linux-user/riscv/signal.c                 |   4 +-
+ linux-user/syscall.c                      |  14 +-
+ target/arm/tcg/crypto_helper.c            |  10 +-
+ target/riscv/cpu.c                        |  83 ++-
+ target/riscv/cpu_helper.c                 |   6 +-
+ target/riscv/crypto_helper.c              |  51 +-
+ target/riscv/csr.c                        |  54 +-
+ target/riscv/debug.c                      |  15 +-
+ target/riscv/kvm.c                        | 201 ++++++-
+ target/riscv/pmp.c                        |   4 +
+ target/riscv/translate.c                  |   1 +
+ target/riscv/vcrypto_helper.c             | 970 ++++++++++++++++++++++++++++++
+ target/riscv/vector_helper.c              | 245 +-------
+ target/riscv/vector_internals.c           |  81 +++
+ target/riscv/insn_trans/trans_rvv.c.inc   | 171 +++---
+ target/riscv/insn_trans/trans_rvvk.c.inc  | 606 +++++++++++++++++++
+ target/riscv/insn_trans/trans_rvzfa.c.inc |   4 +-
+ target/riscv/meson.build                  |   4 +-
+files changed, 2785 insertions(+), 652 deletions(-)
+ create mode 100644 target/riscv/vector_internals.h
+ create mode 100644 target/riscv/vcrypto_helper.c
+ create mode 100644 target/riscv/vector_internals.c
+ create mode 100644 target/riscv/insn_trans/trans_rvvk.c.inc

-[PULL 61/63] target/riscv: vector register gather instruction
+[PULL v2 01/45] target/riscv/cpu.c: do not run 'host' CPU with TCG
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+The 'host' CPU is available in a CONFIG_KVM build and it's currently
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+available for all accels, but is a KVM only CPU. This means that in a
-Message-id: 20200623215920.2594-60-zhiwei_liu@c-sky.com
+RISC-V KVM capable host we can do things like this:
 $ ./build/qemu-system-riscv64 -M virt,accel=tcg -cpu host --nographic
 qemu-system-riscv64: H extension requires priv spec 1.12.0
 This CPU does not have a priv spec because we don't filter its extensions
 via priv spec. We shouldn't be reaching riscv_cpu_realize_tcg() at all
 with the 'host' CPU.
 We don't have a way to filter the 'host' CPU out of the available CPU
 options (-cpu help) if the build includes both KVM and TCG. What we can
 do is to error out during riscv_cpu_realize_tcg() if the user chooses
 the 'host' CPU with accel=tcg:
 $ ./build/qemu-system-riscv64 -M virt,accel=tcg -cpu host --nographic
 qemu-system-riscv64: 'host' CPU is not compatible with TCG acceleration
 Signed-off-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
 Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Message-Id: <20230721133411.474105-1-dbarboza@ventanamicro.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   |  9 +++
+ target/riscv/cpu.c | 5 +++++
- target/riscv/insn32.decode              |  3 +
+file changed, 5 insertions(+)
  target/riscv/insn_trans/trans_rvv.inc.c | 78 +++++++++++++++++++++++++
  target/riscv/vector_helper.c            | 60 +++++++++++++++++++
 files changed, 150 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/target/riscv/cpu.c
-+++ b/target/riscv/helper.h
++++ b/target/riscv/cpu.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vslide1down_vx_b, void, ptr, ptr, tl, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ static void riscv_cpu_realize_tcg(DeviceState *dev, Error **errp)
- DEF_HELPER_6(vslide1down_vx_h, void, ptr, ptr, tl, ptr, env, i32)
+     CPURISCVState *env = &cpu->env;
- DEF_HELPER_6(vslide1down_vx_w, void, ptr, ptr, tl, ptr, env, i32)
+     Error *local_err = NULL;
- DEF_HELPER_6(vslide1down_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+
++    if (object_dynamic_cast(OBJECT(dev), TYPE_RISCV_CPU_HOST)) {
-+DEF_HELPER_6(vrgather_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
++        error_setg(errp, "'host' CPU is not compatible with TCG acceleration");
-+DEF_HELPER_6(vrgather_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++        return;
 +DEF_HELPER_6(vrgather_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vrgather_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vrgather_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vrgather_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vrgather_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vrgather_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@ vslide1up_vx    001110 . ..... ..... 110 ..... 1010111 @r_vm
  vslidedown_vx   001111 . ..... ..... 100 ..... 1010111 @r_vm
  vslidedown_vi   001111 . ..... ..... 011 ..... 1010111 @r_vm
  vslide1down_vx  001111 . ..... ..... 110 ..... 1010111 @r_vm
 +vrgather_vv     001100 . ..... ..... 000 ..... 1010111 @r_vm
 +vrgather_vx     001100 . ..... ..... 100 ..... 1010111 @r_vm
 +vrgather_vi     001100 . ..... ..... 011 ..... 1010111 @r_vm
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ GEN_OPIVI_TRANS(vslideup_vi, 1, vslideup_vx, slideup_check)
  GEN_OPIVX_TRANS(vslidedown_vx, opivx_check)
  GEN_OPIVX_TRANS(vslide1down_vx, opivx_check)
  GEN_OPIVI_TRANS(vslidedown_vi, 1, vslidedown_vx, opivx_check)
 +
 +/* Vector Register Gather Instruction */
 +static bool vrgather_vv_check(DisasContext *s, arg_rmrr *a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_overlap_mask(s, a->rd, a->vm, true) &&
 +            vext_check_reg(s, a->rd, false) &&
 +            vext_check_reg(s, a->rs1, false) &&
 +            vext_check_reg(s, a->rs2, false) &&
 +            (a->rd != a->rs2) && (a->rd != a->rs1));
 +}
 +
 +GEN_OPIVV_TRANS(vrgather_vv, vrgather_vv_check)
 +
 +static bool vrgather_vx_check(DisasContext *s, arg_rmrr *a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_overlap_mask(s, a->rd, a->vm, true) &&
 +            vext_check_reg(s, a->rd, false) &&
 +            vext_check_reg(s, a->rs2, false) &&
 +            (a->rd != a->rs2));
 +}
 +
 +/* vrgather.vx vd, vs2, rs1, vm # vd[i] = (x[rs1] >= VLMAX) ? 0 : vs2[rs1] */
 +static bool trans_vrgather_vx(DisasContext *s, arg_rmrr *a)
 +{
 +    if (!vrgather_vx_check(s, a)) {
 +        return false;
 +    }
 +
-+    if (a->vm && s->vl_eq_vlmax) {
+     riscv_cpu_validate_misa_mxl(cpu, &local_err);
-+        int vlmax = s->vlen / s->mlen;
+     if (local_err != NULL) {
-+        TCGv_i64 dest = tcg_temp_new_i64();
+         error_propagate(errp, local_err);
 +
 +        if (a->rs1 == 0) {
 +            vec_element_loadi(s, dest, a->rs2, 0);
 +        } else {
 +            vec_element_loadx(s, dest, a->rs2, cpu_gpr[a->rs1], vlmax);
 +        }
 +
 +        tcg_gen_gvec_dup_i64(s->sew, vreg_ofs(s, a->rd),
 +                             MAXSZ(s), MAXSZ(s), dest);
 +        tcg_temp_free_i64(dest);
 +    } else {
 +        static gen_helper_opivx * const fns[4] = {
 +            gen_helper_vrgather_vx_b, gen_helper_vrgather_vx_h,
 +            gen_helper_vrgather_vx_w, gen_helper_vrgather_vx_d
 +        };
 +        return opivx_trans(a->rd, a->rs1, a->rs2, a->vm, fns[s->sew], s);
 +    }
 +    return true;
 +}
 +
 +/* vrgather.vi vd, vs2, imm, vm # vd[i] = (imm >= VLMAX) ? 0 : vs2[imm] */
 +static bool trans_vrgather_vi(DisasContext *s, arg_rmrr *a)
 +{
 +    if (!vrgather_vx_check(s, a)) {
 +        return false;
 +    }
 +
 +    if (a->vm && s->vl_eq_vlmax) {
 +        if (a->rs1 >= s->vlen / s->mlen) {
 +            tcg_gen_gvec_dup_imm(SEW64, vreg_ofs(s, a->rd),
 +                                 MAXSZ(s), MAXSZ(s), 0);
 +        } else {
 +            tcg_gen_gvec_dup_mem(s->sew, vreg_ofs(s, a->rd),
 +                                 endian_ofs(s, a->rs2, a->rs1),
 +                                 MAXSZ(s), MAXSZ(s));
 +        }
 +    } else {
 +        static gen_helper_opivx * const fns[4] = {
 +            gen_helper_vrgather_vx_b, gen_helper_vrgather_vx_h,
 +            gen_helper_vrgather_vx_w, gen_helper_vrgather_vx_d
 +        };
 +        return opivi_trans(a->rd, a->rs1, a->rs2, a->vm, fns[s->sew], s, 1);
 +    }
 +    return true;
 +}
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VSLIDE1DOWN_VX(vslide1down_vx_b, uint8_t, H1, clearb)
  GEN_VEXT_VSLIDE1DOWN_VX(vslide1down_vx_h, uint16_t, H2, clearh)
  GEN_VEXT_VSLIDE1DOWN_VX(vslide1down_vx_w, uint32_t, H4, clearl)
  GEN_VEXT_VSLIDE1DOWN_VX(vslide1down_vx_d, uint64_t, H8, clearq)
 +
 +/* Vector Register Gather Instruction */
 +#define GEN_VEXT_VRGATHER_VV(NAME, ETYPE, H, CLEAR_FN)                    \
 +void HELPER(NAME)(void *vd, void *v0, void *vs1, void *vs2,               \
 +                  CPURISCVState *env, uint32_t desc)                      \
 +{                                                                         \
 +    uint32_t mlen = vext_mlen(desc);                                      \
 +    uint32_t vlmax = env_archcpu(env)->cfg.vlen / mlen;                   \
 +    uint32_t vm = vext_vm(desc);                                          \
 +    uint32_t vl = env->vl;                                                \
 +    uint32_t index, i;                                                    \
 +                                                                          \
 +    for (i = 0; i < vl; i++) {                                            \
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {                        \
 +            continue;                                                     \
 +        }                                                                 \
 +        index = *((ETYPE *)vs1 + H(i));                                   \
 +        if (index >= vlmax) {                                             \
 +            *((ETYPE *)vd + H(i)) = 0;                                    \
 +        } else {                                                          \
 +            *((ETYPE *)vd + H(i)) = *((ETYPE *)vs2 + H(index));           \
 +        }                                                                 \
 +    }                                                                     \
 +    CLEAR_FN(vd, vl, vl * sizeof(ETYPE), vlmax * sizeof(ETYPE));          \
 +}
 +
 +/* vd[i] = (vs1[i] >= VLMAX) ? 0 : vs2[vs1[i]]; */
 +GEN_VEXT_VRGATHER_VV(vrgather_vv_b, uint8_t, H1, clearb)
 +GEN_VEXT_VRGATHER_VV(vrgather_vv_h, uint16_t, H2, clearh)
 +GEN_VEXT_VRGATHER_VV(vrgather_vv_w, uint32_t, H4, clearl)
 +GEN_VEXT_VRGATHER_VV(vrgather_vv_d, uint64_t, H8, clearq)
 +
 +#define GEN_VEXT_VRGATHER_VX(NAME, ETYPE, H, CLEAR_FN)                    \
 +void HELPER(NAME)(void *vd, void *v0, target_ulong s1, void *vs2,         \
 +                  CPURISCVState *env, uint32_t desc)                      \
 +{                                                                         \
 +    uint32_t mlen = vext_mlen(desc);                                      \
 +    uint32_t vlmax = env_archcpu(env)->cfg.vlen / mlen;                   \
 +    uint32_t vm = vext_vm(desc);                                          \
 +    uint32_t vl = env->vl;                                                \
 +    uint32_t index = s1, i;                                               \
 +                                                                          \
 +    for (i = 0; i < vl; i++) {                                            \
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {                        \
 +            continue;                                                     \
 +        }                                                                 \
 +        if (index >= vlmax) {                                             \
 +            *((ETYPE *)vd + H(i)) = 0;                                    \
 +        } else {                                                          \
 +            *((ETYPE *)vd + H(i)) = *((ETYPE *)vs2 + H(index));           \
 +        }                                                                 \
 +    }                                                                     \
 +    CLEAR_FN(vd, vl, vl * sizeof(ETYPE), vlmax * sizeof(ETYPE));          \
 +}
 +
 +/* vd[i] = (x[rs1] >= VLMAX) ? 0 : vs2[rs1] */
 +GEN_VEXT_VRGATHER_VX(vrgather_vx_b, uint8_t, H1, clearb)
 +GEN_VEXT_VRGATHER_VX(vrgather_vx_h, uint16_t, H2, clearh)
 +GEN_VEXT_VRGATHER_VX(vrgather_vx_w, uint32_t, H4, clearl)
 +GEN_VEXT_VRGATHER_VX(vrgather_vx_d, uint64_t, H8, clearq)
 --
-.27.0
+.41.0

-[PULL 59/63] target/riscv: floating-point scalar move instructions
+[PULL v2 02/45] hw/char/riscv_htif: Fix printing of console characters on big endian hosts
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Thomas Huth <thuth@redhat.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+The character that should be printed is stored in the 64 bit "payload"
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+variable. The code currently tries to print it by taking the address
-Message-id: 20200623215920.2594-58-zhiwei_liu@c-sky.com
+of the variable and passing this pointer to qemu_chr_fe_write(). However,
 this only works on little endian hosts where the least significant bits
 are stored on the lowest address. To do this in a portable way, we have
 to store the value in an uint8_t variable instead.
 Fixes: 5033606780 ("RISC-V HTIF Console")
 Signed-off-by: Thomas Huth <thuth@redhat.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
 Reviewed-by: Bin Meng <bmeng@tinylab.org>
 Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Message-Id: <20230721094720.902454-2-thuth@redhat.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/insn32.decode              |  3 ++
+ hw/char/riscv_htif.c | 3 ++-
- target/riscv/insn_trans/trans_rvv.inc.c | 49 +++++++++++++++++++++++++
+file changed, 2 insertions(+), 1 deletion(-)
 files changed, 52 insertions(+)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
+diff --git a/hw/char/riscv_htif.c b/hw/char/riscv_htif.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
+--- a/hw/char/riscv_htif.c
-+++ b/target/riscv/insn32.decode
++++ b/hw/char/riscv_htif.c
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ static void htif_handle_tohost_write(HTIFState *s, uint64_t val_written)
- @r2_vm   ...... vm:1 ..... ..... ... ..... ....... &rmr %rs2 %rd
+             s->tohost = 0; /* clear to indicate we read */
- @r1_vm   ...... vm:1 ..... ..... ... ..... ....... %rd
+             return;
- @r_nfvm  ... ... vm:1 ..... ..... ... ..... ....... &rnfvm %nf %rs2 %rs1 %rd
+         } else if (cmd == HTIF_CONSOLE_CMD_PUTC) {
-+@r2rd    .......   ..... ..... ... ..... ....... %rs2 %rd
+-            qemu_chr_fe_write(&s->chr, (uint8_t *)&payload, 1);
- @r_vm    ...... vm:1 ..... ..... ... ..... ....... &rmrr %rs2 %rs1 %rd
++            uint8_t ch = (uint8_t)payload;
- @r_vm_1  ...... . ..... ..... ... ..... .......    &rmrr vm=1 %rs2 %rs1 %rd
++            qemu_chr_fe_write(&s->chr, &ch, 1);
- @r_vm_0  ...... . ..... ..... ... ..... .......    &rmrr vm=0 %rs2 %rs1 %rd
+             resp = 0x100 | (uint8_t)payload;
-@@ -XXX,XX +XXX,XX @@ viota_m         010110 . ..... 10000 010 ..... 1010111 @r2_vm
+         } else {
- vid_v           010110 . 00000 10001 010 ..... 1010111 @r1_vm
+             qemu_log("HTIF device %d: unknown command\n", device);
  vext_x_v        001100 1 ..... ..... 010 ..... 1010111 @r
  vmv_s_x         001101 1 00000 ..... 110 ..... 1010111 @r2
 +vfmv_f_s        001100 1 ..... 00000 001 ..... 1010111 @r2rd
 +vfmv_s_f        001101 1 00000 ..... 101 ..... 1010111 @r2
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ static bool trans_vmv_s_x(DisasContext *s, arg_vmv_s_x *a)
      }
      return false;
  }
 +
 +/* Floating-Point Scalar Move Instructions */
 +static bool trans_vfmv_f_s(DisasContext *s, arg_vfmv_f_s *a)
 +{
 +    if (!s->vill && has_ext(s, RVF) &&
 +        (s->mstatus_fs != 0) && (s->sew != 0)) {
 +        unsigned int len = 8 << s->sew;
 +
 +        vec_element_loadi(s, cpu_fpr[a->rd], a->rs2, 0);
 +        if (len < 64) {
 +            tcg_gen_ori_i64(cpu_fpr[a->rd], cpu_fpr[a->rd],
 +                            MAKE_64BIT_MASK(len, 64 - len));
 +        }
 +
 +        mark_fs_dirty(s);
 +        return true;
 +    }
 +    return false;
 +}
 +
 +/* vfmv.s.f vd, rs1 # vd[0] = rs1 (vs2=0) */
 +static bool trans_vfmv_s_f(DisasContext *s, arg_vfmv_s_f *a)
 +{
 +    if (!s->vill && has_ext(s, RVF) && (s->sew != 0)) {
 +        TCGv_i64 t1;
 +        /* The instructions ignore LMUL and vector register group. */
 +        uint32_t vlmax = s->vlen >> 3;
 +
 +        /* if vl == 0, skip vector register write back */
 +        TCGLabel *over = gen_new_label();
 +        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +
 +        /* zeroed all elements */
 +        tcg_gen_gvec_dup_imm(SEW64, vreg_ofs(s, a->rd), vlmax, vlmax, 0);
 +
 +        /* NaN-box f[rs1] as necessary for SEW */
 +        t1 = tcg_temp_new_i64();
 +        if (s->sew == MO_64 && !has_ext(s, RVD)) {
 +            tcg_gen_ori_i64(t1, cpu_fpr[a->rs1], MAKE_64BIT_MASK(32, 32));
 +        } else {
 +            tcg_gen_mov_i64(t1, cpu_fpr[a->rs1]);
 +        }
 +        vec_element_storei(s, a->rd, 0, t1);
 +        tcg_temp_free_i64(t1);
 +        gen_set_label(over);
 +        return true;
 +    }
 +    return false;
 +}
 --
-.27.0
+.41.0

-[PULL 57/63] target/riscv: integer extract instruction
+[PULL v2 03/45] hw/char/riscv_htif: Fix the console syscall on big endian hosts
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Thomas Huth <thuth@redhat.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Values that have been read via cpu_physical_memory_read() from the
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+guest's memory have to be swapped in case the host endianess differs
-Message-id: 20200623215920.2594-56-zhiwei_liu@c-sky.com
+from the guest.
 Fixes: a6e13e31d5 ("riscv_htif: Support console output via proxy syscall")
 Signed-off-by: Thomas Huth <thuth@redhat.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
 Reviewed-by: Bin Meng <bmeng@tinylab.org>
 Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 Message-Id: <20230721094720.902454-3-thuth@redhat.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/insn32.decode              |   1 +
+ hw/char/riscv_htif.c | 9 +++++----
- target/riscv/insn_trans/trans_rvv.inc.c | 116 ++++++++++++++++++++++++
+file changed, 5 insertions(+), 4 deletions(-)
 files changed, 117 insertions(+)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
+diff --git a/hw/char/riscv_htif.c b/hw/char/riscv_htif.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
+--- a/hw/char/riscv_htif.c
-+++ b/target/riscv/insn32.decode
++++ b/hw/char/riscv_htif.c
-@@ -XXX,XX +XXX,XX @@ vmsif_m         010110 . ..... 00011 010 ..... 1010111 @r2_vm
+@@ -XXX,XX +XXX,XX @@
- vmsof_m         010110 . ..... 00010 010 ..... 1010111 @r2_vm
+ #include "qemu/timer.h"
- viota_m         010110 . ..... 10000 010 ..... 1010111 @r2_vm
+ #include "qemu/error-report.h"
- vid_v           010110 . 00000 10001 010 ..... 1010111 @r1_vm
+ #include "exec/address-spaces.h"
-+vext_x_v        001100 1 ..... ..... 010 ..... 1010111 @r
++#include "exec/tswap.h"
+ #include "sysemu/dma.h"
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
+ #define RISCV_DEBUG_HTIF 0
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
+@@ -XXX,XX +XXX,XX @@ static void htif_handle_tohost_write(HTIFState *s, uint64_t val_written)
-index XXXXXXX..XXXXXXX 100644
+             } else {
---- a/target/riscv/insn_trans/trans_rvv.inc.c
+                 uint64_t syscall[8];
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
+                 cpu_physical_memory_read(payload, syscall, sizeof(syscall));
-@@ -XXX,XX +XXX,XX @@ static bool trans_vid_v(DisasContext *s, arg_vid_v *a)
+-                if (syscall[0] == PK_SYS_WRITE &&
-     }
+-                    syscall[1] == HTIF_DEV_CONSOLE &&
-     return false;
+-                    syscall[3] == HTIF_CONSOLE_CMD_PUTC) {
- }
++                if (tswap64(syscall[0]) == PK_SYS_WRITE &&
-+
++                    tswap64(syscall[1]) == HTIF_DEV_CONSOLE &&
-+/*
++                    tswap64(syscall[3]) == HTIF_CONSOLE_CMD_PUTC) {
-+ *** Vector Permutation Instructions
+                     uint8_t ch;
-+ */
+-                    cpu_physical_memory_read(syscall[2], &ch, 1);
-+
++                    cpu_physical_memory_read(tswap64(syscall[2]), &ch, 1);
-+/* Integer Extract Instruction */
+                     qemu_chr_fe_write(&s->chr, &ch, 1);
-+
+                     resp = 0x100 | (uint8_t)payload;
-+static void load_element(TCGv_i64 dest, TCGv_ptr base,
+                 } else {
 +                         int ofs, int sew)
 +{
 +    switch (sew) {
 +    case MO_8:
 +        tcg_gen_ld8u_i64(dest, base, ofs);
 +        break;
 +    case MO_16:
 +        tcg_gen_ld16u_i64(dest, base, ofs);
 +        break;
 +    case MO_32:
 +        tcg_gen_ld32u_i64(dest, base, ofs);
 +        break;
 +    case MO_64:
 +        tcg_gen_ld_i64(dest, base, ofs);
 +        break;
 +    default:
 +        g_assert_not_reached();
 +        break;
 +    }
 +}
 +
 +/* offset of the idx element with base regsiter r */
 +static uint32_t endian_ofs(DisasContext *s, int r, int idx)
 +{
 +#ifdef HOST_WORDS_BIGENDIAN
 +    return vreg_ofs(s, r) + ((idx ^ (7 >> s->sew)) << s->sew);
 +#else
 +    return vreg_ofs(s, r) + (idx << s->sew);
 +#endif
 +}
 +
 +/* adjust the index according to the endian */
 +static void endian_adjust(TCGv_i32 ofs, int sew)
 +{
 +#ifdef HOST_WORDS_BIGENDIAN
 +    tcg_gen_xori_i32(ofs, ofs, 7 >> sew);
 +#endif
 +}
 +
 +/* Load idx >= VLMAX ? 0 : vreg[idx] */
 +static void vec_element_loadx(DisasContext *s, TCGv_i64 dest,
 +                              int vreg, TCGv idx, int vlmax)
 +{
 +    TCGv_i32 ofs = tcg_temp_new_i32();
 +    TCGv_ptr base = tcg_temp_new_ptr();
 +    TCGv_i64 t_idx = tcg_temp_new_i64();
 +    TCGv_i64 t_vlmax, t_zero;
 +
 +    /*
 +     * Mask the index to the length so that we do
 +     * not produce an out-of-range load.
 +     */
 +    tcg_gen_trunc_tl_i32(ofs, idx);
 +    tcg_gen_andi_i32(ofs, ofs, vlmax - 1);
 +
 +    /* Convert the index to an offset. */
 +    endian_adjust(ofs, s->sew);
 +    tcg_gen_shli_i32(ofs, ofs, s->sew);
 +
 +    /* Convert the index to a pointer. */
 +    tcg_gen_ext_i32_ptr(base, ofs);
 +    tcg_gen_add_ptr(base, base, cpu_env);
 +
 +    /* Perform the load. */
 +    load_element(dest, base,
 +                 vreg_ofs(s, vreg), s->sew);
 +    tcg_temp_free_ptr(base);
 +    tcg_temp_free_i32(ofs);
 +
 +    /* Flush out-of-range indexing to zero.  */
 +    t_vlmax = tcg_const_i64(vlmax);
 +    t_zero = tcg_const_i64(0);
 +    tcg_gen_extu_tl_i64(t_idx, idx);
 +
 +    tcg_gen_movcond_i64(TCG_COND_LTU, dest, t_idx,
 +                        t_vlmax, dest, t_zero);
 +
 +    tcg_temp_free_i64(t_vlmax);
 +    tcg_temp_free_i64(t_zero);
 +    tcg_temp_free_i64(t_idx);
 +}
 +
 +static void vec_element_loadi(DisasContext *s, TCGv_i64 dest,
 +                              int vreg, int idx)
 +{
 +    load_element(dest, cpu_env, endian_ofs(s, vreg, idx), s->sew);
 +}
 +
 +static bool trans_vext_x_v(DisasContext *s, arg_r *a)
 +{
 +    TCGv_i64 tmp = tcg_temp_new_i64();
 +    TCGv dest = tcg_temp_new();
 +
 +    if (a->rs1 == 0) {
 +        /* Special case vmv.x.s rd, vs2. */
 +        vec_element_loadi(s, tmp, a->rs2, 0);
 +    } else {
 +        /* This instruction ignores LMUL and vector register groups */
 +        int vlmax = s->vlen >> (3 + s->sew);
 +        vec_element_loadx(s, tmp, a->rs2, cpu_gpr[a->rs1], vlmax);
 +    }
 +    tcg_gen_trunc_i64_tl(dest, tmp);
 +    gen_set_gpr(a->rd, dest);
 +
 +    tcg_temp_free(dest);
 +    tcg_temp_free_i64(tmp);
 +    return true;
 +}
 --
-.27.0
+.41.0

-[PULL 56/63] target/riscv: vector element index instruction
+[PULL v2 04/45] target/riscv/cpu.c: add zmmul isa string
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+zmmul was promoted from experimental to ratified in commit 6d00ffad4e95.
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Add a riscv,isa string for it.
-Message-id: 20200623215920.2594-55-zhiwei_liu@c-sky.com
 Fixes: 6d00ffad4e95 ("target/riscv: move zmmul out of the experimental properties")
 Signed-off-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 Reviewed-by: Weiwei Li <liweiwei@iscas.ac.cn>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
 Message-Id: <20230720132424.371132-2-dbarboza@ventanamicro.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   |  5 +++++
+ target/riscv/cpu.c | 1 +
- target/riscv/insn32.decode              |  2 ++
+file changed, 1 insertion(+)
  target/riscv/insn_trans/trans_rvv.inc.c | 25 +++++++++++++++++++++++++
  target/riscv/vector_helper.c            | 24 ++++++++++++++++++++++++
 files changed, 56 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/target/riscv/cpu.c
-+++ b/target/riscv/helper.h
++++ b/target/riscv/cpu.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_5(viota_m_b, void, ptr, ptr, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ static const struct isa_ext_data isa_edata_arr[] = {
- DEF_HELPER_5(viota_m_h, void, ptr, ptr, ptr, env, i32)
+     ISA_EXT_DATA_ENTRY(zicsr, PRIV_VERSION_1_10_0, ext_icsr),
- DEF_HELPER_5(viota_m_w, void, ptr, ptr, ptr, env, i32)
+     ISA_EXT_DATA_ENTRY(zifencei, PRIV_VERSION_1_10_0, ext_ifencei),
- DEF_HELPER_5(viota_m_d, void, ptr, ptr, ptr, env, i32)
+     ISA_EXT_DATA_ENTRY(zihintpause, PRIV_VERSION_1_10_0, ext_zihintpause),
-+
++    ISA_EXT_DATA_ENTRY(zmmul, PRIV_VERSION_1_12_0, ext_zmmul),
-+DEF_HELPER_4(vid_v_b, void, ptr, ptr, env, i32)
+     ISA_EXT_DATA_ENTRY(zawrs, PRIV_VERSION_1_12_0, ext_zawrs),
-+DEF_HELPER_4(vid_v_h, void, ptr, ptr, env, i32)
+     ISA_EXT_DATA_ENTRY(zfa, PRIV_VERSION_1_12_0, ext_zfa),
-+DEF_HELPER_4(vid_v_w, void, ptr, ptr, env, i32)
+     ISA_EXT_DATA_ENTRY(zfbfmin, PRIV_VERSION_1_12_0, ext_zfbfmin),
 +DEF_HELPER_4(vid_v_d, void, ptr, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@
  @r2      .......   ..... ..... ... ..... ....... %rs1 %rd
  @r2_nfvm ... ... vm:1 ..... ..... ... ..... ....... &r2nfvm %nf %rs1 %rd
  @r2_vm   ...... vm:1 ..... ..... ... ..... ....... &rmr %rs2 %rd
 +@r1_vm   ...... vm:1 ..... ..... ... ..... ....... %rd
  @r_nfvm  ... ... vm:1 ..... ..... ... ..... ....... &rnfvm %nf %rs2 %rs1 %rd
  @r_vm    ...... vm:1 ..... ..... ... ..... ....... &rmrr %rs2 %rs1 %rd
  @r_vm_1  ...... . ..... ..... ... ..... .......    &rmrr vm=1 %rs2 %rs1 %rd
@@ -XXX,XX +XXX,XX @@ vmsbf_m         010110 . ..... 00001 010 ..... 1010111 @r2_vm
  vmsif_m         010110 . ..... 00011 010 ..... 1010111 @r2_vm
  vmsof_m         010110 . ..... 00010 010 ..... 1010111 @r2_vm
  viota_m         010110 . ..... 10000 010 ..... 1010111 @r2_vm
 +vid_v           010110 . 00000 10001 010 ..... 1010111 @r1_vm
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ static bool trans_viota_m(DisasContext *s, arg_viota_m *a)
      }
      return false;
  }
 +
 +/* Vector Element Index Instruction */
 +static bool trans_vid_v(DisasContext *s, arg_vid_v *a)
 +{
 +    if (vext_check_isa_ill(s) &&
 +        vext_check_reg(s, a->rd, false) &&
 +        vext_check_overlap_mask(s, a->rd, a->vm, false)) {
 +        uint32_t data = 0;
 +        TCGLabel *over = gen_new_label();
 +        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +
 +        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
 +        data = FIELD_DP32(data, VDATA, VM, a->vm);
 +        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
 +        static gen_helper_gvec_2_ptr * const fns[4] = {
 +            gen_helper_vid_v_b, gen_helper_vid_v_h,
 +            gen_helper_vid_v_w, gen_helper_vid_v_d,
 +        };
 +        tcg_gen_gvec_2_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),
 +                           cpu_env, 0, s->vlen / 8, data, fns[s->sew]);
 +        gen_set_label(over);
 +        return true;
 +    }
 +    return false;
 +}
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VIOTA_M(viota_m_b, uint8_t, H1, clearb)
  GEN_VEXT_VIOTA_M(viota_m_h, uint16_t, H2, clearh)
  GEN_VEXT_VIOTA_M(viota_m_w, uint32_t, H4, clearl)
  GEN_VEXT_VIOTA_M(viota_m_d, uint64_t, H8, clearq)
 +
 +/* Vector Element Index Instruction */
 +#define GEN_VEXT_VID_V(NAME, ETYPE, H, CLEAR_FN)                          \
 +void HELPER(NAME)(void *vd, void *v0, CPURISCVState *env, uint32_t desc)  \
 +{                                                                         \
 +    uint32_t mlen = vext_mlen(desc);                                      \
 +    uint32_t vlmax = env_archcpu(env)->cfg.vlen / mlen;                   \
 +    uint32_t vm = vext_vm(desc);                                          \
 +    uint32_t vl = env->vl;                                                \
 +    int i;                                                                \
 +                                                                          \
 +    for (i = 0; i < vl; i++) {                                            \
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {                        \
 +            continue;                                                     \
 +        }                                                                 \
 +        *((ETYPE *)vd + H(i)) = i;                                        \
 +    }                                                                     \
 +    CLEAR_FN(vd, vl, vl * sizeof(ETYPE), vlmax * sizeof(ETYPE));          \
 +}
 +
 +GEN_VEXT_VID_V(vid_v_b, uint8_t, H1, clearb)
 +GEN_VEXT_VID_V(vid_v_h, uint16_t, H2, clearh)
 +GEN_VEXT_VID_V(vid_v_w, uint32_t, H4, clearl)
 +GEN_VEXT_VID_V(vid_v_d, uint64_t, H8, clearq)
 --
-.27.0
+.41.0

-[PULL 55/63] target/riscv: vector iota instruction
+[PULL v2 05/45] target/riscv/cpu.c: add smepmp isa string
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+The cpu->cfg.epmp extension is still experimental, but it already has a
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+'smepmp' riscv,isa string. Add it.
-Message-id: 20200623215920.2594-54-zhiwei_liu@c-sky.com
 Signed-off-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 Reviewed-by: Weiwei Li <liweiwei@iscas.ac.cn>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
 Message-Id: <20230720132424.371132-3-dbarboza@ventanamicro.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   |  5 +++++
+ target/riscv/cpu.c | 1 +
- target/riscv/insn32.decode              |  1 +
+file changed, 1 insertion(+)
  target/riscv/insn_trans/trans_rvv.inc.c | 27 +++++++++++++++++++++++
  target/riscv/vector_helper.c            | 29 +++++++++++++++++++++++++
 files changed, 62 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/target/riscv/cpu.c
-+++ b/target/riscv/helper.h
++++ b/target/riscv/cpu.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_4(vmfirst_m, tl, ptr, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ static const struct isa_ext_data isa_edata_arr[] = {
- DEF_HELPER_5(vmsbf_m, void, ptr, ptr, ptr, env, i32)
+     ISA_EXT_DATA_ENTRY(zhinx, PRIV_VERSION_1_12_0, ext_zhinx),
- DEF_HELPER_5(vmsif_m, void, ptr, ptr, ptr, env, i32)
+     ISA_EXT_DATA_ENTRY(zhinxmin, PRIV_VERSION_1_12_0, ext_zhinxmin),
- DEF_HELPER_5(vmsof_m, void, ptr, ptr, ptr, env, i32)
+     ISA_EXT_DATA_ENTRY(smaia, PRIV_VERSION_1_12_0, ext_smaia),
-+
++    ISA_EXT_DATA_ENTRY(smepmp, PRIV_VERSION_1_12_0, epmp),
-+DEF_HELPER_5(viota_m_b, void, ptr, ptr, ptr, env, i32)
+     ISA_EXT_DATA_ENTRY(smstateen, PRIV_VERSION_1_12_0, ext_smstateen),
-+DEF_HELPER_5(viota_m_h, void, ptr, ptr, ptr, env, i32)
+     ISA_EXT_DATA_ENTRY(ssaia, PRIV_VERSION_1_12_0, ext_ssaia),
-+DEF_HELPER_5(viota_m_w, void, ptr, ptr, ptr, env, i32)
+     ISA_EXT_DATA_ENTRY(sscofpmf, PRIV_VERSION_1_12_0, ext_sscofpmf),
 +DEF_HELPER_5(viota_m_d, void, ptr, ptr, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@ vmfirst_m       010101 . ..... ----- 010 ..... 1010111 @r2_vm
  vmsbf_m         010110 . ..... 00001 010 ..... 1010111 @r2_vm
  vmsif_m         010110 . ..... 00011 010 ..... 1010111 @r2_vm
  vmsof_m         010110 . ..... 00010 010 ..... 1010111 @r2_vm
 +viota_m         010110 . ..... 10000 010 ..... 1010111 @r2_vm
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmr *a)              \
  GEN_M_TRANS(vmsbf_m)
  GEN_M_TRANS(vmsif_m)
  GEN_M_TRANS(vmsof_m)
 +
 +/* Vector Iota Instruction */
 +static bool trans_viota_m(DisasContext *s, arg_viota_m *a)
 +{
 +    if (vext_check_isa_ill(s) &&
 +        vext_check_reg(s, a->rd, false) &&
 +        vext_check_overlap_group(a->rd, 1 << s->lmul, a->rs2, 1) &&
 +        (a->vm != 0 || a->rd != 0)) {
 +        uint32_t data = 0;
 +        TCGLabel *over = gen_new_label();
 +        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +
 +        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
 +        data = FIELD_DP32(data, VDATA, VM, a->vm);
 +        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
 +        static gen_helper_gvec_3_ptr * const fns[4] = {
 +            gen_helper_viota_m_b, gen_helper_viota_m_h,
 +            gen_helper_viota_m_w, gen_helper_viota_m_d,
 +        };
 +        tcg_gen_gvec_3_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),
 +                           vreg_ofs(s, a->rs2), cpu_env, 0,
 +                           s->vlen / 8, data, fns[s->sew]);
 +        gen_set_label(over);
 +        return true;
 +    }
 +    return false;
 +}
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ void HELPER(vmsof_m)(void *vd, void *v0, void *vs2, CPURISCVState *env,
  {
      vmsetm(vd, v0, vs2, env, desc, ONLY_FIRST);
  }
 +
 +/* Vector Iota Instruction */
 +#define GEN_VEXT_VIOTA_M(NAME, ETYPE, H, CLEAR_FN)                        \
 +void HELPER(NAME)(void *vd, void *v0, void *vs2, CPURISCVState *env,      \
 +                  uint32_t desc)                                          \
 +{                                                                         \
 +    uint32_t mlen = vext_mlen(desc);                                      \
 +    uint32_t vlmax = env_archcpu(env)->cfg.vlen / mlen;                   \
 +    uint32_t vm = vext_vm(desc);                                          \
 +    uint32_t vl = env->vl;                                                \
 +    uint32_t sum = 0;                                                     \
 +    int i;                                                                \
 +                                                                          \
 +    for (i = 0; i < vl; i++) {                                            \
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {                        \
 +            continue;                                                     \
 +        }                                                                 \
 +        *((ETYPE *)vd + H(i)) = sum;                                      \
 +        if (vext_elem_mask(vs2, mlen, i)) {                               \
 +            sum++;                                                        \
 +        }                                                                 \
 +    }                                                                     \
 +    CLEAR_FN(vd, vl, vl * sizeof(ETYPE), vlmax * sizeof(ETYPE));          \
 +}
 +
 +GEN_VEXT_VIOTA_M(viota_m_b, uint8_t, H1, clearb)
 +GEN_VEXT_VIOTA_M(viota_m_h, uint16_t, H2, clearh)
 +GEN_VEXT_VIOTA_M(viota_m_w, uint32_t, H4, clearl)
 +GEN_VEXT_VIOTA_M(viota_m_d, uint64_t, H8, clearq)
 --
-.27.0
+.41.0

-[PULL 53/63] target/riscv: vmfirst find-first-set mask bit
+[PULL v2 06/45] target/riscv: Fix page_check_range use in fault-only-first
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: LIU Zhiwei <zhiwei_liu@linux.alibaba.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Commit bef6f008b98(accel/tcg: Return bool from page_check_range) converts
 integer return value to bool type. However, it wrongly converted the use
 of the API in riscv fault-only-first, where page_check_range < = 0, should
 be converted to !page_check_range.
 Signed-off-by: LIU Zhiwei <zhiwei_liu@linux.alibaba.com>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200623215920.2594-52-zhiwei_liu@c-sky.com
+Message-ID: <20230729031618.821-1-zhiwei_liu@linux.alibaba.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   |  2 ++
+ target/riscv/vector_helper.c | 2 +-
- target/riscv/insn32.decode              |  1 +
+file changed, 1 insertion(+), 1 deletion(-)
  target/riscv/insn_trans/trans_rvv.inc.c | 32 +++++++++++++++++++++++++
  target/riscv/vector_helper.c            | 19 +++++++++++++++
 files changed, 54 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vmornot_mm, void, ptr, ptr, ptr, ptr, env, i32)
- DEF_HELPER_6(vmxnor_mm, void, ptr, ptr, ptr, ptr, env, i32)
- DEF_HELPER_4(vmpopc_m, tl, ptr, ptr, env, i32)
-+
-+DEF_HELPER_4(vmfirst_m, tl, ptr, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vmnor_mm        011110 - ..... ..... 010 ..... 1010111 @r
- vmornot_mm      011100 - ..... ..... 010 ..... 1010111 @r
- vmxnor_mm       011111 - ..... ..... 010 ..... 1010111 @r
- vmpopc_m        010100 . ..... ----- 010 ..... 1010111 @r2_vm
-+vmfirst_m       010101 . ..... ----- 010 ..... 1010111 @r2_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ static bool trans_vmpopc_m(DisasContext *s, arg_rmr *a)
-     }
-     return false;
- }
-+
-+/* vmfirst find-first-set mask bit */
-+static bool trans_vmfirst_m(DisasContext *s, arg_rmr *a)
-+{
-+    if (vext_check_isa_ill(s)) {
-+        TCGv_ptr src2, mask;
-+        TCGv dst;
-+        TCGv_i32 desc;
-+        uint32_t data = 0;
-+        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
-+        data = FIELD_DP32(data, VDATA, VM, a->vm);
-+        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
-+
-+        mask = tcg_temp_new_ptr();
-+        src2 = tcg_temp_new_ptr();
-+        dst = tcg_temp_new();
-+        desc = tcg_const_i32(simd_desc(0, s->vlen / 8, data));
-+
-+        tcg_gen_addi_ptr(src2, cpu_env, vreg_ofs(s, a->rs2));
-+        tcg_gen_addi_ptr(mask, cpu_env, vreg_ofs(s, 0));
-+
-+        gen_helper_vmfirst_m(dst, mask, src2, cpu_env, desc);
-+        gen_set_gpr(a->rd, dst);
-+
-+        tcg_temp_free_ptr(mask);
-+        tcg_temp_free_ptr(src2);
-+        tcg_temp_free(dst);
-+        tcg_temp_free_i32(desc);
-+        return true;
-+    }
-+    return false;
-+}
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ target_ulong HELPER(vmpopc_m)(void *v0, void *vs2, CPURISCVState *env,
+@@ -XXX,XX +XXX,XX @@ vext_ldff(void *vd, void *v0, target_ulong base,
-     }
+                                          cpu_mmu_index(env, false));
-     return cnt;
+                 if (host) {
- }
+ #ifdef CONFIG_USER_ONLY
-+
+-                    if (page_check_range(addr, offset, PAGE_READ)) {
-+/* vmfirst find-first-set mask bit*/
++                    if (!page_check_range(addr, offset, PAGE_READ)) {
-+target_ulong HELPER(vmfirst_m)(void *v0, void *vs2, CPURISCVState *env,
+                         vl = i;
-+                               uint32_t desc)
+                         goto ProbeSuccess;
-+{
+                     }
 +    uint32_t mlen = vext_mlen(desc);
 +    uint32_t vm = vext_vm(desc);
 +    uint32_t vl = env->vl;
 +    int i;
 +
 +    for (i = 0; i < vl; i++) {
 +        if (vm || vext_elem_mask(v0, mlen, i)) {
 +            if (vext_elem_mask(vs2, mlen, i)) {
 +                return i;
 +            }
 +        }
 +    }
 +    return -1LL;
 +}
 --
-.27.0
+.41.0

-[PULL 58/63] target/riscv: integer scalar move instruction
+[PULL v2 07/45] target/riscv: Use existing lookup tables for MixColumns
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Ard Biesheuvel <ardb@kernel.org>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+The AES MixColumns and InvMixColumns operations are relatively
 expensive 4x4 matrix multiplications in GF(2^8), which is why C
 implementations usually rely on precomputed lookup tables rather than
 performing the calculations on demand.
 Given that we already carry those tables in QEMU, we can just grab the
 right value in the implementation of the RISC-V AES32 instructions. Note
 that the tables in question are permuted according to the respective
 Sbox, so we can omit the Sbox lookup as well in this case.
 Cc: Richard Henderson <richard.henderson@linaro.org>
 Cc: Philippe Mathieu-Daudé <philmd@linaro.org>
 Cc: Zewen Ye <lustrew@foxmail.com>
 Cc: Weiwei Li <liweiwei@iscas.ac.cn>
 Cc: Junqiang Wang <wangjunqiang@iscas.ac.cn>
 Signed-off-by: Ard Biesheuvel <ardb@kernel.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200623215920.2594-57-zhiwei_liu@c-sky.com
+Message-ID: <20230731084043.1791984-1-ardb@kernel.org>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/internals.h                |  6 +++
+ include/crypto/aes.h         |  7 +++++++
- target/riscv/insn32.decode              |  1 +
+ crypto/aes.c                 |  4 ++--
- target/riscv/insn_trans/trans_rvv.inc.c | 60 +++++++++++++++++++++++++
+ target/riscv/crypto_helper.c | 34 ++++------------------------------
-files changed, 67 insertions(+)
+files changed, 13 insertions(+), 32 deletions(-)
-diff --git a/target/riscv/internals.h b/target/riscv/internals.h
+diff --git a/include/crypto/aes.h b/include/crypto/aes.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/internals.h
+--- a/include/crypto/aes.h
-+++ b/target/riscv/internals.h
++++ b/include/crypto/aes.h
-@@ -XXX,XX +XXX,XX @@ FIELD(VDATA, WD, 11, 1)
+@@ -XXX,XX +XXX,XX @@ void AES_decrypt(const unsigned char *in, unsigned char *out,
- target_ulong fclass_h(uint64_t frs1);
+ extern const uint8_t AES_sbox[256];
- target_ulong fclass_s(uint64_t frs1);
+ extern const uint8_t AES_isbox[256];
- target_ulong fclass_d(uint64_t frs1);
 +/*
 +AES_Te0[x] = S [x].[02, 01, 01, 03];
 +AES_Td0[x] = Si[x].[0e, 09, 0d, 0b];
 +*/
 +
-+#define SEW8  0
++extern const uint32_t AES_Te0[256], AES_Td0[256];
 +#define SEW16 1
 +#define SEW32 2
 +#define SEW64 3
 +
  #endif
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
+diff --git a/crypto/aes.c b/crypto/aes.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
+--- a/crypto/aes.c
-+++ b/target/riscv/insn32.decode
++++ b/crypto/aes.c
-@@ -XXX,XX +XXX,XX @@ vmsof_m         010110 . ..... 00010 010 ..... 1010111 @r2_vm
+@@ -XXX,XX +XXX,XX @@ AES_Td3[x] = Si[x].[09, 0d, 0b, 0e];
- viota_m         010110 . ..... 10000 010 ..... 1010111 @r2_vm
+ AES_Td4[x] = Si[x].[01, 01, 01, 01];
- vid_v           010110 . 00000 10001 010 ..... 1010111 @r1_vm
+ */
- vext_x_v        001100 1 ..... ..... 010 ..... 1010111 @r
-+vmv_s_x         001101 1 00000 ..... 110 ..... 1010111 @r2
+-static const uint32_t AES_Te0[256] = {
++const uint32_t AES_Te0[256] = {
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
+xc66363a5U, 0xf87c7c84U, 0xee777799U, 0xf67b7b8dU,
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
+xfff2f20dU, 0xd66b6bbdU, 0xde6f6fb1U, 0x91c5c554U,
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
+x60303050U, 0x02010103U, 0xce6767a9U, 0x562b2b7dU,
@@ -XXX,XX +XXX,XX @@ static const uint32_t AES_Te4[256] = {
 xb0b0b0b0U, 0x54545454U, 0xbbbbbbbbU, 0x16161616U,
  };
 -static const uint32_t AES_Td0[256] = {
 +const uint32_t AES_Td0[256] = {
 x51f4a750U, 0x7e416553U, 0x1a17a4c3U, 0x3a275e96U,
 x3bab6bcbU, 0x1f9d45f1U, 0xacfa58abU, 0x4be30393U,
 x2030fa55U, 0xad766df6U, 0x88cc7691U, 0xf5024c25U,
 diff --git a/target/riscv/crypto_helper.c b/target/riscv/crypto_helper.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
+--- a/target/riscv/crypto_helper.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
++++ b/target/riscv/crypto_helper.c
-@@ -XXX,XX +XXX,XX @@ static bool trans_vext_x_v(DisasContext *s, arg_r *a)
+@@ -XXX,XX +XXX,XX @@
-     tcg_temp_free_i64(tmp);
+ #include "crypto/aes-round.h"
-     return true;
+ #include "crypto/sm4.h"
- }
-+
+-#define AES_XTIME(a) \
-+/* Integer Scalar Move Instruction */
+-    ((a << 1) ^ ((a & 0x80) ? 0x1b : 0))
-+
+-
-+static void store_element(TCGv_i64 val, TCGv_ptr base,
+-#define AES_GFMUL(a, b) (( \
-+                          int ofs, int sew)
+-    (((b) & 0x1) ? (a) : 0) ^ \
-+{
+-    (((b) & 0x2) ? AES_XTIME(a) : 0) ^ \
-+    switch (sew) {
+-    (((b) & 0x4) ? AES_XTIME(AES_XTIME(a)) : 0) ^ \
-+    case MO_8:
+-    (((b) & 0x8) ? AES_XTIME(AES_XTIME(AES_XTIME(a))) : 0)) & 0xFF)
-+        tcg_gen_st8_i64(val, base, ofs);
+-
-+        break;
+-static inline uint32_t aes_mixcolumn_byte(uint8_t x, bool fwd)
-+    case MO_16:
+-{
-+        tcg_gen_st16_i64(val, base, ofs);
+-    uint32_t u;
-+        break;
+-
-+    case MO_32:
+-    if (fwd) {
-+        tcg_gen_st32_i64(val, base, ofs);
+-        u = (AES_GFMUL(x, 3) << 24) | (x << 16) | (x << 8) |
-+        break;
+-            (AES_GFMUL(x, 2) << 0);
-+    case MO_64:
+-    } else {
-+        tcg_gen_st_i64(val, base, ofs);
+-        u = (AES_GFMUL(x, 0xb) << 24) | (AES_GFMUL(x, 0xd) << 16) |
-+        break;
+-            (AES_GFMUL(x, 0x9) << 8) | (AES_GFMUL(x, 0xe) << 0);
-+    default:
+-    }
-+        g_assert_not_reached();
+-    return u;
-+        break;
+-}
-+    }
+-
-+}
+ #define sext32_xlen(x) (target_ulong)(int32_t)(x)
-+
-+/*
+ static inline target_ulong aes32_operation(target_ulong shamt,
-+ * Store vreg[idx] = val.
+@@ -XXX,XX +XXX,XX @@ static inline target_ulong aes32_operation(target_ulong shamt,
-+ * The index must be in range of VLMAX.
+                                            bool enc, bool mix)
-+ */
+ {
-+static void vec_element_storei(DisasContext *s, int vreg,
+     uint8_t si = rs2 >> shamt;
-+                               int idx, TCGv_i64 val)
+-    uint8_t so;
-+{
+     uint32_t mixed;
-+    store_element(val, cpu_env, endian_ofs(s, vreg, idx), s->sew);
+     target_ulong res;
-+}
-+
+     if (enc) {
-+/* vmv.s.x vd, rs1 # vd[0] = rs1 */
+-        so = AES_sbox[si];
-+static bool trans_vmv_s_x(DisasContext *s, arg_vmv_s_x *a)
+         if (mix) {
-+{
+-            mixed = aes_mixcolumn_byte(so, true);
-+    if (vext_check_isa_ill(s)) {
++            mixed = be32_to_cpu(AES_Te0[si]);
-+        /* This instruction ignores LMUL and vector register groups */
+         } else {
-+        int maxsz = s->vlen >> 3;
+-            mixed = so;
-+        TCGv_i64 t1;
++            mixed = AES_sbox[si];
-+        TCGLabel *over = gen_new_label();
+         }
-+
+     } else {
-+        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
+-        so = AES_isbox[si];
-+        tcg_gen_gvec_dup_imm(SEW64, vreg_ofs(s, a->rd), maxsz, maxsz, 0);
+         if (mix) {
-+        if (a->rs1 == 0) {
+-            mixed = aes_mixcolumn_byte(so, false);
-+            goto done;
++            mixed = be32_to_cpu(AES_Td0[si]);
-+        }
+         } else {
-+
+-            mixed = so;
-+        t1 = tcg_temp_new_i64();
++            mixed = AES_isbox[si];
-+        tcg_gen_extu_tl_i64(t1, cpu_gpr[a->rs1]);
+         }
-+        vec_element_storei(s, a->rd, 0, t1);
+     }
-+        tcg_temp_free_i64(t1);
+     mixed = rol32(mixed, shamt);
 +    done:
 +        gen_set_label(over);
 +        return true;
 +    }
 +    return false;
 +}
 --
-.27.0
+.41.0

-[PULL 12/63] target/riscv: vector single-width integer add and subtract
+[PULL v2 08/45] target/riscv: Refactor some of the generic vector functionality
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Kiran Ostrolenk <kiran.ostrolenk@codethink.co.uk>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Take some functions/macros out of `vector_helper` and put them in a new
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+module called `vector_internals`. This ensures they can be used by both
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+vector and vector-crypto helpers (latter implemented in proceeding
-Message-id: 20200623215920.2594-11-zhiwei_liu@c-sky.com
+commits).
 Signed-off-by: Kiran Ostrolenk <kiran.ostrolenk@codethink.co.uk>
 Reviewed-by: Weiwei Li <liweiwei@iscas.ac.cn>
 Signed-off-by: Max Chou <max.chou@sifive.com>
 Acked-by: Alistair Francis <alistair.francis@wdc.com>
 Message-ID: <20230711165917.2629866-2-max.chou@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   |  25 ++
+ target/riscv/vector_internals.h | 182 +++++++++++++++++++++++++++++
- target/riscv/insn32.decode              |  10 +
+ target/riscv/vector_helper.c    | 201 +-------------------------------
- target/riscv/insn_trans/trans_rvv.inc.c | 291 ++++++++++++++++++++++++
+ target/riscv/vector_internals.c |  81 +++++++++++++
- target/riscv/vector_helper.c            | 183 +++++++++++++++
+ target/riscv/meson.build        |   1 +
-files changed, 509 insertions(+)
+files changed, 265 insertions(+), 200 deletions(-)
  create mode 100644 target/riscv/vector_internals.h
  create mode 100644 target/riscv/vector_internals.c
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/target/riscv/vector_internals.h b/target/riscv/vector_internals.h
-index XXXXXXX..XXXXXXX 100644
+new file mode 100644
---- a/target/riscv/helper.h
+index XXXXXXX..XXXXXXX
-+++ b/target/riscv/helper.h
+--- /dev/null
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vamominw_v_w,  void, ptr, ptr, tl, ptr, env, i32)
++++ b/target/riscv/vector_internals.h
  DEF_HELPER_6(vamomaxw_v_w,  void, ptr, ptr, tl, ptr, env, i32)
  DEF_HELPER_6(vamominuw_v_w, void, ptr, ptr, tl, ptr, env, i32)
  DEF_HELPER_6(vamomaxuw_v_w, void, ptr, ptr, tl, ptr, env, i32)
 +
 +DEF_HELPER_6(vadd_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vadd_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vadd_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vadd_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vsub_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vsub_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vsub_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vsub_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vadd_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vadd_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vadd_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vadd_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsub_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsub_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsub_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsub_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vrsub_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vrsub_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vrsub_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vrsub_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_FLAGS_4(vec_rsubs8, TCG_CALL_NO_RWG, void, ptr, ptr, i64, i32)
 +DEF_HELPER_FLAGS_4(vec_rsubs16, TCG_CALL_NO_RWG, void, ptr, ptr, i64, i32)
 +DEF_HELPER_FLAGS_4(vec_rsubs32, TCG_CALL_NO_RWG, void, ptr, ptr, i64, i32)
 +DEF_HELPER_FLAGS_4(vec_rsubs64, TCG_CALL_NO_RWG, void, ptr, ptr, i64, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
 @@ -XXX,XX +XXX,XX @@
- &u    imm rd
++/*
- &shift     shamt rs1 rd
++ * RISC-V Vector Extension Internals
- &atomic    aq rl rs2 rs1 rd
++ *
-+&rmrr      vm rd rs1 rs2
++ * Copyright (c) 2020 T-Head Semiconductor Co., Ltd. All rights reserved.
- &rwdvm     vm wd rd rs1 rs2
++ *
- &r2nfvm    vm rd rs1 nf
++ * This program is free software; you can redistribute it and/or modify it
- &rnfvm     vm rd rs1 rs2 nf
++ * under the terms and conditions of the GNU General Public License,
-@@ -XXX,XX +XXX,XX @@
++ * version 2 or later, as published by the Free Software Foundation.
- @r2      .......   ..... ..... ... ..... ....... %rs1 %rd
++ *
- @r2_nfvm ... ... vm:1 ..... ..... ... ..... ....... &r2nfvm %nf %rs1 %rd
++ * This program is distributed in the hope it will be useful, but WITHOUT
- @r_nfvm  ... ... vm:1 ..... ..... ... ..... ....... &rnfvm %nf %rs2 %rs1 %rd
++ * ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
-+@r_vm    ...... vm:1 ..... ..... ... ..... ....... &rmrr %rs2 %rs1 %rd
++ * FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License for
- @r_wdvm  ..... wd:1 vm:1 ..... ..... ... ..... ....... &rwdvm %rs2 %rs1 %rd
++ * more details.
- @r2_zimm . zimm:11  ..... ... ..... ....... %rs1 %rd
++ *
++ * You should have received a copy of the GNU General Public License along with
-@@ -XXX,XX +XXX,XX @@ vamominuw_v     11000 . . ..... ..... 110 ..... 0101111 @r_wdvm
++ * this program.  If not, see <http://www.gnu.org/licenses/>.
- vamomaxuw_v     11100 . . ..... ..... 110 ..... 0101111 @r_wdvm
++ */
++
- # *** new major opcode OP-V ***
++#ifndef TARGET_RISCV_VECTOR_INTERNALS_H
-+vadd_vv         000000 . ..... ..... 000 ..... 1010111 @r_vm
++#define TARGET_RISCV_VECTOR_INTERNALS_H
-+vadd_vx         000000 . ..... ..... 100 ..... 1010111 @r_vm
++
-+vadd_vi         000000 . ..... ..... 011 ..... 1010111 @r_vm
++#include "qemu/osdep.h"
-+vsub_vv         000010 . ..... ..... 000 ..... 1010111 @r_vm
++#include "qemu/bitops.h"
-+vsub_vx         000010 . ..... ..... 100 ..... 1010111 @r_vm
++#include "cpu.h"
-+vrsub_vx        000011 . ..... ..... 100 ..... 1010111 @r_vm
++#include "tcg/tcg-gvec-desc.h"
-+vrsub_vi        000011 . ..... ..... 011 ..... 1010111 @r_vm
++#include "internals.h"
 +
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
++static inline uint32_t vext_nf(uint32_t desc)
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
++{
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
++    return FIELD_EX32(simd_data(desc), VDATA, NF);
-index XXXXXXX..XXXXXXX 100644
++}
---- a/target/riscv/insn_trans/trans_rvv.inc.c
++
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
++/*
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_TRANS(vamomaxd_v, 15, rwdvm, amo_op, amo_check)
++ * Note that vector data is stored in host-endian 64-bit chunks,
- GEN_VEXT_TRANS(vamominud_v, 16, rwdvm, amo_op, amo_check)
++ * so addressing units smaller than that needs a host-endian fixup.
- GEN_VEXT_TRANS(vamomaxud_v, 17, rwdvm, amo_op, amo_check)
++ */
- #endif
++#if HOST_BIG_ENDIAN
-+
++#define H1(x)   ((x) ^ 7)
-+/*
++#define H1_2(x) ((x) ^ 6)
-+ *** Vector Integer Arithmetic Instructions
++#define H1_4(x) ((x) ^ 4)
-+ */
++#define H2(x)   ((x) ^ 3)
-+#define MAXSZ(s) (s->vlen >> (3 - s->lmul))
++#define H4(x)   ((x) ^ 1)
-+
++#define H8(x)   ((x))
-+static bool opivv_check(DisasContext *s, arg_rmrr *a)
++#else
-+{
++#define H1(x)   (x)
-+    return (vext_check_isa_ill(s) &&
++#define H1_2(x) (x)
-+            vext_check_overlap_mask(s, a->rd, a->vm, false) &&
++#define H1_4(x) (x)
-+            vext_check_reg(s, a->rd, false) &&
++#define H2(x)   (x)
-+            vext_check_reg(s, a->rs2, false) &&
++#define H4(x)   (x)
-+            vext_check_reg(s, a->rs1, false));
++#define H8(x)   (x)
-+}
++#endif
 +
-+typedef void GVecGen3Fn(unsigned, uint32_t, uint32_t,
++/*
-+                        uint32_t, uint32_t, uint32_t);
++ * Encode LMUL to lmul as following:
-+
++ *     LMUL    vlmul    lmul
-+static inline bool
++ *      1       000       0
-+do_opivv_gvec(DisasContext *s, arg_rmrr *a, GVecGen3Fn *gvec_fn,
++ *      2       001       1
-+              gen_helper_gvec_4_ptr *fn)
++ *      4       010       2
-+{
++ *      8       011       3
-+    TCGLabel *over = gen_new_label();
++ *      -       100       -
-+    if (!opivv_check(s, a)) {
++ *     1/8      101      -3
-+        return false;
++ *     1/4      110      -2
-+    }
++ *     1/2      111      -1
-+
++ */
-+    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
++static inline int32_t vext_lmul(uint32_t desc)
-+
++{
-+    if (a->vm && s->vl_eq_vlmax) {
++    return sextract32(FIELD_EX32(simd_data(desc), VDATA, LMUL), 0, 3);
-+        gvec_fn(s->sew, vreg_ofs(s, a->rd),
++}
-+                vreg_ofs(s, a->rs2), vreg_ofs(s, a->rs1),
++
-+                MAXSZ(s), MAXSZ(s));
++static inline uint32_t vext_vm(uint32_t desc)
-+    } else {
++{
-+        uint32_t data = 0;
++    return FIELD_EX32(simd_data(desc), VDATA, VM);
-+
++}
-+        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
++
-+        data = FIELD_DP32(data, VDATA, VM, a->vm);
++static inline uint32_t vext_vma(uint32_t desc)
-+        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
++{
-+        tcg_gen_gvec_4_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),
++    return FIELD_EX32(simd_data(desc), VDATA, VMA);
-+                           vreg_ofs(s, a->rs1), vreg_ofs(s, a->rs2),
++}
-+                           cpu_env, 0, s->vlen / 8, data, fn);
++
-+    }
++static inline uint32_t vext_vta(uint32_t desc)
-+    gen_set_label(over);
++{
-+    return true;
++    return FIELD_EX32(simd_data(desc), VDATA, VTA);
 +}
 +
-+/* OPIVV with GVEC IR */
++static inline uint32_t vext_vta_all_1s(uint32_t desc)
-+#define GEN_OPIVV_GVEC_TRANS(NAME, SUF) \
++{
-+static bool trans_##NAME(DisasContext *s, arg_rmrr *a)             \
++    return FIELD_EX32(simd_data(desc), VDATA, VTA_ALL_1S);
-+{                                                                  \
++}
-+    static gen_helper_gvec_4_ptr * const fns[4] = {                \
++
-+        gen_helper_##NAME##_b, gen_helper_##NAME##_h,              \
++/*
-+        gen_helper_##NAME##_w, gen_helper_##NAME##_d,              \
++ * Earlier designs (pre-0.9) had a varying number of bits
-+    };                                                             \
++ * per mask value (MLEN). In the 0.9 design, MLEN=1.
-+    return do_opivv_gvec(s, a, tcg_gen_gvec_##SUF, fns[s->sew]);   \
++ * (Section 4.5)
-+}
++ */
-+
++static inline int vext_elem_mask(void *v0, int index)
-+GEN_OPIVV_GVEC_TRANS(vadd_vv, add)
++{
-+GEN_OPIVV_GVEC_TRANS(vsub_vv, sub)
++    int idx = index / 64;
-+
++    int pos = index  % 64;
-+typedef void gen_helper_opivx(TCGv_ptr, TCGv_ptr, TCGv, TCGv_ptr,
++    return (((uint64_t *)v0)[idx] >> pos) & 1;
-+                              TCGv_env, TCGv_i32);
++}
 +
-+static bool opivx_trans(uint32_t vd, uint32_t rs1, uint32_t vs2, uint32_t vm,
++/*
-+                        gen_helper_opivx *fn, DisasContext *s)
++ * Get number of total elements, including prestart, body and tail elements.
-+{
++ * Note that when LMUL < 1, the tail includes the elements past VLMAX that
-+    TCGv_ptr dest, src2, mask;
++ * are held in the same vector register.
-+    TCGv src1;
++ */
-+    TCGv_i32 desc;
++static inline uint32_t vext_get_total_elems(CPURISCVState *env, uint32_t desc,
-+    uint32_t data = 0;
++                                            uint32_t esz)
-+
++{
-+    TCGLabel *over = gen_new_label();
++    uint32_t vlenb = simd_maxsz(desc);
-+    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
++    uint32_t sew = 1 << FIELD_EX64(env->vtype, VTYPE, VSEW);
-+
++    int8_t emul = ctzl(esz) - ctzl(sew) + vext_lmul(desc) < 0 ? 0 :
-+    dest = tcg_temp_new_ptr();
++                  ctzl(esz) - ctzl(sew) + vext_lmul(desc);
-+    mask = tcg_temp_new_ptr();
++    return (vlenb << emul) / esz;
-+    src2 = tcg_temp_new_ptr();
++}
-+    src1 = tcg_temp_new();
++
-+    gen_get_gpr(src1, rs1);
++/* set agnostic elements to 1s */
-+
++void vext_set_elems_1s(void *base, uint32_t is_agnostic, uint32_t cnt,
-+    data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
++                       uint32_t tot);
 +    data = FIELD_DP32(data, VDATA, VM, vm);
 +    data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
 +    desc = tcg_const_i32(simd_desc(0, s->vlen / 8, data));
 +
 +    tcg_gen_addi_ptr(dest, cpu_env, vreg_ofs(s, vd));
 +    tcg_gen_addi_ptr(src2, cpu_env, vreg_ofs(s, vs2));
 +    tcg_gen_addi_ptr(mask, cpu_env, vreg_ofs(s, 0));
 +
 +    fn(dest, mask, src1, src2, cpu_env, desc);
 +
 +    tcg_temp_free_ptr(dest);
 +    tcg_temp_free_ptr(mask);
 +    tcg_temp_free_ptr(src2);
 +    tcg_temp_free(src1);
 +    tcg_temp_free_i32(desc);
 +    gen_set_label(over);
 +    return true;
 +}
 +
 +static bool opivx_check(DisasContext *s, arg_rmrr *a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_overlap_mask(s, a->rd, a->vm, false) &&
 +            vext_check_reg(s, a->rd, false) &&
 +            vext_check_reg(s, a->rs2, false));
 +}
 +
 +typedef void GVecGen2sFn(unsigned, uint32_t, uint32_t, TCGv_i64,
 +                         uint32_t, uint32_t);
 +
 +static inline bool
 +do_opivx_gvec(DisasContext *s, arg_rmrr *a, GVecGen2sFn *gvec_fn,
 +              gen_helper_opivx *fn)
 +{
 +    if (!opivx_check(s, a)) {
 +        return false;
 +    }
 +
 +    if (a->vm && s->vl_eq_vlmax) {
 +        TCGv_i64 src1 = tcg_temp_new_i64();
 +        TCGv tmp = tcg_temp_new();
 +
 +        gen_get_gpr(tmp, a->rs1);
 +        tcg_gen_ext_tl_i64(src1, tmp);
 +        gvec_fn(s->sew, vreg_ofs(s, a->rd), vreg_ofs(s, a->rs2),
 +                src1, MAXSZ(s), MAXSZ(s));
 +
 +        tcg_temp_free_i64(src1);
 +        tcg_temp_free(tmp);
 +        return true;
 +    }
 +    return opivx_trans(a->rd, a->rs1, a->rs2, a->vm, fn, s);
 +}
 +
 +/* OPIVX with GVEC IR */
 +#define GEN_OPIVX_GVEC_TRANS(NAME, SUF) \
 +static bool trans_##NAME(DisasContext *s, arg_rmrr *a)             \
 +{                                                                  \
 +    static gen_helper_opivx * const fns[4] = {                     \
 +        gen_helper_##NAME##_b, gen_helper_##NAME##_h,              \
 +        gen_helper_##NAME##_w, gen_helper_##NAME##_d,              \
 +    };                                                             \
 +    return do_opivx_gvec(s, a, tcg_gen_gvec_##SUF, fns[s->sew]);   \
 +}
 +
 +GEN_OPIVX_GVEC_TRANS(vadd_vx, adds)
 +GEN_OPIVX_GVEC_TRANS(vsub_vx, subs)
 +
 +static void gen_vec_rsub8_i64(TCGv_i64 d, TCGv_i64 a, TCGv_i64 b)
 +{
 +    tcg_gen_vec_sub8_i64(d, b, a);
 +}
 +
 +static void gen_vec_rsub16_i64(TCGv_i64 d, TCGv_i64 a, TCGv_i64 b)
 +{
 +    tcg_gen_vec_sub8_i64(d, b, a);
 +}
 +
 +static void gen_rsub_i32(TCGv_i32 ret, TCGv_i32 arg1, TCGv_i32 arg2)
 +{
 +    tcg_gen_sub_i32(ret, arg2, arg1);
 +}
 +
 +static void gen_rsub_i64(TCGv_i64 ret, TCGv_i64 arg1, TCGv_i64 arg2)
 +{
 +    tcg_gen_sub_i64(ret, arg2, arg1);
 +}
 +
 +static void gen_rsub_vec(unsigned vece, TCGv_vec r, TCGv_vec a, TCGv_vec b)
 +{
 +    tcg_gen_sub_vec(vece, r, b, a);
 +}
 +
 +static void tcg_gen_gvec_rsubs(unsigned vece, uint32_t dofs, uint32_t aofs,
 +                               TCGv_i64 c, uint32_t oprsz, uint32_t maxsz)
 +{
 +    static const GVecGen2s rsub_op[4] = {
 +        { .fni8 = gen_vec_rsub8_i64,
 +          .fniv = gen_rsub_vec,
 +          .fno = gen_helper_vec_rsubs8,
 +          .vece = MO_8 },
 +        { .fni8 = gen_vec_rsub16_i64,
 +          .fniv = gen_rsub_vec,
 +          .fno = gen_helper_vec_rsubs16,
 +          .vece = MO_16 },
 +        { .fni4 = gen_rsub_i32,
 +          .fniv = gen_rsub_vec,
 +          .fno = gen_helper_vec_rsubs32,
 +          .vece = MO_32 },
 +        { .fni8 = gen_rsub_i64,
 +          .fniv = gen_rsub_vec,
 +          .fno = gen_helper_vec_rsubs64,
 +          .prefer_i64 = TCG_TARGET_REG_BITS == 64,
 +          .vece = MO_64 },
 +    };
 +
 +    tcg_debug_assert(vece <= MO_64);
 +    tcg_gen_gvec_2s(dofs, aofs, oprsz, maxsz, c, &rsub_op[vece]);
 +}
 +
 +GEN_OPIVX_GVEC_TRANS(vrsub_vx, rsubs)
 +
 +static bool opivi_trans(uint32_t vd, uint32_t imm, uint32_t vs2, uint32_t vm,
 +                        gen_helper_opivx *fn, DisasContext *s, int zx)
 +{
 +    TCGv_ptr dest, src2, mask;
 +    TCGv src1;
 +    TCGv_i32 desc;
 +    uint32_t data = 0;
 +
 +    TCGLabel *over = gen_new_label();
 +    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +
 +    dest = tcg_temp_new_ptr();
 +    mask = tcg_temp_new_ptr();
 +    src2 = tcg_temp_new_ptr();
 +    if (zx) {
 +        src1 = tcg_const_tl(imm);
 +    } else {
 +        src1 = tcg_const_tl(sextract64(imm, 0, 5));
 +    }
 +    data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
 +    data = FIELD_DP32(data, VDATA, VM, vm);
 +    data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
 +    desc = tcg_const_i32(simd_desc(0, s->vlen / 8, data));
 +
 +    tcg_gen_addi_ptr(dest, cpu_env, vreg_ofs(s, vd));
 +    tcg_gen_addi_ptr(src2, cpu_env, vreg_ofs(s, vs2));
 +    tcg_gen_addi_ptr(mask, cpu_env, vreg_ofs(s, 0));
 +
 +    fn(dest, mask, src1, src2, cpu_env, desc);
 +
 +    tcg_temp_free_ptr(dest);
 +    tcg_temp_free_ptr(mask);
 +    tcg_temp_free_ptr(src2);
 +    tcg_temp_free(src1);
 +    tcg_temp_free_i32(desc);
 +    gen_set_label(over);
 +    return true;
 +}
 +
 +typedef void GVecGen2iFn(unsigned, uint32_t, uint32_t, int64_t,
 +                         uint32_t, uint32_t);
 +
 +static inline bool
 +do_opivi_gvec(DisasContext *s, arg_rmrr *a, GVecGen2iFn *gvec_fn,
 +              gen_helper_opivx *fn, int zx)
 +{
 +    if (!opivx_check(s, a)) {
 +        return false;
 +    }
 +
 +    if (a->vm && s->vl_eq_vlmax) {
 +        if (zx) {
 +            gvec_fn(s->sew, vreg_ofs(s, a->rd), vreg_ofs(s, a->rs2),
 +                    extract64(a->rs1, 0, 5), MAXSZ(s), MAXSZ(s));
 +        } else {
 +            gvec_fn(s->sew, vreg_ofs(s, a->rd), vreg_ofs(s, a->rs2),
 +                    sextract64(a->rs1, 0, 5), MAXSZ(s), MAXSZ(s));
 +        }
 +    } else {
 +        return opivi_trans(a->rd, a->rs1, a->rs2, a->vm, fn, s, zx);
 +    }
 +    return true;
 +}
 +
 +/* OPIVI with GVEC IR */
 +#define GEN_OPIVI_GVEC_TRANS(NAME, ZX, OPIVX, SUF) \
 +static bool trans_##NAME(DisasContext *s, arg_rmrr *a)             \
 +{                                                                  \
 +    static gen_helper_opivx * const fns[4] = {                     \
 +        gen_helper_##OPIVX##_b, gen_helper_##OPIVX##_h,            \
 +        gen_helper_##OPIVX##_w, gen_helper_##OPIVX##_d,            \
 +    };                                                             \
 +    return do_opivi_gvec(s, a, tcg_gen_gvec_##SUF,                 \
 +                         fns[s->sew], ZX);                         \
 +}
 +
 +GEN_OPIVI_GVEC_TRANS(vadd_vi, 0, vadd_vx, addi)
 +
 +static void tcg_gen_gvec_rsubi(unsigned vece, uint32_t dofs, uint32_t aofs,
 +                               int64_t c, uint32_t oprsz, uint32_t maxsz)
 +{
 +    TCGv_i64 tmp = tcg_const_i64(c);
 +    tcg_gen_gvec_rsubs(vece, dofs, aofs, tmp, oprsz, maxsz);
 +    tcg_temp_free_i64(tmp);
 +}
 +
 +GEN_OPIVI_GVEC_TRANS(vrsub_vi, 0, vrsub_vx, rsubi)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_AMO(vamominw_v_w,  int32_t,  int32_t,  idx_w, clearl)
  GEN_VEXT_AMO(vamomaxw_v_w,  int32_t,  int32_t,  idx_w, clearl)
  GEN_VEXT_AMO(vamominuw_v_w, uint32_t, uint32_t, idx_w, clearl)
  GEN_VEXT_AMO(vamomaxuw_v_w, uint32_t, uint32_t, idx_w, clearl)
 +
 +/*
 + *** Vector Integer Arithmetic Instructions
 + */
 +
 +/* expand macro args before macro */
 +#define RVVCALL(macro, ...)  macro(__VA_ARGS__)
 +
 +/* (TD, T1, T2, TX1, TX2) */
-+#define OP_SSS_B int8_t, int8_t, int8_t, int8_t, int8_t
++#define OP_UUU_B uint8_t, uint8_t, uint8_t, uint8_t, uint8_t
-+#define OP_SSS_H int16_t, int16_t, int16_t, int16_t, int16_t
++#define OP_UUU_H uint16_t, uint16_t, uint16_t, uint16_t, uint16_t
-+#define OP_SSS_W int32_t, int32_t, int32_t, int32_t, int32_t
++#define OP_UUU_W uint32_t, uint32_t, uint32_t, uint32_t, uint32_t
-+#define OP_SSS_D int64_t, int64_t, int64_t, int64_t, int64_t
++#define OP_UUU_D uint64_t, uint64_t, uint64_t, uint64_t, uint64_t
 +
 +/* operation of two vector elements */
 +typedef void opivv2_fn(void *vd, void *vs1, void *vs2, int i);
 +
 +#define OPIVV2(NAME, TD, T1, T2, TX1, TX2, HD, HS1, HS2, OP)    \
 +static void do_##NAME(void *vd, void *vs1, void *vs2, int i)    \
 +{                                                               \
 +    TX1 s1 = *((T1 *)vs1 + HS1(i));                             \
 +    TX2 s2 = *((T2 *)vs2 + HS2(i));                             \
 +    *((TD *)vd + HD(i)) = OP(s2, s1);                           \
 +}
-+#define DO_SUB(N, M) (N - M)
++
-+#define DO_RSUB(N, M) (M - N)
++void do_vext_vv(void *vd, void *v0, void *vs1, void *vs2,
-+
++                CPURISCVState *env, uint32_t desc,
-+RVVCALL(OPIVV2, vadd_vv_b, OP_SSS_B, H1, H1, H1, DO_ADD)
++                opivv2_fn *fn, uint32_t esz);
 +RVVCALL(OPIVV2, vadd_vv_h, OP_SSS_H, H2, H2, H2, DO_ADD)
 +RVVCALL(OPIVV2, vadd_vv_w, OP_SSS_W, H4, H4, H4, DO_ADD)
 +RVVCALL(OPIVV2, vadd_vv_d, OP_SSS_D, H8, H8, H8, DO_ADD)
 +RVVCALL(OPIVV2, vsub_vv_b, OP_SSS_B, H1, H1, H1, DO_SUB)
 +RVVCALL(OPIVV2, vsub_vv_h, OP_SSS_H, H2, H2, H2, DO_SUB)
 +RVVCALL(OPIVV2, vsub_vv_w, OP_SSS_W, H4, H4, H4, DO_SUB)
 +RVVCALL(OPIVV2, vsub_vv_d, OP_SSS_D, H8, H8, H8, DO_SUB)
 +
 +static void do_vext_vv(void *vd, void *v0, void *vs1, void *vs2,
 +                       CPURISCVState *env, uint32_t desc,
 +                       uint32_t esz, uint32_t dsz,
 +                       opivv2_fn *fn, clear_fn *clearfn)
 +{
 +    uint32_t vlmax = vext_maxsz(desc) / esz;
 +    uint32_t mlen = vext_mlen(desc);
 +    uint32_t vm = vext_vm(desc);
 +    uint32_t vl = env->vl;
 +    uint32_t i;
 +
 +    for (i = 0; i < vl; i++) {
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {
 +            continue;
 +        }
 +        fn(vd, vs1, vs2, i);
 +    }
 +    clearfn(vd, vl, vl * dsz,  vlmax * dsz);
 +}
 +
 +/* generate the helpers for OPIVV */
-+#define GEN_VEXT_VV(NAME, ESZ, DSZ, CLEAR_FN)             \
++#define GEN_VEXT_VV(NAME, ESZ)                            \
 +void HELPER(NAME)(void *vd, void *v0, void *vs1,          \
 +                  void *vs2, CPURISCVState *env,          \
 +                  uint32_t desc)                          \
 +{                                                         \
-+    do_vext_vv(vd, v0, vs1, vs2, env, desc, ESZ, DSZ,     \
++    do_vext_vv(vd, v0, vs1, vs2, env, desc,               \
-+               do_##NAME, CLEAR_FN);                      \
++               do_##NAME, ESZ);                           \
 +}
 +
 +GEN_VEXT_VV(vadd_vv_b, 1, 1, clearb)
 +GEN_VEXT_VV(vadd_vv_h, 2, 2, clearh)
 +GEN_VEXT_VV(vadd_vv_w, 4, 4, clearl)
 +GEN_VEXT_VV(vadd_vv_d, 8, 8, clearq)
 +GEN_VEXT_VV(vsub_vv_b, 1, 1, clearb)
 +GEN_VEXT_VV(vsub_vv_h, 2, 2, clearh)
 +GEN_VEXT_VV(vsub_vv_w, 4, 4, clearl)
 +GEN_VEXT_VV(vsub_vv_d, 8, 8, clearq)
 +
 +typedef void opivx2_fn(void *vd, target_long s1, void *vs2, int i);
 +
 +/*
 + * (T1)s1 gives the real operator type.
 ...
 +{                                                                   \
 +    TX2 s2 = *((T2 *)vs2 + HS2(i));                                 \
 +    *((TD *)vd + HD(i)) = OP(s2, (TX1)(T1)s1);                      \
 +}
 +
-+RVVCALL(OPIVX2, vadd_vx_b, OP_SSS_B, H1, H1, DO_ADD)
++void do_vext_vx(void *vd, void *v0, target_long s1, void *vs2,
-+RVVCALL(OPIVX2, vadd_vx_h, OP_SSS_H, H2, H2, DO_ADD)
++                CPURISCVState *env, uint32_t desc,
-+RVVCALL(OPIVX2, vadd_vx_w, OP_SSS_W, H4, H4, DO_ADD)
++                opivx2_fn fn, uint32_t esz);
-+RVVCALL(OPIVX2, vadd_vx_d, OP_SSS_D, H8, H8, DO_ADD)
++
-+RVVCALL(OPIVX2, vsub_vx_b, OP_SSS_B, H1, H1, DO_SUB)
++/* generate the helpers for OPIVX */
-+RVVCALL(OPIVX2, vsub_vx_h, OP_SSS_H, H2, H2, DO_SUB)
++#define GEN_VEXT_VX(NAME, ESZ)                            \
-+RVVCALL(OPIVX2, vsub_vx_w, OP_SSS_W, H4, H4, DO_SUB)
++void HELPER(NAME)(void *vd, void *v0, target_ulong s1,    \
-+RVVCALL(OPIVX2, vsub_vx_d, OP_SSS_D, H8, H8, DO_SUB)
++                  void *vs2, CPURISCVState *env,          \
-+RVVCALL(OPIVX2, vrsub_vx_b, OP_SSS_B, H1, H1, DO_RSUB)
++                  uint32_t desc)                          \
-+RVVCALL(OPIVX2, vrsub_vx_h, OP_SSS_H, H2, H2, DO_RSUB)
++{                                                         \
-+RVVCALL(OPIVX2, vrsub_vx_w, OP_SSS_W, H4, H4, DO_RSUB)
++    do_vext_vx(vd, v0, s1, vs2, env, desc,                \
-+RVVCALL(OPIVX2, vrsub_vx_d, OP_SSS_D, H8, H8, DO_RSUB)
++               do_##NAME, ESZ);                           \
-+
++}
-+static void do_vext_vx(void *vd, void *v0, target_long s1, void *vs2,
++
-+                       CPURISCVState *env, uint32_t desc,
++#endif /* TARGET_RISCV_VECTOR_INTERNALS_H */
-+                       uint32_t esz, uint32_t dsz,
+diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-+                       opivx2_fn fn, clear_fn *clearfn)
+index XXXXXXX..XXXXXXX 100644
-+{
+--- a/target/riscv/vector_helper.c
-+    uint32_t vlmax = vext_maxsz(desc) / esz;
++++ b/target/riscv/vector_helper.c
-+    uint32_t mlen = vext_mlen(desc);
+@@ -XXX,XX +XXX,XX @@
  #include "fpu/softfloat.h"
  #include "tcg/tcg-gvec-desc.h"
  #include "internals.h"
 +#include "vector_internals.h"
  #include <math.h>
  target_ulong HELPER(vsetvl)(CPURISCVState *env, target_ulong s1,
@@ -XXX,XX +XXX,XX @@ target_ulong HELPER(vsetvl)(CPURISCVState *env, target_ulong s1,
      return vl;
  }
 -/*
 - * Note that vector data is stored in host-endian 64-bit chunks,
 - * so addressing units smaller than that needs a host-endian fixup.
 - */
 -#if HOST_BIG_ENDIAN
 -#define H1(x)   ((x) ^ 7)
 -#define H1_2(x) ((x) ^ 6)
 -#define H1_4(x) ((x) ^ 4)
 -#define H2(x)   ((x) ^ 3)
 -#define H4(x)   ((x) ^ 1)
 -#define H8(x)   ((x))
 -#else
 -#define H1(x)   (x)
 -#define H1_2(x) (x)
 -#define H1_4(x) (x)
 -#define H2(x)   (x)
 -#define H4(x)   (x)
 -#define H8(x)   (x)
 -#endif
 -
 -static inline uint32_t vext_nf(uint32_t desc)
 -{
 -    return FIELD_EX32(simd_data(desc), VDATA, NF);
 -}
 -
 -static inline uint32_t vext_vm(uint32_t desc)
 -{
 -    return FIELD_EX32(simd_data(desc), VDATA, VM);
 -}
 -
 -/*
 - * Encode LMUL to lmul as following:
 - *     LMUL    vlmul    lmul
 - *      1       000       0
 - *      2       001       1
 - *      4       010       2
 - *      8       011       3
 - *      -       100       -
 - *     1/8      101      -3
 - *     1/4      110      -2
 - *     1/2      111      -1
 - */
 -static inline int32_t vext_lmul(uint32_t desc)
 -{
 -    return sextract32(FIELD_EX32(simd_data(desc), VDATA, LMUL), 0, 3);
 -}
 -
 -static inline uint32_t vext_vta(uint32_t desc)
 -{
 -    return FIELD_EX32(simd_data(desc), VDATA, VTA);
 -}
 -
 -static inline uint32_t vext_vma(uint32_t desc)
 -{
 -    return FIELD_EX32(simd_data(desc), VDATA, VMA);
 -}
 -
 -static inline uint32_t vext_vta_all_1s(uint32_t desc)
 -{
 -    return FIELD_EX32(simd_data(desc), VDATA, VTA_ALL_1S);
 -}
 -
  /*
   * Get the maximum number of elements can be operated.
   *
@@ -XXX,XX +XXX,XX @@ static inline uint32_t vext_max_elems(uint32_t desc, uint32_t log2_esz)
      return scale < 0 ? vlenb >> -scale : vlenb << scale;
  }
 -/*
 - * Get number of total elements, including prestart, body and tail elements.
 - * Note that when LMUL < 1, the tail includes the elements past VLMAX that
 - * are held in the same vector register.
 - */
 -static inline uint32_t vext_get_total_elems(CPURISCVState *env, uint32_t desc,
 -                                            uint32_t esz)
 -{
 -    uint32_t vlenb = simd_maxsz(desc);
 -    uint32_t sew = 1 << FIELD_EX64(env->vtype, VTYPE, VSEW);
 -    int8_t emul = ctzl(esz) - ctzl(sew) + vext_lmul(desc) < 0 ? 0 :
 -                  ctzl(esz) - ctzl(sew) + vext_lmul(desc);
 -    return (vlenb << emul) / esz;
 -}
 -
  static inline target_ulong adjust_addr(CPURISCVState *env, target_ulong addr)
  {
      return (addr & ~env->cur_pmmask) | env->cur_pmbase;
@@ -XXX,XX +XXX,XX @@ static void probe_pages(CPURISCVState *env, target_ulong addr,
      }
  }
 -/* set agnostic elements to 1s */
 -static void vext_set_elems_1s(void *base, uint32_t is_agnostic, uint32_t cnt,
 -                              uint32_t tot)
 -{
 -    if (is_agnostic == 0) {
 -        /* policy undisturbed */
 -        return;
 -    }
 -    if (tot - cnt == 0) {
 -        return;
 -    }
 -    memset(base + cnt, -1, tot - cnt);
 -}
 -
  static inline void vext_set_elem_mask(void *v0, int index,
                                        uint8_t value)
  {
@@ -XXX,XX +XXX,XX @@ static inline void vext_set_elem_mask(void *v0, int index,
      ((uint64_t *)v0)[idx] = deposit64(old, pos, 1, value);
  }
 -/*
 - * Earlier designs (pre-0.9) had a varying number of bits
 - * per mask value (MLEN). In the 0.9 design, MLEN=1.
 - * (Section 4.5)
 - */
 -static inline int vext_elem_mask(void *v0, int index)
 -{
 -    int idx = index / 64;
 -    int pos = index  % 64;
 -    return (((uint64_t *)v0)[idx] >> pos) & 1;
 -}
 -
  /* elements operations for load and store */
  typedef void vext_ldst_elem_fn(CPURISCVState *env, abi_ptr addr,
                                 uint32_t idx, void *vd, uintptr_t retaddr);
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_ST_WHOLE(vs8r_v, int8_t, ste_b)
   * Vector Integer Arithmetic Instructions
   */
 -/* expand macro args before macro */
 -#define RVVCALL(macro, ...)  macro(__VA_ARGS__)
 -
  /* (TD, T1, T2, TX1, TX2) */
  #define OP_SSS_B int8_t, int8_t, int8_t, int8_t, int8_t
  #define OP_SSS_H int16_t, int16_t, int16_t, int16_t, int16_t
  #define OP_SSS_W int32_t, int32_t, int32_t, int32_t, int32_t
  #define OP_SSS_D int64_t, int64_t, int64_t, int64_t, int64_t
 -#define OP_UUU_B uint8_t, uint8_t, uint8_t, uint8_t, uint8_t
 -#define OP_UUU_H uint16_t, uint16_t, uint16_t, uint16_t, uint16_t
 -#define OP_UUU_W uint32_t, uint32_t, uint32_t, uint32_t, uint32_t
 -#define OP_UUU_D uint64_t, uint64_t, uint64_t, uint64_t, uint64_t
  #define OP_SUS_B int8_t, uint8_t, int8_t, uint8_t, int8_t
  #define OP_SUS_H int16_t, uint16_t, int16_t, uint16_t, int16_t
  #define OP_SUS_W int32_t, uint32_t, int32_t, uint32_t, int32_t
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_ST_WHOLE(vs8r_v, int8_t, ste_b)
  #define NOP_UUU_H uint16_t, uint16_t, uint32_t, uint16_t, uint32_t
  #define NOP_UUU_W uint32_t, uint32_t, uint64_t, uint32_t, uint64_t
 -/* operation of two vector elements */
 -typedef void opivv2_fn(void *vd, void *vs1, void *vs2, int i);
 -
 -#define OPIVV2(NAME, TD, T1, T2, TX1, TX2, HD, HS1, HS2, OP)    \
 -static void do_##NAME(void *vd, void *vs1, void *vs2, int i)    \
 -{                                                               \
 -    TX1 s1 = *((T1 *)vs1 + HS1(i));                             \
 -    TX2 s2 = *((T2 *)vs2 + HS2(i));                             \
 -    *((TD *)vd + HD(i)) = OP(s2, s1);                           \
 -}
  #define DO_SUB(N, M) (N - M)
  #define DO_RSUB(N, M) (M - N)
@@ -XXX,XX +XXX,XX @@ RVVCALL(OPIVV2, vsub_vv_h, OP_SSS_H, H2, H2, H2, DO_SUB)
  RVVCALL(OPIVV2, vsub_vv_w, OP_SSS_W, H4, H4, H4, DO_SUB)
  RVVCALL(OPIVV2, vsub_vv_d, OP_SSS_D, H8, H8, H8, DO_SUB)
 -static void do_vext_vv(void *vd, void *v0, void *vs1, void *vs2,
 -                       CPURISCVState *env, uint32_t desc,
 -                       opivv2_fn *fn, uint32_t esz)
 -{
 -    uint32_t vm = vext_vm(desc);
 -    uint32_t vl = env->vl;
 -    uint32_t total_elems = vext_get_total_elems(env, desc, esz);
 -    uint32_t vta = vext_vta(desc);
 -    uint32_t vma = vext_vma(desc);
 -    uint32_t i;
 -
 -    for (i = env->vstart; i < vl; i++) {
 -        if (!vm && !vext_elem_mask(v0, i)) {
 -            /* set masked-off elements to 1s */
 -            vext_set_elems_1s(vd, vma, i * esz, (i + 1) * esz);
 -            continue;
 -        }
 -        fn(vd, vs1, vs2, i);
 -    }
 -    env->vstart = 0;
 -    /* set tail elements to 1s */
 -    vext_set_elems_1s(vd, vta, vl * esz, total_elems * esz);
 -}
 -
 -/* generate the helpers for OPIVV */
 -#define GEN_VEXT_VV(NAME, ESZ)                            \
 -void HELPER(NAME)(void *vd, void *v0, void *vs1,          \
 -                  void *vs2, CPURISCVState *env,          \
 -                  uint32_t desc)                          \
 -{                                                         \
 -    do_vext_vv(vd, v0, vs1, vs2, env, desc,               \
 -               do_##NAME, ESZ);                           \
 -}
 -
  GEN_VEXT_VV(vadd_vv_b, 1)
  GEN_VEXT_VV(vadd_vv_h, 2)
  GEN_VEXT_VV(vadd_vv_w, 4)
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VV(vsub_vv_h, 2)
  GEN_VEXT_VV(vsub_vv_w, 4)
  GEN_VEXT_VV(vsub_vv_d, 8)
 -typedef void opivx2_fn(void *vd, target_long s1, void *vs2, int i);
 -
 -/*
 - * (T1)s1 gives the real operator type.
 - * (TX1)(T1)s1 expands the operator type of widen or narrow operations.
 - */
 -#define OPIVX2(NAME, TD, T1, T2, TX1, TX2, HD, HS2, OP)             \
 -static void do_##NAME(void *vd, target_long s1, void *vs2, int i)   \
 -{                                                                   \
 -    TX2 s2 = *((T2 *)vs2 + HS2(i));                                 \
 -    *((TD *)vd + HD(i)) = OP(s2, (TX1)(T1)s1);                      \
 -}
  RVVCALL(OPIVX2, vadd_vx_b, OP_SSS_B, H1, H1, DO_ADD)
  RVVCALL(OPIVX2, vadd_vx_h, OP_SSS_H, H2, H2, DO_ADD)
@@ -XXX,XX +XXX,XX @@ RVVCALL(OPIVX2, vrsub_vx_h, OP_SSS_H, H2, H2, DO_RSUB)
  RVVCALL(OPIVX2, vrsub_vx_w, OP_SSS_W, H4, H4, DO_RSUB)
  RVVCALL(OPIVX2, vrsub_vx_d, OP_SSS_D, H8, H8, DO_RSUB)
 -static void do_vext_vx(void *vd, void *v0, target_long s1, void *vs2,
 -                       CPURISCVState *env, uint32_t desc,
 -                       opivx2_fn fn, uint32_t esz)
 -{
 -    uint32_t vm = vext_vm(desc);
 -    uint32_t vl = env->vl;
 -    uint32_t total_elems = vext_get_total_elems(env, desc, esz);
 -    uint32_t vta = vext_vta(desc);
 -    uint32_t vma = vext_vma(desc);
 -    uint32_t i;
 -
 -    for (i = env->vstart; i < vl; i++) {
 -        if (!vm && !vext_elem_mask(v0, i)) {
 -            /* set masked-off elements to 1s */
 -            vext_set_elems_1s(vd, vma, i * esz, (i + 1) * esz);
 -            continue;
 -        }
 -        fn(vd, s1, vs2, i);
 -    }
 -    env->vstart = 0;
 -    /* set tail elements to 1s */
 -    vext_set_elems_1s(vd, vta, vl * esz, total_elems * esz);
 -}
 -
 -/* generate the helpers for OPIVX */
 -#define GEN_VEXT_VX(NAME, ESZ)                            \
 -void HELPER(NAME)(void *vd, void *v0, target_ulong s1,    \
 -                  void *vs2, CPURISCVState *env,          \
 -                  uint32_t desc)                          \
 -{                                                         \
 -    do_vext_vx(vd, v0, s1, vs2, env, desc,                \
 -               do_##NAME, ESZ);                           \
 -}
 -
  GEN_VEXT_VX(vadd_vx_b, 1)
  GEN_VEXT_VX(vadd_vx_h, 2)
  GEN_VEXT_VX(vadd_vx_w, 4)
 diff --git a/target/riscv/vector_internals.c b/target/riscv/vector_internals.c
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
 +++ b/target/riscv/vector_internals.c
@@ -XXX,XX +XXX,XX @@
 +/*
 + * RISC-V Vector Extension Internals
 + *
 + * Copyright (c) 2020 T-Head Semiconductor Co., Ltd. All rights reserved.
 + *
 + * This program is free software; you can redistribute it and/or modify it
 + * under the terms and conditions of the GNU General Public License,
 + * version 2 or later, as published by the Free Software Foundation.
 + *
 + * This program is distributed in the hope it will be useful, but WITHOUT
 + * ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
 + * FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License for
 + * more details.
 + *
 + * You should have received a copy of the GNU General Public License along with
 + * this program.  If not, see <http://www.gnu.org/licenses/>.
 + */
 +
 +#include "vector_internals.h"
 +
 +/* set agnostic elements to 1s */
 +void vext_set_elems_1s(void *base, uint32_t is_agnostic, uint32_t cnt,
 +                       uint32_t tot)
 +{
 +    if (is_agnostic == 0) {
 +        /* policy undisturbed */
 +        return;
 +    }
 +    if (tot - cnt == 0) {
 +        return ;
 +    }
 +    memset(base + cnt, -1, tot - cnt);
 +}
 +
 +void do_vext_vv(void *vd, void *v0, void *vs1, void *vs2,
 +                CPURISCVState *env, uint32_t desc,
 +                opivv2_fn *fn, uint32_t esz)
 +{
 +    uint32_t vm = vext_vm(desc);
 +    uint32_t vl = env->vl;
++    uint32_t total_elems = vext_get_total_elems(env, desc, esz);
++    uint32_t vta = vext_vta(desc);
++    uint32_t vma = vext_vma(desc);
 +    uint32_t i;
 +
-+    for (i = 0; i < vl; i++) {
++    for (i = env->vstart; i < vl; i++) {
-+        if (!vm && !vext_elem_mask(v0, mlen, i)) {
++        if (!vm && !vext_elem_mask(v0, i)) {
 +            /* set masked-off elements to 1s */
 +            vext_set_elems_1s(vd, vma, i * esz, (i + 1) * esz);
 +            continue;
 +        }
 +        fn(vd, vs1, vs2, i);
 +    }
 +    env->vstart = 0;
 +    /* set tail elements to 1s */
 +    vext_set_elems_1s(vd, vta, vl * esz, total_elems * esz);
 +}
 +
 +void do_vext_vx(void *vd, void *v0, target_long s1, void *vs2,
 +                CPURISCVState *env, uint32_t desc,
 +                opivx2_fn fn, uint32_t esz)
 +{
 +    uint32_t vm = vext_vm(desc);
 +    uint32_t vl = env->vl;
 +    uint32_t total_elems = vext_get_total_elems(env, desc, esz);
 +    uint32_t vta = vext_vta(desc);
 +    uint32_t vma = vext_vma(desc);
 +    uint32_t i;
 +
 +    for (i = env->vstart; i < vl; i++) {
 +        if (!vm && !vext_elem_mask(v0, i)) {
 +            /* set masked-off elements to 1s */
 +            vext_set_elems_1s(vd, vma, i * esz, (i + 1) * esz);
 +            continue;
 +        }
 +        fn(vd, s1, vs2, i);
 +    }
-+    clearfn(vd, vl, vl * dsz,  vlmax * dsz);
++    env->vstart = 0;
-+}
++    /* set tail elements to 1s */
-+
++    vext_set_elems_1s(vd, vta, vl * esz, total_elems * esz);
-+/* generate the helpers for OPIVX */
++}
-+#define GEN_VEXT_VX(NAME, ESZ, DSZ, CLEAR_FN)             \
+diff --git a/target/riscv/meson.build b/target/riscv/meson.build
-+void HELPER(NAME)(void *vd, void *v0, target_ulong s1,    \
+index XXXXXXX..XXXXXXX 100644
-+                  void *vs2, CPURISCVState *env,          \
+--- a/target/riscv/meson.build
-+                  uint32_t desc)                          \
++++ b/target/riscv/meson.build
-+{                                                         \
+@@ -XXX,XX +XXX,XX @@ riscv_ss.add(files(
-+    do_vext_vx(vd, v0, s1, vs2, env, desc, ESZ, DSZ,      \
+   'gdbstub.c',
-+               do_##NAME, CLEAR_FN);                      \
+   'op_helper.c',
-+}
+   'vector_helper.c',
-+
++  'vector_internals.c',
-+GEN_VEXT_VX(vadd_vx_b, 1, 1, clearb)
+   'bitmanip_helper.c',
-+GEN_VEXT_VX(vadd_vx_h, 2, 2, clearh)
+   'translate.c',
-+GEN_VEXT_VX(vadd_vx_w, 4, 4, clearl)
+   'm128_helper.c',
 +GEN_VEXT_VX(vadd_vx_d, 8, 8, clearq)
 +GEN_VEXT_VX(vsub_vx_b, 1, 1, clearb)
 +GEN_VEXT_VX(vsub_vx_h, 2, 2, clearh)
 +GEN_VEXT_VX(vsub_vx_w, 4, 4, clearl)
 +GEN_VEXT_VX(vsub_vx_d, 8, 8, clearq)
 +GEN_VEXT_VX(vrsub_vx_b, 1, 1, clearb)
 +GEN_VEXT_VX(vrsub_vx_h, 2, 2, clearh)
 +GEN_VEXT_VX(vrsub_vx_w, 4, 4, clearl)
 +GEN_VEXT_VX(vrsub_vx_d, 8, 8, clearq)
 +
 +void HELPER(vec_rsubs8)(void *d, void *a, uint64_t b, uint32_t desc)
 +{
 +    intptr_t oprsz = simd_oprsz(desc);
 +    intptr_t i;
 +
 +    for (i = 0; i < oprsz; i += sizeof(uint8_t)) {
 +        *(uint8_t *)(d + i) = (uint8_t)b - *(uint8_t *)(a + i);
 +    }
 +}
 +
 +void HELPER(vec_rsubs16)(void *d, void *a, uint64_t b, uint32_t desc)
 +{
 +    intptr_t oprsz = simd_oprsz(desc);
 +    intptr_t i;
 +
 +    for (i = 0; i < oprsz; i += sizeof(uint16_t)) {
 +        *(uint16_t *)(d + i) = (uint16_t)b - *(uint16_t *)(a + i);
 +    }
 +}
 +
 +void HELPER(vec_rsubs32)(void *d, void *a, uint64_t b, uint32_t desc)
 +{
 +    intptr_t oprsz = simd_oprsz(desc);
 +    intptr_t i;
 +
 +    for (i = 0; i < oprsz; i += sizeof(uint32_t)) {
 +        *(uint32_t *)(d + i) = (uint32_t)b - *(uint32_t *)(a + i);
 +    }
 +}
 +
 +void HELPER(vec_rsubs64)(void *d, void *a, uint64_t b, uint32_t desc)
 +{
 +    intptr_t oprsz = simd_oprsz(desc);
 +    intptr_t i;
 +
 +    for (i = 0; i < oprsz; i += sizeof(uint64_t)) {
 +        *(uint64_t *)(d + i) = b - *(uint64_t *)(a + i);
 +    }
 +}
 --
-.27.0
+.41.0

-[PULL 14/63] target/riscv: vector integer add-with-carry / subtract-with-borrow instructions
+[PULL v2 09/45] target/riscv: Refactor vector-vector translation macro
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Kiran Ostrolenk <kiran.ostrolenk@codethink.co.uk>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Refactor the non SEW-specific stuff out of `GEN_OPIVV_TRANS` into
 function `opivv_trans` (similar to `opivi_trans`). `opivv_trans` will be
 used in proceeding vector-crypto commits.
 Signed-off-by: Kiran Ostrolenk <kiran.ostrolenk@codethink.co.uk>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Weiwei Li <liweiwei@iscas.ac.cn>
-Message-id: 20200623215920.2594-13-zhiwei_liu@c-sky.com
+Signed-off-by: Max Chou <max.chou@sifive.com>
 Message-ID: <20230711165917.2629866-3-max.chou@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   |  33 ++++++
+ target/riscv/insn_trans/trans_rvv.c.inc | 62 +++++++++++++------------
- target/riscv/insn32.decode              |  11 ++
+file changed, 32 insertions(+), 30 deletions(-)
  target/riscv/insn_trans/trans_rvv.inc.c | 113 +++++++++++++++++++
  target/riscv/vector_helper.c            | 137 ++++++++++++++++++++++++
 files changed, 294 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/target/riscv/insn_trans/trans_rvv.c.inc b/target/riscv/insn_trans/trans_rvv.c.inc
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/target/riscv/insn_trans/trans_rvv.c.inc
-+++ b/target/riscv/helper.h
++++ b/target/riscv/insn_trans/trans_rvv.c.inc
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vwadd_wx_w, void, ptr, ptr, tl, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ GEN_OPIWX_WIDEN_TRANS(vwadd_wx)
  DEF_HELPER_6(vwsub_wx_b, void, ptr, ptr, tl, ptr, env, i32)
  DEF_HELPER_6(vwsub_wx_h, void, ptr, ptr, tl, ptr, env, i32)
  DEF_HELPER_6(vwsub_wx_w, void, ptr, ptr, tl, ptr, env, i32)
 +
 +DEF_HELPER_6(vadc_vvm_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vadc_vvm_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vadc_vvm_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vadc_vvm_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vsbc_vvm_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vsbc_vvm_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vsbc_vvm_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vsbc_vvm_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmadc_vvm_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmadc_vvm_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmadc_vvm_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmadc_vvm_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmsbc_vvm_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmsbc_vvm_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmsbc_vvm_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmsbc_vvm_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vadc_vxm_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vadc_vxm_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vadc_vxm_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vadc_vxm_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsbc_vxm_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsbc_vxm_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsbc_vxm_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsbc_vxm_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmadc_vxm_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmadc_vxm_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmadc_vxm_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmadc_vxm_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmsbc_vxm_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmsbc_vxm_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmsbc_vxm_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vmsbc_vxm_d, void, ptr, ptr, tl, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@
  @r2_nfvm ... ... vm:1 ..... ..... ... ..... ....... &r2nfvm %nf %rs1 %rd
  @r_nfvm  ... ... vm:1 ..... ..... ... ..... ....... &rnfvm %nf %rs2 %rs1 %rd
  @r_vm    ...... vm:1 ..... ..... ... ..... ....... &rmrr %rs2 %rs1 %rd
 +@r_vm_1  ...... . ..... ..... ... ..... .......    &rmrr vm=1 %rs2 %rs1 %rd
  @r_wdvm  ..... wd:1 vm:1 ..... ..... ... ..... ....... &rwdvm %rs2 %rs1 %rd
  @r2_zimm . zimm:11  ..... ... ..... ....... %rs1 %rd
@@ -XXX,XX +XXX,XX @@ vwsubu_wv       110110 . ..... ..... 010 ..... 1010111 @r_vm
  vwsubu_wx       110110 . ..... ..... 110 ..... 1010111 @r_vm
  vwsub_wv        110111 . ..... ..... 010 ..... 1010111 @r_vm
  vwsub_wx        110111 . ..... ..... 110 ..... 1010111 @r_vm
 +vadc_vvm        010000 1 ..... ..... 000 ..... 1010111 @r_vm_1
 +vadc_vxm        010000 1 ..... ..... 100 ..... 1010111 @r_vm_1
 +vadc_vim        010000 1 ..... ..... 011 ..... 1010111 @r_vm_1
 +vmadc_vvm       010001 1 ..... ..... 000 ..... 1010111 @r_vm_1
 +vmadc_vxm       010001 1 ..... ..... 100 ..... 1010111 @r_vm_1
 +vmadc_vim       010001 1 ..... ..... 011 ..... 1010111 @r_vm_1
 +vsbc_vvm        010010 1 ..... ..... 000 ..... 1010111 @r_vm_1
 +vsbc_vxm        010010 1 ..... ..... 100 ..... 1010111 @r_vm_1
 +vmsbc_vvm       010011 1 ..... ..... 000 ..... 1010111 @r_vm_1
 +vmsbc_vxm       010011 1 ..... ..... 100 ..... 1010111 @r_vm_1
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ GEN_OPIWX_WIDEN_TRANS(vwaddu_wx)
  GEN_OPIWX_WIDEN_TRANS(vwadd_wx)
  GEN_OPIWX_WIDEN_TRANS(vwsubu_wx)
  GEN_OPIWX_WIDEN_TRANS(vwsub_wx)
++static bool opivv_trans(uint32_t vd, uint32_t vs1, uint32_t vs2, uint32_t vm,
++                        gen_helper_gvec_4_ptr *fn, DisasContext *s)
++{
++    uint32_t data = 0;
++    TCGLabel *over = gen_new_label();
++    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
++    tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
 +
-+/* Vector Integer Add-with-Carry / Subtract-with-Borrow Instructions */
++    data = FIELD_DP32(data, VDATA, VM, vm);
-+/* OPIVV without GVEC IR */
++    data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
-+#define GEN_OPIVV_TRANS(NAME, CHECK)                               \
++    data = FIELD_DP32(data, VDATA, VTA, s->vta);
-+static bool trans_##NAME(DisasContext *s, arg_rmrr *a)             \
++    data = FIELD_DP32(data, VDATA, VTA_ALL_1S, s->cfg_vta_all_1s);
-+{                                                                  \
++    data = FIELD_DP32(data, VDATA, VMA, s->vma);
-+    if (CHECK(s, a)) {                                             \
++    tcg_gen_gvec_4_ptr(vreg_ofs(s, vd), vreg_ofs(s, 0), vreg_ofs(s, vs1),
-+        uint32_t data = 0;                                         \
++                       vreg_ofs(s, vs2), cpu_env, s->cfg_ptr->vlen / 8,
-+        static gen_helper_gvec_4_ptr * const fns[4] = {            \
++                       s->cfg_ptr->vlen / 8, data, fn);
-+            gen_helper_##NAME##_b, gen_helper_##NAME##_h,          \
++    mark_vs_dirty(s);
-+            gen_helper_##NAME##_w, gen_helper_##NAME##_d,          \
++    gen_set_label(over);
-+        };                                                         \
++    return true;
 +        TCGLabel *over = gen_new_label();                          \
 +        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
 +                                                                   \
 +        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);             \
 +        data = FIELD_DP32(data, VDATA, VM, a->vm);                 \
 +        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);             \
 +        tcg_gen_gvec_4_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),     \
 +                           vreg_ofs(s, a->rs1),                    \
 +                           vreg_ofs(s, a->rs2), cpu_env, 0,        \
 +                           s->vlen / 8, data, fns[s->sew]);        \
 +        gen_set_label(over);                                       \
 +        return true;                                               \
 +    }                                                              \
 +    return false;                                                  \
 +}
 +
-+/*
+ /* Vector Integer Add-with-Carry / Subtract-with-Borrow Instructions */
-+ * For vadc and vsbc, an illegal instruction exception is raised if the
+ /* OPIVV without GVEC IR */
-+ * destination vector register is v0 and LMUL > 1. (Section 12.3)
+-#define GEN_OPIVV_TRANS(NAME, CHECK)                               \
-+ */
+-static bool trans_##NAME(DisasContext *s, arg_rmrr *a)             \
-+static bool opivv_vadc_check(DisasContext *s, arg_rmrr *a)
+-{                                                                  \
-+{
+-    if (CHECK(s, a)) {                                             \
-+    return (vext_check_isa_ill(s) &&
+-        uint32_t data = 0;                                         \
-+            vext_check_reg(s, a->rd, false) &&
+-        static gen_helper_gvec_4_ptr * const fns[4] = {            \
-+            vext_check_reg(s, a->rs2, false) &&
+-            gen_helper_##NAME##_b, gen_helper_##NAME##_h,          \
-+            vext_check_reg(s, a->rs1, false) &&
+-            gen_helper_##NAME##_w, gen_helper_##NAME##_d,          \
-+            ((a->rd != 0) || (s->lmul == 0)));
+-        };                                                         \
-+}
+-        TCGLabel *over = gen_new_label();                          \
-+
+-        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
-+GEN_OPIVV_TRANS(vadc_vvm, opivv_vadc_check)
+-        tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over); \
-+GEN_OPIVV_TRANS(vsbc_vvm, opivv_vadc_check)
+-                                                                   \
-+
+-        data = FIELD_DP32(data, VDATA, VM, a->vm);                 \
-+/*
+-        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);             \
-+ * For vmadc and vmsbc, an illegal instruction exception is raised if the
+-        data = FIELD_DP32(data, VDATA, VTA, s->vta);               \
-+ * destination vector register overlaps a source vector register group.
+-        data =                                                     \
-+ */
+-            FIELD_DP32(data, VDATA, VTA_ALL_1S, s->cfg_vta_all_1s);\
-+static bool opivv_vmadc_check(DisasContext *s, arg_rmrr *a)
+-        data = FIELD_DP32(data, VDATA, VMA, s->vma);               \
-+{
+-        tcg_gen_gvec_4_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),     \
-+    return (vext_check_isa_ill(s) &&
+-                           vreg_ofs(s, a->rs1),                    \
-+            vext_check_reg(s, a->rs2, false) &&
+-                           vreg_ofs(s, a->rs2), cpu_env,           \
-+            vext_check_reg(s, a->rs1, false) &&
+-                           s->cfg_ptr->vlen / 8,                   \
-+            vext_check_overlap_group(a->rd, 1, a->rs1, 1 << s->lmul) &&
+-                           s->cfg_ptr->vlen / 8, data,             \
-+            vext_check_overlap_group(a->rd, 1, a->rs2, 1 << s->lmul));
+-                           fns[s->sew]);                           \
-+}
+-        mark_vs_dirty(s);                                          \
-+
+-        gen_set_label(over);                                       \
-+GEN_OPIVV_TRANS(vmadc_vvm, opivv_vmadc_check)
+-        return true;                                               \
-+GEN_OPIVV_TRANS(vmsbc_vvm, opivv_vmadc_check)
+-    }                                                              \
-+
+-    return false;                                                  \
-+static bool opivx_vadc_check(DisasContext *s, arg_rmrr *a)
++#define GEN_OPIVV_TRANS(NAME, CHECK)                                     \
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_reg(s, a->rd, false) &&
 +            vext_check_reg(s, a->rs2, false) &&
 +            ((a->rd != 0) || (s->lmul == 0)));
 +}
 +
 +/* OPIVX without GVEC IR */
 +#define GEN_OPIVX_TRANS(NAME, CHECK)                                     \
 +static bool trans_##NAME(DisasContext *s, arg_rmrr *a)                   \
 +{                                                                        \
 +    if (CHECK(s, a)) {                                                   \
-+        static gen_helper_opivx * const fns[4] = {                       \
++        static gen_helper_gvec_4_ptr * const fns[4] = {                  \
 +            gen_helper_##NAME##_b, gen_helper_##NAME##_h,                \
 +            gen_helper_##NAME##_w, gen_helper_##NAME##_d,                \
 +        };                                                               \
-+                                                                         \
++        return opivv_trans(a->rd, a->rs1, a->rs2, a->vm, fns[s->sew], s);\
 +        return opivx_trans(a->rd, a->rs1, a->rs2, a->vm, fns[s->sew], s);\
 +    }                                                                    \
 +    return false;                                                        \
-+}
-+
-+GEN_OPIVX_TRANS(vadc_vxm, opivx_vadc_check)
-+GEN_OPIVX_TRANS(vsbc_vxm, opivx_vadc_check)
-+
-+static bool opivx_vmadc_check(DisasContext *s, arg_rmrr *a)
-+{
-+    return (vext_check_isa_ill(s) &&
-+            vext_check_reg(s, a->rs2, false) &&
-+            vext_check_overlap_group(a->rd, 1, a->rs2, 1 << s->lmul));
-+}
-+
-+GEN_OPIVX_TRANS(vmadc_vxm, opivx_vmadc_check)
-+GEN_OPIVX_TRANS(vmsbc_vxm, opivx_vmadc_check)
-+
-+/* OPIVI without GVEC IR */
-+#define GEN_OPIVI_TRANS(NAME, ZX, OPIVX, CHECK)                          \
-+static bool trans_##NAME(DisasContext *s, arg_rmrr *a)                   \
-+{                                                                        \
-+    if (CHECK(s, a)) {                                                   \
-+        static gen_helper_opivx * const fns[4] = {                       \
-+            gen_helper_##OPIVX##_b, gen_helper_##OPIVX##_h,              \
-+            gen_helper_##OPIVX##_w, gen_helper_##OPIVX##_d,              \
-+        };                                                               \
-+        return opivi_trans(a->rd, a->rs1, a->rs2, a->vm,                 \
-+                           fns[s->sew], s, ZX);                          \
-+    }                                                                    \
-+    return false;                                                        \
-+}
-+
-+GEN_OPIVI_TRANS(vadc_vim, 0, vadc_vxm, opivx_vadc_check)
-+GEN_OPIVI_TRANS(vmadc_vim, 0, vmadc_vxm, opivx_vmadc_check)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ static void clearq(void *vd, uint32_t idx, uint32_t cnt, uint32_t tot)
-     vext_clear(cur, cnt, tot);
  }
-+static inline void vext_set_elem_mask(void *v0, int mlen, int index,
+ /*
 +        uint8_t value)
 +{
 +    int idx = (index * mlen) / 64;
 +    int pos = (index * mlen) % 64;
 +    uint64_t old = ((uint64_t *)v0)[idx];
 +    ((uint64_t *)v0)[idx] = deposit64(old, pos, mlen, value);
 +}
  static inline int vext_elem_mask(void *v0, int mlen, int index)
  {
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VX(vwadd_wx_w, 4, 8, clearq)
  GEN_VEXT_VX(vwsub_wx_b, 1, 2, clearh)
  GEN_VEXT_VX(vwsub_wx_h, 2, 4, clearl)
  GEN_VEXT_VX(vwsub_wx_w, 4, 8, clearq)
 +
 +/* Vector Integer Add-with-Carry / Subtract-with-Borrow Instructions */
 +#define DO_VADC(N, M, C) (N + M + C)
 +#define DO_VSBC(N, M, C) (N - M - C)
 +
 +#define GEN_VEXT_VADC_VVM(NAME, ETYPE, H, DO_OP, CLEAR_FN)    \
 +void HELPER(NAME)(void *vd, void *v0, void *vs1, void *vs2,   \
 +                  CPURISCVState *env, uint32_t desc)          \
 +{                                                             \
 +    uint32_t mlen = vext_mlen(desc);                          \
 +    uint32_t vl = env->vl;                                    \
 +    uint32_t esz = sizeof(ETYPE);                             \
 +    uint32_t vlmax = vext_maxsz(desc) / esz;                  \
 +    uint32_t i;                                               \
 +                                                              \
 +    for (i = 0; i < vl; i++) {                                \
 +        ETYPE s1 = *((ETYPE *)vs1 + H(i));                    \
 +        ETYPE s2 = *((ETYPE *)vs2 + H(i));                    \
 +        uint8_t carry = vext_elem_mask(v0, mlen, i);          \
 +                                                              \
 +        *((ETYPE *)vd + H(i)) = DO_OP(s2, s1, carry);         \
 +    }                                                         \
 +    CLEAR_FN(vd, vl, vl * esz, vlmax * esz);                  \
 +}
 +
 +GEN_VEXT_VADC_VVM(vadc_vvm_b, uint8_t,  H1, DO_VADC, clearb)
 +GEN_VEXT_VADC_VVM(vadc_vvm_h, uint16_t, H2, DO_VADC, clearh)
 +GEN_VEXT_VADC_VVM(vadc_vvm_w, uint32_t, H4, DO_VADC, clearl)
 +GEN_VEXT_VADC_VVM(vadc_vvm_d, uint64_t, H8, DO_VADC, clearq)
 +
 +GEN_VEXT_VADC_VVM(vsbc_vvm_b, uint8_t,  H1, DO_VSBC, clearb)
 +GEN_VEXT_VADC_VVM(vsbc_vvm_h, uint16_t, H2, DO_VSBC, clearh)
 +GEN_VEXT_VADC_VVM(vsbc_vvm_w, uint32_t, H4, DO_VSBC, clearl)
 +GEN_VEXT_VADC_VVM(vsbc_vvm_d, uint64_t, H8, DO_VSBC, clearq)
 +
 +#define GEN_VEXT_VADC_VXM(NAME, ETYPE, H, DO_OP, CLEAR_FN)               \
 +void HELPER(NAME)(void *vd, void *v0, target_ulong s1, void *vs2,        \
 +                  CPURISCVState *env, uint32_t desc)                     \
 +{                                                                        \
 +    uint32_t mlen = vext_mlen(desc);                                     \
 +    uint32_t vl = env->vl;                                               \
 +    uint32_t esz = sizeof(ETYPE);                                        \
 +    uint32_t vlmax = vext_maxsz(desc) / esz;                             \
 +    uint32_t i;                                                          \
 +                                                                         \
 +    for (i = 0; i < vl; i++) {                                           \
 +        ETYPE s2 = *((ETYPE *)vs2 + H(i));                               \
 +        uint8_t carry = vext_elem_mask(v0, mlen, i);                     \
 +                                                                         \
 +        *((ETYPE *)vd + H(i)) = DO_OP(s2, (ETYPE)(target_long)s1, carry);\
 +    }                                                                    \
 +    CLEAR_FN(vd, vl, vl * esz, vlmax * esz);                             \
 +}
 +
 +GEN_VEXT_VADC_VXM(vadc_vxm_b, uint8_t,  H1, DO_VADC, clearb)
 +GEN_VEXT_VADC_VXM(vadc_vxm_h, uint16_t, H2, DO_VADC, clearh)
 +GEN_VEXT_VADC_VXM(vadc_vxm_w, uint32_t, H4, DO_VADC, clearl)
 +GEN_VEXT_VADC_VXM(vadc_vxm_d, uint64_t, H8, DO_VADC, clearq)
 +
 +GEN_VEXT_VADC_VXM(vsbc_vxm_b, uint8_t,  H1, DO_VSBC, clearb)
 +GEN_VEXT_VADC_VXM(vsbc_vxm_h, uint16_t, H2, DO_VSBC, clearh)
 +GEN_VEXT_VADC_VXM(vsbc_vxm_w, uint32_t, H4, DO_VSBC, clearl)
 +GEN_VEXT_VADC_VXM(vsbc_vxm_d, uint64_t, H8, DO_VSBC, clearq)
 +
 +#define DO_MADC(N, M, C) (C ? (__typeof(N))(N + M + 1) <= N :           \
 +                          (__typeof(N))(N + M) < N)
 +#define DO_MSBC(N, M, C) (C ? N <= M : N < M)
 +
 +#define GEN_VEXT_VMADC_VVM(NAME, ETYPE, H, DO_OP)             \
 +void HELPER(NAME)(void *vd, void *v0, void *vs1, void *vs2,   \
 +                  CPURISCVState *env, uint32_t desc)          \
 +{                                                             \
 +    uint32_t mlen = vext_mlen(desc);                          \
 +    uint32_t vl = env->vl;                                    \
 +    uint32_t vlmax = vext_maxsz(desc) / sizeof(ETYPE);        \
 +    uint32_t i;                                               \
 +                                                              \
 +    for (i = 0; i < vl; i++) {                                \
 +        ETYPE s1 = *((ETYPE *)vs1 + H(i));                    \
 +        ETYPE s2 = *((ETYPE *)vs2 + H(i));                    \
 +        uint8_t carry = vext_elem_mask(v0, mlen, i);          \
 +                                                              \
 +        vext_set_elem_mask(vd, mlen, i, DO_OP(s2, s1, carry));\
 +    }                                                         \
 +    for (; i < vlmax; i++) {                                  \
 +        vext_set_elem_mask(vd, mlen, i, 0);                   \
 +    }                                                         \
 +}
 +
 +GEN_VEXT_VMADC_VVM(vmadc_vvm_b, uint8_t,  H1, DO_MADC)
 +GEN_VEXT_VMADC_VVM(vmadc_vvm_h, uint16_t, H2, DO_MADC)
 +GEN_VEXT_VMADC_VVM(vmadc_vvm_w, uint32_t, H4, DO_MADC)
 +GEN_VEXT_VMADC_VVM(vmadc_vvm_d, uint64_t, H8, DO_MADC)
 +
 +GEN_VEXT_VMADC_VVM(vmsbc_vvm_b, uint8_t,  H1, DO_MSBC)
 +GEN_VEXT_VMADC_VVM(vmsbc_vvm_h, uint16_t, H2, DO_MSBC)
 +GEN_VEXT_VMADC_VVM(vmsbc_vvm_w, uint32_t, H4, DO_MSBC)
 +GEN_VEXT_VMADC_VVM(vmsbc_vvm_d, uint64_t, H8, DO_MSBC)
 +
 +#define GEN_VEXT_VMADC_VXM(NAME, ETYPE, H, DO_OP)               \
 +void HELPER(NAME)(void *vd, void *v0, target_ulong s1,          \
 +                  void *vs2, CPURISCVState *env, uint32_t desc) \
 +{                                                               \
 +    uint32_t mlen = vext_mlen(desc);                            \
 +    uint32_t vl = env->vl;                                      \
 +    uint32_t vlmax = vext_maxsz(desc) / sizeof(ETYPE);          \
 +    uint32_t i;                                                 \
 +                                                                \
 +    for (i = 0; i < vl; i++) {                                  \
 +        ETYPE s2 = *((ETYPE *)vs2 + H(i));                      \
 +        uint8_t carry = vext_elem_mask(v0, mlen, i);            \
 +                                                                \
 +        vext_set_elem_mask(vd, mlen, i,                         \
 +                DO_OP(s2, (ETYPE)(target_long)s1, carry));      \
 +    }                                                           \
 +    for (; i < vlmax; i++) {                                    \
 +        vext_set_elem_mask(vd, mlen, i, 0);                     \
 +    }                                                           \
 +}
 +
 +GEN_VEXT_VMADC_VXM(vmadc_vxm_b, uint8_t,  H1, DO_MADC)
 +GEN_VEXT_VMADC_VXM(vmadc_vxm_h, uint16_t, H2, DO_MADC)
 +GEN_VEXT_VMADC_VXM(vmadc_vxm_w, uint32_t, H4, DO_MADC)
 +GEN_VEXT_VMADC_VXM(vmadc_vxm_d, uint64_t, H8, DO_MADC)
 +
 +GEN_VEXT_VMADC_VXM(vmsbc_vxm_b, uint8_t,  H1, DO_MSBC)
 +GEN_VEXT_VMADC_VXM(vmsbc_vxm_h, uint16_t, H2, DO_MSBC)
 +GEN_VEXT_VMADC_VXM(vmsbc_vxm_w, uint32_t, H4, DO_MSBC)
 +GEN_VEXT_VMADC_VXM(vmsbc_vxm_d, uint64_t, H8, DO_MSBC)
 --
-.27.0
+.41.0

-[PULL 51/63] target/riscv: vector mask-register logical instructions
+[PULL v2 10/45] target/riscv: Remove redundant "cpu_vl == 0" checks
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Nazar Kazakov <nazar.kazakov@codethink.co.uk>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Remove the redundant "vl == 0" check which is already included within the  vstart >= vl check, when vl == 0.
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200623215920.2594-50-zhiwei_liu@c-sky.com
+Signed-off-by: Nazar Kazakov <nazar.kazakov@codethink.co.uk>
 Reviewed-by: Weiwei Li <liweiwei@iscas.ac.cn>
 Signed-off-by: Max Chou <max.chou@sifive.com>
 Acked-by: Alistair Francis <alistair.francis@wdc.com>
 Message-ID: <20230711165917.2629866-4-max.chou@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   |  9 ++++++
+ target/riscv/insn_trans/trans_rvv.c.inc | 31 +------------------------
- target/riscv/insn32.decode              |  8 +++++
+file changed, 1 insertion(+), 30 deletions(-)
  target/riscv/insn_trans/trans_rvv.inc.c | 35 ++++++++++++++++++++++
  target/riscv/vector_helper.c            | 40 +++++++++++++++++++++++++
 files changed, 92 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/target/riscv/insn_trans/trans_rvv.c.inc b/target/riscv/insn_trans/trans_rvv.c.inc
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/target/riscv/insn_trans/trans_rvv.c.inc
-+++ b/target/riscv/helper.h
++++ b/target/riscv/insn_trans/trans_rvv.c.inc
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vfredmin_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ static bool ldst_us_trans(uint32_t vd, uint32_t rs1, uint32_t data,
+     TCGv_i32 desc;
- DEF_HELPER_6(vfwredsum_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
- DEF_HELPER_6(vfwredsum_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
+     TCGLabel *over = gen_new_label();
-+
+-    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
-+DEF_HELPER_6(vmand_mm, void, ptr, ptr, ptr, ptr, env, i32)
+     tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
-+DEF_HELPER_6(vmnand_mm, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmandnot_mm, void, ptr, ptr, ptr, ptr, env, i32)
+     dest = tcg_temp_new_ptr();
-+DEF_HELPER_6(vmxor_mm, void, ptr, ptr, ptr, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ static bool ldst_stride_trans(uint32_t vd, uint32_t rs1, uint32_t rs2,
-+DEF_HELPER_6(vmor_mm, void, ptr, ptr, ptr, ptr, env, i32)
+     TCGv_i32 desc;
-+DEF_HELPER_6(vmnor_mm, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmornot_mm, void, ptr, ptr, ptr, ptr, env, i32)
+     TCGLabel *over = gen_new_label();
-+DEF_HELPER_6(vmxnor_mm, void, ptr, ptr, ptr, ptr, env, i32)
+-    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
+     tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
+     dest = tcg_temp_new_ptr();
-+++ b/target/riscv/insn32.decode
+@@ -XXX,XX +XXX,XX @@ static bool ldst_index_trans(uint32_t vd, uint32_t rs1, uint32_t vs2,
-@@ -XXX,XX +XXX,XX @@ vfredmin_vs     000101 . ..... ..... 001 ..... 1010111 @r_vm
+     TCGv_i32 desc;
- vfredmax_vs     000111 . ..... ..... 001 ..... 1010111 @r_vm
- # Vector widening ordered and unordered float reduction sum
+     TCGLabel *over = gen_new_label();
- vfwredsum_vs    1100-1 . ..... ..... 001 ..... 1010111 @r_vm
+-    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
-+vmand_mm        011001 - ..... ..... 010 ..... 1010111 @r
+     tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
-+vmnand_mm       011101 - ..... ..... 010 ..... 1010111 @r
-+vmandnot_mm     011000 - ..... ..... 010 ..... 1010111 @r
+     dest = tcg_temp_new_ptr();
-+vmxor_mm        011011 - ..... ..... 010 ..... 1010111 @r
+@@ -XXX,XX +XXX,XX @@ static bool ldff_trans(uint32_t vd, uint32_t rs1, uint32_t data,
-+vmor_mm         011010 - ..... ..... 010 ..... 1010111 @r
+     TCGv_i32 desc;
-+vmnor_mm        011110 - ..... ..... 010 ..... 1010111 @r
-+vmornot_mm      011100 - ..... ..... 010 ..... 1010111 @r
+     TCGLabel *over = gen_new_label();
-+vmxnor_mm       011111 - ..... ..... 010 ..... 1010111 @r
+-    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
+     tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
+     dest = tcg_temp_new_ptr();
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
+@@ -XXX,XX +XXX,XX @@ do_opivv_gvec(DisasContext *s, arg_rmrr *a, GVecGen3Fn *gvec_fn,
-index XXXXXXX..XXXXXXX 100644
+         return false;
---- a/target/riscv/insn_trans/trans_rvv.inc.c
+     }
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPFVV_TRANS(vfredmin_vs, reduction_check)
+-    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
+     tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
- /* Vector Widening Floating-Point Reduction Instructions */
- GEN_OPFVV_WIDEN_TRANS(vfwredsum_vs, reduction_check)
+     if (a->vm && s->vl_eq_vlmax && !(s->vta && s->lmul < 0)) {
-+
+@@ -XXX,XX +XXX,XX @@ static bool opivx_trans(uint32_t vd, uint32_t rs1, uint32_t vs2, uint32_t vm,
-+/*
+     uint32_t data = 0;
-+ *** Vector Mask Operations
-+ */
+     TCGLabel *over = gen_new_label();
-+
+-    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
-+/* Vector Mask-Register Logical Instructions */
+     tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
-+#define GEN_MM_TRANS(NAME)                                         \
-+static bool trans_##NAME(DisasContext *s, arg_r *a)                \
+     dest = tcg_temp_new_ptr();
-+{                                                                  \
+@@ -XXX,XX +XXX,XX @@ static bool opivi_trans(uint32_t vd, uint32_t imm, uint32_t vs2, uint32_t vm,
-+    if (vext_check_isa_ill(s)) {                                   \
+     uint32_t data = 0;
-+        uint32_t data = 0;                                         \
-+        gen_helper_gvec_4_ptr *fn = gen_helper_##NAME;             \
+     TCGLabel *over = gen_new_label();
-+        TCGLabel *over = gen_new_label();                          \
+-    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
-+        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
+     tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
-+                                                                   \
-+        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);             \
+     dest = tcg_temp_new_ptr();
-+        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);             \
+@@ -XXX,XX +XXX,XX @@ static bool do_opivv_widen(DisasContext *s, arg_rmrr *a,
-+        tcg_gen_gvec_4_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),     \
+     if (checkfn(s, a)) {
-+                           vreg_ofs(s, a->rs1),                    \
+         uint32_t data = 0;
-+                           vreg_ofs(s, a->rs2), cpu_env, 0,        \
+         TCGLabel *over = gen_new_label();
-+                           s->vlen / 8, data, fn);                 \
+-        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
-+        gen_set_label(over);                                       \
+         tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
-+        return true;                                               \
-+    }                                                              \
+         data = FIELD_DP32(data, VDATA, VM, a->vm);
-+    return false;                                                  \
+@@ -XXX,XX +XXX,XX @@ static bool do_opiwv_widen(DisasContext *s, arg_rmrr *a,
-+}
+     if (opiwv_widen_check(s, a)) {
-+
+         uint32_t data = 0;
-+GEN_MM_TRANS(vmand_mm)
+         TCGLabel *over = gen_new_label();
-+GEN_MM_TRANS(vmnand_mm)
+-        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
-+GEN_MM_TRANS(vmandnot_mm)
+         tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
-+GEN_MM_TRANS(vmxor_mm)
-+GEN_MM_TRANS(vmor_mm)
+         data = FIELD_DP32(data, VDATA, VM, a->vm);
-+GEN_MM_TRANS(vmnor_mm)
+@@ -XXX,XX +XXX,XX @@ static bool opivv_trans(uint32_t vd, uint32_t vs1, uint32_t vs2, uint32_t vm,
-+GEN_MM_TRANS(vmornot_mm)
+ {
-+GEN_MM_TRANS(vmxnor_mm)
+     uint32_t data = 0;
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
+     TCGLabel *over = gen_new_label();
-index XXXXXXX..XXXXXXX 100644
+-    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
---- a/target/riscv/vector_helper.c
+     tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ void HELPER(vfwredsum_vs_w)(void *vd, void *v0, void *vs1,
+     data = FIELD_DP32(data, VDATA, VM, vm);
-     *((uint64_t *)vd) = s1;
+@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmrr *a)             \
-     clearq(vd, 1, sizeof(uint64_t), tot);
+             gen_helper_##NAME##_w,                                 \
- }
+         };                                                         \
-+
+         TCGLabel *over = gen_new_label();                          \
-+/*
+-        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
-+ *** Vector Mask Operations
+         tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over); \
-+ */
+                                                                    \
-+/* Vector Mask-Register Logical Instructions */
+         data = FIELD_DP32(data, VDATA, VM, a->vm);                 \
-+#define GEN_VEXT_MASK_VV(NAME, OP)                        \
+@@ -XXX,XX +XXX,XX @@ static bool trans_vmv_v_v(DisasContext *s, arg_vmv_v_v *a)
-+void HELPER(NAME)(void *vd, void *v0, void *vs1,          \
+                 gen_helper_vmv_v_v_w, gen_helper_vmv_v_v_d,
-+                  void *vs2, CPURISCVState *env,          \
+             };
-+                  uint32_t desc)                          \
+             TCGLabel *over = gen_new_label();
-+{                                                         \
+-            tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
-+    uint32_t mlen = vext_mlen(desc);                      \
+             tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
-+    uint32_t vlmax = env_archcpu(env)->cfg.vlen / mlen;   \
-+    uint32_t vl = env->vl;                                \
+             tcg_gen_gvec_2_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, a->rs1),
-+    uint32_t i;                                           \
+@@ -XXX,XX +XXX,XX @@ static bool trans_vmv_v_x(DisasContext *s, arg_vmv_v_x *a)
-+    int a, b;                                             \
+         vext_check_ss(s, a->rd, 0, 1)) {
-+                                                          \
+         TCGv s1;
-+    for (i = 0; i < vl; i++) {                            \
+         TCGLabel *over = gen_new_label();
-+        a = vext_elem_mask(vs1, mlen, i);                 \
+-        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
-+        b = vext_elem_mask(vs2, mlen, i);                 \
+         tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
-+        vext_set_elem_mask(vd, mlen, i, OP(b, a));        \
-+    }                                                     \
+         s1 = get_gpr(s, a->rs1, EXT_SIGN);
-+    for (; i < vlmax; i++) {                              \
+@@ -XXX,XX +XXX,XX @@ static bool trans_vmv_v_i(DisasContext *s, arg_vmv_v_i *a)
-+        vext_set_elem_mask(vd, mlen, i, 0);               \
+                 gen_helper_vmv_v_x_w, gen_helper_vmv_v_x_d,
-+    }                                                     \
+             };
-+}
+             TCGLabel *over = gen_new_label();
-+
+-            tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
-+#define DO_NAND(N, M)  (!(N & M))
+             tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
-+#define DO_ANDNOT(N, M)  (N & !M)
-+#define DO_NOR(N, M)  (!(N | M))
+             s1 = tcg_constant_i64(simm);
-+#define DO_ORNOT(N, M)  (N | !M)
+@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmrr *a)             \
-+#define DO_XNOR(N, M)  (!(N ^ M))
+         };                                                         \
-+
+         TCGLabel *over = gen_new_label();                          \
-+GEN_VEXT_MASK_VV(vmand_mm, DO_AND)
+         gen_set_rm(s, RISCV_FRM_DYN);                              \
-+GEN_VEXT_MASK_VV(vmnand_mm, DO_NAND)
+-        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
-+GEN_VEXT_MASK_VV(vmandnot_mm, DO_ANDNOT)
+         tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over); \
-+GEN_VEXT_MASK_VV(vmxor_mm, DO_XOR)
+                                                                    \
-+GEN_VEXT_MASK_VV(vmor_mm, DO_OR)
+         data = FIELD_DP32(data, VDATA, VM, a->vm);                 \
-+GEN_VEXT_MASK_VV(vmnor_mm, DO_NOR)
+@@ -XXX,XX +XXX,XX @@ static bool opfvf_trans(uint32_t vd, uint32_t rs1, uint32_t vs2,
-+GEN_VEXT_MASK_VV(vmornot_mm, DO_ORNOT)
+     TCGv_i64 t1;
-+GEN_VEXT_MASK_VV(vmxnor_mm, DO_XNOR)
      TCGLabel *over = gen_new_label();
 -    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
      tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
      dest = tcg_temp_new_ptr();
@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmrr *a)           \
          };                                                       \
          TCGLabel *over = gen_new_label();                        \
          gen_set_rm(s, RISCV_FRM_DYN);                            \
 -        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);        \
          tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);\
                                                                   \
          data = FIELD_DP32(data, VDATA, VM, a->vm);               \
@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmrr *a)             \
          };                                                         \
          TCGLabel *over = gen_new_label();                          \
          gen_set_rm(s, RISCV_FRM_DYN);                              \
 -        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
          tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over); \
                                                                     \
          data = FIELD_DP32(data, VDATA, VM, a->vm);                 \
@@ -XXX,XX +XXX,XX @@ static bool do_opfv(DisasContext *s, arg_rmr *a,
          uint32_t data = 0;
          TCGLabel *over = gen_new_label();
          gen_set_rm_chkfrm(s, rm);
 -        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
          tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
          data = FIELD_DP32(data, VDATA, VM, a->vm);
@@ -XXX,XX +XXX,XX @@ static bool trans_vfmv_v_f(DisasContext *s, arg_vfmv_v_f *a)
                  gen_helper_vmv_v_x_d,
              };
              TCGLabel *over = gen_new_label();
 -            tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
              tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
              t1 = tcg_temp_new_i64();
@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmr *a)              \
          };                                                         \
          TCGLabel *over = gen_new_label();                          \
          gen_set_rm_chkfrm(s, FRM);                                 \
 -        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
          tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over); \
                                                                     \
          data = FIELD_DP32(data, VDATA, VM, a->vm);                 \
@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmr *a)              \
          };                                                         \
          TCGLabel *over = gen_new_label();                          \
          gen_set_rm(s, RISCV_FRM_DYN);                              \
 -        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
          tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over); \
                                                                     \
          data = FIELD_DP32(data, VDATA, VM, a->vm);                 \
@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmr *a)              \
          };                                                         \
          TCGLabel *over = gen_new_label();                          \
          gen_set_rm_chkfrm(s, FRM);                                 \
 -        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
          tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over); \
                                                                     \
          data = FIELD_DP32(data, VDATA, VM, a->vm);                 \
@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmr *a)              \
          };                                                         \
          TCGLabel *over = gen_new_label();                          \
          gen_set_rm_chkfrm(s, FRM);                                 \
 -        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
          tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over); \
                                                                     \
          data = FIELD_DP32(data, VDATA, VM, a->vm);                 \
@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_r *a)                \
          uint32_t data = 0;                                         \
          gen_helper_gvec_4_ptr *fn = gen_helper_##NAME;             \
          TCGLabel *over = gen_new_label();                          \
 -        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
          tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over); \
                                                                     \
          data = FIELD_DP32(data, VDATA, LMUL, s->lmul);             \
@@ -XXX,XX +XXX,XX @@ static bool trans_vid_v(DisasContext *s, arg_vid_v *a)
          require_vm(a->vm, a->rd)) {
          uint32_t data = 0;
          TCGLabel *over = gen_new_label();
 -        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
          tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
          data = FIELD_DP32(data, VDATA, VM, a->vm);
@@ -XXX,XX +XXX,XX @@ static bool trans_vmv_s_x(DisasContext *s, arg_vmv_s_x *a)
          TCGv s1;
          TCGLabel *over = gen_new_label();
 -        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
          tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
          t1 = tcg_temp_new_i64();
@@ -XXX,XX +XXX,XX @@ static bool trans_vfmv_s_f(DisasContext *s, arg_vfmv_s_f *a)
          TCGv_i64 t1;
          TCGLabel *over = gen_new_label();
 -        /* if vl == 0 or vstart >= vl, skip vector register write back */
 -        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +        /* if vstart >= vl, skip vector register write back */
          tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
          /* NaN-box f[rs1] */
@@ -XXX,XX +XXX,XX @@ static bool int_ext_op(DisasContext *s, arg_rmr *a, uint8_t seq)
      uint32_t data = 0;
      gen_helper_gvec_3_ptr *fn;
      TCGLabel *over = gen_new_label();
 -    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
      tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
      static gen_helper_gvec_3_ptr * const fns[6][4] = {
 --
-.27.0
+.41.0

-[PULL 06/63] target/riscv: add vector configure instruction
+[PULL v2 11/45] target/riscv: Add Zvbc ISA extension support
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Lawrence Hunter <lawrence.hunter@codethink.co.uk>
-vsetvl and vsetvli are two configure instructions for vl, vtype. TB flags
+This commit adds support for the Zvbc vector-crypto extension, which
-should update after configure instructions. The (ill, lmul, sew ) of vtype
+consists of the following instructions:
-and the bit of (VSTART == 0 && VL == VLMAX) will be placed within tb_flags.
+* vclmulh.[vx,vv]
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+* vclmul.[vx,vv]
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Translation functions are defined in
-Message-id: 20200623215920.2594-5-zhiwei_liu@c-sky.com
+`target/riscv/insn_trans/trans_rvvk.c.inc` and helpers are defined in
 `target/riscv/vcrypto_helper.c`.
 Co-authored-by: Nazar Kazakov <nazar.kazakov@codethink.co.uk>
 Co-authored-by: Max Chou <max.chou@sifive.com>
 Signed-off-by: Nazar Kazakov <nazar.kazakov@codethink.co.uk>
 Signed-off-by: Lawrence Hunter <lawrence.hunter@codethink.co.uk>
 Signed-off-by: Max Chou <max.chou@sifive.com>
 [max.chou@sifive.com: Exposed x-zvbc property]
 Message-ID: <20230711165917.2629866-5-max.chou@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/cpu.h                      | 63 +++++++++++++++++---
+ target/riscv/cpu_cfg.h                   |  1 +
- target/riscv/helper.h                   |  3 +
+ target/riscv/helper.h                    |  6 +++
- target/riscv/insn32.decode              |  5 ++
+ target/riscv/insn32.decode               |  6 +++
- target/riscv/insn_trans/trans_rvv.inc.c | 79 +++++++++++++++++++++++++
+ target/riscv/cpu.c                       |  9 ++++
- target/riscv/translate.c                | 17 +++++-
+ target/riscv/translate.c                 |  1 +
- target/riscv/vector_helper.c            | 53 +++++++++++++++++
+ target/riscv/vcrypto_helper.c            | 59 ++++++++++++++++++++++
- target/riscv/Makefile.objs              |  2 +-
+ target/riscv/insn_trans/trans_rvvk.c.inc | 62 ++++++++++++++++++++++++
-files changed, 210 insertions(+), 12 deletions(-)
+ target/riscv/meson.build                 |  3 +-
- create mode 100644 target/riscv/insn_trans/trans_rvv.inc.c
+files changed, 146 insertions(+), 1 deletion(-)
- create mode 100644 target/riscv/vector_helper.c
+ create mode 100644 target/riscv/vcrypto_helper.c
+ create mode 100644 target/riscv/insn_trans/trans_rvvk.c.inc
-diff --git a/target/riscv/cpu.h b/target/riscv/cpu.h
-index XXXXXXX..XXXXXXX 100644
+diff --git a/target/riscv/cpu_cfg.h b/target/riscv/cpu_cfg.h
---- a/target/riscv/cpu.h
+index XXXXXXX..XXXXXXX 100644
-+++ b/target/riscv/cpu.h
+--- a/target/riscv/cpu_cfg.h
-@@ -XXX,XX +XXX,XX @@
++++ b/target/riscv/cpu_cfg.h
- #define RISCV_CPU_H
+@@ -XXX,XX +XXX,XX @@ struct RISCVCPUConfig {
+     bool ext_zve32f;
- #include "hw/core/cpu.h"
+     bool ext_zve64f;
-+#include "hw/registerfields.h"
+     bool ext_zve64d;
- #include "exec/cpu-defs.h"
++    bool ext_zvbc;
- #include "fpu/softfloat-types.h"
+     bool ext_zmmul;
+     bool ext_zvfbfmin;
-@@ -XXX,XX +XXX,XX @@ typedef struct CPURISCVState CPURISCVState;
+     bool ext_zvfbfwma;
  #define RV_VLEN_MAX 512
 +FIELD(VTYPE, VLMUL, 0, 2)
 +FIELD(VTYPE, VSEW, 2, 3)
 +FIELD(VTYPE, VEDIV, 5, 2)
 +FIELD(VTYPE, RESERVED, 7, sizeof(target_ulong) * 8 - 9)
 +FIELD(VTYPE, VILL, sizeof(target_ulong) * 8 - 2, 1)
 +
  struct CPURISCVState {
      target_ulong gpr[32];
      uint64_t fpr[32]; /* assume both F and D extensions */
@@ -XXX,XX +XXX,XX @@ void riscv_cpu_set_fflags(CPURISCVState *env, target_ulong);
  #define TB_FLAGS_MMU_MASK   3
  #define TB_FLAGS_MSTATUS_FS MSTATUS_FS
 +typedef CPURISCVState CPUArchState;
 +typedef RISCVCPU ArchCPU;
 +#include "exec/cpu-all.h"
 +
 +FIELD(TB_FLAGS, VL_EQ_VLMAX, 2, 1)
 +FIELD(TB_FLAGS, LMUL, 3, 2)
 +FIELD(TB_FLAGS, SEW, 5, 3)
 +FIELD(TB_FLAGS, VILL, 8, 1)
 +
 +/*
 + * A simplification for VLMAX
 + * = (1 << LMUL) * VLEN / (8 * (1 << SEW))
 + * = (VLEN << LMUL) / (8 << SEW)
 + * = (VLEN << LMUL) >> (SEW + 3)
 + * = VLEN >> (SEW + 3 - LMUL)
 + */
 +static inline uint32_t vext_get_vlmax(RISCVCPU *cpu, target_ulong vtype)
 +{
 +    uint8_t sew, lmul;
 +
 +    sew = FIELD_EX64(vtype, VTYPE, VSEW);
 +    lmul = FIELD_EX64(vtype, VTYPE, VLMUL);
 +    return cpu->cfg.vlen >> (sew + 3 - lmul);
 +}
 +
  static inline void cpu_get_tb_cpu_state(CPURISCVState *env, target_ulong *pc,
 -                                        target_ulong *cs_base, uint32_t *flags)
 +                                        target_ulong *cs_base, uint32_t *pflags)
  {
 +    uint32_t flags = 0;
 +
      *pc = env->pc;
      *cs_base = 0;
 +
 +    if (riscv_has_ext(env, RVV)) {
 +        uint32_t vlmax = vext_get_vlmax(env_archcpu(env), env->vtype);
 +        bool vl_eq_vlmax = (env->vstart == 0) && (vlmax == env->vl);
 +        flags = FIELD_DP32(flags, TB_FLAGS, VILL,
 +                    FIELD_EX64(env->vtype, VTYPE, VILL));
 +        flags = FIELD_DP32(flags, TB_FLAGS, SEW,
 +                    FIELD_EX64(env->vtype, VTYPE, VSEW));
 +        flags = FIELD_DP32(flags, TB_FLAGS, LMUL,
 +                    FIELD_EX64(env->vtype, VTYPE, VLMUL));
 +        flags = FIELD_DP32(flags, TB_FLAGS, VL_EQ_VLMAX, vl_eq_vlmax);
 +    } else {
 +        flags = FIELD_DP32(flags, TB_FLAGS, VILL, 1);
 +    }
 +
  #ifdef CONFIG_USER_ONLY
 -    *flags = TB_FLAGS_MSTATUS_FS;
 +    flags |= TB_FLAGS_MSTATUS_FS;
  #else
 -    *flags = cpu_mmu_index(env, 0);
 +    flags |= cpu_mmu_index(env, 0);
      if (riscv_cpu_fp_enabled(env)) {
 -        *flags |= env->mstatus & MSTATUS_FS;
 +        flags |= env->mstatus & MSTATUS_FS;
      }
  #endif
 +    *pflags = flags;
  }
  int riscv_csrrw(CPURISCVState *env, int csrno, target_ulong *ret_value,
@@ -XXX,XX +XXX,XX @@ void riscv_set_csr_ops(int csrno, riscv_csr_operations *ops);
  void riscv_cpu_register_gdb_regs_for_features(CPUState *cs);
 -typedef CPURISCVState CPUArchState;
 -typedef RISCVCPU ArchCPU;
 -
 -#include "exec/cpu-all.h"
 -
  #endif /* RISCV_CPU_H */
 diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/helper.h
 +++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_1(tlb_flush, void, env)
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_5(vfwcvtbf16_f_f_v, void, ptr, ptr, ptr, env, i32)
- #ifndef CONFIG_USER_ONLY
- DEF_HELPER_1(hyp_tlb_flush, void, env)
+ DEF_HELPER_6(vfwmaccbf16_vv, void, ptr, ptr, ptr, ptr, env, i32)
- #endif
+ DEF_HELPER_6(vfwmaccbf16_vf, void, ptr, ptr, i64, ptr, env, i32)
 +
-+/* Vector functions */
++/* Vector crypto functions */
-+DEF_HELPER_3(vsetvl, tl, env, tl, tl)
++DEF_HELPER_6(vclmul_vv, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vclmul_vx, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vclmulh_vv, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vclmulh_vx, void, ptr, ptr, tl, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ vfwcvtbf16_f_f_v  010010 . ..... 01101 001 ..... 1010111 @r2_vm
- @r_rm    .......   ..... ..... ... ..... ....... %rs2 %rs1 %rm %rd
+ # *** Zvfbfwma Standard Extension ***
- @r2_rm   .......   ..... ..... ... ..... ....... %rs1 %rm %rd
+ vfwmaccbf16_vv    111011 . ..... ..... 001 ..... 1010111 @r_vm
- @r2      .......   ..... ..... ... ..... ....... %rs1 %rd
+ vfwmaccbf16_vf    111011 . ..... ..... 101 ..... 1010111 @r_vm
-+@r2_zimm . zimm:11  ..... ... ..... ....... %rs1 %rd
++
++# *** Zvbc vector crypto extension ***
- @hfence_gvma ....... ..... .....   ... ..... ....... %rs2 %rs1
++vclmul_vv   001100 . ..... ..... 010 ..... 1010111 @r_vm
- @hfence_vvma ....... ..... .....   ... ..... ....... %rs2 %rs1
++vclmul_vx   001100 . ..... ..... 110 ..... 1010111 @r_vm
-@@ -XXX,XX +XXX,XX @@ fcvt_d_wu  1101001  00001 ..... ... ..... 1010011 @r2_rm
++vclmulh_vv  001101 . ..... ..... 010 ..... 1010111 @r_vm
- # *** RV32H Base Instruction Set ***
++vclmulh_vx  001101 . ..... ..... 110 ..... 1010111 @r_vm
- hfence_gvma 0110001  .....  ..... 000 00000 1110011 @hfence_gvma
+diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
- hfence_vvma 0010001  .....  ..... 000 00000 1110011 @hfence_vvma
+index XXXXXXX..XXXXXXX 100644
-+
+--- a/target/riscv/cpu.c
-+# *** RV32V Extension ***
++++ b/target/riscv/cpu.c
-+vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
+@@ -XXX,XX +XXX,XX @@ static const struct isa_ext_data isa_edata_arr[] = {
-+vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
+     ISA_EXT_DATA_ENTRY(zksed, PRIV_VERSION_1_12_0, ext_zksed),
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
+     ISA_EXT_DATA_ENTRY(zksh, PRIV_VERSION_1_12_0, ext_zksh),
      ISA_EXT_DATA_ENTRY(zkt, PRIV_VERSION_1_12_0, ext_zkt),
 +    ISA_EXT_DATA_ENTRY(zvbc, PRIV_VERSION_1_12_0, ext_zvbc),
      ISA_EXT_DATA_ENTRY(zve32f, PRIV_VERSION_1_10_0, ext_zve32f),
      ISA_EXT_DATA_ENTRY(zve64f, PRIV_VERSION_1_10_0, ext_zve64f),
      ISA_EXT_DATA_ENTRY(zve64d, PRIV_VERSION_1_10_0, ext_zve64d),
@@ -XXX,XX +XXX,XX @@ void riscv_cpu_validate_set_extensions(RISCVCPU *cpu, Error **errp)
          return;
      }
 +    if (cpu->cfg.ext_zvbc && !cpu->cfg.ext_zve64f) {
 +        error_setg(errp, "Zvbc extension requires V or Zve64{f,d} extensions");
 +        return;
 +    }
 +
      if (cpu->cfg.ext_zk) {
          cpu->cfg.ext_zkn = true;
          cpu->cfg.ext_zkr = true;
@@ -XXX,XX +XXX,XX @@ static Property riscv_cpu_extensions[] = {
      DEFINE_PROP_BOOL("x-zvfbfmin", RISCVCPU, cfg.ext_zvfbfmin, false),
      DEFINE_PROP_BOOL("x-zvfbfwma", RISCVCPU, cfg.ext_zvfbfwma, false),
 +    /* Vector cryptography extensions */
 +    DEFINE_PROP_BOOL("x-zvbc", RISCVCPU, cfg.ext_zvbc, false),
 +
      DEFINE_PROP_END_OF_LIST(),
  };
 diff --git a/target/riscv/translate.c b/target/riscv/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/translate.c
 +++ b/target/riscv/translate.c
@@ -XXX,XX +XXX,XX @@ static uint32_t opcode_at(DisasContextBase *dcbase, target_ulong pc)
  #include "insn_trans/trans_rvzfa.c.inc"
  #include "insn_trans/trans_rvzfh.c.inc"
  #include "insn_trans/trans_rvk.c.inc"
 +#include "insn_trans/trans_rvvk.c.inc"
  #include "insn_trans/trans_privileged.c.inc"
  #include "insn_trans/trans_svinval.c.inc"
  #include "insn_trans/trans_rvbf16.c.inc"
 diff --git a/target/riscv/vcrypto_helper.c b/target/riscv/vcrypto_helper.c
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
++++ b/target/riscv/vcrypto_helper.c
 @@ -XXX,XX +XXX,XX @@
 +/*
-+ * RISC-V translation routines for the RVV Standard Extension.
++ * RISC-V Vector Crypto Extension Helpers for QEMU.
 + *
-+ * Copyright (c) 2020 T-Head Semiconductor Co., Ltd. All rights reserved.
++ * Copyright (C) 2023 SiFive, Inc.
 + * Written by Codethink Ltd and SiFive.
 + *
 + * This program is free software; you can redistribute it and/or modify it
 + * under the terms and conditions of the GNU General Public License,
 + * version 2 or later, as published by the Free Software Foundation.
 + *
 ...
 + *
 + * You should have received a copy of the GNU General Public License along with
 + * this program.  If not, see <http://www.gnu.org/licenses/>.
 + */
 +
-+static bool trans_vsetvl(DisasContext *ctx, arg_vsetvl *a)
++#include "qemu/osdep.h"
-+{
++#include "qemu/host-utils.h"
-+    TCGv s1, s2, dst;
++#include "qemu/bitops.h"
-+
++#include "cpu.h"
-+    if (!has_ext(ctx, RVV)) {
++#include "exec/memop.h"
-+        return false;
++#include "exec/exec-all.h"
-+    }
++#include "exec/helper-proto.h"
-+
++#include "internals.h"
-+    s2 = tcg_temp_new();
++#include "vector_internals.h"
-+    dst = tcg_temp_new();
++
-+
++static uint64_t clmul64(uint64_t y, uint64_t x)
-+    /* Using x0 as the rs1 register specifier, encodes an infinite AVL */
++{
-+    if (a->rs1 == 0) {
++    uint64_t result = 0;
-+        /* As the mask is at least one bit, RV_VLEN_MAX is >= VLMAX */
++    for (int j = 63; j >= 0; j--) {
-+        s1 = tcg_const_tl(RV_VLEN_MAX);
++        if ((y >> j) & 1) {
-+    } else {
++            result ^= (x << j);
-+        s1 = tcg_temp_new();
++        }
-+        gen_get_gpr(s1, a->rs1);
++    }
-+    }
++    return result;
-+    gen_get_gpr(s2, a->rs2);
++}
-+    gen_helper_vsetvl(dst, cpu_env, s1, s2);
++
-+    gen_set_gpr(a->rd, dst);
++static uint64_t clmulh64(uint64_t y, uint64_t x)
-+    tcg_gen_movi_tl(cpu_pc, ctx->pc_succ_insn);
++{
-+    lookup_and_goto_ptr(ctx);
++    uint64_t result = 0;
-+    ctx->base.is_jmp = DISAS_NORETURN;
++    for (int j = 63; j >= 1; j--) {
-+
++        if ((y >> j) & 1) {
-+    tcg_temp_free(s1);
++            result ^= (x >> (64 - j));
-+    tcg_temp_free(s2);
++        }
-+    tcg_temp_free(dst);
++    }
-+    return true;
++    return result;
 +}
 +
-+static bool trans_vsetvli(DisasContext *ctx, arg_vsetvli *a)
++RVVCALL(OPIVV2, vclmul_vv, OP_UUU_D, H8, H8, H8, clmul64)
-+{
++GEN_VEXT_VV(vclmul_vv, 8)
-+    TCGv s1, s2, dst;
++RVVCALL(OPIVX2, vclmul_vx, OP_UUU_D, H8, H8, clmul64)
-+
++GEN_VEXT_VX(vclmul_vx, 8)
-+    if (!has_ext(ctx, RVV)) {
++RVVCALL(OPIVV2, vclmulh_vv, OP_UUU_D, H8, H8, H8, clmulh64)
-+        return false;
++GEN_VEXT_VV(vclmulh_vv, 8)
-+    }
++RVVCALL(OPIVX2, vclmulh_vx, OP_UUU_D, H8, H8, clmulh64)
-+
++GEN_VEXT_VX(vclmulh_vx, 8)
-+    s2 = tcg_const_tl(a->zimm);
+diff --git a/target/riscv/insn_trans/trans_rvvk.c.inc b/target/riscv/insn_trans/trans_rvvk.c.inc
 +    dst = tcg_temp_new();
 +
 +    /* Using x0 as the rs1 register specifier, encodes an infinite AVL */
 +    if (a->rs1 == 0) {
 +        /* As the mask is at least one bit, RV_VLEN_MAX is >= VLMAX */
 +        s1 = tcg_const_tl(RV_VLEN_MAX);
 +    } else {
 +        s1 = tcg_temp_new();
 +        gen_get_gpr(s1, a->rs1);
 +    }
 +    gen_helper_vsetvl(dst, cpu_env, s1, s2);
 +    gen_set_gpr(a->rd, dst);
 +    gen_goto_tb(ctx, 0, ctx->pc_succ_insn);
 +    ctx->base.is_jmp = DISAS_NORETURN;
 +
 +    tcg_temp_free(s1);
 +    tcg_temp_free(s2);
 +    tcg_temp_free(dst);
 +    return true;
 +}
 diff --git a/target/riscv/translate.c b/target/riscv/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/translate.c
 +++ b/target/riscv/translate.c
@@ -XXX,XX +XXX,XX @@ typedef struct DisasContext {
         to reset this known value.  */
      int frm;
      bool ext_ifencei;
 +    /* vector extension */
 +    bool vill;
 +    uint8_t lmul;
 +    uint8_t sew;
 +    uint16_t vlen;
 +    bool vl_eq_vlmax;
  } DisasContext;
  #ifdef TARGET_RISCV64
@@ -XXX,XX +XXX,XX @@ static bool gen_shift(DisasContext *ctx, arg_r *a,
  #include "insn_trans/trans_rvf.inc.c"
  #include "insn_trans/trans_rvd.inc.c"
  #include "insn_trans/trans_rvh.inc.c"
 +#include "insn_trans/trans_rvv.inc.c"
  #include "insn_trans/trans_privileged.inc.c"
  /* Include the auto-generated decoder for 16 bit insn */
@@ -XXX,XX +XXX,XX @@ static void riscv_tr_init_disas_context(DisasContextBase *dcbase, CPUState *cs)
      DisasContext *ctx = container_of(dcbase, DisasContext, base);
      CPURISCVState *env = cs->env_ptr;
      RISCVCPU *cpu = RISCV_CPU(cs);
 +    uint32_t tb_flags = ctx->base.tb->flags;
      ctx->pc_succ_insn = ctx->base.pc_first;
 -    ctx->mem_idx = ctx->base.tb->flags & TB_FLAGS_MMU_MASK;
 -    ctx->mstatus_fs = ctx->base.tb->flags & TB_FLAGS_MSTATUS_FS;
 +    ctx->mem_idx = tb_flags & TB_FLAGS_MMU_MASK;
 +    ctx->mstatus_fs = tb_flags & TB_FLAGS_MSTATUS_FS;
      ctx->priv_ver = env->priv_ver;
  #if !defined(CONFIG_USER_ONLY)
      if (riscv_has_ext(env, RVH)) {
@@ -XXX,XX +XXX,XX @@ static void riscv_tr_init_disas_context(DisasContextBase *dcbase, CPUState *cs)
      ctx->misa = env->misa;
      ctx->frm = -1;  /* unknown rounding mode */
      ctx->ext_ifencei = cpu->cfg.ext_ifencei;
 +    ctx->vlen = cpu->cfg.vlen;
 +    ctx->vill = FIELD_EX32(tb_flags, TB_FLAGS, VILL);
 +    ctx->sew = FIELD_EX32(tb_flags, TB_FLAGS, SEW);
 +    ctx->lmul = FIELD_EX32(tb_flags, TB_FLAGS, LMUL);
 +    ctx->vl_eq_vlmax = FIELD_EX32(tb_flags, TB_FLAGS, VL_EQ_VLMAX);
  }
  static void riscv_tr_tb_start(DisasContextBase *db, CPUState *cpu)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
-+++ b/target/riscv/vector_helper.c
++++ b/target/riscv/insn_trans/trans_rvvk.c.inc
 @@ -XXX,XX +XXX,XX @@
 +/*
-+ * RISC-V Vector Extension Helpers for QEMU.
++ * RISC-V translation routines for the vector crypto extension.
 + *
-+ * Copyright (c) 2020 T-Head Semiconductor Co., Ltd. All rights reserved.
++ * Copyright (C) 2023 SiFive, Inc.
 + * Written by Codethink Ltd and SiFive.
 + *
 + * This program is free software; you can redistribute it and/or modify it
 + * under the terms and conditions of the GNU General Public License,
 + * version 2 or later, as published by the Free Software Foundation.
 + *
 ...
 + *
 + * You should have received a copy of the GNU General Public License along with
 + * this program.  If not, see <http://www.gnu.org/licenses/>.
 + */
 +
-+#include "qemu/osdep.h"
++/*
-+#include "cpu.h"
++ * Zvbc
-+#include "exec/exec-all.h"
++ */
-+#include "exec/helper-proto.h"
++
-+#include <math.h>
++#define GEN_VV_MASKED_TRANS(NAME, CHECK)                     \
-+
++    static bool trans_##NAME(DisasContext *s, arg_rmrr *a)   \
-+target_ulong HELPER(vsetvl)(CPURISCVState *env, target_ulong s1,
++    {                                                        \
-+                            target_ulong s2)
++        if (CHECK(s, a)) {                                   \
-+{
++            return opivv_trans(a->rd, a->rs1, a->rs2, a->vm, \
-+    int vlmax, vl;
++                               gen_helper_##NAME, s);        \
-+    RISCVCPU *cpu = env_archcpu(env);
++        }                                                    \
-+    uint16_t sew = 8 << FIELD_EX64(s2, VTYPE, VSEW);
++        return false;                                        \
-+    uint8_t ediv = FIELD_EX64(s2, VTYPE, VEDIV);
++    }
-+    bool vill = FIELD_EX64(s2, VTYPE, VILL);
++
-+    target_ulong reserved = FIELD_EX64(s2, VTYPE, RESERVED);
++static bool vclmul_vv_check(DisasContext *s, arg_rmrr *a)
-+
++{
-+    if ((sew > cpu->cfg.elen) || vill || (ediv != 0) || (reserved != 0)) {
++    return opivv_check(s, a) &&
-+        /* only set vill bit. */
++           s->cfg_ptr->ext_zvbc == true &&
-+        env->vtype = FIELD_DP64(0, VTYPE, VILL, 1);
++           s->sew == MO_64;
-+        env->vl = 0;
++}
-+        env->vstart = 0;
++
-+        return 0;
++GEN_VV_MASKED_TRANS(vclmul_vv, vclmul_vv_check)
-+    }
++GEN_VV_MASKED_TRANS(vclmulh_vv, vclmul_vv_check)
 +
-+    vlmax = vext_get_vlmax(cpu, s2);
++#define GEN_VX_MASKED_TRANS(NAME, CHECK)                     \
-+    if (s1 <= vlmax) {
++    static bool trans_##NAME(DisasContext *s, arg_rmrr *a)   \
-+        vl = s1;
++    {                                                        \
-+    } else {
++        if (CHECK(s, a)) {                                   \
-+        vl = vlmax;
++            return opivx_trans(a->rd, a->rs1, a->rs2, a->vm, \
-+    }
++                               gen_helper_##NAME, s);        \
-+    env->vl = vl;
++        }                                                    \
-+    env->vtype = s2;
++        return false;                                        \
-+    env->vstart = 0;
++    }
-+    return vl;
++
-+}
++static bool vclmul_vx_check(DisasContext *s, arg_rmrr *a)
-diff --git a/target/riscv/Makefile.objs b/target/riscv/Makefile.objs
++{
-index XXXXXXX..XXXXXXX 100644
++    return opivx_check(s, a) &&
---- a/target/riscv/Makefile.objs
++           s->cfg_ptr->ext_zvbc == true &&
-+++ b/target/riscv/Makefile.objs
++           s->sew == MO_64;
-@@ -XXX,XX +XXX,XX @@
++}
--obj-y += translate.o op_helper.o cpu_helper.o cpu.o csr.o fpu_helper.o gdbstub.o
++
-+obj-y += translate.o op_helper.o cpu_helper.o cpu.o csr.o fpu_helper.o vector_helper.o gdbstub.o
++GEN_VX_MASKED_TRANS(vclmul_vx, vclmul_vx_check)
- obj-$(CONFIG_SOFTMMU) += pmp.o
++GEN_VX_MASKED_TRANS(vclmulh_vx, vclmul_vx_check)
+diff --git a/target/riscv/meson.build b/target/riscv/meson.build
- ifeq ($(CONFIG_SOFTMMU),y)
+index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/meson.build
 +++ b/target/riscv/meson.build
@@ -XXX,XX +XXX,XX @@ riscv_ss.add(files(
    'translate.c',
    'm128_helper.c',
    'crypto_helper.c',
 -  'zce_helper.c'
 +  'zce_helper.c',
 +  'vcrypto_helper.c'
  ))
  riscv_ss.add(when: 'CONFIG_KVM', if_true: files('kvm.c'), if_false: files('kvm-stub.c'))
 --
-.27.0
+.41.0

-[PULL 50/63] target/riscv: vector widening floating-point reduction instructions
+[PULL v2 12/45] target/riscv: Move vector translation checks
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Nazar Kazakov <nazar.kazakov@codethink.co.uk>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Move the checks out of `do_opiv{v,x,i}_gvec{,_shift}` functions
 and into the corresponding macros. This enables the functions to be
 reused in proceeding commits without check duplication.
 Signed-off-by: Nazar Kazakov <nazar.kazakov@codethink.co.uk>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Reviewed-by: Weiwei Li <liweiwei@iscas.ac.cn>
-Message-id: 20200623215920.2594-49-zhiwei_liu@c-sky.com
+Signed-off-by: Max Chou <max.chou@sifive.com>
 Message-ID: <20230711165917.2629866-6-max.chou@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   |  3 ++
+ target/riscv/insn_trans/trans_rvv.c.inc | 28 +++++++++++--------------
- target/riscv/insn32.decode              |  2 ++
+file changed, 12 insertions(+), 16 deletions(-)
  target/riscv/insn_trans/trans_rvv.inc.c |  3 ++
  target/riscv/vector_helper.c            | 46 +++++++++++++++++++++++++
 files changed, 54 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/target/riscv/insn_trans/trans_rvv.c.inc b/target/riscv/insn_trans/trans_rvv.c.inc
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/target/riscv/insn_trans/trans_rvv.c.inc
-+++ b/target/riscv/helper.h
++++ b/target/riscv/insn_trans/trans_rvv.c.inc
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vfredmax_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ do_opivv_gvec(DisasContext *s, arg_rmrr *a, GVecGen3Fn *gvec_fn,
- DEF_HELPER_6(vfredmin_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
+               gen_helper_gvec_4_ptr *fn)
- DEF_HELPER_6(vfredmin_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
+ {
- DEF_HELPER_6(vfredmin_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
+     TCGLabel *over = gen_new_label();
-+
+-    if (!opivv_check(s, a)) {
-+DEF_HELPER_6(vfwredsum_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
+-        return false;
-+DEF_HELPER_6(vfwredsum_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
+-    }
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
+     tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
+@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmrr *a)             \
-@@ -XXX,XX +XXX,XX @@ vwredsum_vs     110001 . ..... ..... 000 ..... 1010111 @r_vm
+         gen_helper_##NAME##_b, gen_helper_##NAME##_h,              \
- vfredsum_vs     0000-1 . ..... ..... 001 ..... 1010111 @r_vm
+         gen_helper_##NAME##_w, gen_helper_##NAME##_d,              \
- vfredmin_vs     000101 . ..... ..... 001 ..... 1010111 @r_vm
+     };                                                             \
- vfredmax_vs     000111 . ..... ..... 001 ..... 1010111 @r_vm
++    if (!opivv_check(s, a)) {                                      \
-+# Vector widening ordered and unordered float reduction sum
++        return false;                                              \
-+vfwredsum_vs    1100-1 . ..... ..... 001 ..... 1010111 @r_vm
++    }                                                              \
+     return do_opivv_gvec(s, a, tcg_gen_gvec_##SUF, fns[s->sew]);   \
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
+ }
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
+@@ -XXX,XX +XXX,XX @@ static inline bool
-index XXXXXXX..XXXXXXX 100644
+ do_opivx_gvec(DisasContext *s, arg_rmrr *a, GVecGen2sFn *gvec_fn,
---- a/target/riscv/insn_trans/trans_rvv.inc.c
+               gen_helper_opivx *fn)
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
+ {
-@@ -XXX,XX +XXX,XX @@ GEN_OPIVV_WIDEN_TRANS(vwredsumu_vs, reduction_check)
+-    if (!opivx_check(s, a)) {
- GEN_OPFVV_TRANS(vfredsum_vs, reduction_check)
+-        return false;
- GEN_OPFVV_TRANS(vfredmax_vs, reduction_check)
+-    }
- GEN_OPFVV_TRANS(vfredmin_vs, reduction_check)
+-
-+
+     if (a->vm && s->vl_eq_vlmax && !(s->vta && s->lmul < 0)) {
-+/* Vector Widening Floating-Point Reduction Instructions */
+         TCGv_i64 src1 = tcg_temp_new_i64();
-+GEN_OPFVV_WIDEN_TRANS(vfwredsum_vs, reduction_check)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
+@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmrr *a)             \
-index XXXXXXX..XXXXXXX 100644
+         gen_helper_##NAME##_b, gen_helper_##NAME##_h,              \
---- a/target/riscv/vector_helper.c
+         gen_helper_##NAME##_w, gen_helper_##NAME##_d,              \
-+++ b/target/riscv/vector_helper.c
+     };                                                             \
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_FRED(vfredmax_vs_d, uint64_t, uint64_t, H8, H8, float64_maxnum, clearq)
++    if (!opivx_check(s, a)) {                                      \
- GEN_VEXT_FRED(vfredmin_vs_h, uint16_t, uint16_t, H2, H2, float16_minnum, clearh)
++        return false;                                              \
- GEN_VEXT_FRED(vfredmin_vs_w, uint32_t, uint32_t, H4, H4, float32_minnum, clearl)
++    }                                                              \
- GEN_VEXT_FRED(vfredmin_vs_d, uint64_t, uint64_t, H8, H8, float64_minnum, clearq)
+     return do_opivx_gvec(s, a, tcg_gen_gvec_##SUF, fns[s->sew]);   \
-+
+ }
-+/* Vector Widening Floating-Point Reduction Instructions */
-+/* Unordered reduce 2*SEW = 2*SEW + sum(promote(SEW)) */
+@@ -XXX,XX +XXX,XX @@ static inline bool
-+void HELPER(vfwredsum_vs_h)(void *vd, void *v0, void *vs1,
+ do_opivi_gvec(DisasContext *s, arg_rmrr *a, GVecGen2iFn *gvec_fn,
-+                            void *vs2, CPURISCVState *env, uint32_t desc)
+               gen_helper_opivx *fn, imm_mode_t imm_mode)
-+{
+ {
-+    uint32_t mlen = vext_mlen(desc);
+-    if (!opivx_check(s, a)) {
-+    uint32_t vm = vext_vm(desc);
+-        return false;
-+    uint32_t vl = env->vl;
+-    }
-+    uint32_t i;
+-
-+    uint32_t tot = env_archcpu(env)->cfg.vlen / 8;
+     if (a->vm && s->vl_eq_vlmax && !(s->vta && s->lmul < 0)) {
-+    uint32_t s1 =  *((uint32_t *)vs1 + H4(0));
+         gvec_fn(s->sew, vreg_ofs(s, a->rd), vreg_ofs(s, a->rs2),
-+
+                 extract_imm(s, a->rs1, imm_mode), MAXSZ(s), MAXSZ(s));
-+    for (i = 0; i < vl; i++) {
+@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmrr *a)             \
-+        uint16_t s2 = *((uint16_t *)vs2 + H2(i));
+         gen_helper_##OPIVX##_b, gen_helper_##OPIVX##_h,            \
-+        if (!vm && !vext_elem_mask(v0, mlen, i)) {
+         gen_helper_##OPIVX##_w, gen_helper_##OPIVX##_d,            \
-+            continue;
+     };                                                             \
-+        }
++    if (!opivx_check(s, a)) {                                      \
-+        s1 = float32_add(s1, float16_to_float32(s2, true, &env->fp_status),
++        return false;                                              \
-+                         &env->fp_status);
++    }                                                              \
-+    }
+     return do_opivi_gvec(s, a, tcg_gen_gvec_##SUF,                 \
-+    *((uint32_t *)vd + H4(0)) = s1;
+                          fns[s->sew], IMM_MODE);                   \
-+    clearl(vd, 1, sizeof(uint32_t), tot);
+ }
-+}
+@@ -XXX,XX +XXX,XX @@ static inline bool
-+
+ do_opivx_gvec_shift(DisasContext *s, arg_rmrr *a, GVecGen2sFn32 *gvec_fn,
-+void HELPER(vfwredsum_vs_w)(void *vd, void *v0, void *vs1,
+                     gen_helper_opivx *fn)
-+                            void *vs2, CPURISCVState *env, uint32_t desc)
+ {
-+{
+-    if (!opivx_check(s, a)) {
-+    uint32_t mlen = vext_mlen(desc);
+-        return false;
-+    uint32_t vm = vext_vm(desc);
+-    }
-+    uint32_t vl = env->vl;
+-
-+    uint32_t i;
+     if (a->vm && s->vl_eq_vlmax && !(s->vta && s->lmul < 0)) {
-+    uint32_t tot = env_archcpu(env)->cfg.vlen / 8;
+         TCGv_i32 src1 = tcg_temp_new_i32();
-+    uint64_t s1 =  *((uint64_t *)vs1);
-+
+@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmrr *a)                    \
-+    for (i = 0; i < vl; i++) {
+         gen_helper_##NAME##_b, gen_helper_##NAME##_h,                     \
-+        uint32_t s2 = *((uint32_t *)vs2 + H4(i));
+         gen_helper_##NAME##_w, gen_helper_##NAME##_d,                     \
-+        if (!vm && !vext_elem_mask(v0, mlen, i)) {
+     };                                                                    \
-+            continue;
+-                                                                          \
-+        }
++    if (!opivx_check(s, a)) {                                             \
-+        s1 = float64_add(s1, float32_to_float64(s2, &env->fp_status),
++        return false;                                                     \
-+                         &env->fp_status);
++    }                                                                     \
-+    }
+     return do_opivx_gvec_shift(s, a, tcg_gen_gvec_##SUF, fns[s->sew]);    \
-+    *((uint64_t *)vd) = s1;
+ }
-+    clearq(vd, 1, sizeof(uint64_t), tot);
 +}
 --
-.27.0
+.41.0

-[PULL 16/63] target/riscv: vector single-width bit shift instructions
+[PULL v2 13/45] target/riscv: Refactor translation of vector-widening instruction
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Dickon Hood <dickon.hood@codethink.co.uk>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Zvbb (implemented in later commit) has a widening instruction, which
 requires an extra check on the enabled extensions.  Refactor
 GEN_OPIVX_WIDEN_TRANS() to take a check function to avoid reimplementing
 it.
 Signed-off-by: Dickon Hood <dickon.hood@codethink.co.uk>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Reviewed-by: Weiwei Li <liweiwei@iscas.ac.cn>
-Message-id: 20200623215920.2594-15-zhiwei_liu@c-sky.com
+Signed-off-by: Max Chou <max.chou@sifive.com>
 Message-ID: <20230711165917.2629866-7-max.chou@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   | 25 ++++++++
+ target/riscv/insn_trans/trans_rvv.c.inc | 52 +++++++++++--------------
- target/riscv/insn32.decode              |  9 +++
+file changed, 23 insertions(+), 29 deletions(-)
  target/riscv/insn_trans/trans_rvv.inc.c | 52 ++++++++++++++++
  target/riscv/vector_helper.c            | 79 +++++++++++++++++++++++++
 files changed, 165 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/target/riscv/insn_trans/trans_rvv.c.inc b/target/riscv/insn_trans/trans_rvv.c.inc
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/target/riscv/insn_trans/trans_rvv.c.inc
-+++ b/target/riscv/helper.h
++++ b/target/riscv/insn_trans/trans_rvv.c.inc
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vxor_vx_b, void, ptr, ptr, tl, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ static bool opivx_widen_check(DisasContext *s, arg_rmrr *a)
- DEF_HELPER_6(vxor_vx_h, void, ptr, ptr, tl, ptr, env, i32)
+            vext_check_ds(s, a->rd, a->rs2, a->vm);
- DEF_HELPER_6(vxor_vx_w, void, ptr, ptr, tl, ptr, env, i32)
+ }
- DEF_HELPER_6(vxor_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+
+-static bool do_opivx_widen(DisasContext *s, arg_rmrr *a,
-+DEF_HELPER_6(vsll_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
+-                           gen_helper_opivx *fn)
-+DEF_HELPER_6(vsll_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
+-{
-+DEF_HELPER_6(vsll_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
+-    if (opivx_widen_check(s, a)) {
-+DEF_HELPER_6(vsll_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
+-        return opivx_trans(a->rd, a->rs1, a->rs2, a->vm, fn, s);
-+DEF_HELPER_6(vsrl_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
+-    }
-+DEF_HELPER_6(vsrl_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
+-    return false;
-+DEF_HELPER_6(vsrl_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
+-}
-+DEF_HELPER_6(vsrl_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
+-
-+DEF_HELPER_6(vsra_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
+-#define GEN_OPIVX_WIDEN_TRANS(NAME) \
-+DEF_HELPER_6(vsra_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
+-static bool trans_##NAME(DisasContext *s, arg_rmrr *a)       \
-+DEF_HELPER_6(vsra_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
+-{                                                            \
-+DEF_HELPER_6(vsra_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
+-    static gen_helper_opivx * const fns[3] = {               \
-+DEF_HELPER_6(vsll_vx_b, void, ptr, ptr, tl, ptr, env, i32)
+-        gen_helper_##NAME##_b,                               \
-+DEF_HELPER_6(vsll_vx_h, void, ptr, ptr, tl, ptr, env, i32)
+-        gen_helper_##NAME##_h,                               \
-+DEF_HELPER_6(vsll_vx_w, void, ptr, ptr, tl, ptr, env, i32)
+-        gen_helper_##NAME##_w                                \
-+DEF_HELPER_6(vsll_vx_d, void, ptr, ptr, tl, ptr, env, i32)
+-    };                                                       \
-+DEF_HELPER_6(vsrl_vx_b, void, ptr, ptr, tl, ptr, env, i32)
+-    return do_opivx_widen(s, a, fns[s->sew]);                \
-+DEF_HELPER_6(vsrl_vx_h, void, ptr, ptr, tl, ptr, env, i32)
++#define GEN_OPIVX_WIDEN_TRANS(NAME, CHECK) \
 +DEF_HELPER_6(vsrl_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsrl_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsra_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsra_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsra_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsra_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@ vor_vi          001010 . ..... ..... 011 ..... 1010111 @r_vm
  vxor_vv         001011 . ..... ..... 000 ..... 1010111 @r_vm
  vxor_vx         001011 . ..... ..... 100 ..... 1010111 @r_vm
  vxor_vi         001011 . ..... ..... 011 ..... 1010111 @r_vm
 +vsll_vv         100101 . ..... ..... 000 ..... 1010111 @r_vm
 +vsll_vx         100101 . ..... ..... 100 ..... 1010111 @r_vm
 +vsll_vi         100101 . ..... ..... 011 ..... 1010111 @r_vm
 +vsrl_vv         101000 . ..... ..... 000 ..... 1010111 @r_vm
 +vsrl_vx         101000 . ..... ..... 100 ..... 1010111 @r_vm
 +vsrl_vi         101000 . ..... ..... 011 ..... 1010111 @r_vm
 +vsra_vv         101001 . ..... ..... 000 ..... 1010111 @r_vm
 +vsra_vx         101001 . ..... ..... 100 ..... 1010111 @r_vm
 +vsra_vi         101001 . ..... ..... 011 ..... 1010111 @r_vm
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ GEN_OPIVX_GVEC_TRANS(vxor_vx, xors)
  GEN_OPIVI_GVEC_TRANS(vand_vi, 0, vand_vx, andi)
  GEN_OPIVI_GVEC_TRANS(vor_vi, 0, vor_vx,  ori)
  GEN_OPIVI_GVEC_TRANS(vxor_vi, 0, vxor_vx, xori)
 +
 +/* Vector Single-Width Bit Shift Instructions */
 +GEN_OPIVV_GVEC_TRANS(vsll_vv,  shlv)
 +GEN_OPIVV_GVEC_TRANS(vsrl_vv,  shrv)
 +GEN_OPIVV_GVEC_TRANS(vsra_vv,  sarv)
 +
 +typedef void GVecGen2sFn32(unsigned, uint32_t, uint32_t, TCGv_i32,
 +                           uint32_t, uint32_t);
 +
 +static inline bool
 +do_opivx_gvec_shift(DisasContext *s, arg_rmrr *a, GVecGen2sFn32 *gvec_fn,
 +                    gen_helper_opivx *fn)
 +{
 +    if (!opivx_check(s, a)) {
 +        return false;
 +    }
 +
 +    if (a->vm && s->vl_eq_vlmax) {
 +        TCGv_i32 src1 = tcg_temp_new_i32();
 +        TCGv tmp = tcg_temp_new();
 +
 +        gen_get_gpr(tmp, a->rs1);
 +        tcg_gen_trunc_tl_i32(src1, tmp);
 +        tcg_gen_extract_i32(src1, src1, 0, s->sew + 3);
 +        gvec_fn(s->sew, vreg_ofs(s, a->rd), vreg_ofs(s, a->rs2),
 +                src1, MAXSZ(s), MAXSZ(s));
 +
 +        tcg_temp_free_i32(src1);
 +        tcg_temp_free(tmp);
 +        return true;
 +    }
 +    return opivx_trans(a->rd, a->rs1, a->rs2, a->vm, fn, s);
 +}
 +
 +#define GEN_OPIVX_GVEC_SHIFT_TRANS(NAME, SUF) \
 +static bool trans_##NAME(DisasContext *s, arg_rmrr *a)                    \
 +{                                                                         \
-+    static gen_helper_opivx * const fns[4] = {                            \
++    if (CHECK(s, a)) {                                                    \
-+        gen_helper_##NAME##_b, gen_helper_##NAME##_h,                     \
++        static gen_helper_opivx * const fns[3] = {                        \
-+        gen_helper_##NAME##_w, gen_helper_##NAME##_d,                     \
++            gen_helper_##NAME##_b,                                        \
-+    };                                                                    \
++            gen_helper_##NAME##_h,                                        \
-+                                                                          \
++            gen_helper_##NAME##_w                                         \
-+    return do_opivx_gvec_shift(s, a, tcg_gen_gvec_##SUF, fns[s->sew]);    \
++        };                                                                \
-+}
++        return opivx_trans(a->rd, a->rs1, a->rs2, a->vm, fns[s->sew], s); \
 +
 +GEN_OPIVX_GVEC_SHIFT_TRANS(vsll_vx,  shls)
 +GEN_OPIVX_GVEC_SHIFT_TRANS(vsrl_vx,  shrs)
 +GEN_OPIVX_GVEC_SHIFT_TRANS(vsra_vx,  sars)
 +
 +GEN_OPIVI_GVEC_TRANS(vsll_vi, 1, vsll_vx,  shli)
 +GEN_OPIVI_GVEC_TRANS(vsrl_vi, 1, vsrl_vx,  shri)
 +GEN_OPIVI_GVEC_TRANS(vsra_vi, 1, vsra_vx,  sari)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VX(vxor_vx_b, 1, 1, clearb)
  GEN_VEXT_VX(vxor_vx_h, 2, 2, clearh)
  GEN_VEXT_VX(vxor_vx_w, 4, 4, clearl)
  GEN_VEXT_VX(vxor_vx_d, 8, 8, clearq)
 +
 +/* Vector Single-Width Bit Shift Instructions */
 +#define DO_SLL(N, M)  (N << (M))
 +#define DO_SRL(N, M)  (N >> (M))
 +
 +/* generate the helpers for shift instructions with two vector operators */
 +#define GEN_VEXT_SHIFT_VV(NAME, TS1, TS2, HS1, HS2, OP, MASK, CLEAR_FN)   \
 +void HELPER(NAME)(void *vd, void *v0, void *vs1,                          \
 +                  void *vs2, CPURISCVState *env, uint32_t desc)           \
 +{                                                                         \
 +    uint32_t mlen = vext_mlen(desc);                                      \
 +    uint32_t vm = vext_vm(desc);                                          \
 +    uint32_t vl = env->vl;                                                \
 +    uint32_t esz = sizeof(TS1);                                           \
 +    uint32_t vlmax = vext_maxsz(desc) / esz;                              \
 +    uint32_t i;                                                           \
 +                                                                          \
 +    for (i = 0; i < vl; i++) {                                            \
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {                        \
 +            continue;                                                     \
 +        }                                                                 \
 +        TS1 s1 = *((TS1 *)vs1 + HS1(i));                                  \
 +        TS2 s2 = *((TS2 *)vs2 + HS2(i));                                  \
 +        *((TS1 *)vd + HS1(i)) = OP(s2, s1 & MASK);                        \
 +    }                                                                     \
-+    CLEAR_FN(vd, vl, vl * esz, vlmax * esz);                              \
++    return false;                                                         \
-+}
+ }
-+
-+GEN_VEXT_SHIFT_VV(vsll_vv_b, uint8_t,  uint8_t, H1, H1, DO_SLL, 0x7, clearb)
+-GEN_OPIVX_WIDEN_TRANS(vwaddu_vx)
-+GEN_VEXT_SHIFT_VV(vsll_vv_h, uint16_t, uint16_t, H2, H2, DO_SLL, 0xf, clearh)
+-GEN_OPIVX_WIDEN_TRANS(vwadd_vx)
-+GEN_VEXT_SHIFT_VV(vsll_vv_w, uint32_t, uint32_t, H4, H4, DO_SLL, 0x1f, clearl)
+-GEN_OPIVX_WIDEN_TRANS(vwsubu_vx)
-+GEN_VEXT_SHIFT_VV(vsll_vv_d, uint64_t, uint64_t, H8, H8, DO_SLL, 0x3f, clearq)
+-GEN_OPIVX_WIDEN_TRANS(vwsub_vx)
-+
++GEN_OPIVX_WIDEN_TRANS(vwaddu_vx, opivx_widen_check)
-+GEN_VEXT_SHIFT_VV(vsrl_vv_b, uint8_t, uint8_t, H1, H1, DO_SRL, 0x7, clearb)
++GEN_OPIVX_WIDEN_TRANS(vwadd_vx, opivx_widen_check)
-+GEN_VEXT_SHIFT_VV(vsrl_vv_h, uint16_t, uint16_t, H2, H2, DO_SRL, 0xf, clearh)
++GEN_OPIVX_WIDEN_TRANS(vwsubu_vx, opivx_widen_check)
-+GEN_VEXT_SHIFT_VV(vsrl_vv_w, uint32_t, uint32_t, H4, H4, DO_SRL, 0x1f, clearl)
++GEN_OPIVX_WIDEN_TRANS(vwsub_vx, opivx_widen_check)
-+GEN_VEXT_SHIFT_VV(vsrl_vv_d, uint64_t, uint64_t, H8, H8, DO_SRL, 0x3f, clearq)
-+
+ /* WIDEN OPIVV with WIDEN */
-+GEN_VEXT_SHIFT_VV(vsra_vv_b, uint8_t,  int8_t, H1, H1, DO_SRL, 0x7, clearb)
+ static bool opiwv_widen_check(DisasContext *s, arg_rmrr *a)
-+GEN_VEXT_SHIFT_VV(vsra_vv_h, uint16_t, int16_t, H2, H2, DO_SRL, 0xf, clearh)
+@@ -XXX,XX +XXX,XX @@ GEN_OPIVX_TRANS(vrem_vx, opivx_check)
-+GEN_VEXT_SHIFT_VV(vsra_vv_w, uint32_t, int32_t, H4, H4, DO_SRL, 0x1f, clearl)
+ GEN_OPIVV_WIDEN_TRANS(vwmul_vv, opivv_widen_check)
-+GEN_VEXT_SHIFT_VV(vsra_vv_d, uint64_t, int64_t, H8, H8, DO_SRL, 0x3f, clearq)
+ GEN_OPIVV_WIDEN_TRANS(vwmulu_vv, opivv_widen_check)
-+
+ GEN_OPIVV_WIDEN_TRANS(vwmulsu_vv, opivv_widen_check)
-+/* generate the helpers for shift instructions with one vector and one scalar */
+-GEN_OPIVX_WIDEN_TRANS(vwmul_vx)
-+#define GEN_VEXT_SHIFT_VX(NAME, TD, TS2, HD, HS2, OP, MASK, CLEAR_FN) \
+-GEN_OPIVX_WIDEN_TRANS(vwmulu_vx)
-+void HELPER(NAME)(void *vd, void *v0, target_ulong s1,                \
+-GEN_OPIVX_WIDEN_TRANS(vwmulsu_vx)
-+        void *vs2, CPURISCVState *env, uint32_t desc)                 \
++GEN_OPIVX_WIDEN_TRANS(vwmul_vx, opivx_widen_check)
-+{                                                                     \
++GEN_OPIVX_WIDEN_TRANS(vwmulu_vx, opivx_widen_check)
-+    uint32_t mlen = vext_mlen(desc);                                  \
++GEN_OPIVX_WIDEN_TRANS(vwmulsu_vx, opivx_widen_check)
-+    uint32_t vm = vext_vm(desc);                                      \
-+    uint32_t vl = env->vl;                                            \
+ /* Vector Single-Width Integer Multiply-Add Instructions */
-+    uint32_t esz = sizeof(TD);                                        \
+ GEN_OPIVV_TRANS(vmacc_vv, opivv_check)
-+    uint32_t vlmax = vext_maxsz(desc) / esz;                          \
+@@ -XXX,XX +XXX,XX @@ GEN_OPIVX_TRANS(vnmsub_vx, opivx_check)
-+    uint32_t i;                                                       \
+ GEN_OPIVV_WIDEN_TRANS(vwmaccu_vv, opivv_widen_check)
-+                                                                      \
+ GEN_OPIVV_WIDEN_TRANS(vwmacc_vv, opivv_widen_check)
-+    for (i = 0; i < vl; i++) {                                        \
+ GEN_OPIVV_WIDEN_TRANS(vwmaccsu_vv, opivv_widen_check)
-+        if (!vm && !vext_elem_mask(v0, mlen, i)) {                    \
+-GEN_OPIVX_WIDEN_TRANS(vwmaccu_vx)
-+            continue;                                                 \
+-GEN_OPIVX_WIDEN_TRANS(vwmacc_vx)
-+        }                                                             \
+-GEN_OPIVX_WIDEN_TRANS(vwmaccsu_vx)
-+        TS2 s2 = *((TS2 *)vs2 + HS2(i));                              \
+-GEN_OPIVX_WIDEN_TRANS(vwmaccus_vx)
-+        *((TD *)vd + HD(i)) = OP(s2, s1 & MASK);                      \
++GEN_OPIVX_WIDEN_TRANS(vwmaccu_vx, opivx_widen_check)
-+    }                                                                 \
++GEN_OPIVX_WIDEN_TRANS(vwmacc_vx, opivx_widen_check)
-+    CLEAR_FN(vd, vl, vl * esz, vlmax * esz);                          \
++GEN_OPIVX_WIDEN_TRANS(vwmaccsu_vx, opivx_widen_check)
-+}
++GEN_OPIVX_WIDEN_TRANS(vwmaccus_vx, opivx_widen_check)
-+
-+GEN_VEXT_SHIFT_VX(vsll_vx_b, uint8_t, int8_t, H1, H1, DO_SLL, 0x7, clearb)
+ /* Vector Integer Merge and Move Instructions */
-+GEN_VEXT_SHIFT_VX(vsll_vx_h, uint16_t, int16_t, H2, H2, DO_SLL, 0xf, clearh)
+ static bool trans_vmv_v_v(DisasContext *s, arg_vmv_v_v *a)
 +GEN_VEXT_SHIFT_VX(vsll_vx_w, uint32_t, int32_t, H4, H4, DO_SLL, 0x1f, clearl)
 +GEN_VEXT_SHIFT_VX(vsll_vx_d, uint64_t, int64_t, H8, H8, DO_SLL, 0x3f, clearq)
 +
 +GEN_VEXT_SHIFT_VX(vsrl_vx_b, uint8_t, uint8_t, H1, H1, DO_SRL, 0x7, clearb)
 +GEN_VEXT_SHIFT_VX(vsrl_vx_h, uint16_t, uint16_t, H2, H2, DO_SRL, 0xf, clearh)
 +GEN_VEXT_SHIFT_VX(vsrl_vx_w, uint32_t, uint32_t, H4, H4, DO_SRL, 0x1f, clearl)
 +GEN_VEXT_SHIFT_VX(vsrl_vx_d, uint64_t, uint64_t, H8, H8, DO_SRL, 0x3f, clearq)
 +
 +GEN_VEXT_SHIFT_VX(vsra_vx_b, int8_t, int8_t, H1, H1, DO_SRL, 0x7, clearb)
 +GEN_VEXT_SHIFT_VX(vsra_vx_h, int16_t, int16_t, H2, H2, DO_SRL, 0xf, clearh)
 +GEN_VEXT_SHIFT_VX(vsra_vx_w, int32_t, int32_t, H4, H4, DO_SRL, 0x1f, clearl)
 +GEN_VEXT_SHIFT_VX(vsra_vx_d, int64_t, int64_t, H8, H8, DO_SRL, 0x3f, clearq)
 --
-.27.0
+.41.0

-[PULL 42/63] target/riscv: vector floating-point classify instructions
+[PULL v2 14/45] target/riscv: Refactor some of the generic vector functionality
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Kiran Ostrolenk <kiran.ostrolenk@codethink.co.uk>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Move some macros out of `vector_helper` and into `vector_internals`.
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+This ensures they can be used by both vector and vector-crypto helpers
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+(latter implemented in proceeding commits).
-Message-id: 20200623215920.2594-41-zhiwei_liu@c-sky.com
 Signed-off-by: Kiran Ostrolenk <kiran.ostrolenk@codethink.co.uk>
 Reviewed-by: Weiwei Li <liweiwei@iscas.ac.cn>
 Signed-off-by: Max Chou <max.chou@sifive.com>
 Message-ID: <20230711165917.2629866-8-max.chou@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   |  4 ++
+ target/riscv/vector_internals.h | 46 +++++++++++++++++++++++++++++++++
- target/riscv/internals.h                |  5 ++
+ target/riscv/vector_helper.c    | 42 ------------------------------
- target/riscv/insn32.decode              |  1 +
+files changed, 46 insertions(+), 42 deletions(-)
  target/riscv/fpu_helper.c               | 33 +--------
  target/riscv/insn_trans/trans_rvv.inc.c |  3 +
  target/riscv/vector_helper.c            | 91 +++++++++++++++++++++++++
 files changed, 107 insertions(+), 30 deletions(-)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/target/riscv/vector_internals.h b/target/riscv/vector_internals.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/target/riscv/vector_internals.h
-+++ b/target/riscv/helper.h
++++ b/target/riscv/vector_internals.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vmford_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ void vext_set_elems_1s(void *base, uint32_t is_agnostic, uint32_t cnt,
- DEF_HELPER_6(vmford_vf_h, void, ptr, ptr, i64, ptr, env, i32)
+ /* expand macro args before macro */
- DEF_HELPER_6(vmford_vf_w, void, ptr, ptr, i64, ptr, env, i32)
+ #define RVVCALL(macro, ...)  macro(__VA_ARGS__)
- DEF_HELPER_6(vmford_vf_d, void, ptr, ptr, i64, ptr, env, i32)
 +/* (TD, T2, TX2) */
 +#define OP_UU_B uint8_t, uint8_t, uint8_t
 +#define OP_UU_H uint16_t, uint16_t, uint16_t
 +#define OP_UU_W uint32_t, uint32_t, uint32_t
 +#define OP_UU_D uint64_t, uint64_t, uint64_t
 +
-+DEF_HELPER_5(vfclass_v_h, void, ptr, ptr, ptr, env, i32)
+ /* (TD, T1, T2, TX1, TX2) */
-+DEF_HELPER_5(vfclass_v_w, void, ptr, ptr, ptr, env, i32)
+ #define OP_UUU_B uint8_t, uint8_t, uint8_t, uint8_t, uint8_t
-+DEF_HELPER_5(vfclass_v_d, void, ptr, ptr, ptr, env, i32)
+ #define OP_UUU_H uint16_t, uint16_t, uint16_t, uint16_t, uint16_t
-diff --git a/target/riscv/internals.h b/target/riscv/internals.h
+ #define OP_UUU_W uint32_t, uint32_t, uint32_t, uint32_t, uint32_t
-index XXXXXXX..XXXXXXX 100644
+ #define OP_UUU_D uint64_t, uint64_t, uint64_t, uint64_t, uint64_t
---- a/target/riscv/internals.h
 +++ b/target/riscv/internals.h
@@ -XXX,XX +XXX,XX @@ FIELD(VDATA, VM, 8, 1)
  FIELD(VDATA, LMUL, 9, 2)
  FIELD(VDATA, NF, 11, 4)
  FIELD(VDATA, WD, 11, 1)
 +
 +/* float point classify helpers */
 +target_ulong fclass_h(uint64_t frs1);
 +target_ulong fclass_s(uint64_t frs1);
 +target_ulong fclass_d(uint64_t frs1);
  #endif
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@ vmfgt_vf        011101 . ..... ..... 101 ..... 1010111 @r_vm
  vmfge_vf        011111 . ..... ..... 101 ..... 1010111 @r_vm
  vmford_vv       011010 . ..... ..... 001 ..... 1010111 @r_vm
  vmford_vf       011010 . ..... ..... 101 ..... 1010111 @r_vm
 +vfclass_v       100011 . ..... 10000 001 ..... 1010111 @r2_vm
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/fpu_helper.c b/target/riscv/fpu_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/fpu_helper.c
 +++ b/target/riscv/fpu_helper.c
@@ -XXX,XX +XXX,XX @@
  #include "exec/exec-all.h"
  #include "exec/helper-proto.h"
  #include "fpu/softfloat.h"
 +#include "internals.h"
  target_ulong riscv_cpu_get_fflags(CPURISCVState *env)
  {
@@ -XXX,XX +XXX,XX @@ uint64_t helper_fcvt_s_lu(CPURISCVState *env, uint64_t rs1)
  target_ulong helper_fclass_s(uint64_t frs1)
  {
 -    float32 f = frs1;
 -    bool sign = float32_is_neg(f);
 -
 -    if (float32_is_infinity(f)) {
 -        return sign ? 1 << 0 : 1 << 7;
 -    } else if (float32_is_zero(f)) {
 -        return sign ? 1 << 3 : 1 << 4;
 -    } else if (float32_is_zero_or_denormal(f)) {
 -        return sign ? 1 << 2 : 1 << 5;
 -    } else if (float32_is_any_nan(f)) {
 -        float_status s = { }; /* for snan_bit_is_one */
 -        return float32_is_quiet_nan(f, &s) ? 1 << 9 : 1 << 8;
 -    } else {
 -        return sign ? 1 << 1 : 1 << 6;
 -    }
 +    return fclass_s(frs1);
  }
  uint64_t helper_fadd_d(CPURISCVState *env, uint64_t frs1, uint64_t frs2)
@@ -XXX,XX +XXX,XX @@ uint64_t helper_fcvt_d_lu(CPURISCVState *env, uint64_t rs1)
  target_ulong helper_fclass_d(uint64_t frs1)
  {
 -    float64 f = frs1;
 -    bool sign = float64_is_neg(f);
 -
 -    if (float64_is_infinity(f)) {
 -        return sign ? 1 << 0 : 1 << 7;
 -    } else if (float64_is_zero(f)) {
 -        return sign ? 1 << 3 : 1 << 4;
 -    } else if (float64_is_zero_or_denormal(f)) {
 -        return sign ? 1 << 2 : 1 << 5;
 -    } else if (float64_is_any_nan(f)) {
 -        float_status s = { }; /* for snan_bit_is_one */
 -        return float64_is_quiet_nan(f, &s) ? 1 << 9 : 1 << 8;
 -    } else {
 -        return sign ? 1 << 1 : 1 << 6;
 -    }
 +    return fclass_d(frs1);
  }
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ GEN_OPFVF_TRANS(vmfle_vf, opfvf_cmp_check)
  GEN_OPFVF_TRANS(vmfgt_vf, opfvf_cmp_check)
  GEN_OPFVF_TRANS(vmfge_vf, opfvf_cmp_check)
  GEN_OPFVF_TRANS(vmford_vf, opfvf_cmp_check)
 +
 +/* Vector Floating-Point Classify Instruction */
 +GEN_OPFV_TRANS(vfclass_v, opfv_check)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_CMP_VV_ENV(vmford_vv_d, uint64_t, H8, !float64_unordered_quiet)
  GEN_VEXT_CMP_VF(vmford_vf_h, uint16_t, H2, !float16_unordered_quiet)
  GEN_VEXT_CMP_VF(vmford_vf_w, uint32_t, H4, !float32_unordered_quiet)
  GEN_VEXT_CMP_VF(vmford_vf_d, uint64_t, H8, !float64_unordered_quiet)
 +
 +/* Vector Floating-Point Classify Instruction */
 +#define OPIVV1(NAME, TD, T2, TX2, HD, HS2, OP)         \
 +static void do_##NAME(void *vd, void *vs2, int i)      \
 +{                                                      \
 +    TX2 s2 = *((T2 *)vs2 + HS2(i));                    \
 +    *((TD *)vd + HD(i)) = OP(s2);                      \
 +}
 +
-+#define GEN_VEXT_V(NAME, ESZ, DSZ, CLEAR_FN)           \
++#define GEN_VEXT_V(NAME, ESZ)                          \
 +void HELPER(NAME)(void *vd, void *v0, void *vs2,       \
 +                  CPURISCVState *env, uint32_t desc)   \
 +{                                                      \
-+    uint32_t vlmax = vext_maxsz(desc) / ESZ;           \
-+    uint32_t mlen = vext_mlen(desc);                   \
 +    uint32_t vm = vext_vm(desc);                       \
 +    uint32_t vl = env->vl;                             \
++    uint32_t total_elems =                             \
++        vext_get_total_elems(env, desc, ESZ);          \
++    uint32_t vta = vext_vta(desc);                     \
++    uint32_t vma = vext_vma(desc);                     \
 +    uint32_t i;                                        \
 +                                                       \
-+    for (i = 0; i < vl; i++) {                         \
++    for (i = env->vstart; i < vl; i++) {               \
-+        if (!vm && !vext_elem_mask(v0, mlen, i)) {     \
++        if (!vm && !vext_elem_mask(v0, i)) {           \
 +            /* set masked-off elements to 1s */        \
 +            vext_set_elems_1s(vd, vma, i * ESZ,        \
 +                              (i + 1) * ESZ);          \
 +            continue;                                  \
 +        }                                              \
 +        do_##NAME(vd, vs2, i);                         \
 +    }                                                  \
-+    CLEAR_FN(vd, vl, vl * DSZ,  vlmax * DSZ);          \
++    env->vstart = 0;                                   \
 +    /* set tail elements to 1s */                      \
 +    vext_set_elems_1s(vd, vta, vl * ESZ,               \
 +                      total_elems * ESZ);              \
 +}
 +
-+target_ulong fclass_h(uint64_t frs1)
+ /* operation of two vector elements */
-+{
+ typedef void opivv2_fn(void *vd, void *vs1, void *vs2, int i);
-+    float16 f = frs1;
-+    bool sign = float16_is_neg(f);
+@@ -XXX,XX +XXX,XX @@ void HELPER(NAME)(void *vd, void *v0, target_ulong s1,    \
                 do_##NAME, ESZ);                           \
  }
 +/* Three of the widening shortening macros: */
 +/* (TD, T1, T2, TX1, TX2) */
 +#define WOP_UUU_B uint16_t, uint8_t, uint8_t, uint16_t, uint16_t
 +#define WOP_UUU_H uint32_t, uint16_t, uint16_t, uint32_t, uint32_t
 +#define WOP_UUU_W uint64_t, uint32_t, uint32_t, uint64_t, uint64_t
 +
-+    if (float16_is_infinity(f)) {
+ #endif /* TARGET_RISCV_VECTOR_INTERNALS_H */
-+        return sign ? 1 << 0 : 1 << 7;
+diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-+    } else if (float16_is_zero(f)) {
+index XXXXXXX..XXXXXXX 100644
-+        return sign ? 1 << 3 : 1 << 4;
+--- a/target/riscv/vector_helper.c
-+    } else if (float16_is_zero_or_denormal(f)) {
++++ b/target/riscv/vector_helper.c
-+        return sign ? 1 << 2 : 1 << 5;
+@@ -XXX,XX +XXX,XX @@ GEN_VEXT_ST_WHOLE(vs8r_v, int8_t, ste_b)
-+    } else if (float16_is_any_nan(f)) {
+ #define OP_SUS_H int16_t, uint16_t, int16_t, uint16_t, int16_t
-+        float_status s = { }; /* for snan_bit_is_one */
+ #define OP_SUS_W int32_t, uint32_t, int32_t, uint32_t, int32_t
-+        return float16_is_quiet_nan(f, &s) ? 1 << 9 : 1 << 8;
+ #define OP_SUS_D int64_t, uint64_t, int64_t, uint64_t, int64_t
-+    } else {
+-#define WOP_UUU_B uint16_t, uint8_t, uint8_t, uint16_t, uint16_t
-+        return sign ? 1 << 1 : 1 << 6;
+-#define WOP_UUU_H uint32_t, uint16_t, uint16_t, uint32_t, uint32_t
-+    }
+-#define WOP_UUU_W uint64_t, uint32_t, uint32_t, uint64_t, uint64_t
-+}
+ #define WOP_SSS_B int16_t, int8_t, int8_t, int16_t, int16_t
-+
+ #define WOP_SSS_H int32_t, int16_t, int16_t, int32_t, int32_t
-+target_ulong fclass_s(uint64_t frs1)
+ #define WOP_SSS_W int64_t, int32_t, int32_t, int64_t, int64_t
-+{
+@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VF(vfwnmsac_vf_h, 4)
-+    float32 f = frs1;
+ GEN_VEXT_VF(vfwnmsac_vf_w, 8)
-+    bool sign = float32_is_neg(f);
-+
+ /* Vector Floating-Point Square-Root Instruction */
-+    if (float32_is_infinity(f)) {
+-/* (TD, T2, TX2) */
-+        return sign ? 1 << 0 : 1 << 7;
+-#define OP_UU_H uint16_t, uint16_t, uint16_t
-+    } else if (float32_is_zero(f)) {
+-#define OP_UU_W uint32_t, uint32_t, uint32_t
-+        return sign ? 1 << 3 : 1 << 4;
+-#define OP_UU_D uint64_t, uint64_t, uint64_t
-+    } else if (float32_is_zero_or_denormal(f)) {
+-
-+        return sign ? 1 << 2 : 1 << 5;
+ #define OPFVV1(NAME, TD, T2, TX2, HD, HS2, OP)         \
-+    } else if (float32_is_any_nan(f)) {
+ static void do_##NAME(void *vd, void *vs2, int i,      \
-+        float_status s = { }; /* for snan_bit_is_one */
+                       CPURISCVState *env)              \
-+        return float32_is_quiet_nan(f, &s) ? 1 << 9 : 1 << 8;
+@@ -XXX,XX +XXX,XX @@ GEN_VEXT_CMP_VF(vmfge_vf_w, uint32_t, H4, vmfge32)
-+    } else {
+ GEN_VEXT_CMP_VF(vmfge_vf_d, uint64_t, H8, vmfge64)
-+        return sign ? 1 << 1 : 1 << 6;
-+    }
+ /* Vector Floating-Point Classify Instruction */
-+}
+-#define OPIVV1(NAME, TD, T2, TX2, HD, HS2, OP)         \
-+
+-static void do_##NAME(void *vd, void *vs2, int i)      \
-+target_ulong fclass_d(uint64_t frs1)
+-{                                                      \
-+{
+-    TX2 s2 = *((T2 *)vs2 + HS2(i));                    \
-+    float64 f = frs1;
+-    *((TD *)vd + HD(i)) = OP(s2);                      \
-+    bool sign = float64_is_neg(f);
+-}
-+
+-
-+    if (float64_is_infinity(f)) {
+-#define GEN_VEXT_V(NAME, ESZ)                          \
-+        return sign ? 1 << 0 : 1 << 7;
+-void HELPER(NAME)(void *vd, void *v0, void *vs2,       \
-+    } else if (float64_is_zero(f)) {
+-                  CPURISCVState *env, uint32_t desc)   \
-+        return sign ? 1 << 3 : 1 << 4;
+-{                                                      \
-+    } else if (float64_is_zero_or_denormal(f)) {
+-    uint32_t vm = vext_vm(desc);                       \
-+        return sign ? 1 << 2 : 1 << 5;
+-    uint32_t vl = env->vl;                             \
-+    } else if (float64_is_any_nan(f)) {
+-    uint32_t total_elems =                             \
-+        float_status s = { }; /* for snan_bit_is_one */
+-        vext_get_total_elems(env, desc, ESZ);          \
-+        return float64_is_quiet_nan(f, &s) ? 1 << 9 : 1 << 8;
+-    uint32_t vta = vext_vta(desc);                     \
-+    } else {
+-    uint32_t vma = vext_vma(desc);                     \
-+        return sign ? 1 << 1 : 1 << 6;
+-    uint32_t i;                                        \
-+    }
+-                                                       \
-+}
+-    for (i = env->vstart; i < vl; i++) {               \
-+
+-        if (!vm && !vext_elem_mask(v0, i)) {           \
-+RVVCALL(OPIVV1, vfclass_v_h, OP_UU_H, H2, H2, fclass_h)
+-            /* set masked-off elements to 1s */        \
-+RVVCALL(OPIVV1, vfclass_v_w, OP_UU_W, H4, H4, fclass_s)
+-            vext_set_elems_1s(vd, vma, i * ESZ,        \
-+RVVCALL(OPIVV1, vfclass_v_d, OP_UU_D, H8, H8, fclass_d)
+-                              (i + 1) * ESZ);          \
-+GEN_VEXT_V(vfclass_v_h, 2, 2, clearh)
+-            continue;                                  \
-+GEN_VEXT_V(vfclass_v_w, 4, 4, clearl)
+-        }                                              \
-+GEN_VEXT_V(vfclass_v_d, 8, 8, clearq)
+-        do_##NAME(vd, vs2, i);                         \
 -    }                                                  \
 -    env->vstart = 0;                                   \
 -    /* set tail elements to 1s */                      \
 -    vext_set_elems_1s(vd, vta, vl * ESZ,               \
 -                      total_elems * ESZ);              \
 -}
 -
  target_ulong fclass_h(uint64_t frs1)
  {
      float16 f = frs1;
 --
-.27.0
+.41.0

-[PULL 25/63] target/riscv: vector integer merge and move instructions
+[PULL v2 15/45] target/riscv: Add Zvbb ISA extension support
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Dickon Hood <dickon.hood@codethink.co.uk>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+This commit adds support for the Zvbb vector-crypto extension, which
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+consists of the following instructions:
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200623215920.2594-24-zhiwei_liu@c-sky.com
+* vrol.[vv,vx]
 * vror.[vv,vx,vi]
 * vbrev8.v
 * vrev8.v
 * vandn.[vv,vx]
 * vbrev.v
 * vclz.v
 * vctz.v
 * vcpop.v
 * vwsll.[vv,vx,vi]
 Translation functions are defined in
 `target/riscv/insn_trans/trans_rvvk.c.inc` and helpers are defined in
 `target/riscv/vcrypto_helper.c`.
 Co-authored-by: Nazar Kazakov <nazar.kazakov@codethink.co.uk>
 Co-authored-by: William Salmon <will.salmon@codethink.co.uk>
 Co-authored-by: Kiran Ostrolenk <kiran.ostrolenk@codethink.co.uk>
 [max.chou@sifive.com: Fix imm mode of vror.vi]
 Signed-off-by: Nazar Kazakov <nazar.kazakov@codethink.co.uk>
 Signed-off-by: William Salmon <will.salmon@codethink.co.uk>
 Signed-off-by: Kiran Ostrolenk <kiran.ostrolenk@codethink.co.uk>
 Signed-off-by: Dickon Hood <dickon.hood@codethink.co.uk>
 Signed-off-by: Max Chou <max.chou@sifive.com>
 Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 [max.chou@sifive.com: Exposed x-zvbb property]
 Message-ID: <20230711165917.2629866-9-max.chou@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   |  17 ++++
+ target/riscv/cpu_cfg.h                   |   1 +
- target/riscv/insn32.decode              |   7 ++
+ target/riscv/helper.h                    |  62 +++++++++
- target/riscv/insn_trans/trans_rvv.inc.c | 113 ++++++++++++++++++++++++
+ target/riscv/insn32.decode               |  20 +++
- target/riscv/vector_helper.c            |  88 ++++++++++++++++++
+ target/riscv/cpu.c                       |  12 ++
-files changed, 225 insertions(+)
+ target/riscv/vcrypto_helper.c            | 138 +++++++++++++++++++
  target/riscv/insn_trans/trans_rvvk.c.inc | 164 +++++++++++++++++++++++
 files changed, 397 insertions(+)
+diff --git a/target/riscv/cpu_cfg.h b/target/riscv/cpu_cfg.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/cpu_cfg.h
++++ b/target/riscv/cpu_cfg.h
+@@ -XXX,XX +XXX,XX @@ struct RISCVCPUConfig {
+     bool ext_zve32f;
+     bool ext_zve64f;
+     bool ext_zve64d;
++    bool ext_zvbb;
+     bool ext_zvbc;
+     bool ext_zmmul;
+     bool ext_zvfbfmin;
 diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/helper.h
 +++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vwmaccsu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vclmul_vv, void, ptr, ptr, ptr, ptr, env, i32)
- DEF_HELPER_6(vwmaccus_vx_b, void, ptr, ptr, tl, ptr, env, i32)
+ DEF_HELPER_6(vclmul_vx, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vwmaccus_vx_h, void, ptr, ptr, tl, ptr, env, i32)
+ DEF_HELPER_6(vclmulh_vv, void, ptr, ptr, ptr, ptr, env, i32)
- DEF_HELPER_6(vwmaccus_vx_w, void, ptr, ptr, tl, ptr, env, i32)
+ DEF_HELPER_6(vclmulh_vx, void, ptr, ptr, tl, ptr, env, i32)
 +
-+DEF_HELPER_6(vmerge_vvm_b, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vror_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmerge_vvm_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vror_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmerge_vvm_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vror_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmerge_vvm_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vror_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmerge_vxm_b, void, ptr, ptr, tl, ptr, env, i32)
++
-+DEF_HELPER_6(vmerge_vxm_h, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vror_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmerge_vxm_w, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vror_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmerge_vxm_d, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vror_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_4(vmv_v_v_b, void, ptr, ptr, env, i32)
++DEF_HELPER_6(vror_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_4(vmv_v_v_h, void, ptr, ptr, env, i32)
++
-+DEF_HELPER_4(vmv_v_v_w, void, ptr, ptr, env, i32)
++DEF_HELPER_6(vrol_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_4(vmv_v_v_d, void, ptr, ptr, env, i32)
++DEF_HELPER_6(vrol_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_4(vmv_v_x_b, void, ptr, i64, env, i32)
++DEF_HELPER_6(vrol_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_4(vmv_v_x_h, void, ptr, i64, env, i32)
++DEF_HELPER_6(vrol_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_4(vmv_v_x_w, void, ptr, i64, env, i32)
++
-+DEF_HELPER_4(vmv_v_x_d, void, ptr, i64, env, i32)
++DEF_HELPER_6(vrol_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vrol_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vrol_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vrol_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +
 +DEF_HELPER_5(vrev8_v_b, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_5(vrev8_v_h, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_5(vrev8_v_w, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_5(vrev8_v_d, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_5(vbrev8_v_b, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_5(vbrev8_v_h, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_5(vbrev8_v_w, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_5(vbrev8_v_d, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_5(vbrev_v_b, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_5(vbrev_v_h, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_5(vbrev_v_w, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_5(vbrev_v_d, void, ptr, ptr, ptr, env, i32)
 +
 +DEF_HELPER_5(vclz_v_b, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_5(vclz_v_h, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_5(vclz_v_w, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_5(vclz_v_d, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_5(vctz_v_b, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_5(vctz_v_h, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_5(vctz_v_w, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_5(vctz_v_d, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_5(vcpop_v_b, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_5(vcpop_v_h, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_5(vcpop_v_w, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_5(vcpop_v_d, void, ptr, ptr, ptr, env, i32)
 +
 +DEF_HELPER_6(vwsll_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwsll_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwsll_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwsll_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsll_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsll_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +
 +DEF_HELPER_6(vandn_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vandn_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vandn_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vandn_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vandn_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vandn_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vandn_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vandn_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
 @@ -XXX,XX +XXX,XX @@
- @r_nfvm  ... ... vm:1 ..... ..... ... ..... ....... &rnfvm %nf %rs2 %rs1 %rd
+ %imm_u    12:s20                 !function=ex_shift_12
  %imm_bs   30:2                   !function=ex_shift_3
  %imm_rnum 20:4
 +%imm_z6   26:1 15:5
  # Argument sets:
  &empty
@@ -XXX,XX +XXX,XX @@
  @r_vm    ...... vm:1 ..... ..... ... ..... ....... &rmrr %rs2 %rs1 %rd
  @r_vm_1  ...... . ..... ..... ... ..... .......    &rmrr vm=1 %rs2 %rs1 %rd
-+@r_vm_0  ...... . ..... ..... ... ..... .......    &rmrr vm=0 %rs2 %rs1 %rd
+ @r_vm_0  ...... . ..... ..... ... ..... .......    &rmrr vm=0 %rs2 %rs1 %rd
- @r_wdvm  ..... wd:1 vm:1 ..... ..... ... ..... ....... &rwdvm %rs2 %rs1 %rd
++@r2_zimm6  ..... . vm:1 ..... ..... ... ..... .......  &rmrr %rs2 rs1=%imm_z6 %rd
- @r2_zimm . zimm:11  ..... ... ..... ....... %rs1 %rd
+ @r2_zimm11 . zimm:11  ..... ... ..... ....... %rs1 %rd
+ @r2_zimm10 .. zimm:10  ..... ... ..... ....... %rs1 %rd
-@@ -XXX,XX +XXX,XX @@ vwmacc_vx       111101 . ..... ..... 110 ..... 1010111 @r_vm
+ @r2_s    .......   ..... ..... ... ..... ....... %rs2 %rs1
- vwmaccsu_vv     111110 . ..... ..... 010 ..... 1010111 @r_vm
+@@ -XXX,XX +XXX,XX @@ vclmul_vv   001100 . ..... ..... 010 ..... 1010111 @r_vm
- vwmaccsu_vx     111110 . ..... ..... 110 ..... 1010111 @r_vm
+ vclmul_vx   001100 . ..... ..... 110 ..... 1010111 @r_vm
- vwmaccus_vx     111111 . ..... ..... 110 ..... 1010111 @r_vm
+ vclmulh_vv  001101 . ..... ..... 010 ..... 1010111 @r_vm
-+vmv_v_v         010111 1 00000 ..... 000 ..... 1010111 @r2
+ vclmulh_vx  001101 . ..... ..... 110 ..... 1010111 @r_vm
-+vmv_v_x         010111 1 00000 ..... 100 ..... 1010111 @r2
++
-+vmv_v_i         010111 1 00000 ..... 011 ..... 1010111 @r2
++# *** Zvbb vector crypto extension ***
-+vmerge_vvm      010111 0 ..... ..... 000 ..... 1010111 @r_vm_0
++vrol_vv     010101 . ..... ..... 000 ..... 1010111 @r_vm
-+vmerge_vxm      010111 0 ..... ..... 100 ..... 1010111 @r_vm_0
++vrol_vx     010101 . ..... ..... 100 ..... 1010111 @r_vm
-+vmerge_vim      010111 0 ..... ..... 011 ..... 1010111 @r_vm_0
++vror_vv     010100 . ..... ..... 000 ..... 1010111 @r_vm
++vror_vx     010100 . ..... ..... 100 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
++vror_vi     01010. . ..... ..... 011 ..... 1010111 @r2_zimm6
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
++vbrev8_v    010010 . ..... 01000 010 ..... 1010111 @r2_vm
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
++vrev8_v     010010 . ..... 01001 010 ..... 1010111 @r2_vm
 +vandn_vv    000001 . ..... ..... 000 ..... 1010111 @r_vm
 +vandn_vx    000001 . ..... ..... 100 ..... 1010111 @r_vm
 +vbrev_v     010010 . ..... 01010 010 ..... 1010111 @r2_vm
 +vclz_v      010010 . ..... 01100 010 ..... 1010111 @r2_vm
 +vctz_v      010010 . ..... 01101 010 ..... 1010111 @r2_vm
 +vcpop_v     010010 . ..... 01110 010 ..... 1010111 @r2_vm
 +vwsll_vv    110101 . ..... ..... 000 ..... 1010111 @r_vm
 +vwsll_vx    110101 . ..... ..... 100 ..... 1010111 @r_vm
 +vwsll_vi    110101 . ..... ..... 011 ..... 1010111 @r_vm
 diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
+--- a/target/riscv/cpu.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
++++ b/target/riscv/cpu.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPIVX_WIDEN_TRANS(vwmaccu_vx)
+@@ -XXX,XX +XXX,XX @@ static const struct isa_ext_data isa_edata_arr[] = {
- GEN_OPIVX_WIDEN_TRANS(vwmacc_vx)
+     ISA_EXT_DATA_ENTRY(zksed, PRIV_VERSION_1_12_0, ext_zksed),
- GEN_OPIVX_WIDEN_TRANS(vwmaccsu_vx)
+     ISA_EXT_DATA_ENTRY(zksh, PRIV_VERSION_1_12_0, ext_zksh),
- GEN_OPIVX_WIDEN_TRANS(vwmaccus_vx)
+     ISA_EXT_DATA_ENTRY(zkt, PRIV_VERSION_1_12_0, ext_zkt),
-+
++    ISA_EXT_DATA_ENTRY(zvbb, PRIV_VERSION_1_12_0, ext_zvbb),
-+/* Vector Integer Merge and Move Instructions */
+     ISA_EXT_DATA_ENTRY(zvbc, PRIV_VERSION_1_12_0, ext_zvbc),
-+static bool trans_vmv_v_v(DisasContext *s, arg_vmv_v_v *a)
+     ISA_EXT_DATA_ENTRY(zve32f, PRIV_VERSION_1_10_0, ext_zve32f),
      ISA_EXT_DATA_ENTRY(zve64f, PRIV_VERSION_1_10_0, ext_zve64f),
@@ -XXX,XX +XXX,XX @@ void riscv_cpu_validate_set_extensions(RISCVCPU *cpu, Error **errp)
          return;
      }
 +    /*
 +     * In principle Zve*x would also suffice here, were they supported
 +     * in qemu
 +     */
 +    if (cpu->cfg.ext_zvbb && !cpu->cfg.ext_zve32f) {
 +        error_setg(errp,
 +                   "Vector crypto extensions require V or Zve* extensions");
 +        return;
 +    }
 +
      if (cpu->cfg.ext_zvbc && !cpu->cfg.ext_zve64f) {
          error_setg(errp, "Zvbc extension requires V or Zve64{f,d} extensions");
          return;
@@ -XXX,XX +XXX,XX @@ static Property riscv_cpu_extensions[] = {
      DEFINE_PROP_BOOL("x-zvfbfwma", RISCVCPU, cfg.ext_zvfbfwma, false),
      /* Vector cryptography extensions */
 +    DEFINE_PROP_BOOL("x-zvbb", RISCVCPU, cfg.ext_zvbb, false),
      DEFINE_PROP_BOOL("x-zvbc", RISCVCPU, cfg.ext_zvbc, false),
      DEFINE_PROP_END_OF_LIST(),
 diff --git a/target/riscv/vcrypto_helper.c b/target/riscv/vcrypto_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vcrypto_helper.c
 +++ b/target/riscv/vcrypto_helper.c
@@ -XXX,XX +XXX,XX @@
  #include "qemu/osdep.h"
  #include "qemu/host-utils.h"
  #include "qemu/bitops.h"
 +#include "qemu/bswap.h"
  #include "cpu.h"
  #include "exec/memop.h"
  #include "exec/exec-all.h"
@@ -XXX,XX +XXX,XX @@ RVVCALL(OPIVV2, vclmulh_vv, OP_UUU_D, H8, H8, H8, clmulh64)
  GEN_VEXT_VV(vclmulh_vv, 8)
  RVVCALL(OPIVX2, vclmulh_vx, OP_UUU_D, H8, H8, clmulh64)
  GEN_VEXT_VX(vclmulh_vx, 8)
 +
 +RVVCALL(OPIVV2, vror_vv_b, OP_UUU_B, H1, H1, H1, ror8)
 +RVVCALL(OPIVV2, vror_vv_h, OP_UUU_H, H2, H2, H2, ror16)
 +RVVCALL(OPIVV2, vror_vv_w, OP_UUU_W, H4, H4, H4, ror32)
 +RVVCALL(OPIVV2, vror_vv_d, OP_UUU_D, H8, H8, H8, ror64)
 +GEN_VEXT_VV(vror_vv_b, 1)
 +GEN_VEXT_VV(vror_vv_h, 2)
 +GEN_VEXT_VV(vror_vv_w, 4)
 +GEN_VEXT_VV(vror_vv_d, 8)
 +
 +RVVCALL(OPIVX2, vror_vx_b, OP_UUU_B, H1, H1, ror8)
 +RVVCALL(OPIVX2, vror_vx_h, OP_UUU_H, H2, H2, ror16)
 +RVVCALL(OPIVX2, vror_vx_w, OP_UUU_W, H4, H4, ror32)
 +RVVCALL(OPIVX2, vror_vx_d, OP_UUU_D, H8, H8, ror64)
 +GEN_VEXT_VX(vror_vx_b, 1)
 +GEN_VEXT_VX(vror_vx_h, 2)
 +GEN_VEXT_VX(vror_vx_w, 4)
 +GEN_VEXT_VX(vror_vx_d, 8)
 +
 +RVVCALL(OPIVV2, vrol_vv_b, OP_UUU_B, H1, H1, H1, rol8)
 +RVVCALL(OPIVV2, vrol_vv_h, OP_UUU_H, H2, H2, H2, rol16)
 +RVVCALL(OPIVV2, vrol_vv_w, OP_UUU_W, H4, H4, H4, rol32)
 +RVVCALL(OPIVV2, vrol_vv_d, OP_UUU_D, H8, H8, H8, rol64)
 +GEN_VEXT_VV(vrol_vv_b, 1)
 +GEN_VEXT_VV(vrol_vv_h, 2)
 +GEN_VEXT_VV(vrol_vv_w, 4)
 +GEN_VEXT_VV(vrol_vv_d, 8)
 +
 +RVVCALL(OPIVX2, vrol_vx_b, OP_UUU_B, H1, H1, rol8)
 +RVVCALL(OPIVX2, vrol_vx_h, OP_UUU_H, H2, H2, rol16)
 +RVVCALL(OPIVX2, vrol_vx_w, OP_UUU_W, H4, H4, rol32)
 +RVVCALL(OPIVX2, vrol_vx_d, OP_UUU_D, H8, H8, rol64)
 +GEN_VEXT_VX(vrol_vx_b, 1)
 +GEN_VEXT_VX(vrol_vx_h, 2)
 +GEN_VEXT_VX(vrol_vx_w, 4)
 +GEN_VEXT_VX(vrol_vx_d, 8)
 +
 +static uint64_t brev8(uint64_t val)
 +{
-+    if (vext_check_isa_ill(s) &&
++    val = ((val & 0x5555555555555555ull) << 1) |
-+        vext_check_reg(s, a->rd, false) &&
++          ((val & 0xAAAAAAAAAAAAAAAAull) >> 1);
-+        vext_check_reg(s, a->rs1, false)) {
++    val = ((val & 0x3333333333333333ull) << 2) |
-+
++          ((val & 0xCCCCCCCCCCCCCCCCull) >> 2);
-+        if (s->vl_eq_vlmax) {
++    val = ((val & 0x0F0F0F0F0F0F0F0Full) << 4) |
-+            tcg_gen_gvec_mov(s->sew, vreg_ofs(s, a->rd),
++          ((val & 0xF0F0F0F0F0F0F0F0ull) >> 4);
-+                             vreg_ofs(s, a->rs1),
++
-+                             MAXSZ(s), MAXSZ(s));
++    return val;
 +        } else {
 +            uint32_t data = FIELD_DP32(0, VDATA, LMUL, s->lmul);
 +            static gen_helper_gvec_2_ptr * const fns[4] = {
 +                gen_helper_vmv_v_v_b, gen_helper_vmv_v_v_h,
 +                gen_helper_vmv_v_v_w, gen_helper_vmv_v_v_d,
 +            };
 +            TCGLabel *over = gen_new_label();
 +            tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +
 +            tcg_gen_gvec_2_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, a->rs1),
 +                               cpu_env, 0, s->vlen / 8, data, fns[s->sew]);
 +            gen_set_label(over);
 +        }
 +        return true;
 +    }
 +    return false;
 +}
 +
-+typedef void gen_helper_vmv_vx(TCGv_ptr, TCGv_i64, TCGv_env, TCGv_i32);
++RVVCALL(OPIVV1, vbrev8_v_b, OP_UU_B, H1, H1, brev8)
-+static bool trans_vmv_v_x(DisasContext *s, arg_vmv_v_x *a)
++RVVCALL(OPIVV1, vbrev8_v_h, OP_UU_H, H2, H2, brev8)
 +RVVCALL(OPIVV1, vbrev8_v_w, OP_UU_W, H4, H4, brev8)
 +RVVCALL(OPIVV1, vbrev8_v_d, OP_UU_D, H8, H8, brev8)
 +GEN_VEXT_V(vbrev8_v_b, 1)
 +GEN_VEXT_V(vbrev8_v_h, 2)
 +GEN_VEXT_V(vbrev8_v_w, 4)
 +GEN_VEXT_V(vbrev8_v_d, 8)
 +
 +#define DO_IDENTITY(a) (a)
 +RVVCALL(OPIVV1, vrev8_v_b, OP_UU_B, H1, H1, DO_IDENTITY)
 +RVVCALL(OPIVV1, vrev8_v_h, OP_UU_H, H2, H2, bswap16)
 +RVVCALL(OPIVV1, vrev8_v_w, OP_UU_W, H4, H4, bswap32)
 +RVVCALL(OPIVV1, vrev8_v_d, OP_UU_D, H8, H8, bswap64)
 +GEN_VEXT_V(vrev8_v_b, 1)
 +GEN_VEXT_V(vrev8_v_h, 2)
 +GEN_VEXT_V(vrev8_v_w, 4)
 +GEN_VEXT_V(vrev8_v_d, 8)
 +
 +#define DO_ANDN(a, b) ((a) & ~(b))
 +RVVCALL(OPIVV2, vandn_vv_b, OP_UUU_B, H1, H1, H1, DO_ANDN)
 +RVVCALL(OPIVV2, vandn_vv_h, OP_UUU_H, H2, H2, H2, DO_ANDN)
 +RVVCALL(OPIVV2, vandn_vv_w, OP_UUU_W, H4, H4, H4, DO_ANDN)
 +RVVCALL(OPIVV2, vandn_vv_d, OP_UUU_D, H8, H8, H8, DO_ANDN)
 +GEN_VEXT_VV(vandn_vv_b, 1)
 +GEN_VEXT_VV(vandn_vv_h, 2)
 +GEN_VEXT_VV(vandn_vv_w, 4)
 +GEN_VEXT_VV(vandn_vv_d, 8)
 +
 +RVVCALL(OPIVX2, vandn_vx_b, OP_UUU_B, H1, H1, DO_ANDN)
 +RVVCALL(OPIVX2, vandn_vx_h, OP_UUU_H, H2, H2, DO_ANDN)
 +RVVCALL(OPIVX2, vandn_vx_w, OP_UUU_W, H4, H4, DO_ANDN)
 +RVVCALL(OPIVX2, vandn_vx_d, OP_UUU_D, H8, H8, DO_ANDN)
 +GEN_VEXT_VX(vandn_vx_b, 1)
 +GEN_VEXT_VX(vandn_vx_h, 2)
 +GEN_VEXT_VX(vandn_vx_w, 4)
 +GEN_VEXT_VX(vandn_vx_d, 8)
 +
 +RVVCALL(OPIVV1, vbrev_v_b, OP_UU_B, H1, H1, revbit8)
 +RVVCALL(OPIVV1, vbrev_v_h, OP_UU_H, H2, H2, revbit16)
 +RVVCALL(OPIVV1, vbrev_v_w, OP_UU_W, H4, H4, revbit32)
 +RVVCALL(OPIVV1, vbrev_v_d, OP_UU_D, H8, H8, revbit64)
 +GEN_VEXT_V(vbrev_v_b, 1)
 +GEN_VEXT_V(vbrev_v_h, 2)
 +GEN_VEXT_V(vbrev_v_w, 4)
 +GEN_VEXT_V(vbrev_v_d, 8)
 +
 +RVVCALL(OPIVV1, vclz_v_b, OP_UU_B, H1, H1, clz8)
 +RVVCALL(OPIVV1, vclz_v_h, OP_UU_H, H2, H2, clz16)
 +RVVCALL(OPIVV1, vclz_v_w, OP_UU_W, H4, H4, clz32)
 +RVVCALL(OPIVV1, vclz_v_d, OP_UU_D, H8, H8, clz64)
 +GEN_VEXT_V(vclz_v_b, 1)
 +GEN_VEXT_V(vclz_v_h, 2)
 +GEN_VEXT_V(vclz_v_w, 4)
 +GEN_VEXT_V(vclz_v_d, 8)
 +
 +RVVCALL(OPIVV1, vctz_v_b, OP_UU_B, H1, H1, ctz8)
 +RVVCALL(OPIVV1, vctz_v_h, OP_UU_H, H2, H2, ctz16)
 +RVVCALL(OPIVV1, vctz_v_w, OP_UU_W, H4, H4, ctz32)
 +RVVCALL(OPIVV1, vctz_v_d, OP_UU_D, H8, H8, ctz64)
 +GEN_VEXT_V(vctz_v_b, 1)
 +GEN_VEXT_V(vctz_v_h, 2)
 +GEN_VEXT_V(vctz_v_w, 4)
 +GEN_VEXT_V(vctz_v_d, 8)
 +
 +RVVCALL(OPIVV1, vcpop_v_b, OP_UU_B, H1, H1, ctpop8)
 +RVVCALL(OPIVV1, vcpop_v_h, OP_UU_H, H2, H2, ctpop16)
 +RVVCALL(OPIVV1, vcpop_v_w, OP_UU_W, H4, H4, ctpop32)
 +RVVCALL(OPIVV1, vcpop_v_d, OP_UU_D, H8, H8, ctpop64)
 +GEN_VEXT_V(vcpop_v_b, 1)
 +GEN_VEXT_V(vcpop_v_h, 2)
 +GEN_VEXT_V(vcpop_v_w, 4)
 +GEN_VEXT_V(vcpop_v_d, 8)
 +
 +#define DO_SLL(N, M) (N << (M & (sizeof(N) * 8 - 1)))
 +RVVCALL(OPIVV2, vwsll_vv_b, WOP_UUU_B, H2, H1, H1, DO_SLL)
 +RVVCALL(OPIVV2, vwsll_vv_h, WOP_UUU_H, H4, H2, H2, DO_SLL)
 +RVVCALL(OPIVV2, vwsll_vv_w, WOP_UUU_W, H8, H4, H4, DO_SLL)
 +GEN_VEXT_VV(vwsll_vv_b, 2)
 +GEN_VEXT_VV(vwsll_vv_h, 4)
 +GEN_VEXT_VV(vwsll_vv_w, 8)
 +
 +RVVCALL(OPIVX2, vwsll_vx_b, WOP_UUU_B, H2, H1, DO_SLL)
 +RVVCALL(OPIVX2, vwsll_vx_h, WOP_UUU_H, H4, H2, DO_SLL)
 +RVVCALL(OPIVX2, vwsll_vx_w, WOP_UUU_W, H8, H4, DO_SLL)
 +GEN_VEXT_VX(vwsll_vx_b, 2)
 +GEN_VEXT_VX(vwsll_vx_h, 4)
 +GEN_VEXT_VX(vwsll_vx_w, 8)
 diff --git a/target/riscv/insn_trans/trans_rvvk.c.inc b/target/riscv/insn_trans/trans_rvvk.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvvk.c.inc
 +++ b/target/riscv/insn_trans/trans_rvvk.c.inc
@@ -XXX,XX +XXX,XX @@ static bool vclmul_vx_check(DisasContext *s, arg_rmrr *a)
  GEN_VX_MASKED_TRANS(vclmul_vx, vclmul_vx_check)
  GEN_VX_MASKED_TRANS(vclmulh_vx, vclmul_vx_check)
 +
 +/*
 + * Zvbb
 + */
 +
 +#define GEN_OPIVI_GVEC_TRANS_CHECK(NAME, IMM_MODE, OPIVX, SUF, CHECK)   \
 +    static bool trans_##NAME(DisasContext *s, arg_rmrr *a)              \
 +    {                                                                   \
 +        if (CHECK(s, a)) {                                              \
 +            static gen_helper_opivx *const fns[4] = {                   \
 +                gen_helper_##OPIVX##_b,                                 \
 +                gen_helper_##OPIVX##_h,                                 \
 +                gen_helper_##OPIVX##_w,                                 \
 +                gen_helper_##OPIVX##_d,                                 \
 +            };                                                          \
 +            return do_opivi_gvec(s, a, tcg_gen_gvec_##SUF, fns[s->sew], \
 +                                 IMM_MODE);                             \
 +        }                                                               \
 +        return false;                                                   \
 +    }
 +
 +#define GEN_OPIVV_GVEC_TRANS_CHECK(NAME, SUF, CHECK)                     \
 +    static bool trans_##NAME(DisasContext *s, arg_rmrr *a)               \
 +    {                                                                    \
 +        if (CHECK(s, a)) {                                               \
 +            static gen_helper_gvec_4_ptr *const fns[4] = {               \
 +                gen_helper_##NAME##_b,                                   \
 +                gen_helper_##NAME##_h,                                   \
 +                gen_helper_##NAME##_w,                                   \
 +                gen_helper_##NAME##_d,                                   \
 +            };                                                           \
 +            return do_opivv_gvec(s, a, tcg_gen_gvec_##SUF, fns[s->sew]); \
 +        }                                                                \
 +        return false;                                                    \
 +    }
 +
 +#define GEN_OPIVX_GVEC_SHIFT_TRANS_CHECK(NAME, SUF, CHECK)       \
 +    static bool trans_##NAME(DisasContext *s, arg_rmrr *a)       \
 +    {                                                            \
 +        if (CHECK(s, a)) {                                       \
 +            static gen_helper_opivx *const fns[4] = {            \
 +                gen_helper_##NAME##_b,                           \
 +                gen_helper_##NAME##_h,                           \
 +                gen_helper_##NAME##_w,                           \
 +                gen_helper_##NAME##_d,                           \
 +            };                                                   \
 +            return do_opivx_gvec_shift(s, a, tcg_gen_gvec_##SUF, \
 +                                       fns[s->sew]);             \
 +        }                                                        \
 +        return false;                                            \
 +    }
 +
 +static bool zvbb_vv_check(DisasContext *s, arg_rmrr *a)
 +{
-+    if (vext_check_isa_ill(s) &&
++    return opivv_check(s, a) && s->cfg_ptr->ext_zvbb == true;
 +        vext_check_reg(s, a->rd, false)) {
 +
 +        TCGv s1;
 +        TCGLabel *over = gen_new_label();
 +        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +
 +        s1 = tcg_temp_new();
 +        gen_get_gpr(s1, a->rs1);
 +
 +        if (s->vl_eq_vlmax) {
 +            tcg_gen_gvec_dup_tl(s->sew, vreg_ofs(s, a->rd),
 +                                MAXSZ(s), MAXSZ(s), s1);
 +        } else {
 +            TCGv_i32 desc ;
 +            TCGv_i64 s1_i64 = tcg_temp_new_i64();
 +            TCGv_ptr dest = tcg_temp_new_ptr();
 +            uint32_t data = FIELD_DP32(0, VDATA, LMUL, s->lmul);
 +            static gen_helper_vmv_vx * const fns[4] = {
 +                gen_helper_vmv_v_x_b, gen_helper_vmv_v_x_h,
 +                gen_helper_vmv_v_x_w, gen_helper_vmv_v_x_d,
 +            };
 +
 +            tcg_gen_ext_tl_i64(s1_i64, s1);
 +            desc = tcg_const_i32(simd_desc(0, s->vlen / 8, data));
 +            tcg_gen_addi_ptr(dest, cpu_env, vreg_ofs(s, a->rd));
 +            fns[s->sew](dest, s1_i64, cpu_env, desc);
 +
 +            tcg_temp_free_ptr(dest);
 +            tcg_temp_free_i32(desc);
 +            tcg_temp_free_i64(s1_i64);
 +        }
 +
 +        tcg_temp_free(s1);
 +        gen_set_label(over);
 +        return true;
 +    }
 +    return false;
 +}
 +
-+static bool trans_vmv_v_i(DisasContext *s, arg_vmv_v_i *a)
++static bool zvbb_vx_check(DisasContext *s, arg_rmrr *a)
 +{
-+    if (vext_check_isa_ill(s) &&
++    return opivx_check(s, a) && s->cfg_ptr->ext_zvbb == true;
 +        vext_check_reg(s, a->rd, false)) {
 +
 +        int64_t simm = sextract64(a->rs1, 0, 5);
 +        if (s->vl_eq_vlmax) {
 +            tcg_gen_gvec_dup_imm(s->sew, vreg_ofs(s, a->rd),
 +                                 MAXSZ(s), MAXSZ(s), simm);
 +        } else {
 +            TCGv_i32 desc;
 +            TCGv_i64 s1;
 +            TCGv_ptr dest;
 +            uint32_t data = FIELD_DP32(0, VDATA, LMUL, s->lmul);
 +            static gen_helper_vmv_vx * const fns[4] = {
 +                gen_helper_vmv_v_x_b, gen_helper_vmv_v_x_h,
 +                gen_helper_vmv_v_x_w, gen_helper_vmv_v_x_d,
 +            };
 +            TCGLabel *over = gen_new_label();
 +            tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +
 +            s1 = tcg_const_i64(simm);
 +            dest = tcg_temp_new_ptr();
 +            desc = tcg_const_i32(simd_desc(0, s->vlen / 8, data));
 +            tcg_gen_addi_ptr(dest, cpu_env, vreg_ofs(s, a->rd));
 +            fns[s->sew](dest, s1, cpu_env, desc);
 +
 +            tcg_temp_free_ptr(dest);
 +            tcg_temp_free_i32(desc);
 +            tcg_temp_free_i64(s1);
 +            gen_set_label(over);
 +        }
 +        return true;
 +    }
 +    return false;
 +}
 +
-+GEN_OPIVV_TRANS(vmerge_vvm, opivv_vadc_check)
++/* vrol.v[vx] */
-+GEN_OPIVX_TRANS(vmerge_vxm, opivx_vadc_check)
++GEN_OPIVV_GVEC_TRANS_CHECK(vrol_vv, rotlv, zvbb_vv_check)
-+GEN_OPIVI_TRANS(vmerge_vim, 0, vmerge_vxm, opivx_vadc_check)
++GEN_OPIVX_GVEC_SHIFT_TRANS_CHECK(vrol_vx, rotls, zvbb_vx_check)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
++
-index XXXXXXX..XXXXXXX 100644
++/* vror.v[vxi] */
---- a/target/riscv/vector_helper.c
++GEN_OPIVV_GVEC_TRANS_CHECK(vror_vv, rotrv, zvbb_vv_check)
-+++ b/target/riscv/vector_helper.c
++GEN_OPIVX_GVEC_SHIFT_TRANS_CHECK(vror_vx, rotrs, zvbb_vx_check)
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VX(vwmaccsu_vx_w, 4, 8, clearq)
++GEN_OPIVI_GVEC_TRANS_CHECK(vror_vi, IMM_TRUNC_SEW, vror_vx, rotri, zvbb_vx_check)
- GEN_VEXT_VX(vwmaccus_vx_b, 1, 2, clearh)
++
- GEN_VEXT_VX(vwmaccus_vx_h, 2, 4, clearl)
++#define GEN_OPIVX_GVEC_TRANS_CHECK(NAME, SUF, CHECK)                     \
- GEN_VEXT_VX(vwmaccus_vx_w, 4, 8, clearq)
++    static bool trans_##NAME(DisasContext *s, arg_rmrr *a)               \
-+
++    {                                                                    \
-+/* Vector Integer Merge and Move Instructions */
++        if (CHECK(s, a)) {                                               \
-+#define GEN_VEXT_VMV_VV(NAME, ETYPE, H, CLEAR_FN)                    \
++            static gen_helper_opivx *const fns[4] = {                    \
-+void HELPER(NAME)(void *vd, void *vs1, CPURISCVState *env,           \
++                gen_helper_##NAME##_b,                                   \
-+                  uint32_t desc)                                     \
++                gen_helper_##NAME##_h,                                   \
-+{                                                                    \
++                gen_helper_##NAME##_w,                                   \
-+    uint32_t vl = env->vl;                                           \
++                gen_helper_##NAME##_d,                                   \
-+    uint32_t esz = sizeof(ETYPE);                                    \
++            };                                                           \
-+    uint32_t vlmax = vext_maxsz(desc) / esz;                         \
++            return do_opivx_gvec(s, a, tcg_gen_gvec_##SUF, fns[s->sew]); \
-+    uint32_t i;                                                      \
++        }                                                                \
-+                                                                     \
++        return false;                                                    \
-+    for (i = 0; i < vl; i++) {                                       \
++    }
-+        ETYPE s1 = *((ETYPE *)vs1 + H(i));                           \
++
-+        *((ETYPE *)vd + H(i)) = s1;                                  \
++/* vandn.v[vx] */
-+    }                                                                \
++GEN_OPIVV_GVEC_TRANS_CHECK(vandn_vv, andc, zvbb_vv_check)
-+    CLEAR_FN(vd, vl, vl * esz, vlmax * esz);                         \
++GEN_OPIVX_GVEC_TRANS_CHECK(vandn_vx, andcs, zvbb_vx_check)
 +
 +#define GEN_OPIV_TRANS(NAME, CHECK)                                        \
 +    static bool trans_##NAME(DisasContext *s, arg_rmr *a)                  \
 +    {                                                                      \
 +        if (CHECK(s, a)) {                                                 \
 +            uint32_t data = 0;                                             \
 +            static gen_helper_gvec_3_ptr *const fns[4] = {                 \
 +                gen_helper_##NAME##_b,                                     \
 +                gen_helper_##NAME##_h,                                     \
 +                gen_helper_##NAME##_w,                                     \
 +                gen_helper_##NAME##_d,                                     \
 +            };                                                             \
 +            TCGLabel *over = gen_new_label();                              \
 +            tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);     \
 +                                                                           \
 +            data = FIELD_DP32(data, VDATA, VM, a->vm);                     \
 +            data = FIELD_DP32(data, VDATA, LMUL, s->lmul);                 \
 +            data = FIELD_DP32(data, VDATA, VTA, s->vta);                   \
 +            data = FIELD_DP32(data, VDATA, VTA_ALL_1S, s->cfg_vta_all_1s); \
 +            data = FIELD_DP32(data, VDATA, VMA, s->vma);                   \
 +            tcg_gen_gvec_3_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),         \
 +                               vreg_ofs(s, a->rs2), cpu_env,               \
 +                               s->cfg_ptr->vlen / 8, s->cfg_ptr->vlen / 8, \
 +                               data, fns[s->sew]);                         \
 +            mark_vs_dirty(s);                                              \
 +            gen_set_label(over);                                           \
 +            return true;                                                   \
 +        }                                                                  \
 +        return false;                                                      \
 +    }
 +
 +static bool zvbb_opiv_check(DisasContext *s, arg_rmr *a)
 +{
 +    return s->cfg_ptr->ext_zvbb == true &&
 +           require_rvv(s) &&
 +           vext_check_isa_ill(s) &&
 +           vext_check_ss(s, a->rd, a->rs2, a->vm);
 +}
 +
-+GEN_VEXT_VMV_VV(vmv_v_v_b, int8_t,  H1, clearb)
++GEN_OPIV_TRANS(vbrev8_v, zvbb_opiv_check)
-+GEN_VEXT_VMV_VV(vmv_v_v_h, int16_t, H2, clearh)
++GEN_OPIV_TRANS(vrev8_v, zvbb_opiv_check)
-+GEN_VEXT_VMV_VV(vmv_v_v_w, int32_t, H4, clearl)
++GEN_OPIV_TRANS(vbrev_v, zvbb_opiv_check)
-+GEN_VEXT_VMV_VV(vmv_v_v_d, int64_t, H8, clearq)
++GEN_OPIV_TRANS(vclz_v, zvbb_opiv_check)
-+
++GEN_OPIV_TRANS(vctz_v, zvbb_opiv_check)
-+#define GEN_VEXT_VMV_VX(NAME, ETYPE, H, CLEAR_FN)                    \
++GEN_OPIV_TRANS(vcpop_v, zvbb_opiv_check)
-+void HELPER(NAME)(void *vd, uint64_t s1, CPURISCVState *env,         \
++
-+                  uint32_t desc)                                     \
++static bool vwsll_vv_check(DisasContext *s, arg_rmrr *a)
-+{                                                                    \
++{
-+    uint32_t vl = env->vl;                                           \
++    return s->cfg_ptr->ext_zvbb && opivv_widen_check(s, a);
 +    uint32_t esz = sizeof(ETYPE);                                    \
 +    uint32_t vlmax = vext_maxsz(desc) / esz;                         \
 +    uint32_t i;                                                      \
 +                                                                     \
 +    for (i = 0; i < vl; i++) {                                       \
 +        *((ETYPE *)vd + H(i)) = (ETYPE)s1;                           \
 +    }                                                                \
 +    CLEAR_FN(vd, vl, vl * esz, vlmax * esz);                         \
 +}
 +
-+GEN_VEXT_VMV_VX(vmv_v_x_b, int8_t,  H1, clearb)
++static bool vwsll_vx_check(DisasContext *s, arg_rmrr *a)
-+GEN_VEXT_VMV_VX(vmv_v_x_h, int16_t, H2, clearh)
++{
-+GEN_VEXT_VMV_VX(vmv_v_x_w, int32_t, H4, clearl)
++    return s->cfg_ptr->ext_zvbb && opivx_widen_check(s, a);
 +GEN_VEXT_VMV_VX(vmv_v_x_d, int64_t, H8, clearq)
 +
 +#define GEN_VEXT_VMERGE_VV(NAME, ETYPE, H, CLEAR_FN)                 \
 +void HELPER(NAME)(void *vd, void *v0, void *vs1, void *vs2,          \
 +                  CPURISCVState *env, uint32_t desc)                 \
 +{                                                                    \
 +    uint32_t mlen = vext_mlen(desc);                                 \
 +    uint32_t vl = env->vl;                                           \
 +    uint32_t esz = sizeof(ETYPE);                                    \
 +    uint32_t vlmax = vext_maxsz(desc) / esz;                         \
 +    uint32_t i;                                                      \
 +                                                                     \
 +    for (i = 0; i < vl; i++) {                                       \
 +        ETYPE *vt = (!vext_elem_mask(v0, mlen, i) ? vs2 : vs1);      \
 +        *((ETYPE *)vd + H(i)) = *(vt + H(i));                        \
 +    }                                                                \
 +    CLEAR_FN(vd, vl, vl * esz, vlmax * esz);                         \
 +}
 +
-+GEN_VEXT_VMERGE_VV(vmerge_vvm_b, int8_t,  H1, clearb)
++/* OPIVI without GVEC IR */
-+GEN_VEXT_VMERGE_VV(vmerge_vvm_h, int16_t, H2, clearh)
++#define GEN_OPIVI_WIDEN_TRANS(NAME, IMM_MODE, OPIVX, CHECK)                  \
-+GEN_VEXT_VMERGE_VV(vmerge_vvm_w, int32_t, H4, clearl)
++    static bool trans_##NAME(DisasContext *s, arg_rmrr *a)                   \
-+GEN_VEXT_VMERGE_VV(vmerge_vvm_d, int64_t, H8, clearq)
++    {                                                                        \
-+
++        if (CHECK(s, a)) {                                                   \
-+#define GEN_VEXT_VMERGE_VX(NAME, ETYPE, H, CLEAR_FN)                 \
++            static gen_helper_opivx *const fns[3] = {                        \
-+void HELPER(NAME)(void *vd, void *v0, target_ulong s1,               \
++                gen_helper_##OPIVX##_b,                                      \
-+                  void *vs2, CPURISCVState *env, uint32_t desc)      \
++                gen_helper_##OPIVX##_h,                                      \
-+{                                                                    \
++                gen_helper_##OPIVX##_w,                                      \
-+    uint32_t mlen = vext_mlen(desc);                                 \
++            };                                                               \
-+    uint32_t vl = env->vl;                                           \
++            return opivi_trans(a->rd, a->rs1, a->rs2, a->vm, fns[s->sew], s, \
-+    uint32_t esz = sizeof(ETYPE);                                    \
++                               IMM_MODE);                                    \
-+    uint32_t vlmax = vext_maxsz(desc) / esz;                         \
++        }                                                                    \
-+    uint32_t i;                                                      \
++        return false;                                                        \
-+                                                                     \
++    }
-+    for (i = 0; i < vl; i++) {                                       \
++
-+        ETYPE s2 = *((ETYPE *)vs2 + H(i));                           \
++GEN_OPIVV_WIDEN_TRANS(vwsll_vv, vwsll_vv_check)
-+        ETYPE d = (!vext_elem_mask(v0, mlen, i) ? s2 :               \
++GEN_OPIVX_WIDEN_TRANS(vwsll_vx, vwsll_vx_check)
-+                   (ETYPE)(target_long)s1);                          \
++GEN_OPIVI_WIDEN_TRANS(vwsll_vi, IMM_ZX, vwsll_vx, vwsll_vx_check)
 +        *((ETYPE *)vd + H(i)) = d;                                   \
 +    }                                                                \
 +    CLEAR_FN(vd, vl, vl * esz, vlmax * esz);                         \
 +}
 +
 +GEN_VEXT_VMERGE_VX(vmerge_vxm_b, int8_t,  H1, clearb)
 +GEN_VEXT_VMERGE_VX(vmerge_vxm_h, int16_t, H2, clearh)
 +GEN_VEXT_VMERGE_VX(vmerge_vxm_w, int32_t, H4, clearl)
 +GEN_VEXT_VMERGE_VX(vmerge_vxm_d, int64_t, H8, clearq)
 --
-.27.0
+.41.0

-[PULL 08/63] target/riscv: add vector stride load and store instructions
+[PULL v2 16/45] target/riscv: Add Zvkned ISA extension support
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Nazar Kazakov <nazar.kazakov@codethink.co.uk>
-Vector strided operations access the first memory element at the base address,
+This commit adds support for the Zvkned vector-crypto extension, which
-and then access subsequent elements at address increments given by the byte
+consists of the following instructions:
 offset contained in the x register specified by rs2.
-Vector unit-stride operations access elements stored contiguously in memory
+* vaesef.[vv,vs]
-starting from the base effective address. It can been seen as a special
+* vaesdf.[vv,vs]
-case of strided operations.
+* vaesdm.[vv,vs]
 * vaesz.vs
 * vaesem.[vv,vs]
 * vaeskf1.vi
 * vaeskf2.vi
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Translation functions are defined in
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+`target/riscv/insn_trans/trans_rvvk.c.inc` and helpers are defined in
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+`target/riscv/vcrypto_helper.c`.
-Message-id: 20200623215920.2594-7-zhiwei_liu@c-sky.com
 Co-authored-by: Lawrence Hunter <lawrence.hunter@codethink.co.uk>
 Co-authored-by: William Salmon <will.salmon@codethink.co.uk>
 [max.chou@sifive.com: Replaced vstart checking by TCG op]
 Signed-off-by: Lawrence Hunter <lawrence.hunter@codethink.co.uk>
 Signed-off-by: William Salmon <will.salmon@codethink.co.uk>
 Signed-off-by: Nazar Kazakov <nazar.kazakov@codethink.co.uk>
 Signed-off-by: Max Chou <max.chou@sifive.com>
 Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 [max.chou@sifive.com: Imported aes-round.h and exposed x-zvkned
 property]
 [max.chou@sifive.com: Fixed endian issues and replaced the vstart & vl
 egs checking by helper function]
 [max.chou@sifive.com: Replaced bswap32 calls in aes key expanding]
 Message-ID: <20230711165917.2629866-10-max.chou@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   | 105 ++++++
+ target/riscv/cpu_cfg.h                   |   1 +
- target/riscv/internals.h                |   5 +
+ target/riscv/helper.h                    |  14 ++
- target/riscv/insn32.decode              |  32 ++
+ target/riscv/insn32.decode               |  14 ++
- target/riscv/insn_trans/trans_rvv.inc.c | 355 ++++++++++++++++++++
+ target/riscv/cpu.c                       |   4 +-
- target/riscv/translate.c                |   7 +
+ target/riscv/vcrypto_helper.c            | 202 +++++++++++++++++++++++
- target/riscv/vector_helper.c            | 410 ++++++++++++++++++++++++
+ target/riscv/insn_trans/trans_rvvk.c.inc | 147 +++++++++++++++++
-files changed, 914 insertions(+)
+files changed, 381 insertions(+), 1 deletion(-)
+diff --git a/target/riscv/cpu_cfg.h b/target/riscv/cpu_cfg.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/cpu_cfg.h
++++ b/target/riscv/cpu_cfg.h
+@@ -XXX,XX +XXX,XX @@ struct RISCVCPUConfig {
+     bool ext_zve64d;
+     bool ext_zvbb;
+     bool ext_zvbc;
++    bool ext_zvkned;
+     bool ext_zmmul;
+     bool ext_zvfbfmin;
+     bool ext_zvfbfwma;
 diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/helper.h
 +++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_1(hyp_tlb_flush, void, env)
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vandn_vx_b, void, ptr, ptr, tl, ptr, env, i32)
+ DEF_HELPER_6(vandn_vx_h, void, ptr, ptr, tl, ptr, env, i32)
- /* Vector functions */
+ DEF_HELPER_6(vandn_vx_w, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_3(vsetvl, tl, env, tl, tl)
+ DEF_HELPER_6(vandn_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_5(vlb_v_b, void, ptr, ptr, tl, env, i32)
++
-+DEF_HELPER_5(vlb_v_b_mask, void, ptr, ptr, tl, env, i32)
++DEF_HELPER_2(egs_check, void, i32, env)
-+DEF_HELPER_5(vlb_v_h, void, ptr, ptr, tl, env, i32)
++
-+DEF_HELPER_5(vlb_v_h_mask, void, ptr, ptr, tl, env, i32)
++DEF_HELPER_4(vaesef_vv, void, ptr, ptr, env, i32)
-+DEF_HELPER_5(vlb_v_w, void, ptr, ptr, tl, env, i32)
++DEF_HELPER_4(vaesef_vs, void, ptr, ptr, env, i32)
-+DEF_HELPER_5(vlb_v_w_mask, void, ptr, ptr, tl, env, i32)
++DEF_HELPER_4(vaesdf_vv, void, ptr, ptr, env, i32)
-+DEF_HELPER_5(vlb_v_d, void, ptr, ptr, tl, env, i32)
++DEF_HELPER_4(vaesdf_vs, void, ptr, ptr, env, i32)
-+DEF_HELPER_5(vlb_v_d_mask, void, ptr, ptr, tl, env, i32)
++DEF_HELPER_4(vaesem_vv, void, ptr, ptr, env, i32)
-+DEF_HELPER_5(vlh_v_h, void, ptr, ptr, tl, env, i32)
++DEF_HELPER_4(vaesem_vs, void, ptr, ptr, env, i32)
-+DEF_HELPER_5(vlh_v_h_mask, void, ptr, ptr, tl, env, i32)
++DEF_HELPER_4(vaesdm_vv, void, ptr, ptr, env, i32)
-+DEF_HELPER_5(vlh_v_w, void, ptr, ptr, tl, env, i32)
++DEF_HELPER_4(vaesdm_vs, void, ptr, ptr, env, i32)
-+DEF_HELPER_5(vlh_v_w_mask, void, ptr, ptr, tl, env, i32)
++DEF_HELPER_4(vaesz_vs, void, ptr, ptr, env, i32)
-+DEF_HELPER_5(vlh_v_d, void, ptr, ptr, tl, env, i32)
++DEF_HELPER_5(vaeskf1_vi, void, ptr, ptr, i32, env, i32)
-+DEF_HELPER_5(vlh_v_d_mask, void, ptr, ptr, tl, env, i32)
++DEF_HELPER_5(vaeskf2_vi, void, ptr, ptr, i32, env, i32)
 +DEF_HELPER_5(vlw_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlw_v_w_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlw_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlw_v_d_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vle_v_b, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vle_v_b_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vle_v_h, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vle_v_h_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vle_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vle_v_w_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vle_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vle_v_d_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlbu_v_b, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlbu_v_b_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlbu_v_h, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlbu_v_h_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlbu_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlbu_v_w_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlbu_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlbu_v_d_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlhu_v_h, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlhu_v_h_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlhu_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlhu_v_w_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlhu_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlhu_v_d_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlwu_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlwu_v_w_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlwu_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlwu_v_d_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsb_v_b, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsb_v_b_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsb_v_h, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsb_v_h_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsb_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsb_v_w_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsb_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsb_v_d_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsh_v_h, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsh_v_h_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsh_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsh_v_w_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsh_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsh_v_d_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsw_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsw_v_w_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsw_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vsw_v_d_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vse_v_b, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vse_v_b_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vse_v_h, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vse_v_h_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vse_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vse_v_w_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vse_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vse_v_d_mask, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_6(vlsb_v_b, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlsb_v_h, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlsb_v_w, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlsb_v_d, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlsh_v_h, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlsh_v_w, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlsh_v_d, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlsw_v_w, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlsw_v_d, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlse_v_b, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlse_v_h, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlse_v_w, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlse_v_d, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlsbu_v_b, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlsbu_v_h, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlsbu_v_w, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlsbu_v_d, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlshu_v_h, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlshu_v_w, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlshu_v_d, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlswu_v_w, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vlswu_v_d, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vssb_v_b, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vssb_v_h, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vssb_v_w, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vssb_v_d, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vssh_v_h, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vssh_v_w, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vssh_v_d, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vssw_v_w, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vssw_v_d, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vsse_v_b, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vsse_v_h, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vsse_v_w, void, ptr, ptr, tl, tl, env, i32)
 +DEF_HELPER_6(vsse_v_d, void, ptr, ptr, tl, tl, env, i32)
 diff --git a/target/riscv/internals.h b/target/riscv/internals.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/internals.h
 +++ b/target/riscv/internals.h
@@ -XXX,XX +XXX,XX @@
  #include "hw/registerfields.h"
 +/* share data between vector helpers and decode code */
 +FIELD(VDATA, MLEN, 0, 8)
 +FIELD(VDATA, VM, 8, 1)
 +FIELD(VDATA, LMUL, 9, 2)
 +FIELD(VDATA, NF, 11, 4)
  #endif
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
 @@ -XXX,XX +XXX,XX @@
- %sh10    20:10
- %csr    20:12
- %rm     12:3
-+%nf     29:3                     !function=ex_plus_1
- # immediates:
- %imm_i    20:s12
-@@ -XXX,XX +XXX,XX @@
- &u    imm rd
- &shift     shamt rs1 rd
- &atomic    aq rl rs2 rs1 rd
-+&r2nfvm    vm rd rs1 nf
-+&rnfvm     vm rd rs1 rs2 nf
- # Formats 32:
- @r       .......   ..... ..... ... ..... ....... &r                %rs2 %rs1 %rd
-@@ -XXX,XX +XXX,XX @@
  @r_rm    .......   ..... ..... ... ..... ....... %rs2 %rs1 %rm %rd
  @r2_rm   .......   ..... ..... ... ..... ....... %rs1 %rm %rd
- @r2      .......   ..... ..... ... ..... ....... %rs1 %rd
+ @r2      .......   ..... ..... ... ..... ....... &r2 %rs1 %rd
-+@r2_nfvm ... ... vm:1 ..... ..... ... ..... ....... &r2nfvm %nf %rs1 %rd
++@r2_vm_1 ...... . ..... ..... ... ..... ....... &rmr vm=1 %rs2 %rd
-+@r_nfvm  ... ... vm:1 ..... ..... ... ..... ....... &rnfvm %nf %rs2 %rs1 %rd
+ @r2_nfvm ... ... vm:1 ..... ..... ... ..... ....... &r2nfvm %nf %rs1 %rd
- @r2_zimm . zimm:11  ..... ... ..... ....... %rs1 %rd
+ @r2_vm   ...... vm:1 ..... ..... ... ..... ....... &rmr %rs2 %rd
+ @r1_vm   ...... vm:1 ..... ..... ... ..... ....... %rd
- @hfence_gvma ....... ..... .....   ... ..... ....... %rs2 %rs1
+@@ -XXX,XX +XXX,XX @@ vcpop_v     010010 . ..... 01110 010 ..... 1010111 @r2_vm
-@@ -XXX,XX +XXX,XX @@ hfence_gvma 0110001  .....  ..... 000 00000 1110011 @hfence_gvma
+ vwsll_vv    110101 . ..... ..... 000 ..... 1010111 @r_vm
- hfence_vvma 0010001  .....  ..... 000 00000 1110011 @hfence_vvma
+ vwsll_vx    110101 . ..... ..... 100 ..... 1010111 @r_vm
+ vwsll_vi    110101 . ..... ..... 011 ..... 1010111 @r_vm
- # *** RV32V Extension ***
++
-+
++# *** Zvkned vector crypto extension ***
-+# *** Vector loads and stores are encoded within LOADFP/STORE-FP ***
++vaesef_vv   101000 1 ..... 00011 010 ..... 1110111 @r2_vm_1
-+vlb_v      ... 100 . 00000 ..... 000 ..... 0000111 @r2_nfvm
++vaesef_vs   101001 1 ..... 00011 010 ..... 1110111 @r2_vm_1
-+vlh_v      ... 100 . 00000 ..... 101 ..... 0000111 @r2_nfvm
++vaesdf_vv   101000 1 ..... 00001 010 ..... 1110111 @r2_vm_1
-+vlw_v      ... 100 . 00000 ..... 110 ..... 0000111 @r2_nfvm
++vaesdf_vs   101001 1 ..... 00001 010 ..... 1110111 @r2_vm_1
-+vle_v      ... 000 . 00000 ..... 111 ..... 0000111 @r2_nfvm
++vaesem_vv   101000 1 ..... 00010 010 ..... 1110111 @r2_vm_1
-+vlbu_v     ... 000 . 00000 ..... 000 ..... 0000111 @r2_nfvm
++vaesem_vs   101001 1 ..... 00010 010 ..... 1110111 @r2_vm_1
-+vlhu_v     ... 000 . 00000 ..... 101 ..... 0000111 @r2_nfvm
++vaesdm_vv   101000 1 ..... 00000 010 ..... 1110111 @r2_vm_1
-+vlwu_v     ... 000 . 00000 ..... 110 ..... 0000111 @r2_nfvm
++vaesdm_vs   101001 1 ..... 00000 010 ..... 1110111 @r2_vm_1
-+vsb_v      ... 000 . 00000 ..... 000 ..... 0100111 @r2_nfvm
++vaesz_vs    101001 1 ..... 00111 010 ..... 1110111 @r2_vm_1
-+vsh_v      ... 000 . 00000 ..... 101 ..... 0100111 @r2_nfvm
++vaeskf1_vi  100010 1 ..... ..... 010 ..... 1110111 @r_vm_1
-+vsw_v      ... 000 . 00000 ..... 110 ..... 0100111 @r2_nfvm
++vaeskf2_vi  101010 1 ..... ..... 010 ..... 1110111 @r_vm_1
-+vse_v      ... 000 . 00000 ..... 111 ..... 0100111 @r2_nfvm
+diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
 +
 +vlsb_v     ... 110 . ..... ..... 000 ..... 0000111 @r_nfvm
 +vlsh_v     ... 110 . ..... ..... 101 ..... 0000111 @r_nfvm
 +vlsw_v     ... 110 . ..... ..... 110 ..... 0000111 @r_nfvm
 +vlse_v     ... 010 . ..... ..... 111 ..... 0000111 @r_nfvm
 +vlsbu_v    ... 010 . ..... ..... 000 ..... 0000111 @r_nfvm
 +vlshu_v    ... 010 . ..... ..... 101 ..... 0000111 @r_nfvm
 +vlswu_v    ... 010 . ..... ..... 110 ..... 0000111 @r_nfvm
 +vssb_v     ... 010 . ..... ..... 000 ..... 0100111 @r_nfvm
 +vssh_v     ... 010 . ..... ..... 101 ..... 0100111 @r_nfvm
 +vssw_v     ... 010 . ..... ..... 110 ..... 0100111 @r_nfvm
 +vsse_v     ... 010 . ..... ..... 111 ..... 0100111 @r_nfvm
 +
 +# *** new major opcode OP-V ***
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
+--- a/target/riscv/cpu.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
++++ b/target/riscv/cpu.c
@@ -XXX,XX +XXX,XX @@ static const struct isa_ext_data isa_edata_arr[] = {
      ISA_EXT_DATA_ENTRY(zvfbfwma, PRIV_VERSION_1_12_0, ext_zvfbfwma),
      ISA_EXT_DATA_ENTRY(zvfh, PRIV_VERSION_1_12_0, ext_zvfh),
      ISA_EXT_DATA_ENTRY(zvfhmin, PRIV_VERSION_1_12_0, ext_zvfhmin),
 +    ISA_EXT_DATA_ENTRY(zvkned, PRIV_VERSION_1_12_0, ext_zvkned),
      ISA_EXT_DATA_ENTRY(zhinx, PRIV_VERSION_1_12_0, ext_zhinx),
      ISA_EXT_DATA_ENTRY(zhinxmin, PRIV_VERSION_1_12_0, ext_zhinxmin),
      ISA_EXT_DATA_ENTRY(smaia, PRIV_VERSION_1_12_0, ext_smaia),
@@ -XXX,XX +XXX,XX @@ void riscv_cpu_validate_set_extensions(RISCVCPU *cpu, Error **errp)
       * In principle Zve*x would also suffice here, were they supported
       * in qemu
       */
 -    if (cpu->cfg.ext_zvbb && !cpu->cfg.ext_zve32f) {
 +    if ((cpu->cfg.ext_zvbb || cpu->cfg.ext_zvkned) && !cpu->cfg.ext_zve32f) {
          error_setg(errp,
                     "Vector crypto extensions require V or Zve* extensions");
          return;
@@ -XXX,XX +XXX,XX @@ static Property riscv_cpu_extensions[] = {
      /* Vector cryptography extensions */
      DEFINE_PROP_BOOL("x-zvbb", RISCVCPU, cfg.ext_zvbb, false),
      DEFINE_PROP_BOOL("x-zvbc", RISCVCPU, cfg.ext_zvbc, false),
 +    DEFINE_PROP_BOOL("x-zvkned", RISCVCPU, cfg.ext_zvkned, false),
      DEFINE_PROP_END_OF_LIST(),
  };
 diff --git a/target/riscv/vcrypto_helper.c b/target/riscv/vcrypto_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vcrypto_helper.c
 +++ b/target/riscv/vcrypto_helper.c
 @@ -XXX,XX +XXX,XX @@
-  * You should have received a copy of the GNU General Public License along with
+ #include "qemu/bitops.h"
-  * this program.  If not, see <http://www.gnu.org/licenses/>.
+ #include "qemu/bswap.h"
   */
 +#include "tcg/tcg-op-gvec.h"
 +#include "tcg/tcg-gvec-desc.h"
 +#include "internals.h"
  static bool trans_vsetvl(DisasContext *ctx, arg_vsetvl *a)
  {
@@ -XXX,XX +XXX,XX @@ static bool trans_vsetvli(DisasContext *ctx, arg_vsetvli *a)
      tcg_temp_free(dst);
      return true;
  }
 +
 +/* vector register offset from env */
 +static uint32_t vreg_ofs(DisasContext *s, int reg)
 +{
 +    return offsetof(CPURISCVState, vreg) + reg * s->vlen / 8;
 +}
 +
 +/* check functions */
 +
 +/*
 + * In cpu_get_tb_cpu_state(), set VILL if RVV was not present.
 + * So RVV is also be checked in this function.
 + */
 +static bool vext_check_isa_ill(DisasContext *s)
 +{
 +    return !s->vill;
 +}
 +
 +/*
 + * There are two rules check here.
 + *
 + * 1. Vector register numbers are multiples of LMUL. (Section 3.2)
 + *
 + * 2. For all widening instructions, the destination LMUL value must also be
 + *    a supported LMUL value. (Section 11.2)
 + */
 +static bool vext_check_reg(DisasContext *s, uint32_t reg, bool widen)
 +{
 +    /*
 +     * The destination vector register group results are arranged as if both
 +     * SEW and LMUL were at twice their current settings. (Section 11.2).
 +     */
 +    int legal = widen ? 2 << s->lmul : 1 << s->lmul;
 +
 +    return !((s->lmul == 0x3 && widen) || (reg % legal));
 +}
 +
 +/*
 + * There are two rules check here.
 + *
 + * 1. The destination vector register group for a masked vector instruction can
 + *    only overlap the source mask register (v0) when LMUL=1. (Section 5.3)
 + *
 + * 2. In widen instructions and some other insturctions, like vslideup.vx,
 + *    there is no need to check whether LMUL=1.
 + */
 +static bool vext_check_overlap_mask(DisasContext *s, uint32_t vd, bool vm,
 +    bool force)
 +{
 +    return (vm != 0 || vd != 0) || (!force && (s->lmul == 0));
 +}
 +
 +/* The LMUL setting must be such that LMUL * NFIELDS <= 8. (Section 7.8) */
 +static bool vext_check_nf(DisasContext *s, uint32_t nf)
 +{
 +    return (1 << s->lmul) * nf <= 8;
 +}
 +
 +/* common translation macro */
 +#define GEN_VEXT_TRANS(NAME, SEQ, ARGTYPE, OP, CHECK)      \
 +static bool trans_##NAME(DisasContext *s, arg_##ARGTYPE *a)\
 +{                                                          \
 +    if (CHECK(s, a)) {                                     \
 +        return OP(s, a, SEQ);                              \
 +    }                                                      \
 +    return false;                                          \
 +}
 +
 +/*
 + *** unit stride load and store
 + */
 +typedef void gen_helper_ldst_us(TCGv_ptr, TCGv_ptr, TCGv,
 +                                TCGv_env, TCGv_i32);
 +
 +static bool ldst_us_trans(uint32_t vd, uint32_t rs1, uint32_t data,
 +                          gen_helper_ldst_us *fn, DisasContext *s)
 +{
 +    TCGv_ptr dest, mask;
 +    TCGv base;
 +    TCGv_i32 desc;
 +
 +    TCGLabel *over = gen_new_label();
 +    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +
 +    dest = tcg_temp_new_ptr();
 +    mask = tcg_temp_new_ptr();
 +    base = tcg_temp_new();
 +
 +    /*
 +     * As simd_desc supports at most 256 bytes, and in this implementation,
 +     * the max vector group length is 2048 bytes. So split it into two parts.
 +     *
 +     * The first part is vlen in bytes, encoded in maxsz of simd_desc.
 +     * The second part is lmul, encoded in data of simd_desc.
 +     */
 +    desc = tcg_const_i32(simd_desc(0, s->vlen / 8, data));
 +
 +    gen_get_gpr(base, rs1);
 +    tcg_gen_addi_ptr(dest, cpu_env, vreg_ofs(s, vd));
 +    tcg_gen_addi_ptr(mask, cpu_env, vreg_ofs(s, 0));
 +
 +    fn(dest, mask, base, cpu_env, desc);
 +
 +    tcg_temp_free_ptr(dest);
 +    tcg_temp_free_ptr(mask);
 +    tcg_temp_free(base);
 +    tcg_temp_free_i32(desc);
 +    gen_set_label(over);
 +    return true;
 +}
 +
 +static bool ld_us_op(DisasContext *s, arg_r2nfvm *a, uint8_t seq)
 +{
 +    uint32_t data = 0;
 +    gen_helper_ldst_us *fn;
 +    static gen_helper_ldst_us * const fns[2][7][4] = {
 +        /* masked unit stride load */
 +        { { gen_helper_vlb_v_b_mask,  gen_helper_vlb_v_h_mask,
 +            gen_helper_vlb_v_w_mask,  gen_helper_vlb_v_d_mask },
 +          { NULL,                     gen_helper_vlh_v_h_mask,
 +            gen_helper_vlh_v_w_mask,  gen_helper_vlh_v_d_mask },
 +          { NULL,                     NULL,
 +            gen_helper_vlw_v_w_mask,  gen_helper_vlw_v_d_mask },
 +          { gen_helper_vle_v_b_mask,  gen_helper_vle_v_h_mask,
 +            gen_helper_vle_v_w_mask,  gen_helper_vle_v_d_mask },
 +          { gen_helper_vlbu_v_b_mask, gen_helper_vlbu_v_h_mask,
 +            gen_helper_vlbu_v_w_mask, gen_helper_vlbu_v_d_mask },
 +          { NULL,                     gen_helper_vlhu_v_h_mask,
 +            gen_helper_vlhu_v_w_mask, gen_helper_vlhu_v_d_mask },
 +          { NULL,                     NULL,
 +            gen_helper_vlwu_v_w_mask, gen_helper_vlwu_v_d_mask } },
 +        /* unmasked unit stride load */
 +        { { gen_helper_vlb_v_b,  gen_helper_vlb_v_h,
 +            gen_helper_vlb_v_w,  gen_helper_vlb_v_d },
 +          { NULL,                gen_helper_vlh_v_h,
 +            gen_helper_vlh_v_w,  gen_helper_vlh_v_d },
 +          { NULL,                NULL,
 +            gen_helper_vlw_v_w,  gen_helper_vlw_v_d },
 +          { gen_helper_vle_v_b,  gen_helper_vle_v_h,
 +            gen_helper_vle_v_w,  gen_helper_vle_v_d },
 +          { gen_helper_vlbu_v_b, gen_helper_vlbu_v_h,
 +            gen_helper_vlbu_v_w, gen_helper_vlbu_v_d },
 +          { NULL,                gen_helper_vlhu_v_h,
 +            gen_helper_vlhu_v_w, gen_helper_vlhu_v_d },
 +          { NULL,                NULL,
 +            gen_helper_vlwu_v_w, gen_helper_vlwu_v_d } }
 +    };
 +
 +    fn =  fns[a->vm][seq][s->sew];
 +    if (fn == NULL) {
 +        return false;
 +    }
 +
 +    data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
 +    data = FIELD_DP32(data, VDATA, VM, a->vm);
 +    data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
 +    data = FIELD_DP32(data, VDATA, NF, a->nf);
 +    return ldst_us_trans(a->rd, a->rs1, data, fn, s);
 +}
 +
 +static bool ld_us_check(DisasContext *s, arg_r2nfvm* a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_overlap_mask(s, a->rd, a->vm, false) &&
 +            vext_check_reg(s, a->rd, false) &&
 +            vext_check_nf(s, a->nf));
 +}
 +
 +GEN_VEXT_TRANS(vlb_v, 0, r2nfvm, ld_us_op, ld_us_check)
 +GEN_VEXT_TRANS(vlh_v, 1, r2nfvm, ld_us_op, ld_us_check)
 +GEN_VEXT_TRANS(vlw_v, 2, r2nfvm, ld_us_op, ld_us_check)
 +GEN_VEXT_TRANS(vle_v, 3, r2nfvm, ld_us_op, ld_us_check)
 +GEN_VEXT_TRANS(vlbu_v, 4, r2nfvm, ld_us_op, ld_us_check)
 +GEN_VEXT_TRANS(vlhu_v, 5, r2nfvm, ld_us_op, ld_us_check)
 +GEN_VEXT_TRANS(vlwu_v, 6, r2nfvm, ld_us_op, ld_us_check)
 +
 +static bool st_us_op(DisasContext *s, arg_r2nfvm *a, uint8_t seq)
 +{
 +    uint32_t data = 0;
 +    gen_helper_ldst_us *fn;
 +    static gen_helper_ldst_us * const fns[2][4][4] = {
 +        /* masked unit stride load and store */
 +        { { gen_helper_vsb_v_b_mask,  gen_helper_vsb_v_h_mask,
 +            gen_helper_vsb_v_w_mask,  gen_helper_vsb_v_d_mask },
 +          { NULL,                     gen_helper_vsh_v_h_mask,
 +            gen_helper_vsh_v_w_mask,  gen_helper_vsh_v_d_mask },
 +          { NULL,                     NULL,
 +            gen_helper_vsw_v_w_mask,  gen_helper_vsw_v_d_mask },
 +          { gen_helper_vse_v_b_mask,  gen_helper_vse_v_h_mask,
 +            gen_helper_vse_v_w_mask,  gen_helper_vse_v_d_mask } },
 +        /* unmasked unit stride store */
 +        { { gen_helper_vsb_v_b,  gen_helper_vsb_v_h,
 +            gen_helper_vsb_v_w,  gen_helper_vsb_v_d },
 +          { NULL,                gen_helper_vsh_v_h,
 +            gen_helper_vsh_v_w,  gen_helper_vsh_v_d },
 +          { NULL,                NULL,
 +            gen_helper_vsw_v_w,  gen_helper_vsw_v_d },
 +          { gen_helper_vse_v_b,  gen_helper_vse_v_h,
 +            gen_helper_vse_v_w,  gen_helper_vse_v_d } }
 +    };
 +
 +    fn =  fns[a->vm][seq][s->sew];
 +    if (fn == NULL) {
 +        return false;
 +    }
 +
 +    data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
 +    data = FIELD_DP32(data, VDATA, VM, a->vm);
 +    data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
 +    data = FIELD_DP32(data, VDATA, NF, a->nf);
 +    return ldst_us_trans(a->rd, a->rs1, data, fn, s);
 +}
 +
 +static bool st_us_check(DisasContext *s, arg_r2nfvm* a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_reg(s, a->rd, false) &&
 +            vext_check_nf(s, a->nf));
 +}
 +
 +GEN_VEXT_TRANS(vsb_v, 0, r2nfvm, st_us_op, st_us_check)
 +GEN_VEXT_TRANS(vsh_v, 1, r2nfvm, st_us_op, st_us_check)
 +GEN_VEXT_TRANS(vsw_v, 2, r2nfvm, st_us_op, st_us_check)
 +GEN_VEXT_TRANS(vse_v, 3, r2nfvm, st_us_op, st_us_check)
 +
 +/*
 + *** stride load and store
 + */
 +typedef void gen_helper_ldst_stride(TCGv_ptr, TCGv_ptr, TCGv,
 +                                    TCGv, TCGv_env, TCGv_i32);
 +
 +static bool ldst_stride_trans(uint32_t vd, uint32_t rs1, uint32_t rs2,
 +                              uint32_t data, gen_helper_ldst_stride *fn,
 +                              DisasContext *s)
 +{
 +    TCGv_ptr dest, mask;
 +    TCGv base, stride;
 +    TCGv_i32 desc;
 +
 +    TCGLabel *over = gen_new_label();
 +    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +
 +    dest = tcg_temp_new_ptr();
 +    mask = tcg_temp_new_ptr();
 +    base = tcg_temp_new();
 +    stride = tcg_temp_new();
 +    desc = tcg_const_i32(simd_desc(0, s->vlen / 8, data));
 +
 +    gen_get_gpr(base, rs1);
 +    gen_get_gpr(stride, rs2);
 +    tcg_gen_addi_ptr(dest, cpu_env, vreg_ofs(s, vd));
 +    tcg_gen_addi_ptr(mask, cpu_env, vreg_ofs(s, 0));
 +
 +    fn(dest, mask, base, stride, cpu_env, desc);
 +
 +    tcg_temp_free_ptr(dest);
 +    tcg_temp_free_ptr(mask);
 +    tcg_temp_free(base);
 +    tcg_temp_free(stride);
 +    tcg_temp_free_i32(desc);
 +    gen_set_label(over);
 +    return true;
 +}
 +
 +static bool ld_stride_op(DisasContext *s, arg_rnfvm *a, uint8_t seq)
 +{
 +    uint32_t data = 0;
 +    gen_helper_ldst_stride *fn;
 +    static gen_helper_ldst_stride * const fns[7][4] = {
 +        { gen_helper_vlsb_v_b,  gen_helper_vlsb_v_h,
 +          gen_helper_vlsb_v_w,  gen_helper_vlsb_v_d },
 +        { NULL,                 gen_helper_vlsh_v_h,
 +          gen_helper_vlsh_v_w,  gen_helper_vlsh_v_d },
 +        { NULL,                 NULL,
 +          gen_helper_vlsw_v_w,  gen_helper_vlsw_v_d },
 +        { gen_helper_vlse_v_b,  gen_helper_vlse_v_h,
 +          gen_helper_vlse_v_w,  gen_helper_vlse_v_d },
 +        { gen_helper_vlsbu_v_b, gen_helper_vlsbu_v_h,
 +          gen_helper_vlsbu_v_w, gen_helper_vlsbu_v_d },
 +        { NULL,                 gen_helper_vlshu_v_h,
 +          gen_helper_vlshu_v_w, gen_helper_vlshu_v_d },
 +        { NULL,                 NULL,
 +          gen_helper_vlswu_v_w, gen_helper_vlswu_v_d },
 +    };
 +
 +    fn =  fns[seq][s->sew];
 +    if (fn == NULL) {
 +        return false;
 +    }
 +
 +    data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
 +    data = FIELD_DP32(data, VDATA, VM, a->vm);
 +    data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
 +    data = FIELD_DP32(data, VDATA, NF, a->nf);
 +    return ldst_stride_trans(a->rd, a->rs1, a->rs2, data, fn, s);
 +}
 +
 +static bool ld_stride_check(DisasContext *s, arg_rnfvm* a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_overlap_mask(s, a->rd, a->vm, false) &&
 +            vext_check_reg(s, a->rd, false) &&
 +            vext_check_nf(s, a->nf));
 +}
 +
 +GEN_VEXT_TRANS(vlsb_v, 0, rnfvm, ld_stride_op, ld_stride_check)
 +GEN_VEXT_TRANS(vlsh_v, 1, rnfvm, ld_stride_op, ld_stride_check)
 +GEN_VEXT_TRANS(vlsw_v, 2, rnfvm, ld_stride_op, ld_stride_check)
 +GEN_VEXT_TRANS(vlse_v, 3, rnfvm, ld_stride_op, ld_stride_check)
 +GEN_VEXT_TRANS(vlsbu_v, 4, rnfvm, ld_stride_op, ld_stride_check)
 +GEN_VEXT_TRANS(vlshu_v, 5, rnfvm, ld_stride_op, ld_stride_check)
 +GEN_VEXT_TRANS(vlswu_v, 6, rnfvm, ld_stride_op, ld_stride_check)
 +
 +static bool st_stride_op(DisasContext *s, arg_rnfvm *a, uint8_t seq)
 +{
 +    uint32_t data = 0;
 +    gen_helper_ldst_stride *fn;
 +    static gen_helper_ldst_stride * const fns[4][4] = {
 +        /* masked stride store */
 +        { gen_helper_vssb_v_b,  gen_helper_vssb_v_h,
 +          gen_helper_vssb_v_w,  gen_helper_vssb_v_d },
 +        { NULL,                 gen_helper_vssh_v_h,
 +          gen_helper_vssh_v_w,  gen_helper_vssh_v_d },
 +        { NULL,                 NULL,
 +          gen_helper_vssw_v_w,  gen_helper_vssw_v_d },
 +        { gen_helper_vsse_v_b,  gen_helper_vsse_v_h,
 +          gen_helper_vsse_v_w,  gen_helper_vsse_v_d }
 +    };
 +
 +    data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
 +    data = FIELD_DP32(data, VDATA, VM, a->vm);
 +    data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
 +    data = FIELD_DP32(data, VDATA, NF, a->nf);
 +    fn =  fns[seq][s->sew];
 +    if (fn == NULL) {
 +        return false;
 +    }
 +
 +    return ldst_stride_trans(a->rd, a->rs1, a->rs2, data, fn, s);
 +}
 +
 +static bool st_stride_check(DisasContext *s, arg_rnfvm* a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_reg(s, a->rd, false) &&
 +            vext_check_nf(s, a->nf));
 +}
 +
 +GEN_VEXT_TRANS(vssb_v, 0, rnfvm, st_stride_op, st_stride_check)
 +GEN_VEXT_TRANS(vssh_v, 1, rnfvm, st_stride_op, st_stride_check)
 +GEN_VEXT_TRANS(vssw_v, 2, rnfvm, st_stride_op, st_stride_check)
 +GEN_VEXT_TRANS(vsse_v, 3, rnfvm, st_stride_op, st_stride_check)
 diff --git a/target/riscv/translate.c b/target/riscv/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/translate.c
 +++ b/target/riscv/translate.c
@@ -XXX,XX +XXX,XX @@ typedef struct DisasContext {
      uint8_t lmul;
      uint8_t sew;
      uint16_t vlen;
 +    uint16_t mlen;
      bool vl_eq_vlmax;
  } DisasContext;
@@ -XXX,XX +XXX,XX @@ static void decode_RV32_64C(DisasContext *ctx, uint16_t opcode)
      }
  }
 +static int ex_plus_1(DisasContext *ctx, int nf)
 +{
 +    return nf + 1;
 +}
 +
  #define EX_SH(amount) \
      static int ex_shift_##amount(DisasContext *ctx, int imm) \
      {                                         \
@@ -XXX,XX +XXX,XX @@ static void riscv_tr_init_disas_context(DisasContextBase *dcbase, CPUState *cs)
      ctx->vill = FIELD_EX32(tb_flags, TB_FLAGS, VILL);
      ctx->sew = FIELD_EX32(tb_flags, TB_FLAGS, SEW);
      ctx->lmul = FIELD_EX32(tb_flags, TB_FLAGS, LMUL);
 +    ctx->mlen = 1 << (ctx->sew  + 3 - ctx->lmul);
      ctx->vl_eq_vlmax = FIELD_EX32(tb_flags, TB_FLAGS, VL_EQ_VLMAX);
  }
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@
  #include "qemu/osdep.h"
  #include "cpu.h"
-+#include "exec/memop.h"
++#include "crypto/aes.h"
 +#include "crypto/aes-round.h"
  #include "exec/memop.h"
  #include "exec/exec-all.h"
  #include "exec/helper-proto.h"
-+#include "tcg/tcg-gvec-desc.h"
+@@ -XXX,XX +XXX,XX @@ RVVCALL(OPIVX2, vwsll_vx_w, WOP_UUU_W, H8, H4, DO_SLL)
-+#include "internals.h"
+ GEN_VEXT_VX(vwsll_vx_b, 2)
- #include <math.h>
+ GEN_VEXT_VX(vwsll_vx_h, 4)
+ GEN_VEXT_VX(vwsll_vx_w, 8)
- target_ulong HELPER(vsetvl)(CPURISCVState *env, target_ulong s1,
++
-@@ -XXX,XX +XXX,XX @@ target_ulong HELPER(vsetvl)(CPURISCVState *env, target_ulong s1,
++void HELPER(egs_check)(uint32_t egs, CPURISCVState *env)
-     env->vstart = 0;
++{
-     return vl;
++    uint32_t vl = env->vl;
- }
++    uint32_t vstart = env->vstart;
 +
 +    if (vl % egs != 0 || vstart % egs != 0) {
 +        riscv_raise_exception(env, RISCV_EXCP_ILLEGAL_INST, GETPC());
 +    }
 +}
 +
 +static inline void xor_round_key(AESState *round_state, AESState *round_key)
 +{
 +    round_state->v = round_state->v ^ round_key->v;
 +}
 +
 +#define GEN_ZVKNED_HELPER_VV(NAME, ...)                                   \
 +    void HELPER(NAME)(void *vd, void *vs2, CPURISCVState *env,            \
 +                      uint32_t desc)                                      \
 +    {                                                                     \
 +        uint32_t vl = env->vl;                                            \
 +        uint32_t total_elems = vext_get_total_elems(env, desc, 4);        \
 +        uint32_t vta = vext_vta(desc);                                    \
 +                                                                          \
 +        for (uint32_t i = env->vstart / 4; i < env->vl / 4; i++) {        \
 +            AESState round_key;                                           \
 +            round_key.d[0] = *((uint64_t *)vs2 + H8(i * 2 + 0));          \
 +            round_key.d[1] = *((uint64_t *)vs2 + H8(i * 2 + 1));          \
 +            AESState round_state;                                         \
 +            round_state.d[0] = *((uint64_t *)vd + H8(i * 2 + 0));         \
 +            round_state.d[1] = *((uint64_t *)vd + H8(i * 2 + 1));         \
 +            __VA_ARGS__;                                                  \
 +            *((uint64_t *)vd + H8(i * 2 + 0)) = round_state.d[0];         \
 +            *((uint64_t *)vd + H8(i * 2 + 1)) = round_state.d[1];         \
 +        }                                                                 \
 +        env->vstart = 0;                                                  \
 +        /* set tail elements to 1s */                                     \
 +        vext_set_elems_1s(vd, vta, vl * 4, total_elems * 4);              \
 +    }
 +
 +#define GEN_ZVKNED_HELPER_VS(NAME, ...)                                   \
 +    void HELPER(NAME)(void *vd, void *vs2, CPURISCVState *env,            \
 +                      uint32_t desc)                                      \
 +    {                                                                     \
 +        uint32_t vl = env->vl;                                            \
 +        uint32_t total_elems = vext_get_total_elems(env, desc, 4);        \
 +        uint32_t vta = vext_vta(desc);                                    \
 +                                                                          \
 +        for (uint32_t i = env->vstart / 4; i < env->vl / 4; i++) {        \
 +            AESState round_key;                                           \
 +            round_key.d[0] = *((uint64_t *)vs2 + H8(0));                  \
 +            round_key.d[1] = *((uint64_t *)vs2 + H8(1));                  \
 +            AESState round_state;                                         \
 +            round_state.d[0] = *((uint64_t *)vd + H8(i * 2 + 0));         \
 +            round_state.d[1] = *((uint64_t *)vd + H8(i * 2 + 1));         \
 +            __VA_ARGS__;                                                  \
 +            *((uint64_t *)vd + H8(i * 2 + 0)) = round_state.d[0];         \
 +            *((uint64_t *)vd + H8(i * 2 + 1)) = round_state.d[1];         \
 +        }                                                                 \
 +        env->vstart = 0;                                                  \
 +        /* set tail elements to 1s */                                     \
 +        vext_set_elems_1s(vd, vta, vl * 4, total_elems * 4);              \
 +    }
 +
 +GEN_ZVKNED_HELPER_VV(vaesef_vv, aesenc_SB_SR_AK(&round_state,
 +                                                &round_state,
 +                                                &round_key,
 +                                                false);)
 +GEN_ZVKNED_HELPER_VS(vaesef_vs, aesenc_SB_SR_AK(&round_state,
 +                                                &round_state,
 +                                                &round_key,
 +                                                false);)
 +GEN_ZVKNED_HELPER_VV(vaesdf_vv, aesdec_ISB_ISR_AK(&round_state,
 +                                                  &round_state,
 +                                                  &round_key,
 +                                                  false);)
 +GEN_ZVKNED_HELPER_VS(vaesdf_vs, aesdec_ISB_ISR_AK(&round_state,
 +                                                  &round_state,
 +                                                  &round_key,
 +                                                  false);)
 +GEN_ZVKNED_HELPER_VV(vaesem_vv, aesenc_SB_SR_MC_AK(&round_state,
 +                                                   &round_state,
 +                                                   &round_key,
 +                                                   false);)
 +GEN_ZVKNED_HELPER_VS(vaesem_vs, aesenc_SB_SR_MC_AK(&round_state,
 +                                                   &round_state,
 +                                                   &round_key,
 +                                                   false);)
 +GEN_ZVKNED_HELPER_VV(vaesdm_vv, aesdec_ISB_ISR_AK_IMC(&round_state,
 +                                                      &round_state,
 +                                                      &round_key,
 +                                                      false);)
 +GEN_ZVKNED_HELPER_VS(vaesdm_vs, aesdec_ISB_ISR_AK_IMC(&round_state,
 +                                                      &round_state,
 +                                                      &round_key,
 +                                                      false);)
 +GEN_ZVKNED_HELPER_VS(vaesz_vs, xor_round_key(&round_state, &round_key);)
 +
 +void HELPER(vaeskf1_vi)(void *vd_vptr, void *vs2_vptr, uint32_t uimm,
 +                        CPURISCVState *env, uint32_t desc)
 +{
 +    uint32_t *vd = vd_vptr;
 +    uint32_t *vs2 = vs2_vptr;
 +    uint32_t vl = env->vl;
 +    uint32_t total_elems = vext_get_total_elems(env, desc, 4);
 +    uint32_t vta = vext_vta(desc);
 +
 +    uimm &= 0b1111;
 +    if (uimm > 10 || uimm == 0) {
 +        uimm ^= 0b1000;
 +    }
 +
 +    for (uint32_t i = env->vstart / 4; i < env->vl / 4; i++) {
 +        uint32_t rk[8], tmp;
 +        static const uint32_t rcon[] = {
 +            0x00000001, 0x00000002, 0x00000004, 0x00000008, 0x00000010,
 +            0x00000020, 0x00000040, 0x00000080, 0x0000001B, 0x00000036,
 +        };
 +
 +        rk[0] = vs2[i * 4 + H4(0)];
 +        rk[1] = vs2[i * 4 + H4(1)];
 +        rk[2] = vs2[i * 4 + H4(2)];
 +        rk[3] = vs2[i * 4 + H4(3)];
 +        tmp = ror32(rk[3], 8);
 +
 +        rk[4] = rk[0] ^ (((uint32_t)AES_sbox[(tmp >> 24) & 0xff] << 24) |
 +                         ((uint32_t)AES_sbox[(tmp >> 16) & 0xff] << 16) |
 +                         ((uint32_t)AES_sbox[(tmp >> 8) & 0xff] << 8) |
 +                         ((uint32_t)AES_sbox[(tmp >> 0) & 0xff] << 0))
 +                      ^ rcon[uimm - 1];
 +        rk[5] = rk[1] ^ rk[4];
 +        rk[6] = rk[2] ^ rk[5];
 +        rk[7] = rk[3] ^ rk[6];
 +
 +        vd[i * 4 + H4(0)] = rk[4];
 +        vd[i * 4 + H4(1)] = rk[5];
 +        vd[i * 4 + H4(2)] = rk[6];
 +        vd[i * 4 + H4(3)] = rk[7];
 +    }
 +    env->vstart = 0;
 +    /* set tail elements to 1s */
 +    vext_set_elems_1s(vd, vta, vl * 4, total_elems * 4);
 +}
 +
 +void HELPER(vaeskf2_vi)(void *vd_vptr, void *vs2_vptr, uint32_t uimm,
 +                        CPURISCVState *env, uint32_t desc)
 +{
 +    uint32_t *vd = vd_vptr;
 +    uint32_t *vs2 = vs2_vptr;
 +    uint32_t vl = env->vl;
 +    uint32_t total_elems = vext_get_total_elems(env, desc, 4);
 +    uint32_t vta = vext_vta(desc);
 +
 +    uimm &= 0b1111;
 +    if (uimm > 14 || uimm < 2) {
 +        uimm ^= 0b1000;
 +    }
 +
 +    for (uint32_t i = env->vstart / 4; i < env->vl / 4; i++) {
 +        uint32_t rk[12], tmp;
 +        static const uint32_t rcon[] = {
 +            0x00000001, 0x00000002, 0x00000004, 0x00000008, 0x00000010,
 +            0x00000020, 0x00000040, 0x00000080, 0x0000001B, 0x00000036,
 +        };
 +
 +        rk[0] = vd[i * 4 + H4(0)];
 +        rk[1] = vd[i * 4 + H4(1)];
 +        rk[2] = vd[i * 4 + H4(2)];
 +        rk[3] = vd[i * 4 + H4(3)];
 +        rk[4] = vs2[i * 4 + H4(0)];
 +        rk[5] = vs2[i * 4 + H4(1)];
 +        rk[6] = vs2[i * 4 + H4(2)];
 +        rk[7] = vs2[i * 4 + H4(3)];
 +
 +        if (uimm % 2 == 0) {
 +            tmp = ror32(rk[7], 8);
 +            rk[8] = rk[0] ^ (((uint32_t)AES_sbox[(tmp >> 24) & 0xff] << 24) |
 +                             ((uint32_t)AES_sbox[(tmp >> 16) & 0xff] << 16) |
 +                             ((uint32_t)AES_sbox[(tmp >> 8) & 0xff] << 8) |
 +                             ((uint32_t)AES_sbox[(tmp >> 0) & 0xff] << 0))
 +                          ^ rcon[(uimm - 1) / 2];
 +        } else {
 +            rk[8] = rk[0] ^ (((uint32_t)AES_sbox[(rk[7] >> 24) & 0xff] << 24) |
 +                             ((uint32_t)AES_sbox[(rk[7] >> 16) & 0xff] << 16) |
 +                             ((uint32_t)AES_sbox[(rk[7] >> 8) & 0xff] << 8) |
 +                             ((uint32_t)AES_sbox[(rk[7] >> 0) & 0xff] << 0));
 +        }
 +        rk[9] = rk[1] ^ rk[8];
 +        rk[10] = rk[2] ^ rk[9];
 +        rk[11] = rk[3] ^ rk[10];
 +
 +        vd[i * 4 + H4(0)] = rk[8];
 +        vd[i * 4 + H4(1)] = rk[9];
 +        vd[i * 4 + H4(2)] = rk[10];
 +        vd[i * 4 + H4(3)] = rk[11];
 +    }
 +    env->vstart = 0;
 +    /* set tail elements to 1s */
 +    vext_set_elems_1s(vd, vta, vl * 4, total_elems * 4);
 +}
 diff --git a/target/riscv/insn_trans/trans_rvvk.c.inc b/target/riscv/insn_trans/trans_rvvk.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvvk.c.inc
 +++ b/target/riscv/insn_trans/trans_rvvk.c.inc
@@ -XXX,XX +XXX,XX @@ static bool vwsll_vx_check(DisasContext *s, arg_rmrr *a)
  GEN_OPIVV_WIDEN_TRANS(vwsll_vv, vwsll_vv_check)
  GEN_OPIVX_WIDEN_TRANS(vwsll_vx, vwsll_vx_check)
  GEN_OPIVI_WIDEN_TRANS(vwsll_vi, IMM_ZX, vwsll_vx, vwsll_vx_check)
 +
 +/*
-+ * Note that vector data is stored in host-endian 64-bit chunks,
++ * Zvkned
 + * so addressing units smaller than that needs a host-endian fixup.
 + */
-+#ifdef HOST_WORDS_BIGENDIAN
++
-+#define H1(x)   ((x) ^ 7)
++#define ZVKNED_EGS 4
-+#define H1_2(x) ((x) ^ 6)
++
-+#define H1_4(x) ((x) ^ 4)
++#define GEN_V_UNMASKED_TRANS(NAME, CHECK, EGS)                                \
-+#define H2(x)   ((x) ^ 3)
++    static bool trans_##NAME(DisasContext *s, arg_##NAME *a)                  \
-+#define H4(x)   ((x) ^ 1)
++    {                                                                         \
-+#define H8(x)   ((x))
++        if (CHECK(s, a)) {                                                    \
-+#else
++            TCGv_ptr rd_v, rs2_v;                                             \
-+#define H1(x)   (x)
++            TCGv_i32 desc, egs;                                               \
-+#define H1_2(x) (x)
++            uint32_t data = 0;                                                \
-+#define H1_4(x) (x)
++            TCGLabel *over = gen_new_label();                                 \
-+#define H2(x)   (x)
++                                                                              \
-+#define H4(x)   (x)
++            if (!s->vstart_eq_zero || !s->vl_eq_vlmax) {                      \
-+#define H8(x)   (x)
++                /* save opcode for unwinding in case we throw an exception */ \
-+#endif
++                decode_save_opc(s);                                           \
-+
++                egs = tcg_constant_i32(EGS);                                  \
-+static inline uint32_t vext_nf(uint32_t desc)
++                gen_helper_egs_check(egs, cpu_env);                           \
-+{
++                tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);    \
-+    return FIELD_EX32(simd_data(desc), VDATA, NF);
++            }                                                                 \
-+}
++                                                                              \
-+
++            data = FIELD_DP32(data, VDATA, VM, a->vm);                        \
-+static inline uint32_t vext_mlen(uint32_t desc)
++            data = FIELD_DP32(data, VDATA, LMUL, s->lmul);                    \
-+{
++            data = FIELD_DP32(data, VDATA, VTA, s->vta);                      \
-+    return FIELD_EX32(simd_data(desc), VDATA, MLEN);
++            data = FIELD_DP32(data, VDATA, VTA_ALL_1S, s->cfg_vta_all_1s);    \
-+}
++            data = FIELD_DP32(data, VDATA, VMA, s->vma);                      \
-+
++            rd_v = tcg_temp_new_ptr();                                        \
-+static inline uint32_t vext_vm(uint32_t desc)
++            rs2_v = tcg_temp_new_ptr();                                       \
-+{
++            desc = tcg_constant_i32(                                          \
-+    return FIELD_EX32(simd_data(desc), VDATA, VM);
++                simd_desc(s->cfg_ptr->vlen / 8, s->cfg_ptr->vlen / 8, data)); \
-+}
++            tcg_gen_addi_ptr(rd_v, cpu_env, vreg_ofs(s, a->rd));              \
-+
++            tcg_gen_addi_ptr(rs2_v, cpu_env, vreg_ofs(s, a->rs2));            \
-+static inline uint32_t vext_lmul(uint32_t desc)
++            gen_helper_##NAME(rd_v, rs2_v, cpu_env, desc);                    \
-+{
++            mark_vs_dirty(s);                                                 \
-+    return FIELD_EX32(simd_data(desc), VDATA, LMUL);
++            gen_set_label(over);                                              \
-+}
++            return true;                                                      \
-+
++        }                                                                     \
-+/*
++        return false;                                                         \
-+ * Get vector group length in bytes. Its range is [64, 2048].
++    }
-+ *
++
-+ * As simd_desc support at most 256, the max vlen is 512 bits.
++static bool vaes_check_vv(DisasContext *s, arg_rmr *a)
-+ * So vlen in bytes is encoded as maxsz.
++{
-+ */
++    int egw_bytes = ZVKNED_EGS << s->sew;
-+static inline uint32_t vext_maxsz(uint32_t desc)
++    return s->cfg_ptr->ext_zvkned == true &&
-+{
++           require_rvv(s) &&
-+    return simd_maxsz(desc) << vext_lmul(desc);
++           vext_check_isa_ill(s) &&
-+}
++           MAXSZ(s) >= egw_bytes &&
-+
++           require_align(a->rd, s->lmul) &&
-+/*
++           require_align(a->rs2, s->lmul) &&
-+ * This function checks watchpoint before real load operation.
++           s->sew == MO_32;
-+ *
++}
-+ * In softmmu mode, the TLB API probe_access is enough for watchpoint check.
++
-+ * In user mode, there is no watchpoint support now.
++static bool vaes_check_overlap(DisasContext *s, int vd, int vs2)
-+ *
++{
-+ * It will trigger an exception if there is no mapping in TLB
++    int8_t op_size = s->lmul <= 0 ? 1 : 1 << s->lmul;
-+ * and page table walk can't fill the TLB entry. Then the guest
++    return !is_overlapped(vd, op_size, vs2, 1);
-+ * software can return here after process the exception or never return.
++}
-+ */
++
-+static void probe_pages(CPURISCVState *env, target_ulong addr,
++static bool vaes_check_vs(DisasContext *s, arg_rmr *a)
-+                        target_ulong len, uintptr_t ra,
++{
-+                        MMUAccessType access_type)
++    int egw_bytes = ZVKNED_EGS << s->sew;
-+{
++    return vaes_check_overlap(s, a->rd, a->rs2) &&
-+    target_ulong pagelen = -(addr | TARGET_PAGE_MASK);
++           MAXSZ(s) >= egw_bytes &&
-+    target_ulong curlen = MIN(pagelen, len);
++           s->cfg_ptr->ext_zvkned == true &&
-+
++           require_rvv(s) &&
-+    probe_access(env, addr, curlen, access_type,
++           vext_check_isa_ill(s) &&
-+                 cpu_mmu_index(env, false), ra);
++           require_align(a->rd, s->lmul) &&
-+    if (len > curlen) {
++           s->sew == MO_32;
-+        addr += curlen;
++}
-+        curlen = len - curlen;
++
-+        probe_access(env, addr, curlen, access_type,
++GEN_V_UNMASKED_TRANS(vaesef_vv, vaes_check_vv, ZVKNED_EGS)
-+                     cpu_mmu_index(env, false), ra);
++GEN_V_UNMASKED_TRANS(vaesef_vs, vaes_check_vs, ZVKNED_EGS)
-+    }
++GEN_V_UNMASKED_TRANS(vaesdf_vv, vaes_check_vv, ZVKNED_EGS)
-+}
++GEN_V_UNMASKED_TRANS(vaesdf_vs, vaes_check_vs, ZVKNED_EGS)
-+
++GEN_V_UNMASKED_TRANS(vaesdm_vv, vaes_check_vv, ZVKNED_EGS)
-+#ifdef HOST_WORDS_BIGENDIAN
++GEN_V_UNMASKED_TRANS(vaesdm_vs, vaes_check_vs, ZVKNED_EGS)
-+static void vext_clear(void *tail, uint32_t cnt, uint32_t tot)
++GEN_V_UNMASKED_TRANS(vaesz_vs, vaes_check_vs, ZVKNED_EGS)
-+{
++GEN_V_UNMASKED_TRANS(vaesem_vv, vaes_check_vv, ZVKNED_EGS)
-+    /*
++GEN_V_UNMASKED_TRANS(vaesem_vs, vaes_check_vs, ZVKNED_EGS)
-+     * Split the remaining range to two parts.
++
-+     * The first part is in the last uint64_t unit.
++#define GEN_VI_UNMASKED_TRANS(NAME, CHECK, EGS)                               \
-+     * The second part start from the next uint64_t unit.
++    static bool trans_##NAME(DisasContext *s, arg_##NAME *a)                  \
-+     */
++    {                                                                         \
-+    int part1 = 0, part2 = tot - cnt;
++        if (CHECK(s, a)) {                                                    \
-+    if (cnt % 8) {
++            TCGv_ptr rd_v, rs2_v;                                             \
-+        part1 = 8 - (cnt % 8);
++            TCGv_i32 uimm_v, desc, egs;                                       \
-+        part2 = tot - cnt - part1;
++            uint32_t data = 0;                                                \
-+        memset(tail & ~(7ULL), 0, part1);
++            TCGLabel *over = gen_new_label();                                 \
-+        memset((tail + 8) & ~(7ULL), 0, part2);
++                                                                              \
-+    } else {
++            if (!s->vstart_eq_zero || !s->vl_eq_vlmax) {                      \
-+        memset(tail, 0, part2);
++                /* save opcode for unwinding in case we throw an exception */ \
-+    }
++                decode_save_opc(s);                                           \
-+}
++                egs = tcg_constant_i32(EGS);                                  \
-+#else
++                gen_helper_egs_check(egs, cpu_env);                           \
-+static void vext_clear(void *tail, uint32_t cnt, uint32_t tot)
++                tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);    \
-+{
++            }                                                                 \
-+    memset(tail, 0, tot - cnt);
++                                                                              \
-+}
++            data = FIELD_DP32(data, VDATA, VM, a->vm);                        \
-+#endif
++            data = FIELD_DP32(data, VDATA, LMUL, s->lmul);                    \
-+
++            data = FIELD_DP32(data, VDATA, VTA, s->vta);                      \
-+static void clearb(void *vd, uint32_t idx, uint32_t cnt, uint32_t tot)
++            data = FIELD_DP32(data, VDATA, VTA_ALL_1S, s->cfg_vta_all_1s);    \
-+{
++            data = FIELD_DP32(data, VDATA, VMA, s->vma);                      \
-+    int8_t *cur = ((int8_t *)vd + H1(idx));
++                                                                              \
-+    vext_clear(cur, cnt, tot);
++            rd_v = tcg_temp_new_ptr();                                        \
-+}
++            rs2_v = tcg_temp_new_ptr();                                       \
-+
++            uimm_v = tcg_constant_i32(a->rs1);                                \
-+static void clearh(void *vd, uint32_t idx, uint32_t cnt, uint32_t tot)
++            desc = tcg_constant_i32(                                          \
-+{
++                simd_desc(s->cfg_ptr->vlen / 8, s->cfg_ptr->vlen / 8, data)); \
-+    int16_t *cur = ((int16_t *)vd + H2(idx));
++            tcg_gen_addi_ptr(rd_v, cpu_env, vreg_ofs(s, a->rd));              \
-+    vext_clear(cur, cnt, tot);
++            tcg_gen_addi_ptr(rs2_v, cpu_env, vreg_ofs(s, a->rs2));            \
-+}
++            gen_helper_##NAME(rd_v, rs2_v, uimm_v, cpu_env, desc);            \
-+
++            mark_vs_dirty(s);                                                 \
-+static void clearl(void *vd, uint32_t idx, uint32_t cnt, uint32_t tot)
++            gen_set_label(over);                                              \
-+{
++            return true;                                                      \
-+    int32_t *cur = ((int32_t *)vd + H4(idx));
++        }                                                                     \
-+    vext_clear(cur, cnt, tot);
++        return false;                                                         \
-+}
++    }
 +
-+static void clearq(void *vd, uint32_t idx, uint32_t cnt, uint32_t tot)
++static bool vaeskf1_check(DisasContext *s, arg_vaeskf1_vi *a)
 +{
-+    int64_t *cur = (int64_t *)vd + idx;
++    int egw_bytes = ZVKNED_EGS << s->sew;
-+    vext_clear(cur, cnt, tot);
++    return s->cfg_ptr->ext_zvkned == true &&
-+}
++           require_rvv(s) &&
-+
++           vext_check_isa_ill(s) &&
-+
++           MAXSZ(s) >= egw_bytes &&
-+static inline int vext_elem_mask(void *v0, int mlen, int index)
++           s->sew == MO_32 &&
-+{
++           require_align(a->rd, s->lmul) &&
-+    int idx = (index * mlen) / 64;
++           require_align(a->rs2, s->lmul);
-+    int pos = (index * mlen) % 64;
++}
-+    return (((uint64_t *)v0)[idx] >> pos) & 1;
++
-+}
++static bool vaeskf2_check(DisasContext *s, arg_vaeskf2_vi *a)
-+
++{
-+/* elements operations for load and store */
++    int egw_bytes = ZVKNED_EGS << s->sew;
-+typedef void vext_ldst_elem_fn(CPURISCVState *env, target_ulong addr,
++    return s->cfg_ptr->ext_zvkned == true &&
-+                               uint32_t idx, void *vd, uintptr_t retaddr);
++           require_rvv(s) &&
-+typedef void clear_fn(void *vd, uint32_t idx, uint32_t cnt, uint32_t tot);
++           vext_check_isa_ill(s) &&
-+
++           MAXSZ(s) >= egw_bytes &&
-+#define GEN_VEXT_LD_ELEM(NAME, MTYPE, ETYPE, H, LDSUF)     \
++           s->sew == MO_32 &&
-+static void NAME(CPURISCVState *env, abi_ptr addr,         \
++           require_align(a->rd, s->lmul) &&
-+                 uint32_t idx, void *vd, uintptr_t retaddr)\
++           require_align(a->rs2, s->lmul);
-+{                                                          \
++}
-+    MTYPE data;                                            \
++
-+    ETYPE *cur = ((ETYPE *)vd + H(idx));                   \
++GEN_VI_UNMASKED_TRANS(vaeskf1_vi, vaeskf1_check, ZVKNED_EGS)
-+    data = cpu_##LDSUF##_data_ra(env, addr, retaddr);      \
++GEN_VI_UNMASKED_TRANS(vaeskf2_vi, vaeskf2_check, ZVKNED_EGS)
 +    *cur = data;                                           \
 +}                                                          \
 +
 +GEN_VEXT_LD_ELEM(ldb_b, int8_t,  int8_t,  H1, ldsb)
 +GEN_VEXT_LD_ELEM(ldb_h, int8_t,  int16_t, H2, ldsb)
 +GEN_VEXT_LD_ELEM(ldb_w, int8_t,  int32_t, H4, ldsb)
 +GEN_VEXT_LD_ELEM(ldb_d, int8_t,  int64_t, H8, ldsb)
 +GEN_VEXT_LD_ELEM(ldh_h, int16_t, int16_t, H2, ldsw)
 +GEN_VEXT_LD_ELEM(ldh_w, int16_t, int32_t, H4, ldsw)
 +GEN_VEXT_LD_ELEM(ldh_d, int16_t, int64_t, H8, ldsw)
 +GEN_VEXT_LD_ELEM(ldw_w, int32_t, int32_t, H4, ldl)
 +GEN_VEXT_LD_ELEM(ldw_d, int32_t, int64_t, H8, ldl)
 +GEN_VEXT_LD_ELEM(lde_b, int8_t,  int8_t,  H1, ldsb)
 +GEN_VEXT_LD_ELEM(lde_h, int16_t, int16_t, H2, ldsw)
 +GEN_VEXT_LD_ELEM(lde_w, int32_t, int32_t, H4, ldl)
 +GEN_VEXT_LD_ELEM(lde_d, int64_t, int64_t, H8, ldq)
 +GEN_VEXT_LD_ELEM(ldbu_b, uint8_t,  uint8_t,  H1, ldub)
 +GEN_VEXT_LD_ELEM(ldbu_h, uint8_t,  uint16_t, H2, ldub)
 +GEN_VEXT_LD_ELEM(ldbu_w, uint8_t,  uint32_t, H4, ldub)
 +GEN_VEXT_LD_ELEM(ldbu_d, uint8_t,  uint64_t, H8, ldub)
 +GEN_VEXT_LD_ELEM(ldhu_h, uint16_t, uint16_t, H2, lduw)
 +GEN_VEXT_LD_ELEM(ldhu_w, uint16_t, uint32_t, H4, lduw)
 +GEN_VEXT_LD_ELEM(ldhu_d, uint16_t, uint64_t, H8, lduw)
 +GEN_VEXT_LD_ELEM(ldwu_w, uint32_t, uint32_t, H4, ldl)
 +GEN_VEXT_LD_ELEM(ldwu_d, uint32_t, uint64_t, H8, ldl)
 +
 +#define GEN_VEXT_ST_ELEM(NAME, ETYPE, H, STSUF)            \
 +static void NAME(CPURISCVState *env, abi_ptr addr,         \
 +                 uint32_t idx, void *vd, uintptr_t retaddr)\
 +{                                                          \
 +    ETYPE data = *((ETYPE *)vd + H(idx));                  \
 +    cpu_##STSUF##_data_ra(env, addr, data, retaddr);       \
 +}
 +
 +GEN_VEXT_ST_ELEM(stb_b, int8_t,  H1, stb)
 +GEN_VEXT_ST_ELEM(stb_h, int16_t, H2, stb)
 +GEN_VEXT_ST_ELEM(stb_w, int32_t, H4, stb)
 +GEN_VEXT_ST_ELEM(stb_d, int64_t, H8, stb)
 +GEN_VEXT_ST_ELEM(sth_h, int16_t, H2, stw)
 +GEN_VEXT_ST_ELEM(sth_w, int32_t, H4, stw)
 +GEN_VEXT_ST_ELEM(sth_d, int64_t, H8, stw)
 +GEN_VEXT_ST_ELEM(stw_w, int32_t, H4, stl)
 +GEN_VEXT_ST_ELEM(stw_d, int64_t, H8, stl)
 +GEN_VEXT_ST_ELEM(ste_b, int8_t,  H1, stb)
 +GEN_VEXT_ST_ELEM(ste_h, int16_t, H2, stw)
 +GEN_VEXT_ST_ELEM(ste_w, int32_t, H4, stl)
 +GEN_VEXT_ST_ELEM(ste_d, int64_t, H8, stq)
 +
 +/*
 + *** stride: access vector element from strided memory
 + */
 +static void
 +vext_ldst_stride(void *vd, void *v0, target_ulong base,
 +                 target_ulong stride, CPURISCVState *env,
 +                 uint32_t desc, uint32_t vm,
 +                 vext_ldst_elem_fn *ldst_elem, clear_fn *clear_elem,
 +                 uint32_t esz, uint32_t msz, uintptr_t ra,
 +                 MMUAccessType access_type)
 +{
 +    uint32_t i, k;
 +    uint32_t nf = vext_nf(desc);
 +    uint32_t mlen = vext_mlen(desc);
 +    uint32_t vlmax = vext_maxsz(desc) / esz;
 +
 +    /* probe every access*/
 +    for (i = 0; i < env->vl; i++) {
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {
 +            continue;
 +        }
 +        probe_pages(env, base + stride * i, nf * msz, ra, access_type);
 +    }
 +    /* do real access */
 +    for (i = 0; i < env->vl; i++) {
 +        k = 0;
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {
 +            continue;
 +        }
 +        while (k < nf) {
 +            target_ulong addr = base + stride * i + k * msz;
 +            ldst_elem(env, addr, i + k * vlmax, vd, ra);
 +            k++;
 +        }
 +    }
 +    /* clear tail elements */
 +    if (clear_elem) {
 +        for (k = 0; k < nf; k++) {
 +            clear_elem(vd, env->vl + k * vlmax, env->vl * esz, vlmax * esz);
 +        }
 +    }
 +}
 +
 +#define GEN_VEXT_LD_STRIDE(NAME, MTYPE, ETYPE, LOAD_FN, CLEAR_FN)       \
 +void HELPER(NAME)(void *vd, void * v0, target_ulong base,               \
 +                  target_ulong stride, CPURISCVState *env,              \
 +                  uint32_t desc)                                        \
 +{                                                                       \
 +    uint32_t vm = vext_vm(desc);                                        \
 +    vext_ldst_stride(vd, v0, base, stride, env, desc, vm, LOAD_FN,      \
 +                     CLEAR_FN, sizeof(ETYPE), sizeof(MTYPE),            \
 +                     GETPC(), MMU_DATA_LOAD);                           \
 +}
 +
 +GEN_VEXT_LD_STRIDE(vlsb_v_b,  int8_t,   int8_t,   ldb_b,  clearb)
 +GEN_VEXT_LD_STRIDE(vlsb_v_h,  int8_t,   int16_t,  ldb_h,  clearh)
 +GEN_VEXT_LD_STRIDE(vlsb_v_w,  int8_t,   int32_t,  ldb_w,  clearl)
 +GEN_VEXT_LD_STRIDE(vlsb_v_d,  int8_t,   int64_t,  ldb_d,  clearq)
 +GEN_VEXT_LD_STRIDE(vlsh_v_h,  int16_t,  int16_t,  ldh_h,  clearh)
 +GEN_VEXT_LD_STRIDE(vlsh_v_w,  int16_t,  int32_t,  ldh_w,  clearl)
 +GEN_VEXT_LD_STRIDE(vlsh_v_d,  int16_t,  int64_t,  ldh_d,  clearq)
 +GEN_VEXT_LD_STRIDE(vlsw_v_w,  int32_t,  int32_t,  ldw_w,  clearl)
 +GEN_VEXT_LD_STRIDE(vlsw_v_d,  int32_t,  int64_t,  ldw_d,  clearq)
 +GEN_VEXT_LD_STRIDE(vlse_v_b,  int8_t,   int8_t,   lde_b,  clearb)
 +GEN_VEXT_LD_STRIDE(vlse_v_h,  int16_t,  int16_t,  lde_h,  clearh)
 +GEN_VEXT_LD_STRIDE(vlse_v_w,  int32_t,  int32_t,  lde_w,  clearl)
 +GEN_VEXT_LD_STRIDE(vlse_v_d,  int64_t,  int64_t,  lde_d,  clearq)
 +GEN_VEXT_LD_STRIDE(vlsbu_v_b, uint8_t,  uint8_t,  ldbu_b, clearb)
 +GEN_VEXT_LD_STRIDE(vlsbu_v_h, uint8_t,  uint16_t, ldbu_h, clearh)
 +GEN_VEXT_LD_STRIDE(vlsbu_v_w, uint8_t,  uint32_t, ldbu_w, clearl)
 +GEN_VEXT_LD_STRIDE(vlsbu_v_d, uint8_t,  uint64_t, ldbu_d, clearq)
 +GEN_VEXT_LD_STRIDE(vlshu_v_h, uint16_t, uint16_t, ldhu_h, clearh)
 +GEN_VEXT_LD_STRIDE(vlshu_v_w, uint16_t, uint32_t, ldhu_w, clearl)
 +GEN_VEXT_LD_STRIDE(vlshu_v_d, uint16_t, uint64_t, ldhu_d, clearq)
 +GEN_VEXT_LD_STRIDE(vlswu_v_w, uint32_t, uint32_t, ldwu_w, clearl)
 +GEN_VEXT_LD_STRIDE(vlswu_v_d, uint32_t, uint64_t, ldwu_d, clearq)
 +
 +#define GEN_VEXT_ST_STRIDE(NAME, MTYPE, ETYPE, STORE_FN)                \
 +void HELPER(NAME)(void *vd, void *v0, target_ulong base,                \
 +                  target_ulong stride, CPURISCVState *env,              \
 +                  uint32_t desc)                                        \
 +{                                                                       \
 +    uint32_t vm = vext_vm(desc);                                        \
 +    vext_ldst_stride(vd, v0, base, stride, env, desc, vm, STORE_FN,     \
 +                     NULL, sizeof(ETYPE), sizeof(MTYPE),                \
 +                     GETPC(), MMU_DATA_STORE);                          \
 +}
 +
 +GEN_VEXT_ST_STRIDE(vssb_v_b, int8_t,  int8_t,  stb_b)
 +GEN_VEXT_ST_STRIDE(vssb_v_h, int8_t,  int16_t, stb_h)
 +GEN_VEXT_ST_STRIDE(vssb_v_w, int8_t,  int32_t, stb_w)
 +GEN_VEXT_ST_STRIDE(vssb_v_d, int8_t,  int64_t, stb_d)
 +GEN_VEXT_ST_STRIDE(vssh_v_h, int16_t, int16_t, sth_h)
 +GEN_VEXT_ST_STRIDE(vssh_v_w, int16_t, int32_t, sth_w)
 +GEN_VEXT_ST_STRIDE(vssh_v_d, int16_t, int64_t, sth_d)
 +GEN_VEXT_ST_STRIDE(vssw_v_w, int32_t, int32_t, stw_w)
 +GEN_VEXT_ST_STRIDE(vssw_v_d, int32_t, int64_t, stw_d)
 +GEN_VEXT_ST_STRIDE(vsse_v_b, int8_t,  int8_t,  ste_b)
 +GEN_VEXT_ST_STRIDE(vsse_v_h, int16_t, int16_t, ste_h)
 +GEN_VEXT_ST_STRIDE(vsse_v_w, int32_t, int32_t, ste_w)
 +GEN_VEXT_ST_STRIDE(vsse_v_d, int64_t, int64_t, ste_d)
 +
 +/*
 + *** unit-stride: access elements stored contiguously in memory
 + */
 +
 +/* unmasked unit-stride load and store operation*/
 +static void
 +vext_ldst_us(void *vd, target_ulong base, CPURISCVState *env, uint32_t desc,
 +             vext_ldst_elem_fn *ldst_elem, clear_fn *clear_elem,
 +             uint32_t esz, uint32_t msz, uintptr_t ra,
 +             MMUAccessType access_type)
 +{
 +    uint32_t i, k;
 +    uint32_t nf = vext_nf(desc);
 +    uint32_t vlmax = vext_maxsz(desc) / esz;
 +
 +    /* probe every access */
 +    probe_pages(env, base, env->vl * nf * msz, ra, access_type);
 +    /* load bytes from guest memory */
 +    for (i = 0; i < env->vl; i++) {
 +        k = 0;
 +        while (k < nf) {
 +            target_ulong addr = base + (i * nf + k) * msz;
 +            ldst_elem(env, addr, i + k * vlmax, vd, ra);
 +            k++;
 +        }
 +    }
 +    /* clear tail elements */
 +    if (clear_elem) {
 +        for (k = 0; k < nf; k++) {
 +            clear_elem(vd, env->vl + k * vlmax, env->vl * esz, vlmax * esz);
 +        }
 +    }
 +}
 +
 +/*
 + * masked unit-stride load and store operation will be a special case of stride,
 + * stride = NF * sizeof (MTYPE)
 + */
 +
 +#define GEN_VEXT_LD_US(NAME, MTYPE, ETYPE, LOAD_FN, CLEAR_FN)           \
 +void HELPER(NAME##_mask)(void *vd, void *v0, target_ulong base,         \
 +                         CPURISCVState *env, uint32_t desc)             \
 +{                                                                       \
 +    uint32_t stride = vext_nf(desc) * sizeof(MTYPE);                    \
 +    vext_ldst_stride(vd, v0, base, stride, env, desc, false, LOAD_FN,   \
 +                     CLEAR_FN, sizeof(ETYPE), sizeof(MTYPE),            \
 +                     GETPC(), MMU_DATA_LOAD);                           \
 +}                                                                       \
 +                                                                        \
 +void HELPER(NAME)(void *vd, void *v0, target_ulong base,                \
 +                  CPURISCVState *env, uint32_t desc)                    \
 +{                                                                       \
 +    vext_ldst_us(vd, base, env, desc, LOAD_FN, CLEAR_FN,                \
 +                 sizeof(ETYPE), sizeof(MTYPE), GETPC(), MMU_DATA_LOAD); \
 +}
 +
 +GEN_VEXT_LD_US(vlb_v_b,  int8_t,   int8_t,   ldb_b,  clearb)
 +GEN_VEXT_LD_US(vlb_v_h,  int8_t,   int16_t,  ldb_h,  clearh)
 +GEN_VEXT_LD_US(vlb_v_w,  int8_t,   int32_t,  ldb_w,  clearl)
 +GEN_VEXT_LD_US(vlb_v_d,  int8_t,   int64_t,  ldb_d,  clearq)
 +GEN_VEXT_LD_US(vlh_v_h,  int16_t,  int16_t,  ldh_h,  clearh)
 +GEN_VEXT_LD_US(vlh_v_w,  int16_t,  int32_t,  ldh_w,  clearl)
 +GEN_VEXT_LD_US(vlh_v_d,  int16_t,  int64_t,  ldh_d,  clearq)
 +GEN_VEXT_LD_US(vlw_v_w,  int32_t,  int32_t,  ldw_w,  clearl)
 +GEN_VEXT_LD_US(vlw_v_d,  int32_t,  int64_t,  ldw_d,  clearq)
 +GEN_VEXT_LD_US(vle_v_b,  int8_t,   int8_t,   lde_b,  clearb)
 +GEN_VEXT_LD_US(vle_v_h,  int16_t,  int16_t,  lde_h,  clearh)
 +GEN_VEXT_LD_US(vle_v_w,  int32_t,  int32_t,  lde_w,  clearl)
 +GEN_VEXT_LD_US(vle_v_d,  int64_t,  int64_t,  lde_d,  clearq)
 +GEN_VEXT_LD_US(vlbu_v_b, uint8_t,  uint8_t,  ldbu_b, clearb)
 +GEN_VEXT_LD_US(vlbu_v_h, uint8_t,  uint16_t, ldbu_h, clearh)
 +GEN_VEXT_LD_US(vlbu_v_w, uint8_t,  uint32_t, ldbu_w, clearl)
 +GEN_VEXT_LD_US(vlbu_v_d, uint8_t,  uint64_t, ldbu_d, clearq)
 +GEN_VEXT_LD_US(vlhu_v_h, uint16_t, uint16_t, ldhu_h, clearh)
 +GEN_VEXT_LD_US(vlhu_v_w, uint16_t, uint32_t, ldhu_w, clearl)
 +GEN_VEXT_LD_US(vlhu_v_d, uint16_t, uint64_t, ldhu_d, clearq)
 +GEN_VEXT_LD_US(vlwu_v_w, uint32_t, uint32_t, ldwu_w, clearl)
 +GEN_VEXT_LD_US(vlwu_v_d, uint32_t, uint64_t, ldwu_d, clearq)
 +
 +#define GEN_VEXT_ST_US(NAME, MTYPE, ETYPE, STORE_FN)                    \
 +void HELPER(NAME##_mask)(void *vd, void *v0, target_ulong base,         \
 +                         CPURISCVState *env, uint32_t desc)             \
 +{                                                                       \
 +    uint32_t stride = vext_nf(desc) * sizeof(MTYPE);                    \
 +    vext_ldst_stride(vd, v0, base, stride, env, desc, false, STORE_FN,  \
 +                     NULL, sizeof(ETYPE), sizeof(MTYPE),                \
 +                     GETPC(), MMU_DATA_STORE);                          \
 +}                                                                       \
 +                                                                        \
 +void HELPER(NAME)(void *vd, void *v0, target_ulong base,                \
 +                  CPURISCVState *env, uint32_t desc)                    \
 +{                                                                       \
 +    vext_ldst_us(vd, base, env, desc, STORE_FN, NULL,                   \
 +                 sizeof(ETYPE), sizeof(MTYPE), GETPC(), MMU_DATA_STORE);\
 +}
 +
 +GEN_VEXT_ST_US(vsb_v_b, int8_t,  int8_t , stb_b)
 +GEN_VEXT_ST_US(vsb_v_h, int8_t,  int16_t, stb_h)
 +GEN_VEXT_ST_US(vsb_v_w, int8_t,  int32_t, stb_w)
 +GEN_VEXT_ST_US(vsb_v_d, int8_t,  int64_t, stb_d)
 +GEN_VEXT_ST_US(vsh_v_h, int16_t, int16_t, sth_h)
 +GEN_VEXT_ST_US(vsh_v_w, int16_t, int32_t, sth_w)
 +GEN_VEXT_ST_US(vsh_v_d, int16_t, int64_t, sth_d)
 +GEN_VEXT_ST_US(vsw_v_w, int32_t, int32_t, stw_w)
 +GEN_VEXT_ST_US(vsw_v_d, int32_t, int64_t, stw_d)
 +GEN_VEXT_ST_US(vse_v_b, int8_t,  int8_t , ste_b)
 +GEN_VEXT_ST_US(vse_v_h, int16_t, int16_t, ste_h)
 +GEN_VEXT_ST_US(vse_v_w, int32_t, int32_t, ste_w)
 +GEN_VEXT_ST_US(vse_v_d, int64_t, int64_t, ste_d)
 --
-.27.0
+.41.0

-[PULL 13/63] target/riscv: vector widening integer add and subtract
+[PULL v2 17/45] target/riscv: Add Zvknh ISA extension support
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Kiran Ostrolenk <kiran.ostrolenk@codethink.co.uk>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+This commit adds support for the Zvknh vector-crypto extension, which
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+consists of the following instructions:
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-12-zhiwei_liu@c-sky.com
+* vsha2ms.vv
 * vsha2c[hl].vv
 Translation functions are defined in
 `target/riscv/insn_trans/trans_rvvk.c.inc` and helpers are defined in
 `target/riscv/vcrypto_helper.c`.
 Co-authored-by: Nazar Kazakov <nazar.kazakov@codethink.co.uk>
 Co-authored-by: Lawrence Hunter <lawrence.hunter@codethink.co.uk>
 [max.chou@sifive.com: Replaced vstart checking by TCG op]
 Signed-off-by: Nazar Kazakov <nazar.kazakov@codethink.co.uk>
 Signed-off-by: Lawrence Hunter <lawrence.hunter@codethink.co.uk>
 Signed-off-by: Kiran Ostrolenk <kiran.ostrolenk@codethink.co.uk>
 Signed-off-by: Max Chou <max.chou@sifive.com>
 Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 [max.chou@sifive.com: Exposed x-zvknha & x-zvknhb properties]
 [max.chou@sifive.com: Replaced SEW selection to happened during
 translation]
 Message-ID: <20230711165917.2629866-11-max.chou@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   |  49 +++++++
+ target/riscv/cpu_cfg.h                   |   2 +
- target/riscv/insn32.decode              |  16 ++
+ target/riscv/helper.h                    |   6 +
- target/riscv/insn_trans/trans_rvv.inc.c | 186 ++++++++++++++++++++++++
+ target/riscv/insn32.decode               |   5 +
- target/riscv/vector_helper.c            | 111 ++++++++++++++
+ target/riscv/cpu.c                       |  13 +-
-files changed, 362 insertions(+)
+ target/riscv/vcrypto_helper.c            | 238 +++++++++++++++++++++++
  target/riscv/insn_trans/trans_rvvk.c.inc | 129 ++++++++++++
 files changed, 390 insertions(+), 3 deletions(-)
+diff --git a/target/riscv/cpu_cfg.h b/target/riscv/cpu_cfg.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/cpu_cfg.h
++++ b/target/riscv/cpu_cfg.h
+@@ -XXX,XX +XXX,XX @@ struct RISCVCPUConfig {
+     bool ext_zvbb;
+     bool ext_zvbc;
+     bool ext_zvkned;
++    bool ext_zvknha;
++    bool ext_zvknhb;
+     bool ext_zmmul;
+     bool ext_zvfbfmin;
+     bool ext_zvfbfwma;
 diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/helper.h
 +++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(vec_rsubs8, TCG_CALL_NO_RWG, void, ptr, ptr, i64, i32)
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_4(vaesdm_vs, void, ptr, ptr, env, i32)
- DEF_HELPER_FLAGS_4(vec_rsubs16, TCG_CALL_NO_RWG, void, ptr, ptr, i64, i32)
+ DEF_HELPER_4(vaesz_vs, void, ptr, ptr, env, i32)
- DEF_HELPER_FLAGS_4(vec_rsubs32, TCG_CALL_NO_RWG, void, ptr, ptr, i64, i32)
+ DEF_HELPER_5(vaeskf1_vi, void, ptr, ptr, i32, env, i32)
- DEF_HELPER_FLAGS_4(vec_rsubs64, TCG_CALL_NO_RWG, void, ptr, ptr, i64, i32)
+ DEF_HELPER_5(vaeskf2_vi, void, ptr, ptr, i32, env, i32)
 +
-+DEF_HELPER_6(vwaddu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_5(vsha2ms_vv, void, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwaddu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_5(vsha2ch32_vv, void, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwaddu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_5(vsha2ch64_vv, void, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwsubu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_5(vsha2cl32_vv, void, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwsubu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_5(vsha2cl64_vv, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwsubu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwadd_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwadd_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwadd_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwsub_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwsub_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwsub_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwaddu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwaddu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwaddu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsubu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsubu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsubu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwadd_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwadd_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwadd_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsub_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsub_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsub_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwaddu_wv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwaddu_wv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwaddu_wv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwsubu_wv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwsubu_wv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwsubu_wv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwadd_wv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwadd_wv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwadd_wv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwsub_wv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwsub_wv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwsub_wv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwaddu_wx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwaddu_wx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwaddu_wx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsubu_wx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsubu_wx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsubu_wx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwadd_wx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwadd_wx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwadd_wx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsub_wx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsub_wx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vwsub_wx_w, void, ptr, ptr, tl, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vsub_vv         000010 . ..... ..... 000 ..... 1010111 @r_vm
+@@ -XXX,XX +XXX,XX @@ vaesdm_vs   101001 1 ..... 00000 010 ..... 1110111 @r2_vm_1
- vsub_vx         000010 . ..... ..... 100 ..... 1010111 @r_vm
+ vaesz_vs    101001 1 ..... 00111 010 ..... 1110111 @r2_vm_1
- vrsub_vx        000011 . ..... ..... 100 ..... 1010111 @r_vm
+ vaeskf1_vi  100010 1 ..... ..... 010 ..... 1110111 @r_vm_1
- vrsub_vi        000011 . ..... ..... 011 ..... 1010111 @r_vm
+ vaeskf2_vi  101010 1 ..... ..... 010 ..... 1110111 @r_vm_1
-+vwaddu_vv       110000 . ..... ..... 010 ..... 1010111 @r_vm
++
-+vwaddu_vx       110000 . ..... ..... 110 ..... 1010111 @r_vm
++# *** Zvknh vector crypto extension ***
-+vwadd_vv        110001 . ..... ..... 010 ..... 1010111 @r_vm
++vsha2ms_vv  101101 1 ..... ..... 010 ..... 1110111 @r_vm_1
-+vwadd_vx        110001 . ..... ..... 110 ..... 1010111 @r_vm
++vsha2ch_vv  101110 1 ..... ..... 010 ..... 1110111 @r_vm_1
-+vwsubu_vv       110010 . ..... ..... 010 ..... 1010111 @r_vm
++vsha2cl_vv  101111 1 ..... ..... 010 ..... 1110111 @r_vm_1
-+vwsubu_vx       110010 . ..... ..... 110 ..... 1010111 @r_vm
+diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
 +vwsub_vv        110011 . ..... ..... 010 ..... 1010111 @r_vm
 +vwsub_vx        110011 . ..... ..... 110 ..... 1010111 @r_vm
 +vwaddu_wv       110100 . ..... ..... 010 ..... 1010111 @r_vm
 +vwaddu_wx       110100 . ..... ..... 110 ..... 1010111 @r_vm
 +vwadd_wv        110101 . ..... ..... 010 ..... 1010111 @r_vm
 +vwadd_wx        110101 . ..... ..... 110 ..... 1010111 @r_vm
 +vwsubu_wv       110110 . ..... ..... 010 ..... 1010111 @r_vm
 +vwsubu_wx       110110 . ..... ..... 110 ..... 1010111 @r_vm
 +vwsub_wv        110111 . ..... ..... 010 ..... 1010111 @r_vm
 +vwsub_wx        110111 . ..... ..... 110 ..... 1010111 @r_vm
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
+--- a/target/riscv/cpu.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
++++ b/target/riscv/cpu.c
-@@ -XXX,XX +XXX,XX @@ static bool vext_check_nf(DisasContext *s, uint32_t nf)
+@@ -XXX,XX +XXX,XX @@ static const struct isa_ext_data isa_edata_arr[] = {
-     return (1 << s->lmul) * nf <= 8;
+     ISA_EXT_DATA_ENTRY(zvfh, PRIV_VERSION_1_12_0, ext_zvfh),
      ISA_EXT_DATA_ENTRY(zvfhmin, PRIV_VERSION_1_12_0, ext_zvfhmin),
      ISA_EXT_DATA_ENTRY(zvkned, PRIV_VERSION_1_12_0, ext_zvkned),
 +    ISA_EXT_DATA_ENTRY(zvknha, PRIV_VERSION_1_12_0, ext_zvknha),
 +    ISA_EXT_DATA_ENTRY(zvknhb, PRIV_VERSION_1_12_0, ext_zvknhb),
      ISA_EXT_DATA_ENTRY(zhinx, PRIV_VERSION_1_12_0, ext_zhinx),
      ISA_EXT_DATA_ENTRY(zhinxmin, PRIV_VERSION_1_12_0, ext_zhinxmin),
      ISA_EXT_DATA_ENTRY(smaia, PRIV_VERSION_1_12_0, ext_smaia),
@@ -XXX,XX +XXX,XX @@ void riscv_cpu_validate_set_extensions(RISCVCPU *cpu, Error **errp)
       * In principle Zve*x would also suffice here, were they supported
       * in qemu
       */
 -    if ((cpu->cfg.ext_zvbb || cpu->cfg.ext_zvkned) && !cpu->cfg.ext_zve32f) {
 +    if ((cpu->cfg.ext_zvbb || cpu->cfg.ext_zvkned || cpu->cfg.ext_zvknha) &&
 +        !cpu->cfg.ext_zve32f) {
          error_setg(errp,
                     "Vector crypto extensions require V or Zve* extensions");
          return;
      }
 -    if (cpu->cfg.ext_zvbc && !cpu->cfg.ext_zve64f) {
 -        error_setg(errp, "Zvbc extension requires V or Zve64{f,d} extensions");
 +    if ((cpu->cfg.ext_zvbc || cpu->cfg.ext_zvknhb) && !cpu->cfg.ext_zve64f) {
 +        error_setg(
 +            errp,
 +            "Zvbc and Zvknhb extensions require V or Zve64{f,d} extensions");
          return;
      }
@@ -XXX,XX +XXX,XX @@ static Property riscv_cpu_extensions[] = {
      DEFINE_PROP_BOOL("x-zvbb", RISCVCPU, cfg.ext_zvbb, false),
      DEFINE_PROP_BOOL("x-zvbc", RISCVCPU, cfg.ext_zvbc, false),
      DEFINE_PROP_BOOL("x-zvkned", RISCVCPU, cfg.ext_zvkned, false),
 +    DEFINE_PROP_BOOL("x-zvknha", RISCVCPU, cfg.ext_zvknha, false),
 +    DEFINE_PROP_BOOL("x-zvknhb", RISCVCPU, cfg.ext_zvknhb, false),
      DEFINE_PROP_END_OF_LIST(),
  };
 diff --git a/target/riscv/vcrypto_helper.c b/target/riscv/vcrypto_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vcrypto_helper.c
 +++ b/target/riscv/vcrypto_helper.c
@@ -XXX,XX +XXX,XX @@ void HELPER(vaeskf2_vi)(void *vd_vptr, void *vs2_vptr, uint32_t uimm,
      /* set tail elements to 1s */
      vext_set_elems_1s(vd, vta, vl * 4, total_elems * 4);
  }
++
 +static inline uint32_t sig0_sha256(uint32_t x)
 +{
 +    return ror32(x, 7) ^ ror32(x, 18) ^ (x >> 3);
 +}
 +
 +static inline uint32_t sig1_sha256(uint32_t x)
 +{
 +    return ror32(x, 17) ^ ror32(x, 19) ^ (x >> 10);
 +}
 +
 +static inline uint64_t sig0_sha512(uint64_t x)
 +{
 +    return ror64(x, 1) ^ ror64(x, 8) ^ (x >> 7);
 +}
 +
 +static inline uint64_t sig1_sha512(uint64_t x)
 +{
 +    return ror64(x, 19) ^ ror64(x, 61) ^ (x >> 6);
 +}
 +
 +static inline void vsha2ms_e32(uint32_t *vd, uint32_t *vs1, uint32_t *vs2)
 +{
 +    uint32_t res[4];
 +    res[0] = sig1_sha256(vs1[H4(2)]) + vs2[H4(1)] + sig0_sha256(vd[H4(1)]) +
 +             vd[H4(0)];
 +    res[1] = sig1_sha256(vs1[H4(3)]) + vs2[H4(2)] + sig0_sha256(vd[H4(2)]) +
 +             vd[H4(1)];
 +    res[2] =
 +        sig1_sha256(res[0]) + vs2[H4(3)] + sig0_sha256(vd[H4(3)]) + vd[H4(2)];
 +    res[3] =
 +        sig1_sha256(res[1]) + vs1[H4(0)] + sig0_sha256(vs2[H4(0)]) + vd[H4(3)];
 +    vd[H4(3)] = res[3];
 +    vd[H4(2)] = res[2];
 +    vd[H4(1)] = res[1];
 +    vd[H4(0)] = res[0];
 +}
 +
 +static inline void vsha2ms_e64(uint64_t *vd, uint64_t *vs1, uint64_t *vs2)
 +{
 +    uint64_t res[4];
 +    res[0] = sig1_sha512(vs1[2]) + vs2[1] + sig0_sha512(vd[1]) + vd[0];
 +    res[1] = sig1_sha512(vs1[3]) + vs2[2] + sig0_sha512(vd[2]) + vd[1];
 +    res[2] = sig1_sha512(res[0]) + vs2[3] + sig0_sha512(vd[3]) + vd[2];
 +    res[3] = sig1_sha512(res[1]) + vs1[0] + sig0_sha512(vs2[0]) + vd[3];
 +    vd[3] = res[3];
 +    vd[2] = res[2];
 +    vd[1] = res[1];
 +    vd[0] = res[0];
 +}
 +
 +void HELPER(vsha2ms_vv)(void *vd, void *vs1, void *vs2, CPURISCVState *env,
 +                        uint32_t desc)
 +{
 +    uint32_t sew = FIELD_EX64(env->vtype, VTYPE, VSEW);
 +    uint32_t esz = sew == MO_32 ? 4 : 8;
 +    uint32_t total_elems;
 +    uint32_t vta = vext_vta(desc);
 +
 +    for (uint32_t i = env->vstart / 4; i < env->vl / 4; i++) {
 +        if (sew == MO_32) {
 +            vsha2ms_e32(((uint32_t *)vd) + i * 4, ((uint32_t *)vs1) + i * 4,
 +                        ((uint32_t *)vs2) + i * 4);
 +        } else {
 +            /* If not 32 then SEW should be 64 */
 +            vsha2ms_e64(((uint64_t *)vd) + i * 4, ((uint64_t *)vs1) + i * 4,
 +                        ((uint64_t *)vs2) + i * 4);
 +        }
 +    }
 +    /* set tail elements to 1s */
 +    total_elems = vext_get_total_elems(env, desc, esz);
 +    vext_set_elems_1s(vd, vta, env->vl * esz, total_elems * esz);
 +    env->vstart = 0;
 +}
 +
 +static inline uint64_t sum0_64(uint64_t x)
 +{
 +    return ror64(x, 28) ^ ror64(x, 34) ^ ror64(x, 39);
 +}
 +
 +static inline uint32_t sum0_32(uint32_t x)
 +{
 +    return ror32(x, 2) ^ ror32(x, 13) ^ ror32(x, 22);
 +}
 +
 +static inline uint64_t sum1_64(uint64_t x)
 +{
 +    return ror64(x, 14) ^ ror64(x, 18) ^ ror64(x, 41);
 +}
 +
 +static inline uint32_t sum1_32(uint32_t x)
 +{
 +    return ror32(x, 6) ^ ror32(x, 11) ^ ror32(x, 25);
 +}
 +
 +#define ch(x, y, z) ((x & y) ^ ((~x) & z))
 +
 +#define maj(x, y, z) ((x & y) ^ (x & z) ^ (y & z))
 +
 +static void vsha2c_64(uint64_t *vs2, uint64_t *vd, uint64_t *vs1)
 +{
 +    uint64_t a = vs2[3], b = vs2[2], e = vs2[1], f = vs2[0];
 +    uint64_t c = vd[3], d = vd[2], g = vd[1], h = vd[0];
 +    uint64_t W0 = vs1[0], W1 = vs1[1];
 +    uint64_t T1 = h + sum1_64(e) + ch(e, f, g) + W0;
 +    uint64_t T2 = sum0_64(a) + maj(a, b, c);
 +
 +    h = g;
 +    g = f;
 +    f = e;
 +    e = d + T1;
 +    d = c;
 +    c = b;
 +    b = a;
 +    a = T1 + T2;
 +
 +    T1 = h + sum1_64(e) + ch(e, f, g) + W1;
 +    T2 = sum0_64(a) + maj(a, b, c);
 +    h = g;
 +    g = f;
 +    f = e;
 +    e = d + T1;
 +    d = c;
 +    c = b;
 +    b = a;
 +    a = T1 + T2;
 +
 +    vd[0] = f;
 +    vd[1] = e;
 +    vd[2] = b;
 +    vd[3] = a;
 +}
 +
 +static void vsha2c_32(uint32_t *vs2, uint32_t *vd, uint32_t *vs1)
 +{
 +    uint32_t a = vs2[H4(3)], b = vs2[H4(2)], e = vs2[H4(1)], f = vs2[H4(0)];
 +    uint32_t c = vd[H4(3)], d = vd[H4(2)], g = vd[H4(1)], h = vd[H4(0)];
 +    uint32_t W0 = vs1[H4(0)], W1 = vs1[H4(1)];
 +    uint32_t T1 = h + sum1_32(e) + ch(e, f, g) + W0;
 +    uint32_t T2 = sum0_32(a) + maj(a, b, c);
 +
 +    h = g;
 +    g = f;
 +    f = e;
 +    e = d + T1;
 +    d = c;
 +    c = b;
 +    b = a;
 +    a = T1 + T2;
 +
 +    T1 = h + sum1_32(e) + ch(e, f, g) + W1;
 +    T2 = sum0_32(a) + maj(a, b, c);
 +    h = g;
 +    g = f;
 +    f = e;
 +    e = d + T1;
 +    d = c;
 +    c = b;
 +    b = a;
 +    a = T1 + T2;
 +
 +    vd[H4(0)] = f;
 +    vd[H4(1)] = e;
 +    vd[H4(2)] = b;
 +    vd[H4(3)] = a;
 +}
 +
 +void HELPER(vsha2ch32_vv)(void *vd, void *vs1, void *vs2, CPURISCVState *env,
 +                          uint32_t desc)
 +{
 +    const uint32_t esz = 4;
 +    uint32_t total_elems;
 +    uint32_t vta = vext_vta(desc);
 +
 +    for (uint32_t i = env->vstart / 4; i < env->vl / 4; i++) {
 +        vsha2c_32(((uint32_t *)vs2) + 4 * i, ((uint32_t *)vd) + 4 * i,
 +                  ((uint32_t *)vs1) + 4 * i + 2);
 +    }
 +
 +    /* set tail elements to 1s */
 +    total_elems = vext_get_total_elems(env, desc, esz);
 +    vext_set_elems_1s(vd, vta, env->vl * esz, total_elems * esz);
 +    env->vstart = 0;
 +}
 +
 +void HELPER(vsha2ch64_vv)(void *vd, void *vs1, void *vs2, CPURISCVState *env,
 +                          uint32_t desc)
 +{
 +    const uint32_t esz = 8;
 +    uint32_t total_elems;
 +    uint32_t vta = vext_vta(desc);
 +
 +    for (uint32_t i = env->vstart / 4; i < env->vl / 4; i++) {
 +        vsha2c_64(((uint64_t *)vs2) + 4 * i, ((uint64_t *)vd) + 4 * i,
 +                  ((uint64_t *)vs1) + 4 * i + 2);
 +    }
 +
 +    /* set tail elements to 1s */
 +    total_elems = vext_get_total_elems(env, desc, esz);
 +    vext_set_elems_1s(vd, vta, env->vl * esz, total_elems * esz);
 +    env->vstart = 0;
 +}
 +
 +void HELPER(vsha2cl32_vv)(void *vd, void *vs1, void *vs2, CPURISCVState *env,
 +                          uint32_t desc)
 +{
 +    const uint32_t esz = 4;
 +    uint32_t total_elems;
 +    uint32_t vta = vext_vta(desc);
 +
 +    for (uint32_t i = env->vstart / 4; i < env->vl / 4; i++) {
 +        vsha2c_32(((uint32_t *)vs2) + 4 * i, ((uint32_t *)vd) + 4 * i,
 +                  (((uint32_t *)vs1) + 4 * i));
 +    }
 +
 +    /* set tail elements to 1s */
 +    total_elems = vext_get_total_elems(env, desc, esz);
 +    vext_set_elems_1s(vd, vta, env->vl * esz, total_elems * esz);
 +    env->vstart = 0;
 +}
 +
 +void HELPER(vsha2cl64_vv)(void *vd, void *vs1, void *vs2, CPURISCVState *env,
 +                          uint32_t desc)
 +{
 +    uint32_t esz = 8;
 +    uint32_t total_elems;
 +    uint32_t vta = vext_vta(desc);
 +
 +    for (uint32_t i = env->vstart / 4; i < env->vl / 4; i++) {
 +        vsha2c_64(((uint64_t *)vs2) + 4 * i, ((uint64_t *)vd) + 4 * i,
 +                  (((uint64_t *)vs1) + 4 * i));
 +    }
 +
 +    /* set tail elements to 1s */
 +    total_elems = vext_get_total_elems(env, desc, esz);
 +    vext_set_elems_1s(vd, vta, env->vl * esz, total_elems * esz);
 +    env->vstart = 0;
 +}
 diff --git a/target/riscv/insn_trans/trans_rvvk.c.inc b/target/riscv/insn_trans/trans_rvvk.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvvk.c.inc
 +++ b/target/riscv/insn_trans/trans_rvvk.c.inc
@@ -XXX,XX +XXX,XX @@ static bool vaeskf2_check(DisasContext *s, arg_vaeskf2_vi *a)
  GEN_VI_UNMASKED_TRANS(vaeskf1_vi, vaeskf1_check, ZVKNED_EGS)
  GEN_VI_UNMASKED_TRANS(vaeskf2_vi, vaeskf2_check, ZVKNED_EGS)
 +
 +/*
-+ * The destination vector register group cannot overlap a source vector register
++ * Zvknh
 + * group of a different element width. (Section 11.2)
 + */
-+static inline bool vext_check_overlap_group(int rd, int dlen, int rs, int slen)
++
-+{
++#define ZVKNH_EGS 4
-+    return ((rd >= rs + slen) || (rs >= rd + dlen));
++
-+}
++#define GEN_VV_UNMASKED_TRANS(NAME, CHECK, EGS)                               \
- /* common translation macro */
++    static bool trans_##NAME(DisasContext *s, arg_rmrr *a)                    \
- #define GEN_VEXT_TRANS(NAME, SEQ, ARGTYPE, OP, CHECK)      \
++    {                                                                         \
- static bool trans_##NAME(DisasContext *s, arg_##ARGTYPE *a)\
++        if (CHECK(s, a)) {                                                    \
-@@ -XXX,XX +XXX,XX @@ static void tcg_gen_gvec_rsubi(unsigned vece, uint32_t dofs, uint32_t aofs,
++            uint32_t data = 0;                                                \
- }
++            TCGLabel *over = gen_new_label();                                 \
++            TCGv_i32 egs;                                                     \
- GEN_OPIVI_GVEC_TRANS(vrsub_vi, 0, vrsub_vx, rsubi)
++                                                                              \
-+
++            if (!s->vstart_eq_zero || !s->vl_eq_vlmax) {                      \
-+/* Vector Widening Integer Add/Subtract */
++                /* save opcode for unwinding in case we throw an exception */ \
-+
++                decode_save_opc(s);                                           \
-+/* OPIVV with WIDEN */
++                egs = tcg_constant_i32(EGS);                                  \
-+static bool opivv_widen_check(DisasContext *s, arg_rmrr *a)
++                gen_helper_egs_check(egs, cpu_env);                           \
-+{
++                tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);    \
-+    return (vext_check_isa_ill(s) &&
++            }                                                                 \
-+            vext_check_overlap_mask(s, a->rd, a->vm, true) &&
++                                                                              \
-+            vext_check_reg(s, a->rd, true) &&
++            data = FIELD_DP32(data, VDATA, VM, a->vm);                        \
-+            vext_check_reg(s, a->rs2, false) &&
++            data = FIELD_DP32(data, VDATA, LMUL, s->lmul);                    \
-+            vext_check_reg(s, a->rs1, false) &&
++            data = FIELD_DP32(data, VDATA, VTA, s->vta);                      \
-+            vext_check_overlap_group(a->rd, 2 << s->lmul, a->rs2,
++            data = FIELD_DP32(data, VDATA, VTA_ALL_1S, s->cfg_vta_all_1s);    \
-+                                     1 << s->lmul) &&
++            data = FIELD_DP32(data, VDATA, VMA, s->vma);                      \
-+            vext_check_overlap_group(a->rd, 2 << s->lmul, a->rs1,
++                                                                              \
-+                                     1 << s->lmul) &&
++            tcg_gen_gvec_3_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, a->rs1),       \
-+            (s->lmul < 0x3) && (s->sew < 0x3));
++                               vreg_ofs(s, a->rs2), cpu_env,                  \
-+}
++                               s->cfg_ptr->vlen / 8, s->cfg_ptr->vlen / 8,    \
-+
++                               data, gen_helper_##NAME);                      \
-+static bool do_opivv_widen(DisasContext *s, arg_rmrr *a,
++                                                                              \
-+                           gen_helper_gvec_4_ptr *fn,
++            mark_vs_dirty(s);                                                 \
-+                           bool (*checkfn)(DisasContext *, arg_rmrr *))
++            gen_set_label(over);                                              \
-+{
++            return true;                                                      \
-+    if (checkfn(s, a)) {
++        }                                                                     \
 +        return false;                                                         \
 +    }
 +
 +static bool vsha_check_sew(DisasContext *s)
 +{
 +    return (s->cfg_ptr->ext_zvknha == true && s->sew == MO_32) ||
 +           (s->cfg_ptr->ext_zvknhb == true &&
 +            (s->sew == MO_32 || s->sew == MO_64));
 +}
 +
 +static bool vsha_check(DisasContext *s, arg_rmrr *a)
 +{
 +    int egw_bytes = ZVKNH_EGS << s->sew;
 +    int mult = 1 << MAX(s->lmul, 0);
 +    return opivv_check(s, a) &&
 +           vsha_check_sew(s) &&
 +           MAXSZ(s) >= egw_bytes &&
 +           !is_overlapped(a->rd, mult, a->rs1, mult) &&
 +           !is_overlapped(a->rd, mult, a->rs2, mult) &&
 +           s->lmul >= 0;
 +}
 +
 +GEN_VV_UNMASKED_TRANS(vsha2ms_vv, vsha_check, ZVKNH_EGS)
 +
 +static bool trans_vsha2cl_vv(DisasContext *s, arg_rmrr *a)
 +{
 +    if (vsha_check(s, a)) {
 +        uint32_t data = 0;
 +        TCGLabel *over = gen_new_label();
-+        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
++        TCGv_i32 egs;
 +
-+        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
++        if (!s->vstart_eq_zero || !s->vl_eq_vlmax) {
 +            /* save opcode for unwinding in case we throw an exception */
 +            decode_save_opc(s);
 +            egs = tcg_constant_i32(ZVKNH_EGS);
 +            gen_helper_egs_check(egs, cpu_env);
 +            tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
 +        }
 +
 +        data = FIELD_DP32(data, VDATA, VM, a->vm);
 +        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
-+        tcg_gen_gvec_4_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),
++        data = FIELD_DP32(data, VDATA, VTA, s->vta);
-+                           vreg_ofs(s, a->rs1),
++        data = FIELD_DP32(data, VDATA, VTA_ALL_1S, s->cfg_vta_all_1s);
-+                           vreg_ofs(s, a->rs2),
++        data = FIELD_DP32(data, VDATA, VMA, s->vma);
-+                           cpu_env, 0, s->vlen / 8,
++
-+                           data, fn);
++        tcg_gen_gvec_3_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, a->rs1),
 +            vreg_ofs(s, a->rs2), cpu_env, s->cfg_ptr->vlen / 8,
 +            s->cfg_ptr->vlen / 8, data,
 +            s->sew == MO_32 ?
 +                gen_helper_vsha2cl32_vv : gen_helper_vsha2cl64_vv);
 +
 +        mark_vs_dirty(s);
 +        gen_set_label(over);
 +        return true;
 +    }
 +    return false;
 +}
 +
-+#define GEN_OPIVV_WIDEN_TRANS(NAME, CHECK) \
++static bool trans_vsha2ch_vv(DisasContext *s, arg_rmrr *a)
-+static bool trans_##NAME(DisasContext *s, arg_rmrr *a)       \
++{
-+{                                                            \
++    if (vsha_check(s, a)) {
 +    static gen_helper_gvec_4_ptr * const fns[3] = {          \
 +        gen_helper_##NAME##_b,                               \
 +        gen_helper_##NAME##_h,                               \
 +        gen_helper_##NAME##_w                                \
 +    };                                                       \
 +    return do_opivv_widen(s, a, fns[s->sew], CHECK);         \
 +}
 +
 +GEN_OPIVV_WIDEN_TRANS(vwaddu_vv, opivv_widen_check)
 +GEN_OPIVV_WIDEN_TRANS(vwadd_vv, opivv_widen_check)
 +GEN_OPIVV_WIDEN_TRANS(vwsubu_vv, opivv_widen_check)
 +GEN_OPIVV_WIDEN_TRANS(vwsub_vv, opivv_widen_check)
 +
 +/* OPIVX with WIDEN */
 +static bool opivx_widen_check(DisasContext *s, arg_rmrr *a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_overlap_mask(s, a->rd, a->vm, true) &&
 +            vext_check_reg(s, a->rd, true) &&
 +            vext_check_reg(s, a->rs2, false) &&
 +            vext_check_overlap_group(a->rd, 2 << s->lmul, a->rs2,
 +                                     1 << s->lmul) &&
 +            (s->lmul < 0x3) && (s->sew < 0x3));
 +}
 +
 +static bool do_opivx_widen(DisasContext *s, arg_rmrr *a,
 +                           gen_helper_opivx *fn)
 +{
 +    if (opivx_widen_check(s, a)) {
 +        return opivx_trans(a->rd, a->rs1, a->rs2, a->vm, fn, s);
 +    }
 +    return true;
 +}
 +
 +#define GEN_OPIVX_WIDEN_TRANS(NAME) \
 +static bool trans_##NAME(DisasContext *s, arg_rmrr *a)       \
 +{                                                            \
 +    static gen_helper_opivx * const fns[3] = {               \
 +        gen_helper_##NAME##_b,                               \
 +        gen_helper_##NAME##_h,                               \
 +        gen_helper_##NAME##_w                                \
 +    };                                                       \
 +    return do_opivx_widen(s, a, fns[s->sew]);                \
 +}
 +
 +GEN_OPIVX_WIDEN_TRANS(vwaddu_vx)
 +GEN_OPIVX_WIDEN_TRANS(vwadd_vx)
 +GEN_OPIVX_WIDEN_TRANS(vwsubu_vx)
 +GEN_OPIVX_WIDEN_TRANS(vwsub_vx)
 +
 +/* WIDEN OPIVV with WIDEN */
 +static bool opiwv_widen_check(DisasContext *s, arg_rmrr *a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_overlap_mask(s, a->rd, a->vm, true) &&
 +            vext_check_reg(s, a->rd, true) &&
 +            vext_check_reg(s, a->rs2, true) &&
 +            vext_check_reg(s, a->rs1, false) &&
 +            vext_check_overlap_group(a->rd, 2 << s->lmul, a->rs1,
 +                                     1 << s->lmul) &&
 +            (s->lmul < 0x3) && (s->sew < 0x3));
 +}
 +
 +static bool do_opiwv_widen(DisasContext *s, arg_rmrr *a,
 +                           gen_helper_gvec_4_ptr *fn)
 +{
 +    if (opiwv_widen_check(s, a)) {
 +        uint32_t data = 0;
 +        TCGLabel *over = gen_new_label();
-+        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
++        TCGv_i32 egs;
 +
-+        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
++        if (!s->vstart_eq_zero || !s->vl_eq_vlmax) {
 +            /* save opcode for unwinding in case we throw an exception */
 +            decode_save_opc(s);
 +            egs = tcg_constant_i32(ZVKNH_EGS);
 +            gen_helper_egs_check(egs, cpu_env);
 +            tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
 +        }
 +
 +        data = FIELD_DP32(data, VDATA, VM, a->vm);
 +        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
-+        tcg_gen_gvec_4_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),
++        data = FIELD_DP32(data, VDATA, VTA, s->vta);
-+                           vreg_ofs(s, a->rs1),
++        data = FIELD_DP32(data, VDATA, VTA_ALL_1S, s->cfg_vta_all_1s);
-+                           vreg_ofs(s, a->rs2),
++        data = FIELD_DP32(data, VDATA, VMA, s->vma);
-+                           cpu_env, 0, s->vlen / 8, data, fn);
++
 +        tcg_gen_gvec_3_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, a->rs1),
 +            vreg_ofs(s, a->rs2), cpu_env, s->cfg_ptr->vlen / 8,
 +            s->cfg_ptr->vlen / 8, data,
 +            s->sew == MO_32 ?
 +                gen_helper_vsha2ch32_vv : gen_helper_vsha2ch64_vv);
 +
 +        mark_vs_dirty(s);
 +        gen_set_label(over);
 +        return true;
 +    }
 +    return false;
 +}
-+
-+#define GEN_OPIWV_WIDEN_TRANS(NAME) \
-+static bool trans_##NAME(DisasContext *s, arg_rmrr *a)       \
-+{                                                            \
-+    static gen_helper_gvec_4_ptr * const fns[3] = {          \
-+        gen_helper_##NAME##_b,                               \
-+        gen_helper_##NAME##_h,                               \
-+        gen_helper_##NAME##_w                                \
-+    };                                                       \
-+    return do_opiwv_widen(s, a, fns[s->sew]);                \
-+}
-+
-+GEN_OPIWV_WIDEN_TRANS(vwaddu_wv)
-+GEN_OPIWV_WIDEN_TRANS(vwadd_wv)
-+GEN_OPIWV_WIDEN_TRANS(vwsubu_wv)
-+GEN_OPIWV_WIDEN_TRANS(vwsub_wv)
-+
-+/* WIDEN OPIVX with WIDEN */
-+static bool opiwx_widen_check(DisasContext *s, arg_rmrr *a)
-+{
-+    return (vext_check_isa_ill(s) &&
-+            vext_check_overlap_mask(s, a->rd, a->vm, true) &&
-+            vext_check_reg(s, a->rd, true) &&
-+            vext_check_reg(s, a->rs2, true) &&
-+            (s->lmul < 0x3) && (s->sew < 0x3));
-+}
-+
-+static bool do_opiwx_widen(DisasContext *s, arg_rmrr *a,
-+                           gen_helper_opivx *fn)
-+{
-+    if (opiwx_widen_check(s, a)) {
-+        return opivx_trans(a->rd, a->rs1, a->rs2, a->vm, fn, s);
-+    }
-+    return false;
-+}
-+
-+#define GEN_OPIWX_WIDEN_TRANS(NAME) \
-+static bool trans_##NAME(DisasContext *s, arg_rmrr *a)       \
-+{                                                            \
-+    static gen_helper_opivx * const fns[3] = {               \
-+        gen_helper_##NAME##_b,                               \
-+        gen_helper_##NAME##_h,                               \
-+        gen_helper_##NAME##_w                                \
-+    };                                                       \
-+    return do_opiwx_widen(s, a, fns[s->sew]);                \
-+}
-+
-+GEN_OPIWX_WIDEN_TRANS(vwaddu_wx)
-+GEN_OPIWX_WIDEN_TRANS(vwadd_wx)
-+GEN_OPIWX_WIDEN_TRANS(vwsubu_wx)
-+GEN_OPIWX_WIDEN_TRANS(vwsub_wx)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ void HELPER(vec_rsubs64)(void *d, void *a, uint64_t b, uint32_t desc)
-         *(uint64_t *)(d + i) = b - *(uint64_t *)(a + i);
-     }
- }
-+
-+/* Vector Widening Integer Add/Subtract */
-+#define WOP_UUU_B uint16_t, uint8_t, uint8_t, uint16_t, uint16_t
-+#define WOP_UUU_H uint32_t, uint16_t, uint16_t, uint32_t, uint32_t
-+#define WOP_UUU_W uint64_t, uint32_t, uint32_t, uint64_t, uint64_t
-+#define WOP_SSS_B int16_t, int8_t, int8_t, int16_t, int16_t
-+#define WOP_SSS_H int32_t, int16_t, int16_t, int32_t, int32_t
-+#define WOP_SSS_W int64_t, int32_t, int32_t, int64_t, int64_t
-+#define WOP_WUUU_B  uint16_t, uint8_t, uint16_t, uint16_t, uint16_t
-+#define WOP_WUUU_H  uint32_t, uint16_t, uint32_t, uint32_t, uint32_t
-+#define WOP_WUUU_W  uint64_t, uint32_t, uint64_t, uint64_t, uint64_t
-+#define WOP_WSSS_B  int16_t, int8_t, int16_t, int16_t, int16_t
-+#define WOP_WSSS_H  int32_t, int16_t, int32_t, int32_t, int32_t
-+#define WOP_WSSS_W  int64_t, int32_t, int64_t, int64_t, int64_t
-+RVVCALL(OPIVV2, vwaddu_vv_b, WOP_UUU_B, H2, H1, H1, DO_ADD)
-+RVVCALL(OPIVV2, vwaddu_vv_h, WOP_UUU_H, H4, H2, H2, DO_ADD)
-+RVVCALL(OPIVV2, vwaddu_vv_w, WOP_UUU_W, H8, H4, H4, DO_ADD)
-+RVVCALL(OPIVV2, vwsubu_vv_b, WOP_UUU_B, H2, H1, H1, DO_SUB)
-+RVVCALL(OPIVV2, vwsubu_vv_h, WOP_UUU_H, H4, H2, H2, DO_SUB)
-+RVVCALL(OPIVV2, vwsubu_vv_w, WOP_UUU_W, H8, H4, H4, DO_SUB)
-+RVVCALL(OPIVV2, vwadd_vv_b, WOP_SSS_B, H2, H1, H1, DO_ADD)
-+RVVCALL(OPIVV2, vwadd_vv_h, WOP_SSS_H, H4, H2, H2, DO_ADD)
-+RVVCALL(OPIVV2, vwadd_vv_w, WOP_SSS_W, H8, H4, H4, DO_ADD)
-+RVVCALL(OPIVV2, vwsub_vv_b, WOP_SSS_B, H2, H1, H1, DO_SUB)
-+RVVCALL(OPIVV2, vwsub_vv_h, WOP_SSS_H, H4, H2, H2, DO_SUB)
-+RVVCALL(OPIVV2, vwsub_vv_w, WOP_SSS_W, H8, H4, H4, DO_SUB)
-+RVVCALL(OPIVV2, vwaddu_wv_b, WOP_WUUU_B, H2, H1, H1, DO_ADD)
-+RVVCALL(OPIVV2, vwaddu_wv_h, WOP_WUUU_H, H4, H2, H2, DO_ADD)
-+RVVCALL(OPIVV2, vwaddu_wv_w, WOP_WUUU_W, H8, H4, H4, DO_ADD)
-+RVVCALL(OPIVV2, vwsubu_wv_b, WOP_WUUU_B, H2, H1, H1, DO_SUB)
-+RVVCALL(OPIVV2, vwsubu_wv_h, WOP_WUUU_H, H4, H2, H2, DO_SUB)
-+RVVCALL(OPIVV2, vwsubu_wv_w, WOP_WUUU_W, H8, H4, H4, DO_SUB)
-+RVVCALL(OPIVV2, vwadd_wv_b, WOP_WSSS_B, H2, H1, H1, DO_ADD)
-+RVVCALL(OPIVV2, vwadd_wv_h, WOP_WSSS_H, H4, H2, H2, DO_ADD)
-+RVVCALL(OPIVV2, vwadd_wv_w, WOP_WSSS_W, H8, H4, H4, DO_ADD)
-+RVVCALL(OPIVV2, vwsub_wv_b, WOP_WSSS_B, H2, H1, H1, DO_SUB)
-+RVVCALL(OPIVV2, vwsub_wv_h, WOP_WSSS_H, H4, H2, H2, DO_SUB)
-+RVVCALL(OPIVV2, vwsub_wv_w, WOP_WSSS_W, H8, H4, H4, DO_SUB)
-+GEN_VEXT_VV(vwaddu_vv_b, 1, 2, clearh)
-+GEN_VEXT_VV(vwaddu_vv_h, 2, 4, clearl)
-+GEN_VEXT_VV(vwaddu_vv_w, 4, 8, clearq)
-+GEN_VEXT_VV(vwsubu_vv_b, 1, 2, clearh)
-+GEN_VEXT_VV(vwsubu_vv_h, 2, 4, clearl)
-+GEN_VEXT_VV(vwsubu_vv_w, 4, 8, clearq)
-+GEN_VEXT_VV(vwadd_vv_b, 1, 2, clearh)
-+GEN_VEXT_VV(vwadd_vv_h, 2, 4, clearl)
-+GEN_VEXT_VV(vwadd_vv_w, 4, 8, clearq)
-+GEN_VEXT_VV(vwsub_vv_b, 1, 2, clearh)
-+GEN_VEXT_VV(vwsub_vv_h, 2, 4, clearl)
-+GEN_VEXT_VV(vwsub_vv_w, 4, 8, clearq)
-+GEN_VEXT_VV(vwaddu_wv_b, 1, 2, clearh)
-+GEN_VEXT_VV(vwaddu_wv_h, 2, 4, clearl)
-+GEN_VEXT_VV(vwaddu_wv_w, 4, 8, clearq)
-+GEN_VEXT_VV(vwsubu_wv_b, 1, 2, clearh)
-+GEN_VEXT_VV(vwsubu_wv_h, 2, 4, clearl)
-+GEN_VEXT_VV(vwsubu_wv_w, 4, 8, clearq)
-+GEN_VEXT_VV(vwadd_wv_b, 1, 2, clearh)
-+GEN_VEXT_VV(vwadd_wv_h, 2, 4, clearl)
-+GEN_VEXT_VV(vwadd_wv_w, 4, 8, clearq)
-+GEN_VEXT_VV(vwsub_wv_b, 1, 2, clearh)
-+GEN_VEXT_VV(vwsub_wv_h, 2, 4, clearl)
-+GEN_VEXT_VV(vwsub_wv_w, 4, 8, clearq)
-+
-+RVVCALL(OPIVX2, vwaddu_vx_b, WOP_UUU_B, H2, H1, DO_ADD)
-+RVVCALL(OPIVX2, vwaddu_vx_h, WOP_UUU_H, H4, H2, DO_ADD)
-+RVVCALL(OPIVX2, vwaddu_vx_w, WOP_UUU_W, H8, H4, DO_ADD)
-+RVVCALL(OPIVX2, vwsubu_vx_b, WOP_UUU_B, H2, H1, DO_SUB)
-+RVVCALL(OPIVX2, vwsubu_vx_h, WOP_UUU_H, H4, H2, DO_SUB)
-+RVVCALL(OPIVX2, vwsubu_vx_w, WOP_UUU_W, H8, H4, DO_SUB)
-+RVVCALL(OPIVX2, vwadd_vx_b, WOP_SSS_B, H2, H1, DO_ADD)
-+RVVCALL(OPIVX2, vwadd_vx_h, WOP_SSS_H, H4, H2, DO_ADD)
-+RVVCALL(OPIVX2, vwadd_vx_w, WOP_SSS_W, H8, H4, DO_ADD)
-+RVVCALL(OPIVX2, vwsub_vx_b, WOP_SSS_B, H2, H1, DO_SUB)
-+RVVCALL(OPIVX2, vwsub_vx_h, WOP_SSS_H, H4, H2, DO_SUB)
-+RVVCALL(OPIVX2, vwsub_vx_w, WOP_SSS_W, H8, H4, DO_SUB)
-+RVVCALL(OPIVX2, vwaddu_wx_b, WOP_WUUU_B, H2, H1, DO_ADD)
-+RVVCALL(OPIVX2, vwaddu_wx_h, WOP_WUUU_H, H4, H2, DO_ADD)
-+RVVCALL(OPIVX2, vwaddu_wx_w, WOP_WUUU_W, H8, H4, DO_ADD)
-+RVVCALL(OPIVX2, vwsubu_wx_b, WOP_WUUU_B, H2, H1, DO_SUB)
-+RVVCALL(OPIVX2, vwsubu_wx_h, WOP_WUUU_H, H4, H2, DO_SUB)
-+RVVCALL(OPIVX2, vwsubu_wx_w, WOP_WUUU_W, H8, H4, DO_SUB)
-+RVVCALL(OPIVX2, vwadd_wx_b, WOP_WSSS_B, H2, H1, DO_ADD)
-+RVVCALL(OPIVX2, vwadd_wx_h, WOP_WSSS_H, H4, H2, DO_ADD)
-+RVVCALL(OPIVX2, vwadd_wx_w, WOP_WSSS_W, H8, H4, DO_ADD)
-+RVVCALL(OPIVX2, vwsub_wx_b, WOP_WSSS_B, H2, H1, DO_SUB)
-+RVVCALL(OPIVX2, vwsub_wx_h, WOP_WSSS_H, H4, H2, DO_SUB)
-+RVVCALL(OPIVX2, vwsub_wx_w, WOP_WSSS_W, H8, H4, DO_SUB)
-+GEN_VEXT_VX(vwaddu_vx_b, 1, 2, clearh)
-+GEN_VEXT_VX(vwaddu_vx_h, 2, 4, clearl)
-+GEN_VEXT_VX(vwaddu_vx_w, 4, 8, clearq)
-+GEN_VEXT_VX(vwsubu_vx_b, 1, 2, clearh)
-+GEN_VEXT_VX(vwsubu_vx_h, 2, 4, clearl)
-+GEN_VEXT_VX(vwsubu_vx_w, 4, 8, clearq)
-+GEN_VEXT_VX(vwadd_vx_b, 1, 2, clearh)
-+GEN_VEXT_VX(vwadd_vx_h, 2, 4, clearl)
-+GEN_VEXT_VX(vwadd_vx_w, 4, 8, clearq)
-+GEN_VEXT_VX(vwsub_vx_b, 1, 2, clearh)
-+GEN_VEXT_VX(vwsub_vx_h, 2, 4, clearl)
-+GEN_VEXT_VX(vwsub_vx_w, 4, 8, clearq)
-+GEN_VEXT_VX(vwaddu_wx_b, 1, 2, clearh)
-+GEN_VEXT_VX(vwaddu_wx_h, 2, 4, clearl)
-+GEN_VEXT_VX(vwaddu_wx_w, 4, 8, clearq)
-+GEN_VEXT_VX(vwsubu_wx_b, 1, 2, clearh)
-+GEN_VEXT_VX(vwsubu_wx_h, 2, 4, clearl)
-+GEN_VEXT_VX(vwsubu_wx_w, 4, 8, clearq)
-+GEN_VEXT_VX(vwadd_wx_b, 1, 2, clearh)
-+GEN_VEXT_VX(vwadd_wx_h, 2, 4, clearl)
-+GEN_VEXT_VX(vwadd_wx_w, 4, 8, clearq)
-+GEN_VEXT_VX(vwsub_wx_b, 1, 2, clearh)
-+GEN_VEXT_VX(vwsub_wx_h, 2, 4, clearl)
-+GEN_VEXT_VX(vwsub_wx_w, 4, 8, clearq)
 --
-.27.0
+.41.0

-[PULL 44/63] target/riscv: vector floating-point/integer type-convert instructions
+[PULL v2 18/45] target/riscv: Add Zvksh ISA extension support
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Lawrence Hunter <lawrence.hunter@codethink.co.uk>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+This commit adds support for the Zvksh vector-crypto extension, which
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+consists of the following instructions:
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-43-zhiwei_liu@c-sky.com
+* vsm3me.vv
 * vsm3c.vi
 Translation functions are defined in
 `target/riscv/insn_trans/trans_rvvk.c.inc` and helpers are defined in
 `target/riscv/vcrypto_helper.c`.
 Co-authored-by: Kiran Ostrolenk <kiran.ostrolenk@codethink.co.uk>
 [max.chou@sifive.com: Replaced vstart checking by TCG op]
 Signed-off-by: Kiran Ostrolenk <kiran.ostrolenk@codethink.co.uk>
 Signed-off-by: Lawrence Hunter <lawrence.hunter@codethink.co.uk>
 Signed-off-by: Max Chou <max.chou@sifive.com>
 Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 [max.chou@sifive.com: Exposed x-zvksh property]
 Message-ID: <20230711165917.2629866-12-max.chou@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   | 13 ++++++++++
+ target/riscv/cpu_cfg.h                   |   1 +
- target/riscv/insn32.decode              |  4 +++
+ target/riscv/helper.h                    |   3 +
- target/riscv/insn_trans/trans_rvv.inc.c |  6 +++++
+ target/riscv/insn32.decode               |   4 +
- target/riscv/vector_helper.c            | 33 +++++++++++++++++++++++++
+ target/riscv/cpu.c                       |   6 +-
-files changed, 56 insertions(+)
+ target/riscv/vcrypto_helper.c            | 134 +++++++++++++++++++++++
+ target/riscv/insn_trans/trans_rvvk.c.inc |  31 ++++++
 files changed, 177 insertions(+), 2 deletions(-)
 diff --git a/target/riscv/cpu_cfg.h b/target/riscv/cpu_cfg.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/cpu_cfg.h
 +++ b/target/riscv/cpu_cfg.h
@@ -XXX,XX +XXX,XX @@ struct RISCVCPUConfig {
      bool ext_zvkned;
      bool ext_zvknha;
      bool ext_zvknhb;
 +    bool ext_zvksh;
      bool ext_zmmul;
      bool ext_zvfbfmin;
      bool ext_zvfbfwma;
 diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/helper.h
 +++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_5(vfclass_v_d, void, ptr, ptr, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_5(vsha2ch32_vv, void, ptr, ptr, ptr, env, i32)
- DEF_HELPER_6(vfmerge_vfm_h, void, ptr, ptr, i64, ptr, env, i32)
+ DEF_HELPER_5(vsha2ch64_vv, void, ptr, ptr, ptr, env, i32)
- DEF_HELPER_6(vfmerge_vfm_w, void, ptr, ptr, i64, ptr, env, i32)
+ DEF_HELPER_5(vsha2cl32_vv, void, ptr, ptr, ptr, env, i32)
- DEF_HELPER_6(vfmerge_vfm_d, void, ptr, ptr, i64, ptr, env, i32)
+ DEF_HELPER_5(vsha2cl64_vv, void, ptr, ptr, ptr, env, i32)
 +
-+DEF_HELPER_5(vfcvt_xu_f_v_h, void, ptr, ptr, ptr, env, i32)
++DEF_HELPER_5(vsm3me_vv, void, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_5(vfcvt_xu_f_v_w, void, ptr, ptr, ptr, env, i32)
++DEF_HELPER_5(vsm3c_vi, void, ptr, ptr, i32, env, i32)
 +DEF_HELPER_5(vfcvt_xu_f_v_d, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_5(vfcvt_x_f_v_h, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_5(vfcvt_x_f_v_w, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_5(vfcvt_x_f_v_d, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_5(vfcvt_f_xu_v_h, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_5(vfcvt_f_xu_v_w, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_5(vfcvt_f_xu_v_d, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_5(vfcvt_f_x_v_h, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_5(vfcvt_f_x_v_w, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_5(vfcvt_f_x_v_d, void, ptr, ptr, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vmford_vf       011010 . ..... ..... 101 ..... 1010111 @r_vm
+@@ -XXX,XX +XXX,XX @@ vaeskf2_vi  101010 1 ..... ..... 010 ..... 1110111 @r_vm_1
- vfclass_v       100011 . ..... 10000 001 ..... 1010111 @r2_vm
+ vsha2ms_vv  101101 1 ..... ..... 010 ..... 1110111 @r_vm_1
- vfmerge_vfm     010111 0 ..... ..... 101 ..... 1010111 @r_vm_0
+ vsha2ch_vv  101110 1 ..... ..... 010 ..... 1110111 @r_vm_1
- vfmv_v_f        010111 1 00000 ..... 101 ..... 1010111 @r2
+ vsha2cl_vv  101111 1 ..... ..... 010 ..... 1110111 @r_vm_1
-+vfcvt_xu_f_v    100010 . ..... 00000 001 ..... 1010111 @r2_vm
++
-+vfcvt_x_f_v     100010 . ..... 00001 001 ..... 1010111 @r2_vm
++# *** Zvksh vector crypto extension ***
-+vfcvt_f_xu_v    100010 . ..... 00010 001 ..... 1010111 @r2_vm
++vsm3me_vv   100000 1 ..... ..... 010 ..... 1110111 @r_vm_1
-+vfcvt_f_x_v     100010 . ..... 00011 001 ..... 1010111 @r2_vm
++vsm3c_vi    101011 1 ..... ..... 010 ..... 1110111 @r_vm_1
+diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
+index XXXXXXX..XXXXXXX 100644
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
+--- a/target/riscv/cpu.c
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
++++ b/target/riscv/cpu.c
-index XXXXXXX..XXXXXXX 100644
+@@ -XXX,XX +XXX,XX @@ static const struct isa_ext_data isa_edata_arr[] = {
---- a/target/riscv/insn_trans/trans_rvv.inc.c
+     ISA_EXT_DATA_ENTRY(zvkned, PRIV_VERSION_1_12_0, ext_zvkned),
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
+     ISA_EXT_DATA_ENTRY(zvknha, PRIV_VERSION_1_12_0, ext_zvknha),
-@@ -XXX,XX +XXX,XX @@ static bool trans_vfmv_v_f(DisasContext *s, arg_vfmv_v_f *a)
+     ISA_EXT_DATA_ENTRY(zvknhb, PRIV_VERSION_1_12_0, ext_zvknhb),
 +    ISA_EXT_DATA_ENTRY(zvksh, PRIV_VERSION_1_12_0, ext_zvksh),
      ISA_EXT_DATA_ENTRY(zhinx, PRIV_VERSION_1_12_0, ext_zhinx),
      ISA_EXT_DATA_ENTRY(zhinxmin, PRIV_VERSION_1_12_0, ext_zhinxmin),
      ISA_EXT_DATA_ENTRY(smaia, PRIV_VERSION_1_12_0, ext_smaia),
@@ -XXX,XX +XXX,XX @@ void riscv_cpu_validate_set_extensions(RISCVCPU *cpu, Error **errp)
       * In principle Zve*x would also suffice here, were they supported
       * in qemu
       */
 -    if ((cpu->cfg.ext_zvbb || cpu->cfg.ext_zvkned || cpu->cfg.ext_zvknha) &&
 -        !cpu->cfg.ext_zve32f) {
 +    if ((cpu->cfg.ext_zvbb || cpu->cfg.ext_zvkned || cpu->cfg.ext_zvknha ||
 +         cpu->cfg.ext_zvksh) && !cpu->cfg.ext_zve32f) {
          error_setg(errp,
                     "Vector crypto extensions require V or Zve* extensions");
          return;
@@ -XXX,XX +XXX,XX @@ static Property riscv_cpu_extensions[] = {
      DEFINE_PROP_BOOL("x-zvkned", RISCVCPU, cfg.ext_zvkned, false),
      DEFINE_PROP_BOOL("x-zvknha", RISCVCPU, cfg.ext_zvknha, false),
      DEFINE_PROP_BOOL("x-zvknhb", RISCVCPU, cfg.ext_zvknhb, false),
 +    DEFINE_PROP_BOOL("x-zvksh", RISCVCPU, cfg.ext_zvksh, false),
      DEFINE_PROP_END_OF_LIST(),
  };
 diff --git a/target/riscv/vcrypto_helper.c b/target/riscv/vcrypto_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vcrypto_helper.c
 +++ b/target/riscv/vcrypto_helper.c
@@ -XXX,XX +XXX,XX @@ void HELPER(vsha2cl64_vv)(void *vd, void *vs1, void *vs2, CPURISCVState *env,
      vext_set_elems_1s(vd, vta, env->vl * esz, total_elems * esz);
      env->vstart = 0;
  }
 +
 +static inline uint32_t p1(uint32_t x)
 +{
 +    return x ^ rol32(x, 15) ^ rol32(x, 23);
 +}
 +
 +static inline uint32_t zvksh_w(uint32_t m16, uint32_t m9, uint32_t m3,
 +                               uint32_t m13, uint32_t m6)
 +{
 +    return p1(m16 ^ m9 ^ rol32(m3, 15)) ^ rol32(m13, 7) ^ m6;
 +}
 +
 +void HELPER(vsm3me_vv)(void *vd_vptr, void *vs1_vptr, void *vs2_vptr,
 +                       CPURISCVState *env, uint32_t desc)
 +{
 +    uint32_t esz = memop_size(FIELD_EX64(env->vtype, VTYPE, VSEW));
 +    uint32_t total_elems = vext_get_total_elems(env, desc, esz);
 +    uint32_t vta = vext_vta(desc);
 +    uint32_t *vd = vd_vptr;
 +    uint32_t *vs1 = vs1_vptr;
 +    uint32_t *vs2 = vs2_vptr;
 +
 +    for (int i = env->vstart / 8; i < env->vl / 8; i++) {
 +        uint32_t w[24];
 +        for (int j = 0; j < 8; j++) {
 +            w[j] = bswap32(vs1[H4((i * 8) + j)]);
 +            w[j + 8] = bswap32(vs2[H4((i * 8) + j)]);
 +        }
 +        for (int j = 0; j < 8; j++) {
 +            w[j + 16] =
 +                zvksh_w(w[j], w[j + 7], w[j + 13], w[j + 3], w[j + 10]);
 +        }
 +        for (int j = 0; j < 8; j++) {
 +            vd[(i * 8) + j] = bswap32(w[H4(j + 16)]);
 +        }
 +    }
 +    vext_set_elems_1s(vd_vptr, vta, env->vl * esz, total_elems * esz);
 +    env->vstart = 0;
 +}
 +
 +static inline uint32_t ff1(uint32_t x, uint32_t y, uint32_t z)
 +{
 +    return x ^ y ^ z;
 +}
 +
 +static inline uint32_t ff2(uint32_t x, uint32_t y, uint32_t z)
 +{
 +    return (x & y) | (x & z) | (y & z);
 +}
 +
 +static inline uint32_t ff_j(uint32_t x, uint32_t y, uint32_t z, uint32_t j)
 +{
 +    return (j <= 15) ? ff1(x, y, z) : ff2(x, y, z);
 +}
 +
 +static inline uint32_t gg1(uint32_t x, uint32_t y, uint32_t z)
 +{
 +    return x ^ y ^ z;
 +}
 +
 +static inline uint32_t gg2(uint32_t x, uint32_t y, uint32_t z)
 +{
 +    return (x & y) | (~x & z);
 +}
 +
 +static inline uint32_t gg_j(uint32_t x, uint32_t y, uint32_t z, uint32_t j)
 +{
 +    return (j <= 15) ? gg1(x, y, z) : gg2(x, y, z);
 +}
 +
 +static inline uint32_t t_j(uint32_t j)
 +{
 +    return (j <= 15) ? 0x79cc4519 : 0x7a879d8a;
 +}
 +
 +static inline uint32_t p_0(uint32_t x)
 +{
 +    return x ^ rol32(x, 9) ^ rol32(x, 17);
 +}
 +
 +static void sm3c(uint32_t *vd, uint32_t *vs1, uint32_t *vs2, uint32_t uimm)
 +{
 +    uint32_t x0, x1;
 +    uint32_t j;
 +    uint32_t ss1, ss2, tt1, tt2;
 +    x0 = vs2[0] ^ vs2[4];
 +    x1 = vs2[1] ^ vs2[5];
 +    j = 2 * uimm;
 +    ss1 = rol32(rol32(vs1[0], 12) + vs1[4] + rol32(t_j(j), j % 32), 7);
 +    ss2 = ss1 ^ rol32(vs1[0], 12);
 +    tt1 = ff_j(vs1[0], vs1[1], vs1[2], j) + vs1[3] + ss2 + x0;
 +    tt2 = gg_j(vs1[4], vs1[5], vs1[6], j) + vs1[7] + ss1 + vs2[0];
 +    vs1[3] = vs1[2];
 +    vd[3] = rol32(vs1[1], 9);
 +    vs1[1] = vs1[0];
 +    vd[1] = tt1;
 +    vs1[7] = vs1[6];
 +    vd[7] = rol32(vs1[5], 19);
 +    vs1[5] = vs1[4];
 +    vd[5] = p_0(tt2);
 +    j = 2 * uimm + 1;
 +    ss1 = rol32(rol32(vd[1], 12) + vd[5] + rol32(t_j(j), j % 32), 7);
 +    ss2 = ss1 ^ rol32(vd[1], 12);
 +    tt1 = ff_j(vd[1], vs1[1], vd[3], j) + vs1[3] + ss2 + x1;
 +    tt2 = gg_j(vd[5], vs1[5], vd[7], j) + vs1[7] + ss1 + vs2[1];
 +    vd[2] = rol32(vs1[1], 9);
 +    vd[0] = tt1;
 +    vd[6] = rol32(vs1[5], 19);
 +    vd[4] = p_0(tt2);
 +}
 +
 +void HELPER(vsm3c_vi)(void *vd_vptr, void *vs2_vptr, uint32_t uimm,
 +                      CPURISCVState *env, uint32_t desc)
 +{
 +    uint32_t esz = memop_size(FIELD_EX64(env->vtype, VTYPE, VSEW));
 +    uint32_t total_elems = vext_get_total_elems(env, desc, esz);
 +    uint32_t vta = vext_vta(desc);
 +    uint32_t *vd = vd_vptr;
 +    uint32_t *vs2 = vs2_vptr;
 +    uint32_t v1[8], v2[8], v3[8];
 +
 +    for (int i = env->vstart / 8; i < env->vl / 8; i++) {
 +        for (int k = 0; k < 8; k++) {
 +            v2[k] = bswap32(vd[H4(i * 8 + k)]);
 +            v3[k] = bswap32(vs2[H4(i * 8 + k)]);
 +        }
 +        sm3c(v1, v2, v3, uimm);
 +        for (int k = 0; k < 8; k++) {
 +            vd[i * 8 + k] = bswap32(v1[H4(k)]);
 +        }
 +    }
 +    vext_set_elems_1s(vd_vptr, vta, env->vl * esz, total_elems * esz);
 +    env->vstart = 0;
 +}
 diff --git a/target/riscv/insn_trans/trans_rvvk.c.inc b/target/riscv/insn_trans/trans_rvvk.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvvk.c.inc
 +++ b/target/riscv/insn_trans/trans_rvvk.c.inc
@@ -XXX,XX +XXX,XX @@ static bool trans_vsha2ch_vv(DisasContext *s, arg_rmrr *a)
      }
      return false;
  }
 +
-+/* Single-Width Floating-Point/Integer Type-Convert Instructions */
++/*
-+GEN_OPFV_TRANS(vfcvt_xu_f_v, opfv_check)
++ * Zvksh
-+GEN_OPFV_TRANS(vfcvt_x_f_v, opfv_check)
++ */
-+GEN_OPFV_TRANS(vfcvt_f_xu_v, opfv_check)
++
-+GEN_OPFV_TRANS(vfcvt_f_x_v, opfv_check)
++#define ZVKSH_EGS 8
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
++
-index XXXXXXX..XXXXXXX 100644
++static inline bool vsm3_check(DisasContext *s, arg_rmrr *a)
---- a/target/riscv/vector_helper.c
++{
-+++ b/target/riscv/vector_helper.c
++    int egw_bytes = ZVKSH_EGS << s->sew;
-@@ -XXX,XX +XXX,XX @@ void HELPER(NAME)(void *vd, void *v0, uint64_t s1, void *vs2, \
++    int mult = 1 << MAX(s->lmul, 0);
- GEN_VFMERGE_VF(vfmerge_vfm_h, int16_t, H2, clearh)
++    return s->cfg_ptr->ext_zvksh == true &&
- GEN_VFMERGE_VF(vfmerge_vfm_w, int32_t, H4, clearl)
++           require_rvv(s) &&
- GEN_VFMERGE_VF(vfmerge_vfm_d, int64_t, H8, clearq)
++           vext_check_isa_ill(s) &&
-+
++           !is_overlapped(a->rd, mult, a->rs2, mult) &&
-+/* Single-Width Floating-Point/Integer Type-Convert Instructions */
++           MAXSZ(s) >= egw_bytes &&
-+/* vfcvt.xu.f.v vd, vs2, vm # Convert float to unsigned integer. */
++           s->sew == MO_32;
-+RVVCALL(OPFVV1, vfcvt_xu_f_v_h, OP_UU_H, H2, H2, float16_to_uint16)
++}
-+RVVCALL(OPFVV1, vfcvt_xu_f_v_w, OP_UU_W, H4, H4, float32_to_uint32)
++
-+RVVCALL(OPFVV1, vfcvt_xu_f_v_d, OP_UU_D, H8, H8, float64_to_uint64)
++static inline bool vsm3me_check(DisasContext *s, arg_rmrr *a)
-+GEN_VEXT_V_ENV(vfcvt_xu_f_v_h, 2, 2, clearh)
++{
-+GEN_VEXT_V_ENV(vfcvt_xu_f_v_w, 4, 4, clearl)
++    return vsm3_check(s, a) && vext_check_sss(s, a->rd, a->rs1, a->rs2, a->vm);
-+GEN_VEXT_V_ENV(vfcvt_xu_f_v_d, 8, 8, clearq)
++}
 +
-+/* vfcvt.x.f.v vd, vs2, vm # Convert float to signed integer. */
++static inline bool vsm3c_check(DisasContext *s, arg_rmrr *a)
-+RVVCALL(OPFVV1, vfcvt_x_f_v_h, OP_UU_H, H2, H2, float16_to_int16)
++{
-+RVVCALL(OPFVV1, vfcvt_x_f_v_w, OP_UU_W, H4, H4, float32_to_int32)
++    return vsm3_check(s, a) && vext_check_ss(s, a->rd, a->rs2, a->vm);
-+RVVCALL(OPFVV1, vfcvt_x_f_v_d, OP_UU_D, H8, H8, float64_to_int64)
++}
-+GEN_VEXT_V_ENV(vfcvt_x_f_v_h, 2, 2, clearh)
++
-+GEN_VEXT_V_ENV(vfcvt_x_f_v_w, 4, 4, clearl)
++GEN_VV_UNMASKED_TRANS(vsm3me_vv, vsm3me_check, ZVKSH_EGS)
-+GEN_VEXT_V_ENV(vfcvt_x_f_v_d, 8, 8, clearq)
++GEN_VI_UNMASKED_TRANS(vsm3c_vi, vsm3c_check, ZVKSH_EGS)
 +
 +/* vfcvt.f.xu.v vd, vs2, vm # Convert unsigned integer to float. */
 +RVVCALL(OPFVV1, vfcvt_f_xu_v_h, OP_UU_H, H2, H2, uint16_to_float16)
 +RVVCALL(OPFVV1, vfcvt_f_xu_v_w, OP_UU_W, H4, H4, uint32_to_float32)
 +RVVCALL(OPFVV1, vfcvt_f_xu_v_d, OP_UU_D, H8, H8, uint64_to_float64)
 +GEN_VEXT_V_ENV(vfcvt_f_xu_v_h, 2, 2, clearh)
 +GEN_VEXT_V_ENV(vfcvt_f_xu_v_w, 4, 4, clearl)
 +GEN_VEXT_V_ENV(vfcvt_f_xu_v_d, 8, 8, clearq)
 +
 +/* vfcvt.f.x.v vd, vs2, vm # Convert integer to float. */
 +RVVCALL(OPFVV1, vfcvt_f_x_v_h, OP_UU_H, H2, H2, int16_to_float16)
 +RVVCALL(OPFVV1, vfcvt_f_x_v_w, OP_UU_W, H4, H4, int32_to_float32)
 +RVVCALL(OPFVV1, vfcvt_f_x_v_d, OP_UU_D, H8, H8, int64_to_float64)
 +GEN_VEXT_V_ENV(vfcvt_f_x_v_h, 2, 2, clearh)
 +GEN_VEXT_V_ENV(vfcvt_f_x_v_w, 4, 4, clearl)
 +GEN_VEXT_V_ENV(vfcvt_f_x_v_d, 8, 8, clearq)
 --
-.27.0
+.41.0

-[PULL 60/63] target/riscv: vector slide instructions
+[PULL v2 19/45] target/riscv: Add Zvkg ISA extension support
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Nazar Kazakov <nazar.kazakov@codethink.co.uk>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+This commit adds support for the Zvkg vector-crypto extension, which
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+consists of the following instructions:
-Message-id: 20200623215920.2594-59-zhiwei_liu@c-sky.com
 * vgmul.vv
 * vghsh.vv
 Translation functions are defined in
 `target/riscv/insn_trans/trans_rvvk.c.inc` and helpers are defined in
 `target/riscv/vcrypto_helper.c`.
 Co-authored-by: Lawrence Hunter <lawrence.hunter@codethink.co.uk>
 [max.chou@sifive.com: Replaced vstart checking by TCG op]
 Signed-off-by: Lawrence Hunter <lawrence.hunter@codethink.co.uk>
 Signed-off-by: Nazar Kazakov <nazar.kazakov@codethink.co.uk>
 Signed-off-by: Max Chou <max.chou@sifive.com>
 Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 [max.chou@sifive.com: Exposed x-zvkg property]
 [max.chou@sifive.com: Replaced uint by int for cross win32 build]
 Message-ID: <20230711165917.2629866-13-max.chou@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   |  17 ++++
+ target/riscv/cpu_cfg.h                   |  1 +
- target/riscv/insn32.decode              |   6 ++
+ target/riscv/helper.h                    |  3 +
- target/riscv/insn_trans/trans_rvv.inc.c |  18 ++++
+ target/riscv/insn32.decode               |  4 ++
- target/riscv/vector_helper.c            | 114 ++++++++++++++++++++++++
+ target/riscv/cpu.c                       |  6 +-
-files changed, 155 insertions(+)
+ target/riscv/vcrypto_helper.c            | 72 ++++++++++++++++++++++++
+ target/riscv/insn_trans/trans_rvvk.c.inc | 30 ++++++++++
 files changed, 114 insertions(+), 2 deletions(-)
 diff --git a/target/riscv/cpu_cfg.h b/target/riscv/cpu_cfg.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/cpu_cfg.h
 +++ b/target/riscv/cpu_cfg.h
@@ -XXX,XX +XXX,XX @@ struct RISCVCPUConfig {
      bool ext_zve64d;
      bool ext_zvbb;
      bool ext_zvbc;
 +    bool ext_zvkg;
      bool ext_zvkned;
      bool ext_zvknha;
      bool ext_zvknhb;
 diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/helper.h
 +++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_4(vid_v_b, void, ptr, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_5(vsha2cl64_vv, void, ptr, ptr, ptr, env, i32)
- DEF_HELPER_4(vid_v_h, void, ptr, ptr, env, i32)
- DEF_HELPER_4(vid_v_w, void, ptr, ptr, env, i32)
+ DEF_HELPER_5(vsm3me_vv, void, ptr, ptr, ptr, env, i32)
- DEF_HELPER_4(vid_v_d, void, ptr, ptr, env, i32)
+ DEF_HELPER_5(vsm3c_vi, void, ptr, ptr, i32, env, i32)
 +
-+DEF_HELPER_6(vslideup_vx_b, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_5(vghsh_vv, void, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vslideup_vx_h, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_4(vgmul_vv, void, ptr, ptr, env, i32)
 +DEF_HELPER_6(vslideup_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vslideup_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vslidedown_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vslidedown_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vslidedown_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vslidedown_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vslide1up_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vslide1up_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vslide1up_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vslide1up_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vslide1down_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vslide1down_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vslide1down_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vslide1down_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vext_x_v        001100 1 ..... ..... 010 ..... 1010111 @r
+@@ -XXX,XX +XXX,XX @@ vsha2cl_vv  101111 1 ..... ..... 010 ..... 1110111 @r_vm_1
- vmv_s_x         001101 1 00000 ..... 110 ..... 1010111 @r2
+ # *** Zvksh vector crypto extension ***
- vfmv_f_s        001100 1 ..... 00000 001 ..... 1010111 @r2rd
+ vsm3me_vv   100000 1 ..... ..... 010 ..... 1110111 @r_vm_1
- vfmv_s_f        001101 1 00000 ..... 101 ..... 1010111 @r2
+ vsm3c_vi    101011 1 ..... ..... 010 ..... 1110111 @r_vm_1
-+vslideup_vx     001110 . ..... ..... 100 ..... 1010111 @r_vm
++
-+vslideup_vi     001110 . ..... ..... 011 ..... 1010111 @r_vm
++# *** Zvkg vector crypto extension ***
-+vslide1up_vx    001110 . ..... ..... 110 ..... 1010111 @r_vm
++vghsh_vv    101100 1 ..... ..... 010 ..... 1110111 @r_vm_1
-+vslidedown_vx   001111 . ..... ..... 100 ..... 1010111 @r_vm
++vgmul_vv    101000 1 ..... 10001 010 ..... 1110111 @r2_vm_1
-+vslidedown_vi   001111 . ..... ..... 011 ..... 1010111 @r_vm
+diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
-+vslide1down_vx  001111 . ..... ..... 110 ..... 1010111 @r_vm
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/cpu.c
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
++++ b/target/riscv/cpu.c
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
+@@ -XXX,XX +XXX,XX @@ static const struct isa_ext_data isa_edata_arr[] = {
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
+     ISA_EXT_DATA_ENTRY(zvfbfwma, PRIV_VERSION_1_12_0, ext_zvfbfwma),
-index XXXXXXX..XXXXXXX 100644
+     ISA_EXT_DATA_ENTRY(zvfh, PRIV_VERSION_1_12_0, ext_zvfh),
---- a/target/riscv/insn_trans/trans_rvv.inc.c
+     ISA_EXT_DATA_ENTRY(zvfhmin, PRIV_VERSION_1_12_0, ext_zvfhmin),
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
++    ISA_EXT_DATA_ENTRY(zvkg, PRIV_VERSION_1_12_0, ext_zvkg),
-@@ -XXX,XX +XXX,XX @@ static bool trans_vfmv_s_f(DisasContext *s, arg_vfmv_s_f *a)
+     ISA_EXT_DATA_ENTRY(zvkned, PRIV_VERSION_1_12_0, ext_zvkned),
-     }
+     ISA_EXT_DATA_ENTRY(zvknha, PRIV_VERSION_1_12_0, ext_zvknha),
-     return false;
+     ISA_EXT_DATA_ENTRY(zvknhb, PRIV_VERSION_1_12_0, ext_zvknhb),
@@ -XXX,XX +XXX,XX @@ void riscv_cpu_validate_set_extensions(RISCVCPU *cpu, Error **errp)
       * In principle Zve*x would also suffice here, were they supported
       * in qemu
       */
 -    if ((cpu->cfg.ext_zvbb || cpu->cfg.ext_zvkned || cpu->cfg.ext_zvknha ||
 -         cpu->cfg.ext_zvksh) && !cpu->cfg.ext_zve32f) {
 +    if ((cpu->cfg.ext_zvbb || cpu->cfg.ext_zvkg || cpu->cfg.ext_zvkned ||
 +         cpu->cfg.ext_zvknha || cpu->cfg.ext_zvksh) && !cpu->cfg.ext_zve32f) {
          error_setg(errp,
                     "Vector crypto extensions require V or Zve* extensions");
          return;
@@ -XXX,XX +XXX,XX @@ static Property riscv_cpu_extensions[] = {
      /* Vector cryptography extensions */
      DEFINE_PROP_BOOL("x-zvbb", RISCVCPU, cfg.ext_zvbb, false),
      DEFINE_PROP_BOOL("x-zvbc", RISCVCPU, cfg.ext_zvbc, false),
 +    DEFINE_PROP_BOOL("x-zvkg", RISCVCPU, cfg.ext_zvkg, false),
      DEFINE_PROP_BOOL("x-zvkned", RISCVCPU, cfg.ext_zvkned, false),
      DEFINE_PROP_BOOL("x-zvknha", RISCVCPU, cfg.ext_zvknha, false),
      DEFINE_PROP_BOOL("x-zvknhb", RISCVCPU, cfg.ext_zvknhb, false),
 diff --git a/target/riscv/vcrypto_helper.c b/target/riscv/vcrypto_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vcrypto_helper.c
 +++ b/target/riscv/vcrypto_helper.c
@@ -XXX,XX +XXX,XX @@ void HELPER(vsm3c_vi)(void *vd_vptr, void *vs2_vptr, uint32_t uimm,
      vext_set_elems_1s(vd_vptr, vta, env->vl * esz, total_elems * esz);
      env->vstart = 0;
  }
 +
-+/* Vector Slide Instructions */
++void HELPER(vghsh_vv)(void *vd_vptr, void *vs1_vptr, void *vs2_vptr,
-+static bool slideup_check(DisasContext *s, arg_rmrr *a)
++                      CPURISCVState *env, uint32_t desc)
 +{
-+    return (vext_check_isa_ill(s) &&
++    uint64_t *vd = vd_vptr;
-+            vext_check_overlap_mask(s, a->rd, a->vm, true) &&
++    uint64_t *vs1 = vs1_vptr;
-+            vext_check_reg(s, a->rd, false) &&
++    uint64_t *vs2 = vs2_vptr;
-+            vext_check_reg(s, a->rs2, false) &&
++    uint32_t vta = vext_vta(desc);
-+            (a->rd != a->rs2));
++    uint32_t total_elems = vext_get_total_elems(env, desc, 4);
-+}
++
-+
++    for (uint32_t i = env->vstart / 4; i < env->vl / 4; i++) {
-+GEN_OPIVX_TRANS(vslideup_vx, slideup_check)
++        uint64_t Y[2] = {vd[i * 2 + 0], vd[i * 2 + 1]};
-+GEN_OPIVX_TRANS(vslide1up_vx, slideup_check)
++        uint64_t H[2] = {brev8(vs2[i * 2 + 0]), brev8(vs2[i * 2 + 1])};
-+GEN_OPIVI_TRANS(vslideup_vi, 1, vslideup_vx, slideup_check)
++        uint64_t X[2] = {vs1[i * 2 + 0], vs1[i * 2 + 1]};
-+
++        uint64_t Z[2] = {0, 0};
-+GEN_OPIVX_TRANS(vslidedown_vx, opivx_check)
++
-+GEN_OPIVX_TRANS(vslide1down_vx, opivx_check)
++        uint64_t S[2] = {brev8(Y[0] ^ X[0]), brev8(Y[1] ^ X[1])};
-+GEN_OPIVI_TRANS(vslidedown_vi, 1, vslidedown_vx, opivx_check)
++
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
++        for (int j = 0; j < 128; j++) {
-index XXXXXXX..XXXXXXX 100644
++            if ((S[j / 64] >> (j % 64)) & 1) {
---- a/target/riscv/vector_helper.c
++                Z[0] ^= H[0];
-+++ b/target/riscv/vector_helper.c
++                Z[1] ^= H[1];
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VID_V(vid_v_b, uint8_t, H1, clearb)
++            }
- GEN_VEXT_VID_V(vid_v_h, uint16_t, H2, clearh)
++            bool reduce = ((H[1] >> 63) & 1);
- GEN_VEXT_VID_V(vid_v_w, uint32_t, H4, clearl)
++            H[1] = H[1] << 1 | H[0] >> 63;
- GEN_VEXT_VID_V(vid_v_d, uint64_t, H8, clearq)
++            H[0] = H[0] << 1;
 +            if (reduce) {
 +                H[0] ^= 0x87;
 +            }
 +        }
 +
 +        vd[i * 2 + 0] = brev8(Z[0]);
 +        vd[i * 2 + 1] = brev8(Z[1]);
 +    }
 +    /* set tail elements to 1s */
 +    vext_set_elems_1s(vd, vta, env->vl * 4, total_elems * 4);
 +    env->vstart = 0;
 +}
 +
 +void HELPER(vgmul_vv)(void *vd_vptr, void *vs2_vptr, CPURISCVState *env,
 +                      uint32_t desc)
 +{
 +    uint64_t *vd = vd_vptr;
 +    uint64_t *vs2 = vs2_vptr;
 +    uint32_t vta = vext_vta(desc);
 +    uint32_t total_elems = vext_get_total_elems(env, desc, 4);
 +
 +    for (uint32_t i = env->vstart / 4; i < env->vl / 4; i++) {
 +        uint64_t Y[2] = {brev8(vd[i * 2 + 0]), brev8(vd[i * 2 + 1])};
 +        uint64_t H[2] = {brev8(vs2[i * 2 + 0]), brev8(vs2[i * 2 + 1])};
 +        uint64_t Z[2] = {0, 0};
 +
 +        for (int j = 0; j < 128; j++) {
 +            if ((Y[j / 64] >> (j % 64)) & 1) {
 +                Z[0] ^= H[0];
 +                Z[1] ^= H[1];
 +            }
 +            bool reduce = ((H[1] >> 63) & 1);
 +            H[1] = H[1] << 1 | H[0] >> 63;
 +            H[0] = H[0] << 1;
 +            if (reduce) {
 +                H[0] ^= 0x87;
 +            }
 +        }
 +
 +        vd[i * 2 + 0] = brev8(Z[0]);
 +        vd[i * 2 + 1] = brev8(Z[1]);
 +    }
 +    /* set tail elements to 1s */
 +    vext_set_elems_1s(vd, vta, env->vl * 4, total_elems * 4);
 +    env->vstart = 0;
 +}
 diff --git a/target/riscv/insn_trans/trans_rvvk.c.inc b/target/riscv/insn_trans/trans_rvvk.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvvk.c.inc
 +++ b/target/riscv/insn_trans/trans_rvvk.c.inc
@@ -XXX,XX +XXX,XX @@ static inline bool vsm3c_check(DisasContext *s, arg_rmrr *a)
  GEN_VV_UNMASKED_TRANS(vsm3me_vv, vsm3me_check, ZVKSH_EGS)
  GEN_VI_UNMASKED_TRANS(vsm3c_vi, vsm3c_check, ZVKSH_EGS)
 +
 +/*
-+ *** Vector Permutation Instructions
++ * Zvkg
 + */
 +
-+/* Vector Slide Instructions */
++#define ZVKG_EGS 4
-+#define GEN_VEXT_VSLIDEUP_VX(NAME, ETYPE, H, CLEAR_FN)                    \
++
-+void HELPER(NAME)(void *vd, void *v0, target_ulong s1, void *vs2,         \
++static bool vgmul_check(DisasContext *s, arg_rmr *a)
-+                  CPURISCVState *env, uint32_t desc)                      \
++{
-+{                                                                         \
++    int egw_bytes = ZVKG_EGS << s->sew;
-+    uint32_t mlen = vext_mlen(desc);                                      \
++    return s->cfg_ptr->ext_zvkg == true &&
-+    uint32_t vlmax = env_archcpu(env)->cfg.vlen / mlen;                   \
++           vext_check_isa_ill(s) &&
-+    uint32_t vm = vext_vm(desc);                                          \
++           require_rvv(s) &&
-+    uint32_t vl = env->vl;                                                \
++           MAXSZ(s) >= egw_bytes &&
-+    target_ulong offset = s1, i;                                          \
++           vext_check_ss(s, a->rd, a->rs2, a->vm) &&
-+                                                                          \
++           s->sew == MO_32;
-+    for (i = offset; i < vl; i++) {                                       \
++}
-+        if (!vm && !vext_elem_mask(v0, mlen, i)) {                        \
++
-+            continue;                                                     \
++GEN_V_UNMASKED_TRANS(vgmul_vv, vgmul_check, ZVKG_EGS)
-+        }                                                                 \
++
-+        *((ETYPE *)vd + H(i)) = *((ETYPE *)vs2 + H(i - offset));          \
++static bool vghsh_check(DisasContext *s, arg_rmrr *a)
-+    }                                                                     \
++{
-+    CLEAR_FN(vd, vl, vl * sizeof(ETYPE), vlmax * sizeof(ETYPE));          \
++    int egw_bytes = ZVKG_EGS << s->sew;
-+}
++    return s->cfg_ptr->ext_zvkg == true &&
-+
++           opivv_check(s, a) &&
-+/* vslideup.vx vd, vs2, rs1, vm # vd[i+rs1] = vs2[i] */
++           MAXSZ(s) >= egw_bytes &&
-+GEN_VEXT_VSLIDEUP_VX(vslideup_vx_b, uint8_t, H1, clearb)
++           s->sew == MO_32;
-+GEN_VEXT_VSLIDEUP_VX(vslideup_vx_h, uint16_t, H2, clearh)
++}
-+GEN_VEXT_VSLIDEUP_VX(vslideup_vx_w, uint32_t, H4, clearl)
++
-+GEN_VEXT_VSLIDEUP_VX(vslideup_vx_d, uint64_t, H8, clearq)
++GEN_VV_UNMASKED_TRANS(vghsh_vv, vghsh_check, ZVKG_EGS)
 +
 +#define GEN_VEXT_VSLIDEDOWN_VX(NAME, ETYPE, H, CLEAR_FN)                  \
 +void HELPER(NAME)(void *vd, void *v0, target_ulong s1, void *vs2,         \
 +                  CPURISCVState *env, uint32_t desc)                      \
 +{                                                                         \
 +    uint32_t mlen = vext_mlen(desc);                                      \
 +    uint32_t vlmax = env_archcpu(env)->cfg.vlen / mlen;                   \
 +    uint32_t vm = vext_vm(desc);                                          \
 +    uint32_t vl = env->vl;                                                \
 +    target_ulong offset = s1, i;                                          \
 +                                                                          \
 +    for (i = 0; i < vl; ++i) {                                            \
 +        target_ulong j = i + offset;                                      \
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {                        \
 +            continue;                                                     \
 +        }                                                                 \
 +        *((ETYPE *)vd + H(i)) = j >= vlmax ? 0 : *((ETYPE *)vs2 + H(j));  \
 +    }                                                                     \
 +    CLEAR_FN(vd, vl, vl * sizeof(ETYPE), vlmax * sizeof(ETYPE));          \
 +}
 +
 +/* vslidedown.vx vd, vs2, rs1, vm # vd[i] = vs2[i+rs1] */
 +GEN_VEXT_VSLIDEDOWN_VX(vslidedown_vx_b, uint8_t, H1, clearb)
 +GEN_VEXT_VSLIDEDOWN_VX(vslidedown_vx_h, uint16_t, H2, clearh)
 +GEN_VEXT_VSLIDEDOWN_VX(vslidedown_vx_w, uint32_t, H4, clearl)
 +GEN_VEXT_VSLIDEDOWN_VX(vslidedown_vx_d, uint64_t, H8, clearq)
 +
 +#define GEN_VEXT_VSLIDE1UP_VX(NAME, ETYPE, H, CLEAR_FN)                   \
 +void HELPER(NAME)(void *vd, void *v0, target_ulong s1, void *vs2,         \
 +                  CPURISCVState *env, uint32_t desc)                      \
 +{                                                                         \
 +    uint32_t mlen = vext_mlen(desc);                                      \
 +    uint32_t vlmax = env_archcpu(env)->cfg.vlen / mlen;                   \
 +    uint32_t vm = vext_vm(desc);                                          \
 +    uint32_t vl = env->vl;                                                \
 +    uint32_t i;                                                           \
 +                                                                          \
 +    for (i = 0; i < vl; i++) {                                            \
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {                        \
 +            continue;                                                     \
 +        }                                                                 \
 +        if (i == 0) {                                                     \
 +            *((ETYPE *)vd + H(i)) = s1;                                   \
 +        } else {                                                          \
 +            *((ETYPE *)vd + H(i)) = *((ETYPE *)vs2 + H(i - 1));           \
 +        }                                                                 \
 +    }                                                                     \
 +    CLEAR_FN(vd, vl, vl * sizeof(ETYPE), vlmax * sizeof(ETYPE));          \
 +}
 +
 +/* vslide1up.vx vd, vs2, rs1, vm # vd[0]=x[rs1], vd[i+1] = vs2[i] */
 +GEN_VEXT_VSLIDE1UP_VX(vslide1up_vx_b, uint8_t, H1, clearb)
 +GEN_VEXT_VSLIDE1UP_VX(vslide1up_vx_h, uint16_t, H2, clearh)
 +GEN_VEXT_VSLIDE1UP_VX(vslide1up_vx_w, uint32_t, H4, clearl)
 +GEN_VEXT_VSLIDE1UP_VX(vslide1up_vx_d, uint64_t, H8, clearq)
 +
 +#define GEN_VEXT_VSLIDE1DOWN_VX(NAME, ETYPE, H, CLEAR_FN)                 \
 +void HELPER(NAME)(void *vd, void *v0, target_ulong s1, void *vs2,         \
 +                  CPURISCVState *env, uint32_t desc)                      \
 +{                                                                         \
 +    uint32_t mlen = vext_mlen(desc);                                      \
 +    uint32_t vlmax = env_archcpu(env)->cfg.vlen / mlen;                   \
 +    uint32_t vm = vext_vm(desc);                                          \
 +    uint32_t vl = env->vl;                                                \
 +    uint32_t i;                                                           \
 +                                                                          \
 +    for (i = 0; i < vl; i++) {                                            \
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {                        \
 +            continue;                                                     \
 +        }                                                                 \
 +        if (i == vl - 1) {                                                \
 +            *((ETYPE *)vd + H(i)) = s1;                                   \
 +        } else {                                                          \
 +            *((ETYPE *)vd + H(i)) = *((ETYPE *)vs2 + H(i + 1));           \
 +        }                                                                 \
 +    }                                                                     \
 +    CLEAR_FN(vd, vl, vl * sizeof(ETYPE), vlmax * sizeof(ETYPE));          \
 +}
 +
 +/* vslide1down.vx vd, vs2, rs1, vm # vd[i] = vs2[i+1], vd[vl-1]=x[rs1] */
 +GEN_VEXT_VSLIDE1DOWN_VX(vslide1down_vx_b, uint8_t, H1, clearb)
 +GEN_VEXT_VSLIDE1DOWN_VX(vslide1down_vx_h, uint16_t, H2, clearh)
 +GEN_VEXT_VSLIDE1DOWN_VX(vslide1down_vx_w, uint32_t, H4, clearl)
 +GEN_VEXT_VSLIDE1DOWN_VX(vslide1down_vx_d, uint64_t, H8, clearq)
 --
-.27.0
+.41.0

-[PULL 49/63] target/riscv: vector single-width floating-point reduction instructions
+[PULL v2 20/45] crypto: Create sm4_subword
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Max Chou <max.chou@sifive.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Allows sharing of sm4_subword between different targets.
 Signed-off-by: Max Chou <max.chou@sifive.com>
 Reviewed-by: Frank Chang <frank.chang@sifive.com>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Signed-off-by: Max Chou <max.chou@sifive.com>
-Message-id: 20200623215920.2594-48-zhiwei_liu@c-sky.com
+Message-ID: <20230711165917.2629866-14-max.chou@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   | 10 +++++++
+ include/crypto/sm4.h           |  8 ++++++++
- target/riscv/insn32.decode              |  4 +++
+ target/arm/tcg/crypto_helper.c | 10 ++--------
- target/riscv/insn_trans/trans_rvv.inc.c |  5 ++++
+files changed, 10 insertions(+), 8 deletions(-)
  target/riscv/vector_helper.c            | 39 +++++++++++++++++++++++++
 files changed, 58 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/include/crypto/sm4.h b/include/crypto/sm4.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/include/crypto/sm4.h
-+++ b/target/riscv/helper.h
++++ b/include/crypto/sm4.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vwredsumu_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@
- DEF_HELPER_6(vwredsum_vs_b, void, ptr, ptr, ptr, ptr, env, i32)
- DEF_HELPER_6(vwredsum_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
+ extern const uint8_t sm4_sbox[256];
- DEF_HELPER_6(vwredsum_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
-+
++static inline uint32_t sm4_subword(uint32_t word)
-+DEF_HELPER_6(vfredsum_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
++{
-+DEF_HELPER_6(vfredsum_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
++    return sm4_sbox[word & 0xff] |
-+DEF_HELPER_6(vfredsum_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
++           sm4_sbox[(word >> 8) & 0xff] << 8 |
-+DEF_HELPER_6(vfredmax_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
++           sm4_sbox[(word >> 16) & 0xff] << 16 |
-+DEF_HELPER_6(vfredmax_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
++           sm4_sbox[(word >> 24) & 0xff] << 24;
 +DEF_HELPER_6(vfredmax_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vfredmin_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vfredmin_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vfredmin_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@ vredmaxu_vs     000110 . ..... ..... 010 ..... 1010111 @r_vm
  vredmax_vs      000111 . ..... ..... 010 ..... 1010111 @r_vm
  vwredsumu_vs    110000 . ..... ..... 000 ..... 1010111 @r_vm
  vwredsum_vs     110001 . ..... ..... 000 ..... 1010111 @r_vm
 +# Vector ordered and unordered reduction sum
 +vfredsum_vs     0000-1 . ..... ..... 001 ..... 1010111 @r_vm
 +vfredmin_vs     000101 . ..... ..... 001 ..... 1010111 @r_vm
 +vfredmax_vs     000111 . ..... ..... 001 ..... 1010111 @r_vm
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ GEN_OPIVV_TRANS(vredxor_vs, reduction_check)
  /* Vector Widening Integer Reduction Instructions */
  GEN_OPIVV_WIDEN_TRANS(vwredsum_vs, reduction_check)
  GEN_OPIVV_WIDEN_TRANS(vwredsumu_vs, reduction_check)
 +
 +/* Vector Single-Width Floating-Point Reduction Instructions */
 +GEN_OPFVV_TRANS(vfredsum_vs, reduction_check)
 +GEN_OPFVV_TRANS(vfredmax_vs, reduction_check)
 +GEN_OPFVV_TRANS(vfredmin_vs, reduction_check)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_RED(vwredsum_vs_w, int64_t, int32_t, H8, H4, DO_ADD, clearq)
  GEN_VEXT_RED(vwredsumu_vs_b, uint16_t, uint8_t, H2, H1, DO_ADD, clearh)
  GEN_VEXT_RED(vwredsumu_vs_h, uint32_t, uint16_t, H4, H2, DO_ADD, clearl)
  GEN_VEXT_RED(vwredsumu_vs_w, uint64_t, uint32_t, H8, H4, DO_ADD, clearq)
 +
 +/* Vector Single-Width Floating-Point Reduction Instructions */
 +#define GEN_VEXT_FRED(NAME, TD, TS2, HD, HS2, OP, CLEAR_FN)\
 +void HELPER(NAME)(void *vd, void *v0, void *vs1,           \
 +                  void *vs2, CPURISCVState *env,           \
 +                  uint32_t desc)                           \
 +{                                                          \
 +    uint32_t mlen = vext_mlen(desc);                       \
 +    uint32_t vm = vext_vm(desc);                           \
 +    uint32_t vl = env->vl;                                 \
 +    uint32_t i;                                            \
 +    uint32_t tot = env_archcpu(env)->cfg.vlen / 8;         \
 +    TD s1 =  *((TD *)vs1 + HD(0));                         \
 +                                                           \
 +    for (i = 0; i < vl; i++) {                             \
 +        TS2 s2 = *((TS2 *)vs2 + HS2(i));                   \
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {         \
 +            continue;                                      \
 +        }                                                  \
 +        s1 = OP(s1, (TD)s2, &env->fp_status);              \
 +    }                                                      \
 +    *((TD *)vd + HD(0)) = s1;                              \
 +    CLEAR_FN(vd, 1, sizeof(TD), tot);                      \
 +}
 +
-+/* Unordered sum */
+ #endif
-+GEN_VEXT_FRED(vfredsum_vs_h, uint16_t, uint16_t, H2, H2, float16_add, clearh)
+diff --git a/target/arm/tcg/crypto_helper.c b/target/arm/tcg/crypto_helper.c
-+GEN_VEXT_FRED(vfredsum_vs_w, uint32_t, uint32_t, H4, H4, float32_add, clearl)
+index XXXXXXX..XXXXXXX 100644
-+GEN_VEXT_FRED(vfredsum_vs_d, uint64_t, uint64_t, H8, H8, float64_add, clearq)
+--- a/target/arm/tcg/crypto_helper.c
-+
++++ b/target/arm/tcg/crypto_helper.c
-+/* Maximum value */
+@@ -XXX,XX +XXX,XX @@ static void do_crypto_sm4e(uint64_t *rd, uint64_t *rn, uint64_t *rm)
-+GEN_VEXT_FRED(vfredmax_vs_h, uint16_t, uint16_t, H2, H2, float16_maxnum, clearh)
+             CR_ST_WORD(d, (i + 3) % 4) ^
-+GEN_VEXT_FRED(vfredmax_vs_w, uint32_t, uint32_t, H4, H4, float32_maxnum, clearl)
+             CR_ST_WORD(n, i);
-+GEN_VEXT_FRED(vfredmax_vs_d, uint64_t, uint64_t, H8, H8, float64_maxnum, clearq)
-+
+-        t = sm4_sbox[t & 0xff] |
-+/* Minimum value */
+-            sm4_sbox[(t >> 8) & 0xff] << 8 |
-+GEN_VEXT_FRED(vfredmin_vs_h, uint16_t, uint16_t, H2, H2, float16_minnum, clearh)
+-            sm4_sbox[(t >> 16) & 0xff] << 16 |
-+GEN_VEXT_FRED(vfredmin_vs_w, uint32_t, uint32_t, H4, H4, float32_minnum, clearl)
+-            sm4_sbox[(t >> 24) & 0xff] << 24;
-+GEN_VEXT_FRED(vfredmin_vs_d, uint64_t, uint64_t, H8, H8, float64_minnum, clearq)
++        t = sm4_subword(t);
          CR_ST_WORD(d, i) ^= t ^ rol32(t, 2) ^ rol32(t, 10) ^ rol32(t, 18) ^
                              rol32(t, 24);
@@ -XXX,XX +XXX,XX @@ static void do_crypto_sm4ekey(uint64_t *rd, uint64_t *rn, uint64_t *rm)
              CR_ST_WORD(d, (i + 3) % 4) ^
              CR_ST_WORD(m, i);
 -        t = sm4_sbox[t & 0xff] |
 -            sm4_sbox[(t >> 8) & 0xff] << 8 |
 -            sm4_sbox[(t >> 16) & 0xff] << 16 |
 -            sm4_sbox[(t >> 24) & 0xff] << 24;
 +        t = sm4_subword(t);
          CR_ST_WORD(d, i) ^= t ^ rol32(t, 13) ^ rol32(t, 23);
      }
 --
-.27.0
+.41.0

-[PULL 48/63] target/riscv: vector wideing integer reduction instructions
+[PULL v2 21/45] crypto: Add SM4 constant parameter CK
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Max Chou <max.chou@sifive.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Adds sm4_ck constant for use in sm4 cryptography across different targets.
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Signed-off-by: Max Chou <max.chou@sifive.com>
-Message-id: 20200623215920.2594-47-zhiwei_liu@c-sky.com
+Reviewed-by: Frank Chang <frank.chang@sifive.com>
 Signed-off-by: Max Chou <max.chou@sifive.com>
 Message-ID: <20230711165917.2629866-15-max.chou@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   |  7 +++++++
+ include/crypto/sm4.h |  1 +
- target/riscv/insn32.decode              |  2 ++
+ crypto/sm4.c         | 10 ++++++++++
- target/riscv/insn_trans/trans_rvv.inc.c |  4 ++++
+files changed, 11 insertions(+)
  target/riscv/vector_helper.c            | 11 +++++++++++
 files changed, 24 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/include/crypto/sm4.h b/include/crypto/sm4.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/include/crypto/sm4.h
-+++ b/target/riscv/helper.h
++++ b/include/crypto/sm4.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vredxor_vs_b, void, ptr, ptr, ptr, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@
- DEF_HELPER_6(vredxor_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
+ #define QEMU_SM4_H
- DEF_HELPER_6(vredxor_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
- DEF_HELPER_6(vredxor_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
+ extern const uint8_t sm4_sbox[256];
-+
++extern const uint32_t sm4_ck[32];
-+DEF_HELPER_6(vwredsumu_vs_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwredsumu_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
+ static inline uint32_t sm4_subword(uint32_t word)
-+DEF_HELPER_6(vwredsumu_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
+ {
-+DEF_HELPER_6(vwredsum_vs_b, void, ptr, ptr, ptr, ptr, env, i32)
+diff --git a/crypto/sm4.c b/crypto/sm4.c
 +DEF_HELPER_6(vwredsum_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vwredsum_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
+--- a/crypto/sm4.c
-+++ b/target/riscv/insn32.decode
++++ b/crypto/sm4.c
-@@ -XXX,XX +XXX,XX @@ vredminu_vs     000100 . ..... ..... 010 ..... 1010111 @r_vm
+@@ -XXX,XX +XXX,XX @@ uint8_t const sm4_sbox[] = {
- vredmin_vs      000101 . ..... ..... 010 ..... 1010111 @r_vm
+x79, 0xee, 0x5f, 0x3e, 0xd7, 0xcb, 0x39, 0x48,
- vredmaxu_vs     000110 . ..... ..... 010 ..... 1010111 @r_vm
+ };
- vredmax_vs      000111 . ..... ..... 010 ..... 1010111 @r_vm
-+vwredsumu_vs    110000 . ..... ..... 000 ..... 1010111 @r_vm
++uint32_t const sm4_ck[] = {
-+vwredsum_vs     110001 . ..... ..... 000 ..... 1010111 @r_vm
++    0x00070e15, 0x1c232a31, 0x383f464d, 0x545b6269,
++    0x70777e85, 0x8c939aa1, 0xa8afb6bd, 0xc4cbd2d9,
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
++    0xe0e7eef5, 0xfc030a11, 0x181f262d, 0x343b4249,
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
++    0x50575e65, 0x6c737a81, 0x888f969d, 0xa4abb2b9,
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
++    0xc0c7ced5, 0xdce3eaf1, 0xf8ff060d, 0x141b2229,
-index XXXXXXX..XXXXXXX 100644
++    0x30373e45, 0x4c535a61, 0x686f767d, 0x848b9299,
---- a/target/riscv/insn_trans/trans_rvv.inc.c
++    0xa0a7aeb5, 0xbcc3cad1, 0xd8dfe6ed, 0xf4fb0209,
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
++    0x10171e25, 0x2c333a41, 0x484f565d, 0x646b7279
-@@ -XXX,XX +XXX,XX @@ GEN_OPIVV_TRANS(vredmin_vs, reduction_check)
++};
  GEN_OPIVV_TRANS(vredand_vs, reduction_check)
  GEN_OPIVV_TRANS(vredor_vs, reduction_check)
  GEN_OPIVV_TRANS(vredxor_vs, reduction_check)
 +
 +/* Vector Widening Integer Reduction Instructions */
 +GEN_OPIVV_WIDEN_TRANS(vwredsum_vs, reduction_check)
 +GEN_OPIVV_WIDEN_TRANS(vwredsumu_vs, reduction_check)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_RED(vredxor_vs_b, int8_t, int8_t, H1, H1, DO_XOR, clearb)
  GEN_VEXT_RED(vredxor_vs_h, int16_t, int16_t, H2, H2, DO_XOR, clearh)
  GEN_VEXT_RED(vredxor_vs_w, int32_t, int32_t, H4, H4, DO_XOR, clearl)
  GEN_VEXT_RED(vredxor_vs_d, int64_t, int64_t, H8, H8, DO_XOR, clearq)
 +
 +/* Vector Widening Integer Reduction Instructions */
 +/* signed sum reduction into double-width accumulator */
 +GEN_VEXT_RED(vwredsum_vs_b, int16_t, int8_t, H2, H1, DO_ADD, clearh)
 +GEN_VEXT_RED(vwredsum_vs_h, int32_t, int16_t, H4, H2, DO_ADD, clearl)
 +GEN_VEXT_RED(vwredsum_vs_w, int64_t, int32_t, H8, H4, DO_ADD, clearq)
 +
 +/* Unsigned sum reduction into double-width accumulator */
 +GEN_VEXT_RED(vwredsumu_vs_b, uint16_t, uint8_t, H2, H1, DO_ADD, clearh)
 +GEN_VEXT_RED(vwredsumu_vs_h, uint32_t, uint16_t, H4, H2, DO_ADD, clearl)
 +GEN_VEXT_RED(vwredsumu_vs_w, uint64_t, uint32_t, H8, H4, DO_ADD, clearq)
 --
-.27.0
+.41.0

-[PULL 32/63] target/riscv: vector single-width floating-point add/subtract instructions
+[PULL v2 22/45] target/riscv: Add Zvksed ISA extension support
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Max Chou <max.chou@sifive.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+This commit adds support for the Zvksed vector-crypto extension, which
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+consists of the following instructions:
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-31-zhiwei_liu@c-sky.com
+* vsm4k.vi
 * vsm4r.[vv,vs]
 Translation functions are defined in
 `target/riscv/insn_trans/trans_rvvk.c.inc` and helpers are defined in
 `target/riscv/vcrypto_helper.c`.
 Signed-off-by: Max Chou <max.chou@sifive.com>
 Reviewed-by: Frank Chang <frank.chang@sifive.com>
 [lawrence.hunter@codethink.co.uk: Moved SM4 functions from
 crypto_helper.c to vcrypto_helper.c]
 [nazar.kazakov@codethink.co.uk: Added alignment checks, refactored code to
 use macros, and minor style changes]
 Signed-off-by: Max Chou <max.chou@sifive.com>
 Message-ID: <20230711165917.2629866-16-max.chou@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   |  16 ++++
+ target/riscv/cpu_cfg.h                   |   1 +
- target/riscv/insn32.decode              |   5 +
+ target/riscv/helper.h                    |   4 +
- target/riscv/insn_trans/trans_rvv.inc.c | 118 ++++++++++++++++++++++++
+ target/riscv/insn32.decode               |   5 +
- target/riscv/vector_helper.c            | 111 ++++++++++++++++++++++
+ target/riscv/cpu.c                       |   5 +-
-files changed, 250 insertions(+)
+ target/riscv/vcrypto_helper.c            | 127 +++++++++++++++++++++++
+ target/riscv/insn_trans/trans_rvvk.c.inc |  43 ++++++++
 files changed, 184 insertions(+), 1 deletion(-)
 diff --git a/target/riscv/cpu_cfg.h b/target/riscv/cpu_cfg.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/cpu_cfg.h
 +++ b/target/riscv/cpu_cfg.h
@@ -XXX,XX +XXX,XX @@ struct RISCVCPUConfig {
      bool ext_zvkned;
      bool ext_zvknha;
      bool ext_zvknhb;
 +    bool ext_zvksed;
      bool ext_zvksh;
      bool ext_zmmul;
      bool ext_zvfbfmin;
 diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/helper.h
 +++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vnclipu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_5(vsm3c_vi, void, ptr, ptr, i32, env, i32)
- DEF_HELPER_6(vnclip_vx_b, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vnclip_vx_h, void, ptr, ptr, tl, ptr, env, i32)
+ DEF_HELPER_5(vghsh_vv, void, ptr, ptr, ptr, env, i32)
- DEF_HELPER_6(vnclip_vx_w, void, ptr, ptr, tl, ptr, env, i32)
+ DEF_HELPER_4(vgmul_vv, void, ptr, ptr, env, i32)
 +
-+DEF_HELPER_6(vfadd_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_5(vsm4k_vi, void, ptr, ptr, i32, env, i32)
-+DEF_HELPER_6(vfadd_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_4(vsm4r_vv, void, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfadd_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_4(vsm4r_vs, void, ptr, ptr, env, i32)
 +DEF_HELPER_6(vfsub_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vfsub_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vfsub_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vfadd_vf_h, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vfadd_vf_w, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vfadd_vf_d, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vfsub_vf_h, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vfsub_vf_w, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vfsub_vf_d, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vfrsub_vf_h, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vfrsub_vf_w, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vfrsub_vf_d, void, ptr, ptr, i64, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vnclipu_vi      101110 . ..... ..... 011 ..... 1010111 @r_vm
+@@ -XXX,XX +XXX,XX @@ vsm3c_vi    101011 1 ..... ..... 010 ..... 1110111 @r_vm_1
- vnclip_vv       101111 . ..... ..... 000 ..... 1010111 @r_vm
+ # *** Zvkg vector crypto extension ***
- vnclip_vx       101111 . ..... ..... 100 ..... 1010111 @r_vm
+ vghsh_vv    101100 1 ..... ..... 010 ..... 1110111 @r_vm_1
- vnclip_vi       101111 . ..... ..... 011 ..... 1010111 @r_vm
+ vgmul_vv    101000 1 ..... 10001 010 ..... 1110111 @r2_vm_1
-+vfadd_vv        000000 . ..... ..... 001 ..... 1010111 @r_vm
++
-+vfadd_vf        000000 . ..... ..... 101 ..... 1010111 @r_vm
++# *** Zvksed vector crypto extension ***
-+vfsub_vv        000010 . ..... ..... 001 ..... 1010111 @r_vm
++vsm4k_vi    100001 1 ..... ..... 010 ..... 1110111 @r_vm_1
-+vfsub_vf        000010 . ..... ..... 101 ..... 1010111 @r_vm
++vsm4r_vv    101000 1 ..... 10000 010 ..... 1110111 @r2_vm_1
-+vfrsub_vf       100111 . ..... ..... 101 ..... 1010111 @r_vm
++vsm4r_vs    101001 1 ..... 10000 010 ..... 1110111 @r2_vm_1
+diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
+index XXXXXXX..XXXXXXX 100644
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
+--- a/target/riscv/cpu.c
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
++++ b/target/riscv/cpu.c
-index XXXXXXX..XXXXXXX 100644
+@@ -XXX,XX +XXX,XX @@ static const struct isa_ext_data isa_edata_arr[] = {
---- a/target/riscv/insn_trans/trans_rvv.inc.c
+     ISA_EXT_DATA_ENTRY(zvkned, PRIV_VERSION_1_12_0, ext_zvkned),
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
+     ISA_EXT_DATA_ENTRY(zvknha, PRIV_VERSION_1_12_0, ext_zvknha),
-@@ -XXX,XX +XXX,XX @@ GEN_OPIVX_NARROW_TRANS(vnclipu_vx)
+     ISA_EXT_DATA_ENTRY(zvknhb, PRIV_VERSION_1_12_0, ext_zvknhb),
- GEN_OPIVX_NARROW_TRANS(vnclip_vx)
++    ISA_EXT_DATA_ENTRY(zvksed, PRIV_VERSION_1_12_0, ext_zvksed),
- GEN_OPIVI_NARROW_TRANS(vnclipu_vi, 1, vnclipu_vx)
+     ISA_EXT_DATA_ENTRY(zvksh, PRIV_VERSION_1_12_0, ext_zvksh),
- GEN_OPIVI_NARROW_TRANS(vnclip_vi, 1, vnclip_vx)
+     ISA_EXT_DATA_ENTRY(zhinx, PRIV_VERSION_1_12_0, ext_zhinx),
-+
+     ISA_EXT_DATA_ENTRY(zhinxmin, PRIV_VERSION_1_12_0, ext_zhinxmin),
-+/*
+@@ -XXX,XX +XXX,XX @@ void riscv_cpu_validate_set_extensions(RISCVCPU *cpu, Error **errp)
-+ *** Vector Float Point Arithmetic Instructions
+      * in qemu
-+ */
+      */
-+/* Vector Single-Width Floating-Point Add/Subtract Instructions */
+     if ((cpu->cfg.ext_zvbb || cpu->cfg.ext_zvkg || cpu->cfg.ext_zvkned ||
-+
+-         cpu->cfg.ext_zvknha || cpu->cfg.ext_zvksh) && !cpu->cfg.ext_zve32f) {
-+/*
++         cpu->cfg.ext_zvknha || cpu->cfg.ext_zvksed || cpu->cfg.ext_zvksh) &&
-+ * If the current SEW does not correspond to a supported IEEE floating-point
++        !cpu->cfg.ext_zve32f) {
-+ * type, an illegal instruction exception is raised.
+         error_setg(errp,
-+ */
+                    "Vector crypto extensions require V or Zve* extensions");
-+static bool opfvv_check(DisasContext *s, arg_rmrr *a)
+         return;
-+{
+@@ -XXX,XX +XXX,XX @@ static Property riscv_cpu_extensions[] = {
-+    return (vext_check_isa_ill(s) &&
+     DEFINE_PROP_BOOL("x-zvkned", RISCVCPU, cfg.ext_zvkned, false),
-+            vext_check_overlap_mask(s, a->rd, a->vm, false) &&
+     DEFINE_PROP_BOOL("x-zvknha", RISCVCPU, cfg.ext_zvknha, false),
-+            vext_check_reg(s, a->rd, false) &&
+     DEFINE_PROP_BOOL("x-zvknhb", RISCVCPU, cfg.ext_zvknhb, false),
-+            vext_check_reg(s, a->rs2, false) &&
++    DEFINE_PROP_BOOL("x-zvksed", RISCVCPU, cfg.ext_zvksed, false),
-+            vext_check_reg(s, a->rs1, false) &&
+     DEFINE_PROP_BOOL("x-zvksh", RISCVCPU, cfg.ext_zvksh, false),
-+            (s->sew != 0));
-+}
+     DEFINE_PROP_END_OF_LIST(),
-+
+diff --git a/target/riscv/vcrypto_helper.c b/target/riscv/vcrypto_helper.c
-+/* OPFVV without GVEC IR */
+index XXXXXXX..XXXXXXX 100644
-+#define GEN_OPFVV_TRANS(NAME, CHECK)                               \
+--- a/target/riscv/vcrypto_helper.c
-+static bool trans_##NAME(DisasContext *s, arg_rmrr *a)             \
++++ b/target/riscv/vcrypto_helper.c
 +{                                                                  \
 +    if (CHECK(s, a)) {                                             \
 +        uint32_t data = 0;                                         \
 +        static gen_helper_gvec_4_ptr * const fns[3] = {            \
 +            gen_helper_##NAME##_h,                                 \
 +            gen_helper_##NAME##_w,                                 \
 +            gen_helper_##NAME##_d,                                 \
 +        };                                                         \
 +        TCGLabel *over = gen_new_label();                          \
 +        gen_set_rm(s, 7);                                          \
 +        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
 +                                                                   \
 +        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);             \
 +        data = FIELD_DP32(data, VDATA, VM, a->vm);                 \
 +        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);             \
 +        tcg_gen_gvec_4_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),     \
 +                           vreg_ofs(s, a->rs1),                    \
 +                           vreg_ofs(s, a->rs2), cpu_env, 0,        \
 +                           s->vlen / 8, data, fns[s->sew - 1]);    \
 +        gen_set_label(over);                                       \
 +        return true;                                               \
 +    }                                                              \
 +    return false;                                                  \
 +}
 +GEN_OPFVV_TRANS(vfadd_vv, opfvv_check)
 +GEN_OPFVV_TRANS(vfsub_vv, opfvv_check)
 +
 +typedef void gen_helper_opfvf(TCGv_ptr, TCGv_ptr, TCGv_i64, TCGv_ptr,
 +                              TCGv_env, TCGv_i32);
 +
 +static bool opfvf_trans(uint32_t vd, uint32_t rs1, uint32_t vs2,
 +                        uint32_t data, gen_helper_opfvf *fn, DisasContext *s)
 +{
 +    TCGv_ptr dest, src2, mask;
 +    TCGv_i32 desc;
 +
 +    TCGLabel *over = gen_new_label();
 +    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +
 +    dest = tcg_temp_new_ptr();
 +    mask = tcg_temp_new_ptr();
 +    src2 = tcg_temp_new_ptr();
 +    desc = tcg_const_i32(simd_desc(0, s->vlen / 8, data));
 +
 +    tcg_gen_addi_ptr(dest, cpu_env, vreg_ofs(s, vd));
 +    tcg_gen_addi_ptr(src2, cpu_env, vreg_ofs(s, vs2));
 +    tcg_gen_addi_ptr(mask, cpu_env, vreg_ofs(s, 0));
 +
 +    fn(dest, mask, cpu_fpr[rs1], src2, cpu_env, desc);
 +
 +    tcg_temp_free_ptr(dest);
 +    tcg_temp_free_ptr(mask);
 +    tcg_temp_free_ptr(src2);
 +    tcg_temp_free_i32(desc);
 +    gen_set_label(over);
 +    return true;
 +}
 +
 +static bool opfvf_check(DisasContext *s, arg_rmrr *a)
 +{
 +/*
 + * If the current SEW does not correspond to a supported IEEE floating-point
 + * type, an illegal instruction exception is raised
 + */
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_overlap_mask(s, a->rd, a->vm, false) &&
 +            vext_check_reg(s, a->rd, false) &&
 +            vext_check_reg(s, a->rs2, false) &&
 +            (s->sew != 0));
 +}
 +
 +/* OPFVF without GVEC IR */
 +#define GEN_OPFVF_TRANS(NAME, CHECK)                              \
 +static bool trans_##NAME(DisasContext *s, arg_rmrr *a)            \
 +{                                                                 \
 +    if (CHECK(s, a)) {                                            \
 +        uint32_t data = 0;                                        \
 +        static gen_helper_opfvf *const fns[3] = {                 \
 +            gen_helper_##NAME##_h,                                \
 +            gen_helper_##NAME##_w,                                \
 +            gen_helper_##NAME##_d,                                \
 +        };                                                        \
 +        gen_set_rm(s, 7);                                         \
 +        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);            \
 +        data = FIELD_DP32(data, VDATA, VM, a->vm);                \
 +        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);            \
 +        return opfvf_trans(a->rd, a->rs1, a->rs2, data,           \
 +                           fns[s->sew - 1], s);                   \
 +    }                                                             \
 +    return false;                                                 \
 +}
 +
 +GEN_OPFVF_TRANS(vfadd_vf,  opfvf_check)
 +GEN_OPFVF_TRANS(vfsub_vf,  opfvf_check)
 +GEN_OPFVF_TRANS(vfrsub_vf,  opfvf_check)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
 @@ -XXX,XX +XXX,XX @@
+ #include "cpu.h"
+ #include "crypto/aes.h"
+ #include "crypto/aes-round.h"
++#include "crypto/sm4.h"
  #include "exec/memop.h"
  #include "exec/exec-all.h"
  #include "exec/helper-proto.h"
-+#include "fpu/softfloat.h"
+@@ -XXX,XX +XXX,XX @@ void HELPER(vgmul_vv)(void *vd_vptr, void *vs2_vptr, CPURISCVState *env,
- #include "tcg/tcg-gvec-desc.h"
+     vext_set_elems_1s(vd, vta, env->vl * 4, total_elems * 4);
- #include "internals.h"
+     env->vstart = 0;
- #include <math.h>
+ }
-@@ -XXX,XX +XXX,XX @@ RVVCALL(OPIVX2_RM, vnclipu_vx_w, NOP_UUU_W, H4, H8, vnclipu32)
++
- GEN_VEXT_VX_RM(vnclipu_vx_b, 1, 1, clearb)
++void HELPER(vsm4k_vi)(void *vd, void *vs2, uint32_t uimm5, CPURISCVState *env,
- GEN_VEXT_VX_RM(vnclipu_vx_h, 2, 2, clearh)
++                      uint32_t desc)
- GEN_VEXT_VX_RM(vnclipu_vx_w, 4, 4, clearl)
++{
 +    const uint32_t egs = 4;
 +    uint32_t rnd = uimm5 & 0x7;
 +    uint32_t group_start = env->vstart / egs;
 +    uint32_t group_end = env->vl / egs;
 +    uint32_t esz = sizeof(uint32_t);
 +    uint32_t total_elems = vext_get_total_elems(env, desc, esz);
 +
 +    for (uint32_t i = group_start; i < group_end; ++i) {
 +        uint32_t vstart = i * egs;
 +        uint32_t vend = (i + 1) * egs;
 +        uint32_t rk[4] = {0};
 +        uint32_t tmp[8] = {0};
 +
 +        for (uint32_t j = vstart; j < vend; ++j) {
 +            rk[j - vstart] = *((uint32_t *)vs2 + H4(j));
 +        }
 +
 +        for (uint32_t j = 0; j < egs; ++j) {
 +            tmp[j] = rk[j];
 +        }
 +
 +        for (uint32_t j = 0; j < egs; ++j) {
 +            uint32_t b, s;
 +            b = tmp[j + 1] ^ tmp[j + 2] ^ tmp[j + 3] ^ sm4_ck[rnd * 4 + j];
 +
 +            s = sm4_subword(b);
 +
 +            tmp[j + 4] = tmp[j] ^ (s ^ rol32(s, 13) ^ rol32(s, 23));
 +        }
 +
 +        for (uint32_t j = vstart; j < vend; ++j) {
 +            *((uint32_t *)vd + H4(j)) = tmp[egs + (j - vstart)];
 +        }
 +    }
 +
 +    env->vstart = 0;
 +    /* set tail elements to 1s */
 +    vext_set_elems_1s(vd, vext_vta(desc), env->vl * esz, total_elems * esz);
 +}
 +
 +static void do_sm4_round(uint32_t *rk, uint32_t *buf)
 +{
 +    const uint32_t egs = 4;
 +    uint32_t s, b;
 +
 +    for (uint32_t j = egs; j < egs * 2; ++j) {
 +        b = buf[j - 3] ^ buf[j - 2] ^ buf[j - 1] ^ rk[j - 4];
 +
 +        s = sm4_subword(b);
 +
 +        buf[j] = buf[j - 4] ^ (s ^ rol32(s, 2) ^ rol32(s, 10) ^ rol32(s, 18) ^
 +                               rol32(s, 24));
 +    }
 +}
 +
 +void HELPER(vsm4r_vv)(void *vd, void *vs2, CPURISCVState *env, uint32_t desc)
 +{
 +    const uint32_t egs = 4;
 +    uint32_t group_start = env->vstart / egs;
 +    uint32_t group_end = env->vl / egs;
 +    uint32_t esz = sizeof(uint32_t);
 +    uint32_t total_elems = vext_get_total_elems(env, desc, esz);
 +
 +    for (uint32_t i = group_start; i < group_end; ++i) {
 +        uint32_t vstart = i * egs;
 +        uint32_t vend = (i + 1) * egs;
 +        uint32_t rk[4] = {0};
 +        uint32_t tmp[8] = {0};
 +
 +        for (uint32_t j = vstart; j < vend; ++j) {
 +            rk[j - vstart] = *((uint32_t *)vs2 + H4(j));
 +        }
 +
 +        for (uint32_t j = vstart; j < vend; ++j) {
 +            tmp[j - vstart] = *((uint32_t *)vd + H4(j));
 +        }
 +
 +        do_sm4_round(rk, tmp);
 +
 +        for (uint32_t j = vstart; j < vend; ++j) {
 +            *((uint32_t *)vd + H4(j)) = tmp[egs + (j - vstart)];
 +        }
 +    }
 +
 +    env->vstart = 0;
 +    /* set tail elements to 1s */
 +    vext_set_elems_1s(vd, vext_vta(desc), env->vl * esz, total_elems * esz);
 +}
 +
 +void HELPER(vsm4r_vs)(void *vd, void *vs2, CPURISCVState *env, uint32_t desc)
 +{
 +    const uint32_t egs = 4;
 +    uint32_t group_start = env->vstart / egs;
 +    uint32_t group_end = env->vl / egs;
 +    uint32_t esz = sizeof(uint32_t);
 +    uint32_t total_elems = vext_get_total_elems(env, desc, esz);
 +
 +    for (uint32_t i = group_start; i < group_end; ++i) {
 +        uint32_t vstart = i * egs;
 +        uint32_t vend = (i + 1) * egs;
 +        uint32_t rk[4] = {0};
 +        uint32_t tmp[8] = {0};
 +
 +        for (uint32_t j = 0; j < egs; ++j) {
 +            rk[j] = *((uint32_t *)vs2 + H4(j));
 +        }
 +
 +        for (uint32_t j = vstart; j < vend; ++j) {
 +            tmp[j - vstart] = *((uint32_t *)vd + H4(j));
 +        }
 +
 +        do_sm4_round(rk, tmp);
 +
 +        for (uint32_t j = vstart; j < vend; ++j) {
 +            *((uint32_t *)vd + H4(j)) = tmp[egs + (j - vstart)];
 +        }
 +    }
 +
 +    env->vstart = 0;
 +    /* set tail elements to 1s */
 +    vext_set_elems_1s(vd, vext_vta(desc), env->vl * esz, total_elems * esz);
 +}
 diff --git a/target/riscv/insn_trans/trans_rvvk.c.inc b/target/riscv/insn_trans/trans_rvvk.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvvk.c.inc
 +++ b/target/riscv/insn_trans/trans_rvvk.c.inc
@@ -XXX,XX +XXX,XX @@ static bool vghsh_check(DisasContext *s, arg_rmrr *a)
  }
  GEN_VV_UNMASKED_TRANS(vghsh_vv, vghsh_check, ZVKG_EGS)
 +
 +/*
-+ *** Vector Float Point Arithmetic Instructions
++ * Zvksed
 + */
-+/* Vector Single-Width Floating-Point Add/Subtract Instructions */
++
-+#define OPFVV2(NAME, TD, T1, T2, TX1, TX2, HD, HS1, HS2, OP)   \
++#define ZVKSED_EGS 4
-+static void do_##NAME(void *vd, void *vs1, void *vs2, int i,   \
++
-+                      CPURISCVState *env)                      \
++static bool zvksed_check(DisasContext *s)
-+{                                                              \
++{
-+    TX1 s1 = *((T1 *)vs1 + HS1(i));                            \
++    int egw_bytes = ZVKSED_EGS << s->sew;
-+    TX2 s2 = *((T2 *)vs2 + HS2(i));                            \
++    return s->cfg_ptr->ext_zvksed == true &&
-+    *((TD *)vd + HD(i)) = OP(s2, s1, &env->fp_status);         \
++           require_rvv(s) &&
-+}
++           vext_check_isa_ill(s) &&
-+
++           MAXSZ(s) >= egw_bytes &&
-+#define GEN_VEXT_VV_ENV(NAME, ESZ, DSZ, CLEAR_FN)         \
++           s->sew == MO_32;
-+void HELPER(NAME)(void *vd, void *v0, void *vs1,          \
++}
-+                  void *vs2, CPURISCVState *env,          \
++
-+                  uint32_t desc)                          \
++static bool vsm4k_vi_check(DisasContext *s, arg_rmrr *a)
-+{                                                         \
++{
-+    uint32_t vlmax = vext_maxsz(desc) / ESZ;              \
++    return zvksed_check(s) &&
-+    uint32_t mlen = vext_mlen(desc);                      \
++           require_align(a->rd, s->lmul) &&
-+    uint32_t vm = vext_vm(desc);                          \
++           require_align(a->rs2, s->lmul);
-+    uint32_t vl = env->vl;                                \
++}
-+    uint32_t i;                                           \
++
-+                                                          \
++GEN_VI_UNMASKED_TRANS(vsm4k_vi, vsm4k_vi_check, ZVKSED_EGS)
-+    for (i = 0; i < vl; i++) {                            \
++
-+        if (!vm && !vext_elem_mask(v0, mlen, i)) {        \
++static bool vsm4r_vv_check(DisasContext *s, arg_rmr *a)
-+            continue;                                     \
++{
-+        }                                                 \
++    return zvksed_check(s) &&
-+        do_##NAME(vd, vs1, vs2, i, env);                  \
++           require_align(a->rd, s->lmul) &&
-+    }                                                     \
++           require_align(a->rs2, s->lmul);
-+    CLEAR_FN(vd, vl, vl * DSZ,  vlmax * DSZ);             \
++}
-+}
++
-+
++GEN_V_UNMASKED_TRANS(vsm4r_vv, vsm4r_vv_check, ZVKSED_EGS)
-+RVVCALL(OPFVV2, vfadd_vv_h, OP_UUU_H, H2, H2, H2, float16_add)
++
-+RVVCALL(OPFVV2, vfadd_vv_w, OP_UUU_W, H4, H4, H4, float32_add)
++static bool vsm4r_vs_check(DisasContext *s, arg_rmr *a)
-+RVVCALL(OPFVV2, vfadd_vv_d, OP_UUU_D, H8, H8, H8, float64_add)
++{
-+GEN_VEXT_VV_ENV(vfadd_vv_h, 2, 2, clearh)
++    return zvksed_check(s) &&
-+GEN_VEXT_VV_ENV(vfadd_vv_w, 4, 4, clearl)
++           !is_overlapped(a->rd, 1 << MAX(s->lmul, 0), a->rs2, 1) &&
-+GEN_VEXT_VV_ENV(vfadd_vv_d, 8, 8, clearq)
++           require_align(a->rd, s->lmul);
-+
++}
-+#define OPFVF2(NAME, TD, T1, T2, TX1, TX2, HD, HS2, OP)        \
++
-+static void do_##NAME(void *vd, uint64_t s1, void *vs2, int i, \
++GEN_V_UNMASKED_TRANS(vsm4r_vs, vsm4r_vs_check, ZVKSED_EGS)
 +                      CPURISCVState *env)                      \
 +{                                                              \
 +    TX2 s2 = *((T2 *)vs2 + HS2(i));                            \
 +    *((TD *)vd + HD(i)) = OP(s2, (TX1)(T1)s1, &env->fp_status);\
 +}
 +
 +#define GEN_VEXT_VF(NAME, ESZ, DSZ, CLEAR_FN)             \
 +void HELPER(NAME)(void *vd, void *v0, uint64_t s1,        \
 +                  void *vs2, CPURISCVState *env,          \
 +                  uint32_t desc)                          \
 +{                                                         \
 +    uint32_t vlmax = vext_maxsz(desc) / ESZ;              \
 +    uint32_t mlen = vext_mlen(desc);                      \
 +    uint32_t vm = vext_vm(desc);                          \
 +    uint32_t vl = env->vl;                                \
 +    uint32_t i;                                           \
 +                                                          \
 +    for (i = 0; i < vl; i++) {                            \
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {        \
 +            continue;                                     \
 +        }                                                 \
 +        do_##NAME(vd, s1, vs2, i, env);                   \
 +    }                                                     \
 +    CLEAR_FN(vd, vl, vl * DSZ,  vlmax * DSZ);             \
 +}
 +
 +RVVCALL(OPFVF2, vfadd_vf_h, OP_UUU_H, H2, H2, float16_add)
 +RVVCALL(OPFVF2, vfadd_vf_w, OP_UUU_W, H4, H4, float32_add)
 +RVVCALL(OPFVF2, vfadd_vf_d, OP_UUU_D, H8, H8, float64_add)
 +GEN_VEXT_VF(vfadd_vf_h, 2, 2, clearh)
 +GEN_VEXT_VF(vfadd_vf_w, 4, 4, clearl)
 +GEN_VEXT_VF(vfadd_vf_d, 8, 8, clearq)
 +
 +RVVCALL(OPFVV2, vfsub_vv_h, OP_UUU_H, H2, H2, H2, float16_sub)
 +RVVCALL(OPFVV2, vfsub_vv_w, OP_UUU_W, H4, H4, H4, float32_sub)
 +RVVCALL(OPFVV2, vfsub_vv_d, OP_UUU_D, H8, H8, H8, float64_sub)
 +GEN_VEXT_VV_ENV(vfsub_vv_h, 2, 2, clearh)
 +GEN_VEXT_VV_ENV(vfsub_vv_w, 4, 4, clearl)
 +GEN_VEXT_VV_ENV(vfsub_vv_d, 8, 8, clearq)
 +RVVCALL(OPFVF2, vfsub_vf_h, OP_UUU_H, H2, H2, float16_sub)
 +RVVCALL(OPFVF2, vfsub_vf_w, OP_UUU_W, H4, H4, float32_sub)
 +RVVCALL(OPFVF2, vfsub_vf_d, OP_UUU_D, H8, H8, float64_sub)
 +GEN_VEXT_VF(vfsub_vf_h, 2, 2, clearh)
 +GEN_VEXT_VF(vfsub_vf_w, 4, 4, clearl)
 +GEN_VEXT_VF(vfsub_vf_d, 8, 8, clearq)
 +
 +static uint16_t float16_rsub(uint16_t a, uint16_t b, float_status *s)
 +{
 +    return float16_sub(b, a, s);
 +}
 +
 +static uint32_t float32_rsub(uint32_t a, uint32_t b, float_status *s)
 +{
 +    return float32_sub(b, a, s);
 +}
 +
 +static uint64_t float64_rsub(uint64_t a, uint64_t b, float_status *s)
 +{
 +    return float64_sub(b, a, s);
 +}
 +
 +RVVCALL(OPFVF2, vfrsub_vf_h, OP_UUU_H, H2, H2, float16_rsub)
 +RVVCALL(OPFVF2, vfrsub_vf_w, OP_UUU_W, H4, H4, float32_rsub)
 +RVVCALL(OPFVF2, vfrsub_vf_d, OP_UUU_D, H8, H8, float64_rsub)
 +GEN_VEXT_VF(vfrsub_vf_h, 2, 2, clearh)
 +GEN_VEXT_VF(vfrsub_vf_w, 4, 4, clearl)
 +GEN_VEXT_VF(vfrsub_vf_d, 8, 8, clearq)
 --
-.27.0
+.41.0

-[PULL 47/63] target/riscv: vector single-width integer reduction instructions
+[PULL v2 23/45] target/riscv: Implement WARL behaviour for mcountinhibit/mcounteren
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Rob Bradford <rbradford@rivosinc.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+These are WARL fields - zero out the bits for unavailable counters and
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+special case the TM bit in mcountinhibit which is hardwired to zero.
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+This patch achieves this by modifying the value written so that any use
-Message-id: 20200623215920.2594-46-zhiwei_liu@c-sky.com
+of the field will see the correctly masked bits.
 Tested by modifying OpenSBI to write max value to these CSRs and upon
 subsequent read the appropriate number of bits for number of PMUs is
 enabled and the TM bit is zero in mcountinhibit.
 Signed-off-by: Rob Bradford <rbradford@rivosinc.com>
 Acked-by: Alistair Francis <alistair.francis@wdc.com>
 Reviewed-by: Atish Patra <atishp@rivosinc.com>
 Message-ID: <20230802124906.24197-1-rbradford@rivosinc.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   | 33 +++++++++++
+ target/riscv/csr.c | 11 +++++++++--
- target/riscv/insn32.decode              |  8 +++
+file changed, 9 insertions(+), 2 deletions(-)
  target/riscv/insn_trans/trans_rvv.inc.c | 18 ++++++
  target/riscv/vector_helper.c            | 74 +++++++++++++++++++++++++
 files changed, 133 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/target/riscv/csr.c b/target/riscv/csr.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/target/riscv/csr.c
-+++ b/target/riscv/helper.h
++++ b/target/riscv/csr.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_5(vfncvt_f_x_v_h, void, ptr, ptr, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ static RISCVException write_mcountinhibit(CPURISCVState *env, int csrno,
- DEF_HELPER_5(vfncvt_f_x_v_w, void, ptr, ptr, ptr, env, i32)
+ {
- DEF_HELPER_5(vfncvt_f_f_v_h, void, ptr, ptr, ptr, env, i32)
+     int cidx;
- DEF_HELPER_5(vfncvt_f_f_v_w, void, ptr, ptr, ptr, env, i32)
+     PMUCTRState *counter;
 +    RISCVCPU *cpu = env_archcpu(env);
 -    env->mcountinhibit = val;
 +    /* WARL register - disable unavailable counters; TM bit is always 0 */
 +    env->mcountinhibit =
 +        val & (cpu->pmu_avail_ctrs | COUNTEREN_CY | COUNTEREN_IR);
      /* Check if any other counter is also monitoring cycles/instructions */
      for (cidx = 0; cidx < RV_MAX_MHPMCOUNTERS; cidx++) {
@@ -XXX,XX +XXX,XX @@ static RISCVException read_mcounteren(CPURISCVState *env, int csrno,
  static RISCVException write_mcounteren(CPURISCVState *env, int csrno,
                                         target_ulong val)
  {
 -    env->mcounteren = val;
 +    RISCVCPU *cpu = env_archcpu(env);
 +
-+DEF_HELPER_6(vredsum_vs_b, void, ptr, ptr, ptr, ptr, env, i32)
++    /* WARL register - disable unavailable counters */
-+DEF_HELPER_6(vredsum_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
++    env->mcounteren = val & (cpu->pmu_avail_ctrs | COUNTEREN_CY | COUNTEREN_TM |
-+DEF_HELPER_6(vredsum_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
++                             COUNTEREN_IR);
-+DEF_HELPER_6(vredsum_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
+     return RISCV_EXCP_NONE;
-+DEF_HELPER_6(vredmaxu_vs_b, void, ptr, ptr, ptr, ptr, env, i32)
+ }
-+DEF_HELPER_6(vredmaxu_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredmaxu_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredmaxu_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredmax_vs_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredmax_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredmax_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredmax_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredminu_vs_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredminu_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredminu_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredminu_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredmin_vs_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredmin_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredmin_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredmin_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredand_vs_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredand_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredand_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredand_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredor_vs_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredor_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredor_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredor_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredxor_vs_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredxor_vs_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredxor_vs_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vredxor_vs_d, void, ptr, ptr, ptr, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@ vfncvt_x_f_v    100010 . ..... 10001 001 ..... 1010111 @r2_vm
  vfncvt_f_xu_v   100010 . ..... 10010 001 ..... 1010111 @r2_vm
  vfncvt_f_x_v    100010 . ..... 10011 001 ..... 1010111 @r2_vm
  vfncvt_f_f_v    100010 . ..... 10100 001 ..... 1010111 @r2_vm
 +vredsum_vs      000000 . ..... ..... 010 ..... 1010111 @r_vm
 +vredand_vs      000001 . ..... ..... 010 ..... 1010111 @r_vm
 +vredor_vs       000010 . ..... ..... 010 ..... 1010111 @r_vm
 +vredxor_vs      000011 . ..... ..... 010 ..... 1010111 @r_vm
 +vredminu_vs     000100 . ..... ..... 010 ..... 1010111 @r_vm
 +vredmin_vs      000101 . ..... ..... 010 ..... 1010111 @r_vm
 +vredmaxu_vs     000110 . ..... ..... 010 ..... 1010111 @r_vm
 +vredmax_vs      000111 . ..... ..... 010 ..... 1010111 @r_vm
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ GEN_OPFV_NARROW_TRANS(vfncvt_x_f_v)
  GEN_OPFV_NARROW_TRANS(vfncvt_f_xu_v)
  GEN_OPFV_NARROW_TRANS(vfncvt_f_x_v)
  GEN_OPFV_NARROW_TRANS(vfncvt_f_f_v)
 +
 +/*
 + *** Vector Reduction Operations
 + */
 +/* Vector Single-Width Integer Reduction Instructions */
 +static bool reduction_check(DisasContext *s, arg_rmrr *a)
 +{
 +    return vext_check_isa_ill(s) && vext_check_reg(s, a->rs2, false);
 +}
 +
 +GEN_OPIVV_TRANS(vredsum_vs, reduction_check)
 +GEN_OPIVV_TRANS(vredmaxu_vs, reduction_check)
 +GEN_OPIVV_TRANS(vredmax_vs, reduction_check)
 +GEN_OPIVV_TRANS(vredminu_vs, reduction_check)
 +GEN_OPIVV_TRANS(vredmin_vs, reduction_check)
 +GEN_OPIVV_TRANS(vredand_vs, reduction_check)
 +GEN_OPIVV_TRANS(vredor_vs, reduction_check)
 +GEN_OPIVV_TRANS(vredxor_vs, reduction_check)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ RVVCALL(OPFVV1, vfncvt_f_f_v_h, NOP_UU_H, H2, H4, vfncvtffv16)
  RVVCALL(OPFVV1, vfncvt_f_f_v_w, NOP_UU_W, H4, H8, float64_to_float32)
  GEN_VEXT_V_ENV(vfncvt_f_f_v_h, 2, 2, clearh)
  GEN_VEXT_V_ENV(vfncvt_f_f_v_w, 4, 4, clearl)
 +
 +/*
 + *** Vector Reduction Operations
 + */
 +/* Vector Single-Width Integer Reduction Instructions */
 +#define GEN_VEXT_RED(NAME, TD, TS2, HD, HS2, OP, CLEAR_FN)\
 +void HELPER(NAME)(void *vd, void *v0, void *vs1,          \
 +        void *vs2, CPURISCVState *env, uint32_t desc)     \
 +{                                                         \
 +    uint32_t mlen = vext_mlen(desc);                      \
 +    uint32_t vm = vext_vm(desc);                          \
 +    uint32_t vl = env->vl;                                \
 +    uint32_t i;                                           \
 +    uint32_t tot = env_archcpu(env)->cfg.vlen / 8;        \
 +    TD s1 =  *((TD *)vs1 + HD(0));                        \
 +                                                          \
 +    for (i = 0; i < vl; i++) {                            \
 +        TS2 s2 = *((TS2 *)vs2 + HS2(i));                  \
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {        \
 +            continue;                                     \
 +        }                                                 \
 +        s1 = OP(s1, (TD)s2);                              \
 +    }                                                     \
 +    *((TD *)vd + HD(0)) = s1;                             \
 +    CLEAR_FN(vd, 1, sizeof(TD), tot);                     \
 +}
 +
 +/* vd[0] = sum(vs1[0], vs2[*]) */
 +GEN_VEXT_RED(vredsum_vs_b, int8_t, int8_t, H1, H1, DO_ADD, clearb)
 +GEN_VEXT_RED(vredsum_vs_h, int16_t, int16_t, H2, H2, DO_ADD, clearh)
 +GEN_VEXT_RED(vredsum_vs_w, int32_t, int32_t, H4, H4, DO_ADD, clearl)
 +GEN_VEXT_RED(vredsum_vs_d, int64_t, int64_t, H8, H8, DO_ADD, clearq)
 +
 +/* vd[0] = maxu(vs1[0], vs2[*]) */
 +GEN_VEXT_RED(vredmaxu_vs_b, uint8_t, uint8_t, H1, H1, DO_MAX, clearb)
 +GEN_VEXT_RED(vredmaxu_vs_h, uint16_t, uint16_t, H2, H2, DO_MAX, clearh)
 +GEN_VEXT_RED(vredmaxu_vs_w, uint32_t, uint32_t, H4, H4, DO_MAX, clearl)
 +GEN_VEXT_RED(vredmaxu_vs_d, uint64_t, uint64_t, H8, H8, DO_MAX, clearq)
 +
 +/* vd[0] = max(vs1[0], vs2[*]) */
 +GEN_VEXT_RED(vredmax_vs_b, int8_t, int8_t, H1, H1, DO_MAX, clearb)
 +GEN_VEXT_RED(vredmax_vs_h, int16_t, int16_t, H2, H2, DO_MAX, clearh)
 +GEN_VEXT_RED(vredmax_vs_w, int32_t, int32_t, H4, H4, DO_MAX, clearl)
 +GEN_VEXT_RED(vredmax_vs_d, int64_t, int64_t, H8, H8, DO_MAX, clearq)
 +
 +/* vd[0] = minu(vs1[0], vs2[*]) */
 +GEN_VEXT_RED(vredminu_vs_b, uint8_t, uint8_t, H1, H1, DO_MIN, clearb)
 +GEN_VEXT_RED(vredminu_vs_h, uint16_t, uint16_t, H2, H2, DO_MIN, clearh)
 +GEN_VEXT_RED(vredminu_vs_w, uint32_t, uint32_t, H4, H4, DO_MIN, clearl)
 +GEN_VEXT_RED(vredminu_vs_d, uint64_t, uint64_t, H8, H8, DO_MIN, clearq)
 +
 +/* vd[0] = min(vs1[0], vs2[*]) */
 +GEN_VEXT_RED(vredmin_vs_b, int8_t, int8_t, H1, H1, DO_MIN, clearb)
 +GEN_VEXT_RED(vredmin_vs_h, int16_t, int16_t, H2, H2, DO_MIN, clearh)
 +GEN_VEXT_RED(vredmin_vs_w, int32_t, int32_t, H4, H4, DO_MIN, clearl)
 +GEN_VEXT_RED(vredmin_vs_d, int64_t, int64_t, H8, H8, DO_MIN, clearq)
 +
 +/* vd[0] = and(vs1[0], vs2[*]) */
 +GEN_VEXT_RED(vredand_vs_b, int8_t, int8_t, H1, H1, DO_AND, clearb)
 +GEN_VEXT_RED(vredand_vs_h, int16_t, int16_t, H2, H2, DO_AND, clearh)
 +GEN_VEXT_RED(vredand_vs_w, int32_t, int32_t, H4, H4, DO_AND, clearl)
 +GEN_VEXT_RED(vredand_vs_d, int64_t, int64_t, H8, H8, DO_AND, clearq)
 +
 +/* vd[0] = or(vs1[0], vs2[*]) */
 +GEN_VEXT_RED(vredor_vs_b, int8_t, int8_t, H1, H1, DO_OR, clearb)
 +GEN_VEXT_RED(vredor_vs_h, int16_t, int16_t, H2, H2, DO_OR, clearh)
 +GEN_VEXT_RED(vredor_vs_w, int32_t, int32_t, H4, H4, DO_OR, clearl)
 +GEN_VEXT_RED(vredor_vs_d, int64_t, int64_t, H8, H8, DO_OR, clearq)
 +
 +/* vd[0] = xor(vs1[0], vs2[*]) */
 +GEN_VEXT_RED(vredxor_vs_b, int8_t, int8_t, H1, H1, DO_XOR, clearb)
 +GEN_VEXT_RED(vredxor_vs_h, int16_t, int16_t, H2, H2, DO_XOR, clearh)
 +GEN_VEXT_RED(vredxor_vs_w, int32_t, int32_t, H4, H4, DO_XOR, clearl)
 +GEN_VEXT_RED(vredxor_vs_d, int64_t, int64_t, H8, H8, DO_XOR, clearq)
 --
-.27.0
+.41.0

-[PULL 63/63] target/riscv: configure and turn on vector extension from command line
+[PULL v2 24/45] target/riscv: Add Zihintntl extension ISA string to DTS
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Jason Chien <jason.chien@sifive.com>
-Vector extension is default off. The only way to use vector extension is
+RVA23 Profiles states:
-. use cpu rv32 or rv64
+The RVA23 profiles are intended to be used for 64-bit application
-. turn on it by command line
+processors that will run rich OS stacks from standard binary OS
-   "-cpu rv64,x-v=true,vlen=128,elen=64,vext_spec=v0.7.1".
+distributions and with a substantial number of third-party binary user
 applications that will be supported over a considerable length of time
 in the field.
-vlen is the vector register length, default value is 128 bit.
+The chapter 4 of the unprivileged spec introduces the Zihintntl extension
-elen is the max operator size in bits, default value is 64 bit.
+and Zihintntl is a mandatory extension presented in RVA23 Profiles, whose
-vext_spec is the vector specification version, default value is v0.7.1.
+purpose is to enable application and operating system portability across
-These properties can be specified with other values.
+different implementations. Thus the DTS should contain the Zihintntl ISA
 string in order to pass to software.
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+The unprivileged spec states:
 Like any HINTs, these instructions may be freely ignored. Hence, although
 they are described in terms of cache-based memory hierarchies, they do not
 mandate the provision of caches.
 These instructions are encoded with non-used opcode, e.g. ADD x0, x0, x2,
 which QEMU already supports, and QEMU does not emulate cache. Therefore
 these instructions can be considered as a no-op, and we only need to add
 a new property for the Zihintntl extension.
 Reviewed-by: Frank Chang <frank.chang@sifive.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Signed-off-by: Jason Chien <jason.chien@sifive.com>
-Message-id: 20200623215920.2594-62-zhiwei_liu@c-sky.com
+Message-ID: <20230726074049.19505-2-jason.chien@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/cpu.h |  4 +++-
+ target/riscv/cpu_cfg.h | 1 +
- target/riscv/cpu.c | 43 +++++++++++++++++++++++++++++++++++++++++++
+ target/riscv/cpu.c     | 2 ++
-files changed, 46 insertions(+), 1 deletion(-)
+files changed, 3 insertions(+)
-diff --git a/target/riscv/cpu.h b/target/riscv/cpu.h
+diff --git a/target/riscv/cpu_cfg.h b/target/riscv/cpu_cfg.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/cpu.h
+--- a/target/riscv/cpu_cfg.h
-+++ b/target/riscv/cpu.h
++++ b/target/riscv/cpu_cfg.h
-@@ -XXX,XX +XXX,XX @@ typedef struct CPURISCVState CPURISCVState;
+@@ -XXX,XX +XXX,XX @@ struct RISCVCPUConfig {
+     bool ext_icbom;
- #include "pmp.h"
+     bool ext_icboz;
+     bool ext_zicond;
--#define RV_VLEN_MAX 512
++    bool ext_zihintntl;
-+#define RV_VLEN_MAX 256
+     bool ext_zihintpause;
+     bool ext_smstateen;
- FIELD(VTYPE, VLMUL, 0, 2)
+     bool ext_sstc;
  FIELD(VTYPE, VSEW, 2, 3)
@@ -XXX,XX +XXX,XX @@ typedef struct RISCVCPU {
          bool ext_s;
          bool ext_u;
          bool ext_h;
 +        bool ext_v;
          bool ext_counters;
          bool ext_ifencei;
          bool ext_icsr;
          char *priv_spec;
          char *user_spec;
 +        char *vext_spec;
          uint16_t vlen;
          uint16_t elen;
          bool mmu;
 diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/cpu.c
 +++ b/target/riscv/cpu.c
-@@ -XXX,XX +XXX,XX @@ static void riscv_cpu_realize(DeviceState *dev, Error **errp)
+@@ -XXX,XX +XXX,XX @@ static const struct isa_ext_data isa_edata_arr[] = {
-         if (cpu->cfg.ext_h) {
+     ISA_EXT_DATA_ENTRY(zicond, PRIV_VERSION_1_12_0, ext_zicond),
-             target_misa |= RVH;
+     ISA_EXT_DATA_ENTRY(zicsr, PRIV_VERSION_1_10_0, ext_icsr),
-         }
+     ISA_EXT_DATA_ENTRY(zifencei, PRIV_VERSION_1_10_0, ext_ifencei),
-+        if (cpu->cfg.ext_v) {
++    ISA_EXT_DATA_ENTRY(zihintntl, PRIV_VERSION_1_10_0, ext_zihintntl),
-+            target_misa |= RVV;
+     ISA_EXT_DATA_ENTRY(zihintpause, PRIV_VERSION_1_10_0, ext_zihintpause),
-+            if (!is_power_of_2(cpu->cfg.vlen)) {
+     ISA_EXT_DATA_ENTRY(zmmul, PRIV_VERSION_1_12_0, ext_zmmul),
-+                error_setg(errp,
+     ISA_EXT_DATA_ENTRY(zawrs, PRIV_VERSION_1_12_0, ext_zawrs),
-+                        "Vector extension VLEN must be power of 2");
+@@ -XXX,XX +XXX,XX @@ static Property riscv_cpu_extensions[] = {
-+                return;
+     DEFINE_PROP_BOOL("sscofpmf", RISCVCPU, cfg.ext_sscofpmf, false),
 +            }
 +            if (cpu->cfg.vlen > RV_VLEN_MAX || cpu->cfg.vlen < 128) {
 +                error_setg(errp,
 +                        "Vector extension implementation only supports VLEN "
 +                        "in the range [128, %d]", RV_VLEN_MAX);
 +                return;
 +            }
 +            if (!is_power_of_2(cpu->cfg.elen)) {
 +                error_setg(errp,
 +                        "Vector extension ELEN must be power of 2");
 +                return;
 +            }
 +            if (cpu->cfg.elen > 64 || cpu->cfg.vlen < 8) {
 +                error_setg(errp,
 +                        "Vector extension implementation only supports ELEN "
 +                        "in the range [8, 64]");
 +                return;
 +            }
 +            if (cpu->cfg.vext_spec) {
 +                if (!g_strcmp0(cpu->cfg.vext_spec, "v0.7.1")) {
 +                    vext_version = VEXT_VERSION_0_07_1;
 +                } else {
 +                    error_setg(errp,
 +                           "Unsupported vector spec version '%s'",
 +                           cpu->cfg.vext_spec);
 +                    return;
 +                }
 +            } else {
 +                qemu_log("vector verison is not specified, "
 +                        "use the default value v0.7.1\n");
 +            }
 +            set_vext_version(env, vext_version);
 +        }
          set_misa(env, RVXLEN | target_misa);
      }
@@ -XXX,XX +XXX,XX @@ static Property riscv_cpu_properties[] = {
      DEFINE_PROP_BOOL("u", RISCVCPU, cfg.ext_u, true),
      /* This is experimental so mark with 'x-' */
      DEFINE_PROP_BOOL("x-h", RISCVCPU, cfg.ext_h, false),
 +    DEFINE_PROP_BOOL("x-v", RISCVCPU, cfg.ext_v, false),
      DEFINE_PROP_BOOL("Counters", RISCVCPU, cfg.ext_counters, true),
      DEFINE_PROP_BOOL("Zifencei", RISCVCPU, cfg.ext_ifencei, true),
      DEFINE_PROP_BOOL("Zicsr", RISCVCPU, cfg.ext_icsr, true),
-     DEFINE_PROP_STRING("priv_spec", RISCVCPU, cfg.priv_spec),
++    DEFINE_PROP_BOOL("Zihintntl", RISCVCPU, cfg.ext_zihintntl, true),
-+    DEFINE_PROP_STRING("vext_spec", RISCVCPU, cfg.vext_spec),
+     DEFINE_PROP_BOOL("Zihintpause", RISCVCPU, cfg.ext_zihintpause, true),
-+    DEFINE_PROP_UINT16("vlen", RISCVCPU, cfg.vlen, 128),
+     DEFINE_PROP_BOOL("Zawrs", RISCVCPU, cfg.ext_zawrs, true),
-+    DEFINE_PROP_UINT16("elen", RISCVCPU, cfg.elen, 64),
+     DEFINE_PROP_BOOL("Zfa", RISCVCPU, cfg.ext_zfa, true),
      DEFINE_PROP_BOOL("mmu", RISCVCPU, cfg.mmu, true),
      DEFINE_PROP_BOOL("pmp", RISCVCPU, cfg.pmp, true),
      DEFINE_PROP_END_OF_LIST(),
 --
-.27.0
+.41.0

-[PULL 62/63] target/riscv: vector compress instruction
+[PULL v2 25/45] target/riscv: Fix zfa fleq.d and fltq.d
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: LIU Zhiwei <zhiwei_liu@linux.alibaba.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Commit a47842d ("riscv: Add support for the Zfa extension") implemented the zfa extension.
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+However, it has some typos for fleq.d and fltq.d. Both of them misused the fltq.s
-Message-id: 20200623215920.2594-61-zhiwei_liu@c-sky.com
+helper function.
 Fixes: a47842d ("riscv: Add support for the Zfa extension")
 Signed-off-by: LIU Zhiwei <zhiwei_liu@linux.alibaba.com>
 Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 Reviewed-by: Weiwei Li <liweiwei@iscas.ac.cn>
 Message-ID: <20230728003906.768-1-zhiwei_liu@linux.alibaba.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   |  5 ++++
+ target/riscv/insn_trans/trans_rvzfa.c.inc | 4 ++--
- target/riscv/insn32.decode              |  1 +
+file changed, 2 insertions(+), 2 deletions(-)
  target/riscv/insn_trans/trans_rvv.inc.c | 32 +++++++++++++++++++++++++
  target/riscv/vector_helper.c            | 26 ++++++++++++++++++++
 files changed, 64 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/target/riscv/insn_trans/trans_rvzfa.c.inc b/target/riscv/insn_trans/trans_rvzfa.c.inc
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/target/riscv/insn_trans/trans_rvzfa.c.inc
-+++ b/target/riscv/helper.h
++++ b/target/riscv/insn_trans/trans_rvzfa.c.inc
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vrgather_vx_b, void, ptr, ptr, tl, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ bool trans_fleq_d(DisasContext *ctx, arg_fleq_d *a)
- DEF_HELPER_6(vrgather_vx_h, void, ptr, ptr, tl, ptr, env, i32)
+     TCGv_i64 src1 = get_fpr_hs(ctx, a->rs1);
- DEF_HELPER_6(vrgather_vx_w, void, ptr, ptr, tl, ptr, env, i32)
+     TCGv_i64 src2 = get_fpr_hs(ctx, a->rs2);
- DEF_HELPER_6(vrgather_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+
+-    gen_helper_fltq_s(dest, cpu_env, src1, src2);
-+DEF_HELPER_6(vcompress_vm_b, void, ptr, ptr, ptr, ptr, env, i32)
++    gen_helper_fleq_d(dest, cpu_env, src1, src2);
-+DEF_HELPER_6(vcompress_vm_h, void, ptr, ptr, ptr, ptr, env, i32)
+     gen_set_gpr(ctx, a->rd, dest);
 +DEF_HELPER_6(vcompress_vm_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vcompress_vm_d, void, ptr, ptr, ptr, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@ vslide1down_vx  001111 . ..... ..... 110 ..... 1010111 @r_vm
  vrgather_vv     001100 . ..... ..... 000 ..... 1010111 @r_vm
  vrgather_vx     001100 . ..... ..... 100 ..... 1010111 @r_vm
  vrgather_vi     001100 . ..... ..... 011 ..... 1010111 @r_vm
 +vcompress_vm    010111 - ..... ..... 010 ..... 1010111 @r
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ static bool trans_vrgather_vi(DisasContext *s, arg_rmrr *a)
      }
      return true;
  }
-+
+@@ -XXX,XX +XXX,XX @@ bool trans_fltq_d(DisasContext *ctx, arg_fltq_d *a)
-+/* Vector Compress Instruction */
+     TCGv_i64 src1 = get_fpr_hs(ctx, a->rs1);
-+static bool vcompress_vm_check(DisasContext *s, arg_r *a)
+     TCGv_i64 src2 = get_fpr_hs(ctx, a->rs2);
-+{
-+    return (vext_check_isa_ill(s) &&
+-    gen_helper_fltq_s(dest, cpu_env, src1, src2);
-+            vext_check_reg(s, a->rd, false) &&
++    gen_helper_fltq_d(dest, cpu_env, src1, src2);
-+            vext_check_reg(s, a->rs2, false) &&
+     gen_set_gpr(ctx, a->rd, dest);
-+            vext_check_overlap_group(a->rd, 1 << s->lmul, a->rs1, 1) &&
+     return true;
-+            (a->rd != a->rs2));
+ }
 +}
 +
 +static bool trans_vcompress_vm(DisasContext *s, arg_r *a)
 +{
 +    if (vcompress_vm_check(s, a)) {
 +        uint32_t data = 0;
 +        static gen_helper_gvec_4_ptr * const fns[4] = {
 +            gen_helper_vcompress_vm_b, gen_helper_vcompress_vm_h,
 +            gen_helper_vcompress_vm_w, gen_helper_vcompress_vm_d,
 +        };
 +        TCGLabel *over = gen_new_label();
 +        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +
 +        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
 +        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
 +        tcg_gen_gvec_4_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),
 +                           vreg_ofs(s, a->rs1), vreg_ofs(s, a->rs2),
 +                           cpu_env, 0, s->vlen / 8, data, fns[s->sew]);
 +        gen_set_label(over);
 +        return true;
 +    }
 +    return false;
 +}
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VRGATHER_VX(vrgather_vx_b, uint8_t, H1, clearb)
  GEN_VEXT_VRGATHER_VX(vrgather_vx_h, uint16_t, H2, clearh)
  GEN_VEXT_VRGATHER_VX(vrgather_vx_w, uint32_t, H4, clearl)
  GEN_VEXT_VRGATHER_VX(vrgather_vx_d, uint64_t, H8, clearq)
 +
 +/* Vector Compress Instruction */
 +#define GEN_VEXT_VCOMPRESS_VM(NAME, ETYPE, H, CLEAR_FN)                   \
 +void HELPER(NAME)(void *vd, void *v0, void *vs1, void *vs2,               \
 +                  CPURISCVState *env, uint32_t desc)                      \
 +{                                                                         \
 +    uint32_t mlen = vext_mlen(desc);                                      \
 +    uint32_t vlmax = env_archcpu(env)->cfg.vlen / mlen;                   \
 +    uint32_t vl = env->vl;                                                \
 +    uint32_t num = 0, i;                                                  \
 +                                                                          \
 +    for (i = 0; i < vl; i++) {                                            \
 +        if (!vext_elem_mask(vs1, mlen, i)) {                              \
 +            continue;                                                     \
 +        }                                                                 \
 +        *((ETYPE *)vd + H(num)) = *((ETYPE *)vs2 + H(i));                 \
 +        num++;                                                            \
 +    }                                                                     \
 +    CLEAR_FN(vd, num, num * sizeof(ETYPE), vlmax * sizeof(ETYPE));        \
 +}
 +
 +/* Compress into vd elements of vs2 where vs1 is enabled */
 +GEN_VEXT_VCOMPRESS_VM(vcompress_vm_b, uint8_t, H1, clearb)
 +GEN_VEXT_VCOMPRESS_VM(vcompress_vm_h, uint16_t, H2, clearh)
 +GEN_VEXT_VCOMPRESS_VM(vcompress_vm_w, uint32_t, H4, clearl)
 +GEN_VEXT_VCOMPRESS_VM(vcompress_vm_d, uint64_t, H8, clearq)
 --
-.27.0
+.41.0

-[PULL 46/63] target/riscv: narrowing floating-point/integer type-convert instructions
+[PULL v2 26/45] hw/intc: Fix upper/lower mtime write calculation
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Jason Chien <jason.chien@sifive.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+When writing the upper mtime, we should keep the original lower mtime
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+whose value is given by cpu_riscv_read_rtc() instead of
 cpu_riscv_read_rtc_raw(). The same logic applies to writes to lower mtime.
 Signed-off-by: Jason Chien <jason.chien@sifive.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-45-zhiwei_liu@c-sky.com
+Message-ID: <20230728082502.26439-1-jason.chien@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   | 11 ++++++
+ hw/intc/riscv_aclint.c | 5 +++--
- target/riscv/insn32.decode              |  5 +++
+file changed, 3 insertions(+), 2 deletions(-)
  target/riscv/insn_trans/trans_rvv.inc.c | 48 +++++++++++++++++++++++++
  target/riscv/vector_helper.c            | 39 ++++++++++++++++++++
 files changed, 103 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/hw/intc/riscv_aclint.c b/hw/intc/riscv_aclint.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/hw/intc/riscv_aclint.c
-+++ b/target/riscv/helper.h
++++ b/hw/intc/riscv_aclint.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_5(vfwcvt_f_x_v_h, void, ptr, ptr, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ static void riscv_aclint_mtimer_write(void *opaque, hwaddr addr,
- DEF_HELPER_5(vfwcvt_f_x_v_w, void, ptr, ptr, ptr, env, i32)
+         return;
- DEF_HELPER_5(vfwcvt_f_f_v_h, void, ptr, ptr, ptr, env, i32)
+     } else if (addr == mtimer->time_base || addr == mtimer->time_base + 4) {
- DEF_HELPER_5(vfwcvt_f_f_v_w, void, ptr, ptr, ptr, env, i32)
+         uint64_t rtc_r = cpu_riscv_read_rtc_raw(mtimer->timebase_freq);
-+
++        uint64_t rtc = cpu_riscv_read_rtc(mtimer);
-+DEF_HELPER_5(vfncvt_xu_f_v_h, void, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_5(vfncvt_xu_f_v_w, void, ptr, ptr, ptr, env, i32)
+         if (addr == mtimer->time_base) {
-+DEF_HELPER_5(vfncvt_x_f_v_h, void, ptr, ptr, ptr, env, i32)
+             if (size == 4) {
-+DEF_HELPER_5(vfncvt_x_f_v_w, void, ptr, ptr, ptr, env, i32)
+                 /* time_lo for RV32/RV64 */
-+DEF_HELPER_5(vfncvt_f_xu_v_h, void, ptr, ptr, ptr, env, i32)
+-                mtimer->time_delta = ((rtc_r & ~0xFFFFFFFFULL) | value) - rtc_r;
-+DEF_HELPER_5(vfncvt_f_xu_v_w, void, ptr, ptr, ptr, env, i32)
++                mtimer->time_delta = ((rtc & ~0xFFFFFFFFULL) | value) - rtc_r;
-+DEF_HELPER_5(vfncvt_f_x_v_h, void, ptr, ptr, ptr, env, i32)
+             } else {
-+DEF_HELPER_5(vfncvt_f_x_v_w, void, ptr, ptr, ptr, env, i32)
+                 /* time for RV64 */
-+DEF_HELPER_5(vfncvt_f_f_v_h, void, ptr, ptr, ptr, env, i32)
+                 mtimer->time_delta = value - rtc_r;
-+DEF_HELPER_5(vfncvt_f_f_v_w, void, ptr, ptr, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ static void riscv_aclint_mtimer_write(void *opaque, hwaddr addr,
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
+         } else {
-index XXXXXXX..XXXXXXX 100644
+             if (size == 4) {
---- a/target/riscv/insn32.decode
+                 /* time_hi for RV32/RV64 */
-+++ b/target/riscv/insn32.decode
+-                mtimer->time_delta = (value << 32 | (rtc_r & 0xFFFFFFFF)) - rtc_r;
-@@ -XXX,XX +XXX,XX @@ vfwcvt_x_f_v    100010 . ..... 01001 001 ..... 1010111 @r2_vm
++                mtimer->time_delta = (value << 32 | (rtc & 0xFFFFFFFF)) - rtc_r;
- vfwcvt_f_xu_v   100010 . ..... 01010 001 ..... 1010111 @r2_vm
+             } else {
- vfwcvt_f_x_v    100010 . ..... 01011 001 ..... 1010111 @r2_vm
+                 qemu_log_mask(LOG_GUEST_ERROR,
- vfwcvt_f_f_v    100010 . ..... 01100 001 ..... 1010111 @r2_vm
+                               "aclint-mtimer: invalid time_hi write: %08x",
 +vfncvt_xu_f_v   100010 . ..... 10000 001 ..... 1010111 @r2_vm
 +vfncvt_x_f_v    100010 . ..... 10001 001 ..... 1010111 @r2_vm
 +vfncvt_f_xu_v   100010 . ..... 10010 001 ..... 1010111 @r2_vm
 +vfncvt_f_x_v    100010 . ..... 10011 001 ..... 1010111 @r2_vm
 +vfncvt_f_f_v    100010 . ..... 10100 001 ..... 1010111 @r2_vm
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ GEN_OPFV_WIDEN_TRANS(vfwcvt_x_f_v)
  GEN_OPFV_WIDEN_TRANS(vfwcvt_f_xu_v)
  GEN_OPFV_WIDEN_TRANS(vfwcvt_f_x_v)
  GEN_OPFV_WIDEN_TRANS(vfwcvt_f_f_v)
 +
 +/* Narrowing Floating-Point/Integer Type-Convert Instructions */
 +
 +/*
 + * If the current SEW does not correspond to a supported IEEE floating-point
 + * type, an illegal instruction exception is raised
 + */
 +static bool opfv_narrow_check(DisasContext *s, arg_rmr *a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_overlap_mask(s, a->rd, a->vm, false) &&
 +            vext_check_reg(s, a->rd, false) &&
 +            vext_check_reg(s, a->rs2, true) &&
 +            vext_check_overlap_group(a->rd, 1 << s->lmul, a->rs2,
 +                                     2 << s->lmul) &&
 +            (s->lmul < 0x3) && (s->sew < 0x3) && (s->sew != 0));
 +}
 +
 +#define GEN_OPFV_NARROW_TRANS(NAME)                                \
 +static bool trans_##NAME(DisasContext *s, arg_rmr *a)              \
 +{                                                                  \
 +    if (opfv_narrow_check(s, a)) {                                 \
 +        uint32_t data = 0;                                         \
 +        static gen_helper_gvec_3_ptr * const fns[2] = {            \
 +            gen_helper_##NAME##_h,                                 \
 +            gen_helper_##NAME##_w,                                 \
 +        };                                                         \
 +        TCGLabel *over = gen_new_label();                          \
 +        gen_set_rm(s, 7);                                          \
 +        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
 +                                                                   \
 +        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);             \
 +        data = FIELD_DP32(data, VDATA, VM, a->vm);                 \
 +        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);             \
 +        tcg_gen_gvec_3_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),     \
 +                           vreg_ofs(s, a->rs2), cpu_env, 0,        \
 +                           s->vlen / 8, data, fns[s->sew - 1]);    \
 +        gen_set_label(over);                                       \
 +        return true;                                               \
 +    }                                                              \
 +    return false;                                                  \
 +}
 +
 +GEN_OPFV_NARROW_TRANS(vfncvt_xu_f_v)
 +GEN_OPFV_NARROW_TRANS(vfncvt_x_f_v)
 +GEN_OPFV_NARROW_TRANS(vfncvt_f_xu_v)
 +GEN_OPFV_NARROW_TRANS(vfncvt_f_x_v)
 +GEN_OPFV_NARROW_TRANS(vfncvt_f_f_v)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ RVVCALL(OPFVV1, vfwcvt_f_f_v_h, WOP_UU_H, H4, H2, vfwcvtffv16)
  RVVCALL(OPFVV1, vfwcvt_f_f_v_w, WOP_UU_W, H8, H4, float32_to_float64)
  GEN_VEXT_V_ENV(vfwcvt_f_f_v_h, 2, 4, clearl)
  GEN_VEXT_V_ENV(vfwcvt_f_f_v_w, 4, 8, clearq)
 +
 +/* Narrowing Floating-Point/Integer Type-Convert Instructions */
 +/* (TD, T2, TX2) */
 +#define NOP_UU_H uint16_t, uint32_t, uint32_t
 +#define NOP_UU_W uint32_t, uint64_t, uint64_t
 +/* vfncvt.xu.f.v vd, vs2, vm # Convert float to unsigned integer. */
 +RVVCALL(OPFVV1, vfncvt_xu_f_v_h, NOP_UU_H, H2, H4, float32_to_uint16)
 +RVVCALL(OPFVV1, vfncvt_xu_f_v_w, NOP_UU_W, H4, H8, float64_to_uint32)
 +GEN_VEXT_V_ENV(vfncvt_xu_f_v_h, 2, 2, clearh)
 +GEN_VEXT_V_ENV(vfncvt_xu_f_v_w, 4, 4, clearl)
 +
 +/* vfncvt.x.f.v vd, vs2, vm # Convert double-width float to signed integer. */
 +RVVCALL(OPFVV1, vfncvt_x_f_v_h, NOP_UU_H, H2, H4, float32_to_int16)
 +RVVCALL(OPFVV1, vfncvt_x_f_v_w, NOP_UU_W, H4, H8, float64_to_int32)
 +GEN_VEXT_V_ENV(vfncvt_x_f_v_h, 2, 2, clearh)
 +GEN_VEXT_V_ENV(vfncvt_x_f_v_w, 4, 4, clearl)
 +
 +/* vfncvt.f.xu.v vd, vs2, vm # Convert double-width unsigned integer to float */
 +RVVCALL(OPFVV1, vfncvt_f_xu_v_h, NOP_UU_H, H2, H4, uint32_to_float16)
 +RVVCALL(OPFVV1, vfncvt_f_xu_v_w, NOP_UU_W, H4, H8, uint64_to_float32)
 +GEN_VEXT_V_ENV(vfncvt_f_xu_v_h, 2, 2, clearh)
 +GEN_VEXT_V_ENV(vfncvt_f_xu_v_w, 4, 4, clearl)
 +
 +/* vfncvt.f.x.v vd, vs2, vm # Convert double-width integer to float. */
 +RVVCALL(OPFVV1, vfncvt_f_x_v_h, NOP_UU_H, H2, H4, int32_to_float16)
 +RVVCALL(OPFVV1, vfncvt_f_x_v_w, NOP_UU_W, H4, H8, int64_to_float32)
 +GEN_VEXT_V_ENV(vfncvt_f_x_v_h, 2, 2, clearh)
 +GEN_VEXT_V_ENV(vfncvt_f_x_v_w, 4, 4, clearl)
 +
 +/* vfncvt.f.f.v vd, vs2, vm # Convert double float to single-width float. */
 +static uint16_t vfncvtffv16(uint32_t a, float_status *s)
 +{
 +    return float32_to_float16(a, true, s);
 +}
 +
 +RVVCALL(OPFVV1, vfncvt_f_f_v_h, NOP_UU_H, H2, H4, vfncvtffv16)
 +RVVCALL(OPFVV1, vfncvt_f_f_v_w, NOP_UU_W, H4, H8, float64_to_float32)
 +GEN_VEXT_V_ENV(vfncvt_f_f_v_h, 2, 2, clearh)
 +GEN_VEXT_V_ENV(vfncvt_f_f_v_w, 4, 4, clearl)
 --
-.27.0
+.41.0

-[PULL 45/63] target/riscv: widening floating-point/integer type-convert instructions
+[PULL v2 27/45] hw/intc: Make rtc variable names consistent
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Jason Chien <jason.chien@sifive.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+The variables whose values are given by cpu_riscv_read_rtc() should be named
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+"rtc". The variables whose value are given by cpu_riscv_read_rtc_raw()
 should be named "rtc_r".
 Signed-off-by: Jason Chien <jason.chien@sifive.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-44-zhiwei_liu@c-sky.com
+Message-ID: <20230728082502.26439-2-jason.chien@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   | 11 ++++++
+ hw/intc/riscv_aclint.c | 6 +++---
- target/riscv/insn32.decode              |  5 +++
+file changed, 3 insertions(+), 3 deletions(-)
  target/riscv/insn_trans/trans_rvv.inc.c | 48 +++++++++++++++++++++++++
  target/riscv/vector_helper.c            | 42 ++++++++++++++++++++++
 files changed, 106 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/hw/intc/riscv_aclint.c b/hw/intc/riscv_aclint.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/hw/intc/riscv_aclint.c
-+++ b/target/riscv/helper.h
++++ b/hw/intc/riscv_aclint.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_5(vfcvt_f_xu_v_d, void, ptr, ptr, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ static void riscv_aclint_mtimer_write_timecmp(RISCVAclintMTimerState *mtimer,
- DEF_HELPER_5(vfcvt_f_x_v_h, void, ptr, ptr, ptr, env, i32)
+     uint64_t next;
- DEF_HELPER_5(vfcvt_f_x_v_w, void, ptr, ptr, ptr, env, i32)
+     uint64_t diff;
- DEF_HELPER_5(vfcvt_f_x_v_d, void, ptr, ptr, ptr, env, i32)
-+
+-    uint64_t rtc_r = cpu_riscv_read_rtc(mtimer);
-+DEF_HELPER_5(vfwcvt_xu_f_v_h, void, ptr, ptr, ptr, env, i32)
++    uint64_t rtc = cpu_riscv_read_rtc(mtimer);
-+DEF_HELPER_5(vfwcvt_xu_f_v_w, void, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_5(vfwcvt_x_f_v_h, void, ptr, ptr, ptr, env, i32)
+     /* Compute the relative hartid w.r.t the socket */
-+DEF_HELPER_5(vfwcvt_x_f_v_w, void, ptr, ptr, ptr, env, i32)
+     hartid = hartid - mtimer->hartid_base;
-+DEF_HELPER_5(vfwcvt_f_xu_v_h, void, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_5(vfwcvt_f_xu_v_w, void, ptr, ptr, ptr, env, i32)
+     mtimer->timecmp[hartid] = value;
-+DEF_HELPER_5(vfwcvt_f_x_v_h, void, ptr, ptr, ptr, env, i32)
+-    if (mtimer->timecmp[hartid] <= rtc_r) {
-+DEF_HELPER_5(vfwcvt_f_x_v_w, void, ptr, ptr, ptr, env, i32)
++    if (mtimer->timecmp[hartid] <= rtc) {
-+DEF_HELPER_5(vfwcvt_f_f_v_h, void, ptr, ptr, ptr, env, i32)
+         /*
-+DEF_HELPER_5(vfwcvt_f_f_v_w, void, ptr, ptr, ptr, env, i32)
+          * If we're setting an MTIMECMP value in the "past",
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
+          * immediately raise the timer interrupt
-index XXXXXXX..XXXXXXX 100644
+@@ -XXX,XX +XXX,XX @@ static void riscv_aclint_mtimer_write_timecmp(RISCVAclintMTimerState *mtimer,
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
+     /* otherwise, set up the future timer interrupt */
-@@ -XXX,XX +XXX,XX @@ vfcvt_xu_f_v    100010 . ..... 00000 001 ..... 1010111 @r2_vm
+     qemu_irq_lower(mtimer->timer_irqs[hartid]);
- vfcvt_x_f_v     100010 . ..... 00001 001 ..... 1010111 @r2_vm
+-    diff = mtimer->timecmp[hartid] - rtc_r;
- vfcvt_f_xu_v    100010 . ..... 00010 001 ..... 1010111 @r2_vm
++    diff = mtimer->timecmp[hartid] - rtc;
- vfcvt_f_x_v     100010 . ..... 00011 001 ..... 1010111 @r2_vm
+     /* back to ns (note args switched in muldiv64) */
-+vfwcvt_xu_f_v   100010 . ..... 01000 001 ..... 1010111 @r2_vm
+     uint64_t ns_diff = muldiv64(diff, NANOSECONDS_PER_SECOND, timebase_freq);
-+vfwcvt_x_f_v    100010 . ..... 01001 001 ..... 1010111 @r2_vm
 +vfwcvt_f_xu_v   100010 . ..... 01010 001 ..... 1010111 @r2_vm
 +vfwcvt_f_x_v    100010 . ..... 01011 001 ..... 1010111 @r2_vm
 +vfwcvt_f_f_v    100010 . ..... 01100 001 ..... 1010111 @r2_vm
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ GEN_OPFV_TRANS(vfcvt_xu_f_v, opfv_check)
  GEN_OPFV_TRANS(vfcvt_x_f_v, opfv_check)
  GEN_OPFV_TRANS(vfcvt_f_xu_v, opfv_check)
  GEN_OPFV_TRANS(vfcvt_f_x_v, opfv_check)
 +
 +/* Widening Floating-Point/Integer Type-Convert Instructions */
 +
 +/*
 + * If the current SEW does not correspond to a supported IEEE floating-point
 + * type, an illegal instruction exception is raised
 + */
 +static bool opfv_widen_check(DisasContext *s, arg_rmr *a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_overlap_mask(s, a->rd, a->vm, true) &&
 +            vext_check_reg(s, a->rd, true) &&
 +            vext_check_reg(s, a->rs2, false) &&
 +            vext_check_overlap_group(a->rd, 2 << s->lmul, a->rs2,
 +                                     1 << s->lmul) &&
 +            (s->lmul < 0x3) && (s->sew < 0x3) && (s->sew != 0));
 +}
 +
 +#define GEN_OPFV_WIDEN_TRANS(NAME)                                 \
 +static bool trans_##NAME(DisasContext *s, arg_rmr *a)              \
 +{                                                                  \
 +    if (opfv_widen_check(s, a)) {                                  \
 +        uint32_t data = 0;                                         \
 +        static gen_helper_gvec_3_ptr * const fns[2] = {            \
 +            gen_helper_##NAME##_h,                                 \
 +            gen_helper_##NAME##_w,                                 \
 +        };                                                         \
 +        TCGLabel *over = gen_new_label();                          \
 +        gen_set_rm(s, 7);                                          \
 +        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
 +                                                                   \
 +        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);             \
 +        data = FIELD_DP32(data, VDATA, VM, a->vm);                 \
 +        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);             \
 +        tcg_gen_gvec_3_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),     \
 +                           vreg_ofs(s, a->rs2), cpu_env, 0,        \
 +                           s->vlen / 8, data, fns[s->sew - 1]);    \
 +        gen_set_label(over);                                       \
 +        return true;                                               \
 +    }                                                              \
 +    return false;                                                  \
 +}
 +
 +GEN_OPFV_WIDEN_TRANS(vfwcvt_xu_f_v)
 +GEN_OPFV_WIDEN_TRANS(vfwcvt_x_f_v)
 +GEN_OPFV_WIDEN_TRANS(vfwcvt_f_xu_v)
 +GEN_OPFV_WIDEN_TRANS(vfwcvt_f_x_v)
 +GEN_OPFV_WIDEN_TRANS(vfwcvt_f_f_v)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ RVVCALL(OPFVV1, vfcvt_f_x_v_d, OP_UU_D, H8, H8, int64_to_float64)
  GEN_VEXT_V_ENV(vfcvt_f_x_v_h, 2, 2, clearh)
  GEN_VEXT_V_ENV(vfcvt_f_x_v_w, 4, 4, clearl)
  GEN_VEXT_V_ENV(vfcvt_f_x_v_d, 8, 8, clearq)
 +
 +/* Widening Floating-Point/Integer Type-Convert Instructions */
 +/* (TD, T2, TX2) */
 +#define WOP_UU_H uint32_t, uint16_t, uint16_t
 +#define WOP_UU_W uint64_t, uint32_t, uint32_t
 +/* vfwcvt.xu.f.v vd, vs2, vm # Convert float to double-width unsigned integer.*/
 +RVVCALL(OPFVV1, vfwcvt_xu_f_v_h, WOP_UU_H, H4, H2, float16_to_uint32)
 +RVVCALL(OPFVV1, vfwcvt_xu_f_v_w, WOP_UU_W, H8, H4, float32_to_uint64)
 +GEN_VEXT_V_ENV(vfwcvt_xu_f_v_h, 2, 4, clearl)
 +GEN_VEXT_V_ENV(vfwcvt_xu_f_v_w, 4, 8, clearq)
 +
 +/* vfwcvt.x.f.v vd, vs2, vm # Convert float to double-width signed integer. */
 +RVVCALL(OPFVV1, vfwcvt_x_f_v_h, WOP_UU_H, H4, H2, float16_to_int32)
 +RVVCALL(OPFVV1, vfwcvt_x_f_v_w, WOP_UU_W, H8, H4, float32_to_int64)
 +GEN_VEXT_V_ENV(vfwcvt_x_f_v_h, 2, 4, clearl)
 +GEN_VEXT_V_ENV(vfwcvt_x_f_v_w, 4, 8, clearq)
 +
 +/* vfwcvt.f.xu.v vd, vs2, vm # Convert unsigned integer to double-width float */
 +RVVCALL(OPFVV1, vfwcvt_f_xu_v_h, WOP_UU_H, H4, H2, uint16_to_float32)
 +RVVCALL(OPFVV1, vfwcvt_f_xu_v_w, WOP_UU_W, H8, H4, uint32_to_float64)
 +GEN_VEXT_V_ENV(vfwcvt_f_xu_v_h, 2, 4, clearl)
 +GEN_VEXT_V_ENV(vfwcvt_f_xu_v_w, 4, 8, clearq)
 +
 +/* vfwcvt.f.x.v vd, vs2, vm # Convert integer to double-width float. */
 +RVVCALL(OPFVV1, vfwcvt_f_x_v_h, WOP_UU_H, H4, H2, int16_to_float32)
 +RVVCALL(OPFVV1, vfwcvt_f_x_v_w, WOP_UU_W, H8, H4, int32_to_float64)
 +GEN_VEXT_V_ENV(vfwcvt_f_x_v_h, 2, 4, clearl)
 +GEN_VEXT_V_ENV(vfwcvt_f_x_v_w, 4, 8, clearq)
 +
 +/*
 + * vfwcvt.f.f.v vd, vs2, vm #
 + * Convert single-width float to double-width float.
 + */
 +static uint32_t vfwcvtffv16(uint16_t a, float_status *s)
 +{
 +    return float16_to_float32(a, true, s);
 +}
 +
 +RVVCALL(OPFVV1, vfwcvt_f_f_v_h, WOP_UU_H, H4, H2, vfwcvtffv16)
 +RVVCALL(OPFVV1, vfwcvt_f_f_v_w, WOP_UU_W, H8, H4, float32_to_float64)
 +GEN_VEXT_V_ENV(vfwcvt_f_f_v_h, 2, 4, clearl)
 +GEN_VEXT_V_ENV(vfwcvt_f_f_v_w, 4, 8, clearq)
 --
-.27.0
+.41.0

-[PULL 43/63] target/riscv: vector floating-point merge instructions
+[PULL v2 28/45] linux-user/riscv: Use abi type for target_ucontext
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: LIU Zhiwei <zhiwei_liu@linux.alibaba.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+We should not use types dependend on host arch for target_ucontext.
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+This bug is found when run rv32 applications.
 Signed-off-by: LIU Zhiwei <zhiwei_liu@linux.alibaba.com>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200623215920.2594-42-zhiwei_liu@c-sky.com
+Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Message-ID: <20230811055438.1945-1-zhiwei_liu@linux.alibaba.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   |  4 +++
+ linux-user/riscv/signal.c | 4 ++--
- target/riscv/insn32.decode              |  2 ++
+file changed, 2 insertions(+), 2 deletions(-)
  target/riscv/insn_trans/trans_rvv.inc.c | 38 +++++++++++++++++++++++++
  target/riscv/vector_helper.c            | 24 ++++++++++++++++
 files changed, 68 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/linux-user/riscv/signal.c b/linux-user/riscv/signal.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/linux-user/riscv/signal.c
-+++ b/target/riscv/helper.h
++++ b/linux-user/riscv/signal.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vmford_vf_d, void, ptr, ptr, i64, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ struct target_sigcontext {
- DEF_HELPER_5(vfclass_v_h, void, ptr, ptr, ptr, env, i32)
+ }; /* cf. riscv-linux:arch/riscv/include/uapi/asm/ptrace.h */
- DEF_HELPER_5(vfclass_v_w, void, ptr, ptr, ptr, env, i32)
- DEF_HELPER_5(vfclass_v_d, void, ptr, ptr, ptr, env, i32)
+ struct target_ucontext {
-+
+-    unsigned long uc_flags;
-+DEF_HELPER_6(vfmerge_vfm_h, void, ptr, ptr, i64, ptr, env, i32)
+-    struct target_ucontext *uc_link;
-+DEF_HELPER_6(vfmerge_vfm_w, void, ptr, ptr, i64, ptr, env, i32)
++    abi_ulong uc_flags;
-+DEF_HELPER_6(vfmerge_vfm_d, void, ptr, ptr, i64, ptr, env, i32)
++    abi_ptr uc_link;
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
+     target_stack_t uc_stack;
-index XXXXXXX..XXXXXXX 100644
+     target_sigset_t uc_sigmask;
---- a/target/riscv/insn32.decode
+     uint8_t   __unused[1024 / 8 - sizeof(target_sigset_t)];
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@ vmfge_vf        011111 . ..... ..... 101 ..... 1010111 @r_vm
  vmford_vv       011010 . ..... ..... 001 ..... 1010111 @r_vm
  vmford_vf       011010 . ..... ..... 101 ..... 1010111 @r_vm
  vfclass_v       100011 . ..... 10000 001 ..... 1010111 @r2_vm
 +vfmerge_vfm     010111 0 ..... ..... 101 ..... 1010111 @r_vm_0
 +vfmv_v_f        010111 1 00000 ..... 101 ..... 1010111 @r2
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ GEN_OPFVF_TRANS(vmford_vf, opfvf_cmp_check)
  /* Vector Floating-Point Classify Instruction */
  GEN_OPFV_TRANS(vfclass_v, opfv_check)
 +
 +/* Vector Floating-Point Merge Instruction */
 +GEN_OPFVF_TRANS(vfmerge_vfm,  opfvf_check)
 +
 +static bool trans_vfmv_v_f(DisasContext *s, arg_vfmv_v_f *a)
 +{
 +    if (vext_check_isa_ill(s) &&
 +        vext_check_reg(s, a->rd, false) &&
 +        (s->sew != 0)) {
 +
 +        if (s->vl_eq_vlmax) {
 +            tcg_gen_gvec_dup_i64(s->sew, vreg_ofs(s, a->rd),
 +                                 MAXSZ(s), MAXSZ(s), cpu_fpr[a->rs1]);
 +        } else {
 +            TCGv_ptr dest;
 +            TCGv_i32 desc;
 +            uint32_t data = FIELD_DP32(0, VDATA, LMUL, s->lmul);
 +            static gen_helper_vmv_vx * const fns[3] = {
 +                gen_helper_vmv_v_x_h,
 +                gen_helper_vmv_v_x_w,
 +                gen_helper_vmv_v_x_d,
 +            };
 +            TCGLabel *over = gen_new_label();
 +            tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +
 +            dest = tcg_temp_new_ptr();
 +            desc = tcg_const_i32(simd_desc(0, s->vlen / 8, data));
 +            tcg_gen_addi_ptr(dest, cpu_env, vreg_ofs(s, a->rd));
 +            fns[s->sew - 1](dest, cpu_fpr[a->rs1], cpu_env, desc);
 +
 +            tcg_temp_free_ptr(dest);
 +            tcg_temp_free_i32(desc);
 +            gen_set_label(over);
 +        }
 +        return true;
 +    }
 +    return false;
 +}
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ RVVCALL(OPIVV1, vfclass_v_d, OP_UU_D, H8, H8, fclass_d)
  GEN_VEXT_V(vfclass_v_h, 2, 2, clearh)
  GEN_VEXT_V(vfclass_v_w, 4, 4, clearl)
  GEN_VEXT_V(vfclass_v_d, 8, 8, clearq)
 +
 +/* Vector Floating-Point Merge Instruction */
 +#define GEN_VFMERGE_VF(NAME, ETYPE, H, CLEAR_FN)              \
 +void HELPER(NAME)(void *vd, void *v0, uint64_t s1, void *vs2, \
 +                  CPURISCVState *env, uint32_t desc)          \
 +{                                                             \
 +    uint32_t mlen = vext_mlen(desc);                          \
 +    uint32_t vm = vext_vm(desc);                              \
 +    uint32_t vl = env->vl;                                    \
 +    uint32_t esz = sizeof(ETYPE);                             \
 +    uint32_t vlmax = vext_maxsz(desc) / esz;                  \
 +    uint32_t i;                                               \
 +                                                              \
 +    for (i = 0; i < vl; i++) {                                \
 +        ETYPE s2 = *((ETYPE *)vs2 + H(i));                    \
 +        *((ETYPE *)vd + H(i))                                 \
 +          = (!vm && !vext_elem_mask(v0, mlen, i) ? s2 : s1);  \
 +    }                                                         \
 +    CLEAR_FN(vd, vl, vl * esz, vlmax * esz);                  \
 +}
 +
 +GEN_VFMERGE_VF(vfmerge_vfm_h, int16_t, H2, clearh)
 +GEN_VFMERGE_VF(vfmerge_vfm_w, int32_t, H4, clearl)
 +GEN_VFMERGE_VF(vfmerge_vfm_d, int64_t, H8, clearq)
 --
-.27.0
+.41.0

-[PULL 01/63] riscv: plic: Honour source priorities
+[PULL v2 29/45] target/riscv: support the AIA device emulation with KVM enabled
-From: Jessica Clarke <jrtc27@jrtc27.com>
+From: Yong-Xuan Wang <yongxuan.wang@sifive.com>
-The source priorities can be used to order sources with respect to other
+In this patch, we create the APLIC and IMSIC FDT helper functions and
-sources, not just as a way to enable/disable them based off a threshold.
+remove M mode AIA devices when using KVM acceleration.
 We must therefore always claim the highest-priority source, rather than
 the first source we find.
-Signed-off-by: Jessica Clarke <jrtc27@jrtc27.com>
+Signed-off-by: Yong-Xuan Wang <yongxuan.wang@sifive.com>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Reviewed-by: Jim Shu <jim.shu@sifive.com>
-Message-Id: <20200618202343.20455-1-jrtc27@jrtc27.com>
+Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 Reviewed-by: Andrew Jones <ajones@ventanamicro.com>
 Message-ID: <20230727102439.22554-2-yongxuan.wang@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- hw/riscv/sifive_plic.c | 17 ++++++++++++-----
+ hw/riscv/virt.c | 290 +++++++++++++++++++++++-------------------------
-file changed, 12 insertions(+), 5 deletions(-)
+file changed, 137 insertions(+), 153 deletions(-)
-diff --git a/hw/riscv/sifive_plic.c b/hw/riscv/sifive_plic.c
+diff --git a/hw/riscv/virt.c b/hw/riscv/virt.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/riscv/sifive_plic.c
+--- a/hw/riscv/virt.c
-+++ b/hw/riscv/sifive_plic.c
++++ b/hw/riscv/virt.c
-@@ -XXX,XX +XXX,XX @@ static void sifive_plic_update(SiFivePLICState *plic)
+@@ -XXX,XX +XXX,XX @@ static uint32_t imsic_num_bits(uint32_t count)
- static uint32_t sifive_plic_claim(SiFivePLICState *plic, uint32_t addrid)
+     return ret;
  }
 -static void create_fdt_imsic(RISCVVirtState *s, const MemMapEntry *memmap,
 -                             uint32_t *phandle, uint32_t *intc_phandles,
 -                             uint32_t *msi_m_phandle, uint32_t *msi_s_phandle)
 +static void create_fdt_one_imsic(RISCVVirtState *s, hwaddr base_addr,
 +                                 uint32_t *intc_phandles, uint32_t msi_phandle,
 +                                 bool m_mode, uint32_t imsic_guest_bits)
  {
-     int i, j;
+     int cpu, socket;
-+    uint32_t max_irq = 0;
+     char *imsic_name;
-+    uint32_t max_prio = plic->target_priority[addrid];
+     MachineState *ms = MACHINE(s);
-+
+     int socket_count = riscv_socket_count(ms);
-     for (i = 0; i < plic->bitfield_words; i++) {
+-    uint32_t imsic_max_hart_per_socket, imsic_guest_bits;
-         uint32_t pending_enabled_not_claimed =
++    uint32_t imsic_max_hart_per_socket;
-             (plic->pending[i] & ~plic->claimed[i]) &
+     uint32_t *imsic_cells, *imsic_regs, imsic_addr, imsic_size;
-@@ -XXX,XX +XXX,XX @@ static uint32_t sifive_plic_claim(SiFivePLICState *plic, uint32_t addrid)
-             int irq = (i << 5) + j;
+-    *msi_m_phandle = (*phandle)++;
-             uint32_t prio = plic->source_priority[irq];
+-    *msi_s_phandle = (*phandle)++;
-             int enabled = pending_enabled_not_claimed & (1 << j);
+     imsic_cells = g_new0(uint32_t, ms->smp.cpus * 2);
--            if (enabled && prio > plic->target_priority[addrid]) {
+     imsic_regs = g_new0(uint32_t, socket_count * 4);
--                sifive_plic_set_pending(plic, irq, false);
--                sifive_plic_set_claimed(plic, irq, true);
+-    /* M-level IMSIC node */
--                return irq;
+     for (cpu = 0; cpu < ms->smp.cpus; cpu++) {
-+            if (enabled && prio > max_prio) {
+         imsic_cells[cpu * 2 + 0] = cpu_to_be32(intc_phandles[cpu]);
-+                max_irq = irq;
+-        imsic_cells[cpu * 2 + 1] = cpu_to_be32(IRQ_M_EXT);
-+                max_prio = prio;
++        imsic_cells[cpu * 2 + 1] = cpu_to_be32(m_mode ? IRQ_M_EXT : IRQ_S_EXT);
-             }
+     }
 -    imsic_max_hart_per_socket = 0;
 -    for (socket = 0; socket < socket_count; socket++) {
 -        imsic_addr = memmap[VIRT_IMSIC_M].base +
 -                     socket * VIRT_IMSIC_GROUP_MAX_SIZE;
 -        imsic_size = IMSIC_HART_SIZE(0) * s->soc[socket].num_harts;
 -        imsic_regs[socket * 4 + 0] = 0;
 -        imsic_regs[socket * 4 + 1] = cpu_to_be32(imsic_addr);
 -        imsic_regs[socket * 4 + 2] = 0;
 -        imsic_regs[socket * 4 + 3] = cpu_to_be32(imsic_size);
 -        if (imsic_max_hart_per_socket < s->soc[socket].num_harts) {
 -            imsic_max_hart_per_socket = s->soc[socket].num_harts;
 -        }
 -    }
 -    imsic_name = g_strdup_printf("/soc/imsics@%lx",
 -        (unsigned long)memmap[VIRT_IMSIC_M].base);
 -    qemu_fdt_add_subnode(ms->fdt, imsic_name);
 -    qemu_fdt_setprop_string(ms->fdt, imsic_name, "compatible",
 -        "riscv,imsics");
 -    qemu_fdt_setprop_cell(ms->fdt, imsic_name, "#interrupt-cells",
 -        FDT_IMSIC_INT_CELLS);
 -    qemu_fdt_setprop(ms->fdt, imsic_name, "interrupt-controller",
 -        NULL, 0);
 -    qemu_fdt_setprop(ms->fdt, imsic_name, "msi-controller",
 -        NULL, 0);
 -    qemu_fdt_setprop(ms->fdt, imsic_name, "interrupts-extended",
 -        imsic_cells, ms->smp.cpus * sizeof(uint32_t) * 2);
 -    qemu_fdt_setprop(ms->fdt, imsic_name, "reg", imsic_regs,
 -        socket_count * sizeof(uint32_t) * 4);
 -    qemu_fdt_setprop_cell(ms->fdt, imsic_name, "riscv,num-ids",
 -        VIRT_IRQCHIP_NUM_MSIS);
 -    if (socket_count > 1) {
 -        qemu_fdt_setprop_cell(ms->fdt, imsic_name, "riscv,hart-index-bits",
 -            imsic_num_bits(imsic_max_hart_per_socket));
 -        qemu_fdt_setprop_cell(ms->fdt, imsic_name, "riscv,group-index-bits",
 -            imsic_num_bits(socket_count));
 -        qemu_fdt_setprop_cell(ms->fdt, imsic_name, "riscv,group-index-shift",
 -            IMSIC_MMIO_GROUP_MIN_SHIFT);
 -    }
 -    qemu_fdt_setprop_cell(ms->fdt, imsic_name, "phandle", *msi_m_phandle);
 -
 -    g_free(imsic_name);
 -    /* S-level IMSIC node */
 -    for (cpu = 0; cpu < ms->smp.cpus; cpu++) {
 -        imsic_cells[cpu * 2 + 0] = cpu_to_be32(intc_phandles[cpu]);
 -        imsic_cells[cpu * 2 + 1] = cpu_to_be32(IRQ_S_EXT);
 -    }
 -    imsic_guest_bits = imsic_num_bits(s->aia_guests + 1);
      imsic_max_hart_per_socket = 0;
      for (socket = 0; socket < socket_count; socket++) {
 -        imsic_addr = memmap[VIRT_IMSIC_S].base +
 -                     socket * VIRT_IMSIC_GROUP_MAX_SIZE;
 +        imsic_addr = base_addr + socket * VIRT_IMSIC_GROUP_MAX_SIZE;
          imsic_size = IMSIC_HART_SIZE(imsic_guest_bits) *
                       s->soc[socket].num_harts;
          imsic_regs[socket * 4 + 0] = 0;
@@ -XXX,XX +XXX,XX @@ static void create_fdt_imsic(RISCVVirtState *s, const MemMapEntry *memmap,
              imsic_max_hart_per_socket = s->soc[socket].num_harts;
          }
      }
--    return 0;
+-    imsic_name = g_strdup_printf("/soc/imsics@%lx",
-+
+-        (unsigned long)memmap[VIRT_IMSIC_S].base);
-+    if (max_irq) {
++
-+        sifive_plic_set_pending(plic, max_irq, false);
++    imsic_name = g_strdup_printf("/soc/imsics@%lx", (unsigned long)base_addr);
-+        sifive_plic_set_claimed(plic, max_irq, true);
+     qemu_fdt_add_subnode(ms->fdt, imsic_name);
 -    qemu_fdt_setprop_string(ms->fdt, imsic_name, "compatible",
 -        "riscv,imsics");
 +    qemu_fdt_setprop_string(ms->fdt, imsic_name, "compatible", "riscv,imsics");
      qemu_fdt_setprop_cell(ms->fdt, imsic_name, "#interrupt-cells",
 -        FDT_IMSIC_INT_CELLS);
 -    qemu_fdt_setprop(ms->fdt, imsic_name, "interrupt-controller",
 -        NULL, 0);
 -    qemu_fdt_setprop(ms->fdt, imsic_name, "msi-controller",
 -        NULL, 0);
 +                          FDT_IMSIC_INT_CELLS);
 +    qemu_fdt_setprop(ms->fdt, imsic_name, "interrupt-controller", NULL, 0);
 +    qemu_fdt_setprop(ms->fdt, imsic_name, "msi-controller", NULL, 0);
      qemu_fdt_setprop(ms->fdt, imsic_name, "interrupts-extended",
 -        imsic_cells, ms->smp.cpus * sizeof(uint32_t) * 2);
 +                     imsic_cells, ms->smp.cpus * sizeof(uint32_t) * 2);
      qemu_fdt_setprop(ms->fdt, imsic_name, "reg", imsic_regs,
 -        socket_count * sizeof(uint32_t) * 4);
 +                     socket_count * sizeof(uint32_t) * 4);
      qemu_fdt_setprop_cell(ms->fdt, imsic_name, "riscv,num-ids",
 -        VIRT_IRQCHIP_NUM_MSIS);
 +                     VIRT_IRQCHIP_NUM_MSIS);
 +
      if (imsic_guest_bits) {
          qemu_fdt_setprop_cell(ms->fdt, imsic_name, "riscv,guest-index-bits",
 -            imsic_guest_bits);
 +                              imsic_guest_bits);
      }
 +
      if (socket_count > 1) {
          qemu_fdt_setprop_cell(ms->fdt, imsic_name, "riscv,hart-index-bits",
 -            imsic_num_bits(imsic_max_hart_per_socket));
 +                              imsic_num_bits(imsic_max_hart_per_socket));
          qemu_fdt_setprop_cell(ms->fdt, imsic_name, "riscv,group-index-bits",
 -            imsic_num_bits(socket_count));
 +                              imsic_num_bits(socket_count));
          qemu_fdt_setprop_cell(ms->fdt, imsic_name, "riscv,group-index-shift",
 -            IMSIC_MMIO_GROUP_MIN_SHIFT);
 +                              IMSIC_MMIO_GROUP_MIN_SHIFT);
      }
 -    qemu_fdt_setprop_cell(ms->fdt, imsic_name, "phandle", *msi_s_phandle);
 -    g_free(imsic_name);
 +    qemu_fdt_setprop_cell(ms->fdt, imsic_name, "phandle", msi_phandle);
 +    g_free(imsic_name);
      g_free(imsic_regs);
      g_free(imsic_cells);
  }
 -static void create_fdt_socket_aplic(RISCVVirtState *s,
 -                                    const MemMapEntry *memmap, int socket,
 -                                    uint32_t msi_m_phandle,
 -                                    uint32_t msi_s_phandle,
 -                                    uint32_t *phandle,
 -                                    uint32_t *intc_phandles,
 -                                    uint32_t *aplic_phandles)
 +static void create_fdt_imsic(RISCVVirtState *s, const MemMapEntry *memmap,
 +                             uint32_t *phandle, uint32_t *intc_phandles,
 +                             uint32_t *msi_m_phandle, uint32_t *msi_s_phandle)
 +{
 +    *msi_m_phandle = (*phandle)++;
 +    *msi_s_phandle = (*phandle)++;
 +
 +    if (!kvm_enabled()) {
 +        /* M-level IMSIC node */
 +        create_fdt_one_imsic(s, memmap[VIRT_IMSIC_M].base, intc_phandles,
 +                             *msi_m_phandle, true, 0);
 +    }
-+    return max_irq;
++
 +    /* S-level IMSIC node */
 +    create_fdt_one_imsic(s, memmap[VIRT_IMSIC_S].base, intc_phandles,
 +                         *msi_s_phandle, false,
 +                         imsic_num_bits(s->aia_guests + 1));
 +
 +}
 +
 +static void create_fdt_one_aplic(RISCVVirtState *s, int socket,
 +                                 unsigned long aplic_addr, uint32_t aplic_size,
 +                                 uint32_t msi_phandle,
 +                                 uint32_t *intc_phandles,
 +                                 uint32_t aplic_phandle,
 +                                 uint32_t aplic_child_phandle,
 +                                 bool m_mode)
  {
      int cpu;
      char *aplic_name;
      uint32_t *aplic_cells;
 -    unsigned long aplic_addr;
      MachineState *ms = MACHINE(s);
 -    uint32_t aplic_m_phandle, aplic_s_phandle;
 -    aplic_m_phandle = (*phandle)++;
 -    aplic_s_phandle = (*phandle)++;
      aplic_cells = g_new0(uint32_t, s->soc[socket].num_harts * 2);
 -    /* M-level APLIC node */
      for (cpu = 0; cpu < s->soc[socket].num_harts; cpu++) {
          aplic_cells[cpu * 2 + 0] = cpu_to_be32(intc_phandles[cpu]);
 -        aplic_cells[cpu * 2 + 1] = cpu_to_be32(IRQ_M_EXT);
 +        aplic_cells[cpu * 2 + 1] = cpu_to_be32(m_mode ? IRQ_M_EXT : IRQ_S_EXT);
      }
 -    aplic_addr = memmap[VIRT_APLIC_M].base +
 -                 (memmap[VIRT_APLIC_M].size * socket);
 +
      aplic_name = g_strdup_printf("/soc/aplic@%lx", aplic_addr);
      qemu_fdt_add_subnode(ms->fdt, aplic_name);
      qemu_fdt_setprop_string(ms->fdt, aplic_name, "compatible", "riscv,aplic");
      qemu_fdt_setprop_cell(ms->fdt, aplic_name,
 -        "#interrupt-cells", FDT_APLIC_INT_CELLS);
 +                          "#interrupt-cells", FDT_APLIC_INT_CELLS);
      qemu_fdt_setprop(ms->fdt, aplic_name, "interrupt-controller", NULL, 0);
 +
      if (s->aia_type == VIRT_AIA_TYPE_APLIC) {
          qemu_fdt_setprop(ms->fdt, aplic_name, "interrupts-extended",
 -            aplic_cells, s->soc[socket].num_harts * sizeof(uint32_t) * 2);
 +                         aplic_cells,
 +                         s->soc[socket].num_harts * sizeof(uint32_t) * 2);
      } else {
 -        qemu_fdt_setprop_cell(ms->fdt, aplic_name, "msi-parent",
 -            msi_m_phandle);
 +        qemu_fdt_setprop_cell(ms->fdt, aplic_name, "msi-parent", msi_phandle);
      }
 +
      qemu_fdt_setprop_cells(ms->fdt, aplic_name, "reg",
 -        0x0, aplic_addr, 0x0, memmap[VIRT_APLIC_M].size);
 +                           0x0, aplic_addr, 0x0, aplic_size);
      qemu_fdt_setprop_cell(ms->fdt, aplic_name, "riscv,num-sources",
 -        VIRT_IRQCHIP_NUM_SOURCES);
 -    qemu_fdt_setprop_cell(ms->fdt, aplic_name, "riscv,children",
 -        aplic_s_phandle);
 -    qemu_fdt_setprop_cells(ms->fdt, aplic_name, "riscv,delegate",
 -        aplic_s_phandle, 0x1, VIRT_IRQCHIP_NUM_SOURCES);
 +                          VIRT_IRQCHIP_NUM_SOURCES);
 +
 +    if (aplic_child_phandle) {
 +        qemu_fdt_setprop_cell(ms->fdt, aplic_name, "riscv,children",
 +                              aplic_child_phandle);
 +        qemu_fdt_setprop_cells(ms->fdt, aplic_name, "riscv,delegate",
 +                               aplic_child_phandle, 0x1,
 +                               VIRT_IRQCHIP_NUM_SOURCES);
 +    }
 +
      riscv_socket_fdt_write_id(ms, aplic_name, socket);
 -    qemu_fdt_setprop_cell(ms->fdt, aplic_name, "phandle", aplic_m_phandle);
 +    qemu_fdt_setprop_cell(ms->fdt, aplic_name, "phandle", aplic_phandle);
 +
      g_free(aplic_name);
 +    g_free(aplic_cells);
 +}
 -    /* S-level APLIC node */
 -    for (cpu = 0; cpu < s->soc[socket].num_harts; cpu++) {
 -        aplic_cells[cpu * 2 + 0] = cpu_to_be32(intc_phandles[cpu]);
 -        aplic_cells[cpu * 2 + 1] = cpu_to_be32(IRQ_S_EXT);
 +static void create_fdt_socket_aplic(RISCVVirtState *s,
 +                                    const MemMapEntry *memmap, int socket,
 +                                    uint32_t msi_m_phandle,
 +                                    uint32_t msi_s_phandle,
 +                                    uint32_t *phandle,
 +                                    uint32_t *intc_phandles,
 +                                    uint32_t *aplic_phandles)
 +{
 +    char *aplic_name;
 +    unsigned long aplic_addr;
 +    MachineState *ms = MACHINE(s);
 +    uint32_t aplic_m_phandle, aplic_s_phandle;
 +
 +    aplic_m_phandle = (*phandle)++;
 +    aplic_s_phandle = (*phandle)++;
 +
 +    if (!kvm_enabled()) {
 +        /* M-level APLIC node */
 +        aplic_addr = memmap[VIRT_APLIC_M].base +
 +                     (memmap[VIRT_APLIC_M].size * socket);
 +        create_fdt_one_aplic(s, socket, aplic_addr, memmap[VIRT_APLIC_M].size,
 +                             msi_m_phandle, intc_phandles,
 +                             aplic_m_phandle, aplic_s_phandle,
 +                             true);
      }
 +
 +    /* S-level APLIC node */
      aplic_addr = memmap[VIRT_APLIC_S].base +
                   (memmap[VIRT_APLIC_S].size * socket);
 +    create_fdt_one_aplic(s, socket, aplic_addr, memmap[VIRT_APLIC_S].size,
 +                         msi_s_phandle, intc_phandles,
 +                         aplic_s_phandle, 0,
 +                         false);
 +
      aplic_name = g_strdup_printf("/soc/aplic@%lx", aplic_addr);
 -    qemu_fdt_add_subnode(ms->fdt, aplic_name);
 -    qemu_fdt_setprop_string(ms->fdt, aplic_name, "compatible", "riscv,aplic");
 -    qemu_fdt_setprop_cell(ms->fdt, aplic_name,
 -        "#interrupt-cells", FDT_APLIC_INT_CELLS);
 -    qemu_fdt_setprop(ms->fdt, aplic_name, "interrupt-controller", NULL, 0);
 -    if (s->aia_type == VIRT_AIA_TYPE_APLIC) {
 -        qemu_fdt_setprop(ms->fdt, aplic_name, "interrupts-extended",
 -            aplic_cells, s->soc[socket].num_harts * sizeof(uint32_t) * 2);
 -    } else {
 -        qemu_fdt_setprop_cell(ms->fdt, aplic_name, "msi-parent",
 -            msi_s_phandle);
 -    }
 -    qemu_fdt_setprop_cells(ms->fdt, aplic_name, "reg",
 -        0x0, aplic_addr, 0x0, memmap[VIRT_APLIC_S].size);
 -    qemu_fdt_setprop_cell(ms->fdt, aplic_name, "riscv,num-sources",
 -        VIRT_IRQCHIP_NUM_SOURCES);
 -    riscv_socket_fdt_write_id(ms, aplic_name, socket);
 -    qemu_fdt_setprop_cell(ms->fdt, aplic_name, "phandle", aplic_s_phandle);
      if (!socket) {
          platform_bus_add_all_fdt_nodes(ms->fdt, aplic_name,
@@ -XXX,XX +XXX,XX @@ static void create_fdt_socket_aplic(RISCVVirtState *s,
      g_free(aplic_name);
 -    g_free(aplic_cells);
      aplic_phandles[socket] = aplic_s_phandle;
  }
- static uint64_t sifive_plic_read(void *opaque, hwaddr addr, unsigned size)
+@@ -XXX,XX +XXX,XX @@ static DeviceState *virt_create_aia(RISCVVirtAIAType aia_type, int aia_guests,
      int i;
      hwaddr addr;
      uint32_t guest_bits;
 -    DeviceState *aplic_m;
 -    bool msimode = (aia_type == VIRT_AIA_TYPE_APLIC_IMSIC) ? true : false;
 +    DeviceState *aplic_s = NULL;
 +    DeviceState *aplic_m = NULL;
 +    bool msimode = aia_type == VIRT_AIA_TYPE_APLIC_IMSIC;
      if (msimode) {
 -        /* Per-socket M-level IMSICs */
 -        addr = memmap[VIRT_IMSIC_M].base + socket * VIRT_IMSIC_GROUP_MAX_SIZE;
 -        for (i = 0; i < hart_count; i++) {
 -            riscv_imsic_create(addr + i * IMSIC_HART_SIZE(0),
 -                               base_hartid + i, true, 1,
 -                               VIRT_IRQCHIP_NUM_MSIS);
 +        if (!kvm_enabled()) {
 +            /* Per-socket M-level IMSICs */
 +            addr = memmap[VIRT_IMSIC_M].base +
 +                   socket * VIRT_IMSIC_GROUP_MAX_SIZE;
 +            for (i = 0; i < hart_count; i++) {
 +                riscv_imsic_create(addr + i * IMSIC_HART_SIZE(0),
 +                                   base_hartid + i, true, 1,
 +                                   VIRT_IRQCHIP_NUM_MSIS);
 +            }
          }
          /* Per-socket S-level IMSICs */
@@ -XXX,XX +XXX,XX @@ static DeviceState *virt_create_aia(RISCVVirtAIAType aia_type, int aia_guests,
          }
      }
 -    /* Per-socket M-level APLIC */
 -    aplic_m = riscv_aplic_create(
 -        memmap[VIRT_APLIC_M].base + socket * memmap[VIRT_APLIC_M].size,
 -        memmap[VIRT_APLIC_M].size,
 -        (msimode) ? 0 : base_hartid,
 -        (msimode) ? 0 : hart_count,
 -        VIRT_IRQCHIP_NUM_SOURCES,
 -        VIRT_IRQCHIP_NUM_PRIO_BITS,
 -        msimode, true, NULL);
 -
 -    if (aplic_m) {
 -        /* Per-socket S-level APLIC */
 -        riscv_aplic_create(
 -            memmap[VIRT_APLIC_S].base + socket * memmap[VIRT_APLIC_S].size,
 -            memmap[VIRT_APLIC_S].size,
 -            (msimode) ? 0 : base_hartid,
 -            (msimode) ? 0 : hart_count,
 -            VIRT_IRQCHIP_NUM_SOURCES,
 -            VIRT_IRQCHIP_NUM_PRIO_BITS,
 -            msimode, false, aplic_m);
 +    if (!kvm_enabled()) {
 +        /* Per-socket M-level APLIC */
 +        aplic_m = riscv_aplic_create(memmap[VIRT_APLIC_M].base +
 +                                     socket * memmap[VIRT_APLIC_M].size,
 +                                     memmap[VIRT_APLIC_M].size,
 +                                     (msimode) ? 0 : base_hartid,
 +                                     (msimode) ? 0 : hart_count,
 +                                     VIRT_IRQCHIP_NUM_SOURCES,
 +                                     VIRT_IRQCHIP_NUM_PRIO_BITS,
 +                                     msimode, true, NULL);
      }
 -    return aplic_m;
 +    /* Per-socket S-level APLIC */
 +    aplic_s = riscv_aplic_create(memmap[VIRT_APLIC_S].base +
 +                                 socket * memmap[VIRT_APLIC_S].size,
 +                                 memmap[VIRT_APLIC_S].size,
 +                                 (msimode) ? 0 : base_hartid,
 +                                 (msimode) ? 0 : hart_count,
 +                                 VIRT_IRQCHIP_NUM_SOURCES,
 +                                 VIRT_IRQCHIP_NUM_PRIO_BITS,
 +                                 msimode, false, aplic_m);
 +
 +    return kvm_enabled() ? aplic_s : aplic_m;
  }
  static void create_platform_bus(RISCVVirtState *s, DeviceState *irqchip)
 --
-.27.0
+.41.0

-[PULL 11/63] target/riscv: add vector amo operations
+[PULL v2 30/45] target/riscv: check the in-kernel irqchip support
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Yong-Xuan Wang <yongxuan.wang@sifive.com>
-Vector AMOs operate as if aq and rl bits were zero on each element
+We check the in-kernel irqchip support when using KVM acceleration.
 with regard to ordering relative to other instructions in the same hart.
 Vector AMOs provide no ordering guarantee between element operations
 in the same vector AMO instruction
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Signed-off-by: Yong-Xuan Wang <yongxuan.wang@sifive.com>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Reviewed-by: Jim Shu <jim.shu@sifive.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
-Message-id: 20200623215920.2594-10-zhiwei_liu@c-sky.com
+Reviewed-by: Andrew Jones <ajones@ventanamicro.com>
 Message-ID: <20230727102439.22554-3-yongxuan.wang@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   |  29 +++++
+ target/riscv/kvm.c | 10 +++++++++-
- target/riscv/internals.h                |   1 +
+file changed, 9 insertions(+), 1 deletion(-)
  target/riscv/insn32-64.decode           |  11 ++
  target/riscv/insn32.decode              |  13 +++
  target/riscv/insn_trans/trans_rvv.inc.c | 138 ++++++++++++++++++++++
  target/riscv/vector_helper.c            | 147 ++++++++++++++++++++++++
 files changed, 339 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/target/riscv/kvm.c b/target/riscv/kvm.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/target/riscv/kvm.c
-+++ b/target/riscv/helper.h
++++ b/target/riscv/kvm.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_5(vlhuff_v_w, void, ptr, ptr, tl, env, i32)
+@@ -XXX,XX +XXX,XX @@ int kvm_arch_init(MachineState *ms, KVMState *s)
- DEF_HELPER_5(vlhuff_v_d, void, ptr, ptr, tl, env, i32)
- DEF_HELPER_5(vlwuff_v_w, void, ptr, ptr, tl, env, i32)
+ int kvm_arch_irqchip_create(KVMState *s)
- DEF_HELPER_5(vlwuff_v_d, void, ptr, ptr, tl, env, i32)
+ {
-+#ifdef TARGET_RISCV64
+-    return 0;
-+DEF_HELPER_6(vamoswapw_v_d, void, ptr, ptr, tl, ptr, env, i32)
++    if (kvm_kernel_irqchip_split()) {
-+DEF_HELPER_6(vamoswapd_v_d, void, ptr, ptr, tl, ptr, env, i32)
++        error_report("-machine kernel_irqchip=split is not supported on RISC-V.");
-+DEF_HELPER_6(vamoaddw_v_d,  void, ptr, ptr, tl, ptr, env, i32)
++        exit(1);
 +DEF_HELPER_6(vamoaddd_v_d,  void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamoxorw_v_d,  void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamoxord_v_d,  void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamoandw_v_d,  void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamoandd_v_d,  void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamoorw_v_d,   void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamoord_v_d,   void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamominw_v_d,  void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamomind_v_d,  void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamomaxw_v_d,  void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamomaxd_v_d,  void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamominuw_v_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamominud_v_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamomaxuw_v_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamomaxud_v_d, void, ptr, ptr, tl, ptr, env, i32)
 +#endif
 +DEF_HELPER_6(vamoswapw_v_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamoaddw_v_w,  void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamoxorw_v_w,  void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamoandw_v_w,  void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamoorw_v_w,   void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamominw_v_w,  void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamomaxw_v_w,  void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamominuw_v_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vamomaxuw_v_w, void, ptr, ptr, tl, ptr, env, i32)
 diff --git a/target/riscv/internals.h b/target/riscv/internals.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/internals.h
 +++ b/target/riscv/internals.h
@@ -XXX,XX +XXX,XX @@ FIELD(VDATA, MLEN, 0, 8)
  FIELD(VDATA, VM, 8, 1)
  FIELD(VDATA, LMUL, 9, 2)
  FIELD(VDATA, NF, 11, 4)
 +FIELD(VDATA, WD, 11, 1)
  #endif
 diff --git a/target/riscv/insn32-64.decode b/target/riscv/insn32-64.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32-64.decode
 +++ b/target/riscv/insn32-64.decode
@@ -XXX,XX +XXX,XX @@ amomax_d   10100 . . ..... ..... 011 ..... 0101111 @atom_st
  amominu_d  11000 . . ..... ..... 011 ..... 0101111 @atom_st
  amomaxu_d  11100 . . ..... ..... 011 ..... 0101111 @atom_st
 +#*** Vector AMO operations (in addition to Zvamo) ***
 +vamoswapd_v     00001 . . ..... ..... 111 ..... 0101111 @r_wdvm
 +vamoaddd_v      00000 . . ..... ..... 111 ..... 0101111 @r_wdvm
 +vamoxord_v      00100 . . ..... ..... 111 ..... 0101111 @r_wdvm
 +vamoandd_v      01100 . . ..... ..... 111 ..... 0101111 @r_wdvm
 +vamoord_v       01000 . . ..... ..... 111 ..... 0101111 @r_wdvm
 +vamomind_v      10000 . . ..... ..... 111 ..... 0101111 @r_wdvm
 +vamomaxd_v      10100 . . ..... ..... 111 ..... 0101111 @r_wdvm
 +vamominud_v     11000 . . ..... ..... 111 ..... 0101111 @r_wdvm
 +vamomaxud_v     11100 . . ..... ..... 111 ..... 0101111 @r_wdvm
 +
  # *** RV64F Standard Extension (in addition to RV32F) ***
  fcvt_l_s   1100000  00010 ..... ... ..... 1010011 @r2_rm
  fcvt_lu_s  1100000  00011 ..... ... ..... 1010011 @r2_rm
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@
  &u    imm rd
  &shift     shamt rs1 rd
  &atomic    aq rl rs2 rs1 rd
 +&rwdvm     vm wd rd rs1 rs2
  &r2nfvm    vm rd rs1 nf
  &rnfvm     vm rd rs1 rs2 nf
@@ -XXX,XX +XXX,XX @@
  @r2      .......   ..... ..... ... ..... ....... %rs1 %rd
  @r2_nfvm ... ... vm:1 ..... ..... ... ..... ....... &r2nfvm %nf %rs1 %rd
  @r_nfvm  ... ... vm:1 ..... ..... ... ..... ....... &rnfvm %nf %rs2 %rs1 %rd
 +@r_wdvm  ..... wd:1 vm:1 ..... ..... ... ..... ....... &rwdvm %rs2 %rs1 %rd
  @r2_zimm . zimm:11  ..... ... ..... ....... %rs1 %rd
  @hfence_gvma ....... ..... .....   ... ..... ....... %rs2 %rs1
@@ -XXX,XX +XXX,XX @@ vsxh_v     ... -11 . ..... ..... 101 ..... 0100111 @r_nfvm
  vsxw_v     ... -11 . ..... ..... 110 ..... 0100111 @r_nfvm
  vsxe_v     ... -11 . ..... ..... 111 ..... 0100111 @r_nfvm
 +#*** Vector AMO operations are encoded under the standard AMO major opcode ***
 +vamoswapw_v     00001 . . ..... ..... 110 ..... 0101111 @r_wdvm
 +vamoaddw_v      00000 . . ..... ..... 110 ..... 0101111 @r_wdvm
 +vamoxorw_v      00100 . . ..... ..... 110 ..... 0101111 @r_wdvm
 +vamoandw_v      01100 . . ..... ..... 110 ..... 0101111 @r_wdvm
 +vamoorw_v       01000 . . ..... ..... 110 ..... 0101111 @r_wdvm
 +vamominw_v      10000 . . ..... ..... 110 ..... 0101111 @r_wdvm
 +vamomaxw_v      10100 . . ..... ..... 110 ..... 0101111 @r_wdvm
 +vamominuw_v     11000 . . ..... ..... 110 ..... 0101111 @r_wdvm
 +vamomaxuw_v     11100 . . ..... ..... 110 ..... 0101111 @r_wdvm
 +
  # *** new major opcode OP-V ***
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_TRANS(vleff_v, 3, r2nfvm, ldff_op, ld_us_check)
  GEN_VEXT_TRANS(vlbuff_v, 4, r2nfvm, ldff_op, ld_us_check)
  GEN_VEXT_TRANS(vlhuff_v, 5, r2nfvm, ldff_op, ld_us_check)
  GEN_VEXT_TRANS(vlwuff_v, 6, r2nfvm, ldff_op, ld_us_check)
 +
 +/*
 + *** vector atomic operation
 + */
 +typedef void gen_helper_amo(TCGv_ptr, TCGv_ptr, TCGv, TCGv_ptr,
 +                            TCGv_env, TCGv_i32);
 +
 +static bool amo_trans(uint32_t vd, uint32_t rs1, uint32_t vs2,
 +                      uint32_t data, gen_helper_amo *fn, DisasContext *s)
 +{
 +    TCGv_ptr dest, mask, index;
 +    TCGv base;
 +    TCGv_i32 desc;
 +
 +    TCGLabel *over = gen_new_label();
 +    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +
 +    dest = tcg_temp_new_ptr();
 +    mask = tcg_temp_new_ptr();
 +    index = tcg_temp_new_ptr();
 +    base = tcg_temp_new();
 +    desc = tcg_const_i32(simd_desc(0, s->vlen / 8, data));
 +
 +    gen_get_gpr(base, rs1);
 +    tcg_gen_addi_ptr(dest, cpu_env, vreg_ofs(s, vd));
 +    tcg_gen_addi_ptr(index, cpu_env, vreg_ofs(s, vs2));
 +    tcg_gen_addi_ptr(mask, cpu_env, vreg_ofs(s, 0));
 +
 +    fn(dest, mask, base, index, cpu_env, desc);
 +
 +    tcg_temp_free_ptr(dest);
 +    tcg_temp_free_ptr(mask);
 +    tcg_temp_free_ptr(index);
 +    tcg_temp_free(base);
 +    tcg_temp_free_i32(desc);
 +    gen_set_label(over);
 +    return true;
 +}
 +
 +static bool amo_op(DisasContext *s, arg_rwdvm *a, uint8_t seq)
 +{
 +    uint32_t data = 0;
 +    gen_helper_amo *fn;
 +    static gen_helper_amo *const fnsw[9] = {
 +        /* no atomic operation */
 +        gen_helper_vamoswapw_v_w,
 +        gen_helper_vamoaddw_v_w,
 +        gen_helper_vamoxorw_v_w,
 +        gen_helper_vamoandw_v_w,
 +        gen_helper_vamoorw_v_w,
 +        gen_helper_vamominw_v_w,
 +        gen_helper_vamomaxw_v_w,
 +        gen_helper_vamominuw_v_w,
 +        gen_helper_vamomaxuw_v_w
 +    };
 +#ifdef TARGET_RISCV64
 +    static gen_helper_amo *const fnsd[18] = {
 +        gen_helper_vamoswapw_v_d,
 +        gen_helper_vamoaddw_v_d,
 +        gen_helper_vamoxorw_v_d,
 +        gen_helper_vamoandw_v_d,
 +        gen_helper_vamoorw_v_d,
 +        gen_helper_vamominw_v_d,
 +        gen_helper_vamomaxw_v_d,
 +        gen_helper_vamominuw_v_d,
 +        gen_helper_vamomaxuw_v_d,
 +        gen_helper_vamoswapd_v_d,
 +        gen_helper_vamoaddd_v_d,
 +        gen_helper_vamoxord_v_d,
 +        gen_helper_vamoandd_v_d,
 +        gen_helper_vamoord_v_d,
 +        gen_helper_vamomind_v_d,
 +        gen_helper_vamomaxd_v_d,
 +        gen_helper_vamominud_v_d,
 +        gen_helper_vamomaxud_v_d
 +    };
 +#endif
 +
 +    if (tb_cflags(s->base.tb) & CF_PARALLEL) {
 +        gen_helper_exit_atomic(cpu_env);
 +        s->base.is_jmp = DISAS_NORETURN;
 +        return true;
 +    } else {
 +        if (s->sew == 3) {
 +#ifdef TARGET_RISCV64
 +            fn = fnsd[seq];
 +#else
 +            /* Check done in amo_check(). */
 +            g_assert_not_reached();
 +#endif
 +        } else {
 +            fn = fnsw[seq];
 +        }
 +    }
 +
-+    data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
++    /*
-+    data = FIELD_DP32(data, VDATA, VM, a->vm);
++     * We can create the VAIA using the newer device control API.
-+    data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
++     */
-+    data = FIELD_DP32(data, VDATA, WD, a->wd);
++    return kvm_check_extension(s, KVM_CAP_DEVICE_CTRL);
 +    return amo_trans(a->rd, a->rs1, a->rs2, data, fn, s);
 +}
 +/*
 + * There are two rules check here.
 + *
 + * 1. SEW must be at least as wide as the AMO memory element size.
 + *
 + * 2. If SEW is greater than XLEN, an illegal instruction exception is raised.
 + */
 +static bool amo_check(DisasContext *s, arg_rwdvm* a)
 +{
 +    return (!s->vill && has_ext(s, RVA) &&
 +            (!a->wd || vext_check_overlap_mask(s, a->rd, a->vm, false)) &&
 +            vext_check_reg(s, a->rd, false) &&
 +            vext_check_reg(s, a->rs2, false) &&
 +            ((1 << s->sew) <= sizeof(target_ulong)) &&
 +            ((1 << s->sew) >= 4));
 +}
 +
 +GEN_VEXT_TRANS(vamoswapw_v, 0, rwdvm, amo_op, amo_check)
 +GEN_VEXT_TRANS(vamoaddw_v, 1, rwdvm, amo_op, amo_check)
 +GEN_VEXT_TRANS(vamoxorw_v, 2, rwdvm, amo_op, amo_check)
 +GEN_VEXT_TRANS(vamoandw_v, 3, rwdvm, amo_op, amo_check)
 +GEN_VEXT_TRANS(vamoorw_v, 4, rwdvm, amo_op, amo_check)
 +GEN_VEXT_TRANS(vamominw_v, 5, rwdvm, amo_op, amo_check)
 +GEN_VEXT_TRANS(vamomaxw_v, 6, rwdvm, amo_op, amo_check)
 +GEN_VEXT_TRANS(vamominuw_v, 7, rwdvm, amo_op, amo_check)
 +GEN_VEXT_TRANS(vamomaxuw_v, 8, rwdvm, amo_op, amo_check)
 +#ifdef TARGET_RISCV64
 +GEN_VEXT_TRANS(vamoswapd_v, 9, rwdvm, amo_op, amo_check)
 +GEN_VEXT_TRANS(vamoaddd_v, 10, rwdvm, amo_op, amo_check)
 +GEN_VEXT_TRANS(vamoxord_v, 11, rwdvm, amo_op, amo_check)
 +GEN_VEXT_TRANS(vamoandd_v, 12, rwdvm, amo_op, amo_check)
 +GEN_VEXT_TRANS(vamoord_v, 13, rwdvm, amo_op, amo_check)
 +GEN_VEXT_TRANS(vamomind_v, 14, rwdvm, amo_op, amo_check)
 +GEN_VEXT_TRANS(vamomaxd_v, 15, rwdvm, amo_op, amo_check)
 +GEN_VEXT_TRANS(vamominud_v, 16, rwdvm, amo_op, amo_check)
 +GEN_VEXT_TRANS(vamomaxud_v, 17, rwdvm, amo_op, amo_check)
 +#endif
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ static inline uint32_t vext_lmul(uint32_t desc)
      return FIELD_EX32(simd_data(desc), VDATA, LMUL);
  }
-+static uint32_t vext_wd(uint32_t desc)
+ int kvm_arch_process_async_events(CPUState *cs)
 +{
 +    return (simd_data(desc) >> 11) & 0x1;
 +}
 +
  /*
   * Get vector group length in bytes. Its range is [64, 2048].
   *
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_LDFF(vlhuff_v_w, uint16_t, uint32_t, ldhu_w, clearl)
  GEN_VEXT_LDFF(vlhuff_v_d, uint16_t, uint64_t, ldhu_d, clearq)
  GEN_VEXT_LDFF(vlwuff_v_w, uint32_t, uint32_t, ldwu_w, clearl)
  GEN_VEXT_LDFF(vlwuff_v_d, uint32_t, uint64_t, ldwu_d, clearq)
 +
 +/*
 + *** Vector AMO Operations (Zvamo)
 + */
 +typedef void vext_amo_noatomic_fn(void *vs3, target_ulong addr,
 +                                  uint32_t wd, uint32_t idx, CPURISCVState *env,
 +                                  uintptr_t retaddr);
 +
 +/* no atomic opreation for vector atomic insructions */
 +#define DO_SWAP(N, M) (M)
 +#define DO_AND(N, M)  (N & M)
 +#define DO_XOR(N, M)  (N ^ M)
 +#define DO_OR(N, M)   (N | M)
 +#define DO_ADD(N, M)  (N + M)
 +
 +#define GEN_VEXT_AMO_NOATOMIC_OP(NAME, ESZ, MSZ, H, DO_OP, SUF) \
 +static void                                                     \
 +vext_##NAME##_noatomic_op(void *vs3, target_ulong addr,         \
 +                          uint32_t wd, uint32_t idx,            \
 +                          CPURISCVState *env, uintptr_t retaddr)\
 +{                                                               \
 +    typedef int##ESZ##_t ETYPE;                                 \
 +    typedef int##MSZ##_t MTYPE;                                 \
 +    typedef uint##MSZ##_t UMTYPE __attribute__((unused));       \
 +    ETYPE *pe3 = (ETYPE *)vs3 + H(idx);                         \
 +    MTYPE  a = cpu_ld##SUF##_data(env, addr), b = *pe3;         \
 +                                                                \
 +    cpu_st##SUF##_data(env, addr, DO_OP(a, b));                 \
 +    if (wd) {                                                   \
 +        *pe3 = a;                                               \
 +    }                                                           \
 +}
 +
 +/* Signed min/max */
 +#define DO_MAX(N, M)  ((N) >= (M) ? (N) : (M))
 +#define DO_MIN(N, M)  ((N) >= (M) ? (M) : (N))
 +
 +/* Unsigned min/max */
 +#define DO_MAXU(N, M) DO_MAX((UMTYPE)N, (UMTYPE)M)
 +#define DO_MINU(N, M) DO_MIN((UMTYPE)N, (UMTYPE)M)
 +
 +GEN_VEXT_AMO_NOATOMIC_OP(vamoswapw_v_w, 32, 32, H4, DO_SWAP, l)
 +GEN_VEXT_AMO_NOATOMIC_OP(vamoaddw_v_w,  32, 32, H4, DO_ADD,  l)
 +GEN_VEXT_AMO_NOATOMIC_OP(vamoxorw_v_w,  32, 32, H4, DO_XOR,  l)
 +GEN_VEXT_AMO_NOATOMIC_OP(vamoandw_v_w,  32, 32, H4, DO_AND,  l)
 +GEN_VEXT_AMO_NOATOMIC_OP(vamoorw_v_w,   32, 32, H4, DO_OR,   l)
 +GEN_VEXT_AMO_NOATOMIC_OP(vamominw_v_w,  32, 32, H4, DO_MIN,  l)
 +GEN_VEXT_AMO_NOATOMIC_OP(vamomaxw_v_w,  32, 32, H4, DO_MAX,  l)
 +GEN_VEXT_AMO_NOATOMIC_OP(vamominuw_v_w, 32, 32, H4, DO_MINU, l)
 +GEN_VEXT_AMO_NOATOMIC_OP(vamomaxuw_v_w, 32, 32, H4, DO_MAXU, l)
 +#ifdef TARGET_RISCV64
 +GEN_VEXT_AMO_NOATOMIC_OP(vamoswapw_v_d, 64, 32, H8, DO_SWAP, l)
 +GEN_VEXT_AMO_NOATOMIC_OP(vamoswapd_v_d, 64, 64, H8, DO_SWAP, q)
 +GEN_VEXT_AMO_NOATOMIC_OP(vamoaddw_v_d,  64, 32, H8, DO_ADD,  l)
 +GEN_VEXT_AMO_NOATOMIC_OP(vamoaddd_v_d,  64, 64, H8, DO_ADD,  q)
 +GEN_VEXT_AMO_NOATOMIC_OP(vamoxorw_v_d,  64, 32, H8, DO_XOR,  l)
 +GEN_VEXT_AMO_NOATOMIC_OP(vamoxord_v_d,  64, 64, H8, DO_XOR,  q)
 +GEN_VEXT_AMO_NOATOMIC_OP(vamoandw_v_d,  64, 32, H8, DO_AND,  l)
 +GEN_VEXT_AMO_NOATOMIC_OP(vamoandd_v_d,  64, 64, H8, DO_AND,  q)
 +GEN_VEXT_AMO_NOATOMIC_OP(vamoorw_v_d,   64, 32, H8, DO_OR,   l)
 +GEN_VEXT_AMO_NOATOMIC_OP(vamoord_v_d,   64, 64, H8, DO_OR,   q)
 +GEN_VEXT_AMO_NOATOMIC_OP(vamominw_v_d,  64, 32, H8, DO_MIN,  l)
 +GEN_VEXT_AMO_NOATOMIC_OP(vamomind_v_d,  64, 64, H8, DO_MIN,  q)
 +GEN_VEXT_AMO_NOATOMIC_OP(vamomaxw_v_d,  64, 32, H8, DO_MAX,  l)
 +GEN_VEXT_AMO_NOATOMIC_OP(vamomaxd_v_d,  64, 64, H8, DO_MAX,  q)
 +GEN_VEXT_AMO_NOATOMIC_OP(vamominuw_v_d, 64, 32, H8, DO_MINU, l)
 +GEN_VEXT_AMO_NOATOMIC_OP(vamominud_v_d, 64, 64, H8, DO_MINU, q)
 +GEN_VEXT_AMO_NOATOMIC_OP(vamomaxuw_v_d, 64, 32, H8, DO_MAXU, l)
 +GEN_VEXT_AMO_NOATOMIC_OP(vamomaxud_v_d, 64, 64, H8, DO_MAXU, q)
 +#endif
 +
 +static inline void
 +vext_amo_noatomic(void *vs3, void *v0, target_ulong base,
 +                  void *vs2, CPURISCVState *env, uint32_t desc,
 +                  vext_get_index_addr get_index_addr,
 +                  vext_amo_noatomic_fn *noatomic_op,
 +                  clear_fn *clear_elem,
 +                  uint32_t esz, uint32_t msz, uintptr_t ra)
 +{
 +    uint32_t i;
 +    target_long addr;
 +    uint32_t wd = vext_wd(desc);
 +    uint32_t vm = vext_vm(desc);
 +    uint32_t mlen = vext_mlen(desc);
 +    uint32_t vlmax = vext_maxsz(desc) / esz;
 +
 +    for (i = 0; i < env->vl; i++) {
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {
 +            continue;
 +        }
 +        probe_pages(env, get_index_addr(base, i, vs2), msz, ra, MMU_DATA_LOAD);
 +        probe_pages(env, get_index_addr(base, i, vs2), msz, ra, MMU_DATA_STORE);
 +    }
 +    for (i = 0; i < env->vl; i++) {
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {
 +            continue;
 +        }
 +        addr = get_index_addr(base, i, vs2);
 +        noatomic_op(vs3, addr, wd, i, env, ra);
 +    }
 +    clear_elem(vs3, env->vl, env->vl * esz, vlmax * esz);
 +}
 +
 +#define GEN_VEXT_AMO(NAME, MTYPE, ETYPE, INDEX_FN, CLEAR_FN)    \
 +void HELPER(NAME)(void *vs3, void *v0, target_ulong base,       \
 +                  void *vs2, CPURISCVState *env, uint32_t desc) \
 +{                                                               \
 +    vext_amo_noatomic(vs3, v0, base, vs2, env, desc,            \
 +                      INDEX_FN, vext_##NAME##_noatomic_op,      \
 +                      CLEAR_FN, sizeof(ETYPE), sizeof(MTYPE),   \
 +                      GETPC());                                 \
 +}
 +
 +#ifdef TARGET_RISCV64
 +GEN_VEXT_AMO(vamoswapw_v_d, int32_t,  int64_t,  idx_d, clearq)
 +GEN_VEXT_AMO(vamoswapd_v_d, int64_t,  int64_t,  idx_d, clearq)
 +GEN_VEXT_AMO(vamoaddw_v_d,  int32_t,  int64_t,  idx_d, clearq)
 +GEN_VEXT_AMO(vamoaddd_v_d,  int64_t,  int64_t,  idx_d, clearq)
 +GEN_VEXT_AMO(vamoxorw_v_d,  int32_t,  int64_t,  idx_d, clearq)
 +GEN_VEXT_AMO(vamoxord_v_d,  int64_t,  int64_t,  idx_d, clearq)
 +GEN_VEXT_AMO(vamoandw_v_d,  int32_t,  int64_t,  idx_d, clearq)
 +GEN_VEXT_AMO(vamoandd_v_d,  int64_t,  int64_t,  idx_d, clearq)
 +GEN_VEXT_AMO(vamoorw_v_d,   int32_t,  int64_t,  idx_d, clearq)
 +GEN_VEXT_AMO(vamoord_v_d,   int64_t,  int64_t,  idx_d, clearq)
 +GEN_VEXT_AMO(vamominw_v_d,  int32_t,  int64_t,  idx_d, clearq)
 +GEN_VEXT_AMO(vamomind_v_d,  int64_t,  int64_t,  idx_d, clearq)
 +GEN_VEXT_AMO(vamomaxw_v_d,  int32_t,  int64_t,  idx_d, clearq)
 +GEN_VEXT_AMO(vamomaxd_v_d,  int64_t,  int64_t,  idx_d, clearq)
 +GEN_VEXT_AMO(vamominuw_v_d, uint32_t, uint64_t, idx_d, clearq)
 +GEN_VEXT_AMO(vamominud_v_d, uint64_t, uint64_t, idx_d, clearq)
 +GEN_VEXT_AMO(vamomaxuw_v_d, uint32_t, uint64_t, idx_d, clearq)
 +GEN_VEXT_AMO(vamomaxud_v_d, uint64_t, uint64_t, idx_d, clearq)
 +#endif
 +GEN_VEXT_AMO(vamoswapw_v_w, int32_t,  int32_t,  idx_w, clearl)
 +GEN_VEXT_AMO(vamoaddw_v_w,  int32_t,  int32_t,  idx_w, clearl)
 +GEN_VEXT_AMO(vamoxorw_v_w,  int32_t,  int32_t,  idx_w, clearl)
 +GEN_VEXT_AMO(vamoandw_v_w,  int32_t,  int32_t,  idx_w, clearl)
 +GEN_VEXT_AMO(vamoorw_v_w,   int32_t,  int32_t,  idx_w, clearl)
 +GEN_VEXT_AMO(vamominw_v_w,  int32_t,  int32_t,  idx_w, clearl)
 +GEN_VEXT_AMO(vamomaxw_v_w,  int32_t,  int32_t,  idx_w, clearl)
 +GEN_VEXT_AMO(vamominuw_v_w, uint32_t, uint32_t, idx_w, clearl)
 +GEN_VEXT_AMO(vamomaxuw_v_w, uint32_t, uint32_t, idx_w, clearl)
 --
-.27.0
+.41.0

-[PULL 52/63] target/riscv: vector mask population count vmpopc
+[PULL v2 31/45] target/riscv: Create an KVM AIA irqchip
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Yong-Xuan Wang <yongxuan.wang@sifive.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+We create a vAIA chip by using the KVM_DEV_TYPE_RISCV_AIA and then set up
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+the chip with the KVM_DEV_RISCV_AIA_GRP_* APIs.
-Message-id: 20200623215920.2594-51-zhiwei_liu@c-sky.com
+We also extend KVM accelerator to specify the KVM AIA mode. The "riscv-aia"
 parameter is passed along with --accel in QEMU command-line.
 ) "riscv-aia=emul": IMSIC is emulated by hypervisor
 ) "riscv-aia=hwaccel": use hardware guest IMSIC
 ) "riscv-aia=auto": use the hardware guest IMSICs whenever available
                      otherwise we fallback to software emulation.
 Signed-off-by: Yong-Xuan Wang <yongxuan.wang@sifive.com>
 Reviewed-by: Jim Shu <jim.shu@sifive.com>
 Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 Reviewed-by: Andrew Jones <ajones@ventanamicro.com>
 Message-ID: <20230727102439.22554-4-yongxuan.wang@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   |  2 ++
+ target/riscv/kvm_riscv.h |   4 +
- target/riscv/insn32.decode              |  1 +
+ target/riscv/kvm.c       | 186 +++++++++++++++++++++++++++++++++++++++
- target/riscv/insn_trans/trans_rvv.inc.c | 32 +++++++++++++++++++++++++
+files changed, 190 insertions(+)
  target/riscv/vector_helper.c            | 20 ++++++++++++++++
 files changed, 55 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/target/riscv/kvm_riscv.h b/target/riscv/kvm_riscv.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/target/riscv/kvm_riscv.h
-+++ b/target/riscv/helper.h
++++ b/target/riscv/kvm_riscv.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vmor_mm, void, ptr, ptr, ptr, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@
- DEF_HELPER_6(vmnor_mm, void, ptr, ptr, ptr, ptr, env, i32)
+ void kvm_riscv_init_user_properties(Object *cpu_obj);
- DEF_HELPER_6(vmornot_mm, void, ptr, ptr, ptr, ptr, env, i32)
+ void kvm_riscv_reset_vcpu(RISCVCPU *cpu);
- DEF_HELPER_6(vmxnor_mm, void, ptr, ptr, ptr, ptr, env, i32)
+ void kvm_riscv_set_irq(RISCVCPU *cpu, int irq, int level);
-+
++void kvm_riscv_aia_create(MachineState *machine, uint64_t group_shift,
-+DEF_HELPER_4(vmpopc_m, tl, ptr, ptr, env, i32)
++                          uint64_t aia_irq_num, uint64_t aia_msi_num,
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
++                          uint64_t aplic_base, uint64_t imsic_base,
 +                          uint64_t guest_num);
  #endif
 diff --git a/target/riscv/kvm.c b/target/riscv/kvm.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
+--- a/target/riscv/kvm.c
-+++ b/target/riscv/insn32.decode
++++ b/target/riscv/kvm.c
-@@ -XXX,XX +XXX,XX @@ vmor_mm         011010 - ..... ..... 010 ..... 1010111 @r
+@@ -XXX,XX +XXX,XX @@
- vmnor_mm        011110 - ..... ..... 010 ..... 1010111 @r
+ #include "exec/address-spaces.h"
- vmornot_mm      011100 - ..... ..... 010 ..... 1010111 @r
+ #include "hw/boards.h"
- vmxnor_mm       011111 - ..... ..... 010 ..... 1010111 @r
+ #include "hw/irq.h"
-+vmpopc_m        010100 . ..... ----- 010 ..... 1010111 @r2_vm
++#include "hw/intc/riscv_imsic.h"
+ #include "qemu/log.h"
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
+ #include "hw/loader.h"
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
+ #include "kvm_riscv.h"
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
+@@ -XXX,XX +XXX,XX @@
-index XXXXXXX..XXXXXXX 100644
+ #include "chardev/char-fe.h"
---- a/target/riscv/insn_trans/trans_rvv.inc.c
+ #include "migration/migration.h"
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
+ #include "sysemu/runstate.h"
-@@ -XXX,XX +XXX,XX @@ GEN_MM_TRANS(vmor_mm)
++#include "hw/riscv/numa.h"
- GEN_MM_TRANS(vmnor_mm)
- GEN_MM_TRANS(vmornot_mm)
+ static uint64_t kvm_riscv_reg_id(CPURISCVState *env, uint64_t type,
- GEN_MM_TRANS(vmxnor_mm)
+                                  uint64_t idx)
-+
+@@ -XXX,XX +XXX,XX @@ bool kvm_arch_cpu_check_are_resettable(void)
-+/* Vector mask population count vmpopc */
+     return true;
-+static bool trans_vmpopc_m(DisasContext *s, arg_rmr *a)
+ }
-+{
-+    if (vext_check_isa_ill(s)) {
++static int aia_mode;
-+        TCGv_ptr src2, mask;
++
-+        TCGv dst;
++static const char *kvm_aia_mode_str(uint64_t mode)
-+        TCGv_i32 desc;
++{
-+        uint32_t data = 0;
++    switch (mode) {
-+        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
++    case KVM_DEV_RISCV_AIA_MODE_EMUL:
-+        data = FIELD_DP32(data, VDATA, VM, a->vm);
++        return "emul";
-+        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
++    case KVM_DEV_RISCV_AIA_MODE_HWACCEL:
-+
++        return "hwaccel";
-+        mask = tcg_temp_new_ptr();
++    case KVM_DEV_RISCV_AIA_MODE_AUTO:
-+        src2 = tcg_temp_new_ptr();
++    default:
-+        dst = tcg_temp_new();
++        return "auto";
-+        desc = tcg_const_i32(simd_desc(0, s->vlen / 8, data));
++    };
-+
++}
-+        tcg_gen_addi_ptr(src2, cpu_env, vreg_ofs(s, a->rs2));
++
-+        tcg_gen_addi_ptr(mask, cpu_env, vreg_ofs(s, 0));
++static char *riscv_get_kvm_aia(Object *obj, Error **errp)
-+
++{
-+        gen_helper_vmpopc_m(dst, mask, src2, cpu_env, desc);
++    return g_strdup(kvm_aia_mode_str(aia_mode));
-+        gen_set_gpr(a->rd, dst);
++}
 +
-+        tcg_temp_free_ptr(mask);
++static void riscv_set_kvm_aia(Object *obj, const char *val, Error **errp)
-+        tcg_temp_free_ptr(src2);
++{
-+        tcg_temp_free(dst);
++    if (!strcmp(val, "emul")) {
-+        tcg_temp_free_i32(desc);
++        aia_mode = KVM_DEV_RISCV_AIA_MODE_EMUL;
-+        return true;
++    } else if (!strcmp(val, "hwaccel")) {
-+    }
++        aia_mode = KVM_DEV_RISCV_AIA_MODE_HWACCEL;
-+    return false;
++    } else if (!strcmp(val, "auto")) {
-+}
++        aia_mode = KVM_DEV_RISCV_AIA_MODE_AUTO;
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
++    } else {
-index XXXXXXX..XXXXXXX 100644
++        error_setg(errp, "Invalid KVM AIA mode");
---- a/target/riscv/vector_helper.c
++        error_append_hint(errp, "Valid values are emul, hwaccel, and auto.\n");
-+++ b/target/riscv/vector_helper.c
++    }
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_MASK_VV(vmor_mm, DO_OR)
++}
- GEN_VEXT_MASK_VV(vmnor_mm, DO_NOR)
++
- GEN_VEXT_MASK_VV(vmornot_mm, DO_ORNOT)
+ void kvm_arch_accel_class_init(ObjectClass *oc)
- GEN_VEXT_MASK_VV(vmxnor_mm, DO_XNOR)
+ {
-+
++    object_class_property_add_str(oc, "riscv-aia", riscv_get_kvm_aia,
-+/* Vector mask population count vmpopc */
++                                  riscv_set_kvm_aia);
-+target_ulong HELPER(vmpopc_m)(void *v0, void *vs2, CPURISCVState *env,
++    object_class_property_set_description(oc, "riscv-aia",
-+                              uint32_t desc)
++                                          "Set KVM AIA mode. Valid values are "
-+{
++                                          "emul, hwaccel, and auto. Default "
-+    target_ulong cnt = 0;
++                                          "is auto.");
-+    uint32_t mlen = vext_mlen(desc);
++    object_property_set_default_str(object_class_property_find(oc, "riscv-aia"),
-+    uint32_t vm = vext_vm(desc);
++                                    "auto");
-+    uint32_t vl = env->vl;
++}
-+    int i;
++
-+
++void kvm_riscv_aia_create(MachineState *machine, uint64_t group_shift,
-+    for (i = 0; i < vl; i++) {
++                          uint64_t aia_irq_num, uint64_t aia_msi_num,
-+        if (vm || vext_elem_mask(v0, mlen, i)) {
++                          uint64_t aplic_base, uint64_t imsic_base,
-+            if (vext_elem_mask(vs2, mlen, i)) {
++                          uint64_t guest_num)
-+                cnt++;
++{
 +    int ret, i;
 +    int aia_fd = -1;
 +    uint64_t default_aia_mode;
 +    uint64_t socket_count = riscv_socket_count(machine);
 +    uint64_t max_hart_per_socket = 0;
 +    uint64_t socket, base_hart, hart_count, socket_imsic_base, imsic_addr;
 +    uint64_t socket_bits, hart_bits, guest_bits;
 +
 +    aia_fd = kvm_create_device(kvm_state, KVM_DEV_TYPE_RISCV_AIA, false);
 +
 +    if (aia_fd < 0) {
 +        error_report("Unable to create in-kernel irqchip");
 +        exit(1);
 +    }
 +
 +    ret = kvm_device_access(aia_fd, KVM_DEV_RISCV_AIA_GRP_CONFIG,
 +                            KVM_DEV_RISCV_AIA_CONFIG_MODE,
 +                            &default_aia_mode, false, NULL);
 +    if (ret < 0) {
 +        error_report("KVM AIA: failed to get current KVM AIA mode");
 +        exit(1);
 +    }
 +    qemu_log("KVM AIA: default mode is %s\n",
 +             kvm_aia_mode_str(default_aia_mode));
 +
 +    if (default_aia_mode != aia_mode) {
 +        ret = kvm_device_access(aia_fd, KVM_DEV_RISCV_AIA_GRP_CONFIG,
 +                                KVM_DEV_RISCV_AIA_CONFIG_MODE,
 +                                &aia_mode, true, NULL);
 +        if (ret < 0)
 +            warn_report("KVM AIA: failed to set KVM AIA mode");
 +        else
 +            qemu_log("KVM AIA: set current mode to %s\n",
 +                     kvm_aia_mode_str(aia_mode));
 +    }
 +
 +    ret = kvm_device_access(aia_fd, KVM_DEV_RISCV_AIA_GRP_CONFIG,
 +                            KVM_DEV_RISCV_AIA_CONFIG_SRCS,
 +                            &aia_irq_num, true, NULL);
 +    if (ret < 0) {
 +        error_report("KVM AIA: failed to set number of input irq lines");
 +        exit(1);
 +    }
 +
 +    ret = kvm_device_access(aia_fd, KVM_DEV_RISCV_AIA_GRP_CONFIG,
 +                            KVM_DEV_RISCV_AIA_CONFIG_IDS,
 +                            &aia_msi_num, true, NULL);
 +    if (ret < 0) {
 +        error_report("KVM AIA: failed to set number of msi");
 +        exit(1);
 +    }
 +
 +    socket_bits = find_last_bit(&socket_count, BITS_PER_LONG) + 1;
 +    ret = kvm_device_access(aia_fd, KVM_DEV_RISCV_AIA_GRP_CONFIG,
 +                            KVM_DEV_RISCV_AIA_CONFIG_GROUP_BITS,
 +                            &socket_bits, true, NULL);
 +    if (ret < 0) {
 +        error_report("KVM AIA: failed to set group_bits");
 +        exit(1);
 +    }
 +
 +    ret = kvm_device_access(aia_fd, KVM_DEV_RISCV_AIA_GRP_CONFIG,
 +                            KVM_DEV_RISCV_AIA_CONFIG_GROUP_SHIFT,
 +                            &group_shift, true, NULL);
 +    if (ret < 0) {
 +        error_report("KVM AIA: failed to set group_shift");
 +        exit(1);
 +    }
 +
 +    guest_bits = guest_num == 0 ? 0 :
 +                 find_last_bit(&guest_num, BITS_PER_LONG) + 1;
 +    ret = kvm_device_access(aia_fd, KVM_DEV_RISCV_AIA_GRP_CONFIG,
 +                            KVM_DEV_RISCV_AIA_CONFIG_GUEST_BITS,
 +                            &guest_bits, true, NULL);
 +    if (ret < 0) {
 +        error_report("KVM AIA: failed to set guest_bits");
 +        exit(1);
 +    }
 +
 +    ret = kvm_device_access(aia_fd, KVM_DEV_RISCV_AIA_GRP_ADDR,
 +                            KVM_DEV_RISCV_AIA_ADDR_APLIC,
 +                            &aplic_base, true, NULL);
 +    if (ret < 0) {
 +        error_report("KVM AIA: failed to set the base address of APLIC");
 +        exit(1);
 +    }
 +
 +    for (socket = 0; socket < socket_count; socket++) {
 +        socket_imsic_base = imsic_base + socket * (1U << group_shift);
 +        hart_count = riscv_socket_hart_count(machine, socket);
 +        base_hart = riscv_socket_first_hartid(machine, socket);
 +
 +        if (max_hart_per_socket < hart_count) {
 +            max_hart_per_socket = hart_count;
 +        }
 +
 +        for (i = 0; i < hart_count; i++) {
 +            imsic_addr = socket_imsic_base + i * IMSIC_HART_SIZE(guest_bits);
 +            ret = kvm_device_access(aia_fd, KVM_DEV_RISCV_AIA_GRP_ADDR,
 +                                    KVM_DEV_RISCV_AIA_ADDR_IMSIC(i + base_hart),
 +                                    &imsic_addr, true, NULL);
 +            if (ret < 0) {
 +                error_report("KVM AIA: failed to set the IMSIC address for hart %d", i);
 +                exit(1);
 +            }
 +        }
 +    }
-+    return cnt;
++
-+}
++    hart_bits = find_last_bit(&max_hart_per_socket, BITS_PER_LONG) + 1;
 +    ret = kvm_device_access(aia_fd, KVM_DEV_RISCV_AIA_GRP_CONFIG,
 +                            KVM_DEV_RISCV_AIA_CONFIG_HART_BITS,
 +                            &hart_bits, true, NULL);
 +    if (ret < 0) {
 +        error_report("KVM AIA: failed to set hart_bits");
 +        exit(1);
 +    }
 +
 +    if (kvm_has_gsi_routing()) {
 +        for (uint64_t idx = 0; idx < aia_irq_num + 1; ++idx) {
 +            /* KVM AIA only has one APLIC instance */
 +            kvm_irqchip_add_irq_route(kvm_state, idx, 0, idx);
 +        }
 +        kvm_gsi_routing_allowed = true;
 +        kvm_irqchip_commit_routes(kvm_state);
 +    }
 +
 +    ret = kvm_device_access(aia_fd, KVM_DEV_RISCV_AIA_GRP_CTRL,
 +                            KVM_DEV_RISCV_AIA_CTRL_INIT,
 +                            NULL, true, NULL);
 +    if (ret < 0) {
 +        error_report("KVM AIA: initialized fail");
 +        exit(1);
 +    }
 +
 +    kvm_msi_via_irqfd_allowed = kvm_irqfds_enabled();
  }
 --
-.27.0
+.41.0

-[PULL 10/63] target/riscv: add fault-only-first unit stride load
+[PULL v2 32/45] target/riscv: update APLIC and IMSIC to support KVM AIA
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Yong-Xuan Wang <yongxuan.wang@sifive.com>
-The unit-stride fault-only-fault load instructions are used to
+KVM AIA can't emulate APLIC only. When "aia=aplic" parameter is passed,
-vectorize loops with data-dependent exit conditions(while loops).
+APLIC devices is emulated by QEMU. For "aia=aplic-imsic", remove the
-These instructions execute as a regular load except that they
+mmio operations of APLIC when using KVM AIA and send wired interrupt
-will only take a trap on element 0.
+signal via KVM_IRQ_LINE API.
 After KVM AIA enabled, MSI messages are delivered by KVM_SIGNAL_MSI API
 when the IMSICs receive mmio write requests.
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Signed-off-by: Yong-Xuan Wang <yongxuan.wang@sifive.com>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Reviewed-by: Jim Shu <jim.shu@sifive.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
-Message-id: 20200623215920.2594-9-zhiwei_liu@c-sky.com
+Reviewed-by: Andrew Jones <ajones@ventanamicro.com>
 Message-ID: <20230727102439.22554-5-yongxuan.wang@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   |  22 +++++
+ hw/intc/riscv_aplic.c | 56 ++++++++++++++++++++++++++++++-------------
- target/riscv/insn32.decode              |   7 ++
+ hw/intc/riscv_imsic.c | 25 +++++++++++++++----
- target/riscv/insn_trans/trans_rvv.inc.c |  73 ++++++++++++++++
+files changed, 61 insertions(+), 20 deletions(-)
  target/riscv/vector_helper.c            | 110 ++++++++++++++++++++++++
 files changed, 212 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/hw/intc/riscv_aplic.c b/hw/intc/riscv_aplic.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/hw/intc/riscv_aplic.c
-+++ b/target/riscv/helper.h
++++ b/hw/intc/riscv_aplic.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vsxe_v_b, void, ptr, ptr, tl, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@
- DEF_HELPER_6(vsxe_v_h, void, ptr, ptr, tl, ptr, env, i32)
+ #include "hw/irq.h"
- DEF_HELPER_6(vsxe_v_w, void, ptr, ptr, tl, ptr, env, i32)
+ #include "target/riscv/cpu.h"
- DEF_HELPER_6(vsxe_v_d, void, ptr, ptr, tl, ptr, env, i32)
+ #include "sysemu/sysemu.h"
-+DEF_HELPER_5(vlbff_v_b, void, ptr, ptr, tl, env, i32)
++#include "sysemu/kvm.h"
-+DEF_HELPER_5(vlbff_v_h, void, ptr, ptr, tl, env, i32)
+ #include "migration/vmstate.h"
-+DEF_HELPER_5(vlbff_v_w, void, ptr, ptr, tl, env, i32)
-+DEF_HELPER_5(vlbff_v_d, void, ptr, ptr, tl, env, i32)
+ #define APLIC_MAX_IDC                  (1UL << 14)
-+DEF_HELPER_5(vlhff_v_h, void, ptr, ptr, tl, env, i32)
+@@ -XXX,XX +XXX,XX @@
-+DEF_HELPER_5(vlhff_v_w, void, ptr, ptr, tl, env, i32)
-+DEF_HELPER_5(vlhff_v_d, void, ptr, ptr, tl, env, i32)
+ #define APLIC_IDC_CLAIMI               0x1c
-+DEF_HELPER_5(vlwff_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlwff_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vleff_v_b, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vleff_v_h, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vleff_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vleff_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlbuff_v_b, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlbuff_v_h, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlbuff_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlbuff_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlhuff_v_h, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlhuff_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlhuff_v_d, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlwuff_v_w, void, ptr, ptr, tl, env, i32)
 +DEF_HELPER_5(vlwuff_v_d, void, ptr, ptr, tl, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@ vle_v      ... 000 . 00000 ..... 111 ..... 0000111 @r2_nfvm
  vlbu_v     ... 000 . 00000 ..... 000 ..... 0000111 @r2_nfvm
  vlhu_v     ... 000 . 00000 ..... 101 ..... 0000111 @r2_nfvm
  vlwu_v     ... 000 . 00000 ..... 110 ..... 0000111 @r2_nfvm
 +vlbff_v    ... 100 . 10000 ..... 000 ..... 0000111 @r2_nfvm
 +vlhff_v    ... 100 . 10000 ..... 101 ..... 0000111 @r2_nfvm
 +vlwff_v    ... 100 . 10000 ..... 110 ..... 0000111 @r2_nfvm
 +vleff_v    ... 000 . 10000 ..... 111 ..... 0000111 @r2_nfvm
 +vlbuff_v   ... 000 . 10000 ..... 000 ..... 0000111 @r2_nfvm
 +vlhuff_v   ... 000 . 10000 ..... 101 ..... 0000111 @r2_nfvm
 +vlwuff_v   ... 000 . 10000 ..... 110 ..... 0000111 @r2_nfvm
  vsb_v      ... 000 . 00000 ..... 000 ..... 0100111 @r2_nfvm
  vsh_v      ... 000 . 00000 ..... 101 ..... 0100111 @r2_nfvm
  vsw_v      ... 000 . 00000 ..... 110 ..... 0100111 @r2_nfvm
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_TRANS(vsxb_v, 0, rnfvm, st_index_op, st_index_check)
  GEN_VEXT_TRANS(vsxh_v, 1, rnfvm, st_index_op, st_index_check)
  GEN_VEXT_TRANS(vsxw_v, 2, rnfvm, st_index_op, st_index_check)
  GEN_VEXT_TRANS(vsxe_v, 3, rnfvm, st_index_op, st_index_check)
 +
 +/*
-+ *** unit stride fault-only-first load
++ * KVM AIA only supports APLIC MSI, fallback to QEMU emulation if we want to use
 + * APLIC Wired.
 + */
-+static bool ldff_trans(uint32_t vd, uint32_t rs1, uint32_t data,
++static bool is_kvm_aia(bool msimode)
 +                       gen_helper_ldst_us *fn, DisasContext *s)
 +{
-+    TCGv_ptr dest, mask;
++    return kvm_irqchip_in_kernel() && msimode;
 +    TCGv base;
 +    TCGv_i32 desc;
 +
 +    TCGLabel *over = gen_new_label();
 +    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +
 +    dest = tcg_temp_new_ptr();
 +    mask = tcg_temp_new_ptr();
 +    base = tcg_temp_new();
 +    desc = tcg_const_i32(simd_desc(0, s->vlen / 8, data));
 +
 +    gen_get_gpr(base, rs1);
 +    tcg_gen_addi_ptr(dest, cpu_env, vreg_ofs(s, vd));
 +    tcg_gen_addi_ptr(mask, cpu_env, vreg_ofs(s, 0));
 +
 +    fn(dest, mask, base, cpu_env, desc);
 +
 +    tcg_temp_free_ptr(dest);
 +    tcg_temp_free_ptr(mask);
 +    tcg_temp_free(base);
 +    tcg_temp_free_i32(desc);
 +    gen_set_label(over);
 +    return true;
 +}
 +
-+static bool ldff_op(DisasContext *s, arg_r2nfvm *a, uint8_t seq)
+ static uint32_t riscv_aplic_read_input_word(RISCVAPLICState *aplic,
                                              uint32_t word)
  {
@@ -XXX,XX +XXX,XX @@ static uint32_t riscv_aplic_idc_claimi(RISCVAPLICState *aplic, uint32_t idc)
      return topi;
  }
 +static void riscv_kvm_aplic_request(void *opaque, int irq, int level)
 +{
-+    uint32_t data = 0;
++    kvm_set_irq(kvm_state, irq, !!level);
 +    gen_helper_ldst_us *fn;
 +    static gen_helper_ldst_us * const fns[7][4] = {
 +        { gen_helper_vlbff_v_b,  gen_helper_vlbff_v_h,
 +          gen_helper_vlbff_v_w,  gen_helper_vlbff_v_d },
 +        { NULL,                  gen_helper_vlhff_v_h,
 +          gen_helper_vlhff_v_w,  gen_helper_vlhff_v_d },
 +        { NULL,                  NULL,
 +          gen_helper_vlwff_v_w,  gen_helper_vlwff_v_d },
 +        { gen_helper_vleff_v_b,  gen_helper_vleff_v_h,
 +          gen_helper_vleff_v_w,  gen_helper_vleff_v_d },
 +        { gen_helper_vlbuff_v_b, gen_helper_vlbuff_v_h,
 +          gen_helper_vlbuff_v_w, gen_helper_vlbuff_v_d },
 +        { NULL,                  gen_helper_vlhuff_v_h,
 +          gen_helper_vlhuff_v_w, gen_helper_vlhuff_v_d },
 +        { NULL,                  NULL,
 +          gen_helper_vlwuff_v_w, gen_helper_vlwuff_v_d }
 +    };
 +
 +    fn =  fns[seq][s->sew];
 +    if (fn == NULL) {
 +        return false;
 +    }
 +
 +    data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
 +    data = FIELD_DP32(data, VDATA, VM, a->vm);
 +    data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
 +    data = FIELD_DP32(data, VDATA, NF, a->nf);
 +    return ldff_trans(a->rd, a->rs1, data, fn, s);
 +}
 +
-+GEN_VEXT_TRANS(vlbff_v, 0, r2nfvm, ldff_op, ld_us_check)
+ static void riscv_aplic_request(void *opaque, int irq, int level)
-+GEN_VEXT_TRANS(vlhff_v, 1, r2nfvm, ldff_op, ld_us_check)
+ {
-+GEN_VEXT_TRANS(vlwff_v, 2, r2nfvm, ldff_op, ld_us_check)
+     bool update = false;
-+GEN_VEXT_TRANS(vleff_v, 3, r2nfvm, ldff_op, ld_us_check)
+@@ -XXX,XX +XXX,XX @@ static void riscv_aplic_realize(DeviceState *dev, Error **errp)
-+GEN_VEXT_TRANS(vlbuff_v, 4, r2nfvm, ldff_op, ld_us_check)
+     uint32_t i;
-+GEN_VEXT_TRANS(vlhuff_v, 5, r2nfvm, ldff_op, ld_us_check)
+     RISCVAPLICState *aplic = RISCV_APLIC(dev);
-+GEN_VEXT_TRANS(vlwuff_v, 6, r2nfvm, ldff_op, ld_us_check)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
+-    aplic->bitfield_words = (aplic->num_irqs + 31) >> 5;
 -    aplic->sourcecfg = g_new0(uint32_t, aplic->num_irqs);
 -    aplic->state = g_new0(uint32_t, aplic->num_irqs);
 -    aplic->target = g_new0(uint32_t, aplic->num_irqs);
 -    if (!aplic->msimode) {
 -        for (i = 0; i < aplic->num_irqs; i++) {
 -            aplic->target[i] = 1;
 +    if (!is_kvm_aia(aplic->msimode)) {
 +        aplic->bitfield_words = (aplic->num_irqs + 31) >> 5;
 +        aplic->sourcecfg = g_new0(uint32_t, aplic->num_irqs);
 +        aplic->state = g_new0(uint32_t, aplic->num_irqs);
 +        aplic->target = g_new0(uint32_t, aplic->num_irqs);
 +        if (!aplic->msimode) {
 +            for (i = 0; i < aplic->num_irqs; i++) {
 +                aplic->target[i] = 1;
 +            }
          }
 -    }
 -    aplic->idelivery = g_new0(uint32_t, aplic->num_harts);
 -    aplic->iforce = g_new0(uint32_t, aplic->num_harts);
 -    aplic->ithreshold = g_new0(uint32_t, aplic->num_harts);
 +        aplic->idelivery = g_new0(uint32_t, aplic->num_harts);
 +        aplic->iforce = g_new0(uint32_t, aplic->num_harts);
 +        aplic->ithreshold = g_new0(uint32_t, aplic->num_harts);
 -    memory_region_init_io(&aplic->mmio, OBJECT(dev), &riscv_aplic_ops, aplic,
 -                          TYPE_RISCV_APLIC, aplic->aperture_size);
 -    sysbus_init_mmio(SYS_BUS_DEVICE(dev), &aplic->mmio);
 +        memory_region_init_io(&aplic->mmio, OBJECT(dev), &riscv_aplic_ops,
 +                              aplic, TYPE_RISCV_APLIC, aplic->aperture_size);
 +        sysbus_init_mmio(SYS_BUS_DEVICE(dev), &aplic->mmio);
 +    }
      /*
       * Only root APLICs have hardware IRQ lines. All non-root APLICs
       * have IRQ lines delegated by their parent APLIC.
       */
      if (!aplic->parent) {
 -        qdev_init_gpio_in(dev, riscv_aplic_request, aplic->num_irqs);
 +        if (is_kvm_aia(aplic->msimode)) {
 +            qdev_init_gpio_in(dev, riscv_kvm_aplic_request, aplic->num_irqs);
 +        } else {
 +            qdev_init_gpio_in(dev, riscv_aplic_request, aplic->num_irqs);
 +        }
      }
      /* Create output IRQ lines for non-MSI mode */
@@ -XXX,XX +XXX,XX @@ DeviceState *riscv_aplic_create(hwaddr addr, hwaddr size,
      qdev_prop_set_bit(dev, "mmode", mmode);
      sysbus_realize_and_unref(SYS_BUS_DEVICE(dev), &error_fatal);
 -    sysbus_mmio_map(SYS_BUS_DEVICE(dev), 0, addr);
 +
 +    if (!is_kvm_aia(msimode)) {
 +        sysbus_mmio_map(SYS_BUS_DEVICE(dev), 0, addr);
 +    }
      if (parent) {
          riscv_aplic_add_child(parent, dev);
 diff --git a/hw/intc/riscv_imsic.c b/hw/intc/riscv_imsic.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
+--- a/hw/intc/riscv_imsic.c
-+++ b/target/riscv/vector_helper.c
++++ b/hw/intc/riscv_imsic.c
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_ST_INDEX(vsxe_v_b, int8_t,  int8_t,  idx_b, ste_b)
+@@ -XXX,XX +XXX,XX @@
- GEN_VEXT_ST_INDEX(vsxe_v_h, int16_t, int16_t, idx_h, ste_h)
+ #include "target/riscv/cpu.h"
- GEN_VEXT_ST_INDEX(vsxe_v_w, int32_t, int32_t, idx_w, ste_w)
+ #include "target/riscv/cpu_bits.h"
- GEN_VEXT_ST_INDEX(vsxe_v_d, int64_t, int64_t, idx_d, ste_d)
+ #include "sysemu/sysemu.h"
 +#include "sysemu/kvm.h"
  #include "migration/vmstate.h"
  #define IMSIC_MMIO_PAGE_LE             0x00
@@ -XXX,XX +XXX,XX @@ static void riscv_imsic_write(void *opaque, hwaddr addr, uint64_t value,
          goto err;
      }
 +#if defined(CONFIG_KVM)
 +    if (kvm_irqchip_in_kernel()) {
 +        struct kvm_msi msi;
 +
-+/*
++        msi.address_lo = extract64(imsic->mmio.addr + addr, 0, 32);
-+ *** unit-stride fault-only-fisrt load instructions
++        msi.address_hi = extract64(imsic->mmio.addr + addr, 32, 32);
-+ */
++        msi.data = le32_to_cpu(value);
 +static inline void
 +vext_ldff(void *vd, void *v0, target_ulong base,
 +          CPURISCVState *env, uint32_t desc,
 +          vext_ldst_elem_fn *ldst_elem,
 +          clear_fn *clear_elem,
 +          uint32_t esz, uint32_t msz, uintptr_t ra)
 +{
 +    void *host;
 +    uint32_t i, k, vl = 0;
 +    uint32_t mlen = vext_mlen(desc);
 +    uint32_t nf = vext_nf(desc);
 +    uint32_t vm = vext_vm(desc);
 +    uint32_t vlmax = vext_maxsz(desc) / esz;
 +    target_ulong addr, offset, remain;
 +
-+    /* probe every access*/
++        kvm_vm_ioctl(kvm_state, KVM_SIGNAL_MSI, &msi);
-+    for (i = 0; i < env->vl; i++) {
++
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {
 +            continue;
 +        }
 +        addr = base + nf * i * msz;
 +        if (i == 0) {
 +            probe_pages(env, addr, nf * msz, ra, MMU_DATA_LOAD);
 +        } else {
 +            /* if it triggers an exception, no need to check watchpoint */
 +            remain = nf * msz;
 +            while (remain > 0) {
 +                offset = -(addr | TARGET_PAGE_MASK);
 +                host = tlb_vaddr_to_host(env, addr, MMU_DATA_LOAD,
 +                                         cpu_mmu_index(env, false));
 +                if (host) {
 +#ifdef CONFIG_USER_ONLY
 +                    if (page_check_range(addr, nf * msz, PAGE_READ) < 0) {
 +                        vl = i;
 +                        goto ProbeSuccess;
 +                    }
 +#else
 +                    probe_pages(env, addr, nf * msz, ra, MMU_DATA_LOAD);
 +#endif
 +                } else {
 +                    vl = i;
 +                    goto ProbeSuccess;
 +                }
 +                if (remain <=  offset) {
 +                    break;
 +                }
 +                remain -= offset;
 +                addr += offset;
 +            }
 +        }
 +    }
 +ProbeSuccess:
 +    /* load bytes from guest memory */
 +    if (vl != 0) {
 +        env->vl = vl;
 +    }
 +    for (i = 0; i < env->vl; i++) {
 +        k = 0;
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {
 +            continue;
 +        }
 +        while (k < nf) {
 +            target_ulong addr = base + (i * nf + k) * msz;
 +            ldst_elem(env, addr, i + k * vlmax, vd, ra);
 +            k++;
 +        }
 +    }
 +    /* clear tail elements */
 +    if (vl != 0) {
 +        return;
 +    }
-+    for (k = 0; k < nf; k++) {
++#endif
-+        clear_elem(vd, env->vl + k * vlmax, env->vl * esz, vlmax * esz);
++
      /* Writes only supported for MSI little-endian registers */
      page = addr >> IMSIC_MMIO_PAGE_SHIFT;
      if ((addr & (IMSIC_MMIO_PAGE_SZ - 1)) == IMSIC_MMIO_PAGE_LE) {
@@ -XXX,XX +XXX,XX @@ static void riscv_imsic_realize(DeviceState *dev, Error **errp)
      CPUState *cpu = cpu_by_arch_id(imsic->hartid);
      CPURISCVState *env = cpu ? cpu->env_ptr : NULL;
 -    imsic->num_eistate = imsic->num_pages * imsic->num_irqs;
 -    imsic->eidelivery = g_new0(uint32_t, imsic->num_pages);
 -    imsic->eithreshold = g_new0(uint32_t, imsic->num_pages);
 -    imsic->eistate = g_new0(uint32_t, imsic->num_eistate);
 +    if (!kvm_irqchip_in_kernel()) {
 +        imsic->num_eistate = imsic->num_pages * imsic->num_irqs;
 +        imsic->eidelivery = g_new0(uint32_t, imsic->num_pages);
 +        imsic->eithreshold = g_new0(uint32_t, imsic->num_pages);
 +        imsic->eistate = g_new0(uint32_t, imsic->num_eistate);
 +    }
-+}
-+
+     memory_region_init_io(&imsic->mmio, OBJECT(dev), &riscv_imsic_ops,
-+#define GEN_VEXT_LDFF(NAME, MTYPE, ETYPE, LOAD_FN, CLEAR_FN)     \
+                           imsic, TYPE_RISCV_IMSIC,
 +void HELPER(NAME)(void *vd, void *v0, target_ulong base,         \
 +                  CPURISCVState *env, uint32_t desc)             \
 +{                                                                \
 +    vext_ldff(vd, v0, base, env, desc, LOAD_FN, CLEAR_FN,        \
 +              sizeof(ETYPE), sizeof(MTYPE), GETPC());            \
 +}
 +
 +GEN_VEXT_LDFF(vlbff_v_b,  int8_t,   int8_t,   ldb_b,  clearb)
 +GEN_VEXT_LDFF(vlbff_v_h,  int8_t,   int16_t,  ldb_h,  clearh)
 +GEN_VEXT_LDFF(vlbff_v_w,  int8_t,   int32_t,  ldb_w,  clearl)
 +GEN_VEXT_LDFF(vlbff_v_d,  int8_t,   int64_t,  ldb_d,  clearq)
 +GEN_VEXT_LDFF(vlhff_v_h,  int16_t,  int16_t,  ldh_h,  clearh)
 +GEN_VEXT_LDFF(vlhff_v_w,  int16_t,  int32_t,  ldh_w,  clearl)
 +GEN_VEXT_LDFF(vlhff_v_d,  int16_t,  int64_t,  ldh_d,  clearq)
 +GEN_VEXT_LDFF(vlwff_v_w,  int32_t,  int32_t,  ldw_w,  clearl)
 +GEN_VEXT_LDFF(vlwff_v_d,  int32_t,  int64_t,  ldw_d,  clearq)
 +GEN_VEXT_LDFF(vleff_v_b,  int8_t,   int8_t,   lde_b,  clearb)
 +GEN_VEXT_LDFF(vleff_v_h,  int16_t,  int16_t,  lde_h,  clearh)
 +GEN_VEXT_LDFF(vleff_v_w,  int32_t,  int32_t,  lde_w,  clearl)
 +GEN_VEXT_LDFF(vleff_v_d,  int64_t,  int64_t,  lde_d,  clearq)
 +GEN_VEXT_LDFF(vlbuff_v_b, uint8_t,  uint8_t,  ldbu_b, clearb)
 +GEN_VEXT_LDFF(vlbuff_v_h, uint8_t,  uint16_t, ldbu_h, clearh)
 +GEN_VEXT_LDFF(vlbuff_v_w, uint8_t,  uint32_t, ldbu_w, clearl)
 +GEN_VEXT_LDFF(vlbuff_v_d, uint8_t,  uint64_t, ldbu_d, clearq)
 +GEN_VEXT_LDFF(vlhuff_v_h, uint16_t, uint16_t, ldhu_h, clearh)
 +GEN_VEXT_LDFF(vlhuff_v_w, uint16_t, uint32_t, ldhu_w, clearl)
 +GEN_VEXT_LDFF(vlhuff_v_d, uint16_t, uint64_t, ldhu_d, clearq)
 +GEN_VEXT_LDFF(vlwuff_v_w, uint32_t, uint32_t, ldwu_w, clearl)
 +GEN_VEXT_LDFF(vlwuff_v_d, uint32_t, uint64_t, ldwu_d, clearq)
 --
-.27.0
+.41.0

-[PULL 28/63] target/riscv: vector single-width fractional multiply with rounding and saturation
+[PULL v2 33/45] target/riscv: select KVM AIA in riscv virt machine
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Yong-Xuan Wang <yongxuan.wang@sifive.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Select KVM AIA when the host kernel has in-kernel AIA chip support.
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Since KVM AIA only has one APLIC instance, we map the QEMU APLIC
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+devices to KVM APLIC.
-Message-id: 20200623215920.2594-27-zhiwei_liu@c-sky.com
 Signed-off-by: Yong-Xuan Wang <yongxuan.wang@sifive.com>
 Reviewed-by: Jim Shu <jim.shu@sifive.com>
 Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 Reviewed-by: Andrew Jones <ajones@ventanamicro.com>
 Message-ID: <20230727102439.22554-6-yongxuan.wang@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   |   9 ++
+ hw/riscv/virt.c | 94 +++++++++++++++++++++++++++++++++----------------
- target/riscv/insn32.decode              |   2 +
+file changed, 63 insertions(+), 31 deletions(-)
  target/riscv/insn_trans/trans_rvv.inc.c |   4 +
  target/riscv/vector_helper.c            | 107 ++++++++++++++++++++++++
 files changed, 122 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/hw/riscv/virt.c b/hw/riscv/virt.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/hw/riscv/virt.c
-+++ b/target/riscv/helper.h
++++ b/hw/riscv/virt.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vasub_vx_b, void, ptr, ptr, tl, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@
- DEF_HELPER_6(vasub_vx_h, void, ptr, ptr, tl, ptr, env, i32)
+ #include "hw/riscv/virt.h"
- DEF_HELPER_6(vasub_vx_w, void, ptr, ptr, tl, ptr, env, i32)
+ #include "hw/riscv/boot.h"
- DEF_HELPER_6(vasub_vx_d, void, ptr, ptr, tl, ptr, env, i32)
+ #include "hw/riscv/numa.h"
-+
++#include "kvm_riscv.h"
-+DEF_HELPER_6(vsmul_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
+ #include "hw/intc/riscv_aclint.h"
-+DEF_HELPER_6(vsmul_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
+ #include "hw/intc/riscv_aplic.h"
-+DEF_HELPER_6(vsmul_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
+ #include "hw/intc/riscv_imsic.h"
-+DEF_HELPER_6(vsmul_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@
-+DEF_HELPER_6(vsmul_vx_b, void, ptr, ptr, tl, ptr, env, i32)
+ #error "Can't accommodate all IMSIC groups in address space"
-+DEF_HELPER_6(vsmul_vx_h, void, ptr, ptr, tl, ptr, env, i32)
+ #endif
-+DEF_HELPER_6(vsmul_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vsmul_vx_d, void, ptr, ptr, tl, ptr, env, i32)
++/* KVM AIA only supports APLIC MSI. APLIC Wired is always emulated by QEMU. */
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
++static bool virt_use_kvm_aia(RISCVVirtState *s)
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@ vaadd_vx        100100 . ..... ..... 100 ..... 1010111 @r_vm
  vaadd_vi        100100 . ..... ..... 011 ..... 1010111 @r_vm
  vasub_vv        100110 . ..... ..... 000 ..... 1010111 @r_vm
  vasub_vx        100110 . ..... ..... 100 ..... 1010111 @r_vm
 +vsmul_vv        100111 . ..... ..... 000 ..... 1010111 @r_vm
 +vsmul_vx        100111 . ..... ..... 100 ..... 1010111 @r_vm
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ GEN_OPIVV_TRANS(vasub_vv, opivv_check)
  GEN_OPIVX_TRANS(vaadd_vx,  opivx_check)
  GEN_OPIVX_TRANS(vasub_vx,  opivx_check)
  GEN_OPIVI_TRANS(vaadd_vi, 0, vaadd_vx, opivx_check)
 +
 +/* Vector Single-Width Fractional Multiply with Rounding and Saturation */
 +GEN_OPIVV_TRANS(vsmul_vv, opivv_check)
 +GEN_OPIVX_TRANS(vsmul_vx,  opivx_check)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VX_RM(vasub_vx_b, 1, 1, clearb)
  GEN_VEXT_VX_RM(vasub_vx_h, 2, 2, clearh)
  GEN_VEXT_VX_RM(vasub_vx_w, 4, 4, clearl)
  GEN_VEXT_VX_RM(vasub_vx_d, 8, 8, clearq)
 +
 +/* Vector Single-Width Fractional Multiply with Rounding and Saturation */
 +static inline int8_t vsmul8(CPURISCVState *env, int vxrm, int8_t a, int8_t b)
 +{
-+    uint8_t round;
++    return kvm_irqchip_in_kernel() && s->aia_type == VIRT_AIA_TYPE_APLIC_IMSIC;
 +    int16_t res;
 +
 +    res = (int16_t)a * (int16_t)b;
 +    round = get_round(vxrm, res, 7);
 +    res   = (res >> 7) + round;
 +
 +    if (res > INT8_MAX) {
 +        env->vxsat = 0x1;
 +        return INT8_MAX;
 +    } else if (res < INT8_MIN) {
 +        env->vxsat = 0x1;
 +        return INT8_MIN;
 +    } else {
 +        return res;
 +    }
 +}
 +
-+static int16_t vsmul16(CPURISCVState *env, int vxrm, int16_t a, int16_t b)
+ static const MemMapEntry virt_memmap[] = {
-+{
+     [VIRT_DEBUG] =        {        0x0,         0x100 },
-+    uint8_t round;
+     [VIRT_MROM] =         {     0x1000,        0xf000 },
-+    int32_t res;
+@@ -XXX,XX +XXX,XX @@ static void create_fdt_one_aplic(RISCVVirtState *s, int socket,
                                   uint32_t *intc_phandles,
                                   uint32_t aplic_phandle,
                                   uint32_t aplic_child_phandle,
 -                                 bool m_mode)
 +                                 bool m_mode, int num_harts)
  {
      int cpu;
      char *aplic_name;
      uint32_t *aplic_cells;
      MachineState *ms = MACHINE(s);
 -    aplic_cells = g_new0(uint32_t, s->soc[socket].num_harts * 2);
 +    aplic_cells = g_new0(uint32_t, num_harts * 2);
 -    for (cpu = 0; cpu < s->soc[socket].num_harts; cpu++) {
 +    for (cpu = 0; cpu < num_harts; cpu++) {
          aplic_cells[cpu * 2 + 0] = cpu_to_be32(intc_phandles[cpu]);
          aplic_cells[cpu * 2 + 1] = cpu_to_be32(m_mode ? IRQ_M_EXT : IRQ_S_EXT);
      }
@@ -XXX,XX +XXX,XX @@ static void create_fdt_one_aplic(RISCVVirtState *s, int socket,
      if (s->aia_type == VIRT_AIA_TYPE_APLIC) {
          qemu_fdt_setprop(ms->fdt, aplic_name, "interrupts-extended",
 -                         aplic_cells,
 -                         s->soc[socket].num_harts * sizeof(uint32_t) * 2);
 +                         aplic_cells, num_harts * sizeof(uint32_t) * 2);
      } else {
          qemu_fdt_setprop_cell(ms->fdt, aplic_name, "msi-parent", msi_phandle);
      }
@@ -XXX,XX +XXX,XX @@ static void create_fdt_socket_aplic(RISCVVirtState *s,
                                      uint32_t msi_s_phandle,
                                      uint32_t *phandle,
                                      uint32_t *intc_phandles,
 -                                    uint32_t *aplic_phandles)
 +                                    uint32_t *aplic_phandles,
 +                                    int num_harts)
  {
      char *aplic_name;
      unsigned long aplic_addr;
@@ -XXX,XX +XXX,XX @@ static void create_fdt_socket_aplic(RISCVVirtState *s,
          create_fdt_one_aplic(s, socket, aplic_addr, memmap[VIRT_APLIC_M].size,
                               msi_m_phandle, intc_phandles,
                               aplic_m_phandle, aplic_s_phandle,
 -                             true);
 +                             true, num_harts);
      }
      /* S-level APLIC node */
@@ -XXX,XX +XXX,XX @@ static void create_fdt_socket_aplic(RISCVVirtState *s,
      create_fdt_one_aplic(s, socket, aplic_addr, memmap[VIRT_APLIC_S].size,
                           msi_s_phandle, intc_phandles,
                           aplic_s_phandle, 0,
 -                         false);
 +                         false, num_harts);
      aplic_name = g_strdup_printf("/soc/aplic@%lx", aplic_addr);
@@ -XXX,XX +XXX,XX @@ static void create_fdt_sockets(RISCVVirtState *s, const MemMapEntry *memmap,
          *msi_pcie_phandle = msi_s_phandle;
      }
 -    phandle_pos = ms->smp.cpus;
 -    for (socket = (socket_count - 1); socket >= 0; socket--) {
 -        phandle_pos -= s->soc[socket].num_harts;
 -
 -        if (s->aia_type == VIRT_AIA_TYPE_NONE) {
 -            create_fdt_socket_plic(s, memmap, socket, phandle,
 -                &intc_phandles[phandle_pos], xplic_phandles);
 -        } else {
 -            create_fdt_socket_aplic(s, memmap, socket,
 -                msi_m_phandle, msi_s_phandle, phandle,
 -                &intc_phandles[phandle_pos], xplic_phandles);
 +    /* KVM AIA only has one APLIC instance */
 +    if (virt_use_kvm_aia(s)) {
 +        create_fdt_socket_aplic(s, memmap, 0,
 +                                msi_m_phandle, msi_s_phandle, phandle,
 +                                &intc_phandles[0], xplic_phandles,
 +                                ms->smp.cpus);
 +    } else {
 +        phandle_pos = ms->smp.cpus;
 +        for (socket = (socket_count - 1); socket >= 0; socket--) {
 +            phandle_pos -= s->soc[socket].num_harts;
 +
-+    res = (int32_t)a * (int32_t)b;
++            if (s->aia_type == VIRT_AIA_TYPE_NONE) {
-+    round = get_round(vxrm, res, 15);
++                create_fdt_socket_plic(s, memmap, socket, phandle,
-+    res   = (res >> 15) + round;
++                                       &intc_phandles[phandle_pos],
-+
++                                       xplic_phandles);
-+    if (res > INT16_MAX) {
++            } else {
-+        env->vxsat = 0x1;
++                create_fdt_socket_aplic(s, memmap, socket,
-+        return INT16_MAX;
++                                        msi_m_phandle, msi_s_phandle, phandle,
-+    } else if (res < INT16_MIN) {
++                                        &intc_phandles[phandle_pos],
-+        env->vxsat = 0x1;
++                                        xplic_phandles,
-+        return INT16_MIN;
++                                        s->soc[socket].num_harts);
 +            }
          }
      }
      g_free(intc_phandles);
 -    for (socket = 0; socket < socket_count; socket++) {
 -        if (socket == 0) {
 -            *irq_mmio_phandle = xplic_phandles[socket];
 -            *irq_virtio_phandle = xplic_phandles[socket];
 -            *irq_pcie_phandle = xplic_phandles[socket];
 -        }
 -        if (socket == 1) {
 -            *irq_virtio_phandle = xplic_phandles[socket];
 -            *irq_pcie_phandle = xplic_phandles[socket];
 -        }
 -        if (socket == 2) {
 -            *irq_pcie_phandle = xplic_phandles[socket];
 +    if (virt_use_kvm_aia(s)) {
 +        *irq_mmio_phandle = xplic_phandles[0];
 +        *irq_virtio_phandle = xplic_phandles[0];
 +        *irq_pcie_phandle = xplic_phandles[0];
 +    } else {
-+        return res;
++        for (socket = 0; socket < socket_count; socket++) {
-+    }
++            if (socket == 0) {
-+}
++                *irq_mmio_phandle = xplic_phandles[socket];
-+
++                *irq_virtio_phandle = xplic_phandles[socket];
-+static int32_t vsmul32(CPURISCVState *env, int vxrm, int32_t a, int32_t b)
++                *irq_pcie_phandle = xplic_phandles[socket];
-+{
++            }
-+    uint8_t round;
++            if (socket == 1) {
-+    int64_t res;
++                *irq_virtio_phandle = xplic_phandles[socket];
-+
++                *irq_pcie_phandle = xplic_phandles[socket];
-+    res = (int64_t)a * (int64_t)b;
++            }
-+    round = get_round(vxrm, res, 31);
++            if (socket == 2) {
-+    res   = (res >> 31) + round;
++                *irq_pcie_phandle = xplic_phandles[socket];
-+
++            }
-+    if (res > INT32_MAX) {
+         }
-+        env->vxsat = 0x1;
+     }
-+        return INT32_MAX;
-+    } else if (res < INT32_MIN) {
+@@ -XXX,XX +XXX,XX @@ static void virt_machine_init(MachineState *machine)
-+        env->vxsat = 0x1;
+         }
-+        return INT32_MIN;
+     }
-+    } else {
-+        return res;
++    if (virt_use_kvm_aia(s)) {
-+    }
++        kvm_riscv_aia_create(machine, IMSIC_MMIO_GROUP_MIN_SHIFT,
-+}
++                             VIRT_IRQCHIP_NUM_SOURCES, VIRT_IRQCHIP_NUM_MSIS,
-+
++                             memmap[VIRT_APLIC_S].base,
-+static int64_t vsmul64(CPURISCVState *env, int vxrm, int64_t a, int64_t b)
++                             memmap[VIRT_IMSIC_S].base,
-+{
++                             s->aia_guests);
 +    uint8_t round;
 +    uint64_t hi_64, lo_64;
 +    int64_t res;
 +
 +    if (a == INT64_MIN && b == INT64_MIN) {
 +        env->vxsat = 1;
 +        return INT64_MAX;
 +    }
 +
-+    muls64(&lo_64, &hi_64, a, b);
+     if (riscv_is_32bit(&s->soc[0])) {
-+    round = get_round(vxrm, lo_64, 63);
+ #if HOST_LONG_BITS == 64
-+    /*
+         /* limit RAM size in a 32-bit system */
 +     * Cannot overflow, as there are always
 +     * 2 sign bits after multiply.
 +     */
 +    res = (hi_64 << 1) | (lo_64 >> 63);
 +    if (round) {
 +        if (res == INT64_MAX) {
 +            env->vxsat = 1;
 +        } else {
 +            res += 1;
 +        }
 +    }
 +    return res;
 +}
 +
 +RVVCALL(OPIVV2_RM, vsmul_vv_b, OP_SSS_B, H1, H1, H1, vsmul8)
 +RVVCALL(OPIVV2_RM, vsmul_vv_h, OP_SSS_H, H2, H2, H2, vsmul16)
 +RVVCALL(OPIVV2_RM, vsmul_vv_w, OP_SSS_W, H4, H4, H4, vsmul32)
 +RVVCALL(OPIVV2_RM, vsmul_vv_d, OP_SSS_D, H8, H8, H8, vsmul64)
 +GEN_VEXT_VV_RM(vsmul_vv_b, 1, 1, clearb)
 +GEN_VEXT_VV_RM(vsmul_vv_h, 2, 2, clearh)
 +GEN_VEXT_VV_RM(vsmul_vv_w, 4, 4, clearl)
 +GEN_VEXT_VV_RM(vsmul_vv_d, 8, 8, clearq)
 +
 +RVVCALL(OPIVX2_RM, vsmul_vx_b, OP_SSS_B, H1, H1, vsmul8)
 +RVVCALL(OPIVX2_RM, vsmul_vx_h, OP_SSS_H, H2, H2, vsmul16)
 +RVVCALL(OPIVX2_RM, vsmul_vx_w, OP_SSS_W, H4, H4, vsmul32)
 +RVVCALL(OPIVX2_RM, vsmul_vx_d, OP_SSS_D, H8, H8, vsmul64)
 +GEN_VEXT_VX_RM(vsmul_vx_b, 1, 1, clearb)
 +GEN_VEXT_VX_RM(vsmul_vx_h, 2, 2, clearh)
 +GEN_VEXT_VX_RM(vsmul_vx_w, 4, 4, clearl)
 +GEN_VEXT_VX_RM(vsmul_vx_d, 8, 8, clearq)
 --
-.27.0
+.41.0

-[PULL 41/63] target/riscv: vector floating-point compare instructions
+[PULL v2 34/45] hw/riscv: virt: Fix riscv,pmu DT node path
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Conor Dooley <conor.dooley@microchip.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+On a dtb dumped from the virt machine, dt-validate complains:
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+soc: pmu: {'riscv,event-to-mhpmcounters': [[1, 1, 524281], [2, 2, 524284], [65561, 65561, 524280], [65563, 65563, 524280], [65569, 65569, 524280]], 'compatible': ['riscv,pmu']} should not be valid under {'type': 'object'}
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+        from schema $id: http://devicetree.org/schemas/simple-bus.yaml#
-Message-id: 20200623215920.2594-40-zhiwei_liu@c-sky.com
+That's pretty cryptic, but running the dtb back through dtc produces
 something a lot more reasonable:
 Warning (simple_bus_reg): /soc/pmu: missing or empty reg/ranges property
 Moving the riscv,pmu node out of the soc bus solves the problem.
 Signed-off-by: Conor Dooley <conor.dooley@microchip.com>
 Acked-by: Alistair Francis <alistair.francis@wdc.com>
 Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 Message-ID: <20230727-groom-decline-2c57ce42841c@spud>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   |  37 +++++
+ hw/riscv/virt.c | 2 +-
- target/riscv/insn32.decode              |  12 ++
+file changed, 1 insertion(+), 1 deletion(-)
  target/riscv/insn_trans/trans_rvv.inc.c |  35 +++++
  target/riscv/vector_helper.c            | 174 ++++++++++++++++++++++++
 files changed, 258 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/hw/riscv/virt.c b/hw/riscv/virt.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/hw/riscv/virt.c
-+++ b/target/riscv/helper.h
++++ b/hw/riscv/virt.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vfsgnjn_vf_d, void, ptr, ptr, i64, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ static void create_fdt_pmu(RISCVVirtState *s)
- DEF_HELPER_6(vfsgnjx_vf_h, void, ptr, ptr, i64, ptr, env, i32)
+     MachineState *ms = MACHINE(s);
- DEF_HELPER_6(vfsgnjx_vf_w, void, ptr, ptr, i64, ptr, env, i32)
+     RISCVCPU hart = s->soc[0].harts[0];
- DEF_HELPER_6(vfsgnjx_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-+
+-    pmu_name = g_strdup_printf("/soc/pmu");
-+DEF_HELPER_6(vmfeq_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++    pmu_name = g_strdup_printf("/pmu");
-+DEF_HELPER_6(vmfeq_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
+     qemu_fdt_add_subnode(ms->fdt, pmu_name);
-+DEF_HELPER_6(vmfeq_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
+     qemu_fdt_setprop_string(ms->fdt, pmu_name, "compatible", "riscv,pmu");
-+DEF_HELPER_6(vmfne_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
+     riscv_pmu_generate_fdt_node(ms->fdt, hart.cfg.pmu_num, pmu_name);
 +DEF_HELPER_6(vmfne_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmfne_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmflt_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmflt_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmflt_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmfle_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmfle_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmfle_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmfeq_vf_h, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vmfeq_vf_w, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vmfeq_vf_d, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vmfne_vf_h, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vmfne_vf_w, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vmfne_vf_d, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vmflt_vf_h, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vmflt_vf_w, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vmflt_vf_d, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vmfle_vf_h, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vmfle_vf_w, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vmfle_vf_d, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vmfgt_vf_h, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vmfgt_vf_w, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vmfgt_vf_d, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vmfge_vf_h, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vmfge_vf_w, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vmfge_vf_d, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vmford_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmford_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmford_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vmford_vf_h, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vmford_vf_w, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vmford_vf_d, void, ptr, ptr, i64, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@ vfsgnjn_vv      001001 . ..... ..... 001 ..... 1010111 @r_vm
  vfsgnjn_vf      001001 . ..... ..... 101 ..... 1010111 @r_vm
  vfsgnjx_vv      001010 . ..... ..... 001 ..... 1010111 @r_vm
  vfsgnjx_vf      001010 . ..... ..... 101 ..... 1010111 @r_vm
 +vmfeq_vv        011000 . ..... ..... 001 ..... 1010111 @r_vm
 +vmfeq_vf        011000 . ..... ..... 101 ..... 1010111 @r_vm
 +vmfne_vv        011100 . ..... ..... 001 ..... 1010111 @r_vm
 +vmfne_vf        011100 . ..... ..... 101 ..... 1010111 @r_vm
 +vmflt_vv        011011 . ..... ..... 001 ..... 1010111 @r_vm
 +vmflt_vf        011011 . ..... ..... 101 ..... 1010111 @r_vm
 +vmfle_vv        011001 . ..... ..... 001 ..... 1010111 @r_vm
 +vmfle_vf        011001 . ..... ..... 101 ..... 1010111 @r_vm
 +vmfgt_vf        011101 . ..... ..... 101 ..... 1010111 @r_vm
 +vmfge_vf        011111 . ..... ..... 101 ..... 1010111 @r_vm
 +vmford_vv       011010 . ..... ..... 001 ..... 1010111 @r_vm
 +vmford_vf       011010 . ..... ..... 101 ..... 1010111 @r_vm
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ GEN_OPFVV_TRANS(vfsgnjx_vv, opfvv_check)
  GEN_OPFVF_TRANS(vfsgnj_vf, opfvf_check)
  GEN_OPFVF_TRANS(vfsgnjn_vf, opfvf_check)
  GEN_OPFVF_TRANS(vfsgnjx_vf, opfvf_check)
 +
 +/* Vector Floating-Point Compare Instructions */
 +static bool opfvv_cmp_check(DisasContext *s, arg_rmrr *a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_reg(s, a->rs2, false) &&
 +            vext_check_reg(s, a->rs1, false) &&
 +            (s->sew != 0) &&
 +            ((vext_check_overlap_group(a->rd, 1, a->rs1, 1 << s->lmul) &&
 +              vext_check_overlap_group(a->rd, 1, a->rs2, 1 << s->lmul)) ||
 +             (s->lmul == 0)));
 +}
 +
 +GEN_OPFVV_TRANS(vmfeq_vv, opfvv_cmp_check)
 +GEN_OPFVV_TRANS(vmfne_vv, opfvv_cmp_check)
 +GEN_OPFVV_TRANS(vmflt_vv, opfvv_cmp_check)
 +GEN_OPFVV_TRANS(vmfle_vv, opfvv_cmp_check)
 +GEN_OPFVV_TRANS(vmford_vv, opfvv_cmp_check)
 +
 +static bool opfvf_cmp_check(DisasContext *s, arg_rmrr *a)
 +{
 +    return (vext_check_isa_ill(s) &&
 +            vext_check_reg(s, a->rs2, false) &&
 +            (s->sew != 0) &&
 +            (vext_check_overlap_group(a->rd, 1, a->rs2, 1 << s->lmul) ||
 +             (s->lmul == 0)));
 +}
 +
 +GEN_OPFVF_TRANS(vmfeq_vf, opfvf_cmp_check)
 +GEN_OPFVF_TRANS(vmfne_vf, opfvf_cmp_check)
 +GEN_OPFVF_TRANS(vmflt_vf, opfvf_cmp_check)
 +GEN_OPFVF_TRANS(vmfle_vf, opfvf_cmp_check)
 +GEN_OPFVF_TRANS(vmfgt_vf, opfvf_cmp_check)
 +GEN_OPFVF_TRANS(vmfge_vf, opfvf_cmp_check)
 +GEN_OPFVF_TRANS(vmford_vf, opfvf_cmp_check)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ RVVCALL(OPFVF2, vfsgnjx_vf_d, OP_UUU_D, H8, H8, fsgnjx64)
  GEN_VEXT_VF(vfsgnjx_vf_h, 2, 2, clearh)
  GEN_VEXT_VF(vfsgnjx_vf_w, 4, 4, clearl)
  GEN_VEXT_VF(vfsgnjx_vf_d, 8, 8, clearq)
 +
 +/* Vector Floating-Point Compare Instructions */
 +#define GEN_VEXT_CMP_VV_ENV(NAME, ETYPE, H, DO_OP)            \
 +void HELPER(NAME)(void *vd, void *v0, void *vs1, void *vs2,   \
 +                  CPURISCVState *env, uint32_t desc)          \
 +{                                                             \
 +    uint32_t mlen = vext_mlen(desc);                          \
 +    uint32_t vm = vext_vm(desc);                              \
 +    uint32_t vl = env->vl;                                    \
 +    uint32_t vlmax = vext_maxsz(desc) / sizeof(ETYPE);        \
 +    uint32_t i;                                               \
 +                                                              \
 +    for (i = 0; i < vl; i++) {                                \
 +        ETYPE s1 = *((ETYPE *)vs1 + H(i));                    \
 +        ETYPE s2 = *((ETYPE *)vs2 + H(i));                    \
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {            \
 +            continue;                                         \
 +        }                                                     \
 +        vext_set_elem_mask(vd, mlen, i,                       \
 +                           DO_OP(s2, s1, &env->fp_status));   \
 +    }                                                         \
 +    for (; i < vlmax; i++) {                                  \
 +        vext_set_elem_mask(vd, mlen, i, 0);                   \
 +    }                                                         \
 +}
 +
 +static bool float16_eq_quiet(uint16_t a, uint16_t b, float_status *s)
 +{
 +    FloatRelation compare = float16_compare_quiet(a, b, s);
 +    return compare == float_relation_equal;
 +}
 +
 +GEN_VEXT_CMP_VV_ENV(vmfeq_vv_h, uint16_t, H2, float16_eq_quiet)
 +GEN_VEXT_CMP_VV_ENV(vmfeq_vv_w, uint32_t, H4, float32_eq_quiet)
 +GEN_VEXT_CMP_VV_ENV(vmfeq_vv_d, uint64_t, H8, float64_eq_quiet)
 +
 +#define GEN_VEXT_CMP_VF(NAME, ETYPE, H, DO_OP)                      \
 +void HELPER(NAME)(void *vd, void *v0, uint64_t s1, void *vs2,       \
 +                  CPURISCVState *env, uint32_t desc)                \
 +{                                                                   \
 +    uint32_t mlen = vext_mlen(desc);                                \
 +    uint32_t vm = vext_vm(desc);                                    \
 +    uint32_t vl = env->vl;                                          \
 +    uint32_t vlmax = vext_maxsz(desc) / sizeof(ETYPE);              \
 +    uint32_t i;                                                     \
 +                                                                    \
 +    for (i = 0; i < vl; i++) {                                      \
 +        ETYPE s2 = *((ETYPE *)vs2 + H(i));                          \
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {                  \
 +            continue;                                               \
 +        }                                                           \
 +        vext_set_elem_mask(vd, mlen, i,                             \
 +                           DO_OP(s2, (ETYPE)s1, &env->fp_status));  \
 +    }                                                               \
 +    for (; i < vlmax; i++) {                                        \
 +        vext_set_elem_mask(vd, mlen, i, 0);                         \
 +    }                                                               \
 +}
 +
 +GEN_VEXT_CMP_VF(vmfeq_vf_h, uint16_t, H2, float16_eq_quiet)
 +GEN_VEXT_CMP_VF(vmfeq_vf_w, uint32_t, H4, float32_eq_quiet)
 +GEN_VEXT_CMP_VF(vmfeq_vf_d, uint64_t, H8, float64_eq_quiet)
 +
 +static bool vmfne16(uint16_t a, uint16_t b, float_status *s)
 +{
 +    FloatRelation compare = float16_compare_quiet(a, b, s);
 +    return compare != float_relation_equal;
 +}
 +
 +static bool vmfne32(uint32_t a, uint32_t b, float_status *s)
 +{
 +    FloatRelation compare = float32_compare_quiet(a, b, s);
 +    return compare != float_relation_equal;
 +}
 +
 +static bool vmfne64(uint64_t a, uint64_t b, float_status *s)
 +{
 +    FloatRelation compare = float64_compare_quiet(a, b, s);
 +    return compare != float_relation_equal;
 +}
 +
 +GEN_VEXT_CMP_VV_ENV(vmfne_vv_h, uint16_t, H2, vmfne16)
 +GEN_VEXT_CMP_VV_ENV(vmfne_vv_w, uint32_t, H4, vmfne32)
 +GEN_VEXT_CMP_VV_ENV(vmfne_vv_d, uint64_t, H8, vmfne64)
 +GEN_VEXT_CMP_VF(vmfne_vf_h, uint16_t, H2, vmfne16)
 +GEN_VEXT_CMP_VF(vmfne_vf_w, uint32_t, H4, vmfne32)
 +GEN_VEXT_CMP_VF(vmfne_vf_d, uint64_t, H8, vmfne64)
 +
 +static bool float16_lt(uint16_t a, uint16_t b, float_status *s)
 +{
 +    FloatRelation compare = float16_compare(a, b, s);
 +    return compare == float_relation_less;
 +}
 +
 +GEN_VEXT_CMP_VV_ENV(vmflt_vv_h, uint16_t, H2, float16_lt)
 +GEN_VEXT_CMP_VV_ENV(vmflt_vv_w, uint32_t, H4, float32_lt)
 +GEN_VEXT_CMP_VV_ENV(vmflt_vv_d, uint64_t, H8, float64_lt)
 +GEN_VEXT_CMP_VF(vmflt_vf_h, uint16_t, H2, float16_lt)
 +GEN_VEXT_CMP_VF(vmflt_vf_w, uint32_t, H4, float32_lt)
 +GEN_VEXT_CMP_VF(vmflt_vf_d, uint64_t, H8, float64_lt)
 +
 +static bool float16_le(uint16_t a, uint16_t b, float_status *s)
 +{
 +    FloatRelation compare = float16_compare(a, b, s);
 +    return compare == float_relation_less ||
 +           compare == float_relation_equal;
 +}
 +
 +GEN_VEXT_CMP_VV_ENV(vmfle_vv_h, uint16_t, H2, float16_le)
 +GEN_VEXT_CMP_VV_ENV(vmfle_vv_w, uint32_t, H4, float32_le)
 +GEN_VEXT_CMP_VV_ENV(vmfle_vv_d, uint64_t, H8, float64_le)
 +GEN_VEXT_CMP_VF(vmfle_vf_h, uint16_t, H2, float16_le)
 +GEN_VEXT_CMP_VF(vmfle_vf_w, uint32_t, H4, float32_le)
 +GEN_VEXT_CMP_VF(vmfle_vf_d, uint64_t, H8, float64_le)
 +
 +static bool vmfgt16(uint16_t a, uint16_t b, float_status *s)
 +{
 +    FloatRelation compare = float16_compare(a, b, s);
 +    return compare == float_relation_greater;
 +}
 +
 +static bool vmfgt32(uint32_t a, uint32_t b, float_status *s)
 +{
 +    FloatRelation compare = float32_compare(a, b, s);
 +    return compare == float_relation_greater;
 +}
 +
 +static bool vmfgt64(uint64_t a, uint64_t b, float_status *s)
 +{
 +    FloatRelation compare = float64_compare(a, b, s);
 +    return compare == float_relation_greater;
 +}
 +
 +GEN_VEXT_CMP_VF(vmfgt_vf_h, uint16_t, H2, vmfgt16)
 +GEN_VEXT_CMP_VF(vmfgt_vf_w, uint32_t, H4, vmfgt32)
 +GEN_VEXT_CMP_VF(vmfgt_vf_d, uint64_t, H8, vmfgt64)
 +
 +static bool vmfge16(uint16_t a, uint16_t b, float_status *s)
 +{
 +    FloatRelation compare = float16_compare(a, b, s);
 +    return compare == float_relation_greater ||
 +           compare == float_relation_equal;
 +}
 +
 +static bool vmfge32(uint32_t a, uint32_t b, float_status *s)
 +{
 +    FloatRelation compare = float32_compare(a, b, s);
 +    return compare == float_relation_greater ||
 +           compare == float_relation_equal;
 +}
 +
 +static bool vmfge64(uint64_t a, uint64_t b, float_status *s)
 +{
 +    FloatRelation compare = float64_compare(a, b, s);
 +    return compare == float_relation_greater ||
 +           compare == float_relation_equal;
 +}
 +
 +GEN_VEXT_CMP_VF(vmfge_vf_h, uint16_t, H2, vmfge16)
 +GEN_VEXT_CMP_VF(vmfge_vf_w, uint32_t, H4, vmfge32)
 +GEN_VEXT_CMP_VF(vmfge_vf_d, uint64_t, H8, vmfge64)
 +
 +static bool float16_unordered_quiet(uint16_t a, uint16_t b, float_status *s)
 +{
 +    FloatRelation compare = float16_compare_quiet(a, b, s);
 +    return compare == float_relation_unordered;
 +}
 +
 +GEN_VEXT_CMP_VV_ENV(vmford_vv_h, uint16_t, H2, !float16_unordered_quiet)
 +GEN_VEXT_CMP_VV_ENV(vmford_vv_w, uint32_t, H4, !float32_unordered_quiet)
 +GEN_VEXT_CMP_VV_ENV(vmford_vv_d, uint64_t, H8, !float64_unordered_quiet)
 +GEN_VEXT_CMP_VF(vmford_vf_h, uint16_t, H2, !float16_unordered_quiet)
 +GEN_VEXT_CMP_VF(vmford_vf_w, uint32_t, H4, !float32_unordered_quiet)
 +GEN_VEXT_CMP_VF(vmford_vf_d, uint64_t, H8, !float64_unordered_quiet)
 --
-.27.0
+.41.0

-[PULL 05/63] target/riscv: support vector extension csr
+[PULL v2 35/45] target/riscv: Update CSR bits name for svadu extension
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Weiwei Li <liweiwei@iscas.ac.cn>
-The v0.7.1 specification does not define vector status within mstatus.
+The Svadu specification updated the name of the *envcfg bit from
-A future revision will define the privileged portion of the vector status.
+HADE to ADUE.
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Signed-off-by: Weiwei Li <liweiwei@iscas.ac.cn>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Signed-off-by: Junqiang Wang <wangjunqiang@iscas.ac.cn>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
-Message-id: 20200623215920.2594-4-zhiwei_liu@c-sky.com
+Message-ID: <20230816141916.66898-1-liweiwei@iscas.ac.cn>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/cpu_bits.h | 15 +++++++++
+ target/riscv/cpu_bits.h   |  8 ++++----
- target/riscv/csr.c      | 75 ++++++++++++++++++++++++++++++++++++++++-
+ target/riscv/cpu.c        |  4 ++--
-files changed, 89 insertions(+), 1 deletion(-)
+ target/riscv/cpu_helper.c |  6 +++---
  target/riscv/csr.c        | 12 ++++++------
 files changed, 15 insertions(+), 15 deletions(-)
 diff --git a/target/riscv/cpu_bits.h b/target/riscv/cpu_bits.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/cpu_bits.h
 +++ b/target/riscv/cpu_bits.h
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ typedef enum RISCVException {
- #define FSR_NXA             (FPEXC_NX << FSR_AEXC_SHIFT)
+ #define MENVCFG_CBIE                       (3UL << 4)
- #define FSR_AEXC            (FSR_NVA | FSR_OFA | FSR_UFA | FSR_DZA | FSR_NXA)
+ #define MENVCFG_CBCFE                      BIT(6)
+ #define MENVCFG_CBZE                       BIT(7)
-+/* Vector Fixed-Point round model */
+-#define MENVCFG_HADE                       (1ULL << 61)
-+#define FSR_VXRM_SHIFT      9
++#define MENVCFG_ADUE                       (1ULL << 61)
-+#define FSR_VXRM            (0x3 << FSR_VXRM_SHIFT)
+ #define MENVCFG_PBMTE                      (1ULL << 62)
-+
+ #define MENVCFG_STCE                       (1ULL << 63)
-+/* Vector Fixed-Point saturation flag */
-+#define FSR_VXSAT_SHIFT     8
+ /* For RV32 */
-+#define FSR_VXSAT           (0x1 << FSR_VXSAT_SHIFT)
+-#define MENVCFGH_HADE                      BIT(29)
-+
++#define MENVCFGH_ADUE                      BIT(29)
- /* Control and Status Registers */
+ #define MENVCFGH_PBMTE                     BIT(30)
+ #define MENVCFGH_STCE                      BIT(31)
- /* User Trap Setup */
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ typedef enum RISCVException {
- #define CSR_FRM             0x002
+ #define HENVCFG_CBIE                       MENVCFG_CBIE
- #define CSR_FCSR            0x003
+ #define HENVCFG_CBCFE                      MENVCFG_CBCFE
+ #define HENVCFG_CBZE                       MENVCFG_CBZE
-+/* User Vector CSRs */
+-#define HENVCFG_HADE                       MENVCFG_HADE
-+#define CSR_VSTART          0x008
++#define HENVCFG_ADUE                       MENVCFG_ADUE
-+#define CSR_VXSAT           0x009
+ #define HENVCFG_PBMTE                      MENVCFG_PBMTE
-+#define CSR_VXRM            0x00a
+ #define HENVCFG_STCE                       MENVCFG_STCE
-+#define CSR_VL              0xc20
-+#define CSR_VTYPE           0xc21
+ /* For RV32 */
-+
+-#define HENVCFGH_HADE                       MENVCFGH_HADE
- /* User Timers and Counters */
++#define HENVCFGH_ADUE                       MENVCFGH_ADUE
- #define CSR_CYCLE           0xc00
+ #define HENVCFGH_PBMTE                      MENVCFGH_PBMTE
- #define CSR_TIME            0xc01
+ #define HENVCFGH_STCE                       MENVCFGH_STCE
 diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/cpu.c
 +++ b/target/riscv/cpu.c
@@ -XXX,XX +XXX,XX @@ static void riscv_cpu_reset_hold(Object *obj)
      env->two_stage_lookup = false;
      env->menvcfg = (cpu->cfg.ext_svpbmt ? MENVCFG_PBMTE : 0) |
 -                   (cpu->cfg.ext_svadu ? MENVCFG_HADE : 0);
 +                   (cpu->cfg.ext_svadu ? MENVCFG_ADUE : 0);
      env->henvcfg = (cpu->cfg.ext_svpbmt ? HENVCFG_PBMTE : 0) |
 -                   (cpu->cfg.ext_svadu ? HENVCFG_HADE : 0);
 +                   (cpu->cfg.ext_svadu ? HENVCFG_ADUE : 0);
      /* Initialized default priorities of local interrupts. */
      for (i = 0; i < ARRAY_SIZE(env->miprio); i++) {
 diff --git a/target/riscv/cpu_helper.c b/target/riscv/cpu_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/cpu_helper.c
 +++ b/target/riscv/cpu_helper.c
@@ -XXX,XX +XXX,XX @@ static int get_physical_address(CPURISCVState *env, hwaddr *physical,
      }
      bool pbmte = env->menvcfg & MENVCFG_PBMTE;
 -    bool hade = env->menvcfg & MENVCFG_HADE;
 +    bool adue = env->menvcfg & MENVCFG_ADUE;
      if (first_stage && two_stage && env->virt_enabled) {
          pbmte = pbmte && (env->henvcfg & HENVCFG_PBMTE);
 -        hade = hade && (env->henvcfg & HENVCFG_HADE);
 +        adue = adue && (env->henvcfg & HENVCFG_ADUE);
      }
      int ptshift = (levels - 1) * ptidxbits;
@@ -XXX,XX +XXX,XX @@ restart:
      /* Page table updates need to be atomic with MTTCG enabled */
      if (updated_pte != pte && !is_debug) {
 -        if (!hade) {
 +        if (!adue) {
              return TRANSLATE_FAIL;
          }
 diff --git a/target/riscv/csr.c b/target/riscv/csr.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/csr.c
 +++ b/target/riscv/csr.c
-@@ -XXX,XX +XXX,XX @@ void riscv_set_csr_ops(int csrno, riscv_csr_operations *ops)
+@@ -XXX,XX +XXX,XX @@ static RISCVException write_menvcfg(CPURISCVState *env, int csrno,
- static int fs(CPURISCVState *env, int csrno)
+     if (riscv_cpu_mxl(env) == MXL_RV64) {
          mask |= (cfg->ext_svpbmt ? MENVCFG_PBMTE : 0) |
                  (cfg->ext_sstc ? MENVCFG_STCE : 0) |
 -                (cfg->ext_svadu ? MENVCFG_HADE : 0);
 +                (cfg->ext_svadu ? MENVCFG_ADUE : 0);
      }
      env->menvcfg = (env->menvcfg & ~mask) | (val & mask);
@@ -XXX,XX +XXX,XX @@ static RISCVException write_menvcfgh(CPURISCVState *env, int csrno,
      const RISCVCPUConfig *cfg = riscv_cpu_cfg(env);
      uint64_t mask = (cfg->ext_svpbmt ? MENVCFG_PBMTE : 0) |
                      (cfg->ext_sstc ? MENVCFG_STCE : 0) |
 -                    (cfg->ext_svadu ? MENVCFG_HADE : 0);
 +                    (cfg->ext_svadu ? MENVCFG_ADUE : 0);
      uint64_t valh = (uint64_t)val << 32;
      env->menvcfg = (env->menvcfg & ~mask) | (valh & mask);
@@ -XXX,XX +XXX,XX @@ static RISCVException read_henvcfg(CPURISCVState *env, int csrno,
       * henvcfg.stce is read_only 0 when menvcfg.stce = 0
       * henvcfg.hade is read_only 0 when menvcfg.hade = 0
       */
 -    *val = env->henvcfg & (~(HENVCFG_PBMTE | HENVCFG_STCE | HENVCFG_HADE) |
 +    *val = env->henvcfg & (~(HENVCFG_PBMTE | HENVCFG_STCE | HENVCFG_ADUE) |
                             env->menvcfg);
      return RISCV_EXCP_NONE;
  }
@@ -XXX,XX +XXX,XX @@ static RISCVException write_henvcfg(CPURISCVState *env, int csrno,
      }
      if (riscv_cpu_mxl(env) == MXL_RV64) {
 -        mask |= env->menvcfg & (HENVCFG_PBMTE | HENVCFG_STCE | HENVCFG_HADE);
 +        mask |= env->menvcfg & (HENVCFG_PBMTE | HENVCFG_STCE | HENVCFG_ADUE);
      }
      env->henvcfg = (env->henvcfg & ~mask) | (val & mask);
@@ -XXX,XX +XXX,XX @@ static RISCVException read_henvcfgh(CPURISCVState *env, int csrno,
          return ret;
      }
 -    *val = (env->henvcfg & (~(HENVCFG_PBMTE | HENVCFG_STCE | HENVCFG_HADE) |
 +    *val = (env->henvcfg & (~(HENVCFG_PBMTE | HENVCFG_STCE | HENVCFG_ADUE) |
                              env->menvcfg)) >> 32;
      return RISCV_EXCP_NONE;
  }
@@ -XXX,XX +XXX,XX @@ static RISCVException write_henvcfgh(CPURISCVState *env, int csrno,
                                       target_ulong val)
  {
- #if !defined(CONFIG_USER_ONLY)
+     uint64_t mask = env->menvcfg & (HENVCFG_PBMTE | HENVCFG_STCE |
-+    /* loose check condition for fcsr in vector extension */
+-                                    HENVCFG_HADE);
-+    if ((csrno == CSR_FCSR) && (env->misa & RVV)) {
++                                    HENVCFG_ADUE);
-+        return 0;
+     uint64_t valh = (uint64_t)val << 32;
-+    }
+     RISCVException ret;
-     if (!env->debugger && !riscv_cpu_fp_enabled(env)) {
          return -1;
      }
@@ -XXX,XX +XXX,XX @@ static int fs(CPURISCVState *env, int csrno)
      return 0;
  }
 +static int vs(CPURISCVState *env, int csrno)
 +{
 +    if (env->misa & RVV) {
 +        return 0;
 +    }
 +    return -1;
 +}
 +
  static int ctr(CPURISCVState *env, int csrno)
  {
  #if !defined(CONFIG_USER_ONLY)
@@ -XXX,XX +XXX,XX @@ static int read_fcsr(CPURISCVState *env, int csrno, target_ulong *val)
  #endif
      *val = (riscv_cpu_get_fflags(env) << FSR_AEXC_SHIFT)
          | (env->frm << FSR_RD_SHIFT);
 +    if (vs(env, csrno) >= 0) {
 +        *val |= (env->vxrm << FSR_VXRM_SHIFT)
 +                | (env->vxsat << FSR_VXSAT_SHIFT);
 +    }
      return 0;
  }
@@ -XXX,XX +XXX,XX @@ static int write_fcsr(CPURISCVState *env, int csrno, target_ulong val)
      env->mstatus |= MSTATUS_FS;
  #endif
      env->frm = (val & FSR_RD) >> FSR_RD_SHIFT;
 +    if (vs(env, csrno) >= 0) {
 +        env->vxrm = (val & FSR_VXRM) >> FSR_VXRM_SHIFT;
 +        env->vxsat = (val & FSR_VXSAT) >> FSR_VXSAT_SHIFT;
 +    }
      riscv_cpu_set_fflags(env, (val & FSR_AEXC) >> FSR_AEXC_SHIFT);
      return 0;
  }
 +static int read_vtype(CPURISCVState *env, int csrno, target_ulong *val)
 +{
 +    *val = env->vtype;
 +    return 0;
 +}
 +
 +static int read_vl(CPURISCVState *env, int csrno, target_ulong *val)
 +{
 +    *val = env->vl;
 +    return 0;
 +}
 +
 +static int read_vxrm(CPURISCVState *env, int csrno, target_ulong *val)
 +{
 +    *val = env->vxrm;
 +    return 0;
 +}
 +
 +static int write_vxrm(CPURISCVState *env, int csrno, target_ulong val)
 +{
 +    env->vxrm = val;
 +    return 0;
 +}
 +
 +static int read_vxsat(CPURISCVState *env, int csrno, target_ulong *val)
 +{
 +    *val = env->vxsat;
 +    return 0;
 +}
 +
 +static int write_vxsat(CPURISCVState *env, int csrno, target_ulong val)
 +{
 +    env->vxsat = val;
 +    return 0;
 +}
 +
 +static int read_vstart(CPURISCVState *env, int csrno, target_ulong *val)
 +{
 +    *val = env->vstart;
 +    return 0;
 +}
 +
 +static int write_vstart(CPURISCVState *env, int csrno, target_ulong val)
 +{
 +    env->vstart = val;
 +    return 0;
 +}
 +
  /* User Timers and Counters */
  static int read_instret(CPURISCVState *env, int csrno, target_ulong *val)
  {
@@ -XXX,XX +XXX,XX @@ static riscv_csr_operations csr_ops[CSR_TABLE_SIZE] = {
      [CSR_FFLAGS] =              { fs,   read_fflags,      write_fflags      },
      [CSR_FRM] =                 { fs,   read_frm,         write_frm         },
      [CSR_FCSR] =                { fs,   read_fcsr,        write_fcsr        },
 -
 +    /* Vector CSRs */
 +    [CSR_VSTART] =              { vs,   read_vstart,      write_vstart      },
 +    [CSR_VXSAT] =               { vs,   read_vxsat,       write_vxsat       },
 +    [CSR_VXRM] =                { vs,   read_vxrm,        write_vxrm        },
 +    [CSR_VL] =                  { vs,   read_vl                             },
 +    [CSR_VTYPE] =               { vs,   read_vtype                          },
      /* User Timers and Counters */
      [CSR_CYCLE] =               { ctr,  read_instret                        },
      [CSR_INSTRET] =             { ctr,  read_instret                        },
 --
-.27.0
+.41.0

-[PULL 26/63] target/riscv: vector single-width saturating add and subtract
+[PULL v2 36/45] target/riscv: fix satp_mode_finalize() when satp_mode.supported = 0
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+In the same emulated RISC-V host, the 'host' KVM CPU takes 4 times
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+longer to boot than the 'rv64' KVM CPU.
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-25-zhiwei_liu@c-sky.com
+The reason is an unintended behavior of riscv_cpu_satp_mode_finalize()
 when satp_mode.supported = 0, i.e. when cpu_init() does not set
 satp_mode_max_supported(). satp_mode_max_from_map(map) does:
 - __builtin_clz(map)
 This means that, if satp_mode.supported = 0, satp_mode_supported_max
 wil be '31 - 32'. But this is C, so satp_mode_supported_max will gladly
 set it to UINT_MAX (4294967295). After that, if the user didn't set a
 satp_mode, set_satp_mode_default_map(cpu) will make
 cfg.satp_mode.map = cfg.satp_mode.supported
 So satp_mode.map = 0. And then satp_mode_map_max will be set to
 satp_mode_max_from_map(cpu->cfg.satp_mode.map), i.e. also UINT_MAX. The
 guard "satp_mode_map_max > satp_mode_supported_max" doesn't protect us
 here since both are UINT_MAX.
 And finally we have 2 loops:
         for (int i = satp_mode_map_max - 1; i >= 0; --i) {
 Which are, in fact, 2 loops from UINT_MAX -1 to -1. This is where the
 extra delay when booting the 'host' CPU is coming from.
 Commit 43d1de32f8 already set a precedence for satp_mode.supported = 0
 in a different manner. We're doing the same here. If supported == 0,
 interpret as 'the CPU wants the OS to handle satp mode alone' and skip
 satp_mode_finalize().
 We'll also put a guard in satp_mode_max_from_map() to assert out if map
 is 0 since the function is not ready to deal with it.
 Cc: Alexandre Ghiti <alexghiti@rivosinc.com>
 Fixes: 6f23aaeb9b ("riscv: Allow user to set the satp mode")
 Signed-off-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 Reviewed-by: Andrew Jones <ajones@ventanamicro.com>
 Message-ID: <20230817152903.694926-1-dbarboza@ventanamicro.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   |  33 ++
+ target/riscv/cpu.c | 23 ++++++++++++++++++++---
- target/riscv/insn32.decode              |  10 +
+file changed, 20 insertions(+), 3 deletions(-)
  target/riscv/insn_trans/trans_rvv.inc.c |  16 +
  target/riscv/vector_helper.c            | 385 ++++++++++++++++++++++++
 files changed, 444 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/target/riscv/cpu.c
-+++ b/target/riscv/helper.h
++++ b/target/riscv/cpu.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_4(vmv_v_x_b, void, ptr, i64, env, i32)
+@@ -XXX,XX +XXX,XX @@ static uint8_t satp_mode_from_str(const char *satp_mode_str)
- DEF_HELPER_4(vmv_v_x_h, void, ptr, i64, env, i32)
- DEF_HELPER_4(vmv_v_x_w, void, ptr, i64, env, i32)
+ uint8_t satp_mode_max_from_map(uint32_t map)
- DEF_HELPER_4(vmv_v_x_d, void, ptr, i64, env, i32)
+ {
 +    /*
 +     * 'map = 0' will make us return (31 - 32), which C will
 +     * happily overflow to UINT_MAX. There's no good result to
 +     * return if 'map = 0' (e.g. returning 0 will be ambiguous
 +     * with the result for 'map = 1').
 +     *
 +     * Assert out if map = 0. Callers will have to deal with
 +     * it outside of this function.
 +     */
 +    g_assert(map > 0);
 +
-+DEF_HELPER_6(vsaddu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
+     /* map here has at least one bit set, so no problem with clz */
-+DEF_HELPER_6(vsaddu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
+     return 31 - __builtin_clz(map);
-+DEF_HELPER_6(vsaddu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
+ }
-+DEF_HELPER_6(vsaddu_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ void riscv_cpu_validate_set_extensions(RISCVCPU *cpu, Error **errp)
-+DEF_HELPER_6(vsadd_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
+ static void riscv_cpu_satp_mode_finalize(RISCVCPU *cpu, Error **errp)
-+DEF_HELPER_6(vsadd_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
+ {
-+DEF_HELPER_6(vsadd_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
+     bool rv32 = riscv_cpu_mxl(&cpu->env) == MXL_RV32;
-+DEF_HELPER_6(vsadd_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
+-    uint8_t satp_mode_map_max;
-+DEF_HELPER_6(vssubu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
+-    uint8_t satp_mode_supported_max =
-+DEF_HELPER_6(vssubu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
+-                        satp_mode_max_from_map(cpu->cfg.satp_mode.supported);
-+DEF_HELPER_6(vssubu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++    uint8_t satp_mode_map_max, satp_mode_supported_max;
 +DEF_HELPER_6(vssubu_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vssub_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vssub_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vssub_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vssub_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vsaddu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsaddu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsaddu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsaddu_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsadd_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsadd_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsadd_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vsadd_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vssubu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vssubu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vssubu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vssubu_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vssub_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vssub_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vssub_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vssub_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@ vmv_v_i         010111 1 00000 ..... 011 ..... 1010111 @r2
  vmerge_vvm      010111 0 ..... ..... 000 ..... 1010111 @r_vm_0
  vmerge_vxm      010111 0 ..... ..... 100 ..... 1010111 @r_vm_0
  vmerge_vim      010111 0 ..... ..... 011 ..... 1010111 @r_vm_0
 +vsaddu_vv       100000 . ..... ..... 000 ..... 1010111 @r_vm
 +vsaddu_vx       100000 . ..... ..... 100 ..... 1010111 @r_vm
 +vsaddu_vi       100000 . ..... ..... 011 ..... 1010111 @r_vm
 +vsadd_vv        100001 . ..... ..... 000 ..... 1010111 @r_vm
 +vsadd_vx        100001 . ..... ..... 100 ..... 1010111 @r_vm
 +vsadd_vi        100001 . ..... ..... 011 ..... 1010111 @r_vm
 +vssubu_vv       100010 . ..... ..... 000 ..... 1010111 @r_vm
 +vssubu_vx       100010 . ..... ..... 100 ..... 1010111 @r_vm
 +vssub_vv        100011 . ..... ..... 000 ..... 1010111 @r_vm
 +vssub_vx        100011 . ..... ..... 100 ..... 1010111 @r_vm
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ static bool trans_vmv_v_i(DisasContext *s, arg_vmv_v_i *a)
  GEN_OPIVV_TRANS(vmerge_vvm, opivv_vadc_check)
  GEN_OPIVX_TRANS(vmerge_vxm, opivx_vadc_check)
  GEN_OPIVI_TRANS(vmerge_vim, 0, vmerge_vxm, opivx_vadc_check)
 +
-+/*
++    /* The CPU wants the OS to decide which satp mode to use */
-+ *** Vector Fixed-Point Arithmetic Instructions
++    if (cpu->cfg.satp_mode.supported == 0) {
-+ */
++        return;
 +
 +/* Vector Single-Width Saturating Add and Subtract */
 +GEN_OPIVV_TRANS(vsaddu_vv, opivv_check)
 +GEN_OPIVV_TRANS(vsadd_vv,  opivv_check)
 +GEN_OPIVV_TRANS(vssubu_vv, opivv_check)
 +GEN_OPIVV_TRANS(vssub_vv,  opivv_check)
 +GEN_OPIVX_TRANS(vsaddu_vx,  opivx_check)
 +GEN_OPIVX_TRANS(vsadd_vx,  opivx_check)
 +GEN_OPIVX_TRANS(vssubu_vx,  opivx_check)
 +GEN_OPIVX_TRANS(vssub_vx,  opivx_check)
 +GEN_OPIVI_TRANS(vsaddu_vi, 1, vsaddu_vx, opivx_check)
 +GEN_OPIVI_TRANS(vsadd_vi, 0, vsadd_vx, opivx_check)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VMERGE_VX(vmerge_vxm_b, int8_t,  H1, clearb)
  GEN_VEXT_VMERGE_VX(vmerge_vxm_h, int16_t, H2, clearh)
  GEN_VEXT_VMERGE_VX(vmerge_vxm_w, int32_t, H4, clearl)
  GEN_VEXT_VMERGE_VX(vmerge_vxm_d, int64_t, H8, clearq)
 +
 +/*
 + *** Vector Fixed-Point Arithmetic Instructions
 + */
 +
 +/* Vector Single-Width Saturating Add and Subtract */
 +
 +/*
 + * As fixed point instructions probably have round mode and saturation,
 + * define common macros for fixed point here.
 + */
 +typedef void opivv2_rm_fn(void *vd, void *vs1, void *vs2, int i,
 +                          CPURISCVState *env, int vxrm);
 +
 +#define OPIVV2_RM(NAME, TD, T1, T2, TX1, TX2, HD, HS1, HS2, OP)     \
 +static inline void                                                  \
 +do_##NAME(void *vd, void *vs1, void *vs2, int i,                    \
 +          CPURISCVState *env, int vxrm)                             \
 +{                                                                   \
 +    TX1 s1 = *((T1 *)vs1 + HS1(i));                                 \
 +    TX2 s2 = *((T2 *)vs2 + HS2(i));                                 \
 +    *((TD *)vd + HD(i)) = OP(env, vxrm, s2, s1);                    \
 +}
 +
 +static inline void
 +vext_vv_rm_1(void *vd, void *v0, void *vs1, void *vs2,
 +             CPURISCVState *env,
 +             uint32_t vl, uint32_t vm, uint32_t mlen, int vxrm,
 +             opivv2_rm_fn *fn)
 +{
 +    for (uint32_t i = 0; i < vl; i++) {
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {
 +            continue;
 +        }
 +        fn(vd, vs1, vs2, i, env, vxrm);
 +    }
 +}
 +
 +static inline void
 +vext_vv_rm_2(void *vd, void *v0, void *vs1, void *vs2,
 +             CPURISCVState *env,
 +             uint32_t desc, uint32_t esz, uint32_t dsz,
 +             opivv2_rm_fn *fn, clear_fn *clearfn)
 +{
 +    uint32_t vlmax = vext_maxsz(desc) / esz;
 +    uint32_t mlen = vext_mlen(desc);
 +    uint32_t vm = vext_vm(desc);
 +    uint32_t vl = env->vl;
 +
 +    switch (env->vxrm) {
 +    case 0: /* rnu */
 +        vext_vv_rm_1(vd, v0, vs1, vs2,
 +                     env, vl, vm, mlen, 0, fn);
 +        break;
 +    case 1: /* rne */
 +        vext_vv_rm_1(vd, v0, vs1, vs2,
 +                     env, vl, vm, mlen, 1, fn);
 +        break;
 +    case 2: /* rdn */
 +        vext_vv_rm_1(vd, v0, vs1, vs2,
 +                     env, vl, vm, mlen, 2, fn);
 +        break;
 +    default: /* rod */
 +        vext_vv_rm_1(vd, v0, vs1, vs2,
 +                     env, vl, vm, mlen, 3, fn);
 +        break;
 +    }
 +
-+    clearfn(vd, vl, vl * dsz,  vlmax * dsz);
++    satp_mode_supported_max =
-+}
++                    satp_mode_max_from_map(cpu->cfg.satp_mode.supported);
-+
-+/* generate helpers for fixed point instructions with OPIVV format */
+     if (cpu->cfg.satp_mode.map == 0) {
-+#define GEN_VEXT_VV_RM(NAME, ESZ, DSZ, CLEAR_FN)                \
+         if (cpu->cfg.satp_mode.init == 0) {
 +void HELPER(NAME)(void *vd, void *v0, void *vs1, void *vs2,     \
 +                  CPURISCVState *env, uint32_t desc)            \
 +{                                                               \
 +    vext_vv_rm_2(vd, v0, vs1, vs2, env, desc, ESZ, DSZ,         \
 +                 do_##NAME, CLEAR_FN);                          \
 +}
 +
 +static inline uint8_t saddu8(CPURISCVState *env, int vxrm, uint8_t a, uint8_t b)
 +{
 +    uint8_t res = a + b;
 +    if (res < a) {
 +        res = UINT8_MAX;
 +        env->vxsat = 0x1;
 +    }
 +    return res;
 +}
 +
 +static inline uint16_t saddu16(CPURISCVState *env, int vxrm, uint16_t a,
 +                               uint16_t b)
 +{
 +    uint16_t res = a + b;
 +    if (res < a) {
 +        res = UINT16_MAX;
 +        env->vxsat = 0x1;
 +    }
 +    return res;
 +}
 +
 +static inline uint32_t saddu32(CPURISCVState *env, int vxrm, uint32_t a,
 +                               uint32_t b)
 +{
 +    uint32_t res = a + b;
 +    if (res < a) {
 +        res = UINT32_MAX;
 +        env->vxsat = 0x1;
 +    }
 +    return res;
 +}
 +
 +static inline uint64_t saddu64(CPURISCVState *env, int vxrm, uint64_t a,
 +                               uint64_t b)
 +{
 +    uint64_t res = a + b;
 +    if (res < a) {
 +        res = UINT64_MAX;
 +        env->vxsat = 0x1;
 +    }
 +    return res;
 +}
 +
 +RVVCALL(OPIVV2_RM, vsaddu_vv_b, OP_UUU_B, H1, H1, H1, saddu8)
 +RVVCALL(OPIVV2_RM, vsaddu_vv_h, OP_UUU_H, H2, H2, H2, saddu16)
 +RVVCALL(OPIVV2_RM, vsaddu_vv_w, OP_UUU_W, H4, H4, H4, saddu32)
 +RVVCALL(OPIVV2_RM, vsaddu_vv_d, OP_UUU_D, H8, H8, H8, saddu64)
 +GEN_VEXT_VV_RM(vsaddu_vv_b, 1, 1, clearb)
 +GEN_VEXT_VV_RM(vsaddu_vv_h, 2, 2, clearh)
 +GEN_VEXT_VV_RM(vsaddu_vv_w, 4, 4, clearl)
 +GEN_VEXT_VV_RM(vsaddu_vv_d, 8, 8, clearq)
 +
 +typedef void opivx2_rm_fn(void *vd, target_long s1, void *vs2, int i,
 +                          CPURISCVState *env, int vxrm);
 +
 +#define OPIVX2_RM(NAME, TD, T1, T2, TX1, TX2, HD, HS2, OP)          \
 +static inline void                                                  \
 +do_##NAME(void *vd, target_long s1, void *vs2, int i,               \
 +          CPURISCVState *env, int vxrm)                             \
 +{                                                                   \
 +    TX2 s2 = *((T2 *)vs2 + HS2(i));                                 \
 +    *((TD *)vd + HD(i)) = OP(env, vxrm, s2, (TX1)(T1)s1);           \
 +}
 +
 +static inline void
 +vext_vx_rm_1(void *vd, void *v0, target_long s1, void *vs2,
 +             CPURISCVState *env,
 +             uint32_t vl, uint32_t vm, uint32_t mlen, int vxrm,
 +             opivx2_rm_fn *fn)
 +{
 +    for (uint32_t i = 0; i < vl; i++) {
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {
 +            continue;
 +        }
 +        fn(vd, s1, vs2, i, env, vxrm);
 +    }
 +}
 +
 +static inline void
 +vext_vx_rm_2(void *vd, void *v0, target_long s1, void *vs2,
 +             CPURISCVState *env,
 +             uint32_t desc, uint32_t esz, uint32_t dsz,
 +             opivx2_rm_fn *fn, clear_fn *clearfn)
 +{
 +    uint32_t vlmax = vext_maxsz(desc) / esz;
 +    uint32_t mlen = vext_mlen(desc);
 +    uint32_t vm = vext_vm(desc);
 +    uint32_t vl = env->vl;
 +
 +    switch (env->vxrm) {
 +    case 0: /* rnu */
 +        vext_vx_rm_1(vd, v0, s1, vs2,
 +                     env, vl, vm, mlen, 0, fn);
 +        break;
 +    case 1: /* rne */
 +        vext_vx_rm_1(vd, v0, s1, vs2,
 +                     env, vl, vm, mlen, 1, fn);
 +        break;
 +    case 2: /* rdn */
 +        vext_vx_rm_1(vd, v0, s1, vs2,
 +                     env, vl, vm, mlen, 2, fn);
 +        break;
 +    default: /* rod */
 +        vext_vx_rm_1(vd, v0, s1, vs2,
 +                     env, vl, vm, mlen, 3, fn);
 +        break;
 +    }
 +
 +    clearfn(vd, vl, vl * dsz,  vlmax * dsz);
 +}
 +
 +/* generate helpers for fixed point instructions with OPIVX format */
 +#define GEN_VEXT_VX_RM(NAME, ESZ, DSZ, CLEAR_FN)          \
 +void HELPER(NAME)(void *vd, void *v0, target_ulong s1,    \
 +        void *vs2, CPURISCVState *env, uint32_t desc)     \
 +{                                                         \
 +    vext_vx_rm_2(vd, v0, s1, vs2, env, desc, ESZ, DSZ,    \
 +                 do_##NAME, CLEAR_FN);                    \
 +}
 +
 +RVVCALL(OPIVX2_RM, vsaddu_vx_b, OP_UUU_B, H1, H1, saddu8)
 +RVVCALL(OPIVX2_RM, vsaddu_vx_h, OP_UUU_H, H2, H2, saddu16)
 +RVVCALL(OPIVX2_RM, vsaddu_vx_w, OP_UUU_W, H4, H4, saddu32)
 +RVVCALL(OPIVX2_RM, vsaddu_vx_d, OP_UUU_D, H8, H8, saddu64)
 +GEN_VEXT_VX_RM(vsaddu_vx_b, 1, 1, clearb)
 +GEN_VEXT_VX_RM(vsaddu_vx_h, 2, 2, clearh)
 +GEN_VEXT_VX_RM(vsaddu_vx_w, 4, 4, clearl)
 +GEN_VEXT_VX_RM(vsaddu_vx_d, 8, 8, clearq)
 +
 +static inline int8_t sadd8(CPURISCVState *env, int vxrm, int8_t a, int8_t b)
 +{
 +    int8_t res = a + b;
 +    if ((res ^ a) & (res ^ b) & INT8_MIN) {
 +        res = a > 0 ? INT8_MAX : INT8_MIN;
 +        env->vxsat = 0x1;
 +    }
 +    return res;
 +}
 +
 +static inline int16_t sadd16(CPURISCVState *env, int vxrm, int16_t a, int16_t b)
 +{
 +    int16_t res = a + b;
 +    if ((res ^ a) & (res ^ b) & INT16_MIN) {
 +        res = a > 0 ? INT16_MAX : INT16_MIN;
 +        env->vxsat = 0x1;
 +    }
 +    return res;
 +}
 +
 +static inline int32_t sadd32(CPURISCVState *env, int vxrm, int32_t a, int32_t b)
 +{
 +    int32_t res = a + b;
 +    if ((res ^ a) & (res ^ b) & INT32_MIN) {
 +        res = a > 0 ? INT32_MAX : INT32_MIN;
 +        env->vxsat = 0x1;
 +    }
 +    return res;
 +}
 +
 +static inline int64_t sadd64(CPURISCVState *env, int vxrm, int64_t a, int64_t b)
 +{
 +    int64_t res = a + b;
 +    if ((res ^ a) & (res ^ b) & INT64_MIN) {
 +        res = a > 0 ? INT64_MAX : INT64_MIN;
 +        env->vxsat = 0x1;
 +    }
 +    return res;
 +}
 +
 +RVVCALL(OPIVV2_RM, vsadd_vv_b, OP_SSS_B, H1, H1, H1, sadd8)
 +RVVCALL(OPIVV2_RM, vsadd_vv_h, OP_SSS_H, H2, H2, H2, sadd16)
 +RVVCALL(OPIVV2_RM, vsadd_vv_w, OP_SSS_W, H4, H4, H4, sadd32)
 +RVVCALL(OPIVV2_RM, vsadd_vv_d, OP_SSS_D, H8, H8, H8, sadd64)
 +GEN_VEXT_VV_RM(vsadd_vv_b, 1, 1, clearb)
 +GEN_VEXT_VV_RM(vsadd_vv_h, 2, 2, clearh)
 +GEN_VEXT_VV_RM(vsadd_vv_w, 4, 4, clearl)
 +GEN_VEXT_VV_RM(vsadd_vv_d, 8, 8, clearq)
 +
 +RVVCALL(OPIVX2_RM, vsadd_vx_b, OP_SSS_B, H1, H1, sadd8)
 +RVVCALL(OPIVX2_RM, vsadd_vx_h, OP_SSS_H, H2, H2, sadd16)
 +RVVCALL(OPIVX2_RM, vsadd_vx_w, OP_SSS_W, H4, H4, sadd32)
 +RVVCALL(OPIVX2_RM, vsadd_vx_d, OP_SSS_D, H8, H8, sadd64)
 +GEN_VEXT_VX_RM(vsadd_vx_b, 1, 1, clearb)
 +GEN_VEXT_VX_RM(vsadd_vx_h, 2, 2, clearh)
 +GEN_VEXT_VX_RM(vsadd_vx_w, 4, 4, clearl)
 +GEN_VEXT_VX_RM(vsadd_vx_d, 8, 8, clearq)
 +
 +static inline uint8_t ssubu8(CPURISCVState *env, int vxrm, uint8_t a, uint8_t b)
 +{
 +    uint8_t res = a - b;
 +    if (res > a) {
 +        res = 0;
 +        env->vxsat = 0x1;
 +    }
 +    return res;
 +}
 +
 +static inline uint16_t ssubu16(CPURISCVState *env, int vxrm, uint16_t a,
 +                               uint16_t b)
 +{
 +    uint16_t res = a - b;
 +    if (res > a) {
 +        res = 0;
 +        env->vxsat = 0x1;
 +    }
 +    return res;
 +}
 +
 +static inline uint32_t ssubu32(CPURISCVState *env, int vxrm, uint32_t a,
 +                               uint32_t b)
 +{
 +    uint32_t res = a - b;
 +    if (res > a) {
 +        res = 0;
 +        env->vxsat = 0x1;
 +    }
 +    return res;
 +}
 +
 +static inline uint64_t ssubu64(CPURISCVState *env, int vxrm, uint64_t a,
 +                               uint64_t b)
 +{
 +    uint64_t res = a - b;
 +    if (res > a) {
 +        res = 0;
 +        env->vxsat = 0x1;
 +    }
 +    return res;
 +}
 +
 +RVVCALL(OPIVV2_RM, vssubu_vv_b, OP_UUU_B, H1, H1, H1, ssubu8)
 +RVVCALL(OPIVV2_RM, vssubu_vv_h, OP_UUU_H, H2, H2, H2, ssubu16)
 +RVVCALL(OPIVV2_RM, vssubu_vv_w, OP_UUU_W, H4, H4, H4, ssubu32)
 +RVVCALL(OPIVV2_RM, vssubu_vv_d, OP_UUU_D, H8, H8, H8, ssubu64)
 +GEN_VEXT_VV_RM(vssubu_vv_b, 1, 1, clearb)
 +GEN_VEXT_VV_RM(vssubu_vv_h, 2, 2, clearh)
 +GEN_VEXT_VV_RM(vssubu_vv_w, 4, 4, clearl)
 +GEN_VEXT_VV_RM(vssubu_vv_d, 8, 8, clearq)
 +
 +RVVCALL(OPIVX2_RM, vssubu_vx_b, OP_UUU_B, H1, H1, ssubu8)
 +RVVCALL(OPIVX2_RM, vssubu_vx_h, OP_UUU_H, H2, H2, ssubu16)
 +RVVCALL(OPIVX2_RM, vssubu_vx_w, OP_UUU_W, H4, H4, ssubu32)
 +RVVCALL(OPIVX2_RM, vssubu_vx_d, OP_UUU_D, H8, H8, ssubu64)
 +GEN_VEXT_VX_RM(vssubu_vx_b, 1, 1, clearb)
 +GEN_VEXT_VX_RM(vssubu_vx_h, 2, 2, clearh)
 +GEN_VEXT_VX_RM(vssubu_vx_w, 4, 4, clearl)
 +GEN_VEXT_VX_RM(vssubu_vx_d, 8, 8, clearq)
 +
 +static inline int8_t ssub8(CPURISCVState *env, int vxrm, int8_t a, int8_t b)
 +{
 +    int8_t res = a - b;
 +    if ((res ^ a) & (a ^ b) & INT8_MIN) {
 +        res = a > 0 ? INT8_MAX : INT8_MIN;
 +        env->vxsat = 0x1;
 +    }
 +    return res;
 +}
 +
 +static inline int16_t ssub16(CPURISCVState *env, int vxrm, int16_t a, int16_t b)
 +{
 +    int16_t res = a - b;
 +    if ((res ^ a) & (a ^ b) & INT16_MIN) {
 +        res = a > 0 ? INT16_MAX : INT16_MIN;
 +        env->vxsat = 0x1;
 +    }
 +    return res;
 +}
 +
 +static inline int32_t ssub32(CPURISCVState *env, int vxrm, int32_t a, int32_t b)
 +{
 +    int32_t res = a - b;
 +    if ((res ^ a) & (a ^ b) & INT32_MIN) {
 +        res = a > 0 ? INT32_MAX : INT32_MIN;
 +        env->vxsat = 0x1;
 +    }
 +    return res;
 +}
 +
 +static inline int64_t ssub64(CPURISCVState *env, int vxrm, int64_t a, int64_t b)
 +{
 +    int64_t res = a - b;
 +    if ((res ^ a) & (a ^ b) & INT64_MIN) {
 +        res = a > 0 ? INT64_MAX : INT64_MIN;
 +        env->vxsat = 0x1;
 +    }
 +    return res;
 +}
 +
 +RVVCALL(OPIVV2_RM, vssub_vv_b, OP_SSS_B, H1, H1, H1, ssub8)
 +RVVCALL(OPIVV2_RM, vssub_vv_h, OP_SSS_H, H2, H2, H2, ssub16)
 +RVVCALL(OPIVV2_RM, vssub_vv_w, OP_SSS_W, H4, H4, H4, ssub32)
 +RVVCALL(OPIVV2_RM, vssub_vv_d, OP_SSS_D, H8, H8, H8, ssub64)
 +GEN_VEXT_VV_RM(vssub_vv_b, 1, 1, clearb)
 +GEN_VEXT_VV_RM(vssub_vv_h, 2, 2, clearh)
 +GEN_VEXT_VV_RM(vssub_vv_w, 4, 4, clearl)
 +GEN_VEXT_VV_RM(vssub_vv_d, 8, 8, clearq)
 +
 +RVVCALL(OPIVX2_RM, vssub_vx_b, OP_SSS_B, H1, H1, ssub8)
 +RVVCALL(OPIVX2_RM, vssub_vx_h, OP_SSS_H, H2, H2, ssub16)
 +RVVCALL(OPIVX2_RM, vssub_vx_w, OP_SSS_W, H4, H4, ssub32)
 +RVVCALL(OPIVX2_RM, vssub_vx_d, OP_SSS_D, H8, H8, ssub64)
 +GEN_VEXT_VX_RM(vssub_vx_b, 1, 1, clearb)
 +GEN_VEXT_VX_RM(vssub_vx_h, 2, 2, clearh)
 +GEN_VEXT_VX_RM(vssub_vx_w, 4, 4, clearl)
 +GEN_VEXT_VX_RM(vssub_vx_d, 8, 8, clearq)
 --
-.27.0
+.41.0

-[PULL 04/63] target/riscv: implementation-defined constant parameters
+[PULL v2 37/45] riscv: zicond: make non-experimental
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Vineet Gupta <vineetg@rivosinc.com>
-vlen is the vector register length in bits.
+zicond is now codegen supported in both llvm and gcc.
 elen is the max element size in bits.
 vext_spec is the vector specification version, default value is v0.7.1.
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+This change allows seamless enabling/testing of zicond in downstream
 projects. e.g. currently riscv-gnu-toolchain parses elf attributes
 to create a cmdline for qemu but fails short of enabling it because of
 the "x-" prefix.
 Signed-off-by: Vineet Gupta <vineetg@rivosinc.com>
 Message-ID: <20230808181715.436395-1-vineetg@rivosinc.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200623215920.2594-3-zhiwei_liu@c-sky.com
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/cpu.h | 5 +++++
+ target/riscv/cpu.c | 2 +-
- target/riscv/cpu.c | 7 +++++++
+file changed, 1 insertion(+), 1 deletion(-)
 files changed, 12 insertions(+)
-diff --git a/target/riscv/cpu.h b/target/riscv/cpu.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/cpu.h
-+++ b/target/riscv/cpu.h
-@@ -XXX,XX +XXX,XX @@ enum {
- #define PRIV_VERSION_1_10_0 0x00011000
- #define PRIV_VERSION_1_11_0 0x00011100
-+#define VEXT_VERSION_0_07_1 0x00000701
-+
- #define TRANSLATE_PMP_FAIL 2
- #define TRANSLATE_FAIL 1
- #define TRANSLATE_SUCCESS 0
-@@ -XXX,XX +XXX,XX @@ struct CPURISCVState {
-     target_ulong guest_phys_fault_addr;
-     target_ulong priv_ver;
-+    target_ulong vext_ver;
-     target_ulong misa;
-     target_ulong misa_mask;
-@@ -XXX,XX +XXX,XX @@ typedef struct RISCVCPU {
-         char *priv_spec;
-         char *user_spec;
-+        uint16_t vlen;
-+        uint16_t elen;
-         bool mmu;
-         bool pmp;
-     } cfg;
 diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/cpu.c
 +++ b/target/riscv/cpu.c
-@@ -XXX,XX +XXX,XX @@ static void set_priv_version(CPURISCVState *env, int priv_ver)
+@@ -XXX,XX +XXX,XX @@ static Property riscv_cpu_extensions[] = {
-     env->priv_ver = priv_ver;
+     DEFINE_PROP_BOOL("zcf", RISCVCPU, cfg.ext_zcf, false),
- }
+     DEFINE_PROP_BOOL("zcmp", RISCVCPU, cfg.ext_zcmp, false),
+     DEFINE_PROP_BOOL("zcmt", RISCVCPU, cfg.ext_zcmt, false),
-+static void set_vext_version(CPURISCVState *env, int vext_ver)
++    DEFINE_PROP_BOOL("zicond", RISCVCPU, cfg.ext_zicond, false),
-+{
-+    env->vext_ver = vext_ver;
+     /* Vendor-specific custom extensions */
-+}
+     DEFINE_PROP_BOOL("xtheadba", RISCVCPU, cfg.ext_xtheadba, false),
-+
+@@ -XXX,XX +XXX,XX @@ static Property riscv_cpu_extensions[] = {
- static void set_feature(CPURISCVState *env, int feature)
+     DEFINE_PROP_BOOL("xventanacondops", RISCVCPU, cfg.ext_XVentanaCondOps, false),
- {
-     env->features |= (1ULL << feature);
+     /* These are experimental so mark with 'x-' */
-@@ -XXX,XX +XXX,XX @@ static void riscv_cpu_realize(DeviceState *dev, Error **errp)
+-    DEFINE_PROP_BOOL("x-zicond", RISCVCPU, cfg.ext_zicond, false),
-     CPURISCVState *env = &cpu->env;
-     RISCVCPUClass *mcc = RISCV_CPU_GET_CLASS(dev);
+     /* ePMP 0.9.3 */
-     int priv_version = PRIV_VERSION_1_11_0;
+     DEFINE_PROP_BOOL("x-epmp", RISCVCPU, cfg.epmp, false),
 +    int vext_version = VEXT_VERSION_0_07_1;
      target_ulong target_misa = 0;
      Error *local_err = NULL;
@@ -XXX,XX +XXX,XX @@ static void riscv_cpu_realize(DeviceState *dev, Error **errp)
      }
      set_priv_version(env, priv_version);
 +    set_vext_version(env, vext_version);
      if (cpu->cfg.mmu) {
          set_feature(env, RISCV_FEATURE_MMU);
 --
-.27.0
+.41.0

-[PULL 02/63] riscv: plic: Add a couple of mising sifive_plic_update calls
+[PULL v2 38/45] hw/riscv/virt.c: fix non-KVM --enable-debug build
-From: Jessica Clarke <jrtc27@jrtc27.com>
+From: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
-Claiming an interrupt and changing the source priority both potentially
+A build with --enable-debug and without KVM will fail as follows:
 affect whether an interrupt is pending, thus we must re-compute xEIP.
 Note that we don't put the sifive_plic_update inside sifive_plic_claim
 so that the logging of a claim (and the resulting IRQ) happens before
 the state update, making the causal effect clear, and that we drop the
 explicit call to sifive_plic_print_state when claiming since
 sifive_plic_update already does that automatically at the end for us.
-This can result in both spurious interrupt storms if you fail to
+/usr/bin/ld: libqemu-riscv64-softmmu.fa.p/hw_riscv_virt.c.o: in function `virt_machine_init':
-complete an IRQ before enabling interrupts (and no other actions occur
+./qemu/build/../hw/riscv/virt.c:1465: undefined reference to `kvm_riscv_aia_create'
 that result in a call to sifive_plic_update), but also more importantly
 lost interrupts if a disabled interrupt is pending and then becomes
 enabled.
-Signed-off-by: Jessica Clarke <jrtc27@jrtc27.com>
+This happens because the code block with "if virt_use_kvm_aia(s)" isn't
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+being ignored by the debug build, resulting in an undefined reference to
-Message-id: 20200618210649.22451-1-jrtc27@jrtc27.com
+a KVM only function.
-Message-Id: <20200618210649.22451-1-jrtc27@jrtc27.com>
 Add a 'kvm_enabled()' conditional together with virt_use_kvm_aia() will
 make the compiler crop the kvm_riscv_aia_create() call entirely from a
 non-KVM build. Note that adding the 'kvm_enabled()' conditional inside
 virt_use_kvm_aia() won't fix the build because this function would need
 to be inlined multiple times to make the compiler zero out the entire
 block.
 While we're at it, use kvm_enabled() in all instances where
 virt_use_kvm_aia() is checked to allow the compiler to elide these other
 kvm-only instances as well.
 Suggested-by: Richard Henderson <richard.henderson@linaro.org>
 Fixes: dbdb99948e ("target/riscv: select KVM AIA in riscv virt machine")
 Signed-off-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 Reviewed-by: Andrew Jones <ajones@ventanamicro.com>
 Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Message-ID: <20230830133503.711138-2-dbarboza@ventanamicro.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- hw/riscv/sifive_plic.c | 3 ++-
+ hw/riscv/virt.c | 6 +++---
-file changed, 2 insertions(+), 1 deletion(-)
+file changed, 3 insertions(+), 3 deletions(-)
-diff --git a/hw/riscv/sifive_plic.c b/hw/riscv/sifive_plic.c
+diff --git a/hw/riscv/virt.c b/hw/riscv/virt.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/riscv/sifive_plic.c
+--- a/hw/riscv/virt.c
-+++ b/hw/riscv/sifive_plic.c
++++ b/hw/riscv/virt.c
-@@ -XXX,XX +XXX,XX @@ static uint64_t sifive_plic_read(void *opaque, hwaddr addr, unsigned size)
+@@ -XXX,XX +XXX,XX @@ static void create_fdt_sockets(RISCVVirtState *s, const MemMapEntry *memmap,
-                     plic->addr_config[addrid].hartid,
+     }
-                     mode_to_char(plic->addr_config[addrid].mode),
-                     value);
+     /* KVM AIA only has one APLIC instance */
--                sifive_plic_print_state(plic);
+-    if (virt_use_kvm_aia(s)) {
-             }
++    if (kvm_enabled() && virt_use_kvm_aia(s)) {
-+            sifive_plic_update(plic);
+         create_fdt_socket_aplic(s, memmap, 0,
-             return value;
+                                 msi_m_phandle, msi_s_phandle, phandle,
                                  &intc_phandles[0], xplic_phandles,
@@ -XXX,XX +XXX,XX @@ static void create_fdt_sockets(RISCVVirtState *s, const MemMapEntry *memmap,
      g_free(intc_phandles);
 -    if (virt_use_kvm_aia(s)) {
 +    if (kvm_enabled() && virt_use_kvm_aia(s)) {
          *irq_mmio_phandle = xplic_phandles[0];
          *irq_virtio_phandle = xplic_phandles[0];
          *irq_pcie_phandle = xplic_phandles[0];
@@ -XXX,XX +XXX,XX @@ static void virt_machine_init(MachineState *machine)
          }
      }
-@@ -XXX,XX +XXX,XX @@ static void sifive_plic_write(void *opaque, hwaddr addr, uint64_t value,
-             qemu_log("plic: write priority: irq=%d priority=%d\n",
+-    if (virt_use_kvm_aia(s)) {
-                 irq, plic->source_priority[irq]);
++    if (kvm_enabled() && virt_use_kvm_aia(s)) {
-         }
+         kvm_riscv_aia_create(machine, IMSIC_MMIO_GROUP_MIN_SHIFT,
-+        sifive_plic_update(plic);
+                              VIRT_IRQCHIP_NUM_SOURCES, VIRT_IRQCHIP_NUM_MSIS,
-         return;
+                              memmap[VIRT_APLIC_S].base,
      } else if (addr >= plic->pending_base && /* 1 bit per source */
                 addr < plic->pending_base + (plic->num_sources >> 3))
 --
-.27.0
+.41.0

-[PULL 40/63] target/riscv: vector floating-point sign-injection instructions
+[PULL v2 39/45] hw/intc/riscv_aplic.c fix non-KVM --enable-debug build
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Commit 6df0b37e2ab breaks a --enable-debug build in a non-KVM
 environment with the following error:
 /usr/bin/ld: libqemu-riscv64-softmmu.fa.p/hw_intc_riscv_aplic.c.o: in function `riscv_kvm_aplic_request':
 ./qemu/build/../hw/intc/riscv_aplic.c:486: undefined reference to `kvm_set_irq'
 collect2: error: ld returned 1 exit status
 This happens because the debug build will poke into the
 'if (is_kvm_aia(aplic->msimode))' block and fail to find a reference to
 the KVM only function riscv_kvm_aplic_request().
 There are multiple solutions to fix this. We'll go with the same
 solution from the previous patch, i.e. add a kvm_enabled() conditional
 to filter out the block. But there's a catch: riscv_kvm_aplic_request()
 is a local function that would end up being used if the compiler crops
 the block, and this won't work. Quoting Richard Henderson's explanation
 in [1]:
 "(...) the compiler won't eliminate entire unused functions with -O0"
 We'll solve it by moving riscv_kvm_aplic_request() to kvm.c and add its
 declaration in kvm_riscv.h, where all other KVM specific public
 functions are already declared. Other archs handles KVM specific code in
 this manner and we expect to do the same from now on.
 [1] https://lore.kernel.org/qemu-riscv/d2f1ad02-eb03-138f-9d08-db676deeed05@linaro.org/
 Signed-off-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 Reviewed-by: Andrew Jones <ajones@ventanamicro.com>
 Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Message-ID: <20230830133503.711138-3-dbarboza@ventanamicro.com>
 Message-id: 20200623215920.2594-39-zhiwei_liu@c-sky.com
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   | 19 ++++++
+ target/riscv/kvm_riscv.h | 1 +
- target/riscv/insn32.decode              |  6 ++
+ hw/intc/riscv_aplic.c    | 8 ++------
- target/riscv/insn_trans/trans_rvv.inc.c |  8 +++
+ target/riscv/kvm.c       | 5 +++++
- target/riscv/vector_helper.c            | 85 +++++++++++++++++++++++++
+files changed, 8 insertions(+), 6 deletions(-)
 files changed, 118 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/target/riscv/kvm_riscv.h b/target/riscv/kvm_riscv.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/target/riscv/kvm_riscv.h
-+++ b/target/riscv/helper.h
++++ b/target/riscv/kvm_riscv.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vfmin_vf_d, void, ptr, ptr, i64, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ void kvm_riscv_aia_create(MachineState *machine, uint64_t group_shift,
- DEF_HELPER_6(vfmax_vf_h, void, ptr, ptr, i64, ptr, env, i32)
+                           uint64_t aia_irq_num, uint64_t aia_msi_num,
- DEF_HELPER_6(vfmax_vf_w, void, ptr, ptr, i64, ptr, env, i32)
+                           uint64_t aplic_base, uint64_t imsic_base,
- DEF_HELPER_6(vfmax_vf_d, void, ptr, ptr, i64, ptr, env, i32)
+                           uint64_t guest_num);
-+
++void riscv_kvm_aplic_request(void *opaque, int irq, int level);
-+DEF_HELPER_6(vfsgnj_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfsgnj_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
+ #endif
-+DEF_HELPER_6(vfsgnj_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
+diff --git a/hw/intc/riscv_aplic.c b/hw/intc/riscv_aplic.c
 +DEF_HELPER_6(vfsgnjn_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vfsgnjn_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vfsgnjn_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vfsgnjx_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vfsgnjx_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vfsgnjx_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vfsgnj_vf_h, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vfsgnj_vf_w, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vfsgnj_vf_d, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vfsgnjn_vf_h, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vfsgnjn_vf_w, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vfsgnjn_vf_d, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vfsgnjx_vf_h, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vfsgnjx_vf_w, void, ptr, ptr, i64, ptr, env, i32)
 +DEF_HELPER_6(vfsgnjx_vf_d, void, ptr, ptr, i64, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
+--- a/hw/intc/riscv_aplic.c
-+++ b/target/riscv/insn32.decode
++++ b/hw/intc/riscv_aplic.c
-@@ -XXX,XX +XXX,XX @@ vfmin_vv        000100 . ..... ..... 001 ..... 1010111 @r_vm
+@@ -XXX,XX +XXX,XX @@
- vfmin_vf        000100 . ..... ..... 101 ..... 1010111 @r_vm
+ #include "target/riscv/cpu.h"
- vfmax_vv        000110 . ..... ..... 001 ..... 1010111 @r_vm
+ #include "sysemu/sysemu.h"
- vfmax_vf        000110 . ..... ..... 101 ..... 1010111 @r_vm
+ #include "sysemu/kvm.h"
-+vfsgnj_vv       001000 . ..... ..... 001 ..... 1010111 @r_vm
++#include "kvm_riscv.h"
-+vfsgnj_vf       001000 . ..... ..... 101 ..... 1010111 @r_vm
+ #include "migration/vmstate.h"
-+vfsgnjn_vv      001001 . ..... ..... 001 ..... 1010111 @r_vm
-+vfsgnjn_vf      001001 . ..... ..... 101 ..... 1010111 @r_vm
+ #define APLIC_MAX_IDC                  (1UL << 14)
-+vfsgnjx_vv      001010 . ..... ..... 001 ..... 1010111 @r_vm
+@@ -XXX,XX +XXX,XX @@ static uint32_t riscv_aplic_idc_claimi(RISCVAPLICState *aplic, uint32_t idc)
-+vfsgnjx_vf      001010 . ..... ..... 101 ..... 1010111 @r_vm
+     return topi;
+ }
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
+-static void riscv_kvm_aplic_request(void *opaque, int irq, int level)
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
+-{
 -    kvm_set_irq(kvm_state, irq, !!level);
 -}
 -
  static void riscv_aplic_request(void *opaque, int irq, int level)
  {
      bool update = false;
@@ -XXX,XX +XXX,XX @@ static void riscv_aplic_realize(DeviceState *dev, Error **errp)
       * have IRQ lines delegated by their parent APLIC.
       */
      if (!aplic->parent) {
 -        if (is_kvm_aia(aplic->msimode)) {
 +        if (kvm_enabled() && is_kvm_aia(aplic->msimode)) {
              qdev_init_gpio_in(dev, riscv_kvm_aplic_request, aplic->num_irqs);
          } else {
              qdev_init_gpio_in(dev, riscv_aplic_request, aplic->num_irqs);
 diff --git a/target/riscv/kvm.c b/target/riscv/kvm.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
+--- a/target/riscv/kvm.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
++++ b/target/riscv/kvm.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPFVV_TRANS(vfmin_vv, opfvv_check)
+@@ -XXX,XX +XXX,XX @@
- GEN_OPFVV_TRANS(vfmax_vv, opfvv_check)
+ #include "sysemu/runstate.h"
- GEN_OPFVF_TRANS(vfmin_vf, opfvf_check)
+ #include "hw/riscv/numa.h"
- GEN_OPFVF_TRANS(vfmax_vf, opfvf_check)
-+
++void riscv_kvm_aplic_request(void *opaque, int irq, int level)
 +/* Vector Floating-Point Sign-Injection Instructions */
 +GEN_OPFVV_TRANS(vfsgnj_vv, opfvv_check)
 +GEN_OPFVV_TRANS(vfsgnjn_vv, opfvv_check)
 +GEN_OPFVV_TRANS(vfsgnjx_vv, opfvv_check)
 +GEN_OPFVF_TRANS(vfsgnj_vf, opfvf_check)
 +GEN_OPFVF_TRANS(vfsgnjn_vf, opfvf_check)
 +GEN_OPFVF_TRANS(vfsgnjx_vf, opfvf_check)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ RVVCALL(OPFVF2, vfmax_vf_d, OP_UUU_D, H8, H8, float64_maxnum)
  GEN_VEXT_VF(vfmax_vf_h, 2, 2, clearh)
  GEN_VEXT_VF(vfmax_vf_w, 4, 4, clearl)
  GEN_VEXT_VF(vfmax_vf_d, 8, 8, clearq)
 +
 +/* Vector Floating-Point Sign-Injection Instructions */
 +static uint16_t fsgnj16(uint16_t a, uint16_t b, float_status *s)
 +{
-+    return deposit64(b, 0, 15, a);
++    kvm_set_irq(kvm_state, irq, !!level);
 +}
 +
-+static uint32_t fsgnj32(uint32_t a, uint32_t b, float_status *s)
+ static uint64_t kvm_riscv_reg_id(CPURISCVState *env, uint64_t type,
-+{
+                                  uint64_t idx)
-+    return deposit64(b, 0, 31, a);
+ {
 +}
 +
 +static uint64_t fsgnj64(uint64_t a, uint64_t b, float_status *s)
 +{
 +    return deposit64(b, 0, 63, a);
 +}
 +
 +RVVCALL(OPFVV2, vfsgnj_vv_h, OP_UUU_H, H2, H2, H2, fsgnj16)
 +RVVCALL(OPFVV2, vfsgnj_vv_w, OP_UUU_W, H4, H4, H4, fsgnj32)
 +RVVCALL(OPFVV2, vfsgnj_vv_d, OP_UUU_D, H8, H8, H8, fsgnj64)
 +GEN_VEXT_VV_ENV(vfsgnj_vv_h, 2, 2, clearh)
 +GEN_VEXT_VV_ENV(vfsgnj_vv_w, 4, 4, clearl)
 +GEN_VEXT_VV_ENV(vfsgnj_vv_d, 8, 8, clearq)
 +RVVCALL(OPFVF2, vfsgnj_vf_h, OP_UUU_H, H2, H2, fsgnj16)
 +RVVCALL(OPFVF2, vfsgnj_vf_w, OP_UUU_W, H4, H4, fsgnj32)
 +RVVCALL(OPFVF2, vfsgnj_vf_d, OP_UUU_D, H8, H8, fsgnj64)
 +GEN_VEXT_VF(vfsgnj_vf_h, 2, 2, clearh)
 +GEN_VEXT_VF(vfsgnj_vf_w, 4, 4, clearl)
 +GEN_VEXT_VF(vfsgnj_vf_d, 8, 8, clearq)
 +
 +static uint16_t fsgnjn16(uint16_t a, uint16_t b, float_status *s)
 +{
 +    return deposit64(~b, 0, 15, a);
 +}
 +
 +static uint32_t fsgnjn32(uint32_t a, uint32_t b, float_status *s)
 +{
 +    return deposit64(~b, 0, 31, a);
 +}
 +
 +static uint64_t fsgnjn64(uint64_t a, uint64_t b, float_status *s)
 +{
 +    return deposit64(~b, 0, 63, a);
 +}
 +
 +RVVCALL(OPFVV2, vfsgnjn_vv_h, OP_UUU_H, H2, H2, H2, fsgnjn16)
 +RVVCALL(OPFVV2, vfsgnjn_vv_w, OP_UUU_W, H4, H4, H4, fsgnjn32)
 +RVVCALL(OPFVV2, vfsgnjn_vv_d, OP_UUU_D, H8, H8, H8, fsgnjn64)
 +GEN_VEXT_VV_ENV(vfsgnjn_vv_h, 2, 2, clearh)
 +GEN_VEXT_VV_ENV(vfsgnjn_vv_w, 4, 4, clearl)
 +GEN_VEXT_VV_ENV(vfsgnjn_vv_d, 8, 8, clearq)
 +RVVCALL(OPFVF2, vfsgnjn_vf_h, OP_UUU_H, H2, H2, fsgnjn16)
 +RVVCALL(OPFVF2, vfsgnjn_vf_w, OP_UUU_W, H4, H4, fsgnjn32)
 +RVVCALL(OPFVF2, vfsgnjn_vf_d, OP_UUU_D, H8, H8, fsgnjn64)
 +GEN_VEXT_VF(vfsgnjn_vf_h, 2, 2, clearh)
 +GEN_VEXT_VF(vfsgnjn_vf_w, 4, 4, clearl)
 +GEN_VEXT_VF(vfsgnjn_vf_d, 8, 8, clearq)
 +
 +static uint16_t fsgnjx16(uint16_t a, uint16_t b, float_status *s)
 +{
 +    return deposit64(b ^ a, 0, 15, a);
 +}
 +
 +static uint32_t fsgnjx32(uint32_t a, uint32_t b, float_status *s)
 +{
 +    return deposit64(b ^ a, 0, 31, a);
 +}
 +
 +static uint64_t fsgnjx64(uint64_t a, uint64_t b, float_status *s)
 +{
 +    return deposit64(b ^ a, 0, 63, a);
 +}
 +
 +RVVCALL(OPFVV2, vfsgnjx_vv_h, OP_UUU_H, H2, H2, H2, fsgnjx16)
 +RVVCALL(OPFVV2, vfsgnjx_vv_w, OP_UUU_W, H4, H4, H4, fsgnjx32)
 +RVVCALL(OPFVV2, vfsgnjx_vv_d, OP_UUU_D, H8, H8, H8, fsgnjx64)
 +GEN_VEXT_VV_ENV(vfsgnjx_vv_h, 2, 2, clearh)
 +GEN_VEXT_VV_ENV(vfsgnjx_vv_w, 4, 4, clearl)
 +GEN_VEXT_VV_ENV(vfsgnjx_vv_d, 8, 8, clearq)
 +RVVCALL(OPFVF2, vfsgnjx_vf_h, OP_UUU_H, H2, H2, fsgnjx16)
 +RVVCALL(OPFVF2, vfsgnjx_vf_w, OP_UUU_W, H4, H4, fsgnjx32)
 +RVVCALL(OPFVF2, vfsgnjx_vf_d, OP_UUU_D, H8, H8, fsgnjx64)
 +GEN_VEXT_VF(vfsgnjx_vf_h, 2, 2, clearh)
 +GEN_VEXT_VF(vfsgnjx_vf_w, 4, 4, clearl)
 +GEN_VEXT_VF(vfsgnjx_vf_d, 8, 8, clearq)
 --
-.27.0
+.41.0

-[PULL 38/63] target/riscv: vector floating-point square-root instruction
+[PULL v2 40/45] linux-user/riscv: Add new extensions to hwprobe
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Robbin Ehn <rehn@rivosinc.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+This patch adds the new extensions in
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+linux 6.5 to the hwprobe syscall.
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-37-zhiwei_liu@c-sky.com
+And fixes RVC check to OR with correct value.
 The previous variable contains 0 therefore it
 did work.
 Signed-off-by: Robbin Ehn <rehn@rivosinc.com>
 Acked-by: Richard Henderson <richard.henderson@linaro.org>
 Acked-by: Alistair Francis <alistair.francis@wdc.com>
 Message-ID: <bc82203b72d7efb30f1b4a8f9eb3d94699799dc8.camel@rivosinc.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   |  4 +++
+ linux-user/syscall.c | 14 +++++++++++++-
- target/riscv/insn32.decode              |  3 ++
+file changed, 13 insertions(+), 1 deletion(-)
  target/riscv/insn_trans/trans_rvv.inc.c | 43 +++++++++++++++++++++++++
  target/riscv/vector_helper.c            | 43 +++++++++++++++++++++++++
 files changed, 93 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/linux-user/syscall.c b/linux-user/syscall.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/linux-user/syscall.c
-+++ b/target/riscv/helper.h
++++ b/linux-user/syscall.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vfwmsac_vf_h, void, ptr, ptr, i64, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ static int do_getdents64(abi_long dirfd, abi_long arg2, abi_long count)
- DEF_HELPER_6(vfwmsac_vf_w, void, ptr, ptr, i64, ptr, env, i32)
+ #define RISCV_HWPROBE_KEY_IMA_EXT_0     4
- DEF_HELPER_6(vfwnmsac_vf_h, void, ptr, ptr, i64, ptr, env, i32)
+ #define     RISCV_HWPROBE_IMA_FD       (1 << 0)
- DEF_HELPER_6(vfwnmsac_vf_w, void, ptr, ptr, i64, ptr, env, i32)
+ #define     RISCV_HWPROBE_IMA_C        (1 << 1)
-+
++#define     RISCV_HWPROBE_IMA_V        (1 << 2)
-+DEF_HELPER_5(vfsqrt_v_h, void, ptr, ptr, ptr, env, i32)
++#define     RISCV_HWPROBE_EXT_ZBA      (1 << 3)
-+DEF_HELPER_5(vfsqrt_v_w, void, ptr, ptr, ptr, env, i32)
++#define     RISCV_HWPROBE_EXT_ZBB      (1 << 4)
-+DEF_HELPER_5(vfsqrt_v_d, void, ptr, ptr, ptr, env, i32)
++#define     RISCV_HWPROBE_EXT_ZBS      (1 << 5)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
+ #define RISCV_HWPROBE_KEY_CPUPERF_0     5
---- a/target/riscv/insn32.decode
+ #define     RISCV_HWPROBE_MISALIGNED_UNKNOWN     (0 << 0)
-+++ b/target/riscv/insn32.decode
+@@ -XXX,XX +XXX,XX @@ static void risc_hwprobe_fill_pairs(CPURISCVState *env,
-@@ -XXX,XX +XXX,XX @@
+                     riscv_has_ext(env, RVD) ?
- &shift     shamt rs1 rd
+                     RISCV_HWPROBE_IMA_FD : 0;
- &atomic    aq rl rs2 rs1 rd
+             value |= riscv_has_ext(env, RVC) ?
- &rmrr      vm rd rs1 rs2
+-                     RISCV_HWPROBE_IMA_C : pair->value;
-+&rmr       vm rd rs2
++                     RISCV_HWPROBE_IMA_C : 0;
- &rwdvm     vm wd rd rs1 rs2
++            value |= riscv_has_ext(env, RVV) ?
- &r2nfvm    vm rd rs1 nf
++                     RISCV_HWPROBE_IMA_V : 0;
- &rnfvm     vm rd rs1 rs2 nf
++            value |= cfg->ext_zba ?
-@@ -XXX,XX +XXX,XX @@
++                     RISCV_HWPROBE_EXT_ZBA : 0;
- @r2_rm   .......   ..... ..... ... ..... ....... %rs1 %rm %rd
++            value |= cfg->ext_zbb ?
- @r2      .......   ..... ..... ... ..... ....... %rs1 %rd
++                     RISCV_HWPROBE_EXT_ZBB : 0;
- @r2_nfvm ... ... vm:1 ..... ..... ... ..... ....... &r2nfvm %nf %rs1 %rd
++            value |= cfg->ext_zbs ?
-+@r2_vm   ...... vm:1 ..... ..... ... ..... ....... &rmr %rs2 %rd
++                     RISCV_HWPROBE_EXT_ZBS : 0;
- @r_nfvm  ... ... vm:1 ..... ..... ... ..... ....... &rnfvm %nf %rs2 %rs1 %rd
+             __put_user(value, &pair->value);
- @r_vm    ...... vm:1 ..... ..... ... ..... ....... &rmrr %rs2 %rs1 %rd
+             break;
- @r_vm_1  ...... . ..... ..... ... ..... .......    &rmrr vm=1 %rs2 %rs1 %rd
+         case RISCV_HWPROBE_KEY_CPUPERF_0:
@@ -XXX,XX +XXX,XX @@ vfwmsac_vv      111110 . ..... ..... 001 ..... 1010111 @r_vm
  vfwmsac_vf      111110 . ..... ..... 101 ..... 1010111 @r_vm
  vfwnmsac_vv     111111 . ..... ..... 001 ..... 1010111 @r_vm
  vfwnmsac_vf     111111 . ..... ..... 101 ..... 1010111 @r_vm
 +vfsqrt_v        100011 . ..... 00000 001 ..... 1010111 @r2_vm
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ GEN_OPFVF_WIDEN_TRANS(vfwmacc_vf)
  GEN_OPFVF_WIDEN_TRANS(vfwnmacc_vf)
  GEN_OPFVF_WIDEN_TRANS(vfwmsac_vf)
  GEN_OPFVF_WIDEN_TRANS(vfwnmsac_vf)
 +
 +/* Vector Floating-Point Square-Root Instruction */
 +
 +/*
 + * If the current SEW does not correspond to a supported IEEE floating-point
 + * type, an illegal instruction exception is raised
 + */
 +static bool opfv_check(DisasContext *s, arg_rmr *a)
 +{
 +   return (vext_check_isa_ill(s) &&
 +            vext_check_overlap_mask(s, a->rd, a->vm, false) &&
 +            vext_check_reg(s, a->rd, false) &&
 +            vext_check_reg(s, a->rs2, false) &&
 +            (s->sew != 0));
 +}
 +
 +#define GEN_OPFV_TRANS(NAME, CHECK)                                \
 +static bool trans_##NAME(DisasContext *s, arg_rmr *a)              \
 +{                                                                  \
 +    if (CHECK(s, a)) {                                             \
 +        uint32_t data = 0;                                         \
 +        static gen_helper_gvec_3_ptr * const fns[3] = {            \
 +            gen_helper_##NAME##_h,                                 \
 +            gen_helper_##NAME##_w,                                 \
 +            gen_helper_##NAME##_d,                                 \
 +        };                                                         \
 +        TCGLabel *over = gen_new_label();                          \
 +        gen_set_rm(s, 7);                                          \
 +        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
 +                                                                   \
 +        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);             \
 +        data = FIELD_DP32(data, VDATA, VM, a->vm);                 \
 +        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);             \
 +        tcg_gen_gvec_3_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),     \
 +                           vreg_ofs(s, a->rs2), cpu_env, 0,        \
 +                           s->vlen / 8, data, fns[s->sew - 1]);    \
 +        gen_set_label(over);                                       \
 +        return true;                                               \
 +    }                                                              \
 +    return false;                                                  \
 +}
 +
 +GEN_OPFV_TRANS(vfsqrt_v, opfv_check)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ RVVCALL(OPFVF3, vfwnmsac_vf_h, WOP_UUU_H, H4, H2, fwnmsac16)
  RVVCALL(OPFVF3, vfwnmsac_vf_w, WOP_UUU_W, H8, H4, fwnmsac32)
  GEN_VEXT_VF(vfwnmsac_vf_h, 2, 4, clearl)
  GEN_VEXT_VF(vfwnmsac_vf_w, 4, 8, clearq)
 +
 +/* Vector Floating-Point Square-Root Instruction */
 +/* (TD, T2, TX2) */
 +#define OP_UU_H uint16_t, uint16_t, uint16_t
 +#define OP_UU_W uint32_t, uint32_t, uint32_t
 +#define OP_UU_D uint64_t, uint64_t, uint64_t
 +
 +#define OPFVV1(NAME, TD, T2, TX2, HD, HS2, OP)        \
 +static void do_##NAME(void *vd, void *vs2, int i,      \
 +        CPURISCVState *env)                            \
 +{                                                      \
 +    TX2 s2 = *((T2 *)vs2 + HS2(i));                    \
 +    *((TD *)vd + HD(i)) = OP(s2, &env->fp_status);     \
 +}
 +
 +#define GEN_VEXT_V_ENV(NAME, ESZ, DSZ, CLEAR_FN)       \
 +void HELPER(NAME)(void *vd, void *v0, void *vs2,       \
 +        CPURISCVState *env, uint32_t desc)             \
 +{                                                      \
 +    uint32_t vlmax = vext_maxsz(desc) / ESZ;           \
 +    uint32_t mlen = vext_mlen(desc);                   \
 +    uint32_t vm = vext_vm(desc);                       \
 +    uint32_t vl = env->vl;                             \
 +    uint32_t i;                                        \
 +                                                       \
 +    if (vl == 0) {                                     \
 +        return;                                        \
 +    }                                                  \
 +    for (i = 0; i < vl; i++) {                         \
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {     \
 +            continue;                                  \
 +        }                                              \
 +        do_##NAME(vd, vs2, i, env);                    \
 +    }                                                  \
 +    CLEAR_FN(vd, vl, vl * DSZ,  vlmax * DSZ);          \
 +}
 +
 +RVVCALL(OPFVV1, vfsqrt_v_h, OP_UU_H, H2, H2, float16_sqrt)
 +RVVCALL(OPFVV1, vfsqrt_v_w, OP_UU_W, H4, H4, float32_sqrt)
 +RVVCALL(OPFVV1, vfsqrt_v_d, OP_UU_D, H8, H8, float64_sqrt)
 +GEN_VEXT_V_ENV(vfsqrt_v_h, 2, 2, clearh)
 +GEN_VEXT_V_ENV(vfsqrt_v_w, 4, 4, clearl)
 +GEN_VEXT_V_ENV(vfsqrt_v_d, 8, 8, clearq)
 --
-.27.0
+.41.0

-[PULL 39/63] target/riscv: vector floating-point min/max instructions
+[PULL v2 41/45] target/riscv: Use accelerated helper for AES64KS1I
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Ard Biesheuvel <ardb@kernel.org>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+Use the accelerated SubBytes/ShiftRows/AddRoundKey AES helper to
 implement the first half of the key schedule derivation. This does not
 actually involve shifting rows, so clone the same value into all four
 columns of the AES vector to counter that operation.
 Cc: Richard Henderson <richard.henderson@linaro.org>
 Cc: Philippe Mathieu-Daudé <philmd@linaro.org>
 Cc: Palmer Dabbelt <palmer@dabbelt.com>
 Cc: Alistair Francis <alistair.francis@wdc.com>
 Signed-off-by: Ard Biesheuvel <ardb@kernel.org>
 Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Message-ID: <20230831154118.138727-1-ardb@kernel.org>
 Message-id: 20200623215920.2594-38-zhiwei_liu@c-sky.com
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   | 13 ++++++++++++
+ target/riscv/crypto_helper.c | 17 +++++------------
- target/riscv/insn32.decode              |  4 ++++
+file changed, 5 insertions(+), 12 deletions(-)
  target/riscv/insn_trans/trans_rvv.inc.c |  6 ++++++
  target/riscv/vector_helper.c            | 27 +++++++++++++++++++++++++
 files changed, 50 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/target/riscv/crypto_helper.c b/target/riscv/crypto_helper.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/target/riscv/crypto_helper.c
-+++ b/target/riscv/helper.h
++++ b/target/riscv/crypto_helper.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vfwnmsac_vf_w, void, ptr, ptr, i64, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ target_ulong HELPER(aes64ks1i)(target_ulong rs1, target_ulong rnum)
- DEF_HELPER_5(vfsqrt_v_h, void, ptr, ptr, ptr, env, i32)
- DEF_HELPER_5(vfsqrt_v_w, void, ptr, ptr, ptr, env, i32)
+     uint8_t enc_rnum = rnum;
- DEF_HELPER_5(vfsqrt_v_d, void, ptr, ptr, ptr, env, i32)
+     uint32_t temp = (RS1 >> 32) & 0xFFFFFFFF;
-+
+-    uint8_t rcon_ = 0;
-+DEF_HELPER_6(vfmin_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
+-    target_ulong result;
-+DEF_HELPER_6(vfmin_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++    AESState t, rc = {};
-+DEF_HELPER_6(vfmin_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfmax_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
+     if (enc_rnum != 0xA) {
-+DEF_HELPER_6(vfmax_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
+         temp = ror32(temp, 8); /* Rotate right by 8 */
-+DEF_HELPER_6(vfmax_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
+-        rcon_ = round_consts[enc_rnum];
-+DEF_HELPER_6(vfmin_vf_h, void, ptr, ptr, i64, ptr, env, i32)
++        rc.w[0] = rc.w[1] = round_consts[enc_rnum];
-+DEF_HELPER_6(vfmin_vf_w, void, ptr, ptr, i64, ptr, env, i32)
+     }
-+DEF_HELPER_6(vfmin_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfmax_vf_h, void, ptr, ptr, i64, ptr, env, i32)
+-    temp = ((uint32_t)AES_sbox[(temp >> 24) & 0xFF] << 24) |
-+DEF_HELPER_6(vfmax_vf_w, void, ptr, ptr, i64, ptr, env, i32)
+-           ((uint32_t)AES_sbox[(temp >> 16) & 0xFF] << 16) |
-+DEF_HELPER_6(vfmax_vf_d, void, ptr, ptr, i64, ptr, env, i32)
+-           ((uint32_t)AES_sbox[(temp >> 8) & 0xFF] << 8) |
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
+-           ((uint32_t)AES_sbox[(temp >> 0) & 0xFF] << 0);
-index XXXXXXX..XXXXXXX 100644
++    t.w[0] = t.w[1] = t.w[2] = t.w[3] = temp;
---- a/target/riscv/insn32.decode
++    aesenc_SB_SR_AK(&t, &t, &rc, false);
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vfwmsac_vf      111110 . ..... ..... 101 ..... 1010111 @r_vm
+-    temp ^= rcon_;
- vfwnmsac_vv     111111 . ..... ..... 001 ..... 1010111 @r_vm
+-
- vfwnmsac_vf     111111 . ..... ..... 101 ..... 1010111 @r_vm
+-    result = ((uint64_t)temp << 32) | temp;
- vfsqrt_v        100011 . ..... 00000 001 ..... 1010111 @r2_vm
+-
-+vfmin_vv        000100 . ..... ..... 001 ..... 1010111 @r_vm
+-    return result;
-+vfmin_vf        000100 . ..... ..... 101 ..... 1010111 @r_vm
++    return t.d[0];
 +vfmax_vv        000110 . ..... ..... 001 ..... 1010111 @r_vm
 +vfmax_vf        000110 . ..... ..... 101 ..... 1010111 @r_vm
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmr *a)              \
  }
- GEN_OPFV_TRANS(vfsqrt_v, opfv_check)
+ target_ulong HELPER(aes64im)(target_ulong rs1)
 +
 +/* Vector Floating-Point MIN/MAX Instructions */
 +GEN_OPFVV_TRANS(vfmin_vv, opfvv_check)
 +GEN_OPFVV_TRANS(vfmax_vv, opfvv_check)
 +GEN_OPFVF_TRANS(vfmin_vf, opfvf_check)
 +GEN_OPFVF_TRANS(vfmax_vf, opfvf_check)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ RVVCALL(OPFVV1, vfsqrt_v_d, OP_UU_D, H8, H8, float64_sqrt)
  GEN_VEXT_V_ENV(vfsqrt_v_h, 2, 2, clearh)
  GEN_VEXT_V_ENV(vfsqrt_v_w, 4, 4, clearl)
  GEN_VEXT_V_ENV(vfsqrt_v_d, 8, 8, clearq)
 +
 +/* Vector Floating-Point MIN/MAX Instructions */
 +RVVCALL(OPFVV2, vfmin_vv_h, OP_UUU_H, H2, H2, H2, float16_minnum)
 +RVVCALL(OPFVV2, vfmin_vv_w, OP_UUU_W, H4, H4, H4, float32_minnum)
 +RVVCALL(OPFVV2, vfmin_vv_d, OP_UUU_D, H8, H8, H8, float64_minnum)
 +GEN_VEXT_VV_ENV(vfmin_vv_h, 2, 2, clearh)
 +GEN_VEXT_VV_ENV(vfmin_vv_w, 4, 4, clearl)
 +GEN_VEXT_VV_ENV(vfmin_vv_d, 8, 8, clearq)
 +RVVCALL(OPFVF2, vfmin_vf_h, OP_UUU_H, H2, H2, float16_minnum)
 +RVVCALL(OPFVF2, vfmin_vf_w, OP_UUU_W, H4, H4, float32_minnum)
 +RVVCALL(OPFVF2, vfmin_vf_d, OP_UUU_D, H8, H8, float64_minnum)
 +GEN_VEXT_VF(vfmin_vf_h, 2, 2, clearh)
 +GEN_VEXT_VF(vfmin_vf_w, 4, 4, clearl)
 +GEN_VEXT_VF(vfmin_vf_d, 8, 8, clearq)
 +
 +RVVCALL(OPFVV2, vfmax_vv_h, OP_UUU_H, H2, H2, H2, float16_maxnum)
 +RVVCALL(OPFVV2, vfmax_vv_w, OP_UUU_W, H4, H4, H4, float32_maxnum)
 +RVVCALL(OPFVV2, vfmax_vv_d, OP_UUU_D, H8, H8, H8, float64_maxnum)
 +GEN_VEXT_VV_ENV(vfmax_vv_h, 2, 2, clearh)
 +GEN_VEXT_VV_ENV(vfmax_vv_w, 4, 4, clearl)
 +GEN_VEXT_VV_ENV(vfmax_vv_d, 8, 8, clearq)
 +RVVCALL(OPFVF2, vfmax_vf_h, OP_UUU_H, H2, H2, float16_maxnum)
 +RVVCALL(OPFVF2, vfmax_vf_w, OP_UUU_W, H4, H4, float32_maxnum)
 +RVVCALL(OPFVF2, vfmax_vf_d, OP_UUU_D, H8, H8, float64_maxnum)
 +GEN_VEXT_VF(vfmax_vf_h, 2, 2, clearh)
 +GEN_VEXT_VF(vfmax_vf_w, 4, 4, clearl)
 +GEN_VEXT_VF(vfmax_vf_d, 8, 8, clearq)
 --
-.27.0
+.41.0

-[PULL 54/63] target/riscv: set-X-first mask bit
+[PULL v2 42/45] target/riscv: Allocate itrigger timers only once
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Akihiko Odaki <akihiko.odaki@daynix.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+riscv_trigger_init() had been called on reset events that can happen
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+several times for a CPU and it allocated timers for itrigger. If old
-Message-id: 20200623215920.2594-53-zhiwei_liu@c-sky.com
+timers were present, they were simply overwritten by the new timers,
 resulting in a memory leak.
 Divide riscv_trigger_init() into two functions, namely
 riscv_trigger_realize() and riscv_trigger_reset() and call them in
 appropriate timing. The timer allocation will happen only once for a
 CPU in riscv_trigger_realize().
 Fixes: 5a4ae64cac ("target/riscv: Add itrigger support when icount is enabled")
 Signed-off-by: Akihiko Odaki <akihiko.odaki@daynix.com>
 Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Reviewed-by: LIU Zhiwei <zhiwei_liu@linux.alibaba.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
 Message-ID: <20230818034059.9146-1-akihiko.odaki@daynix.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   |  4 ++
+ target/riscv/debug.h |  3 ++-
- target/riscv/insn32.decode              |  3 ++
+ target/riscv/cpu.c   |  8 +++++++-
- target/riscv/insn_trans/trans_rvv.inc.c | 28 +++++++++++
+ target/riscv/debug.c | 15 ++++++++++++---
- target/riscv/vector_helper.c            | 63 +++++++++++++++++++++++++
+files changed, 21 insertions(+), 5 deletions(-)
 files changed, 98 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/target/riscv/debug.h b/target/riscv/debug.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/target/riscv/debug.h
-+++ b/target/riscv/helper.h
++++ b/target/riscv/debug.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vmxnor_mm, void, ptr, ptr, ptr, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ void riscv_cpu_debug_excp_handler(CPUState *cs);
- DEF_HELPER_4(vmpopc_m, tl, ptr, ptr, env, i32)
+ bool riscv_cpu_debug_check_breakpoint(CPUState *cs);
+ bool riscv_cpu_debug_check_watchpoint(CPUState *cs, CPUWatchpoint *wp);
- DEF_HELPER_4(vmfirst_m, tl, ptr, ptr, env, i32)
 -void riscv_trigger_init(CPURISCVState *env);
 +void riscv_trigger_realize(CPURISCVState *env);
 +void riscv_trigger_reset_hold(CPURISCVState *env);
  bool riscv_itrigger_enabled(CPURISCVState *env);
  void riscv_itrigger_update_priv(CPURISCVState *env);
 diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/cpu.c
 +++ b/target/riscv/cpu.c
@@ -XXX,XX +XXX,XX @@ static void riscv_cpu_reset_hold(Object *obj)
  #ifndef CONFIG_USER_ONLY
      if (cpu->cfg.debug) {
 -        riscv_trigger_init(env);
 +        riscv_trigger_reset_hold(env);
      }
      if (kvm_enabled()) {
@@ -XXX,XX +XXX,XX @@ static void riscv_cpu_realize(DeviceState *dev, Error **errp)
      riscv_cpu_register_gdb_regs_for_features(cs);
 +#ifndef CONFIG_USER_ONLY
 +    if (cpu->cfg.debug) {
 +        riscv_trigger_realize(&cpu->env);
 +    }
 +#endif
 +
-+DEF_HELPER_5(vmsbf_m, void, ptr, ptr, ptr, env, i32)
+     qemu_init_vcpu(cs);
-+DEF_HELPER_5(vmsif_m, void, ptr, ptr, ptr, env, i32)
+     cpu_reset(cs);
-+DEF_HELPER_5(vmsof_m, void, ptr, ptr, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
+diff --git a/target/riscv/debug.c b/target/riscv/debug.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
+--- a/target/riscv/debug.c
-+++ b/target/riscv/insn32.decode
++++ b/target/riscv/debug.c
-@@ -XXX,XX +XXX,XX @@ vmornot_mm      011100 - ..... ..... 010 ..... 1010111 @r
+@@ -XXX,XX +XXX,XX @@ bool riscv_cpu_debug_check_watchpoint(CPUState *cs, CPUWatchpoint *wp)
  vmxnor_mm       011111 - ..... ..... 010 ..... 1010111 @r
  vmpopc_m        010100 . ..... ----- 010 ..... 1010111 @r2_vm
  vmfirst_m       010101 . ..... ----- 010 ..... 1010111 @r2_vm
 +vmsbf_m         010110 . ..... 00001 010 ..... 1010111 @r2_vm
 +vmsif_m         010110 . ..... 00011 010 ..... 1010111 @r2_vm
 +vmsof_m         010110 . ..... 00010 010 ..... 1010111 @r2_vm
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ static bool trans_vmfirst_m(DisasContext *s, arg_rmr *a)
      }
      return false;
  }
+-void riscv_trigger_init(CPURISCVState *env)
++void riscv_trigger_realize(CPURISCVState *env)
++{
++    int i;
 +
-+/* vmsbf.m set-before-first mask bit */
++    for (i = 0; i < RV_MAX_TRIGGERS; i++) {
-+/* vmsif.m set-includ-first mask bit */
++        env->itrigger_timer[i] = timer_new_ns(QEMU_CLOCK_VIRTUAL,
-+/* vmsof.m set-only-first mask bit */
++                                              riscv_itrigger_timer_cb, env);
 +#define GEN_M_TRANS(NAME)                                          \
 +static bool trans_##NAME(DisasContext *s, arg_rmr *a)              \
 +{                                                                  \
 +    if (vext_check_isa_ill(s)) {                                   \
 +        uint32_t data = 0;                                         \
 +        gen_helper_gvec_3_ptr *fn = gen_helper_##NAME;             \
 +        TCGLabel *over = gen_new_label();                          \
 +        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
 +                                                                   \
 +        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);             \
 +        data = FIELD_DP32(data, VDATA, VM, a->vm);                 \
 +        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);             \
 +        tcg_gen_gvec_3_ptr(vreg_ofs(s, a->rd),                     \
 +                           vreg_ofs(s, 0), vreg_ofs(s, a->rs2),    \
 +                           cpu_env, 0, s->vlen / 8, data, fn);     \
 +        gen_set_label(over);                                       \
 +        return true;                                               \
 +    }                                                              \
 +    return false;                                                  \
 +}
 +
 +GEN_M_TRANS(vmsbf_m)
 +GEN_M_TRANS(vmsif_m)
 +GEN_M_TRANS(vmsof_m)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ target_ulong HELPER(vmfirst_m)(void *v0, void *vs2, CPURISCVState *env,
      }
      return -1LL;
  }
 +
 +enum set_mask_type {
 +    ONLY_FIRST = 1,
 +    INCLUDE_FIRST,
 +    BEFORE_FIRST,
 +};
 +
 +static void vmsetm(void *vd, void *v0, void *vs2, CPURISCVState *env,
 +                   uint32_t desc, enum set_mask_type type)
 +{
 +    uint32_t mlen = vext_mlen(desc);
 +    uint32_t vlmax = env_archcpu(env)->cfg.vlen / mlen;
 +    uint32_t vm = vext_vm(desc);
 +    uint32_t vl = env->vl;
 +    int i;
 +    bool first_mask_bit = false;
 +
 +    for (i = 0; i < vl; i++) {
 +        if (!vm && !vext_elem_mask(v0, mlen, i)) {
 +            continue;
 +        }
 +        /* write a zero to all following active elements */
 +        if (first_mask_bit) {
 +            vext_set_elem_mask(vd, mlen, i, 0);
 +            continue;
 +        }
 +        if (vext_elem_mask(vs2, mlen, i)) {
 +            first_mask_bit = true;
 +            if (type == BEFORE_FIRST) {
 +                vext_set_elem_mask(vd, mlen, i, 0);
 +            } else {
 +                vext_set_elem_mask(vd, mlen, i, 1);
 +            }
 +        } else {
 +            if (type == ONLY_FIRST) {
 +                vext_set_elem_mask(vd, mlen, i, 0);
 +            } else {
 +                vext_set_elem_mask(vd, mlen, i, 1);
 +            }
 +        }
 +    }
 +    for (; i < vlmax; i++) {
 +        vext_set_elem_mask(vd, mlen, i, 0);
 +    }
 +}
 +
-+void HELPER(vmsbf_m)(void *vd, void *v0, void *vs2, CPURISCVState *env,
++void riscv_trigger_reset_hold(CPURISCVState *env)
-+                     uint32_t desc)
+ {
-+{
+     target_ulong tdata1 = build_tdata1(env, TRIGGER_TYPE_AD_MATCH, 0, 0);
-+    vmsetm(vd, v0, vs2, env, desc, BEFORE_FIRST);
+     int i;
-+}
+@@ -XXX,XX +XXX,XX @@ void riscv_trigger_init(CPURISCVState *env)
-+
+         env->tdata3[i] = 0;
-+void HELPER(vmsif_m)(void *vd, void *v0, void *vs2, CPURISCVState *env,
+         env->cpu_breakpoint[i] = NULL;
-+                     uint32_t desc)
+         env->cpu_watchpoint[i] = NULL;
-+{
+-        env->itrigger_timer[i] = timer_new_ns(QEMU_CLOCK_VIRTUAL,
-+    vmsetm(vd, v0, vs2, env, desc, INCLUDE_FIRST);
+-                                              riscv_itrigger_timer_cb, env);
-+}
++        timer_del(env->itrigger_timer[i]);
-+
+     }
-+void HELPER(vmsof_m)(void *vd, void *v0, void *vs2, CPURISCVState *env,
+ }
 +                     uint32_t desc)
 +{
 +    vmsetm(vd, v0, vs2, env, desc, ONLY_FIRST);
 +}
 --
-.27.0
+.41.0

-[PULL 27/63] target/riscv: vector single-width averaging add and subtract
+[PULL v2 43/45] target/riscv/pmp.c: respect mseccfg.RLB for pmpaddrX changes
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Leon Schuermann <leons@opentitan.org>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+When the rule-lock bypass (RLB) bit is set in the mseccfg CSR, the PMP
 configuration lock bits must not apply. While this behavior is
 implemented for the pmpcfgX CSRs, this bit is not respected for
 changes to the pmpaddrX CSRs. This patch ensures that pmpaddrX CSR
 writes work even on locked regions when the global rule-lock bypass is
 enabled.
 Signed-off-by: Leon Schuermann <leons@opentitan.org>
 Reviewed-by: Mayuresh Chitale <mchitale@ventanamicro.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Message-ID: <20230829215046.1430463-1-leon@is.currently.online>
 Message-id: 20200623215920.2594-26-zhiwei_liu@c-sky.com
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   |  17 ++++
+ target/riscv/pmp.c | 4 ++++
- target/riscv/insn32.decode              |   5 ++
+file changed, 4 insertions(+)
  target/riscv/insn_trans/trans_rvv.inc.c |   7 ++
  target/riscv/vector_helper.c            | 100 ++++++++++++++++++++++++
 files changed, 129 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/target/riscv/pmp.c b/target/riscv/pmp.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/target/riscv/pmp.c
-+++ b/target/riscv/helper.h
++++ b/target/riscv/pmp.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vssub_vx_b, void, ptr, ptr, tl, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ static inline uint8_t pmp_get_a_field(uint8_t cfg)
- DEF_HELPER_6(vssub_vx_h, void, ptr, ptr, tl, ptr, env, i32)
+  */
- DEF_HELPER_6(vssub_vx_w, void, ptr, ptr, tl, ptr, env, i32)
+ static inline int pmp_is_locked(CPURISCVState *env, uint32_t pmp_index)
- DEF_HELPER_6(vssub_vx_d, void, ptr, ptr, tl, ptr, env, i32)
+ {
-+
++    /* mseccfg.RLB is set */
-+DEF_HELPER_6(vaadd_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
++    if (MSECCFG_RLB_ISSET(env)) {
 +DEF_HELPER_6(vaadd_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vaadd_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vaadd_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vasub_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vasub_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vasub_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vasub_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_6(vaadd_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vaadd_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vaadd_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vaadd_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vasub_vx_b, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vasub_vx_h, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vasub_vx_w, void, ptr, ptr, tl, ptr, env, i32)
 +DEF_HELPER_6(vasub_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@ vssubu_vv       100010 . ..... ..... 000 ..... 1010111 @r_vm
  vssubu_vx       100010 . ..... ..... 100 ..... 1010111 @r_vm
  vssub_vv        100011 . ..... ..... 000 ..... 1010111 @r_vm
  vssub_vx        100011 . ..... ..... 100 ..... 1010111 @r_vm
 +vaadd_vv        100100 . ..... ..... 000 ..... 1010111 @r_vm
 +vaadd_vx        100100 . ..... ..... 100 ..... 1010111 @r_vm
 +vaadd_vi        100100 . ..... ..... 011 ..... 1010111 @r_vm
 +vasub_vv        100110 . ..... ..... 000 ..... 1010111 @r_vm
 +vasub_vx        100110 . ..... ..... 100 ..... 1010111 @r_vm
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ GEN_OPIVX_TRANS(vssubu_vx,  opivx_check)
  GEN_OPIVX_TRANS(vssub_vx,  opivx_check)
  GEN_OPIVI_TRANS(vsaddu_vi, 1, vsaddu_vx, opivx_check)
  GEN_OPIVI_TRANS(vsadd_vi, 0, vsadd_vx, opivx_check)
 +
 +/* Vector Single-Width Averaging Add and Subtract */
 +GEN_OPIVV_TRANS(vaadd_vv, opivv_check)
 +GEN_OPIVV_TRANS(vasub_vv, opivv_check)
 +GEN_OPIVX_TRANS(vaadd_vx,  opivx_check)
 +GEN_OPIVX_TRANS(vasub_vx,  opivx_check)
 +GEN_OPIVI_TRANS(vaadd_vi, 0, vaadd_vx, opivx_check)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VX_RM(vssub_vx_b, 1, 1, clearb)
  GEN_VEXT_VX_RM(vssub_vx_h, 2, 2, clearh)
  GEN_VEXT_VX_RM(vssub_vx_w, 4, 4, clearl)
  GEN_VEXT_VX_RM(vssub_vx_d, 8, 8, clearq)
 +
 +/* Vector Single-Width Averaging Add and Subtract */
 +static inline uint8_t get_round(int vxrm, uint64_t v, uint8_t shift)
 +{
 +    uint8_t d = extract64(v, shift, 1);
 +    uint8_t d1;
 +    uint64_t D1, D2;
 +
 +    if (shift == 0 || shift > 64) {
 +        return 0;
 +    }
-+
-+    d1 = extract64(v, shift - 1, 1);
+     if (env->pmp_state.pmp[pmp_index].cfg_reg & PMP_LOCK) {
-+    D1 = extract64(v, 0, shift);
+         return 1;
 +    if (vxrm == 0) { /* round-to-nearest-up (add +0.5 LSB) */
 +        return d1;
 +    } else if (vxrm == 1) { /* round-to-nearest-even */
 +        if (shift > 1) {
 +            D2 = extract64(v, 0, shift - 1);
 +            return d1 & ((D2 != 0) | d);
 +        } else {
 +            return d1 & d;
 +        }
 +    } else if (vxrm == 3) { /* round-to-odd (OR bits into LSB, aka "jam") */
 +        return !d & (D1 != 0);
 +    }
 +    return 0; /* round-down (truncate) */
 +}
 +
 +static inline int32_t aadd32(CPURISCVState *env, int vxrm, int32_t a, int32_t b)
 +{
 +    int64_t res = (int64_t)a + b;
 +    uint8_t round = get_round(vxrm, res, 1);
 +
 +    return (res >> 1) + round;
 +}
 +
 +static inline int64_t aadd64(CPURISCVState *env, int vxrm, int64_t a, int64_t b)
 +{
 +    int64_t res = a + b;
 +    uint8_t round = get_round(vxrm, res, 1);
 +    int64_t over = (res ^ a) & (res ^ b) & INT64_MIN;
 +
 +    /* With signed overflow, bit 64 is inverse of bit 63. */
 +    return ((res >> 1) ^ over) + round;
 +}
 +
 +RVVCALL(OPIVV2_RM, vaadd_vv_b, OP_SSS_B, H1, H1, H1, aadd32)
 +RVVCALL(OPIVV2_RM, vaadd_vv_h, OP_SSS_H, H2, H2, H2, aadd32)
 +RVVCALL(OPIVV2_RM, vaadd_vv_w, OP_SSS_W, H4, H4, H4, aadd32)
 +RVVCALL(OPIVV2_RM, vaadd_vv_d, OP_SSS_D, H8, H8, H8, aadd64)
 +GEN_VEXT_VV_RM(vaadd_vv_b, 1, 1, clearb)
 +GEN_VEXT_VV_RM(vaadd_vv_h, 2, 2, clearh)
 +GEN_VEXT_VV_RM(vaadd_vv_w, 4, 4, clearl)
 +GEN_VEXT_VV_RM(vaadd_vv_d, 8, 8, clearq)
 +
 +RVVCALL(OPIVX2_RM, vaadd_vx_b, OP_SSS_B, H1, H1, aadd32)
 +RVVCALL(OPIVX2_RM, vaadd_vx_h, OP_SSS_H, H2, H2, aadd32)
 +RVVCALL(OPIVX2_RM, vaadd_vx_w, OP_SSS_W, H4, H4, aadd32)
 +RVVCALL(OPIVX2_RM, vaadd_vx_d, OP_SSS_D, H8, H8, aadd64)
 +GEN_VEXT_VX_RM(vaadd_vx_b, 1, 1, clearb)
 +GEN_VEXT_VX_RM(vaadd_vx_h, 2, 2, clearh)
 +GEN_VEXT_VX_RM(vaadd_vx_w, 4, 4, clearl)
 +GEN_VEXT_VX_RM(vaadd_vx_d, 8, 8, clearq)
 +
 +static inline int32_t asub32(CPURISCVState *env, int vxrm, int32_t a, int32_t b)
 +{
 +    int64_t res = (int64_t)a - b;
 +    uint8_t round = get_round(vxrm, res, 1);
 +
 +    return (res >> 1) + round;
 +}
 +
 +static inline int64_t asub64(CPURISCVState *env, int vxrm, int64_t a, int64_t b)
 +{
 +    int64_t res = (int64_t)a - b;
 +    uint8_t round = get_round(vxrm, res, 1);
 +    int64_t over = (res ^ a) & (a ^ b) & INT64_MIN;
 +
 +    /* With signed overflow, bit 64 is inverse of bit 63. */
 +    return ((res >> 1) ^ over) + round;
 +}
 +
 +RVVCALL(OPIVV2_RM, vasub_vv_b, OP_SSS_B, H1, H1, H1, asub32)
 +RVVCALL(OPIVV2_RM, vasub_vv_h, OP_SSS_H, H2, H2, H2, asub32)
 +RVVCALL(OPIVV2_RM, vasub_vv_w, OP_SSS_W, H4, H4, H4, asub32)
 +RVVCALL(OPIVV2_RM, vasub_vv_d, OP_SSS_D, H8, H8, H8, asub64)
 +GEN_VEXT_VV_RM(vasub_vv_b, 1, 1, clearb)
 +GEN_VEXT_VV_RM(vasub_vv_h, 2, 2, clearh)
 +GEN_VEXT_VV_RM(vasub_vv_w, 4, 4, clearl)
 +GEN_VEXT_VV_RM(vasub_vv_d, 8, 8, clearq)
 +
 +RVVCALL(OPIVX2_RM, vasub_vx_b, OP_SSS_B, H1, H1, asub32)
 +RVVCALL(OPIVX2_RM, vasub_vx_h, OP_SSS_H, H2, H2, asub32)
 +RVVCALL(OPIVX2_RM, vasub_vx_w, OP_SSS_W, H4, H4, asub32)
 +RVVCALL(OPIVX2_RM, vasub_vx_d, OP_SSS_D, H8, H8, asub64)
 +GEN_VEXT_VX_RM(vasub_vx_b, 1, 1, clearb)
 +GEN_VEXT_VX_RM(vasub_vx_h, 2, 2, clearh)
 +GEN_VEXT_VX_RM(vasub_vx_w, 4, 4, clearl)
 +GEN_VEXT_VX_RM(vasub_vx_d, 8, 8, clearq)
 --
-.27.0
+.41.0

-[PULL 37/63] target/riscv: vector widening floating-point fused multiply-add instructions
+[PULL v2 44/45] target/riscv: Align the AIA model to v1.0 ratified spec
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Tommy Wu <tommy.wu@sifive.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+According to the new spec, when vsiselect has a reserved value, attempts
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+from M-mode or HS-mode to access vsireg, or from VS-mode to access
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+sireg, should preferably raise an illegal instruction exception.
-Message-id: 20200623215920.2594-36-zhiwei_liu@c-sky.com
 Signed-off-by: Tommy Wu <tommy.wu@sifive.com>
 Reviewed-by: Frank Chang <frank.chang@sifive.com>
 Message-ID: <20230816061647.600672-1-tommy.wu@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/helper.h                   | 17 +++++
+ target/riscv/csr.c | 7 +++++--
- target/riscv/insn32.decode              |  8 +++
+file changed, 5 insertions(+), 2 deletions(-)
  target/riscv/insn_trans/trans_rvv.inc.c | 10 +++
  target/riscv/vector_helper.c            | 91 +++++++++++++++++++++++++
 files changed, 126 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+diff --git a/target/riscv/csr.c b/target/riscv/csr.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
+--- a/target/riscv/csr.c
-+++ b/target/riscv/helper.h
++++ b/target/riscv/csr.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vfmsub_vf_d, void, ptr, ptr, i64, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ static int rmw_iprio(target_ulong xlen,
- DEF_HELPER_6(vfnmsub_vf_h, void, ptr, ptr, i64, ptr, env, i32)
+ static int rmw_xireg(CPURISCVState *env, int csrno, target_ulong *val,
- DEF_HELPER_6(vfnmsub_vf_w, void, ptr, ptr, i64, ptr, env, i32)
+                      target_ulong new_val, target_ulong wr_mask)
- DEF_HELPER_6(vfnmsub_vf_d, void, ptr, ptr, i64, ptr, env, i32)
+ {
-+
+-    bool virt;
-+DEF_HELPER_6(vfwmacc_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++    bool virt, isel_reserved;
-+DEF_HELPER_6(vfwmacc_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
+     uint8_t *iprio;
-+DEF_HELPER_6(vfwnmacc_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
+     int ret = -EINVAL;
-+DEF_HELPER_6(vfwnmacc_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
+     target_ulong priv, isel, vgein;
-+DEF_HELPER_6(vfwmsac_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ static int rmw_xireg(CPURISCVState *env, int csrno, target_ulong *val,
-+DEF_HELPER_6(vfwmsac_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfwnmsac_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
+     /* Decode register details from CSR number */
-+DEF_HELPER_6(vfwnmsac_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
+     virt = false;
-+DEF_HELPER_6(vfwmacc_vf_h, void, ptr, ptr, i64, ptr, env, i32)
++    isel_reserved = false;
-+DEF_HELPER_6(vfwmacc_vf_w, void, ptr, ptr, i64, ptr, env, i32)
+     switch (csrno) {
-+DEF_HELPER_6(vfwnmacc_vf_h, void, ptr, ptr, i64, ptr, env, i32)
+     case CSR_MIREG:
-+DEF_HELPER_6(vfwnmacc_vf_w, void, ptr, ptr, i64, ptr, env, i32)
+         iprio = env->miprio;
-+DEF_HELPER_6(vfwmsac_vf_h, void, ptr, ptr, i64, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ static int rmw_xireg(CPURISCVState *env, int csrno, target_ulong *val,
-+DEF_HELPER_6(vfwmsac_vf_w, void, ptr, ptr, i64, ptr, env, i32)
+                                                   riscv_cpu_mxl_bits(env)),
-+DEF_HELPER_6(vfwnmsac_vf_h, void, ptr, ptr, i64, ptr, env, i32)
+                                     val, new_val, wr_mask);
-+DEF_HELPER_6(vfwnmsac_vf_w, void, ptr, ptr, i64, ptr, env, i32)
+         }
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
++    } else {
-index XXXXXXX..XXXXXXX 100644
++        isel_reserved = true;
---- a/target/riscv/insn32.decode
+     }
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vfmsub_vv       101010 . ..... ..... 001 ..... 1010111 @r_vm
+ done:
- vfmsub_vf       101010 . ..... ..... 101 ..... 1010111 @r_vm
+     if (ret) {
- vfnmsub_vv      101011 . ..... ..... 001 ..... 1010111 @r_vm
+-        return (env->virt_enabled && virt) ?
- vfnmsub_vf      101011 . ..... ..... 101 ..... 1010111 @r_vm
++        return (env->virt_enabled && virt && !isel_reserved) ?
-+vfwmacc_vv      111100 . ..... ..... 001 ..... 1010111 @r_vm
+                RISCV_EXCP_VIRT_INSTRUCTION_FAULT : RISCV_EXCP_ILLEGAL_INST;
-+vfwmacc_vf      111100 . ..... ..... 101 ..... 1010111 @r_vm
+     }
-+vfwnmacc_vv     111101 . ..... ..... 001 ..... 1010111 @r_vm
+     return RISCV_EXCP_NONE;
 +vfwnmacc_vf     111101 . ..... ..... 101 ..... 1010111 @r_vm
 +vfwmsac_vv      111110 . ..... ..... 001 ..... 1010111 @r_vm
 +vfwmsac_vf      111110 . ..... ..... 101 ..... 1010111 @r_vm
 +vfwnmsac_vv     111111 . ..... ..... 001 ..... 1010111 @r_vm
 +vfwnmsac_vf     111111 . ..... ..... 101 ..... 1010111 @r_vm
  vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
  vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
 diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.inc.c
 +++ b/target/riscv/insn_trans/trans_rvv.inc.c
@@ -XXX,XX +XXX,XX @@ GEN_OPFVF_TRANS(vfmadd_vf, opfvf_check)
  GEN_OPFVF_TRANS(vfnmadd_vf, opfvf_check)
  GEN_OPFVF_TRANS(vfmsub_vf, opfvf_check)
  GEN_OPFVF_TRANS(vfnmsub_vf, opfvf_check)
 +
 +/* Vector Widening Floating-Point Fused Multiply-Add Instructions */
 +GEN_OPFVV_WIDEN_TRANS(vfwmacc_vv, opfvv_widen_check)
 +GEN_OPFVV_WIDEN_TRANS(vfwnmacc_vv, opfvv_widen_check)
 +GEN_OPFVV_WIDEN_TRANS(vfwmsac_vv, opfvv_widen_check)
 +GEN_OPFVV_WIDEN_TRANS(vfwnmsac_vv, opfvv_widen_check)
 +GEN_OPFVF_WIDEN_TRANS(vfwmacc_vf)
 +GEN_OPFVF_WIDEN_TRANS(vfwnmacc_vf)
 +GEN_OPFVF_WIDEN_TRANS(vfwmsac_vf)
 +GEN_OPFVF_WIDEN_TRANS(vfwnmsac_vf)
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ RVVCALL(OPFVF3, vfnmsub_vf_d, OP_UUU_D, H8, H8, fnmsub64)
  GEN_VEXT_VF(vfnmsub_vf_h, 2, 2, clearh)
  GEN_VEXT_VF(vfnmsub_vf_w, 4, 4, clearl)
  GEN_VEXT_VF(vfnmsub_vf_d, 8, 8, clearq)
 +
 +/* Vector Widening Floating-Point Fused Multiply-Add Instructions */
 +static uint32_t fwmacc16(uint16_t a, uint16_t b, uint32_t d, float_status *s)
 +{
 +    return float32_muladd(float16_to_float32(a, true, s),
 +                        float16_to_float32(b, true, s), d, 0, s);
 +}
 +
 +static uint64_t fwmacc32(uint32_t a, uint32_t b, uint64_t d, float_status *s)
 +{
 +    return float64_muladd(float32_to_float64(a, s),
 +                        float32_to_float64(b, s), d, 0, s);
 +}
 +
 +RVVCALL(OPFVV3, vfwmacc_vv_h, WOP_UUU_H, H4, H2, H2, fwmacc16)
 +RVVCALL(OPFVV3, vfwmacc_vv_w, WOP_UUU_W, H8, H4, H4, fwmacc32)
 +GEN_VEXT_VV_ENV(vfwmacc_vv_h, 2, 4, clearl)
 +GEN_VEXT_VV_ENV(vfwmacc_vv_w, 4, 8, clearq)
 +RVVCALL(OPFVF3, vfwmacc_vf_h, WOP_UUU_H, H4, H2, fwmacc16)
 +RVVCALL(OPFVF3, vfwmacc_vf_w, WOP_UUU_W, H8, H4, fwmacc32)
 +GEN_VEXT_VF(vfwmacc_vf_h, 2, 4, clearl)
 +GEN_VEXT_VF(vfwmacc_vf_w, 4, 8, clearq)
 +
 +static uint32_t fwnmacc16(uint16_t a, uint16_t b, uint32_t d, float_status *s)
 +{
 +    return float32_muladd(float16_to_float32(a, true, s),
 +                        float16_to_float32(b, true, s), d,
 +                        float_muladd_negate_c | float_muladd_negate_product, s);
 +}
 +
 +static uint64_t fwnmacc32(uint32_t a, uint32_t b, uint64_t d, float_status *s)
 +{
 +    return float64_muladd(float32_to_float64(a, s),
 +                        float32_to_float64(b, s), d,
 +                        float_muladd_negate_c | float_muladd_negate_product, s);
 +}
 +
 +RVVCALL(OPFVV3, vfwnmacc_vv_h, WOP_UUU_H, H4, H2, H2, fwnmacc16)
 +RVVCALL(OPFVV3, vfwnmacc_vv_w, WOP_UUU_W, H8, H4, H4, fwnmacc32)
 +GEN_VEXT_VV_ENV(vfwnmacc_vv_h, 2, 4, clearl)
 +GEN_VEXT_VV_ENV(vfwnmacc_vv_w, 4, 8, clearq)
 +RVVCALL(OPFVF3, vfwnmacc_vf_h, WOP_UUU_H, H4, H2, fwnmacc16)
 +RVVCALL(OPFVF3, vfwnmacc_vf_w, WOP_UUU_W, H8, H4, fwnmacc32)
 +GEN_VEXT_VF(vfwnmacc_vf_h, 2, 4, clearl)
 +GEN_VEXT_VF(vfwnmacc_vf_w, 4, 8, clearq)
 +
 +static uint32_t fwmsac16(uint16_t a, uint16_t b, uint32_t d, float_status *s)
 +{
 +    return float32_muladd(float16_to_float32(a, true, s),
 +                        float16_to_float32(b, true, s), d,
 +                        float_muladd_negate_c, s);
 +}
 +
 +static uint64_t fwmsac32(uint32_t a, uint32_t b, uint64_t d, float_status *s)
 +{
 +    return float64_muladd(float32_to_float64(a, s),
 +                        float32_to_float64(b, s), d,
 +                        float_muladd_negate_c, s);
 +}
 +
 +RVVCALL(OPFVV3, vfwmsac_vv_h, WOP_UUU_H, H4, H2, H2, fwmsac16)
 +RVVCALL(OPFVV3, vfwmsac_vv_w, WOP_UUU_W, H8, H4, H4, fwmsac32)
 +GEN_VEXT_VV_ENV(vfwmsac_vv_h, 2, 4, clearl)
 +GEN_VEXT_VV_ENV(vfwmsac_vv_w, 4, 8, clearq)
 +RVVCALL(OPFVF3, vfwmsac_vf_h, WOP_UUU_H, H4, H2, fwmsac16)
 +RVVCALL(OPFVF3, vfwmsac_vf_w, WOP_UUU_W, H8, H4, fwmsac32)
 +GEN_VEXT_VF(vfwmsac_vf_h, 2, 4, clearl)
 +GEN_VEXT_VF(vfwmsac_vf_w, 4, 8, clearq)
 +
 +static uint32_t fwnmsac16(uint16_t a, uint16_t b, uint32_t d, float_status *s)
 +{
 +    return float32_muladd(float16_to_float32(a, true, s),
 +                        float16_to_float32(b, true, s), d,
 +                        float_muladd_negate_product, s);
 +}
 +
 +static uint64_t fwnmsac32(uint32_t a, uint32_t b, uint64_t d, float_status *s)
 +{
 +    return float64_muladd(float32_to_float64(a, s),
 +                        float32_to_float64(b, s), d,
 +                        float_muladd_negate_product, s);
 +}
 +
 +RVVCALL(OPFVV3, vfwnmsac_vv_h, WOP_UUU_H, H4, H2, H2, fwnmsac16)
 +RVVCALL(OPFVV3, vfwnmsac_vv_w, WOP_UUU_W, H8, H4, H4, fwnmsac32)
 +GEN_VEXT_VV_ENV(vfwnmsac_vv_h, 2, 4, clearl)
 +GEN_VEXT_VV_ENV(vfwnmsac_vv_w, 4, 8, clearq)
 +RVVCALL(OPFVF3, vfwnmsac_vf_h, WOP_UUU_H, H4, H2, fwnmsac16)
 +RVVCALL(OPFVF3, vfwnmsac_vf_w, WOP_UUU_W, H8, H4, fwnmsac32)
 +GEN_VEXT_VF(vfwnmsac_vf_h, 2, 4, clearl)
 +GEN_VEXT_VF(vfwnmsac_vf_w, 4, 8, clearq)
 --
-.27.0
+.41.0

-[PULL 03/63] target/riscv: add vector extension field in CPURISCVState
+[PULL v2 45/45] target/riscv: don't read CSR in riscv_csrrw_do64
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
+From: Nikita Shubin <n.shubin@yadro.com>
-The 32 vector registers will be viewed as a continuous memory block.
+As per ISA:
 It avoids the convension between element index and (regno, offset).
 Thus elements can be directly accessed by offset from the first vector
 base address.
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
+"For CSRRWI, if rd=x0, then the instruction shall not read the CSR and
-Acked-by: Alistair Francis <alistair.francis@wdc.com>
+shall not cause any of the side effects that might occur on a CSR read."
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200623215920.2594-2-zhiwei_liu@c-sky.com
+trans_csrrwi() and trans_csrrw() call do_csrw() if rd=x0, do_csrw() calls
 riscv_csrrw_do64(), via helper_csrw() passing NULL as *ret_value.
 Signed-off-by: Nikita Shubin <n.shubin@yadro.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
 Message-ID: <20230808090914.17634-1-nikita.shubin@maquefel.me>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/cpu.h       | 12 ++++++++++++
+ target/riscv/csr.c | 24 +++++++++++++++---------
- target/riscv/translate.c |  3 ++-
+file changed, 15 insertions(+), 9 deletions(-)
 files changed, 14 insertions(+), 1 deletion(-)
-diff --git a/target/riscv/cpu.h b/target/riscv/cpu.h
+diff --git a/target/riscv/csr.c b/target/riscv/csr.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/cpu.h
+--- a/target/riscv/csr.c
-+++ b/target/riscv/cpu.h
++++ b/target/riscv/csr.c
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ static RISCVException riscv_csrrw_do64(CPURISCVState *env, int csrno,
- #define RVA RV('A')
+                                        target_ulong write_mask)
- #define RVF RV('F')
+ {
- #define RVD RV('D')
+     RISCVException ret;
-+#define RVV RV('V')
+-    target_ulong old_value;
- #define RVC RV('C')
++    target_ulong old_value = 0;
- #define RVS RV('S')
- #define RVU RV('U')
+     /* execute combined read/write operation if it exists */
-@@ -XXX,XX +XXX,XX @@ typedef struct CPURISCVState CPURISCVState;
+     if (csr_ops[csrno].op) {
+         return csr_ops[csrno].op(env, csrno, ret_value, new_value, write_mask);
  #include "pmp.h"
 +#define RV_VLEN_MAX 512
 +
  struct CPURISCVState {
      target_ulong gpr[32];
      uint64_t fpr[32]; /* assume both F and D extensions */
 +
 +    /* vector coprocessor state. */
 +    uint64_t vreg[32 * RV_VLEN_MAX / 64] QEMU_ALIGNED(16);
 +    target_ulong vxrm;
 +    target_ulong vxsat;
 +    target_ulong vl;
 +    target_ulong vstart;
 +    target_ulong vtype;
 +
      target_ulong pc;
      target_ulong load_res;
      target_ulong load_val;
 diff --git a/target/riscv/translate.c b/target/riscv/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/translate.c
 +++ b/target/riscv/translate.c
@@ -XXX,XX +XXX,XX @@
  #include "instmap.h"
  /* global register indices */
 -static TCGv cpu_gpr[32], cpu_pc;
 +static TCGv cpu_gpr[32], cpu_pc, cpu_vl;
  static TCGv_i64 cpu_fpr[32]; /* assume F and D extensions */
  static TCGv load_res;
  static TCGv load_val;
@@ -XXX,XX +XXX,XX @@ void riscv_translate_init(void)
      }
-     cpu_pc = tcg_global_mem_new(cpu_env, offsetof(CPURISCVState, pc), "pc");
+-    /* if no accessor exists then return failure */
-+    cpu_vl = tcg_global_mem_new(cpu_env, offsetof(CPURISCVState, vl), "vl");
+-    if (!csr_ops[csrno].read) {
-     load_res = tcg_global_mem_new(cpu_env, offsetof(CPURISCVState, load_res),
+-        return RISCV_EXCP_ILLEGAL_INST;
-                              "load_res");
+-    }
-     load_val = tcg_global_mem_new(cpu_env, offsetof(CPURISCVState, load_val),
+-    /* read old value */
 -    ret = csr_ops[csrno].read(env, csrno, &old_value);
 -    if (ret != RISCV_EXCP_NONE) {
 -        return ret;
 +    /*
 +     * ret_value == NULL means that rd=x0 and we're coming from helper_csrw()
 +     * and we can't throw side effects caused by CSR reads.
 +     */
 +    if (ret_value) {
 +        /* if no accessor exists then return failure */
 +        if (!csr_ops[csrno].read) {
 +            return RISCV_EXCP_ILLEGAL_INST;
 +        }
 +        /* read old value */
 +        ret = csr_ops[csrno].read(env, csrno, &old_value);
 +        if (ret != RISCV_EXCP_NONE) {
 +            return ret;
 +        }
      }
      /* write value if writable and write mask set, otherwise drop writes */
 --
-.27.0
+.41.0

-[PULL 07/63] target/riscv: add an internals.h header
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-The internals.h keeps things that are not relevant to the actual architecture,
-only to the implementation, separate.
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200623215920.2594-6-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/internals.h | 24 ++++++++++++++++++++++++
-file changed, 24 insertions(+)
- create mode 100644 target/riscv/internals.h
-diff --git a/target/riscv/internals.h b/target/riscv/internals.h
-new file mode 100644
-index XXXXXXX..XXXXXXX
---- /dev/null
-+++ b/target/riscv/internals.h
-@@ -XXX,XX +XXX,XX @@
-+/*
-+ * QEMU RISC-V CPU -- internal functions and types
-+ *
-+ * Copyright (c) 2020 T-Head Semiconductor Co., Ltd. All rights reserved.
-+ *
-+ * This program is free software; you can redistribute it and/or modify it
-+ * under the terms and conditions of the GNU General Public License,
-+ * version 2 or later, as published by the Free Software Foundation.
-+ *
-+ * This program is distributed in the hope it will be useful, but WITHOUT
-+ * ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
-+ * FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License for
-+ * more details.
-+ *
-+ * You should have received a copy of the GNU General Public License along with
-+ * this program.  If not, see <http://www.gnu.org/licenses/>.
-+ */
-+
-+#ifndef RISCV_CPU_INTERNALS_H
-+#define RISCV_CPU_INTERNALS_H
-+
-+#include "hw/registerfields.h"
-+
-+#endif
---
-.27.0

-[PULL 09/63] target/riscv: add vector index load and store instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Vector indexed operations add the contents of each element of the
-vector offset operand specified by vs2 to the base effective address
-to give the effective address of each element.
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200623215920.2594-8-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   |  35 +++++++
- target/riscv/insn32.decode              |  13 +++
- target/riscv/insn_trans/trans_rvv.inc.c | 129 ++++++++++++++++++++++++
- target/riscv/vector_helper.c            | 116 +++++++++++++++++++++
-files changed, 293 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vsse_v_b, void, ptr, ptr, tl, tl, env, i32)
- DEF_HELPER_6(vsse_v_h, void, ptr, ptr, tl, tl, env, i32)
- DEF_HELPER_6(vsse_v_w, void, ptr, ptr, tl, tl, env, i32)
- DEF_HELPER_6(vsse_v_d, void, ptr, ptr, tl, tl, env, i32)
-+DEF_HELPER_6(vlxb_v_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vlxb_v_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vlxb_v_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vlxb_v_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vlxh_v_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vlxh_v_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vlxh_v_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vlxw_v_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vlxw_v_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vlxe_v_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vlxe_v_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vlxe_v_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vlxe_v_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vlxbu_v_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vlxbu_v_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vlxbu_v_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vlxbu_v_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vlxhu_v_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vlxhu_v_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vlxhu_v_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vlxwu_v_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vlxwu_v_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vsxb_v_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vsxb_v_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vsxb_v_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vsxb_v_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vsxh_v_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vsxh_v_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vsxh_v_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vsxw_v_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vsxw_v_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vsxe_v_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vsxe_v_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vsxe_v_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vsxe_v_d, void, ptr, ptr, tl, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vssh_v     ... 010 . ..... ..... 101 ..... 0100111 @r_nfvm
- vssw_v     ... 010 . ..... ..... 110 ..... 0100111 @r_nfvm
- vsse_v     ... 010 . ..... ..... 111 ..... 0100111 @r_nfvm
-+vlxb_v     ... 111 . ..... ..... 000 ..... 0000111 @r_nfvm
-+vlxh_v     ... 111 . ..... ..... 101 ..... 0000111 @r_nfvm
-+vlxw_v     ... 111 . ..... ..... 110 ..... 0000111 @r_nfvm
-+vlxe_v     ... 011 . ..... ..... 111 ..... 0000111 @r_nfvm
-+vlxbu_v    ... 011 . ..... ..... 000 ..... 0000111 @r_nfvm
-+vlxhu_v    ... 011 . ..... ..... 101 ..... 0000111 @r_nfvm
-+vlxwu_v    ... 011 . ..... ..... 110 ..... 0000111 @r_nfvm
-+# Vector ordered-indexed and unordered-indexed store insns.
-+vsxb_v     ... -11 . ..... ..... 000 ..... 0100111 @r_nfvm
-+vsxh_v     ... -11 . ..... ..... 101 ..... 0100111 @r_nfvm
-+vsxw_v     ... -11 . ..... ..... 110 ..... 0100111 @r_nfvm
-+vsxe_v     ... -11 . ..... ..... 111 ..... 0100111 @r_nfvm
-+
- # *** new major opcode OP-V ***
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_TRANS(vssb_v, 0, rnfvm, st_stride_op, st_stride_check)
- GEN_VEXT_TRANS(vssh_v, 1, rnfvm, st_stride_op, st_stride_check)
- GEN_VEXT_TRANS(vssw_v, 2, rnfvm, st_stride_op, st_stride_check)
- GEN_VEXT_TRANS(vsse_v, 3, rnfvm, st_stride_op, st_stride_check)
-+
-+/*
-+ *** index load and store
-+ */
-+typedef void gen_helper_ldst_index(TCGv_ptr, TCGv_ptr, TCGv,
-+                                   TCGv_ptr, TCGv_env, TCGv_i32);
-+
-+static bool ldst_index_trans(uint32_t vd, uint32_t rs1, uint32_t vs2,
-+                             uint32_t data, gen_helper_ldst_index *fn,
-+                             DisasContext *s)
-+{
-+    TCGv_ptr dest, mask, index;
-+    TCGv base;
-+    TCGv_i32 desc;
-+
-+    TCGLabel *over = gen_new_label();
-+    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
-+
-+    dest = tcg_temp_new_ptr();
-+    mask = tcg_temp_new_ptr();
-+    index = tcg_temp_new_ptr();
-+    base = tcg_temp_new();
-+    desc = tcg_const_i32(simd_desc(0, s->vlen / 8, data));
-+
-+    gen_get_gpr(base, rs1);
-+    tcg_gen_addi_ptr(dest, cpu_env, vreg_ofs(s, vd));
-+    tcg_gen_addi_ptr(index, cpu_env, vreg_ofs(s, vs2));
-+    tcg_gen_addi_ptr(mask, cpu_env, vreg_ofs(s, 0));
-+
-+    fn(dest, mask, base, index, cpu_env, desc);
-+
-+    tcg_temp_free_ptr(dest);
-+    tcg_temp_free_ptr(mask);
-+    tcg_temp_free_ptr(index);
-+    tcg_temp_free(base);
-+    tcg_temp_free_i32(desc);
-+    gen_set_label(over);
-+    return true;
-+}
-+
-+static bool ld_index_op(DisasContext *s, arg_rnfvm *a, uint8_t seq)
-+{
-+    uint32_t data = 0;
-+    gen_helper_ldst_index *fn;
-+    static gen_helper_ldst_index * const fns[7][4] = {
-+        { gen_helper_vlxb_v_b,  gen_helper_vlxb_v_h,
-+          gen_helper_vlxb_v_w,  gen_helper_vlxb_v_d },
-+        { NULL,                 gen_helper_vlxh_v_h,
-+          gen_helper_vlxh_v_w,  gen_helper_vlxh_v_d },
-+        { NULL,                 NULL,
-+          gen_helper_vlxw_v_w,  gen_helper_vlxw_v_d },
-+        { gen_helper_vlxe_v_b,  gen_helper_vlxe_v_h,
-+          gen_helper_vlxe_v_w,  gen_helper_vlxe_v_d },
-+        { gen_helper_vlxbu_v_b, gen_helper_vlxbu_v_h,
-+          gen_helper_vlxbu_v_w, gen_helper_vlxbu_v_d },
-+        { NULL,                 gen_helper_vlxhu_v_h,
-+          gen_helper_vlxhu_v_w, gen_helper_vlxhu_v_d },
-+        { NULL,                 NULL,
-+          gen_helper_vlxwu_v_w, gen_helper_vlxwu_v_d },
-+    };
-+
-+    fn =  fns[seq][s->sew];
-+    if (fn == NULL) {
-+        return false;
-+    }
-+
-+    data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
-+    data = FIELD_DP32(data, VDATA, VM, a->vm);
-+    data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
-+    data = FIELD_DP32(data, VDATA, NF, a->nf);
-+    return ldst_index_trans(a->rd, a->rs1, a->rs2, data, fn, s);
-+}
-+
-+static bool ld_index_check(DisasContext *s, arg_rnfvm* a)
-+{
-+    return (vext_check_isa_ill(s) &&
-+            vext_check_overlap_mask(s, a->rd, a->vm, false) &&
-+            vext_check_reg(s, a->rd, false) &&
-+            vext_check_reg(s, a->rs2, false) &&
-+            vext_check_nf(s, a->nf));
-+}
-+
-+GEN_VEXT_TRANS(vlxb_v, 0, rnfvm, ld_index_op, ld_index_check)
-+GEN_VEXT_TRANS(vlxh_v, 1, rnfvm, ld_index_op, ld_index_check)
-+GEN_VEXT_TRANS(vlxw_v, 2, rnfvm, ld_index_op, ld_index_check)
-+GEN_VEXT_TRANS(vlxe_v, 3, rnfvm, ld_index_op, ld_index_check)
-+GEN_VEXT_TRANS(vlxbu_v, 4, rnfvm, ld_index_op, ld_index_check)
-+GEN_VEXT_TRANS(vlxhu_v, 5, rnfvm, ld_index_op, ld_index_check)
-+GEN_VEXT_TRANS(vlxwu_v, 6, rnfvm, ld_index_op, ld_index_check)
-+
-+static bool st_index_op(DisasContext *s, arg_rnfvm *a, uint8_t seq)
-+{
-+    uint32_t data = 0;
-+    gen_helper_ldst_index *fn;
-+    static gen_helper_ldst_index * const fns[4][4] = {
-+        { gen_helper_vsxb_v_b,  gen_helper_vsxb_v_h,
-+          gen_helper_vsxb_v_w,  gen_helper_vsxb_v_d },
-+        { NULL,                 gen_helper_vsxh_v_h,
-+          gen_helper_vsxh_v_w,  gen_helper_vsxh_v_d },
-+        { NULL,                 NULL,
-+          gen_helper_vsxw_v_w,  gen_helper_vsxw_v_d },
-+        { gen_helper_vsxe_v_b,  gen_helper_vsxe_v_h,
-+          gen_helper_vsxe_v_w,  gen_helper_vsxe_v_d }
-+    };
-+
-+    fn =  fns[seq][s->sew];
-+    if (fn == NULL) {
-+        return false;
-+    }
-+
-+    data = FIELD_DP32(data, VDATA, MLEN, s->mlen);
-+    data = FIELD_DP32(data, VDATA, VM, a->vm);
-+    data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
-+    data = FIELD_DP32(data, VDATA, NF, a->nf);
-+    return ldst_index_trans(a->rd, a->rs1, a->rs2, data, fn, s);
-+}
-+
-+static bool st_index_check(DisasContext *s, arg_rnfvm* a)
-+{
-+    return (vext_check_isa_ill(s) &&
-+            vext_check_reg(s, a->rd, false) &&
-+            vext_check_reg(s, a->rs2, false) &&
-+            vext_check_nf(s, a->nf));
-+}
-+
-+GEN_VEXT_TRANS(vsxb_v, 0, rnfvm, st_index_op, st_index_check)
-+GEN_VEXT_TRANS(vsxh_v, 1, rnfvm, st_index_op, st_index_check)
-+GEN_VEXT_TRANS(vsxw_v, 2, rnfvm, st_index_op, st_index_check)
-+GEN_VEXT_TRANS(vsxe_v, 3, rnfvm, st_index_op, st_index_check)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_ST_US(vse_v_b, int8_t,  int8_t , ste_b)
- GEN_VEXT_ST_US(vse_v_h, int16_t, int16_t, ste_h)
- GEN_VEXT_ST_US(vse_v_w, int32_t, int32_t, ste_w)
- GEN_VEXT_ST_US(vse_v_d, int64_t, int64_t, ste_d)
-+
-+/*
-+ *** index: access vector element from indexed memory
-+ */
-+typedef target_ulong vext_get_index_addr(target_ulong base,
-+        uint32_t idx, void *vs2);
-+
-+#define GEN_VEXT_GET_INDEX_ADDR(NAME, ETYPE, H)        \
-+static target_ulong NAME(target_ulong base,            \
-+                         uint32_t idx, void *vs2)      \
-+{                                                      \
-+    return (base + *((ETYPE *)vs2 + H(idx)));          \
-+}
-+
-+GEN_VEXT_GET_INDEX_ADDR(idx_b, int8_t,  H1)
-+GEN_VEXT_GET_INDEX_ADDR(idx_h, int16_t, H2)
-+GEN_VEXT_GET_INDEX_ADDR(idx_w, int32_t, H4)
-+GEN_VEXT_GET_INDEX_ADDR(idx_d, int64_t, H8)
-+
-+static inline void
-+vext_ldst_index(void *vd, void *v0, target_ulong base,
-+                void *vs2, CPURISCVState *env, uint32_t desc,
-+                vext_get_index_addr get_index_addr,
-+                vext_ldst_elem_fn *ldst_elem,
-+                clear_fn *clear_elem,
-+                uint32_t esz, uint32_t msz, uintptr_t ra,
-+                MMUAccessType access_type)
-+{
-+    uint32_t i, k;
-+    uint32_t nf = vext_nf(desc);
-+    uint32_t vm = vext_vm(desc);
-+    uint32_t mlen = vext_mlen(desc);
-+    uint32_t vlmax = vext_maxsz(desc) / esz;
-+
-+    /* probe every access*/
-+    for (i = 0; i < env->vl; i++) {
-+        if (!vm && !vext_elem_mask(v0, mlen, i)) {
-+            continue;
-+        }
-+        probe_pages(env, get_index_addr(base, i, vs2), nf * msz, ra,
-+                    access_type);
-+    }
-+    /* load bytes from guest memory */
-+    for (i = 0; i < env->vl; i++) {
-+        k = 0;
-+        if (!vm && !vext_elem_mask(v0, mlen, i)) {
-+            continue;
-+        }
-+        while (k < nf) {
-+            abi_ptr addr = get_index_addr(base, i, vs2) + k * msz;
-+            ldst_elem(env, addr, i + k * vlmax, vd, ra);
-+            k++;
-+        }
-+    }
-+    /* clear tail elements */
-+    if (clear_elem) {
-+        for (k = 0; k < nf; k++) {
-+            clear_elem(vd, env->vl + k * vlmax, env->vl * esz, vlmax * esz);
-+        }
-+    }
-+}
-+
-+#define GEN_VEXT_LD_INDEX(NAME, MTYPE, ETYPE, INDEX_FN, LOAD_FN, CLEAR_FN) \
-+void HELPER(NAME)(void *vd, void *v0, target_ulong base,                   \
-+                  void *vs2, CPURISCVState *env, uint32_t desc)            \
-+{                                                                          \
-+    vext_ldst_index(vd, v0, base, vs2, env, desc, INDEX_FN,                \
-+                    LOAD_FN, CLEAR_FN, sizeof(ETYPE), sizeof(MTYPE),       \
-+                    GETPC(), MMU_DATA_LOAD);                               \
-+}
-+
-+GEN_VEXT_LD_INDEX(vlxb_v_b,  int8_t,   int8_t,   idx_b, ldb_b,  clearb)
-+GEN_VEXT_LD_INDEX(vlxb_v_h,  int8_t,   int16_t,  idx_h, ldb_h,  clearh)
-+GEN_VEXT_LD_INDEX(vlxb_v_w,  int8_t,   int32_t,  idx_w, ldb_w,  clearl)
-+GEN_VEXT_LD_INDEX(vlxb_v_d,  int8_t,   int64_t,  idx_d, ldb_d,  clearq)
-+GEN_VEXT_LD_INDEX(vlxh_v_h,  int16_t,  int16_t,  idx_h, ldh_h,  clearh)
-+GEN_VEXT_LD_INDEX(vlxh_v_w,  int16_t,  int32_t,  idx_w, ldh_w,  clearl)
-+GEN_VEXT_LD_INDEX(vlxh_v_d,  int16_t,  int64_t,  idx_d, ldh_d,  clearq)
-+GEN_VEXT_LD_INDEX(vlxw_v_w,  int32_t,  int32_t,  idx_w, ldw_w,  clearl)
-+GEN_VEXT_LD_INDEX(vlxw_v_d,  int32_t,  int64_t,  idx_d, ldw_d,  clearq)
-+GEN_VEXT_LD_INDEX(vlxe_v_b,  int8_t,   int8_t,   idx_b, lde_b,  clearb)
-+GEN_VEXT_LD_INDEX(vlxe_v_h,  int16_t,  int16_t,  idx_h, lde_h,  clearh)
-+GEN_VEXT_LD_INDEX(vlxe_v_w,  int32_t,  int32_t,  idx_w, lde_w,  clearl)
-+GEN_VEXT_LD_INDEX(vlxe_v_d,  int64_t,  int64_t,  idx_d, lde_d,  clearq)
-+GEN_VEXT_LD_INDEX(vlxbu_v_b, uint8_t,  uint8_t,  idx_b, ldbu_b, clearb)
-+GEN_VEXT_LD_INDEX(vlxbu_v_h, uint8_t,  uint16_t, idx_h, ldbu_h, clearh)
-+GEN_VEXT_LD_INDEX(vlxbu_v_w, uint8_t,  uint32_t, idx_w, ldbu_w, clearl)
-+GEN_VEXT_LD_INDEX(vlxbu_v_d, uint8_t,  uint64_t, idx_d, ldbu_d, clearq)
-+GEN_VEXT_LD_INDEX(vlxhu_v_h, uint16_t, uint16_t, idx_h, ldhu_h, clearh)
-+GEN_VEXT_LD_INDEX(vlxhu_v_w, uint16_t, uint32_t, idx_w, ldhu_w, clearl)
-+GEN_VEXT_LD_INDEX(vlxhu_v_d, uint16_t, uint64_t, idx_d, ldhu_d, clearq)
-+GEN_VEXT_LD_INDEX(vlxwu_v_w, uint32_t, uint32_t, idx_w, ldwu_w, clearl)
-+GEN_VEXT_LD_INDEX(vlxwu_v_d, uint32_t, uint64_t, idx_d, ldwu_d, clearq)
-+
-+#define GEN_VEXT_ST_INDEX(NAME, MTYPE, ETYPE, INDEX_FN, STORE_FN)\
-+void HELPER(NAME)(void *vd, void *v0, target_ulong base,         \
-+                  void *vs2, CPURISCVState *env, uint32_t desc)  \
-+{                                                                \
-+    vext_ldst_index(vd, v0, base, vs2, env, desc, INDEX_FN,      \
-+                    STORE_FN, NULL, sizeof(ETYPE), sizeof(MTYPE),\
-+                    GETPC(), MMU_DATA_STORE);                    \
-+}
-+
-+GEN_VEXT_ST_INDEX(vsxb_v_b, int8_t,  int8_t,  idx_b, stb_b)
-+GEN_VEXT_ST_INDEX(vsxb_v_h, int8_t,  int16_t, idx_h, stb_h)
-+GEN_VEXT_ST_INDEX(vsxb_v_w, int8_t,  int32_t, idx_w, stb_w)
-+GEN_VEXT_ST_INDEX(vsxb_v_d, int8_t,  int64_t, idx_d, stb_d)
-+GEN_VEXT_ST_INDEX(vsxh_v_h, int16_t, int16_t, idx_h, sth_h)
-+GEN_VEXT_ST_INDEX(vsxh_v_w, int16_t, int32_t, idx_w, sth_w)
-+GEN_VEXT_ST_INDEX(vsxh_v_d, int16_t, int64_t, idx_d, sth_d)
-+GEN_VEXT_ST_INDEX(vsxw_v_w, int32_t, int32_t, idx_w, stw_w)
-+GEN_VEXT_ST_INDEX(vsxw_v_d, int32_t, int64_t, idx_d, stw_d)
-+GEN_VEXT_ST_INDEX(vsxe_v_b, int8_t,  int8_t,  idx_b, ste_b)
-+GEN_VEXT_ST_INDEX(vsxe_v_h, int16_t, int16_t, idx_h, ste_h)
-+GEN_VEXT_ST_INDEX(vsxe_v_w, int32_t, int32_t, idx_w, ste_w)
-+GEN_VEXT_ST_INDEX(vsxe_v_d, int64_t, int64_t, idx_d, ste_d)
---
-.27.0

-[PULL 15/63] target/riscv: vector bitwise logical instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-14-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   | 25 ++++++++++++
- target/riscv/insn32.decode              |  9 +++++
- target/riscv/insn_trans/trans_rvv.inc.c | 11 ++++++
- target/riscv/vector_helper.c            | 51 +++++++++++++++++++++++++
-files changed, 96 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vmsbc_vxm_b, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vmsbc_vxm_h, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vmsbc_vxm_w, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vmsbc_vxm_d, void, ptr, ptr, tl, ptr, env, i32)
-+
-+DEF_HELPER_6(vand_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vand_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vand_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vand_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vor_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vor_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vor_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vor_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vxor_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vxor_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vxor_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vxor_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vand_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vand_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vand_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vand_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vor_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vor_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vor_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vor_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vxor_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vxor_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vxor_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vxor_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vsbc_vvm        010010 1 ..... ..... 000 ..... 1010111 @r_vm_1
- vsbc_vxm        010010 1 ..... ..... 100 ..... 1010111 @r_vm_1
- vmsbc_vvm       010011 1 ..... ..... 000 ..... 1010111 @r_vm_1
- vmsbc_vxm       010011 1 ..... ..... 100 ..... 1010111 @r_vm_1
-+vand_vv         001001 . ..... ..... 000 ..... 1010111 @r_vm
-+vand_vx         001001 . ..... ..... 100 ..... 1010111 @r_vm
-+vand_vi         001001 . ..... ..... 011 ..... 1010111 @r_vm
-+vor_vv          001010 . ..... ..... 000 ..... 1010111 @r_vm
-+vor_vx          001010 . ..... ..... 100 ..... 1010111 @r_vm
-+vor_vi          001010 . ..... ..... 011 ..... 1010111 @r_vm
-+vxor_vv         001011 . ..... ..... 000 ..... 1010111 @r_vm
-+vxor_vx         001011 . ..... ..... 100 ..... 1010111 @r_vm
-+vxor_vi         001011 . ..... ..... 011 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmrr *a)                   \
- GEN_OPIVI_TRANS(vadc_vim, 0, vadc_vxm, opivx_vadc_check)
- GEN_OPIVI_TRANS(vmadc_vim, 0, vmadc_vxm, opivx_vmadc_check)
-+
-+/* Vector Bitwise Logical Instructions */
-+GEN_OPIVV_GVEC_TRANS(vand_vv, and)
-+GEN_OPIVV_GVEC_TRANS(vor_vv,  or)
-+GEN_OPIVV_GVEC_TRANS(vxor_vv, xor)
-+GEN_OPIVX_GVEC_TRANS(vand_vx, ands)
-+GEN_OPIVX_GVEC_TRANS(vor_vx,  ors)
-+GEN_OPIVX_GVEC_TRANS(vxor_vx, xors)
-+GEN_OPIVI_GVEC_TRANS(vand_vi, 0, vand_vx, andi)
-+GEN_OPIVI_GVEC_TRANS(vor_vi, 0, vor_vx,  ori)
-+GEN_OPIVI_GVEC_TRANS(vxor_vi, 0, vxor_vx, xori)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VMADC_VXM(vmsbc_vxm_b, uint8_t,  H1, DO_MSBC)
- GEN_VEXT_VMADC_VXM(vmsbc_vxm_h, uint16_t, H2, DO_MSBC)
- GEN_VEXT_VMADC_VXM(vmsbc_vxm_w, uint32_t, H4, DO_MSBC)
- GEN_VEXT_VMADC_VXM(vmsbc_vxm_d, uint64_t, H8, DO_MSBC)
-+
-+/* Vector Bitwise Logical Instructions */
-+RVVCALL(OPIVV2, vand_vv_b, OP_SSS_B, H1, H1, H1, DO_AND)
-+RVVCALL(OPIVV2, vand_vv_h, OP_SSS_H, H2, H2, H2, DO_AND)
-+RVVCALL(OPIVV2, vand_vv_w, OP_SSS_W, H4, H4, H4, DO_AND)
-+RVVCALL(OPIVV2, vand_vv_d, OP_SSS_D, H8, H8, H8, DO_AND)
-+RVVCALL(OPIVV2, vor_vv_b, OP_SSS_B, H1, H1, H1, DO_OR)
-+RVVCALL(OPIVV2, vor_vv_h, OP_SSS_H, H2, H2, H2, DO_OR)
-+RVVCALL(OPIVV2, vor_vv_w, OP_SSS_W, H4, H4, H4, DO_OR)
-+RVVCALL(OPIVV2, vor_vv_d, OP_SSS_D, H8, H8, H8, DO_OR)
-+RVVCALL(OPIVV2, vxor_vv_b, OP_SSS_B, H1, H1, H1, DO_XOR)
-+RVVCALL(OPIVV2, vxor_vv_h, OP_SSS_H, H2, H2, H2, DO_XOR)
-+RVVCALL(OPIVV2, vxor_vv_w, OP_SSS_W, H4, H4, H4, DO_XOR)
-+RVVCALL(OPIVV2, vxor_vv_d, OP_SSS_D, H8, H8, H8, DO_XOR)
-+GEN_VEXT_VV(vand_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV(vand_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV(vand_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV(vand_vv_d, 8, 8, clearq)
-+GEN_VEXT_VV(vor_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV(vor_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV(vor_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV(vor_vv_d, 8, 8, clearq)
-+GEN_VEXT_VV(vxor_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV(vxor_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV(vxor_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV(vxor_vv_d, 8, 8, clearq)
-+
-+RVVCALL(OPIVX2, vand_vx_b, OP_SSS_B, H1, H1, DO_AND)
-+RVVCALL(OPIVX2, vand_vx_h, OP_SSS_H, H2, H2, DO_AND)
-+RVVCALL(OPIVX2, vand_vx_w, OP_SSS_W, H4, H4, DO_AND)
-+RVVCALL(OPIVX2, vand_vx_d, OP_SSS_D, H8, H8, DO_AND)
-+RVVCALL(OPIVX2, vor_vx_b, OP_SSS_B, H1, H1, DO_OR)
-+RVVCALL(OPIVX2, vor_vx_h, OP_SSS_H, H2, H2, DO_OR)
-+RVVCALL(OPIVX2, vor_vx_w, OP_SSS_W, H4, H4, DO_OR)
-+RVVCALL(OPIVX2, vor_vx_d, OP_SSS_D, H8, H8, DO_OR)
-+RVVCALL(OPIVX2, vxor_vx_b, OP_SSS_B, H1, H1, DO_XOR)
-+RVVCALL(OPIVX2, vxor_vx_h, OP_SSS_H, H2, H2, DO_XOR)
-+RVVCALL(OPIVX2, vxor_vx_w, OP_SSS_W, H4, H4, DO_XOR)
-+RVVCALL(OPIVX2, vxor_vx_d, OP_SSS_D, H8, H8, DO_XOR)
-+GEN_VEXT_VX(vand_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX(vand_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX(vand_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX(vand_vx_d, 8, 8, clearq)
-+GEN_VEXT_VX(vor_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX(vor_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX(vor_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX(vor_vx_d, 8, 8, clearq)
-+GEN_VEXT_VX(vxor_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX(vxor_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX(vxor_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX(vxor_vx_d, 8, 8, clearq)
---
-.27.0

-[PULL 17/63] target/riscv: vector narrowing integer right shift instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-16-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   | 13 ++++
- target/riscv/insn32.decode              |  6 ++
- target/riscv/insn_trans/trans_rvv.inc.c | 90 +++++++++++++++++++++++++
- target/riscv/vector_helper.c            | 14 ++++
-files changed, 123 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vsra_vx_b, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vsra_vx_h, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vsra_vx_w, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vsra_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+
-+DEF_HELPER_6(vnsrl_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vnsrl_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vnsrl_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vnsra_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vnsra_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vnsra_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vnsrl_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vnsrl_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vnsrl_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vnsra_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vnsra_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vnsra_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vsrl_vi         101000 . ..... ..... 011 ..... 1010111 @r_vm
- vsra_vv         101001 . ..... ..... 000 ..... 1010111 @r_vm
- vsra_vx         101001 . ..... ..... 100 ..... 1010111 @r_vm
- vsra_vi         101001 . ..... ..... 011 ..... 1010111 @r_vm
-+vnsrl_vv        101100 . ..... ..... 000 ..... 1010111 @r_vm
-+vnsrl_vx        101100 . ..... ..... 100 ..... 1010111 @r_vm
-+vnsrl_vi        101100 . ..... ..... 011 ..... 1010111 @r_vm
-+vnsra_vv        101101 . ..... ..... 000 ..... 1010111 @r_vm
-+vnsra_vx        101101 . ..... ..... 100 ..... 1010111 @r_vm
-+vnsra_vi        101101 . ..... ..... 011 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPIVX_GVEC_SHIFT_TRANS(vsra_vx,  sars)
- GEN_OPIVI_GVEC_TRANS(vsll_vi, 1, vsll_vx,  shli)
- GEN_OPIVI_GVEC_TRANS(vsrl_vi, 1, vsrl_vx,  shri)
- GEN_OPIVI_GVEC_TRANS(vsra_vi, 1, vsra_vx,  sari)
-+
-+/* Vector Narrowing Integer Right Shift Instructions */
-+static bool opivv_narrow_check(DisasContext *s, arg_rmrr *a)
-+{
-+    return (vext_check_isa_ill(s) &&
-+            vext_check_overlap_mask(s, a->rd, a->vm, false) &&
-+            vext_check_reg(s, a->rd, false) &&
-+            vext_check_reg(s, a->rs2, true) &&
-+            vext_check_reg(s, a->rs1, false) &&
-+            vext_check_overlap_group(a->rd, 1 << s->lmul, a->rs2,
-+                2 << s->lmul) &&
-+            (s->lmul < 0x3) && (s->sew < 0x3));
-+}
-+
-+/* OPIVV with NARROW */
-+#define GEN_OPIVV_NARROW_TRANS(NAME)                               \
-+static bool trans_##NAME(DisasContext *s, arg_rmrr *a)             \
-+{                                                                  \
-+    if (opivv_narrow_check(s, a)) {                                \
-+        uint32_t data = 0;                                         \
-+        static gen_helper_gvec_4_ptr * const fns[3] = {            \
-+            gen_helper_##NAME##_b,                                 \
-+            gen_helper_##NAME##_h,                                 \
-+            gen_helper_##NAME##_w,                                 \
-+        };                                                         \
-+        TCGLabel *over = gen_new_label();                          \
-+        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
-+                                                                   \
-+        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);             \
-+        data = FIELD_DP32(data, VDATA, VM, a->vm);                 \
-+        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);             \
-+        tcg_gen_gvec_4_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),     \
-+                           vreg_ofs(s, a->rs1),                    \
-+                           vreg_ofs(s, a->rs2), cpu_env, 0,        \
-+                           s->vlen / 8, data, fns[s->sew]);        \
-+        gen_set_label(over);                                       \
-+        return true;                                               \
-+    }                                                              \
-+    return false;                                                  \
-+}
-+GEN_OPIVV_NARROW_TRANS(vnsra_vv)
-+GEN_OPIVV_NARROW_TRANS(vnsrl_vv)
-+
-+static bool opivx_narrow_check(DisasContext *s, arg_rmrr *a)
-+{
-+    return (vext_check_isa_ill(s) &&
-+            vext_check_overlap_mask(s, a->rd, a->vm, false) &&
-+            vext_check_reg(s, a->rd, false) &&
-+            vext_check_reg(s, a->rs2, true) &&
-+            vext_check_overlap_group(a->rd, 1 << s->lmul, a->rs2,
-+                2 << s->lmul) &&
-+            (s->lmul < 0x3) && (s->sew < 0x3));
-+}
-+
-+/* OPIVX with NARROW */
-+#define GEN_OPIVX_NARROW_TRANS(NAME)                                     \
-+static bool trans_##NAME(DisasContext *s, arg_rmrr *a)                   \
-+{                                                                        \
-+    if (opivx_narrow_check(s, a)) {                                      \
-+        static gen_helper_opivx * const fns[3] = {                       \
-+            gen_helper_##NAME##_b,                                       \
-+            gen_helper_##NAME##_h,                                       \
-+            gen_helper_##NAME##_w,                                       \
-+        };                                                               \
-+        return opivx_trans(a->rd, a->rs1, a->rs2, a->vm, fns[s->sew], s);\
-+    }                                                                    \
-+    return false;                                                        \
-+}
-+
-+GEN_OPIVX_NARROW_TRANS(vnsra_vx)
-+GEN_OPIVX_NARROW_TRANS(vnsrl_vx)
-+
-+/* OPIVI with NARROW */
-+#define GEN_OPIVI_NARROW_TRANS(NAME, ZX, OPIVX)                          \
-+static bool trans_##NAME(DisasContext *s, arg_rmrr *a)                   \
-+{                                                                        \
-+    if (opivx_narrow_check(s, a)) {                                      \
-+        static gen_helper_opivx * const fns[3] = {                       \
-+            gen_helper_##OPIVX##_b,                                      \
-+            gen_helper_##OPIVX##_h,                                      \
-+            gen_helper_##OPIVX##_w,                                      \
-+        };                                                               \
-+        return opivi_trans(a->rd, a->rs1, a->rs2, a->vm,                 \
-+                           fns[s->sew], s, ZX);                          \
-+    }                                                                    \
-+    return false;                                                        \
-+}
-+
-+GEN_OPIVI_NARROW_TRANS(vnsra_vi, 1, vnsra_vx)
-+GEN_OPIVI_NARROW_TRANS(vnsrl_vi, 1, vnsrl_vx)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_SHIFT_VX(vsra_vx_b, int8_t, int8_t, H1, H1, DO_SRL, 0x7, clearb)
- GEN_VEXT_SHIFT_VX(vsra_vx_h, int16_t, int16_t, H2, H2, DO_SRL, 0xf, clearh)
- GEN_VEXT_SHIFT_VX(vsra_vx_w, int32_t, int32_t, H4, H4, DO_SRL, 0x1f, clearl)
- GEN_VEXT_SHIFT_VX(vsra_vx_d, int64_t, int64_t, H8, H8, DO_SRL, 0x3f, clearq)
-+
-+/* Vector Narrowing Integer Right Shift Instructions */
-+GEN_VEXT_SHIFT_VV(vnsrl_vv_b, uint8_t,  uint16_t, H1, H2, DO_SRL, 0xf, clearb)
-+GEN_VEXT_SHIFT_VV(vnsrl_vv_h, uint16_t, uint32_t, H2, H4, DO_SRL, 0x1f, clearh)
-+GEN_VEXT_SHIFT_VV(vnsrl_vv_w, uint32_t, uint64_t, H4, H8, DO_SRL, 0x3f, clearl)
-+GEN_VEXT_SHIFT_VV(vnsra_vv_b, uint8_t,  int16_t, H1, H2, DO_SRL, 0xf, clearb)
-+GEN_VEXT_SHIFT_VV(vnsra_vv_h, uint16_t, int32_t, H2, H4, DO_SRL, 0x1f, clearh)
-+GEN_VEXT_SHIFT_VV(vnsra_vv_w, uint32_t, int64_t, H4, H8, DO_SRL, 0x3f, clearl)
-+GEN_VEXT_SHIFT_VX(vnsrl_vx_b, uint8_t, uint16_t, H1, H2, DO_SRL, 0xf, clearb)
-+GEN_VEXT_SHIFT_VX(vnsrl_vx_h, uint16_t, uint32_t, H2, H4, DO_SRL, 0x1f, clearh)
-+GEN_VEXT_SHIFT_VX(vnsrl_vx_w, uint32_t, uint64_t, H4, H8, DO_SRL, 0x3f, clearl)
-+GEN_VEXT_SHIFT_VX(vnsra_vx_b, int8_t, int16_t, H1, H2, DO_SRL, 0xf, clearb)
-+GEN_VEXT_SHIFT_VX(vnsra_vx_h, int16_t, int32_t, H2, H4, DO_SRL, 0x1f, clearh)
-+GEN_VEXT_SHIFT_VX(vnsra_vx_w, int32_t, int64_t, H4, H8, DO_SRL, 0x3f, clearl)
---
-.27.0

-[PULL 18/63] target/riscv: vector integer comparison instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-17-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   |  57 +++++++++++
- target/riscv/insn32.decode              |  20 ++++
- target/riscv/insn_trans/trans_rvv.inc.c |  46 +++++++++
- target/riscv/vector_helper.c            | 123 ++++++++++++++++++++++++
-files changed, 246 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vnsrl_vx_w, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vnsra_vx_b, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vnsra_vx_h, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vnsra_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+
-+DEF_HELPER_6(vmseq_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmseq_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmseq_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmseq_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmsne_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmsne_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmsne_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmsne_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmsltu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmsltu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmsltu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmsltu_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmslt_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmslt_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmslt_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmslt_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmsleu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmsleu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmsleu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmsleu_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmsle_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmsle_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmsle_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmsle_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmseq_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmseq_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmseq_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmseq_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsne_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsne_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsne_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsne_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsltu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsltu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsltu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsltu_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmslt_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmslt_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmslt_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmslt_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsleu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsleu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsleu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsleu_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsle_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsle_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsle_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsle_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsgtu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsgtu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsgtu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsgtu_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsgt_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsgt_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsgt_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmsgt_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vnsrl_vi        101100 . ..... ..... 011 ..... 1010111 @r_vm
- vnsra_vv        101101 . ..... ..... 000 ..... 1010111 @r_vm
- vnsra_vx        101101 . ..... ..... 100 ..... 1010111 @r_vm
- vnsra_vi        101101 . ..... ..... 011 ..... 1010111 @r_vm
-+vmseq_vv        011000 . ..... ..... 000 ..... 1010111 @r_vm
-+vmseq_vx        011000 . ..... ..... 100 ..... 1010111 @r_vm
-+vmseq_vi        011000 . ..... ..... 011 ..... 1010111 @r_vm
-+vmsne_vv        011001 . ..... ..... 000 ..... 1010111 @r_vm
-+vmsne_vx        011001 . ..... ..... 100 ..... 1010111 @r_vm
-+vmsne_vi        011001 . ..... ..... 011 ..... 1010111 @r_vm
-+vmsltu_vv       011010 . ..... ..... 000 ..... 1010111 @r_vm
-+vmsltu_vx       011010 . ..... ..... 100 ..... 1010111 @r_vm
-+vmslt_vv        011011 . ..... ..... 000 ..... 1010111 @r_vm
-+vmslt_vx        011011 . ..... ..... 100 ..... 1010111 @r_vm
-+vmsleu_vv       011100 . ..... ..... 000 ..... 1010111 @r_vm
-+vmsleu_vx       011100 . ..... ..... 100 ..... 1010111 @r_vm
-+vmsleu_vi       011100 . ..... ..... 011 ..... 1010111 @r_vm
-+vmsle_vv        011101 . ..... ..... 000 ..... 1010111 @r_vm
-+vmsle_vx        011101 . ..... ..... 100 ..... 1010111 @r_vm
-+vmsle_vi        011101 . ..... ..... 011 ..... 1010111 @r_vm
-+vmsgtu_vx       011110 . ..... ..... 100 ..... 1010111 @r_vm
-+vmsgtu_vi       011110 . ..... ..... 011 ..... 1010111 @r_vm
-+vmsgt_vx        011111 . ..... ..... 100 ..... 1010111 @r_vm
-+vmsgt_vi        011111 . ..... ..... 011 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmrr *a)                   \
- GEN_OPIVI_NARROW_TRANS(vnsra_vi, 1, vnsra_vx)
- GEN_OPIVI_NARROW_TRANS(vnsrl_vi, 1, vnsrl_vx)
-+
-+/* Vector Integer Comparison Instructions */
-+/*
-+ * For all comparison instructions, an illegal instruction exception is raised
-+ * if the destination vector register overlaps a source vector register group
-+ * and LMUL > 1.
-+ */
-+static bool opivv_cmp_check(DisasContext *s, arg_rmrr *a)
-+{
-+    return (vext_check_isa_ill(s) &&
-+            vext_check_reg(s, a->rs2, false) &&
-+            vext_check_reg(s, a->rs1, false) &&
-+            ((vext_check_overlap_group(a->rd, 1, a->rs1, 1 << s->lmul) &&
-+              vext_check_overlap_group(a->rd, 1, a->rs2, 1 << s->lmul)) ||
-+             (s->lmul == 0)));
-+}
-+GEN_OPIVV_TRANS(vmseq_vv, opivv_cmp_check)
-+GEN_OPIVV_TRANS(vmsne_vv, opivv_cmp_check)
-+GEN_OPIVV_TRANS(vmsltu_vv, opivv_cmp_check)
-+GEN_OPIVV_TRANS(vmslt_vv, opivv_cmp_check)
-+GEN_OPIVV_TRANS(vmsleu_vv, opivv_cmp_check)
-+GEN_OPIVV_TRANS(vmsle_vv, opivv_cmp_check)
-+
-+static bool opivx_cmp_check(DisasContext *s, arg_rmrr *a)
-+{
-+    return (vext_check_isa_ill(s) &&
-+            vext_check_reg(s, a->rs2, false) &&
-+            (vext_check_overlap_group(a->rd, 1, a->rs2, 1 << s->lmul) ||
-+             (s->lmul == 0)));
-+}
-+
-+GEN_OPIVX_TRANS(vmseq_vx, opivx_cmp_check)
-+GEN_OPIVX_TRANS(vmsne_vx, opivx_cmp_check)
-+GEN_OPIVX_TRANS(vmsltu_vx, opivx_cmp_check)
-+GEN_OPIVX_TRANS(vmslt_vx, opivx_cmp_check)
-+GEN_OPIVX_TRANS(vmsleu_vx, opivx_cmp_check)
-+GEN_OPIVX_TRANS(vmsle_vx, opivx_cmp_check)
-+GEN_OPIVX_TRANS(vmsgtu_vx, opivx_cmp_check)
-+GEN_OPIVX_TRANS(vmsgt_vx, opivx_cmp_check)
-+
-+GEN_OPIVI_TRANS(vmseq_vi, 0, vmseq_vx, opivx_cmp_check)
-+GEN_OPIVI_TRANS(vmsne_vi, 0, vmsne_vx, opivx_cmp_check)
-+GEN_OPIVI_TRANS(vmsleu_vi, 1, vmsleu_vx, opivx_cmp_check)
-+GEN_OPIVI_TRANS(vmsle_vi, 0, vmsle_vx, opivx_cmp_check)
-+GEN_OPIVI_TRANS(vmsgtu_vi, 1, vmsgtu_vx, opivx_cmp_check)
-+GEN_OPIVI_TRANS(vmsgt_vi, 0, vmsgt_vx, opivx_cmp_check)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_SHIFT_VX(vnsrl_vx_w, uint32_t, uint64_t, H4, H8, DO_SRL, 0x3f, clearl)
- GEN_VEXT_SHIFT_VX(vnsra_vx_b, int8_t, int16_t, H1, H2, DO_SRL, 0xf, clearb)
- GEN_VEXT_SHIFT_VX(vnsra_vx_h, int16_t, int32_t, H2, H4, DO_SRL, 0x1f, clearh)
- GEN_VEXT_SHIFT_VX(vnsra_vx_w, int32_t, int64_t, H4, H8, DO_SRL, 0x3f, clearl)
-+
-+/* Vector Integer Comparison Instructions */
-+#define DO_MSEQ(N, M) (N == M)
-+#define DO_MSNE(N, M) (N != M)
-+#define DO_MSLT(N, M) (N < M)
-+#define DO_MSLE(N, M) (N <= M)
-+#define DO_MSGT(N, M) (N > M)
-+
-+#define GEN_VEXT_CMP_VV(NAME, ETYPE, H, DO_OP)                \
-+void HELPER(NAME)(void *vd, void *v0, void *vs1, void *vs2,   \
-+                  CPURISCVState *env, uint32_t desc)          \
-+{                                                             \
-+    uint32_t mlen = vext_mlen(desc);                          \
-+    uint32_t vm = vext_vm(desc);                              \
-+    uint32_t vl = env->vl;                                    \
-+    uint32_t vlmax = vext_maxsz(desc) / sizeof(ETYPE);        \
-+    uint32_t i;                                               \
-+                                                              \
-+    for (i = 0; i < vl; i++) {                                \
-+        ETYPE s1 = *((ETYPE *)vs1 + H(i));                    \
-+        ETYPE s2 = *((ETYPE *)vs2 + H(i));                    \
-+        if (!vm && !vext_elem_mask(v0, mlen, i)) {            \
-+            continue;                                         \
-+        }                                                     \
-+        vext_set_elem_mask(vd, mlen, i, DO_OP(s2, s1));       \
-+    }                                                         \
-+    for (; i < vlmax; i++) {                                  \
-+        vext_set_elem_mask(vd, mlen, i, 0);                   \
-+    }                                                         \
-+}
-+
-+GEN_VEXT_CMP_VV(vmseq_vv_b, uint8_t,  H1, DO_MSEQ)
-+GEN_VEXT_CMP_VV(vmseq_vv_h, uint16_t, H2, DO_MSEQ)
-+GEN_VEXT_CMP_VV(vmseq_vv_w, uint32_t, H4, DO_MSEQ)
-+GEN_VEXT_CMP_VV(vmseq_vv_d, uint64_t, H8, DO_MSEQ)
-+
-+GEN_VEXT_CMP_VV(vmsne_vv_b, uint8_t,  H1, DO_MSNE)
-+GEN_VEXT_CMP_VV(vmsne_vv_h, uint16_t, H2, DO_MSNE)
-+GEN_VEXT_CMP_VV(vmsne_vv_w, uint32_t, H4, DO_MSNE)
-+GEN_VEXT_CMP_VV(vmsne_vv_d, uint64_t, H8, DO_MSNE)
-+
-+GEN_VEXT_CMP_VV(vmsltu_vv_b, uint8_t,  H1, DO_MSLT)
-+GEN_VEXT_CMP_VV(vmsltu_vv_h, uint16_t, H2, DO_MSLT)
-+GEN_VEXT_CMP_VV(vmsltu_vv_w, uint32_t, H4, DO_MSLT)
-+GEN_VEXT_CMP_VV(vmsltu_vv_d, uint64_t, H8, DO_MSLT)
-+
-+GEN_VEXT_CMP_VV(vmslt_vv_b, int8_t,  H1, DO_MSLT)
-+GEN_VEXT_CMP_VV(vmslt_vv_h, int16_t, H2, DO_MSLT)
-+GEN_VEXT_CMP_VV(vmslt_vv_w, int32_t, H4, DO_MSLT)
-+GEN_VEXT_CMP_VV(vmslt_vv_d, int64_t, H8, DO_MSLT)
-+
-+GEN_VEXT_CMP_VV(vmsleu_vv_b, uint8_t,  H1, DO_MSLE)
-+GEN_VEXT_CMP_VV(vmsleu_vv_h, uint16_t, H2, DO_MSLE)
-+GEN_VEXT_CMP_VV(vmsleu_vv_w, uint32_t, H4, DO_MSLE)
-+GEN_VEXT_CMP_VV(vmsleu_vv_d, uint64_t, H8, DO_MSLE)
-+
-+GEN_VEXT_CMP_VV(vmsle_vv_b, int8_t,  H1, DO_MSLE)
-+GEN_VEXT_CMP_VV(vmsle_vv_h, int16_t, H2, DO_MSLE)
-+GEN_VEXT_CMP_VV(vmsle_vv_w, int32_t, H4, DO_MSLE)
-+GEN_VEXT_CMP_VV(vmsle_vv_d, int64_t, H8, DO_MSLE)
-+
-+#define GEN_VEXT_CMP_VX(NAME, ETYPE, H, DO_OP)                      \
-+void HELPER(NAME)(void *vd, void *v0, target_ulong s1, void *vs2,   \
-+                  CPURISCVState *env, uint32_t desc)                \
-+{                                                                   \
-+    uint32_t mlen = vext_mlen(desc);                                \
-+    uint32_t vm = vext_vm(desc);                                    \
-+    uint32_t vl = env->vl;                                          \
-+    uint32_t vlmax = vext_maxsz(desc) / sizeof(ETYPE);              \
-+    uint32_t i;                                                     \
-+                                                                    \
-+    for (i = 0; i < vl; i++) {                                      \
-+        ETYPE s2 = *((ETYPE *)vs2 + H(i));                          \
-+        if (!vm && !vext_elem_mask(v0, mlen, i)) {                  \
-+            continue;                                               \
-+        }                                                           \
-+        vext_set_elem_mask(vd, mlen, i,                             \
-+                DO_OP(s2, (ETYPE)(target_long)s1));                 \
-+    }                                                               \
-+    for (; i < vlmax; i++) {                                        \
-+        vext_set_elem_mask(vd, mlen, i, 0);                         \
-+    }                                                               \
-+}
-+
-+GEN_VEXT_CMP_VX(vmseq_vx_b, uint8_t,  H1, DO_MSEQ)
-+GEN_VEXT_CMP_VX(vmseq_vx_h, uint16_t, H2, DO_MSEQ)
-+GEN_VEXT_CMP_VX(vmseq_vx_w, uint32_t, H4, DO_MSEQ)
-+GEN_VEXT_CMP_VX(vmseq_vx_d, uint64_t, H8, DO_MSEQ)
-+
-+GEN_VEXT_CMP_VX(vmsne_vx_b, uint8_t,  H1, DO_MSNE)
-+GEN_VEXT_CMP_VX(vmsne_vx_h, uint16_t, H2, DO_MSNE)
-+GEN_VEXT_CMP_VX(vmsne_vx_w, uint32_t, H4, DO_MSNE)
-+GEN_VEXT_CMP_VX(vmsne_vx_d, uint64_t, H8, DO_MSNE)
-+
-+GEN_VEXT_CMP_VX(vmsltu_vx_b, uint8_t,  H1, DO_MSLT)
-+GEN_VEXT_CMP_VX(vmsltu_vx_h, uint16_t, H2, DO_MSLT)
-+GEN_VEXT_CMP_VX(vmsltu_vx_w, uint32_t, H4, DO_MSLT)
-+GEN_VEXT_CMP_VX(vmsltu_vx_d, uint64_t, H8, DO_MSLT)
-+
-+GEN_VEXT_CMP_VX(vmslt_vx_b, int8_t,  H1, DO_MSLT)
-+GEN_VEXT_CMP_VX(vmslt_vx_h, int16_t, H2, DO_MSLT)
-+GEN_VEXT_CMP_VX(vmslt_vx_w, int32_t, H4, DO_MSLT)
-+GEN_VEXT_CMP_VX(vmslt_vx_d, int64_t, H8, DO_MSLT)
-+
-+GEN_VEXT_CMP_VX(vmsleu_vx_b, uint8_t,  H1, DO_MSLE)
-+GEN_VEXT_CMP_VX(vmsleu_vx_h, uint16_t, H2, DO_MSLE)
-+GEN_VEXT_CMP_VX(vmsleu_vx_w, uint32_t, H4, DO_MSLE)
-+GEN_VEXT_CMP_VX(vmsleu_vx_d, uint64_t, H8, DO_MSLE)
-+
-+GEN_VEXT_CMP_VX(vmsle_vx_b, int8_t,  H1, DO_MSLE)
-+GEN_VEXT_CMP_VX(vmsle_vx_h, int16_t, H2, DO_MSLE)
-+GEN_VEXT_CMP_VX(vmsle_vx_w, int32_t, H4, DO_MSLE)
-+GEN_VEXT_CMP_VX(vmsle_vx_d, int64_t, H8, DO_MSLE)
-+
-+GEN_VEXT_CMP_VX(vmsgtu_vx_b, uint8_t,  H1, DO_MSGT)
-+GEN_VEXT_CMP_VX(vmsgtu_vx_h, uint16_t, H2, DO_MSGT)
-+GEN_VEXT_CMP_VX(vmsgtu_vx_w, uint32_t, H4, DO_MSGT)
-+GEN_VEXT_CMP_VX(vmsgtu_vx_d, uint64_t, H8, DO_MSGT)
-+
-+GEN_VEXT_CMP_VX(vmsgt_vx_b, int8_t,  H1, DO_MSGT)
-+GEN_VEXT_CMP_VX(vmsgt_vx_h, int16_t, H2, DO_MSGT)
-+GEN_VEXT_CMP_VX(vmsgt_vx_w, int32_t, H4, DO_MSGT)
-+GEN_VEXT_CMP_VX(vmsgt_vx_d, int64_t, H8, DO_MSGT)
---
-.27.0

-[PULL 19/63] target/riscv: vector integer min/max instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-18-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   | 33 ++++++++++++
- target/riscv/insn32.decode              |  8 +++
- target/riscv/insn_trans/trans_rvv.inc.c | 10 ++++
- target/riscv/vector_helper.c            | 71 +++++++++++++++++++++++++
-files changed, 122 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vmsgt_vx_b, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vmsgt_vx_h, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vmsgt_vx_w, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vmsgt_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+
-+DEF_HELPER_6(vminu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vminu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vminu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vminu_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmin_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmin_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmin_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmin_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmaxu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmaxu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmaxu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmaxu_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmax_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmax_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmax_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmax_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vminu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vminu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vminu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vminu_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmin_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmin_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmin_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmin_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmaxu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmaxu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmaxu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmaxu_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmax_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmax_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmax_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmax_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vmsgtu_vx       011110 . ..... ..... 100 ..... 1010111 @r_vm
- vmsgtu_vi       011110 . ..... ..... 011 ..... 1010111 @r_vm
- vmsgt_vx        011111 . ..... ..... 100 ..... 1010111 @r_vm
- vmsgt_vi        011111 . ..... ..... 011 ..... 1010111 @r_vm
-+vminu_vv        000100 . ..... ..... 000 ..... 1010111 @r_vm
-+vminu_vx        000100 . ..... ..... 100 ..... 1010111 @r_vm
-+vmin_vv         000101 . ..... ..... 000 ..... 1010111 @r_vm
-+vmin_vx         000101 . ..... ..... 100 ..... 1010111 @r_vm
-+vmaxu_vv        000110 . ..... ..... 000 ..... 1010111 @r_vm
-+vmaxu_vx        000110 . ..... ..... 100 ..... 1010111 @r_vm
-+vmax_vv         000111 . ..... ..... 000 ..... 1010111 @r_vm
-+vmax_vx         000111 . ..... ..... 100 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPIVI_TRANS(vmsleu_vi, 1, vmsleu_vx, opivx_cmp_check)
- GEN_OPIVI_TRANS(vmsle_vi, 0, vmsle_vx, opivx_cmp_check)
- GEN_OPIVI_TRANS(vmsgtu_vi, 1, vmsgtu_vx, opivx_cmp_check)
- GEN_OPIVI_TRANS(vmsgt_vi, 0, vmsgt_vx, opivx_cmp_check)
-+
-+/* Vector Integer Min/Max Instructions */
-+GEN_OPIVV_GVEC_TRANS(vminu_vv, umin)
-+GEN_OPIVV_GVEC_TRANS(vmin_vv,  smin)
-+GEN_OPIVV_GVEC_TRANS(vmaxu_vv, umax)
-+GEN_OPIVV_GVEC_TRANS(vmax_vv,  smax)
-+GEN_OPIVX_TRANS(vminu_vx, opivx_check)
-+GEN_OPIVX_TRANS(vmin_vx,  opivx_check)
-+GEN_OPIVX_TRANS(vmaxu_vx, opivx_check)
-+GEN_OPIVX_TRANS(vmax_vx,  opivx_check)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_AMO(vamomaxuw_v_w, uint32_t, uint32_t, idx_w, clearl)
- #define OP_SSS_H int16_t, int16_t, int16_t, int16_t, int16_t
- #define OP_SSS_W int32_t, int32_t, int32_t, int32_t, int32_t
- #define OP_SSS_D int64_t, int64_t, int64_t, int64_t, int64_t
-+#define OP_UUU_B uint8_t, uint8_t, uint8_t, uint8_t, uint8_t
-+#define OP_UUU_H uint16_t, uint16_t, uint16_t, uint16_t, uint16_t
-+#define OP_UUU_W uint32_t, uint32_t, uint32_t, uint32_t, uint32_t
-+#define OP_UUU_D uint64_t, uint64_t, uint64_t, uint64_t, uint64_t
- /* operation of two vector elements */
- typedef void opivv2_fn(void *vd, void *vs1, void *vs2, int i);
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_CMP_VX(vmsgt_vx_b, int8_t,  H1, DO_MSGT)
- GEN_VEXT_CMP_VX(vmsgt_vx_h, int16_t, H2, DO_MSGT)
- GEN_VEXT_CMP_VX(vmsgt_vx_w, int32_t, H4, DO_MSGT)
- GEN_VEXT_CMP_VX(vmsgt_vx_d, int64_t, H8, DO_MSGT)
-+
-+/* Vector Integer Min/Max Instructions */
-+RVVCALL(OPIVV2, vminu_vv_b, OP_UUU_B, H1, H1, H1, DO_MIN)
-+RVVCALL(OPIVV2, vminu_vv_h, OP_UUU_H, H2, H2, H2, DO_MIN)
-+RVVCALL(OPIVV2, vminu_vv_w, OP_UUU_W, H4, H4, H4, DO_MIN)
-+RVVCALL(OPIVV2, vminu_vv_d, OP_UUU_D, H8, H8, H8, DO_MIN)
-+RVVCALL(OPIVV2, vmin_vv_b, OP_SSS_B, H1, H1, H1, DO_MIN)
-+RVVCALL(OPIVV2, vmin_vv_h, OP_SSS_H, H2, H2, H2, DO_MIN)
-+RVVCALL(OPIVV2, vmin_vv_w, OP_SSS_W, H4, H4, H4, DO_MIN)
-+RVVCALL(OPIVV2, vmin_vv_d, OP_SSS_D, H8, H8, H8, DO_MIN)
-+RVVCALL(OPIVV2, vmaxu_vv_b, OP_UUU_B, H1, H1, H1, DO_MAX)
-+RVVCALL(OPIVV2, vmaxu_vv_h, OP_UUU_H, H2, H2, H2, DO_MAX)
-+RVVCALL(OPIVV2, vmaxu_vv_w, OP_UUU_W, H4, H4, H4, DO_MAX)
-+RVVCALL(OPIVV2, vmaxu_vv_d, OP_UUU_D, H8, H8, H8, DO_MAX)
-+RVVCALL(OPIVV2, vmax_vv_b, OP_SSS_B, H1, H1, H1, DO_MAX)
-+RVVCALL(OPIVV2, vmax_vv_h, OP_SSS_H, H2, H2, H2, DO_MAX)
-+RVVCALL(OPIVV2, vmax_vv_w, OP_SSS_W, H4, H4, H4, DO_MAX)
-+RVVCALL(OPIVV2, vmax_vv_d, OP_SSS_D, H8, H8, H8, DO_MAX)
-+GEN_VEXT_VV(vminu_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV(vminu_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV(vminu_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV(vminu_vv_d, 8, 8, clearq)
-+GEN_VEXT_VV(vmin_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV(vmin_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV(vmin_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV(vmin_vv_d, 8, 8, clearq)
-+GEN_VEXT_VV(vmaxu_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV(vmaxu_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV(vmaxu_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV(vmaxu_vv_d, 8, 8, clearq)
-+GEN_VEXT_VV(vmax_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV(vmax_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV(vmax_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV(vmax_vv_d, 8, 8, clearq)
-+
-+RVVCALL(OPIVX2, vminu_vx_b, OP_UUU_B, H1, H1, DO_MIN)
-+RVVCALL(OPIVX2, vminu_vx_h, OP_UUU_H, H2, H2, DO_MIN)
-+RVVCALL(OPIVX2, vminu_vx_w, OP_UUU_W, H4, H4, DO_MIN)
-+RVVCALL(OPIVX2, vminu_vx_d, OP_UUU_D, H8, H8, DO_MIN)
-+RVVCALL(OPIVX2, vmin_vx_b, OP_SSS_B, H1, H1, DO_MIN)
-+RVVCALL(OPIVX2, vmin_vx_h, OP_SSS_H, H2, H2, DO_MIN)
-+RVVCALL(OPIVX2, vmin_vx_w, OP_SSS_W, H4, H4, DO_MIN)
-+RVVCALL(OPIVX2, vmin_vx_d, OP_SSS_D, H8, H8, DO_MIN)
-+RVVCALL(OPIVX2, vmaxu_vx_b, OP_UUU_B, H1, H1, DO_MAX)
-+RVVCALL(OPIVX2, vmaxu_vx_h, OP_UUU_H, H2, H2, DO_MAX)
-+RVVCALL(OPIVX2, vmaxu_vx_w, OP_UUU_W, H4, H4, DO_MAX)
-+RVVCALL(OPIVX2, vmaxu_vx_d, OP_UUU_D, H8, H8, DO_MAX)
-+RVVCALL(OPIVX2, vmax_vx_b, OP_SSS_B, H1, H1, DO_MAX)
-+RVVCALL(OPIVX2, vmax_vx_h, OP_SSS_H, H2, H2, DO_MAX)
-+RVVCALL(OPIVX2, vmax_vx_w, OP_SSS_W, H4, H4, DO_MAX)
-+RVVCALL(OPIVX2, vmax_vx_d, OP_SSS_D, H8, H8, DO_MAX)
-+GEN_VEXT_VX(vminu_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX(vminu_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX(vminu_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX(vminu_vx_d, 8, 8, clearq)
-+GEN_VEXT_VX(vmin_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX(vmin_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX(vmin_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX(vmin_vx_d, 8, 8, clearq)
-+GEN_VEXT_VX(vmaxu_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX(vmaxu_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX(vmaxu_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX(vmaxu_vx_d, 8, 8,  clearq)
-+GEN_VEXT_VX(vmax_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX(vmax_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX(vmax_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX(vmax_vx_d, 8, 8, clearq)
---
-.27.0

-[PULL 20/63] target/riscv: vector single-width integer multiply instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Message-id: 20200623215920.2594-19-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   |  33 +++++
- target/riscv/insn32.decode              |   8 ++
- target/riscv/insn_trans/trans_rvv.inc.c |  10 ++
- target/riscv/vector_helper.c            | 163 ++++++++++++++++++++++++
-files changed, 214 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vmax_vx_b, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vmax_vx_h, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vmax_vx_w, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vmax_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+
-+DEF_HELPER_6(vmul_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmul_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmul_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmul_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmulh_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmulh_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmulh_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmulh_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmulhu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmulhu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmulhu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmulhu_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmulhsu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmulhsu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmulhsu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmulhsu_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmul_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmul_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmul_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmul_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmulh_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmulh_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmulh_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmulh_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmulhu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmulhu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmulhu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmulhu_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmulhsu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmulhsu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmulhsu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmulhsu_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vmaxu_vv        000110 . ..... ..... 000 ..... 1010111 @r_vm
- vmaxu_vx        000110 . ..... ..... 100 ..... 1010111 @r_vm
- vmax_vv         000111 . ..... ..... 000 ..... 1010111 @r_vm
- vmax_vx         000111 . ..... ..... 100 ..... 1010111 @r_vm
-+vmul_vv         100101 . ..... ..... 010 ..... 1010111 @r_vm
-+vmul_vx         100101 . ..... ..... 110 ..... 1010111 @r_vm
-+vmulh_vv        100111 . ..... ..... 010 ..... 1010111 @r_vm
-+vmulh_vx        100111 . ..... ..... 110 ..... 1010111 @r_vm
-+vmulhu_vv       100100 . ..... ..... 010 ..... 1010111 @r_vm
-+vmulhu_vx       100100 . ..... ..... 110 ..... 1010111 @r_vm
-+vmulhsu_vv      100110 . ..... ..... 010 ..... 1010111 @r_vm
-+vmulhsu_vx      100110 . ..... ..... 110 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPIVX_TRANS(vminu_vx, opivx_check)
- GEN_OPIVX_TRANS(vmin_vx,  opivx_check)
- GEN_OPIVX_TRANS(vmaxu_vx, opivx_check)
- GEN_OPIVX_TRANS(vmax_vx,  opivx_check)
-+
-+/* Vector Single-Width Integer Multiply Instructions */
-+GEN_OPIVV_GVEC_TRANS(vmul_vv,  mul)
-+GEN_OPIVV_TRANS(vmulh_vv, opivv_check)
-+GEN_OPIVV_TRANS(vmulhu_vv, opivv_check)
-+GEN_OPIVV_TRANS(vmulhsu_vv, opivv_check)
-+GEN_OPIVX_GVEC_TRANS(vmul_vx,  muls)
-+GEN_OPIVX_TRANS(vmulh_vx, opivx_check)
-+GEN_OPIVX_TRANS(vmulhu_vx, opivx_check)
-+GEN_OPIVX_TRANS(vmulhsu_vx, opivx_check)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_AMO(vamomaxuw_v_w, uint32_t, uint32_t, idx_w, clearl)
- #define OP_UUU_H uint16_t, uint16_t, uint16_t, uint16_t, uint16_t
- #define OP_UUU_W uint32_t, uint32_t, uint32_t, uint32_t, uint32_t
- #define OP_UUU_D uint64_t, uint64_t, uint64_t, uint64_t, uint64_t
-+#define OP_SUS_B int8_t, uint8_t, int8_t, uint8_t, int8_t
-+#define OP_SUS_H int16_t, uint16_t, int16_t, uint16_t, int16_t
-+#define OP_SUS_W int32_t, uint32_t, int32_t, uint32_t, int32_t
-+#define OP_SUS_D int64_t, uint64_t, int64_t, uint64_t, int64_t
- /* operation of two vector elements */
- typedef void opivv2_fn(void *vd, void *vs1, void *vs2, int i);
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VX(vmax_vx_b, 1, 1, clearb)
- GEN_VEXT_VX(vmax_vx_h, 2, 2, clearh)
- GEN_VEXT_VX(vmax_vx_w, 4, 4, clearl)
- GEN_VEXT_VX(vmax_vx_d, 8, 8, clearq)
-+
-+/* Vector Single-Width Integer Multiply Instructions */
-+#define DO_MUL(N, M) (N * M)
-+RVVCALL(OPIVV2, vmul_vv_b, OP_SSS_B, H1, H1, H1, DO_MUL)
-+RVVCALL(OPIVV2, vmul_vv_h, OP_SSS_H, H2, H2, H2, DO_MUL)
-+RVVCALL(OPIVV2, vmul_vv_w, OP_SSS_W, H4, H4, H4, DO_MUL)
-+RVVCALL(OPIVV2, vmul_vv_d, OP_SSS_D, H8, H8, H8, DO_MUL)
-+GEN_VEXT_VV(vmul_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV(vmul_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV(vmul_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV(vmul_vv_d, 8, 8, clearq)
-+
-+static int8_t do_mulh_b(int8_t s2, int8_t s1)
-+{
-+    return (int16_t)s2 * (int16_t)s1 >> 8;
-+}
-+
-+static int16_t do_mulh_h(int16_t s2, int16_t s1)
-+{
-+    return (int32_t)s2 * (int32_t)s1 >> 16;
-+}
-+
-+static int32_t do_mulh_w(int32_t s2, int32_t s1)
-+{
-+    return (int64_t)s2 * (int64_t)s1 >> 32;
-+}
-+
-+static int64_t do_mulh_d(int64_t s2, int64_t s1)
-+{
-+    uint64_t hi_64, lo_64;
-+
-+    muls64(&lo_64, &hi_64, s1, s2);
-+    return hi_64;
-+}
-+
-+static uint8_t do_mulhu_b(uint8_t s2, uint8_t s1)
-+{
-+    return (uint16_t)s2 * (uint16_t)s1 >> 8;
-+}
-+
-+static uint16_t do_mulhu_h(uint16_t s2, uint16_t s1)
-+{
-+    return (uint32_t)s2 * (uint32_t)s1 >> 16;
-+}
-+
-+static uint32_t do_mulhu_w(uint32_t s2, uint32_t s1)
-+{
-+    return (uint64_t)s2 * (uint64_t)s1 >> 32;
-+}
-+
-+static uint64_t do_mulhu_d(uint64_t s2, uint64_t s1)
-+{
-+    uint64_t hi_64, lo_64;
-+
-+    mulu64(&lo_64, &hi_64, s2, s1);
-+    return hi_64;
-+}
-+
-+static int8_t do_mulhsu_b(int8_t s2, uint8_t s1)
-+{
-+    return (int16_t)s2 * (uint16_t)s1 >> 8;
-+}
-+
-+static int16_t do_mulhsu_h(int16_t s2, uint16_t s1)
-+{
-+    return (int32_t)s2 * (uint32_t)s1 >> 16;
-+}
-+
-+static int32_t do_mulhsu_w(int32_t s2, uint32_t s1)
-+{
-+    return (int64_t)s2 * (uint64_t)s1 >> 32;
-+}
-+
-+/*
-+ * Let  A = signed operand,
-+ *      B = unsigned operand
-+ *      P = mulu64(A, B), unsigned product
-+ *
-+ * LET  X = 2 ** 64  - A, 2's complement of A
-+ *      SP = signed product
-+ * THEN
-+ *      IF A < 0
-+ *          SP = -X * B
-+ *             = -(2 ** 64 - A) * B
-+ *             = A * B - 2 ** 64 * B
-+ *             = P - 2 ** 64 * B
-+ *      ELSE
-+ *          SP = P
-+ * THEN
-+ *      HI_P -= (A < 0 ? B : 0)
-+ */
-+
-+static int64_t do_mulhsu_d(int64_t s2, uint64_t s1)
-+{
-+    uint64_t hi_64, lo_64;
-+
-+    mulu64(&lo_64, &hi_64, s2, s1);
-+
-+    hi_64 -= s2 < 0 ? s1 : 0;
-+    return hi_64;
-+}
-+
-+RVVCALL(OPIVV2, vmulh_vv_b, OP_SSS_B, H1, H1, H1, do_mulh_b)
-+RVVCALL(OPIVV2, vmulh_vv_h, OP_SSS_H, H2, H2, H2, do_mulh_h)
-+RVVCALL(OPIVV2, vmulh_vv_w, OP_SSS_W, H4, H4, H4, do_mulh_w)
-+RVVCALL(OPIVV2, vmulh_vv_d, OP_SSS_D, H8, H8, H8, do_mulh_d)
-+RVVCALL(OPIVV2, vmulhu_vv_b, OP_UUU_B, H1, H1, H1, do_mulhu_b)
-+RVVCALL(OPIVV2, vmulhu_vv_h, OP_UUU_H, H2, H2, H2, do_mulhu_h)
-+RVVCALL(OPIVV2, vmulhu_vv_w, OP_UUU_W, H4, H4, H4, do_mulhu_w)
-+RVVCALL(OPIVV2, vmulhu_vv_d, OP_UUU_D, H8, H8, H8, do_mulhu_d)
-+RVVCALL(OPIVV2, vmulhsu_vv_b, OP_SUS_B, H1, H1, H1, do_mulhsu_b)
-+RVVCALL(OPIVV2, vmulhsu_vv_h, OP_SUS_H, H2, H2, H2, do_mulhsu_h)
-+RVVCALL(OPIVV2, vmulhsu_vv_w, OP_SUS_W, H4, H4, H4, do_mulhsu_w)
-+RVVCALL(OPIVV2, vmulhsu_vv_d, OP_SUS_D, H8, H8, H8, do_mulhsu_d)
-+GEN_VEXT_VV(vmulh_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV(vmulh_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV(vmulh_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV(vmulh_vv_d, 8, 8, clearq)
-+GEN_VEXT_VV(vmulhu_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV(vmulhu_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV(vmulhu_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV(vmulhu_vv_d, 8, 8, clearq)
-+GEN_VEXT_VV(vmulhsu_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV(vmulhsu_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV(vmulhsu_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV(vmulhsu_vv_d, 8, 8, clearq)
-+
-+RVVCALL(OPIVX2, vmul_vx_b, OP_SSS_B, H1, H1, DO_MUL)
-+RVVCALL(OPIVX2, vmul_vx_h, OP_SSS_H, H2, H2, DO_MUL)
-+RVVCALL(OPIVX2, vmul_vx_w, OP_SSS_W, H4, H4, DO_MUL)
-+RVVCALL(OPIVX2, vmul_vx_d, OP_SSS_D, H8, H8, DO_MUL)
-+RVVCALL(OPIVX2, vmulh_vx_b, OP_SSS_B, H1, H1, do_mulh_b)
-+RVVCALL(OPIVX2, vmulh_vx_h, OP_SSS_H, H2, H2, do_mulh_h)
-+RVVCALL(OPIVX2, vmulh_vx_w, OP_SSS_W, H4, H4, do_mulh_w)
-+RVVCALL(OPIVX2, vmulh_vx_d, OP_SSS_D, H8, H8, do_mulh_d)
-+RVVCALL(OPIVX2, vmulhu_vx_b, OP_UUU_B, H1, H1, do_mulhu_b)
-+RVVCALL(OPIVX2, vmulhu_vx_h, OP_UUU_H, H2, H2, do_mulhu_h)
-+RVVCALL(OPIVX2, vmulhu_vx_w, OP_UUU_W, H4, H4, do_mulhu_w)
-+RVVCALL(OPIVX2, vmulhu_vx_d, OP_UUU_D, H8, H8, do_mulhu_d)
-+RVVCALL(OPIVX2, vmulhsu_vx_b, OP_SUS_B, H1, H1, do_mulhsu_b)
-+RVVCALL(OPIVX2, vmulhsu_vx_h, OP_SUS_H, H2, H2, do_mulhsu_h)
-+RVVCALL(OPIVX2, vmulhsu_vx_w, OP_SUS_W, H4, H4, do_mulhsu_w)
-+RVVCALL(OPIVX2, vmulhsu_vx_d, OP_SUS_D, H8, H8, do_mulhsu_d)
-+GEN_VEXT_VX(vmul_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX(vmul_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX(vmul_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX(vmul_vx_d, 8, 8, clearq)
-+GEN_VEXT_VX(vmulh_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX(vmulh_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX(vmulh_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX(vmulh_vx_d, 8, 8, clearq)
-+GEN_VEXT_VX(vmulhu_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX(vmulhu_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX(vmulhu_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX(vmulhu_vx_d, 8, 8, clearq)
-+GEN_VEXT_VX(vmulhsu_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX(vmulhsu_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX(vmulhsu_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX(vmulhsu_vx_d, 8, 8, clearq)
---
-.27.0

-[PULL 21/63] target/riscv: vector integer divide instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-20-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   | 33 +++++++++++
- target/riscv/insn32.decode              |  8 +++
- target/riscv/insn_trans/trans_rvv.inc.c | 10 ++++
- target/riscv/vector_helper.c            | 74 +++++++++++++++++++++++++
-files changed, 125 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vmulhsu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vmulhsu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vmulhsu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vmulhsu_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+
-+DEF_HELPER_6(vdivu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vdivu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vdivu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vdivu_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vdiv_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vdiv_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vdiv_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vdiv_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vremu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vremu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vremu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vremu_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vrem_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vrem_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vrem_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vrem_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vdivu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vdivu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vdivu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vdivu_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vdiv_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vdiv_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vdiv_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vdiv_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vremu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vremu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vremu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vremu_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vrem_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vrem_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vrem_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vrem_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vmulhu_vv       100100 . ..... ..... 010 ..... 1010111 @r_vm
- vmulhu_vx       100100 . ..... ..... 110 ..... 1010111 @r_vm
- vmulhsu_vv      100110 . ..... ..... 010 ..... 1010111 @r_vm
- vmulhsu_vx      100110 . ..... ..... 110 ..... 1010111 @r_vm
-+vdivu_vv        100000 . ..... ..... 010 ..... 1010111 @r_vm
-+vdivu_vx        100000 . ..... ..... 110 ..... 1010111 @r_vm
-+vdiv_vv         100001 . ..... ..... 010 ..... 1010111 @r_vm
-+vdiv_vx         100001 . ..... ..... 110 ..... 1010111 @r_vm
-+vremu_vv        100010 . ..... ..... 010 ..... 1010111 @r_vm
-+vremu_vx        100010 . ..... ..... 110 ..... 1010111 @r_vm
-+vrem_vv         100011 . ..... ..... 010 ..... 1010111 @r_vm
-+vrem_vx         100011 . ..... ..... 110 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPIVX_GVEC_TRANS(vmul_vx,  muls)
- GEN_OPIVX_TRANS(vmulh_vx, opivx_check)
- GEN_OPIVX_TRANS(vmulhu_vx, opivx_check)
- GEN_OPIVX_TRANS(vmulhsu_vx, opivx_check)
-+
-+/* Vector Integer Divide Instructions */
-+GEN_OPIVV_TRANS(vdivu_vv, opivv_check)
-+GEN_OPIVV_TRANS(vdiv_vv, opivv_check)
-+GEN_OPIVV_TRANS(vremu_vv, opivv_check)
-+GEN_OPIVV_TRANS(vrem_vv, opivv_check)
-+GEN_OPIVX_TRANS(vdivu_vx, opivx_check)
-+GEN_OPIVX_TRANS(vdiv_vx, opivx_check)
-+GEN_OPIVX_TRANS(vremu_vx, opivx_check)
-+GEN_OPIVX_TRANS(vrem_vx, opivx_check)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VX(vmulhsu_vx_b, 1, 1, clearb)
- GEN_VEXT_VX(vmulhsu_vx_h, 2, 2, clearh)
- GEN_VEXT_VX(vmulhsu_vx_w, 4, 4, clearl)
- GEN_VEXT_VX(vmulhsu_vx_d, 8, 8, clearq)
-+
-+/* Vector Integer Divide Instructions */
-+#define DO_DIVU(N, M) (unlikely(M == 0) ? (__typeof(N))(-1) : N / M)
-+#define DO_REMU(N, M) (unlikely(M == 0) ? N : N % M)
-+#define DO_DIV(N, M)  (unlikely(M == 0) ? (__typeof(N))(-1) :\
-+        unlikely((N == -N) && (M == (__typeof(N))(-1))) ? N : N / M)
-+#define DO_REM(N, M)  (unlikely(M == 0) ? N :\
-+        unlikely((N == -N) && (M == (__typeof(N))(-1))) ? 0 : N % M)
-+
-+RVVCALL(OPIVV2, vdivu_vv_b, OP_UUU_B, H1, H1, H1, DO_DIVU)
-+RVVCALL(OPIVV2, vdivu_vv_h, OP_UUU_H, H2, H2, H2, DO_DIVU)
-+RVVCALL(OPIVV2, vdivu_vv_w, OP_UUU_W, H4, H4, H4, DO_DIVU)
-+RVVCALL(OPIVV2, vdivu_vv_d, OP_UUU_D, H8, H8, H8, DO_DIVU)
-+RVVCALL(OPIVV2, vdiv_vv_b, OP_SSS_B, H1, H1, H1, DO_DIV)
-+RVVCALL(OPIVV2, vdiv_vv_h, OP_SSS_H, H2, H2, H2, DO_DIV)
-+RVVCALL(OPIVV2, vdiv_vv_w, OP_SSS_W, H4, H4, H4, DO_DIV)
-+RVVCALL(OPIVV2, vdiv_vv_d, OP_SSS_D, H8, H8, H8, DO_DIV)
-+RVVCALL(OPIVV2, vremu_vv_b, OP_UUU_B, H1, H1, H1, DO_REMU)
-+RVVCALL(OPIVV2, vremu_vv_h, OP_UUU_H, H2, H2, H2, DO_REMU)
-+RVVCALL(OPIVV2, vremu_vv_w, OP_UUU_W, H4, H4, H4, DO_REMU)
-+RVVCALL(OPIVV2, vremu_vv_d, OP_UUU_D, H8, H8, H8, DO_REMU)
-+RVVCALL(OPIVV2, vrem_vv_b, OP_SSS_B, H1, H1, H1, DO_REM)
-+RVVCALL(OPIVV2, vrem_vv_h, OP_SSS_H, H2, H2, H2, DO_REM)
-+RVVCALL(OPIVV2, vrem_vv_w, OP_SSS_W, H4, H4, H4, DO_REM)
-+RVVCALL(OPIVV2, vrem_vv_d, OP_SSS_D, H8, H8, H8, DO_REM)
-+GEN_VEXT_VV(vdivu_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV(vdivu_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV(vdivu_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV(vdivu_vv_d, 8, 8, clearq)
-+GEN_VEXT_VV(vdiv_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV(vdiv_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV(vdiv_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV(vdiv_vv_d, 8, 8, clearq)
-+GEN_VEXT_VV(vremu_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV(vremu_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV(vremu_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV(vremu_vv_d, 8, 8, clearq)
-+GEN_VEXT_VV(vrem_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV(vrem_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV(vrem_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV(vrem_vv_d, 8, 8, clearq)
-+
-+RVVCALL(OPIVX2, vdivu_vx_b, OP_UUU_B, H1, H1, DO_DIVU)
-+RVVCALL(OPIVX2, vdivu_vx_h, OP_UUU_H, H2, H2, DO_DIVU)
-+RVVCALL(OPIVX2, vdivu_vx_w, OP_UUU_W, H4, H4, DO_DIVU)
-+RVVCALL(OPIVX2, vdivu_vx_d, OP_UUU_D, H8, H8, DO_DIVU)
-+RVVCALL(OPIVX2, vdiv_vx_b, OP_SSS_B, H1, H1, DO_DIV)
-+RVVCALL(OPIVX2, vdiv_vx_h, OP_SSS_H, H2, H2, DO_DIV)
-+RVVCALL(OPIVX2, vdiv_vx_w, OP_SSS_W, H4, H4, DO_DIV)
-+RVVCALL(OPIVX2, vdiv_vx_d, OP_SSS_D, H8, H8, DO_DIV)
-+RVVCALL(OPIVX2, vremu_vx_b, OP_UUU_B, H1, H1, DO_REMU)
-+RVVCALL(OPIVX2, vremu_vx_h, OP_UUU_H, H2, H2, DO_REMU)
-+RVVCALL(OPIVX2, vremu_vx_w, OP_UUU_W, H4, H4, DO_REMU)
-+RVVCALL(OPIVX2, vremu_vx_d, OP_UUU_D, H8, H8, DO_REMU)
-+RVVCALL(OPIVX2, vrem_vx_b, OP_SSS_B, H1, H1, DO_REM)
-+RVVCALL(OPIVX2, vrem_vx_h, OP_SSS_H, H2, H2, DO_REM)
-+RVVCALL(OPIVX2, vrem_vx_w, OP_SSS_W, H4, H4, DO_REM)
-+RVVCALL(OPIVX2, vrem_vx_d, OP_SSS_D, H8, H8, DO_REM)
-+GEN_VEXT_VX(vdivu_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX(vdivu_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX(vdivu_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX(vdivu_vx_d, 8, 8, clearq)
-+GEN_VEXT_VX(vdiv_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX(vdiv_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX(vdiv_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX(vdiv_vx_d, 8, 8, clearq)
-+GEN_VEXT_VX(vremu_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX(vremu_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX(vremu_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX(vremu_vx_d, 8, 8, clearq)
-+GEN_VEXT_VX(vrem_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX(vrem_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX(vrem_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX(vrem_vx_d, 8, 8, clearq)
---
-.27.0

-[PULL 22/63] target/riscv: vector widening integer multiply instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-21-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   | 19 +++++++++
- target/riscv/insn32.decode              |  6 +++
- target/riscv/insn_trans/trans_rvv.inc.c |  8 ++++
- target/riscv/vector_helper.c            | 51 +++++++++++++++++++++++++
-files changed, 84 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vrem_vx_b, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vrem_vx_h, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vrem_vx_w, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vrem_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+
-+DEF_HELPER_6(vwmul_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwmul_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwmul_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwmulu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwmulu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwmulu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwmulsu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwmulsu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwmulsu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwmul_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwmul_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwmul_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwmulu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwmulu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwmulu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwmulsu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwmulsu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwmulsu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vremu_vv        100010 . ..... ..... 010 ..... 1010111 @r_vm
- vremu_vx        100010 . ..... ..... 110 ..... 1010111 @r_vm
- vrem_vv         100011 . ..... ..... 010 ..... 1010111 @r_vm
- vrem_vx         100011 . ..... ..... 110 ..... 1010111 @r_vm
-+vwmulu_vv       111000 . ..... ..... 010 ..... 1010111 @r_vm
-+vwmulu_vx       111000 . ..... ..... 110 ..... 1010111 @r_vm
-+vwmulsu_vv      111010 . ..... ..... 010 ..... 1010111 @r_vm
-+vwmulsu_vx      111010 . ..... ..... 110 ..... 1010111 @r_vm
-+vwmul_vv        111011 . ..... ..... 010 ..... 1010111 @r_vm
-+vwmul_vx        111011 . ..... ..... 110 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPIVX_TRANS(vdivu_vx, opivx_check)
- GEN_OPIVX_TRANS(vdiv_vx, opivx_check)
- GEN_OPIVX_TRANS(vremu_vx, opivx_check)
- GEN_OPIVX_TRANS(vrem_vx, opivx_check)
-+
-+/* Vector Widening Integer Multiply Instructions */
-+GEN_OPIVV_WIDEN_TRANS(vwmul_vv, opivv_widen_check)
-+GEN_OPIVV_WIDEN_TRANS(vwmulu_vv, opivv_widen_check)
-+GEN_OPIVV_WIDEN_TRANS(vwmulsu_vv, opivv_widen_check)
-+GEN_OPIVX_WIDEN_TRANS(vwmul_vx)
-+GEN_OPIVX_WIDEN_TRANS(vwmulu_vx)
-+GEN_OPIVX_WIDEN_TRANS(vwmulsu_vx)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_AMO(vamomaxuw_v_w, uint32_t, uint32_t, idx_w, clearl)
- #define OP_SUS_H int16_t, uint16_t, int16_t, uint16_t, int16_t
- #define OP_SUS_W int32_t, uint32_t, int32_t, uint32_t, int32_t
- #define OP_SUS_D int64_t, uint64_t, int64_t, uint64_t, int64_t
-+#define WOP_UUU_B uint16_t, uint8_t, uint8_t, uint16_t, uint16_t
-+#define WOP_UUU_H uint32_t, uint16_t, uint16_t, uint32_t, uint32_t
-+#define WOP_UUU_W uint64_t, uint32_t, uint32_t, uint64_t, uint64_t
-+#define WOP_SSS_B int16_t, int8_t, int8_t, int16_t, int16_t
-+#define WOP_SSS_H int32_t, int16_t, int16_t, int32_t, int32_t
-+#define WOP_SSS_W int64_t, int32_t, int32_t, int64_t, int64_t
-+#define WOP_SUS_B int16_t, uint8_t, int8_t, uint16_t, int16_t
-+#define WOP_SUS_H int32_t, uint16_t, int16_t, uint32_t, int32_t
-+#define WOP_SUS_W int64_t, uint32_t, int32_t, uint64_t, int64_t
-+#define WOP_SSU_B int16_t, int8_t, uint8_t, int16_t, uint16_t
-+#define WOP_SSU_H int32_t, int16_t, uint16_t, int32_t, uint32_t
-+#define WOP_SSU_W int64_t, int32_t, uint32_t, int64_t, uint64_t
- /* operation of two vector elements */
- typedef void opivv2_fn(void *vd, void *vs1, void *vs2, int i);
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VX(vrem_vx_b, 1, 1, clearb)
- GEN_VEXT_VX(vrem_vx_h, 2, 2, clearh)
- GEN_VEXT_VX(vrem_vx_w, 4, 4, clearl)
- GEN_VEXT_VX(vrem_vx_d, 8, 8, clearq)
-+
-+/* Vector Widening Integer Multiply Instructions */
-+RVVCALL(OPIVV2, vwmul_vv_b, WOP_SSS_B, H2, H1, H1, DO_MUL)
-+RVVCALL(OPIVV2, vwmul_vv_h, WOP_SSS_H, H4, H2, H2, DO_MUL)
-+RVVCALL(OPIVV2, vwmul_vv_w, WOP_SSS_W, H8, H4, H4, DO_MUL)
-+RVVCALL(OPIVV2, vwmulu_vv_b, WOP_UUU_B, H2, H1, H1, DO_MUL)
-+RVVCALL(OPIVV2, vwmulu_vv_h, WOP_UUU_H, H4, H2, H2, DO_MUL)
-+RVVCALL(OPIVV2, vwmulu_vv_w, WOP_UUU_W, H8, H4, H4, DO_MUL)
-+RVVCALL(OPIVV2, vwmulsu_vv_b, WOP_SUS_B, H2, H1, H1, DO_MUL)
-+RVVCALL(OPIVV2, vwmulsu_vv_h, WOP_SUS_H, H4, H2, H2, DO_MUL)
-+RVVCALL(OPIVV2, vwmulsu_vv_w, WOP_SUS_W, H8, H4, H4, DO_MUL)
-+GEN_VEXT_VV(vwmul_vv_b, 1, 2, clearh)
-+GEN_VEXT_VV(vwmul_vv_h, 2, 4, clearl)
-+GEN_VEXT_VV(vwmul_vv_w, 4, 8, clearq)
-+GEN_VEXT_VV(vwmulu_vv_b, 1, 2, clearh)
-+GEN_VEXT_VV(vwmulu_vv_h, 2, 4, clearl)
-+GEN_VEXT_VV(vwmulu_vv_w, 4, 8, clearq)
-+GEN_VEXT_VV(vwmulsu_vv_b, 1, 2, clearh)
-+GEN_VEXT_VV(vwmulsu_vv_h, 2, 4, clearl)
-+GEN_VEXT_VV(vwmulsu_vv_w, 4, 8, clearq)
-+
-+RVVCALL(OPIVX2, vwmul_vx_b, WOP_SSS_B, H2, H1, DO_MUL)
-+RVVCALL(OPIVX2, vwmul_vx_h, WOP_SSS_H, H4, H2, DO_MUL)
-+RVVCALL(OPIVX2, vwmul_vx_w, WOP_SSS_W, H8, H4, DO_MUL)
-+RVVCALL(OPIVX2, vwmulu_vx_b, WOP_UUU_B, H2, H1, DO_MUL)
-+RVVCALL(OPIVX2, vwmulu_vx_h, WOP_UUU_H, H4, H2, DO_MUL)
-+RVVCALL(OPIVX2, vwmulu_vx_w, WOP_UUU_W, H8, H4, DO_MUL)
-+RVVCALL(OPIVX2, vwmulsu_vx_b, WOP_SUS_B, H2, H1, DO_MUL)
-+RVVCALL(OPIVX2, vwmulsu_vx_h, WOP_SUS_H, H4, H2, DO_MUL)
-+RVVCALL(OPIVX2, vwmulsu_vx_w, WOP_SUS_W, H8, H4, DO_MUL)
-+GEN_VEXT_VX(vwmul_vx_b, 1, 2, clearh)
-+GEN_VEXT_VX(vwmul_vx_h, 2, 4, clearl)
-+GEN_VEXT_VX(vwmul_vx_w, 4, 8, clearq)
-+GEN_VEXT_VX(vwmulu_vx_b, 1, 2, clearh)
-+GEN_VEXT_VX(vwmulu_vx_h, 2, 4, clearl)
-+GEN_VEXT_VX(vwmulu_vx_w, 4, 8, clearq)
-+GEN_VEXT_VX(vwmulsu_vx_b, 1, 2, clearh)
-+GEN_VEXT_VX(vwmulsu_vx_h, 2, 4, clearl)
-+GEN_VEXT_VX(vwmulsu_vx_w, 4, 8, clearq)
---
-.27.0

-[PULL 23/63] target/riscv: vector single-width integer multiply-add instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-22-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   | 33 ++++++++++
- target/riscv/insn32.decode              |  8 +++
- target/riscv/insn_trans/trans_rvv.inc.c | 10 +++
- target/riscv/vector_helper.c            | 88 +++++++++++++++++++++++++
-files changed, 139 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vwmulu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vwmulsu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vwmulsu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vwmulsu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+
-+DEF_HELPER_6(vmacc_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmacc_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmacc_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmacc_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vnmsac_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vnmsac_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vnmsac_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vnmsac_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmadd_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmadd_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmadd_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmadd_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vnmsub_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vnmsub_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vnmsub_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vnmsub_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vmacc_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmacc_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmacc_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmacc_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vnmsac_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vnmsac_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vnmsac_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vnmsac_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmadd_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmadd_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmadd_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vmadd_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vnmsub_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vnmsub_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vnmsub_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vnmsub_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vwmulsu_vv      111010 . ..... ..... 010 ..... 1010111 @r_vm
- vwmulsu_vx      111010 . ..... ..... 110 ..... 1010111 @r_vm
- vwmul_vv        111011 . ..... ..... 010 ..... 1010111 @r_vm
- vwmul_vx        111011 . ..... ..... 110 ..... 1010111 @r_vm
-+vmacc_vv        101101 . ..... ..... 010 ..... 1010111 @r_vm
-+vmacc_vx        101101 . ..... ..... 110 ..... 1010111 @r_vm
-+vnmsac_vv       101111 . ..... ..... 010 ..... 1010111 @r_vm
-+vnmsac_vx       101111 . ..... ..... 110 ..... 1010111 @r_vm
-+vmadd_vv        101001 . ..... ..... 010 ..... 1010111 @r_vm
-+vmadd_vx        101001 . ..... ..... 110 ..... 1010111 @r_vm
-+vnmsub_vv       101011 . ..... ..... 010 ..... 1010111 @r_vm
-+vnmsub_vx       101011 . ..... ..... 110 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPIVV_WIDEN_TRANS(vwmulsu_vv, opivv_widen_check)
- GEN_OPIVX_WIDEN_TRANS(vwmul_vx)
- GEN_OPIVX_WIDEN_TRANS(vwmulu_vx)
- GEN_OPIVX_WIDEN_TRANS(vwmulsu_vx)
-+
-+/* Vector Single-Width Integer Multiply-Add Instructions */
-+GEN_OPIVV_TRANS(vmacc_vv, opivv_check)
-+GEN_OPIVV_TRANS(vnmsac_vv, opivv_check)
-+GEN_OPIVV_TRANS(vmadd_vv, opivv_check)
-+GEN_OPIVV_TRANS(vnmsub_vv, opivv_check)
-+GEN_OPIVX_TRANS(vmacc_vx, opivx_check)
-+GEN_OPIVX_TRANS(vnmsac_vx, opivx_check)
-+GEN_OPIVX_TRANS(vmadd_vx, opivx_check)
-+GEN_OPIVX_TRANS(vnmsub_vx, opivx_check)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VX(vwmulu_vx_w, 4, 8, clearq)
- GEN_VEXT_VX(vwmulsu_vx_b, 1, 2, clearh)
- GEN_VEXT_VX(vwmulsu_vx_h, 2, 4, clearl)
- GEN_VEXT_VX(vwmulsu_vx_w, 4, 8, clearq)
-+
-+/* Vector Single-Width Integer Multiply-Add Instructions */
-+#define OPIVV3(NAME, TD, T1, T2, TX1, TX2, HD, HS1, HS2, OP)   \
-+static void do_##NAME(void *vd, void *vs1, void *vs2, int i)       \
-+{                                                                  \
-+    TX1 s1 = *((T1 *)vs1 + HS1(i));                                \
-+    TX2 s2 = *((T2 *)vs2 + HS2(i));                                \
-+    TD d = *((TD *)vd + HD(i));                                    \
-+    *((TD *)vd + HD(i)) = OP(s2, s1, d);                           \
-+}
-+
-+#define DO_MACC(N, M, D) (M * N + D)
-+#define DO_NMSAC(N, M, D) (-(M * N) + D)
-+#define DO_MADD(N, M, D) (M * D + N)
-+#define DO_NMSUB(N, M, D) (-(M * D) + N)
-+RVVCALL(OPIVV3, vmacc_vv_b, OP_SSS_B, H1, H1, H1, DO_MACC)
-+RVVCALL(OPIVV3, vmacc_vv_h, OP_SSS_H, H2, H2, H2, DO_MACC)
-+RVVCALL(OPIVV3, vmacc_vv_w, OP_SSS_W, H4, H4, H4, DO_MACC)
-+RVVCALL(OPIVV3, vmacc_vv_d, OP_SSS_D, H8, H8, H8, DO_MACC)
-+RVVCALL(OPIVV3, vnmsac_vv_b, OP_SSS_B, H1, H1, H1, DO_NMSAC)
-+RVVCALL(OPIVV3, vnmsac_vv_h, OP_SSS_H, H2, H2, H2, DO_NMSAC)
-+RVVCALL(OPIVV3, vnmsac_vv_w, OP_SSS_W, H4, H4, H4, DO_NMSAC)
-+RVVCALL(OPIVV3, vnmsac_vv_d, OP_SSS_D, H8, H8, H8, DO_NMSAC)
-+RVVCALL(OPIVV3, vmadd_vv_b, OP_SSS_B, H1, H1, H1, DO_MADD)
-+RVVCALL(OPIVV3, vmadd_vv_h, OP_SSS_H, H2, H2, H2, DO_MADD)
-+RVVCALL(OPIVV3, vmadd_vv_w, OP_SSS_W, H4, H4, H4, DO_MADD)
-+RVVCALL(OPIVV3, vmadd_vv_d, OP_SSS_D, H8, H8, H8, DO_MADD)
-+RVVCALL(OPIVV3, vnmsub_vv_b, OP_SSS_B, H1, H1, H1, DO_NMSUB)
-+RVVCALL(OPIVV3, vnmsub_vv_h, OP_SSS_H, H2, H2, H2, DO_NMSUB)
-+RVVCALL(OPIVV3, vnmsub_vv_w, OP_SSS_W, H4, H4, H4, DO_NMSUB)
-+RVVCALL(OPIVV3, vnmsub_vv_d, OP_SSS_D, H8, H8, H8, DO_NMSUB)
-+GEN_VEXT_VV(vmacc_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV(vmacc_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV(vmacc_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV(vmacc_vv_d, 8, 8, clearq)
-+GEN_VEXT_VV(vnmsac_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV(vnmsac_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV(vnmsac_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV(vnmsac_vv_d, 8, 8, clearq)
-+GEN_VEXT_VV(vmadd_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV(vmadd_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV(vmadd_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV(vmadd_vv_d, 8, 8, clearq)
-+GEN_VEXT_VV(vnmsub_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV(vnmsub_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV(vnmsub_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV(vnmsub_vv_d, 8, 8, clearq)
-+
-+#define OPIVX3(NAME, TD, T1, T2, TX1, TX2, HD, HS2, OP)             \
-+static void do_##NAME(void *vd, target_long s1, void *vs2, int i)   \
-+{                                                                   \
-+    TX2 s2 = *((T2 *)vs2 + HS2(i));                                 \
-+    TD d = *((TD *)vd + HD(i));                                     \
-+    *((TD *)vd + HD(i)) = OP(s2, (TX1)(T1)s1, d);                   \
-+}
-+
-+RVVCALL(OPIVX3, vmacc_vx_b, OP_SSS_B, H1, H1, DO_MACC)
-+RVVCALL(OPIVX3, vmacc_vx_h, OP_SSS_H, H2, H2, DO_MACC)
-+RVVCALL(OPIVX3, vmacc_vx_w, OP_SSS_W, H4, H4, DO_MACC)
-+RVVCALL(OPIVX3, vmacc_vx_d, OP_SSS_D, H8, H8, DO_MACC)
-+RVVCALL(OPIVX3, vnmsac_vx_b, OP_SSS_B, H1, H1, DO_NMSAC)
-+RVVCALL(OPIVX3, vnmsac_vx_h, OP_SSS_H, H2, H2, DO_NMSAC)
-+RVVCALL(OPIVX3, vnmsac_vx_w, OP_SSS_W, H4, H4, DO_NMSAC)
-+RVVCALL(OPIVX3, vnmsac_vx_d, OP_SSS_D, H8, H8, DO_NMSAC)
-+RVVCALL(OPIVX3, vmadd_vx_b, OP_SSS_B, H1, H1, DO_MADD)
-+RVVCALL(OPIVX3, vmadd_vx_h, OP_SSS_H, H2, H2, DO_MADD)
-+RVVCALL(OPIVX3, vmadd_vx_w, OP_SSS_W, H4, H4, DO_MADD)
-+RVVCALL(OPIVX3, vmadd_vx_d, OP_SSS_D, H8, H8, DO_MADD)
-+RVVCALL(OPIVX3, vnmsub_vx_b, OP_SSS_B, H1, H1, DO_NMSUB)
-+RVVCALL(OPIVX3, vnmsub_vx_h, OP_SSS_H, H2, H2, DO_NMSUB)
-+RVVCALL(OPIVX3, vnmsub_vx_w, OP_SSS_W, H4, H4, DO_NMSUB)
-+RVVCALL(OPIVX3, vnmsub_vx_d, OP_SSS_D, H8, H8, DO_NMSUB)
-+GEN_VEXT_VX(vmacc_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX(vmacc_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX(vmacc_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX(vmacc_vx_d, 8, 8, clearq)
-+GEN_VEXT_VX(vnmsac_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX(vnmsac_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX(vnmsac_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX(vnmsac_vx_d, 8, 8, clearq)
-+GEN_VEXT_VX(vmadd_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX(vmadd_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX(vmadd_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX(vmadd_vx_d, 8, 8, clearq)
-+GEN_VEXT_VX(vnmsub_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX(vnmsub_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX(vnmsub_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX(vnmsub_vx_d, 8, 8, clearq)
---
-.27.0

-[PULL 24/63] target/riscv: vector widening integer multiply-add instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-23-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   | 22 ++++++++++++
- target/riscv/insn32.decode              |  7 ++++
- target/riscv/insn_trans/trans_rvv.inc.c |  9 +++++
- target/riscv/vector_helper.c            | 45 +++++++++++++++++++++++++
-files changed, 83 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vnmsub_vx_b, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vnmsub_vx_h, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vnmsub_vx_w, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vnmsub_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+
-+DEF_HELPER_6(vwmaccu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwmaccu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwmaccu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwmacc_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwmacc_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwmacc_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwmaccsu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwmaccsu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwmaccsu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwmaccu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwmaccu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwmaccu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwmacc_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwmacc_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwmacc_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwmaccsu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwmaccsu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwmaccsu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwmaccus_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwmaccus_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwmaccus_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vmadd_vv        101001 . ..... ..... 010 ..... 1010111 @r_vm
- vmadd_vx        101001 . ..... ..... 110 ..... 1010111 @r_vm
- vnmsub_vv       101011 . ..... ..... 010 ..... 1010111 @r_vm
- vnmsub_vx       101011 . ..... ..... 110 ..... 1010111 @r_vm
-+vwmaccu_vv      111100 . ..... ..... 010 ..... 1010111 @r_vm
-+vwmaccu_vx      111100 . ..... ..... 110 ..... 1010111 @r_vm
-+vwmacc_vv       111101 . ..... ..... 010 ..... 1010111 @r_vm
-+vwmacc_vx       111101 . ..... ..... 110 ..... 1010111 @r_vm
-+vwmaccsu_vv     111110 . ..... ..... 010 ..... 1010111 @r_vm
-+vwmaccsu_vx     111110 . ..... ..... 110 ..... 1010111 @r_vm
-+vwmaccus_vx     111111 . ..... ..... 110 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPIVX_TRANS(vmacc_vx, opivx_check)
- GEN_OPIVX_TRANS(vnmsac_vx, opivx_check)
- GEN_OPIVX_TRANS(vmadd_vx, opivx_check)
- GEN_OPIVX_TRANS(vnmsub_vx, opivx_check)
-+
-+/* Vector Widening Integer Multiply-Add Instructions */
-+GEN_OPIVV_WIDEN_TRANS(vwmaccu_vv, opivv_widen_check)
-+GEN_OPIVV_WIDEN_TRANS(vwmacc_vv, opivv_widen_check)
-+GEN_OPIVV_WIDEN_TRANS(vwmaccsu_vv, opivv_widen_check)
-+GEN_OPIVX_WIDEN_TRANS(vwmaccu_vx)
-+GEN_OPIVX_WIDEN_TRANS(vwmacc_vx)
-+GEN_OPIVX_WIDEN_TRANS(vwmaccsu_vx)
-+GEN_OPIVX_WIDEN_TRANS(vwmaccus_vx)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VX(vnmsub_vx_b, 1, 1, clearb)
- GEN_VEXT_VX(vnmsub_vx_h, 2, 2, clearh)
- GEN_VEXT_VX(vnmsub_vx_w, 4, 4, clearl)
- GEN_VEXT_VX(vnmsub_vx_d, 8, 8, clearq)
-+
-+/* Vector Widening Integer Multiply-Add Instructions */
-+RVVCALL(OPIVV3, vwmaccu_vv_b, WOP_UUU_B, H2, H1, H1, DO_MACC)
-+RVVCALL(OPIVV3, vwmaccu_vv_h, WOP_UUU_H, H4, H2, H2, DO_MACC)
-+RVVCALL(OPIVV3, vwmaccu_vv_w, WOP_UUU_W, H8, H4, H4, DO_MACC)
-+RVVCALL(OPIVV3, vwmacc_vv_b, WOP_SSS_B, H2, H1, H1, DO_MACC)
-+RVVCALL(OPIVV3, vwmacc_vv_h, WOP_SSS_H, H4, H2, H2, DO_MACC)
-+RVVCALL(OPIVV3, vwmacc_vv_w, WOP_SSS_W, H8, H4, H4, DO_MACC)
-+RVVCALL(OPIVV3, vwmaccsu_vv_b, WOP_SSU_B, H2, H1, H1, DO_MACC)
-+RVVCALL(OPIVV3, vwmaccsu_vv_h, WOP_SSU_H, H4, H2, H2, DO_MACC)
-+RVVCALL(OPIVV3, vwmaccsu_vv_w, WOP_SSU_W, H8, H4, H4, DO_MACC)
-+GEN_VEXT_VV(vwmaccu_vv_b, 1, 2, clearh)
-+GEN_VEXT_VV(vwmaccu_vv_h, 2, 4, clearl)
-+GEN_VEXT_VV(vwmaccu_vv_w, 4, 8, clearq)
-+GEN_VEXT_VV(vwmacc_vv_b, 1, 2, clearh)
-+GEN_VEXT_VV(vwmacc_vv_h, 2, 4, clearl)
-+GEN_VEXT_VV(vwmacc_vv_w, 4, 8, clearq)
-+GEN_VEXT_VV(vwmaccsu_vv_b, 1, 2, clearh)
-+GEN_VEXT_VV(vwmaccsu_vv_h, 2, 4, clearl)
-+GEN_VEXT_VV(vwmaccsu_vv_w, 4, 8, clearq)
-+
-+RVVCALL(OPIVX3, vwmaccu_vx_b, WOP_UUU_B, H2, H1, DO_MACC)
-+RVVCALL(OPIVX3, vwmaccu_vx_h, WOP_UUU_H, H4, H2, DO_MACC)
-+RVVCALL(OPIVX3, vwmaccu_vx_w, WOP_UUU_W, H8, H4, DO_MACC)
-+RVVCALL(OPIVX3, vwmacc_vx_b, WOP_SSS_B, H2, H1, DO_MACC)
-+RVVCALL(OPIVX3, vwmacc_vx_h, WOP_SSS_H, H4, H2, DO_MACC)
-+RVVCALL(OPIVX3, vwmacc_vx_w, WOP_SSS_W, H8, H4, DO_MACC)
-+RVVCALL(OPIVX3, vwmaccsu_vx_b, WOP_SSU_B, H2, H1, DO_MACC)
-+RVVCALL(OPIVX3, vwmaccsu_vx_h, WOP_SSU_H, H4, H2, DO_MACC)
-+RVVCALL(OPIVX3, vwmaccsu_vx_w, WOP_SSU_W, H8, H4, DO_MACC)
-+RVVCALL(OPIVX3, vwmaccus_vx_b, WOP_SUS_B, H2, H1, DO_MACC)
-+RVVCALL(OPIVX3, vwmaccus_vx_h, WOP_SUS_H, H4, H2, DO_MACC)
-+RVVCALL(OPIVX3, vwmaccus_vx_w, WOP_SUS_W, H8, H4, DO_MACC)
-+GEN_VEXT_VX(vwmaccu_vx_b, 1, 2, clearh)
-+GEN_VEXT_VX(vwmaccu_vx_h, 2, 4, clearl)
-+GEN_VEXT_VX(vwmaccu_vx_w, 4, 8, clearq)
-+GEN_VEXT_VX(vwmacc_vx_b, 1, 2, clearh)
-+GEN_VEXT_VX(vwmacc_vx_h, 2, 4, clearl)
-+GEN_VEXT_VX(vwmacc_vx_w, 4, 8, clearq)
-+GEN_VEXT_VX(vwmaccsu_vx_b, 1, 2, clearh)
-+GEN_VEXT_VX(vwmaccsu_vx_h, 2, 4, clearl)
-+GEN_VEXT_VX(vwmaccsu_vx_w, 4, 8, clearq)
-+GEN_VEXT_VX(vwmaccus_vx_b, 1, 2, clearh)
-+GEN_VEXT_VX(vwmaccus_vx_h, 2, 4, clearl)
-+GEN_VEXT_VX(vwmaccus_vx_w, 4, 8, clearq)
---
-.27.0

-[PULL 29/63] target/riscv: vector widening saturating scaled multiply-add
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-28-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   |  22 +++
- target/riscv/insn32.decode              |   7 +
- target/riscv/insn_trans/trans_rvv.inc.c |   9 ++
- target/riscv/vector_helper.c            | 205 ++++++++++++++++++++++++
-files changed, 243 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vsmul_vx_b, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vsmul_vx_h, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vsmul_vx_w, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vsmul_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+
-+DEF_HELPER_6(vwsmaccu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwsmaccu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwsmaccu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwsmacc_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwsmacc_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwsmacc_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwsmaccsu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwsmaccsu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwsmaccsu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vwsmaccu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwsmaccu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwsmaccu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwsmacc_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwsmacc_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwsmacc_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwsmaccsu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwsmaccsu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwsmaccsu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwsmaccus_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwsmaccus_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vwsmaccus_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vasub_vv        100110 . ..... ..... 000 ..... 1010111 @r_vm
- vasub_vx        100110 . ..... ..... 100 ..... 1010111 @r_vm
- vsmul_vv        100111 . ..... ..... 000 ..... 1010111 @r_vm
- vsmul_vx        100111 . ..... ..... 100 ..... 1010111 @r_vm
-+vwsmaccu_vv     111100 . ..... ..... 000 ..... 1010111 @r_vm
-+vwsmaccu_vx     111100 . ..... ..... 100 ..... 1010111 @r_vm
-+vwsmacc_vv      111101 . ..... ..... 000 ..... 1010111 @r_vm
-+vwsmacc_vx      111101 . ..... ..... 100 ..... 1010111 @r_vm
-+vwsmaccsu_vv    111110 . ..... ..... 000 ..... 1010111 @r_vm
-+vwsmaccsu_vx    111110 . ..... ..... 100 ..... 1010111 @r_vm
-+vwsmaccus_vx    111111 . ..... ..... 100 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPIVI_TRANS(vaadd_vi, 0, vaadd_vx, opivx_check)
- /* Vector Single-Width Fractional Multiply with Rounding and Saturation */
- GEN_OPIVV_TRANS(vsmul_vv, opivv_check)
- GEN_OPIVX_TRANS(vsmul_vx,  opivx_check)
-+
-+/* Vector Widening Saturating Scaled Multiply-Add */
-+GEN_OPIVV_WIDEN_TRANS(vwsmaccu_vv, opivv_widen_check)
-+GEN_OPIVV_WIDEN_TRANS(vwsmacc_vv, opivv_widen_check)
-+GEN_OPIVV_WIDEN_TRANS(vwsmaccsu_vv, opivv_widen_check)
-+GEN_OPIVX_WIDEN_TRANS(vwsmaccu_vx)
-+GEN_OPIVX_WIDEN_TRANS(vwsmacc_vx)
-+GEN_OPIVX_WIDEN_TRANS(vwsmaccsu_vx)
-+GEN_OPIVX_WIDEN_TRANS(vwsmaccus_vx)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VX_RM(vsmul_vx_b, 1, 1, clearb)
- GEN_VEXT_VX_RM(vsmul_vx_h, 2, 2, clearh)
- GEN_VEXT_VX_RM(vsmul_vx_w, 4, 4, clearl)
- GEN_VEXT_VX_RM(vsmul_vx_d, 8, 8, clearq)
-+
-+/* Vector Widening Saturating Scaled Multiply-Add */
-+static inline uint16_t
-+vwsmaccu8(CPURISCVState *env, int vxrm, uint8_t a, uint8_t b,
-+          uint16_t c)
-+{
-+    uint8_t round;
-+    uint16_t res = (uint16_t)a * b;
-+
-+    round = get_round(vxrm, res, 4);
-+    res   = (res >> 4) + round;
-+    return saddu16(env, vxrm, c, res);
-+}
-+
-+static inline uint32_t
-+vwsmaccu16(CPURISCVState *env, int vxrm, uint16_t a, uint16_t b,
-+           uint32_t c)
-+{
-+    uint8_t round;
-+    uint32_t res = (uint32_t)a * b;
-+
-+    round = get_round(vxrm, res, 8);
-+    res   = (res >> 8) + round;
-+    return saddu32(env, vxrm, c, res);
-+}
-+
-+static inline uint64_t
-+vwsmaccu32(CPURISCVState *env, int vxrm, uint32_t a, uint32_t b,
-+           uint64_t c)
-+{
-+    uint8_t round;
-+    uint64_t res = (uint64_t)a * b;
-+
-+    round = get_round(vxrm, res, 16);
-+    res   = (res >> 16) + round;
-+    return saddu64(env, vxrm, c, res);
-+}
-+
-+#define OPIVV3_RM(NAME, TD, T1, T2, TX1, TX2, HD, HS1, HS2, OP)    \
-+static inline void                                                 \
-+do_##NAME(void *vd, void *vs1, void *vs2, int i,                   \
-+          CPURISCVState *env, int vxrm)                            \
-+{                                                                  \
-+    TX1 s1 = *((T1 *)vs1 + HS1(i));                                \
-+    TX2 s2 = *((T2 *)vs2 + HS2(i));                                \
-+    TD d = *((TD *)vd + HD(i));                                    \
-+    *((TD *)vd + HD(i)) = OP(env, vxrm, s2, s1, d);                \
-+}
-+
-+RVVCALL(OPIVV3_RM, vwsmaccu_vv_b, WOP_UUU_B, H2, H1, H1, vwsmaccu8)
-+RVVCALL(OPIVV3_RM, vwsmaccu_vv_h, WOP_UUU_H, H4, H2, H2, vwsmaccu16)
-+RVVCALL(OPIVV3_RM, vwsmaccu_vv_w, WOP_UUU_W, H8, H4, H4, vwsmaccu32)
-+GEN_VEXT_VV_RM(vwsmaccu_vv_b, 1, 2, clearh)
-+GEN_VEXT_VV_RM(vwsmaccu_vv_h, 2, 4, clearl)
-+GEN_VEXT_VV_RM(vwsmaccu_vv_w, 4, 8, clearq)
-+
-+#define OPIVX3_RM(NAME, TD, T1, T2, TX1, TX2, HD, HS2, OP)         \
-+static inline void                                                 \
-+do_##NAME(void *vd, target_long s1, void *vs2, int i,              \
-+          CPURISCVState *env, int vxrm)                            \
-+{                                                                  \
-+    TX2 s2 = *((T2 *)vs2 + HS2(i));                                \
-+    TD d = *((TD *)vd + HD(i));                                    \
-+    *((TD *)vd + HD(i)) = OP(env, vxrm, s2, (TX1)(T1)s1, d);       \
-+}
-+
-+RVVCALL(OPIVX3_RM, vwsmaccu_vx_b, WOP_UUU_B, H2, H1, vwsmaccu8)
-+RVVCALL(OPIVX3_RM, vwsmaccu_vx_h, WOP_UUU_H, H4, H2, vwsmaccu16)
-+RVVCALL(OPIVX3_RM, vwsmaccu_vx_w, WOP_UUU_W, H8, H4, vwsmaccu32)
-+GEN_VEXT_VX_RM(vwsmaccu_vx_b, 1, 2, clearh)
-+GEN_VEXT_VX_RM(vwsmaccu_vx_h, 2, 4, clearl)
-+GEN_VEXT_VX_RM(vwsmaccu_vx_w, 4, 8, clearq)
-+
-+static inline int16_t
-+vwsmacc8(CPURISCVState *env, int vxrm, int8_t a, int8_t b, int16_t c)
-+{
-+    uint8_t round;
-+    int16_t res = (int16_t)a * b;
-+
-+    round = get_round(vxrm, res, 4);
-+    res   = (res >> 4) + round;
-+    return sadd16(env, vxrm, c, res);
-+}
-+
-+static inline int32_t
-+vwsmacc16(CPURISCVState *env, int vxrm, int16_t a, int16_t b, int32_t c)
-+{
-+    uint8_t round;
-+    int32_t res = (int32_t)a * b;
-+
-+    round = get_round(vxrm, res, 8);
-+    res   = (res >> 8) + round;
-+    return sadd32(env, vxrm, c, res);
-+
-+}
-+
-+static inline int64_t
-+vwsmacc32(CPURISCVState *env, int vxrm, int32_t a, int32_t b, int64_t c)
-+{
-+    uint8_t round;
-+    int64_t res = (int64_t)a * b;
-+
-+    round = get_round(vxrm, res, 16);
-+    res   = (res >> 16) + round;
-+    return sadd64(env, vxrm, c, res);
-+}
-+
-+RVVCALL(OPIVV3_RM, vwsmacc_vv_b, WOP_SSS_B, H2, H1, H1, vwsmacc8)
-+RVVCALL(OPIVV3_RM, vwsmacc_vv_h, WOP_SSS_H, H4, H2, H2, vwsmacc16)
-+RVVCALL(OPIVV3_RM, vwsmacc_vv_w, WOP_SSS_W, H8, H4, H4, vwsmacc32)
-+GEN_VEXT_VV_RM(vwsmacc_vv_b, 1, 2, clearh)
-+GEN_VEXT_VV_RM(vwsmacc_vv_h, 2, 4, clearl)
-+GEN_VEXT_VV_RM(vwsmacc_vv_w, 4, 8, clearq)
-+RVVCALL(OPIVX3_RM, vwsmacc_vx_b, WOP_SSS_B, H2, H1, vwsmacc8)
-+RVVCALL(OPIVX3_RM, vwsmacc_vx_h, WOP_SSS_H, H4, H2, vwsmacc16)
-+RVVCALL(OPIVX3_RM, vwsmacc_vx_w, WOP_SSS_W, H8, H4, vwsmacc32)
-+GEN_VEXT_VX_RM(vwsmacc_vx_b, 1, 2, clearh)
-+GEN_VEXT_VX_RM(vwsmacc_vx_h, 2, 4, clearl)
-+GEN_VEXT_VX_RM(vwsmacc_vx_w, 4, 8, clearq)
-+
-+static inline int16_t
-+vwsmaccsu8(CPURISCVState *env, int vxrm, uint8_t a, int8_t b, int16_t c)
-+{
-+    uint8_t round;
-+    int16_t res = a * (int16_t)b;
-+
-+    round = get_round(vxrm, res, 4);
-+    res   = (res >> 4) + round;
-+    return ssub16(env, vxrm, c, res);
-+}
-+
-+static inline int32_t
-+vwsmaccsu16(CPURISCVState *env, int vxrm, uint16_t a, int16_t b, uint32_t c)
-+{
-+    uint8_t round;
-+    int32_t res = a * (int32_t)b;
-+
-+    round = get_round(vxrm, res, 8);
-+    res   = (res >> 8) + round;
-+    return ssub32(env, vxrm, c, res);
-+}
-+
-+static inline int64_t
-+vwsmaccsu32(CPURISCVState *env, int vxrm, uint32_t a, int32_t b, int64_t c)
-+{
-+    uint8_t round;
-+    int64_t res = a * (int64_t)b;
-+
-+    round = get_round(vxrm, res, 16);
-+    res   = (res >> 16) + round;
-+    return ssub64(env, vxrm, c, res);
-+}
-+
-+RVVCALL(OPIVV3_RM, vwsmaccsu_vv_b, WOP_SSU_B, H2, H1, H1, vwsmaccsu8)
-+RVVCALL(OPIVV3_RM, vwsmaccsu_vv_h, WOP_SSU_H, H4, H2, H2, vwsmaccsu16)
-+RVVCALL(OPIVV3_RM, vwsmaccsu_vv_w, WOP_SSU_W, H8, H4, H4, vwsmaccsu32)
-+GEN_VEXT_VV_RM(vwsmaccsu_vv_b, 1, 2, clearh)
-+GEN_VEXT_VV_RM(vwsmaccsu_vv_h, 2, 4, clearl)
-+GEN_VEXT_VV_RM(vwsmaccsu_vv_w, 4, 8, clearq)
-+RVVCALL(OPIVX3_RM, vwsmaccsu_vx_b, WOP_SSU_B, H2, H1, vwsmaccsu8)
-+RVVCALL(OPIVX3_RM, vwsmaccsu_vx_h, WOP_SSU_H, H4, H2, vwsmaccsu16)
-+RVVCALL(OPIVX3_RM, vwsmaccsu_vx_w, WOP_SSU_W, H8, H4, vwsmaccsu32)
-+GEN_VEXT_VX_RM(vwsmaccsu_vx_b, 1, 2, clearh)
-+GEN_VEXT_VX_RM(vwsmaccsu_vx_h, 2, 4, clearl)
-+GEN_VEXT_VX_RM(vwsmaccsu_vx_w, 4, 8, clearq)
-+
-+static inline int16_t
-+vwsmaccus8(CPURISCVState *env, int vxrm, int8_t a, uint8_t b, int16_t c)
-+{
-+    uint8_t round;
-+    int16_t res = (int16_t)a * b;
-+
-+    round = get_round(vxrm, res, 4);
-+    res   = (res >> 4) + round;
-+    return ssub16(env, vxrm, c, res);
-+}
-+
-+static inline int32_t
-+vwsmaccus16(CPURISCVState *env, int vxrm, int16_t a, uint16_t b, int32_t c)
-+{
-+    uint8_t round;
-+    int32_t res = (int32_t)a * b;
-+
-+    round = get_round(vxrm, res, 8);
-+    res   = (res >> 8) + round;
-+    return ssub32(env, vxrm, c, res);
-+}
-+
-+static inline int64_t
-+vwsmaccus32(CPURISCVState *env, int vxrm, int32_t a, uint32_t b, int64_t c)
-+{
-+    uint8_t round;
-+    int64_t res = (int64_t)a * b;
-+
-+    round = get_round(vxrm, res, 16);
-+    res   = (res >> 16) + round;
-+    return ssub64(env, vxrm, c, res);
-+}
-+
-+RVVCALL(OPIVX3_RM, vwsmaccus_vx_b, WOP_SUS_B, H2, H1, vwsmaccus8)
-+RVVCALL(OPIVX3_RM, vwsmaccus_vx_h, WOP_SUS_H, H4, H2, vwsmaccus16)
-+RVVCALL(OPIVX3_RM, vwsmaccus_vx_w, WOP_SUS_W, H8, H4, vwsmaccus32)
-+GEN_VEXT_VX_RM(vwsmaccus_vx_b, 1, 2, clearh)
-+GEN_VEXT_VX_RM(vwsmaccus_vx_h, 2, 4, clearl)
-+GEN_VEXT_VX_RM(vwsmaccus_vx_w, 4, 8, clearq)
---
-.27.0

-[PULL 30/63] target/riscv: vector single-width scaling shift instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-29-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   |  17 ++++
- target/riscv/insn32.decode              |   6 ++
- target/riscv/insn_trans/trans_rvv.inc.c |   8 ++
- target/riscv/vector_helper.c            | 117 ++++++++++++++++++++++++
-files changed, 148 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vwsmaccsu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vwsmaccus_vx_b, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vwsmaccus_vx_h, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vwsmaccus_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+
-+DEF_HELPER_6(vssrl_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vssrl_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vssrl_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vssrl_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vssra_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vssra_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vssra_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vssra_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vssrl_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vssrl_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vssrl_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vssrl_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vssra_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vssra_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vssra_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vssra_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vwsmacc_vx      111101 . ..... ..... 100 ..... 1010111 @r_vm
- vwsmaccsu_vv    111110 . ..... ..... 000 ..... 1010111 @r_vm
- vwsmaccsu_vx    111110 . ..... ..... 100 ..... 1010111 @r_vm
- vwsmaccus_vx    111111 . ..... ..... 100 ..... 1010111 @r_vm
-+vssrl_vv        101010 . ..... ..... 000 ..... 1010111 @r_vm
-+vssrl_vx        101010 . ..... ..... 100 ..... 1010111 @r_vm
-+vssrl_vi        101010 . ..... ..... 011 ..... 1010111 @r_vm
-+vssra_vv        101011 . ..... ..... 000 ..... 1010111 @r_vm
-+vssra_vx        101011 . ..... ..... 100 ..... 1010111 @r_vm
-+vssra_vi        101011 . ..... ..... 011 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPIVX_WIDEN_TRANS(vwsmaccu_vx)
- GEN_OPIVX_WIDEN_TRANS(vwsmacc_vx)
- GEN_OPIVX_WIDEN_TRANS(vwsmaccsu_vx)
- GEN_OPIVX_WIDEN_TRANS(vwsmaccus_vx)
-+
-+/* Vector Single-Width Scaling Shift Instructions */
-+GEN_OPIVV_TRANS(vssrl_vv, opivv_check)
-+GEN_OPIVV_TRANS(vssra_vv, opivv_check)
-+GEN_OPIVX_TRANS(vssrl_vx,  opivx_check)
-+GEN_OPIVX_TRANS(vssra_vx,  opivx_check)
-+GEN_OPIVI_TRANS(vssrl_vi, 1, vssrl_vx, opivx_check)
-+GEN_OPIVI_TRANS(vssra_vi, 0, vssra_vx, opivx_check)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ RVVCALL(OPIVX3_RM, vwsmaccus_vx_w, WOP_SUS_W, H8, H4, vwsmaccus32)
- GEN_VEXT_VX_RM(vwsmaccus_vx_b, 1, 2, clearh)
- GEN_VEXT_VX_RM(vwsmaccus_vx_h, 2, 4, clearl)
- GEN_VEXT_VX_RM(vwsmaccus_vx_w, 4, 8, clearq)
-+
-+/* Vector Single-Width Scaling Shift Instructions */
-+static inline uint8_t
-+vssrl8(CPURISCVState *env, int vxrm, uint8_t a, uint8_t b)
-+{
-+    uint8_t round, shift = b & 0x7;
-+    uint8_t res;
-+
-+    round = get_round(vxrm, a, shift);
-+    res   = (a >> shift)  + round;
-+    return res;
-+}
-+static inline uint16_t
-+vssrl16(CPURISCVState *env, int vxrm, uint16_t a, uint16_t b)
-+{
-+    uint8_t round, shift = b & 0xf;
-+    uint16_t res;
-+
-+    round = get_round(vxrm, a, shift);
-+    res   = (a >> shift)  + round;
-+    return res;
-+}
-+static inline uint32_t
-+vssrl32(CPURISCVState *env, int vxrm, uint32_t a, uint32_t b)
-+{
-+    uint8_t round, shift = b & 0x1f;
-+    uint32_t res;
-+
-+    round = get_round(vxrm, a, shift);
-+    res   = (a >> shift)  + round;
-+    return res;
-+}
-+static inline uint64_t
-+vssrl64(CPURISCVState *env, int vxrm, uint64_t a, uint64_t b)
-+{
-+    uint8_t round, shift = b & 0x3f;
-+    uint64_t res;
-+
-+    round = get_round(vxrm, a, shift);
-+    res   = (a >> shift)  + round;
-+    return res;
-+}
-+RVVCALL(OPIVV2_RM, vssrl_vv_b, OP_UUU_B, H1, H1, H1, vssrl8)
-+RVVCALL(OPIVV2_RM, vssrl_vv_h, OP_UUU_H, H2, H2, H2, vssrl16)
-+RVVCALL(OPIVV2_RM, vssrl_vv_w, OP_UUU_W, H4, H4, H4, vssrl32)
-+RVVCALL(OPIVV2_RM, vssrl_vv_d, OP_UUU_D, H8, H8, H8, vssrl64)
-+GEN_VEXT_VV_RM(vssrl_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV_RM(vssrl_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV_RM(vssrl_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV_RM(vssrl_vv_d, 8, 8, clearq)
-+
-+RVVCALL(OPIVX2_RM, vssrl_vx_b, OP_UUU_B, H1, H1, vssrl8)
-+RVVCALL(OPIVX2_RM, vssrl_vx_h, OP_UUU_H, H2, H2, vssrl16)
-+RVVCALL(OPIVX2_RM, vssrl_vx_w, OP_UUU_W, H4, H4, vssrl32)
-+RVVCALL(OPIVX2_RM, vssrl_vx_d, OP_UUU_D, H8, H8, vssrl64)
-+GEN_VEXT_VX_RM(vssrl_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX_RM(vssrl_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX_RM(vssrl_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX_RM(vssrl_vx_d, 8, 8, clearq)
-+
-+static inline int8_t
-+vssra8(CPURISCVState *env, int vxrm, int8_t a, int8_t b)
-+{
-+    uint8_t round, shift = b & 0x7;
-+    int8_t res;
-+
-+    round = get_round(vxrm, a, shift);
-+    res   = (a >> shift)  + round;
-+    return res;
-+}
-+static inline int16_t
-+vssra16(CPURISCVState *env, int vxrm, int16_t a, int16_t b)
-+{
-+    uint8_t round, shift = b & 0xf;
-+    int16_t res;
-+
-+    round = get_round(vxrm, a, shift);
-+    res   = (a >> shift)  + round;
-+    return res;
-+}
-+static inline int32_t
-+vssra32(CPURISCVState *env, int vxrm, int32_t a, int32_t b)
-+{
-+    uint8_t round, shift = b & 0x1f;
-+    int32_t res;
-+
-+    round = get_round(vxrm, a, shift);
-+    res   = (a >> shift)  + round;
-+    return res;
-+}
-+static inline int64_t
-+vssra64(CPURISCVState *env, int vxrm, int64_t a, int64_t b)
-+{
-+    uint8_t round, shift = b & 0x3f;
-+    int64_t res;
-+
-+    round = get_round(vxrm, a, shift);
-+    res   = (a >> shift)  + round;
-+    return res;
-+}
-+RVVCALL(OPIVV2_RM, vssra_vv_b, OP_SSS_B, H1, H1, H1, vssra8)
-+RVVCALL(OPIVV2_RM, vssra_vv_h, OP_SSS_H, H2, H2, H2, vssra16)
-+RVVCALL(OPIVV2_RM, vssra_vv_w, OP_SSS_W, H4, H4, H4, vssra32)
-+RVVCALL(OPIVV2_RM, vssra_vv_d, OP_SSS_D, H8, H8, H8, vssra64)
-+GEN_VEXT_VV_RM(vssra_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV_RM(vssra_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV_RM(vssra_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV_RM(vssra_vv_d, 8, 8, clearq)
-+
-+RVVCALL(OPIVX2_RM, vssra_vx_b, OP_SSS_B, H1, H1, vssra8)
-+RVVCALL(OPIVX2_RM, vssra_vx_h, OP_SSS_H, H2, H2, vssra16)
-+RVVCALL(OPIVX2_RM, vssra_vx_w, OP_SSS_W, H4, H4, vssra32)
-+RVVCALL(OPIVX2_RM, vssra_vx_d, OP_SSS_D, H8, H8, vssra64)
-+GEN_VEXT_VX_RM(vssra_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX_RM(vssra_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX_RM(vssra_vx_w, 4, 4, clearl)
-+GEN_VEXT_VX_RM(vssra_vx_d, 8, 8, clearq)
---
-.27.0

-[PULL 31/63] target/riscv: vector narrowing fixed-point clip instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-30-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   |  13 +++
- target/riscv/insn32.decode              |   6 +
- target/riscv/insn_trans/trans_rvv.inc.c |   8 ++
- target/riscv/vector_helper.c            | 141 ++++++++++++++++++++++++
-files changed, 168 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vssra_vx_b, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vssra_vx_h, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vssra_vx_w, void, ptr, ptr, tl, ptr, env, i32)
- DEF_HELPER_6(vssra_vx_d, void, ptr, ptr, tl, ptr, env, i32)
-+
-+DEF_HELPER_6(vnclip_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vnclip_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vnclip_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vnclipu_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vnclipu_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vnclipu_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vnclipu_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vnclipu_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vnclipu_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vnclip_vx_b, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vnclip_vx_h, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_6(vnclip_vx_w, void, ptr, ptr, tl, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vssrl_vi        101010 . ..... ..... 011 ..... 1010111 @r_vm
- vssra_vv        101011 . ..... ..... 000 ..... 1010111 @r_vm
- vssra_vx        101011 . ..... ..... 100 ..... 1010111 @r_vm
- vssra_vi        101011 . ..... ..... 011 ..... 1010111 @r_vm
-+vnclipu_vv      101110 . ..... ..... 000 ..... 1010111 @r_vm
-+vnclipu_vx      101110 . ..... ..... 100 ..... 1010111 @r_vm
-+vnclipu_vi      101110 . ..... ..... 011 ..... 1010111 @r_vm
-+vnclip_vv       101111 . ..... ..... 000 ..... 1010111 @r_vm
-+vnclip_vx       101111 . ..... ..... 100 ..... 1010111 @r_vm
-+vnclip_vi       101111 . ..... ..... 011 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPIVX_TRANS(vssrl_vx,  opivx_check)
- GEN_OPIVX_TRANS(vssra_vx,  opivx_check)
- GEN_OPIVI_TRANS(vssrl_vi, 1, vssrl_vx, opivx_check)
- GEN_OPIVI_TRANS(vssra_vi, 0, vssra_vx, opivx_check)
-+
-+/* Vector Narrowing Fixed-Point Clip Instructions */
-+GEN_OPIVV_NARROW_TRANS(vnclipu_vv)
-+GEN_OPIVV_NARROW_TRANS(vnclip_vv)
-+GEN_OPIVX_NARROW_TRANS(vnclipu_vx)
-+GEN_OPIVX_NARROW_TRANS(vnclip_vx)
-+GEN_OPIVI_NARROW_TRANS(vnclipu_vi, 1, vnclipu_vx)
-+GEN_OPIVI_NARROW_TRANS(vnclip_vi, 1, vnclip_vx)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_AMO(vamomaxuw_v_w, uint32_t, uint32_t, idx_w, clearl)
- #define WOP_SSU_B int16_t, int8_t, uint8_t, int16_t, uint16_t
- #define WOP_SSU_H int32_t, int16_t, uint16_t, int32_t, uint32_t
- #define WOP_SSU_W int64_t, int32_t, uint32_t, int64_t, uint64_t
-+#define NOP_SSS_B int8_t, int8_t, int16_t, int8_t, int16_t
-+#define NOP_SSS_H int16_t, int16_t, int32_t, int16_t, int32_t
-+#define NOP_SSS_W int32_t, int32_t, int64_t, int32_t, int64_t
-+#define NOP_UUU_B uint8_t, uint8_t, uint16_t, uint8_t, uint16_t
-+#define NOP_UUU_H uint16_t, uint16_t, uint32_t, uint16_t, uint32_t
-+#define NOP_UUU_W uint32_t, uint32_t, uint64_t, uint32_t, uint64_t
- /* operation of two vector elements */
- typedef void opivv2_fn(void *vd, void *vs1, void *vs2, int i);
-@@ -XXX,XX +XXX,XX @@ vssra64(CPURISCVState *env, int vxrm, int64_t a, int64_t b)
-     res   = (a >> shift)  + round;
-     return res;
- }
-+
- RVVCALL(OPIVV2_RM, vssra_vv_b, OP_SSS_B, H1, H1, H1, vssra8)
- RVVCALL(OPIVV2_RM, vssra_vv_h, OP_SSS_H, H2, H2, H2, vssra16)
- RVVCALL(OPIVV2_RM, vssra_vv_w, OP_SSS_W, H4, H4, H4, vssra32)
-@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VX_RM(vssra_vx_b, 1, 1, clearb)
- GEN_VEXT_VX_RM(vssra_vx_h, 2, 2, clearh)
- GEN_VEXT_VX_RM(vssra_vx_w, 4, 4, clearl)
- GEN_VEXT_VX_RM(vssra_vx_d, 8, 8, clearq)
-+
-+/* Vector Narrowing Fixed-Point Clip Instructions */
-+static inline int8_t
-+vnclip8(CPURISCVState *env, int vxrm, int16_t a, int8_t b)
-+{
-+    uint8_t round, shift = b & 0xf;
-+    int16_t res;
-+
-+    round = get_round(vxrm, a, shift);
-+    res   = (a >> shift)  + round;
-+    if (res > INT8_MAX) {
-+        env->vxsat = 0x1;
-+        return INT8_MAX;
-+    } else if (res < INT8_MIN) {
-+        env->vxsat = 0x1;
-+        return INT8_MIN;
-+    } else {
-+        return res;
-+    }
-+}
-+
-+static inline int16_t
-+vnclip16(CPURISCVState *env, int vxrm, int32_t a, int16_t b)
-+{
-+    uint8_t round, shift = b & 0x1f;
-+    int32_t res;
-+
-+    round = get_round(vxrm, a, shift);
-+    res   = (a >> shift)  + round;
-+    if (res > INT16_MAX) {
-+        env->vxsat = 0x1;
-+        return INT16_MAX;
-+    } else if (res < INT16_MIN) {
-+        env->vxsat = 0x1;
-+        return INT16_MIN;
-+    } else {
-+        return res;
-+    }
-+}
-+
-+static inline int32_t
-+vnclip32(CPURISCVState *env, int vxrm, int64_t a, int32_t b)
-+{
-+    uint8_t round, shift = b & 0x3f;
-+    int64_t res;
-+
-+    round = get_round(vxrm, a, shift);
-+    res   = (a >> shift)  + round;
-+    if (res > INT32_MAX) {
-+        env->vxsat = 0x1;
-+        return INT32_MAX;
-+    } else if (res < INT32_MIN) {
-+        env->vxsat = 0x1;
-+        return INT32_MIN;
-+    } else {
-+        return res;
-+    }
-+}
-+
-+RVVCALL(OPIVV2_RM, vnclip_vv_b, NOP_SSS_B, H1, H2, H1, vnclip8)
-+RVVCALL(OPIVV2_RM, vnclip_vv_h, NOP_SSS_H, H2, H4, H2, vnclip16)
-+RVVCALL(OPIVV2_RM, vnclip_vv_w, NOP_SSS_W, H4, H8, H4, vnclip32)
-+GEN_VEXT_VV_RM(vnclip_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV_RM(vnclip_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV_RM(vnclip_vv_w, 4, 4, clearl)
-+
-+RVVCALL(OPIVX2_RM, vnclip_vx_b, NOP_SSS_B, H1, H2, vnclip8)
-+RVVCALL(OPIVX2_RM, vnclip_vx_h, NOP_SSS_H, H2, H4, vnclip16)
-+RVVCALL(OPIVX2_RM, vnclip_vx_w, NOP_SSS_W, H4, H8, vnclip32)
-+GEN_VEXT_VX_RM(vnclip_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX_RM(vnclip_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX_RM(vnclip_vx_w, 4, 4, clearl)
-+
-+static inline uint8_t
-+vnclipu8(CPURISCVState *env, int vxrm, uint16_t a, uint8_t b)
-+{
-+    uint8_t round, shift = b & 0xf;
-+    uint16_t res;
-+
-+    round = get_round(vxrm, a, shift);
-+    res   = (a >> shift)  + round;
-+    if (res > UINT8_MAX) {
-+        env->vxsat = 0x1;
-+        return UINT8_MAX;
-+    } else {
-+        return res;
-+    }
-+}
-+
-+static inline uint16_t
-+vnclipu16(CPURISCVState *env, int vxrm, uint32_t a, uint16_t b)
-+{
-+    uint8_t round, shift = b & 0x1f;
-+    uint32_t res;
-+
-+    round = get_round(vxrm, a, shift);
-+    res   = (a >> shift)  + round;
-+    if (res > UINT16_MAX) {
-+        env->vxsat = 0x1;
-+        return UINT16_MAX;
-+    } else {
-+        return res;
-+    }
-+}
-+
-+static inline uint32_t
-+vnclipu32(CPURISCVState *env, int vxrm, uint64_t a, uint32_t b)
-+{
-+    uint8_t round, shift = b & 0x3f;
-+    int64_t res;
-+
-+    round = get_round(vxrm, a, shift);
-+    res   = (a >> shift)  + round;
-+    if (res > UINT32_MAX) {
-+        env->vxsat = 0x1;
-+        return UINT32_MAX;
-+    } else {
-+        return res;
-+    }
-+}
-+
-+RVVCALL(OPIVV2_RM, vnclipu_vv_b, NOP_UUU_B, H1, H2, H1, vnclipu8)
-+RVVCALL(OPIVV2_RM, vnclipu_vv_h, NOP_UUU_H, H2, H4, H2, vnclipu16)
-+RVVCALL(OPIVV2_RM, vnclipu_vv_w, NOP_UUU_W, H4, H8, H4, vnclipu32)
-+GEN_VEXT_VV_RM(vnclipu_vv_b, 1, 1, clearb)
-+GEN_VEXT_VV_RM(vnclipu_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV_RM(vnclipu_vv_w, 4, 4, clearl)
-+
-+RVVCALL(OPIVX2_RM, vnclipu_vx_b, NOP_UUU_B, H1, H2, vnclipu8)
-+RVVCALL(OPIVX2_RM, vnclipu_vx_h, NOP_UUU_H, H2, H4, vnclipu16)
-+RVVCALL(OPIVX2_RM, vnclipu_vx_w, NOP_UUU_W, H4, H8, vnclipu32)
-+GEN_VEXT_VX_RM(vnclipu_vx_b, 1, 1, clearb)
-+GEN_VEXT_VX_RM(vnclipu_vx_h, 2, 2, clearh)
-+GEN_VEXT_VX_RM(vnclipu_vx_w, 4, 4, clearl)
---
-.27.0

-[PULL 33/63] target/riscv: vector widening floating-point add/subtract instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-32-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   |  17 +++
- target/riscv/insn32.decode              |   8 ++
- target/riscv/insn_trans/trans_rvv.inc.c | 149 ++++++++++++++++++++++++
- target/riscv/vector_helper.c            |  83 +++++++++++++
-files changed, 257 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vfsub_vf_d, void, ptr, ptr, i64, ptr, env, i32)
- DEF_HELPER_6(vfrsub_vf_h, void, ptr, ptr, i64, ptr, env, i32)
- DEF_HELPER_6(vfrsub_vf_w, void, ptr, ptr, i64, ptr, env, i32)
- DEF_HELPER_6(vfrsub_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-+
-+DEF_HELPER_6(vfwadd_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfwadd_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfwsub_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfwsub_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfwadd_wv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfwadd_wv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfwsub_wv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfwsub_wv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfwadd_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfwadd_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfwsub_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfwsub_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfwadd_wf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfwadd_wf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfwsub_wf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfwsub_wf_w, void, ptr, ptr, i64, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vfadd_vf        000000 . ..... ..... 101 ..... 1010111 @r_vm
- vfsub_vv        000010 . ..... ..... 001 ..... 1010111 @r_vm
- vfsub_vf        000010 . ..... ..... 101 ..... 1010111 @r_vm
- vfrsub_vf       100111 . ..... ..... 101 ..... 1010111 @r_vm
-+vfwadd_vv       110000 . ..... ..... 001 ..... 1010111 @r_vm
-+vfwadd_vf       110000 . ..... ..... 101 ..... 1010111 @r_vm
-+vfwadd_wv       110100 . ..... ..... 001 ..... 1010111 @r_vm
-+vfwadd_wf       110100 . ..... ..... 101 ..... 1010111 @r_vm
-+vfwsub_vv       110010 . ..... ..... 001 ..... 1010111 @r_vm
-+vfwsub_vf       110010 . ..... ..... 101 ..... 1010111 @r_vm
-+vfwsub_wv       110110 . ..... ..... 001 ..... 1010111 @r_vm
-+vfwsub_wf       110110 . ..... ..... 101 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmrr *a)            \
- GEN_OPFVF_TRANS(vfadd_vf,  opfvf_check)
- GEN_OPFVF_TRANS(vfsub_vf,  opfvf_check)
- GEN_OPFVF_TRANS(vfrsub_vf,  opfvf_check)
-+
-+/* Vector Widening Floating-Point Add/Subtract Instructions */
-+static bool opfvv_widen_check(DisasContext *s, arg_rmrr *a)
-+{
-+    return (vext_check_isa_ill(s) &&
-+            vext_check_overlap_mask(s, a->rd, a->vm, true) &&
-+            vext_check_reg(s, a->rd, true) &&
-+            vext_check_reg(s, a->rs2, false) &&
-+            vext_check_reg(s, a->rs1, false) &&
-+            vext_check_overlap_group(a->rd, 2 << s->lmul, a->rs2,
-+                                     1 << s->lmul) &&
-+            vext_check_overlap_group(a->rd, 2 << s->lmul, a->rs1,
-+                                     1 << s->lmul) &&
-+            (s->lmul < 0x3) && (s->sew < 0x3) && (s->sew != 0));
-+}
-+
-+/* OPFVV with WIDEN */
-+#define GEN_OPFVV_WIDEN_TRANS(NAME, CHECK)                       \
-+static bool trans_##NAME(DisasContext *s, arg_rmrr *a)           \
-+{                                                                \
-+    if (CHECK(s, a)) {                                           \
-+        uint32_t data = 0;                                       \
-+        static gen_helper_gvec_4_ptr * const fns[2] = {          \
-+            gen_helper_##NAME##_h, gen_helper_##NAME##_w,        \
-+        };                                                       \
-+        TCGLabel *over = gen_new_label();                        \
-+        gen_set_rm(s, 7);                                        \
-+        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);        \
-+                                                                 \
-+        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);           \
-+        data = FIELD_DP32(data, VDATA, VM, a->vm);               \
-+        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);           \
-+        tcg_gen_gvec_4_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),   \
-+                           vreg_ofs(s, a->rs1),                  \
-+                           vreg_ofs(s, a->rs2), cpu_env, 0,      \
-+                           s->vlen / 8, data, fns[s->sew - 1]);  \
-+        gen_set_label(over);                                     \
-+        return true;                                             \
-+    }                                                            \
-+    return false;                                                \
-+}
-+
-+GEN_OPFVV_WIDEN_TRANS(vfwadd_vv, opfvv_widen_check)
-+GEN_OPFVV_WIDEN_TRANS(vfwsub_vv, opfvv_widen_check)
-+
-+static bool opfvf_widen_check(DisasContext *s, arg_rmrr *a)
-+{
-+    return (vext_check_isa_ill(s) &&
-+            vext_check_overlap_mask(s, a->rd, a->vm, true) &&
-+            vext_check_reg(s, a->rd, true) &&
-+            vext_check_reg(s, a->rs2, false) &&
-+            vext_check_overlap_group(a->rd, 2 << s->lmul, a->rs2,
-+                                     1 << s->lmul) &&
-+            (s->lmul < 0x3) && (s->sew < 0x3) && (s->sew != 0));
-+}
-+
-+/* OPFVF with WIDEN */
-+#define GEN_OPFVF_WIDEN_TRANS(NAME)                              \
-+static bool trans_##NAME(DisasContext *s, arg_rmrr *a)           \
-+{                                                                \
-+    if (opfvf_widen_check(s, a)) {                               \
-+        uint32_t data = 0;                                       \
-+        static gen_helper_opfvf *const fns[2] = {                \
-+            gen_helper_##NAME##_h, gen_helper_##NAME##_w,        \
-+        };                                                       \
-+        gen_set_rm(s, 7);                                        \
-+        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);           \
-+        data = FIELD_DP32(data, VDATA, VM, a->vm);               \
-+        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);           \
-+        return opfvf_trans(a->rd, a->rs1, a->rs2, data,          \
-+                           fns[s->sew - 1], s);                  \
-+    }                                                            \
-+    return false;                                                \
-+}
-+
-+GEN_OPFVF_WIDEN_TRANS(vfwadd_vf)
-+GEN_OPFVF_WIDEN_TRANS(vfwsub_vf)
-+
-+static bool opfwv_widen_check(DisasContext *s, arg_rmrr *a)
-+{
-+    return (vext_check_isa_ill(s) &&
-+            vext_check_overlap_mask(s, a->rd, a->vm, true) &&
-+            vext_check_reg(s, a->rd, true) &&
-+            vext_check_reg(s, a->rs2, true) &&
-+            vext_check_reg(s, a->rs1, false) &&
-+            vext_check_overlap_group(a->rd, 2 << s->lmul, a->rs1,
-+                                     1 << s->lmul) &&
-+            (s->lmul < 0x3) && (s->sew < 0x3) && (s->sew != 0));
-+}
-+
-+/* WIDEN OPFVV with WIDEN */
-+#define GEN_OPFWV_WIDEN_TRANS(NAME)                                \
-+static bool trans_##NAME(DisasContext *s, arg_rmrr *a)             \
-+{                                                                  \
-+    if (opfwv_widen_check(s, a)) {                                 \
-+        uint32_t data = 0;                                         \
-+        static gen_helper_gvec_4_ptr * const fns[2] = {            \
-+            gen_helper_##NAME##_h, gen_helper_##NAME##_w,          \
-+        };                                                         \
-+        TCGLabel *over = gen_new_label();                          \
-+        gen_set_rm(s, 7);                                          \
-+        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
-+                                                                   \
-+        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);             \
-+        data = FIELD_DP32(data, VDATA, VM, a->vm);                 \
-+        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);             \
-+        tcg_gen_gvec_4_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),     \
-+                           vreg_ofs(s, a->rs1),                    \
-+                           vreg_ofs(s, a->rs2), cpu_env, 0,        \
-+                           s->vlen / 8, data, fns[s->sew - 1]);    \
-+        gen_set_label(over);                                       \
-+        return true;                                               \
-+    }                                                              \
-+    return false;                                                  \
-+}
-+
-+GEN_OPFWV_WIDEN_TRANS(vfwadd_wv)
-+GEN_OPFWV_WIDEN_TRANS(vfwsub_wv)
-+
-+static bool opfwf_widen_check(DisasContext *s, arg_rmrr *a)
-+{
-+    return (vext_check_isa_ill(s) &&
-+            vext_check_overlap_mask(s, a->rd, a->vm, true) &&
-+            vext_check_reg(s, a->rd, true) &&
-+            vext_check_reg(s, a->rs2, true) &&
-+            (s->lmul < 0x3) && (s->sew < 0x3) && (s->sew != 0));
-+}
-+
-+/* WIDEN OPFVF with WIDEN */
-+#define GEN_OPFWF_WIDEN_TRANS(NAME)                              \
-+static bool trans_##NAME(DisasContext *s, arg_rmrr *a)           \
-+{                                                                \
-+    if (opfwf_widen_check(s, a)) {                               \
-+        uint32_t data = 0;                                       \
-+        static gen_helper_opfvf *const fns[2] = {                \
-+            gen_helper_##NAME##_h, gen_helper_##NAME##_w,        \
-+        };                                                       \
-+        gen_set_rm(s, 7);                                        \
-+        data = FIELD_DP32(data, VDATA, MLEN, s->mlen);           \
-+        data = FIELD_DP32(data, VDATA, VM, a->vm);               \
-+        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);           \
-+        return opfvf_trans(a->rd, a->rs1, a->rs2, data,          \
-+                           fns[s->sew - 1], s);                  \
-+    }                                                            \
-+    return false;                                                \
-+}
-+
-+GEN_OPFWF_WIDEN_TRANS(vfwadd_wf)
-+GEN_OPFWF_WIDEN_TRANS(vfwsub_wf)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ RVVCALL(OPFVF2, vfrsub_vf_d, OP_UUU_D, H8, H8, float64_rsub)
- GEN_VEXT_VF(vfrsub_vf_h, 2, 2, clearh)
- GEN_VEXT_VF(vfrsub_vf_w, 4, 4, clearl)
- GEN_VEXT_VF(vfrsub_vf_d, 8, 8, clearq)
-+
-+/* Vector Widening Floating-Point Add/Subtract Instructions */
-+static uint32_t vfwadd16(uint16_t a, uint16_t b, float_status *s)
-+{
-+    return float32_add(float16_to_float32(a, true, s),
-+            float16_to_float32(b, true, s), s);
-+}
-+
-+static uint64_t vfwadd32(uint32_t a, uint32_t b, float_status *s)
-+{
-+    return float64_add(float32_to_float64(a, s),
-+            float32_to_float64(b, s), s);
-+
-+}
-+
-+RVVCALL(OPFVV2, vfwadd_vv_h, WOP_UUU_H, H4, H2, H2, vfwadd16)
-+RVVCALL(OPFVV2, vfwadd_vv_w, WOP_UUU_W, H8, H4, H4, vfwadd32)
-+GEN_VEXT_VV_ENV(vfwadd_vv_h, 2, 4, clearl)
-+GEN_VEXT_VV_ENV(vfwadd_vv_w, 4, 8, clearq)
-+RVVCALL(OPFVF2, vfwadd_vf_h, WOP_UUU_H, H4, H2, vfwadd16)
-+RVVCALL(OPFVF2, vfwadd_vf_w, WOP_UUU_W, H8, H4, vfwadd32)
-+GEN_VEXT_VF(vfwadd_vf_h, 2, 4, clearl)
-+GEN_VEXT_VF(vfwadd_vf_w, 4, 8, clearq)
-+
-+static uint32_t vfwsub16(uint16_t a, uint16_t b, float_status *s)
-+{
-+    return float32_sub(float16_to_float32(a, true, s),
-+            float16_to_float32(b, true, s), s);
-+}
-+
-+static uint64_t vfwsub32(uint32_t a, uint32_t b, float_status *s)
-+{
-+    return float64_sub(float32_to_float64(a, s),
-+            float32_to_float64(b, s), s);
-+
-+}
-+
-+RVVCALL(OPFVV2, vfwsub_vv_h, WOP_UUU_H, H4, H2, H2, vfwsub16)
-+RVVCALL(OPFVV2, vfwsub_vv_w, WOP_UUU_W, H8, H4, H4, vfwsub32)
-+GEN_VEXT_VV_ENV(vfwsub_vv_h, 2, 4, clearl)
-+GEN_VEXT_VV_ENV(vfwsub_vv_w, 4, 8, clearq)
-+RVVCALL(OPFVF2, vfwsub_vf_h, WOP_UUU_H, H4, H2, vfwsub16)
-+RVVCALL(OPFVF2, vfwsub_vf_w, WOP_UUU_W, H8, H4, vfwsub32)
-+GEN_VEXT_VF(vfwsub_vf_h, 2, 4, clearl)
-+GEN_VEXT_VF(vfwsub_vf_w, 4, 8, clearq)
-+
-+static uint32_t vfwaddw16(uint32_t a, uint16_t b, float_status *s)
-+{
-+    return float32_add(a, float16_to_float32(b, true, s), s);
-+}
-+
-+static uint64_t vfwaddw32(uint64_t a, uint32_t b, float_status *s)
-+{
-+    return float64_add(a, float32_to_float64(b, s), s);
-+}
-+
-+RVVCALL(OPFVV2, vfwadd_wv_h, WOP_WUUU_H, H4, H2, H2, vfwaddw16)
-+RVVCALL(OPFVV2, vfwadd_wv_w, WOP_WUUU_W, H8, H4, H4, vfwaddw32)
-+GEN_VEXT_VV_ENV(vfwadd_wv_h, 2, 4, clearl)
-+GEN_VEXT_VV_ENV(vfwadd_wv_w, 4, 8, clearq)
-+RVVCALL(OPFVF2, vfwadd_wf_h, WOP_WUUU_H, H4, H2, vfwaddw16)
-+RVVCALL(OPFVF2, vfwadd_wf_w, WOP_WUUU_W, H8, H4, vfwaddw32)
-+GEN_VEXT_VF(vfwadd_wf_h, 2, 4, clearl)
-+GEN_VEXT_VF(vfwadd_wf_w, 4, 8, clearq)
-+
-+static uint32_t vfwsubw16(uint32_t a, uint16_t b, float_status *s)
-+{
-+    return float32_sub(a, float16_to_float32(b, true, s), s);
-+}
-+
-+static uint64_t vfwsubw32(uint64_t a, uint32_t b, float_status *s)
-+{
-+    return float64_sub(a, float32_to_float64(b, s), s);
-+}
-+
-+RVVCALL(OPFVV2, vfwsub_wv_h, WOP_WUUU_H, H4, H2, H2, vfwsubw16)
-+RVVCALL(OPFVV2, vfwsub_wv_w, WOP_WUUU_W, H8, H4, H4, vfwsubw32)
-+GEN_VEXT_VV_ENV(vfwsub_wv_h, 2, 4, clearl)
-+GEN_VEXT_VV_ENV(vfwsub_wv_w, 4, 8, clearq)
-+RVVCALL(OPFVF2, vfwsub_wf_h, WOP_WUUU_H, H4, H2, vfwsubw16)
-+RVVCALL(OPFVF2, vfwsub_wf_w, WOP_WUUU_W, H8, H4, vfwsubw32)
-+GEN_VEXT_VF(vfwsub_wf_h, 2, 4, clearl)
-+GEN_VEXT_VF(vfwsub_wf_w, 4, 8, clearq)
---
-.27.0

-[PULL 34/63] target/riscv: vector single-width floating-point multiply/divide instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-33-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   | 16 ++++++++
- target/riscv/insn32.decode              |  5 +++
- target/riscv/insn_trans/trans_rvv.inc.c |  7 ++++
- target/riscv/vector_helper.c            | 49 +++++++++++++++++++++++++
-files changed, 77 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vfwadd_wf_h, void, ptr, ptr, i64, ptr, env, i32)
- DEF_HELPER_6(vfwadd_wf_w, void, ptr, ptr, i64, ptr, env, i32)
- DEF_HELPER_6(vfwsub_wf_h, void, ptr, ptr, i64, ptr, env, i32)
- DEF_HELPER_6(vfwsub_wf_w, void, ptr, ptr, i64, ptr, env, i32)
-+
-+DEF_HELPER_6(vfmul_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfmul_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfmul_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfdiv_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfdiv_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfdiv_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfmul_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfmul_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfmul_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfdiv_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfdiv_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfdiv_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfrdiv_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfrdiv_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfrdiv_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vfwsub_vv       110010 . ..... ..... 001 ..... 1010111 @r_vm
- vfwsub_vf       110010 . ..... ..... 101 ..... 1010111 @r_vm
- vfwsub_wv       110110 . ..... ..... 001 ..... 1010111 @r_vm
- vfwsub_wf       110110 . ..... ..... 101 ..... 1010111 @r_vm
-+vfmul_vv        100100 . ..... ..... 001 ..... 1010111 @r_vm
-+vfmul_vf        100100 . ..... ..... 101 ..... 1010111 @r_vm
-+vfdiv_vv        100000 . ..... ..... 001 ..... 1010111 @r_vm
-+vfdiv_vf        100000 . ..... ..... 101 ..... 1010111 @r_vm
-+vfrdiv_vf       100001 . ..... ..... 101 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmrr *a)           \
- GEN_OPFWF_WIDEN_TRANS(vfwadd_wf)
- GEN_OPFWF_WIDEN_TRANS(vfwsub_wf)
-+
-+/* Vector Single-Width Floating-Point Multiply/Divide Instructions */
-+GEN_OPFVV_TRANS(vfmul_vv, opfvv_check)
-+GEN_OPFVV_TRANS(vfdiv_vv, opfvv_check)
-+GEN_OPFVF_TRANS(vfmul_vf,  opfvf_check)
-+GEN_OPFVF_TRANS(vfdiv_vf,  opfvf_check)
-+GEN_OPFVF_TRANS(vfrdiv_vf,  opfvf_check)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ RVVCALL(OPFVF2, vfwsub_wf_h, WOP_WUUU_H, H4, H2, vfwsubw16)
- RVVCALL(OPFVF2, vfwsub_wf_w, WOP_WUUU_W, H8, H4, vfwsubw32)
- GEN_VEXT_VF(vfwsub_wf_h, 2, 4, clearl)
- GEN_VEXT_VF(vfwsub_wf_w, 4, 8, clearq)
-+
-+/* Vector Single-Width Floating-Point Multiply/Divide Instructions */
-+RVVCALL(OPFVV2, vfmul_vv_h, OP_UUU_H, H2, H2, H2, float16_mul)
-+RVVCALL(OPFVV2, vfmul_vv_w, OP_UUU_W, H4, H4, H4, float32_mul)
-+RVVCALL(OPFVV2, vfmul_vv_d, OP_UUU_D, H8, H8, H8, float64_mul)
-+GEN_VEXT_VV_ENV(vfmul_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV_ENV(vfmul_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV_ENV(vfmul_vv_d, 8, 8, clearq)
-+RVVCALL(OPFVF2, vfmul_vf_h, OP_UUU_H, H2, H2, float16_mul)
-+RVVCALL(OPFVF2, vfmul_vf_w, OP_UUU_W, H4, H4, float32_mul)
-+RVVCALL(OPFVF2, vfmul_vf_d, OP_UUU_D, H8, H8, float64_mul)
-+GEN_VEXT_VF(vfmul_vf_h, 2, 2, clearh)
-+GEN_VEXT_VF(vfmul_vf_w, 4, 4, clearl)
-+GEN_VEXT_VF(vfmul_vf_d, 8, 8, clearq)
-+
-+RVVCALL(OPFVV2, vfdiv_vv_h, OP_UUU_H, H2, H2, H2, float16_div)
-+RVVCALL(OPFVV2, vfdiv_vv_w, OP_UUU_W, H4, H4, H4, float32_div)
-+RVVCALL(OPFVV2, vfdiv_vv_d, OP_UUU_D, H8, H8, H8, float64_div)
-+GEN_VEXT_VV_ENV(vfdiv_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV_ENV(vfdiv_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV_ENV(vfdiv_vv_d, 8, 8, clearq)
-+RVVCALL(OPFVF2, vfdiv_vf_h, OP_UUU_H, H2, H2, float16_div)
-+RVVCALL(OPFVF2, vfdiv_vf_w, OP_UUU_W, H4, H4, float32_div)
-+RVVCALL(OPFVF2, vfdiv_vf_d, OP_UUU_D, H8, H8, float64_div)
-+GEN_VEXT_VF(vfdiv_vf_h, 2, 2, clearh)
-+GEN_VEXT_VF(vfdiv_vf_w, 4, 4, clearl)
-+GEN_VEXT_VF(vfdiv_vf_d, 8, 8, clearq)
-+
-+static uint16_t float16_rdiv(uint16_t a, uint16_t b, float_status *s)
-+{
-+    return float16_div(b, a, s);
-+}
-+
-+static uint32_t float32_rdiv(uint32_t a, uint32_t b, float_status *s)
-+{
-+    return float32_div(b, a, s);
-+}
-+
-+static uint64_t float64_rdiv(uint64_t a, uint64_t b, float_status *s)
-+{
-+    return float64_div(b, a, s);
-+}
-+
-+RVVCALL(OPFVF2, vfrdiv_vf_h, OP_UUU_H, H2, H2, float16_rdiv)
-+RVVCALL(OPFVF2, vfrdiv_vf_w, OP_UUU_W, H4, H4, float32_rdiv)
-+RVVCALL(OPFVF2, vfrdiv_vf_d, OP_UUU_D, H8, H8, float64_rdiv)
-+GEN_VEXT_VF(vfrdiv_vf_h, 2, 2, clearh)
-+GEN_VEXT_VF(vfrdiv_vf_w, 4, 4, clearl)
-+GEN_VEXT_VF(vfrdiv_vf_d, 8, 8, clearq)
---
-.27.0

-[PULL 35/63] target/riscv: vector widening floating-point multiply
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-34-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   |  5 +++++
- target/riscv/insn32.decode              |  2 ++
- target/riscv/insn_trans/trans_rvv.inc.c |  4 ++++
- target/riscv/vector_helper.c            | 22 ++++++++++++++++++++++
-files changed, 33 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vfdiv_vf_d, void, ptr, ptr, i64, ptr, env, i32)
- DEF_HELPER_6(vfrdiv_vf_h, void, ptr, ptr, i64, ptr, env, i32)
- DEF_HELPER_6(vfrdiv_vf_w, void, ptr, ptr, i64, ptr, env, i32)
- DEF_HELPER_6(vfrdiv_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-+
-+DEF_HELPER_6(vfwmul_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfwmul_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfwmul_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfwmul_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vfmul_vf        100100 . ..... ..... 101 ..... 1010111 @r_vm
- vfdiv_vv        100000 . ..... ..... 001 ..... 1010111 @r_vm
- vfdiv_vf        100000 . ..... ..... 101 ..... 1010111 @r_vm
- vfrdiv_vf       100001 . ..... ..... 101 ..... 1010111 @r_vm
-+vfwmul_vv       111000 . ..... ..... 001 ..... 1010111 @r_vm
-+vfwmul_vf       111000 . ..... ..... 101 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPFVV_TRANS(vfdiv_vv, opfvv_check)
- GEN_OPFVF_TRANS(vfmul_vf,  opfvf_check)
- GEN_OPFVF_TRANS(vfdiv_vf,  opfvf_check)
- GEN_OPFVF_TRANS(vfrdiv_vf,  opfvf_check)
-+
-+/* Vector Widening Floating-Point Multiply */
-+GEN_OPFVV_WIDEN_TRANS(vfwmul_vv, opfvv_widen_check)
-+GEN_OPFVF_WIDEN_TRANS(vfwmul_vf)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ RVVCALL(OPFVF2, vfrdiv_vf_d, OP_UUU_D, H8, H8, float64_rdiv)
- GEN_VEXT_VF(vfrdiv_vf_h, 2, 2, clearh)
- GEN_VEXT_VF(vfrdiv_vf_w, 4, 4, clearl)
- GEN_VEXT_VF(vfrdiv_vf_d, 8, 8, clearq)
-+
-+/* Vector Widening Floating-Point Multiply */
-+static uint32_t vfwmul16(uint16_t a, uint16_t b, float_status *s)
-+{
-+    return float32_mul(float16_to_float32(a, true, s),
-+            float16_to_float32(b, true, s), s);
-+}
-+
-+static uint64_t vfwmul32(uint32_t a, uint32_t b, float_status *s)
-+{
-+    return float64_mul(float32_to_float64(a, s),
-+            float32_to_float64(b, s), s);
-+
-+}
-+RVVCALL(OPFVV2, vfwmul_vv_h, WOP_UUU_H, H4, H2, H2, vfwmul16)
-+RVVCALL(OPFVV2, vfwmul_vv_w, WOP_UUU_W, H8, H4, H4, vfwmul32)
-+GEN_VEXT_VV_ENV(vfwmul_vv_h, 2, 4, clearl)
-+GEN_VEXT_VV_ENV(vfwmul_vv_w, 4, 8, clearq)
-+RVVCALL(OPFVF2, vfwmul_vf_h, WOP_UUU_H, H4, H2, vfwmul16)
-+RVVCALL(OPFVF2, vfwmul_vf_w, WOP_UUU_W, H8, H4, vfwmul32)
-+GEN_VEXT_VF(vfwmul_vf_h, 2, 4, clearl)
-+GEN_VEXT_VF(vfwmul_vf_w, 4, 8, clearq)
---
-.27.0

-[PULL 36/63] target/riscv: vector single-width floating-point fused multiply-add instructions
+Deleted patch
-From: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Signed-off-by: LIU Zhiwei <zhiwei_liu@c-sky.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20200623215920.2594-35-zhiwei_liu@c-sky.com
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
----
- target/riscv/helper.h                   |  49 +++++
- target/riscv/insn32.decode              |  16 ++
- target/riscv/insn_trans/trans_rvv.inc.c |  18 ++
- target/riscv/vector_helper.c            | 251 ++++++++++++++++++++++++
-files changed, 334 insertions(+)
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vfwmul_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
- DEF_HELPER_6(vfwmul_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
- DEF_HELPER_6(vfwmul_vf_h, void, ptr, ptr, i64, ptr, env, i32)
- DEF_HELPER_6(vfwmul_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+
-+DEF_HELPER_6(vfmacc_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfmacc_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfmacc_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfnmacc_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfnmacc_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfnmacc_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfmsac_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfmsac_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfmsac_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfnmsac_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfnmsac_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfnmsac_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfmadd_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfmadd_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfmadd_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfnmadd_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfnmadd_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfnmadd_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfmsub_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfmsub_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfmsub_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfnmsub_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfnmsub_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfnmsub_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_6(vfmacc_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfmacc_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfmacc_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfnmacc_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfnmacc_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfnmacc_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfmsac_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfmsac_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfmsac_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfnmsac_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfnmsac_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfnmsac_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfmadd_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfmadd_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfmadd_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfnmadd_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfnmadd_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfnmadd_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfmsub_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfmsub_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfmsub_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfnmsub_vf_h, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfnmsub_vf_w, void, ptr, ptr, i64, ptr, env, i32)
-+DEF_HELPER_6(vfnmsub_vf_d, void, ptr, ptr, i64, ptr, env, i32)
-diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn32.decode
-+++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ vfdiv_vf        100000 . ..... ..... 101 ..... 1010111 @r_vm
- vfrdiv_vf       100001 . ..... ..... 101 ..... 1010111 @r_vm
- vfwmul_vv       111000 . ..... ..... 001 ..... 1010111 @r_vm
- vfwmul_vf       111000 . ..... ..... 101 ..... 1010111 @r_vm
-+vfmacc_vv       101100 . ..... ..... 001 ..... 1010111 @r_vm
-+vfnmacc_vv      101101 . ..... ..... 001 ..... 1010111 @r_vm
-+vfnmacc_vf      101101 . ..... ..... 101 ..... 1010111 @r_vm
-+vfmacc_vf       101100 . ..... ..... 101 ..... 1010111 @r_vm
-+vfmsac_vv       101110 . ..... ..... 001 ..... 1010111 @r_vm
-+vfmsac_vf       101110 . ..... ..... 101 ..... 1010111 @r_vm
-+vfnmsac_vv      101111 . ..... ..... 001 ..... 1010111 @r_vm
-+vfnmsac_vf      101111 . ..... ..... 101 ..... 1010111 @r_vm
-+vfmadd_vv       101000 . ..... ..... 001 ..... 1010111 @r_vm
-+vfmadd_vf       101000 . ..... ..... 101 ..... 1010111 @r_vm
-+vfnmadd_vv      101001 . ..... ..... 001 ..... 1010111 @r_vm
-+vfnmadd_vf      101001 . ..... ..... 101 ..... 1010111 @r_vm
-+vfmsub_vv       101010 . ..... ..... 001 ..... 1010111 @r_vm
-+vfmsub_vf       101010 . ..... ..... 101 ..... 1010111 @r_vm
-+vfnmsub_vv      101011 . ..... ..... 001 ..... 1010111 @r_vm
-+vfnmsub_vf      101011 . ..... ..... 101 ..... 1010111 @r_vm
- vsetvli         0 ........... ..... 111 ..... 1010111  @r2_zimm
- vsetvl          1000000 ..... ..... 111 ..... 1010111  @r
-diff --git a/target/riscv/insn_trans/trans_rvv.inc.c b/target/riscv/insn_trans/trans_rvv.inc.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvv.inc.c
-+++ b/target/riscv/insn_trans/trans_rvv.inc.c
-@@ -XXX,XX +XXX,XX @@ GEN_OPFVF_TRANS(vfrdiv_vf,  opfvf_check)
- /* Vector Widening Floating-Point Multiply */
- GEN_OPFVV_WIDEN_TRANS(vfwmul_vv, opfvv_widen_check)
- GEN_OPFVF_WIDEN_TRANS(vfwmul_vf)
-+
-+/* Vector Single-Width Floating-Point Fused Multiply-Add Instructions */
-+GEN_OPFVV_TRANS(vfmacc_vv, opfvv_check)
-+GEN_OPFVV_TRANS(vfnmacc_vv, opfvv_check)
-+GEN_OPFVV_TRANS(vfmsac_vv, opfvv_check)
-+GEN_OPFVV_TRANS(vfnmsac_vv, opfvv_check)
-+GEN_OPFVV_TRANS(vfmadd_vv, opfvv_check)
-+GEN_OPFVV_TRANS(vfnmadd_vv, opfvv_check)
-+GEN_OPFVV_TRANS(vfmsub_vv, opfvv_check)
-+GEN_OPFVV_TRANS(vfnmsub_vv, opfvv_check)
-+GEN_OPFVF_TRANS(vfmacc_vf, opfvf_check)
-+GEN_OPFVF_TRANS(vfnmacc_vf, opfvf_check)
-+GEN_OPFVF_TRANS(vfmsac_vf, opfvf_check)
-+GEN_OPFVF_TRANS(vfnmsac_vf, opfvf_check)
-+GEN_OPFVF_TRANS(vfmadd_vf, opfvf_check)
-+GEN_OPFVF_TRANS(vfnmadd_vf, opfvf_check)
-+GEN_OPFVF_TRANS(vfmsub_vf, opfvf_check)
-+GEN_OPFVF_TRANS(vfnmsub_vf, opfvf_check)
-diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/vector_helper.c
-+++ b/target/riscv/vector_helper.c
-@@ -XXX,XX +XXX,XX @@ RVVCALL(OPFVF2, vfwmul_vf_h, WOP_UUU_H, H4, H2, vfwmul16)
- RVVCALL(OPFVF2, vfwmul_vf_w, WOP_UUU_W, H8, H4, vfwmul32)
- GEN_VEXT_VF(vfwmul_vf_h, 2, 4, clearl)
- GEN_VEXT_VF(vfwmul_vf_w, 4, 8, clearq)
-+
-+/* Vector Single-Width Floating-Point Fused Multiply-Add Instructions */
-+#define OPFVV3(NAME, TD, T1, T2, TX1, TX2, HD, HS1, HS2, OP)       \
-+static void do_##NAME(void *vd, void *vs1, void *vs2, int i,       \
-+        CPURISCVState *env)                                        \
-+{                                                                  \
-+    TX1 s1 = *((T1 *)vs1 + HS1(i));                                \
-+    TX2 s2 = *((T2 *)vs2 + HS2(i));                                \
-+    TD d = *((TD *)vd + HD(i));                                    \
-+    *((TD *)vd + HD(i)) = OP(s2, s1, d, &env->fp_status);          \
-+}
-+
-+static uint16_t fmacc16(uint16_t a, uint16_t b, uint16_t d, float_status *s)
-+{
-+    return float16_muladd(a, b, d, 0, s);
-+}
-+
-+static uint32_t fmacc32(uint32_t a, uint32_t b, uint32_t d, float_status *s)
-+{
-+    return float32_muladd(a, b, d, 0, s);
-+}
-+
-+static uint64_t fmacc64(uint64_t a, uint64_t b, uint64_t d, float_status *s)
-+{
-+    return float64_muladd(a, b, d, 0, s);
-+}
-+
-+RVVCALL(OPFVV3, vfmacc_vv_h, OP_UUU_H, H2, H2, H2, fmacc16)
-+RVVCALL(OPFVV3, vfmacc_vv_w, OP_UUU_W, H4, H4, H4, fmacc32)
-+RVVCALL(OPFVV3, vfmacc_vv_d, OP_UUU_D, H8, H8, H8, fmacc64)
-+GEN_VEXT_VV_ENV(vfmacc_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV_ENV(vfmacc_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV_ENV(vfmacc_vv_d, 8, 8, clearq)
-+
-+#define OPFVF3(NAME, TD, T1, T2, TX1, TX2, HD, HS2, OP)           \
-+static void do_##NAME(void *vd, uint64_t s1, void *vs2, int i,    \
-+        CPURISCVState *env)                                       \
-+{                                                                 \
-+    TX2 s2 = *((T2 *)vs2 + HS2(i));                               \
-+    TD d = *((TD *)vd + HD(i));                                   \
-+    *((TD *)vd + HD(i)) = OP(s2, (TX1)(T1)s1, d, &env->fp_status);\
-+}
-+
-+RVVCALL(OPFVF3, vfmacc_vf_h, OP_UUU_H, H2, H2, fmacc16)
-+RVVCALL(OPFVF3, vfmacc_vf_w, OP_UUU_W, H4, H4, fmacc32)
-+RVVCALL(OPFVF3, vfmacc_vf_d, OP_UUU_D, H8, H8, fmacc64)
-+GEN_VEXT_VF(vfmacc_vf_h, 2, 2, clearh)
-+GEN_VEXT_VF(vfmacc_vf_w, 4, 4, clearl)
-+GEN_VEXT_VF(vfmacc_vf_d, 8, 8, clearq)
-+
-+static uint16_t fnmacc16(uint16_t a, uint16_t b, uint16_t d, float_status *s)
-+{
-+    return float16_muladd(a, b, d,
-+            float_muladd_negate_c | float_muladd_negate_product, s);
-+}
-+
-+static uint32_t fnmacc32(uint32_t a, uint32_t b, uint32_t d, float_status *s)
-+{
-+    return float32_muladd(a, b, d,
-+            float_muladd_negate_c | float_muladd_negate_product, s);
-+}
-+
-+static uint64_t fnmacc64(uint64_t a, uint64_t b, uint64_t d, float_status *s)
-+{
-+    return float64_muladd(a, b, d,
-+            float_muladd_negate_c | float_muladd_negate_product, s);
-+}
-+
-+RVVCALL(OPFVV3, vfnmacc_vv_h, OP_UUU_H, H2, H2, H2, fnmacc16)
-+RVVCALL(OPFVV3, vfnmacc_vv_w, OP_UUU_W, H4, H4, H4, fnmacc32)
-+RVVCALL(OPFVV3, vfnmacc_vv_d, OP_UUU_D, H8, H8, H8, fnmacc64)
-+GEN_VEXT_VV_ENV(vfnmacc_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV_ENV(vfnmacc_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV_ENV(vfnmacc_vv_d, 8, 8, clearq)
-+RVVCALL(OPFVF3, vfnmacc_vf_h, OP_UUU_H, H2, H2, fnmacc16)
-+RVVCALL(OPFVF3, vfnmacc_vf_w, OP_UUU_W, H4, H4, fnmacc32)
-+RVVCALL(OPFVF3, vfnmacc_vf_d, OP_UUU_D, H8, H8, fnmacc64)
-+GEN_VEXT_VF(vfnmacc_vf_h, 2, 2, clearh)
-+GEN_VEXT_VF(vfnmacc_vf_w, 4, 4, clearl)
-+GEN_VEXT_VF(vfnmacc_vf_d, 8, 8, clearq)
-+
-+static uint16_t fmsac16(uint16_t a, uint16_t b, uint16_t d, float_status *s)
-+{
-+    return float16_muladd(a, b, d, float_muladd_negate_c, s);
-+}
-+
-+static uint32_t fmsac32(uint32_t a, uint32_t b, uint32_t d, float_status *s)
-+{
-+    return float32_muladd(a, b, d, float_muladd_negate_c, s);
-+}
-+
-+static uint64_t fmsac64(uint64_t a, uint64_t b, uint64_t d, float_status *s)
-+{
-+    return float64_muladd(a, b, d, float_muladd_negate_c, s);
-+}
-+
-+RVVCALL(OPFVV3, vfmsac_vv_h, OP_UUU_H, H2, H2, H2, fmsac16)
-+RVVCALL(OPFVV3, vfmsac_vv_w, OP_UUU_W, H4, H4, H4, fmsac32)
-+RVVCALL(OPFVV3, vfmsac_vv_d, OP_UUU_D, H8, H8, H8, fmsac64)
-+GEN_VEXT_VV_ENV(vfmsac_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV_ENV(vfmsac_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV_ENV(vfmsac_vv_d, 8, 8, clearq)
-+RVVCALL(OPFVF3, vfmsac_vf_h, OP_UUU_H, H2, H2, fmsac16)
-+RVVCALL(OPFVF3, vfmsac_vf_w, OP_UUU_W, H4, H4, fmsac32)
-+RVVCALL(OPFVF3, vfmsac_vf_d, OP_UUU_D, H8, H8, fmsac64)
-+GEN_VEXT_VF(vfmsac_vf_h, 2, 2, clearh)
-+GEN_VEXT_VF(vfmsac_vf_w, 4, 4, clearl)
-+GEN_VEXT_VF(vfmsac_vf_d, 8, 8, clearq)
-+
-+static uint16_t fnmsac16(uint16_t a, uint16_t b, uint16_t d, float_status *s)
-+{
-+    return float16_muladd(a, b, d, float_muladd_negate_product, s);
-+}
-+
-+static uint32_t fnmsac32(uint32_t a, uint32_t b, uint32_t d, float_status *s)
-+{
-+    return float32_muladd(a, b, d, float_muladd_negate_product, s);
-+}
-+
-+static uint64_t fnmsac64(uint64_t a, uint64_t b, uint64_t d, float_status *s)
-+{
-+    return float64_muladd(a, b, d, float_muladd_negate_product, s);
-+}
-+
-+RVVCALL(OPFVV3, vfnmsac_vv_h, OP_UUU_H, H2, H2, H2, fnmsac16)
-+RVVCALL(OPFVV3, vfnmsac_vv_w, OP_UUU_W, H4, H4, H4, fnmsac32)
-+RVVCALL(OPFVV3, vfnmsac_vv_d, OP_UUU_D, H8, H8, H8, fnmsac64)
-+GEN_VEXT_VV_ENV(vfnmsac_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV_ENV(vfnmsac_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV_ENV(vfnmsac_vv_d, 8, 8, clearq)
-+RVVCALL(OPFVF3, vfnmsac_vf_h, OP_UUU_H, H2, H2, fnmsac16)
-+RVVCALL(OPFVF3, vfnmsac_vf_w, OP_UUU_W, H4, H4, fnmsac32)
-+RVVCALL(OPFVF3, vfnmsac_vf_d, OP_UUU_D, H8, H8, fnmsac64)
-+GEN_VEXT_VF(vfnmsac_vf_h, 2, 2, clearh)
-+GEN_VEXT_VF(vfnmsac_vf_w, 4, 4, clearl)
-+GEN_VEXT_VF(vfnmsac_vf_d, 8, 8, clearq)
-+
-+static uint16_t fmadd16(uint16_t a, uint16_t b, uint16_t d, float_status *s)
-+{
-+    return float16_muladd(d, b, a, 0, s);
-+}
-+
-+static uint32_t fmadd32(uint32_t a, uint32_t b, uint32_t d, float_status *s)
-+{
-+    return float32_muladd(d, b, a, 0, s);
-+}
-+
-+static uint64_t fmadd64(uint64_t a, uint64_t b, uint64_t d, float_status *s)
-+{
-+    return float64_muladd(d, b, a, 0, s);
-+}
-+
-+RVVCALL(OPFVV3, vfmadd_vv_h, OP_UUU_H, H2, H2, H2, fmadd16)
-+RVVCALL(OPFVV3, vfmadd_vv_w, OP_UUU_W, H4, H4, H4, fmadd32)
-+RVVCALL(OPFVV3, vfmadd_vv_d, OP_UUU_D, H8, H8, H8, fmadd64)
-+GEN_VEXT_VV_ENV(vfmadd_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV_ENV(vfmadd_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV_ENV(vfmadd_vv_d, 8, 8, clearq)
-+RVVCALL(OPFVF3, vfmadd_vf_h, OP_UUU_H, H2, H2, fmadd16)
-+RVVCALL(OPFVF3, vfmadd_vf_w, OP_UUU_W, H4, H4, fmadd32)
-+RVVCALL(OPFVF3, vfmadd_vf_d, OP_UUU_D, H8, H8, fmadd64)
-+GEN_VEXT_VF(vfmadd_vf_h, 2, 2, clearh)
-+GEN_VEXT_VF(vfmadd_vf_w, 4, 4, clearl)
-+GEN_VEXT_VF(vfmadd_vf_d, 8, 8, clearq)
-+
-+static uint16_t fnmadd16(uint16_t a, uint16_t b, uint16_t d, float_status *s)
-+{
-+    return float16_muladd(d, b, a,
-+            float_muladd_negate_c | float_muladd_negate_product, s);
-+}
-+
-+static uint32_t fnmadd32(uint32_t a, uint32_t b, uint32_t d, float_status *s)
-+{
-+    return float32_muladd(d, b, a,
-+            float_muladd_negate_c | float_muladd_negate_product, s);
-+}
-+
-+static uint64_t fnmadd64(uint64_t a, uint64_t b, uint64_t d, float_status *s)
-+{
-+    return float64_muladd(d, b, a,
-+            float_muladd_negate_c | float_muladd_negate_product, s);
-+}
-+
-+RVVCALL(OPFVV3, vfnmadd_vv_h, OP_UUU_H, H2, H2, H2, fnmadd16)
-+RVVCALL(OPFVV3, vfnmadd_vv_w, OP_UUU_W, H4, H4, H4, fnmadd32)
-+RVVCALL(OPFVV3, vfnmadd_vv_d, OP_UUU_D, H8, H8, H8, fnmadd64)
-+GEN_VEXT_VV_ENV(vfnmadd_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV_ENV(vfnmadd_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV_ENV(vfnmadd_vv_d, 8, 8, clearq)
-+RVVCALL(OPFVF3, vfnmadd_vf_h, OP_UUU_H, H2, H2, fnmadd16)
-+RVVCALL(OPFVF3, vfnmadd_vf_w, OP_UUU_W, H4, H4, fnmadd32)
-+RVVCALL(OPFVF3, vfnmadd_vf_d, OP_UUU_D, H8, H8, fnmadd64)
-+GEN_VEXT_VF(vfnmadd_vf_h, 2, 2, clearh)
-+GEN_VEXT_VF(vfnmadd_vf_w, 4, 4, clearl)
-+GEN_VEXT_VF(vfnmadd_vf_d, 8, 8, clearq)
-+
-+static uint16_t fmsub16(uint16_t a, uint16_t b, uint16_t d, float_status *s)
-+{
-+    return float16_muladd(d, b, a, float_muladd_negate_c, s);
-+}
-+
-+static uint32_t fmsub32(uint32_t a, uint32_t b, uint32_t d, float_status *s)
-+{
-+    return float32_muladd(d, b, a, float_muladd_negate_c, s);
-+}
-+
-+static uint64_t fmsub64(uint64_t a, uint64_t b, uint64_t d, float_status *s)
-+{
-+    return float64_muladd(d, b, a, float_muladd_negate_c, s);
-+}
-+
-+RVVCALL(OPFVV3, vfmsub_vv_h, OP_UUU_H, H2, H2, H2, fmsub16)
-+RVVCALL(OPFVV3, vfmsub_vv_w, OP_UUU_W, H4, H4, H4, fmsub32)
-+RVVCALL(OPFVV3, vfmsub_vv_d, OP_UUU_D, H8, H8, H8, fmsub64)
-+GEN_VEXT_VV_ENV(vfmsub_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV_ENV(vfmsub_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV_ENV(vfmsub_vv_d, 8, 8, clearq)
-+RVVCALL(OPFVF3, vfmsub_vf_h, OP_UUU_H, H2, H2, fmsub16)
-+RVVCALL(OPFVF3, vfmsub_vf_w, OP_UUU_W, H4, H4, fmsub32)
-+RVVCALL(OPFVF3, vfmsub_vf_d, OP_UUU_D, H8, H8, fmsub64)
-+GEN_VEXT_VF(vfmsub_vf_h, 2, 2, clearh)
-+GEN_VEXT_VF(vfmsub_vf_w, 4, 4, clearl)
-+GEN_VEXT_VF(vfmsub_vf_d, 8, 8, clearq)
-+
-+static uint16_t fnmsub16(uint16_t a, uint16_t b, uint16_t d, float_status *s)
-+{
-+    return float16_muladd(d, b, a, float_muladd_negate_product, s);
-+}
-+
-+static uint32_t fnmsub32(uint32_t a, uint32_t b, uint32_t d, float_status *s)
-+{
-+    return float32_muladd(d, b, a, float_muladd_negate_product, s);
-+}
-+
-+static uint64_t fnmsub64(uint64_t a, uint64_t b, uint64_t d, float_status *s)
-+{
-+    return float64_muladd(d, b, a, float_muladd_negate_product, s);
-+}
-+
-+RVVCALL(OPFVV3, vfnmsub_vv_h, OP_UUU_H, H2, H2, H2, fnmsub16)
-+RVVCALL(OPFVV3, vfnmsub_vv_w, OP_UUU_W, H4, H4, H4, fnmsub32)
-+RVVCALL(OPFVV3, vfnmsub_vv_d, OP_UUU_D, H8, H8, H8, fnmsub64)
-+GEN_VEXT_VV_ENV(vfnmsub_vv_h, 2, 2, clearh)
-+GEN_VEXT_VV_ENV(vfnmsub_vv_w, 4, 4, clearl)
-+GEN_VEXT_VV_ENV(vfnmsub_vv_d, 8, 8, clearq)
-+RVVCALL(OPFVF3, vfnmsub_vf_h, OP_UUU_H, H2, H2, fnmsub16)
-+RVVCALL(OPFVF3, vfnmsub_vf_w, OP_UUU_W, H4, H4, fnmsub32)
-+RVVCALL(OPFVF3, vfnmsub_vf_d, OP_UUU_D, H8, H8, fnmsub64)
-+GEN_VEXT_VF(vfnmsub_vf_h, 2, 2, clearh)
-+GEN_VEXT_VF(vfnmsub_vf_w, 4, 4, clearl)
-+GEN_VEXT_VF(vfnmsub_vf_d, 8, 8, clearq)
---
-.27.0

The following changes since commit 553cf5d7c47bee05a3dec9461c1f8430316d516b:

Merge remote-tracking branch 'remotes/pmaydell/tags/pull-target-arm-20200626' into staging (2020-06-26 18:22:36 +0100)

are available in the Git repository at:

git@github.com:alistair23/qemu.git tags/pull-riscv-to-apply-20200626-1

for you to fetch changes up to b39d59434ea10649fdb9e0a339c30c76e38c5e17:

target/riscv: configure and turn on vector extension from command line (2020-06-26 14:22:15 -0700)

----------------------------------------------------------------
This PR contains two patches to improve PLIC support in QEMU.

The rest of the PR is adding support for the v0.7.1 RISC-V vector
extensions. This is experimental support as the vector extensions are
still in a draft state.

----------------------------------------------------------------
Jessica Clarke (2):
      riscv: plic: Honour source priorities
      riscv: plic: Add a couple of mising sifive_plic_update calls

LIU Zhiwei (61):
      target/riscv: add vector extension field in CPURISCVState
      target/riscv: implementation-defined constant parameters
      target/riscv: support vector extension csr
      target/riscv: add vector configure instruction
      target/riscv: add an internals.h header
      target/riscv: add vector stride load and store instructions
      target/riscv: add vector index load and store instructions
      target/riscv: add fault-only-first unit stride load
      target/riscv: add vector amo operations
      target/riscv: vector single-width integer add and subtract
      target/riscv: vector widening integer add and subtract
      target/riscv: vector integer add-with-carry / subtract-with-borrow instructions
      target/riscv: vector bitwise logical instructions
      target/riscv: vector single-width bit shift instructions
      target/riscv: vector narrowing integer right shift instructions
      target/riscv: vector integer comparison instructions
      target/riscv: vector integer min/max instructions
      target/riscv: vector single-width integer multiply instructions
      target/riscv: vector integer divide instructions
      target/riscv: vector widening integer multiply instructions
      target/riscv: vector single-width integer multiply-add instructions
      target/riscv: vector widening integer multiply-add instructions
      target/riscv: vector integer merge and move instructions
      target/riscv: vector single-width saturating add and subtract
      target/riscv: vector single-width averaging add and subtract
      target/riscv: vector single-width fractional multiply with rounding and saturation
      target/riscv: vector widening saturating scaled multiply-add
      target/riscv: vector single-width scaling shift instructions
      target/riscv: vector narrowing fixed-point clip instructions
      target/riscv: vector single-width floating-point add/subtract instructions
      target/riscv: vector widening floating-point add/subtract instructions
      target/riscv: vector single-width floating-point multiply/divide instructions
      target/riscv: vector widening floating-point multiply
      target/riscv: vector single-width floating-point fused multiply-add instructions
      target/riscv: vector widening floating-point fused multiply-add instructions
      target/riscv: vector floating-point square-root instruction
      target/riscv: vector floating-point min/max instructions
      target/riscv: vector floating-point sign-injection instructions
      target/riscv: vector floating-point compare instructions
      target/riscv: vector floating-point classify instructions
      target/riscv: vector floating-point merge instructions
      target/riscv: vector floating-point/integer type-convert instructions
      target/riscv: widening floating-point/integer type-convert instructions
      target/riscv: narrowing floating-point/integer type-convert instructions
      target/riscv: vector single-width integer reduction instructions
      target/riscv: vector wideing integer reduction instructions
      target/riscv: vector single-width floating-point reduction instructions
      target/riscv: vector widening floating-point reduction instructions
      target/riscv: vector mask-register logical instructions
      target/riscv: vector mask population count vmpopc
      target/riscv: vmfirst find-first-set mask bit
      target/riscv: set-X-first mask bit
      target/riscv: vector iota instruction
      target/riscv: vector element index instruction
      target/riscv: integer extract instruction
      target/riscv: integer scalar move instruction
      target/riscv: floating-point scalar move instructions
      target/riscv: vector slide instructions
      target/riscv: vector register gather instruction
      target/riscv: vector compress instruction
      target/riscv: configure and turn on vector extension from command line

target/riscv/cpu.h                      |   82 +-
 target/riscv/cpu_bits.h                 |   15 +
 target/riscv/helper.h                   | 1069 +++++++
 target/riscv/internals.h                |   41 +
 target/riscv/insn32-64.decode           |   11 +
 target/riscv/insn32.decode              |  372 +++
 hw/riscv/sifive_plic.c                  |   20 +-
 target/riscv/cpu.c                      |   50 +
 target/riscv/csr.c                      |   75 +-
 target/riscv/fpu_helper.c               |   33 +-
 target/riscv/insn_trans/trans_rvv.inc.c | 2888 ++++++++++++++++++
 target/riscv/translate.c                |   27 +-
 target/riscv/vector_helper.c            | 4899 +++++++++++++++++++++++++++++++
 target/riscv/Makefile.objs              |    2 +-
 14 files changed, 9534 insertions(+), 50 deletions(-)
 create mode 100644 target/riscv/internals.h
 create mode 100644 target/riscv/insn_trans/trans_rvv.inc.c
 create mode 100644 target/riscv/vector_helper.c

From: Jessica Clarke <jrtc27@jrtc27.com>

The source priorities can be used to order sources with respect to other
sources, not just as a way to enable/disable them based off a threshold.
We must therefore always claim the highest-priority source, rather than
the first source we find.

Signed-off-by: Jessica Clarke <jrtc27@jrtc27.com>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Message-Id: <20200618202343.20455-1-jrtc27@jrtc27.com>
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 hw/riscv/sifive_plic.c | 17 ++++++++++++-----
 1 file changed, 12 insertions(+), 5 deletions(-)

diff --git a/hw/riscv/sifive_plic.c b/hw/riscv/sifive_plic.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/sifive_plic.c
+++ b/hw/riscv/sifive_plic.c
@@ -XXX,XX +XXX,XX @@ static void sifive_plic_update(SiFivePLICState *plic)
 static uint32_t sifive_plic_claim(SiFivePLICState *plic, uint32_t addrid)
 {
     int i, j;
+    uint32_t max_irq = 0;
+    uint32_t max_prio = plic->target_priority[addrid];
+
     for (i = 0; i < plic->bitfield_words; i++) {
         uint32_t pending_enabled_not_claimed =
             (plic->pending[i] & ~plic->claimed[i]) &
@@ -XXX,XX +XXX,XX @@ static uint32_t sifive_plic_claim(SiFivePLICState *plic, uint32_t addrid)
             int irq = (i << 5) + j;
             uint32_t prio = plic->source_priority[irq];
             int enabled = pending_enabled_not_claimed & (1 << j);
-            if (enabled && prio > plic->target_priority[addrid]) {
-                sifive_plic_set_pending(plic, irq, false);
-                sifive_plic_set_claimed(plic, irq, true);
-                return irq;
+            if (enabled && prio > max_prio) {
+                max_irq = irq;
+                max_prio = prio;
             }
         }
     }
-    return 0;
+
+    if (max_irq) {
+        sifive_plic_set_pending(plic, max_irq, false);
+        sifive_plic_set_claimed(plic, max_irq, true);
+    }
+    return max_irq;
 }
 
 static uint64_t sifive_plic_read(void *opaque, hwaddr addr, unsigned size)
-- 
2.27.0

From: Jessica Clarke <jrtc27@jrtc27.com>

Claiming an interrupt and changing the source priority both potentially
affect whether an interrupt is pending, thus we must re-compute xEIP.
Note that we don't put the sifive_plic_update inside sifive_plic_claim
so that the logging of a claim (and the resulting IRQ) happens before
the state update, making the causal effect clear, and that we drop the
explicit call to sifive_plic_print_state when claiming since
sifive_plic_update already does that automatically at the end for us.

This can result in both spurious interrupt storms if you fail to
complete an IRQ before enabling interrupts (and no other actions occur
that result in a call to sifive_plic_update), but also more importantly
lost interrupts if a disabled interrupt is pending and then becomes
enabled.

Signed-off-by: Jessica Clarke <jrtc27@jrtc27.com>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Message-id: 20200618210649.22451-1-jrtc27@jrtc27.com
Message-Id: <20200618210649.22451-1-jrtc27@jrtc27.com>
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 hw/riscv/sifive_plic.c | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/hw/riscv/sifive_plic.c b/hw/riscv/sifive_plic.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/sifive_plic.c
+++ b/hw/riscv/sifive_plic.c
@@ -XXX,XX +XXX,XX @@ static uint64_t sifive_plic_read(void *opaque, hwaddr addr, unsigned size)
                     plic->addr_config[addrid].hartid,
                     mode_to_char(plic->addr_config[addrid].mode),
                     value);
-                sifive_plic_print_state(plic);
             }
+            sifive_plic_update(plic);
             return value;
         }
     }
@@ -XXX,XX +XXX,XX @@ static void sifive_plic_write(void *opaque, hwaddr addr, uint64_t value,
             qemu_log("plic: write priority: irq=%d priority=%d\n",
                 irq, plic->source_priority[irq]);
         }
+        sifive_plic_update(plic);
         return;
     } else if (addr >= plic->pending_base && /* 1 bit per source */
                addr < plic->pending_base + (plic->num_sources >> 3))
-- 
2.27.0