Series comparison

-[PULL 00/37] riscv-to-apply queue
+[PULL v2 00/45] riscv-to-apply queue
-From: Alistair Francis <alistair.francis@wdc.com>
+The following changes since commit c5ea91da443b458352c1b629b490ee6631775cb4:
-The following changes since commit d70075373af51b6aa1d637962c962120e201fc98:
+  Merge tag 'pull-trivial-patches' of https://gitlab.com/mjt0k/qemu into staging (2023-09-08 10:06:25 -0400)
   Merge tag 'for_upstream' of git://git.kernel.org/pub/scm/virt/kvm/mst/qemu into staging (2022-01-07 17:24:24 -0800)
 are available in the Git repository at:
-  git@github.com:alistair23/qemu.git tags/pull-riscv-to-apply-20220108
+  https://github.com/alistair23/qemu.git tags/pull-riscv-to-apply-20230911
-for you to fetch changes up to 48eaeb56debf91817dea00a2cd9c1f6c986eb531:
+for you to fetch changes up to e7a03409f29e2da59297d55afbaec98c96e43e3a:
-  target/riscv: Implement the stval/mtval illegal instruction (2022-01-08 15:46:10 +1000)
+  target/riscv: don't read CSR in riscv_csrrw_do64 (2023-09-11 11:45:55 +1000)
 ----------------------------------------------------------------
-Second RISC-V PR for QEMU 7.0
+First RISC-V PR for 8.2
- - Fix illegal instruction when PMP is disabled
+ * Remove 'host' CPU from TCG
- - SiFive PDMA 64-bit support
+ * riscv_htif Fixup printing on big endian hosts
- - SiFive PLIC cleanups
+ * Add zmmul isa string
- - Mark Hypervisor extension as non experimental
+ * Add smepmp isa string
- - Enable Hypervisor extension by default
+ * Fix page_check_range use in fault-only-first
- - Support 32 cores on the virt machine
+ * Use existing lookup tables for MixColumns
- - Corrections for the Vector extension
+ * Add RISC-V vector cryptographic instruction set support
- - Experimental support for 128-bit CPUs
+ * Implement WARL behaviour for mcountinhibit/mcounteren
- - stval and mtval support for illegal instructions
+ * Add Zihintntl extension ISA string to DTS
  * Fix zfa fleq.d and fltq.d
  * Fix upper/lower mtime write calculation
  * Make rtc variable names consistent
  * Use abi type for linux-user target_ucontext
  * Add RISC-V KVM AIA Support
  * Fix riscv,pmu DT node path in the virt machine
  * Update CSR bits name for svadu extension
  * Mark zicond non-experimental
  * Fix satp_mode_finalize() when satp_mode.supported = 0
  * Fix non-KVM --enable-debug build
  * Add new extensions to hwprobe
  * Use accelerated helper for AES64KS1I
  * Allocate itrigger timers only once
  * Respect mseccfg.RLB for pmpaddrX changes
  * Align the AIA model to v1.0 ratified spec
  * Don't read the CSR in riscv_csrrw_do64
 ----------------------------------------------------------------
-Alistair Francis (11):
+Akihiko Odaki (1):
-      hw/intc: sifive_plic: Add a reset function
+      target/riscv: Allocate itrigger timers only once
       hw/intc: sifive_plic: Cleanup the write function
       hw/intc: sifive_plic: Cleanup the read function
       hw/intc: sifive_plic: Cleanup remaining functions
       target/riscv: Mark the Hypervisor extension as non experimental
       target/riscv: Enable the Hypervisor extension by default
       hw/riscv: Use error_fatal for SoC realisation
       hw/riscv: virt: Allow support for 32 cores
       target/riscv: Set the opcode in DisasContext
       target/riscv: Fixup setting GVA
       target/riscv: Implement the stval/mtval illegal instruction
-Bin Meng (1):
+Ard Biesheuvel (2):
-      roms/opensbi: Upgrade from v0.9 to v1.0
+      target/riscv: Use existing lookup tables for MixColumns
       target/riscv: Use accelerated helper for AES64KS1I
-Frank Chang (3):
+Conor Dooley (1):
-      target/riscv: rvv-1.0: Call the correct RVF/RVD check function for widening fp insns
+      hw/riscv: virt: Fix riscv,pmu DT node path
       target/riscv: rvv-1.0: Call the correct RVF/RVD check function for widening fp/int type-convert insns
       target/riscv: rvv-1.0: Call the correct RVF/RVD check function for narrowing fp/int type-convert insns
-Frédéric Pétrot (18):
+Daniel Henrique Barboza (6):
-      exec/memop: Adding signedness to quad definitions
+      target/riscv/cpu.c: do not run 'host' CPU with TCG
-      exec/memop: Adding signed quad and octo defines
+      target/riscv/cpu.c: add zmmul isa string
-      qemu/int128: addition of div/rem 128-bit operations
+      target/riscv/cpu.c: add smepmp isa string
-      target/riscv: additional macros to check instruction support
+      target/riscv: fix satp_mode_finalize() when satp_mode.supported = 0
-      target/riscv: separation of bitwise logic and arithmetic helpers
+      hw/riscv/virt.c: fix non-KVM --enable-debug build
-      target/riscv: array for the 64 upper bits of 128-bit registers
+      hw/intc/riscv_aplic.c fix non-KVM --enable-debug build
       target/riscv: setup everything for rv64 to support rv128 execution
       target/riscv: moving some insns close to similar insns
       target/riscv: accessors to registers upper part and 128-bit load/store
       target/riscv: support for 128-bit bitwise instructions
       target/riscv: support for 128-bit U-type instructions
       target/riscv: support for 128-bit shift instructions
       target/riscv: support for 128-bit arithmetic instructions
       target/riscv: support for 128-bit M extension
       target/riscv: adding high part of some csrs
       target/riscv: helper functions to wrap calls to 128-bit csr insns
       target/riscv: modification of the trans_csrxx for 128-bit support
       target/riscv: actual functions to realize crs 128-bit insns
-Jim Shu (2):
+Dickon Hood (2):
-      hw/dma: sifive_pdma: support high 32-bit access of 64-bit register
+      target/riscv: Refactor translation of vector-widening instruction
-      hw/dma: sifive_pdma: permit 4/8-byte access size of PDMA registers
+      target/riscv: Add Zvbb ISA extension support
 Jason Chien (3):
       target/riscv: Add Zihintntl extension ISA string to DTS
       hw/intc: Fix upper/lower mtime write calculation
       hw/intc: Make rtc variable names consistent
 Kiran Ostrolenk (4):
       target/riscv: Refactor some of the generic vector functionality
       target/riscv: Refactor vector-vector translation macro
       target/riscv: Refactor some of the generic vector functionality
       target/riscv: Add Zvknh ISA extension support
 LIU Zhiwei (3):
       target/riscv: Fix page_check_range use in fault-only-first
       target/riscv: Fix zfa fleq.d and fltq.d
       linux-user/riscv: Use abi type for target_ucontext
 Lawrence Hunter (2):
       target/riscv: Add Zvbc ISA extension support
       target/riscv: Add Zvksh ISA extension support
 Leon Schuermann (1):
       target/riscv/pmp.c: respect mseccfg.RLB for pmpaddrX changes
 Max Chou (3):
       crypto: Create sm4_subword
       crypto: Add SM4 constant parameter CK
       target/riscv: Add Zvksed ISA extension support
 Nazar Kazakov (4):
       target/riscv: Remove redundant "cpu_vl == 0" checks
       target/riscv: Move vector translation checks
       target/riscv: Add Zvkned ISA extension support
       target/riscv: Add Zvkg ISA extension support
 Nikita Shubin (1):
-      target/riscv/pmp: fix no pmp illegal intrs
+      target/riscv: don't read CSR in riscv_csrrw_do64
-Philipp Tomsich (1):
+Rob Bradford (1):
-      target/riscv: Fix position of 'experimental' comment
+      target/riscv: Implement WARL behaviour for mcountinhibit/mcounteren
- include/disas/dis-asm.h                        |   1 +
+Robbin Ehn (1):
- include/exec/memop.h                           |  15 +-
+      linux-user/riscv: Add new extensions to hwprobe
  include/hw/riscv/virt.h                        |   2 +-
  include/qemu/int128.h                          |  27 +
  include/tcg/tcg-op.h                           |   4 +-
  target/arm/translate-a32.h                     |   4 +-
  target/riscv/cpu.h                             |  24 +
  target/riscv/cpu_bits.h                        |   3 +
  target/riscv/helper.h                          |   9 +
  target/riscv/insn16.decode                     |  27 +-
  target/riscv/insn32.decode                     |  25 +
  accel/tcg/cputlb.c                             |  30 +-
  accel/tcg/user-exec.c                          |   8 +-
  disas/riscv.c                                  |   5 +
  hw/dma/sifive_pdma.c                           | 181 ++++++-
  hw/intc/sifive_plic.c                          | 254 +++------
  hw/riscv/microchip_pfsoc.c                     |   2 +-
  hw/riscv/opentitan.c                           |   2 +-
  hw/riscv/sifive_e.c                            |   2 +-
  hw/riscv/sifive_u.c                            |   2 +-
  target/alpha/translate.c                       |  32 +-
  target/arm/helper-a64.c                        |   8 +-
  target/arm/translate-a64.c                     |   8 +-
  target/arm/translate-neon.c                    |   6 +-
  target/arm/translate-sve.c                     |  10 +-
  target/arm/translate-vfp.c                     |   8 +-
  target/arm/translate.c                         |   2 +-
  target/cris/translate.c                        |   2 +-
  target/hppa/translate.c                        |   4 +-
  target/i386/tcg/mem_helper.c                   |   2 +-
  target/i386/tcg/translate.c                    |  36 +-
  target/m68k/op_helper.c                        |   2 +-
  target/mips/tcg/translate.c                    |  58 +-
  target/mips/tcg/tx79_translate.c               |   8 +-
  target/ppc/translate.c                         |  32 +-
  target/riscv/cpu.c                             |  34 +-
  target/riscv/cpu_helper.c                      |  24 +-
  target/riscv/csr.c                             | 194 ++++++-
  target/riscv/gdbstub.c                         |   5 +
  target/riscv/m128_helper.c                     | 109 ++++
  target/riscv/machine.c                         |  22 +
  target/riscv/op_helper.c                       |  47 +-
  target/riscv/translate.c                       | 257 +++++++--
  target/s390x/tcg/mem_helper.c                  |   8 +-
  target/s390x/tcg/translate.c                   |   8 +-
  target/sh4/translate.c                         |  12 +-
  target/sparc/translate.c                       |  36 +-
  target/tricore/translate.c                     |   4 +-
  target/xtensa/translate.c                      |   4 +-
  tcg/tcg.c                                      |   4 +-
  tcg/tci.c                                      |  16 +-
  util/int128.c                                  | 147 +++++
  accel/tcg/ldst_common.c.inc                    |   8 +-
  target/mips/tcg/micromips_translate.c.inc      |  10 +-
  target/ppc/translate/fixedpoint-impl.c.inc     |  22 +-
  target/ppc/translate/fp-impl.c.inc             |   4 +-
  target/ppc/translate/vsx-impl.c.inc            |  42 +-
  target/riscv/insn_trans/trans_rva.c.inc        |  22 +-
  target/riscv/insn_trans/trans_rvb.c.inc        |  48 +-
  target/riscv/insn_trans/trans_rvd.c.inc        |   4 +-
  target/riscv/insn_trans/trans_rvh.c.inc        |   4 +-
  target/riscv/insn_trans/trans_rvi.c.inc        | 716 +++++++++++++++++++++----
  target/riscv/insn_trans/trans_rvm.c.inc        | 192 ++++++-
  target/riscv/insn_trans/trans_rvv.c.inc        |  78 ++-
  target/s390x/tcg/translate_vx.c.inc            |  18 +-
  tcg/aarch64/tcg-target.c.inc                   |   2 +-
  tcg/arm/tcg-target.c.inc                       |  10 +-
  tcg/i386/tcg-target.c.inc                      |  12 +-
  tcg/mips/tcg-target.c.inc                      |  12 +-
  tcg/ppc/tcg-target.c.inc                       |  16 +-
  tcg/riscv/tcg-target.c.inc                     |   6 +-
  tcg/s390x/tcg-target.c.inc                     |  18 +-
  tcg/sparc/tcg-target.c.inc                     |  16 +-
  pc-bios/opensbi-riscv32-generic-fw_dynamic.bin | Bin 78680 -> 108504 bytes
  pc-bios/opensbi-riscv32-generic-fw_dynamic.elf | Bin 727464 -> 838904 bytes
  pc-bios/opensbi-riscv64-generic-fw_dynamic.bin | Bin 75096 -> 105296 bytes
  pc-bios/opensbi-riscv64-generic-fw_dynamic.elf | Bin 781264 -> 934696 bytes
  roms/opensbi                                   |   2 +-
  target/riscv/meson.build                       |   1 +
  target/s390x/tcg/insn-data.def                 |  28 +-
  util/meson.build                               |   1 +
 files changed, 2318 insertions(+), 750 deletions(-)
  create mode 100644 target/riscv/m128_helper.c
  create mode 100644 util/int128.c
+Thomas Huth (2):
+      hw/char/riscv_htif: Fix printing of console characters on big endian hosts
+      hw/char/riscv_htif: Fix the console syscall on big endian hosts
+Tommy Wu (1):
+      target/riscv: Align the AIA model to v1.0 ratified spec
+Vineet Gupta (1):
+      riscv: zicond: make non-experimental
+Weiwei Li (1):
+      target/riscv: Update CSR bits name for svadu extension
+Yong-Xuan Wang (5):
+      target/riscv: support the AIA device emulation with KVM enabled
+      target/riscv: check the in-kernel irqchip support
+      target/riscv: Create an KVM AIA irqchip
+      target/riscv: update APLIC and IMSIC to support KVM AIA
+      target/riscv: select KVM AIA in riscv virt machine
+ include/crypto/aes.h                      |   7 +
+ include/crypto/sm4.h                      |   9 +
+ target/riscv/cpu_bits.h                   |   8 +-
+ target/riscv/cpu_cfg.h                    |   9 +
+ target/riscv/debug.h                      |   3 +-
+ target/riscv/helper.h                     |  98 +++
+ target/riscv/kvm_riscv.h                  |   5 +
+ target/riscv/vector_internals.h           | 228 +++++++
+ target/riscv/insn32.decode                |  58 ++
+ crypto/aes.c                              |   4 +-
+ crypto/sm4.c                              |  10 +
+ hw/char/riscv_htif.c                      |  12 +-
+ hw/intc/riscv_aclint.c                    |  11 +-
+ hw/intc/riscv_aplic.c                     |  52 +-
+ hw/intc/riscv_imsic.c                     |  25 +-
+ hw/riscv/virt.c                           | 374 ++++++------
+ linux-user/riscv/signal.c                 |   4 +-
+ linux-user/syscall.c                      |  14 +-
+ target/arm/tcg/crypto_helper.c            |  10 +-
+ target/riscv/cpu.c                        |  83 ++-
+ target/riscv/cpu_helper.c                 |   6 +-
+ target/riscv/crypto_helper.c              |  51 +-
+ target/riscv/csr.c                        |  54 +-
+ target/riscv/debug.c                      |  15 +-
+ target/riscv/kvm.c                        | 201 ++++++-
+ target/riscv/pmp.c                        |   4 +
+ target/riscv/translate.c                  |   1 +
+ target/riscv/vcrypto_helper.c             | 970 ++++++++++++++++++++++++++++++
+ target/riscv/vector_helper.c              | 245 +-------
+ target/riscv/vector_internals.c           |  81 +++
+ target/riscv/insn_trans/trans_rvv.c.inc   | 171 +++---
+ target/riscv/insn_trans/trans_rvvk.c.inc  | 606 +++++++++++++++++++
+ target/riscv/insn_trans/trans_rvzfa.c.inc |   4 +-
+ target/riscv/meson.build                  |   4 +-
+files changed, 2785 insertions(+), 652 deletions(-)
+ create mode 100644 target/riscv/vector_internals.h
+ create mode 100644 target/riscv/vcrypto_helper.c
+ create mode 100644 target/riscv/vector_internals.c
+ create mode 100644 target/riscv/insn_trans/trans_rvvk.c.inc

-[PULL 16/37] target/riscv: Fix position of 'experimental' comment
+[PULL v2 01/45] target/riscv/cpu.c: do not run 'host' CPU with TCG
-From: Philipp Tomsich <philipp.tomsich@vrull.eu>
+From: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
-When commit 0643c12e4b dropped the 'x-' prefix for Zb[abcs] and set
+The 'host' CPU is available in a CONFIG_KVM build and it's currently
-them to be enabled by default, the comment about experimental
+available for all accels, but is a KVM only CPU. This means that in a
-extensions was kept in place above them.  This moves it down a few
+RISC-V KVM capable host we can do things like this:
 lines to only cover experimental extensions.
-References: 0643c12e4b ("target/riscv: Enable bitmanip Zb[abcs] instructions")
+$ ./build/qemu-system-riscv64 -M virt,accel=tcg -cpu host --nographic
 qemu-system-riscv64: H extension requires priv spec 1.12.0
-Signed-off-by: Philipp Tomsich <philipp.tomsich@vrull.eu>
+This CPU does not have a priv spec because we don't filter its extensions
-Reviewed-by: Bin Meng <bmeng.cn@gmail.com>
+via priv spec. We shouldn't be reaching riscv_cpu_realize_tcg() at all
-Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
+with the 'host' CPU.
 We don't have a way to filter the 'host' CPU out of the available CPU
 options (-cpu help) if the build includes both KVM and TCG. What we can
 do is to error out during riscv_cpu_realize_tcg() if the user chooses
 the 'host' CPU with accel=tcg:
 $ ./build/qemu-system-riscv64 -M virt,accel=tcg -cpu host --nographic
 qemu-system-riscv64: 'host' CPU is not compatible with TCG acceleration
 Signed-off-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20220106134020.1628889-1-philipp.tomsich@vrull.eu
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Message-Id: <20230721133411.474105-1-dbarboza@ventanamicro.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/cpu.c | 3 ++-
+ target/riscv/cpu.c | 5 +++++
-file changed, 2 insertions(+), 1 deletion(-)
+file changed, 5 insertions(+)
 diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/cpu.c
 +++ b/target/riscv/cpu.c
-@@ -XXX,XX +XXX,XX @@ static Property riscv_cpu_properties[] = {
+@@ -XXX,XX +XXX,XX @@ static void riscv_cpu_realize_tcg(DeviceState *dev, Error **errp)
-     DEFINE_PROP_UINT16("vlen", RISCVCPU, cfg.vlen, 128),
+     CPURISCVState *env = &cpu->env;
-     DEFINE_PROP_UINT16("elen", RISCVCPU, cfg.elen, 64),
+     Error *local_err = NULL;
--    /* These are experimental so mark with 'x-' */
++    if (object_dynamic_cast(OBJECT(dev), TYPE_RISCV_CPU_HOST)) {
-     DEFINE_PROP_BOOL("zba", RISCVCPU, cfg.ext_zba, true),
++        error_setg(errp, "'host' CPU is not compatible with TCG acceleration");
-     DEFINE_PROP_BOOL("zbb", RISCVCPU, cfg.ext_zbb, true),
++        return;
-     DEFINE_PROP_BOOL("zbc", RISCVCPU, cfg.ext_zbc, true),
++    }
      DEFINE_PROP_BOOL("zbs", RISCVCPU, cfg.ext_zbs, true),
 +
-+    /* These are experimental so mark with 'x-' */
+     riscv_cpu_validate_misa_mxl(cpu, &local_err);
-     DEFINE_PROP_BOOL("x-j", RISCVCPU, cfg.ext_j, false),
+     if (local_err != NULL) {
-     /* ePMP 0.9.3 */
+         error_propagate(errp, local_err);
      DEFINE_PROP_BOOL("x-epmp", RISCVCPU, cfg.epmp, false),
 --
-.31.1
+.41.0

-[PULL 36/37] target/riscv: Fixup setting GVA
+[PULL v2 02/45] hw/char/riscv_htif: Fix printing of console characters on big endian hosts
-From: Alistair Francis <alistair.francis@wdc.com>
+From: Thomas Huth <thuth@redhat.com>
-In preparation for adding support for the illegal instruction address
+The character that should be printed is stored in the 64 bit "payload"
-let's fixup the Hypervisor extension setting GVA logic and improve the
+variable. The code currently tries to print it by taking the address
-variable names.
+of the variable and passing this pointer to qemu_chr_fe_write(). However,
 this only works on little endian hosts where the least significant bits
 are stored on the lowest address. To do this in a portable way, we have
 to store the value in an uint8_t variable instead.
+Fixes: 5033606780 ("RISC-V HTIF Console")
+Signed-off-by: Thomas Huth <thuth@redhat.com>
+Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Reviewed-by: Bin Meng <bmeng@tinylab.org>
+Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
+Message-Id: <20230721094720.902454-2-thuth@redhat.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Bin Meng <bmeng.cn@gmail.com>
-Message-id: 20211220064916.107241-3-alistair.francis@opensource.wdc.com
 ---
- target/riscv/cpu_helper.c | 21 ++++++---------------
+ hw/char/riscv_htif.c | 3 ++-
-file changed, 6 insertions(+), 15 deletions(-)
+file changed, 2 insertions(+), 1 deletion(-)
-diff --git a/target/riscv/cpu_helper.c b/target/riscv/cpu_helper.c
+diff --git a/hw/char/riscv_htif.c b/hw/char/riscv_htif.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/cpu_helper.c
+--- a/hw/char/riscv_htif.c
-+++ b/target/riscv/cpu_helper.c
++++ b/hw/char/riscv_htif.c
-@@ -XXX,XX +XXX,XX @@ void riscv_cpu_do_interrupt(CPUState *cs)
+@@ -XXX,XX +XXX,XX @@ static void htif_handle_tohost_write(HTIFState *s, uint64_t val_written)
+             s->tohost = 0; /* clear to indicate we read */
-     RISCVCPU *cpu = RISCV_CPU(cs);
+             return;
-     CPURISCVState *env = &cpu->env;
+         } else if (cmd == HTIF_CONSOLE_CMD_PUTC) {
-+    bool write_gva = false;
+-            qemu_chr_fe_write(&s->chr, (uint8_t *)&payload, 1);
-     uint64_t s;
++            uint8_t ch = (uint8_t)payload;
++            qemu_chr_fe_write(&s->chr, &ch, 1);
-     /* cs->exception is 32-bits wide unlike mcause which is XLEN-bits wide
+             resp = 0x100 | (uint8_t)payload;
-@@ -XXX,XX +XXX,XX @@ void riscv_cpu_do_interrupt(CPUState *cs)
+         } else {
-     bool async = !!(cs->exception_index & RISCV_EXCP_INT_FLAG);
+             qemu_log("HTIF device %d: unknown command\n", device);
      target_ulong cause = cs->exception_index & RISCV_EXCP_INT_MASK;
      target_ulong deleg = async ? env->mideleg : env->medeleg;
 -    bool write_tval = false;
      target_ulong tval = 0;
      target_ulong htval = 0;
      target_ulong mtval2 = 0;
@@ -XXX,XX +XXX,XX @@ void riscv_cpu_do_interrupt(CPUState *cs)
          case RISCV_EXCP_INST_PAGE_FAULT:
          case RISCV_EXCP_LOAD_PAGE_FAULT:
          case RISCV_EXCP_STORE_PAGE_FAULT:
 -            write_tval  = true;
 +            write_gva = true;
              tval = env->badaddr;
              break;
          default:
@@ -XXX,XX +XXX,XX @@ void riscv_cpu_do_interrupt(CPUState *cs)
          if (riscv_has_ext(env, RVH)) {
              target_ulong hdeleg = async ? env->hideleg : env->hedeleg;
 -            if (env->two_stage_lookup && write_tval) {
 -                /*
 -                 * If we are writing a guest virtual address to stval, set
 -                 * this to 1. If we are trapping to VS we will set this to 0
 -                 * later.
 -                 */
 -                env->hstatus = set_field(env->hstatus, HSTATUS_GVA, 1);
 -            } else {
 -                /* For other HS-mode traps, we set this to 0. */
 -                env->hstatus = set_field(env->hstatus, HSTATUS_GVA, 0);
 -            }
 -
              if (riscv_cpu_virt_enabled(env) && ((hdeleg >> cause) & 1)) {
                  /* Trap to VS mode */
                  /*
@@ -XXX,XX +XXX,XX @@ void riscv_cpu_do_interrupt(CPUState *cs)
                      cause == IRQ_VS_EXT) {
                      cause = cause - 1;
                  }
 -                env->hstatus = set_field(env->hstatus, HSTATUS_GVA, 0);
 +                write_gva = false;
              } else if (riscv_cpu_virt_enabled(env)) {
                  /* Trap into HS mode, from virt */
                  riscv_cpu_swap_hypervisor_regs(env);
@@ -XXX,XX +XXX,XX @@ void riscv_cpu_do_interrupt(CPUState *cs)
                  env->hstatus = set_field(env->hstatus, HSTATUS_SPV,
                                           riscv_cpu_virt_enabled(env));
 +
                  htval = env->guest_phys_fault_addr;
                  riscv_cpu_set_virt_enabled(env, 0);
@@ -XXX,XX +XXX,XX @@ void riscv_cpu_do_interrupt(CPUState *cs)
                  /* Trap into HS mode */
                  env->hstatus = set_field(env->hstatus, HSTATUS_SPV, false);
                  htval = env->guest_phys_fault_addr;
 +                write_gva = false;
              }
 +            env->hstatus = set_field(env->hstatus, HSTATUS_GVA, write_gva);
          }
          s = env->mstatus;
 --
-.31.1
+.41.0

-New patch
+[PULL v2 03/45] hw/char/riscv_htif: Fix the console syscall on big endian hosts
+From: Thomas Huth <thuth@redhat.com>
+Values that have been read via cpu_physical_memory_read() from the
+guest's memory have to be swapped in case the host endianess differs
+from the guest.
+Fixes: a6e13e31d5 ("riscv_htif: Support console output via proxy syscall")
+Signed-off-by: Thomas Huth <thuth@redhat.com>
+Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Reviewed-by: Bin Meng <bmeng@tinylab.org>
+Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
+Message-Id: <20230721094720.902454-3-thuth@redhat.com>
+Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
+---
+ hw/char/riscv_htif.c | 9 +++++----
+file changed, 5 insertions(+), 4 deletions(-)
+diff --git a/hw/char/riscv_htif.c b/hw/char/riscv_htif.c
+index XXXXXXX..XXXXXXX 100644
+--- a/hw/char/riscv_htif.c
++++ b/hw/char/riscv_htif.c
+@@ -XXX,XX +XXX,XX @@
+ #include "qemu/timer.h"
+ #include "qemu/error-report.h"
+ #include "exec/address-spaces.h"
++#include "exec/tswap.h"
+ #include "sysemu/dma.h"
+ #define RISCV_DEBUG_HTIF 0
+@@ -XXX,XX +XXX,XX @@ static void htif_handle_tohost_write(HTIFState *s, uint64_t val_written)
+             } else {
+                 uint64_t syscall[8];
+                 cpu_physical_memory_read(payload, syscall, sizeof(syscall));
+-                if (syscall[0] == PK_SYS_WRITE &&
+-                    syscall[1] == HTIF_DEV_CONSOLE &&
+-                    syscall[3] == HTIF_CONSOLE_CMD_PUTC) {
++                if (tswap64(syscall[0]) == PK_SYS_WRITE &&
++                    tswap64(syscall[1]) == HTIF_DEV_CONSOLE &&
++                    tswap64(syscall[3]) == HTIF_CONSOLE_CMD_PUTC) {
+                     uint8_t ch;
+-                    cpu_physical_memory_read(syscall[2], &ch, 1);
++                    cpu_physical_memory_read(tswap64(syscall[2]), &ch, 1);
+                     qemu_chr_fe_write(&s->chr, &ch, 1);
+                     resp = 0x100 | (uint8_t)payload;
+                 } else {
+--
+.41.0

-New patch
+[PULL v2 04/45] target/riscv/cpu.c: add zmmul isa string
+From: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
+zmmul was promoted from experimental to ratified in commit 6d00ffad4e95.
+Add a riscv,isa string for it.
+Fixes: 6d00ffad4e95 ("target/riscv: move zmmul out of the experimental properties")
+Signed-off-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
+Reviewed-by: Weiwei Li <liweiwei@iscas.ac.cn>
+Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Message-Id: <20230720132424.371132-2-dbarboza@ventanamicro.com>
+Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
+---
+ target/riscv/cpu.c | 1 +
+file changed, 1 insertion(+)
+diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/cpu.c
++++ b/target/riscv/cpu.c
+@@ -XXX,XX +XXX,XX @@ static const struct isa_ext_data isa_edata_arr[] = {
+     ISA_EXT_DATA_ENTRY(zicsr, PRIV_VERSION_1_10_0, ext_icsr),
+     ISA_EXT_DATA_ENTRY(zifencei, PRIV_VERSION_1_10_0, ext_ifencei),
+     ISA_EXT_DATA_ENTRY(zihintpause, PRIV_VERSION_1_10_0, ext_zihintpause),
++    ISA_EXT_DATA_ENTRY(zmmul, PRIV_VERSION_1_12_0, ext_zmmul),
+     ISA_EXT_DATA_ENTRY(zawrs, PRIV_VERSION_1_12_0, ext_zawrs),
+     ISA_EXT_DATA_ENTRY(zfa, PRIV_VERSION_1_12_0, ext_zfa),
+     ISA_EXT_DATA_ENTRY(zfbfmin, PRIV_VERSION_1_12_0, ext_zfbfmin),
+--
+.41.0

-New patch
+[PULL v2 05/45] target/riscv/cpu.c: add smepmp isa string
+From: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
+The cpu->cfg.epmp extension is still experimental, but it already has a
+'smepmp' riscv,isa string. Add it.
+Signed-off-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
+Reviewed-by: Weiwei Li <liweiwei@iscas.ac.cn>
+Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Message-Id: <20230720132424.371132-3-dbarboza@ventanamicro.com>
+Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
+---
+ target/riscv/cpu.c | 1 +
+file changed, 1 insertion(+)
+diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/cpu.c
++++ b/target/riscv/cpu.c
+@@ -XXX,XX +XXX,XX @@ static const struct isa_ext_data isa_edata_arr[] = {
+     ISA_EXT_DATA_ENTRY(zhinx, PRIV_VERSION_1_12_0, ext_zhinx),
+     ISA_EXT_DATA_ENTRY(zhinxmin, PRIV_VERSION_1_12_0, ext_zhinxmin),
+     ISA_EXT_DATA_ENTRY(smaia, PRIV_VERSION_1_12_0, ext_smaia),
++    ISA_EXT_DATA_ENTRY(smepmp, PRIV_VERSION_1_12_0, epmp),
+     ISA_EXT_DATA_ENTRY(smstateen, PRIV_VERSION_1_12_0, ext_smstateen),
+     ISA_EXT_DATA_ENTRY(ssaia, PRIV_VERSION_1_12_0, ext_ssaia),
+     ISA_EXT_DATA_ENTRY(sscofpmf, PRIV_VERSION_1_12_0, ext_sscofpmf),
+--
+.41.0

-New patch
+[PULL v2 06/45] target/riscv: Fix page_check_range use in fault-only-first
+From: LIU Zhiwei <zhiwei_liu@linux.alibaba.com>
+Commit bef6f008b98(accel/tcg: Return bool from page_check_range) converts
+integer return value to bool type. However, it wrongly converted the use
+of the API in riscv fault-only-first, where page_check_range < = 0, should
+be converted to !page_check_range.
+Signed-off-by: LIU Zhiwei <zhiwei_liu@linux.alibaba.com>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Message-ID: <20230729031618.821-1-zhiwei_liu@linux.alibaba.com>
+Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
+---
+ target/riscv/vector_helper.c | 2 +-
+file changed, 1 insertion(+), 1 deletion(-)
+diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/vector_helper.c
++++ b/target/riscv/vector_helper.c
+@@ -XXX,XX +XXX,XX @@ vext_ldff(void *vd, void *v0, target_ulong base,
+                                          cpu_mmu_index(env, false));
+                 if (host) {
+ #ifdef CONFIG_USER_ONLY
+-                    if (page_check_range(addr, offset, PAGE_READ)) {
++                    if (!page_check_range(addr, offset, PAGE_READ)) {
+                         vl = i;
+                         goto ProbeSuccess;
+                     }
+--
+.41.0

-[PULL 35/37] target/riscv: Set the opcode in DisasContext
+[PULL v2 07/45] target/riscv: Use existing lookup tables for MixColumns
-From: Alistair Francis <alistair.francis@wdc.com>
+From: Ard Biesheuvel <ardb@kernel.org>
+The AES MixColumns and InvMixColumns operations are relatively
+expensive 4x4 matrix multiplications in GF(2^8), which is why C
+implementations usually rely on precomputed lookup tables rather than
+performing the calculations on demand.
+Given that we already carry those tables in QEMU, we can just grab the
+right value in the implementation of the RISC-V AES32 instructions. Note
+that the tables in question are permuted according to the respective
+Sbox, so we can omit the Sbox lookup as well in this case.
+Cc: Richard Henderson <richard.henderson@linaro.org>
+Cc: Philippe Mathieu-Daudé <philmd@linaro.org>
+Cc: Zewen Ye <lustrew@foxmail.com>
+Cc: Weiwei Li <liweiwei@iscas.ac.cn>
+Cc: Junqiang Wang <wangjunqiang@iscas.ac.cn>
+Signed-off-by: Ard Biesheuvel <ardb@kernel.org>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Message-ID: <20230731084043.1791984-1-ardb@kernel.org>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Bin Meng <bmeng.cn@gmail.com>
-Message-id: 20211220064916.107241-2-alistair.francis@opensource.wdc.com
 ---
- target/riscv/translate.c | 2 ++
+ include/crypto/aes.h         |  7 +++++++
-file changed, 2 insertions(+)
+ crypto/aes.c                 |  4 ++--
  target/riscv/crypto_helper.c | 34 ++++------------------------------
 files changed, 13 insertions(+), 32 deletions(-)
-diff --git a/target/riscv/translate.c b/target/riscv/translate.c
+diff --git a/include/crypto/aes.h b/include/crypto/aes.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/translate.c
+--- a/include/crypto/aes.h
-+++ b/target/riscv/translate.c
++++ b/include/crypto/aes.h
-@@ -XXX,XX +XXX,XX @@ static void decode_opc(CPURISCVState *env, DisasContext *ctx, uint16_t opcode)
+@@ -XXX,XX +XXX,XX @@ void AES_decrypt(const unsigned char *in, unsigned char *out,
-         if (!has_ext(ctx, RVC)) {
+ extern const uint8_t AES_sbox[256];
-             gen_exception_illegal(ctx);
+ extern const uint8_t AES_isbox[256];
 +/*
 +AES_Te0[x] = S [x].[02, 01, 01, 03];
 +AES_Td0[x] = Si[x].[0e, 09, 0d, 0b];
 +*/
 +
 +extern const uint32_t AES_Te0[256], AES_Td0[256];
 +
  #endif
 diff --git a/crypto/aes.c b/crypto/aes.c
 index XXXXXXX..XXXXXXX 100644
 --- a/crypto/aes.c
 +++ b/crypto/aes.c
@@ -XXX,XX +XXX,XX @@ AES_Td3[x] = Si[x].[09, 0d, 0b, 0e];
  AES_Td4[x] = Si[x].[01, 01, 01, 01];
  */
 -static const uint32_t AES_Te0[256] = {
 +const uint32_t AES_Te0[256] = {
 xc66363a5U, 0xf87c7c84U, 0xee777799U, 0xf67b7b8dU,
 xfff2f20dU, 0xd66b6bbdU, 0xde6f6fb1U, 0x91c5c554U,
 x60303050U, 0x02010103U, 0xce6767a9U, 0x562b2b7dU,
@@ -XXX,XX +XXX,XX @@ static const uint32_t AES_Te4[256] = {
 xb0b0b0b0U, 0x54545454U, 0xbbbbbbbbU, 0x16161616U,
  };
 -static const uint32_t AES_Td0[256] = {
 +const uint32_t AES_Td0[256] = {
 x51f4a750U, 0x7e416553U, 0x1a17a4c3U, 0x3a275e96U,
 x3bab6bcbU, 0x1f9d45f1U, 0xacfa58abU, 0x4be30393U,
 x2030fa55U, 0xad766df6U, 0x88cc7691U, 0xf5024c25U,
 diff --git a/target/riscv/crypto_helper.c b/target/riscv/crypto_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/crypto_helper.c
 +++ b/target/riscv/crypto_helper.c
@@ -XXX,XX +XXX,XX @@
  #include "crypto/aes-round.h"
  #include "crypto/sm4.h"
 -#define AES_XTIME(a) \
 -    ((a << 1) ^ ((a & 0x80) ? 0x1b : 0))
 -
 -#define AES_GFMUL(a, b) (( \
 -    (((b) & 0x1) ? (a) : 0) ^ \
 -    (((b) & 0x2) ? AES_XTIME(a) : 0) ^ \
 -    (((b) & 0x4) ? AES_XTIME(AES_XTIME(a)) : 0) ^ \
 -    (((b) & 0x8) ? AES_XTIME(AES_XTIME(AES_XTIME(a))) : 0)) & 0xFF)
 -
 -static inline uint32_t aes_mixcolumn_byte(uint8_t x, bool fwd)
 -{
 -    uint32_t u;
 -
 -    if (fwd) {
 -        u = (AES_GFMUL(x, 3) << 24) | (x << 16) | (x << 8) |
 -            (AES_GFMUL(x, 2) << 0);
 -    } else {
 -        u = (AES_GFMUL(x, 0xb) << 24) | (AES_GFMUL(x, 0xd) << 16) |
 -            (AES_GFMUL(x, 0x9) << 8) | (AES_GFMUL(x, 0xe) << 0);
 -    }
 -    return u;
 -}
 -
  #define sext32_xlen(x) (target_ulong)(int32_t)(x)
  static inline target_ulong aes32_operation(target_ulong shamt,
@@ -XXX,XX +XXX,XX @@ static inline target_ulong aes32_operation(target_ulong shamt,
                                             bool enc, bool mix)
  {
      uint8_t si = rs2 >> shamt;
 -    uint8_t so;
      uint32_t mixed;
      target_ulong res;
      if (enc) {
 -        so = AES_sbox[si];
          if (mix) {
 -            mixed = aes_mixcolumn_byte(so, true);
 +            mixed = be32_to_cpu(AES_Te0[si]);
          } else {
-+            ctx->opcode = opcode;
+-            mixed = so;
-             ctx->pc_succ_insn = ctx->base.pc_next + 2;
++            mixed = AES_sbox[si];
-             if (!decode_insn16(ctx, opcode)) {
+         }
-                 gen_exception_illegal(ctx);
+     } else {
-@@ -XXX,XX +XXX,XX @@ static void decode_opc(CPURISCVState *env, DisasContext *ctx, uint16_t opcode)
+-        so = AES_isbox[si];
-         opcode32 = deposit32(opcode32, 16, 16,
+         if (mix) {
-                              translator_lduw(env, &ctx->base,
+-            mixed = aes_mixcolumn_byte(so, false);
-                                              ctx->base.pc_next + 2));
++            mixed = be32_to_cpu(AES_Td0[si]);
-+        ctx->opcode = opcode32;
+         } else {
-         ctx->pc_succ_insn = ctx->base.pc_next + 4;
+-            mixed = so;
-         if (!decode_insn32(ctx, opcode32)) {
++            mixed = AES_isbox[si];
-             gen_exception_illegal(ctx);
+         }
      }
      mixed = rol32(mixed, shamt);
 --
-.31.1
+.41.0

-[PULL 07/37] hw/intc: sifive_plic: Cleanup remaining functions
+[PULL v2 08/45] target/riscv: Refactor some of the generic vector functionality
-From: Alistair Francis <alistair.francis@wdc.com>
+From: Kiran Ostrolenk <kiran.ostrolenk@codethink.co.uk>
-We can remove the original sifive_plic_irqs_pending() function and
+Take some functions/macros out of `vector_helper` and put them in a new
-instead just use the sifive_plic_claim() function (renamed to
+module called `vector_internals`. This ensures they can be used by both
-sifive_plic_claimed()) to determine if any interrupts are pending.
+vector and vector-crypto helpers (latter implemented in proceeding
 commits).
-This requires move the side effects outside of sifive_plic_claimed(),
+Signed-off-by: Kiran Ostrolenk <kiran.ostrolenk@codethink.co.uk>
-but as they are only invoked once that isn't a problem.
+Reviewed-by: Weiwei Li <liweiwei@iscas.ac.cn>
 Signed-off-by: Max Chou <max.chou@sifive.com>
 Acked-by: Alistair Francis <alistair.francis@wdc.com>
 Message-ID: <20230711165917.2629866-2-max.chou@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
  target/riscv/vector_internals.h | 182 +++++++++++++++++++++++++++++
  target/riscv/vector_helper.c    | 201 +-------------------------------
  target/riscv/vector_internals.c |  81 +++++++++++++
  target/riscv/meson.build        |   1 +
 files changed, 265 insertions(+), 200 deletions(-)
  create mode 100644 target/riscv/vector_internals.h
  create mode 100644 target/riscv/vector_internals.c
-We have also removed all of the old #ifdef debugging logs, so let's
+diff --git a/target/riscv/vector_internals.h b/target/riscv/vector_internals.h
-cleanup the last remaining debug function while we are here.
+new file mode 100644
+index XXXXXXX..XXXXXXX
-Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
+--- /dev/null
-Reviewed-by: Bin Meng <bmeng.cn@gmail.com>
++++ b/target/riscv/vector_internals.h
-Message-Id: <20220105213937.1113508-5-alistair.francis@opensource.wdc.com>
+@@ -XXX,XX +XXX,XX @@
----
++/*
- hw/intc/sifive_plic.c | 109 +++++++++---------------------------------
++ * RISC-V Vector Extension Internals
-file changed, 22 insertions(+), 87 deletions(-)
++ *
++ * Copyright (c) 2020 T-Head Semiconductor Co., Ltd. All rights reserved.
-diff --git a/hw/intc/sifive_plic.c b/hw/intc/sifive_plic.c
++ *
 + * This program is free software; you can redistribute it and/or modify it
 + * under the terms and conditions of the GNU General Public License,
 + * version 2 or later, as published by the Free Software Foundation.
 + *
 + * This program is distributed in the hope it will be useful, but WITHOUT
 + * ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
 + * FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License for
 + * more details.
 + *
 + * You should have received a copy of the GNU General Public License along with
 + * this program.  If not, see <http://www.gnu.org/licenses/>.
 + */
 +
 +#ifndef TARGET_RISCV_VECTOR_INTERNALS_H
 +#define TARGET_RISCV_VECTOR_INTERNALS_H
 +
 +#include "qemu/osdep.h"
 +#include "qemu/bitops.h"
 +#include "cpu.h"
 +#include "tcg/tcg-gvec-desc.h"
 +#include "internals.h"
 +
 +static inline uint32_t vext_nf(uint32_t desc)
 +{
 +    return FIELD_EX32(simd_data(desc), VDATA, NF);
 +}
 +
 +/*
 + * Note that vector data is stored in host-endian 64-bit chunks,
 + * so addressing units smaller than that needs a host-endian fixup.
 + */
 +#if HOST_BIG_ENDIAN
 +#define H1(x)   ((x) ^ 7)
 +#define H1_2(x) ((x) ^ 6)
 +#define H1_4(x) ((x) ^ 4)
 +#define H2(x)   ((x) ^ 3)
 +#define H4(x)   ((x) ^ 1)
 +#define H8(x)   ((x))
 +#else
 +#define H1(x)   (x)
 +#define H1_2(x) (x)
 +#define H1_4(x) (x)
 +#define H2(x)   (x)
 +#define H4(x)   (x)
 +#define H8(x)   (x)
 +#endif
 +
 +/*
 + * Encode LMUL to lmul as following:
 + *     LMUL    vlmul    lmul
 + *      1       000       0
 + *      2       001       1
 + *      4       010       2
 + *      8       011       3
 + *      -       100       -
 + *     1/8      101      -3
 + *     1/4      110      -2
 + *     1/2      111      -1
 + */
 +static inline int32_t vext_lmul(uint32_t desc)
 +{
 +    return sextract32(FIELD_EX32(simd_data(desc), VDATA, LMUL), 0, 3);
 +}
 +
 +static inline uint32_t vext_vm(uint32_t desc)
 +{
 +    return FIELD_EX32(simd_data(desc), VDATA, VM);
 +}
 +
 +static inline uint32_t vext_vma(uint32_t desc)
 +{
 +    return FIELD_EX32(simd_data(desc), VDATA, VMA);
 +}
 +
 +static inline uint32_t vext_vta(uint32_t desc)
 +{
 +    return FIELD_EX32(simd_data(desc), VDATA, VTA);
 +}
 +
 +static inline uint32_t vext_vta_all_1s(uint32_t desc)
 +{
 +    return FIELD_EX32(simd_data(desc), VDATA, VTA_ALL_1S);
 +}
 +
 +/*
 + * Earlier designs (pre-0.9) had a varying number of bits
 + * per mask value (MLEN). In the 0.9 design, MLEN=1.
 + * (Section 4.5)
 + */
 +static inline int vext_elem_mask(void *v0, int index)
 +{
 +    int idx = index / 64;
 +    int pos = index  % 64;
 +    return (((uint64_t *)v0)[idx] >> pos) & 1;
 +}
 +
 +/*
 + * Get number of total elements, including prestart, body and tail elements.
 + * Note that when LMUL < 1, the tail includes the elements past VLMAX that
 + * are held in the same vector register.
 + */
 +static inline uint32_t vext_get_total_elems(CPURISCVState *env, uint32_t desc,
 +                                            uint32_t esz)
 +{
 +    uint32_t vlenb = simd_maxsz(desc);
 +    uint32_t sew = 1 << FIELD_EX64(env->vtype, VTYPE, VSEW);
 +    int8_t emul = ctzl(esz) - ctzl(sew) + vext_lmul(desc) < 0 ? 0 :
 +                  ctzl(esz) - ctzl(sew) + vext_lmul(desc);
 +    return (vlenb << emul) / esz;
 +}
 +
 +/* set agnostic elements to 1s */
 +void vext_set_elems_1s(void *base, uint32_t is_agnostic, uint32_t cnt,
 +                       uint32_t tot);
 +
 +/* expand macro args before macro */
 +#define RVVCALL(macro, ...)  macro(__VA_ARGS__)
 +
 +/* (TD, T1, T2, TX1, TX2) */
 +#define OP_UUU_B uint8_t, uint8_t, uint8_t, uint8_t, uint8_t
 +#define OP_UUU_H uint16_t, uint16_t, uint16_t, uint16_t, uint16_t
 +#define OP_UUU_W uint32_t, uint32_t, uint32_t, uint32_t, uint32_t
 +#define OP_UUU_D uint64_t, uint64_t, uint64_t, uint64_t, uint64_t
 +
 +/* operation of two vector elements */
 +typedef void opivv2_fn(void *vd, void *vs1, void *vs2, int i);
 +
 +#define OPIVV2(NAME, TD, T1, T2, TX1, TX2, HD, HS1, HS2, OP)    \
 +static void do_##NAME(void *vd, void *vs1, void *vs2, int i)    \
 +{                                                               \
 +    TX1 s1 = *((T1 *)vs1 + HS1(i));                             \
 +    TX2 s2 = *((T2 *)vs2 + HS2(i));                             \
 +    *((TD *)vd + HD(i)) = OP(s2, s1);                           \
 +}
 +
 +void do_vext_vv(void *vd, void *v0, void *vs1, void *vs2,
 +                CPURISCVState *env, uint32_t desc,
 +                opivv2_fn *fn, uint32_t esz);
 +
 +/* generate the helpers for OPIVV */
 +#define GEN_VEXT_VV(NAME, ESZ)                            \
 +void HELPER(NAME)(void *vd, void *v0, void *vs1,          \
 +                  void *vs2, CPURISCVState *env,          \
 +                  uint32_t desc)                          \
 +{                                                         \
 +    do_vext_vv(vd, v0, vs1, vs2, env, desc,               \
 +               do_##NAME, ESZ);                           \
 +}
 +
 +typedef void opivx2_fn(void *vd, target_long s1, void *vs2, int i);
 +
 +/*
 + * (T1)s1 gives the real operator type.
 + * (TX1)(T1)s1 expands the operator type of widen or narrow operations.
 + */
 +#define OPIVX2(NAME, TD, T1, T2, TX1, TX2, HD, HS2, OP)             \
 +static void do_##NAME(void *vd, target_long s1, void *vs2, int i)   \
 +{                                                                   \
 +    TX2 s2 = *((T2 *)vs2 + HS2(i));                                 \
 +    *((TD *)vd + HD(i)) = OP(s2, (TX1)(T1)s1);                      \
 +}
 +
 +void do_vext_vx(void *vd, void *v0, target_long s1, void *vs2,
 +                CPURISCVState *env, uint32_t desc,
 +                opivx2_fn fn, uint32_t esz);
 +
 +/* generate the helpers for OPIVX */
 +#define GEN_VEXT_VX(NAME, ESZ)                            \
 +void HELPER(NAME)(void *vd, void *v0, target_ulong s1,    \
 +                  void *vs2, CPURISCVState *env,          \
 +                  uint32_t desc)                          \
 +{                                                         \
 +    do_vext_vx(vd, v0, s1, vs2, env, desc,                \
 +               do_##NAME, ESZ);                           \
 +}
 +
 +#endif /* TARGET_RISCV_VECTOR_INTERNALS_H */
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/intc/sifive_plic.c
+--- a/target/riscv/vector_helper.c
-+++ b/hw/intc/sifive_plic.c
++++ b/target/riscv/vector_helper.c
 @@ -XXX,XX +XXX,XX @@
- #include "migration/vmstate.h"
+ #include "fpu/softfloat.h"
- #include "hw/irq.h"
+ #include "tcg/tcg-gvec-desc.h"
+ #include "internals.h"
--#define RISCV_DEBUG_PLIC 0
++#include "vector_internals.h"
--
+ #include <math.h>
- static bool addr_between(uint32_t addr, uint32_t base, uint32_t num)
  target_ulong HELPER(vsetvl)(CPURISCVState *env, target_ulong s1,
@@ -XXX,XX +XXX,XX @@ target_ulong HELPER(vsetvl)(CPURISCVState *env, target_ulong s1,
      return vl;
  }
 -/*
 - * Note that vector data is stored in host-endian 64-bit chunks,
 - * so addressing units smaller than that needs a host-endian fixup.
 - */
 -#if HOST_BIG_ENDIAN
 -#define H1(x)   ((x) ^ 7)
 -#define H1_2(x) ((x) ^ 6)
 -#define H1_4(x) ((x) ^ 4)
 -#define H2(x)   ((x) ^ 3)
 -#define H4(x)   ((x) ^ 1)
 -#define H8(x)   ((x))
 -#else
 -#define H1(x)   (x)
 -#define H1_2(x) (x)
 -#define H1_4(x) (x)
 -#define H2(x)   (x)
 -#define H4(x)   (x)
 -#define H8(x)   (x)
 -#endif
 -
 -static inline uint32_t vext_nf(uint32_t desc)
 -{
 -    return FIELD_EX32(simd_data(desc), VDATA, NF);
 -}
 -
 -static inline uint32_t vext_vm(uint32_t desc)
 -{
 -    return FIELD_EX32(simd_data(desc), VDATA, VM);
 -}
 -
 -/*
 - * Encode LMUL to lmul as following:
 - *     LMUL    vlmul    lmul
 - *      1       000       0
 - *      2       001       1
 - *      4       010       2
 - *      8       011       3
 - *      -       100       -
 - *     1/8      101      -3
 - *     1/4      110      -2
 - *     1/2      111      -1
 - */
 -static inline int32_t vext_lmul(uint32_t desc)
 -{
 -    return sextract32(FIELD_EX32(simd_data(desc), VDATA, LMUL), 0, 3);
 -}
 -
 -static inline uint32_t vext_vta(uint32_t desc)
 -{
 -    return FIELD_EX32(simd_data(desc), VDATA, VTA);
 -}
 -
 -static inline uint32_t vext_vma(uint32_t desc)
 -{
 -    return FIELD_EX32(simd_data(desc), VDATA, VMA);
 -}
 -
 -static inline uint32_t vext_vta_all_1s(uint32_t desc)
 -{
 -    return FIELD_EX32(simd_data(desc), VDATA, VTA_ALL_1S);
 -}
 -
  /*
   * Get the maximum number of elements can be operated.
   *
@@ -XXX,XX +XXX,XX @@ static inline uint32_t vext_max_elems(uint32_t desc, uint32_t log2_esz)
      return scale < 0 ? vlenb >> -scale : vlenb << scale;
  }
 -/*
 - * Get number of total elements, including prestart, body and tail elements.
 - * Note that when LMUL < 1, the tail includes the elements past VLMAX that
 - * are held in the same vector register.
 - */
 -static inline uint32_t vext_get_total_elems(CPURISCVState *env, uint32_t desc,
 -                                            uint32_t esz)
 -{
 -    uint32_t vlenb = simd_maxsz(desc);
 -    uint32_t sew = 1 << FIELD_EX64(env->vtype, VTYPE, VSEW);
 -    int8_t emul = ctzl(esz) - ctzl(sew) + vext_lmul(desc) < 0 ? 0 :
 -                  ctzl(esz) - ctzl(sew) + vext_lmul(desc);
 -    return (vlenb << emul) / esz;
 -}
 -
  static inline target_ulong adjust_addr(CPURISCVState *env, target_ulong addr)
  {
-     return addr >= base && addr - base < num;
+     return (addr & ~env->cur_pmmask) | env->cur_pmbase;
-@@ -XXX,XX +XXX,XX @@ static PLICMode char_to_mode(char c)
+@@ -XXX,XX +XXX,XX @@ static void probe_pages(CPURISCVState *env, target_ulong addr,
      }
  }
--static char mode_to_char(PLICMode m)
+-/* set agnostic elements to 1s */
--{
+-static void vext_set_elems_1s(void *base, uint32_t is_agnostic, uint32_t cnt,
--    switch (m) {
+-                              uint32_t tot)
--    case PLICMode_U: return 'U';
+-{
--    case PLICMode_S: return 'S';
+-    if (is_agnostic == 0) {
--    case PLICMode_H: return 'H';
+-        /* policy undisturbed */
--    case PLICMode_M: return 'M';
+-        return;
 -    default: return '?';
 -    }
--}
+-    if (tot - cnt == 0) {
--
+-        return;
 -static void sifive_plic_print_state(SiFivePLICState *plic)
 -{
 -    int i;
 -    int addrid;
 -
 -    /* pending */
 -    qemu_log("pending       : ");
 -    for (i = plic->bitfield_words - 1; i >= 0; i--) {
 -        qemu_log("%08x", plic->pending[i]);
 -    }
--    qemu_log("\n");
+-    memset(base + cnt, -1, tot - cnt);
--
+-}
--    /* pending */
+-
--    qemu_log("claimed       : ");
+ static inline void vext_set_elem_mask(void *v0, int index,
--    for (i = plic->bitfield_words - 1; i >= 0; i--) {
+                                       uint8_t value)
 -        qemu_log("%08x", plic->claimed[i]);
 -    }
 -    qemu_log("\n");
 -
 -    for (addrid = 0; addrid < plic->num_addrs; addrid++) {
 -        qemu_log("hart%d-%c enable: ",
 -            plic->addr_config[addrid].hartid,
 -            mode_to_char(plic->addr_config[addrid].mode));
 -        for (i = plic->bitfield_words - 1; i >= 0; i--) {
 -            qemu_log("%08x", plic->enable[addrid * plic->bitfield_words + i]);
 -        }
 -        qemu_log("\n");
 -    }
 -}
 -
  static uint32_t atomic_set_masked(uint32_t *a, uint32_t mask, uint32_t value)
  {
-     uint32_t old, new, cmp = qatomic_read(a);
+@@ -XXX,XX +XXX,XX @@ static inline void vext_set_elem_mask(void *v0, int index,
-@@ -XXX,XX +XXX,XX @@ static void sifive_plic_set_claimed(SiFivePLICState *plic, int irq, bool level)
+     ((uint64_t *)v0)[idx] = deposit64(old, pos, 1, value);
      atomic_set_masked(&plic->claimed[irq >> 5], 1 << (irq & 31), -!!level);
  }
--static int sifive_plic_irqs_pending(SiFivePLICState *plic, uint32_t addrid)
+-/*
-+static uint32_t sifive_plic_claimed(SiFivePLICState *plic, uint32_t addrid)
+- * Earlier designs (pre-0.9) had a varying number of bits
- {
+- * per mask value (MLEN). In the 0.9 design, MLEN=1.
-+    uint32_t max_irq = 0;
+- * (Section 4.5)
-+    uint32_t max_prio = plic->target_priority[addrid];
+- */
-     int i, j;
+-static inline int vext_elem_mask(void *v0, int index)
-+
+-{
-     for (i = 0; i < plic->bitfield_words; i++) {
+-    int idx = index / 64;
-         uint32_t pending_enabled_not_claimed =
+-    int pos = index  % 64;
--            (plic->pending[i] & ~plic->claimed[i]) &
+-    return (((uint64_t *)v0)[idx] >> pos) & 1;
--            plic->enable[addrid * plic->bitfield_words + i];
+-}
-+                        (plic->pending[i] & ~plic->claimed[i]) &
+-
-+                            plic->enable[addrid * plic->bitfield_words + i];
+ /* elements operations for load and store */
-+
+ typedef void vext_ldst_elem_fn(CPURISCVState *env, abi_ptr addr,
-         if (!pending_enabled_not_claimed) {
+                                uint32_t idx, void *vd, uintptr_t retaddr);
-             continue;
+@@ -XXX,XX +XXX,XX @@ GEN_VEXT_ST_WHOLE(vs8r_v, int8_t, ste_b)
-         }
+  * Vector Integer Arithmetic Instructions
-+
+  */
-         for (j = 0; j < 32; j++) {
-             int irq = (i << 5) + j;
+-/* expand macro args before macro */
-             uint32_t prio = plic->source_priority[irq];
+-#define RVVCALL(macro, ...)  macro(__VA_ARGS__)
-             int enabled = pending_enabled_not_claimed & (1 << j);
+-
--            if (enabled && prio > plic->target_priority[addrid]) {
+ /* (TD, T1, T2, TX1, TX2) */
--                return 1;
+ #define OP_SSS_B int8_t, int8_t, int8_t, int8_t, int8_t
-+
+ #define OP_SSS_H int16_t, int16_t, int16_t, int16_t, int16_t
-+            if (enabled && prio > max_prio) {
+ #define OP_SSS_W int32_t, int32_t, int32_t, int32_t, int32_t
-+                max_irq = irq;
+ #define OP_SSS_D int64_t, int64_t, int64_t, int64_t, int64_t
-+                max_prio = prio;
+-#define OP_UUU_B uint8_t, uint8_t, uint8_t, uint8_t, uint8_t
-             }
+-#define OP_UUU_H uint16_t, uint16_t, uint16_t, uint16_t, uint16_t
-         }
+-#define OP_UUU_W uint32_t, uint32_t, uint32_t, uint32_t, uint32_t
-     }
+-#define OP_UUU_D uint64_t, uint64_t, uint64_t, uint64_t, uint64_t
--    return 0;
+ #define OP_SUS_B int8_t, uint8_t, int8_t, uint8_t, int8_t
-+
+ #define OP_SUS_H int16_t, uint16_t, int16_t, uint16_t, int16_t
-+    return max_irq;
+ #define OP_SUS_W int32_t, uint32_t, int32_t, uint32_t, int32_t
- }
+@@ -XXX,XX +XXX,XX @@ GEN_VEXT_ST_WHOLE(vs8r_v, int8_t, ste_b)
+ #define NOP_UUU_H uint16_t, uint16_t, uint32_t, uint16_t, uint32_t
- static void sifive_plic_update(SiFivePLICState *plic)
+ #define NOP_UUU_W uint32_t, uint32_t, uint64_t, uint32_t, uint64_t
-@@ -XXX,XX +XXX,XX @@ static void sifive_plic_update(SiFivePLICState *plic)
-     for (addrid = 0; addrid < plic->num_addrs; addrid++) {
+-/* operation of two vector elements */
-         uint32_t hartid = plic->addr_config[addrid].hartid;
+-typedef void opivv2_fn(void *vd, void *vs1, void *vs2, int i);
-         PLICMode mode = plic->addr_config[addrid].mode;
+-
--        int level = sifive_plic_irqs_pending(plic, addrid);
+-#define OPIVV2(NAME, TD, T1, T2, TX1, TX2, HD, HS1, HS2, OP)    \
-+        bool level = !!sifive_plic_claimed(plic, addrid);
+-static void do_##NAME(void *vd, void *vs1, void *vs2, int i)    \
+-{                                                               \
-         switch (mode) {
+-    TX1 s1 = *((T1 *)vs1 + HS1(i));                             \
-         case PLICMode_M:
+-    TX2 s2 = *((T2 *)vs2 + HS2(i));                             \
-@@ -XXX,XX +XXX,XX @@ static void sifive_plic_update(SiFivePLICState *plic)
+-    *((TD *)vd + HD(i)) = OP(s2, s1);                           \
-             break;
+-}
-         }
+ #define DO_SUB(N, M) (N - M)
-     }
+ #define DO_RSUB(N, M) (M - N)
--
--    if (RISCV_DEBUG_PLIC) {
+@@ -XXX,XX +XXX,XX @@ RVVCALL(OPIVV2, vsub_vv_h, OP_SSS_H, H2, H2, H2, DO_SUB)
--        sifive_plic_print_state(plic);
+ RVVCALL(OPIVV2, vsub_vv_w, OP_SSS_W, H4, H4, H4, DO_SUB)
--    }
+ RVVCALL(OPIVV2, vsub_vv_d, OP_SSS_D, H8, H8, H8, DO_SUB)
--}
--
+-static void do_vext_vv(void *vd, void *v0, void *vs1, void *vs2,
--static uint32_t sifive_plic_claim(SiFivePLICState *plic, uint32_t addrid)
+-                       CPURISCVState *env, uint32_t desc,
--{
+-                       opivv2_fn *fn, uint32_t esz)
--    int i, j;
+-{
--    uint32_t max_irq = 0;
+-    uint32_t vm = vext_vm(desc);
--    uint32_t max_prio = plic->target_priority[addrid];
+-    uint32_t vl = env->vl;
--
+-    uint32_t total_elems = vext_get_total_elems(env, desc, esz);
--    for (i = 0; i < plic->bitfield_words; i++) {
+-    uint32_t vta = vext_vta(desc);
--        uint32_t pending_enabled_not_claimed =
+-    uint32_t vma = vext_vma(desc);
--            (plic->pending[i] & ~plic->claimed[i]) &
+-    uint32_t i;
--            plic->enable[addrid * plic->bitfield_words + i];
+-
--        if (!pending_enabled_not_claimed) {
+-    for (i = env->vstart; i < vl; i++) {
 -        if (!vm && !vext_elem_mask(v0, i)) {
 -            /* set masked-off elements to 1s */
 -            vext_set_elems_1s(vd, vma, i * esz, (i + 1) * esz);
 -            continue;
 -        }
--        for (j = 0; j < 32; j++) {
+-        fn(vd, vs1, vs2, i);
--            int irq = (i << 5) + j;
+-    }
--            uint32_t prio = plic->source_priority[irq];
+-    env->vstart = 0;
--            int enabled = pending_enabled_not_claimed & (1 << j);
+-    /* set tail elements to 1s */
--            if (enabled && prio > max_prio) {
+-    vext_set_elems_1s(vd, vta, vl * esz, total_elems * esz);
--                max_irq = irq;
+-}
--                max_prio = prio;
+-
--            }
+-/* generate the helpers for OPIVV */
 -#define GEN_VEXT_VV(NAME, ESZ)                            \
 -void HELPER(NAME)(void *vd, void *v0, void *vs1,          \
 -                  void *vs2, CPURISCVState *env,          \
 -                  uint32_t desc)                          \
 -{                                                         \
 -    do_vext_vv(vd, v0, vs1, vs2, env, desc,               \
 -               do_##NAME, ESZ);                           \
 -}
 -
  GEN_VEXT_VV(vadd_vv_b, 1)
  GEN_VEXT_VV(vadd_vv_h, 2)
  GEN_VEXT_VV(vadd_vv_w, 4)
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VV(vsub_vv_h, 2)
  GEN_VEXT_VV(vsub_vv_w, 4)
  GEN_VEXT_VV(vsub_vv_d, 8)
 -typedef void opivx2_fn(void *vd, target_long s1, void *vs2, int i);
 -
 -/*
 - * (T1)s1 gives the real operator type.
 - * (TX1)(T1)s1 expands the operator type of widen or narrow operations.
 - */
 -#define OPIVX2(NAME, TD, T1, T2, TX1, TX2, HD, HS2, OP)             \
 -static void do_##NAME(void *vd, target_long s1, void *vs2, int i)   \
 -{                                                                   \
 -    TX2 s2 = *((T2 *)vs2 + HS2(i));                                 \
 -    *((TD *)vd + HD(i)) = OP(s2, (TX1)(T1)s1);                      \
 -}
  RVVCALL(OPIVX2, vadd_vx_b, OP_SSS_B, H1, H1, DO_ADD)
  RVVCALL(OPIVX2, vadd_vx_h, OP_SSS_H, H2, H2, DO_ADD)
@@ -XXX,XX +XXX,XX @@ RVVCALL(OPIVX2, vrsub_vx_h, OP_SSS_H, H2, H2, DO_RSUB)
  RVVCALL(OPIVX2, vrsub_vx_w, OP_SSS_W, H4, H4, DO_RSUB)
  RVVCALL(OPIVX2, vrsub_vx_d, OP_SSS_D, H8, H8, DO_RSUB)
 -static void do_vext_vx(void *vd, void *v0, target_long s1, void *vs2,
 -                       CPURISCVState *env, uint32_t desc,
 -                       opivx2_fn fn, uint32_t esz)
 -{
 -    uint32_t vm = vext_vm(desc);
 -    uint32_t vl = env->vl;
 -    uint32_t total_elems = vext_get_total_elems(env, desc, esz);
 -    uint32_t vta = vext_vta(desc);
 -    uint32_t vma = vext_vma(desc);
 -    uint32_t i;
 -
 -    for (i = env->vstart; i < vl; i++) {
 -        if (!vm && !vext_elem_mask(v0, i)) {
 -            /* set masked-off elements to 1s */
 -            vext_set_elems_1s(vd, vma, i * esz, (i + 1) * esz);
 -            continue;
 -        }
+-        fn(vd, s1, vs2, i);
 -    }
--
+-    env->vstart = 0;
--    if (max_irq) {
+-    /* set tail elements to 1s */
--        sifive_plic_set_pending(plic, max_irq, false);
+-    vext_set_elems_1s(vd, vta, vl * esz, total_elems * esz);
--        sifive_plic_set_claimed(plic, max_irq, true);
+-}
--    }
+-
--    return max_irq;
+-/* generate the helpers for OPIVX */
- }
+-#define GEN_VEXT_VX(NAME, ESZ)                            \
+-void HELPER(NAME)(void *vd, void *v0, target_ulong s1,    \
- static uint64_t sifive_plic_read(void *opaque, hwaddr addr, unsigned size)
+-                  void *vs2, CPURISCVState *env,          \
-@@ -XXX,XX +XXX,XX @@ static uint64_t sifive_plic_read(void *opaque, hwaddr addr, unsigned size)
+-                  uint32_t desc)                          \
-         if (contextid == 0) {
+-{                                                         \
-             return plic->target_priority[addrid];
+-    do_vext_vx(vd, v0, s1, vs2, env, desc,                \
-         } else if (contextid == 4) {
+-               do_##NAME, ESZ);                           \
--            uint32_t value = sifive_plic_claim(plic, addrid);
+-}
-+            uint32_t max_irq = sifive_plic_claimed(plic, addrid);
+-
-+
+ GEN_VEXT_VX(vadd_vx_b, 1)
-+            if (max_irq) {
+ GEN_VEXT_VX(vadd_vx_h, 2)
-+                sifive_plic_set_pending(plic, max_irq, false);
+ GEN_VEXT_VX(vadd_vx_w, 4)
-+                sifive_plic_set_claimed(plic, max_irq, true);
+diff --git a/target/riscv/vector_internals.c b/target/riscv/vector_internals.c
-+            }
+new file mode 100644
+index XXXXXXX..XXXXXXX
-             sifive_plic_update(plic);
+--- /dev/null
--            return value;
++++ b/target/riscv/vector_internals.c
-+            return max_irq;
+@@ -XXX,XX +XXX,XX @@
-         }
++/*
-     }
++ * RISC-V Vector Extension Internals
++ *
 + * Copyright (c) 2020 T-Head Semiconductor Co., Ltd. All rights reserved.
 + *
 + * This program is free software; you can redistribute it and/or modify it
 + * under the terms and conditions of the GNU General Public License,
 + * version 2 or later, as published by the Free Software Foundation.
 + *
 + * This program is distributed in the hope it will be useful, but WITHOUT
 + * ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
 + * FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License for
 + * more details.
 + *
 + * You should have received a copy of the GNU General Public License along with
 + * this program.  If not, see <http://www.gnu.org/licenses/>.
 + */
 +
 +#include "vector_internals.h"
 +
 +/* set agnostic elements to 1s */
 +void vext_set_elems_1s(void *base, uint32_t is_agnostic, uint32_t cnt,
 +                       uint32_t tot)
 +{
 +    if (is_agnostic == 0) {
 +        /* policy undisturbed */
 +        return;
 +    }
 +    if (tot - cnt == 0) {
 +        return ;
 +    }
 +    memset(base + cnt, -1, tot - cnt);
 +}
 +
 +void do_vext_vv(void *vd, void *v0, void *vs1, void *vs2,
 +                CPURISCVState *env, uint32_t desc,
 +                opivv2_fn *fn, uint32_t esz)
 +{
 +    uint32_t vm = vext_vm(desc);
 +    uint32_t vl = env->vl;
 +    uint32_t total_elems = vext_get_total_elems(env, desc, esz);
 +    uint32_t vta = vext_vta(desc);
 +    uint32_t vma = vext_vma(desc);
 +    uint32_t i;
 +
 +    for (i = env->vstart; i < vl; i++) {
 +        if (!vm && !vext_elem_mask(v0, i)) {
 +            /* set masked-off elements to 1s */
 +            vext_set_elems_1s(vd, vma, i * esz, (i + 1) * esz);
 +            continue;
 +        }
 +        fn(vd, vs1, vs2, i);
 +    }
 +    env->vstart = 0;
 +    /* set tail elements to 1s */
 +    vext_set_elems_1s(vd, vta, vl * esz, total_elems * esz);
 +}
 +
 +void do_vext_vx(void *vd, void *v0, target_long s1, void *vs2,
 +                CPURISCVState *env, uint32_t desc,
 +                opivx2_fn fn, uint32_t esz)
 +{
 +    uint32_t vm = vext_vm(desc);
 +    uint32_t vl = env->vl;
 +    uint32_t total_elems = vext_get_total_elems(env, desc, esz);
 +    uint32_t vta = vext_vta(desc);
 +    uint32_t vma = vext_vma(desc);
 +    uint32_t i;
 +
 +    for (i = env->vstart; i < vl; i++) {
 +        if (!vm && !vext_elem_mask(v0, i)) {
 +            /* set masked-off elements to 1s */
 +            vext_set_elems_1s(vd, vma, i * esz, (i + 1) * esz);
 +            continue;
 +        }
 +        fn(vd, s1, vs2, i);
 +    }
 +    env->vstart = 0;
 +    /* set tail elements to 1s */
 +    vext_set_elems_1s(vd, vta, vl * esz, total_elems * esz);
 +}
 diff --git a/target/riscv/meson.build b/target/riscv/meson.build
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/meson.build
 +++ b/target/riscv/meson.build
@@ -XXX,XX +XXX,XX @@ riscv_ss.add(files(
    'gdbstub.c',
    'op_helper.c',
    'vector_helper.c',
 +  'vector_internals.c',
    'bitmanip_helper.c',
    'translate.c',
    'm128_helper.c',
 --
-.31.1
+.41.0

-[PULL 21/37] target/riscv: separation of bitwise logic and arithmetic helpers
+[PULL v2 09/45] target/riscv: Refactor vector-vector translation macro
-From: Frédéric Pétrot <frederic.petrot@univ-grenoble-alpes.fr>
+From: Kiran Ostrolenk <kiran.ostrolenk@codethink.co.uk>
-Introduction of a gen_logic function for bitwise logic to implement
+Refactor the non SEW-specific stuff out of `GEN_OPIVV_TRANS` into
-instructions in which no propagation of information occurs between bits and
+function `opivv_trans` (similar to `opivi_trans`). `opivv_trans` will be
-use of this function on the bitwise instructions.
+used in proceeding vector-crypto commits.
-Signed-off-by: Frédéric Pétrot <frederic.petrot@univ-grenoble-alpes.fr>
+Signed-off-by: Kiran Ostrolenk <kiran.ostrolenk@codethink.co.uk>
 Co-authored-by: Fabien Portas <fabien.portas@grenoble-inp.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20220106210108.138226-6-frederic.petrot@univ-grenoble-alpes.fr
+Reviewed-by: Weiwei Li <liweiwei@iscas.ac.cn>
 Signed-off-by: Max Chou <max.chou@sifive.com>
 Message-ID: <20230711165917.2629866-3-max.chou@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/translate.c                | 27 +++++++++++++++++++++++++
+ target/riscv/insn_trans/trans_rvv.c.inc | 62 +++++++++++++------------
- target/riscv/insn_trans/trans_rvb.c.inc |  6 +++---
+file changed, 32 insertions(+), 30 deletions(-)
  target/riscv/insn_trans/trans_rvi.c.inc | 12 +++++------
 files changed, 36 insertions(+), 9 deletions(-)
-diff --git a/target/riscv/translate.c b/target/riscv/translate.c
+diff --git a/target/riscv/insn_trans/trans_rvv.c.inc b/target/riscv/insn_trans/trans_rvv.c.inc
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/translate.c
+--- a/target/riscv/insn_trans/trans_rvv.c.inc
-+++ b/target/riscv/translate.c
++++ b/target/riscv/insn_trans/trans_rvv.c.inc
-@@ -XXX,XX +XXX,XX @@ static int ex_rvc_shifti(DisasContext *ctx, int imm)
+@@ -XXX,XX +XXX,XX @@ GEN_OPIWX_WIDEN_TRANS(vwadd_wx)
- /* Include the auto-generated decoder for 32 bit insn */
+ GEN_OPIWX_WIDEN_TRANS(vwsubu_wx)
- #include "decode-insn32.c.inc"
+ GEN_OPIWX_WIDEN_TRANS(vwsub_wx)
-+static bool gen_logic_imm_fn(DisasContext *ctx, arg_i *a,
++static bool opivv_trans(uint32_t vd, uint32_t vs1, uint32_t vs2, uint32_t vm,
-+                             void (*func)(TCGv, TCGv, target_long))
++                        gen_helper_gvec_4_ptr *fn, DisasContext *s)
 +{
-+    TCGv dest = dest_gpr(ctx, a->rd);
++    uint32_t data = 0;
-+    TCGv src1 = get_gpr(ctx, a->rs1, EXT_NONE);
++    TCGLabel *over = gen_new_label();
 +    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +    tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
 +
-+    func(dest, src1, a->imm);
++    data = FIELD_DP32(data, VDATA, VM, vm);
-+
++    data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
-+    gen_set_gpr(ctx, a->rd, dest);
++    data = FIELD_DP32(data, VDATA, VTA, s->vta);
-+
++    data = FIELD_DP32(data, VDATA, VTA_ALL_1S, s->cfg_vta_all_1s);
 +    data = FIELD_DP32(data, VDATA, VMA, s->vma);
 +    tcg_gen_gvec_4_ptr(vreg_ofs(s, vd), vreg_ofs(s, 0), vreg_ofs(s, vs1),
 +                       vreg_ofs(s, vs2), cpu_env, s->cfg_ptr->vlen / 8,
 +                       s->cfg_ptr->vlen / 8, data, fn);
 +    mark_vs_dirty(s);
 +    gen_set_label(over);
 +    return true;
 +}
 +
-+static bool gen_logic(DisasContext *ctx, arg_r *a,
+ /* Vector Integer Add-with-Carry / Subtract-with-Borrow Instructions */
-+                      void (*func)(TCGv, TCGv, TCGv))
+ /* OPIVV without GVEC IR */
-+{
+-#define GEN_OPIVV_TRANS(NAME, CHECK)                               \
-+    TCGv dest = dest_gpr(ctx, a->rd);
+-static bool trans_##NAME(DisasContext *s, arg_rmrr *a)             \
-+    TCGv src1 = get_gpr(ctx, a->rs1, EXT_NONE);
+-{                                                                  \
-+    TCGv src2 = get_gpr(ctx, a->rs2, EXT_NONE);
+-    if (CHECK(s, a)) {                                             \
-+
+-        uint32_t data = 0;                                         \
-+    func(dest, src1, src2);
+-        static gen_helper_gvec_4_ptr * const fns[4] = {            \
-+
+-            gen_helper_##NAME##_b, gen_helper_##NAME##_h,          \
-+    gen_set_gpr(ctx, a->rd, dest);
+-            gen_helper_##NAME##_w, gen_helper_##NAME##_d,          \
-+
+-        };                                                         \
-+    return true;
+-        TCGLabel *over = gen_new_label();                          \
-+}
+-        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
-+
+-        tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over); \
- static bool gen_arith_imm_fn(DisasContext *ctx, arg_i *a, DisasExtend ext,
+-                                                                   \
-                              void (*func)(TCGv, TCGv, target_long))
+-        data = FIELD_DP32(data, VDATA, VM, a->vm);                 \
- {
+-        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);             \
-diff --git a/target/riscv/insn_trans/trans_rvb.c.inc b/target/riscv/insn_trans/trans_rvb.c.inc
+-        data = FIELD_DP32(data, VDATA, VTA, s->vta);               \
-index XXXXXXX..XXXXXXX 100644
+-        data =                                                     \
---- a/target/riscv/insn_trans/trans_rvb.c.inc
+-            FIELD_DP32(data, VDATA, VTA_ALL_1S, s->cfg_vta_all_1s);\
-+++ b/target/riscv/insn_trans/trans_rvb.c.inc
+-        data = FIELD_DP32(data, VDATA, VMA, s->vma);               \
-@@ -XXX,XX +XXX,XX @@ static bool trans_cpop(DisasContext *ctx, arg_cpop *a)
+-        tcg_gen_gvec_4_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),     \
- static bool trans_andn(DisasContext *ctx, arg_andn *a)
+-                           vreg_ofs(s, a->rs1),                    \
- {
+-                           vreg_ofs(s, a->rs2), cpu_env,           \
-     REQUIRE_ZBB(ctx);
+-                           s->cfg_ptr->vlen / 8,                   \
--    return gen_arith(ctx, a, EXT_NONE, tcg_gen_andc_tl);
+-                           s->cfg_ptr->vlen / 8, data,             \
-+    return gen_logic(ctx, a, tcg_gen_andc_tl);
+-                           fns[s->sew]);                           \
 -        mark_vs_dirty(s);                                          \
 -        gen_set_label(over);                                       \
 -        return true;                                               \
 -    }                                                              \
 -    return false;                                                  \
 +#define GEN_OPIVV_TRANS(NAME, CHECK)                                     \
 +static bool trans_##NAME(DisasContext *s, arg_rmrr *a)                   \
 +{                                                                        \
 +    if (CHECK(s, a)) {                                                   \
 +        static gen_helper_gvec_4_ptr * const fns[4] = {                  \
 +            gen_helper_##NAME##_b, gen_helper_##NAME##_h,                \
 +            gen_helper_##NAME##_w, gen_helper_##NAME##_d,                \
 +        };                                                               \
 +        return opivv_trans(a->rd, a->rs1, a->rs2, a->vm, fns[s->sew], s);\
 +    }                                                                    \
 +    return false;                                                        \
  }
- static bool trans_orn(DisasContext *ctx, arg_orn *a)
+ /*
  {
      REQUIRE_ZBB(ctx);
 -    return gen_arith(ctx, a, EXT_NONE, tcg_gen_orc_tl);
 +    return gen_logic(ctx, a, tcg_gen_orc_tl);
  }
  static bool trans_xnor(DisasContext *ctx, arg_xnor *a)
  {
      REQUIRE_ZBB(ctx);
 -    return gen_arith(ctx, a, EXT_NONE, tcg_gen_eqv_tl);
 +    return gen_logic(ctx, a, tcg_gen_eqv_tl);
  }
  static bool trans_min(DisasContext *ctx, arg_min *a)
 diff --git a/target/riscv/insn_trans/trans_rvi.c.inc b/target/riscv/insn_trans/trans_rvi.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvi.c.inc
 +++ b/target/riscv/insn_trans/trans_rvi.c.inc
@@ -XXX,XX +XXX,XX @@ static bool trans_sltiu(DisasContext *ctx, arg_sltiu *a)
  static bool trans_xori(DisasContext *ctx, arg_xori *a)
  {
 -    return gen_arith_imm_fn(ctx, a, EXT_NONE, tcg_gen_xori_tl);
 +    return gen_logic_imm_fn(ctx, a, tcg_gen_xori_tl);
  }
  static bool trans_ori(DisasContext *ctx, arg_ori *a)
  {
 -    return gen_arith_imm_fn(ctx, a, EXT_NONE, tcg_gen_ori_tl);
 +    return gen_logic_imm_fn(ctx, a, tcg_gen_ori_tl);
  }
  static bool trans_andi(DisasContext *ctx, arg_andi *a)
  {
 -    return gen_arith_imm_fn(ctx, a, EXT_NONE, tcg_gen_andi_tl);
 +    return gen_logic_imm_fn(ctx, a, tcg_gen_andi_tl);
  }
  static bool trans_slli(DisasContext *ctx, arg_slli *a)
@@ -XXX,XX +XXX,XX @@ static bool trans_sltu(DisasContext *ctx, arg_sltu *a)
  static bool trans_xor(DisasContext *ctx, arg_xor *a)
  {
 -    return gen_arith(ctx, a, EXT_NONE, tcg_gen_xor_tl);
 +    return gen_logic(ctx, a, tcg_gen_xor_tl);
  }
  static bool trans_srl(DisasContext *ctx, arg_srl *a)
@@ -XXX,XX +XXX,XX @@ static bool trans_sra(DisasContext *ctx, arg_sra *a)
  static bool trans_or(DisasContext *ctx, arg_or *a)
  {
 -    return gen_arith(ctx, a, EXT_NONE, tcg_gen_or_tl);
 +    return gen_logic(ctx, a, tcg_gen_or_tl);
  }
  static bool trans_and(DisasContext *ctx, arg_and *a)
  {
 -    return gen_arith(ctx, a, EXT_NONE, tcg_gen_and_tl);
 +    return gen_logic(ctx, a, tcg_gen_and_tl);
  }
  static bool trans_addiw(DisasContext *ctx, arg_addiw *a)
 --
-.31.1
+.41.0

-[PULL 13/37] target/riscv: rvv-1.0: Call the correct RVF/RVD check function for widening fp insns
+[PULL v2 10/45] target/riscv: Remove redundant "cpu_vl == 0" checks
-From: Frank Chang <frank.chang@sifive.com>
+From: Nazar Kazakov <nazar.kazakov@codethink.co.uk>
-Vector widening floating-point instructions should use
+Remove the redundant "vl == 0" check which is already included within the  vstart >= vl check, when vl == 0.
 require_scale_rvf() instead of require_rvf() to check whether RVF/RVD is
 enabled.
-Signed-off-by: Frank Chang <frank.chang@sifive.com>
+Signed-off-by: Nazar Kazakov <nazar.kazakov@codethink.co.uk>
 Reviewed-by: Weiwei Li <liweiwei@iscas.ac.cn>
 Signed-off-by: Max Chou <max.chou@sifive.com>
 Acked-by: Alistair Francis <alistair.francis@wdc.com>
-Message-Id: <20220105022247.21131-2-frank.chang@sifive.com>
+Message-ID: <20230711165917.2629866-4-max.chou@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/insn_trans/trans_rvv.c.inc | 12 ++++++++----
+ target/riscv/insn_trans/trans_rvv.c.inc | 31 +------------------------
-file changed, 8 insertions(+), 4 deletions(-)
+file changed, 1 insertion(+), 30 deletions(-)
 diff --git a/target/riscv/insn_trans/trans_rvv.c.inc b/target/riscv/insn_trans/trans_rvv.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.c.inc
 +++ b/target/riscv/insn_trans/trans_rvv.c.inc
-@@ -XXX,XX +XXX,XX @@ GEN_OPFVF_TRANS(vfrsub_vf,  opfvf_check)
+@@ -XXX,XX +XXX,XX @@ static bool ldst_us_trans(uint32_t vd, uint32_t rs1, uint32_t data,
- static bool opfvv_widen_check(DisasContext *s, arg_rmrr *a)
+     TCGv_i32 desc;
      TCGLabel *over = gen_new_label();
 -    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
      tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
      dest = tcg_temp_new_ptr();
@@ -XXX,XX +XXX,XX @@ static bool ldst_stride_trans(uint32_t vd, uint32_t rs1, uint32_t rs2,
      TCGv_i32 desc;
      TCGLabel *over = gen_new_label();
 -    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
      tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
      dest = tcg_temp_new_ptr();
@@ -XXX,XX +XXX,XX @@ static bool ldst_index_trans(uint32_t vd, uint32_t rs1, uint32_t vs2,
      TCGv_i32 desc;
      TCGLabel *over = gen_new_label();
 -    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
      tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
      dest = tcg_temp_new_ptr();
@@ -XXX,XX +XXX,XX @@ static bool ldff_trans(uint32_t vd, uint32_t rs1, uint32_t data,
      TCGv_i32 desc;
      TCGLabel *over = gen_new_label();
 -    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
      tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
      dest = tcg_temp_new_ptr();
@@ -XXX,XX +XXX,XX @@ do_opivv_gvec(DisasContext *s, arg_rmrr *a, GVecGen3Fn *gvec_fn,
          return false;
      }
 -    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
      tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
      if (a->vm && s->vl_eq_vlmax && !(s->vta && s->lmul < 0)) {
@@ -XXX,XX +XXX,XX @@ static bool opivx_trans(uint32_t vd, uint32_t rs1, uint32_t vs2, uint32_t vm,
      uint32_t data = 0;
      TCGLabel *over = gen_new_label();
 -    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
      tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
      dest = tcg_temp_new_ptr();
@@ -XXX,XX +XXX,XX @@ static bool opivi_trans(uint32_t vd, uint32_t imm, uint32_t vs2, uint32_t vm,
      uint32_t data = 0;
      TCGLabel *over = gen_new_label();
 -    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
      tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
      dest = tcg_temp_new_ptr();
@@ -XXX,XX +XXX,XX @@ static bool do_opivv_widen(DisasContext *s, arg_rmrr *a,
      if (checkfn(s, a)) {
          uint32_t data = 0;
          TCGLabel *over = gen_new_label();
 -        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
          tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
          data = FIELD_DP32(data, VDATA, VM, a->vm);
@@ -XXX,XX +XXX,XX @@ static bool do_opiwv_widen(DisasContext *s, arg_rmrr *a,
      if (opiwv_widen_check(s, a)) {
          uint32_t data = 0;
          TCGLabel *over = gen_new_label();
 -        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
          tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
          data = FIELD_DP32(data, VDATA, VM, a->vm);
@@ -XXX,XX +XXX,XX @@ static bool opivv_trans(uint32_t vd, uint32_t vs1, uint32_t vs2, uint32_t vm,
  {
-     return require_rvv(s) &&
+     uint32_t data = 0;
--           require_rvf(s) &&
+     TCGLabel *over = gen_new_label();
-+           require_scale_rvf(s) &&
+-    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
-+           (s->sew != MO_8) &&
+     tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
-            vext_check_isa_ill(s) &&
-            vext_check_dss(s, a->rd, a->rs1, a->rs2, a->vm);
+     data = FIELD_DP32(data, VDATA, VM, vm);
- }
+@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmrr *a)             \
-@@ -XXX,XX +XXX,XX @@ GEN_OPFVV_WIDEN_TRANS(vfwsub_vv, opfvv_widen_check)
+             gen_helper_##NAME##_w,                                 \
- static bool opfvf_widen_check(DisasContext *s, arg_rmrr *a)
+         };                                                         \
- {
+         TCGLabel *over = gen_new_label();                          \
-     return require_rvv(s) &&
+-        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
--           require_rvf(s) &&
+         tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over); \
-+           require_scale_rvf(s) &&
+                                                                    \
-+           (s->sew != MO_8) &&
+         data = FIELD_DP32(data, VDATA, VM, a->vm);                 \
-            vext_check_isa_ill(s) &&
+@@ -XXX,XX +XXX,XX @@ static bool trans_vmv_v_v(DisasContext *s, arg_vmv_v_v *a)
-            vext_check_ds(s, a->rd, a->rs2, a->vm);
+                 gen_helper_vmv_v_v_w, gen_helper_vmv_v_v_d,
- }
+             };
-@@ -XXX,XX +XXX,XX @@ GEN_OPFVF_WIDEN_TRANS(vfwsub_vf)
+             TCGLabel *over = gen_new_label();
- static bool opfwv_widen_check(DisasContext *s, arg_rmrr *a)
+-            tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
- {
+             tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
-     return require_rvv(s) &&
--           require_rvf(s) &&
+             tcg_gen_gvec_2_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, a->rs1),
-+           require_scale_rvf(s) &&
+@@ -XXX,XX +XXX,XX @@ static bool trans_vmv_v_x(DisasContext *s, arg_vmv_v_x *a)
-+           (s->sew != MO_8) &&
+         vext_check_ss(s, a->rd, 0, 1)) {
-            vext_check_isa_ill(s) &&
+         TCGv s1;
-            vext_check_dds(s, a->rd, a->rs1, a->rs2, a->vm);
+         TCGLabel *over = gen_new_label();
- }
+-        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
-@@ -XXX,XX +XXX,XX @@ GEN_OPFWV_WIDEN_TRANS(vfwsub_wv)
+         tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
- static bool opfwf_widen_check(DisasContext *s, arg_rmrr *a)
- {
+         s1 = get_gpr(s, a->rs1, EXT_SIGN);
-     return require_rvv(s) &&
+@@ -XXX,XX +XXX,XX @@ static bool trans_vmv_v_i(DisasContext *s, arg_vmv_v_i *a)
--           require_rvf(s) &&
+                 gen_helper_vmv_v_x_w, gen_helper_vmv_v_x_d,
-+           require_scale_rvf(s) &&
+             };
-+           (s->sew != MO_8) &&
+             TCGLabel *over = gen_new_label();
-            vext_check_isa_ill(s) &&
+-            tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
-            vext_check_dd(s, a->rd, a->rs2, a->vm);
+             tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
- }
              s1 = tcg_constant_i64(simm);
@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmrr *a)             \
          };                                                         \
          TCGLabel *over = gen_new_label();                          \
          gen_set_rm(s, RISCV_FRM_DYN);                              \
 -        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
          tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over); \
                                                                     \
          data = FIELD_DP32(data, VDATA, VM, a->vm);                 \
@@ -XXX,XX +XXX,XX @@ static bool opfvf_trans(uint32_t vd, uint32_t rs1, uint32_t vs2,
      TCGv_i64 t1;
      TCGLabel *over = gen_new_label();
 -    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
      tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
      dest = tcg_temp_new_ptr();
@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmrr *a)           \
          };                                                       \
          TCGLabel *over = gen_new_label();                        \
          gen_set_rm(s, RISCV_FRM_DYN);                            \
 -        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);        \
          tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);\
                                                                   \
          data = FIELD_DP32(data, VDATA, VM, a->vm);               \
@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmrr *a)             \
          };                                                         \
          TCGLabel *over = gen_new_label();                          \
          gen_set_rm(s, RISCV_FRM_DYN);                              \
 -        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
          tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over); \
                                                                     \
          data = FIELD_DP32(data, VDATA, VM, a->vm);                 \
@@ -XXX,XX +XXX,XX @@ static bool do_opfv(DisasContext *s, arg_rmr *a,
          uint32_t data = 0;
          TCGLabel *over = gen_new_label();
          gen_set_rm_chkfrm(s, rm);
 -        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
          tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
          data = FIELD_DP32(data, VDATA, VM, a->vm);
@@ -XXX,XX +XXX,XX @@ static bool trans_vfmv_v_f(DisasContext *s, arg_vfmv_v_f *a)
                  gen_helper_vmv_v_x_d,
              };
              TCGLabel *over = gen_new_label();
 -            tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
              tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
              t1 = tcg_temp_new_i64();
@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmr *a)              \
          };                                                         \
          TCGLabel *over = gen_new_label();                          \
          gen_set_rm_chkfrm(s, FRM);                                 \
 -        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
          tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over); \
                                                                     \
          data = FIELD_DP32(data, VDATA, VM, a->vm);                 \
@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmr *a)              \
          };                                                         \
          TCGLabel *over = gen_new_label();                          \
          gen_set_rm(s, RISCV_FRM_DYN);                              \
 -        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
          tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over); \
                                                                     \
          data = FIELD_DP32(data, VDATA, VM, a->vm);                 \
@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmr *a)              \
          };                                                         \
          TCGLabel *over = gen_new_label();                          \
          gen_set_rm_chkfrm(s, FRM);                                 \
 -        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
          tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over); \
                                                                     \
          data = FIELD_DP32(data, VDATA, VM, a->vm);                 \
@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmr *a)              \
          };                                                         \
          TCGLabel *over = gen_new_label();                          \
          gen_set_rm_chkfrm(s, FRM);                                 \
 -        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
          tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over); \
                                                                     \
          data = FIELD_DP32(data, VDATA, VM, a->vm);                 \
@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_r *a)                \
          uint32_t data = 0;                                         \
          gen_helper_gvec_4_ptr *fn = gen_helper_##NAME;             \
          TCGLabel *over = gen_new_label();                          \
 -        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);          \
          tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over); \
                                                                     \
          data = FIELD_DP32(data, VDATA, LMUL, s->lmul);             \
@@ -XXX,XX +XXX,XX @@ static bool trans_vid_v(DisasContext *s, arg_vid_v *a)
          require_vm(a->vm, a->rd)) {
          uint32_t data = 0;
          TCGLabel *over = gen_new_label();
 -        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
          tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
          data = FIELD_DP32(data, VDATA, VM, a->vm);
@@ -XXX,XX +XXX,XX @@ static bool trans_vmv_s_x(DisasContext *s, arg_vmv_s_x *a)
          TCGv s1;
          TCGLabel *over = gen_new_label();
 -        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
          tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
          t1 = tcg_temp_new_i64();
@@ -XXX,XX +XXX,XX @@ static bool trans_vfmv_s_f(DisasContext *s, arg_vfmv_s_f *a)
          TCGv_i64 t1;
          TCGLabel *over = gen_new_label();
 -        /* if vl == 0 or vstart >= vl, skip vector register write back */
 -        tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
 +        /* if vstart >= vl, skip vector register write back */
          tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
          /* NaN-box f[rs1] */
@@ -XXX,XX +XXX,XX @@ static bool int_ext_op(DisasContext *s, arg_rmr *a, uint8_t seq)
      uint32_t data = 0;
      gen_helper_gvec_3_ptr *fn;
      TCGLabel *over = gen_new_label();
 -    tcg_gen_brcondi_tl(TCG_COND_EQ, cpu_vl, 0, over);
      tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
      static gen_helper_gvec_3_ptr * const fns[6][4] = {
 --
-.31.1
+.41.0

-[PULL 30/37] target/riscv: support for 128-bit M extension
+[PULL v2 11/45] target/riscv: Add Zvbc ISA extension support
-From: Frédéric Pétrot <frederic.petrot@univ-grenoble-alpes.fr>
+From: Lawrence Hunter <lawrence.hunter@codethink.co.uk>
-Mult are generated inline (using a cool trick pointed out by Richard), but
+This commit adds support for the Zvbc vector-crypto extension, which
-for div and rem, given the complexity of the implementation of these
+consists of the following instructions:
-instructions, we call helpers to produce their behavior. From an
-implementation standpoint, the helpers return the low part of the results,
+* vclmulh.[vx,vv]
-while the high part is temporarily stored in a dedicated field of cpu_env
+* vclmul.[vx,vv]
-that is used to update the architectural register in the generation wrapper.
+Translation functions are defined in
-Signed-off-by: Frédéric Pétrot <frederic.petrot@univ-grenoble-alpes.fr>
+`target/riscv/insn_trans/trans_rvvk.c.inc` and helpers are defined in
-Co-authored-by: Fabien Portas <fabien.portas@grenoble-inp.org>
+`target/riscv/vcrypto_helper.c`.
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Co-authored-by: Nazar Kazakov <nazar.kazakov@codethink.co.uk>
-Message-id: 20220106210108.138226-15-frederic.petrot@univ-grenoble-alpes.fr
+Co-authored-by: Max Chou <max.chou@sifive.com>
 Signed-off-by: Nazar Kazakov <nazar.kazakov@codethink.co.uk>
 Signed-off-by: Lawrence Hunter <lawrence.hunter@codethink.co.uk>
 Signed-off-by: Max Chou <max.chou@sifive.com>
 [max.chou@sifive.com: Exposed x-zvbc property]
 Message-ID: <20230711165917.2629866-5-max.chou@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/cpu.h                      |   3 +
+ target/riscv/cpu_cfg.h                   |  1 +
- target/riscv/helper.h                   |   6 +
+ target/riscv/helper.h                    |  6 +++
- target/riscv/insn32.decode              |   7 +
+ target/riscv/insn32.decode               |  6 +++
- target/riscv/m128_helper.c              | 109 ++++++++++++++
+ target/riscv/cpu.c                       |  9 ++++
- target/riscv/insn_trans/trans_rvm.c.inc | 182 ++++++++++++++++++++++--
+ target/riscv/translate.c                 |  1 +
- target/riscv/meson.build                |   1 +
+ target/riscv/vcrypto_helper.c            | 59 ++++++++++++++++++++++
-files changed, 295 insertions(+), 13 deletions(-)
+ target/riscv/insn_trans/trans_rvvk.c.inc | 62 ++++++++++++++++++++++++
- create mode 100644 target/riscv/m128_helper.c
+ target/riscv/meson.build                 |  3 +-
+files changed, 146 insertions(+), 1 deletion(-)
-diff --git a/target/riscv/cpu.h b/target/riscv/cpu.h
+ create mode 100644 target/riscv/vcrypto_helper.c
-index XXXXXXX..XXXXXXX 100644
+ create mode 100644 target/riscv/insn_trans/trans_rvvk.c.inc
---- a/target/riscv/cpu.h
-+++ b/target/riscv/cpu.h
+diff --git a/target/riscv/cpu_cfg.h b/target/riscv/cpu_cfg.h
-@@ -XXX,XX +XXX,XX @@ struct CPURISCVState {
+index XXXXXXX..XXXXXXX 100644
-     uint32_t misa_ext;      /* current extensions */
+--- a/target/riscv/cpu_cfg.h
-     uint32_t misa_ext_mask; /* max ext for this cpu */
++++ b/target/riscv/cpu_cfg.h
+@@ -XXX,XX +XXX,XX @@ struct RISCVCPUConfig {
-+    /* 128-bit helpers upper part return value */
+     bool ext_zve32f;
-+    target_ulong retxh;
+     bool ext_zve64f;
-+
+     bool ext_zve64d;
-     uint32_t features;
++    bool ext_zvbc;
+     bool ext_zmmul;
- #ifdef CONFIG_USER_ONLY
+     bool ext_zvfbfmin;
      bool ext_zvfbfwma;
 diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/helper.h
 +++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_5(vsext_vf2_d, void, ptr, ptr, ptr, env, i32)
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_5(vfwcvtbf16_f_f_v, void, ptr, ptr, ptr, env, i32)
- DEF_HELPER_5(vsext_vf4_w, void, ptr, ptr, ptr, env, i32)
- DEF_HELPER_5(vsext_vf4_d, void, ptr, ptr, ptr, env, i32)
+ DEF_HELPER_6(vfwmaccbf16_vv, void, ptr, ptr, ptr, ptr, env, i32)
- DEF_HELPER_5(vsext_vf8_d, void, ptr, ptr, ptr, env, i32)
+ DEF_HELPER_6(vfwmaccbf16_vf, void, ptr, ptr, i64, ptr, env, i32)
 +
-+/* 128-bit integer multiplication and division */
++/* Vector crypto functions */
-+DEF_HELPER_5(divu_i128, tl, env, tl, tl, tl, tl)
++DEF_HELPER_6(vclmul_vv, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_5(divs_i128, tl, env, tl, tl, tl, tl)
++DEF_HELPER_6(vclmul_vx, void, ptr, ptr, tl, ptr, env, i32)
-+DEF_HELPER_5(remu_i128, tl, env, tl, tl, tl, tl)
++DEF_HELPER_6(vclmulh_vv, void, ptr, ptr, ptr, ptr, env, i32)
-+DEF_HELPER_5(rems_i128, tl, env, tl, tl, tl, tl)
++DEF_HELPER_6(vclmulh_vx, void, ptr, ptr, tl, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ divuw    0000001 .....  ..... 101 ..... 0111011 @r
+@@ -XXX,XX +XXX,XX @@ vfwcvtbf16_f_f_v  010010 . ..... 01101 001 ..... 1010111 @r2_vm
- remw     0000001 .....  ..... 110 ..... 0111011 @r
+ # *** Zvfbfwma Standard Extension ***
- remuw    0000001 .....  ..... 111 ..... 0111011 @r
+ vfwmaccbf16_vv    111011 . ..... ..... 001 ..... 1010111 @r_vm
+ vfwmaccbf16_vf    111011 . ..... ..... 101 ..... 1010111 @r_vm
-+# *** RV128M Standard Extension (in addition to RV64M) ***
++
-+muld     0000001 .....  ..... 000 ..... 1111011 @r
++# *** Zvbc vector crypto extension ***
-+divd     0000001 .....  ..... 100 ..... 1111011 @r
++vclmul_vv   001100 . ..... ..... 010 ..... 1010111 @r_vm
-+divud    0000001 .....  ..... 101 ..... 1111011 @r
++vclmul_vx   001100 . ..... ..... 110 ..... 1010111 @r_vm
-+remd     0000001 .....  ..... 110 ..... 1111011 @r
++vclmulh_vv  001101 . ..... ..... 010 ..... 1010111 @r_vm
-+remud    0000001 .....  ..... 111 ..... 1111011 @r
++vclmulh_vx  001101 . ..... ..... 110 ..... 1010111 @r_vm
-+
+diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
- # *** RV32A Standard Extension ***
+index XXXXXXX..XXXXXXX 100644
- lr_w       00010 . . 00000 ..... 010 ..... 0101111 @atom_ld
+--- a/target/riscv/cpu.c
- sc_w       00011 . . ..... ..... 010 ..... 0101111 @atom_st
++++ b/target/riscv/cpu.c
-diff --git a/target/riscv/m128_helper.c b/target/riscv/m128_helper.c
+@@ -XXX,XX +XXX,XX @@ static const struct isa_ext_data isa_edata_arr[] = {
      ISA_EXT_DATA_ENTRY(zksed, PRIV_VERSION_1_12_0, ext_zksed),
      ISA_EXT_DATA_ENTRY(zksh, PRIV_VERSION_1_12_0, ext_zksh),
      ISA_EXT_DATA_ENTRY(zkt, PRIV_VERSION_1_12_0, ext_zkt),
 +    ISA_EXT_DATA_ENTRY(zvbc, PRIV_VERSION_1_12_0, ext_zvbc),
      ISA_EXT_DATA_ENTRY(zve32f, PRIV_VERSION_1_10_0, ext_zve32f),
      ISA_EXT_DATA_ENTRY(zve64f, PRIV_VERSION_1_10_0, ext_zve64f),
      ISA_EXT_DATA_ENTRY(zve64d, PRIV_VERSION_1_10_0, ext_zve64d),
@@ -XXX,XX +XXX,XX @@ void riscv_cpu_validate_set_extensions(RISCVCPU *cpu, Error **errp)
          return;
      }
 +    if (cpu->cfg.ext_zvbc && !cpu->cfg.ext_zve64f) {
 +        error_setg(errp, "Zvbc extension requires V or Zve64{f,d} extensions");
 +        return;
 +    }
 +
      if (cpu->cfg.ext_zk) {
          cpu->cfg.ext_zkn = true;
          cpu->cfg.ext_zkr = true;
@@ -XXX,XX +XXX,XX @@ static Property riscv_cpu_extensions[] = {
      DEFINE_PROP_BOOL("x-zvfbfmin", RISCVCPU, cfg.ext_zvfbfmin, false),
      DEFINE_PROP_BOOL("x-zvfbfwma", RISCVCPU, cfg.ext_zvfbfwma, false),
 +    /* Vector cryptography extensions */
 +    DEFINE_PROP_BOOL("x-zvbc", RISCVCPU, cfg.ext_zvbc, false),
 +
      DEFINE_PROP_END_OF_LIST(),
  };
 diff --git a/target/riscv/translate.c b/target/riscv/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/translate.c
 +++ b/target/riscv/translate.c
@@ -XXX,XX +XXX,XX @@ static uint32_t opcode_at(DisasContextBase *dcbase, target_ulong pc)
  #include "insn_trans/trans_rvzfa.c.inc"
  #include "insn_trans/trans_rvzfh.c.inc"
  #include "insn_trans/trans_rvk.c.inc"
 +#include "insn_trans/trans_rvvk.c.inc"
  #include "insn_trans/trans_privileged.c.inc"
  #include "insn_trans/trans_svinval.c.inc"
  #include "insn_trans/trans_rvbf16.c.inc"
 diff --git a/target/riscv/vcrypto_helper.c b/target/riscv/vcrypto_helper.c
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
-+++ b/target/riscv/m128_helper.c
++++ b/target/riscv/vcrypto_helper.c
 @@ -XXX,XX +XXX,XX @@
 +/*
-+ * RISC-V Emulation Helpers for QEMU.
++ * RISC-V Vector Crypto Extension Helpers for QEMU.
 + *
-+ * Copyright (c) 2016-2017 Sagar Karandikar, sagark@eecs.berkeley.edu
++ * Copyright (C) 2023 SiFive, Inc.
-+ * Copyright (c) 2017-2018 SiFive, Inc.
++ * Written by Codethink Ltd and SiFive.
 + *
 + * This program is free software; you can redistribute it and/or modify it
 + * under the terms and conditions of the GNU General Public License,
 + * version 2 or later, as published by the Free Software Foundation.
 + *
 ...
 + * You should have received a copy of the GNU General Public License along with
 + * this program.  If not, see <http://www.gnu.org/licenses/>.
 + */
 +
 +#include "qemu/osdep.h"
++#include "qemu/host-utils.h"
++#include "qemu/bitops.h"
 +#include "cpu.h"
-+#include "qemu/main-loop.h"
++#include "exec/memop.h"
 +#include "exec/exec-all.h"
 +#include "exec/helper-proto.h"
-+
++#include "internals.h"
-+target_ulong HELPER(divu_i128)(CPURISCVState *env,
++#include "vector_internals.h"
-+                       target_ulong ul, target_ulong uh,
++
-+                       target_ulong vl, target_ulong vh)
++static uint64_t clmul64(uint64_t y, uint64_t x)
 +{
-+    target_ulong ql, qh;
++    uint64_t result = 0;
-+    Int128 q;
++    for (int j = 63; j >= 0; j--) {
-+
++        if ((y >> j) & 1) {
-+    if (vl == 0 && vh == 0) { /* Handle special behavior on div by zero */
++            result ^= (x << j);
-+        ql = ~0x0;
++        }
-+        qh = ~0x0;
++    }
-+    } else {
++    return result;
-+        q = int128_divu(int128_make128(ul, uh), int128_make128(vl, vh));
++}
-+        ql = int128_getlo(q);
++
-+        qh = int128_gethi(q);
++static uint64_t clmulh64(uint64_t y, uint64_t x)
-+    }
++{
-+
++    uint64_t result = 0;
-+    env->retxh = qh;
++    for (int j = 63; j >= 1; j--) {
-+    return ql;
++        if ((y >> j) & 1) {
-+}
++            result ^= (x >> (64 - j));
-+
++        }
-+target_ulong HELPER(remu_i128)(CPURISCVState *env,
++    }
-+                       target_ulong ul, target_ulong uh,
++    return result;
-+                       target_ulong vl, target_ulong vh)
++}
-+{
++
-+    target_ulong rl, rh;
++RVVCALL(OPIVV2, vclmul_vv, OP_UUU_D, H8, H8, H8, clmul64)
-+    Int128 r;
++GEN_VEXT_VV(vclmul_vv, 8)
-+
++RVVCALL(OPIVX2, vclmul_vx, OP_UUU_D, H8, H8, clmul64)
-+    if (vl == 0 && vh == 0) {
++GEN_VEXT_VX(vclmul_vx, 8)
-+        rl = ul;
++RVVCALL(OPIVV2, vclmulh_vv, OP_UUU_D, H8, H8, H8, clmulh64)
-+        rh = uh;
++GEN_VEXT_VV(vclmulh_vv, 8)
-+    } else {
++RVVCALL(OPIVX2, vclmulh_vx, OP_UUU_D, H8, H8, clmulh64)
-+        r = int128_remu(int128_make128(ul, uh), int128_make128(vl, vh));
++GEN_VEXT_VX(vclmulh_vx, 8)
-+        rl = int128_getlo(r);
+diff --git a/target/riscv/insn_trans/trans_rvvk.c.inc b/target/riscv/insn_trans/trans_rvvk.c.inc
-+        rh = int128_gethi(r);
+new file mode 100644
-+    }
+index XXXXXXX..XXXXXXX
-+
+--- /dev/null
-+    env->retxh = rh;
++++ b/target/riscv/insn_trans/trans_rvvk.c.inc
 +    return rl;
 +}
 +
 +target_ulong HELPER(divs_i128)(CPURISCVState *env,
 +                       target_ulong ul, target_ulong uh,
 +                       target_ulong vl, target_ulong vh)
 +{
 +    target_ulong qh, ql;
 +    Int128 q;
 +
 +    if (vl == 0 && vh == 0) { /* Div by zero check */
 +        ql = ~0x0;
 +        qh = ~0x0;
 +    } else if (uh == (1ULL << (TARGET_LONG_BITS - 1)) && ul == 0 &&
 +               vh == ~0x0 && vl == ~0x0) {
 +        /* Signed div overflow check (-2**127 / -1) */
 +        ql = ul;
 +        qh = uh;
 +    } else {
 +        q = int128_divs(int128_make128(ul, uh), int128_make128(vl, vh));
 +        ql = int128_getlo(q);
 +        qh = int128_gethi(q);
 +    }
 +
 +    env->retxh = qh;
 +    return ql;
 +}
 +
 +target_ulong HELPER(rems_i128)(CPURISCVState *env,
 +                       target_ulong ul, target_ulong uh,
 +                       target_ulong vl, target_ulong vh)
 +{
 +    target_ulong rh, rl;
 +    Int128 r;
 +
 +    if (vl == 0 && vh == 0) {
 +        rl = ul;
 +        rh = uh;
 +    } else {
 +        r = int128_rems(int128_make128(ul, uh), int128_make128(vl, vh));
 +        rl = int128_getlo(r);
 +        rh = int128_gethi(r);
 +    }
 +
 +    env->retxh = rh;
 +    return rl;
 +}
 diff --git a/target/riscv/insn_trans/trans_rvm.c.inc b/target/riscv/insn_trans/trans_rvm.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvm.c.inc
 +++ b/target/riscv/insn_trans/trans_rvm.c.inc
 @@ -XXX,XX +XXX,XX @@
-  * this program.  If not, see <http://www.gnu.org/licenses/>.
++/*
-  */
++ * RISC-V translation routines for the vector crypto extension.
++ *
-+static void gen_mulhu_i128(TCGv r2, TCGv r3, TCGv al, TCGv ah, TCGv bl, TCGv bh)
++ * Copyright (C) 2023 SiFive, Inc.
-+{
++ * Written by Codethink Ltd and SiFive.
-+    TCGv tmpl = tcg_temp_new();
++ *
-+    TCGv tmph = tcg_temp_new();
++ * This program is free software; you can redistribute it and/or modify it
-+    TCGv r0 = tcg_temp_new();
++ * under the terms and conditions of the GNU General Public License,
-+    TCGv r1 = tcg_temp_new();
++ * version 2 or later, as published by the Free Software Foundation.
-+    TCGv zero = tcg_constant_tl(0);
++ *
-+
++ * This program is distributed in the hope it will be useful, but WITHOUT
-+    tcg_gen_mulu2_tl(r0, r1, al, bl);
++ * ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
-+
++ * FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License for
-+    tcg_gen_mulu2_tl(tmpl, tmph, al, bh);
++ * more details.
-+    tcg_gen_add2_tl(r1, r2, r1, zero, tmpl, tmph);
++ *
-+    tcg_gen_mulu2_tl(tmpl, tmph, ah, bl);
++ * You should have received a copy of the GNU General Public License along with
-+    tcg_gen_add2_tl(r1, tmph, r1, r2, tmpl, tmph);
++ * this program.  If not, see <http://www.gnu.org/licenses/>.
-+    /* Overflow detection into r3 */
++ */
-+    tcg_gen_setcond_tl(TCG_COND_LTU, r3, tmph, r2);
++
-+
++/*
-+    tcg_gen_mov_tl(r2, tmph);
++ * Zvbc
-+
++ */
-+    tcg_gen_mulu2_tl(tmpl, tmph, ah, bh);
++
-+    tcg_gen_add2_tl(r2, r3, r2, r3, tmpl, tmph);
++#define GEN_VV_MASKED_TRANS(NAME, CHECK)                     \
-+
++    static bool trans_##NAME(DisasContext *s, arg_rmrr *a)   \
-+    tcg_temp_free(tmpl);
++    {                                                        \
-+    tcg_temp_free(tmph);
++        if (CHECK(s, a)) {                                   \
-+}
++            return opivv_trans(a->rd, a->rs1, a->rs2, a->vm, \
-+
++                               gen_helper_##NAME, s);        \
-+static void gen_mul_i128(TCGv rl, TCGv rh,
++        }                                                    \
-+                         TCGv rs1l, TCGv rs1h, TCGv rs2l, TCGv rs2h)
++        return false;                                        \
-+{
++    }
-+    TCGv tmpl = tcg_temp_new();
++
-+    TCGv tmph = tcg_temp_new();
++static bool vclmul_vv_check(DisasContext *s, arg_rmrr *a)
-+    TCGv tmpx = tcg_temp_new();
++{
-+    TCGv zero = tcg_constant_tl(0);
++    return opivv_check(s, a) &&
-+
++           s->cfg_ptr->ext_zvbc == true &&
-+    tcg_gen_mulu2_tl(rl, rh, rs1l, rs2l);
++           s->sew == MO_64;
-+    tcg_gen_mulu2_tl(tmpl, tmph, rs1l, rs2h);
++}
-+    tcg_gen_add2_tl(rh, tmpx, rh, zero, tmpl, tmph);
++
-+    tcg_gen_mulu2_tl(tmpl, tmph, rs1h, rs2l);
++GEN_VV_MASKED_TRANS(vclmul_vv, vclmul_vv_check)
-+    tcg_gen_add2_tl(rh, tmph, rh, tmpx, tmpl, tmph);
++GEN_VV_MASKED_TRANS(vclmulh_vv, vclmul_vv_check)
 +
-+    tcg_temp_free(tmpl);
++#define GEN_VX_MASKED_TRANS(NAME, CHECK)                     \
-+    tcg_temp_free(tmph);
++    static bool trans_##NAME(DisasContext *s, arg_rmrr *a)   \
-+    tcg_temp_free(tmpx);
++    {                                                        \
-+}
++        if (CHECK(s, a)) {                                   \
++            return opivx_trans(a->rd, a->rs1, a->rs2, a->vm, \
- static bool trans_mul(DisasContext *ctx, arg_mul *a)
++                               gen_helper_##NAME, s);        \
- {
++        }                                                    \
-     REQUIRE_EXT(ctx, RVM);
++        return false;                                        \
--    return gen_arith(ctx, a, EXT_NONE, tcg_gen_mul_tl, NULL);
++    }
-+    return gen_arith(ctx, a, EXT_NONE, tcg_gen_mul_tl, gen_mul_i128);
++
-+}
++static bool vclmul_vx_check(DisasContext *s, arg_rmrr *a)
-+
++{
-+static void gen_mulh_i128(TCGv rl, TCGv rh,
++    return opivx_check(s, a) &&
-+                          TCGv rs1l, TCGv rs1h, TCGv rs2l, TCGv rs2h)
++           s->cfg_ptr->ext_zvbc == true &&
-+{
++           s->sew == MO_64;
-+    TCGv t0l = tcg_temp_new();
++}
-+    TCGv t0h = tcg_temp_new();
++
-+    TCGv t1l = tcg_temp_new();
++GEN_VX_MASKED_TRANS(vclmul_vx, vclmul_vx_check)
-+    TCGv t1h = tcg_temp_new();
++GEN_VX_MASKED_TRANS(vclmulh_vx, vclmul_vx_check)
 +
 +    gen_mulhu_i128(rl, rh, rs1l, rs1h, rs2l, rs2h);
 +    tcg_gen_sari_tl(t0h, rs1h, 63);
 +    tcg_gen_and_tl(t0l, t0h, rs2l);
 +    tcg_gen_and_tl(t0h, t0h, rs2h);
 +    tcg_gen_sari_tl(t1h, rs2h, 63);
 +    tcg_gen_and_tl(t1l, t1h, rs1l);
 +    tcg_gen_and_tl(t1h, t1h, rs1h);
 +    tcg_gen_sub2_tl(t0l, t0h, rl, rh, t0l, t0h);
 +    tcg_gen_sub2_tl(rl, rh, t0l, t0h, t1l, t1h);
 +
 +    tcg_temp_free(t0l);
 +    tcg_temp_free(t0h);
 +    tcg_temp_free(t1l);
 +    tcg_temp_free(t1h);
  }
  static void gen_mulh(TCGv ret, TCGv s1, TCGv s2)
@@ -XXX,XX +XXX,XX @@ static void gen_mulh_w(TCGv ret, TCGv s1, TCGv s2)
  static bool trans_mulh(DisasContext *ctx, arg_mulh *a)
  {
      REQUIRE_EXT(ctx, RVM);
 -    return gen_arith_per_ol(ctx, a, EXT_SIGN, gen_mulh, gen_mulh_w, NULL);
 +    return gen_arith_per_ol(ctx, a, EXT_SIGN, gen_mulh, gen_mulh_w,
 +                            gen_mulh_i128);
 +}
 +
 +static void gen_mulhsu_i128(TCGv rl, TCGv rh,
 +                            TCGv rs1l, TCGv rs1h, TCGv rs2l, TCGv rs2h)
 +{
 +
 +    TCGv t0l = tcg_temp_new();
 +    TCGv t0h = tcg_temp_new();
 +
 +    gen_mulhu_i128(rl, rh, rs1l, rs1h, rs2l, rs2h);
 +    tcg_gen_sari_tl(t0h, rs1h, 63);
 +    tcg_gen_and_tl(t0l, t0h, rs2l);
 +    tcg_gen_and_tl(t0h, t0h, rs2h);
 +    tcg_gen_sub2_tl(rl, rh, rl, rh, t0l, t0h);
 +
 +    tcg_temp_free(t0l);
 +    tcg_temp_free(t0h);
  }
  static void gen_mulhsu(TCGv ret, TCGv arg1, TCGv arg2)
@@ -XXX,XX +XXX,XX @@ static void gen_mulhsu_w(TCGv ret, TCGv arg1, TCGv arg2)
  static bool trans_mulhsu(DisasContext *ctx, arg_mulhsu *a)
  {
      REQUIRE_EXT(ctx, RVM);
 -    return gen_arith_per_ol(ctx, a, EXT_NONE, gen_mulhsu, gen_mulhsu_w, NULL);
 +    return gen_arith_per_ol(ctx, a, EXT_NONE, gen_mulhsu, gen_mulhsu_w,
 +                            gen_mulhsu_i128);
  }
  static void gen_mulhu(TCGv ret, TCGv s1, TCGv s2)
@@ -XXX,XX +XXX,XX @@ static bool trans_mulhu(DisasContext *ctx, arg_mulhu *a)
  {
      REQUIRE_EXT(ctx, RVM);
      /* gen_mulh_w works for either sign as input. */
 -    return gen_arith_per_ol(ctx, a, EXT_ZERO, gen_mulhu, gen_mulh_w, NULL);
 +    return gen_arith_per_ol(ctx, a, EXT_ZERO, gen_mulhu, gen_mulh_w,
 +                            gen_mulhu_i128);
 +}
 +
 +static void gen_div_i128(TCGv rdl, TCGv rdh,
 +                         TCGv rs1l, TCGv rs1h, TCGv rs2l, TCGv rs2h)
 +{
 +    gen_helper_divs_i128(rdl, cpu_env, rs1l, rs1h, rs2l, rs2h);
 +    tcg_gen_ld_tl(rdh, cpu_env, offsetof(CPURISCVState, retxh));
  }
  static void gen_div(TCGv ret, TCGv source1, TCGv source2)
@@ -XXX,XX +XXX,XX @@ static void gen_div(TCGv ret, TCGv source1, TCGv source2)
  static bool trans_div(DisasContext *ctx, arg_div *a)
  {
      REQUIRE_EXT(ctx, RVM);
 -    return gen_arith(ctx, a, EXT_SIGN, gen_div, NULL);
 +    return gen_arith(ctx, a, EXT_SIGN, gen_div, gen_div_i128);
 +}
 +
 +static void gen_divu_i128(TCGv rdl, TCGv rdh,
 +                          TCGv rs1l, TCGv rs1h, TCGv rs2l, TCGv rs2h)
 +{
 +    gen_helper_divu_i128(rdl, cpu_env, rs1l, rs1h, rs2l, rs2h);
 +    tcg_gen_ld_tl(rdh, cpu_env, offsetof(CPURISCVState, retxh));
  }
  static void gen_divu(TCGv ret, TCGv source1, TCGv source2)
@@ -XXX,XX +XXX,XX @@ static void gen_divu(TCGv ret, TCGv source1, TCGv source2)
  static bool trans_divu(DisasContext *ctx, arg_divu *a)
  {
      REQUIRE_EXT(ctx, RVM);
 -    return gen_arith(ctx, a, EXT_ZERO, gen_divu, NULL);
 +    return gen_arith(ctx, a, EXT_ZERO, gen_divu, gen_divu_i128);
 +}
 +
 +static void gen_rem_i128(TCGv rdl, TCGv rdh,
 +                         TCGv rs1l, TCGv rs1h, TCGv rs2l, TCGv rs2h)
 +{
 +    gen_helper_rems_i128(rdl, cpu_env, rs1l, rs1h, rs2l, rs2h);
 +    tcg_gen_ld_tl(rdh, cpu_env, offsetof(CPURISCVState, retxh));
  }
  static void gen_rem(TCGv ret, TCGv source1, TCGv source2)
@@ -XXX,XX +XXX,XX @@ static void gen_rem(TCGv ret, TCGv source1, TCGv source2)
  static bool trans_rem(DisasContext *ctx, arg_rem *a)
  {
      REQUIRE_EXT(ctx, RVM);
 -    return gen_arith(ctx, a, EXT_SIGN, gen_rem, NULL);
 +    return gen_arith(ctx, a, EXT_SIGN, gen_rem, gen_rem_i128);
 +}
 +
 +static void gen_remu_i128(TCGv rdl, TCGv rdh,
 +                          TCGv rs1l, TCGv rs1h, TCGv rs2l, TCGv rs2h)
 +{
 +    gen_helper_remu_i128(rdl, cpu_env, rs1l, rs1h, rs2l, rs2h);
 +    tcg_gen_ld_tl(rdh, cpu_env, offsetof(CPURISCVState, retxh));
  }
  static void gen_remu(TCGv ret, TCGv source1, TCGv source2)
@@ -XXX,XX +XXX,XX @@ static void gen_remu(TCGv ret, TCGv source1, TCGv source2)
  static bool trans_remu(DisasContext *ctx, arg_remu *a)
  {
      REQUIRE_EXT(ctx, RVM);
 -    return gen_arith(ctx, a, EXT_ZERO, gen_remu, NULL);
 +    return gen_arith(ctx, a, EXT_ZERO, gen_remu, gen_remu_i128);
  }
  static bool trans_mulw(DisasContext *ctx, arg_mulw *a)
  {
 -    REQUIRE_64BIT(ctx);
 +    REQUIRE_64_OR_128BIT(ctx);
      REQUIRE_EXT(ctx, RVM);
      ctx->ol = MXL_RV32;
      return gen_arith(ctx, a, EXT_NONE, tcg_gen_mul_tl, NULL);
@@ -XXX,XX +XXX,XX @@ static bool trans_mulw(DisasContext *ctx, arg_mulw *a)
  static bool trans_divw(DisasContext *ctx, arg_divw *a)
  {
 -    REQUIRE_64BIT(ctx);
 +    REQUIRE_64_OR_128BIT(ctx);
      REQUIRE_EXT(ctx, RVM);
      ctx->ol = MXL_RV32;
      return gen_arith(ctx, a, EXT_SIGN, gen_div, NULL);
@@ -XXX,XX +XXX,XX @@ static bool trans_divw(DisasContext *ctx, arg_divw *a)
  static bool trans_divuw(DisasContext *ctx, arg_divuw *a)
  {
 -    REQUIRE_64BIT(ctx);
 +    REQUIRE_64_OR_128BIT(ctx);
      REQUIRE_EXT(ctx, RVM);
      ctx->ol = MXL_RV32;
      return gen_arith(ctx, a, EXT_ZERO, gen_divu, NULL);
@@ -XXX,XX +XXX,XX @@ static bool trans_divuw(DisasContext *ctx, arg_divuw *a)
  static bool trans_remw(DisasContext *ctx, arg_remw *a)
  {
 -    REQUIRE_64BIT(ctx);
 +    REQUIRE_64_OR_128BIT(ctx);
      REQUIRE_EXT(ctx, RVM);
      ctx->ol = MXL_RV32;
      return gen_arith(ctx, a, EXT_SIGN, gen_rem, NULL);
@@ -XXX,XX +XXX,XX @@ static bool trans_remw(DisasContext *ctx, arg_remw *a)
  static bool trans_remuw(DisasContext *ctx, arg_remuw *a)
  {
 -    REQUIRE_64BIT(ctx);
 +    REQUIRE_64_OR_128BIT(ctx);
      REQUIRE_EXT(ctx, RVM);
      ctx->ol = MXL_RV32;
      return gen_arith(ctx, a, EXT_ZERO, gen_remu, NULL);
  }
 +
 +static bool trans_muld(DisasContext *ctx, arg_muld *a)
 +{
 +    REQUIRE_128BIT(ctx);
 +    REQUIRE_EXT(ctx, RVM);
 +    ctx->ol = MXL_RV64;
 +    return gen_arith(ctx, a, EXT_SIGN, tcg_gen_mul_tl, NULL);
 +}
 +
 +static bool trans_divd(DisasContext *ctx, arg_divd *a)
 +{
 +    REQUIRE_128BIT(ctx);
 +    REQUIRE_EXT(ctx, RVM);
 +    ctx->ol = MXL_RV64;
 +    return gen_arith(ctx, a, EXT_SIGN, gen_div, NULL);
 +}
 +
 +static bool trans_divud(DisasContext *ctx, arg_divud *a)
 +{
 +    REQUIRE_128BIT(ctx);
 +    REQUIRE_EXT(ctx, RVM);
 +    ctx->ol = MXL_RV64;
 +    return gen_arith(ctx, a, EXT_ZERO, gen_divu, NULL);
 +}
 +
 +static bool trans_remd(DisasContext *ctx, arg_remd *a)
 +{
 +    REQUIRE_128BIT(ctx);
 +    REQUIRE_EXT(ctx, RVM);
 +    ctx->ol = MXL_RV64;
 +    return gen_arith(ctx, a, EXT_SIGN, gen_rem, NULL);
 +}
 +
 +static bool trans_remud(DisasContext *ctx, arg_remud *a)
 +{
 +    REQUIRE_128BIT(ctx);
 +    REQUIRE_EXT(ctx, RVM);
 +    ctx->ol = MXL_RV64;
 +    return gen_arith(ctx, a, EXT_ZERO, gen_remu, NULL);
 +}
 diff --git a/target/riscv/meson.build b/target/riscv/meson.build
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/meson.build
 +++ b/target/riscv/meson.build
 @@ -XXX,XX +XXX,XX @@ riscv_ss.add(files(
-   'vector_helper.c',
-   'bitmanip_helper.c',
    'translate.c',
-+  'm128_helper.c'
+   'm128_helper.c',
    'crypto_helper.c',
 -  'zce_helper.c'
 +  'zce_helper.c',
 +  'vcrypto_helper.c'
  ))
+ riscv_ss.add(when: 'CONFIG_KVM', if_true: files('kvm.c'), if_false: files('kvm-stub.c'))
- riscv_softmmu_ss = ss.source_set()
 --
-.31.1
+.41.0

-[PULL 15/37] target/riscv: rvv-1.0: Call the correct RVF/RVD check function for narrowing fp/int type-convert insns
+[PULL v2 12/45] target/riscv: Move vector translation checks
-From: Frank Chang <frank.chang@sifive.com>
+From: Nazar Kazakov <nazar.kazakov@codethink.co.uk>
-vfncvt.f.xu.w, vfncvt.f.x.w convert double-width integer to single-width
+Move the checks out of `do_opiv{v,x,i}_gvec{,_shift}` functions
-floating-point. Therefore, should use require_rvf() to check whether
+and into the corresponding macros. This enables the functions to be
-RVF/RVD is enabled.
+reused in proceeding commits without check duplication.
-vfncvt.f.f.w, vfncvt.rod.f.f.w convert double-width floating-point to
+Signed-off-by: Nazar Kazakov <nazar.kazakov@codethink.co.uk>
-single-width integer. Therefore, should use require_scale_rvf() to check
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-whether RVF/RVD is enabled.
+Reviewed-by: Weiwei Li <liweiwei@iscas.ac.cn>
+Signed-off-by: Max Chou <max.chou@sifive.com>
-Signed-off-by: Frank Chang <frank.chang@sifive.com>
+Message-ID: <20230711165917.2629866-6-max.chou@sifive.com>
 Acked-by: Alistair Francis <alistair.francis@wdc.com>
 Message-Id: <20220105022247.21131-4-frank.chang@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/insn_trans/trans_rvv.c.inc | 32 ++++++++++++++++++-------
+ target/riscv/insn_trans/trans_rvv.c.inc | 28 +++++++++++--------------
-file changed, 24 insertions(+), 8 deletions(-)
+file changed, 12 insertions(+), 16 deletions(-)
 diff --git a/target/riscv/insn_trans/trans_rvv.c.inc b/target/riscv/insn_trans/trans_rvv.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.c.inc
 +++ b/target/riscv/insn_trans/trans_rvv.c.inc
-@@ -XXX,XX +XXX,XX @@ GEN_OPFXV_WIDEN_TRANS(vfwcvt_f_x_v)
+@@ -XXX,XX +XXX,XX @@ do_opivv_gvec(DisasContext *s, arg_rmrr *a, GVecGen3Fn *gvec_fn,
- static bool opfv_narrow_check(DisasContext *s, arg_rmr *a)
+               gen_helper_gvec_4_ptr *fn)
  {
-     return require_rvv(s) &&
+     TCGLabel *over = gen_new_label();
--           require_rvf(s) &&
+-    if (!opivv_check(s, a)) {
--           (s->sew != MO_64) &&
+-        return false;
-            vext_check_isa_ill(s) &&
+-    }
-            /* OPFV narrowing instructions ignore vs1 check */
-            vext_check_sd(s, a->rd, a->rs2, a->vm);
+     tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmrr *a)             \
          gen_helper_##NAME##_b, gen_helper_##NAME##_h,              \
          gen_helper_##NAME##_w, gen_helper_##NAME##_d,              \
      };                                                             \
 +    if (!opivv_check(s, a)) {                                      \
 +        return false;                                              \
 +    }                                                              \
      return do_opivv_gvec(s, a, tcg_gen_gvec_##SUF, fns[s->sew]);   \
  }
--#define GEN_OPFV_NARROW_TRANS(NAME, HELPER, FRM)                   \
+@@ -XXX,XX +XXX,XX @@ static inline bool
-+static bool opfxv_narrow_check(DisasContext *s, arg_rmr *a)
+ do_opivx_gvec(DisasContext *s, arg_rmrr *a, GVecGen2sFn *gvec_fn,
-+{
+               gen_helper_opivx *fn)
-+    return opfv_narrow_check(s, a) &&
+ {
-+           require_rvf(s) &&
+-    if (!opivx_check(s, a)) {
-+           (s->sew != MO_64);
+-        return false;
-+}
+-    }
-+
+-
-+static bool opffv_narrow_check(DisasContext *s, arg_rmr *a)
+     if (a->vm && s->vl_eq_vlmax && !(s->vta && s->lmul < 0)) {
-+{
+         TCGv_i64 src1 = tcg_temp_new_i64();
-+    return opfv_narrow_check(s, a) &&
-+           require_scale_rvf(s) &&
+@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmrr *a)             \
-+           (s->sew != MO_8);
+         gen_helper_##NAME##_b, gen_helper_##NAME##_h,              \
-+}
+         gen_helper_##NAME##_w, gen_helper_##NAME##_d,              \
-+
+     };                                                             \
-+#define GEN_OPFV_NARROW_TRANS(NAME, CHECK, HELPER, FRM)            \
++    if (!opivx_check(s, a)) {                                      \
- static bool trans_##NAME(DisasContext *s, arg_rmr *a)              \
++        return false;                                              \
- {                                                                  \
++    }                                                              \
--    if (opfv_narrow_check(s, a)) {                                 \
+     return do_opivx_gvec(s, a, tcg_gen_gvec_##SUF, fns[s->sew]);   \
 +    if (CHECK(s, a)) {                                             \
          if (FRM != RISCV_FRM_DYN) {                                \
              gen_set_rm(s, RISCV_FRM_DYN);                          \
          }                                                          \
@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmr *a)              \
      return false;                                                  \
  }
--GEN_OPFV_NARROW_TRANS(vfncvt_f_xu_w, vfncvt_f_xu_w, RISCV_FRM_DYN)
+@@ -XXX,XX +XXX,XX @@ static inline bool
--GEN_OPFV_NARROW_TRANS(vfncvt_f_x_w, vfncvt_f_x_w, RISCV_FRM_DYN)
+ do_opivi_gvec(DisasContext *s, arg_rmrr *a, GVecGen2iFn *gvec_fn,
--GEN_OPFV_NARROW_TRANS(vfncvt_f_f_w, vfncvt_f_f_w, RISCV_FRM_DYN)
+               gen_helper_opivx *fn, imm_mode_t imm_mode)
 +GEN_OPFV_NARROW_TRANS(vfncvt_f_xu_w, opfxv_narrow_check, vfncvt_f_xu_w,
 +                      RISCV_FRM_DYN)
 +GEN_OPFV_NARROW_TRANS(vfncvt_f_x_w, opfxv_narrow_check, vfncvt_f_x_w,
 +                      RISCV_FRM_DYN)
 +GEN_OPFV_NARROW_TRANS(vfncvt_f_f_w, opffv_narrow_check, vfncvt_f_f_w,
 +                      RISCV_FRM_DYN)
  /* Reuse the helper function from vfncvt.f.f.w */
 -GEN_OPFV_NARROW_TRANS(vfncvt_rod_f_f_w, vfncvt_f_f_w, RISCV_FRM_ROD)
 +GEN_OPFV_NARROW_TRANS(vfncvt_rod_f_f_w, opffv_narrow_check, vfncvt_f_f_w,
 +                      RISCV_FRM_ROD)
  static bool opxfv_narrow_check(DisasContext *s, arg_rmr *a)
  {
+-    if (!opivx_check(s, a)) {
+-        return false;
+-    }
+-
+     if (a->vm && s->vl_eq_vlmax && !(s->vta && s->lmul < 0)) {
+         gvec_fn(s->sew, vreg_ofs(s, a->rd), vreg_ofs(s, a->rs2),
+                 extract_imm(s, a->rs1, imm_mode), MAXSZ(s), MAXSZ(s));
+@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmrr *a)             \
+         gen_helper_##OPIVX##_b, gen_helper_##OPIVX##_h,            \
+         gen_helper_##OPIVX##_w, gen_helper_##OPIVX##_d,            \
+     };                                                             \
++    if (!opivx_check(s, a)) {                                      \
++        return false;                                              \
++    }                                                              \
+     return do_opivi_gvec(s, a, tcg_gen_gvec_##SUF,                 \
+                          fns[s->sew], IMM_MODE);                   \
+ }
+@@ -XXX,XX +XXX,XX @@ static inline bool
+ do_opivx_gvec_shift(DisasContext *s, arg_rmrr *a, GVecGen2sFn32 *gvec_fn,
+                     gen_helper_opivx *fn)
+ {
+-    if (!opivx_check(s, a)) {
+-        return false;
+-    }
+-
+     if (a->vm && s->vl_eq_vlmax && !(s->vta && s->lmul < 0)) {
+         TCGv_i32 src1 = tcg_temp_new_i32();
+@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmrr *a)                    \
+         gen_helper_##NAME##_b, gen_helper_##NAME##_h,                     \
+         gen_helper_##NAME##_w, gen_helper_##NAME##_d,                     \
+     };                                                                    \
+-                                                                          \
++    if (!opivx_check(s, a)) {                                             \
++        return false;                                                     \
++    }                                                                     \
+     return do_opivx_gvec_shift(s, a, tcg_gen_gvec_##SUF, fns[s->sew]);    \
+ }
 --
-.31.1
+.41.0

-[PULL 14/37] target/riscv: rvv-1.0: Call the correct RVF/RVD check function for widening fp/int type-convert insns
+[PULL v2 13/45] target/riscv: Refactor translation of vector-widening instruction
-From: Frank Chang <frank.chang@sifive.com>
+From: Dickon Hood <dickon.hood@codethink.co.uk>
-vfwcvt.xu.f.v, vfwcvt.x.f.v, vfwcvt.rtz.xu.f.v and vfwcvt.rtz.x.f.v
+Zvbb (implemented in later commit) has a widening instruction, which
-convert single-width floating-point to double-width integer.
+requires an extra check on the enabled extensions.  Refactor
-Therefore, should use require_rvf() to check whether RVF/RVD is enabled.
+GEN_OPIVX_WIDEN_TRANS() to take a check function to avoid reimplementing
 it.
-vfwcvt.f.xu.v, vfwcvt.f.x.v convert single-width integer to double-width
+Signed-off-by: Dickon Hood <dickon.hood@codethink.co.uk>
-floating-point, and vfwcvt.f.f.v convert double-width floating-point to
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-single-width floating-point. Therefore, should use require_scale_rvf() to
+Reviewed-by: Weiwei Li <liweiwei@iscas.ac.cn>
-check whether RVF/RVD is enabled.
+Signed-off-by: Max Chou <max.chou@sifive.com>
+Message-ID: <20230711165917.2629866-7-max.chou@sifive.com>
 Signed-off-by: Frank Chang <frank.chang@sifive.com>
 Acked-by: Alistair Francis <alistair.francis@wdc.com>
 Message-Id: <20220105022247.21131-3-frank.chang@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/insn_trans/trans_rvv.c.inc | 34 ++++++++++++++++++-------
+ target/riscv/insn_trans/trans_rvv.c.inc | 52 +++++++++++--------------
-file changed, 25 insertions(+), 9 deletions(-)
+file changed, 23 insertions(+), 29 deletions(-)
 diff --git a/target/riscv/insn_trans/trans_rvv.c.inc b/target/riscv/insn_trans/trans_rvv.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvv.c.inc
 +++ b/target/riscv/insn_trans/trans_rvv.c.inc
-@@ -XXX,XX +XXX,XX @@ GEN_OPFV_CVT_TRANS(vfcvt_rtz_x_f_v, vfcvt_x_f_v, RISCV_FRM_RTZ)
+@@ -XXX,XX +XXX,XX @@ static bool opivx_widen_check(DisasContext *s, arg_rmrr *a)
  static bool opfv_widen_check(DisasContext *s, arg_rmr *a)
  {
      return require_rvv(s) &&
 -           require_scale_rvf(s) &&
 -           (s->sew != MO_8) &&
             vext_check_isa_ill(s) &&
             vext_check_ds(s, a->rd, a->rs2, a->vm);
  }
--#define GEN_OPFV_WIDEN_TRANS(NAME, HELPER, FRM)                    \
+-static bool do_opivx_widen(DisasContext *s, arg_rmrr *a,
-+static bool opxfv_widen_check(DisasContext *s, arg_rmr *a)
+-                           gen_helper_opivx *fn)
-+{
+-{
-+    return opfv_widen_check(s, a) &&
+-    if (opivx_widen_check(s, a)) {
-+           require_rvf(s);
+-        return opivx_trans(a->rd, a->rs1, a->rs2, a->vm, fn, s);
-+}
+-    }
-+
+-    return false;
-+static bool opffv_widen_check(DisasContext *s, arg_rmr *a)
+-}
-+{
+-
-+    return opfv_widen_check(s, a) &&
+-#define GEN_OPIVX_WIDEN_TRANS(NAME) \
-+           require_scale_rvf(s) &&
+-static bool trans_##NAME(DisasContext *s, arg_rmrr *a)       \
-+           (s->sew != MO_8);
+-{                                                            \
-+}
+-    static gen_helper_opivx * const fns[3] = {               \
-+
+-        gen_helper_##NAME##_b,                               \
-+#define GEN_OPFV_WIDEN_TRANS(NAME, CHECK, HELPER, FRM)             \
+-        gen_helper_##NAME##_h,                               \
- static bool trans_##NAME(DisasContext *s, arg_rmr *a)              \
+-        gen_helper_##NAME##_w                                \
- {                                                                  \
+-    };                                                       \
--    if (opfv_widen_check(s, a)) {                                  \
+-    return do_opivx_widen(s, a, fns[s->sew]);                \
-+    if (CHECK(s, a)) {                                             \
++#define GEN_OPIVX_WIDEN_TRANS(NAME, CHECK) \
-         if (FRM != RISCV_FRM_DYN) {                                \
++static bool trans_##NAME(DisasContext *s, arg_rmrr *a)                    \
-             gen_set_rm(s, RISCV_FRM_DYN);                          \
++{                                                                         \
-         }                                                          \
++    if (CHECK(s, a)) {                                                    \
-@@ -XXX,XX +XXX,XX @@ static bool trans_##NAME(DisasContext *s, arg_rmr *a)              \
++        static gen_helper_opivx * const fns[3] = {                        \
-     return false;                                                  \
++            gen_helper_##NAME##_b,                                        \
 +            gen_helper_##NAME##_h,                                        \
 +            gen_helper_##NAME##_w                                         \
 +        };                                                                \
 +        return opivx_trans(a->rd, a->rs1, a->rs2, a->vm, fns[s->sew], s); \
 +    }                                                                     \
 +    return false;                                                         \
  }
--GEN_OPFV_WIDEN_TRANS(vfwcvt_xu_f_v, vfwcvt_xu_f_v, RISCV_FRM_DYN)
+-GEN_OPIVX_WIDEN_TRANS(vwaddu_vx)
--GEN_OPFV_WIDEN_TRANS(vfwcvt_x_f_v, vfwcvt_x_f_v, RISCV_FRM_DYN)
+-GEN_OPIVX_WIDEN_TRANS(vwadd_vx)
--GEN_OPFV_WIDEN_TRANS(vfwcvt_f_f_v, vfwcvt_f_f_v, RISCV_FRM_DYN)
+-GEN_OPIVX_WIDEN_TRANS(vwsubu_vx)
-+GEN_OPFV_WIDEN_TRANS(vfwcvt_xu_f_v, opxfv_widen_check, vfwcvt_xu_f_v,
+-GEN_OPIVX_WIDEN_TRANS(vwsub_vx)
-+                     RISCV_FRM_DYN)
++GEN_OPIVX_WIDEN_TRANS(vwaddu_vx, opivx_widen_check)
-+GEN_OPFV_WIDEN_TRANS(vfwcvt_x_f_v, opxfv_widen_check, vfwcvt_x_f_v,
++GEN_OPIVX_WIDEN_TRANS(vwadd_vx, opivx_widen_check)
-+                     RISCV_FRM_DYN)
++GEN_OPIVX_WIDEN_TRANS(vwsubu_vx, opivx_widen_check)
-+GEN_OPFV_WIDEN_TRANS(vfwcvt_f_f_v, opffv_widen_check, vfwcvt_f_f_v,
++GEN_OPIVX_WIDEN_TRANS(vwsub_vx, opivx_widen_check)
-+                     RISCV_FRM_DYN)
- /* Reuse the helper functions from vfwcvt.xu.f.v and vfwcvt.x.f.v */
+ /* WIDEN OPIVV with WIDEN */
--GEN_OPFV_WIDEN_TRANS(vfwcvt_rtz_xu_f_v, vfwcvt_xu_f_v, RISCV_FRM_RTZ)
+ static bool opiwv_widen_check(DisasContext *s, arg_rmrr *a)
--GEN_OPFV_WIDEN_TRANS(vfwcvt_rtz_x_f_v, vfwcvt_x_f_v, RISCV_FRM_RTZ)
+@@ -XXX,XX +XXX,XX @@ GEN_OPIVX_TRANS(vrem_vx, opivx_check)
-+GEN_OPFV_WIDEN_TRANS(vfwcvt_rtz_xu_f_v, opxfv_widen_check, vfwcvt_xu_f_v,
+ GEN_OPIVV_WIDEN_TRANS(vwmul_vv, opivv_widen_check)
-+                     RISCV_FRM_RTZ)
+ GEN_OPIVV_WIDEN_TRANS(vwmulu_vv, opivv_widen_check)
-+GEN_OPFV_WIDEN_TRANS(vfwcvt_rtz_x_f_v, opxfv_widen_check, vfwcvt_x_f_v,
+ GEN_OPIVV_WIDEN_TRANS(vwmulsu_vv, opivv_widen_check)
-+                     RISCV_FRM_RTZ)
+-GEN_OPIVX_WIDEN_TRANS(vwmul_vx)
+-GEN_OPIVX_WIDEN_TRANS(vwmulu_vx)
- static bool opfxv_widen_check(DisasContext *s, arg_rmr *a)
+-GEN_OPIVX_WIDEN_TRANS(vwmulsu_vx)
- {
++GEN_OPIVX_WIDEN_TRANS(vwmul_vx, opivx_widen_check)
 +GEN_OPIVX_WIDEN_TRANS(vwmulu_vx, opivx_widen_check)
 +GEN_OPIVX_WIDEN_TRANS(vwmulsu_vx, opivx_widen_check)
  /* Vector Single-Width Integer Multiply-Add Instructions */
  GEN_OPIVV_TRANS(vmacc_vv, opivv_check)
@@ -XXX,XX +XXX,XX @@ GEN_OPIVX_TRANS(vnmsub_vx, opivx_check)
  GEN_OPIVV_WIDEN_TRANS(vwmaccu_vv, opivv_widen_check)
  GEN_OPIVV_WIDEN_TRANS(vwmacc_vv, opivv_widen_check)
  GEN_OPIVV_WIDEN_TRANS(vwmaccsu_vv, opivv_widen_check)
 -GEN_OPIVX_WIDEN_TRANS(vwmaccu_vx)
 -GEN_OPIVX_WIDEN_TRANS(vwmacc_vx)
 -GEN_OPIVX_WIDEN_TRANS(vwmaccsu_vx)
 -GEN_OPIVX_WIDEN_TRANS(vwmaccus_vx)
 +GEN_OPIVX_WIDEN_TRANS(vwmaccu_vx, opivx_widen_check)
 +GEN_OPIVX_WIDEN_TRANS(vwmacc_vx, opivx_widen_check)
 +GEN_OPIVX_WIDEN_TRANS(vwmaccsu_vx, opivx_widen_check)
 +GEN_OPIVX_WIDEN_TRANS(vwmaccus_vx, opivx_widen_check)
  /* Vector Integer Merge and Move Instructions */
  static bool trans_vmv_v_v(DisasContext *s, arg_vmv_v_v *a)
 --
-.31.1
+.41.0

-[PULL 24/37] target/riscv: moving some insns close to similar insns
+[PULL v2 14/45] target/riscv: Refactor some of the generic vector functionality
-From: Frédéric Pétrot <frederic.petrot@univ-grenoble-alpes.fr>
+From: Kiran Ostrolenk <kiran.ostrolenk@codethink.co.uk>
-lwu and ld are functionally close to the other loads, but were after the
+Move some macros out of `vector_helper` and into `vector_internals`.
-stores in the source file.
+This ensures they can be used by both vector and vector-crypto helpers
-Similarly, xor was away from or and and by two arithmetic functions, while
+(latter implemented in proceeding commits).
 the immediate versions were nicely put together.
 This patch moves the aforementioned loads after lhu, and xor above or,
 where they more logically belong.
-Signed-off-by: Frédéric Pétrot <frederic.petrot@univ-grenoble-alpes.fr>
+Signed-off-by: Kiran Ostrolenk <kiran.ostrolenk@codethink.co.uk>
-Co-authored-by: Fabien Portas <fabien.portas@grenoble-inp.org>
+Reviewed-by: Weiwei Li <liweiwei@iscas.ac.cn>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Signed-off-by: Max Chou <max.chou@sifive.com>
-Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
+Message-ID: <20230711165917.2629866-8-max.chou@sifive.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
 Message-id: 20220106210108.138226-9-frederic.petrot@univ-grenoble-alpes.fr
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/insn_trans/trans_rvi.c.inc | 34 ++++++++++++-------------
+ target/riscv/vector_internals.h | 46 +++++++++++++++++++++++++++++++++
-file changed, 17 insertions(+), 17 deletions(-)
+ target/riscv/vector_helper.c    | 42 ------------------------------
 files changed, 46 insertions(+), 42 deletions(-)
-diff --git a/target/riscv/insn_trans/trans_rvi.c.inc b/target/riscv/insn_trans/trans_rvi.c.inc
+diff --git a/target/riscv/vector_internals.h b/target/riscv/vector_internals.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvi.c.inc
+--- a/target/riscv/vector_internals.h
-+++ b/target/riscv/insn_trans/trans_rvi.c.inc
++++ b/target/riscv/vector_internals.h
-@@ -XXX,XX +XXX,XX @@ static bool trans_lhu(DisasContext *ctx, arg_lhu *a)
+@@ -XXX,XX +XXX,XX @@ void vext_set_elems_1s(void *base, uint32_t is_agnostic, uint32_t cnt,
-     return gen_load(ctx, a, MO_TEUW);
+ /* expand macro args before macro */
- }
+ #define RVVCALL(macro, ...)  macro(__VA_ARGS__)
-+static bool trans_lwu(DisasContext *ctx, arg_lwu *a)
++/* (TD, T2, TX2) */
-+{
++#define OP_UU_B uint8_t, uint8_t, uint8_t
-+    REQUIRE_64BIT(ctx);
++#define OP_UU_H uint16_t, uint16_t, uint16_t
-+    return gen_load(ctx, a, MO_TEUL);
++#define OP_UU_W uint32_t, uint32_t, uint32_t
 +#define OP_UU_D uint64_t, uint64_t, uint64_t
 +
  /* (TD, T1, T2, TX1, TX2) */
  #define OP_UUU_B uint8_t, uint8_t, uint8_t, uint8_t, uint8_t
  #define OP_UUU_H uint16_t, uint16_t, uint16_t, uint16_t, uint16_t
  #define OP_UUU_W uint32_t, uint32_t, uint32_t, uint32_t, uint32_t
  #define OP_UUU_D uint64_t, uint64_t, uint64_t, uint64_t, uint64_t
 +#define OPIVV1(NAME, TD, T2, TX2, HD, HS2, OP)         \
 +static void do_##NAME(void *vd, void *vs2, int i)      \
 +{                                                      \
 +    TX2 s2 = *((T2 *)vs2 + HS2(i));                    \
 +    *((TD *)vd + HD(i)) = OP(s2);                      \
 +}
 +
-+static bool trans_ld(DisasContext *ctx, arg_ld *a)
++#define GEN_VEXT_V(NAME, ESZ)                          \
-+{
++void HELPER(NAME)(void *vd, void *v0, void *vs2,       \
-+    REQUIRE_64BIT(ctx);
++                  CPURISCVState *env, uint32_t desc)   \
-+    return gen_load(ctx, a, MO_TEUQ);
++{                                                      \
 +    uint32_t vm = vext_vm(desc);                       \
 +    uint32_t vl = env->vl;                             \
 +    uint32_t total_elems =                             \
 +        vext_get_total_elems(env, desc, ESZ);          \
 +    uint32_t vta = vext_vta(desc);                     \
 +    uint32_t vma = vext_vma(desc);                     \
 +    uint32_t i;                                        \
 +                                                       \
 +    for (i = env->vstart; i < vl; i++) {               \
 +        if (!vm && !vext_elem_mask(v0, i)) {           \
 +            /* set masked-off elements to 1s */        \
 +            vext_set_elems_1s(vd, vma, i * ESZ,        \
 +                              (i + 1) * ESZ);          \
 +            continue;                                  \
 +        }                                              \
 +        do_##NAME(vd, vs2, i);                         \
 +    }                                                  \
 +    env->vstart = 0;                                   \
 +    /* set tail elements to 1s */                      \
 +    vext_set_elems_1s(vd, vta, vl * ESZ,               \
 +                      total_elems * ESZ);              \
 +}
 +
- static bool gen_store(DisasContext *ctx, arg_sb *a, MemOp memop)
+ /* operation of two vector elements */
- {
+ typedef void opivv2_fn(void *vd, void *vs1, void *vs2, int i);
-     TCGv addr = get_gpr(ctx, a->rs1, EXT_NONE);
-@@ -XXX,XX +XXX,XX @@ static bool trans_sw(DisasContext *ctx, arg_sw *a)
+@@ -XXX,XX +XXX,XX @@ void HELPER(NAME)(void *vd, void *v0, target_ulong s1,    \
-     return gen_store(ctx, a, MO_TESL);
+                do_##NAME, ESZ);                           \
  }
--static bool trans_lwu(DisasContext *ctx, arg_lwu *a)
++/* Three of the widening shortening macros: */
--{
++/* (TD, T1, T2, TX1, TX2) */
--    REQUIRE_64BIT(ctx);
++#define WOP_UUU_B uint16_t, uint8_t, uint8_t, uint16_t, uint16_t
--    return gen_load(ctx, a, MO_TEUL);
++#define WOP_UUU_H uint32_t, uint16_t, uint16_t, uint32_t, uint32_t
 +#define WOP_UUU_W uint64_t, uint32_t, uint32_t, uint64_t, uint64_t
 +
  #endif /* TARGET_RISCV_VECTOR_INTERNALS_H */
 diff --git a/target/riscv/vector_helper.c b/target/riscv/vector_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vector_helper.c
 +++ b/target/riscv/vector_helper.c
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_ST_WHOLE(vs8r_v, int8_t, ste_b)
  #define OP_SUS_H int16_t, uint16_t, int16_t, uint16_t, int16_t
  #define OP_SUS_W int32_t, uint32_t, int32_t, uint32_t, int32_t
  #define OP_SUS_D int64_t, uint64_t, int64_t, uint64_t, int64_t
 -#define WOP_UUU_B uint16_t, uint8_t, uint8_t, uint16_t, uint16_t
 -#define WOP_UUU_H uint32_t, uint16_t, uint16_t, uint32_t, uint32_t
 -#define WOP_UUU_W uint64_t, uint32_t, uint32_t, uint64_t, uint64_t
  #define WOP_SSS_B int16_t, int8_t, int8_t, int16_t, int16_t
  #define WOP_SSS_H int32_t, int16_t, int16_t, int32_t, int32_t
  #define WOP_SSS_W int64_t, int32_t, int32_t, int64_t, int64_t
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_VF(vfwnmsac_vf_h, 4)
  GEN_VEXT_VF(vfwnmsac_vf_w, 8)
  /* Vector Floating-Point Square-Root Instruction */
 -/* (TD, T2, TX2) */
 -#define OP_UU_H uint16_t, uint16_t, uint16_t
 -#define OP_UU_W uint32_t, uint32_t, uint32_t
 -#define OP_UU_D uint64_t, uint64_t, uint64_t
 -
  #define OPFVV1(NAME, TD, T2, TX2, HD, HS2, OP)         \
  static void do_##NAME(void *vd, void *vs2, int i,      \
                        CPURISCVState *env)              \
@@ -XXX,XX +XXX,XX @@ GEN_VEXT_CMP_VF(vmfge_vf_w, uint32_t, H4, vmfge32)
  GEN_VEXT_CMP_VF(vmfge_vf_d, uint64_t, H8, vmfge64)
  /* Vector Floating-Point Classify Instruction */
 -#define OPIVV1(NAME, TD, T2, TX2, HD, HS2, OP)         \
 -static void do_##NAME(void *vd, void *vs2, int i)      \
 -{                                                      \
 -    TX2 s2 = *((T2 *)vs2 + HS2(i));                    \
 -    *((TD *)vd + HD(i)) = OP(s2);                      \
 -}
 -
--static bool trans_ld(DisasContext *ctx, arg_ld *a)
+-#define GEN_VEXT_V(NAME, ESZ)                          \
--{
+-void HELPER(NAME)(void *vd, void *v0, void *vs2,       \
--    REQUIRE_64BIT(ctx);
+-                  CPURISCVState *env, uint32_t desc)   \
--    return gen_load(ctx, a, MO_TEUQ);
+-{                                                      \
 -    uint32_t vm = vext_vm(desc);                       \
 -    uint32_t vl = env->vl;                             \
 -    uint32_t total_elems =                             \
 -        vext_get_total_elems(env, desc, ESZ);          \
 -    uint32_t vta = vext_vta(desc);                     \
 -    uint32_t vma = vext_vma(desc);                     \
 -    uint32_t i;                                        \
 -                                                       \
 -    for (i = env->vstart; i < vl; i++) {               \
 -        if (!vm && !vext_elem_mask(v0, i)) {           \
 -            /* set masked-off elements to 1s */        \
 -            vext_set_elems_1s(vd, vma, i * ESZ,        \
 -                              (i + 1) * ESZ);          \
 -            continue;                                  \
 -        }                                              \
 -        do_##NAME(vd, vs2, i);                         \
 -    }                                                  \
 -    env->vstart = 0;                                   \
 -    /* set tail elements to 1s */                      \
 -    vext_set_elems_1s(vd, vta, vl * ESZ,               \
 -                      total_elems * ESZ);              \
 -}
 -
- static bool trans_sd(DisasContext *ctx, arg_sd *a)
+ target_ulong fclass_h(uint64_t frs1)
  {
-     REQUIRE_64BIT(ctx);
+     float16 f = frs1;
@@ -XXX,XX +XXX,XX @@ static bool trans_sltu(DisasContext *ctx, arg_sltu *a)
      return gen_arith(ctx, a, EXT_SIGN, gen_sltu);
  }
 -static bool trans_xor(DisasContext *ctx, arg_xor *a)
 -{
 -    return gen_logic(ctx, a, tcg_gen_xor_tl);
 -}
 -
  static bool trans_srl(DisasContext *ctx, arg_srl *a)
  {
      return gen_shift(ctx, a, EXT_ZERO, tcg_gen_shr_tl);
@@ -XXX,XX +XXX,XX @@ static bool trans_sra(DisasContext *ctx, arg_sra *a)
      return gen_shift(ctx, a, EXT_SIGN, tcg_gen_sar_tl);
  }
 +static bool trans_xor(DisasContext *ctx, arg_xor *a)
 +{
 +    return gen_logic(ctx, a, tcg_gen_xor_tl);
 +}
 +
  static bool trans_or(DisasContext *ctx, arg_or *a)
  {
      return gen_logic(ctx, a, tcg_gen_or_tl);
 --
-.31.1
+.41.0

-[PULL 28/37] target/riscv: support for 128-bit shift instructions
+[PULL v2 15/45] target/riscv: Add Zvbb ISA extension support
-From: Frédéric Pétrot <frederic.petrot@univ-grenoble-alpes.fr>
+From: Dickon Hood <dickon.hood@codethink.co.uk>
-Handling shifts for 32, 64 and 128 operation length for RV128, following the
+This commit adds support for the Zvbb vector-crypto extension, which
-general framework for handling various olens proposed by Richard.
+consists of the following instructions:
-Signed-off-by: Frédéric Pétrot <frederic.petrot@univ-grenoble-alpes.fr>
+* vrol.[vv,vx]
-Co-authored-by: Fabien Portas <fabien.portas@grenoble-inp.org>
+* vror.[vv,vx,vi]
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+* vbrev8.v
-Message-id: 20220106210108.138226-13-frederic.petrot@univ-grenoble-alpes.fr
+* vrev8.v
 * vandn.[vv,vx]
 * vbrev.v
 * vclz.v
 * vctz.v
 * vcpop.v
 * vwsll.[vv,vx,vi]
 Translation functions are defined in
 `target/riscv/insn_trans/trans_rvvk.c.inc` and helpers are defined in
 `target/riscv/vcrypto_helper.c`.
 Co-authored-by: Nazar Kazakov <nazar.kazakov@codethink.co.uk>
 Co-authored-by: William Salmon <will.salmon@codethink.co.uk>
 Co-authored-by: Kiran Ostrolenk <kiran.ostrolenk@codethink.co.uk>
 [max.chou@sifive.com: Fix imm mode of vror.vi]
 Signed-off-by: Nazar Kazakov <nazar.kazakov@codethink.co.uk>
 Signed-off-by: William Salmon <will.salmon@codethink.co.uk>
 Signed-off-by: Kiran Ostrolenk <kiran.ostrolenk@codethink.co.uk>
 Signed-off-by: Dickon Hood <dickon.hood@codethink.co.uk>
 Signed-off-by: Max Chou <max.chou@sifive.com>
 Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 [max.chou@sifive.com: Exposed x-zvbb property]
 Message-ID: <20230711165917.2629866-9-max.chou@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/insn32.decode              |  10 ++
+ target/riscv/cpu_cfg.h                   |   1 +
- target/riscv/translate.c                |  58 ++++--
+ target/riscv/helper.h                    |  62 +++++++++
- target/riscv/insn_trans/trans_rvb.c.inc |  22 +--
+ target/riscv/insn32.decode               |  20 +++
- target/riscv/insn_trans/trans_rvi.c.inc | 224 ++++++++++++++++++++++--
+ target/riscv/cpu.c                       |  12 ++
-files changed, 270 insertions(+), 44 deletions(-)
+ target/riscv/vcrypto_helper.c            | 138 +++++++++++++++++++
  target/riscv/insn_trans/trans_rvvk.c.inc | 164 +++++++++++++++++++++++
 files changed, 397 insertions(+)
+diff --git a/target/riscv/cpu_cfg.h b/target/riscv/cpu_cfg.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/cpu_cfg.h
++++ b/target/riscv/cpu_cfg.h
+@@ -XXX,XX +XXX,XX @@ struct RISCVCPUConfig {
+     bool ext_zve32f;
+     bool ext_zve64f;
+     bool ext_zve64d;
++    bool ext_zvbb;
+     bool ext_zvbc;
+     bool ext_zmmul;
+     bool ext_zvfbfmin;
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/helper.h
++++ b/target/riscv/helper.h
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vclmul_vv, void, ptr, ptr, ptr, ptr, env, i32)
+ DEF_HELPER_6(vclmul_vx, void, ptr, ptr, tl, ptr, env, i32)
+ DEF_HELPER_6(vclmulh_vv, void, ptr, ptr, ptr, ptr, env, i32)
+ DEF_HELPER_6(vclmulh_vx, void, ptr, ptr, tl, ptr, env, i32)
++
++DEF_HELPER_6(vror_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vror_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vror_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vror_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++
++DEF_HELPER_6(vror_vx_b, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vror_vx_h, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vror_vx_w, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vror_vx_d, void, ptr, ptr, tl, ptr, env, i32)
++
++DEF_HELPER_6(vrol_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vrol_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vrol_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vrol_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++
++DEF_HELPER_6(vrol_vx_b, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vrol_vx_h, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vrol_vx_w, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vrol_vx_d, void, ptr, ptr, tl, ptr, env, i32)
++
++DEF_HELPER_5(vrev8_v_b, void, ptr, ptr, ptr, env, i32)
++DEF_HELPER_5(vrev8_v_h, void, ptr, ptr, ptr, env, i32)
++DEF_HELPER_5(vrev8_v_w, void, ptr, ptr, ptr, env, i32)
++DEF_HELPER_5(vrev8_v_d, void, ptr, ptr, ptr, env, i32)
++DEF_HELPER_5(vbrev8_v_b, void, ptr, ptr, ptr, env, i32)
++DEF_HELPER_5(vbrev8_v_h, void, ptr, ptr, ptr, env, i32)
++DEF_HELPER_5(vbrev8_v_w, void, ptr, ptr, ptr, env, i32)
++DEF_HELPER_5(vbrev8_v_d, void, ptr, ptr, ptr, env, i32)
++DEF_HELPER_5(vbrev_v_b, void, ptr, ptr, ptr, env, i32)
++DEF_HELPER_5(vbrev_v_h, void, ptr, ptr, ptr, env, i32)
++DEF_HELPER_5(vbrev_v_w, void, ptr, ptr, ptr, env, i32)
++DEF_HELPER_5(vbrev_v_d, void, ptr, ptr, ptr, env, i32)
++
++DEF_HELPER_5(vclz_v_b, void, ptr, ptr, ptr, env, i32)
++DEF_HELPER_5(vclz_v_h, void, ptr, ptr, ptr, env, i32)
++DEF_HELPER_5(vclz_v_w, void, ptr, ptr, ptr, env, i32)
++DEF_HELPER_5(vclz_v_d, void, ptr, ptr, ptr, env, i32)
++DEF_HELPER_5(vctz_v_b, void, ptr, ptr, ptr, env, i32)
++DEF_HELPER_5(vctz_v_h, void, ptr, ptr, ptr, env, i32)
++DEF_HELPER_5(vctz_v_w, void, ptr, ptr, ptr, env, i32)
++DEF_HELPER_5(vctz_v_d, void, ptr, ptr, ptr, env, i32)
++DEF_HELPER_5(vcpop_v_b, void, ptr, ptr, ptr, env, i32)
++DEF_HELPER_5(vcpop_v_h, void, ptr, ptr, ptr, env, i32)
++DEF_HELPER_5(vcpop_v_w, void, ptr, ptr, ptr, env, i32)
++DEF_HELPER_5(vcpop_v_d, void, ptr, ptr, ptr, env, i32)
++
++DEF_HELPER_6(vwsll_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vwsll_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vwsll_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vwsll_vx_b, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vwsll_vx_h, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vwsll_vx_w, void, ptr, ptr, tl, ptr, env, i32)
++
++DEF_HELPER_6(vandn_vv_b, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vandn_vv_h, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vandn_vv_w, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vandn_vv_d, void, ptr, ptr, ptr, ptr, env, i32)
++DEF_HELPER_6(vandn_vx_b, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vandn_vx_h, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vandn_vx_w, void, ptr, ptr, tl, ptr, env, i32)
++DEF_HELPER_6(vandn_vx_d, void, ptr, ptr, tl, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
 @@ -XXX,XX +XXX,XX @@
- %rs1       15:5
+ %imm_u    12:s20                 !function=ex_shift_12
- %rd        7:5
+ %imm_bs   30:2                   !function=ex_shift_3
- %sh5       20:5
+ %imm_rnum 20:4
-+%sh6       20:6
++%imm_z6   26:1 15:5
- %sh7    20:7
+ # Argument sets:
- %csr    20:12
+ &empty
 @@ -XXX,XX +XXX,XX @@
- # Formats 64:
+ @r_vm    ...... vm:1 ..... ..... ... ..... ....... &rmrr %rs2 %rs1 %rd
- @sh5     .......  ..... .....  ... ..... ....... &shift  shamt=%sh5      %rs1 %rd
+ @r_vm_1  ...... . ..... ..... ... ..... .......    &rmrr vm=1 %rs2 %rs1 %rd
+ @r_vm_0  ...... . ..... ..... ... ..... .......    &rmrr vm=0 %rs2 %rs1 %rd
-+# Formats 128:
++@r2_zimm6  ..... . vm:1 ..... ..... ... ..... .......  &rmrr %rs2 rs1=%imm_z6 %rd
-+@sh6       ...... ...... ..... ... ..... ....... &shift shamt=%sh6 %rs1 %rd
+ @r2_zimm11 . zimm:11  ..... ... ..... ....... %rs1 %rd
-+
+ @r2_zimm10 .. zimm:10  ..... ... ..... ....... %rs1 %rd
- # *** Privileged Instructions ***
+ @r2_s    .......   ..... ..... ... ..... ....... %rs2 %rs1
- ecall       000000000000     00000 000 00000 1110011
+@@ -XXX,XX +XXX,XX @@ vclmul_vv   001100 . ..... ..... 010 ..... 1010111 @r_vm
- ebreak      000000000001     00000 000 00000 1110011
+ vclmul_vx   001100 . ..... ..... 110 ..... 1010111 @r_vm
-@@ -XXX,XX +XXX,XX @@ sraw     0100000 .....  ..... 101 ..... 0111011 @r
+ vclmulh_vv  001101 . ..... ..... 010 ..... 1010111 @r_vm
- ldu      ............   ..... 111 ..... 0000011 @i
+ vclmulh_vx  001101 . ..... ..... 110 ..... 1010111 @r_vm
- lq       ............   ..... 010 ..... 0001111 @i
++
- sq       ............   ..... 100 ..... 0100011 @s
++# *** Zvbb vector crypto extension ***
-+sllid    000000 ......  ..... 001 ..... 1011011 @sh6
++vrol_vv     010101 . ..... ..... 000 ..... 1010111 @r_vm
-+srlid    000000 ......  ..... 101 ..... 1011011 @sh6
++vrol_vx     010101 . ..... ..... 100 ..... 1010111 @r_vm
-+sraid    010000 ......  ..... 101 ..... 1011011 @sh6
++vror_vv     010100 . ..... ..... 000 ..... 1010111 @r_vm
-+slld     0000000 ..... .....  001 ..... 1111011 @r
++vror_vx     010100 . ..... ..... 100 ..... 1010111 @r_vm
-+srld     0000000 ..... .....  101 ..... 1111011 @r
++vror_vi     01010. . ..... ..... 011 ..... 1010111 @r2_zimm6
-+srad     0100000 ..... .....  101 ..... 1111011 @r
++vbrev8_v    010010 . ..... 01000 010 ..... 1010111 @r2_vm
++vrev8_v     010010 . ..... 01001 010 ..... 1010111 @r2_vm
- # *** RV32M Standard Extension ***
++vandn_vv    000001 . ..... ..... 000 ..... 1010111 @r_vm
- mul      0000001 .....  ..... 000 ..... 0110011 @r
++vandn_vx    000001 . ..... ..... 100 ..... 1010111 @r_vm
-diff --git a/target/riscv/translate.c b/target/riscv/translate.c
++vbrev_v     010010 . ..... 01010 010 ..... 1010111 @r2_vm
 +vclz_v      010010 . ..... 01100 010 ..... 1010111 @r2_vm
 +vctz_v      010010 . ..... 01101 010 ..... 1010111 @r2_vm
 +vcpop_v     010010 . ..... 01110 010 ..... 1010111 @r2_vm
 +vwsll_vv    110101 . ..... ..... 000 ..... 1010111 @r_vm
 +vwsll_vx    110101 . ..... ..... 100 ..... 1010111 @r_vm
 +vwsll_vi    110101 . ..... ..... 011 ..... 1010111 @r_vm
 diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/translate.c
+--- a/target/riscv/cpu.c
-+++ b/target/riscv/translate.c
++++ b/target/riscv/cpu.c
-@@ -XXX,XX +XXX,XX @@ static bool gen_arith_per_ol(DisasContext *ctx, arg_r *a, DisasExtend ext,
+@@ -XXX,XX +XXX,XX @@ static const struct isa_ext_data isa_edata_arr[] = {
- }
+     ISA_EXT_DATA_ENTRY(zksed, PRIV_VERSION_1_12_0, ext_zksed),
+     ISA_EXT_DATA_ENTRY(zksh, PRIV_VERSION_1_12_0, ext_zksh),
- static bool gen_shift_imm_fn(DisasContext *ctx, arg_shift *a, DisasExtend ext,
+     ISA_EXT_DATA_ENTRY(zkt, PRIV_VERSION_1_12_0, ext_zkt),
--                             void (*func)(TCGv, TCGv, target_long))
++    ISA_EXT_DATA_ENTRY(zvbb, PRIV_VERSION_1_12_0, ext_zvbb),
-+                             void (*func)(TCGv, TCGv, target_long),
+     ISA_EXT_DATA_ENTRY(zvbc, PRIV_VERSION_1_12_0, ext_zvbc),
-+                             void (*f128)(TCGv, TCGv, TCGv, TCGv, target_long))
+     ISA_EXT_DATA_ENTRY(zve32f, PRIV_VERSION_1_10_0, ext_zve32f),
- {
+     ISA_EXT_DATA_ENTRY(zve64f, PRIV_VERSION_1_10_0, ext_zve64f),
-     TCGv dest, src1;
+@@ -XXX,XX +XXX,XX @@ void riscv_cpu_validate_set_extensions(RISCVCPU *cpu, Error **errp)
-     int max_len = get_olen(ctx);
+         return;
@@ -XXX,XX +XXX,XX @@ static bool gen_shift_imm_fn(DisasContext *ctx, arg_shift *a, DisasExtend ext,
      dest = dest_gpr(ctx, a->rd);
      src1 = get_gpr(ctx, a->rs1, ext);
 -    func(dest, src1, a->shamt);
 +    if (max_len < 128) {
 +        func(dest, src1, a->shamt);
 +        gen_set_gpr(ctx, a->rd, dest);
 +    } else {
 +        TCGv src1h = get_gprh(ctx, a->rs1);
 +        TCGv desth = dest_gprh(ctx, a->rd);
 -    gen_set_gpr(ctx, a->rd, dest);
 +        if (f128 == NULL) {
 +            return false;
 +        }
 +        f128(dest, desth, src1, src1h, a->shamt);
 +        gen_set_gpr128(ctx, a->rd, dest, desth);
 +    }
      return true;
  }
  static bool gen_shift_imm_fn_per_ol(DisasContext *ctx, arg_shift *a,
                                      DisasExtend ext,
                                      void (*f_tl)(TCGv, TCGv, target_long),
 -                                    void (*f_32)(TCGv, TCGv, target_long))
 +                                    void (*f_32)(TCGv, TCGv, target_long),
 +                                    void (*f_128)(TCGv, TCGv, TCGv, TCGv,
 +                                                  target_long))
  {
      int olen = get_olen(ctx);
      if (olen != TARGET_LONG_BITS) {
          if (olen == 32) {
              f_tl = f_32;
 -        } else {
 +        } else if (olen != 128) {
              g_assert_not_reached();
          }
      }
--    return gen_shift_imm_fn(ctx, a, ext, f_tl);
-+    return gen_shift_imm_fn(ctx, a, ext, f_tl, f_128);
++    /*
- }
++     * In principle Zve*x would also suffice here, were they supported
++     * in qemu
- static bool gen_shift_imm_tl(DisasContext *ctx, arg_shift *a, DisasExtend ext,
++     */
-@@ -XXX,XX +XXX,XX @@ static bool gen_shift_imm_tl(DisasContext *ctx, arg_shift *a, DisasExtend ext,
++    if (cpu->cfg.ext_zvbb && !cpu->cfg.ext_zve32f) {
- }
++        error_setg(errp,
++                   "Vector crypto extensions require V or Zve* extensions");
- static bool gen_shift(DisasContext *ctx, arg_r *a, DisasExtend ext,
++        return;
--                      void (*func)(TCGv, TCGv, TCGv))
++    }
-+                      void (*func)(TCGv, TCGv, TCGv),
++
-+                      void (*f128)(TCGv, TCGv, TCGv, TCGv, TCGv))
+     if (cpu->cfg.ext_zvbc && !cpu->cfg.ext_zve64f) {
- {
+         error_setg(errp, "Zvbc extension requires V or Zve64{f,d} extensions");
--    TCGv dest = dest_gpr(ctx, a->rd);
+         return;
--    TCGv src1 = get_gpr(ctx, a->rs1, ext);
+@@ -XXX,XX +XXX,XX @@ static Property riscv_cpu_extensions[] = {
-     TCGv src2 = get_gpr(ctx, a->rs2, EXT_NONE);
+     DEFINE_PROP_BOOL("x-zvfbfwma", RISCVCPU, cfg.ext_zvfbfwma, false),
-     TCGv ext2 = tcg_temp_new();
-+    int max_len = get_olen(ctx);
+     /* Vector cryptography extensions */
++    DEFINE_PROP_BOOL("x-zvbb", RISCVCPU, cfg.ext_zvbb, false),
--    tcg_gen_andi_tl(ext2, src2, get_olen(ctx) - 1);
+     DEFINE_PROP_BOOL("x-zvbc", RISCVCPU, cfg.ext_zvbc, false),
--    func(dest, src1, ext2);
-+    tcg_gen_andi_tl(ext2, src2, max_len - 1);
+     DEFINE_PROP_END_OF_LIST(),
+diff --git a/target/riscv/vcrypto_helper.c b/target/riscv/vcrypto_helper.c
 -    gen_set_gpr(ctx, a->rd, dest);
 +    TCGv dest = dest_gpr(ctx, a->rd);
 +    TCGv src1 = get_gpr(ctx, a->rs1, ext);
 +
 +    if (max_len < 128) {
 +        func(dest, src1, ext2);
 +        gen_set_gpr(ctx, a->rd, dest);
 +    } else {
 +        TCGv src1h = get_gprh(ctx, a->rs1);
 +        TCGv desth = dest_gprh(ctx, a->rd);
 +
 +        if (f128 == NULL) {
 +            return false;
 +        }
 +        f128(dest, desth, src1, src1h, ext2);
 +        gen_set_gpr128(ctx, a->rd, dest, desth);
 +    }
      tcg_temp_free(ext2);
      return true;
  }
  static bool gen_shift_per_ol(DisasContext *ctx, arg_r *a, DisasExtend ext,
                               void (*f_tl)(TCGv, TCGv, TCGv),
 -                             void (*f_32)(TCGv, TCGv, TCGv))
 +                             void (*f_32)(TCGv, TCGv, TCGv),
 +                             void (*f_128)(TCGv, TCGv, TCGv, TCGv, TCGv))
  {
      int olen = get_olen(ctx);
      if (olen != TARGET_LONG_BITS) {
          if (olen == 32) {
              f_tl = f_32;
 -        } else {
 +        } else if (olen != 128) {
              g_assert_not_reached();
          }
      }
 -    return gen_shift(ctx, a, ext, f_tl);
 +    return gen_shift(ctx, a, ext, f_tl, f_128);
  }
  static bool gen_unary(DisasContext *ctx, arg_r2 *a, DisasExtend ext,
 diff --git a/target/riscv/insn_trans/trans_rvb.c.inc b/target/riscv/insn_trans/trans_rvb.c.inc
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvb.c.inc
+--- a/target/riscv/vcrypto_helper.c
-+++ b/target/riscv/insn_trans/trans_rvb.c.inc
++++ b/target/riscv/vcrypto_helper.c
-@@ -XXX,XX +XXX,XX @@ static void gen_bset(TCGv ret, TCGv arg1, TCGv shamt)
+@@ -XXX,XX +XXX,XX @@
- static bool trans_bset(DisasContext *ctx, arg_bset *a)
+ #include "qemu/osdep.h"
- {
+ #include "qemu/host-utils.h"
-     REQUIRE_ZBS(ctx);
+ #include "qemu/bitops.h"
--    return gen_shift(ctx, a, EXT_NONE, gen_bset);
++#include "qemu/bswap.h"
-+    return gen_shift(ctx, a, EXT_NONE, gen_bset, NULL);
+ #include "cpu.h"
- }
+ #include "exec/memop.h"
+ #include "exec/exec-all.h"
- static bool trans_bseti(DisasContext *ctx, arg_bseti *a)
+@@ -XXX,XX +XXX,XX @@ RVVCALL(OPIVV2, vclmulh_vv, OP_UUU_D, H8, H8, H8, clmulh64)
-@@ -XXX,XX +XXX,XX @@ static void gen_bclr(TCGv ret, TCGv arg1, TCGv shamt)
+ GEN_VEXT_VV(vclmulh_vv, 8)
- static bool trans_bclr(DisasContext *ctx, arg_bclr *a)
+ RVVCALL(OPIVX2, vclmulh_vx, OP_UUU_D, H8, H8, clmulh64)
- {
+ GEN_VEXT_VX(vclmulh_vx, 8)
-     REQUIRE_ZBS(ctx);
++
--    return gen_shift(ctx, a, EXT_NONE, gen_bclr);
++RVVCALL(OPIVV2, vror_vv_b, OP_UUU_B, H1, H1, H1, ror8)
-+    return gen_shift(ctx, a, EXT_NONE, gen_bclr, NULL);
++RVVCALL(OPIVV2, vror_vv_h, OP_UUU_H, H2, H2, H2, ror16)
- }
++RVVCALL(OPIVV2, vror_vv_w, OP_UUU_W, H4, H4, H4, ror32)
++RVVCALL(OPIVV2, vror_vv_d, OP_UUU_D, H8, H8, H8, ror64)
- static bool trans_bclri(DisasContext *ctx, arg_bclri *a)
++GEN_VEXT_VV(vror_vv_b, 1)
-@@ -XXX,XX +XXX,XX @@ static void gen_binv(TCGv ret, TCGv arg1, TCGv shamt)
++GEN_VEXT_VV(vror_vv_h, 2)
- static bool trans_binv(DisasContext *ctx, arg_binv *a)
++GEN_VEXT_VV(vror_vv_w, 4)
- {
++GEN_VEXT_VV(vror_vv_d, 8)
-     REQUIRE_ZBS(ctx);
++
--    return gen_shift(ctx, a, EXT_NONE, gen_binv);
++RVVCALL(OPIVX2, vror_vx_b, OP_UUU_B, H1, H1, ror8)
-+    return gen_shift(ctx, a, EXT_NONE, gen_binv, NULL);
++RVVCALL(OPIVX2, vror_vx_h, OP_UUU_H, H2, H2, ror16)
- }
++RVVCALL(OPIVX2, vror_vx_w, OP_UUU_W, H4, H4, ror32)
++RVVCALL(OPIVX2, vror_vx_d, OP_UUU_D, H8, H8, ror64)
- static bool trans_binvi(DisasContext *ctx, arg_binvi *a)
++GEN_VEXT_VX(vror_vx_b, 1)
-@@ -XXX,XX +XXX,XX @@ static void gen_bext(TCGv ret, TCGv arg1, TCGv shamt)
++GEN_VEXT_VX(vror_vx_h, 2)
- static bool trans_bext(DisasContext *ctx, arg_bext *a)
++GEN_VEXT_VX(vror_vx_w, 4)
- {
++GEN_VEXT_VX(vror_vx_d, 8)
-     REQUIRE_ZBS(ctx);
++
--    return gen_shift(ctx, a, EXT_NONE, gen_bext);
++RVVCALL(OPIVV2, vrol_vv_b, OP_UUU_B, H1, H1, H1, rol8)
-+    return gen_shift(ctx, a, EXT_NONE, gen_bext, NULL);
++RVVCALL(OPIVV2, vrol_vv_h, OP_UUU_H, H2, H2, H2, rol16)
- }
++RVVCALL(OPIVV2, vrol_vv_w, OP_UUU_W, H4, H4, H4, rol32)
++RVVCALL(OPIVV2, vrol_vv_d, OP_UUU_D, H8, H8, H8, rol64)
- static bool trans_bexti(DisasContext *ctx, arg_bexti *a)
++GEN_VEXT_VV(vrol_vv_b, 1)
-@@ -XXX,XX +XXX,XX @@ static void gen_rorw(TCGv ret, TCGv arg1, TCGv arg2)
++GEN_VEXT_VV(vrol_vv_h, 2)
- static bool trans_ror(DisasContext *ctx, arg_ror *a)
++GEN_VEXT_VV(vrol_vv_w, 4)
- {
++GEN_VEXT_VV(vrol_vv_d, 8)
-     REQUIRE_ZBB(ctx);
++
--    return gen_shift_per_ol(ctx, a, EXT_NONE, tcg_gen_rotr_tl, gen_rorw);
++RVVCALL(OPIVX2, vrol_vx_b, OP_UUU_B, H1, H1, rol8)
-+    return gen_shift_per_ol(ctx, a, EXT_NONE, tcg_gen_rotr_tl, gen_rorw, NULL);
++RVVCALL(OPIVX2, vrol_vx_h, OP_UUU_H, H2, H2, rol16)
- }
++RVVCALL(OPIVX2, vrol_vx_w, OP_UUU_W, H4, H4, rol32)
++RVVCALL(OPIVX2, vrol_vx_d, OP_UUU_D, H8, H8, rol64)
- static void gen_roriw(TCGv ret, TCGv arg1, target_long shamt)
++GEN_VEXT_VX(vrol_vx_b, 1)
-@@ -XXX,XX +XXX,XX @@ static bool trans_rori(DisasContext *ctx, arg_rori *a)
++GEN_VEXT_VX(vrol_vx_h, 2)
- {
++GEN_VEXT_VX(vrol_vx_w, 4)
-     REQUIRE_ZBB(ctx);
++GEN_VEXT_VX(vrol_vx_d, 8)
-     return gen_shift_imm_fn_per_ol(ctx, a, EXT_NONE,
++
--                                   tcg_gen_rotri_tl, gen_roriw);
++static uint64_t brev8(uint64_t val)
-+                                   tcg_gen_rotri_tl, gen_roriw, NULL);
++{
- }
++    val = ((val & 0x5555555555555555ull) << 1) |
++          ((val & 0xAAAAAAAAAAAAAAAAull) >> 1);
- static void gen_rolw(TCGv ret, TCGv arg1, TCGv arg2)
++    val = ((val & 0x3333333333333333ull) << 2) |
-@@ -XXX,XX +XXX,XX @@ static void gen_rolw(TCGv ret, TCGv arg1, TCGv arg2)
++          ((val & 0xCCCCCCCCCCCCCCCCull) >> 2);
- static bool trans_rol(DisasContext *ctx, arg_rol *a)
++    val = ((val & 0x0F0F0F0F0F0F0F0Full) << 4) |
- {
++          ((val & 0xF0F0F0F0F0F0F0F0ull) >> 4);
-     REQUIRE_ZBB(ctx);
++
--    return gen_shift_per_ol(ctx, a, EXT_NONE, tcg_gen_rotl_tl, gen_rolw);
++    return val;
-+    return gen_shift_per_ol(ctx, a, EXT_NONE, tcg_gen_rotl_tl, gen_rolw, NULL);
++}
- }
++
++RVVCALL(OPIVV1, vbrev8_v_b, OP_UU_B, H1, H1, brev8)
- static void gen_rev8_32(TCGv ret, TCGv src1)
++RVVCALL(OPIVV1, vbrev8_v_h, OP_UU_H, H2, H2, brev8)
-@@ -XXX,XX +XXX,XX @@ static bool trans_rorw(DisasContext *ctx, arg_rorw *a)
++RVVCALL(OPIVV1, vbrev8_v_w, OP_UU_W, H4, H4, brev8)
-     REQUIRE_64BIT(ctx);
++RVVCALL(OPIVV1, vbrev8_v_d, OP_UU_D, H8, H8, brev8)
-     REQUIRE_ZBB(ctx);
++GEN_VEXT_V(vbrev8_v_b, 1)
-     ctx->ol = MXL_RV32;
++GEN_VEXT_V(vbrev8_v_h, 2)
--    return gen_shift(ctx, a, EXT_NONE, gen_rorw);
++GEN_VEXT_V(vbrev8_v_w, 4)
-+    return gen_shift(ctx, a, EXT_NONE, gen_rorw, NULL);
++GEN_VEXT_V(vbrev8_v_d, 8)
- }
++
++#define DO_IDENTITY(a) (a)
- static bool trans_roriw(DisasContext *ctx, arg_roriw *a)
++RVVCALL(OPIVV1, vrev8_v_b, OP_UU_B, H1, H1, DO_IDENTITY)
-@@ -XXX,XX +XXX,XX @@ static bool trans_roriw(DisasContext *ctx, arg_roriw *a)
++RVVCALL(OPIVV1, vrev8_v_h, OP_UU_H, H2, H2, bswap16)
-     REQUIRE_64BIT(ctx);
++RVVCALL(OPIVV1, vrev8_v_w, OP_UU_W, H4, H4, bswap32)
-     REQUIRE_ZBB(ctx);
++RVVCALL(OPIVV1, vrev8_v_d, OP_UU_D, H8, H8, bswap64)
-     ctx->ol = MXL_RV32;
++GEN_VEXT_V(vrev8_v_b, 1)
--    return gen_shift_imm_fn(ctx, a, EXT_NONE, gen_roriw);
++GEN_VEXT_V(vrev8_v_h, 2)
-+    return gen_shift_imm_fn(ctx, a, EXT_NONE, gen_roriw, NULL);
++GEN_VEXT_V(vrev8_v_w, 4)
- }
++GEN_VEXT_V(vrev8_v_d, 8)
++
- static bool trans_rolw(DisasContext *ctx, arg_rolw *a)
++#define DO_ANDN(a, b) ((a) & ~(b))
-@@ -XXX,XX +XXX,XX @@ static bool trans_rolw(DisasContext *ctx, arg_rolw *a)
++RVVCALL(OPIVV2, vandn_vv_b, OP_UUU_B, H1, H1, H1, DO_ANDN)
-     REQUIRE_64BIT(ctx);
++RVVCALL(OPIVV2, vandn_vv_h, OP_UUU_H, H2, H2, H2, DO_ANDN)
-     REQUIRE_ZBB(ctx);
++RVVCALL(OPIVV2, vandn_vv_w, OP_UUU_W, H4, H4, H4, DO_ANDN)
-     ctx->ol = MXL_RV32;
++RVVCALL(OPIVV2, vandn_vv_d, OP_UUU_D, H8, H8, H8, DO_ANDN)
--    return gen_shift(ctx, a, EXT_NONE, gen_rolw);
++GEN_VEXT_VV(vandn_vv_b, 1)
-+    return gen_shift(ctx, a, EXT_NONE, gen_rolw, NULL);
++GEN_VEXT_VV(vandn_vv_h, 2)
- }
++GEN_VEXT_VV(vandn_vv_w, 4)
++GEN_VEXT_VV(vandn_vv_d, 8)
- #define GEN_SHADD_UW(SHAMT)                                       \
++
-@@ -XXX,XX +XXX,XX @@ static bool trans_slli_uw(DisasContext *ctx, arg_slli_uw *a)
++RVVCALL(OPIVX2, vandn_vx_b, OP_UUU_B, H1, H1, DO_ANDN)
- {
++RVVCALL(OPIVX2, vandn_vx_h, OP_UUU_H, H2, H2, DO_ANDN)
-     REQUIRE_64BIT(ctx);
++RVVCALL(OPIVX2, vandn_vx_w, OP_UUU_W, H4, H4, DO_ANDN)
-     REQUIRE_ZBA(ctx);
++RVVCALL(OPIVX2, vandn_vx_d, OP_UUU_D, H8, H8, DO_ANDN)
--    return gen_shift_imm_fn(ctx, a, EXT_NONE, gen_slli_uw);
++GEN_VEXT_VX(vandn_vx_b, 1)
-+    return gen_shift_imm_fn(ctx, a, EXT_NONE, gen_slli_uw, NULL);
++GEN_VEXT_VX(vandn_vx_h, 2)
- }
++GEN_VEXT_VX(vandn_vx_w, 4)
++GEN_VEXT_VX(vandn_vx_d, 8)
- static bool trans_clmul(DisasContext *ctx, arg_clmul *a)
++
-diff --git a/target/riscv/insn_trans/trans_rvi.c.inc b/target/riscv/insn_trans/trans_rvi.c.inc
++RVVCALL(OPIVV1, vbrev_v_b, OP_UU_B, H1, H1, revbit8)
 +RVVCALL(OPIVV1, vbrev_v_h, OP_UU_H, H2, H2, revbit16)
 +RVVCALL(OPIVV1, vbrev_v_w, OP_UU_W, H4, H4, revbit32)
 +RVVCALL(OPIVV1, vbrev_v_d, OP_UU_D, H8, H8, revbit64)
 +GEN_VEXT_V(vbrev_v_b, 1)
 +GEN_VEXT_V(vbrev_v_h, 2)
 +GEN_VEXT_V(vbrev_v_w, 4)
 +GEN_VEXT_V(vbrev_v_d, 8)
 +
 +RVVCALL(OPIVV1, vclz_v_b, OP_UU_B, H1, H1, clz8)
 +RVVCALL(OPIVV1, vclz_v_h, OP_UU_H, H2, H2, clz16)
 +RVVCALL(OPIVV1, vclz_v_w, OP_UU_W, H4, H4, clz32)
 +RVVCALL(OPIVV1, vclz_v_d, OP_UU_D, H8, H8, clz64)
 +GEN_VEXT_V(vclz_v_b, 1)
 +GEN_VEXT_V(vclz_v_h, 2)
 +GEN_VEXT_V(vclz_v_w, 4)
 +GEN_VEXT_V(vclz_v_d, 8)
 +
 +RVVCALL(OPIVV1, vctz_v_b, OP_UU_B, H1, H1, ctz8)
 +RVVCALL(OPIVV1, vctz_v_h, OP_UU_H, H2, H2, ctz16)
 +RVVCALL(OPIVV1, vctz_v_w, OP_UU_W, H4, H4, ctz32)
 +RVVCALL(OPIVV1, vctz_v_d, OP_UU_D, H8, H8, ctz64)
 +GEN_VEXT_V(vctz_v_b, 1)
 +GEN_VEXT_V(vctz_v_h, 2)
 +GEN_VEXT_V(vctz_v_w, 4)
 +GEN_VEXT_V(vctz_v_d, 8)
 +
 +RVVCALL(OPIVV1, vcpop_v_b, OP_UU_B, H1, H1, ctpop8)
 +RVVCALL(OPIVV1, vcpop_v_h, OP_UU_H, H2, H2, ctpop16)
 +RVVCALL(OPIVV1, vcpop_v_w, OP_UU_W, H4, H4, ctpop32)
 +RVVCALL(OPIVV1, vcpop_v_d, OP_UU_D, H8, H8, ctpop64)
 +GEN_VEXT_V(vcpop_v_b, 1)
 +GEN_VEXT_V(vcpop_v_h, 2)
 +GEN_VEXT_V(vcpop_v_w, 4)
 +GEN_VEXT_V(vcpop_v_d, 8)
 +
 +#define DO_SLL(N, M) (N << (M & (sizeof(N) * 8 - 1)))
 +RVVCALL(OPIVV2, vwsll_vv_b, WOP_UUU_B, H2, H1, H1, DO_SLL)
 +RVVCALL(OPIVV2, vwsll_vv_h, WOP_UUU_H, H4, H2, H2, DO_SLL)
 +RVVCALL(OPIVV2, vwsll_vv_w, WOP_UUU_W, H8, H4, H4, DO_SLL)
 +GEN_VEXT_VV(vwsll_vv_b, 2)
 +GEN_VEXT_VV(vwsll_vv_h, 4)
 +GEN_VEXT_VV(vwsll_vv_w, 8)
 +
 +RVVCALL(OPIVX2, vwsll_vx_b, WOP_UUU_B, H2, H1, DO_SLL)
 +RVVCALL(OPIVX2, vwsll_vx_h, WOP_UUU_H, H4, H2, DO_SLL)
 +RVVCALL(OPIVX2, vwsll_vx_w, WOP_UUU_W, H8, H4, DO_SLL)
 +GEN_VEXT_VX(vwsll_vx_b, 2)
 +GEN_VEXT_VX(vwsll_vx_h, 4)
 +GEN_VEXT_VX(vwsll_vx_w, 8)
 diff --git a/target/riscv/insn_trans/trans_rvvk.c.inc b/target/riscv/insn_trans/trans_rvvk.c.inc
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvi.c.inc
+--- a/target/riscv/insn_trans/trans_rvvk.c.inc
-+++ b/target/riscv/insn_trans/trans_rvi.c.inc
++++ b/target/riscv/insn_trans/trans_rvvk.c.inc
-@@ -XXX,XX +XXX,XX @@ static bool trans_andi(DisasContext *ctx, arg_andi *a)
+@@ -XXX,XX +XXX,XX @@ static bool vclmul_vx_check(DisasContext *s, arg_rmrr *a)
-     return gen_logic_imm_fn(ctx, a, tcg_gen_andi_tl);
- }
+ GEN_VX_MASKED_TRANS(vclmul_vx, vclmul_vx_check)
+ GEN_VX_MASKED_TRANS(vclmulh_vx, vclmul_vx_check)
-+static void gen_slli_i128(TCGv retl, TCGv reth,
++
-+                          TCGv src1l, TCGv src1h,
++/*
-+                          target_long shamt)
++ * Zvbb
 + */
 +
 +#define GEN_OPIVI_GVEC_TRANS_CHECK(NAME, IMM_MODE, OPIVX, SUF, CHECK)   \
 +    static bool trans_##NAME(DisasContext *s, arg_rmrr *a)              \
 +    {                                                                   \
 +        if (CHECK(s, a)) {                                              \
 +            static gen_helper_opivx *const fns[4] = {                   \
 +                gen_helper_##OPIVX##_b,                                 \
 +                gen_helper_##OPIVX##_h,                                 \
 +                gen_helper_##OPIVX##_w,                                 \
 +                gen_helper_##OPIVX##_d,                                 \
 +            };                                                          \
 +            return do_opivi_gvec(s, a, tcg_gen_gvec_##SUF, fns[s->sew], \
 +                                 IMM_MODE);                             \
 +        }                                                               \
 +        return false;                                                   \
 +    }
 +
 +#define GEN_OPIVV_GVEC_TRANS_CHECK(NAME, SUF, CHECK)                     \
 +    static bool trans_##NAME(DisasContext *s, arg_rmrr *a)               \
 +    {                                                                    \
 +        if (CHECK(s, a)) {                                               \
 +            static gen_helper_gvec_4_ptr *const fns[4] = {               \
 +                gen_helper_##NAME##_b,                                   \
 +                gen_helper_##NAME##_h,                                   \
 +                gen_helper_##NAME##_w,                                   \
 +                gen_helper_##NAME##_d,                                   \
 +            };                                                           \
 +            return do_opivv_gvec(s, a, tcg_gen_gvec_##SUF, fns[s->sew]); \
 +        }                                                                \
 +        return false;                                                    \
 +    }
 +
 +#define GEN_OPIVX_GVEC_SHIFT_TRANS_CHECK(NAME, SUF, CHECK)       \
 +    static bool trans_##NAME(DisasContext *s, arg_rmrr *a)       \
 +    {                                                            \
 +        if (CHECK(s, a)) {                                       \
 +            static gen_helper_opivx *const fns[4] = {            \
 +                gen_helper_##NAME##_b,                           \
 +                gen_helper_##NAME##_h,                           \
 +                gen_helper_##NAME##_w,                           \
 +                gen_helper_##NAME##_d,                           \
 +            };                                                   \
 +            return do_opivx_gvec_shift(s, a, tcg_gen_gvec_##SUF, \
 +                                       fns[s->sew]);             \
 +        }                                                        \
 +        return false;                                            \
 +    }
 +
 +static bool zvbb_vv_check(DisasContext *s, arg_rmrr *a)
 +{
-+    if (shamt >= 64) {
++    return opivv_check(s, a) && s->cfg_ptr->ext_zvbb == true;
 +        tcg_gen_shli_tl(reth, src1l, shamt - 64);
 +        tcg_gen_movi_tl(retl, 0);
 +    } else {
 +        tcg_gen_extract2_tl(reth, src1l, src1h, 64 - shamt);
 +        tcg_gen_shli_tl(retl, src1l, shamt);
 +    }
 +}
 +
- static bool trans_slli(DisasContext *ctx, arg_slli *a)
++static bool zvbb_vx_check(DisasContext *s, arg_rmrr *a)
  {
 -    return gen_shift_imm_fn(ctx, a, EXT_NONE, tcg_gen_shli_tl);
 +    return gen_shift_imm_fn(ctx, a, EXT_NONE, tcg_gen_shli_tl, gen_slli_i128);
  }
  static void gen_srliw(TCGv dst, TCGv src, target_long shamt)
@@ -XXX,XX +XXX,XX @@ static void gen_srliw(TCGv dst, TCGv src, target_long shamt)
      tcg_gen_extract_tl(dst, src, shamt, 32 - shamt);
  }
 +static void gen_srli_i128(TCGv retl, TCGv reth,
 +                          TCGv src1l, TCGv src1h,
 +                          target_long shamt)
 +{
-+    if (shamt >= 64) {
++    return opivx_check(s, a) && s->cfg_ptr->ext_zvbb == true;
 +        tcg_gen_shri_tl(retl, src1h, shamt - 64);
 +        tcg_gen_movi_tl(reth, 0);
 +    } else {
 +        tcg_gen_extract2_tl(retl, src1l, src1h, shamt);
 +        tcg_gen_shri_tl(reth, src1h, shamt);
 +    }
 +}
 +
- static bool trans_srli(DisasContext *ctx, arg_srli *a)
++/* vrol.v[vx] */
- {
++GEN_OPIVV_GVEC_TRANS_CHECK(vrol_vv, rotlv, zvbb_vv_check)
-     return gen_shift_imm_fn_per_ol(ctx, a, EXT_NONE,
++GEN_OPIVX_GVEC_SHIFT_TRANS_CHECK(vrol_vx, rotls, zvbb_vx_check)
--                                   tcg_gen_shri_tl, gen_srliw);
++
-+                                   tcg_gen_shri_tl, gen_srliw, gen_srli_i128);
++/* vror.v[vxi] */
- }
++GEN_OPIVV_GVEC_TRANS_CHECK(vror_vv, rotrv, zvbb_vv_check)
++GEN_OPIVX_GVEC_SHIFT_TRANS_CHECK(vror_vx, rotrs, zvbb_vx_check)
- static void gen_sraiw(TCGv dst, TCGv src, target_long shamt)
++GEN_OPIVI_GVEC_TRANS_CHECK(vror_vi, IMM_TRUNC_SEW, vror_vx, rotri, zvbb_vx_check)
-@@ -XXX,XX +XXX,XX @@ static void gen_sraiw(TCGv dst, TCGv src, target_long shamt)
++
-     tcg_gen_sextract_tl(dst, src, shamt, 32 - shamt);
++#define GEN_OPIVX_GVEC_TRANS_CHECK(NAME, SUF, CHECK)                     \
- }
++    static bool trans_##NAME(DisasContext *s, arg_rmrr *a)               \
++    {                                                                    \
-+static void gen_srai_i128(TCGv retl, TCGv reth,
++        if (CHECK(s, a)) {                                               \
-+                          TCGv src1l, TCGv src1h,
++            static gen_helper_opivx *const fns[4] = {                    \
-+                          target_long shamt)
++                gen_helper_##NAME##_b,                                   \
 +                gen_helper_##NAME##_h,                                   \
 +                gen_helper_##NAME##_w,                                   \
 +                gen_helper_##NAME##_d,                                   \
 +            };                                                           \
 +            return do_opivx_gvec(s, a, tcg_gen_gvec_##SUF, fns[s->sew]); \
 +        }                                                                \
 +        return false;                                                    \
 +    }
 +
 +/* vandn.v[vx] */
 +GEN_OPIVV_GVEC_TRANS_CHECK(vandn_vv, andc, zvbb_vv_check)
 +GEN_OPIVX_GVEC_TRANS_CHECK(vandn_vx, andcs, zvbb_vx_check)
 +
 +#define GEN_OPIV_TRANS(NAME, CHECK)                                        \
 +    static bool trans_##NAME(DisasContext *s, arg_rmr *a)                  \
 +    {                                                                      \
 +        if (CHECK(s, a)) {                                                 \
 +            uint32_t data = 0;                                             \
 +            static gen_helper_gvec_3_ptr *const fns[4] = {                 \
 +                gen_helper_##NAME##_b,                                     \
 +                gen_helper_##NAME##_h,                                     \
 +                gen_helper_##NAME##_w,                                     \
 +                gen_helper_##NAME##_d,                                     \
 +            };                                                             \
 +            TCGLabel *over = gen_new_label();                              \
 +            tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);     \
 +                                                                           \
 +            data = FIELD_DP32(data, VDATA, VM, a->vm);                     \
 +            data = FIELD_DP32(data, VDATA, LMUL, s->lmul);                 \
 +            data = FIELD_DP32(data, VDATA, VTA, s->vta);                   \
 +            data = FIELD_DP32(data, VDATA, VTA_ALL_1S, s->cfg_vta_all_1s); \
 +            data = FIELD_DP32(data, VDATA, VMA, s->vma);                   \
 +            tcg_gen_gvec_3_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, 0),         \
 +                               vreg_ofs(s, a->rs2), cpu_env,               \
 +                               s->cfg_ptr->vlen / 8, s->cfg_ptr->vlen / 8, \
 +                               data, fns[s->sew]);                         \
 +            mark_vs_dirty(s);                                              \
 +            gen_set_label(over);                                           \
 +            return true;                                                   \
 +        }                                                                  \
 +        return false;                                                      \
 +    }
 +
 +static bool zvbb_opiv_check(DisasContext *s, arg_rmr *a)
 +{
-+    if (shamt >= 64) {
++    return s->cfg_ptr->ext_zvbb == true &&
-+        tcg_gen_sari_tl(retl, src1h, shamt - 64);
++           require_rvv(s) &&
-+        tcg_gen_sari_tl(reth, src1h, 63);
++           vext_check_isa_ill(s) &&
-+    } else {
++           vext_check_ss(s, a->rd, a->rs2, a->vm);
 +        tcg_gen_extract2_tl(retl, src1l, src1h, shamt);
 +        tcg_gen_sari_tl(reth, src1h, shamt);
 +    }
 +}
 +
- static bool trans_srai(DisasContext *ctx, arg_srai *a)
++GEN_OPIV_TRANS(vbrev8_v, zvbb_opiv_check)
- {
++GEN_OPIV_TRANS(vrev8_v, zvbb_opiv_check)
-     return gen_shift_imm_fn_per_ol(ctx, a, EXT_NONE,
++GEN_OPIV_TRANS(vbrev_v, zvbb_opiv_check)
--                                   tcg_gen_sari_tl, gen_sraiw);
++GEN_OPIV_TRANS(vclz_v, zvbb_opiv_check)
-+                                   tcg_gen_sari_tl, gen_sraiw, gen_srai_i128);
++GEN_OPIV_TRANS(vctz_v, zvbb_opiv_check)
- }
++GEN_OPIV_TRANS(vcpop_v, zvbb_opiv_check)
++
- static bool trans_add(DisasContext *ctx, arg_add *a)
++static bool vwsll_vv_check(DisasContext *s, arg_rmrr *a)
@@ -XXX,XX +XXX,XX @@ static bool trans_sub(DisasContext *ctx, arg_sub *a)
      return gen_arith(ctx, a, EXT_NONE, tcg_gen_sub_tl);
  }
 +static void gen_sll_i128(TCGv destl, TCGv desth,
 +                         TCGv src1l, TCGv src1h, TCGv shamt)
 +{
-+    TCGv ls = tcg_temp_new();
++    return s->cfg_ptr->ext_zvbb && opivv_widen_check(s, a);
 +    TCGv rs = tcg_temp_new();
 +    TCGv hs = tcg_temp_new();
 +    TCGv ll = tcg_temp_new();
 +    TCGv lr = tcg_temp_new();
 +    TCGv h0 = tcg_temp_new();
 +    TCGv h1 = tcg_temp_new();
 +    TCGv zero = tcg_constant_tl(0);
 +
 +    tcg_gen_andi_tl(hs, shamt, 64);
 +    tcg_gen_andi_tl(ls, shamt, 63);
 +    tcg_gen_neg_tl(shamt, shamt);
 +    tcg_gen_andi_tl(rs, shamt, 63);
 +
 +    tcg_gen_shl_tl(ll, src1l, ls);
 +    tcg_gen_shl_tl(h0, src1h, ls);
 +    tcg_gen_shr_tl(lr, src1l, rs);
 +    tcg_gen_movcond_tl(TCG_COND_NE, lr, shamt, zero, lr, zero);
 +    tcg_gen_or_tl(h1, h0, lr);
 +
 +    tcg_gen_movcond_tl(TCG_COND_NE, destl, hs, zero, zero, ll);
 +    tcg_gen_movcond_tl(TCG_COND_NE, desth, hs, zero, ll, h1);
 +
 +    tcg_temp_free(ls);
 +    tcg_temp_free(rs);
 +    tcg_temp_free(hs);
 +    tcg_temp_free(ll);
 +    tcg_temp_free(lr);
 +    tcg_temp_free(h0);
 +    tcg_temp_free(h1);
 +}
 +
- static bool trans_sll(DisasContext *ctx, arg_sll *a)
++static bool vwsll_vx_check(DisasContext *s, arg_rmrr *a)
  {
 -    return gen_shift(ctx, a, EXT_NONE, tcg_gen_shl_tl);
 +    return gen_shift(ctx, a, EXT_NONE, tcg_gen_shl_tl, gen_sll_i128);
  }
  static bool trans_slt(DisasContext *ctx, arg_slt *a)
@@ -XXX,XX +XXX,XX @@ static bool trans_sltu(DisasContext *ctx, arg_sltu *a)
      return gen_arith(ctx, a, EXT_SIGN, gen_sltu);
  }
 +static void gen_srl_i128(TCGv destl, TCGv desth,
 +                         TCGv src1l, TCGv src1h, TCGv shamt)
 +{
-+    TCGv ls = tcg_temp_new();
++    return s->cfg_ptr->ext_zvbb && opivx_widen_check(s, a);
 +    TCGv rs = tcg_temp_new();
 +    TCGv hs = tcg_temp_new();
 +    TCGv ll = tcg_temp_new();
 +    TCGv lr = tcg_temp_new();
 +    TCGv h0 = tcg_temp_new();
 +    TCGv h1 = tcg_temp_new();
 +    TCGv zero = tcg_constant_tl(0);
 +
 +    tcg_gen_andi_tl(hs, shamt, 64);
 +    tcg_gen_andi_tl(rs, shamt, 63);
 +    tcg_gen_neg_tl(shamt, shamt);
 +    tcg_gen_andi_tl(ls, shamt, 63);
 +
 +    tcg_gen_shr_tl(lr, src1l, rs);
 +    tcg_gen_shr_tl(h1, src1h, rs);
 +    tcg_gen_shl_tl(ll, src1h, ls);
 +    tcg_gen_movcond_tl(TCG_COND_NE, ll, shamt, zero, ll, zero);
 +    tcg_gen_or_tl(h0, ll, lr);
 +
 +    tcg_gen_movcond_tl(TCG_COND_NE, destl, hs, zero, h1, h0);
 +    tcg_gen_movcond_tl(TCG_COND_NE, desth, hs, zero, zero, h1);
 +
 +    tcg_temp_free(ls);
 +    tcg_temp_free(rs);
 +    tcg_temp_free(hs);
 +    tcg_temp_free(ll);
 +    tcg_temp_free(lr);
 +    tcg_temp_free(h0);
 +    tcg_temp_free(h1);
 +}
 +
- static bool trans_srl(DisasContext *ctx, arg_srl *a)
++/* OPIVI without GVEC IR */
- {
++#define GEN_OPIVI_WIDEN_TRANS(NAME, IMM_MODE, OPIVX, CHECK)                  \
--    return gen_shift(ctx, a, EXT_ZERO, tcg_gen_shr_tl);
++    static bool trans_##NAME(DisasContext *s, arg_rmrr *a)                   \
-+    return gen_shift(ctx, a, EXT_ZERO, tcg_gen_shr_tl, gen_srl_i128);
++    {                                                                        \
-+}
++        if (CHECK(s, a)) {                                                   \
-+
++            static gen_helper_opivx *const fns[3] = {                        \
-+static void gen_sra_i128(TCGv destl, TCGv desth,
++                gen_helper_##OPIVX##_b,                                      \
-+                         TCGv src1l, TCGv src1h, TCGv shamt)
++                gen_helper_##OPIVX##_h,                                      \
-+{
++                gen_helper_##OPIVX##_w,                                      \
-+    TCGv ls = tcg_temp_new();
++            };                                                               \
-+    TCGv rs = tcg_temp_new();
++            return opivi_trans(a->rd, a->rs1, a->rs2, a->vm, fns[s->sew], s, \
-+    TCGv hs = tcg_temp_new();
++                               IMM_MODE);                                    \
-+    TCGv ll = tcg_temp_new();
++        }                                                                    \
-+    TCGv lr = tcg_temp_new();
++        return false;                                                        \
-+    TCGv h0 = tcg_temp_new();
++    }
-+    TCGv h1 = tcg_temp_new();
++
-+    TCGv zero = tcg_constant_tl(0);
++GEN_OPIVV_WIDEN_TRANS(vwsll_vv, vwsll_vv_check)
-+
++GEN_OPIVX_WIDEN_TRANS(vwsll_vx, vwsll_vx_check)
-+    tcg_gen_andi_tl(hs, shamt, 64);
++GEN_OPIVI_WIDEN_TRANS(vwsll_vi, IMM_ZX, vwsll_vx, vwsll_vx_check)
 +    tcg_gen_andi_tl(rs, shamt, 63);
 +    tcg_gen_neg_tl(shamt, shamt);
 +    tcg_gen_andi_tl(ls, shamt, 63);
 +
 +    tcg_gen_shr_tl(lr, src1l, rs);
 +    tcg_gen_sar_tl(h1, src1h, rs);
 +    tcg_gen_shl_tl(ll, src1h, ls);
 +    tcg_gen_movcond_tl(TCG_COND_NE, ll, shamt, zero, ll, zero);
 +    tcg_gen_or_tl(h0, ll, lr);
 +    tcg_gen_sari_tl(lr, src1h, 63);
 +
 +    tcg_gen_movcond_tl(TCG_COND_NE, destl, hs, zero, h1, h0);
 +    tcg_gen_movcond_tl(TCG_COND_NE, desth, hs, zero, lr, h1);
 +
 +    tcg_temp_free(ls);
 +    tcg_temp_free(rs);
 +    tcg_temp_free(hs);
 +    tcg_temp_free(ll);
 +    tcg_temp_free(lr);
 +    tcg_temp_free(h0);
 +    tcg_temp_free(h1);
  }
  static bool trans_sra(DisasContext *ctx, arg_sra *a)
  {
 -    return gen_shift(ctx, a, EXT_SIGN, tcg_gen_sar_tl);
 +    return gen_shift(ctx, a, EXT_SIGN, tcg_gen_sar_tl, gen_sra_i128);
  }
  static bool trans_xor(DisasContext *ctx, arg_xor *a)
@@ -XXX,XX +XXX,XX @@ static bool trans_addiw(DisasContext *ctx, arg_addiw *a)
  static bool trans_slliw(DisasContext *ctx, arg_slliw *a)
  {
 -    REQUIRE_64BIT(ctx);
 +    REQUIRE_64_OR_128BIT(ctx);
      ctx->ol = MXL_RV32;
 -    return gen_shift_imm_fn(ctx, a, EXT_NONE, tcg_gen_shli_tl);
 +    return gen_shift_imm_fn(ctx, a, EXT_NONE, tcg_gen_shli_tl, NULL);
  }
  static bool trans_srliw(DisasContext *ctx, arg_srliw *a)
  {
 -    REQUIRE_64BIT(ctx);
 +    REQUIRE_64_OR_128BIT(ctx);
      ctx->ol = MXL_RV32;
 -    return gen_shift_imm_fn(ctx, a, EXT_NONE, gen_srliw);
 +    return gen_shift_imm_fn(ctx, a, EXT_NONE, gen_srliw, NULL);
  }
  static bool trans_sraiw(DisasContext *ctx, arg_sraiw *a)
  {
 -    REQUIRE_64BIT(ctx);
 +    REQUIRE_64_OR_128BIT(ctx);
      ctx->ol = MXL_RV32;
 -    return gen_shift_imm_fn(ctx, a, EXT_NONE, gen_sraiw);
 +    return gen_shift_imm_fn(ctx, a, EXT_NONE, gen_sraiw, NULL);
 +}
 +
 +static bool trans_sllid(DisasContext *ctx, arg_sllid *a)
 +{
 +    REQUIRE_128BIT(ctx);
 +    ctx->ol = MXL_RV64;
 +    return gen_shift_imm_fn(ctx, a, EXT_NONE, tcg_gen_shli_tl, NULL);
 +}
 +
 +static bool trans_srlid(DisasContext *ctx, arg_srlid *a)
 +{
 +    REQUIRE_128BIT(ctx);
 +    ctx->ol = MXL_RV64;
 +    return gen_shift_imm_fn(ctx, a, EXT_NONE, tcg_gen_shri_tl, NULL);
 +}
 +
 +static bool trans_sraid(DisasContext *ctx, arg_sraid *a)
 +{
 +    REQUIRE_128BIT(ctx);
 +    ctx->ol = MXL_RV64;
 +    return gen_shift_imm_fn(ctx, a, EXT_NONE, tcg_gen_sari_tl,  NULL);
  }
  static bool trans_addw(DisasContext *ctx, arg_addw *a)
@@ -XXX,XX +XXX,XX @@ static bool trans_subw(DisasContext *ctx, arg_subw *a)
  static bool trans_sllw(DisasContext *ctx, arg_sllw *a)
  {
 -    REQUIRE_64BIT(ctx);
 +    REQUIRE_64_OR_128BIT(ctx);
      ctx->ol = MXL_RV32;
 -    return gen_shift(ctx, a, EXT_NONE, tcg_gen_shl_tl);
 +    return gen_shift(ctx, a, EXT_NONE, tcg_gen_shl_tl, NULL);
  }
  static bool trans_srlw(DisasContext *ctx, arg_srlw *a)
  {
 -    REQUIRE_64BIT(ctx);
 +    REQUIRE_64_OR_128BIT(ctx);
      ctx->ol = MXL_RV32;
 -    return gen_shift(ctx, a, EXT_ZERO, tcg_gen_shr_tl);
 +    return gen_shift(ctx, a, EXT_ZERO, tcg_gen_shr_tl, NULL);
  }
  static bool trans_sraw(DisasContext *ctx, arg_sraw *a)
  {
 -    REQUIRE_64BIT(ctx);
 +    REQUIRE_64_OR_128BIT(ctx);
      ctx->ol = MXL_RV32;
 -    return gen_shift(ctx, a, EXT_SIGN, tcg_gen_sar_tl);
 +    return gen_shift(ctx, a, EXT_SIGN, tcg_gen_sar_tl, NULL);
 +}
 +
 +static bool trans_slld(DisasContext *ctx, arg_slld *a)
 +{
 +    REQUIRE_128BIT(ctx);
 +    ctx->ol = MXL_RV64;
 +    return gen_shift(ctx, a, EXT_NONE, tcg_gen_shl_tl, NULL);
  }
 +static bool trans_srld(DisasContext *ctx, arg_srld *a)
 +{
 +    REQUIRE_128BIT(ctx);
 +    ctx->ol = MXL_RV64;
 +    return gen_shift(ctx, a, EXT_ZERO, tcg_gen_shr_tl, NULL);
 +}
 +
 +static bool trans_srad(DisasContext *ctx, arg_srad *a)
 +{
 +    REQUIRE_128BIT(ctx);
 +    ctx->ol = MXL_RV64;
 +    return gen_shift(ctx, a, EXT_SIGN, tcg_gen_sar_tl, NULL);
 +}
 +
 +
  static bool trans_fence(DisasContext *ctx, arg_fence *a)
  {
      /* FENCE is a full memory barrier. */
 --
-.31.1
+.41.0

-New patch
+[PULL v2 16/45] target/riscv: Add Zvkned ISA extension support
+From: Nazar Kazakov <nazar.kazakov@codethink.co.uk>
+This commit adds support for the Zvkned vector-crypto extension, which
+consists of the following instructions:
+* vaesef.[vv,vs]
+* vaesdf.[vv,vs]
+* vaesdm.[vv,vs]
+* vaesz.vs
+* vaesem.[vv,vs]
+* vaeskf1.vi
+* vaeskf2.vi
+Translation functions are defined in
+`target/riscv/insn_trans/trans_rvvk.c.inc` and helpers are defined in
+`target/riscv/vcrypto_helper.c`.
+Co-authored-by: Lawrence Hunter <lawrence.hunter@codethink.co.uk>
+Co-authored-by: William Salmon <will.salmon@codethink.co.uk>
+[max.chou@sifive.com: Replaced vstart checking by TCG op]
+Signed-off-by: Lawrence Hunter <lawrence.hunter@codethink.co.uk>
+Signed-off-by: William Salmon <will.salmon@codethink.co.uk>
+Signed-off-by: Nazar Kazakov <nazar.kazakov@codethink.co.uk>
+Signed-off-by: Max Chou <max.chou@sifive.com>
+Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
+[max.chou@sifive.com: Imported aes-round.h and exposed x-zvkned
+property]
+[max.chou@sifive.com: Fixed endian issues and replaced the vstart & vl
+egs checking by helper function]
+[max.chou@sifive.com: Replaced bswap32 calls in aes key expanding]
+Message-ID: <20230711165917.2629866-10-max.chou@sifive.com>
+Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
+---
+ target/riscv/cpu_cfg.h                   |   1 +
+ target/riscv/helper.h                    |  14 ++
+ target/riscv/insn32.decode               |  14 ++
+ target/riscv/cpu.c                       |   4 +-
+ target/riscv/vcrypto_helper.c            | 202 +++++++++++++++++++++++
+ target/riscv/insn_trans/trans_rvvk.c.inc | 147 +++++++++++++++++
+files changed, 381 insertions(+), 1 deletion(-)
+diff --git a/target/riscv/cpu_cfg.h b/target/riscv/cpu_cfg.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/cpu_cfg.h
++++ b/target/riscv/cpu_cfg.h
+@@ -XXX,XX +XXX,XX @@ struct RISCVCPUConfig {
+     bool ext_zve64d;
+     bool ext_zvbb;
+     bool ext_zvbc;
++    bool ext_zvkned;
+     bool ext_zmmul;
+     bool ext_zvfbfmin;
+     bool ext_zvfbfwma;
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/helper.h
++++ b/target/riscv/helper.h
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_6(vandn_vx_b, void, ptr, ptr, tl, ptr, env, i32)
+ DEF_HELPER_6(vandn_vx_h, void, ptr, ptr, tl, ptr, env, i32)
+ DEF_HELPER_6(vandn_vx_w, void, ptr, ptr, tl, ptr, env, i32)
+ DEF_HELPER_6(vandn_vx_d, void, ptr, ptr, tl, ptr, env, i32)
++
++DEF_HELPER_2(egs_check, void, i32, env)
++
++DEF_HELPER_4(vaesef_vv, void, ptr, ptr, env, i32)
++DEF_HELPER_4(vaesef_vs, void, ptr, ptr, env, i32)
++DEF_HELPER_4(vaesdf_vv, void, ptr, ptr, env, i32)
++DEF_HELPER_4(vaesdf_vs, void, ptr, ptr, env, i32)
++DEF_HELPER_4(vaesem_vv, void, ptr, ptr, env, i32)
++DEF_HELPER_4(vaesem_vs, void, ptr, ptr, env, i32)
++DEF_HELPER_4(vaesdm_vv, void, ptr, ptr, env, i32)
++DEF_HELPER_4(vaesdm_vs, void, ptr, ptr, env, i32)
++DEF_HELPER_4(vaesz_vs, void, ptr, ptr, env, i32)
++DEF_HELPER_5(vaeskf1_vi, void, ptr, ptr, i32, env, i32)
++DEF_HELPER_5(vaeskf2_vi, void, ptr, ptr, i32, env, i32)
+diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn32.decode
++++ b/target/riscv/insn32.decode
+@@ -XXX,XX +XXX,XX @@
+ @r_rm    .......   ..... ..... ... ..... ....... %rs2 %rs1 %rm %rd
+ @r2_rm   .......   ..... ..... ... ..... ....... %rs1 %rm %rd
+ @r2      .......   ..... ..... ... ..... ....... &r2 %rs1 %rd
++@r2_vm_1 ...... . ..... ..... ... ..... ....... &rmr vm=1 %rs2 %rd
+ @r2_nfvm ... ... vm:1 ..... ..... ... ..... ....... &r2nfvm %nf %rs1 %rd
+ @r2_vm   ...... vm:1 ..... ..... ... ..... ....... &rmr %rs2 %rd
+ @r1_vm   ...... vm:1 ..... ..... ... ..... ....... %rd
+@@ -XXX,XX +XXX,XX @@ vcpop_v     010010 . ..... 01110 010 ..... 1010111 @r2_vm
+ vwsll_vv    110101 . ..... ..... 000 ..... 1010111 @r_vm
+ vwsll_vx    110101 . ..... ..... 100 ..... 1010111 @r_vm
+ vwsll_vi    110101 . ..... ..... 011 ..... 1010111 @r_vm
++
++# *** Zvkned vector crypto extension ***
++vaesef_vv   101000 1 ..... 00011 010 ..... 1110111 @r2_vm_1
++vaesef_vs   101001 1 ..... 00011 010 ..... 1110111 @r2_vm_1
++vaesdf_vv   101000 1 ..... 00001 010 ..... 1110111 @r2_vm_1
++vaesdf_vs   101001 1 ..... 00001 010 ..... 1110111 @r2_vm_1
++vaesem_vv   101000 1 ..... 00010 010 ..... 1110111 @r2_vm_1
++vaesem_vs   101001 1 ..... 00010 010 ..... 1110111 @r2_vm_1
++vaesdm_vv   101000 1 ..... 00000 010 ..... 1110111 @r2_vm_1
++vaesdm_vs   101001 1 ..... 00000 010 ..... 1110111 @r2_vm_1
++vaesz_vs    101001 1 ..... 00111 010 ..... 1110111 @r2_vm_1
++vaeskf1_vi  100010 1 ..... ..... 010 ..... 1110111 @r_vm_1
++vaeskf2_vi  101010 1 ..... ..... 010 ..... 1110111 @r_vm_1
+diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/cpu.c
++++ b/target/riscv/cpu.c
+@@ -XXX,XX +XXX,XX @@ static const struct isa_ext_data isa_edata_arr[] = {
+     ISA_EXT_DATA_ENTRY(zvfbfwma, PRIV_VERSION_1_12_0, ext_zvfbfwma),
+     ISA_EXT_DATA_ENTRY(zvfh, PRIV_VERSION_1_12_0, ext_zvfh),
+     ISA_EXT_DATA_ENTRY(zvfhmin, PRIV_VERSION_1_12_0, ext_zvfhmin),
++    ISA_EXT_DATA_ENTRY(zvkned, PRIV_VERSION_1_12_0, ext_zvkned),
+     ISA_EXT_DATA_ENTRY(zhinx, PRIV_VERSION_1_12_0, ext_zhinx),
+     ISA_EXT_DATA_ENTRY(zhinxmin, PRIV_VERSION_1_12_0, ext_zhinxmin),
+     ISA_EXT_DATA_ENTRY(smaia, PRIV_VERSION_1_12_0, ext_smaia),
+@@ -XXX,XX +XXX,XX @@ void riscv_cpu_validate_set_extensions(RISCVCPU *cpu, Error **errp)
+      * In principle Zve*x would also suffice here, were they supported
+      * in qemu
+      */
+-    if (cpu->cfg.ext_zvbb && !cpu->cfg.ext_zve32f) {
++    if ((cpu->cfg.ext_zvbb || cpu->cfg.ext_zvkned) && !cpu->cfg.ext_zve32f) {
+         error_setg(errp,
+                    "Vector crypto extensions require V or Zve* extensions");
+         return;
+@@ -XXX,XX +XXX,XX @@ static Property riscv_cpu_extensions[] = {
+     /* Vector cryptography extensions */
+     DEFINE_PROP_BOOL("x-zvbb", RISCVCPU, cfg.ext_zvbb, false),
+     DEFINE_PROP_BOOL("x-zvbc", RISCVCPU, cfg.ext_zvbc, false),
++    DEFINE_PROP_BOOL("x-zvkned", RISCVCPU, cfg.ext_zvkned, false),
+     DEFINE_PROP_END_OF_LIST(),
+ };
+diff --git a/target/riscv/vcrypto_helper.c b/target/riscv/vcrypto_helper.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/vcrypto_helper.c
++++ b/target/riscv/vcrypto_helper.c
+@@ -XXX,XX +XXX,XX @@
+ #include "qemu/bitops.h"
+ #include "qemu/bswap.h"
+ #include "cpu.h"
++#include "crypto/aes.h"
++#include "crypto/aes-round.h"
+ #include "exec/memop.h"
+ #include "exec/exec-all.h"
+ #include "exec/helper-proto.h"
+@@ -XXX,XX +XXX,XX @@ RVVCALL(OPIVX2, vwsll_vx_w, WOP_UUU_W, H8, H4, DO_SLL)
+ GEN_VEXT_VX(vwsll_vx_b, 2)
+ GEN_VEXT_VX(vwsll_vx_h, 4)
+ GEN_VEXT_VX(vwsll_vx_w, 8)
++
++void HELPER(egs_check)(uint32_t egs, CPURISCVState *env)
++{
++    uint32_t vl = env->vl;
++    uint32_t vstart = env->vstart;
++
++    if (vl % egs != 0 || vstart % egs != 0) {
++        riscv_raise_exception(env, RISCV_EXCP_ILLEGAL_INST, GETPC());
++    }
++}
++
++static inline void xor_round_key(AESState *round_state, AESState *round_key)
++{
++    round_state->v = round_state->v ^ round_key->v;
++}
++
++#define GEN_ZVKNED_HELPER_VV(NAME, ...)                                   \
++    void HELPER(NAME)(void *vd, void *vs2, CPURISCVState *env,            \
++                      uint32_t desc)                                      \
++    {                                                                     \
++        uint32_t vl = env->vl;                                            \
++        uint32_t total_elems = vext_get_total_elems(env, desc, 4);        \
++        uint32_t vta = vext_vta(desc);                                    \
++                                                                          \
++        for (uint32_t i = env->vstart / 4; i < env->vl / 4; i++) {        \
++            AESState round_key;                                           \
++            round_key.d[0] = *((uint64_t *)vs2 + H8(i * 2 + 0));          \
++            round_key.d[1] = *((uint64_t *)vs2 + H8(i * 2 + 1));          \
++            AESState round_state;                                         \
++            round_state.d[0] = *((uint64_t *)vd + H8(i * 2 + 0));         \
++            round_state.d[1] = *((uint64_t *)vd + H8(i * 2 + 1));         \
++            __VA_ARGS__;                                                  \
++            *((uint64_t *)vd + H8(i * 2 + 0)) = round_state.d[0];         \
++            *((uint64_t *)vd + H8(i * 2 + 1)) = round_state.d[1];         \
++        }                                                                 \
++        env->vstart = 0;                                                  \
++        /* set tail elements to 1s */                                     \
++        vext_set_elems_1s(vd, vta, vl * 4, total_elems * 4);              \
++    }
++
++#define GEN_ZVKNED_HELPER_VS(NAME, ...)                                   \
++    void HELPER(NAME)(void *vd, void *vs2, CPURISCVState *env,            \
++                      uint32_t desc)                                      \
++    {                                                                     \
++        uint32_t vl = env->vl;                                            \
++        uint32_t total_elems = vext_get_total_elems(env, desc, 4);        \
++        uint32_t vta = vext_vta(desc);                                    \
++                                                                          \
++        for (uint32_t i = env->vstart / 4; i < env->vl / 4; i++) {        \
++            AESState round_key;                                           \
++            round_key.d[0] = *((uint64_t *)vs2 + H8(0));                  \
++            round_key.d[1] = *((uint64_t *)vs2 + H8(1));                  \
++            AESState round_state;                                         \
++            round_state.d[0] = *((uint64_t *)vd + H8(i * 2 + 0));         \
++            round_state.d[1] = *((uint64_t *)vd + H8(i * 2 + 1));         \
++            __VA_ARGS__;                                                  \
++            *((uint64_t *)vd + H8(i * 2 + 0)) = round_state.d[0];         \
++            *((uint64_t *)vd + H8(i * 2 + 1)) = round_state.d[1];         \
++        }                                                                 \
++        env->vstart = 0;                                                  \
++        /* set tail elements to 1s */                                     \
++        vext_set_elems_1s(vd, vta, vl * 4, total_elems * 4);              \
++    }
++
++GEN_ZVKNED_HELPER_VV(vaesef_vv, aesenc_SB_SR_AK(&round_state,
++                                                &round_state,
++                                                &round_key,
++                                                false);)
++GEN_ZVKNED_HELPER_VS(vaesef_vs, aesenc_SB_SR_AK(&round_state,
++                                                &round_state,
++                                                &round_key,
++                                                false);)
++GEN_ZVKNED_HELPER_VV(vaesdf_vv, aesdec_ISB_ISR_AK(&round_state,
++                                                  &round_state,
++                                                  &round_key,
++                                                  false);)
++GEN_ZVKNED_HELPER_VS(vaesdf_vs, aesdec_ISB_ISR_AK(&round_state,
++                                                  &round_state,
++                                                  &round_key,
++                                                  false);)
++GEN_ZVKNED_HELPER_VV(vaesem_vv, aesenc_SB_SR_MC_AK(&round_state,
++                                                   &round_state,
++                                                   &round_key,
++                                                   false);)
++GEN_ZVKNED_HELPER_VS(vaesem_vs, aesenc_SB_SR_MC_AK(&round_state,
++                                                   &round_state,
++                                                   &round_key,
++                                                   false);)
++GEN_ZVKNED_HELPER_VV(vaesdm_vv, aesdec_ISB_ISR_AK_IMC(&round_state,
++                                                      &round_state,
++                                                      &round_key,
++                                                      false);)
++GEN_ZVKNED_HELPER_VS(vaesdm_vs, aesdec_ISB_ISR_AK_IMC(&round_state,
++                                                      &round_state,
++                                                      &round_key,
++                                                      false);)
++GEN_ZVKNED_HELPER_VS(vaesz_vs, xor_round_key(&round_state, &round_key);)
++
++void HELPER(vaeskf1_vi)(void *vd_vptr, void *vs2_vptr, uint32_t uimm,
++                        CPURISCVState *env, uint32_t desc)
++{
++    uint32_t *vd = vd_vptr;
++    uint32_t *vs2 = vs2_vptr;
++    uint32_t vl = env->vl;
++    uint32_t total_elems = vext_get_total_elems(env, desc, 4);
++    uint32_t vta = vext_vta(desc);
++
++    uimm &= 0b1111;
++    if (uimm > 10 || uimm == 0) {
++        uimm ^= 0b1000;
++    }
++
++    for (uint32_t i = env->vstart / 4; i < env->vl / 4; i++) {
++        uint32_t rk[8], tmp;
++        static const uint32_t rcon[] = {
++            0x00000001, 0x00000002, 0x00000004, 0x00000008, 0x00000010,
++            0x00000020, 0x00000040, 0x00000080, 0x0000001B, 0x00000036,
++        };
++
++        rk[0] = vs2[i * 4 + H4(0)];
++        rk[1] = vs2[i * 4 + H4(1)];
++        rk[2] = vs2[i * 4 + H4(2)];
++        rk[3] = vs2[i * 4 + H4(3)];
++        tmp = ror32(rk[3], 8);
++
++        rk[4] = rk[0] ^ (((uint32_t)AES_sbox[(tmp >> 24) & 0xff] << 24) |
++                         ((uint32_t)AES_sbox[(tmp >> 16) & 0xff] << 16) |
++                         ((uint32_t)AES_sbox[(tmp >> 8) & 0xff] << 8) |
++                         ((uint32_t)AES_sbox[(tmp >> 0) & 0xff] << 0))
++                      ^ rcon[uimm - 1];
++        rk[5] = rk[1] ^ rk[4];
++        rk[6] = rk[2] ^ rk[5];
++        rk[7] = rk[3] ^ rk[6];
++
++        vd[i * 4 + H4(0)] = rk[4];
++        vd[i * 4 + H4(1)] = rk[5];
++        vd[i * 4 + H4(2)] = rk[6];
++        vd[i * 4 + H4(3)] = rk[7];
++    }
++    env->vstart = 0;
++    /* set tail elements to 1s */
++    vext_set_elems_1s(vd, vta, vl * 4, total_elems * 4);
++}
++
++void HELPER(vaeskf2_vi)(void *vd_vptr, void *vs2_vptr, uint32_t uimm,
++                        CPURISCVState *env, uint32_t desc)
++{
++    uint32_t *vd = vd_vptr;
++    uint32_t *vs2 = vs2_vptr;
++    uint32_t vl = env->vl;
++    uint32_t total_elems = vext_get_total_elems(env, desc, 4);
++    uint32_t vta = vext_vta(desc);
++
++    uimm &= 0b1111;
++    if (uimm > 14 || uimm < 2) {
++        uimm ^= 0b1000;
++    }
++
++    for (uint32_t i = env->vstart / 4; i < env->vl / 4; i++) {
++        uint32_t rk[12], tmp;
++        static const uint32_t rcon[] = {
++            0x00000001, 0x00000002, 0x00000004, 0x00000008, 0x00000010,
++            0x00000020, 0x00000040, 0x00000080, 0x0000001B, 0x00000036,
++        };
++
++        rk[0] = vd[i * 4 + H4(0)];
++        rk[1] = vd[i * 4 + H4(1)];
++        rk[2] = vd[i * 4 + H4(2)];
++        rk[3] = vd[i * 4 + H4(3)];
++        rk[4] = vs2[i * 4 + H4(0)];
++        rk[5] = vs2[i * 4 + H4(1)];
++        rk[6] = vs2[i * 4 + H4(2)];
++        rk[7] = vs2[i * 4 + H4(3)];
++
++        if (uimm % 2 == 0) {
++            tmp = ror32(rk[7], 8);
++            rk[8] = rk[0] ^ (((uint32_t)AES_sbox[(tmp >> 24) & 0xff] << 24) |
++                             ((uint32_t)AES_sbox[(tmp >> 16) & 0xff] << 16) |
++                             ((uint32_t)AES_sbox[(tmp >> 8) & 0xff] << 8) |
++                             ((uint32_t)AES_sbox[(tmp >> 0) & 0xff] << 0))
++                          ^ rcon[(uimm - 1) / 2];
++        } else {
++            rk[8] = rk[0] ^ (((uint32_t)AES_sbox[(rk[7] >> 24) & 0xff] << 24) |
++                             ((uint32_t)AES_sbox[(rk[7] >> 16) & 0xff] << 16) |
++                             ((uint32_t)AES_sbox[(rk[7] >> 8) & 0xff] << 8) |
++                             ((uint32_t)AES_sbox[(rk[7] >> 0) & 0xff] << 0));
++        }
++        rk[9] = rk[1] ^ rk[8];
++        rk[10] = rk[2] ^ rk[9];
++        rk[11] = rk[3] ^ rk[10];
++
++        vd[i * 4 + H4(0)] = rk[8];
++        vd[i * 4 + H4(1)] = rk[9];
++        vd[i * 4 + H4(2)] = rk[10];
++        vd[i * 4 + H4(3)] = rk[11];
++    }
++    env->vstart = 0;
++    /* set tail elements to 1s */
++    vext_set_elems_1s(vd, vta, vl * 4, total_elems * 4);
++}
+diff --git a/target/riscv/insn_trans/trans_rvvk.c.inc b/target/riscv/insn_trans/trans_rvvk.c.inc
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/insn_trans/trans_rvvk.c.inc
++++ b/target/riscv/insn_trans/trans_rvvk.c.inc
+@@ -XXX,XX +XXX,XX @@ static bool vwsll_vx_check(DisasContext *s, arg_rmrr *a)
+ GEN_OPIVV_WIDEN_TRANS(vwsll_vv, vwsll_vv_check)
+ GEN_OPIVX_WIDEN_TRANS(vwsll_vx, vwsll_vx_check)
+ GEN_OPIVI_WIDEN_TRANS(vwsll_vi, IMM_ZX, vwsll_vx, vwsll_vx_check)
++
++/*
++ * Zvkned
++ */
++
++#define ZVKNED_EGS 4
++
++#define GEN_V_UNMASKED_TRANS(NAME, CHECK, EGS)                                \
++    static bool trans_##NAME(DisasContext *s, arg_##NAME *a)                  \
++    {                                                                         \
++        if (CHECK(s, a)) {                                                    \
++            TCGv_ptr rd_v, rs2_v;                                             \
++            TCGv_i32 desc, egs;                                               \
++            uint32_t data = 0;                                                \
++            TCGLabel *over = gen_new_label();                                 \
++                                                                              \
++            if (!s->vstart_eq_zero || !s->vl_eq_vlmax) {                      \
++                /* save opcode for unwinding in case we throw an exception */ \
++                decode_save_opc(s);                                           \
++                egs = tcg_constant_i32(EGS);                                  \
++                gen_helper_egs_check(egs, cpu_env);                           \
++                tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);    \
++            }                                                                 \
++                                                                              \
++            data = FIELD_DP32(data, VDATA, VM, a->vm);                        \
++            data = FIELD_DP32(data, VDATA, LMUL, s->lmul);                    \
++            data = FIELD_DP32(data, VDATA, VTA, s->vta);                      \
++            data = FIELD_DP32(data, VDATA, VTA_ALL_1S, s->cfg_vta_all_1s);    \
++            data = FIELD_DP32(data, VDATA, VMA, s->vma);                      \
++            rd_v = tcg_temp_new_ptr();                                        \
++            rs2_v = tcg_temp_new_ptr();                                       \
++            desc = tcg_constant_i32(                                          \
++                simd_desc(s->cfg_ptr->vlen / 8, s->cfg_ptr->vlen / 8, data)); \
++            tcg_gen_addi_ptr(rd_v, cpu_env, vreg_ofs(s, a->rd));              \
++            tcg_gen_addi_ptr(rs2_v, cpu_env, vreg_ofs(s, a->rs2));            \
++            gen_helper_##NAME(rd_v, rs2_v, cpu_env, desc);                    \
++            mark_vs_dirty(s);                                                 \
++            gen_set_label(over);                                              \
++            return true;                                                      \
++        }                                                                     \
++        return false;                                                         \
++    }
++
++static bool vaes_check_vv(DisasContext *s, arg_rmr *a)
++{
++    int egw_bytes = ZVKNED_EGS << s->sew;
++    return s->cfg_ptr->ext_zvkned == true &&
++           require_rvv(s) &&
++           vext_check_isa_ill(s) &&
++           MAXSZ(s) >= egw_bytes &&
++           require_align(a->rd, s->lmul) &&
++           require_align(a->rs2, s->lmul) &&
++           s->sew == MO_32;
++}
++
++static bool vaes_check_overlap(DisasContext *s, int vd, int vs2)
++{
++    int8_t op_size = s->lmul <= 0 ? 1 : 1 << s->lmul;
++    return !is_overlapped(vd, op_size, vs2, 1);
++}
++
++static bool vaes_check_vs(DisasContext *s, arg_rmr *a)
++{
++    int egw_bytes = ZVKNED_EGS << s->sew;
++    return vaes_check_overlap(s, a->rd, a->rs2) &&
++           MAXSZ(s) >= egw_bytes &&
++           s->cfg_ptr->ext_zvkned == true &&
++           require_rvv(s) &&
++           vext_check_isa_ill(s) &&
++           require_align(a->rd, s->lmul) &&
++           s->sew == MO_32;
++}
++
++GEN_V_UNMASKED_TRANS(vaesef_vv, vaes_check_vv, ZVKNED_EGS)
++GEN_V_UNMASKED_TRANS(vaesef_vs, vaes_check_vs, ZVKNED_EGS)
++GEN_V_UNMASKED_TRANS(vaesdf_vv, vaes_check_vv, ZVKNED_EGS)
++GEN_V_UNMASKED_TRANS(vaesdf_vs, vaes_check_vs, ZVKNED_EGS)
++GEN_V_UNMASKED_TRANS(vaesdm_vv, vaes_check_vv, ZVKNED_EGS)
++GEN_V_UNMASKED_TRANS(vaesdm_vs, vaes_check_vs, ZVKNED_EGS)
++GEN_V_UNMASKED_TRANS(vaesz_vs, vaes_check_vs, ZVKNED_EGS)
++GEN_V_UNMASKED_TRANS(vaesem_vv, vaes_check_vv, ZVKNED_EGS)
++GEN_V_UNMASKED_TRANS(vaesem_vs, vaes_check_vs, ZVKNED_EGS)
++
++#define GEN_VI_UNMASKED_TRANS(NAME, CHECK, EGS)                               \
++    static bool trans_##NAME(DisasContext *s, arg_##NAME *a)                  \
++    {                                                                         \
++        if (CHECK(s, a)) {                                                    \
++            TCGv_ptr rd_v, rs2_v;                                             \
++            TCGv_i32 uimm_v, desc, egs;                                       \
++            uint32_t data = 0;                                                \
++            TCGLabel *over = gen_new_label();                                 \
++                                                                              \
++            if (!s->vstart_eq_zero || !s->vl_eq_vlmax) {                      \
++                /* save opcode for unwinding in case we throw an exception */ \
++                decode_save_opc(s);                                           \
++                egs = tcg_constant_i32(EGS);                                  \
++                gen_helper_egs_check(egs, cpu_env);                           \
++                tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);    \
++            }                                                                 \
++                                                                              \
++            data = FIELD_DP32(data, VDATA, VM, a->vm);                        \
++            data = FIELD_DP32(data, VDATA, LMUL, s->lmul);                    \
++            data = FIELD_DP32(data, VDATA, VTA, s->vta);                      \
++            data = FIELD_DP32(data, VDATA, VTA_ALL_1S, s->cfg_vta_all_1s);    \
++            data = FIELD_DP32(data, VDATA, VMA, s->vma);                      \
++                                                                              \
++            rd_v = tcg_temp_new_ptr();                                        \
++            rs2_v = tcg_temp_new_ptr();                                       \
++            uimm_v = tcg_constant_i32(a->rs1);                                \
++            desc = tcg_constant_i32(                                          \
++                simd_desc(s->cfg_ptr->vlen / 8, s->cfg_ptr->vlen / 8, data)); \
++            tcg_gen_addi_ptr(rd_v, cpu_env, vreg_ofs(s, a->rd));              \
++            tcg_gen_addi_ptr(rs2_v, cpu_env, vreg_ofs(s, a->rs2));            \
++            gen_helper_##NAME(rd_v, rs2_v, uimm_v, cpu_env, desc);            \
++            mark_vs_dirty(s);                                                 \
++            gen_set_label(over);                                              \
++            return true;                                                      \
++        }                                                                     \
++        return false;                                                         \
++    }
++
++static bool vaeskf1_check(DisasContext *s, arg_vaeskf1_vi *a)
++{
++    int egw_bytes = ZVKNED_EGS << s->sew;
++    return s->cfg_ptr->ext_zvkned == true &&
++           require_rvv(s) &&
++           vext_check_isa_ill(s) &&
++           MAXSZ(s) >= egw_bytes &&
++           s->sew == MO_32 &&
++           require_align(a->rd, s->lmul) &&
++           require_align(a->rs2, s->lmul);
++}
++
++static bool vaeskf2_check(DisasContext *s, arg_vaeskf2_vi *a)
++{
++    int egw_bytes = ZVKNED_EGS << s->sew;
++    return s->cfg_ptr->ext_zvkned == true &&
++           require_rvv(s) &&
++           vext_check_isa_ill(s) &&
++           MAXSZ(s) >= egw_bytes &&
++           s->sew == MO_32 &&
++           require_align(a->rd, s->lmul) &&
++           require_align(a->rs2, s->lmul);
++}
++
++GEN_VI_UNMASKED_TRANS(vaeskf1_vi, vaeskf1_check, ZVKNED_EGS)
++GEN_VI_UNMASKED_TRANS(vaeskf2_vi, vaeskf2_check, ZVKNED_EGS)
+--
+.41.0

-[PULL 25/37] target/riscv: accessors to registers upper part and 128-bit load/store
+[PULL v2 17/45] target/riscv: Add Zvknh ISA extension support
-From: Frédéric Pétrot <frederic.petrot@univ-grenoble-alpes.fr>
+From: Kiran Ostrolenk <kiran.ostrolenk@codethink.co.uk>
-Get function to retrieve the 64 top bits of a register, stored in the gprh
+This commit adds support for the Zvknh vector-crypto extension, which
-field of the cpu state. Set function that writes the 128-bit value at once.
+consists of the following instructions:
 The access to the gprh field can not be protected at compile time to make
 sure it is accessed only in the 128-bit version of the processor because we
 have no way to indicate that the misa_mxl_max field is const.
-The 128-bit ISA adds ldu, lq and sq. We provide support for these
+* vsha2ms.vv
-instructions. Note that (a) we compute only 64-bit addresses to actually
+* vsha2c[hl].vv
 access memory, cowardly utilizing the existing address translation mechanism
 of QEMU, and (b) we assume for now little-endian memory accesses.
-Signed-off-by: Frédéric Pétrot <frederic.petrot@univ-grenoble-alpes.fr>
+Translation functions are defined in
-Co-authored-by: Fabien Portas <fabien.portas@grenoble-inp.org>
+`target/riscv/insn_trans/trans_rvvk.c.inc` and helpers are defined in
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+`target/riscv/vcrypto_helper.c`.
-Message-id: 20220106210108.138226-10-frederic.petrot@univ-grenoble-alpes.fr
 Co-authored-by: Nazar Kazakov <nazar.kazakov@codethink.co.uk>
 Co-authored-by: Lawrence Hunter <lawrence.hunter@codethink.co.uk>
 [max.chou@sifive.com: Replaced vstart checking by TCG op]
 Signed-off-by: Nazar Kazakov <nazar.kazakov@codethink.co.uk>
 Signed-off-by: Lawrence Hunter <lawrence.hunter@codethink.co.uk>
 Signed-off-by: Kiran Ostrolenk <kiran.ostrolenk@codethink.co.uk>
 Signed-off-by: Max Chou <max.chou@sifive.com>
 Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 [max.chou@sifive.com: Exposed x-zvknha & x-zvknhb properties]
 [max.chou@sifive.com: Replaced SEW selection to happened during
 translation]
 Message-ID: <20230711165917.2629866-11-max.chou@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/insn16.decode              |  27 ++++++-
+ target/riscv/cpu_cfg.h                   |   2 +
- target/riscv/insn32.decode              |   5 ++
+ target/riscv/helper.h                    |   6 +
- target/riscv/translate.c                |  41 ++++++++++
+ target/riscv/insn32.decode               |   5 +
- target/riscv/insn_trans/trans_rvi.c.inc | 100 ++++++++++++++++++++++--
+ target/riscv/cpu.c                       |  13 +-
-files changed, 163 insertions(+), 10 deletions(-)
+ target/riscv/vcrypto_helper.c            | 238 +++++++++++++++++++++++
  target/riscv/insn_trans/trans_rvvk.c.inc | 129 ++++++++++++
 files changed, 390 insertions(+), 3 deletions(-)
-diff --git a/target/riscv/insn16.decode b/target/riscv/insn16.decode
+diff --git a/target/riscv/cpu_cfg.h b/target/riscv/cpu_cfg.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn16.decode
+--- a/target/riscv/cpu_cfg.h
-+++ b/target/riscv/insn16.decode
++++ b/target/riscv/cpu_cfg.h
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ struct RISCVCPUConfig {
- # Immediates:
+     bool ext_zvbb;
- %imm_ci        12:s1 2:5
+     bool ext_zvbc;
- %nzuimm_ciw    7:4 11:2 5:1 6:1   !function=ex_shift_2
+     bool ext_zvkned;
-+%uimm_cl_q     10:1 5:2 11:2      !function=ex_shift_4
++    bool ext_zvknha;
- %uimm_cl_d     5:2 10:3           !function=ex_shift_3
++    bool ext_zvknhb;
- %uimm_cl_w     5:1 10:3 6:1       !function=ex_shift_2
+     bool ext_zmmul;
- %imm_cb        12:s1 5:2 2:1 10:2 3:2 !function=ex_shift_1
+     bool ext_zvfbfmin;
- %imm_cj        12:s1 8:1 9:2 6:1 7:1 2:1 11:1 3:3 !function=ex_shift_1
+     bool ext_zvfbfwma;
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
- %shimm_6bit   12:1 2:5               !function=ex_rvc_shifti
+index XXXXXXX..XXXXXXX 100644
-+%uimm_6bit_lq 2:4 12:1 6:1           !function=ex_shift_4
+--- a/target/riscv/helper.h
- %uimm_6bit_ld 2:3 12:1 5:2           !function=ex_shift_3
++++ b/target/riscv/helper.h
- %uimm_6bit_lw 2:2 12:1 4:3           !function=ex_shift_2
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_4(vaesdm_vs, void, ptr, ptr, env, i32)
-+%uimm_6bit_sq 7:4 11:2               !function=ex_shift_4
+ DEF_HELPER_4(vaesz_vs, void, ptr, ptr, env, i32)
- %uimm_6bit_sd 7:3 10:3               !function=ex_shift_3
+ DEF_HELPER_5(vaeskf1_vi, void, ptr, ptr, i32, env, i32)
- %uimm_6bit_sw 7:2 9:4                !function=ex_shift_2
+ DEF_HELPER_5(vaeskf2_vi, void, ptr, ptr, i32, env, i32)
++
-@@ -XXX,XX +XXX,XX @@
++DEF_HELPER_5(vsha2ms_vv, void, ptr, ptr, ptr, env, i32)
- # Formats 16:
++DEF_HELPER_5(vsha2ch32_vv, void, ptr, ptr, ptr, env, i32)
- @cr        ....  ..... .....  .. &r      rs2=%rs2_5       rs1=%rd     %rd
++DEF_HELPER_5(vsha2ch64_vv, void, ptr, ptr, ptr, env, i32)
- @ci        ... . ..... .....  .. &i      imm=%imm_ci      rs1=%rd     %rd
++DEF_HELPER_5(vsha2cl32_vv, void, ptr, ptr, ptr, env, i32)
-+@cl_q      ... . .....  ..... .. &i      imm=%uimm_cl_q   rs1=%rs1_3  rd=%rs2_3
++DEF_HELPER_5(vsha2cl64_vv, void, ptr, ptr, ptr, env, i32)
  @cl_d      ... ... ... .. ... .. &i      imm=%uimm_cl_d   rs1=%rs1_3  rd=%rs2_3
  @cl_w      ... ... ... .. ... .. &i      imm=%uimm_cl_w   rs1=%rs1_3  rd=%rs2_3
  @cs_2      ... ... ... .. ... .. &r      rs2=%rs2_3       rs1=%rs1_3  rd=%rs1_3
 +@cs_q      ... ... ... .. ... .. &s      imm=%uimm_cl_q   rs1=%rs1_3  rs2=%rs2_3
  @cs_d      ... ... ... .. ... .. &s      imm=%uimm_cl_d   rs1=%rs1_3  rs2=%rs2_3
  @cs_w      ... ... ... .. ... .. &s      imm=%uimm_cl_w   rs1=%rs1_3  rs2=%rs2_3
  @cj        ...    ........... .. &j      imm=%imm_cj
  @cb_z      ... ... ... .. ... .. &b      imm=%imm_cb      rs1=%rs1_3  rs2=0
 +@c_lqsp    ... . .....  ..... .. &i      imm=%uimm_6bit_lq rs1=2 %rd
  @c_ldsp    ... . .....  ..... .. &i      imm=%uimm_6bit_ld rs1=2 %rd
  @c_lwsp    ... . .....  ..... .. &i      imm=%uimm_6bit_lw rs1=2 %rd
 +@c_sqsp    ... . .....  ..... .. &s      imm=%uimm_6bit_sq rs1=2 rs2=%rs2_5
  @c_sdsp    ... . .....  ..... .. &s      imm=%uimm_6bit_sd rs1=2 rs2=%rs2_5
  @c_swsp    ... . .....  ..... .. &s      imm=%uimm_6bit_sw rs1=2 rs2=%rs2_5
  @c_li      ... . .....  ..... .. &i      imm=%imm_ci rs1=0 %rd
@@ -XXX,XX +XXX,XX @@
    illegal         000  000 000 00 --- 00
    addi            000  ... ... .. ... 00 @c_addi4spn
  }
 -fld               001  ... ... .. ... 00 @cl_d
 +{
 +  lq              001  ... ... .. ... 00 @cl_q
 +  fld             001  ... ... .. ... 00 @cl_d
 +}
  lw                010  ... ... .. ... 00 @cl_w
 -fsd               101  ... ... .. ... 00 @cs_d
 +{
 +  sq              101  ... ... .. ... 00 @cs_q
 +  fsd             101  ... ... .. ... 00 @cs_d
 +}
  sw                110  ... ... .. ... 00 @cs_w
  # *** RV32C and RV64C specific Standard Extension (Quadrant 0) ***
@@ -XXX,XX +XXX,XX @@ addw              100 1 11 ... 01 ... 01 @cs_2
  # *** RV32/64C Standard Extension (Quadrant 2) ***
  slli              000 .  .....  ..... 10 @c_shift2
 -fld               001 .  .....  ..... 10 @c_ldsp
 +{
 +  lq              001  ... ... .. ... 10 @c_lqsp
 +  fld             001 .  .....  ..... 10 @c_ldsp
 +}
  {
    illegal         010 -  00000  ----- 10 # c.lwsp, RES rd=0
    lw              010 .  .....  ..... 10 @c_lwsp
@@ -XXX,XX +XXX,XX @@ fld               001 .  .....  ..... 10 @c_ldsp
    jalr            100 1  .....  00000 10 @c_jalr rd=1  # C.JALR
    add             100 1  .....  ..... 10 @cr
  }
 -fsd               101   ......  ..... 10 @c_sdsp
 +{
 +  sq              101  ... ... .. ... 10 @c_sqsp
 +  fsd             101   ......  ..... 10 @c_sdsp
 +}
  sw                110 .  .....  ..... 10 @c_swsp
  # *** RV32C and RV64C specific Standard Extension (Quadrant 2) ***
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ sllw     0000000 .....  ..... 001 ..... 0111011 @r
+@@ -XXX,XX +XXX,XX @@ vaesdm_vs   101001 1 ..... 00000 010 ..... 1110111 @r2_vm_1
- srlw     0000000 .....  ..... 101 ..... 0111011 @r
+ vaesz_vs    101001 1 ..... 00111 010 ..... 1110111 @r2_vm_1
- sraw     0100000 .....  ..... 101 ..... 0111011 @r
+ vaeskf1_vi  100010 1 ..... ..... 010 ..... 1110111 @r_vm_1
+ vaeskf2_vi  101010 1 ..... ..... 010 ..... 1110111 @r_vm_1
-+# *** RV128I Base Instruction Set (in addition to RV64I) ***
++
-+ldu      ............   ..... 111 ..... 0000011 @i
++# *** Zvknh vector crypto extension ***
-+lq       ............   ..... 010 ..... 0001111 @i
++vsha2ms_vv  101101 1 ..... ..... 010 ..... 1110111 @r_vm_1
-+sq       ............   ..... 100 ..... 0100011 @s
++vsha2ch_vv  101110 1 ..... ..... 010 ..... 1110111 @r_vm_1
-+
++vsha2cl_vv  101111 1 ..... ..... 010 ..... 1110111 @r_vm_1
- # *** RV32M Standard Extension ***
+diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
  mul      0000001 .....  ..... 000 ..... 0110011 @r
  mulh     0000001 .....  ..... 001 ..... 0110011 @r
 diff --git a/target/riscv/translate.c b/target/riscv/translate.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/translate.c
+--- a/target/riscv/cpu.c
-+++ b/target/riscv/translate.c
++++ b/target/riscv/cpu.c
-@@ -XXX,XX +XXX,XX @@ typedef struct DisasContext {
+@@ -XXX,XX +XXX,XX @@ static const struct isa_ext_data isa_edata_arr[] = {
-     /* pc_succ_insn points to the instruction following base.pc_next */
+     ISA_EXT_DATA_ENTRY(zvfh, PRIV_VERSION_1_12_0, ext_zvfh),
-     target_ulong pc_succ_insn;
+     ISA_EXT_DATA_ENTRY(zvfhmin, PRIV_VERSION_1_12_0, ext_zvfhmin),
-     target_ulong priv_ver;
+     ISA_EXT_DATA_ENTRY(zvkned, PRIV_VERSION_1_12_0, ext_zvkned),
-+    RISCVMXL misa_mxl_max;
++    ISA_EXT_DATA_ENTRY(zvknha, PRIV_VERSION_1_12_0, ext_zvknha),
-     RISCVMXL xl;
++    ISA_EXT_DATA_ENTRY(zvknhb, PRIV_VERSION_1_12_0, ext_zvknhb),
-     uint32_t misa_ext;
+     ISA_EXT_DATA_ENTRY(zhinx, PRIV_VERSION_1_12_0, ext_zhinx),
-     uint32_t opcode;
+     ISA_EXT_DATA_ENTRY(zhinxmin, PRIV_VERSION_1_12_0, ext_zhinxmin),
-@@ -XXX,XX +XXX,XX @@ static inline int get_olen(DisasContext *ctx)
+     ISA_EXT_DATA_ENTRY(smaia, PRIV_VERSION_1_12_0, ext_smaia),
-     return 16 << get_ol(ctx);
+@@ -XXX,XX +XXX,XX @@ void riscv_cpu_validate_set_extensions(RISCVCPU *cpu, Error **errp)
       * In principle Zve*x would also suffice here, were they supported
       * in qemu
       */
 -    if ((cpu->cfg.ext_zvbb || cpu->cfg.ext_zvkned) && !cpu->cfg.ext_zve32f) {
 +    if ((cpu->cfg.ext_zvbb || cpu->cfg.ext_zvkned || cpu->cfg.ext_zvknha) &&
 +        !cpu->cfg.ext_zve32f) {
          error_setg(errp,
                     "Vector crypto extensions require V or Zve* extensions");
          return;
      }
 -    if (cpu->cfg.ext_zvbc && !cpu->cfg.ext_zve64f) {
 -        error_setg(errp, "Zvbc extension requires V or Zve64{f,d} extensions");
 +    if ((cpu->cfg.ext_zvbc || cpu->cfg.ext_zvknhb) && !cpu->cfg.ext_zve64f) {
 +        error_setg(
 +            errp,
 +            "Zvbc and Zvknhb extensions require V or Zve64{f,d} extensions");
          return;
      }
@@ -XXX,XX +XXX,XX @@ static Property riscv_cpu_extensions[] = {
      DEFINE_PROP_BOOL("x-zvbb", RISCVCPU, cfg.ext_zvbb, false),
      DEFINE_PROP_BOOL("x-zvbc", RISCVCPU, cfg.ext_zvbc, false),
      DEFINE_PROP_BOOL("x-zvkned", RISCVCPU, cfg.ext_zvkned, false),
 +    DEFINE_PROP_BOOL("x-zvknha", RISCVCPU, cfg.ext_zvknha, false),
 +    DEFINE_PROP_BOOL("x-zvknhb", RISCVCPU, cfg.ext_zvknhb, false),
      DEFINE_PROP_END_OF_LIST(),
  };
 diff --git a/target/riscv/vcrypto_helper.c b/target/riscv/vcrypto_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vcrypto_helper.c
 +++ b/target/riscv/vcrypto_helper.c
@@ -XXX,XX +XXX,XX @@ void HELPER(vaeskf2_vi)(void *vd_vptr, void *vs2_vptr, uint32_t uimm,
      /* set tail elements to 1s */
      vext_set_elems_1s(vd, vta, vl * 4, total_elems * 4);
  }
++
-+/* The maximum register length */
++static inline uint32_t sig0_sha256(uint32_t x)
-+#ifdef TARGET_RISCV32
++{
-+#define get_xl_max(ctx)    MXL_RV32
++    return ror32(x, 7) ^ ror32(x, 18) ^ (x >> 3);
-+#else
++}
-+#define get_xl_max(ctx)    ((ctx)->misa_mxl_max)
++
-+#endif
++static inline uint32_t sig1_sha256(uint32_t x)
-+
++{
- /*
++    return ror32(x, 17) ^ ror32(x, 19) ^ (x >> 10);
-  * RISC-V requires NaN-boxing of narrower width floating point values.
++}
-  * This applies when a 32-bit value is assigned to a 64-bit FP register.
++
-@@ -XXX,XX +XXX,XX @@ static TCGv get_gpr(DisasContext *ctx, int reg_num, DisasExtend ext)
++static inline uint64_t sig0_sha512(uint64_t x)
-         }
++{
-         break;
++    return ror64(x, 1) ^ ror64(x, 8) ^ (x >> 7);
-     case MXL_RV64:
++}
-+    case MXL_RV128:
++
-         break;
++static inline uint64_t sig1_sha512(uint64_t x)
-     default:
++{
-         g_assert_not_reached();
++    return ror64(x, 19) ^ ror64(x, 61) ^ (x >> 6);
-@@ -XXX,XX +XXX,XX @@ static TCGv get_gpr(DisasContext *ctx, int reg_num, DisasExtend ext)
++}
-     return cpu_gpr[reg_num];
++
- }
++static inline void vsha2ms_e32(uint32_t *vd, uint32_t *vs1, uint32_t *vs2)
++{
-+static TCGv get_gprh(DisasContext *ctx, int reg_num)
++    uint32_t res[4];
-+{
++    res[0] = sig1_sha256(vs1[H4(2)]) + vs2[H4(1)] + sig0_sha256(vd[H4(1)]) +
-+    assert(get_xl(ctx) == MXL_RV128);
++             vd[H4(0)];
-+    if (reg_num == 0) {
++    res[1] = sig1_sha256(vs1[H4(3)]) + vs2[H4(2)] + sig0_sha256(vd[H4(2)]) +
-+        return ctx->zero;
++             vd[H4(1)];
-+    }
++    res[2] =
-+    return cpu_gprh[reg_num];
++        sig1_sha256(res[0]) + vs2[H4(3)] + sig0_sha256(vd[H4(3)]) + vd[H4(2)];
-+}
++    res[3] =
-+
++        sig1_sha256(res[1]) + vs1[H4(0)] + sig0_sha256(vs2[H4(0)]) + vd[H4(3)];
- static TCGv dest_gpr(DisasContext *ctx, int reg_num)
++    vd[H4(3)] = res[3];
- {
++    vd[H4(2)] = res[2];
-     if (reg_num == 0 || get_olen(ctx) < TARGET_LONG_BITS) {
++    vd[H4(1)] = res[1];
-@@ -XXX,XX +XXX,XX @@ static TCGv dest_gpr(DisasContext *ctx, int reg_num)
++    vd[H4(0)] = res[0];
-     return cpu_gpr[reg_num];
++}
- }
++
++static inline void vsha2ms_e64(uint64_t *vd, uint64_t *vs1, uint64_t *vs2)
-+static TCGv dest_gprh(DisasContext *ctx, int reg_num)
++{
-+{
++    uint64_t res[4];
-+    if (reg_num == 0) {
++    res[0] = sig1_sha512(vs1[2]) + vs2[1] + sig0_sha512(vd[1]) + vd[0];
-+        return temp_new(ctx);
++    res[1] = sig1_sha512(vs1[3]) + vs2[2] + sig0_sha512(vd[2]) + vd[1];
-+    }
++    res[2] = sig1_sha512(res[0]) + vs2[3] + sig0_sha512(vd[3]) + vd[2];
-+    return cpu_gprh[reg_num];
++    res[3] = sig1_sha512(res[1]) + vs1[0] + sig0_sha512(vs2[0]) + vd[3];
-+}
++    vd[3] = res[3];
-+
++    vd[2] = res[2];
- static void gen_set_gpr(DisasContext *ctx, int reg_num, TCGv t)
++    vd[1] = res[1];
- {
++    vd[0] = res[0];
-     if (reg_num != 0) {
++}
-@@ -XXX,XX +XXX,XX @@ static void gen_set_gpr(DisasContext *ctx, int reg_num, TCGv t)
++
-             tcg_gen_ext32s_tl(cpu_gpr[reg_num], t);
++void HELPER(vsha2ms_vv)(void *vd, void *vs1, void *vs2, CPURISCVState *env,
-             break;
++                        uint32_t desc)
-         case MXL_RV64:
++{
-+        case MXL_RV128:
++    uint32_t sew = FIELD_EX64(env->vtype, VTYPE, VSEW);
-             tcg_gen_mov_tl(cpu_gpr[reg_num], t);
++    uint32_t esz = sew == MO_32 ? 4 : 8;
-             break;
++    uint32_t total_elems;
-         default:
++    uint32_t vta = vext_vta(desc);
-             g_assert_not_reached();
++
-         }
++    for (uint32_t i = env->vstart / 4; i < env->vl / 4; i++) {
-+
++        if (sew == MO_32) {
-+        if (get_xl_max(ctx) == MXL_RV128) {
++            vsha2ms_e32(((uint32_t *)vd) + i * 4, ((uint32_t *)vs1) + i * 4,
-+            tcg_gen_sari_tl(cpu_gprh[reg_num], cpu_gpr[reg_num], 63);
++                        ((uint32_t *)vs2) + i * 4);
 +        } else {
 +            /* If not 32 then SEW should be 64 */
 +            vsha2ms_e64(((uint64_t *)vd) + i * 4, ((uint64_t *)vs1) + i * 4,
 +                        ((uint64_t *)vs2) + i * 4);
 +        }
 +    }
-+}
++    /* set tail elements to 1s */
-+
++    total_elems = vext_get_total_elems(env, desc, esz);
-+static void gen_set_gpr128(DisasContext *ctx, int reg_num, TCGv rl, TCGv rh)
++    vext_set_elems_1s(vd, vta, env->vl * esz, total_elems * esz);
-+{
++    env->vstart = 0;
-+    assert(get_ol(ctx) == MXL_RV128);
++}
-+    if (reg_num != 0) {
++
-+        tcg_gen_mov_tl(cpu_gpr[reg_num], rl);
++static inline uint64_t sum0_64(uint64_t x)
-+        tcg_gen_mov_tl(cpu_gprh[reg_num], rh);
++{
-     }
++    return ror64(x, 28) ^ ror64(x, 34) ^ ror64(x, 39);
- }
++}
++
-@@ -XXX,XX +XXX,XX @@ static void riscv_tr_init_disas_context(DisasContextBase *dcbase, CPUState *cs)
++static inline uint32_t sum0_32(uint32_t x)
-     ctx->lmul = sextract32(FIELD_EX32(tb_flags, TB_FLAGS, LMUL), 0, 3);
++{
-     ctx->vstart = env->vstart;
++    return ror32(x, 2) ^ ror32(x, 13) ^ ror32(x, 22);
-     ctx->vl_eq_vlmax = FIELD_EX32(tb_flags, TB_FLAGS, VL_EQ_VLMAX);
++}
-+    ctx->misa_mxl_max = env->misa_mxl_max;
++
-     ctx->xl = FIELD_EX32(tb_flags, TB_FLAGS, XL);
++static inline uint64_t sum1_64(uint64_t x)
-     ctx->cs = cs;
++{
-     ctx->ntemp = 0;
++    return ror64(x, 14) ^ ror64(x, 18) ^ ror64(x, 41);
-diff --git a/target/riscv/insn_trans/trans_rvi.c.inc b/target/riscv/insn_trans/trans_rvi.c.inc
++}
 +
 +static inline uint32_t sum1_32(uint32_t x)
 +{
 +    return ror32(x, 6) ^ ror32(x, 11) ^ ror32(x, 25);
 +}
 +
 +#define ch(x, y, z) ((x & y) ^ ((~x) & z))
 +
 +#define maj(x, y, z) ((x & y) ^ (x & z) ^ (y & z))
 +
 +static void vsha2c_64(uint64_t *vs2, uint64_t *vd, uint64_t *vs1)
 +{
 +    uint64_t a = vs2[3], b = vs2[2], e = vs2[1], f = vs2[0];
 +    uint64_t c = vd[3], d = vd[2], g = vd[1], h = vd[0];
 +    uint64_t W0 = vs1[0], W1 = vs1[1];
 +    uint64_t T1 = h + sum1_64(e) + ch(e, f, g) + W0;
 +    uint64_t T2 = sum0_64(a) + maj(a, b, c);
 +
 +    h = g;
 +    g = f;
 +    f = e;
 +    e = d + T1;
 +    d = c;
 +    c = b;
 +    b = a;
 +    a = T1 + T2;
 +
 +    T1 = h + sum1_64(e) + ch(e, f, g) + W1;
 +    T2 = sum0_64(a) + maj(a, b, c);
 +    h = g;
 +    g = f;
 +    f = e;
 +    e = d + T1;
 +    d = c;
 +    c = b;
 +    b = a;
 +    a = T1 + T2;
 +
 +    vd[0] = f;
 +    vd[1] = e;
 +    vd[2] = b;
 +    vd[3] = a;
 +}
 +
 +static void vsha2c_32(uint32_t *vs2, uint32_t *vd, uint32_t *vs1)
 +{
 +    uint32_t a = vs2[H4(3)], b = vs2[H4(2)], e = vs2[H4(1)], f = vs2[H4(0)];
 +    uint32_t c = vd[H4(3)], d = vd[H4(2)], g = vd[H4(1)], h = vd[H4(0)];
 +    uint32_t W0 = vs1[H4(0)], W1 = vs1[H4(1)];
 +    uint32_t T1 = h + sum1_32(e) + ch(e, f, g) + W0;
 +    uint32_t T2 = sum0_32(a) + maj(a, b, c);
 +
 +    h = g;
 +    g = f;
 +    f = e;
 +    e = d + T1;
 +    d = c;
 +    c = b;
 +    b = a;
 +    a = T1 + T2;
 +
 +    T1 = h + sum1_32(e) + ch(e, f, g) + W1;
 +    T2 = sum0_32(a) + maj(a, b, c);
 +    h = g;
 +    g = f;
 +    f = e;
 +    e = d + T1;
 +    d = c;
 +    c = b;
 +    b = a;
 +    a = T1 + T2;
 +
 +    vd[H4(0)] = f;
 +    vd[H4(1)] = e;
 +    vd[H4(2)] = b;
 +    vd[H4(3)] = a;
 +}
 +
 +void HELPER(vsha2ch32_vv)(void *vd, void *vs1, void *vs2, CPURISCVState *env,
 +                          uint32_t desc)
 +{
 +    const uint32_t esz = 4;
 +    uint32_t total_elems;
 +    uint32_t vta = vext_vta(desc);
 +
 +    for (uint32_t i = env->vstart / 4; i < env->vl / 4; i++) {
 +        vsha2c_32(((uint32_t *)vs2) + 4 * i, ((uint32_t *)vd) + 4 * i,
 +                  ((uint32_t *)vs1) + 4 * i + 2);
 +    }
 +
 +    /* set tail elements to 1s */
 +    total_elems = vext_get_total_elems(env, desc, esz);
 +    vext_set_elems_1s(vd, vta, env->vl * esz, total_elems * esz);
 +    env->vstart = 0;
 +}
 +
 +void HELPER(vsha2ch64_vv)(void *vd, void *vs1, void *vs2, CPURISCVState *env,
 +                          uint32_t desc)
 +{
 +    const uint32_t esz = 8;
 +    uint32_t total_elems;
 +    uint32_t vta = vext_vta(desc);
 +
 +    for (uint32_t i = env->vstart / 4; i < env->vl / 4; i++) {
 +        vsha2c_64(((uint64_t *)vs2) + 4 * i, ((uint64_t *)vd) + 4 * i,
 +                  ((uint64_t *)vs1) + 4 * i + 2);
 +    }
 +
 +    /* set tail elements to 1s */
 +    total_elems = vext_get_total_elems(env, desc, esz);
 +    vext_set_elems_1s(vd, vta, env->vl * esz, total_elems * esz);
 +    env->vstart = 0;
 +}
 +
 +void HELPER(vsha2cl32_vv)(void *vd, void *vs1, void *vs2, CPURISCVState *env,
 +                          uint32_t desc)
 +{
 +    const uint32_t esz = 4;
 +    uint32_t total_elems;
 +    uint32_t vta = vext_vta(desc);
 +
 +    for (uint32_t i = env->vstart / 4; i < env->vl / 4; i++) {
 +        vsha2c_32(((uint32_t *)vs2) + 4 * i, ((uint32_t *)vd) + 4 * i,
 +                  (((uint32_t *)vs1) + 4 * i));
 +    }
 +
 +    /* set tail elements to 1s */
 +    total_elems = vext_get_total_elems(env, desc, esz);
 +    vext_set_elems_1s(vd, vta, env->vl * esz, total_elems * esz);
 +    env->vstart = 0;
 +}
 +
 +void HELPER(vsha2cl64_vv)(void *vd, void *vs1, void *vs2, CPURISCVState *env,
 +                          uint32_t desc)
 +{
 +    uint32_t esz = 8;
 +    uint32_t total_elems;
 +    uint32_t vta = vext_vta(desc);
 +
 +    for (uint32_t i = env->vstart / 4; i < env->vl / 4; i++) {
 +        vsha2c_64(((uint64_t *)vs2) + 4 * i, ((uint64_t *)vd) + 4 * i,
 +                  (((uint64_t *)vs1) + 4 * i));
 +    }
 +
 +    /* set tail elements to 1s */
 +    total_elems = vext_get_total_elems(env, desc, esz);
 +    vext_set_elems_1s(vd, vta, env->vl * esz, total_elems * esz);
 +    env->vstart = 0;
 +}
 diff --git a/target/riscv/insn_trans/trans_rvvk.c.inc b/target/riscv/insn_trans/trans_rvvk.c.inc
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvi.c.inc
+--- a/target/riscv/insn_trans/trans_rvvk.c.inc
-+++ b/target/riscv/insn_trans/trans_rvi.c.inc
++++ b/target/riscv/insn_trans/trans_rvvk.c.inc
-@@ -XXX,XX +XXX,XX @@ static bool trans_bgeu(DisasContext *ctx, arg_bgeu *a)
+@@ -XXX,XX +XXX,XX @@ static bool vaeskf2_check(DisasContext *s, arg_vaeskf2_vi *a)
-     return gen_branch(ctx, a, TCG_COND_GEU);
- }
+ GEN_VI_UNMASKED_TRANS(vaeskf1_vi, vaeskf1_check, ZVKNED_EGS)
+ GEN_VI_UNMASKED_TRANS(vaeskf2_vi, vaeskf2_check, ZVKNED_EGS)
--static bool gen_load(DisasContext *ctx, arg_lb *a, MemOp memop)
++
-+static bool gen_load_tl(DisasContext *ctx, arg_lb *a, MemOp memop)
++/*
- {
++ * Zvknh
-     TCGv dest = dest_gpr(ctx, a->rd);
++ */
-     TCGv addr = get_gpr(ctx, a->rs1, EXT_NONE);
++
-@@ -XXX,XX +XXX,XX @@ static bool gen_load(DisasContext *ctx, arg_lb *a, MemOp memop)
++#define ZVKNH_EGS 4
-     return true;
++
- }
++#define GEN_VV_UNMASKED_TRANS(NAME, CHECK, EGS)                               \
++    static bool trans_##NAME(DisasContext *s, arg_rmrr *a)                    \
-+/* Compute only 64-bit addresses to use the address translation mechanism */
++    {                                                                         \
-+static bool gen_load_i128(DisasContext *ctx, arg_lb *a, MemOp memop)
++        if (CHECK(s, a)) {                                                    \
-+{
++            uint32_t data = 0;                                                \
-+    TCGv src1l = get_gpr(ctx, a->rs1, EXT_NONE);
++            TCGLabel *over = gen_new_label();                                 \
-+    TCGv destl = dest_gpr(ctx, a->rd);
++            TCGv_i32 egs;                                                     \
-+    TCGv desth = dest_gprh(ctx, a->rd);
++                                                                              \
-+    TCGv addrl = tcg_temp_new();
++            if (!s->vstart_eq_zero || !s->vl_eq_vlmax) {                      \
-+
++                /* save opcode for unwinding in case we throw an exception */ \
-+    tcg_gen_addi_tl(addrl, src1l, a->imm);
++                decode_save_opc(s);                                           \
-+
++                egs = tcg_constant_i32(EGS);                                  \
-+    if ((memop & MO_SIZE) <= MO_64) {
++                gen_helper_egs_check(egs, cpu_env);                           \
-+        tcg_gen_qemu_ld_tl(destl, addrl, ctx->mem_idx, memop);
++                tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);    \
-+        if (memop & MO_SIGN) {
++            }                                                                 \
-+            tcg_gen_sari_tl(desth, destl, 63);
++                                                                              \
-+        } else {
++            data = FIELD_DP32(data, VDATA, VM, a->vm);                        \
-+            tcg_gen_movi_tl(desth, 0);
++            data = FIELD_DP32(data, VDATA, LMUL, s->lmul);                    \
 +            data = FIELD_DP32(data, VDATA, VTA, s->vta);                      \
 +            data = FIELD_DP32(data, VDATA, VTA_ALL_1S, s->cfg_vta_all_1s);    \
 +            data = FIELD_DP32(data, VDATA, VMA, s->vma);                      \
 +                                                                              \
 +            tcg_gen_gvec_3_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, a->rs1),       \
 +                               vreg_ofs(s, a->rs2), cpu_env,                  \
 +                               s->cfg_ptr->vlen / 8, s->cfg_ptr->vlen / 8,    \
 +                               data, gen_helper_##NAME);                      \
 +                                                                              \
 +            mark_vs_dirty(s);                                                 \
 +            gen_set_label(over);                                              \
 +            return true;                                                      \
 +        }                                                                     \
 +        return false;                                                         \
 +    }
 +
 +static bool vsha_check_sew(DisasContext *s)
 +{
 +    return (s->cfg_ptr->ext_zvknha == true && s->sew == MO_32) ||
 +           (s->cfg_ptr->ext_zvknhb == true &&
 +            (s->sew == MO_32 || s->sew == MO_64));
 +}
 +
 +static bool vsha_check(DisasContext *s, arg_rmrr *a)
 +{
 +    int egw_bytes = ZVKNH_EGS << s->sew;
 +    int mult = 1 << MAX(s->lmul, 0);
 +    return opivv_check(s, a) &&
 +           vsha_check_sew(s) &&
 +           MAXSZ(s) >= egw_bytes &&
 +           !is_overlapped(a->rd, mult, a->rs1, mult) &&
 +           !is_overlapped(a->rd, mult, a->rs2, mult) &&
 +           s->lmul >= 0;
 +}
 +
 +GEN_VV_UNMASKED_TRANS(vsha2ms_vv, vsha_check, ZVKNH_EGS)
 +
 +static bool trans_vsha2cl_vv(DisasContext *s, arg_rmrr *a)
 +{
 +    if (vsha_check(s, a)) {
 +        uint32_t data = 0;
 +        TCGLabel *over = gen_new_label();
 +        TCGv_i32 egs;
 +
 +        if (!s->vstart_eq_zero || !s->vl_eq_vlmax) {
 +            /* save opcode for unwinding in case we throw an exception */
 +            decode_save_opc(s);
 +            egs = tcg_constant_i32(ZVKNH_EGS);
 +            gen_helper_egs_check(egs, cpu_env);
 +            tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
 +        }
-+    } else {
++
-+        /* assume little-endian memory access for now */
++        data = FIELD_DP32(data, VDATA, VM, a->vm);
-+        tcg_gen_qemu_ld_tl(destl, addrl, ctx->mem_idx, MO_TEUQ);
++        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
-+        tcg_gen_addi_tl(addrl, addrl, 8);
++        data = FIELD_DP32(data, VDATA, VTA, s->vta);
-+        tcg_gen_qemu_ld_tl(desth, addrl, ctx->mem_idx, MO_TEUQ);
++        data = FIELD_DP32(data, VDATA, VTA_ALL_1S, s->cfg_vta_all_1s);
-+    }
++        data = FIELD_DP32(data, VDATA, VMA, s->vma);
 +
-+    gen_set_gpr128(ctx, a->rd, destl, desth);
++        tcg_gen_gvec_3_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, a->rs1),
-+
++            vreg_ofs(s, a->rs2), cpu_env, s->cfg_ptr->vlen / 8,
-+    tcg_temp_free(addrl);
++            s->cfg_ptr->vlen / 8, data,
-+    return true;
++            s->sew == MO_32 ?
-+}
++                gen_helper_vsha2cl32_vv : gen_helper_vsha2cl64_vv);
 +
-+static bool gen_load(DisasContext *ctx, arg_lb *a, MemOp memop)
++        mark_vs_dirty(s);
-+{
++        gen_set_label(over);
-+    if (get_xl(ctx) == MXL_RV128) {
++        return true;
-+        return gen_load_i128(ctx, a, memop);
++    }
-+    } else {
++    return false;
-+        return gen_load_tl(ctx, a, memop);
++}
-+    }
++
-+}
++static bool trans_vsha2ch_vv(DisasContext *s, arg_rmrr *a)
-+
++{
- static bool trans_lb(DisasContext *ctx, arg_lb *a)
++    if (vsha_check(s, a)) {
- {
++        uint32_t data = 0;
-     return gen_load(ctx, a, MO_SB);
++        TCGLabel *over = gen_new_label();
-@@ -XXX,XX +XXX,XX @@ static bool trans_lw(DisasContext *ctx, arg_lw *a)
++        TCGv_i32 egs;
-     return gen_load(ctx, a, MO_TESL);
++
- }
++        if (!s->vstart_eq_zero || !s->vl_eq_vlmax) {
++            /* save opcode for unwinding in case we throw an exception */
-+static bool trans_ld(DisasContext *ctx, arg_ld *a)
++            decode_save_opc(s);
-+{
++            egs = tcg_constant_i32(ZVKNH_EGS);
-+    REQUIRE_64_OR_128BIT(ctx);
++            gen_helper_egs_check(egs, cpu_env);
-+    return gen_load(ctx, a, MO_TESQ);
++            tcg_gen_brcond_tl(TCG_COND_GEU, cpu_vstart, cpu_vl, over);
-+}
++        }
 +
-+static bool trans_lq(DisasContext *ctx, arg_lq *a)
++        data = FIELD_DP32(data, VDATA, VM, a->vm);
-+{
++        data = FIELD_DP32(data, VDATA, LMUL, s->lmul);
-+    REQUIRE_128BIT(ctx);
++        data = FIELD_DP32(data, VDATA, VTA, s->vta);
-+    return gen_load(ctx, a, MO_TEUO);
++        data = FIELD_DP32(data, VDATA, VTA_ALL_1S, s->cfg_vta_all_1s);
-+}
++        data = FIELD_DP32(data, VDATA, VMA, s->vma);
 +
- static bool trans_lbu(DisasContext *ctx, arg_lbu *a)
++        tcg_gen_gvec_3_ptr(vreg_ofs(s, a->rd), vreg_ofs(s, a->rs1),
- {
++            vreg_ofs(s, a->rs2), cpu_env, s->cfg_ptr->vlen / 8,
-     return gen_load(ctx, a, MO_UB);
++            s->cfg_ptr->vlen / 8, data,
-@@ -XXX,XX +XXX,XX @@ static bool trans_lhu(DisasContext *ctx, arg_lhu *a)
++            s->sew == MO_32 ?
++                gen_helper_vsha2ch32_vv : gen_helper_vsha2ch64_vv);
- static bool trans_lwu(DisasContext *ctx, arg_lwu *a)
++
- {
++        mark_vs_dirty(s);
--    REQUIRE_64BIT(ctx);
++        gen_set_label(over);
-+    REQUIRE_64_OR_128BIT(ctx);
++        return true;
-     return gen_load(ctx, a, MO_TEUL);
++    }
- }
++    return false;
++}
 -static bool trans_ld(DisasContext *ctx, arg_ld *a)
 +static bool trans_ldu(DisasContext *ctx, arg_ldu *a)
  {
 -    REQUIRE_64BIT(ctx);
 +    REQUIRE_128BIT(ctx);
      return gen_load(ctx, a, MO_TEUQ);
  }
 -static bool gen_store(DisasContext *ctx, arg_sb *a, MemOp memop)
 +static bool gen_store_tl(DisasContext *ctx, arg_sb *a, MemOp memop)
  {
      TCGv addr = get_gpr(ctx, a->rs1, EXT_NONE);
      TCGv data = get_gpr(ctx, a->rs2, EXT_NONE);
@@ -XXX,XX +XXX,XX @@ static bool gen_store(DisasContext *ctx, arg_sb *a, MemOp memop)
      return true;
  }
 +static bool gen_store_i128(DisasContext *ctx, arg_sb *a, MemOp memop)
 +{
 +    TCGv src1l = get_gpr(ctx, a->rs1, EXT_NONE);
 +    TCGv src2l = get_gpr(ctx, a->rs2, EXT_NONE);
 +    TCGv src2h = get_gprh(ctx, a->rs2);
 +    TCGv addrl = tcg_temp_new();
 +
 +    tcg_gen_addi_tl(addrl, src1l, a->imm);
 +
 +    if ((memop & MO_SIZE) <= MO_64) {
 +        tcg_gen_qemu_st_tl(src2l, addrl, ctx->mem_idx, memop);
 +    } else {
 +        /* little-endian memory access assumed for now */
 +        tcg_gen_qemu_st_tl(src2l, addrl, ctx->mem_idx, MO_TEUQ);
 +        tcg_gen_addi_tl(addrl, addrl, 8);
 +        tcg_gen_qemu_st_tl(src2h, addrl, ctx->mem_idx, MO_TEUQ);
 +    }
 +
 +    tcg_temp_free(addrl);
 +    return true;
 +}
 +
 +static bool gen_store(DisasContext *ctx, arg_sb *a, MemOp memop)
 +{
 +    if (get_xl(ctx) == MXL_RV128) {
 +        return gen_store_i128(ctx, a, memop);
 +    } else {
 +        return gen_store_tl(ctx, a, memop);
 +    }
 +}
 +
  static bool trans_sb(DisasContext *ctx, arg_sb *a)
  {
      return gen_store(ctx, a, MO_SB);
@@ -XXX,XX +XXX,XX @@ static bool trans_sw(DisasContext *ctx, arg_sw *a)
  static bool trans_sd(DisasContext *ctx, arg_sd *a)
  {
 -    REQUIRE_64BIT(ctx);
 +    REQUIRE_64_OR_128BIT(ctx);
      return gen_store(ctx, a, MO_TEUQ);
  }
 +static bool trans_sq(DisasContext *ctx, arg_sq *a)
 +{
 +    REQUIRE_128BIT(ctx);
 +    return gen_store(ctx, a, MO_TEUO);
 +}
 +
  static bool trans_addi(DisasContext *ctx, arg_addi *a)
  {
      return gen_arith_imm_fn(ctx, a, EXT_NONE, tcg_gen_addi_tl);
 --
-.31.1
+.41.0

-New patch
+[PULL v2 18/45] target/riscv: Add Zvksh ISA extension support
+From: Lawrence Hunter <lawrence.hunter@codethink.co.uk>
 This commit adds support for the Zvksh vector-crypto extension, which
 consists of the following instructions:
 * vsm3me.vv
 * vsm3c.vi
 Translation functions are defined in
 `target/riscv/insn_trans/trans_rvvk.c.inc` and helpers are defined in
 `target/riscv/vcrypto_helper.c`.
 Co-authored-by: Kiran Ostrolenk <kiran.ostrolenk@codethink.co.uk>
 [max.chou@sifive.com: Replaced vstart checking by TCG op]
 Signed-off-by: Kiran Ostrolenk <kiran.ostrolenk@codethink.co.uk>
 Signed-off-by: Lawrence Hunter <lawrence.hunter@codethink.co.uk>
 Signed-off-by: Max Chou <max.chou@sifive.com>
 Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 [max.chou@sifive.com: Exposed x-zvksh property]
 Message-ID: <20230711165917.2629866-12-max.chou@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
  target/riscv/cpu_cfg.h                   |   1 +
  target/riscv/helper.h                    |   3 +
  target/riscv/insn32.decode               |   4 +
  target/riscv/cpu.c                       |   6 +-
  target/riscv/vcrypto_helper.c            | 134 +++++++++++++++++++++++
  target/riscv/insn_trans/trans_rvvk.c.inc |  31 ++++++
 files changed, 177 insertions(+), 2 deletions(-)
 diff --git a/target/riscv/cpu_cfg.h b/target/riscv/cpu_cfg.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/cpu_cfg.h
 +++ b/target/riscv/cpu_cfg.h
@@ -XXX,XX +XXX,XX @@ struct RISCVCPUConfig {
      bool ext_zvkned;
      bool ext_zvknha;
      bool ext_zvknhb;
 +    bool ext_zvksh;
      bool ext_zmmul;
      bool ext_zvfbfmin;
      bool ext_zvfbfwma;
 diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/helper.h
 +++ b/target/riscv/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_5(vsha2ch32_vv, void, ptr, ptr, ptr, env, i32)
  DEF_HELPER_5(vsha2ch64_vv, void, ptr, ptr, ptr, env, i32)
  DEF_HELPER_5(vsha2cl32_vv, void, ptr, ptr, ptr, env, i32)
  DEF_HELPER_5(vsha2cl64_vv, void, ptr, ptr, ptr, env, i32)
 +
 +DEF_HELPER_5(vsm3me_vv, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_5(vsm3c_vi, void, ptr, ptr, i32, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@ vaeskf2_vi  101010 1 ..... ..... 010 ..... 1110111 @r_vm_1
  vsha2ms_vv  101101 1 ..... ..... 010 ..... 1110111 @r_vm_1
  vsha2ch_vv  101110 1 ..... ..... 010 ..... 1110111 @r_vm_1
  vsha2cl_vv  101111 1 ..... ..... 010 ..... 1110111 @r_vm_1
 +
 +# *** Zvksh vector crypto extension ***
 +vsm3me_vv   100000 1 ..... ..... 010 ..... 1110111 @r_vm_1
 +vsm3c_vi    101011 1 ..... ..... 010 ..... 1110111 @r_vm_1
 diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/cpu.c
 +++ b/target/riscv/cpu.c
@@ -XXX,XX +XXX,XX @@ static const struct isa_ext_data isa_edata_arr[] = {
      ISA_EXT_DATA_ENTRY(zvkned, PRIV_VERSION_1_12_0, ext_zvkned),
      ISA_EXT_DATA_ENTRY(zvknha, PRIV_VERSION_1_12_0, ext_zvknha),
      ISA_EXT_DATA_ENTRY(zvknhb, PRIV_VERSION_1_12_0, ext_zvknhb),
 +    ISA_EXT_DATA_ENTRY(zvksh, PRIV_VERSION_1_12_0, ext_zvksh),
      ISA_EXT_DATA_ENTRY(zhinx, PRIV_VERSION_1_12_0, ext_zhinx),
      ISA_EXT_DATA_ENTRY(zhinxmin, PRIV_VERSION_1_12_0, ext_zhinxmin),
      ISA_EXT_DATA_ENTRY(smaia, PRIV_VERSION_1_12_0, ext_smaia),
@@ -XXX,XX +XXX,XX @@ void riscv_cpu_validate_set_extensions(RISCVCPU *cpu, Error **errp)
       * In principle Zve*x would also suffice here, were they supported
       * in qemu
       */
 -    if ((cpu->cfg.ext_zvbb || cpu->cfg.ext_zvkned || cpu->cfg.ext_zvknha) &&
 -        !cpu->cfg.ext_zve32f) {
 +    if ((cpu->cfg.ext_zvbb || cpu->cfg.ext_zvkned || cpu->cfg.ext_zvknha ||
 +         cpu->cfg.ext_zvksh) && !cpu->cfg.ext_zve32f) {
          error_setg(errp,
                     "Vector crypto extensions require V or Zve* extensions");
          return;
@@ -XXX,XX +XXX,XX @@ static Property riscv_cpu_extensions[] = {
      DEFINE_PROP_BOOL("x-zvkned", RISCVCPU, cfg.ext_zvkned, false),
      DEFINE_PROP_BOOL("x-zvknha", RISCVCPU, cfg.ext_zvknha, false),
      DEFINE_PROP_BOOL("x-zvknhb", RISCVCPU, cfg.ext_zvknhb, false),
 +    DEFINE_PROP_BOOL("x-zvksh", RISCVCPU, cfg.ext_zvksh, false),
      DEFINE_PROP_END_OF_LIST(),
  };
 diff --git a/target/riscv/vcrypto_helper.c b/target/riscv/vcrypto_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vcrypto_helper.c
 +++ b/target/riscv/vcrypto_helper.c
@@ -XXX,XX +XXX,XX @@ void HELPER(vsha2cl64_vv)(void *vd, void *vs1, void *vs2, CPURISCVState *env,
      vext_set_elems_1s(vd, vta, env->vl * esz, total_elems * esz);
      env->vstart = 0;
  }
 +
 +static inline uint32_t p1(uint32_t x)
 +{
 +    return x ^ rol32(x, 15) ^ rol32(x, 23);
 +}
 +
 +static inline uint32_t zvksh_w(uint32_t m16, uint32_t m9, uint32_t m3,
 +                               uint32_t m13, uint32_t m6)
 +{
 +    return p1(m16 ^ m9 ^ rol32(m3, 15)) ^ rol32(m13, 7) ^ m6;
 +}
 +
 +void HELPER(vsm3me_vv)(void *vd_vptr, void *vs1_vptr, void *vs2_vptr,
 +                       CPURISCVState *env, uint32_t desc)
 +{
 +    uint32_t esz = memop_size(FIELD_EX64(env->vtype, VTYPE, VSEW));
 +    uint32_t total_elems = vext_get_total_elems(env, desc, esz);
 +    uint32_t vta = vext_vta(desc);
 +    uint32_t *vd = vd_vptr;
 +    uint32_t *vs1 = vs1_vptr;
 +    uint32_t *vs2 = vs2_vptr;
 +
 +    for (int i = env->vstart / 8; i < env->vl / 8; i++) {
 +        uint32_t w[24];
 +        for (int j = 0; j < 8; j++) {
 +            w[j] = bswap32(vs1[H4((i * 8) + j)]);
 +            w[j + 8] = bswap32(vs2[H4((i * 8) + j)]);
 +        }
 +        for (int j = 0; j < 8; j++) {
 +            w[j + 16] =
 +                zvksh_w(w[j], w[j + 7], w[j + 13], w[j + 3], w[j + 10]);
 +        }
 +        for (int j = 0; j < 8; j++) {
 +            vd[(i * 8) + j] = bswap32(w[H4(j + 16)]);
 +        }
 +    }
 +    vext_set_elems_1s(vd_vptr, vta, env->vl * esz, total_elems * esz);
 +    env->vstart = 0;
 +}
 +
 +static inline uint32_t ff1(uint32_t x, uint32_t y, uint32_t z)
 +{
 +    return x ^ y ^ z;
 +}
 +
 +static inline uint32_t ff2(uint32_t x, uint32_t y, uint32_t z)
 +{
 +    return (x & y) | (x & z) | (y & z);
 +}
 +
 +static inline uint32_t ff_j(uint32_t x, uint32_t y, uint32_t z, uint32_t j)
 +{
 +    return (j <= 15) ? ff1(x, y, z) : ff2(x, y, z);
 +}
 +
 +static inline uint32_t gg1(uint32_t x, uint32_t y, uint32_t z)
 +{
 +    return x ^ y ^ z;
 +}
 +
 +static inline uint32_t gg2(uint32_t x, uint32_t y, uint32_t z)
 +{
 +    return (x & y) | (~x & z);
 +}
 +
 +static inline uint32_t gg_j(uint32_t x, uint32_t y, uint32_t z, uint32_t j)
 +{
 +    return (j <= 15) ? gg1(x, y, z) : gg2(x, y, z);
 +}
 +
 +static inline uint32_t t_j(uint32_t j)
 +{
 +    return (j <= 15) ? 0x79cc4519 : 0x7a879d8a;
 +}
 +
 +static inline uint32_t p_0(uint32_t x)
 +{
 +    return x ^ rol32(x, 9) ^ rol32(x, 17);
 +}
 +
 +static void sm3c(uint32_t *vd, uint32_t *vs1, uint32_t *vs2, uint32_t uimm)
 +{
 +    uint32_t x0, x1;
 +    uint32_t j;
 +    uint32_t ss1, ss2, tt1, tt2;
 +    x0 = vs2[0] ^ vs2[4];
 +    x1 = vs2[1] ^ vs2[5];
 +    j = 2 * uimm;
 +    ss1 = rol32(rol32(vs1[0], 12) + vs1[4] + rol32(t_j(j), j % 32), 7);
 +    ss2 = ss1 ^ rol32(vs1[0], 12);
 +    tt1 = ff_j(vs1[0], vs1[1], vs1[2], j) + vs1[3] + ss2 + x0;
 +    tt2 = gg_j(vs1[4], vs1[5], vs1[6], j) + vs1[7] + ss1 + vs2[0];
 +    vs1[3] = vs1[2];
 +    vd[3] = rol32(vs1[1], 9);
 +    vs1[1] = vs1[0];
 +    vd[1] = tt1;
 +    vs1[7] = vs1[6];
 +    vd[7] = rol32(vs1[5], 19);
 +    vs1[5] = vs1[4];
 +    vd[5] = p_0(tt2);
 +    j = 2 * uimm + 1;
 +    ss1 = rol32(rol32(vd[1], 12) + vd[5] + rol32(t_j(j), j % 32), 7);
 +    ss2 = ss1 ^ rol32(vd[1], 12);
 +    tt1 = ff_j(vd[1], vs1[1], vd[3], j) + vs1[3] + ss2 + x1;
 +    tt2 = gg_j(vd[5], vs1[5], vd[7], j) + vs1[7] + ss1 + vs2[1];
 +    vd[2] = rol32(vs1[1], 9);
 +    vd[0] = tt1;
 +    vd[6] = rol32(vs1[5], 19);
 +    vd[4] = p_0(tt2);
 +}
 +
 +void HELPER(vsm3c_vi)(void *vd_vptr, void *vs2_vptr, uint32_t uimm,
 +                      CPURISCVState *env, uint32_t desc)
 +{
 +    uint32_t esz = memop_size(FIELD_EX64(env->vtype, VTYPE, VSEW));
 +    uint32_t total_elems = vext_get_total_elems(env, desc, esz);
 +    uint32_t vta = vext_vta(desc);
 +    uint32_t *vd = vd_vptr;
 +    uint32_t *vs2 = vs2_vptr;
 +    uint32_t v1[8], v2[8], v3[8];
 +
 +    for (int i = env->vstart / 8; i < env->vl / 8; i++) {
 +        for (int k = 0; k < 8; k++) {
 +            v2[k] = bswap32(vd[H4(i * 8 + k)]);
 +            v3[k] = bswap32(vs2[H4(i * 8 + k)]);
 +        }
 +        sm3c(v1, v2, v3, uimm);
 +        for (int k = 0; k < 8; k++) {
 +            vd[i * 8 + k] = bswap32(v1[H4(k)]);
 +        }
 +    }
 +    vext_set_elems_1s(vd_vptr, vta, env->vl * esz, total_elems * esz);
 +    env->vstart = 0;
 +}
 diff --git a/target/riscv/insn_trans/trans_rvvk.c.inc b/target/riscv/insn_trans/trans_rvvk.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvvk.c.inc
 +++ b/target/riscv/insn_trans/trans_rvvk.c.inc
@@ -XXX,XX +XXX,XX @@ static bool trans_vsha2ch_vv(DisasContext *s, arg_rmrr *a)
      }
      return false;
  }
 +
 +/*
 + * Zvksh
 + */
 +
 +#define ZVKSH_EGS 8
 +
 +static inline bool vsm3_check(DisasContext *s, arg_rmrr *a)
 +{
 +    int egw_bytes = ZVKSH_EGS << s->sew;
 +    int mult = 1 << MAX(s->lmul, 0);
 +    return s->cfg_ptr->ext_zvksh == true &&
 +           require_rvv(s) &&
 +           vext_check_isa_ill(s) &&
 +           !is_overlapped(a->rd, mult, a->rs2, mult) &&
 +           MAXSZ(s) >= egw_bytes &&
 +           s->sew == MO_32;
 +}
 +
 +static inline bool vsm3me_check(DisasContext *s, arg_rmrr *a)
 +{
 +    return vsm3_check(s, a) && vext_check_sss(s, a->rd, a->rs1, a->rs2, a->vm);
 +}
 +
 +static inline bool vsm3c_check(DisasContext *s, arg_rmrr *a)
 +{
 +    return vsm3_check(s, a) && vext_check_ss(s, a->rd, a->rs2, a->vm);
 +}
 +
 +GEN_VV_UNMASKED_TRANS(vsm3me_vv, vsm3me_check, ZVKSH_EGS)
 +GEN_VI_UNMASKED_TRANS(vsm3c_vi, vsm3c_check, ZVKSH_EGS)
 --
 .41.0

-[PULL 22/37] target/riscv: array for the 64 upper bits of 128-bit registers
+[PULL v2 19/45] target/riscv: Add Zvkg ISA extension support
-From: Frédéric Pétrot <frederic.petrot@univ-grenoble-alpes.fr>
+From: Nazar Kazakov <nazar.kazakov@codethink.co.uk>
-The upper 64-bit of the 128-bit registers have now a place inside
+This commit adds support for the Zvkg vector-crypto extension, which
-the cpu state structure, and are created as globals for future use.
+consists of the following instructions:
-Signed-off-by: Frédéric Pétrot <frederic.petrot@univ-grenoble-alpes.fr>
+* vgmul.vv
-Co-authored-by: Fabien Portas <fabien.portas@grenoble-inp.org>
+* vghsh.vv
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20220106210108.138226-7-frederic.petrot@univ-grenoble-alpes.fr
+Translation functions are defined in
 `target/riscv/insn_trans/trans_rvvk.c.inc` and helpers are defined in
 `target/riscv/vcrypto_helper.c`.
 Co-authored-by: Lawrence Hunter <lawrence.hunter@codethink.co.uk>
 [max.chou@sifive.com: Replaced vstart checking by TCG op]
 Signed-off-by: Lawrence Hunter <lawrence.hunter@codethink.co.uk>
 Signed-off-by: Nazar Kazakov <nazar.kazakov@codethink.co.uk>
 Signed-off-by: Max Chou <max.chou@sifive.com>
 Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 [max.chou@sifive.com: Exposed x-zvkg property]
 [max.chou@sifive.com: Replaced uint by int for cross win32 build]
 Message-ID: <20230711165917.2629866-13-max.chou@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/cpu.h       |  2 ++
+ target/riscv/cpu_cfg.h                   |  1 +
- target/riscv/cpu.c       |  9 +++++++++
+ target/riscv/helper.h                    |  3 +
- target/riscv/machine.c   | 20 ++++++++++++++++++++
+ target/riscv/insn32.decode               |  4 ++
- target/riscv/translate.c |  5 ++++-
+ target/riscv/cpu.c                       |  6 +-
-files changed, 35 insertions(+), 1 deletion(-)
+ target/riscv/vcrypto_helper.c            | 72 ++++++++++++++++++++++++
+ target/riscv/insn_trans/trans_rvvk.c.inc | 30 ++++++++++
-diff --git a/target/riscv/cpu.h b/target/riscv/cpu.h
+files changed, 114 insertions(+), 2 deletions(-)
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/cpu.h
+diff --git a/target/riscv/cpu_cfg.h b/target/riscv/cpu_cfg.h
-+++ b/target/riscv/cpu.h
+index XXXXXXX..XXXXXXX 100644
-@@ -XXX,XX +XXX,XX @@ FIELD(VTYPE, VILL, sizeof(target_ulong) * 8 - 1, 1)
+--- a/target/riscv/cpu_cfg.h
++++ b/target/riscv/cpu_cfg.h
- struct CPURISCVState {
+@@ -XXX,XX +XXX,XX @@ struct RISCVCPUConfig {
-     target_ulong gpr[32];
+     bool ext_zve64d;
-+    target_ulong gprh[32]; /* 64 top bits of the 128-bit registers */
+     bool ext_zvbb;
-     uint64_t fpr[32]; /* assume both F and D extensions */
+     bool ext_zvbc;
++    bool ext_zvkg;
-     /* vector coprocessor state. */
+     bool ext_zvkned;
-@@ -XXX,XX +XXX,XX @@ static inline bool riscv_feature(CPURISCVState *env, int feature)
+     bool ext_zvknha;
- #include "cpu_user.h"
+     bool ext_zvknhb;
+diff --git a/target/riscv/helper.h b/target/riscv/helper.h
- extern const char * const riscv_int_regnames[];
+index XXXXXXX..XXXXXXX 100644
-+extern const char * const riscv_int_regnamesh[];
+--- a/target/riscv/helper.h
- extern const char * const riscv_fpr_regnames[];
++++ b/target/riscv/helper.h
+@@ -XXX,XX +XXX,XX @@ DEF_HELPER_5(vsha2cl64_vv, void, ptr, ptr, ptr, env, i32)
- const char *riscv_cpu_get_trap_name(target_ulong cause, bool async);
  DEF_HELPER_5(vsm3me_vv, void, ptr, ptr, ptr, env, i32)
  DEF_HELPER_5(vsm3c_vi, void, ptr, ptr, i32, env, i32)
 +
 +DEF_HELPER_5(vghsh_vv, void, ptr, ptr, ptr, env, i32)
 +DEF_HELPER_4(vgmul_vv, void, ptr, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
@@ -XXX,XX +XXX,XX @@ vsha2cl_vv  101111 1 ..... ..... 010 ..... 1110111 @r_vm_1
  # *** Zvksh vector crypto extension ***
  vsm3me_vv   100000 1 ..... ..... 010 ..... 1110111 @r_vm_1
  vsm3c_vi    101011 1 ..... ..... 010 ..... 1110111 @r_vm_1
 +
 +# *** Zvkg vector crypto extension ***
 +vghsh_vv    101100 1 ..... ..... 010 ..... 1110111 @r_vm_1
 +vgmul_vv    101000 1 ..... 10001 010 ..... 1110111 @r2_vm_1
 diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/cpu.c
 +++ b/target/riscv/cpu.c
-@@ -XXX,XX +XXX,XX @@ const char * const riscv_int_regnames[] = {
+@@ -XXX,XX +XXX,XX @@ static const struct isa_ext_data isa_edata_arr[] = {
-   "x28/t3",  "x29/t4", "x30/t5", "x31/t6"
+     ISA_EXT_DATA_ENTRY(zvfbfwma, PRIV_VERSION_1_12_0, ext_zvfbfwma),
- };
+     ISA_EXT_DATA_ENTRY(zvfh, PRIV_VERSION_1_12_0, ext_zvfh),
+     ISA_EXT_DATA_ENTRY(zvfhmin, PRIV_VERSION_1_12_0, ext_zvfhmin),
-+const char * const riscv_int_regnamesh[] = {
++    ISA_EXT_DATA_ENTRY(zvkg, PRIV_VERSION_1_12_0, ext_zvkg),
-+  "x0h/zeroh", "x1h/rah",  "x2h/sph",   "x3h/gph",   "x4h/tph",  "x5h/t0h",
+     ISA_EXT_DATA_ENTRY(zvkned, PRIV_VERSION_1_12_0, ext_zvkned),
-+  "x6h/t1h",   "x7h/t2h",  "x8h/s0h",   "x9h/s1h",   "x10h/a0h", "x11h/a1h",
+     ISA_EXT_DATA_ENTRY(zvknha, PRIV_VERSION_1_12_0, ext_zvknha),
-+  "x12h/a2h",  "x13h/a3h", "x14h/a4h",  "x15h/a5h",  "x16h/a6h", "x17h/a7h",
+     ISA_EXT_DATA_ENTRY(zvknhb, PRIV_VERSION_1_12_0, ext_zvknhb),
-+  "x18h/s2h",  "x19h/s3h", "x20h/s4h",  "x21h/s5h",  "x22h/s6h", "x23h/s7h",
+@@ -XXX,XX +XXX,XX @@ void riscv_cpu_validate_set_extensions(RISCVCPU *cpu, Error **errp)
-+  "x24h/s8h",  "x25h/s9h", "x26h/s10h", "x27h/s11h", "x28h/t3h", "x29h/t4h",
+      * In principle Zve*x would also suffice here, were they supported
-+  "x30h/t5h",  "x31h/t6h"
+      * in qemu
-+};
+      */
-+
+-    if ((cpu->cfg.ext_zvbb || cpu->cfg.ext_zvkned || cpu->cfg.ext_zvknha ||
- const char * const riscv_fpr_regnames[] = {
+-         cpu->cfg.ext_zvksh) && !cpu->cfg.ext_zve32f) {
-   "f0/ft0",   "f1/ft1",  "f2/ft2",   "f3/ft3",   "f4/ft4",  "f5/ft5",
++    if ((cpu->cfg.ext_zvbb || cpu->cfg.ext_zvkg || cpu->cfg.ext_zvkned ||
-   "f6/ft6",   "f7/ft7",  "f8/fs0",   "f9/fs1",   "f10/fa0", "f11/fa1",
++         cpu->cfg.ext_zvknha || cpu->cfg.ext_zvksh) && !cpu->cfg.ext_zve32f) {
-diff --git a/target/riscv/machine.c b/target/riscv/machine.c
+         error_setg(errp,
-index XXXXXXX..XXXXXXX 100644
+                    "Vector crypto extensions require V or Zve* extensions");
---- a/target/riscv/machine.c
+         return;
-+++ b/target/riscv/machine.c
+@@ -XXX,XX +XXX,XX @@ static Property riscv_cpu_extensions[] = {
-@@ -XXX,XX +XXX,XX @@ static const VMStateDescription vmstate_pointermasking = {
+     /* Vector cryptography extensions */
-     }
+     DEFINE_PROP_BOOL("x-zvbb", RISCVCPU, cfg.ext_zvbb, false),
- };
+     DEFINE_PROP_BOOL("x-zvbc", RISCVCPU, cfg.ext_zvbc, false),
++    DEFINE_PROP_BOOL("x-zvkg", RISCVCPU, cfg.ext_zvkg, false),
-+static bool rv128_needed(void *opaque)
+     DEFINE_PROP_BOOL("x-zvkned", RISCVCPU, cfg.ext_zvkned, false),
-+{
+     DEFINE_PROP_BOOL("x-zvknha", RISCVCPU, cfg.ext_zvknha, false),
-+    RISCVCPU *cpu = opaque;
+     DEFINE_PROP_BOOL("x-zvknhb", RISCVCPU, cfg.ext_zvknhb, false),
-+    CPURISCVState *env = &cpu->env;
+diff --git a/target/riscv/vcrypto_helper.c b/target/riscv/vcrypto_helper.c
-+
+index XXXXXXX..XXXXXXX 100644
-+    return env->misa_mxl_max == MXL_RV128;
+--- a/target/riscv/vcrypto_helper.c
-+}
++++ b/target/riscv/vcrypto_helper.c
-+
+@@ -XXX,XX +XXX,XX @@ void HELPER(vsm3c_vi)(void *vd_vptr, void *vs2_vptr, uint32_t uimm,
-+static const VMStateDescription vmstate_rv128 = {
+     vext_set_elems_1s(vd_vptr, vta, env->vl * esz, total_elems * esz);
-+    .name = "cpu/rv128",
+     env->vstart = 0;
-+    .version_id = 1,
+ }
-+    .minimum_version_id = 1,
++
-+    .needed = rv128_needed,
++void HELPER(vghsh_vv)(void *vd_vptr, void *vs1_vptr, void *vs2_vptr,
-+    .fields = (VMStateField[]) {
++                      CPURISCVState *env, uint32_t desc)
-+        VMSTATE_UINTTL_ARRAY(env.gprh, RISCVCPU, 32),
++{
-+        VMSTATE_END_OF_LIST()
++    uint64_t *vd = vd_vptr;
 +    uint64_t *vs1 = vs1_vptr;
 +    uint64_t *vs2 = vs2_vptr;
 +    uint32_t vta = vext_vta(desc);
 +    uint32_t total_elems = vext_get_total_elems(env, desc, 4);
 +
 +    for (uint32_t i = env->vstart / 4; i < env->vl / 4; i++) {
 +        uint64_t Y[2] = {vd[i * 2 + 0], vd[i * 2 + 1]};
 +        uint64_t H[2] = {brev8(vs2[i * 2 + 0]), brev8(vs2[i * 2 + 1])};
 +        uint64_t X[2] = {vs1[i * 2 + 0], vs1[i * 2 + 1]};
 +        uint64_t Z[2] = {0, 0};
 +
 +        uint64_t S[2] = {brev8(Y[0] ^ X[0]), brev8(Y[1] ^ X[1])};
 +
 +        for (int j = 0; j < 128; j++) {
 +            if ((S[j / 64] >> (j % 64)) & 1) {
 +                Z[0] ^= H[0];
 +                Z[1] ^= H[1];
 +            }
 +            bool reduce = ((H[1] >> 63) & 1);
 +            H[1] = H[1] << 1 | H[0] >> 63;
 +            H[0] = H[0] << 1;
 +            if (reduce) {
 +                H[0] ^= 0x87;
 +            }
 +        }
 +
 +        vd[i * 2 + 0] = brev8(Z[0]);
 +        vd[i * 2 + 1] = brev8(Z[1]);
 +    }
-+};
++    /* set tail elements to 1s */
-+
++    vext_set_elems_1s(vd, vta, env->vl * 4, total_elems * 4);
- const VMStateDescription vmstate_riscv_cpu = {
++    env->vstart = 0;
-     .name = "cpu",
++}
-     .version_id = 3,
++
-@@ -XXX,XX +XXX,XX @@ const VMStateDescription vmstate_riscv_cpu = {
++void HELPER(vgmul_vv)(void *vd_vptr, void *vs2_vptr, CPURISCVState *env,
-         &vmstate_hyper,
++                      uint32_t desc)
-         &vmstate_vector,
++{
-         &vmstate_pointermasking,
++    uint64_t *vd = vd_vptr;
-+        &vmstate_rv128,
++    uint64_t *vs2 = vs2_vptr;
-         NULL
++    uint32_t vta = vext_vta(desc);
-     }
++    uint32_t total_elems = vext_get_total_elems(env, desc, 4);
- };
++
-diff --git a/target/riscv/translate.c b/target/riscv/translate.c
++    for (uint32_t i = env->vstart / 4; i < env->vl / 4; i++) {
-index XXXXXXX..XXXXXXX 100644
++        uint64_t Y[2] = {brev8(vd[i * 2 + 0]), brev8(vd[i * 2 + 1])};
---- a/target/riscv/translate.c
++        uint64_t H[2] = {brev8(vs2[i * 2 + 0]), brev8(vs2[i * 2 + 1])};
-+++ b/target/riscv/translate.c
++        uint64_t Z[2] = {0, 0};
-@@ -XXX,XX +XXX,XX @@
++
- #include "internals.h"
++        for (int j = 0; j < 128; j++) {
++            if ((Y[j / 64] >> (j % 64)) & 1) {
- /* global register indices */
++                Z[0] ^= H[0];
--static TCGv cpu_gpr[32], cpu_pc, cpu_vl, cpu_vstart;
++                Z[1] ^= H[1];
-+static TCGv cpu_gpr[32], cpu_gprh[32], cpu_pc, cpu_vl, cpu_vstart;
++            }
- static TCGv_i64 cpu_fpr[32]; /* assume F and D extensions */
++            bool reduce = ((H[1] >> 63) & 1);
- static TCGv load_res;
++            H[1] = H[1] << 1 | H[0] >> 63;
- static TCGv load_val;
++            H[0] = H[0] << 1;
-@@ -XXX,XX +XXX,XX @@ void riscv_translate_init(void)
++            if (reduce) {
-      * unless you specifically block reads/writes to reg 0.
++                H[0] ^= 0x87;
-      */
++            }
-     cpu_gpr[0] = NULL;
++        }
-+    cpu_gprh[0] = NULL;
++
++        vd[i * 2 + 0] = brev8(Z[0]);
-     for (i = 1; i < 32; i++) {
++        vd[i * 2 + 1] = brev8(Z[1]);
-         cpu_gpr[i] = tcg_global_mem_new(cpu_env,
++    }
-             offsetof(CPURISCVState, gpr[i]), riscv_int_regnames[i]);
++    /* set tail elements to 1s */
-+        cpu_gprh[i] = tcg_global_mem_new(cpu_env,
++    vext_set_elems_1s(vd, vta, env->vl * 4, total_elems * 4);
-+            offsetof(CPURISCVState, gprh[i]), riscv_int_regnamesh[i]);
++    env->vstart = 0;
-     }
++}
+diff --git a/target/riscv/insn_trans/trans_rvvk.c.inc b/target/riscv/insn_trans/trans_rvvk.c.inc
-     for (i = 0; i < 32; i++) {
+index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvvk.c.inc
 +++ b/target/riscv/insn_trans/trans_rvvk.c.inc
@@ -XXX,XX +XXX,XX @@ static inline bool vsm3c_check(DisasContext *s, arg_rmrr *a)
  GEN_VV_UNMASKED_TRANS(vsm3me_vv, vsm3me_check, ZVKSH_EGS)
  GEN_VI_UNMASKED_TRANS(vsm3c_vi, vsm3c_check, ZVKSH_EGS)
 +
 +/*
 + * Zvkg
 + */
 +
 +#define ZVKG_EGS 4
 +
 +static bool vgmul_check(DisasContext *s, arg_rmr *a)
 +{
 +    int egw_bytes = ZVKG_EGS << s->sew;
 +    return s->cfg_ptr->ext_zvkg == true &&
 +           vext_check_isa_ill(s) &&
 +           require_rvv(s) &&
 +           MAXSZ(s) >= egw_bytes &&
 +           vext_check_ss(s, a->rd, a->rs2, a->vm) &&
 +           s->sew == MO_32;
 +}
 +
 +GEN_V_UNMASKED_TRANS(vgmul_vv, vgmul_check, ZVKG_EGS)
 +
 +static bool vghsh_check(DisasContext *s, arg_rmrr *a)
 +{
 +    int egw_bytes = ZVKG_EGS << s->sew;
 +    return s->cfg_ptr->ext_zvkg == true &&
 +           opivv_check(s, a) &&
 +           MAXSZ(s) >= egw_bytes &&
 +           s->sew == MO_32;
 +}
 +
 +GEN_VV_UNMASKED_TRANS(vghsh_vv, vghsh_check, ZVKG_EGS)
 --
-.31.1
+.41.0

-[PULL 05/37] hw/intc: sifive_plic: Cleanup the write function
+[PULL v2 20/45] crypto: Create sm4_subword
-From: Alistair Francis <alistair.francis@wdc.com>
+From: Max Chou <max.chou@sifive.com>
+Allows sharing of sm4_subword between different targets.
+Signed-off-by: Max Chou <max.chou@sifive.com>
+Reviewed-by: Frank Chang <frank.chang@sifive.com>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Signed-off-by: Max Chou <max.chou@sifive.com>
+Message-ID: <20230711165917.2629866-14-max.chou@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
-Reviewed-by: Bin Meng <bmeng.cn@gmail.com>
-Message-Id: <20220105213937.1113508-3-alistair.francis@opensource.wdc.com>
 ---
- hw/intc/sifive_plic.c | 76 +++++++++++++++----------------------------
+ include/crypto/sm4.h           |  8 ++++++++
-file changed, 27 insertions(+), 49 deletions(-)
+ target/arm/tcg/crypto_helper.c | 10 ++--------
 files changed, 10 insertions(+), 8 deletions(-)
-diff --git a/hw/intc/sifive_plic.c b/hw/intc/sifive_plic.c
+diff --git a/include/crypto/sm4.h b/include/crypto/sm4.h
 index XXXXXXX..XXXXXXX 100644
---- a/hw/intc/sifive_plic.c
+--- a/include/crypto/sm4.h
-+++ b/hw/intc/sifive_plic.c
++++ b/include/crypto/sm4.h
 @@ -XXX,XX +XXX,XX @@
- #define RISCV_DEBUG_PLIC 0
+ extern const uint8_t sm4_sbox[256];
-+static bool addr_between(uint32_t addr, uint32_t base, uint32_t num)
++static inline uint32_t sm4_subword(uint32_t word)
 +{
-+    return addr >= base && addr - base < num;
++    return sm4_sbox[word & 0xff] |
 +           sm4_sbox[(word >> 8) & 0xff] << 8 |
 +           sm4_sbox[(word >> 16) & 0xff] << 16 |
 +           sm4_sbox[(word >> 24) & 0xff] << 24;
 +}
 +
- static PLICMode char_to_mode(char c)
+ #endif
- {
+diff --git a/target/arm/tcg/crypto_helper.c b/target/arm/tcg/crypto_helper.c
-     switch (c) {
+index XXXXXXX..XXXXXXX 100644
-@@ -XXX,XX +XXX,XX @@ static void sifive_plic_write(void *opaque, hwaddr addr, uint64_t value,
+--- a/target/arm/tcg/crypto_helper.c
- {
++++ b/target/arm/tcg/crypto_helper.c
-     SiFivePLICState *plic = opaque;
+@@ -XXX,XX +XXX,XX @@ static void do_crypto_sm4e(uint64_t *rd, uint64_t *rn, uint64_t *rm)
+             CR_ST_WORD(d, (i + 3) % 4) ^
--    /* writes must be 4 byte words */
+             CR_ST_WORD(n, i);
--    if ((addr & 0x3) != 0) {
--        goto err;
+-        t = sm4_sbox[t & 0xff] |
--    }
+-            sm4_sbox[(t >> 8) & 0xff] << 8 |
--
+-            sm4_sbox[(t >> 16) & 0xff] << 16 |
--    if (addr >= plic->priority_base && /* 4 bytes per source */
+-            sm4_sbox[(t >> 24) & 0xff] << 24;
--        addr < plic->priority_base + (plic->num_sources << 2))
++        t = sm4_subword(t);
--    {
-+    if (addr_between(addr, plic->priority_base, plic->num_sources << 2)) {
+         CR_ST_WORD(d, i) ^= t ^ rol32(t, 2) ^ rol32(t, 10) ^ rol32(t, 18) ^
-         uint32_t irq = ((addr - plic->priority_base) >> 2) + 1;
+                             rol32(t, 24);
-+
+@@ -XXX,XX +XXX,XX @@ static void do_crypto_sm4ekey(uint64_t *rd, uint64_t *rn, uint64_t *rm)
-         plic->source_priority[irq] = value & 7;
+             CR_ST_WORD(d, (i + 3) % 4) ^
--        if (RISCV_DEBUG_PLIC) {
+             CR_ST_WORD(m, i);
--            qemu_log("plic: write priority: irq=%d priority=%d\n",
--                irq, plic->source_priority[irq]);
+-        t = sm4_sbox[t & 0xff] |
--        }
+-            sm4_sbox[(t >> 8) & 0xff] << 8 |
-         sifive_plic_update(plic);
+-            sm4_sbox[(t >> 16) & 0xff] << 16 |
--        return;
+-            sm4_sbox[(t >> 24) & 0xff] << 24;
--    } else if (addr >= plic->pending_base && /* 1 bit per source */
++        t = sm4_subword(t);
--               addr < plic->pending_base + (plic->num_sources >> 3))
--    {
+         CR_ST_WORD(d, i) ^= t ^ rol32(t, 13) ^ rol32(t, 23);
 +    } else if (addr_between(addr, plic->pending_base,
 +                            plic->num_sources >> 3)) {
          qemu_log_mask(LOG_GUEST_ERROR,
                        "%s: invalid pending write: 0x%" HWADDR_PRIx "",
                        __func__, addr);
 -        return;
 -    } else if (addr >= plic->enable_base && /* 1 bit per source */
 -        addr < plic->enable_base + plic->num_addrs * plic->enable_stride)
 -    {
 +    } else if (addr_between(addr, plic->enable_base,
 +                            plic->num_addrs * plic->enable_stride)) {
          uint32_t addrid = (addr - plic->enable_base) / plic->enable_stride;
          uint32_t wordid = (addr & (plic->enable_stride - 1)) >> 2;
 +
          if (wordid < plic->bitfield_words) {
              plic->enable[addrid * plic->bitfield_words + wordid] = value;
 -            if (RISCV_DEBUG_PLIC) {
 -                qemu_log("plic: write enable: hart%d-%c word=%d value=%x\n",
 -                    plic->addr_config[addrid].hartid,
 -                    mode_to_char(plic->addr_config[addrid].mode), wordid,
 -                    plic->enable[addrid * plic->bitfield_words + wordid]);
 -            }
 -            return;
 +        } else {
 +            qemu_log_mask(LOG_GUEST_ERROR,
 +                          "%s: Invalid enable write 0x%" HWADDR_PRIx "\n",
 +                          __func__, addr);
          }
 -    } else if (addr >= plic->context_base && /* 4 bytes per reg */
 -        addr < plic->context_base + plic->num_addrs * plic->context_stride)
 -    {
 +    } else if (addr_between(addr, plic->context_base,
 +                            plic->num_addrs * plic->context_stride)) {
          uint32_t addrid = (addr - plic->context_base) / plic->context_stride;
          uint32_t contextid = (addr & (plic->context_stride - 1));
 +
          if (contextid == 0) {
 -            if (RISCV_DEBUG_PLIC) {
 -                qemu_log("plic: write priority: hart%d-%c priority=%x\n",
 -                    plic->addr_config[addrid].hartid,
 -                    mode_to_char(plic->addr_config[addrid].mode),
 -                    plic->target_priority[addrid]);
 -            }
              if (value <= plic->num_priorities) {
                  plic->target_priority[addrid] = value;
                  sifive_plic_update(plic);
              }
 -            return;
          } else if (contextid == 4) {
 -            if (RISCV_DEBUG_PLIC) {
 -                qemu_log("plic: write claim: hart%d-%c irq=%x\n",
 -                    plic->addr_config[addrid].hartid,
 -                    mode_to_char(plic->addr_config[addrid].mode),
 -                    (uint32_t)value);
 -            }
              if (value < plic->num_sources) {
                  sifive_plic_set_claimed(plic, value, false);
                  sifive_plic_update(plic);
              }
 -            return;
 +        } else {
 +            qemu_log_mask(LOG_GUEST_ERROR,
 +                          "%s: Invalid context write 0x%" HWADDR_PRIx "\n",
 +                          __func__, addr);
          }
 +    } else {
 +        qemu_log_mask(LOG_GUEST_ERROR,
 +                      "%s: Invalid register write 0x%" HWADDR_PRIx "\n",
 +                      __func__, addr);
      }
--
--err:
--    qemu_log_mask(LOG_GUEST_ERROR,
--                  "%s: Invalid register write 0x%" HWADDR_PRIx "\n",
--                  __func__, addr);
- }
- static const MemoryRegionOps sifive_plic_ops = {
 --
-.31.1
+.41.0

-New patch
+[PULL v2 21/45] crypto: Add SM4 constant parameter CK
+From: Max Chou <max.chou@sifive.com>
+Adds sm4_ck constant for use in sm4 cryptography across different targets.
+Signed-off-by: Max Chou <max.chou@sifive.com>
+Reviewed-by: Frank Chang <frank.chang@sifive.com>
+Signed-off-by: Max Chou <max.chou@sifive.com>
+Message-ID: <20230711165917.2629866-15-max.chou@sifive.com>
+Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
+---
+ include/crypto/sm4.h |  1 +
+ crypto/sm4.c         | 10 ++++++++++
+files changed, 11 insertions(+)
+diff --git a/include/crypto/sm4.h b/include/crypto/sm4.h
+index XXXXXXX..XXXXXXX 100644
+--- a/include/crypto/sm4.h
++++ b/include/crypto/sm4.h
+@@ -XXX,XX +XXX,XX @@
+ #define QEMU_SM4_H
+ extern const uint8_t sm4_sbox[256];
++extern const uint32_t sm4_ck[32];
+ static inline uint32_t sm4_subword(uint32_t word)
+ {
+diff --git a/crypto/sm4.c b/crypto/sm4.c
+index XXXXXXX..XXXXXXX 100644
+--- a/crypto/sm4.c
++++ b/crypto/sm4.c
+@@ -XXX,XX +XXX,XX @@ uint8_t const sm4_sbox[] = {
+x79, 0xee, 0x5f, 0x3e, 0xd7, 0xcb, 0x39, 0x48,
+ };
++uint32_t const sm4_ck[] = {
++    0x00070e15, 0x1c232a31, 0x383f464d, 0x545b6269,
++    0x70777e85, 0x8c939aa1, 0xa8afb6bd, 0xc4cbd2d9,
++    0xe0e7eef5, 0xfc030a11, 0x181f262d, 0x343b4249,
++    0x50575e65, 0x6c737a81, 0x888f969d, 0xa4abb2b9,
++    0xc0c7ced5, 0xdce3eaf1, 0xf8ff060d, 0x141b2229,
++    0x30373e45, 0x4c535a61, 0x686f767d, 0x848b9299,
++    0xa0a7aeb5, 0xbcc3cad1, 0xd8dfe6ed, 0xf4fb0209,
++    0x10171e25, 0x2c333a41, 0x484f565d, 0x646b7279
++};
+--
+.41.0

-[PULL 29/37] target/riscv: support for 128-bit arithmetic instructions
+[PULL v2 22/45] target/riscv: Add Zvksed ISA extension support
-From: Frédéric Pétrot <frederic.petrot@univ-grenoble-alpes.fr>
+From: Max Chou <max.chou@sifive.com>
-Addition of 128-bit adds and subs in their various sizes,
+This commit adds support for the Zvksed vector-crypto extension, which
-"set if less than"s and branches.
+consists of the following instructions:
-Refactored the code to have a comparison function used for both stls and
-branches.
+* vsm4k.vi
+* vsm4r.[vv,vs]
-Signed-off-by: Frédéric Pétrot <frederic.petrot@univ-grenoble-alpes.fr>
-Co-authored-by: Fabien Portas <fabien.portas@grenoble-inp.org>
+Translation functions are defined in
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+`target/riscv/insn_trans/trans_rvvk.c.inc` and helpers are defined in
-Message-id: 20220106210108.138226-14-frederic.petrot@univ-grenoble-alpes.fr
+`target/riscv/vcrypto_helper.c`.
 Signed-off-by: Max Chou <max.chou@sifive.com>
 Reviewed-by: Frank Chang <frank.chang@sifive.com>
 [lawrence.hunter@codethink.co.uk: Moved SM4 functions from
 crypto_helper.c to vcrypto_helper.c]
 [nazar.kazakov@codethink.co.uk: Added alignment checks, refactored code to
 use macros, and minor style changes]
 Signed-off-by: Max Chou <max.chou@sifive.com>
 Message-ID: <20230711165917.2629866-16-max.chou@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/insn32.decode              |   3 +
+ target/riscv/cpu_cfg.h                   |   1 +
- target/riscv/translate.c                |  63 ++++++++--
+ target/riscv/helper.h                    |   4 +
- target/riscv/insn_trans/trans_rvb.c.inc |  20 +--
+ target/riscv/insn32.decode               |   5 +
- target/riscv/insn_trans/trans_rvi.c.inc | 159 +++++++++++++++++++++---
+ target/riscv/cpu.c                       |   5 +-
- target/riscv/insn_trans/trans_rvm.c.inc |  26 ++--
+ target/riscv/vcrypto_helper.c            | 127 +++++++++++++++++++++++
-files changed, 222 insertions(+), 49 deletions(-)
+ target/riscv/insn_trans/trans_rvvk.c.inc |  43 ++++++++
+files changed, 184 insertions(+), 1 deletion(-)
 diff --git a/target/riscv/cpu_cfg.h b/target/riscv/cpu_cfg.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/cpu_cfg.h
 +++ b/target/riscv/cpu_cfg.h
@@ -XXX,XX +XXX,XX @@ struct RISCVCPUConfig {
      bool ext_zvkned;
      bool ext_zvknha;
      bool ext_zvknhb;
 +    bool ext_zvksed;
      bool ext_zvksh;
      bool ext_zmmul;
      bool ext_zvfbfmin;
 diff --git a/target/riscv/helper.h b/target/riscv/helper.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/helper.h
 +++ b/target/riscv/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_5(vsm3c_vi, void, ptr, ptr, i32, env, i32)
  DEF_HELPER_5(vghsh_vv, void, ptr, ptr, ptr, env, i32)
  DEF_HELPER_4(vgmul_vv, void, ptr, ptr, env, i32)
 +
 +DEF_HELPER_5(vsm4k_vi, void, ptr, ptr, i32, env, i32)
 +DEF_HELPER_4(vsm4r_vv, void, ptr, ptr, env, i32)
 +DEF_HELPER_4(vsm4r_vs, void, ptr, ptr, env, i32)
 diff --git a/target/riscv/insn32.decode b/target/riscv/insn32.decode
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn32.decode
 +++ b/target/riscv/insn32.decode
-@@ -XXX,XX +XXX,XX @@ sraw     0100000 .....  ..... 101 ..... 0111011 @r
+@@ -XXX,XX +XXX,XX @@ vsm3c_vi    101011 1 ..... ..... 010 ..... 1110111 @r_vm_1
- ldu      ............   ..... 111 ..... 0000011 @i
+ # *** Zvkg vector crypto extension ***
- lq       ............   ..... 010 ..... 0001111 @i
+ vghsh_vv    101100 1 ..... ..... 010 ..... 1110111 @r_vm_1
- sq       ............   ..... 100 ..... 0100011 @s
+ vgmul_vv    101000 1 ..... 10001 010 ..... 1110111 @r2_vm_1
-+addid    ............  .....  000 ..... 1011011 @i
++
- sllid    000000 ......  ..... 001 ..... 1011011 @sh6
++# *** Zvksed vector crypto extension ***
- srlid    000000 ......  ..... 101 ..... 1011011 @sh6
++vsm4k_vi    100001 1 ..... ..... 010 ..... 1110111 @r_vm_1
- sraid    010000 ......  ..... 101 ..... 1011011 @sh6
++vsm4r_vv    101000 1 ..... 10000 010 ..... 1110111 @r2_vm_1
-+addd     0000000 ..... .....  000 ..... 1111011 @r
++vsm4r_vs    101001 1 ..... 10000 010 ..... 1110111 @r2_vm_1
-+subd     0100000 ..... .....  000 ..... 1111011 @r
+diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
- slld     0000000 ..... .....  001 ..... 1111011 @r
+index XXXXXXX..XXXXXXX 100644
- srld     0000000 ..... .....  101 ..... 1111011 @r
+--- a/target/riscv/cpu.c
- srad     0100000 ..... .....  101 ..... 1111011 @r
++++ b/target/riscv/cpu.c
-diff --git a/target/riscv/translate.c b/target/riscv/translate.c
+@@ -XXX,XX +XXX,XX @@ static const struct isa_ext_data isa_edata_arr[] = {
-index XXXXXXX..XXXXXXX 100644
+     ISA_EXT_DATA_ENTRY(zvkned, PRIV_VERSION_1_12_0, ext_zvkned),
---- a/target/riscv/translate.c
+     ISA_EXT_DATA_ENTRY(zvknha, PRIV_VERSION_1_12_0, ext_zvknha),
-+++ b/target/riscv/translate.c
+     ISA_EXT_DATA_ENTRY(zvknhb, PRIV_VERSION_1_12_0, ext_zvknhb),
-@@ -XXX,XX +XXX,XX @@ static bool gen_logic(DisasContext *ctx, arg_r *a,
++    ISA_EXT_DATA_ENTRY(zvksed, PRIV_VERSION_1_12_0, ext_zvksed),
      ISA_EXT_DATA_ENTRY(zvksh, PRIV_VERSION_1_12_0, ext_zvksh),
      ISA_EXT_DATA_ENTRY(zhinx, PRIV_VERSION_1_12_0, ext_zhinx),
      ISA_EXT_DATA_ENTRY(zhinxmin, PRIV_VERSION_1_12_0, ext_zhinxmin),
@@ -XXX,XX +XXX,XX @@ void riscv_cpu_validate_set_extensions(RISCVCPU *cpu, Error **errp)
       * in qemu
       */
      if ((cpu->cfg.ext_zvbb || cpu->cfg.ext_zvkg || cpu->cfg.ext_zvkned ||
 -         cpu->cfg.ext_zvknha || cpu->cfg.ext_zvksh) && !cpu->cfg.ext_zve32f) {
 +         cpu->cfg.ext_zvknha || cpu->cfg.ext_zvksed || cpu->cfg.ext_zvksh) &&
 +        !cpu->cfg.ext_zve32f) {
          error_setg(errp,
                     "Vector crypto extensions require V or Zve* extensions");
          return;
@@ -XXX,XX +XXX,XX @@ static Property riscv_cpu_extensions[] = {
      DEFINE_PROP_BOOL("x-zvkned", RISCVCPU, cfg.ext_zvkned, false),
      DEFINE_PROP_BOOL("x-zvknha", RISCVCPU, cfg.ext_zvknha, false),
      DEFINE_PROP_BOOL("x-zvknhb", RISCVCPU, cfg.ext_zvknhb, false),
 +    DEFINE_PROP_BOOL("x-zvksed", RISCVCPU, cfg.ext_zvksed, false),
      DEFINE_PROP_BOOL("x-zvksh", RISCVCPU, cfg.ext_zvksh, false),
      DEFINE_PROP_END_OF_LIST(),
 diff --git a/target/riscv/vcrypto_helper.c b/target/riscv/vcrypto_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/vcrypto_helper.c
 +++ b/target/riscv/vcrypto_helper.c
@@ -XXX,XX +XXX,XX @@
  #include "cpu.h"
  #include "crypto/aes.h"
  #include "crypto/aes-round.h"
 +#include "crypto/sm4.h"
  #include "exec/memop.h"
  #include "exec/exec-all.h"
  #include "exec/helper-proto.h"
@@ -XXX,XX +XXX,XX @@ void HELPER(vgmul_vv)(void *vd_vptr, void *vs2_vptr, CPURISCVState *env,
      vext_set_elems_1s(vd, vta, env->vl * 4, total_elems * 4);
      env->vstart = 0;
  }
++
- static bool gen_arith_imm_fn(DisasContext *ctx, arg_i *a, DisasExtend ext,
++void HELPER(vsm4k_vi)(void *vd, void *vs2, uint32_t uimm5, CPURISCVState *env,
--                             void (*func)(TCGv, TCGv, target_long))
++                      uint32_t desc)
-+                             void (*func)(TCGv, TCGv, target_long),
++{
-+                             void (*f128)(TCGv, TCGv, TCGv, TCGv, target_long))
++    const uint32_t egs = 4;
- {
++    uint32_t rnd = uimm5 & 0x7;
-     TCGv dest = dest_gpr(ctx, a->rd);
++    uint32_t group_start = env->vstart / egs;
-     TCGv src1 = get_gpr(ctx, a->rs1, ext);
++    uint32_t group_end = env->vl / egs;
++    uint32_t esz = sizeof(uint32_t);
--    func(dest, src1, a->imm);
++    uint32_t total_elems = vext_get_total_elems(env, desc, esz);
-+    if (get_ol(ctx) < MXL_RV128) {
++
-+        func(dest, src1, a->imm);
++    for (uint32_t i = group_start; i < group_end; ++i) {
-+        gen_set_gpr(ctx, a->rd, dest);
++        uint32_t vstart = i * egs;
-+    } else {
++        uint32_t vend = (i + 1) * egs;
-+        if (f128 == NULL) {
++        uint32_t rk[4] = {0};
-+            return false;
++        uint32_t tmp[8] = {0};
-+        }
++
++        for (uint32_t j = vstart; j < vend; ++j) {
--    gen_set_gpr(ctx, a->rd, dest);
++            rk[j - vstart] = *((uint32_t *)vs2 + H4(j));
-+        TCGv src1h = get_gprh(ctx, a->rs1);
++        }
-+        TCGv desth = dest_gprh(ctx, a->rd);
++
-+
++        for (uint32_t j = 0; j < egs; ++j) {
-+        f128(dest, desth, src1, src1h, a->imm);
++            tmp[j] = rk[j];
-+        gen_set_gpr128(ctx, a->rd, dest, desth);
++        }
-+    }
++
-     return true;
++        for (uint32_t j = 0; j < egs; ++j) {
 +            uint32_t b, s;
 +            b = tmp[j + 1] ^ tmp[j + 2] ^ tmp[j + 3] ^ sm4_ck[rnd * 4 + j];
 +
 +            s = sm4_subword(b);
 +
 +            tmp[j + 4] = tmp[j] ^ (s ^ rol32(s, 13) ^ rol32(s, 23));
 +        }
 +
 +        for (uint32_t j = vstart; j < vend; ++j) {
 +            *((uint32_t *)vd + H4(j)) = tmp[egs + (j - vstart)];
 +        }
 +    }
 +
 +    env->vstart = 0;
 +    /* set tail elements to 1s */
 +    vext_set_elems_1s(vd, vext_vta(desc), env->vl * esz, total_elems * esz);
 +}
 +
 +static void do_sm4_round(uint32_t *rk, uint32_t *buf)
 +{
 +    const uint32_t egs = 4;
 +    uint32_t s, b;
 +
 +    for (uint32_t j = egs; j < egs * 2; ++j) {
 +        b = buf[j - 3] ^ buf[j - 2] ^ buf[j - 1] ^ rk[j - 4];
 +
 +        s = sm4_subword(b);
 +
 +        buf[j] = buf[j - 4] ^ (s ^ rol32(s, 2) ^ rol32(s, 10) ^ rol32(s, 18) ^
 +                               rol32(s, 24));
 +    }
 +}
 +
 +void HELPER(vsm4r_vv)(void *vd, void *vs2, CPURISCVState *env, uint32_t desc)
 +{
 +    const uint32_t egs = 4;
 +    uint32_t group_start = env->vstart / egs;
 +    uint32_t group_end = env->vl / egs;
 +    uint32_t esz = sizeof(uint32_t);
 +    uint32_t total_elems = vext_get_total_elems(env, desc, esz);
 +
 +    for (uint32_t i = group_start; i < group_end; ++i) {
 +        uint32_t vstart = i * egs;
 +        uint32_t vend = (i + 1) * egs;
 +        uint32_t rk[4] = {0};
 +        uint32_t tmp[8] = {0};
 +
 +        for (uint32_t j = vstart; j < vend; ++j) {
 +            rk[j - vstart] = *((uint32_t *)vs2 + H4(j));
 +        }
 +
 +        for (uint32_t j = vstart; j < vend; ++j) {
 +            tmp[j - vstart] = *((uint32_t *)vd + H4(j));
 +        }
 +
 +        do_sm4_round(rk, tmp);
 +
 +        for (uint32_t j = vstart; j < vend; ++j) {
 +            *((uint32_t *)vd + H4(j)) = tmp[egs + (j - vstart)];
 +        }
 +    }
 +
 +    env->vstart = 0;
 +    /* set tail elements to 1s */
 +    vext_set_elems_1s(vd, vext_vta(desc), env->vl * esz, total_elems * esz);
 +}
 +
 +void HELPER(vsm4r_vs)(void *vd, void *vs2, CPURISCVState *env, uint32_t desc)
 +{
 +    const uint32_t egs = 4;
 +    uint32_t group_start = env->vstart / egs;
 +    uint32_t group_end = env->vl / egs;
 +    uint32_t esz = sizeof(uint32_t);
 +    uint32_t total_elems = vext_get_total_elems(env, desc, esz);
 +
 +    for (uint32_t i = group_start; i < group_end; ++i) {
 +        uint32_t vstart = i * egs;
 +        uint32_t vend = (i + 1) * egs;
 +        uint32_t rk[4] = {0};
 +        uint32_t tmp[8] = {0};
 +
 +        for (uint32_t j = 0; j < egs; ++j) {
 +            rk[j] = *((uint32_t *)vs2 + H4(j));
 +        }
 +
 +        for (uint32_t j = vstart; j < vend; ++j) {
 +            tmp[j - vstart] = *((uint32_t *)vd + H4(j));
 +        }
 +
 +        do_sm4_round(rk, tmp);
 +
 +        for (uint32_t j = vstart; j < vend; ++j) {
 +            *((uint32_t *)vd + H4(j)) = tmp[egs + (j - vstart)];
 +        }
 +    }
 +
 +    env->vstart = 0;
 +    /* set tail elements to 1s */
 +    vext_set_elems_1s(vd, vext_vta(desc), env->vl * esz, total_elems * esz);
 +}
 diff --git a/target/riscv/insn_trans/trans_rvvk.c.inc b/target/riscv/insn_trans/trans_rvvk.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvvk.c.inc
 +++ b/target/riscv/insn_trans/trans_rvvk.c.inc
@@ -XXX,XX +XXX,XX @@ static bool vghsh_check(DisasContext *s, arg_rmrr *a)
  }
- static bool gen_arith_imm_tl(DisasContext *ctx, arg_i *a, DisasExtend ext,
+ GEN_VV_UNMASKED_TRANS(vghsh_vv, vghsh_check, ZVKG_EGS)
--                             void (*func)(TCGv, TCGv, TCGv))
++
-+                             void (*func)(TCGv, TCGv, TCGv),
++/*
-+                             void (*f128)(TCGv, TCGv, TCGv, TCGv, TCGv, TCGv))
++ * Zvksed
- {
++ */
-     TCGv dest = dest_gpr(ctx, a->rd);
++
-     TCGv src1 = get_gpr(ctx, a->rs1, ext);
++#define ZVKSED_EGS 4
-     TCGv src2 = tcg_constant_tl(a->imm);
++
++static bool zvksed_check(DisasContext *s)
--    func(dest, src1, src2);
++{
-+    if (get_ol(ctx) < MXL_RV128) {
++    int egw_bytes = ZVKSED_EGS << s->sew;
-+        func(dest, src1, src2);
++    return s->cfg_ptr->ext_zvksed == true &&
-+        gen_set_gpr(ctx, a->rd, dest);
++           require_rvv(s) &&
-+    } else {
++           vext_check_isa_ill(s) &&
-+        if (f128 == NULL) {
++           MAXSZ(s) >= egw_bytes &&
-+            return false;
++           s->sew == MO_32;
-+        }
++}
++
--    gen_set_gpr(ctx, a->rd, dest);
++static bool vsm4k_vi_check(DisasContext *s, arg_rmrr *a)
-+        TCGv src1h = get_gprh(ctx, a->rs1);
++{
-+        TCGv src2h = tcg_constant_tl(-(a->imm < 0));
++    return zvksed_check(s) &&
-+        TCGv desth = dest_gprh(ctx, a->rd);
++           require_align(a->rd, s->lmul) &&
-+
++           require_align(a->rs2, s->lmul);
-+        f128(dest, desth, src1, src1h, src2, src2h);
++}
-+        gen_set_gpr128(ctx, a->rd, dest, desth);
++
-+    }
++GEN_VI_UNMASKED_TRANS(vsm4k_vi, vsm4k_vi_check, ZVKSED_EGS)
-     return true;
++
- }
++static bool vsm4r_vv_check(DisasContext *s, arg_rmr *a)
++{
- static bool gen_arith(DisasContext *ctx, arg_r *a, DisasExtend ext,
++    return zvksed_check(s) &&
--                      void (*func)(TCGv, TCGv, TCGv))
++           require_align(a->rd, s->lmul) &&
-+                      void (*func)(TCGv, TCGv, TCGv),
++           require_align(a->rs2, s->lmul);
-+                      void (*f128)(TCGv, TCGv, TCGv, TCGv, TCGv, TCGv))
++}
- {
++
-     TCGv dest = dest_gpr(ctx, a->rd);
++GEN_V_UNMASKED_TRANS(vsm4r_vv, vsm4r_vv_check, ZVKSED_EGS)
-     TCGv src1 = get_gpr(ctx, a->rs1, ext);
++
-     TCGv src2 = get_gpr(ctx, a->rs2, ext);
++static bool vsm4r_vs_check(DisasContext *s, arg_rmr *a)
++{
--    func(dest, src1, src2);
++    return zvksed_check(s) &&
-+    if (get_ol(ctx) < MXL_RV128) {
++           !is_overlapped(a->rd, 1 << MAX(s->lmul, 0), a->rs2, 1) &&
-+        func(dest, src1, src2);
++           require_align(a->rd, s->lmul);
-+        gen_set_gpr(ctx, a->rd, dest);
++}
-+    } else {
++
-+        if (f128 == NULL) {
++GEN_V_UNMASKED_TRANS(vsm4r_vs, vsm4r_vs_check, ZVKSED_EGS)
 +            return false;
 +        }
 -    gen_set_gpr(ctx, a->rd, dest);
 +        TCGv src1h = get_gprh(ctx, a->rs1);
 +        TCGv src2h = get_gprh(ctx, a->rs2);
 +        TCGv desth = dest_gprh(ctx, a->rd);
 +
 +        f128(dest, desth, src1, src1h, src2, src2h);
 +        gen_set_gpr128(ctx, a->rd, dest, desth);
 +    }
      return true;
  }
  static bool gen_arith_per_ol(DisasContext *ctx, arg_r *a, DisasExtend ext,
                               void (*f_tl)(TCGv, TCGv, TCGv),
 -                             void (*f_32)(TCGv, TCGv, TCGv))
 +                             void (*f_32)(TCGv, TCGv, TCGv),
 +                             void (*f_128)(TCGv, TCGv, TCGv, TCGv, TCGv, TCGv))
  {
      int olen = get_olen(ctx);
      if (olen != TARGET_LONG_BITS) {
          if (olen == 32) {
              f_tl = f_32;
 -        } else {
 +        } else if (olen != 128) {
              g_assert_not_reached();
          }
      }
 -    return gen_arith(ctx, a, ext, f_tl);
 +    return gen_arith(ctx, a, ext, f_tl, f_128);
  }
  static bool gen_shift_imm_fn(DisasContext *ctx, arg_shift *a, DisasExtend ext,
 diff --git a/target/riscv/insn_trans/trans_rvb.c.inc b/target/riscv/insn_trans/trans_rvb.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvb.c.inc
 +++ b/target/riscv/insn_trans/trans_rvb.c.inc
@@ -XXX,XX +XXX,XX @@ static bool trans_xnor(DisasContext *ctx, arg_xnor *a)
  static bool trans_min(DisasContext *ctx, arg_min *a)
  {
      REQUIRE_ZBB(ctx);
 -    return gen_arith(ctx, a, EXT_SIGN, tcg_gen_smin_tl);
 +    return gen_arith(ctx, a, EXT_SIGN, tcg_gen_smin_tl, NULL);
  }
  static bool trans_max(DisasContext *ctx, arg_max *a)
  {
      REQUIRE_ZBB(ctx);
 -    return gen_arith(ctx, a, EXT_SIGN, tcg_gen_smax_tl);
 +    return gen_arith(ctx, a, EXT_SIGN, tcg_gen_smax_tl, NULL);
  }
  static bool trans_minu(DisasContext *ctx, arg_minu *a)
  {
      REQUIRE_ZBB(ctx);
 -    return gen_arith(ctx, a, EXT_SIGN, tcg_gen_umin_tl);
 +    return gen_arith(ctx, a, EXT_SIGN, tcg_gen_umin_tl, NULL);
  }
  static bool trans_maxu(DisasContext *ctx, arg_maxu *a)
  {
      REQUIRE_ZBB(ctx);
 -    return gen_arith(ctx, a, EXT_SIGN, tcg_gen_umax_tl);
 +    return gen_arith(ctx, a, EXT_SIGN, tcg_gen_umax_tl, NULL);
  }
  static bool trans_sext_b(DisasContext *ctx, arg_sext_b *a)
@@ -XXX,XX +XXX,XX @@ GEN_SHADD(3)
  static bool trans_sh##SHAMT##add(DisasContext *ctx, arg_sh##SHAMT##add *a) \
  {                                                                          \
      REQUIRE_ZBA(ctx);                                                      \
 -    return gen_arith(ctx, a, EXT_NONE, gen_sh##SHAMT##add);                \
 +    return gen_arith(ctx, a, EXT_NONE, gen_sh##SHAMT##add, NULL);          \
  }
  GEN_TRANS_SHADD(1)
@@ -XXX,XX +XXX,XX @@ static bool trans_sh##SHAMT##add_uw(DisasContext *ctx,        \
  {                                                             \
      REQUIRE_64BIT(ctx);                                       \
      REQUIRE_ZBA(ctx);                                         \
 -    return gen_arith(ctx, a, EXT_NONE, gen_sh##SHAMT##add_uw);  \
 +    return gen_arith(ctx, a, EXT_NONE, gen_sh##SHAMT##add_uw, NULL); \
  }
  GEN_TRANS_SHADD_UW(1)
@@ -XXX,XX +XXX,XX @@ static bool trans_add_uw(DisasContext *ctx, arg_add_uw *a)
  {
      REQUIRE_64BIT(ctx);
      REQUIRE_ZBA(ctx);
 -    return gen_arith(ctx, a, EXT_NONE, gen_add_uw);
 +    return gen_arith(ctx, a, EXT_NONE, gen_add_uw, NULL);
  }
  static void gen_slli_uw(TCGv dest, TCGv src, target_long shamt)
@@ -XXX,XX +XXX,XX @@ static bool trans_slli_uw(DisasContext *ctx, arg_slli_uw *a)
  static bool trans_clmul(DisasContext *ctx, arg_clmul *a)
  {
      REQUIRE_ZBC(ctx);
 -    return gen_arith(ctx, a, EXT_NONE, gen_helper_clmul);
 +    return gen_arith(ctx, a, EXT_NONE, gen_helper_clmul, NULL);
  }
  static void gen_clmulh(TCGv dst, TCGv src1, TCGv src2)
@@ -XXX,XX +XXX,XX @@ static void gen_clmulh(TCGv dst, TCGv src1, TCGv src2)
  static bool trans_clmulh(DisasContext *ctx, arg_clmulr *a)
  {
      REQUIRE_ZBC(ctx);
 -    return gen_arith(ctx, a, EXT_NONE, gen_clmulh);
 +    return gen_arith(ctx, a, EXT_NONE, gen_clmulh, NULL);
  }
  static bool trans_clmulr(DisasContext *ctx, arg_clmulh *a)
  {
      REQUIRE_ZBC(ctx);
 -    return gen_arith(ctx, a, EXT_NONE, gen_helper_clmulr);
 +    return gen_arith(ctx, a, EXT_NONE, gen_helper_clmulr, NULL);
  }
 diff --git a/target/riscv/insn_trans/trans_rvi.c.inc b/target/riscv/insn_trans/trans_rvi.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvi.c.inc
 +++ b/target/riscv/insn_trans/trans_rvi.c.inc
@@ -XXX,XX +XXX,XX @@ static bool trans_jalr(DisasContext *ctx, arg_jalr *a)
      return true;
  }
 +static TCGCond gen_compare_i128(bool bz, TCGv rl,
 +                                TCGv al, TCGv ah, TCGv bl, TCGv bh,
 +                                TCGCond cond)
 +{
 +    TCGv rh = tcg_temp_new();
 +    bool invert = false;
 +
 +    switch (cond) {
 +    case TCG_COND_EQ:
 +    case TCG_COND_NE:
 +        if (bz) {
 +            tcg_gen_or_tl(rl, al, ah);
 +        } else {
 +            tcg_gen_xor_tl(rl, al, bl);
 +            tcg_gen_xor_tl(rh, ah, bh);
 +            tcg_gen_or_tl(rl, rl, rh);
 +        }
 +        break;
 +
 +    case TCG_COND_GE:
 +    case TCG_COND_LT:
 +        if (bz) {
 +            tcg_gen_mov_tl(rl, ah);
 +        } else {
 +            TCGv tmp = tcg_temp_new();
 +
 +            tcg_gen_sub2_tl(rl, rh, al, ah, bl, bh);
 +            tcg_gen_xor_tl(rl, rh, ah);
 +            tcg_gen_xor_tl(tmp, ah, bh);
 +            tcg_gen_and_tl(rl, rl, tmp);
 +            tcg_gen_xor_tl(rl, rh, rl);
 +
 +            tcg_temp_free(tmp);
 +        }
 +        break;
 +
 +    case TCG_COND_LTU:
 +        invert = true;
 +        /* fallthrough */
 +    case TCG_COND_GEU:
 +        {
 +            TCGv tmp = tcg_temp_new();
 +            TCGv zero = tcg_constant_tl(0);
 +            TCGv one = tcg_constant_tl(1);
 +
 +            cond = TCG_COND_NE;
 +            /* borrow in to second word */
 +            tcg_gen_setcond_tl(TCG_COND_LTU, tmp, al, bl);
 +            /* seed third word with 1, which will be result */
 +            tcg_gen_sub2_tl(tmp, rh, ah, one, tmp, zero);
 +            tcg_gen_sub2_tl(tmp, rl, tmp, rh, bh, zero);
 +
 +            tcg_temp_free(tmp);
 +        }
 +        break;
 +
 +    default:
 +        g_assert_not_reached();
 +    }
 +
 +    if (invert) {
 +        cond = tcg_invert_cond(cond);
 +    }
 +
 +    tcg_temp_free(rh);
 +    return cond;
 +}
 +
 +static void gen_setcond_i128(TCGv rl, TCGv rh,
 +                             TCGv src1l, TCGv src1h,
 +                             TCGv src2l, TCGv src2h,
 +                             TCGCond cond)
 +{
 +    cond = gen_compare_i128(false, rl, src1l, src1h, src2l, src2h, cond);
 +    tcg_gen_setcondi_tl(cond, rl, rl, 0);
 +    tcg_gen_movi_tl(rh, 0);
 +}
 +
  static bool gen_branch(DisasContext *ctx, arg_b *a, TCGCond cond)
  {
      TCGLabel *l = gen_new_label();
      TCGv src1 = get_gpr(ctx, a->rs1, EXT_SIGN);
      TCGv src2 = get_gpr(ctx, a->rs2, EXT_SIGN);
 -    tcg_gen_brcond_tl(cond, src1, src2, l);
 +    if (get_xl(ctx) == MXL_RV128) {
 +        TCGv src1h = get_gprh(ctx, a->rs1);
 +        TCGv src2h = get_gprh(ctx, a->rs2);
 +        TCGv tmp = tcg_temp_new();
 +
 +        cond = gen_compare_i128(a->rs2 == 0,
 +                                tmp, src1, src1h, src2, src2h, cond);
 +        tcg_gen_brcondi_tl(cond, tmp, 0, l);
 +
 +        tcg_temp_free(tmp);
 +    } else {
 +        tcg_gen_brcond_tl(cond, src1, src2, l);
 +    }
      gen_goto_tb(ctx, 1, ctx->pc_succ_insn);
      gen_set_label(l); /* branch taken */
@@ -XXX,XX +XXX,XX @@ static bool trans_sq(DisasContext *ctx, arg_sq *a)
      return gen_store(ctx, a, MO_TEUO);
  }
 +static bool trans_addd(DisasContext *ctx, arg_addd *a)
 +{
 +    REQUIRE_128BIT(ctx);
 +    ctx->ol = MXL_RV64;
 +    return gen_arith(ctx, a, EXT_NONE, tcg_gen_add_tl, NULL);
 +}
 +
 +static bool trans_addid(DisasContext *ctx, arg_addid *a)
 +{
 +    REQUIRE_128BIT(ctx);
 +    ctx->ol = MXL_RV64;
 +    return gen_arith_imm_fn(ctx, a, EXT_NONE, tcg_gen_addi_tl, NULL);
 +}
 +
 +static bool trans_subd(DisasContext *ctx, arg_subd *a)
 +{
 +    REQUIRE_128BIT(ctx);
 +    ctx->ol = MXL_RV64;
 +    return gen_arith(ctx, a, EXT_NONE, tcg_gen_sub_tl, NULL);
 +}
 +
 +static void gen_addi2_i128(TCGv retl, TCGv reth,
 +                           TCGv srcl, TCGv srch, target_long imm)
 +{
 +    TCGv imml  = tcg_constant_tl(imm);
 +    TCGv immh  = tcg_constant_tl(-(imm < 0));
 +    tcg_gen_add2_tl(retl, reth, srcl, srch, imml, immh);
 +}
 +
  static bool trans_addi(DisasContext *ctx, arg_addi *a)
  {
 -    return gen_arith_imm_fn(ctx, a, EXT_NONE, tcg_gen_addi_tl);
 +    return gen_arith_imm_fn(ctx, a, EXT_NONE, tcg_gen_addi_tl, gen_addi2_i128);
  }
  static void gen_slt(TCGv ret, TCGv s1, TCGv s2)
@@ -XXX,XX +XXX,XX @@ static void gen_slt(TCGv ret, TCGv s1, TCGv s2)
      tcg_gen_setcond_tl(TCG_COND_LT, ret, s1, s2);
  }
 +static void gen_slt_i128(TCGv retl, TCGv reth,
 +                         TCGv s1l, TCGv s1h, TCGv s2l, TCGv s2h)
 +{
 +    gen_setcond_i128(retl, reth, s1l, s1h, s2l, s2h, TCG_COND_LT);
 +}
 +
  static void gen_sltu(TCGv ret, TCGv s1, TCGv s2)
  {
      tcg_gen_setcond_tl(TCG_COND_LTU, ret, s1, s2);
  }
 +static void gen_sltu_i128(TCGv retl, TCGv reth,
 +                          TCGv s1l, TCGv s1h, TCGv s2l, TCGv s2h)
 +{
 +    gen_setcond_i128(retl, reth, s1l, s1h, s2l, s2h, TCG_COND_LTU);
 +}
 +
  static bool trans_slti(DisasContext *ctx, arg_slti *a)
  {
 -    return gen_arith_imm_tl(ctx, a, EXT_SIGN, gen_slt);
 +    return gen_arith_imm_tl(ctx, a, EXT_SIGN, gen_slt, gen_slt_i128);
  }
  static bool trans_sltiu(DisasContext *ctx, arg_sltiu *a)
  {
 -    return gen_arith_imm_tl(ctx, a, EXT_SIGN, gen_sltu);
 +    return gen_arith_imm_tl(ctx, a, EXT_SIGN, gen_sltu, gen_sltu_i128);
  }
  static bool trans_xori(DisasContext *ctx, arg_xori *a)
@@ -XXX,XX +XXX,XX @@ static bool trans_srai(DisasContext *ctx, arg_srai *a)
  static bool trans_add(DisasContext *ctx, arg_add *a)
  {
 -    return gen_arith(ctx, a, EXT_NONE, tcg_gen_add_tl);
 +    return gen_arith(ctx, a, EXT_NONE, tcg_gen_add_tl, tcg_gen_add2_tl);
  }
  static bool trans_sub(DisasContext *ctx, arg_sub *a)
  {
 -    return gen_arith(ctx, a, EXT_NONE, tcg_gen_sub_tl);
 +    return gen_arith(ctx, a, EXT_NONE, tcg_gen_sub_tl, tcg_gen_sub2_tl);
  }
  static void gen_sll_i128(TCGv destl, TCGv desth,
@@ -XXX,XX +XXX,XX @@ static bool trans_sll(DisasContext *ctx, arg_sll *a)
  static bool trans_slt(DisasContext *ctx, arg_slt *a)
  {
 -    return gen_arith(ctx, a, EXT_SIGN, gen_slt);
 +    return gen_arith(ctx, a, EXT_SIGN, gen_slt, gen_slt_i128);
  }
  static bool trans_sltu(DisasContext *ctx, arg_sltu *a)
  {
 -    return gen_arith(ctx, a, EXT_SIGN, gen_sltu);
 +    return gen_arith(ctx, a, EXT_SIGN, gen_sltu, gen_sltu_i128);
  }
  static void gen_srl_i128(TCGv destl, TCGv desth,
@@ -XXX,XX +XXX,XX @@ static bool trans_and(DisasContext *ctx, arg_and *a)
  static bool trans_addiw(DisasContext *ctx, arg_addiw *a)
  {
 -    REQUIRE_64BIT(ctx);
 +    REQUIRE_64_OR_128BIT(ctx);
      ctx->ol = MXL_RV32;
 -    return gen_arith_imm_fn(ctx, a, EXT_NONE, tcg_gen_addi_tl);
 +    return gen_arith_imm_fn(ctx, a, EXT_NONE, tcg_gen_addi_tl, NULL);
  }
  static bool trans_slliw(DisasContext *ctx, arg_slliw *a)
@@ -XXX,XX +XXX,XX @@ static bool trans_sraid(DisasContext *ctx, arg_sraid *a)
  static bool trans_addw(DisasContext *ctx, arg_addw *a)
  {
 -    REQUIRE_64BIT(ctx);
 +    REQUIRE_64_OR_128BIT(ctx);
      ctx->ol = MXL_RV32;
 -    return gen_arith(ctx, a, EXT_NONE, tcg_gen_add_tl);
 +    return gen_arith(ctx, a, EXT_NONE, tcg_gen_add_tl, NULL);
  }
  static bool trans_subw(DisasContext *ctx, arg_subw *a)
  {
 -    REQUIRE_64BIT(ctx);
 +    REQUIRE_64_OR_128BIT(ctx);
      ctx->ol = MXL_RV32;
 -    return gen_arith(ctx, a, EXT_NONE, tcg_gen_sub_tl);
 +    return gen_arith(ctx, a, EXT_NONE, tcg_gen_sub_tl, NULL);
  }
  static bool trans_sllw(DisasContext *ctx, arg_sllw *a)
 diff --git a/target/riscv/insn_trans/trans_rvm.c.inc b/target/riscv/insn_trans/trans_rvm.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvm.c.inc
 +++ b/target/riscv/insn_trans/trans_rvm.c.inc
@@ -XXX,XX +XXX,XX @@
  static bool trans_mul(DisasContext *ctx, arg_mul *a)
  {
      REQUIRE_EXT(ctx, RVM);
 -    return gen_arith(ctx, a, EXT_NONE, tcg_gen_mul_tl);
 +    return gen_arith(ctx, a, EXT_NONE, tcg_gen_mul_tl, NULL);
  }
  static void gen_mulh(TCGv ret, TCGv s1, TCGv s2)
@@ -XXX,XX +XXX,XX @@ static void gen_mulh_w(TCGv ret, TCGv s1, TCGv s2)
  static bool trans_mulh(DisasContext *ctx, arg_mulh *a)
  {
      REQUIRE_EXT(ctx, RVM);
 -    return gen_arith_per_ol(ctx, a, EXT_SIGN, gen_mulh, gen_mulh_w);
 +    return gen_arith_per_ol(ctx, a, EXT_SIGN, gen_mulh, gen_mulh_w, NULL);
  }
  static void gen_mulhsu(TCGv ret, TCGv arg1, TCGv arg2)
@@ -XXX,XX +XXX,XX @@ static void gen_mulhsu_w(TCGv ret, TCGv arg1, TCGv arg2)
  static bool trans_mulhsu(DisasContext *ctx, arg_mulhsu *a)
  {
      REQUIRE_EXT(ctx, RVM);
 -    return gen_arith_per_ol(ctx, a, EXT_NONE, gen_mulhsu, gen_mulhsu_w);
 +    return gen_arith_per_ol(ctx, a, EXT_NONE, gen_mulhsu, gen_mulhsu_w, NULL);
  }
  static void gen_mulhu(TCGv ret, TCGv s1, TCGv s2)
@@ -XXX,XX +XXX,XX @@ static bool trans_mulhu(DisasContext *ctx, arg_mulhu *a)
  {
      REQUIRE_EXT(ctx, RVM);
      /* gen_mulh_w works for either sign as input. */
 -    return gen_arith_per_ol(ctx, a, EXT_ZERO, gen_mulhu, gen_mulh_w);
 +    return gen_arith_per_ol(ctx, a, EXT_ZERO, gen_mulhu, gen_mulh_w, NULL);
  }
  static void gen_div(TCGv ret, TCGv source1, TCGv source2)
@@ -XXX,XX +XXX,XX @@ static void gen_div(TCGv ret, TCGv source1, TCGv source2)
  static bool trans_div(DisasContext *ctx, arg_div *a)
  {
      REQUIRE_EXT(ctx, RVM);
 -    return gen_arith(ctx, a, EXT_SIGN, gen_div);
 +    return gen_arith(ctx, a, EXT_SIGN, gen_div, NULL);
  }
  static void gen_divu(TCGv ret, TCGv source1, TCGv source2)
@@ -XXX,XX +XXX,XX @@ static void gen_divu(TCGv ret, TCGv source1, TCGv source2)
  static bool trans_divu(DisasContext *ctx, arg_divu *a)
  {
      REQUIRE_EXT(ctx, RVM);
 -    return gen_arith(ctx, a, EXT_ZERO, gen_divu);
 +    return gen_arith(ctx, a, EXT_ZERO, gen_divu, NULL);
  }
  static void gen_rem(TCGv ret, TCGv source1, TCGv source2)
@@ -XXX,XX +XXX,XX @@ static void gen_rem(TCGv ret, TCGv source1, TCGv source2)
  static bool trans_rem(DisasContext *ctx, arg_rem *a)
  {
      REQUIRE_EXT(ctx, RVM);
 -    return gen_arith(ctx, a, EXT_SIGN, gen_rem);
 +    return gen_arith(ctx, a, EXT_SIGN, gen_rem, NULL);
  }
  static void gen_remu(TCGv ret, TCGv source1, TCGv source2)
@@ -XXX,XX +XXX,XX @@ static void gen_remu(TCGv ret, TCGv source1, TCGv source2)
  static bool trans_remu(DisasContext *ctx, arg_remu *a)
  {
      REQUIRE_EXT(ctx, RVM);
 -    return gen_arith(ctx, a, EXT_ZERO, gen_remu);
 +    return gen_arith(ctx, a, EXT_ZERO, gen_remu, NULL);
  }
  static bool trans_mulw(DisasContext *ctx, arg_mulw *a)
@@ -XXX,XX +XXX,XX @@ static bool trans_mulw(DisasContext *ctx, arg_mulw *a)
      REQUIRE_64BIT(ctx);
      REQUIRE_EXT(ctx, RVM);
      ctx->ol = MXL_RV32;
 -    return gen_arith(ctx, a, EXT_NONE, tcg_gen_mul_tl);
 +    return gen_arith(ctx, a, EXT_NONE, tcg_gen_mul_tl, NULL);
  }
  static bool trans_divw(DisasContext *ctx, arg_divw *a)
@@ -XXX,XX +XXX,XX @@ static bool trans_divw(DisasContext *ctx, arg_divw *a)
      REQUIRE_64BIT(ctx);
      REQUIRE_EXT(ctx, RVM);
      ctx->ol = MXL_RV32;
 -    return gen_arith(ctx, a, EXT_SIGN, gen_div);
 +    return gen_arith(ctx, a, EXT_SIGN, gen_div, NULL);
  }
  static bool trans_divuw(DisasContext *ctx, arg_divuw *a)
@@ -XXX,XX +XXX,XX @@ static bool trans_divuw(DisasContext *ctx, arg_divuw *a)
      REQUIRE_64BIT(ctx);
      REQUIRE_EXT(ctx, RVM);
      ctx->ol = MXL_RV32;
 -    return gen_arith(ctx, a, EXT_ZERO, gen_divu);
 +    return gen_arith(ctx, a, EXT_ZERO, gen_divu, NULL);
  }
  static bool trans_remw(DisasContext *ctx, arg_remw *a)
@@ -XXX,XX +XXX,XX @@ static bool trans_remw(DisasContext *ctx, arg_remw *a)
      REQUIRE_64BIT(ctx);
      REQUIRE_EXT(ctx, RVM);
      ctx->ol = MXL_RV32;
 -    return gen_arith(ctx, a, EXT_SIGN, gen_rem);
 +    return gen_arith(ctx, a, EXT_SIGN, gen_rem, NULL);
  }
  static bool trans_remuw(DisasContext *ctx, arg_remuw *a)
@@ -XXX,XX +XXX,XX @@ static bool trans_remuw(DisasContext *ctx, arg_remuw *a)
      REQUIRE_64BIT(ctx);
      REQUIRE_EXT(ctx, RVM);
      ctx->ol = MXL_RV32;
 -    return gen_arith(ctx, a, EXT_ZERO, gen_remu);
 +    return gen_arith(ctx, a, EXT_ZERO, gen_remu, NULL);
  }
 --
-.31.1
+.41.0

-[PULL 32/37] target/riscv: helper functions to wrap calls to 128-bit csr insns
+[PULL v2 23/45] target/riscv: Implement WARL behaviour for mcountinhibit/mcounteren
-From: Frédéric Pétrot <frederic.petrot@univ-grenoble-alpes.fr>
+From: Rob Bradford <rbradford@rivosinc.com>
-Given the side effects they have, the csr instructions are realized as
+These are WARL fields - zero out the bits for unavailable counters and
-helpers. We extend this existing infrastructure for 128-bit sized csr.
+special case the TM bit in mcountinhibit which is hardwired to zero.
-We return 128-bit values using the same approach as for div/rem.
+This patch achieves this by modifying the value written so that any use
-Theses helpers all call a unique function that is currently a fallback
+of the field will see the correctly masked bits.
 on the 64-bit version.
 The trans_csrxx functions supporting 128-bit are yet to be implemented.
-Signed-off-by: Frédéric Pétrot <frederic.petrot@univ-grenoble-alpes.fr>
+Tested by modifying OpenSBI to write max value to these CSRs and upon
-Co-authored-by: Fabien Portas <fabien.portas@grenoble-inp.org>
+subsequent read the appropriate number of bits for number of PMUs is
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+enabled and the TM bit is zero in mcountinhibit.
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20220106210108.138226-17-frederic.petrot@univ-grenoble-alpes.fr
+Signed-off-by: Rob Bradford <rbradford@rivosinc.com>
 Acked-by: Alistair Francis <alistair.francis@wdc.com>
 Reviewed-by: Atish Patra <atishp@rivosinc.com>
 Message-ID: <20230802124906.24197-1-rbradford@rivosinc.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/cpu.h       |  5 +++++
+ target/riscv/csr.c | 11 +++++++++--
- target/riscv/helper.h    |  3 +++
+file changed, 9 insertions(+), 2 deletions(-)
  target/riscv/csr.c       | 17 ++++++++++++++++
  target/riscv/op_helper.c | 44 ++++++++++++++++++++++++++++++++++++++++
 files changed, 69 insertions(+)
-diff --git a/target/riscv/cpu.h b/target/riscv/cpu.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/cpu.h
-+++ b/target/riscv/cpu.h
-@@ -XXX,XX +XXX,XX @@
- #include "exec/cpu-defs.h"
- #include "fpu/softfloat-types.h"
- #include "qom/object.h"
-+#include "qemu/int128.h"
- #include "cpu_bits.h"
- #define TCG_GUEST_DEFAULT_MO 0
-@@ -XXX,XX +XXX,XX @@ typedef RISCVException (*riscv_csr_op_fn)(CPURISCVState *env, int csrno,
-                                           target_ulong new_value,
-                                           target_ulong write_mask);
-+RISCVException riscv_csrrw_i128(CPURISCVState *env, int csrno,
-+                                Int128 *ret_value,
-+                                Int128 new_value, Int128 write_mask);
-+
- typedef struct {
-     const char *name;
-     riscv_csr_predicate_fn predicate;
-diff --git a/target/riscv/helper.h b/target/riscv/helper.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/helper.h
-+++ b/target/riscv/helper.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_1(fclass_h, TCG_CALL_NO_RWG_SE, tl, i64)
- DEF_HELPER_2(csrr, tl, env, int)
- DEF_HELPER_3(csrw, void, env, int, tl)
- DEF_HELPER_4(csrrw, tl, env, int, tl, tl)
-+DEF_HELPER_2(csrr_i128, tl, env, int)
-+DEF_HELPER_4(csrw_i128, void, env, int, tl, tl)
-+DEF_HELPER_6(csrrw_i128, tl, env, int, tl, tl, tl, tl)
- #ifndef CONFIG_USER_ONLY
- DEF_HELPER_2(sret, tl, env, tl)
- DEF_HELPER_2(mret, tl, env, tl)
 diff --git a/target/riscv/csr.c b/target/riscv/csr.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/csr.c
 +++ b/target/riscv/csr.c
-@@ -XXX,XX +XXX,XX @@ RISCVException riscv_csrrw(CPURISCVState *env, int csrno,
+@@ -XXX,XX +XXX,XX @@ static RISCVException write_mcountinhibit(CPURISCVState *env, int csrno,
  {
      int cidx;
      PMUCTRState *counter;
 +    RISCVCPU *cpu = env_archcpu(env);
 -    env->mcountinhibit = val;
 +    /* WARL register - disable unavailable counters; TM bit is always 0 */
 +    env->mcountinhibit =
 +        val & (cpu->pmu_avail_ctrs | COUNTEREN_CY | COUNTEREN_IR);
      /* Check if any other counter is also monitoring cycles/instructions */
      for (cidx = 0; cidx < RV_MAX_MHPMCOUNTERS; cidx++) {
@@ -XXX,XX +XXX,XX @@ static RISCVException read_mcounteren(CPURISCVState *env, int csrno,
  static RISCVException write_mcounteren(CPURISCVState *env, int csrno,
                                         target_ulong val)
  {
 -    env->mcounteren = val;
 +    RISCVCPU *cpu = env_archcpu(env);
 +
 +    /* WARL register - disable unavailable counters */
 +    env->mcounteren = val & (cpu->pmu_avail_ctrs | COUNTEREN_CY | COUNTEREN_TM |
 +                             COUNTEREN_IR);
      return RISCV_EXCP_NONE;
  }
-+RISCVException riscv_csrrw_i128(CPURISCVState *env, int csrno,
-+                               Int128 *ret_value,
-+                               Int128 new_value, Int128 write_mask)
-+{
-+    /* fall back to 64-bit version for now */
-+    target_ulong ret_64;
-+    RISCVException ret = riscv_csrrw(env, csrno, &ret_64,
-+                                     int128_getlo(new_value),
-+                                     int128_getlo(write_mask));
-+
-+    if (ret_value) {
-+        *ret_value = int128_make64(ret_64);
-+    }
-+
-+    return ret;
-+}
-+
- /*
-  * Debugger support.  If not in user mode, set env->debugger before the
-  * riscv_csrrw call and clear it after the call.
-diff --git a/target/riscv/op_helper.c b/target/riscv/op_helper.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/op_helper.c
-+++ b/target/riscv/op_helper.c
-@@ -XXX,XX +XXX,XX @@ target_ulong helper_csrrw(CPURISCVState *env, int csr,
-     return val;
- }
-+target_ulong helper_csrr_i128(CPURISCVState *env, int csr)
-+{
-+    Int128 rv = int128_zero();
-+    RISCVException ret = riscv_csrrw_i128(env, csr, &rv,
-+                                          int128_zero(),
-+                                          int128_zero());
-+
-+    if (ret != RISCV_EXCP_NONE) {
-+        riscv_raise_exception(env, ret, GETPC());
-+    }
-+
-+    env->retxh = int128_gethi(rv);
-+    return int128_getlo(rv);
-+}
-+
-+void helper_csrw_i128(CPURISCVState *env, int csr,
-+                      target_ulong srcl, target_ulong srch)
-+{
-+    RISCVException ret = riscv_csrrw_i128(env, csr, NULL,
-+                                          int128_make128(srcl, srch),
-+                                          UINT128_MAX);
-+
-+    if (ret != RISCV_EXCP_NONE) {
-+        riscv_raise_exception(env, ret, GETPC());
-+    }
-+}
-+
-+target_ulong helper_csrrw_i128(CPURISCVState *env, int csr,
-+                       target_ulong srcl, target_ulong srch,
-+                       target_ulong maskl, target_ulong maskh)
-+{
-+    Int128 rv = int128_zero();
-+    RISCVException ret = riscv_csrrw_i128(env, csr, &rv,
-+                                          int128_make128(srcl, srch),
-+                                          int128_make128(maskl, maskh));
-+
-+    if (ret != RISCV_EXCP_NONE) {
-+        riscv_raise_exception(env, ret, GETPC());
-+    }
-+
-+    env->retxh = int128_gethi(rv);
-+    return int128_getlo(rv);
-+}
-+
- #ifndef CONFIG_USER_ONLY
- target_ulong helper_sret(CPURISCVState *env, target_ulong cpu_pc_deb)
 --
-.31.1
+.41.0

-[PULL 09/37] target/riscv: Enable the Hypervisor extension by default
+[PULL v2 24/45] target/riscv: Add Zihintntl extension ISA string to DTS
-From: Alistair Francis <alistair.francis@wdc.com>
+From: Jason Chien <jason.chien@sifive.com>
-Let's enable the Hypervisor extension by default. This doesn't affect
+RVA23 Profiles states:
-named CPUs (such as lowrisc-ibex or sifive-u54) but does enable the
+The RVA23 profiles are intended to be used for 64-bit application
-Hypervisor extensions by default for the virt machine.
+processors that will run rich OS stacks from standard binary OS
 distributions and with a substantial number of third-party binary user
 applications that will be supported over a considerable length of time
 in the field.
+The chapter 4 of the unprivileged spec introduces the Zihintntl extension
+and Zihintntl is a mandatory extension presented in RVA23 Profiles, whose
+purpose is to enable application and operating system portability across
+different implementations. Thus the DTS should contain the Zihintntl ISA
+string in order to pass to software.
+The unprivileged spec states:
+Like any HINTs, these instructions may be freely ignored. Hence, although
+they are described in terms of cache-based memory hierarchies, they do not
+mandate the provision of caches.
+These instructions are encoded with non-used opcode, e.g. ADD x0, x0, x2,
+which QEMU already supports, and QEMU does not emulate cache. Therefore
+these instructions can be considered as a no-op, and we only need to add
+a new property for the Zihintntl extension.
+Reviewed-by: Frank Chang <frank.chang@sifive.com>
+Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Signed-off-by: Jason Chien <jason.chien@sifive.com>
+Message-ID: <20230726074049.19505-2-jason.chien@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
-Reviewed-by: Anup Patel <anup.patel@wdc.com>
-Reviewed-by: Bin Meng <bmeng.cn@gmail.com>
-Message-Id: <20220105213937.1113508-7-alistair.francis@opensource.wdc.com>
 ---
- target/riscv/cpu.c | 2 +-
+ target/riscv/cpu_cfg.h | 1 +
-file changed, 1 insertion(+), 1 deletion(-)
+ target/riscv/cpu.c     | 2 ++
 files changed, 3 insertions(+)
+diff --git a/target/riscv/cpu_cfg.h b/target/riscv/cpu_cfg.h
+index XXXXXXX..XXXXXXX 100644
+--- a/target/riscv/cpu_cfg.h
++++ b/target/riscv/cpu_cfg.h
+@@ -XXX,XX +XXX,XX @@ struct RISCVCPUConfig {
+     bool ext_icbom;
+     bool ext_icboz;
+     bool ext_zicond;
++    bool ext_zihintntl;
+     bool ext_zihintpause;
+     bool ext_smstateen;
+     bool ext_sstc;
 diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/cpu.c
 +++ b/target/riscv/cpu.c
-@@ -XXX,XX +XXX,XX @@ static Property riscv_cpu_properties[] = {
+@@ -XXX,XX +XXX,XX @@ static const struct isa_ext_data isa_edata_arr[] = {
-     DEFINE_PROP_BOOL("s", RISCVCPU, cfg.ext_s, true),
+     ISA_EXT_DATA_ENTRY(zicond, PRIV_VERSION_1_12_0, ext_zicond),
-     DEFINE_PROP_BOOL("u", RISCVCPU, cfg.ext_u, true),
+     ISA_EXT_DATA_ENTRY(zicsr, PRIV_VERSION_1_10_0, ext_icsr),
-     DEFINE_PROP_BOOL("v", RISCVCPU, cfg.ext_v, false),
+     ISA_EXT_DATA_ENTRY(zifencei, PRIV_VERSION_1_10_0, ext_ifencei),
--    DEFINE_PROP_BOOL("h", RISCVCPU, cfg.ext_h, false),
++    ISA_EXT_DATA_ENTRY(zihintntl, PRIV_VERSION_1_10_0, ext_zihintntl),
-+    DEFINE_PROP_BOOL("h", RISCVCPU, cfg.ext_h, true),
+     ISA_EXT_DATA_ENTRY(zihintpause, PRIV_VERSION_1_10_0, ext_zihintpause),
-     DEFINE_PROP_BOOL("Counters", RISCVCPU, cfg.ext_counters, true),
+     ISA_EXT_DATA_ENTRY(zmmul, PRIV_VERSION_1_12_0, ext_zmmul),
      ISA_EXT_DATA_ENTRY(zawrs, PRIV_VERSION_1_12_0, ext_zawrs),
@@ -XXX,XX +XXX,XX @@ static Property riscv_cpu_extensions[] = {
      DEFINE_PROP_BOOL("sscofpmf", RISCVCPU, cfg.ext_sscofpmf, false),
      DEFINE_PROP_BOOL("Zifencei", RISCVCPU, cfg.ext_ifencei, true),
      DEFINE_PROP_BOOL("Zicsr", RISCVCPU, cfg.ext_icsr, true),
++    DEFINE_PROP_BOOL("Zihintntl", RISCVCPU, cfg.ext_zihintntl, true),
+     DEFINE_PROP_BOOL("Zihintpause", RISCVCPU, cfg.ext_zihintpause, true),
+     DEFINE_PROP_BOOL("Zawrs", RISCVCPU, cfg.ext_zawrs, true),
+     DEFINE_PROP_BOOL("Zfa", RISCVCPU, cfg.ext_zfa, true),
 --
-.31.1
+.41.0

-[PULL 26/37] target/riscv: support for 128-bit bitwise instructions
+[PULL v2 25/45] target/riscv: Fix zfa fleq.d and fltq.d
-From: Frédéric Pétrot <frederic.petrot@univ-grenoble-alpes.fr>
+From: LIU Zhiwei <zhiwei_liu@linux.alibaba.com>
-The 128-bit bitwise instructions do not need any function prototype change
+Commit a47842d ("riscv: Add support for the Zfa extension") implemented the zfa extension.
-as the functions can be applied independently on the lower and upper part of
+However, it has some typos for fleq.d and fltq.d. Both of them misused the fltq.s
-the registers.
+helper function.
-Signed-off-by: Frédéric Pétrot <frederic.petrot@univ-grenoble-alpes.fr>
+Fixes: a47842d ("riscv: Add support for the Zfa extension")
-Co-authored-by: Fabien Portas <fabien.portas@grenoble-inp.org>
+Signed-off-by: LIU Zhiwei <zhiwei_liu@linux.alibaba.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Reviewed-by: Weiwei Li <liweiwei@iscas.ac.cn>
-Message-id: 20220106210108.138226-11-frederic.petrot@univ-grenoble-alpes.fr
+Message-ID: <20230728003906.768-1-zhiwei_liu@linux.alibaba.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/translate.c | 21 +++++++++++++++++++--
+ target/riscv/insn_trans/trans_rvzfa.c.inc | 4 ++--
-file changed, 19 insertions(+), 2 deletions(-)
+file changed, 2 insertions(+), 2 deletions(-)
-diff --git a/target/riscv/translate.c b/target/riscv/translate.c
+diff --git a/target/riscv/insn_trans/trans_rvzfa.c.inc b/target/riscv/insn_trans/trans_rvzfa.c.inc
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/translate.c
+--- a/target/riscv/insn_trans/trans_rvzfa.c.inc
-+++ b/target/riscv/translate.c
++++ b/target/riscv/insn_trans/trans_rvzfa.c.inc
-@@ -XXX,XX +XXX,XX @@ static bool gen_logic_imm_fn(DisasContext *ctx, arg_i *a,
+@@ -XXX,XX +XXX,XX @@ bool trans_fleq_d(DisasContext *ctx, arg_fleq_d *a)
+     TCGv_i64 src1 = get_fpr_hs(ctx, a->rs1);
-     func(dest, src1, a->imm);
+     TCGv_i64 src2 = get_fpr_hs(ctx, a->rs2);
--    gen_set_gpr(ctx, a->rd, dest);
+-    gen_helper_fltq_s(dest, cpu_env, src1, src2);
-+    if (get_xl(ctx) == MXL_RV128) {
++    gen_helper_fleq_d(dest, cpu_env, src1, src2);
-+        TCGv src1h = get_gprh(ctx, a->rs1);
+     gen_set_gpr(ctx, a->rd, dest);
 +        TCGv desth = dest_gprh(ctx, a->rd);
 +
 +        func(desth, src1h, -(a->imm < 0));
 +        gen_set_gpr128(ctx, a->rd, dest, desth);
 +    } else {
 +        gen_set_gpr(ctx, a->rd, dest);
 +    }
      return true;
  }
-@@ -XXX,XX +XXX,XX @@ static bool gen_logic(DisasContext *ctx, arg_r *a,
+@@ -XXX,XX +XXX,XX @@ bool trans_fltq_d(DisasContext *ctx, arg_fltq_d *a)
+     TCGv_i64 src1 = get_fpr_hs(ctx, a->rs1);
-     func(dest, src1, src2);
+     TCGv_i64 src2 = get_fpr_hs(ctx, a->rs2);
--    gen_set_gpr(ctx, a->rd, dest);
+-    gen_helper_fltq_s(dest, cpu_env, src1, src2);
-+    if (get_xl(ctx) == MXL_RV128) {
++    gen_helper_fltq_d(dest, cpu_env, src1, src2);
-+        TCGv src1h = get_gprh(ctx, a->rs1);
+     gen_set_gpr(ctx, a->rd, dest);
 +        TCGv src2h = get_gprh(ctx, a->rs2);
 +        TCGv desth = dest_gprh(ctx, a->rd);
 +
 +        func(desth, src1h, src2h);
 +        gen_set_gpr128(ctx, a->rd, dest, desth);
 +    } else {
 +        gen_set_gpr(ctx, a->rd, dest);
 +    }
      return true;
  }
 --
-.31.1
+.41.0

-New patch
+[PULL v2 26/45] hw/intc: Fix upper/lower mtime write calculation
+From: Jason Chien <jason.chien@sifive.com>
+When writing the upper mtime, we should keep the original lower mtime
+whose value is given by cpu_riscv_read_rtc() instead of
+cpu_riscv_read_rtc_raw(). The same logic applies to writes to lower mtime.
+Signed-off-by: Jason Chien <jason.chien@sifive.com>
+Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Message-ID: <20230728082502.26439-1-jason.chien@sifive.com>
+Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
+---
+ hw/intc/riscv_aclint.c | 5 +++--
+file changed, 3 insertions(+), 2 deletions(-)
+diff --git a/hw/intc/riscv_aclint.c b/hw/intc/riscv_aclint.c
+index XXXXXXX..XXXXXXX 100644
+--- a/hw/intc/riscv_aclint.c
++++ b/hw/intc/riscv_aclint.c
+@@ -XXX,XX +XXX,XX @@ static void riscv_aclint_mtimer_write(void *opaque, hwaddr addr,
+         return;
+     } else if (addr == mtimer->time_base || addr == mtimer->time_base + 4) {
+         uint64_t rtc_r = cpu_riscv_read_rtc_raw(mtimer->timebase_freq);
++        uint64_t rtc = cpu_riscv_read_rtc(mtimer);
+         if (addr == mtimer->time_base) {
+             if (size == 4) {
+                 /* time_lo for RV32/RV64 */
+-                mtimer->time_delta = ((rtc_r & ~0xFFFFFFFFULL) | value) - rtc_r;
++                mtimer->time_delta = ((rtc & ~0xFFFFFFFFULL) | value) - rtc_r;
+             } else {
+                 /* time for RV64 */
+                 mtimer->time_delta = value - rtc_r;
+@@ -XXX,XX +XXX,XX @@ static void riscv_aclint_mtimer_write(void *opaque, hwaddr addr,
+         } else {
+             if (size == 4) {
+                 /* time_hi for RV32/RV64 */
+-                mtimer->time_delta = (value << 32 | (rtc_r & 0xFFFFFFFF)) - rtc_r;
++                mtimer->time_delta = (value << 32 | (rtc & 0xFFFFFFFF)) - rtc_r;
+             } else {
+                 qemu_log_mask(LOG_GUEST_ERROR,
+                               "aclint-mtimer: invalid time_hi write: %08x",
+--
+.41.0

-[PULL 37/37] target/riscv: Implement the stval/mtval illegal instruction
+[PULL v2 27/45] hw/intc: Make rtc variable names consistent
-From: Alistair Francis <alistair.francis@wdc.com>
+From: Jason Chien <jason.chien@sifive.com>
-The stval and mtval registers can optionally contain the faulting
+The variables whose values are given by cpu_riscv_read_rtc() should be named
-instruction on an illegal instruction exception. This patch adds support
+"rtc". The variables whose value are given by cpu_riscv_read_rtc_raw()
-for setting the stval and mtval registers.
+should be named "rtc_r".
-The RISC-V spec states that "The stval register can optionally also be
+Signed-off-by: Jason Chien <jason.chien@sifive.com>
-used to return the faulting instruction bits on an illegal instruction
+Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-exception...". In this case we are always writing the value on an
+Message-ID: <20230728082502.26439-2-jason.chien@sifive.com>
-illegal instruction.
+Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
  hw/intc/riscv_aclint.c | 6 +++---
 file changed, 3 insertions(+), 3 deletions(-)
-This doesn't match all CPUs (some CPUs won't write the data), but in
+diff --git a/hw/intc/riscv_aclint.c b/hw/intc/riscv_aclint.c
 QEMU let's just populate the value on illegal instructions. This won't
 break any guest software, but will provide more information to guests.
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Reviewed-by: Bin Meng <bmeng.cn@gmail.com>
 Message-id: 20211220064916.107241-4-alistair.francis@opensource.wdc.com
 ---
  target/riscv/cpu.h        | 2 ++
  target/riscv/cpu_helper.c | 3 +++
  target/riscv/translate.c  | 3 +++
 files changed, 8 insertions(+)
 diff --git a/target/riscv/cpu.h b/target/riscv/cpu.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/cpu.h
+--- a/hw/intc/riscv_aclint.c
-+++ b/target/riscv/cpu.h
++++ b/hw/intc/riscv_aclint.c
-@@ -XXX,XX +XXX,XX @@ struct CPURISCVState {
+@@ -XXX,XX +XXX,XX @@ static void riscv_aclint_mtimer_write_timecmp(RISCVAclintMTimerState *mtimer,
-     target_ulong frm;
+     uint64_t next;
+     uint64_t diff;
-     target_ulong badaddr;
-+    uint32_t bins;
+-    uint64_t rtc_r = cpu_riscv_read_rtc(mtimer);
-+
++    uint64_t rtc = cpu_riscv_read_rtc(mtimer);
-     target_ulong guest_phys_fault_addr;
+     /* Compute the relative hartid w.r.t the socket */
-     target_ulong priv_ver;
+     hartid = hartid - mtimer->hartid_base;
-diff --git a/target/riscv/cpu_helper.c b/target/riscv/cpu_helper.c
-index XXXXXXX..XXXXXXX 100644
+     mtimer->timecmp[hartid] = value;
---- a/target/riscv/cpu_helper.c
+-    if (mtimer->timecmp[hartid] <= rtc_r) {
-+++ b/target/riscv/cpu_helper.c
++    if (mtimer->timecmp[hartid] <= rtc) {
-@@ -XXX,XX +XXX,XX @@ void riscv_cpu_do_interrupt(CPUState *cs)
+         /*
-             write_gva = true;
+          * If we're setting an MTIMECMP value in the "past",
-             tval = env->badaddr;
+          * immediately raise the timer interrupt
-             break;
+@@ -XXX,XX +XXX,XX @@ static void riscv_aclint_mtimer_write_timecmp(RISCVAclintMTimerState *mtimer,
-+        case RISCV_EXCP_ILLEGAL_INST:
-+            tval = env->bins;
+     /* otherwise, set up the future timer interrupt */
-+            break;
+     qemu_irq_lower(mtimer->timer_irqs[hartid]);
-         default:
+-    diff = mtimer->timecmp[hartid] - rtc_r;
-             break;
++    diff = mtimer->timecmp[hartid] - rtc;
-         }
+     /* back to ns (note args switched in muldiv64) */
-diff --git a/target/riscv/translate.c b/target/riscv/translate.c
+     uint64_t ns_diff = muldiv64(diff, NANOSECONDS_PER_SECOND, timebase_freq);
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/translate.c
 +++ b/target/riscv/translate.c
@@ -XXX,XX +XXX,XX @@ static void generate_exception_mtval(DisasContext *ctx, int excp)
  static void gen_exception_illegal(DisasContext *ctx)
  {
 +    tcg_gen_st_i32(tcg_constant_i32(ctx->opcode), cpu_env,
 +                   offsetof(CPURISCVState, bins));
 +
      generate_exception(ctx, RISCV_EXCP_ILLEGAL_INST);
  }
 --
-.31.1
+.41.0

-[PULL 31/37] target/riscv: adding high part of some csrs
+[PULL v2 28/45] linux-user/riscv: Use abi type for target_ucontext
-From: Frédéric Pétrot <frederic.petrot@univ-grenoble-alpes.fr>
+From: LIU Zhiwei <zhiwei_liu@linux.alibaba.com>
-Adding the high part of a very minimal set of csr.
+We should not use types dependend on host arch for target_ucontext.
 This bug is found when run rv32 applications.
-Signed-off-by: Frédéric Pétrot <frederic.petrot@univ-grenoble-alpes.fr>
+Signed-off-by: LIU Zhiwei <zhiwei_liu@linux.alibaba.com>
 Co-authored-by: Fabien Portas <fabien.portas@grenoble-inp.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
-Message-id: 20220106210108.138226-16-frederic.petrot@univ-grenoble-alpes.fr
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Message-ID: <20230811055438.1945-1-zhiwei_liu@linux.alibaba.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/cpu.h     | 4 ++++
+ linux-user/riscv/signal.c | 4 ++--
- target/riscv/machine.c | 2 ++
+file changed, 2 insertions(+), 2 deletions(-)
 files changed, 6 insertions(+)
-diff --git a/target/riscv/cpu.h b/target/riscv/cpu.h
+diff --git a/linux-user/riscv/signal.c b/linux-user/riscv/signal.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/cpu.h
+--- a/linux-user/riscv/signal.c
-+++ b/target/riscv/cpu.h
++++ b/linux-user/riscv/signal.c
-@@ -XXX,XX +XXX,XX @@ struct CPURISCVState {
+@@ -XXX,XX +XXX,XX @@ struct target_sigcontext {
-     target_ulong hgatp;
+ }; /* cf. riscv-linux:arch/riscv/include/uapi/asm/ptrace.h */
-     uint64_t htimedelta;
+ struct target_ucontext {
-+    /* Upper 64-bits of 128-bit CSRs */
+-    unsigned long uc_flags;
-+    uint64_t mscratchh;
+-    struct target_ucontext *uc_link;
-+    uint64_t sscratchh;
++    abi_ulong uc_flags;
-+
++    abi_ptr uc_link;
-     /* Virtual CSRs */
+     target_stack_t uc_stack;
-     /*
+     target_sigset_t uc_sigmask;
-      * For RV32 this is 32-bit vsstatus and 32-bit vsstatush.
+     uint8_t   __unused[1024 / 8 - sizeof(target_sigset_t)];
 diff --git a/target/riscv/machine.c b/target/riscv/machine.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/machine.c
 +++ b/target/riscv/machine.c
@@ -XXX,XX +XXX,XX @@ static const VMStateDescription vmstate_rv128 = {
      .needed = rv128_needed,
      .fields = (VMStateField[]) {
          VMSTATE_UINTTL_ARRAY(env.gprh, RISCVCPU, 32),
 +        VMSTATE_UINT64(env.mscratchh, RISCVCPU),
 +        VMSTATE_UINT64(env.sscratchh, RISCVCPU),
          VMSTATE_END_OF_LIST()
      }
  };
 --
-.31.1
+.41.0

-[PULL 19/37] qemu/int128: addition of div/rem 128-bit operations
+[PULL v2 29/45] target/riscv: support the AIA device emulation with KVM enabled
-From: Frédéric Pétrot <frederic.petrot@univ-grenoble-alpes.fr>
+From: Yong-Xuan Wang <yongxuan.wang@sifive.com>
-Addition of div and rem on 128-bit integers, using the 128/64->128 divu and
+In this patch, we create the APLIC and IMSIC FDT helper functions and
-x64->128 mulu in host-utils.
+remove M mode AIA devices when using KVM acceleration.
 These operations will be used within div/rem helpers in the 128-bit riscv
 target.
-Signed-off-by: Frédéric Pétrot <frederic.petrot@univ-grenoble-alpes.fr>
+Signed-off-by: Yong-Xuan Wang <yongxuan.wang@sifive.com>
-Co-authored-by: Fabien Portas <fabien.portas@grenoble-inp.org>
+Reviewed-by: Jim Shu <jim.shu@sifive.com>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
-Message-id: 20220106210108.138226-4-frederic.petrot@univ-grenoble-alpes.fr
+Reviewed-by: Andrew Jones <ajones@ventanamicro.com>
 Message-ID: <20230727102439.22554-2-yongxuan.wang@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- include/qemu/int128.h |  27 ++++++++
+ hw/riscv/virt.c | 290 +++++++++++++++++++++++-------------------------
- util/int128.c         | 147 ++++++++++++++++++++++++++++++++++++++++++
+file changed, 137 insertions(+), 153 deletions(-)
  util/meson.build      |   1 +
 files changed, 175 insertions(+)
  create mode 100644 util/int128.c
-diff --git a/include/qemu/int128.h b/include/qemu/int128.h
+diff --git a/hw/riscv/virt.c b/hw/riscv/virt.c
 index XXXXXXX..XXXXXXX 100644
---- a/include/qemu/int128.h
+--- a/hw/riscv/virt.c
-+++ b/include/qemu/int128.h
++++ b/hw/riscv/virt.c
-@@ -XXX,XX +XXX,XX @@ static inline Int128 bswap128(Int128 a)
+@@ -XXX,XX +XXX,XX @@ static uint32_t imsic_num_bits(uint32_t count)
- #endif
+     return ret;
  }
-+static inline Int128 int128_divu(Int128 a, Int128 b)
+-static void create_fdt_imsic(RISCVVirtState *s, const MemMapEntry *memmap,
 -                             uint32_t *phandle, uint32_t *intc_phandles,
 -                             uint32_t *msi_m_phandle, uint32_t *msi_s_phandle)
 +static void create_fdt_one_imsic(RISCVVirtState *s, hwaddr base_addr,
 +                                 uint32_t *intc_phandles, uint32_t msi_phandle,
 +                                 bool m_mode, uint32_t imsic_guest_bits)
  {
      int cpu, socket;
      char *imsic_name;
      MachineState *ms = MACHINE(s);
      int socket_count = riscv_socket_count(ms);
 -    uint32_t imsic_max_hart_per_socket, imsic_guest_bits;
 +    uint32_t imsic_max_hart_per_socket;
      uint32_t *imsic_cells, *imsic_regs, imsic_addr, imsic_size;
 -    *msi_m_phandle = (*phandle)++;
 -    *msi_s_phandle = (*phandle)++;
      imsic_cells = g_new0(uint32_t, ms->smp.cpus * 2);
      imsic_regs = g_new0(uint32_t, socket_count * 4);
 -    /* M-level IMSIC node */
      for (cpu = 0; cpu < ms->smp.cpus; cpu++) {
          imsic_cells[cpu * 2 + 0] = cpu_to_be32(intc_phandles[cpu]);
 -        imsic_cells[cpu * 2 + 1] = cpu_to_be32(IRQ_M_EXT);
 +        imsic_cells[cpu * 2 + 1] = cpu_to_be32(m_mode ? IRQ_M_EXT : IRQ_S_EXT);
      }
 -    imsic_max_hart_per_socket = 0;
 -    for (socket = 0; socket < socket_count; socket++) {
 -        imsic_addr = memmap[VIRT_IMSIC_M].base +
 -                     socket * VIRT_IMSIC_GROUP_MAX_SIZE;
 -        imsic_size = IMSIC_HART_SIZE(0) * s->soc[socket].num_harts;
 -        imsic_regs[socket * 4 + 0] = 0;
 -        imsic_regs[socket * 4 + 1] = cpu_to_be32(imsic_addr);
 -        imsic_regs[socket * 4 + 2] = 0;
 -        imsic_regs[socket * 4 + 3] = cpu_to_be32(imsic_size);
 -        if (imsic_max_hart_per_socket < s->soc[socket].num_harts) {
 -            imsic_max_hart_per_socket = s->soc[socket].num_harts;
 -        }
 -    }
 -    imsic_name = g_strdup_printf("/soc/imsics@%lx",
 -        (unsigned long)memmap[VIRT_IMSIC_M].base);
 -    qemu_fdt_add_subnode(ms->fdt, imsic_name);
 -    qemu_fdt_setprop_string(ms->fdt, imsic_name, "compatible",
 -        "riscv,imsics");
 -    qemu_fdt_setprop_cell(ms->fdt, imsic_name, "#interrupt-cells",
 -        FDT_IMSIC_INT_CELLS);
 -    qemu_fdt_setprop(ms->fdt, imsic_name, "interrupt-controller",
 -        NULL, 0);
 -    qemu_fdt_setprop(ms->fdt, imsic_name, "msi-controller",
 -        NULL, 0);
 -    qemu_fdt_setprop(ms->fdt, imsic_name, "interrupts-extended",
 -        imsic_cells, ms->smp.cpus * sizeof(uint32_t) * 2);
 -    qemu_fdt_setprop(ms->fdt, imsic_name, "reg", imsic_regs,
 -        socket_count * sizeof(uint32_t) * 4);
 -    qemu_fdt_setprop_cell(ms->fdt, imsic_name, "riscv,num-ids",
 -        VIRT_IRQCHIP_NUM_MSIS);
 -    if (socket_count > 1) {
 -        qemu_fdt_setprop_cell(ms->fdt, imsic_name, "riscv,hart-index-bits",
 -            imsic_num_bits(imsic_max_hart_per_socket));
 -        qemu_fdt_setprop_cell(ms->fdt, imsic_name, "riscv,group-index-bits",
 -            imsic_num_bits(socket_count));
 -        qemu_fdt_setprop_cell(ms->fdt, imsic_name, "riscv,group-index-shift",
 -            IMSIC_MMIO_GROUP_MIN_SHIFT);
 -    }
 -    qemu_fdt_setprop_cell(ms->fdt, imsic_name, "phandle", *msi_m_phandle);
 -
 -    g_free(imsic_name);
 -    /* S-level IMSIC node */
 -    for (cpu = 0; cpu < ms->smp.cpus; cpu++) {
 -        imsic_cells[cpu * 2 + 0] = cpu_to_be32(intc_phandles[cpu]);
 -        imsic_cells[cpu * 2 + 1] = cpu_to_be32(IRQ_S_EXT);
 -    }
 -    imsic_guest_bits = imsic_num_bits(s->aia_guests + 1);
      imsic_max_hart_per_socket = 0;
      for (socket = 0; socket < socket_count; socket++) {
 -        imsic_addr = memmap[VIRT_IMSIC_S].base +
 -                     socket * VIRT_IMSIC_GROUP_MAX_SIZE;
 +        imsic_addr = base_addr + socket * VIRT_IMSIC_GROUP_MAX_SIZE;
          imsic_size = IMSIC_HART_SIZE(imsic_guest_bits) *
                       s->soc[socket].num_harts;
          imsic_regs[socket * 4 + 0] = 0;
@@ -XXX,XX +XXX,XX @@ static void create_fdt_imsic(RISCVVirtState *s, const MemMapEntry *memmap,
              imsic_max_hart_per_socket = s->soc[socket].num_harts;
          }
      }
 -    imsic_name = g_strdup_printf("/soc/imsics@%lx",
 -        (unsigned long)memmap[VIRT_IMSIC_S].base);
 +
 +    imsic_name = g_strdup_printf("/soc/imsics@%lx", (unsigned long)base_addr);
      qemu_fdt_add_subnode(ms->fdt, imsic_name);
 -    qemu_fdt_setprop_string(ms->fdt, imsic_name, "compatible",
 -        "riscv,imsics");
 +    qemu_fdt_setprop_string(ms->fdt, imsic_name, "compatible", "riscv,imsics");
      qemu_fdt_setprop_cell(ms->fdt, imsic_name, "#interrupt-cells",
 -        FDT_IMSIC_INT_CELLS);
 -    qemu_fdt_setprop(ms->fdt, imsic_name, "interrupt-controller",
 -        NULL, 0);
 -    qemu_fdt_setprop(ms->fdt, imsic_name, "msi-controller",
 -        NULL, 0);
 +                          FDT_IMSIC_INT_CELLS);
 +    qemu_fdt_setprop(ms->fdt, imsic_name, "interrupt-controller", NULL, 0);
 +    qemu_fdt_setprop(ms->fdt, imsic_name, "msi-controller", NULL, 0);
      qemu_fdt_setprop(ms->fdt, imsic_name, "interrupts-extended",
 -        imsic_cells, ms->smp.cpus * sizeof(uint32_t) * 2);
 +                     imsic_cells, ms->smp.cpus * sizeof(uint32_t) * 2);
      qemu_fdt_setprop(ms->fdt, imsic_name, "reg", imsic_regs,
 -        socket_count * sizeof(uint32_t) * 4);
 +                     socket_count * sizeof(uint32_t) * 4);
      qemu_fdt_setprop_cell(ms->fdt, imsic_name, "riscv,num-ids",
 -        VIRT_IRQCHIP_NUM_MSIS);
 +                     VIRT_IRQCHIP_NUM_MSIS);
 +
      if (imsic_guest_bits) {
          qemu_fdt_setprop_cell(ms->fdt, imsic_name, "riscv,guest-index-bits",
 -            imsic_guest_bits);
 +                              imsic_guest_bits);
      }
 +
      if (socket_count > 1) {
          qemu_fdt_setprop_cell(ms->fdt, imsic_name, "riscv,hart-index-bits",
 -            imsic_num_bits(imsic_max_hart_per_socket));
 +                              imsic_num_bits(imsic_max_hart_per_socket));
          qemu_fdt_setprop_cell(ms->fdt, imsic_name, "riscv,group-index-bits",
 -            imsic_num_bits(socket_count));
 +                              imsic_num_bits(socket_count));
          qemu_fdt_setprop_cell(ms->fdt, imsic_name, "riscv,group-index-shift",
 -            IMSIC_MMIO_GROUP_MIN_SHIFT);
 +                              IMSIC_MMIO_GROUP_MIN_SHIFT);
      }
 -    qemu_fdt_setprop_cell(ms->fdt, imsic_name, "phandle", *msi_s_phandle);
 -    g_free(imsic_name);
 +    qemu_fdt_setprop_cell(ms->fdt, imsic_name, "phandle", msi_phandle);
 +    g_free(imsic_name);
      g_free(imsic_regs);
      g_free(imsic_cells);
  }
 -static void create_fdt_socket_aplic(RISCVVirtState *s,
 -                                    const MemMapEntry *memmap, int socket,
 -                                    uint32_t msi_m_phandle,
 -                                    uint32_t msi_s_phandle,
 -                                    uint32_t *phandle,
 -                                    uint32_t *intc_phandles,
 -                                    uint32_t *aplic_phandles)
 +static void create_fdt_imsic(RISCVVirtState *s, const MemMapEntry *memmap,
 +                             uint32_t *phandle, uint32_t *intc_phandles,
 +                             uint32_t *msi_m_phandle, uint32_t *msi_s_phandle)
 +{
-+    return (__uint128_t)a / (__uint128_t)b;
++    *msi_m_phandle = (*phandle)++;
 +    *msi_s_phandle = (*phandle)++;
 +
 +    if (!kvm_enabled()) {
 +        /* M-level IMSIC node */
 +        create_fdt_one_imsic(s, memmap[VIRT_IMSIC_M].base, intc_phandles,
 +                             *msi_m_phandle, true, 0);
 +    }
 +
 +    /* S-level IMSIC node */
 +    create_fdt_one_imsic(s, memmap[VIRT_IMSIC_S].base, intc_phandles,
 +                         *msi_s_phandle, false,
 +                         imsic_num_bits(s->aia_guests + 1));
 +
 +}
 +
-+static inline Int128 int128_remu(Int128 a, Int128 b)
++static void create_fdt_one_aplic(RISCVVirtState *s, int socket,
 +                                 unsigned long aplic_addr, uint32_t aplic_size,
 +                                 uint32_t msi_phandle,
 +                                 uint32_t *intc_phandles,
 +                                 uint32_t aplic_phandle,
 +                                 uint32_t aplic_child_phandle,
 +                                 bool m_mode)
  {
      int cpu;
      char *aplic_name;
      uint32_t *aplic_cells;
 -    unsigned long aplic_addr;
      MachineState *ms = MACHINE(s);
 -    uint32_t aplic_m_phandle, aplic_s_phandle;
 -    aplic_m_phandle = (*phandle)++;
 -    aplic_s_phandle = (*phandle)++;
      aplic_cells = g_new0(uint32_t, s->soc[socket].num_harts * 2);
 -    /* M-level APLIC node */
      for (cpu = 0; cpu < s->soc[socket].num_harts; cpu++) {
          aplic_cells[cpu * 2 + 0] = cpu_to_be32(intc_phandles[cpu]);
 -        aplic_cells[cpu * 2 + 1] = cpu_to_be32(IRQ_M_EXT);
 +        aplic_cells[cpu * 2 + 1] = cpu_to_be32(m_mode ? IRQ_M_EXT : IRQ_S_EXT);
      }
 -    aplic_addr = memmap[VIRT_APLIC_M].base +
 -                 (memmap[VIRT_APLIC_M].size * socket);
 +
      aplic_name = g_strdup_printf("/soc/aplic@%lx", aplic_addr);
      qemu_fdt_add_subnode(ms->fdt, aplic_name);
      qemu_fdt_setprop_string(ms->fdt, aplic_name, "compatible", "riscv,aplic");
      qemu_fdt_setprop_cell(ms->fdt, aplic_name,
 -        "#interrupt-cells", FDT_APLIC_INT_CELLS);
 +                          "#interrupt-cells", FDT_APLIC_INT_CELLS);
      qemu_fdt_setprop(ms->fdt, aplic_name, "interrupt-controller", NULL, 0);
 +
      if (s->aia_type == VIRT_AIA_TYPE_APLIC) {
          qemu_fdt_setprop(ms->fdt, aplic_name, "interrupts-extended",
 -            aplic_cells, s->soc[socket].num_harts * sizeof(uint32_t) * 2);
 +                         aplic_cells,
 +                         s->soc[socket].num_harts * sizeof(uint32_t) * 2);
      } else {
 -        qemu_fdt_setprop_cell(ms->fdt, aplic_name, "msi-parent",
 -            msi_m_phandle);
 +        qemu_fdt_setprop_cell(ms->fdt, aplic_name, "msi-parent", msi_phandle);
      }
 +
      qemu_fdt_setprop_cells(ms->fdt, aplic_name, "reg",
 -        0x0, aplic_addr, 0x0, memmap[VIRT_APLIC_M].size);
 +                           0x0, aplic_addr, 0x0, aplic_size);
      qemu_fdt_setprop_cell(ms->fdt, aplic_name, "riscv,num-sources",
 -        VIRT_IRQCHIP_NUM_SOURCES);
 -    qemu_fdt_setprop_cell(ms->fdt, aplic_name, "riscv,children",
 -        aplic_s_phandle);
 -    qemu_fdt_setprop_cells(ms->fdt, aplic_name, "riscv,delegate",
 -        aplic_s_phandle, 0x1, VIRT_IRQCHIP_NUM_SOURCES);
 +                          VIRT_IRQCHIP_NUM_SOURCES);
 +
 +    if (aplic_child_phandle) {
 +        qemu_fdt_setprop_cell(ms->fdt, aplic_name, "riscv,children",
 +                              aplic_child_phandle);
 +        qemu_fdt_setprop_cells(ms->fdt, aplic_name, "riscv,delegate",
 +                               aplic_child_phandle, 0x1,
 +                               VIRT_IRQCHIP_NUM_SOURCES);
 +    }
 +
      riscv_socket_fdt_write_id(ms, aplic_name, socket);
 -    qemu_fdt_setprop_cell(ms->fdt, aplic_name, "phandle", aplic_m_phandle);
 +    qemu_fdt_setprop_cell(ms->fdt, aplic_name, "phandle", aplic_phandle);
 +
      g_free(aplic_name);
 +    g_free(aplic_cells);
 +}
 -    /* S-level APLIC node */
 -    for (cpu = 0; cpu < s->soc[socket].num_harts; cpu++) {
 -        aplic_cells[cpu * 2 + 0] = cpu_to_be32(intc_phandles[cpu]);
 -        aplic_cells[cpu * 2 + 1] = cpu_to_be32(IRQ_S_EXT);
 +static void create_fdt_socket_aplic(RISCVVirtState *s,
 +                                    const MemMapEntry *memmap, int socket,
 +                                    uint32_t msi_m_phandle,
 +                                    uint32_t msi_s_phandle,
 +                                    uint32_t *phandle,
 +                                    uint32_t *intc_phandles,
 +                                    uint32_t *aplic_phandles)
 +{
-+    return (__uint128_t)a % (__uint128_t)b;
++    char *aplic_name;
-+}
++    unsigned long aplic_addr;
-+
++    MachineState *ms = MACHINE(s);
-+static inline Int128 int128_divs(Int128 a, Int128 b)
++    uint32_t aplic_m_phandle, aplic_s_phandle;
-+{
++
-+    return a / b;
++    aplic_m_phandle = (*phandle)++;
-+}
++    aplic_s_phandle = (*phandle)++;
 +
-+static inline Int128 int128_rems(Int128 a, Int128 b)
++    if (!kvm_enabled()) {
-+{
++        /* M-level APLIC node */
-+    return a % b;
++        aplic_addr = memmap[VIRT_APLIC_M].base +
-+}
++                     (memmap[VIRT_APLIC_M].size * socket);
-+
++        create_fdt_one_aplic(s, socket, aplic_addr, memmap[VIRT_APLIC_M].size,
- #else /* !CONFIG_INT128 */
++                             msi_m_phandle, intc_phandles,
++                             aplic_m_phandle, aplic_s_phandle,
- typedef struct Int128 Int128;
++                             true);
-@@ -XXX,XX +XXX,XX @@ static inline Int128 bswap128(Int128 a)
+     }
-     return int128_make128(bswap64(a.hi), bswap64(a.lo));
++
 +    /* S-level APLIC node */
      aplic_addr = memmap[VIRT_APLIC_S].base +
                   (memmap[VIRT_APLIC_S].size * socket);
 +    create_fdt_one_aplic(s, socket, aplic_addr, memmap[VIRT_APLIC_S].size,
 +                         msi_s_phandle, intc_phandles,
 +                         aplic_s_phandle, 0,
 +                         false);
 +
      aplic_name = g_strdup_printf("/soc/aplic@%lx", aplic_addr);
 -    qemu_fdt_add_subnode(ms->fdt, aplic_name);
 -    qemu_fdt_setprop_string(ms->fdt, aplic_name, "compatible", "riscv,aplic");
 -    qemu_fdt_setprop_cell(ms->fdt, aplic_name,
 -        "#interrupt-cells", FDT_APLIC_INT_CELLS);
 -    qemu_fdt_setprop(ms->fdt, aplic_name, "interrupt-controller", NULL, 0);
 -    if (s->aia_type == VIRT_AIA_TYPE_APLIC) {
 -        qemu_fdt_setprop(ms->fdt, aplic_name, "interrupts-extended",
 -            aplic_cells, s->soc[socket].num_harts * sizeof(uint32_t) * 2);
 -    } else {
 -        qemu_fdt_setprop_cell(ms->fdt, aplic_name, "msi-parent",
 -            msi_s_phandle);
 -    }
 -    qemu_fdt_setprop_cells(ms->fdt, aplic_name, "reg",
 -        0x0, aplic_addr, 0x0, memmap[VIRT_APLIC_S].size);
 -    qemu_fdt_setprop_cell(ms->fdt, aplic_name, "riscv,num-sources",
 -        VIRT_IRQCHIP_NUM_SOURCES);
 -    riscv_socket_fdt_write_id(ms, aplic_name, socket);
 -    qemu_fdt_setprop_cell(ms->fdt, aplic_name, "phandle", aplic_s_phandle);
      if (!socket) {
          platform_bus_add_all_fdt_nodes(ms->fdt, aplic_name,
@@ -XXX,XX +XXX,XX @@ static void create_fdt_socket_aplic(RISCVVirtState *s,
      g_free(aplic_name);
 -    g_free(aplic_cells);
      aplic_phandles[socket] = aplic_s_phandle;
  }
-+Int128 int128_divu(Int128, Int128);
+@@ -XXX,XX +XXX,XX @@ static DeviceState *virt_create_aia(RISCVVirtAIAType aia_type, int aia_guests,
-+Int128 int128_remu(Int128, Int128);
+     int i;
-+Int128 int128_divs(Int128, Int128);
+     hwaddr addr;
-+Int128 int128_rems(Int128, Int128);
+     uint32_t guest_bits;
-+
+-    DeviceState *aplic_m;
- #endif /* CONFIG_INT128 */
+-    bool msimode = (aia_type == VIRT_AIA_TYPE_APLIC_IMSIC) ? true : false;
++    DeviceState *aplic_s = NULL;
- static inline void bswap128s(Int128 *s)
++    DeviceState *aplic_m = NULL;
-@@ -XXX,XX +XXX,XX @@ static inline void bswap128s(Int128 *s)
++    bool msimode = aia_type == VIRT_AIA_TYPE_APLIC_IMSIC;
-     *s = bswap128(*s);
      if (msimode) {
 -        /* Per-socket M-level IMSICs */
 -        addr = memmap[VIRT_IMSIC_M].base + socket * VIRT_IMSIC_GROUP_MAX_SIZE;
 -        for (i = 0; i < hart_count; i++) {
 -            riscv_imsic_create(addr + i * IMSIC_HART_SIZE(0),
 -                               base_hartid + i, true, 1,
 -                               VIRT_IRQCHIP_NUM_MSIS);
 +        if (!kvm_enabled()) {
 +            /* Per-socket M-level IMSICs */
 +            addr = memmap[VIRT_IMSIC_M].base +
 +                   socket * VIRT_IMSIC_GROUP_MAX_SIZE;
 +            for (i = 0; i < hart_count; i++) {
 +                riscv_imsic_create(addr + i * IMSIC_HART_SIZE(0),
 +                                   base_hartid + i, true, 1,
 +                                   VIRT_IRQCHIP_NUM_MSIS);
 +            }
          }
          /* Per-socket S-level IMSICs */
@@ -XXX,XX +XXX,XX @@ static DeviceState *virt_create_aia(RISCVVirtAIAType aia_type, int aia_guests,
          }
      }
 -    /* Per-socket M-level APLIC */
 -    aplic_m = riscv_aplic_create(
 -        memmap[VIRT_APLIC_M].base + socket * memmap[VIRT_APLIC_M].size,
 -        memmap[VIRT_APLIC_M].size,
 -        (msimode) ? 0 : base_hartid,
 -        (msimode) ? 0 : hart_count,
 -        VIRT_IRQCHIP_NUM_SOURCES,
 -        VIRT_IRQCHIP_NUM_PRIO_BITS,
 -        msimode, true, NULL);
 -
 -    if (aplic_m) {
 -        /* Per-socket S-level APLIC */
 -        riscv_aplic_create(
 -            memmap[VIRT_APLIC_S].base + socket * memmap[VIRT_APLIC_S].size,
 -            memmap[VIRT_APLIC_S].size,
 -            (msimode) ? 0 : base_hartid,
 -            (msimode) ? 0 : hart_count,
 -            VIRT_IRQCHIP_NUM_SOURCES,
 -            VIRT_IRQCHIP_NUM_PRIO_BITS,
 -            msimode, false, aplic_m);
 +    if (!kvm_enabled()) {
 +        /* Per-socket M-level APLIC */
 +        aplic_m = riscv_aplic_create(memmap[VIRT_APLIC_M].base +
 +                                     socket * memmap[VIRT_APLIC_M].size,
 +                                     memmap[VIRT_APLIC_M].size,
 +                                     (msimode) ? 0 : base_hartid,
 +                                     (msimode) ? 0 : hart_count,
 +                                     VIRT_IRQCHIP_NUM_SOURCES,
 +                                     VIRT_IRQCHIP_NUM_PRIO_BITS,
 +                                     msimode, true, NULL);
      }
 -    return aplic_m;
 +    /* Per-socket S-level APLIC */
 +    aplic_s = riscv_aplic_create(memmap[VIRT_APLIC_S].base +
 +                                 socket * memmap[VIRT_APLIC_S].size,
 +                                 memmap[VIRT_APLIC_S].size,
 +                                 (msimode) ? 0 : base_hartid,
 +                                 (msimode) ? 0 : hart_count,
 +                                 VIRT_IRQCHIP_NUM_SOURCES,
 +                                 VIRT_IRQCHIP_NUM_PRIO_BITS,
 +                                 msimode, false, aplic_m);
 +
 +    return kvm_enabled() ? aplic_s : aplic_m;
  }
-+#define UINT128_MAX int128_make128(~0LL, ~0LL)
+ static void create_platform_bus(RISCVVirtState *s, DeviceState *irqchip)
 +
  #endif /* INT128_H */
 diff --git a/util/int128.c b/util/int128.c
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
 +++ b/util/int128.c
@@ -XXX,XX +XXX,XX @@
 +/*
 + * 128-bit division and remainder for compilers not supporting __int128
 + *
 + * Copyright (c) 2021 Frédéric Pétrot <frederic.petrot@univ-grenoble-alpes.fr>
 + *
 + * Permission is hereby granted, free of charge, to any person obtaining a copy
 + * of this software and associated documentation files (the "Software"), to deal
 + * in the Software without restriction, including without limitation the rights
 + * to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
 + * copies of the Software, and to permit persons to whom the Software is
 + * furnished to do so, subject to the following conditions:
 + *
 + * The above copyright notice and this permission notice shall be included in
 + * all copies or substantial portions of the Software.
 + *
 + * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
 + * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
 + * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL
 + * THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
 + * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
 + * OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN
 + * THE SOFTWARE.
 + */
 +
 +#include "qemu/osdep.h"
 +#include "qemu/host-utils.h"
 +#include "qemu/int128.h"
 +
 +#ifndef CONFIG_INT128
 +
 +/*
 + * Division and remainder algorithms for 128-bit due to Stefan Kanthak,
 + * https://skanthak.homepage.t-online.de/integer.html#udivmodti4
 + * Preconditions:
 + *     - function should never be called with v equals to 0, it has to
 + *       be dealt with beforehand
 + *     - quotien pointer must be valid
 + */
 +static Int128 divrem128(Int128 u, Int128 v, Int128 *q)
 +{
 +    Int128 qq;
 +    uint64_t hi, lo, tmp;
 +    int s = clz64(v.hi);
 +
 +    if (s == 64) {
 +        /* we have uu÷0v => let's use divu128 */
 +        hi = u.hi;
 +        lo = u.lo;
 +        tmp = divu128(&lo, &hi, v.lo);
 +        *q = int128_make128(lo, hi);
 +        return int128_make128(tmp, 0);
 +    } else {
 +        hi = int128_gethi(int128_lshift(v, s));
 +
 +        if (hi > u.hi) {
 +            lo = u.lo;
 +            tmp = u.hi;
 +            divu128(&lo, &tmp, hi);
 +            lo = int128_gethi(int128_lshift(int128_make128(lo, 0), s));
 +        } else { /* prevent overflow */
 +            lo = u.lo;
 +            tmp = u.hi - hi;
 +            divu128(&lo, &tmp, hi);
 +            lo = int128_gethi(int128_lshift(int128_make128(lo, 1), s));
 +        }
 +
 +        qq = int128_make64(lo);
 +
 +        tmp = lo * v.hi;
 +        mulu64(&lo, &hi, lo, v.lo);
 +        hi += tmp;
 +
 +        if (hi < tmp     /* quotient * divisor >= 2**128 > dividend */
 +            || hi > u.hi /* quotient * divisor > dividend */
 +            || (hi == u.hi && lo > u.lo)) {
 +            qq.lo -= 1;
 +            mulu64(&lo, &hi, qq.lo, v.lo);
 +            hi += qq.lo * v.hi;
 +        }
 +
 +        *q = qq;
 +        u.hi -= hi + (u.lo < lo);
 +        u.lo -= lo;
 +        return u;
 +    }
 +}
 +
 +Int128 int128_divu(Int128 a, Int128 b)
 +{
 +    Int128 q;
 +    divrem128(a, b, &q);
 +    return q;
 +}
 +
 +Int128 int128_remu(Int128 a, Int128 b)
 +{
 +    Int128 q;
 +    return divrem128(a, b, &q);
 +}
 +
 +Int128 int128_divs(Int128 a, Int128 b)
 +{
 +    Int128 q;
 +    bool sgna = !int128_nonneg(a);
 +    bool sgnb = !int128_nonneg(b);
 +
 +    if (sgna) {
 +        a = int128_neg(a);
 +    }
 +
 +    if (sgnb) {
 +        b = int128_neg(b);
 +    }
 +
 +    divrem128(a, b, &q);
 +
 +    if (sgna != sgnb) {
 +        q = int128_neg(q);
 +    }
 +
 +    return q;
 +}
 +
 +Int128 int128_rems(Int128 a, Int128 b)
 +{
 +    Int128 q, r;
 +    bool sgna = !int128_nonneg(a);
 +    bool sgnb = !int128_nonneg(b);
 +
 +    if (sgna) {
 +        a = int128_neg(a);
 +    }
 +
 +    if (sgnb) {
 +        b = int128_neg(b);
 +    }
 +
 +    r = divrem128(a, b, &q);
 +
 +    if (sgna) {
 +        r = int128_neg(r);
 +    }
 +
 +    return r;
 +}
 +
 +#endif
 diff --git a/util/meson.build b/util/meson.build
 index XXXXXXX..XXXXXXX 100644
 --- a/util/meson.build
 +++ b/util/meson.build
@@ -XXX,XX +XXX,XX @@ util_ss.add(files('transactions.c'))
  util_ss.add(when: 'CONFIG_POSIX', if_true: files('drm.c'))
  util_ss.add(files('guest-random.c'))
  util_ss.add(files('yank.c'))
 +util_ss.add(files('int128.c'))
  if have_user
    util_ss.add(files('selfmap.c'))
 --
-.31.1
+.41.0

-[PULL 20/37] target/riscv: additional macros to check instruction support
+[PULL v2 30/45] target/riscv: check the in-kernel irqchip support
-From: Frédéric Pétrot <frederic.petrot@univ-grenoble-alpes.fr>
+From: Yong-Xuan Wang <yongxuan.wang@sifive.com>
-Given that the 128-bit version of the riscv spec adds new instructions, and
+We check the in-kernel irqchip support when using KVM acceleration.
 that some instructions that were previously only available in 64-bit mode
 are now available for both 64-bit and 128-bit, we added new macros to check
 for the processor mode during translation.
 Although RV128 is a superset of RV64, we keep for now the RV64 only tests
 for extensions other than RVI and RVM.
-Signed-off-by: Frédéric Pétrot <frederic.petrot@univ-grenoble-alpes.fr>
+Signed-off-by: Yong-Xuan Wang <yongxuan.wang@sifive.com>
-Co-authored-by: Fabien Portas <fabien.portas@grenoble-inp.org>
+Reviewed-by: Jim Shu <jim.shu@sifive.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Reviewed-by: Andrew Jones <ajones@ventanamicro.com>
-Message-id: 20220106210108.138226-5-frederic.petrot@univ-grenoble-alpes.fr
+Message-ID: <20230727102439.22554-3-yongxuan.wang@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/translate.c | 20 ++++++++++++++++----
+ target/riscv/kvm.c | 10 +++++++++-
-file changed, 16 insertions(+), 4 deletions(-)
+file changed, 9 insertions(+), 1 deletion(-)
-diff --git a/target/riscv/translate.c b/target/riscv/translate.c
+diff --git a/target/riscv/kvm.c b/target/riscv/kvm.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/translate.c
+--- a/target/riscv/kvm.c
-+++ b/target/riscv/translate.c
++++ b/target/riscv/kvm.c
-@@ -XXX,XX +XXX,XX @@ EX_SH(12)
+@@ -XXX,XX +XXX,XX @@ int kvm_arch_init(MachineState *ms, KVMState *s)
-     }                              \
- } while (0)
+ int kvm_arch_irqchip_create(KVMState *s)
+ {
--#define REQUIRE_64BIT(ctx) do {    \
+-    return 0;
--    if (get_xl(ctx) < MXL_RV64) {  \
++    if (kvm_kernel_irqchip_split()) {
--        return false;              \
++        error_report("-machine kernel_irqchip=split is not supported on RISC-V.");
--    }                              \
++        exit(1);
-+#define REQUIRE_64BIT(ctx) do {     \
++    }
 +    if (get_xl(ctx) != MXL_RV64) {  \
 +        return false;               \
 +    }                               \
 +} while (0)
 +
-+#define REQUIRE_128BIT(ctx) do {    \
++    /*
-+    if (get_xl(ctx) != MXL_RV128) { \
++     * We can create the VAIA using the newer device control API.
-+        return false;               \
++     */
-+    }                               \
++    return kvm_check_extension(s, KVM_CAP_DEVICE_CTRL);
-+} while (0)
+ }
-+
-+#define REQUIRE_64_OR_128BIT(ctx) do { \
+ int kvm_arch_process_async_events(CPUState *cs)
 +    if (get_xl(ctx) == MXL_RV32) {     \
 +        return false;                  \
 +    }                                  \
  } while (0)
  static int ex_rvc_register(DisasContext *ctx, int reg)
 --
-.31.1
+.41.0

-[PULL 33/37] target/riscv: modification of the trans_csrxx for 128-bit support
+[PULL v2 31/45] target/riscv: Create an KVM AIA irqchip
-From: Frédéric Pétrot <frederic.petrot@univ-grenoble-alpes.fr>
+From: Yong-Xuan Wang <yongxuan.wang@sifive.com>
-As opposed to the gen_arith and gen_shift generation helpers, the csr insns
+We create a vAIA chip by using the KVM_DEV_TYPE_RISCV_AIA and then set up
-do not have a common prototype, so the choice to generate 32/64 or 128-bit
+the chip with the KVM_DEV_RISCV_AIA_GRP_* APIs.
-helper calls is done in the trans_csrxx functions.
+We also extend KVM accelerator to specify the KVM AIA mode. The "riscv-aia"
 parameter is passed along with --accel in QEMU command-line.
 ) "riscv-aia=emul": IMSIC is emulated by hypervisor
 ) "riscv-aia=hwaccel": use hardware guest IMSIC
 ) "riscv-aia=auto": use the hardware guest IMSICs whenever available
                      otherwise we fallback to software emulation.
-Signed-off-by: Frédéric Pétrot <frederic.petrot@univ-grenoble-alpes.fr>
+Signed-off-by: Yong-Xuan Wang <yongxuan.wang@sifive.com>
-Co-authored-by: Fabien Portas <fabien.portas@grenoble-inp.org>
+Reviewed-by: Jim Shu <jim.shu@sifive.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Reviewed-by: Andrew Jones <ajones@ventanamicro.com>
-Message-id: 20220106210108.138226-18-frederic.petrot@univ-grenoble-alpes.fr
+Message-ID: <20230727102439.22554-4-yongxuan.wang@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/insn_trans/trans_rvi.c.inc | 201 +++++++++++++++++++-----
+ target/riscv/kvm_riscv.h |   4 +
-file changed, 158 insertions(+), 43 deletions(-)
+ target/riscv/kvm.c       | 186 +++++++++++++++++++++++++++++++++++++++
 files changed, 190 insertions(+)
-diff --git a/target/riscv/insn_trans/trans_rvi.c.inc b/target/riscv/insn_trans/trans_rvi.c.inc
+diff --git a/target/riscv/kvm_riscv.h b/target/riscv/kvm_riscv.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvi.c.inc
+--- a/target/riscv/kvm_riscv.h
-+++ b/target/riscv/insn_trans/trans_rvi.c.inc
++++ b/target/riscv/kvm_riscv.h
-@@ -XXX,XX +XXX,XX @@ static bool do_csrrw(DisasContext *ctx, int rd, int rc, TCGv src, TCGv mask)
+@@ -XXX,XX +XXX,XX @@
-     return do_csr_post(ctx);
+ void kvm_riscv_init_user_properties(Object *cpu_obj);
  void kvm_riscv_reset_vcpu(RISCVCPU *cpu);
  void kvm_riscv_set_irq(RISCVCPU *cpu, int irq, int level);
 +void kvm_riscv_aia_create(MachineState *machine, uint64_t group_shift,
 +                          uint64_t aia_irq_num, uint64_t aia_msi_num,
 +                          uint64_t aplic_base, uint64_t imsic_base,
 +                          uint64_t guest_num);
  #endif
 diff --git a/target/riscv/kvm.c b/target/riscv/kvm.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/kvm.c
 +++ b/target/riscv/kvm.c
@@ -XXX,XX +XXX,XX @@
  #include "exec/address-spaces.h"
  #include "hw/boards.h"
  #include "hw/irq.h"
 +#include "hw/intc/riscv_imsic.h"
  #include "qemu/log.h"
  #include "hw/loader.h"
  #include "kvm_riscv.h"
@@ -XXX,XX +XXX,XX @@
  #include "chardev/char-fe.h"
  #include "migration/migration.h"
  #include "sysemu/runstate.h"
 +#include "hw/riscv/numa.h"
  static uint64_t kvm_riscv_reg_id(CPURISCVState *env, uint64_t type,
                                   uint64_t idx)
@@ -XXX,XX +XXX,XX @@ bool kvm_arch_cpu_check_are_resettable(void)
      return true;
  }
--static bool trans_csrrw(DisasContext *ctx, arg_csrrw *a)
++static int aia_mode;
-+static bool do_csrr_i128(DisasContext *ctx, int rd, int rc)
++
 +static const char *kvm_aia_mode_str(uint64_t mode)
 +{
 +    switch (mode) {
 +    case KVM_DEV_RISCV_AIA_MODE_EMUL:
 +        return "emul";
 +    case KVM_DEV_RISCV_AIA_MODE_HWACCEL:
 +        return "hwaccel";
 +    case KVM_DEV_RISCV_AIA_MODE_AUTO:
 +    default:
 +        return "auto";
 +    };
 +}
 +
 +static char *riscv_get_kvm_aia(Object *obj, Error **errp)
 +{
 +    return g_strdup(kvm_aia_mode_str(aia_mode));
 +}
 +
 +static void riscv_set_kvm_aia(Object *obj, const char *val, Error **errp)
 +{
 +    if (!strcmp(val, "emul")) {
 +        aia_mode = KVM_DEV_RISCV_AIA_MODE_EMUL;
 +    } else if (!strcmp(val, "hwaccel")) {
 +        aia_mode = KVM_DEV_RISCV_AIA_MODE_HWACCEL;
 +    } else if (!strcmp(val, "auto")) {
 +        aia_mode = KVM_DEV_RISCV_AIA_MODE_AUTO;
 +    } else {
 +        error_setg(errp, "Invalid KVM AIA mode");
 +        error_append_hint(errp, "Valid values are emul, hwaccel, and auto.\n");
 +    }
 +}
 +
  void kvm_arch_accel_class_init(ObjectClass *oc)
  {
--    TCGv src = get_gpr(ctx, a->rs1, EXT_NONE);
++    object_class_property_add_str(oc, "riscv-aia", riscv_get_kvm_aia,
-+    TCGv destl = dest_gpr(ctx, rd);
++                                  riscv_set_kvm_aia);
-+    TCGv desth = dest_gprh(ctx, rd);
++    object_class_property_set_description(oc, "riscv-aia",
-+    TCGv_i32 csr = tcg_constant_i32(rc);
++                                          "Set KVM AIA mode. Valid values are "
++                                          "emul, hwaccel, and auto. Default "
--    /*
++                                          "is auto.");
--     * If rd == 0, the insn shall not read the csr, nor cause any of the
++    object_property_set_default_str(object_class_property_find(oc, "riscv-aia"),
--     * side effects that might occur on a csr read.
++                                    "auto");
--     */
++}
--    if (a->rd == 0) {
++
--        return do_csrw(ctx, a->csr, src);
++void kvm_riscv_aia_create(MachineState *machine, uint64_t group_shift,
-+    if (tb_cflags(ctx->base.tb) & CF_USE_ICOUNT) {
++                          uint64_t aia_irq_num, uint64_t aia_msi_num,
-+        gen_io_start();
++                          uint64_t aplic_base, uint64_t imsic_base,
-     }
++                          uint64_t guest_num)
-+    gen_helper_csrr_i128(destl, cpu_env, csr);
++{
-+    tcg_gen_ld_tl(desth, cpu_env, offsetof(CPURISCVState, retxh));
++    int ret, i;
-+    gen_set_gpr128(ctx, rd, destl, desth);
++    int aia_fd = -1;
-+    return do_csr_post(ctx);
++    uint64_t default_aia_mode;
-+}
++    uint64_t socket_count = riscv_socket_count(machine);
-+
++    uint64_t max_hart_per_socket = 0;
-+static bool do_csrw_i128(DisasContext *ctx, int rc, TCGv srcl, TCGv srch)
++    uint64_t socket, base_hart, hart_count, socket_imsic_base, imsic_addr;
-+{
++    uint64_t socket_bits, hart_bits, guest_bits;
-+    TCGv_i32 csr = tcg_constant_i32(rc);
++
-+
++    aia_fd = kvm_create_device(kvm_state, KVM_DEV_TYPE_RISCV_AIA, false);
-+    if (tb_cflags(ctx->base.tb) & CF_USE_ICOUNT) {
++
-+        gen_io_start();
++    if (aia_fd < 0) {
-+    }
++        error_report("Unable to create in-kernel irqchip");
-+    gen_helper_csrw_i128(cpu_env, csr, srcl, srch);
++        exit(1);
-+    return do_csr_post(ctx);
++    }
-+}
++
++    ret = kvm_device_access(aia_fd, KVM_DEV_RISCV_AIA_GRP_CONFIG,
--    TCGv mask = tcg_constant_tl(-1);
++                            KVM_DEV_RISCV_AIA_CONFIG_MODE,
--    return do_csrrw(ctx, a->rd, a->csr, src, mask);
++                            &default_aia_mode, false, NULL);
-+static bool do_csrrw_i128(DisasContext *ctx, int rd, int rc,
++    if (ret < 0) {
-+                          TCGv srcl, TCGv srch, TCGv maskl, TCGv maskh)
++        error_report("KVM AIA: failed to get current KVM AIA mode");
-+{
++        exit(1);
-+    TCGv destl = dest_gpr(ctx, rd);
++    }
-+    TCGv desth = dest_gprh(ctx, rd);
++    qemu_log("KVM AIA: default mode is %s\n",
-+    TCGv_i32 csr = tcg_constant_i32(rc);
++             kvm_aia_mode_str(default_aia_mode));
 +
-+    if (tb_cflags(ctx->base.tb) & CF_USE_ICOUNT) {
++    if (default_aia_mode != aia_mode) {
-+        gen_io_start();
++        ret = kvm_device_access(aia_fd, KVM_DEV_RISCV_AIA_GRP_CONFIG,
-+    }
++                                KVM_DEV_RISCV_AIA_CONFIG_MODE,
-+    gen_helper_csrrw_i128(destl, cpu_env, csr, srcl, srch, maskl, maskh);
++                                &aia_mode, true, NULL);
-+    tcg_gen_ld_tl(desth, cpu_env, offsetof(CPURISCVState, retxh));
++        if (ret < 0)
-+    gen_set_gpr128(ctx, rd, destl, desth);
++            warn_report("KVM AIA: failed to set KVM AIA mode");
-+    return do_csr_post(ctx);
++        else
-+}
++            qemu_log("KVM AIA: set current mode to %s\n",
-+
++                     kvm_aia_mode_str(aia_mode));
-+static bool trans_csrrw(DisasContext *ctx, arg_csrrw *a)
++    }
-+{
++
-+    if (get_xl(ctx) < MXL_RV128) {
++    ret = kvm_device_access(aia_fd, KVM_DEV_RISCV_AIA_GRP_CONFIG,
-+        TCGv src = get_gpr(ctx, a->rs1, EXT_NONE);
++                            KVM_DEV_RISCV_AIA_CONFIG_SRCS,
-+
++                            &aia_irq_num, true, NULL);
-+        /*
++    if (ret < 0) {
-+         * If rd == 0, the insn shall not read the csr, nor cause any of the
++        error_report("KVM AIA: failed to set number of input irq lines");
-+         * side effects that might occur on a csr read.
++        exit(1);
-+         */
++    }
-+        if (a->rd == 0) {
++
-+            return do_csrw(ctx, a->csr, src);
++    ret = kvm_device_access(aia_fd, KVM_DEV_RISCV_AIA_GRP_CONFIG,
 +                            KVM_DEV_RISCV_AIA_CONFIG_IDS,
 +                            &aia_msi_num, true, NULL);
 +    if (ret < 0) {
 +        error_report("KVM AIA: failed to set number of msi");
 +        exit(1);
 +    }
 +
 +    socket_bits = find_last_bit(&socket_count, BITS_PER_LONG) + 1;
 +    ret = kvm_device_access(aia_fd, KVM_DEV_RISCV_AIA_GRP_CONFIG,
 +                            KVM_DEV_RISCV_AIA_CONFIG_GROUP_BITS,
 +                            &socket_bits, true, NULL);
 +    if (ret < 0) {
 +        error_report("KVM AIA: failed to set group_bits");
 +        exit(1);
 +    }
 +
 +    ret = kvm_device_access(aia_fd, KVM_DEV_RISCV_AIA_GRP_CONFIG,
 +                            KVM_DEV_RISCV_AIA_CONFIG_GROUP_SHIFT,
 +                            &group_shift, true, NULL);
 +    if (ret < 0) {
 +        error_report("KVM AIA: failed to set group_shift");
 +        exit(1);
 +    }
 +
 +    guest_bits = guest_num == 0 ? 0 :
 +                 find_last_bit(&guest_num, BITS_PER_LONG) + 1;
 +    ret = kvm_device_access(aia_fd, KVM_DEV_RISCV_AIA_GRP_CONFIG,
 +                            KVM_DEV_RISCV_AIA_CONFIG_GUEST_BITS,
 +                            &guest_bits, true, NULL);
 +    if (ret < 0) {
 +        error_report("KVM AIA: failed to set guest_bits");
 +        exit(1);
 +    }
 +
 +    ret = kvm_device_access(aia_fd, KVM_DEV_RISCV_AIA_GRP_ADDR,
 +                            KVM_DEV_RISCV_AIA_ADDR_APLIC,
 +                            &aplic_base, true, NULL);
 +    if (ret < 0) {
 +        error_report("KVM AIA: failed to set the base address of APLIC");
 +        exit(1);
 +    }
 +
 +    for (socket = 0; socket < socket_count; socket++) {
 +        socket_imsic_base = imsic_base + socket * (1U << group_shift);
 +        hart_count = riscv_socket_hart_count(machine, socket);
 +        base_hart = riscv_socket_first_hartid(machine, socket);
 +
 +        if (max_hart_per_socket < hart_count) {
 +            max_hart_per_socket = hart_count;
 +        }
 +
-+        TCGv mask = tcg_constant_tl(-1);
++        for (i = 0; i < hart_count; i++) {
-+        return do_csrrw(ctx, a->rd, a->csr, src, mask);
++            imsic_addr = socket_imsic_base + i * IMSIC_HART_SIZE(guest_bits);
-+    } else {
++            ret = kvm_device_access(aia_fd, KVM_DEV_RISCV_AIA_GRP_ADDR,
-+        TCGv srcl = get_gpr(ctx, a->rs1, EXT_NONE);
++                                    KVM_DEV_RISCV_AIA_ADDR_IMSIC(i + base_hart),
-+        TCGv srch = get_gprh(ctx, a->rs1);
++                                    &imsic_addr, true, NULL);
-+
++            if (ret < 0) {
-+        /*
++                error_report("KVM AIA: failed to set the IMSIC address for hart %d", i);
-+         * If rd == 0, the insn shall not read the csr, nor cause any of the
++                exit(1);
-+         * side effects that might occur on a csr read.
++            }
 +         */
 +        if (a->rd == 0) {
 +            return do_csrw_i128(ctx, a->csr, srcl, srch);
 +        }
-+
++    }
-+        TCGv mask = tcg_constant_tl(-1);
++
-+        return do_csrrw_i128(ctx, a->rd, a->csr, srcl, srch, mask, mask);
++    hart_bits = find_last_bit(&max_hart_per_socket, BITS_PER_LONG) + 1;
-+    }
++    ret = kvm_device_access(aia_fd, KVM_DEV_RISCV_AIA_GRP_CONFIG,
- }
++                            KVM_DEV_RISCV_AIA_CONFIG_HART_BITS,
++                            &hart_bits, true, NULL);
- static bool trans_csrrs(DisasContext *ctx, arg_csrrs *a)
++    if (ret < 0) {
-@@ -XXX,XX +XXX,XX @@ static bool trans_csrrs(DisasContext *ctx, arg_csrrs *a)
++        error_report("KVM AIA: failed to set hart_bits");
-      * a zero value, the instruction will still attempt to write the
++        exit(1);
-      * unmodified value back to the csr and will cause side effects.
++    }
-      */
++
--    if (a->rs1 == 0) {
++    if (kvm_has_gsi_routing()) {
--        return do_csrr(ctx, a->rd, a->csr);
++        for (uint64_t idx = 0; idx < aia_irq_num + 1; ++idx) {
--    }
++            /* KVM AIA only has one APLIC instance */
-+    if (get_xl(ctx) < MXL_RV128) {
++            kvm_irqchip_add_irq_route(kvm_state, idx, 0, idx);
 +        if (a->rs1 == 0) {
 +            return do_csrr(ctx, a->rd, a->csr);
 +        }
++        kvm_gsi_routing_allowed = true;
--    TCGv ones = tcg_constant_tl(-1);
++        kvm_irqchip_commit_routes(kvm_state);
--    TCGv mask = get_gpr(ctx, a->rs1, EXT_ZERO);
++    }
--    return do_csrrw(ctx, a->rd, a->csr, ones, mask);
++
-+        TCGv ones = tcg_constant_tl(-1);
++    ret = kvm_device_access(aia_fd, KVM_DEV_RISCV_AIA_GRP_CTRL,
-+        TCGv mask = get_gpr(ctx, a->rs1, EXT_ZERO);
++                            KVM_DEV_RISCV_AIA_CTRL_INIT,
-+        return do_csrrw(ctx, a->rd, a->csr, ones, mask);
++                            NULL, true, NULL);
-+    } else {
++    if (ret < 0) {
-+        if (a->rs1 == 0) {
++        error_report("KVM AIA: initialized fail");
-+            return do_csrr_i128(ctx, a->rd, a->csr);
++        exit(1);
-+        }
++    }
 +
-+        TCGv ones = tcg_constant_tl(-1);
++    kvm_msi_via_irqfd_allowed = kvm_irqfds_enabled();
 +        TCGv maskl = get_gpr(ctx, a->rs1, EXT_ZERO);
 +        TCGv maskh = get_gprh(ctx, a->rs1);
 +        return do_csrrw_i128(ctx, a->rd, a->csr, ones, ones, maskl, maskh);
 +    }
  }
  static bool trans_csrrc(DisasContext *ctx, arg_csrrc *a)
@@ -XXX,XX +XXX,XX @@ static bool trans_csrrc(DisasContext *ctx, arg_csrrc *a)
       * a zero value, the instruction will still attempt to write the
       * unmodified value back to the csr and will cause side effects.
       */
 -    if (a->rs1 == 0) {
 -        return do_csrr(ctx, a->rd, a->csr);
 -    }
 +    if (get_xl(ctx) < MXL_RV128) {
 +        if (a->rs1 == 0) {
 +            return do_csrr(ctx, a->rd, a->csr);
 +        }
 -    TCGv mask = get_gpr(ctx, a->rs1, EXT_ZERO);
 -    return do_csrrw(ctx, a->rd, a->csr, ctx->zero, mask);
 +        TCGv mask = get_gpr(ctx, a->rs1, EXT_ZERO);
 +        return do_csrrw(ctx, a->rd, a->csr, ctx->zero, mask);
 +    } else {
 +        if (a->rs1 == 0) {
 +            return do_csrr_i128(ctx, a->rd, a->csr);
 +        }
 +
 +        TCGv maskl = get_gpr(ctx, a->rs1, EXT_ZERO);
 +        TCGv maskh = get_gprh(ctx, a->rs1);
 +        return do_csrrw_i128(ctx, a->rd, a->csr,
 +                             ctx->zero, ctx->zero, maskl, maskh);
 +    }
  }
  static bool trans_csrrwi(DisasContext *ctx, arg_csrrwi *a)
  {
 -    TCGv src = tcg_constant_tl(a->rs1);
 +    if (get_xl(ctx) < MXL_RV128) {
 +        TCGv src = tcg_constant_tl(a->rs1);
 -    /*
 -     * If rd == 0, the insn shall not read the csr, nor cause any of the
 -     * side effects that might occur on a csr read.
 -     */
 -    if (a->rd == 0) {
 -        return do_csrw(ctx, a->csr, src);
 -    }
 +        /*
 +         * If rd == 0, the insn shall not read the csr, nor cause any of the
 +         * side effects that might occur on a csr read.
 +         */
 +        if (a->rd == 0) {
 +            return do_csrw(ctx, a->csr, src);
 +        }
 -    TCGv mask = tcg_constant_tl(-1);
 -    return do_csrrw(ctx, a->rd, a->csr, src, mask);
 +        TCGv mask = tcg_constant_tl(-1);
 +        return do_csrrw(ctx, a->rd, a->csr, src, mask);
 +    } else {
 +        TCGv src = tcg_constant_tl(a->rs1);
 +
 +        /*
 +         * If rd == 0, the insn shall not read the csr, nor cause any of the
 +         * side effects that might occur on a csr read.
 +         */
 +        if (a->rd == 0) {
 +            return do_csrw_i128(ctx, a->csr, src, ctx->zero);
 +        }
 +
 +        TCGv mask = tcg_constant_tl(-1);
 +        return do_csrrw_i128(ctx, a->rd, a->csr, src, ctx->zero, mask, mask);
 +    }
  }
  static bool trans_csrrsi(DisasContext *ctx, arg_csrrsi *a)
@@ -XXX,XX +XXX,XX @@ static bool trans_csrrsi(DisasContext *ctx, arg_csrrsi *a)
       * a zero value, the instruction will still attempt to write the
       * unmodified value back to the csr and will cause side effects.
       */
 -    if (a->rs1 == 0) {
 -        return do_csrr(ctx, a->rd, a->csr);
 -    }
 +    if (get_xl(ctx) < MXL_RV128) {
 +        if (a->rs1 == 0) {
 +            return do_csrr(ctx, a->rd, a->csr);
 +        }
 +
 +        TCGv ones = tcg_constant_tl(-1);
 +        TCGv mask = tcg_constant_tl(a->rs1);
 +        return do_csrrw(ctx, a->rd, a->csr, ones, mask);
 +    } else {
 +        if (a->rs1 == 0) {
 +            return do_csrr_i128(ctx, a->rd, a->csr);
 +        }
 -    TCGv ones = tcg_constant_tl(-1);
 -    TCGv mask = tcg_constant_tl(a->rs1);
 -    return do_csrrw(ctx, a->rd, a->csr, ones, mask);
 +        TCGv ones = tcg_constant_tl(-1);
 +        TCGv mask = tcg_constant_tl(a->rs1);
 +        return do_csrrw_i128(ctx, a->rd, a->csr, ones, ones, mask, ctx->zero);
 +    }
  }
 -static bool trans_csrrci(DisasContext *ctx, arg_csrrci *a)
 +static bool trans_csrrci(DisasContext *ctx, arg_csrrci * a)
  {
      /*
       * If rs1 == 0, the insn shall not write to the csr at all, nor
@@ -XXX,XX +XXX,XX @@ static bool trans_csrrci(DisasContext *ctx, arg_csrrci *a)
       * a zero value, the instruction will still attempt to write the
       * unmodified value back to the csr and will cause side effects.
       */
 -    if (a->rs1 == 0) {
 -        return do_csrr(ctx, a->rd, a->csr);
 -    }
 +    if (get_xl(ctx) < MXL_RV128) {
 +        if (a->rs1 == 0) {
 +            return do_csrr(ctx, a->rd, a->csr);
 +        }
 -    TCGv mask = tcg_constant_tl(a->rs1);
 -    return do_csrrw(ctx, a->rd, a->csr, ctx->zero, mask);
 +        TCGv mask = tcg_constant_tl(a->rs1);
 +        return do_csrrw(ctx, a->rd, a->csr, ctx->zero, mask);
 +    } else {
 +        if (a->rs1 == 0) {
 +            return do_csrr_i128(ctx, a->rd, a->csr);
 +        }
 +
 +        TCGv mask = tcg_constant_tl(a->rs1);
 +        return do_csrrw_i128(ctx, a->rd, a->csr,
 +                             ctx->zero, ctx->zero, mask, ctx->zero);
 +    }
  }
 --
-.31.1
+.41.0

-[PULL 02/37] hw/dma: sifive_pdma: support high 32-bit access of 64-bit register
+[PULL v2 32/45] target/riscv: update APLIC and IMSIC to support KVM AIA
-From: Jim Shu <jim.shu@sifive.com>
+From: Yong-Xuan Wang <yongxuan.wang@sifive.com>
-Real PDMA supports high 32-bit read/write memory access of 64-bit
+KVM AIA can't emulate APLIC only. When "aia=aplic" parameter is passed,
-register.
+APLIC devices is emulated by QEMU. For "aia=aplic-imsic", remove the
 mmio operations of APLIC when using KVM AIA and send wired interrupt
 signal via KVM_IRQ_LINE API.
 After KVM AIA enabled, MSI messages are delivered by KVM_SIGNAL_MSI API
 when the IMSICs receive mmio write requests.
-The following result is PDMA tested in U-Boot on Unmatched board:
+Signed-off-by: Yong-Xuan Wang <yongxuan.wang@sifive.com>
+Reviewed-by: Jim Shu <jim.shu@sifive.com>
-. Real PDMA allows high 32-bit read/write to 64-bit register.
+Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
-=> mw.l 0x3000000 0x0                      <= Disclaim channel 0
+Reviewed-by: Andrew Jones <ajones@ventanamicro.com>
-=> mw.l 0x3000000 0x1                      <= Claim channel 0
+Message-ID: <20230727102439.22554-5-yongxuan.wang@sifive.com>
 => mw.l 0x3000010 0x80000000               <= Write low 32-bit NextDest (NextDest = 0x280000000)
 => mw.l 0x3000014 0x2                      <= Write high 32-bit NextDest
 => md.l 0x3000010 1                        <= Dump low 32-bit NextDest
 03000010: 80000000
 => md.l 0x3000014 1                        <= Dump high 32-bit NextDest
 03000014: 00000002
 => mw.l 0x3000018 0x80001000               <= Write low 32-bit NextSrc (NextSrc = 0x280001000)
 => mw.l 0x300001c 0x2                      <= Write high 32-bit NextSrc
 => md.l 0x3000018 1                        <= Dump low 32-bit NextSrc
 03000010: 80001000
 => md.l 0x300001c 1                        <= Dump high 32-bit NextSrc
 03000014: 00000002
 . PDMA transfer from 0x280001000 to 0x280000000 is OK.
 => mw.q 0x3000008 0x4                      <= NextBytes = 4
 => mw.l 0x3000004 0x22000000               <= wsize = rsize = 2 (2^2 = 4 bytes)
 => mw.l 0x280000000 0x87654321             <= Fill test data to dst
 => mw.l 0x280001000 0x12345678             <= Fill test data to src
 => md.l 0x280000000 1; md.l 0x280001000 1  <= Dump src/dst memory contents
 280000000: 87654321                              !Ce.
 280001000: 12345678                              xV4.
 => md.l 0x3000000 8                        <= Dump PDMA status
 03000000: 00000001 22000000 00000004 00000000    ......."........
 03000010: 80000000 00000002 80001000 00000002    ................
 => mw.l 0x3000000 0x3                      <= Set channel 0 run and claim bits
 => md.l 0x3000000 8                        <= Dump PDMA status
 03000000: 40000001 22000000 00000004 00000000    ...@..."........
 03000010: 80000000 00000002 80001000 00000002    ................
 => md.l 0x280000000 1; md.l 0x280001000 1  <= Dump src/dst memory contents
 280000000: 12345678                               xV4.
 280001000: 12345678                               xV4.
 Signed-off-by: Jim Shu <jim.shu@sifive.com>
 Reviewed-by: Frank Chang <frank.chang@sifive.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
 Reviewed-by: Bin Meng <bmeng.cn@gmail.com>
 Tested-by: Bin Meng <bmeng.cn@gmail.com>
 Message-id: 20220104063408.658169-2-jim.shu@sifive.com
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- hw/dma/sifive_pdma.c | 177 +++++++++++++++++++++++++++++++++++++------
+ hw/intc/riscv_aplic.c | 56 ++++++++++++++++++++++++++++++-------------
-file changed, 155 insertions(+), 22 deletions(-)
+ hw/intc/riscv_imsic.c | 25 +++++++++++++++----
 files changed, 61 insertions(+), 20 deletions(-)
-diff --git a/hw/dma/sifive_pdma.c b/hw/dma/sifive_pdma.c
+diff --git a/hw/intc/riscv_aplic.c b/hw/intc/riscv_aplic.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/dma/sifive_pdma.c
+--- a/hw/intc/riscv_aplic.c
-+++ b/hw/dma/sifive_pdma.c
++++ b/hw/intc/riscv_aplic.c
-@@ -XXX,XX +XXX,XX @@ static inline void sifive_pdma_update_irq(SiFivePDMAState *s, int ch)
+@@ -XXX,XX +XXX,XX @@
-     s->chan[ch].state = DMA_CHAN_STATE_IDLE;
+ #include "hw/irq.h"
- }
+ #include "target/riscv/cpu.h"
+ #include "sysemu/sysemu.h"
--static uint64_t sifive_pdma_read(void *opaque, hwaddr offset, unsigned size)
++#include "sysemu/kvm.h"
-+static uint64_t sifive_pdma_readq(SiFivePDMAState *s, int ch, hwaddr offset)
+ #include "migration/vmstate.h"
- {
--    SiFivePDMAState *s = opaque;
+ #define APLIC_MAX_IDC                  (1UL << 14)
--    int ch = SIFIVE_PDMA_CHAN_NO(offset);
+@@ -XXX,XX +XXX,XX @@
-     uint64_t val = 0;
+ #define APLIC_IDC_CLAIMI               0x1c
--    if (ch >= SIFIVE_PDMA_CHANS) {
--        qemu_log_mask(LOG_GUEST_ERROR, "%s: Invalid channel no %d\n",
++/*
--                      __func__, ch);
++ * KVM AIA only supports APLIC MSI, fallback to QEMU emulation if we want to use
--        return 0;
++ * APLIC Wired.
-+    offset &= 0xfff;
++ */
-+    switch (offset) {
++static bool is_kvm_aia(bool msimode)
-+    case DMA_NEXT_BYTES:
++{
-+        val = s->chan[ch].next_bytes;
++    return kvm_irqchip_in_kernel() && msimode;
 +        break;
 +    case DMA_NEXT_DST:
 +        val = s->chan[ch].next_dst;
 +        break;
 +    case DMA_NEXT_SRC:
 +        val = s->chan[ch].next_src;
 +        break;
 +    case DMA_EXEC_BYTES:
 +        val = s->chan[ch].exec_bytes;
 +        break;
 +    case DMA_EXEC_DST:
 +        val = s->chan[ch].exec_dst;
 +        break;
 +    case DMA_EXEC_SRC:
 +        val = s->chan[ch].exec_src;
 +        break;
 +    default:
 +        qemu_log_mask(LOG_GUEST_ERROR,
 +                      "%s: Unexpected 64-bit access to 0x%" HWADDR_PRIX "\n",
 +                      __func__, offset);
 +        break;
      }
 +    return val;
 +}
 +
-+static uint32_t sifive_pdma_readl(SiFivePDMAState *s, int ch, hwaddr offset)
+ static uint32_t riscv_aplic_read_input_word(RISCVAPLICState *aplic,
                                              uint32_t word)
  {
@@ -XXX,XX +XXX,XX @@ static uint32_t riscv_aplic_idc_claimi(RISCVAPLICState *aplic, uint32_t idc)
      return topi;
  }
 +static void riscv_kvm_aplic_request(void *opaque, int irq, int level)
 +{
-+    uint32_t val = 0;
++    kvm_set_irq(kvm_state, irq, !!level);
 +
      offset &= 0xfff;
      switch (offset) {
      case DMA_CONTROL:
@@ -XXX,XX +XXX,XX @@ static uint64_t sifive_pdma_read(void *opaque, hwaddr offset, unsigned size)
          val = s->chan[ch].next_config;
          break;
      case DMA_NEXT_BYTES:
 -        val = s->chan[ch].next_bytes;
 +        val = extract64(s->chan[ch].next_bytes, 0, 32);
 +        break;
 +    case DMA_NEXT_BYTES + 4:
 +        val = extract64(s->chan[ch].next_bytes, 32, 32);
          break;
      case DMA_NEXT_DST:
 -        val = s->chan[ch].next_dst;
 +        val = extract64(s->chan[ch].next_dst, 0, 32);
 +        break;
 +    case DMA_NEXT_DST + 4:
 +        val = extract64(s->chan[ch].next_dst, 32, 32);
          break;
      case DMA_NEXT_SRC:
 -        val = s->chan[ch].next_src;
 +        val = extract64(s->chan[ch].next_src, 0, 32);
 +        break;
 +    case DMA_NEXT_SRC + 4:
 +        val = extract64(s->chan[ch].next_src, 32, 32);
          break;
      case DMA_EXEC_CONFIG:
          val = s->chan[ch].exec_config;
          break;
      case DMA_EXEC_BYTES:
 -        val = s->chan[ch].exec_bytes;
 +        val = extract64(s->chan[ch].exec_bytes, 0, 32);
 +        break;
 +    case DMA_EXEC_BYTES + 4:
 +        val = extract64(s->chan[ch].exec_bytes, 32, 32);
          break;
      case DMA_EXEC_DST:
 -        val = s->chan[ch].exec_dst;
 +        val = extract64(s->chan[ch].exec_dst, 0, 32);
 +        break;
 +    case DMA_EXEC_DST + 4:
 +        val = extract64(s->chan[ch].exec_dst, 32, 32);
          break;
      case DMA_EXEC_SRC:
 -        val = s->chan[ch].exec_src;
 +        val = extract64(s->chan[ch].exec_src, 0, 32);
 +        break;
 +    case DMA_EXEC_SRC + 4:
 +        val = extract64(s->chan[ch].exec_src, 32, 32);
          break;
      default:
 -        qemu_log_mask(LOG_GUEST_ERROR, "%s: Bad offset 0x%" HWADDR_PRIX "\n",
 +        qemu_log_mask(LOG_GUEST_ERROR,
 +                      "%s: Unexpected 32-bit access to 0x%" HWADDR_PRIX "\n",
                        __func__, offset);
          break;
      }
@@ -XXX,XX +XXX,XX @@ static uint64_t sifive_pdma_read(void *opaque, hwaddr offset, unsigned size)
      return val;
  }
 -static void sifive_pdma_write(void *opaque, hwaddr offset,
 -                              uint64_t value, unsigned size)
 +static uint64_t sifive_pdma_read(void *opaque, hwaddr offset, unsigned size)
  {
      SiFivePDMAState *s = opaque;
      int ch = SIFIVE_PDMA_CHAN_NO(offset);
 -    bool claimed, run;
 +    uint64_t val = 0;
      if (ch >= SIFIVE_PDMA_CHANS) {
          qemu_log_mask(LOG_GUEST_ERROR, "%s: Invalid channel no %d\n",
                        __func__, ch);
 -        return;
 +        return 0;
 +    }
 +
 +    switch (size) {
 +    case 8:
 +        val = sifive_pdma_readq(s, ch, offset);
 +        break;
 +    case 4:
 +        val = sifive_pdma_readl(s, ch, offset);
 +        break;
 +    default:
 +        qemu_log_mask(LOG_GUEST_ERROR, "%s: Invalid read size %u to PDMA\n",
 +                      __func__, size);
 +        return 0;
      }
 +    return val;
 +}
 +
-+static void sifive_pdma_writeq(SiFivePDMAState *s, int ch,
+ static void riscv_aplic_request(void *opaque, int irq, int level)
-+                               hwaddr offset, uint64_t value)
+ {
-+{
+     bool update = false;
-+    offset &= 0xfff;
+@@ -XXX,XX +XXX,XX @@ static void riscv_aplic_realize(DeviceState *dev, Error **errp)
-+    switch (offset) {
+     uint32_t i;
-+    case DMA_NEXT_BYTES:
+     RISCVAPLICState *aplic = RISCV_APLIC(dev);
-+        s->chan[ch].next_bytes = value;
-+        break;
+-    aplic->bitfield_words = (aplic->num_irqs + 31) >> 5;
-+    case DMA_NEXT_DST:
+-    aplic->sourcecfg = g_new0(uint32_t, aplic->num_irqs);
-+        s->chan[ch].next_dst = value;
+-    aplic->state = g_new0(uint32_t, aplic->num_irqs);
-+        break;
+-    aplic->target = g_new0(uint32_t, aplic->num_irqs);
-+    case DMA_NEXT_SRC:
+-    if (!aplic->msimode) {
-+        s->chan[ch].next_src = value;
+-        for (i = 0; i < aplic->num_irqs; i++) {
-+        break;
+-            aplic->target[i] = 1;
-+    case DMA_EXEC_BYTES:
++    if (!is_kvm_aia(aplic->msimode)) {
-+    case DMA_EXEC_DST:
++        aplic->bitfield_words = (aplic->num_irqs + 31) >> 5;
-+    case DMA_EXEC_SRC:
++        aplic->sourcecfg = g_new0(uint32_t, aplic->num_irqs);
-+        /* these are read-only registers */
++        aplic->state = g_new0(uint32_t, aplic->num_irqs);
-+        break;
++        aplic->target = g_new0(uint32_t, aplic->num_irqs);
-+    default:
++        if (!aplic->msimode) {
-+        qemu_log_mask(LOG_GUEST_ERROR,
++            for (i = 0; i < aplic->num_irqs; i++) {
-+                      "%s: Unexpected 64-bit access to 0x%" HWADDR_PRIX "\n",
++                aplic->target[i] = 1;
-+                      __func__, offset);
++            }
-+        break;
+         }
 -    }
 -    aplic->idelivery = g_new0(uint32_t, aplic->num_harts);
 -    aplic->iforce = g_new0(uint32_t, aplic->num_harts);
 -    aplic->ithreshold = g_new0(uint32_t, aplic->num_harts);
 +        aplic->idelivery = g_new0(uint32_t, aplic->num_harts);
 +        aplic->iforce = g_new0(uint32_t, aplic->num_harts);
 +        aplic->ithreshold = g_new0(uint32_t, aplic->num_harts);
 -    memory_region_init_io(&aplic->mmio, OBJECT(dev), &riscv_aplic_ops, aplic,
 -                          TYPE_RISCV_APLIC, aplic->aperture_size);
 -    sysbus_init_mmio(SYS_BUS_DEVICE(dev), &aplic->mmio);
 +        memory_region_init_io(&aplic->mmio, OBJECT(dev), &riscv_aplic_ops,
 +                              aplic, TYPE_RISCV_APLIC, aplic->aperture_size);
 +        sysbus_init_mmio(SYS_BUS_DEVICE(dev), &aplic->mmio);
 +    }
-+}
      /*
       * Only root APLICs have hardware IRQ lines. All non-root APLICs
       * have IRQ lines delegated by their parent APLIC.
       */
      if (!aplic->parent) {
 -        qdev_init_gpio_in(dev, riscv_aplic_request, aplic->num_irqs);
 +        if (is_kvm_aia(aplic->msimode)) {
 +            qdev_init_gpio_in(dev, riscv_kvm_aplic_request, aplic->num_irqs);
 +        } else {
 +            qdev_init_gpio_in(dev, riscv_aplic_request, aplic->num_irqs);
 +        }
      }
      /* Create output IRQ lines for non-MSI mode */
@@ -XXX,XX +XXX,XX @@ DeviceState *riscv_aplic_create(hwaddr addr, hwaddr size,
      qdev_prop_set_bit(dev, "mmode", mmode);
      sysbus_realize_and_unref(SYS_BUS_DEVICE(dev), &error_fatal);
 -    sysbus_mmio_map(SYS_BUS_DEVICE(dev), 0, addr);
 +
-+static void sifive_pdma_writel(SiFivePDMAState *s, int ch,
++    if (!is_kvm_aia(msimode)) {
-+                               hwaddr offset, uint32_t value)
++        sysbus_mmio_map(SYS_BUS_DEVICE(dev), 0, addr);
-+{
++    }
-+    bool claimed, run;
      if (parent) {
          riscv_aplic_add_child(parent, dev);
 diff --git a/hw/intc/riscv_imsic.c b/hw/intc/riscv_imsic.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/intc/riscv_imsic.c
 +++ b/hw/intc/riscv_imsic.c
@@ -XXX,XX +XXX,XX @@
  #include "target/riscv/cpu.h"
  #include "target/riscv/cpu_bits.h"
  #include "sysemu/sysemu.h"
 +#include "sysemu/kvm.h"
  #include "migration/vmstate.h"
  #define IMSIC_MMIO_PAGE_LE             0x00
@@ -XXX,XX +XXX,XX @@ static void riscv_imsic_write(void *opaque, hwaddr addr, uint64_t value,
          goto err;
      }
 +#if defined(CONFIG_KVM)
 +    if (kvm_irqchip_in_kernel()) {
 +        struct kvm_msi msi;
 +
-     offset &= 0xfff;
++        msi.address_lo = extract64(imsic->mmio.addr + addr, 0, 32);
-     switch (offset) {
++        msi.address_hi = extract64(imsic->mmio.addr + addr, 32, 32);
-     case DMA_CONTROL:
++        msi.data = le32_to_cpu(value);
@@ -XXX,XX +XXX,XX @@ static void sifive_pdma_write(void *opaque, hwaddr offset,
          s->chan[ch].next_config = value;
          break;
      case DMA_NEXT_BYTES:
 -        s->chan[ch].next_bytes = value;
 +        s->chan[ch].next_bytes =
 +            deposit64(s->chan[ch].next_bytes, 0, 32, value);
 +        break;
 +    case DMA_NEXT_BYTES + 4:
 +        s->chan[ch].next_bytes =
 +            deposit64(s->chan[ch].next_bytes, 32, 32, value);
          break;
      case DMA_NEXT_DST:
 -        s->chan[ch].next_dst = value;
 +        s->chan[ch].next_dst = deposit64(s->chan[ch].next_dst, 0, 32, value);
 +        break;
 +    case DMA_NEXT_DST + 4:
 +        s->chan[ch].next_dst = deposit64(s->chan[ch].next_dst, 32, 32, value);
          break;
      case DMA_NEXT_SRC:
 -        s->chan[ch].next_src = value;
 +        s->chan[ch].next_src = deposit64(s->chan[ch].next_src, 0, 32, value);
 +        break;
 +    case DMA_NEXT_SRC + 4:
 +        s->chan[ch].next_src = deposit64(s->chan[ch].next_src, 32, 32, value);
          break;
      case DMA_EXEC_CONFIG:
      case DMA_EXEC_BYTES:
 +    case DMA_EXEC_BYTES + 4:
      case DMA_EXEC_DST:
 +    case DMA_EXEC_DST + 4:
      case DMA_EXEC_SRC:
 +    case DMA_EXEC_SRC + 4:
          /* these are read-only registers */
          break;
      default:
 -        qemu_log_mask(LOG_GUEST_ERROR, "%s: Bad offset 0x%" HWADDR_PRIX "\n",
 +        qemu_log_mask(LOG_GUEST_ERROR,
 +                      "%s: Unexpected 32-bit access to 0x%" HWADDR_PRIX "\n",
                        __func__, offset);
          break;
      }
  }
 +static void sifive_pdma_write(void *opaque, hwaddr offset,
 +                              uint64_t value, unsigned size)
 +{
 +    SiFivePDMAState *s = opaque;
 +    int ch = SIFIVE_PDMA_CHAN_NO(offset);
 +
-+    if (ch >= SIFIVE_PDMA_CHANS) {
++        kvm_vm_ioctl(kvm_state, KVM_SIGNAL_MSI, &msi);
-+        qemu_log_mask(LOG_GUEST_ERROR, "%s: Invalid channel no %d\n",
++
 +                      __func__, ch);
 +        return;
 +    }
++#endif
 +
-+    switch (size) {
+     /* Writes only supported for MSI little-endian registers */
-+    case 8:
+     page = addr >> IMSIC_MMIO_PAGE_SHIFT;
-+        sifive_pdma_writeq(s, ch, offset, value);
+     if ((addr & (IMSIC_MMIO_PAGE_SZ - 1)) == IMSIC_MMIO_PAGE_LE) {
-+        break;
+@@ -XXX,XX +XXX,XX @@ static void riscv_imsic_realize(DeviceState *dev, Error **errp)
-+    case 4:
+     CPUState *cpu = cpu_by_arch_id(imsic->hartid);
-+        sifive_pdma_writel(s, ch, offset, (uint32_t) value);
+     CPURISCVState *env = cpu ? cpu->env_ptr : NULL;
-+        break;
-+    default:
+-    imsic->num_eistate = imsic->num_pages * imsic->num_irqs;
-+        qemu_log_mask(LOG_GUEST_ERROR, "%s: Invalid write size %u to PDMA\n",
+-    imsic->eidelivery = g_new0(uint32_t, imsic->num_pages);
-+                      __func__, size);
+-    imsic->eithreshold = g_new0(uint32_t, imsic->num_pages);
-+        break;
+-    imsic->eistate = g_new0(uint32_t, imsic->num_eistate);
 +    if (!kvm_irqchip_in_kernel()) {
 +        imsic->num_eistate = imsic->num_pages * imsic->num_irqs;
 +        imsic->eidelivery = g_new0(uint32_t, imsic->num_pages);
 +        imsic->eithreshold = g_new0(uint32_t, imsic->num_pages);
 +        imsic->eistate = g_new0(uint32_t, imsic->num_eistate);
 +    }
-+}
-+
+     memory_region_init_io(&imsic->mmio, OBJECT(dev), &riscv_imsic_ops,
- static const MemoryRegionOps sifive_pdma_ops = {
+                           imsic, TYPE_RISCV_IMSIC,
      .read = sifive_pdma_read,
      .write = sifive_pdma_write,
 --
-.31.1
+.41.0

-[PULL 17/37] exec/memop: Adding signedness to quad definitions
+[PULL v2 33/45] target/riscv: select KVM AIA in riscv virt machine
-From: Frédéric Pétrot <frederic.petrot@univ-grenoble-alpes.fr>
+From: Yong-Xuan Wang <yongxuan.wang@sifive.com>
-Renaming defines for quad in their various forms so that their signedness is
+Select KVM AIA when the host kernel has in-kernel AIA chip support.
-now explicit.
+Since KVM AIA only has one APLIC instance, we map the QEMU APLIC
-Done using git grep as suggested by Philippe, with a bit of hand edition to
+devices to KVM APLIC.
 keep assignments aligned.
-Signed-off-by: Frédéric Pétrot <frederic.petrot@univ-grenoble-alpes.fr>
+Signed-off-by: Yong-Xuan Wang <yongxuan.wang@sifive.com>
-Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
+Reviewed-by: Jim Shu <jim.shu@sifive.com>
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Reviewed-by: Andrew Jones <ajones@ventanamicro.com>
-Message-id: 20220106210108.138226-2-frederic.petrot@univ-grenoble-alpes.fr
+Message-ID: <20230727102439.22554-6-yongxuan.wang@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- include/exec/memop.h                       |  8 +--
+ hw/riscv/virt.c | 94 +++++++++++++++++++++++++++++++++----------------
- include/tcg/tcg-op.h                       |  4 +-
+file changed, 63 insertions(+), 31 deletions(-)
  target/arm/translate-a32.h                 |  4 +-
  accel/tcg/cputlb.c                         | 30 +++++------
  accel/tcg/user-exec.c                      |  8 +--
  target/alpha/translate.c                   | 32 ++++++------
  target/arm/helper-a64.c                    |  8 +--
  target/arm/translate-a64.c                 |  8 +--
  target/arm/translate-neon.c                |  6 +--
  target/arm/translate-sve.c                 | 10 ++--
  target/arm/translate-vfp.c                 |  8 +--
  target/arm/translate.c                     |  2 +-
  target/cris/translate.c                    |  2 +-
  target/hppa/translate.c                    |  4 +-
  target/i386/tcg/mem_helper.c               |  2 +-
  target/i386/tcg/translate.c                | 36 +++++++-------
  target/m68k/op_helper.c                    |  2 +-
  target/mips/tcg/translate.c                | 58 +++++++++++-----------
  target/mips/tcg/tx79_translate.c           |  8 +--
  target/ppc/translate.c                     | 32 ++++++------
  target/s390x/tcg/mem_helper.c              |  8 +--
  target/s390x/tcg/translate.c               |  8 +--
  target/sh4/translate.c                     | 12 ++---
  target/sparc/translate.c                   | 36 +++++++-------
  target/tricore/translate.c                 |  4 +-
  target/xtensa/translate.c                  |  4 +-
  tcg/tcg.c                                  |  4 +-
  tcg/tci.c                                  | 16 +++---
  accel/tcg/ldst_common.c.inc                |  8 +--
  target/mips/tcg/micromips_translate.c.inc  | 10 ++--
  target/ppc/translate/fixedpoint-impl.c.inc | 22 ++++----
  target/ppc/translate/fp-impl.c.inc         |  4 +-
  target/ppc/translate/vsx-impl.c.inc        | 42 ++++++++--------
  target/riscv/insn_trans/trans_rva.c.inc    | 22 ++++----
  target/riscv/insn_trans/trans_rvd.c.inc    |  4 +-
  target/riscv/insn_trans/trans_rvh.c.inc    |  4 +-
  target/riscv/insn_trans/trans_rvi.c.inc    |  4 +-
  target/s390x/tcg/translate_vx.c.inc        | 18 +++----
  tcg/aarch64/tcg-target.c.inc               |  2 +-
  tcg/arm/tcg-target.c.inc                   | 10 ++--
  tcg/i386/tcg-target.c.inc                  | 12 ++---
  tcg/mips/tcg-target.c.inc                  | 12 ++---
  tcg/ppc/tcg-target.c.inc                   | 16 +++---
  tcg/riscv/tcg-target.c.inc                 |  6 +--
  tcg/s390x/tcg-target.c.inc                 | 18 +++----
  tcg/sparc/tcg-target.c.inc                 | 16 +++---
  target/s390x/tcg/insn-data.def             | 28 +++++------
 files changed, 311 insertions(+), 311 deletions(-)
-diff --git a/include/exec/memop.h b/include/exec/memop.h
+diff --git a/hw/riscv/virt.c b/hw/riscv/virt.c
 index XXXXXXX..XXXXXXX 100644
---- a/include/exec/memop.h
+--- a/hw/riscv/virt.c
-+++ b/include/exec/memop.h
++++ b/hw/riscv/virt.c
-@@ -XXX,XX +XXX,XX @@ typedef enum MemOp {
+@@ -XXX,XX +XXX,XX @@
-     MO_UB    = MO_8,
+ #include "hw/riscv/virt.h"
-     MO_UW    = MO_16,
+ #include "hw/riscv/boot.h"
-     MO_UL    = MO_32,
+ #include "hw/riscv/numa.h"
-+    MO_UQ    = MO_64,
++#include "kvm_riscv.h"
-     MO_SB    = MO_SIGN | MO_8,
+ #include "hw/intc/riscv_aclint.h"
-     MO_SW    = MO_SIGN | MO_16,
+ #include "hw/intc/riscv_aplic.h"
-     MO_SL    = MO_SIGN | MO_32,
+ #include "hw/intc/riscv_imsic.h"
--    MO_Q     = MO_64,
+@@ -XXX,XX +XXX,XX @@
+ #error "Can't accommodate all IMSIC groups in address space"
      MO_LEUW  = MO_LE | MO_UW,
      MO_LEUL  = MO_LE | MO_UL,
 +    MO_LEUQ  = MO_LE | MO_UQ,
      MO_LESW  = MO_LE | MO_SW,
      MO_LESL  = MO_LE | MO_SL,
 -    MO_LEQ   = MO_LE | MO_Q,
      MO_BEUW  = MO_BE | MO_UW,
      MO_BEUL  = MO_BE | MO_UL,
 +    MO_BEUQ  = MO_BE | MO_UQ,
      MO_BESW  = MO_BE | MO_SW,
      MO_BESL  = MO_BE | MO_SL,
 -    MO_BEQ   = MO_BE | MO_Q,
  #ifdef NEED_CPU_H
      MO_TEUW  = MO_TE | MO_UW,
      MO_TEUL  = MO_TE | MO_UL,
 +    MO_TEUQ  = MO_TE | MO_UQ,
      MO_TESW  = MO_TE | MO_SW,
      MO_TESL  = MO_TE | MO_SL,
 -    MO_TEQ   = MO_TE | MO_Q,
  #endif
-     MO_SSIZE = MO_SIZE | MO_SIGN,
++/* KVM AIA only supports APLIC MSI. APLIC Wired is always emulated by QEMU. */
-diff --git a/include/tcg/tcg-op.h b/include/tcg/tcg-op.h
++static bool virt_use_kvm_aia(RISCVVirtState *s)
-index XXXXXXX..XXXXXXX 100644
++{
---- a/include/tcg/tcg-op.h
++    return kvm_irqchip_in_kernel() && s->aia_type == VIRT_AIA_TYPE_APLIC_IMSIC;
-+++ b/include/tcg/tcg-op.h
++}
-@@ -XXX,XX +XXX,XX @@ static inline void tcg_gen_qemu_ld32s(TCGv ret, TCGv addr, int mem_index)
++
+ static const MemMapEntry virt_memmap[] = {
- static inline void tcg_gen_qemu_ld64(TCGv_i64 ret, TCGv addr, int mem_index)
+     [VIRT_DEBUG] =        {        0x0,         0x100 },
      [VIRT_MROM] =         {     0x1000,        0xf000 },
@@ -XXX,XX +XXX,XX @@ static void create_fdt_one_aplic(RISCVVirtState *s, int socket,
                                   uint32_t *intc_phandles,
                                   uint32_t aplic_phandle,
                                   uint32_t aplic_child_phandle,
 -                                 bool m_mode)
 +                                 bool m_mode, int num_harts)
  {
--    tcg_gen_qemu_ld_i64(ret, addr, mem_index, MO_TEQ);
+     int cpu;
-+    tcg_gen_qemu_ld_i64(ret, addr, mem_index, MO_TEUQ);
+     char *aplic_name;
- }
+     uint32_t *aplic_cells;
+     MachineState *ms = MACHINE(s);
- static inline void tcg_gen_qemu_st8(TCGv arg, TCGv addr, int mem_index)
-@@ -XXX,XX +XXX,XX @@ static inline void tcg_gen_qemu_st32(TCGv arg, TCGv addr, int mem_index)
+-    aplic_cells = g_new0(uint32_t, s->soc[socket].num_harts * 2);
++    aplic_cells = g_new0(uint32_t, num_harts * 2);
- static inline void tcg_gen_qemu_st64(TCGv_i64 arg, TCGv addr, int mem_index)
 -    for (cpu = 0; cpu < s->soc[socket].num_harts; cpu++) {
 +    for (cpu = 0; cpu < num_harts; cpu++) {
          aplic_cells[cpu * 2 + 0] = cpu_to_be32(intc_phandles[cpu]);
          aplic_cells[cpu * 2 + 1] = cpu_to_be32(m_mode ? IRQ_M_EXT : IRQ_S_EXT);
      }
@@ -XXX,XX +XXX,XX @@ static void create_fdt_one_aplic(RISCVVirtState *s, int socket,
      if (s->aia_type == VIRT_AIA_TYPE_APLIC) {
          qemu_fdt_setprop(ms->fdt, aplic_name, "interrupts-extended",
 -                         aplic_cells,
 -                         s->soc[socket].num_harts * sizeof(uint32_t) * 2);
 +                         aplic_cells, num_harts * sizeof(uint32_t) * 2);
      } else {
          qemu_fdt_setprop_cell(ms->fdt, aplic_name, "msi-parent", msi_phandle);
      }
@@ -XXX,XX +XXX,XX @@ static void create_fdt_socket_aplic(RISCVVirtState *s,
                                      uint32_t msi_s_phandle,
                                      uint32_t *phandle,
                                      uint32_t *intc_phandles,
 -                                    uint32_t *aplic_phandles)
 +                                    uint32_t *aplic_phandles,
 +                                    int num_harts)
  {
--    tcg_gen_qemu_st_i64(arg, addr, mem_index, MO_TEQ);
+     char *aplic_name;
-+    tcg_gen_qemu_st_i64(arg, addr, mem_index, MO_TEUQ);
+     unsigned long aplic_addr;
- }
+@@ -XXX,XX +XXX,XX @@ static void create_fdt_socket_aplic(RISCVVirtState *s,
+         create_fdt_one_aplic(s, socket, aplic_addr, memmap[VIRT_APLIC_M].size,
- void tcg_gen_atomic_cmpxchg_i32(TCGv_i32, TCGv, TCGv_i32, TCGv_i32,
+                              msi_m_phandle, intc_phandles,
-diff --git a/target/arm/translate-a32.h b/target/arm/translate-a32.h
+                              aplic_m_phandle, aplic_s_phandle,
-index XXXXXXX..XXXXXXX 100644
+-                             true);
---- a/target/arm/translate-a32.h
++                             true, num_harts);
-+++ b/target/arm/translate-a32.h
+     }
-@@ -XXX,XX +XXX,XX @@ void gen_aa32_st_i64(DisasContext *s, TCGv_i64 val, TCGv_i32 a32,
- static inline void gen_aa32_ld64(DisasContext *s, TCGv_i64 val,
+     /* S-level APLIC node */
-                                  TCGv_i32 a32, int index)
+@@ -XXX,XX +XXX,XX @@ static void create_fdt_socket_aplic(RISCVVirtState *s,
- {
+     create_fdt_one_aplic(s, socket, aplic_addr, memmap[VIRT_APLIC_S].size,
--    gen_aa32_ld_i64(s, val, a32, index, MO_Q);
+                          msi_s_phandle, intc_phandles,
-+    gen_aa32_ld_i64(s, val, a32, index, MO_UQ);
+                          aplic_s_phandle, 0,
- }
+-                         false);
++                         false, num_harts);
- static inline void gen_aa32_st64(DisasContext *s, TCGv_i64 val,
-                                  TCGv_i32 a32, int index)
+     aplic_name = g_strdup_printf("/soc/aplic@%lx", aplic_addr);
- {
--    gen_aa32_st_i64(s, val, a32, index, MO_Q);
+@@ -XXX,XX +XXX,XX @@ static void create_fdt_sockets(RISCVVirtState *s, const MemMapEntry *memmap,
-+    gen_aa32_st_i64(s, val, a32, index, MO_UQ);
+         *msi_pcie_phandle = msi_s_phandle;
- }
+     }
- DO_GEN_LD(8u, MO_UB)
+-    phandle_pos = ms->smp.cpus;
-diff --git a/accel/tcg/cputlb.c b/accel/tcg/cputlb.c
+-    for (socket = (socket_count - 1); socket >= 0; socket--) {
-index XXXXXXX..XXXXXXX 100644
+-        phandle_pos -= s->soc[socket].num_harts;
---- a/accel/tcg/cputlb.c
+-
-+++ b/accel/tcg/cputlb.c
+-        if (s->aia_type == VIRT_AIA_TYPE_NONE) {
-@@ -XXX,XX +XXX,XX @@ load_memop(const void *haddr, MemOp op)
+-            create_fdt_socket_plic(s, memmap, socket, phandle,
-         return (uint32_t)ldl_be_p(haddr);
+-                &intc_phandles[phandle_pos], xplic_phandles);
-     case MO_LEUL:
+-        } else {
-         return (uint32_t)ldl_le_p(haddr);
+-            create_fdt_socket_aplic(s, memmap, socket,
--    case MO_BEQ:
+-                msi_m_phandle, msi_s_phandle, phandle,
-+    case MO_BEUQ:
+-                &intc_phandles[phandle_pos], xplic_phandles);
-         return ldq_be_p(haddr);
++    /* KVM AIA only has one APLIC instance */
--    case MO_LEQ:
++    if (virt_use_kvm_aia(s)) {
-+    case MO_LEUQ:
++        create_fdt_socket_aplic(s, memmap, 0,
-         return ldq_le_p(haddr);
++                                msi_m_phandle, msi_s_phandle, phandle,
-     default:
++                                &intc_phandles[0], xplic_phandles,
-         qemu_build_not_reached();
++                                ms->smp.cpus);
-@@ -XXX,XX +XXX,XX @@ tcg_target_ulong helper_be_ldul_mmu(CPUArchState *env, target_ulong addr,
++    } else {
- uint64_t helper_le_ldq_mmu(CPUArchState *env, target_ulong addr,
++        phandle_pos = ms->smp.cpus;
-                            MemOpIdx oi, uintptr_t retaddr)
++        for (socket = (socket_count - 1); socket >= 0; socket--) {
- {
++            phandle_pos -= s->soc[socket].num_harts;
--    validate_memop(oi, MO_LEQ);
++
--    return load_helper(env, addr, oi, retaddr, MO_LEQ, false,
++            if (s->aia_type == VIRT_AIA_TYPE_NONE) {
-+    validate_memop(oi, MO_LEUQ);
++                create_fdt_socket_plic(s, memmap, socket, phandle,
-+    return load_helper(env, addr, oi, retaddr, MO_LEUQ, false,
++                                       &intc_phandles[phandle_pos],
-                        helper_le_ldq_mmu);
++                                       xplic_phandles);
- }
++            } else {
++                create_fdt_socket_aplic(s, memmap, socket,
- uint64_t helper_be_ldq_mmu(CPUArchState *env, target_ulong addr,
++                                        msi_m_phandle, msi_s_phandle, phandle,
-                            MemOpIdx oi, uintptr_t retaddr)
++                                        &intc_phandles[phandle_pos],
- {
++                                        xplic_phandles,
--    validate_memop(oi, MO_BEQ);
++                                        s->soc[socket].num_harts);
--    return load_helper(env, addr, oi, retaddr, MO_BEQ, false,
++            }
 +    validate_memop(oi, MO_BEUQ);
 +    return load_helper(env, addr, oi, retaddr, MO_BEUQ, false,
                         helper_be_ldq_mmu);
  }
@@ -XXX,XX +XXX,XX @@ uint32_t cpu_ldl_be_mmu(CPUArchState *env, abi_ptr addr,
  uint64_t cpu_ldq_be_mmu(CPUArchState *env, abi_ptr addr,
                          MemOpIdx oi, uintptr_t ra)
  {
 -    return cpu_load_helper(env, addr, oi, MO_BEQ, helper_be_ldq_mmu);
 +    return cpu_load_helper(env, addr, oi, MO_BEUQ, helper_be_ldq_mmu);
  }
  uint16_t cpu_ldw_le_mmu(CPUArchState *env, abi_ptr addr,
@@ -XXX,XX +XXX,XX @@ store_memop(void *haddr, uint64_t val, MemOp op)
      case MO_LEUL:
          stl_le_p(haddr, val);
          break;
 -    case MO_BEQ:
 +    case MO_BEUQ:
          stq_be_p(haddr, val);
          break;
 -    case MO_LEQ:
 +    case MO_LEUQ:
          stq_le_p(haddr, val);
          break;
      default:
@@ -XXX,XX +XXX,XX @@ void helper_be_stl_mmu(CPUArchState *env, target_ulong addr, uint32_t val,
  void helper_le_stq_mmu(CPUArchState *env, target_ulong addr, uint64_t val,
                         MemOpIdx oi, uintptr_t retaddr)
  {
 -    validate_memop(oi, MO_LEQ);
 -    store_helper(env, addr, val, oi, retaddr, MO_LEQ);
 +    validate_memop(oi, MO_LEUQ);
 +    store_helper(env, addr, val, oi, retaddr, MO_LEUQ);
  }
  void helper_be_stq_mmu(CPUArchState *env, target_ulong addr, uint64_t val,
                         MemOpIdx oi, uintptr_t retaddr)
  {
 -    validate_memop(oi, MO_BEQ);
 -    store_helper(env, addr, val, oi, retaddr, MO_BEQ);
 +    validate_memop(oi, MO_BEUQ);
 +    store_helper(env, addr, val, oi, retaddr, MO_BEUQ);
  }
  /*
@@ -XXX,XX +XXX,XX @@ uint32_t cpu_ldl_code(CPUArchState *env, abi_ptr addr)
  static uint64_t full_ldq_code(CPUArchState *env, target_ulong addr,
                                MemOpIdx oi, uintptr_t retaddr)
  {
 -    return load_helper(env, addr, oi, retaddr, MO_TEQ, true, full_ldq_code);
 +    return load_helper(env, addr, oi, retaddr, MO_TEUQ, true, full_ldq_code);
  }
  uint64_t cpu_ldq_code(CPUArchState *env, abi_ptr addr)
  {
 -    MemOpIdx oi = make_memop_idx(MO_TEQ, cpu_mmu_index(env, true));
 +    MemOpIdx oi = make_memop_idx(MO_TEUQ, cpu_mmu_index(env, true));
      return full_ldq_code(env, addr, oi, 0);
  }
 diff --git a/accel/tcg/user-exec.c b/accel/tcg/user-exec.c
 index XXXXXXX..XXXXXXX 100644
 --- a/accel/tcg/user-exec.c
 +++ b/accel/tcg/user-exec.c
@@ -XXX,XX +XXX,XX @@ uint64_t cpu_ldq_be_mmu(CPUArchState *env, abi_ptr addr,
      void *haddr;
      uint64_t ret;
 -    validate_memop(oi, MO_BEQ);
 +    validate_memop(oi, MO_BEUQ);
      trace_guest_ld_before_exec(env_cpu(env), addr, oi);
      haddr = cpu_mmu_lookup(env, addr, oi, ra, MMU_DATA_LOAD);
      ret = ldq_be_p(haddr);
@@ -XXX,XX +XXX,XX @@ uint64_t cpu_ldq_le_mmu(CPUArchState *env, abi_ptr addr,
      void *haddr;
      uint64_t ret;
 -    validate_memop(oi, MO_LEQ);
 +    validate_memop(oi, MO_LEUQ);
      trace_guest_ld_before_exec(env_cpu(env), addr, oi);
      haddr = cpu_mmu_lookup(env, addr, oi, ra, MMU_DATA_LOAD);
      ret = ldq_le_p(haddr);
@@ -XXX,XX +XXX,XX @@ void cpu_stq_be_mmu(CPUArchState *env, abi_ptr addr, uint64_t val,
  {
      void *haddr;
 -    validate_memop(oi, MO_BEQ);
 +    validate_memop(oi, MO_BEUQ);
      trace_guest_st_before_exec(env_cpu(env), addr, oi);
      haddr = cpu_mmu_lookup(env, addr, oi, ra, MMU_DATA_STORE);
      stq_be_p(haddr, val);
@@ -XXX,XX +XXX,XX @@ void cpu_stq_le_mmu(CPUArchState *env, abi_ptr addr, uint64_t val,
  {
      void *haddr;
 -    validate_memop(oi, MO_LEQ);
 +    validate_memop(oi, MO_LEUQ);
      trace_guest_st_before_exec(env_cpu(env), addr, oi);
      haddr = cpu_mmu_lookup(env, addr, oi, ra, MMU_DATA_STORE);
      stq_le_p(haddr, val);
 diff --git a/target/alpha/translate.c b/target/alpha/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/alpha/translate.c
 +++ b/target/alpha/translate.c
@@ -XXX,XX +XXX,XX @@ static void gen_ldf(DisasContext *ctx, TCGv dest, TCGv addr)
  static void gen_ldg(DisasContext *ctx, TCGv dest, TCGv addr)
  {
      TCGv tmp = tcg_temp_new();
 -    tcg_gen_qemu_ld_i64(tmp, addr, ctx->mem_idx, MO_LEQ | UNALIGN(ctx));
 +    tcg_gen_qemu_ld_i64(tmp, addr, ctx->mem_idx, MO_LEUQ | UNALIGN(ctx));
      gen_helper_memory_to_g(dest, tmp);
      tcg_temp_free(tmp);
  }
@@ -XXX,XX +XXX,XX @@ static void gen_lds(DisasContext *ctx, TCGv dest, TCGv addr)
  static void gen_ldt(DisasContext *ctx, TCGv dest, TCGv addr)
  {
 -    tcg_gen_qemu_ld_i64(dest, addr, ctx->mem_idx, MO_LEQ | UNALIGN(ctx));
 +    tcg_gen_qemu_ld_i64(dest, addr, ctx->mem_idx, MO_LEUQ | UNALIGN(ctx));
  }
  static void gen_load_fp(DisasContext *ctx, int ra, int rb, int32_t disp16,
@@ -XXX,XX +XXX,XX @@ static void gen_stg(DisasContext *ctx, TCGv src, TCGv addr)
  {
      TCGv tmp = tcg_temp_new();
      gen_helper_g_to_memory(tmp, src);
 -    tcg_gen_qemu_st_i64(tmp, addr, ctx->mem_idx, MO_LEQ | UNALIGN(ctx));
 +    tcg_gen_qemu_st_i64(tmp, addr, ctx->mem_idx, MO_LEUQ | UNALIGN(ctx));
      tcg_temp_free(tmp);
  }
@@ -XXX,XX +XXX,XX @@ static void gen_sts(DisasContext *ctx, TCGv src, TCGv addr)
  static void gen_stt(DisasContext *ctx, TCGv src, TCGv addr)
  {
 -    tcg_gen_qemu_st_i64(src, addr, ctx->mem_idx, MO_LEQ | UNALIGN(ctx));
 +    tcg_gen_qemu_st_i64(src, addr, ctx->mem_idx, MO_LEUQ | UNALIGN(ctx));
  }
  static void gen_store_fp(DisasContext *ctx, int ra, int rb, int32_t disp16,
@@ -XXX,XX +XXX,XX @@ static DisasJumpType translate_one(DisasContext *ctx, uint32_t insn)
          break;
      case 0x0B:
          /* LDQ_U */
 -        gen_load_int(ctx, ra, rb, disp16, MO_LEQ, 1, 0);
 +        gen_load_int(ctx, ra, rb, disp16, MO_LEUQ, 1, 0);
          break;
      case 0x0C:
          /* LDWU */
@@ -XXX,XX +XXX,XX @@ static DisasJumpType translate_one(DisasContext *ctx, uint32_t insn)
          break;
      case 0x0F:
          /* STQ_U */
 -        gen_store_int(ctx, ra, rb, disp16, MO_LEQ, 1);
 +        gen_store_int(ctx, ra, rb, disp16, MO_LEUQ, 1);
          break;
      case 0x10:
@@ -XXX,XX +XXX,XX @@ static DisasJumpType translate_one(DisasContext *ctx, uint32_t insn)
                  break;
              case 0x1:
                  /* Quadword physical access (hw_ldq/p) */
 -                tcg_gen_qemu_ld_i64(va, addr, MMU_PHYS_IDX, MO_LEQ);
 +                tcg_gen_qemu_ld_i64(va, addr, MMU_PHYS_IDX, MO_LEUQ);
                  break;
              case 0x2:
                  /* Longword physical access with lock (hw_ldl_l/p) */
@@ -XXX,XX +XXX,XX @@ static DisasJumpType translate_one(DisasContext *ctx, uint32_t insn)
                  break;
              case 0x3:
                  /* Quadword physical access with lock (hw_ldq_l/p) */
 -                tcg_gen_qemu_ld_i64(va, addr, MMU_PHYS_IDX, MO_LEQ);
 +                tcg_gen_qemu_ld_i64(va, addr, MMU_PHYS_IDX, MO_LEUQ);
                  tcg_gen_mov_i64(cpu_lock_addr, addr);
                  tcg_gen_mov_i64(cpu_lock_value, va);
                  break;
@@ -XXX,XX +XXX,XX @@ static DisasJumpType translate_one(DisasContext *ctx, uint32_t insn)
                  break;
              case 0xB:
                  /* Quadword virtual access with protection check (hw_ldq/w) */
 -                tcg_gen_qemu_ld_i64(va, addr, MMU_KERNEL_IDX, MO_LEQ);
 +                tcg_gen_qemu_ld_i64(va, addr, MMU_KERNEL_IDX, MO_LEUQ);
                  break;
              case 0xC:
                  /* Longword virtual access with alt access mode (hw_ldl/a)*/
@@ -XXX,XX +XXX,XX @@ static DisasJumpType translate_one(DisasContext *ctx, uint32_t insn)
              case 0xF:
                  /* Quadword virtual access with alternate access mode and
                     protection checks (hw_ldq/wa) */
 -                tcg_gen_qemu_ld_i64(va, addr, MMU_USER_IDX, MO_LEQ);
 +                tcg_gen_qemu_ld_i64(va, addr, MMU_USER_IDX, MO_LEUQ);
                  break;
              }
              tcg_temp_free(addr);
@@ -XXX,XX +XXX,XX @@ static DisasJumpType translate_one(DisasContext *ctx, uint32_t insn)
                  vb = load_gpr(ctx, rb);
                  tmp = tcg_temp_new();
                  tcg_gen_addi_i64(tmp, vb, disp12);
 -                tcg_gen_qemu_st_i64(va, tmp, MMU_PHYS_IDX, MO_LEQ);
 +                tcg_gen_qemu_st_i64(va, tmp, MMU_PHYS_IDX, MO_LEUQ);
                  tcg_temp_free(tmp);
                  break;
              case 0x2:
@@ -XXX,XX +XXX,XX @@ static DisasJumpType translate_one(DisasContext *ctx, uint32_t insn)
              case 0x3:
                  /* Quadword physical access with lock */
                  ret = gen_store_conditional(ctx, ra, rb, disp12,
 -                                            MMU_PHYS_IDX, MO_LEQ);
 +                                            MMU_PHYS_IDX, MO_LEUQ);
                  break;
              case 0x4:
                  /* Longword virtual access */
@@ -XXX,XX +XXX,XX @@ static DisasJumpType translate_one(DisasContext *ctx, uint32_t insn)
          break;
      case 0x29:
          /* LDQ */
 -        gen_load_int(ctx, ra, rb, disp16, MO_LEQ, 0, 0);
 +        gen_load_int(ctx, ra, rb, disp16, MO_LEUQ, 0, 0);
          break;
      case 0x2A:
          /* LDL_L */
@@ -XXX,XX +XXX,XX @@ static DisasJumpType translate_one(DisasContext *ctx, uint32_t insn)
          break;
      case 0x2B:
          /* LDQ_L */
 -        gen_load_int(ctx, ra, rb, disp16, MO_LEQ, 0, 1);
 +        gen_load_int(ctx, ra, rb, disp16, MO_LEUQ, 0, 1);
          break;
      case 0x2C:
          /* STL */
@@ -XXX,XX +XXX,XX @@ static DisasJumpType translate_one(DisasContext *ctx, uint32_t insn)
          break;
      case 0x2D:
          /* STQ */
 -        gen_store_int(ctx, ra, rb, disp16, MO_LEQ, 0);
 +        gen_store_int(ctx, ra, rb, disp16, MO_LEUQ, 0);
          break;
      case 0x2E:
          /* STL_C */
@@ -XXX,XX +XXX,XX @@ static DisasJumpType translate_one(DisasContext *ctx, uint32_t insn)
      case 0x2F:
          /* STQ_C */
          ret = gen_store_conditional(ctx, ra, rb, disp16,
 -                                    ctx->mem_idx, MO_LEQ);
 +                                    ctx->mem_idx, MO_LEUQ);
          break;
      case 0x30:
          /* BR */
 diff --git a/target/arm/helper-a64.c b/target/arm/helper-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/helper-a64.c
 +++ b/target/arm/helper-a64.c
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(paired_cmpxchg64_le)(CPUARMState *env, uint64_t addr,
      uint64_t o0, o1;
      bool success;
      int mem_idx = cpu_mmu_index(env, false);
 -    MemOpIdx oi0 = make_memop_idx(MO_LEQ | MO_ALIGN_16, mem_idx);
 -    MemOpIdx oi1 = make_memop_idx(MO_LEQ, mem_idx);
 +    MemOpIdx oi0 = make_memop_idx(MO_LEUQ | MO_ALIGN_16, mem_idx);
 +    MemOpIdx oi1 = make_memop_idx(MO_LEUQ, mem_idx);
      o0 = cpu_ldq_le_mmu(env, addr + 0, oi0, ra);
      o1 = cpu_ldq_le_mmu(env, addr + 8, oi1, ra);
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(paired_cmpxchg64_be)(CPUARMState *env, uint64_t addr,
      uint64_t o0, o1;
      bool success;
      int mem_idx = cpu_mmu_index(env, false);
 -    MemOpIdx oi0 = make_memop_idx(MO_BEQ | MO_ALIGN_16, mem_idx);
 -    MemOpIdx oi1 = make_memop_idx(MO_BEQ, mem_idx);
 +    MemOpIdx oi0 = make_memop_idx(MO_BEUQ | MO_ALIGN_16, mem_idx);
 +    MemOpIdx oi1 = make_memop_idx(MO_BEUQ, mem_idx);
      o1 = cpu_ldq_be_mmu(env, addr + 0, oi0, ra);
      o0 = cpu_ldq_be_mmu(env, addr + 8, oi1, ra);
 diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-a64.c
 +++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void do_fp_st(DisasContext *s, int srcidx, TCGv_i64 tcg_addr, int size)
          tcg_gen_ld_i64(tmphi, cpu_env, fp_reg_hi_offset(s, srcidx));
 -        mop = s->be_data | MO_Q;
 +        mop = s->be_data | MO_UQ;
          tcg_gen_qemu_st_i64(be ? tmphi : tmplo, tcg_addr, get_mem_index(s),
                              mop | (s->align_mem ? MO_ALIGN_16 : 0));
          tcg_gen_addi_i64(tcg_hiaddr, tcg_addr, 8);
@@ -XXX,XX +XXX,XX @@ static void do_fp_ld(DisasContext *s, int destidx, TCGv_i64 tcg_addr, int size)
          tmphi = tcg_temp_new_i64();
          tcg_hiaddr = tcg_temp_new_i64();
 -        mop = s->be_data | MO_Q;
 +        mop = s->be_data | MO_UQ;
          tcg_gen_qemu_ld_i64(be ? tmphi : tmplo, tcg_addr, get_mem_index(s),
                              mop | (s->align_mem ? MO_ALIGN_16 : 0));
          tcg_gen_addi_i64(tcg_hiaddr, tcg_addr, 8);
@@ -XXX,XX +XXX,XX @@ static void disas_ldst_tag(DisasContext *s, uint32_t insn)
          int i, n = (1 + is_pair) << LOG2_TAG_GRANULE;
          tcg_gen_qemu_st_i64(tcg_zero, clean_addr, mem_index,
 -                            MO_Q | MO_ALIGN_16);
 +                            MO_UQ | MO_ALIGN_16);
          for (i = 8; i < n; i += 8) {
              tcg_gen_addi_i64(clean_addr, clean_addr, 8);
 -            tcg_gen_qemu_st_i64(tcg_zero, clean_addr, mem_index, MO_Q);
 +            tcg_gen_qemu_st_i64(tcg_zero, clean_addr, mem_index, MO_UQ);
          }
-         tcg_temp_free_i64(tcg_zero);
      }
-diff --git a/target/arm/translate-neon.c b/target/arm/translate-neon.c
-index XXXXXXX..XXXXXXX 100644
+     g_free(intc_phandles);
---- a/target/arm/translate-neon.c
-+++ b/target/arm/translate-neon.c
+-    for (socket = 0; socket < socket_count; socket++) {
-@@ -XXX,XX +XXX,XX @@ static void neon_load_element64(TCGv_i64 var, int reg, int ele, MemOp mop)
+-        if (socket == 0) {
-     case MO_UL:
+-            *irq_mmio_phandle = xplic_phandles[socket];
-         tcg_gen_ld32u_i64(var, cpu_env, offset);
+-            *irq_virtio_phandle = xplic_phandles[socket];
-         break;
+-            *irq_pcie_phandle = xplic_phandles[socket];
--    case MO_Q:
+-        }
-+    case MO_UQ:
+-        if (socket == 1) {
-         tcg_gen_ld_i64(var, cpu_env, offset);
+-            *irq_virtio_phandle = xplic_phandles[socket];
-         break;
+-            *irq_pcie_phandle = xplic_phandles[socket];
-     default:
+-        }
-@@ -XXX,XX +XXX,XX @@ static bool do_prewiden_3d(DisasContext *s, arg_3diff *a,
+-        if (socket == 2) {
-         return false;
+-            *irq_pcie_phandle = xplic_phandles[socket];
 +    if (virt_use_kvm_aia(s)) {
 +        *irq_mmio_phandle = xplic_phandles[0];
 +        *irq_virtio_phandle = xplic_phandles[0];
 +        *irq_pcie_phandle = xplic_phandles[0];
 +    } else {
 +        for (socket = 0; socket < socket_count; socket++) {
 +            if (socket == 0) {
 +                *irq_mmio_phandle = xplic_phandles[socket];
 +                *irq_virtio_phandle = xplic_phandles[socket];
 +                *irq_pcie_phandle = xplic_phandles[socket];
 +            }
 +            if (socket == 1) {
 +                *irq_virtio_phandle = xplic_phandles[socket];
 +                *irq_pcie_phandle = xplic_phandles[socket];
 +            }
 +            if (socket == 2) {
 +                *irq_pcie_phandle = xplic_phandles[socket];
 +            }
          }
      }
--    if ((a->vd & 1) || (src1_mop == MO_Q && (a->vn & 1))) {
+@@ -XXX,XX +XXX,XX @@ static void virt_machine_init(MachineState *machine)
-+    if ((a->vd & 1) || (src1_mop == MO_UQ && (a->vn & 1))) {
+         }
          return false;
      }
-@@ -XXX,XX +XXX,XX @@ static bool do_prewiden_3d(DisasContext *s, arg_3diff *a,
++    if (virt_use_kvm_aia(s)) {
-         };                                                              \
++        kvm_riscv_aia_create(machine, IMSIC_MMIO_GROUP_MIN_SHIFT,
-         int narrow_mop = a->size == MO_32 ? MO_32 | SIGN : -1;          \
++                             VIRT_IRQCHIP_NUM_SOURCES, VIRT_IRQCHIP_NUM_MSIS,
-         return do_prewiden_3d(s, a, widenfn[a->size], addfn[a->size],   \
++                             memmap[VIRT_APLIC_S].base,
--                              SRC1WIDE ? MO_Q : narrow_mop,             \
++                             memmap[VIRT_IMSIC_S].base,
-+                              SRC1WIDE ? MO_UQ : narrow_mop,             \
++                             s->aia_guests);
-                               narrow_mop);                              \
++    }
-     }
++
+     if (riscv_is_32bit(&s->soc[0])) {
-diff --git a/target/arm/translate-sve.c b/target/arm/translate-sve.c
+ #if HOST_LONG_BITS == 64
-index XXXXXXX..XXXXXXX 100644
+         /* limit RAM size in a 32-bit system */
 --- a/target/arm/translate-sve.c
 +++ b/target/arm/translate-sve.c
@@ -XXX,XX +XXX,XX @@ static void do_ldr(DisasContext *s, uint32_t vofs, int len, int rn, int imm)
          t0 = tcg_temp_new_i64();
          for (i = 0; i < len_align; i += 8) {
 -            tcg_gen_qemu_ld_i64(t0, clean_addr, midx, MO_LEQ);
 +            tcg_gen_qemu_ld_i64(t0, clean_addr, midx, MO_LEUQ);
              tcg_gen_st_i64(t0, cpu_env, vofs + i);
              tcg_gen_addi_i64(clean_addr, clean_addr, 8);
          }
@@ -XXX,XX +XXX,XX @@ static void do_ldr(DisasContext *s, uint32_t vofs, int len, int rn, int imm)
          gen_set_label(loop);
          t0 = tcg_temp_new_i64();
 -        tcg_gen_qemu_ld_i64(t0, clean_addr, midx, MO_LEQ);
 +        tcg_gen_qemu_ld_i64(t0, clean_addr, midx, MO_LEUQ);
          tcg_gen_addi_i64(clean_addr, clean_addr, 8);
          tp = tcg_temp_new_ptr();
@@ -XXX,XX +XXX,XX @@ static void do_str(DisasContext *s, uint32_t vofs, int len, int rn, int imm)
          t0 = tcg_temp_new_i64();
          for (i = 0; i < len_align; i += 8) {
              tcg_gen_ld_i64(t0, cpu_env, vofs + i);
 -            tcg_gen_qemu_st_i64(t0, clean_addr, midx, MO_LEQ);
 +            tcg_gen_qemu_st_i64(t0, clean_addr, midx, MO_LEUQ);
              tcg_gen_addi_i64(clean_addr, clean_addr, 8);
          }
          tcg_temp_free_i64(t0);
@@ -XXX,XX +XXX,XX @@ static void do_str(DisasContext *s, uint32_t vofs, int len, int rn, int imm)
          tcg_gen_addi_ptr(i, i, 8);
          tcg_temp_free_ptr(tp);
 -        tcg_gen_qemu_st_i64(t0, clean_addr, midx, MO_LEQ);
 +        tcg_gen_qemu_st_i64(t0, clean_addr, midx, MO_LEUQ);
          tcg_gen_addi_i64(clean_addr, clean_addr, 8);
          tcg_temp_free_i64(t0);
@@ -XXX,XX +XXX,XX @@ static const MemOp dtype_mop[16] = {
      MO_UB, MO_UB, MO_UB, MO_UB,
      MO_SL, MO_UW, MO_UW, MO_UW,
      MO_SW, MO_SW, MO_UL, MO_UL,
 -    MO_SB, MO_SB, MO_SB, MO_Q
 +    MO_SB, MO_SB, MO_SB, MO_UQ
  };
  #define dtype_msz(x)  (dtype_mop[x] & MO_SIZE)
 diff --git a/target/arm/translate-vfp.c b/target/arm/translate-vfp.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-vfp.c
 +++ b/target/arm/translate-vfp.c
@@ -XXX,XX +XXX,XX @@ static bool trans_VLDR_VSTR_dp(DisasContext *s, arg_VLDR_VSTR_dp *a)
      addr = add_reg_for_lit(s, a->rn, offset);
      tmp = tcg_temp_new_i64();
      if (a->l) {
 -        gen_aa32_ld_i64(s, tmp, addr, get_mem_index(s), MO_Q | MO_ALIGN_4);
 +        gen_aa32_ld_i64(s, tmp, addr, get_mem_index(s), MO_UQ | MO_ALIGN_4);
          vfp_store_reg64(tmp, a->vd);
      } else {
          vfp_load_reg64(tmp, a->vd);
 -        gen_aa32_st_i64(s, tmp, addr, get_mem_index(s), MO_Q | MO_ALIGN_4);
 +        gen_aa32_st_i64(s, tmp, addr, get_mem_index(s), MO_UQ | MO_ALIGN_4);
      }
      tcg_temp_free_i64(tmp);
      tcg_temp_free_i32(addr);
@@ -XXX,XX +XXX,XX @@ static bool trans_VLDM_VSTM_dp(DisasContext *s, arg_VLDM_VSTM_dp *a)
      for (i = 0; i < n; i++) {
          if (a->l) {
              /* load */
 -            gen_aa32_ld_i64(s, tmp, addr, get_mem_index(s), MO_Q | MO_ALIGN_4);
 +            gen_aa32_ld_i64(s, tmp, addr, get_mem_index(s), MO_UQ | MO_ALIGN_4);
              vfp_store_reg64(tmp, a->vd + i);
          } else {
              /* store */
              vfp_load_reg64(tmp, a->vd + i);
 -            gen_aa32_st_i64(s, tmp, addr, get_mem_index(s), MO_Q | MO_ALIGN_4);
 +            gen_aa32_st_i64(s, tmp, addr, get_mem_index(s), MO_UQ | MO_ALIGN_4);
          }
          tcg_gen_addi_i32(addr, addr, offset);
      }
 diff --git a/target/arm/translate.c b/target/arm/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate.c
 +++ b/target/arm/translate.c
@@ -XXX,XX +XXX,XX @@ void read_neon_element64(TCGv_i64 dest, int reg, int ele, MemOp memop)
      case MO_UL:
          tcg_gen_ld32u_i64(dest, cpu_env, off);
          break;
 -    case MO_Q:
 +    case MO_UQ:
          tcg_gen_ld_i64(dest, cpu_env, off);
          break;
      default:
 diff --git a/target/cris/translate.c b/target/cris/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/cris/translate.c
 +++ b/target/cris/translate.c
@@ -XXX,XX +XXX,XX @@ static void gen_load64(DisasContext *dc, TCGv_i64 dst, TCGv addr)
          cris_store_direct_jmp(dc);
      }
 -    tcg_gen_qemu_ld_i64(dst, addr, mem_index, MO_TEQ);
 +    tcg_gen_qemu_ld_i64(dst, addr, mem_index, MO_TEUQ);
  }
  static void gen_load(DisasContext *dc, TCGv dst, TCGv addr,
 diff --git a/target/hppa/translate.c b/target/hppa/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/hppa/translate.c
 +++ b/target/hppa/translate.c
@@ -XXX,XX +XXX,XX @@ static bool do_floadd(DisasContext *ctx, unsigned rt, unsigned rb,
      nullify_over(ctx);
      tmp = tcg_temp_new_i64();
 -    do_load_64(ctx, tmp, rb, rx, scale, disp, sp, modify, MO_TEQ);
 +    do_load_64(ctx, tmp, rb, rx, scale, disp, sp, modify, MO_TEUQ);
      save_frd(rt, tmp);
      tcg_temp_free_i64(tmp);
@@ -XXX,XX +XXX,XX @@ static bool do_fstored(DisasContext *ctx, unsigned rt, unsigned rb,
      nullify_over(ctx);
      tmp = load_frd(rt);
 -    do_store_64(ctx, tmp, rb, rx, scale, disp, sp, modify, MO_TEQ);
 +    do_store_64(ctx, tmp, rb, rx, scale, disp, sp, modify, MO_TEUQ);
      tcg_temp_free_i64(tmp);
      return nullify_end(ctx);
 diff --git a/target/i386/tcg/mem_helper.c b/target/i386/tcg/mem_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/i386/tcg/mem_helper.c
 +++ b/target/i386/tcg/mem_helper.c
@@ -XXX,XX +XXX,XX @@ void helper_cmpxchg8b(CPUX86State *env, target_ulong a0)
      {
          uintptr_t ra = GETPC();
          int mem_idx = cpu_mmu_index(env, false);
 -        MemOpIdx oi = make_memop_idx(MO_TEQ, mem_idx);
 +        MemOpIdx oi = make_memop_idx(MO_TEUQ, mem_idx);
          oldv = cpu_atomic_cmpxchgq_le_mmu(env, a0, cmpv, newv, oi, ra);
      }
 diff --git a/target/i386/tcg/translate.c b/target/i386/tcg/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/i386/tcg/translate.c
 +++ b/target/i386/tcg/translate.c
@@ -XXX,XX +XXX,XX @@ static void gen_jmp(DisasContext *s, target_ulong eip)
  static inline void gen_ldq_env_A0(DisasContext *s, int offset)
  {
 -    tcg_gen_qemu_ld_i64(s->tmp1_i64, s->A0, s->mem_index, MO_LEQ);
 +    tcg_gen_qemu_ld_i64(s->tmp1_i64, s->A0, s->mem_index, MO_LEUQ);
      tcg_gen_st_i64(s->tmp1_i64, cpu_env, offset);
  }
  static inline void gen_stq_env_A0(DisasContext *s, int offset)
  {
      tcg_gen_ld_i64(s->tmp1_i64, cpu_env, offset);
 -    tcg_gen_qemu_st_i64(s->tmp1_i64, s->A0, s->mem_index, MO_LEQ);
 +    tcg_gen_qemu_st_i64(s->tmp1_i64, s->A0, s->mem_index, MO_LEUQ);
  }
  static inline void gen_ldo_env_A0(DisasContext *s, int offset)
  {
      int mem_index = s->mem_index;
 -    tcg_gen_qemu_ld_i64(s->tmp1_i64, s->A0, mem_index, MO_LEQ);
 +    tcg_gen_qemu_ld_i64(s->tmp1_i64, s->A0, mem_index, MO_LEUQ);
      tcg_gen_st_i64(s->tmp1_i64, cpu_env, offset + offsetof(ZMMReg, ZMM_Q(0)));
      tcg_gen_addi_tl(s->tmp0, s->A0, 8);
 -    tcg_gen_qemu_ld_i64(s->tmp1_i64, s->tmp0, mem_index, MO_LEQ);
 +    tcg_gen_qemu_ld_i64(s->tmp1_i64, s->tmp0, mem_index, MO_LEUQ);
      tcg_gen_st_i64(s->tmp1_i64, cpu_env, offset + offsetof(ZMMReg, ZMM_Q(1)));
  }
@@ -XXX,XX +XXX,XX @@ static inline void gen_sto_env_A0(DisasContext *s, int offset)
  {
      int mem_index = s->mem_index;
      tcg_gen_ld_i64(s->tmp1_i64, cpu_env, offset + offsetof(ZMMReg, ZMM_Q(0)));
 -    tcg_gen_qemu_st_i64(s->tmp1_i64, s->A0, mem_index, MO_LEQ);
 +    tcg_gen_qemu_st_i64(s->tmp1_i64, s->A0, mem_index, MO_LEUQ);
      tcg_gen_addi_tl(s->tmp0, s->A0, 8);
      tcg_gen_ld_i64(s->tmp1_i64, cpu_env, offset + offsetof(ZMMReg, ZMM_Q(1)));
 -    tcg_gen_qemu_st_i64(s->tmp1_i64, s->tmp0, mem_index, MO_LEQ);
 +    tcg_gen_qemu_st_i64(s->tmp1_i64, s->tmp0, mem_index, MO_LEUQ);
  }
  static inline void gen_op_movo(DisasContext *s, int d_offset, int s_offset)
@@ -XXX,XX +XXX,XX @@ static void gen_sse(CPUX86State *env, DisasContext *s, int b,
                              tcg_gen_mov_i64(cpu_regs[rm], s->tmp1_i64);
                          } else {
                              tcg_gen_qemu_st_i64(s->tmp1_i64, s->A0,
 -                                                s->mem_index, MO_LEQ);
 +                                                s->mem_index, MO_LEUQ);
                          }
  #else
                          goto illegal_op;
@@ -XXX,XX +XXX,XX @@ static void gen_sse(CPUX86State *env, DisasContext *s, int b,
                              gen_op_mov_v_reg(s, ot, s->tmp1_i64, rm);
                          } else {
                              tcg_gen_qemu_ld_i64(s->tmp1_i64, s->A0,
 -                                                s->mem_index, MO_LEQ);
 +                                                s->mem_index, MO_LEUQ);
                          }
                          tcg_gen_st_i64(s->tmp1_i64, cpu_env,
                                          offsetof(CPUX86State,
@@ -XXX,XX +XXX,XX @@ static target_ulong disas_insn(DisasContext *s, CPUState *cpu)
                              break;
                          case 2:
                              tcg_gen_qemu_ld_i64(s->tmp1_i64, s->A0,
 -                                                s->mem_index, MO_LEQ);
 +                                                s->mem_index, MO_LEUQ);
                              gen_helper_fldl_FT0(cpu_env, s->tmp1_i64);
                              break;
                          case 3:
@@ -XXX,XX +XXX,XX @@ static target_ulong disas_insn(DisasContext *s, CPUState *cpu)
                              break;
                          case 2:
                              tcg_gen_qemu_ld_i64(s->tmp1_i64, s->A0,
 -                                                s->mem_index, MO_LEQ);
 +                                                s->mem_index, MO_LEUQ);
                              gen_helper_fldl_ST0(cpu_env, s->tmp1_i64);
                              break;
                          case 3:
@@ -XXX,XX +XXX,XX @@ static target_ulong disas_insn(DisasContext *s, CPUState *cpu)
                          case 2:
                              gen_helper_fisttll_ST0(s->tmp1_i64, cpu_env);
                              tcg_gen_qemu_st_i64(s->tmp1_i64, s->A0,
 -                                                s->mem_index, MO_LEQ);
 +                                                s->mem_index, MO_LEUQ);
                              break;
                          case 3:
                          default:
@@ -XXX,XX +XXX,XX @@ static target_ulong disas_insn(DisasContext *s, CPUState *cpu)
                          case 2:
                              gen_helper_fstl_ST0(s->tmp1_i64, cpu_env);
                              tcg_gen_qemu_st_i64(s->tmp1_i64, s->A0,
 -                                                s->mem_index, MO_LEQ);
 +                                                s->mem_index, MO_LEUQ);
                              break;
                          case 3:
                          default:
@@ -XXX,XX +XXX,XX @@ static target_ulong disas_insn(DisasContext *s, CPUState *cpu)
                      break;
                  case 0x3d: /* fildll */
                      tcg_gen_qemu_ld_i64(s->tmp1_i64, s->A0,
 -                                        s->mem_index, MO_LEQ);
 +                                        s->mem_index, MO_LEUQ);
                      gen_helper_fildll_ST0(cpu_env, s->tmp1_i64);
                      break;
                  case 0x3f: /* fistpll */
                      gen_helper_fistll_ST0(s->tmp1_i64, cpu_env);
                      tcg_gen_qemu_st_i64(s->tmp1_i64, s->A0,
 -                                        s->mem_index, MO_LEQ);
 +                                        s->mem_index, MO_LEUQ);
                      gen_helper_fpop(cpu_env);
                      break;
                  default:
@@ -XXX,XX +XXX,XX @@ static target_ulong disas_insn(DisasContext *s, CPUState *cpu)
                      gen_lea_modrm(env, s, modrm);
                      if (CODE64(s)) {
                          tcg_gen_qemu_ld_i64(cpu_bndl[reg], s->A0,
 -                                            s->mem_index, MO_LEQ);
 +                                            s->mem_index, MO_LEUQ);
                          tcg_gen_addi_tl(s->A0, s->A0, 8);
                          tcg_gen_qemu_ld_i64(cpu_bndu[reg], s->A0,
 -                                            s->mem_index, MO_LEQ);
 +                                            s->mem_index, MO_LEUQ);
                      } else {
                          tcg_gen_qemu_ld_i64(cpu_bndl[reg], s->A0,
                                              s->mem_index, MO_LEUL);
@@ -XXX,XX +XXX,XX @@ static target_ulong disas_insn(DisasContext *s, CPUState *cpu)
                      gen_lea_modrm(env, s, modrm);
                      if (CODE64(s)) {
                          tcg_gen_qemu_st_i64(cpu_bndl[reg], s->A0,
 -                                            s->mem_index, MO_LEQ);
 +                                            s->mem_index, MO_LEUQ);
                          tcg_gen_addi_tl(s->A0, s->A0, 8);
                          tcg_gen_qemu_st_i64(cpu_bndu[reg], s->A0,
 -                                            s->mem_index, MO_LEQ);
 +                                            s->mem_index, MO_LEUQ);
                      } else {
                          tcg_gen_qemu_st_i64(cpu_bndl[reg], s->A0,
                                              s->mem_index, MO_LEUL);
 diff --git a/target/m68k/op_helper.c b/target/m68k/op_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/m68k/op_helper.c
 +++ b/target/m68k/op_helper.c
@@ -XXX,XX +XXX,XX @@ static void do_cas2l(CPUM68KState *env, uint32_t regs, uint32_t a1, uint32_t a2,
      uintptr_t ra = GETPC();
  #if defined(CONFIG_ATOMIC64)
      int mmu_idx = cpu_mmu_index(env, 0);
 -    MemOpIdx oi = make_memop_idx(MO_BEQ, mmu_idx);
 +    MemOpIdx oi = make_memop_idx(MO_BEUQ, mmu_idx);
  #endif
      if (parallel) {
 diff --git a/target/mips/tcg/translate.c b/target/mips/tcg/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/mips/tcg/translate.c
 +++ b/target/mips/tcg/translate.c
@@ -XXX,XX +XXX,XX @@ static void gen_ld(DisasContext *ctx, uint32_t opc,
          gen_store_gpr(t0, rt);
          break;
      case OPC_LD:
 -        tcg_gen_qemu_ld_tl(t0, t0, mem_idx, MO_TEQ |
 +        tcg_gen_qemu_ld_tl(t0, t0, mem_idx, MO_TEUQ |
                             ctx->default_tcg_memop_mask);
          gen_store_gpr(t0, rt);
          break;
@@ -XXX,XX +XXX,XX @@ static void gen_ld(DisasContext *ctx, uint32_t opc,
          }
          tcg_gen_shli_tl(t1, t1, 3);
          tcg_gen_andi_tl(t0, t0, ~7);
 -        tcg_gen_qemu_ld_tl(t0, t0, mem_idx, MO_TEQ);
 +        tcg_gen_qemu_ld_tl(t0, t0, mem_idx, MO_TEUQ);
          tcg_gen_shl_tl(t0, t0, t1);
          t2 = tcg_const_tl(-1);
          tcg_gen_shl_tl(t2, t2, t1);
@@ -XXX,XX +XXX,XX @@ static void gen_ld(DisasContext *ctx, uint32_t opc,
          }
          tcg_gen_shli_tl(t1, t1, 3);
          tcg_gen_andi_tl(t0, t0, ~7);
 -        tcg_gen_qemu_ld_tl(t0, t0, mem_idx, MO_TEQ);
 +        tcg_gen_qemu_ld_tl(t0, t0, mem_idx, MO_TEUQ);
          tcg_gen_shr_tl(t0, t0, t1);
          tcg_gen_xori_tl(t1, t1, 63);
          t2 = tcg_const_tl(0xfffffffffffffffeull);
@@ -XXX,XX +XXX,XX @@ static void gen_ld(DisasContext *ctx, uint32_t opc,
          t1 = tcg_const_tl(pc_relative_pc(ctx));
          gen_op_addr_add(ctx, t0, t0, t1);
          tcg_temp_free(t1);
 -        tcg_gen_qemu_ld_tl(t0, t0, mem_idx, MO_TEQ);
 +        tcg_gen_qemu_ld_tl(t0, t0, mem_idx, MO_TEUQ);
          gen_store_gpr(t0, rt);
          break;
  #endif
@@ -XXX,XX +XXX,XX @@ static void gen_st(DisasContext *ctx, uint32_t opc, int rt,
      switch (opc) {
  #if defined(TARGET_MIPS64)
      case OPC_SD:
 -        tcg_gen_qemu_st_tl(t1, t0, mem_idx, MO_TEQ |
 +        tcg_gen_qemu_st_tl(t1, t0, mem_idx, MO_TEUQ |
                             ctx->default_tcg_memop_mask);
          break;
      case OPC_SDL:
@@ -XXX,XX +XXX,XX @@ static void gen_flt_ldst(DisasContext *ctx, uint32_t opc, int ft,
      case OPC_LDC1:
          {
              TCGv_i64 fp0 = tcg_temp_new_i64();
 -            tcg_gen_qemu_ld_i64(fp0, t0, ctx->mem_idx, MO_TEQ |
 +            tcg_gen_qemu_ld_i64(fp0, t0, ctx->mem_idx, MO_TEUQ |
                                  ctx->default_tcg_memop_mask);
              gen_store_fpr64(ctx, fp0, ft);
              tcg_temp_free_i64(fp0);
@@ -XXX,XX +XXX,XX @@ static void gen_flt_ldst(DisasContext *ctx, uint32_t opc, int ft,
          {
              TCGv_i64 fp0 = tcg_temp_new_i64();
              gen_load_fpr64(ctx, fp0, ft);
 -            tcg_gen_qemu_st_i64(fp0, t0, ctx->mem_idx, MO_TEQ |
 +            tcg_gen_qemu_st_i64(fp0, t0, ctx->mem_idx, MO_TEUQ |
                                  ctx->default_tcg_memop_mask);
              tcg_temp_free_i64(fp0);
          }
@@ -XXX,XX +XXX,XX @@ static inline void gen_pcrel(DisasContext *ctx, int opc, target_ulong pc,
              check_mips_64(ctx);
              offset = sextract32(ctx->opcode << 3, 0, 21);
              addr = addr_add(ctx, (pc & ~0x7), offset);
 -            gen_r6_ld(addr, rs, ctx->mem_idx, MO_TEQ);
 +            gen_r6_ld(addr, rs, ctx->mem_idx, MO_TEUQ);
              break;
  #endif
          default:
@@ -XXX,XX +XXX,XX @@ static void gen_loongson_lswc2(DisasContext *ctx, int rt,
      case OPC_GSLQ:
          t1 = tcg_temp_new();
          gen_base_offset_addr(ctx, t0, rs, lsq_offset);
 -        tcg_gen_qemu_ld_tl(t1, t0, ctx->mem_idx, MO_TEQ |
 +        tcg_gen_qemu_ld_tl(t1, t0, ctx->mem_idx, MO_TEUQ |
                             ctx->default_tcg_memop_mask);
          gen_base_offset_addr(ctx, t0, rs, lsq_offset + 8);
 -        tcg_gen_qemu_ld_tl(t0, t0, ctx->mem_idx, MO_TEQ |
 +        tcg_gen_qemu_ld_tl(t0, t0, ctx->mem_idx, MO_TEUQ |
                             ctx->default_tcg_memop_mask);
          gen_store_gpr(t1, rt);
          gen_store_gpr(t0, lsq_rt1);
@@ -XXX,XX +XXX,XX @@ static void gen_loongson_lswc2(DisasContext *ctx, int rt,
          check_cp1_enabled(ctx);
          t1 = tcg_temp_new();
          gen_base_offset_addr(ctx, t0, rs, lsq_offset);
 -        tcg_gen_qemu_ld_tl(t1, t0, ctx->mem_idx, MO_TEQ |
 +        tcg_gen_qemu_ld_tl(t1, t0, ctx->mem_idx, MO_TEUQ |
                             ctx->default_tcg_memop_mask);
          gen_base_offset_addr(ctx, t0, rs, lsq_offset + 8);
 -        tcg_gen_qemu_ld_tl(t0, t0, ctx->mem_idx, MO_TEQ |
 +        tcg_gen_qemu_ld_tl(t0, t0, ctx->mem_idx, MO_TEUQ |
                             ctx->default_tcg_memop_mask);
          gen_store_fpr64(ctx, t1, rt);
          gen_store_fpr64(ctx, t0, lsq_rt1);
@@ -XXX,XX +XXX,XX @@ static void gen_loongson_lswc2(DisasContext *ctx, int rt,
          t1 = tcg_temp_new();
          gen_base_offset_addr(ctx, t0, rs, lsq_offset);
          gen_load_gpr(t1, rt);
 -        tcg_gen_qemu_st_tl(t1, t0, ctx->mem_idx, MO_TEQ |
 +        tcg_gen_qemu_st_tl(t1, t0, ctx->mem_idx, MO_TEUQ |
                             ctx->default_tcg_memop_mask);
          gen_base_offset_addr(ctx, t0, rs, lsq_offset + 8);
          gen_load_gpr(t1, lsq_rt1);
 -        tcg_gen_qemu_st_tl(t1, t0, ctx->mem_idx, MO_TEQ |
 +        tcg_gen_qemu_st_tl(t1, t0, ctx->mem_idx, MO_TEUQ |
                             ctx->default_tcg_memop_mask);
          tcg_temp_free(t1);
          break;
@@ -XXX,XX +XXX,XX @@ static void gen_loongson_lswc2(DisasContext *ctx, int rt,
          t1 = tcg_temp_new();
          gen_base_offset_addr(ctx, t0, rs, lsq_offset);
          gen_load_fpr64(ctx, t1, rt);
 -        tcg_gen_qemu_st_tl(t1, t0, ctx->mem_idx, MO_TEQ |
 +        tcg_gen_qemu_st_tl(t1, t0, ctx->mem_idx, MO_TEUQ |
                             ctx->default_tcg_memop_mask);
          gen_base_offset_addr(ctx, t0, rs, lsq_offset + 8);
          gen_load_fpr64(ctx, t1, lsq_rt1);
 -        tcg_gen_qemu_st_tl(t1, t0, ctx->mem_idx, MO_TEQ |
 +        tcg_gen_qemu_st_tl(t1, t0, ctx->mem_idx, MO_TEUQ |
                             ctx->default_tcg_memop_mask);
          tcg_temp_free(t1);
          break;
@@ -XXX,XX +XXX,XX @@ static void gen_loongson_lswc2(DisasContext *ctx, int rt,
              }
              tcg_gen_shli_tl(t1, t1, 3);
              tcg_gen_andi_tl(t0, t0, ~7);
 -            tcg_gen_qemu_ld_tl(t0, t0, ctx->mem_idx, MO_TEQ);
 +            tcg_gen_qemu_ld_tl(t0, t0, ctx->mem_idx, MO_TEUQ);
              tcg_gen_shl_tl(t0, t0, t1);
              t2 = tcg_const_tl(-1);
              tcg_gen_shl_tl(t2, t2, t1);
@@ -XXX,XX +XXX,XX @@ static void gen_loongson_lswc2(DisasContext *ctx, int rt,
              }
              tcg_gen_shli_tl(t1, t1, 3);
              tcg_gen_andi_tl(t0, t0, ~7);
 -            tcg_gen_qemu_ld_tl(t0, t0, ctx->mem_idx, MO_TEQ);
 +            tcg_gen_qemu_ld_tl(t0, t0, ctx->mem_idx, MO_TEUQ);
              tcg_gen_shr_tl(t0, t0, t1);
              tcg_gen_xori_tl(t1, t1, 63);
              t2 = tcg_const_tl(0xfffffffffffffffeull);
@@ -XXX,XX +XXX,XX @@ static void gen_loongson_lsdc2(DisasContext *ctx, int rt,
          if (rd) {
              gen_op_addr_add(ctx, t0, cpu_gpr[rd], t0);
          }
 -        tcg_gen_qemu_ld_tl(t0, t0, ctx->mem_idx, MO_TEQ |
 +        tcg_gen_qemu_ld_tl(t0, t0, ctx->mem_idx, MO_TEUQ |
                             ctx->default_tcg_memop_mask);
          gen_store_gpr(t0, rt);
          break;
@@ -XXX,XX +XXX,XX @@ static void gen_loongson_lsdc2(DisasContext *ctx, int rt,
          if (rd) {
              gen_op_addr_add(ctx, t0, cpu_gpr[rd], t0);
          }
 -        tcg_gen_qemu_ld_tl(t0, t0, ctx->mem_idx, MO_TEQ |
 +        tcg_gen_qemu_ld_tl(t0, t0, ctx->mem_idx, MO_TEUQ |
                             ctx->default_tcg_memop_mask);
          gen_store_fpr64(ctx, t0, rt);
          break;
@@ -XXX,XX +XXX,XX @@ static void gen_loongson_lsdc2(DisasContext *ctx, int rt,
      case OPC_GSSDX:
          t1 = tcg_temp_new();
          gen_load_gpr(t1, rt);
 -        tcg_gen_qemu_st_tl(t1, t0, ctx->mem_idx, MO_TEQ |
 +        tcg_gen_qemu_st_tl(t1, t0, ctx->mem_idx, MO_TEUQ |
                             ctx->default_tcg_memop_mask);
          tcg_temp_free(t1);
          break;
@@ -XXX,XX +XXX,XX @@ static void gen_loongson_lsdc2(DisasContext *ctx, int rt,
      case OPC_GSSDXC1:
          t1 = tcg_temp_new();
          gen_load_fpr64(ctx, t1, rt);
 -        tcg_gen_qemu_st_i64(t1, t0, ctx->mem_idx, MO_TEQ |
 +        tcg_gen_qemu_st_i64(t1, t0, ctx->mem_idx, MO_TEUQ |
                              ctx->default_tcg_memop_mask);
          tcg_temp_free(t1);
          break;
@@ -XXX,XX +XXX,XX @@ static void gen_flt3_ldst(DisasContext *ctx, uint32_t opc,
          check_cp1_registers(ctx, fd);
          {
              TCGv_i64 fp0 = tcg_temp_new_i64();
 -            tcg_gen_qemu_ld_i64(fp0, t0, ctx->mem_idx, MO_TEQ);
 +            tcg_gen_qemu_ld_i64(fp0, t0, ctx->mem_idx, MO_TEUQ);
              gen_store_fpr64(ctx, fp0, fd);
              tcg_temp_free_i64(fp0);
          }
@@ -XXX,XX +XXX,XX @@ static void gen_flt3_ldst(DisasContext *ctx, uint32_t opc,
          {
              TCGv_i64 fp0 = tcg_temp_new_i64();
 -            tcg_gen_qemu_ld_i64(fp0, t0, ctx->mem_idx, MO_TEQ);
 +            tcg_gen_qemu_ld_i64(fp0, t0, ctx->mem_idx, MO_TEUQ);
              gen_store_fpr64(ctx, fp0, fd);
              tcg_temp_free_i64(fp0);
          }
@@ -XXX,XX +XXX,XX @@ static void gen_flt3_ldst(DisasContext *ctx, uint32_t opc,
          {
              TCGv_i64 fp0 = tcg_temp_new_i64();
              gen_load_fpr64(ctx, fp0, fs);
 -            tcg_gen_qemu_st_i64(fp0, t0, ctx->mem_idx, MO_TEQ);
 +            tcg_gen_qemu_st_i64(fp0, t0, ctx->mem_idx, MO_TEUQ);
              tcg_temp_free_i64(fp0);
          }
          break;
@@ -XXX,XX +XXX,XX @@ static void gen_flt3_ldst(DisasContext *ctx, uint32_t opc,
          {
              TCGv_i64 fp0 = tcg_temp_new_i64();
              gen_load_fpr64(ctx, fp0, fs);
 -            tcg_gen_qemu_st_i64(fp0, t0, ctx->mem_idx, MO_TEQ);
 +            tcg_gen_qemu_st_i64(fp0, t0, ctx->mem_idx, MO_TEUQ);
              tcg_temp_free_i64(fp0);
          }
          break;
@@ -XXX,XX +XXX,XX @@ static void gen_mipsdsp_ld(DisasContext *ctx, uint32_t opc,
          break;
  #if defined(TARGET_MIPS64)
      case OPC_LDX:
 -        tcg_gen_qemu_ld_tl(t0, t0, ctx->mem_idx, MO_TEQ);
 +        tcg_gen_qemu_ld_tl(t0, t0, ctx->mem_idx, MO_TEUQ);
          gen_store_gpr(t0, rd);
          break;
  #endif
@@ -XXX,XX +XXX,XX @@ static void decode_opc_special3_r6(CPUMIPSState *env, DisasContext *ctx)
  #endif
  #if defined(TARGET_MIPS64)
      case R6_OPC_SCD:
 -        gen_st_cond(ctx, rt, rs, imm, MO_TEQ, false);
 +        gen_st_cond(ctx, rt, rs, imm, MO_TEUQ, false);
          break;
      case R6_OPC_LLD:
          gen_ld(ctx, op1, rt, rs, imm);
@@ -XXX,XX +XXX,XX @@ static bool decode_opc_legacy(CPUMIPSState *env, DisasContext *ctx)
              check_insn_opc_user_only(ctx, INSN_R5900);
          }
          check_mips_64(ctx);
 -        gen_st_cond(ctx, rt, rs, imm, MO_TEQ, false);
 +        gen_st_cond(ctx, rt, rs, imm, MO_TEUQ, false);
          break;
      case OPC_BNVC: /* OPC_BNEZALC, OPC_BNEC, OPC_DADDI */
          if (ctx->insn_flags & ISA_MIPS_R6) {
 diff --git a/target/mips/tcg/tx79_translate.c b/target/mips/tcg/tx79_translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/mips/tcg/tx79_translate.c
 +++ b/target/mips/tcg/tx79_translate.c
@@ -XXX,XX +XXX,XX @@ static bool trans_LQ(DisasContext *ctx, arg_i *a)
      tcg_gen_andi_tl(addr, addr, ~0xf);
      /* Lower half */
 -    tcg_gen_qemu_ld_i64(t0, addr, ctx->mem_idx, MO_TEQ);
 +    tcg_gen_qemu_ld_i64(t0, addr, ctx->mem_idx, MO_TEUQ);
      gen_store_gpr(t0, a->rt);
      /* Upper half */
      tcg_gen_addi_i64(addr, addr, 8);
 -    tcg_gen_qemu_ld_i64(t0, addr, ctx->mem_idx, MO_TEQ);
 +    tcg_gen_qemu_ld_i64(t0, addr, ctx->mem_idx, MO_TEUQ);
      gen_store_gpr_hi(t0, a->rt);
      tcg_temp_free(t0);
@@ -XXX,XX +XXX,XX @@ static bool trans_SQ(DisasContext *ctx, arg_i *a)
      /* Lower half */
      gen_load_gpr(t0, a->rt);
 -    tcg_gen_qemu_st_i64(t0, addr, ctx->mem_idx, MO_TEQ);
 +    tcg_gen_qemu_st_i64(t0, addr, ctx->mem_idx, MO_TEUQ);
      /* Upper half */
      tcg_gen_addi_i64(addr, addr, 8);
      gen_load_gpr_hi(t0, a->rt);
 -    tcg_gen_qemu_st_i64(t0, addr, ctx->mem_idx, MO_TEQ);
 +    tcg_gen_qemu_st_i64(t0, addr, ctx->mem_idx, MO_TEUQ);
      tcg_temp_free(addr);
      tcg_temp_free(t0);
 diff --git a/target/ppc/translate.c b/target/ppc/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/ppc/translate.c
 +++ b/target/ppc/translate.c
@@ -XXX,XX +XXX,XX @@ GEN_QEMU_LOAD_64(ld8u,  DEF_MEMOP(MO_UB))
  GEN_QEMU_LOAD_64(ld16u, DEF_MEMOP(MO_UW))
  GEN_QEMU_LOAD_64(ld32u, DEF_MEMOP(MO_UL))
  GEN_QEMU_LOAD_64(ld32s, DEF_MEMOP(MO_SL))
 -GEN_QEMU_LOAD_64(ld64,  DEF_MEMOP(MO_Q))
 +GEN_QEMU_LOAD_64(ld64,  DEF_MEMOP(MO_UQ))
  #if defined(TARGET_PPC64)
 -GEN_QEMU_LOAD_64(ld64ur, BSWAP_MEMOP(MO_Q))
 +GEN_QEMU_LOAD_64(ld64ur, BSWAP_MEMOP(MO_UQ))
  #endif
  #define GEN_QEMU_STORE_TL(stop, op)                                     \
@@ -XXX,XX +XXX,XX @@ static void glue(gen_qemu_, glue(stop, _i64))(DisasContext *ctx,  \
  GEN_QEMU_STORE_64(st8,  DEF_MEMOP(MO_UB))
  GEN_QEMU_STORE_64(st16, DEF_MEMOP(MO_UW))
  GEN_QEMU_STORE_64(st32, DEF_MEMOP(MO_UL))
 -GEN_QEMU_STORE_64(st64, DEF_MEMOP(MO_Q))
 +GEN_QEMU_STORE_64(st64, DEF_MEMOP(MO_UQ))
  #if defined(TARGET_PPC64)
 -GEN_QEMU_STORE_64(st64r, BSWAP_MEMOP(MO_Q))
 +GEN_QEMU_STORE_64(st64r, BSWAP_MEMOP(MO_UQ))
  #endif
  #define GEN_LDX_E(name, ldop, opc2, opc3, type, type2, chk)                   \
@@ -XXX,XX +XXX,XX @@ GEN_LDEPX(lb, DEF_MEMOP(MO_UB), 0x1F, 0x02)
  GEN_LDEPX(lh, DEF_MEMOP(MO_UW), 0x1F, 0x08)
  GEN_LDEPX(lw, DEF_MEMOP(MO_UL), 0x1F, 0x00)
  #if defined(TARGET_PPC64)
 -GEN_LDEPX(ld, DEF_MEMOP(MO_Q), 0x1D, 0x00)
 +GEN_LDEPX(ld, DEF_MEMOP(MO_UQ), 0x1D, 0x00)
  #endif
  #if defined(TARGET_PPC64)
@@ -XXX,XX +XXX,XX @@ GEN_STEPX(stb, DEF_MEMOP(MO_UB), 0x1F, 0x06)
  GEN_STEPX(sth, DEF_MEMOP(MO_UW), 0x1F, 0x0C)
  GEN_STEPX(stw, DEF_MEMOP(MO_UL), 0x1F, 0x04)
  #if defined(TARGET_PPC64)
 -GEN_STEPX(std, DEF_MEMOP(MO_Q), 0x1d, 0x04)
 +GEN_STEPX(std, DEF_MEMOP(MO_UQ), 0x1d, 0x04)
  #endif
  #if defined(TARGET_PPC64)
@@ -XXX,XX +XXX,XX @@ static void gen_lwat(DisasContext *ctx)
  #ifdef TARGET_PPC64
  static void gen_ldat(DisasContext *ctx)
  {
 -    gen_ld_atomic(ctx, DEF_MEMOP(MO_Q));
 +    gen_ld_atomic(ctx, DEF_MEMOP(MO_UQ));
  }
  #endif
@@ -XXX,XX +XXX,XX @@ static void gen_stwat(DisasContext *ctx)
  #ifdef TARGET_PPC64
  static void gen_stdat(DisasContext *ctx)
  {
 -    gen_st_atomic(ctx, DEF_MEMOP(MO_Q));
 +    gen_st_atomic(ctx, DEF_MEMOP(MO_UQ));
  }
  #endif
@@ -XXX,XX +XXX,XX @@ STCX(stwcx_, DEF_MEMOP(MO_UL))
  #if defined(TARGET_PPC64)
  /* ldarx */
 -LARX(ldarx, DEF_MEMOP(MO_Q))
 +LARX(ldarx, DEF_MEMOP(MO_UQ))
  /* stdcx. */
 -STCX(stdcx_, DEF_MEMOP(MO_Q))
 +STCX(stdcx_, DEF_MEMOP(MO_UQ))
  /* lqarx */
  static void gen_lqarx(DisasContext *ctx)
@@ -XXX,XX +XXX,XX @@ static void gen_lqarx(DisasContext *ctx)
              return;
          }
      } else if (ctx->le_mode) {
 -        tcg_gen_qemu_ld_i64(lo, EA, ctx->mem_idx, MO_LEQ | MO_ALIGN_16);
 +        tcg_gen_qemu_ld_i64(lo, EA, ctx->mem_idx, MO_LEUQ | MO_ALIGN_16);
          tcg_gen_mov_tl(cpu_reserve, EA);
          gen_addr_add(ctx, EA, EA, 8);
 -        tcg_gen_qemu_ld_i64(hi, EA, ctx->mem_idx, MO_LEQ);
 +        tcg_gen_qemu_ld_i64(hi, EA, ctx->mem_idx, MO_LEUQ);
      } else {
 -        tcg_gen_qemu_ld_i64(hi, EA, ctx->mem_idx, MO_BEQ | MO_ALIGN_16);
 +        tcg_gen_qemu_ld_i64(hi, EA, ctx->mem_idx, MO_BEUQ | MO_ALIGN_16);
          tcg_gen_mov_tl(cpu_reserve, EA);
          gen_addr_add(ctx, EA, EA, 8);
 -        tcg_gen_qemu_ld_i64(lo, EA, ctx->mem_idx, MO_BEQ);
 +        tcg_gen_qemu_ld_i64(lo, EA, ctx->mem_idx, MO_BEUQ);
      }
      tcg_temp_free(EA);
@@ -XXX,XX +XXX,XX @@ GEN_LDEPX(lb, DEF_MEMOP(MO_UB), 0x1F, 0x02)
  GEN_LDEPX(lh, DEF_MEMOP(MO_UW), 0x1F, 0x08)
  GEN_LDEPX(lw, DEF_MEMOP(MO_UL), 0x1F, 0x00)
  #if defined(TARGET_PPC64)
 -GEN_LDEPX(ld, DEF_MEMOP(MO_Q), 0x1D, 0x00)
 +GEN_LDEPX(ld, DEF_MEMOP(MO_UQ), 0x1D, 0x00)
  #endif
  #undef GEN_STX_E
@@ -XXX,XX +XXX,XX @@ GEN_STEPX(stb, DEF_MEMOP(MO_UB), 0x1F, 0x06)
  GEN_STEPX(sth, DEF_MEMOP(MO_UW), 0x1F, 0x0C)
  GEN_STEPX(stw, DEF_MEMOP(MO_UL), 0x1F, 0x04)
  #if defined(TARGET_PPC64)
 -GEN_STEPX(std, DEF_MEMOP(MO_Q), 0x1D, 0x04)
 +GEN_STEPX(std, DEF_MEMOP(MO_UQ), 0x1D, 0x04)
  #endif
  #undef GEN_CRLOGIC
 diff --git a/target/s390x/tcg/mem_helper.c b/target/s390x/tcg/mem_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/s390x/tcg/mem_helper.c
 +++ b/target/s390x/tcg/mem_helper.c
@@ -XXX,XX +XXX,XX @@ static uint32_t do_csst(CPUS390XState *env, uint32_t r3, uint64_t a1,
              if (parallel) {
  #ifdef CONFIG_ATOMIC64
 -                MemOpIdx oi = make_memop_idx(MO_TEQ | MO_ALIGN, mem_idx);
 +                MemOpIdx oi = make_memop_idx(MO_TEUQ | MO_ALIGN, mem_idx);
                  ov = cpu_atomic_cmpxchgq_be_mmu(env, a1, cv, nv, oi, ra);
  #else
                  /* Note that we asserted !parallel above.  */
@@ -XXX,XX +XXX,XX @@ static uint32_t do_csst(CPUS390XState *env, uint32_t r3, uint64_t a1,
                  cpu_stq_data_ra(env, a2 + 0, svh, ra);
                  cpu_stq_data_ra(env, a2 + 8, svl, ra);
              } else if (HAVE_ATOMIC128) {
 -                MemOpIdx oi = make_memop_idx(MO_TEQ | MO_ALIGN_16, mem_idx);
 +                MemOpIdx oi = make_memop_idx(MO_TEUQ | MO_ALIGN_16, mem_idx);
                  Int128 sv = int128_make128(svl, svh);
                  cpu_atomic_sto_be_mmu(env, a2, sv, oi, ra);
              } else {
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(lpq_parallel)(CPUS390XState *env, uint64_t addr)
      assert(HAVE_ATOMIC128);
      mem_idx = cpu_mmu_index(env, false);
 -    oi = make_memop_idx(MO_TEQ | MO_ALIGN_16, mem_idx);
 +    oi = make_memop_idx(MO_TEUQ | MO_ALIGN_16, mem_idx);
      v = cpu_atomic_ldo_be_mmu(env, addr, oi, ra);
      hi = int128_gethi(v);
      lo = int128_getlo(v);
@@ -XXX,XX +XXX,XX @@ void HELPER(stpq_parallel)(CPUS390XState *env, uint64_t addr,
      assert(HAVE_ATOMIC128);
      mem_idx = cpu_mmu_index(env, false);
 -    oi = make_memop_idx(MO_TEQ | MO_ALIGN_16, mem_idx);
 +    oi = make_memop_idx(MO_TEUQ | MO_ALIGN_16, mem_idx);
      v = int128_make128(low, high);
      cpu_atomic_sto_be_mmu(env, addr, v, oi, ra);
  }
 diff --git a/target/s390x/tcg/translate.c b/target/s390x/tcg/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/s390x/tcg/translate.c
 +++ b/target/s390x/tcg/translate.c
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_lpswe(DisasContext *s, DisasOps *o)
      t1 = tcg_temp_new_i64();
      t2 = tcg_temp_new_i64();
      tcg_gen_qemu_ld_i64(t1, o->in2, get_mem_index(s),
 -                        MO_TEQ | MO_ALIGN_8);
 +                        MO_TEUQ | MO_ALIGN_8);
      tcg_gen_addi_i64(o->in2, o->in2, 8);
      tcg_gen_qemu_ld64(t2, o->in2, get_mem_index(s));
      gen_helper_load_psw(cpu_env, t1, t2);
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_stcke(DisasContext *s, DisasOps *o)
  #ifndef CONFIG_USER_ONLY
  static DisasJumpType op_sck(DisasContext *s, DisasOps *o)
  {
 -    tcg_gen_qemu_ld_i64(o->in1, o->addr1, get_mem_index(s), MO_TEQ | MO_ALIGN);
 +    tcg_gen_qemu_ld_i64(o->in1, o->addr1, get_mem_index(s), MO_TEUQ | MO_ALIGN);
      gen_helper_sck(cc_op, cpu_env, o->in1);
      set_cc_static(s);
      return DISAS_NEXT;
@@ -XXX,XX +XXX,XX @@ static void wout_m1_64(DisasContext *s, DisasOps *o)
  #ifndef CONFIG_USER_ONLY
  static void wout_m1_64a(DisasContext *s, DisasOps *o)
  {
 -    tcg_gen_qemu_st_i64(o->out, o->addr1, get_mem_index(s), MO_TEQ | MO_ALIGN);
 +    tcg_gen_qemu_st_i64(o->out, o->addr1, get_mem_index(s), MO_TEUQ | MO_ALIGN);
  }
  #define SPEC_wout_m1_64a 0
  #endif
@@ -XXX,XX +XXX,XX @@ static void in2_m2_64w(DisasContext *s, DisasOps *o)
  static void in2_m2_64a(DisasContext *s, DisasOps *o)
  {
      in2_a2(s, o);
 -    tcg_gen_qemu_ld_i64(o->in2, o->in2, get_mem_index(s), MO_TEQ | MO_ALIGN);
 +    tcg_gen_qemu_ld_i64(o->in2, o->in2, get_mem_index(s), MO_TEUQ | MO_ALIGN);
  }
  #define SPEC_in2_m2_64a 0
  #endif
 diff --git a/target/sh4/translate.c b/target/sh4/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/sh4/translate.c
 +++ b/target/sh4/translate.c
@@ -XXX,XX +XXX,XX @@ static void _decode_opc(DisasContext * ctx)
          if (ctx->tbflags & FPSCR_SZ) {
              TCGv_i64 fp = tcg_temp_new_i64();
              gen_load_fpr64(ctx, fp, XHACK(B7_4));
 -            tcg_gen_qemu_st_i64(fp, REG(B11_8), ctx->memidx, MO_TEQ);
 +            tcg_gen_qemu_st_i64(fp, REG(B11_8), ctx->memidx, MO_TEUQ);
              tcg_temp_free_i64(fp);
      } else {
              tcg_gen_qemu_st_i32(FREG(B7_4), REG(B11_8), ctx->memidx, MO_TEUL);
@@ -XXX,XX +XXX,XX @@ static void _decode_opc(DisasContext * ctx)
      CHECK_FPU_ENABLED
          if (ctx->tbflags & FPSCR_SZ) {
              TCGv_i64 fp = tcg_temp_new_i64();
 -            tcg_gen_qemu_ld_i64(fp, REG(B7_4), ctx->memidx, MO_TEQ);
 +            tcg_gen_qemu_ld_i64(fp, REG(B7_4), ctx->memidx, MO_TEUQ);
              gen_store_fpr64(ctx, fp, XHACK(B11_8));
              tcg_temp_free_i64(fp);
      } else {
@@ -XXX,XX +XXX,XX @@ static void _decode_opc(DisasContext * ctx)
      CHECK_FPU_ENABLED
          if (ctx->tbflags & FPSCR_SZ) {
              TCGv_i64 fp = tcg_temp_new_i64();
 -            tcg_gen_qemu_ld_i64(fp, REG(B7_4), ctx->memidx, MO_TEQ);
 +            tcg_gen_qemu_ld_i64(fp, REG(B7_4), ctx->memidx, MO_TEUQ);
              gen_store_fpr64(ctx, fp, XHACK(B11_8));
              tcg_temp_free_i64(fp);
              tcg_gen_addi_i32(REG(B7_4), REG(B7_4), 8);
@@ -XXX,XX +XXX,XX @@ static void _decode_opc(DisasContext * ctx)
                  TCGv_i64 fp = tcg_temp_new_i64();
                  gen_load_fpr64(ctx, fp, XHACK(B7_4));
                  tcg_gen_subi_i32(addr, REG(B11_8), 8);
 -                tcg_gen_qemu_st_i64(fp, addr, ctx->memidx, MO_TEQ);
 +                tcg_gen_qemu_st_i64(fp, addr, ctx->memidx, MO_TEUQ);
                  tcg_temp_free_i64(fp);
              } else {
                  tcg_gen_subi_i32(addr, REG(B11_8), 4);
@@ -XXX,XX +XXX,XX @@ static void _decode_opc(DisasContext * ctx)
          tcg_gen_add_i32(addr, REG(B7_4), REG(0));
              if (ctx->tbflags & FPSCR_SZ) {
                  TCGv_i64 fp = tcg_temp_new_i64();
 -                tcg_gen_qemu_ld_i64(fp, addr, ctx->memidx, MO_TEQ);
 +                tcg_gen_qemu_ld_i64(fp, addr, ctx->memidx, MO_TEUQ);
                  gen_store_fpr64(ctx, fp, XHACK(B11_8));
                  tcg_temp_free_i64(fp);
          } else {
@@ -XXX,XX +XXX,XX @@ static void _decode_opc(DisasContext * ctx)
              if (ctx->tbflags & FPSCR_SZ) {
                  TCGv_i64 fp = tcg_temp_new_i64();
                  gen_load_fpr64(ctx, fp, XHACK(B7_4));
 -                tcg_gen_qemu_st_i64(fp, addr, ctx->memidx, MO_TEQ);
 +                tcg_gen_qemu_st_i64(fp, addr, ctx->memidx, MO_TEUQ);
                  tcg_temp_free_i64(fp);
          } else {
                  tcg_gen_qemu_st_i32(FREG(B7_4), addr, ctx->memidx, MO_TEUL);
 diff --git a/target/sparc/translate.c b/target/sparc/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/sparc/translate.c
 +++ b/target/sparc/translate.c
@@ -XXX,XX +XXX,XX @@ static void gen_ldstub_asi(DisasContext *dc, TCGv dst, TCGv addr, int insn)
  static void gen_ldf_asi(DisasContext *dc, TCGv addr,
                          int insn, int size, int rd)
  {
 -    DisasASI da = get_asi(dc, insn, (size == 4 ? MO_TEUL : MO_TEQ));
 +    DisasASI da = get_asi(dc, insn, (size == 4 ? MO_TEUL : MO_TEUQ));
      TCGv_i32 d32;
      TCGv_i64 d64;
@@ -XXX,XX +XXX,XX @@ static void gen_ldf_asi(DisasContext *dc, TCGv addr,
  static void gen_stf_asi(DisasContext *dc, TCGv addr,
                          int insn, int size, int rd)
  {
 -    DisasASI da = get_asi(dc, insn, (size == 4 ? MO_TEUL : MO_TEQ));
 +    DisasASI da = get_asi(dc, insn, (size == 4 ? MO_TEUL : MO_TEUQ));
      TCGv_i32 d32;
      switch (da.type) {
@@ -XXX,XX +XXX,XX @@ static void gen_stf_asi(DisasContext *dc, TCGv addr,
  static void gen_ldda_asi(DisasContext *dc, TCGv addr, int insn, int rd)
  {
 -    DisasASI da = get_asi(dc, insn, MO_TEQ);
 +    DisasASI da = get_asi(dc, insn, MO_TEUQ);
      TCGv_i64 hi = gen_dest_gpr(dc, rd);
      TCGv_i64 lo = gen_dest_gpr(dc, rd + 1);
@@ -XXX,XX +XXX,XX @@ static void gen_ldda_asi(DisasContext *dc, TCGv addr, int insn, int rd)
  static void gen_stda_asi(DisasContext *dc, TCGv hi, TCGv addr,
                           int insn, int rd)
  {
 -    DisasASI da = get_asi(dc, insn, MO_TEQ);
 +    DisasASI da = get_asi(dc, insn, MO_TEUQ);
      TCGv lo = gen_load_gpr(dc, rd + 1);
      switch (da.type) {
@@ -XXX,XX +XXX,XX @@ static void gen_stda_asi(DisasContext *dc, TCGv hi, TCGv addr,
  static void gen_casx_asi(DisasContext *dc, TCGv addr, TCGv cmpv,
                           int insn, int rd)
  {
 -    DisasASI da = get_asi(dc, insn, MO_TEQ);
 +    DisasASI da = get_asi(dc, insn, MO_TEUQ);
      TCGv oldv;
      switch (da.type) {
@@ -XXX,XX +XXX,XX @@ static void gen_ldda_asi(DisasContext *dc, TCGv addr, int insn, int rd)
      TCGv lo = gen_dest_gpr(dc, rd | 1);
      TCGv hi = gen_dest_gpr(dc, rd);
      TCGv_i64 t64 = tcg_temp_new_i64();
 -    DisasASI da = get_asi(dc, insn, MO_TEQ);
 +    DisasASI da = get_asi(dc, insn, MO_TEUQ);
      switch (da.type) {
      case GET_ASI_EXCP:
@@ -XXX,XX +XXX,XX @@ static void gen_ldda_asi(DisasContext *dc, TCGv addr, int insn, int rd)
      default:
          {
              TCGv_i32 r_asi = tcg_const_i32(da.asi);
 -            TCGv_i32 r_mop = tcg_const_i32(MO_Q);
 +            TCGv_i32 r_mop = tcg_const_i32(MO_UQ);
              save_state(dc);
              gen_helper_ld_asi(t64, cpu_env, addr, r_asi, r_mop);
@@ -XXX,XX +XXX,XX @@ static void gen_ldda_asi(DisasContext *dc, TCGv addr, int insn, int rd)
  static void gen_stda_asi(DisasContext *dc, TCGv hi, TCGv addr,
                           int insn, int rd)
  {
 -    DisasASI da = get_asi(dc, insn, MO_TEQ);
 +    DisasASI da = get_asi(dc, insn, MO_TEUQ);
      TCGv lo = gen_load_gpr(dc, rd + 1);
      TCGv_i64 t64 = tcg_temp_new_i64();
@@ -XXX,XX +XXX,XX @@ static void gen_stda_asi(DisasContext *dc, TCGv hi, TCGv addr,
      default:
          {
              TCGv_i32 r_asi = tcg_const_i32(da.asi);
 -            TCGv_i32 r_mop = tcg_const_i32(MO_Q);
 +            TCGv_i32 r_mop = tcg_const_i32(MO_UQ);
              save_state(dc);
              gen_helper_st_asi(cpu_env, addr, t64, r_asi, r_mop);
@@ -XXX,XX +XXX,XX @@ static void disas_sparc_insn(DisasContext * dc, unsigned int insn)
                      gen_ld_asi(dc, cpu_val, cpu_addr, insn, MO_TESL);
                      break;
                  case 0x1b: /* V9 ldxa */
 -                    gen_ld_asi(dc, cpu_val, cpu_addr, insn, MO_TEQ);
 +                    gen_ld_asi(dc, cpu_val, cpu_addr, insn, MO_TEUQ);
                      break;
                  case 0x2d: /* V9 prefetch, no effect */
                      goto skip_move;
@@ -XXX,XX +XXX,XX @@ static void disas_sparc_insn(DisasContext * dc, unsigned int insn)
                      if (rd == 1) {
                          TCGv_i64 t64 = tcg_temp_new_i64();
                          tcg_gen_qemu_ld_i64(t64, cpu_addr,
 -                                            dc->mem_idx, MO_TEQ);
 +                                            dc->mem_idx, MO_TEUQ);
                          gen_helper_ldxfsr(cpu_fsr, cpu_env, cpu_fsr, t64);
                          tcg_temp_free_i64(t64);
                          break;
@@ -XXX,XX +XXX,XX @@ static void disas_sparc_insn(DisasContext * dc, unsigned int insn)
                      gen_address_mask(dc, cpu_addr);
                      cpu_src1_64 = tcg_temp_new_i64();
                      tcg_gen_qemu_ld_i64(cpu_src1_64, cpu_addr, dc->mem_idx,
 -                                        MO_TEQ | MO_ALIGN_4);
 +                                        MO_TEUQ | MO_ALIGN_4);
                      tcg_gen_addi_tl(cpu_addr, cpu_addr, 8);
                      cpu_src2_64 = tcg_temp_new_i64();
                      tcg_gen_qemu_ld_i64(cpu_src2_64, cpu_addr, dc->mem_idx,
 -                                        MO_TEQ | MO_ALIGN_4);
 +                                        MO_TEUQ | MO_ALIGN_4);
                      gen_store_fpr_Q(dc, rd, cpu_src1_64, cpu_src2_64);
                      tcg_temp_free_i64(cpu_src1_64);
                      tcg_temp_free_i64(cpu_src2_64);
@@ -XXX,XX +XXX,XX @@ static void disas_sparc_insn(DisasContext * dc, unsigned int insn)
                      gen_address_mask(dc, cpu_addr);
                      cpu_dst_64 = gen_dest_fpr_D(dc, rd);
                      tcg_gen_qemu_ld_i64(cpu_dst_64, cpu_addr, dc->mem_idx,
 -                                        MO_TEQ | MO_ALIGN_4);
 +                                        MO_TEUQ | MO_ALIGN_4);
                      gen_store_fpr_D(dc, rd, cpu_dst_64);
                      break;
                  default:
@@ -XXX,XX +XXX,XX @@ static void disas_sparc_insn(DisasContext * dc, unsigned int insn)
                      tcg_gen_qemu_st64(cpu_val, cpu_addr, dc->mem_idx);
                      break;
                  case 0x1e: /* V9 stxa */
 -                    gen_st_asi(dc, cpu_val, cpu_addr, insn, MO_TEQ);
 +                    gen_st_asi(dc, cpu_val, cpu_addr, insn, MO_TEUQ);
                      break;
  #endif
                  default:
@@ -XXX,XX +XXX,XX @@ static void disas_sparc_insn(DisasContext * dc, unsigned int insn)
                         before performing the first write.  */
                      cpu_src1_64 = gen_load_fpr_Q0(dc, rd);
                      tcg_gen_qemu_st_i64(cpu_src1_64, cpu_addr,
 -                                        dc->mem_idx, MO_TEQ | MO_ALIGN_16);
 +                                        dc->mem_idx, MO_TEUQ | MO_ALIGN_16);
                      tcg_gen_addi_tl(cpu_addr, cpu_addr, 8);
                      cpu_src2_64 = gen_load_fpr_Q1(dc, rd);
                      tcg_gen_qemu_st_i64(cpu_src1_64, cpu_addr,
 -                                        dc->mem_idx, MO_TEQ);
 +                                        dc->mem_idx, MO_TEUQ);
                      break;
  #else /* !TARGET_SPARC64 */
                      /* stdfq, store floating point queue */
@@ -XXX,XX +XXX,XX @@ static void disas_sparc_insn(DisasContext * dc, unsigned int insn)
                      gen_address_mask(dc, cpu_addr);
                      cpu_src1_64 = gen_load_fpr_D(dc, rd);
                      tcg_gen_qemu_st_i64(cpu_src1_64, cpu_addr, dc->mem_idx,
 -                                        MO_TEQ | MO_ALIGN_4);
 +                                        MO_TEUQ | MO_ALIGN_4);
                      break;
                  default:
                      goto illegal_insn;
 diff --git a/target/tricore/translate.c b/target/tricore/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/tricore/translate.c
 +++ b/target/tricore/translate.c
@@ -XXX,XX +XXX,XX @@ static void gen_st_2regs_64(TCGv rh, TCGv rl, TCGv address, DisasContext *ctx)
      TCGv_i64 temp = tcg_temp_new_i64();
      tcg_gen_concat_i32_i64(temp, rl, rh);
 -    tcg_gen_qemu_st_i64(temp, address, ctx->mem_idx, MO_LEQ);
 +    tcg_gen_qemu_st_i64(temp, address, ctx->mem_idx, MO_LEUQ);
      tcg_temp_free_i64(temp);
  }
@@ -XXX,XX +XXX,XX @@ static void gen_ld_2regs_64(TCGv rh, TCGv rl, TCGv address, DisasContext *ctx)
  {
      TCGv_i64 temp = tcg_temp_new_i64();
 -    tcg_gen_qemu_ld_i64(temp, address, ctx->mem_idx, MO_LEQ);
 +    tcg_gen_qemu_ld_i64(temp, address, ctx->mem_idx, MO_LEUQ);
      /* write back to two 32 bit regs */
      tcg_gen_extr_i64_i32(rl, rh, temp);
 diff --git a/target/xtensa/translate.c b/target/xtensa/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/xtensa/translate.c
 +++ b/target/xtensa/translate.c
@@ -XXX,XX +XXX,XX @@ static void translate_ldsti_d(DisasContext *dc, const OpcodeArg arg[],
      } else {
          addr = arg[1].in;
      }
 -    mop = gen_load_store_alignment(dc, MO_TEQ, addr);
 +    mop = gen_load_store_alignment(dc, MO_TEUQ, addr);
      if (par[0]) {
          tcg_gen_qemu_st_i64(arg[0].in, addr, dc->cring, mop);
      } else {
@@ -XXX,XX +XXX,XX @@ static void translate_ldstx_d(DisasContext *dc, const OpcodeArg arg[],
      } else {
          addr = arg[1].in;
      }
 -    mop = gen_load_store_alignment(dc, MO_TEQ, addr);
 +    mop = gen_load_store_alignment(dc, MO_TEUQ, addr);
      if (par[0]) {
          tcg_gen_qemu_st_i64(arg[0].in, addr, dc->cring, mop);
      } else {
 diff --git a/tcg/tcg.c b/tcg/tcg.c
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tcg.c
 +++ b/tcg/tcg.c
@@ -XXX,XX +XXX,XX @@ static const char * const ldst_name[] =
      [MO_LESW] = "lesw",
      [MO_LEUL] = "leul",
      [MO_LESL] = "lesl",
 -    [MO_LEQ]  = "leq",
 +    [MO_LEUQ] = "leq",
      [MO_BEUW] = "beuw",
      [MO_BESW] = "besw",
      [MO_BEUL] = "beul",
      [MO_BESL] = "besl",
 -    [MO_BEQ]  = "beq",
 +    [MO_BEUQ] = "beq",
  };
  static const char * const alignment_name[(MO_AMASK >> MO_ASHIFT) + 1] = {
 diff --git a/tcg/tci.c b/tcg/tci.c
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tci.c
 +++ b/tcg/tci.c
@@ -XXX,XX +XXX,XX @@ static uint64_t tci_qemu_ld(CPUArchState *env, target_ulong taddr,
          return helper_le_ldul_mmu(env, taddr, oi, ra);
      case MO_LESL:
          return helper_le_ldsl_mmu(env, taddr, oi, ra);
 -    case MO_LEQ:
 +    case MO_LEUQ:
          return helper_le_ldq_mmu(env, taddr, oi, ra);
      case MO_BEUW:
          return helper_be_lduw_mmu(env, taddr, oi, ra);
@@ -XXX,XX +XXX,XX @@ static uint64_t tci_qemu_ld(CPUArchState *env, target_ulong taddr,
          return helper_be_ldul_mmu(env, taddr, oi, ra);
      case MO_BESL:
          return helper_be_ldsl_mmu(env, taddr, oi, ra);
 -    case MO_BEQ:
 +    case MO_BEUQ:
          return helper_be_ldq_mmu(env, taddr, oi, ra);
      default:
          g_assert_not_reached();
@@ -XXX,XX +XXX,XX @@ static uint64_t tci_qemu_ld(CPUArchState *env, target_ulong taddr,
      case MO_LESL:
          ret = (int32_t)ldl_le_p(haddr);
          break;
 -    case MO_LEQ:
 +    case MO_LEUQ:
          ret = ldq_le_p(haddr);
          break;
      case MO_BEUW:
@@ -XXX,XX +XXX,XX @@ static uint64_t tci_qemu_ld(CPUArchState *env, target_ulong taddr,
      case MO_BESL:
          ret = (int32_t)ldl_be_p(haddr);
          break;
 -    case MO_BEQ:
 +    case MO_BEUQ:
          ret = ldq_be_p(haddr);
          break;
      default:
@@ -XXX,XX +XXX,XX @@ static void tci_qemu_st(CPUArchState *env, target_ulong taddr, uint64_t val,
      case MO_LEUL:
          helper_le_stl_mmu(env, taddr, val, oi, ra);
          break;
 -    case MO_LEQ:
 +    case MO_LEUQ:
          helper_le_stq_mmu(env, taddr, val, oi, ra);
          break;
      case MO_BEUW:
@@ -XXX,XX +XXX,XX @@ static void tci_qemu_st(CPUArchState *env, target_ulong taddr, uint64_t val,
      case MO_BEUL:
          helper_be_stl_mmu(env, taddr, val, oi, ra);
          break;
 -    case MO_BEQ:
 +    case MO_BEUQ:
          helper_be_stq_mmu(env, taddr, val, oi, ra);
          break;
      default:
@@ -XXX,XX +XXX,XX @@ static void tci_qemu_st(CPUArchState *env, target_ulong taddr, uint64_t val,
      case MO_LEUL:
          stl_le_p(haddr, val);
          break;
 -    case MO_LEQ:
 +    case MO_LEUQ:
          stq_le_p(haddr, val);
          break;
      case MO_BEUW:
@@ -XXX,XX +XXX,XX @@ static void tci_qemu_st(CPUArchState *env, target_ulong taddr, uint64_t val,
      case MO_BEUL:
          stl_be_p(haddr, val);
          break;
 -    case MO_BEQ:
 +    case MO_BEUQ:
          stq_be_p(haddr, val);
          break;
      default:
 diff --git a/accel/tcg/ldst_common.c.inc b/accel/tcg/ldst_common.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/accel/tcg/ldst_common.c.inc
 +++ b/accel/tcg/ldst_common.c.inc
@@ -XXX,XX +XXX,XX @@ uint32_t cpu_ldl_be_mmuidx_ra(CPUArchState *env, abi_ptr addr,
  uint64_t cpu_ldq_be_mmuidx_ra(CPUArchState *env, abi_ptr addr,
                                int mmu_idx, uintptr_t ra)
  {
 -    MemOpIdx oi = make_memop_idx(MO_BEQ | MO_UNALN, mmu_idx);
 +    MemOpIdx oi = make_memop_idx(MO_BEUQ | MO_UNALN, mmu_idx);
      return cpu_ldq_be_mmu(env, addr, oi, ra);
  }
@@ -XXX,XX +XXX,XX @@ uint32_t cpu_ldl_le_mmuidx_ra(CPUArchState *env, abi_ptr addr,
  uint64_t cpu_ldq_le_mmuidx_ra(CPUArchState *env, abi_ptr addr,
                                int mmu_idx, uintptr_t ra)
  {
 -    MemOpIdx oi = make_memop_idx(MO_LEQ | MO_UNALN, mmu_idx);
 +    MemOpIdx oi = make_memop_idx(MO_LEUQ | MO_UNALN, mmu_idx);
      return cpu_ldq_le_mmu(env, addr, oi, ra);
  }
@@ -XXX,XX +XXX,XX @@ void cpu_stl_be_mmuidx_ra(CPUArchState *env, abi_ptr addr, uint32_t val,
  void cpu_stq_be_mmuidx_ra(CPUArchState *env, abi_ptr addr, uint64_t val,
                            int mmu_idx, uintptr_t ra)
  {
 -    MemOpIdx oi = make_memop_idx(MO_BEQ | MO_UNALN, mmu_idx);
 +    MemOpIdx oi = make_memop_idx(MO_BEUQ | MO_UNALN, mmu_idx);
      cpu_stq_be_mmu(env, addr, val, oi, ra);
  }
@@ -XXX,XX +XXX,XX @@ void cpu_stl_le_mmuidx_ra(CPUArchState *env, abi_ptr addr, uint32_t val,
  void cpu_stq_le_mmuidx_ra(CPUArchState *env, abi_ptr addr, uint64_t val,
                            int mmu_idx, uintptr_t ra)
  {
 -    MemOpIdx oi = make_memop_idx(MO_LEQ | MO_UNALN, mmu_idx);
 +    MemOpIdx oi = make_memop_idx(MO_LEUQ | MO_UNALN, mmu_idx);
      cpu_stq_le_mmu(env, addr, val, oi, ra);
  }
 diff --git a/target/mips/tcg/micromips_translate.c.inc b/target/mips/tcg/micromips_translate.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/mips/tcg/micromips_translate.c.inc
 +++ b/target/mips/tcg/micromips_translate.c.inc
@@ -XXX,XX +XXX,XX @@ static void gen_ldst_pair(DisasContext *ctx, uint32_t opc, int rd,
              gen_reserved_instruction(ctx);
              return;
          }
 -        tcg_gen_qemu_ld_tl(t1, t0, ctx->mem_idx, MO_TEQ);
 +        tcg_gen_qemu_ld_tl(t1, t0, ctx->mem_idx, MO_TEUQ);
          gen_store_gpr(t1, rd);
          tcg_gen_movi_tl(t1, 8);
          gen_op_addr_add(ctx, t0, t0, t1);
 -        tcg_gen_qemu_ld_tl(t1, t0, ctx->mem_idx, MO_TEQ);
 +        tcg_gen_qemu_ld_tl(t1, t0, ctx->mem_idx, MO_TEUQ);
          gen_store_gpr(t1, rd + 1);
          break;
      case SDP:
          gen_load_gpr(t1, rd);
 -        tcg_gen_qemu_st_tl(t1, t0, ctx->mem_idx, MO_TEQ);
 +        tcg_gen_qemu_st_tl(t1, t0, ctx->mem_idx, MO_TEUQ);
          tcg_gen_movi_tl(t1, 8);
          gen_op_addr_add(ctx, t0, t0, t1);
          gen_load_gpr(t1, rd + 1);
 -        tcg_gen_qemu_st_tl(t1, t0, ctx->mem_idx, MO_TEQ);
 +        tcg_gen_qemu_st_tl(t1, t0, ctx->mem_idx, MO_TEUQ);
          break;
  #endif
      }
@@ -XXX,XX +XXX,XX @@ static void decode_micromips32_opc(CPUMIPSState *env, DisasContext *ctx)
          case SCD:
              check_insn(ctx, ISA_MIPS3);
              check_mips_64(ctx);
 -            gen_st_cond(ctx, rt, rs, offset, MO_TEQ, false);
 +            gen_st_cond(ctx, rt, rs, offset, MO_TEUQ, false);
              break;
  #endif
          case LD_EVA:
 diff --git a/target/ppc/translate/fixedpoint-impl.c.inc b/target/ppc/translate/fixedpoint-impl.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/ppc/translate/fixedpoint-impl.c.inc
 +++ b/target/ppc/translate/fixedpoint-impl.c.inc
@@ -XXX,XX +XXX,XX @@ static bool do_ldst_quad(DisasContext *ctx, arg_D *a, bool store, bool prefixed)
              ctx->base.is_jmp = DISAS_NORETURN;
          }
      } else {
 -        mop = DEF_MEMOP(MO_Q);
 +        mop = DEF_MEMOP(MO_UQ);
          if (store) {
              tcg_gen_qemu_st_i64(low_addr_gpr, ea, ctx->mem_idx, mop);
          } else {
@@ -XXX,XX +XXX,XX @@ TRANS64(LWAUX, do_ldst_X, true, false, MO_SL)
  TRANS64(PLWA, do_ldst_PLS_D, false, false, MO_SL)
  /* Load Doubleword */
 -TRANS64(LD, do_ldst_D, false, false, MO_Q)
 -TRANS64(LDX, do_ldst_X, false, false, MO_Q)
 -TRANS64(LDU, do_ldst_D, true, false, MO_Q)
 -TRANS64(LDUX, do_ldst_X, true, false, MO_Q)
 -TRANS64(PLD, do_ldst_PLS_D, false, false, MO_Q)
 +TRANS64(LD, do_ldst_D, false, false, MO_UQ)
 +TRANS64(LDX, do_ldst_X, false, false, MO_UQ)
 +TRANS64(LDU, do_ldst_D, true, false, MO_UQ)
 +TRANS64(LDUX, do_ldst_X, true, false, MO_UQ)
 +TRANS64(PLD, do_ldst_PLS_D, false, false, MO_UQ)
  /* Load Quadword */
  TRANS64(LQ, do_ldst_quad, false, false);
@@ -XXX,XX +XXX,XX @@ TRANS(STWUX, do_ldst_X, true, true, MO_UL)
  TRANS(PSTW, do_ldst_PLS_D, false, true, MO_UL)
  /* Store Doubleword */
 -TRANS64(STD, do_ldst_D, false, true, MO_Q)
 -TRANS64(STDX, do_ldst_X, false, true, MO_Q)
 -TRANS64(STDU, do_ldst_D, true, true, MO_Q)
 -TRANS64(STDUX, do_ldst_X, true, true, MO_Q)
 -TRANS64(PSTD, do_ldst_PLS_D, false, true, MO_Q)
 +TRANS64(STD, do_ldst_D, false, true, MO_UQ)
 +TRANS64(STDX, do_ldst_X, false, true, MO_UQ)
 +TRANS64(STDU, do_ldst_D, true, true, MO_UQ)
 +TRANS64(STDUX, do_ldst_X, true, true, MO_UQ)
 +TRANS64(PSTD, do_ldst_PLS_D, false, true, MO_UQ)
  /* Store Quadword */
  TRANS64(STQ, do_ldst_quad, true, false);
 diff --git a/target/ppc/translate/fp-impl.c.inc b/target/ppc/translate/fp-impl.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/ppc/translate/fp-impl.c.inc
 +++ b/target/ppc/translate/fp-impl.c.inc
@@ -XXX,XX +XXX,XX @@ static void gen_lfdepx(DisasContext *ctx)
      EA = tcg_temp_new();
      t0 = tcg_temp_new_i64();
      gen_addr_reg_index(ctx, EA);
 -    tcg_gen_qemu_ld_i64(t0, EA, PPC_TLB_EPID_LOAD, DEF_MEMOP(MO_Q));
 +    tcg_gen_qemu_ld_i64(t0, EA, PPC_TLB_EPID_LOAD, DEF_MEMOP(MO_UQ));
      set_fpr(rD(ctx->opcode), t0);
      tcg_temp_free(EA);
      tcg_temp_free_i64(t0);
@@ -XXX,XX +XXX,XX @@ static void gen_stfdepx(DisasContext *ctx)
      t0 = tcg_temp_new_i64();
      gen_addr_reg_index(ctx, EA);
      get_fpr(t0, rD(ctx->opcode));
 -    tcg_gen_qemu_st_i64(t0, EA, PPC_TLB_EPID_STORE, DEF_MEMOP(MO_Q));
 +    tcg_gen_qemu_st_i64(t0, EA, PPC_TLB_EPID_STORE, DEF_MEMOP(MO_UQ));
      tcg_temp_free(EA);
      tcg_temp_free_i64(t0);
  }
 diff --git a/target/ppc/translate/vsx-impl.c.inc b/target/ppc/translate/vsx-impl.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/ppc/translate/vsx-impl.c.inc
 +++ b/target/ppc/translate/vsx-impl.c.inc
@@ -XXX,XX +XXX,XX @@ static void gen_lxvw4x(DisasContext *ctx)
          TCGv_i64 t0 = tcg_temp_new_i64();
          TCGv_i64 t1 = tcg_temp_new_i64();
 -        tcg_gen_qemu_ld_i64(t0, EA, ctx->mem_idx, MO_LEQ);
 +        tcg_gen_qemu_ld_i64(t0, EA, ctx->mem_idx, MO_LEUQ);
          tcg_gen_shri_i64(t1, t0, 32);
          tcg_gen_deposit_i64(xth, t1, t0, 32, 32);
          tcg_gen_addi_tl(EA, EA, 8);
 -        tcg_gen_qemu_ld_i64(t0, EA, ctx->mem_idx, MO_LEQ);
 +        tcg_gen_qemu_ld_i64(t0, EA, ctx->mem_idx, MO_LEUQ);
          tcg_gen_shri_i64(t1, t0, 32);
          tcg_gen_deposit_i64(xtl, t1, t0, 32, 32);
          tcg_temp_free_i64(t0);
          tcg_temp_free_i64(t1);
      } else {
 -        tcg_gen_qemu_ld_i64(xth, EA, ctx->mem_idx, MO_BEQ);
 +        tcg_gen_qemu_ld_i64(xth, EA, ctx->mem_idx, MO_BEUQ);
          tcg_gen_addi_tl(EA, EA, 8);
 -        tcg_gen_qemu_ld_i64(xtl, EA, ctx->mem_idx, MO_BEQ);
 +        tcg_gen_qemu_ld_i64(xtl, EA, ctx->mem_idx, MO_BEUQ);
      }
      set_cpu_vsr(xT(ctx->opcode), xth, true);
      set_cpu_vsr(xT(ctx->opcode), xtl, false);
@@ -XXX,XX +XXX,XX @@ static void gen_lxvdsx(DisasContext *ctx)
      gen_addr_reg_index(ctx, EA);
      data = tcg_temp_new_i64();
 -    tcg_gen_qemu_ld_i64(data, EA, ctx->mem_idx, DEF_MEMOP(MO_Q));
 -    tcg_gen_gvec_dup_i64(MO_Q, vsr_full_offset(xT(ctx->opcode)), 16, 16, data);
 +    tcg_gen_qemu_ld_i64(data, EA, ctx->mem_idx, DEF_MEMOP(MO_UQ));
 +    tcg_gen_gvec_dup_i64(MO_UQ, vsr_full_offset(xT(ctx->opcode)), 16, 16, data);
      tcg_temp_free(EA);
      tcg_temp_free_i64(data);
@@ -XXX,XX +XXX,XX @@ static void gen_lxvh8x(DisasContext *ctx)
      EA = tcg_temp_new();
      gen_addr_reg_index(ctx, EA);
 -    tcg_gen_qemu_ld_i64(xth, EA, ctx->mem_idx, MO_BEQ);
 +    tcg_gen_qemu_ld_i64(xth, EA, ctx->mem_idx, MO_BEUQ);
      tcg_gen_addi_tl(EA, EA, 8);
 -    tcg_gen_qemu_ld_i64(xtl, EA, ctx->mem_idx, MO_BEQ);
 +    tcg_gen_qemu_ld_i64(xtl, EA, ctx->mem_idx, MO_BEUQ);
      if (ctx->le_mode) {
          gen_bswap16x8(xth, xtl, xth, xtl);
      }
@@ -XXX,XX +XXX,XX @@ static void gen_lxvb16x(DisasContext *ctx)
      gen_set_access_type(ctx, ACCESS_INT);
      EA = tcg_temp_new();
      gen_addr_reg_index(ctx, EA);
 -    tcg_gen_qemu_ld_i64(xth, EA, ctx->mem_idx, MO_BEQ);
 +    tcg_gen_qemu_ld_i64(xth, EA, ctx->mem_idx, MO_BEUQ);
      tcg_gen_addi_tl(EA, EA, 8);
 -    tcg_gen_qemu_ld_i64(xtl, EA, ctx->mem_idx, MO_BEQ);
 +    tcg_gen_qemu_ld_i64(xtl, EA, ctx->mem_idx, MO_BEUQ);
      set_cpu_vsr(xT(ctx->opcode), xth, true);
      set_cpu_vsr(xT(ctx->opcode), xtl, false);
      tcg_temp_free(EA);
@@ -XXX,XX +XXX,XX @@ static void gen_stxvw4x(DisasContext *ctx)
          tcg_gen_shri_i64(t0, xsh, 32);
          tcg_gen_deposit_i64(t1, t0, xsh, 32, 32);
 -        tcg_gen_qemu_st_i64(t1, EA, ctx->mem_idx, MO_LEQ);
 +        tcg_gen_qemu_st_i64(t1, EA, ctx->mem_idx, MO_LEUQ);
          tcg_gen_addi_tl(EA, EA, 8);
          tcg_gen_shri_i64(t0, xsl, 32);
          tcg_gen_deposit_i64(t1, t0, xsl, 32, 32);
 -        tcg_gen_qemu_st_i64(t1, EA, ctx->mem_idx, MO_LEQ);
 +        tcg_gen_qemu_st_i64(t1, EA, ctx->mem_idx, MO_LEUQ);
          tcg_temp_free_i64(t0);
          tcg_temp_free_i64(t1);
      } else {
 -        tcg_gen_qemu_st_i64(xsh, EA, ctx->mem_idx, MO_BEQ);
 +        tcg_gen_qemu_st_i64(xsh, EA, ctx->mem_idx, MO_BEUQ);
          tcg_gen_addi_tl(EA, EA, 8);
 -        tcg_gen_qemu_st_i64(xsl, EA, ctx->mem_idx, MO_BEQ);
 +        tcg_gen_qemu_st_i64(xsl, EA, ctx->mem_idx, MO_BEUQ);
      }
      tcg_temp_free(EA);
      tcg_temp_free_i64(xsh);
@@ -XXX,XX +XXX,XX @@ static void gen_stxvh8x(DisasContext *ctx)
          TCGv_i64 outl = tcg_temp_new_i64();
          gen_bswap16x8(outh, outl, xsh, xsl);
 -        tcg_gen_qemu_st_i64(outh, EA, ctx->mem_idx, MO_BEQ);
 +        tcg_gen_qemu_st_i64(outh, EA, ctx->mem_idx, MO_BEUQ);
          tcg_gen_addi_tl(EA, EA, 8);
 -        tcg_gen_qemu_st_i64(outl, EA, ctx->mem_idx, MO_BEQ);
 +        tcg_gen_qemu_st_i64(outl, EA, ctx->mem_idx, MO_BEUQ);
          tcg_temp_free_i64(outh);
          tcg_temp_free_i64(outl);
      } else {
 -        tcg_gen_qemu_st_i64(xsh, EA, ctx->mem_idx, MO_BEQ);
 +        tcg_gen_qemu_st_i64(xsh, EA, ctx->mem_idx, MO_BEUQ);
          tcg_gen_addi_tl(EA, EA, 8);
 -        tcg_gen_qemu_st_i64(xsl, EA, ctx->mem_idx, MO_BEQ);
 +        tcg_gen_qemu_st_i64(xsl, EA, ctx->mem_idx, MO_BEUQ);
      }
      tcg_temp_free(EA);
      tcg_temp_free_i64(xsh);
@@ -XXX,XX +XXX,XX @@ static void gen_stxvb16x(DisasContext *ctx)
      gen_set_access_type(ctx, ACCESS_INT);
      EA = tcg_temp_new();
      gen_addr_reg_index(ctx, EA);
 -    tcg_gen_qemu_st_i64(xsh, EA, ctx->mem_idx, MO_BEQ);
 +    tcg_gen_qemu_st_i64(xsh, EA, ctx->mem_idx, MO_BEUQ);
      tcg_gen_addi_tl(EA, EA, 8);
 -    tcg_gen_qemu_st_i64(xsl, EA, ctx->mem_idx, MO_BEQ);
 +    tcg_gen_qemu_st_i64(xsl, EA, ctx->mem_idx, MO_BEUQ);
      tcg_temp_free(EA);
      tcg_temp_free_i64(xsh);
      tcg_temp_free_i64(xsl);
@@ -XXX,XX +XXX,XX @@ static bool do_lstxv(DisasContext *ctx, int ra, TCGv displ,
      xt = tcg_temp_new_i64();
 -    mop = DEF_MEMOP(MO_Q);
 +    mop = DEF_MEMOP(MO_UQ);
      gen_set_access_type(ctx, ACCESS_INT);
      ea = do_ea_calc(ctx, ra, displ);
 diff --git a/target/riscv/insn_trans/trans_rva.c.inc b/target/riscv/insn_trans/trans_rva.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rva.c.inc
 +++ b/target/riscv/insn_trans/trans_rva.c.inc
@@ -XXX,XX +XXX,XX @@ static bool trans_amomaxu_w(DisasContext *ctx, arg_amomaxu_w *a)
  static bool trans_lr_d(DisasContext *ctx, arg_lr_d *a)
  {
      REQUIRE_64BIT(ctx);
 -    return gen_lr(ctx, a, MO_ALIGN | MO_TEQ);
 +    return gen_lr(ctx, a, MO_ALIGN | MO_TEUQ);
  }
  static bool trans_sc_d(DisasContext *ctx, arg_sc_d *a)
  {
      REQUIRE_64BIT(ctx);
 -    return gen_sc(ctx, a, (MO_ALIGN | MO_TEQ));
 +    return gen_sc(ctx, a, (MO_ALIGN | MO_TEUQ));
  }
  static bool trans_amoswap_d(DisasContext *ctx, arg_amoswap_d *a)
  {
      REQUIRE_64BIT(ctx);
 -    return gen_amo(ctx, a, &tcg_gen_atomic_xchg_tl, (MO_ALIGN | MO_TEQ));
 +    return gen_amo(ctx, a, &tcg_gen_atomic_xchg_tl, (MO_ALIGN | MO_TEUQ));
  }
  static bool trans_amoadd_d(DisasContext *ctx, arg_amoadd_d *a)
  {
      REQUIRE_64BIT(ctx);
 -    return gen_amo(ctx, a, &tcg_gen_atomic_fetch_add_tl, (MO_ALIGN | MO_TEQ));
 +    return gen_amo(ctx, a, &tcg_gen_atomic_fetch_add_tl, (MO_ALIGN | MO_TEUQ));
  }
  static bool trans_amoxor_d(DisasContext *ctx, arg_amoxor_d *a)
  {
      REQUIRE_64BIT(ctx);
 -    return gen_amo(ctx, a, &tcg_gen_atomic_fetch_xor_tl, (MO_ALIGN | MO_TEQ));
 +    return gen_amo(ctx, a, &tcg_gen_atomic_fetch_xor_tl, (MO_ALIGN | MO_TEUQ));
  }
  static bool trans_amoand_d(DisasContext *ctx, arg_amoand_d *a)
  {
      REQUIRE_64BIT(ctx);
 -    return gen_amo(ctx, a, &tcg_gen_atomic_fetch_and_tl, (MO_ALIGN | MO_TEQ));
 +    return gen_amo(ctx, a, &tcg_gen_atomic_fetch_and_tl, (MO_ALIGN | MO_TEUQ));
  }
  static bool trans_amoor_d(DisasContext *ctx, arg_amoor_d *a)
  {
      REQUIRE_64BIT(ctx);
 -    return gen_amo(ctx, a, &tcg_gen_atomic_fetch_or_tl, (MO_ALIGN | MO_TEQ));
 +    return gen_amo(ctx, a, &tcg_gen_atomic_fetch_or_tl, (MO_ALIGN | MO_TEUQ));
  }
  static bool trans_amomin_d(DisasContext *ctx, arg_amomin_d *a)
  {
      REQUIRE_64BIT(ctx);
 -    return gen_amo(ctx, a, &tcg_gen_atomic_fetch_smin_tl, (MO_ALIGN | MO_TEQ));
 +    return gen_amo(ctx, a, &tcg_gen_atomic_fetch_smin_tl, (MO_ALIGN | MO_TEUQ));
  }
  static bool trans_amomax_d(DisasContext *ctx, arg_amomax_d *a)
  {
      REQUIRE_64BIT(ctx);
 -    return gen_amo(ctx, a, &tcg_gen_atomic_fetch_smax_tl, (MO_ALIGN | MO_TEQ));
 +    return gen_amo(ctx, a, &tcg_gen_atomic_fetch_smax_tl, (MO_ALIGN | MO_TEUQ));
  }
  static bool trans_amominu_d(DisasContext *ctx, arg_amominu_d *a)
  {
      REQUIRE_64BIT(ctx);
 -    return gen_amo(ctx, a, &tcg_gen_atomic_fetch_umin_tl, (MO_ALIGN | MO_TEQ));
 +    return gen_amo(ctx, a, &tcg_gen_atomic_fetch_umin_tl, (MO_ALIGN | MO_TEUQ));
  }
  static bool trans_amomaxu_d(DisasContext *ctx, arg_amomaxu_d *a)
  {
      REQUIRE_64BIT(ctx);
 -    return gen_amo(ctx, a, &tcg_gen_atomic_fetch_umax_tl, (MO_ALIGN | MO_TEQ));
 +    return gen_amo(ctx, a, &tcg_gen_atomic_fetch_umax_tl, (MO_ALIGN | MO_TEUQ));
  }
 diff --git a/target/riscv/insn_trans/trans_rvd.c.inc b/target/riscv/insn_trans/trans_rvd.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvd.c.inc
 +++ b/target/riscv/insn_trans/trans_rvd.c.inc
@@ -XXX,XX +XXX,XX @@ static bool trans_fld(DisasContext *ctx, arg_fld *a)
      }
      addr = gen_pm_adjust_address(ctx, addr);
 -    tcg_gen_qemu_ld_i64(cpu_fpr[a->rd], addr, ctx->mem_idx, MO_TEQ);
 +    tcg_gen_qemu_ld_i64(cpu_fpr[a->rd], addr, ctx->mem_idx, MO_TEUQ);
      mark_fs_dirty(ctx);
      return true;
@@ -XXX,XX +XXX,XX @@ static bool trans_fsd(DisasContext *ctx, arg_fsd *a)
      }
      addr = gen_pm_adjust_address(ctx, addr);
 -    tcg_gen_qemu_st_i64(cpu_fpr[a->rs2], addr, ctx->mem_idx, MO_TEQ);
 +    tcg_gen_qemu_st_i64(cpu_fpr[a->rs2], addr, ctx->mem_idx, MO_TEUQ);
      return true;
  }
 diff --git a/target/riscv/insn_trans/trans_rvh.c.inc b/target/riscv/insn_trans/trans_rvh.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvh.c.inc
 +++ b/target/riscv/insn_trans/trans_rvh.c.inc
@@ -XXX,XX +XXX,XX @@ static bool trans_hlv_d(DisasContext *ctx, arg_hlv_d *a)
  {
      REQUIRE_64BIT(ctx);
      REQUIRE_EXT(ctx, RVH);
 -    return do_hlv(ctx, a, MO_TEQ);
 +    return do_hlv(ctx, a, MO_TEUQ);
  }
  static bool trans_hsv_d(DisasContext *ctx, arg_hsv_d *a)
  {
      REQUIRE_64BIT(ctx);
      REQUIRE_EXT(ctx, RVH);
 -    return do_hsv(ctx, a, MO_TEQ);
 +    return do_hsv(ctx, a, MO_TEUQ);
  }
  #ifndef CONFIG_USER_ONLY
 diff --git a/target/riscv/insn_trans/trans_rvi.c.inc b/target/riscv/insn_trans/trans_rvi.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/insn_trans/trans_rvi.c.inc
 +++ b/target/riscv/insn_trans/trans_rvi.c.inc
@@ -XXX,XX +XXX,XX @@ static bool trans_lwu(DisasContext *ctx, arg_lwu *a)
  static bool trans_ld(DisasContext *ctx, arg_ld *a)
  {
      REQUIRE_64BIT(ctx);
 -    return gen_load(ctx, a, MO_TEQ);
 +    return gen_load(ctx, a, MO_TEUQ);
  }
  static bool trans_sd(DisasContext *ctx, arg_sd *a)
  {
      REQUIRE_64BIT(ctx);
 -    return gen_store(ctx, a, MO_TEQ);
 +    return gen_store(ctx, a, MO_TEUQ);
  }
  static bool trans_addi(DisasContext *ctx, arg_addi *a)
 diff --git a/target/s390x/tcg/translate_vx.c.inc b/target/s390x/tcg/translate_vx.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/s390x/tcg/translate_vx.c.inc
 +++ b/target/s390x/tcg/translate_vx.c.inc
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_vl(DisasContext *s, DisasOps *o)
      TCGv_i64 t0 = tcg_temp_new_i64();
      TCGv_i64 t1 = tcg_temp_new_i64();
 -    tcg_gen_qemu_ld_i64(t0, o->addr1, get_mem_index(s), MO_TEQ);
 +    tcg_gen_qemu_ld_i64(t0, o->addr1, get_mem_index(s), MO_TEUQ);
      gen_addi_and_wrap_i64(s, o->addr1, o->addr1, 8);
 -    tcg_gen_qemu_ld_i64(t1, o->addr1, get_mem_index(s), MO_TEQ);
 +    tcg_gen_qemu_ld_i64(t1, o->addr1, get_mem_index(s), MO_TEUQ);
      write_vec_element_i64(t0, get_field(s, v1), 0, ES_64);
      write_vec_element_i64(t1, get_field(s, v1), 1, ES_64);
      tcg_temp_free(t0);
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_vlm(DisasContext *s, DisasOps *o)
      t0 = tcg_temp_new_i64();
      t1 = tcg_temp_new_i64();
      gen_addi_and_wrap_i64(s, t0, o->addr1, (v3 - v1) * 16 + 8);
 -    tcg_gen_qemu_ld_i64(t0, t0, get_mem_index(s), MO_TEQ);
 +    tcg_gen_qemu_ld_i64(t0, t0, get_mem_index(s), MO_TEUQ);
      for (;; v1++) {
 -        tcg_gen_qemu_ld_i64(t1, o->addr1, get_mem_index(s), MO_TEQ);
 +        tcg_gen_qemu_ld_i64(t1, o->addr1, get_mem_index(s), MO_TEUQ);
          write_vec_element_i64(t1, v1, 0, ES_64);
          if (v1 == v3) {
              break;
          }
          gen_addi_and_wrap_i64(s, o->addr1, o->addr1, 8);
 -        tcg_gen_qemu_ld_i64(t1, o->addr1, get_mem_index(s), MO_TEQ);
 +        tcg_gen_qemu_ld_i64(t1, o->addr1, get_mem_index(s), MO_TEUQ);
          write_vec_element_i64(t1, v1, 1, ES_64);
          gen_addi_and_wrap_i64(s, o->addr1, o->addr1, 8);
      }
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_vst(DisasContext *s, DisasOps *o)
      gen_helper_probe_write_access(cpu_env, o->addr1, tmp);
      read_vec_element_i64(tmp,  get_field(s, v1), 0, ES_64);
 -    tcg_gen_qemu_st_i64(tmp, o->addr1, get_mem_index(s), MO_TEQ);
 +    tcg_gen_qemu_st_i64(tmp, o->addr1, get_mem_index(s), MO_TEUQ);
      gen_addi_and_wrap_i64(s, o->addr1, o->addr1, 8);
      read_vec_element_i64(tmp,  get_field(s, v1), 1, ES_64);
 -    tcg_gen_qemu_st_i64(tmp, o->addr1, get_mem_index(s), MO_TEQ);
 +    tcg_gen_qemu_st_i64(tmp, o->addr1, get_mem_index(s), MO_TEUQ);
      tcg_temp_free_i64(tmp);
      return DISAS_NEXT;
  }
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_vstm(DisasContext *s, DisasOps *o)
      for (;; v1++) {
          read_vec_element_i64(tmp, v1, 0, ES_64);
 -        tcg_gen_qemu_st_i64(tmp, o->addr1, get_mem_index(s), MO_TEQ);
 +        tcg_gen_qemu_st_i64(tmp, o->addr1, get_mem_index(s), MO_TEUQ);
          gen_addi_and_wrap_i64(s, o->addr1, o->addr1, 8);
          read_vec_element_i64(tmp, v1, 1, ES_64);
 -        tcg_gen_qemu_st_i64(tmp, o->addr1, get_mem_index(s), MO_TEQ);
 +        tcg_gen_qemu_st_i64(tmp, o->addr1, get_mem_index(s), MO_TEUQ);
          if (v1 == v3) {
              break;
          }
 diff --git a/tcg/aarch64/tcg-target.c.inc b/tcg/aarch64/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/aarch64/tcg-target.c.inc
 +++ b/tcg/aarch64/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static void tcg_out_qemu_ld_direct(TCGContext *s, MemOp memop, TCGType ext,
      case MO_SL:
          tcg_out_ldst_r(s, I3312_LDRSWX, data_r, addr_r, otype, off_r);
          break;
 -    case MO_Q:
 +    case MO_UQ:
          tcg_out_ldst_r(s, I3312_LDRX, data_r, addr_r, otype, off_r);
          break;
      default:
 diff --git a/tcg/arm/tcg-target.c.inc b/tcg/arm/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/arm/tcg-target.c.inc
 +++ b/tcg/arm/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static void * const qemu_ld_helpers[MO_SSIZE + 1] = {
  #ifdef HOST_WORDS_BIGENDIAN
      [MO_UW] = helper_be_lduw_mmu,
      [MO_UL] = helper_be_ldul_mmu,
 -    [MO_Q]  = helper_be_ldq_mmu,
 +    [MO_UQ] = helper_be_ldq_mmu,
      [MO_SW] = helper_be_ldsw_mmu,
      [MO_SL] = helper_be_ldul_mmu,
  #else
      [MO_UW] = helper_le_lduw_mmu,
      [MO_UL] = helper_le_ldul_mmu,
 -    [MO_Q]  = helper_le_ldq_mmu,
 +    [MO_UQ] = helper_le_ldq_mmu,
      [MO_SW] = helper_le_ldsw_mmu,
      [MO_SL] = helper_le_ldul_mmu,
  #endif
@@ -XXX,XX +XXX,XX @@ static bool tcg_out_qemu_ld_slow_path(TCGContext *s, TCGLabelQemuLdst *lb)
      default:
          tcg_out_mov_reg(s, COND_AL, datalo, TCG_REG_R0);
          break;
 -    case MO_Q:
 +    case MO_UQ:
          if (datalo != TCG_REG_R1) {
              tcg_out_mov_reg(s, COND_AL, datalo, TCG_REG_R0);
              tcg_out_mov_reg(s, COND_AL, datahi, TCG_REG_R1);
@@ -XXX,XX +XXX,XX @@ static void tcg_out_qemu_ld_index(TCGContext *s, MemOp opc,
      case MO_UL:
          tcg_out_ld32_r(s, COND_AL, datalo, addrlo, addend);
          break;
 -    case MO_Q:
 +    case MO_UQ:
          /* Avoid ldrd for user-only emulation, to handle unaligned.  */
          if (USING_SOFTMMU && use_armv6_instructions
              && (datalo & 1) == 0 && datahi == datalo + 1) {
@@ -XXX,XX +XXX,XX @@ static void tcg_out_qemu_ld_direct(TCGContext *s, MemOp opc, TCGReg datalo,
      case MO_UL:
          tcg_out_ld32_12(s, COND_AL, datalo, addrlo, 0);
          break;
 -    case MO_Q:
 +    case MO_UQ:
          /* Avoid ldrd for user-only emulation, to handle unaligned.  */
          if (USING_SOFTMMU && use_armv6_instructions
              && (datalo & 1) == 0 && datahi == datalo + 1) {
 diff --git a/tcg/i386/tcg-target.c.inc b/tcg/i386/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/i386/tcg-target.c.inc
 +++ b/tcg/i386/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static void * const qemu_ld_helpers[(MO_SIZE | MO_BSWAP) + 1] = {
      [MO_UB]   = helper_ret_ldub_mmu,
      [MO_LEUW] = helper_le_lduw_mmu,
      [MO_LEUL] = helper_le_ldul_mmu,
 -    [MO_LEQ]  = helper_le_ldq_mmu,
 +    [MO_LEUQ] = helper_le_ldq_mmu,
      [MO_BEUW] = helper_be_lduw_mmu,
      [MO_BEUL] = helper_be_ldul_mmu,
 -    [MO_BEQ]  = helper_be_ldq_mmu,
 +    [MO_BEUQ] = helper_be_ldq_mmu,
  };
  /* helper signature: helper_ret_st_mmu(CPUState *env, target_ulong addr,
@@ -XXX,XX +XXX,XX @@ static void * const qemu_st_helpers[(MO_SIZE | MO_BSWAP) + 1] = {
      [MO_UB]   = helper_ret_stb_mmu,
      [MO_LEUW] = helper_le_stw_mmu,
      [MO_LEUL] = helper_le_stl_mmu,
 -    [MO_LEQ]  = helper_le_stq_mmu,
 +    [MO_LEUQ] = helper_le_stq_mmu,
      [MO_BEUW] = helper_be_stw_mmu,
      [MO_BEUL] = helper_be_stl_mmu,
 -    [MO_BEQ]  = helper_be_stq_mmu,
 +    [MO_BEUQ] = helper_be_stq_mmu,
  };
  /* Perform the TLB load and compare.
@@ -XXX,XX +XXX,XX @@ static bool tcg_out_qemu_ld_slow_path(TCGContext *s, TCGLabelQemuLdst *l)
      case MO_UL:
          tcg_out_mov(s, TCG_TYPE_I32, data_reg, TCG_REG_EAX);
          break;
 -    case MO_Q:
 +    case MO_UQ:
          if (TCG_TARGET_REG_BITS == 64) {
              tcg_out_mov(s, TCG_TYPE_I64, data_reg, TCG_REG_RAX);
          } else if (data_reg == TCG_REG_EDX) {
@@ -XXX,XX +XXX,XX @@ static void tcg_out_qemu_ld_direct(TCGContext *s, TCGReg datalo, TCGReg datahi,
          }
          break;
  #endif
 -    case MO_Q:
 +    case MO_UQ:
          if (TCG_TARGET_REG_BITS == 64) {
              tcg_out_modrm_sib_offset(s, movop + P_REXW + seg, datalo,
                                       base, index, 0, ofs);
 diff --git a/tcg/mips/tcg-target.c.inc b/tcg/mips/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/mips/tcg-target.c.inc
 +++ b/tcg/mips/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static void * const qemu_ld_helpers[(MO_SSIZE | MO_BSWAP) + 1] = {
      [MO_LEUW] = helper_le_lduw_mmu,
      [MO_LESW] = helper_le_ldsw_mmu,
      [MO_LEUL] = helper_le_ldul_mmu,
 -    [MO_LEQ]  = helper_le_ldq_mmu,
 +    [MO_LEUQ] = helper_le_ldq_mmu,
      [MO_BEUW] = helper_be_lduw_mmu,
      [MO_BESW] = helper_be_ldsw_mmu,
      [MO_BEUL] = helper_be_ldul_mmu,
 -    [MO_BEQ]  = helper_be_ldq_mmu,
 +    [MO_BEUQ] = helper_be_ldq_mmu,
  #if TCG_TARGET_REG_BITS == 64
      [MO_LESL] = helper_le_ldsl_mmu,
      [MO_BESL] = helper_be_ldsl_mmu,
@@ -XXX,XX +XXX,XX @@ static void * const qemu_st_helpers[(MO_SIZE | MO_BSWAP) + 1] = {
      [MO_UB]   = helper_ret_stb_mmu,
      [MO_LEUW] = helper_le_stw_mmu,
      [MO_LEUL] = helper_le_stl_mmu,
 -    [MO_LEQ]  = helper_le_stq_mmu,
 +    [MO_LEUQ] = helper_le_stq_mmu,
      [MO_BEUW] = helper_be_stw_mmu,
      [MO_BEUL] = helper_be_stl_mmu,
 -    [MO_BEQ]  = helper_be_stq_mmu,
 +    [MO_BEUQ] = helper_be_stq_mmu,
  };
  /* Helper routines for marshalling helper function arguments into
@@ -XXX,XX +XXX,XX @@ static void tcg_out_qemu_ld_direct(TCGContext *s, TCGReg lo, TCGReg hi,
      case MO_SL:
          tcg_out_opc_imm(s, OPC_LW, lo, base, 0);
          break;
 -    case MO_Q | MO_BSWAP:
 +    case MO_UQ | MO_BSWAP:
          if (TCG_TARGET_REG_BITS == 64) {
              if (use_mips32r2_instructions) {
                  tcg_out_opc_imm(s, OPC_LD, lo, base, 0);
@@ -XXX,XX +XXX,XX @@ static void tcg_out_qemu_ld_direct(TCGContext *s, TCGReg lo, TCGReg hi,
              tcg_out_mov(s, TCG_TYPE_I32, MIPS_BE ? hi : lo, TCG_TMP3);
          }
          break;
 -    case MO_Q:
 +    case MO_UQ:
          /* Prefer to load from offset 0 first, but allow for overlap.  */
          if (TCG_TARGET_REG_BITS == 64) {
              tcg_out_opc_imm(s, OPC_LD, lo, base, 0);
 diff --git a/tcg/ppc/tcg-target.c.inc b/tcg/ppc/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/ppc/tcg-target.c.inc
 +++ b/tcg/ppc/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static const uint32_t qemu_ldx_opc[(MO_SSIZE + MO_BSWAP) + 1] = {
      [MO_UB] = LBZX,
      [MO_UW] = LHZX,
      [MO_UL] = LWZX,
 -    [MO_Q]  = LDX,
 +    [MO_UQ] = LDX,
      [MO_SW] = LHAX,
      [MO_SL] = LWAX,
      [MO_BSWAP | MO_UB] = LBZX,
      [MO_BSWAP | MO_UW] = LHBRX,
      [MO_BSWAP | MO_UL] = LWBRX,
 -    [MO_BSWAP | MO_Q]  = LDBRX,
 +    [MO_BSWAP | MO_UQ] = LDBRX,
  };
  static const uint32_t qemu_stx_opc[(MO_SIZE + MO_BSWAP) + 1] = {
      [MO_UB] = STBX,
      [MO_UW] = STHX,
      [MO_UL] = STWX,
 -    [MO_Q]  = STDX,
 +    [MO_UQ] = STDX,
      [MO_BSWAP | MO_UB] = STBX,
      [MO_BSWAP | MO_UW] = STHBRX,
      [MO_BSWAP | MO_UL] = STWBRX,
 -    [MO_BSWAP | MO_Q]  = STDBRX,
 +    [MO_BSWAP | MO_UQ] = STDBRX,
  };
  static const uint32_t qemu_exts_opc[4] = {
@@ -XXX,XX +XXX,XX @@ static void * const qemu_ld_helpers[(MO_SIZE | MO_BSWAP) + 1] = {
      [MO_UB]   = helper_ret_ldub_mmu,
      [MO_LEUW] = helper_le_lduw_mmu,
      [MO_LEUL] = helper_le_ldul_mmu,
 -    [MO_LEQ]  = helper_le_ldq_mmu,
 +    [MO_LEUQ] = helper_le_ldq_mmu,
      [MO_BEUW] = helper_be_lduw_mmu,
      [MO_BEUL] = helper_be_ldul_mmu,
 -    [MO_BEQ]  = helper_be_ldq_mmu,
 +    [MO_BEUQ] = helper_be_ldq_mmu,
  };
  /* helper signature: helper_st_mmu(CPUState *env, target_ulong addr,
@@ -XXX,XX +XXX,XX @@ static void * const qemu_st_helpers[(MO_SIZE | MO_BSWAP) + 1] = {
      [MO_UB]   = helper_ret_stb_mmu,
      [MO_LEUW] = helper_le_stw_mmu,
      [MO_LEUL] = helper_le_stl_mmu,
 -    [MO_LEQ]  = helper_le_stq_mmu,
 +    [MO_LEUQ] = helper_le_stq_mmu,
      [MO_BEUW] = helper_be_stw_mmu,
      [MO_BEUL] = helper_be_stl_mmu,
 -    [MO_BEQ]  = helper_be_stq_mmu,
 +    [MO_BEUQ] = helper_be_stq_mmu,
  };
  /* We expect to use a 16-bit negative offset from ENV.  */
 diff --git a/tcg/riscv/tcg-target.c.inc b/tcg/riscv/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/riscv/tcg-target.c.inc
 +++ b/tcg/riscv/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static void * const qemu_ld_helpers[MO_SSIZE + 1] = {
  #if TCG_TARGET_REG_BITS == 64
      [MO_SL] = helper_be_ldsl_mmu,
  #endif
 -    [MO_Q]  = helper_be_ldq_mmu,
 +    [MO_UQ] = helper_be_ldq_mmu,
  #else
      [MO_UW] = helper_le_lduw_mmu,
      [MO_SW] = helper_le_ldsw_mmu,
@@ -XXX,XX +XXX,XX @@ static void * const qemu_ld_helpers[MO_SSIZE + 1] = {
  #if TCG_TARGET_REG_BITS == 64
      [MO_SL] = helper_le_ldsl_mmu,
  #endif
 -    [MO_Q]  = helper_le_ldq_mmu,
 +    [MO_UQ] = helper_le_ldq_mmu,
  #endif
  };
@@ -XXX,XX +XXX,XX @@ static void tcg_out_qemu_ld_direct(TCGContext *s, TCGReg lo, TCGReg hi,
      case MO_SL:
          tcg_out_opc_imm(s, OPC_LW, lo, base, 0);
          break;
 -    case MO_Q:
 +    case MO_UQ:
          /* Prefer to load from offset 0 first, but allow for overlap.  */
          if (TCG_TARGET_REG_BITS == 64) {
              tcg_out_opc_imm(s, OPC_LD, lo, base, 0);
 diff --git a/tcg/s390x/tcg-target.c.inc b/tcg/s390x/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/s390x/tcg-target.c.inc
 +++ b/tcg/s390x/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static void * const qemu_ld_helpers[(MO_SSIZE | MO_BSWAP) + 1] = {
      [MO_LESW] = helper_le_ldsw_mmu,
      [MO_LEUL] = helper_le_ldul_mmu,
      [MO_LESL] = helper_le_ldsl_mmu,
 -    [MO_LEQ]  = helper_le_ldq_mmu,
 +    [MO_LEUQ] = helper_le_ldq_mmu,
      [MO_BEUW] = helper_be_lduw_mmu,
      [MO_BESW] = helper_be_ldsw_mmu,
      [MO_BEUL] = helper_be_ldul_mmu,
      [MO_BESL] = helper_be_ldsl_mmu,
 -    [MO_BEQ]  = helper_be_ldq_mmu,
 +    [MO_BEUQ] = helper_be_ldq_mmu,
  };
  static void * const qemu_st_helpers[(MO_SIZE | MO_BSWAP) + 1] = {
      [MO_UB]   = helper_ret_stb_mmu,
      [MO_LEUW] = helper_le_stw_mmu,
      [MO_LEUL] = helper_le_stl_mmu,
 -    [MO_LEQ]  = helper_le_stq_mmu,
 +    [MO_LEUQ] = helper_le_stq_mmu,
      [MO_BEUW] = helper_be_stw_mmu,
      [MO_BEUL] = helper_be_stl_mmu,
 -    [MO_BEQ]  = helper_be_stq_mmu,
 +    [MO_BEUQ] = helper_be_stq_mmu,
  };
  #endif
@@ -XXX,XX +XXX,XX @@ static void tcg_out_qemu_ld_direct(TCGContext *s, MemOp opc, TCGReg data,
          tcg_out_insn(s, RXY, LGF, data, base, index, disp);
          break;
 -    case MO_Q | MO_BSWAP:
 +    case MO_UQ | MO_BSWAP:
          tcg_out_insn(s, RXY, LRVG, data, base, index, disp);
          break;
 -    case MO_Q:
 +    case MO_UQ:
          tcg_out_insn(s, RXY, LG, data, base, index, disp);
          break;
@@ -XXX,XX +XXX,XX @@ static void tcg_out_qemu_st_direct(TCGContext *s, MemOp opc, TCGReg data,
          }
          break;
 -    case MO_Q | MO_BSWAP:
 +    case MO_UQ | MO_BSWAP:
          tcg_out_insn(s, RXY, STRVG, data, base, index, disp);
          break;
 -    case MO_Q:
 +    case MO_UQ:
          tcg_out_insn(s, RXY, STG, data, base, index, disp);
          break;
@@ -XXX,XX +XXX,XX @@ static bool tcg_out_qemu_st_slow_path(TCGContext *s, TCGLabelQemuLdst *lb)
      case MO_UL:
          tgen_ext32u(s, TCG_REG_R4, data_reg);
          break;
 -    case MO_Q:
 +    case MO_UQ:
          tcg_out_mov(s, TCG_TYPE_I64, TCG_REG_R4, data_reg);
          break;
      default:
 diff --git a/tcg/sparc/tcg-target.c.inc b/tcg/sparc/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/sparc/tcg-target.c.inc
 +++ b/tcg/sparc/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static void build_trampolines(TCGContext *s)
          [MO_LEUW] = helper_le_lduw_mmu,
          [MO_LESW] = helper_le_ldsw_mmu,
          [MO_LEUL] = helper_le_ldul_mmu,
 -        [MO_LEQ]  = helper_le_ldq_mmu,
 +        [MO_LEUQ] = helper_le_ldq_mmu,
          [MO_BEUW] = helper_be_lduw_mmu,
          [MO_BESW] = helper_be_ldsw_mmu,
          [MO_BEUL] = helper_be_ldul_mmu,
 -        [MO_BEQ]  = helper_be_ldq_mmu,
 +        [MO_BEUQ] = helper_be_ldq_mmu,
      };
      static void * const qemu_st_helpers[] = {
          [MO_UB]   = helper_ret_stb_mmu,
          [MO_LEUW] = helper_le_stw_mmu,
          [MO_LEUL] = helper_le_stl_mmu,
 -        [MO_LEQ]  = helper_le_stq_mmu,
 +        [MO_LEUQ] = helper_le_stq_mmu,
          [MO_BEUW] = helper_be_stw_mmu,
          [MO_BEUL] = helper_be_stl_mmu,
 -        [MO_BEQ]  = helper_be_stq_mmu,
 +        [MO_BEUQ] = helper_be_stq_mmu,
      };
      int i;
@@ -XXX,XX +XXX,XX @@ static const int qemu_ld_opc[(MO_SSIZE | MO_BSWAP) + 1] = {
      [MO_BESW] = LDSH,
      [MO_BEUL] = LDUW,
      [MO_BESL] = LDSW,
 -    [MO_BEQ]  = LDX,
 +    [MO_BEUQ] = LDX,
      [MO_LEUW] = LDUH_LE,
      [MO_LESW] = LDSH_LE,
      [MO_LEUL] = LDUW_LE,
      [MO_LESL] = LDSW_LE,
 -    [MO_LEQ]  = LDX_LE,
 +    [MO_LEUQ] = LDX_LE,
  };
  static const int qemu_st_opc[(MO_SIZE | MO_BSWAP) + 1] = {
@@ -XXX,XX +XXX,XX @@ static const int qemu_st_opc[(MO_SIZE | MO_BSWAP) + 1] = {
      [MO_BEUW] = STH,
      [MO_BEUL] = STW,
 -    [MO_BEQ]  = STX,
 +    [MO_BEUQ] = STX,
      [MO_LEUW] = STH_LE,
      [MO_LEUL] = STW_LE,
 -    [MO_LEQ]  = STX_LE,
 +    [MO_LEUQ] = STX_LE,
  };
  static void tcg_out_qemu_ld(TCGContext *s, TCGReg data, TCGReg addr,
 diff --git a/target/s390x/tcg/insn-data.def b/target/s390x/tcg/insn-data.def
 index XXXXXXX..XXXXXXX 100644
 --- a/target/s390x/tcg/insn-data.def
 +++ b/target/s390x/tcg/insn-data.def
@@ -XXX,XX +XXX,XX @@
      D(0xeb6a, ASI,     SIY,   GIE, la1, i2, new, 0, asi, adds32, MO_TESL)
      C(0xecd8, AHIK,    RIE_d, DO,  r3, i2, new, r1_32, add, adds32)
      C(0xc208, AGFI,    RIL_a, EI,  r1, i2, r1, 0, add, adds64)
 -    D(0xeb7a, AGSI,    SIY,   GIE, la1, i2, new, 0, asi, adds64, MO_TEQ)
 +    D(0xeb7a, AGSI,    SIY,   GIE, la1, i2, new, 0, asi, adds64, MO_TEUQ)
      C(0xecd9, AGHIK,   RIE_d, DO,  r3, i2, r1, 0, add, adds64)
  /* ADD IMMEDIATE HIGH */
      C(0xcc08, AIH,     RIL_a, HW,  r1_sr32, i2, new, r1_32h, add, adds32)
@@ -XXX,XX +XXX,XX @@
  /* ADD LOGICAL WITH SIGNED IMMEDIATE */
      D(0xeb6e, ALSI,    SIY,   GIE, la1, i2_32u, new, 0, asi, addu32, MO_TEUL)
      C(0xecda, ALHSIK,  RIE_d, DO,  r3_32u, i2_32u, new, r1_32, add, addu32)
 -    D(0xeb7e, ALGSI,   SIY,   GIE, la1, i2, new, 0, asiu64, addu64, MO_TEQ)
 +    D(0xeb7e, ALGSI,   SIY,   GIE, la1, i2, new, 0, asiu64, addu64, MO_TEUQ)
      C(0xecdb, ALGHSIK, RIE_d, DO,  r3, i2, r1, 0, addu64, addu64)
  /* ADD LOGICAL WITH SIGNED IMMEDIATE HIGH */
      C(0xcc0a, ALSIH,   RIL_a, HW,  r1_sr32, i2_32u, new, r1_32h, add, addu32)
@@ -XXX,XX +XXX,XX @@
  /* COMPARE AND SWAP */
      D(0xba00, CS,      RS_a,  Z,   r3_32u, r1_32u, new, r1_32, cs, 0, MO_TEUL)
      D(0xeb14, CSY,     RSY_a, LD,  r3_32u, r1_32u, new, r1_32, cs, 0, MO_TEUL)
 -    D(0xeb30, CSG,     RSY_a, Z,   r3_o, r1_o, new, r1, cs, 0, MO_TEQ)
 +    D(0xeb30, CSG,     RSY_a, Z,   r3_o, r1_o, new, r1, cs, 0, MO_TEUQ)
  /* COMPARE DOUBLE AND SWAP */
 -    D(0xbb00, CDS,     RS_a,  Z,   r3_D32, r1_D32, new, r1_D32, cs, 0, MO_TEQ)
 -    D(0xeb31, CDSY,    RSY_a, LD,  r3_D32, r1_D32, new, r1_D32, cs, 0, MO_TEQ)
 +    D(0xbb00, CDS,     RS_a,  Z,   r3_D32, r1_D32, new, r1_D32, cs, 0, MO_TEUQ)
 +    D(0xeb31, CDSY,    RSY_a, LD,  r3_D32, r1_D32, new, r1_D32, cs, 0, MO_TEUQ)
      C(0xeb3e, CDSG,    RSY_a, Z,   0, 0, 0, 0, cdsg, 0)
  /* COMPARE AND SWAP AND STORE */
      C(0xc802, CSST,    SSF,   CASS, la1, a2, 0, 0, csst, 0)
@@ -XXX,XX +XXX,XX @@
      C(0xc000, LARL,    RIL_b, Z,   0, ri2, 0, r1, mov2, 0)
  /* LOAD AND ADD */
      D(0xebf8, LAA,     RSY_a, ILA, r3_32s, a2, new, in2_r1_32, laa, adds32, MO_TESL)
 -    D(0xebe8, LAAG,    RSY_a, ILA, r3, a2, new, in2_r1, laa, adds64, MO_TEQ)
 +    D(0xebe8, LAAG,    RSY_a, ILA, r3, a2, new, in2_r1, laa, adds64, MO_TEUQ)
  /* LOAD AND ADD LOGICAL */
      D(0xebfa, LAAL,    RSY_a, ILA, r3_32u, a2, new, in2_r1_32, laa, addu32, MO_TEUL)
 -    D(0xebea, LAALG,   RSY_a, ILA, r3, a2, new, in2_r1, laa, addu64, MO_TEQ)
 +    D(0xebea, LAALG,   RSY_a, ILA, r3, a2, new, in2_r1, laa, addu64, MO_TEUQ)
  /* LOAD AND AND */
      D(0xebf4, LAN,     RSY_a, ILA, r3_32s, a2, new, in2_r1_32, lan, nz32, MO_TESL)
 -    D(0xebe4, LANG,    RSY_a, ILA, r3, a2, new, in2_r1, lan, nz64, MO_TEQ)
 +    D(0xebe4, LANG,    RSY_a, ILA, r3, a2, new, in2_r1, lan, nz64, MO_TEUQ)
  /* LOAD AND EXCLUSIVE OR */
      D(0xebf7, LAX,     RSY_a, ILA, r3_32s, a2, new, in2_r1_32, lax, nz32, MO_TESL)
 -    D(0xebe7, LAXG,    RSY_a, ILA, r3, a2, new, in2_r1, lax, nz64, MO_TEQ)
 +    D(0xebe7, LAXG,    RSY_a, ILA, r3, a2, new, in2_r1, lax, nz64, MO_TEUQ)
  /* LOAD AND OR */
      D(0xebf6, LAO,     RSY_a, ILA, r3_32s, a2, new, in2_r1_32, lao, nz32, MO_TESL)
 -    D(0xebe6, LAOG,    RSY_a, ILA, r3, a2, new, in2_r1, lao, nz64, MO_TEQ)
 +    D(0xebe6, LAOG,    RSY_a, ILA, r3, a2, new, in2_r1, lao, nz64, MO_TEUQ)
  /* LOAD AND TEST */
      C(0x1200, LTR,     RR_a,  Z,   0, r2_o, 0, cond_r1r2_32, mov2, s32)
      C(0xb902, LTGR,    RRE,   Z,   0, r2_o, 0, r1, mov2, s64)
@@ -XXX,XX +XXX,XX @@
      C(0xebe0, LOCFH,   RSY_b, LOC2, r1_sr32, m2_32u, new, r1_32h, loc, 0)
  /* LOAD PAIR DISJOINT */
      D(0xc804, LPD,     SSF,   ILA, 0, 0, new_P, r3_P32, lpd, 0, MO_TEUL)
 -    D(0xc805, LPDG,    SSF,   ILA, 0, 0, new_P, r3_P64, lpd, 0, MO_TEQ)
 +    D(0xc805, LPDG,    SSF,   ILA, 0, 0, new_P, r3_P64, lpd, 0, MO_TEUQ)
  /* LOAD PAIR FROM QUADWORD */
      C(0xe38f, LPQ,     RXY_a, Z,   0, a2, r1_P, 0, lpq, 0)
  /* LOAD POSITIVE */
@@ -XXX,XX +XXX,XX @@
  #ifndef CONFIG_USER_ONLY
  /* COMPARE AND SWAP AND PURGE */
      E(0xb250, CSP,     RRE,   Z,   r1_32u, ra2, r1_P, 0, csp, 0, MO_TEUL, IF_PRIV)
 -    E(0xb98a, CSPG,    RRE, DAT_ENH, r1_o, ra2, r1_P, 0, csp, 0, MO_TEQ, IF_PRIV)
 +    E(0xb98a, CSPG,    RRE, DAT_ENH, r1_o, ra2, r1_P, 0, csp, 0, MO_TEUQ, IF_PRIV)
  /* DIAGNOSE (KVM hypercall) */
      F(0x8300, DIAG,    RSI,   Z,   0, 0, 0, 0, diag, 0, IF_PRIV | IF_IO)
  /* INSERT STORAGE KEY EXTENDED */
@@ -XXX,XX +XXX,XX @@
      F(0xe303, LRAG,    RXY_a, Z,   0, a2, r1, 0, lra, 0, IF_PRIV)
  /* LOAD USING REAL ADDRESS */
      E(0xb24b, LURA,    RRE,   Z,   0, ra2, new, r1_32, lura, 0, MO_TEUL, IF_PRIV)
 -    E(0xb905, LURAG,   RRE,   Z,   0, ra2, r1, 0, lura, 0, MO_TEQ, IF_PRIV)
 +    E(0xb905, LURAG,   RRE,   Z,   0, ra2, r1, 0, lura, 0, MO_TEUQ, IF_PRIV)
  /* MOVE TO PRIMARY */
      F(0xda00, MVCP,    SS_d,  Z,   la1, a2, 0, 0, mvcp, 0, IF_PRIV)
  /* MOVE TO SECONDARY */
@@ -XXX,XX +XXX,XX @@
      F(0xad00, STOSM,   SI,    Z,   la1, 0, 0, 0, stnosm, 0, IF_PRIV)
  /* STORE USING REAL ADDRESS */
      E(0xb246, STURA,   RRE,   Z,   r1_o, ra2, 0, 0, stura, 0, MO_TEUL, IF_PRIV)
 -    E(0xb925, STURG,   RRE,   Z,   r1_o, ra2, 0, 0, stura, 0, MO_TEQ, IF_PRIV)
 +    E(0xb925, STURG,   RRE,   Z,   r1_o, ra2, 0, 0, stura, 0, MO_TEUQ, IF_PRIV)
  /* TEST BLOCK */
      F(0xb22c, TB,      RRE,   Z,   0, r2_o, 0, 0, testblock, 0, IF_PRIV)
  /* TEST PROTECTION */
 --
-.31.1
+.41.0

-[PULL 11/37] hw/riscv: virt: Allow support for 32 cores
+[PULL v2 34/45] hw/riscv: virt: Fix riscv,pmu DT node path
-From: Alistair Francis <alistair.francis@wdc.com>
+From: Conor Dooley <conor.dooley@microchip.com>
-Linux supports up to 32 cores for both 32-bit and 64-bit RISC-V, so
+On a dtb dumped from the virt machine, dt-validate complains:
-let's set that as the maximum for the virt board.
+soc: pmu: {'riscv,event-to-mhpmcounters': [[1, 1, 524281], [2, 2, 524284], [65561, 65561, 524280], [65563, 65563, 524280], [65569, 65569, 524280]], 'compatible': ['riscv,pmu']} should not be valid under {'type': 'object'}
         from schema $id: http://devicetree.org/schemas/simple-bus.yaml#
 That's pretty cryptic, but running the dtb back through dtc produces
 something a lot more reasonable:
 Warning (simple_bus_reg): /soc/pmu: missing or empty reg/ranges property
-Resolves: https://gitlab.com/qemu-project/qemu/-/issues/435
+Moving the riscv,pmu node out of the soc bus solves the problem.
 Signed-off-by: Conor Dooley <conor.dooley@microchip.com>
 Acked-by: Alistair Francis <alistair.francis@wdc.com>
 Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 Message-ID: <20230727-groom-decline-2c57ce42841c@spud>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
-Reviewed-by: Anup Patel <anup.patel@wdc.com>
-Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
-Reviewed-by: Bin Meng <bmeng.cn@gmail.com>
-Message-Id: <20220105213937.1113508-9-alistair.francis@opensource.wdc.com>
 ---
- include/hw/riscv/virt.h | 2 +-
+ hw/riscv/virt.c | 2 +-
 file changed, 1 insertion(+), 1 deletion(-)
-diff --git a/include/hw/riscv/virt.h b/include/hw/riscv/virt.h
+diff --git a/hw/riscv/virt.c b/hw/riscv/virt.c
 index XXXXXXX..XXXXXXX 100644
---- a/include/hw/riscv/virt.h
+--- a/hw/riscv/virt.c
-+++ b/include/hw/riscv/virt.h
++++ b/hw/riscv/virt.c
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ static void create_fdt_pmu(RISCVVirtState *s)
- #include "hw/block/flash.h"
+     MachineState *ms = MACHINE(s);
- #include "qom/object.h"
+     RISCVCPU hart = s->soc[0].harts[0];
--#define VIRT_CPUS_MAX 8
+-    pmu_name = g_strdup_printf("/soc/pmu");
-+#define VIRT_CPUS_MAX 32
++    pmu_name = g_strdup_printf("/pmu");
- #define VIRT_SOCKETS_MAX 8
+     qemu_fdt_add_subnode(ms->fdt, pmu_name);
+     qemu_fdt_setprop_string(ms->fdt, pmu_name, "compatible", "riscv,pmu");
- #define TYPE_RISCV_VIRT_MACHINE MACHINE_TYPE_NAME("virt")
+     riscv_pmu_generate_fdt_node(ms->fdt, hart.cfg.pmu_num, pmu_name);
 --
-.31.1
+.41.0

-[PULL 34/37] target/riscv: actual functions to realize crs 128-bit insns
+[PULL v2 35/45] target/riscv: Update CSR bits name for svadu extension
-From: Frédéric Pétrot <frederic.petrot@univ-grenoble-alpes.fr>
+From: Weiwei Li <liweiwei@iscas.ac.cn>
-The csrs are accessed through function pointers: we add 128-bit read
+The Svadu specification updated the name of the *envcfg bit from
-operations in the table for three csrs (writes fallback to the
+HADE to ADUE.
 -bit version as the upper 64-bit information is handled elsewhere):
 - misa, as mxl is needed for proper operation,
 - mstatus and sstatus, to return sd
 In addition, we also add read and write accesses to the machine and
 supervisor scratch registers.
-Signed-off-by: Frédéric Pétrot <frederic.petrot@univ-grenoble-alpes.fr>
+Signed-off-by: Weiwei Li <liweiwei@iscas.ac.cn>
-Co-authored-by: Fabien Portas <fabien.portas@grenoble-inp.org>
+Signed-off-by: Junqiang Wang <wangjunqiang@iscas.ac.cn>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Reviewed-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
-Message-id: 20220106210108.138226-19-frederic.petrot@univ-grenoble-alpes.fr
+Message-ID: <20230816141916.66898-1-liweiwei@iscas.ac.cn>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/cpu.h      |   7 ++
+ target/riscv/cpu_bits.h   |  8 ++++----
- target/riscv/cpu_bits.h |   3 +
+ target/riscv/cpu.c        |  4 ++--
- target/riscv/csr.c      | 195 +++++++++++++++++++++++++++++++++-------
+ target/riscv/cpu_helper.c |  6 +++---
-files changed, 175 insertions(+), 30 deletions(-)
+ target/riscv/csr.c        | 12 ++++++------
 files changed, 15 insertions(+), 15 deletions(-)
-diff --git a/target/riscv/cpu.h b/target/riscv/cpu.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/cpu.h
-+++ b/target/riscv/cpu.h
-@@ -XXX,XX +XXX,XX @@ RISCVException riscv_csrrw_i128(CPURISCVState *env, int csrno,
-                                 Int128 *ret_value,
-                                 Int128 new_value, Int128 write_mask);
-+typedef RISCVException (*riscv_csr_read128_fn)(CPURISCVState *env, int csrno,
-+                                               Int128 *ret_value);
-+typedef RISCVException (*riscv_csr_write128_fn)(CPURISCVState *env, int csrno,
-+                                             Int128 new_value);
-+
- typedef struct {
-     const char *name;
-     riscv_csr_predicate_fn predicate;
-     riscv_csr_read_fn read;
-     riscv_csr_write_fn write;
-     riscv_csr_op_fn op;
-+    riscv_csr_read128_fn read128;
-+    riscv_csr_write128_fn write128;
- } riscv_csr_operations;
- /* CSR function table constants */
 diff --git a/target/riscv/cpu_bits.h b/target/riscv/cpu_bits.h
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/cpu_bits.h
 +++ b/target/riscv/cpu_bits.h
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ typedef enum RISCVException {
+ #define MENVCFG_CBIE                       (3UL << 4)
- #define MSTATUS32_SD        0x80000000
+ #define MENVCFG_CBCFE                      BIT(6)
- #define MSTATUS64_SD        0x8000000000000000ULL
+ #define MENVCFG_CBZE                       BIT(7)
-+#define MSTATUSH128_SD      0x8000000000000000ULL
+-#define MENVCFG_HADE                       (1ULL << 61)
++#define MENVCFG_ADUE                       (1ULL << 61)
- #define MISA32_MXL          0xC0000000
+ #define MENVCFG_PBMTE                      (1ULL << 62)
- #define MISA64_MXL          0xC000000000000000ULL
+ #define MENVCFG_STCE                       (1ULL << 63)
-@@ -XXX,XX +XXX,XX @@ typedef enum {
- #define SSTATUS_SUM         0x00040000 /* since: priv-1.10 */
+ /* For RV32 */
- #define SSTATUS_MXR         0x00080000
+-#define MENVCFGH_HADE                      BIT(29)
++#define MENVCFGH_ADUE                      BIT(29)
-+#define SSTATUS64_UXL       0x0000000300000000ULL
+ #define MENVCFGH_PBMTE                     BIT(30)
-+
+ #define MENVCFGH_STCE                      BIT(31)
- #define SSTATUS32_SD        0x80000000
- #define SSTATUS64_SD        0x8000000000000000ULL
+@@ -XXX,XX +XXX,XX @@ typedef enum RISCVException {
  #define HENVCFG_CBIE                       MENVCFG_CBIE
  #define HENVCFG_CBCFE                      MENVCFG_CBCFE
  #define HENVCFG_CBZE                       MENVCFG_CBZE
 -#define HENVCFG_HADE                       MENVCFG_HADE
 +#define HENVCFG_ADUE                       MENVCFG_ADUE
  #define HENVCFG_PBMTE                      MENVCFG_PBMTE
  #define HENVCFG_STCE                       MENVCFG_STCE
  /* For RV32 */
 -#define HENVCFGH_HADE                       MENVCFGH_HADE
 +#define HENVCFGH_ADUE                       MENVCFGH_ADUE
  #define HENVCFGH_PBMTE                      MENVCFGH_PBMTE
  #define HENVCFGH_STCE                       MENVCFGH_STCE
 diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/cpu.c
 +++ b/target/riscv/cpu.c
@@ -XXX,XX +XXX,XX @@ static void riscv_cpu_reset_hold(Object *obj)
      env->two_stage_lookup = false;
      env->menvcfg = (cpu->cfg.ext_svpbmt ? MENVCFG_PBMTE : 0) |
 -                   (cpu->cfg.ext_svadu ? MENVCFG_HADE : 0);
 +                   (cpu->cfg.ext_svadu ? MENVCFG_ADUE : 0);
      env->henvcfg = (cpu->cfg.ext_svpbmt ? HENVCFG_PBMTE : 0) |
 -                   (cpu->cfg.ext_svadu ? HENVCFG_HADE : 0);
 +                   (cpu->cfg.ext_svadu ? HENVCFG_ADUE : 0);
      /* Initialized default priorities of local interrupts. */
      for (i = 0; i < ARRAY_SIZE(env->miprio); i++) {
 diff --git a/target/riscv/cpu_helper.c b/target/riscv/cpu_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/cpu_helper.c
 +++ b/target/riscv/cpu_helper.c
@@ -XXX,XX +XXX,XX @@ static int get_physical_address(CPURISCVState *env, hwaddr *physical,
      }
      bool pbmte = env->menvcfg & MENVCFG_PBMTE;
 -    bool hade = env->menvcfg & MENVCFG_HADE;
 +    bool adue = env->menvcfg & MENVCFG_ADUE;
      if (first_stage && two_stage && env->virt_enabled) {
          pbmte = pbmte && (env->henvcfg & HENVCFG_PBMTE);
 -        hade = hade && (env->henvcfg & HENVCFG_HADE);
 +        adue = adue && (env->henvcfg & HENVCFG_ADUE);
      }
      int ptshift = (levels - 1) * ptidxbits;
@@ -XXX,XX +XXX,XX @@ restart:
      /* Page table updates need to be atomic with MTTCG enabled */
      if (updated_pte != pte && !is_debug) {
 -        if (!hade) {
 +        if (!adue) {
              return TRANSLATE_FAIL;
          }
 diff --git a/target/riscv/csr.c b/target/riscv/csr.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/csr.c
 +++ b/target/riscv/csr.c
-@@ -XXX,XX +XXX,XX @@ static const target_ulong vs_delegable_excps = DELEGABLE_EXCPS &
+@@ -XXX,XX +XXX,XX @@ static RISCVException write_menvcfg(CPURISCVState *env, int csrno,
-       (1ULL << (RISCV_EXCP_STORE_GUEST_AMO_ACCESS_FAULT)));
+     if (riscv_cpu_mxl(env) == MXL_RV64) {
- static const target_ulong sstatus_v1_10_mask = SSTATUS_SIE | SSTATUS_SPIE |
+         mask |= (cfg->ext_svpbmt ? MENVCFG_PBMTE : 0) |
-     SSTATUS_UIE | SSTATUS_UPIE | SSTATUS_SPP | SSTATUS_FS | SSTATUS_XS |
+                 (cfg->ext_sstc ? MENVCFG_STCE : 0) |
--    SSTATUS_SUM | SSTATUS_MXR | SSTATUS_VS;
+-                (cfg->ext_svadu ? MENVCFG_HADE : 0);
-+    SSTATUS_SUM | SSTATUS_MXR | SSTATUS_VS | (target_ulong)SSTATUS64_UXL;
++                (cfg->ext_svadu ? MENVCFG_ADUE : 0);
  static const target_ulong sip_writable_mask = SIP_SSIP | MIP_USIP | MIP_UEIP;
  static const target_ulong hip_writable_mask = MIP_VSSIP;
  static const target_ulong hvip_writable_mask = MIP_VSSIP | MIP_VSTIP | MIP_VSEIP;
@@ -XXX,XX +XXX,XX @@ static uint64_t add_status_sd(RISCVMXL xl, uint64_t status)
              return status | MSTATUS32_SD;
          case MXL_RV64:
              return status | MSTATUS64_SD;
 +        case MXL_RV128:
 +            return MSTATUSH128_SD;
          default:
              g_assert_not_reached();
          }
@@ -XXX,XX +XXX,XX @@ static RISCVException write_mstatus(CPURISCVState *env, int csrno,
      mstatus = (mstatus & ~mask) | (val & mask);
 -    if (riscv_cpu_mxl(env) == MXL_RV64) {
 +    RISCVMXL xl = riscv_cpu_mxl(env);
 +    if (xl > MXL_RV32) {
          /* SXL and UXL fields are for now read only */
 -        mstatus = set_field(mstatus, MSTATUS64_SXL, MXL_RV64);
 -        mstatus = set_field(mstatus, MSTATUS64_UXL, MXL_RV64);
 +        mstatus = set_field(mstatus, MSTATUS64_SXL, xl);
 +        mstatus = set_field(mstatus, MSTATUS64_UXL, xl);
      }
-     env->mstatus = mstatus;
+     env->menvcfg = (env->menvcfg & ~mask) | (val & mask);
-@@ -XXX,XX +XXX,XX @@ static RISCVException write_mstatush(CPURISCVState *env, int csrno,
+@@ -XXX,XX +XXX,XX @@ static RISCVException write_menvcfgh(CPURISCVState *env, int csrno,
      const RISCVCPUConfig *cfg = riscv_cpu_cfg(env);
      uint64_t mask = (cfg->ext_svpbmt ? MENVCFG_PBMTE : 0) |
                      (cfg->ext_sstc ? MENVCFG_STCE : 0) |
 -                    (cfg->ext_svadu ? MENVCFG_HADE : 0);
 +                    (cfg->ext_svadu ? MENVCFG_ADUE : 0);
      uint64_t valh = (uint64_t)val << 32;
      env->menvcfg = (env->menvcfg & ~mask) | (valh & mask);
@@ -XXX,XX +XXX,XX @@ static RISCVException read_henvcfg(CPURISCVState *env, int csrno,
       * henvcfg.stce is read_only 0 when menvcfg.stce = 0
       * henvcfg.hade is read_only 0 when menvcfg.hade = 0
       */
 -    *val = env->henvcfg & (~(HENVCFG_PBMTE | HENVCFG_STCE | HENVCFG_HADE) |
 +    *val = env->henvcfg & (~(HENVCFG_PBMTE | HENVCFG_STCE | HENVCFG_ADUE) |
                             env->menvcfg);
      return RISCV_EXCP_NONE;
  }
+@@ -XXX,XX +XXX,XX @@ static RISCVException write_henvcfg(CPURISCVState *env, int csrno,
 +static RISCVException read_mstatus_i128(CPURISCVState *env, int csrno,
 +                                        Int128 *val)
 +{
 +    *val = int128_make128(env->mstatus, add_status_sd(MXL_RV128, env->mstatus));
 +    return RISCV_EXCP_NONE;
 +}
 +
 +static RISCVException read_misa_i128(CPURISCVState *env, int csrno,
 +                                     Int128 *val)
 +{
 +    *val = int128_make128(env->misa_ext, (uint64_t)MXL_RV128 << 62);
 +    return RISCV_EXCP_NONE;
 +}
 +
  static RISCVException read_misa(CPURISCVState *env, int csrno,
                                  target_ulong *val)
  {
@@ -XXX,XX +XXX,XX @@ static RISCVException write_mcounteren(CPURISCVState *env, int csrno,
  }
  /* Machine Trap Handling */
 +static RISCVException read_mscratch_i128(CPURISCVState *env, int csrno,
 +                                         Int128 *val)
 +{
 +    *val = int128_make128(env->mscratch, env->mscratchh);
 +    return RISCV_EXCP_NONE;
 +}
 +
 +static RISCVException write_mscratch_i128(CPURISCVState *env, int csrno,
 +                                          Int128 val)
 +{
 +    env->mscratch = int128_getlo(val);
 +    env->mscratchh = int128_gethi(val);
 +    return RISCV_EXCP_NONE;
 +}
 +
  static RISCVException read_mscratch(CPURISCVState *env, int csrno,
                                      target_ulong *val)
  {
@@ -XXX,XX +XXX,XX @@ static RISCVException rmw_mip(CPURISCVState *env, int csrno,
  }
  /* Supervisor Trap Setup */
 +static RISCVException read_sstatus_i128(CPURISCVState *env, int csrno,
 +                                        Int128 *val)
 +{
 +    uint64_t mask = sstatus_v1_10_mask;
 +    uint64_t sstatus = env->mstatus & mask;
 +
 +    *val = int128_make128(sstatus, add_status_sd(MXL_RV128, sstatus));
 +    return RISCV_EXCP_NONE;
 +}
 +
  static RISCVException read_sstatus(CPURISCVState *env, int csrno,
                                     target_ulong *val)
  {
@@ -XXX,XX +XXX,XX @@ static RISCVException write_scounteren(CPURISCVState *env, int csrno,
  }
  /* Supervisor Trap Handling */
 +static RISCVException read_sscratch_i128(CPURISCVState *env, int csrno,
 +                                         Int128 *val)
 +{
 +    *val = int128_make128(env->sscratch, env->sscratchh);
 +    return RISCV_EXCP_NONE;
 +}
 +
 +static RISCVException write_sscratch_i128(CPURISCVState *env, int csrno,
 +                                          Int128 val)
 +{
 +    env->sscratch = int128_getlo(val);
 +    env->sscratchh = int128_gethi(val);
 +    return RISCV_EXCP_NONE;
 +}
 +
  static RISCVException read_sscratch(CPURISCVState *env, int csrno,
                                      target_ulong *val)
  {
@@ -XXX,XX +XXX,XX @@ static RISCVException write_upmbase(CPURISCVState *env, int csrno,
   * csrrc  <->  riscv_csrrw(env, csrno, ret_value, 0, value);
   */
 -RISCVException riscv_csrrw(CPURISCVState *env, int csrno,
 -                           target_ulong *ret_value,
 -                           target_ulong new_value, target_ulong write_mask)
 +static inline RISCVException riscv_csrrw_check(CPURISCVState *env,
 +                                               int csrno,
 +                                               bool write_mask,
 +                                               RISCVCPU *cpu)
  {
 -    RISCVException ret;
 -    target_ulong old_value;
 -    RISCVCPU *cpu = env_archcpu(env);
 -    int read_only = get_field(csrno, 0xC00) == 3;
 -
      /* check privileges and return RISCV_EXCP_ILLEGAL_INST if check fails */
 +    int read_only = get_field(csrno, 0xC00) == 3;
  #if !defined(CONFIG_USER_ONLY)
      int effective_priv = env->priv;
@@ -XXX,XX +XXX,XX @@ RISCVException riscv_csrrw(CPURISCVState *env, int csrno,
      if (!csr_ops[csrno].predicate) {
          return RISCV_EXCP_ILLEGAL_INST;
      }
--    ret = csr_ops[csrno].predicate(env, csrno);
--    if (ret != RISCV_EXCP_NONE) {
+     if (riscv_cpu_mxl(env) == MXL_RV64) {
--        return ret;
+-        mask |= env->menvcfg & (HENVCFG_PBMTE | HENVCFG_STCE | HENVCFG_HADE);
--    }
++        mask |= env->menvcfg & (HENVCFG_PBMTE | HENVCFG_STCE | HENVCFG_ADUE);
-+
+     }
-+    return csr_ops[csrno].predicate(env, csrno);
-+}
+     env->henvcfg = (env->henvcfg & ~mask) | (val & mask);
-+
+@@ -XXX,XX +XXX,XX @@ static RISCVException read_henvcfgh(CPURISCVState *env, int csrno,
-+static RISCVException riscv_csrrw_do64(CPURISCVState *env, int csrno,
+         return ret;
-+                                       target_ulong *ret_value,
+     }
-+                                       target_ulong new_value,
-+                                       target_ulong write_mask)
+-    *val = (env->henvcfg & (~(HENVCFG_PBMTE | HENVCFG_STCE | HENVCFG_HADE) |
-+{
++    *val = (env->henvcfg & (~(HENVCFG_PBMTE | HENVCFG_STCE | HENVCFG_ADUE) |
-+    RISCVException ret;
+                             env->menvcfg)) >> 32;
 +    target_ulong old_value;
      /* execute combined read/write operation if it exists */
      if (csr_ops[csrno].op) {
@@ -XXX,XX +XXX,XX @@ RISCVException riscv_csrrw(CPURISCVState *env, int csrno,
      return RISCV_EXCP_NONE;
  }
+@@ -XXX,XX +XXX,XX @@ static RISCVException write_henvcfgh(CPURISCVState *env, int csrno,
--RISCVException riscv_csrrw_i128(CPURISCVState *env, int csrno,
+                                      target_ulong val)
 -                               Int128 *ret_value,
 -                               Int128 new_value, Int128 write_mask)
 +RISCVException riscv_csrrw(CPURISCVState *env, int csrno,
 +                           target_ulong *ret_value,
 +                           target_ulong new_value, target_ulong write_mask)
 +{
 +    RISCVCPU *cpu = env_archcpu(env);
 +
 +    RISCVException ret = riscv_csrrw_check(env, csrno, write_mask, cpu);
 +    if (ret != RISCV_EXCP_NONE) {
 +        return ret;
 +    }
 +
 +    return riscv_csrrw_do64(env, csrno, ret_value, new_value, write_mask);
 +}
 +
 +static RISCVException riscv_csrrw_do128(CPURISCVState *env, int csrno,
 +                                        Int128 *ret_value,
 +                                        Int128 new_value,
 +                                        Int128 write_mask)
  {
--    /* fall back to 64-bit version for now */
+     uint64_t mask = env->menvcfg & (HENVCFG_PBMTE | HENVCFG_STCE |
--    target_ulong ret_64;
+-                                    HENVCFG_HADE);
--    RISCVException ret = riscv_csrrw(env, csrno, &ret_64,
++                                    HENVCFG_ADUE);
--                                     int128_getlo(new_value),
+     uint64_t valh = (uint64_t)val << 32;
--                                     int128_getlo(write_mask));
+     RISCVException ret;
-+    RISCVException ret;
 +    Int128 old_value;
 +
 +    /* read old value */
 +    ret = csr_ops[csrno].read128(env, csrno, &old_value);
 +    if (ret != RISCV_EXCP_NONE) {
 +        return ret;
 +    }
 +
 +    /* write value if writable and write mask set, otherwise drop writes */
 +    if (int128_nz(write_mask)) {
 +        new_value = int128_or(int128_and(old_value, int128_not(write_mask)),
 +                              int128_and(new_value, write_mask));
 +        if (csr_ops[csrno].write128) {
 +            ret = csr_ops[csrno].write128(env, csrno, new_value);
 +            if (ret != RISCV_EXCP_NONE) {
 +                return ret;
 +            }
 +        } else if (csr_ops[csrno].write) {
 +            /* avoids having to write wrappers for all registers */
 +            ret = csr_ops[csrno].write(env, csrno, int128_getlo(new_value));
 +            if (ret != RISCV_EXCP_NONE) {
 +                return ret;
 +            }
 +        }
 +    }
 +    /* return old value */
      if (ret_value) {
 -        *ret_value = int128_make64(ret_64);
 +        *ret_value = old_value;
 +    }
 +
 +    return RISCV_EXCP_NONE;
 +}
 +
 +RISCVException riscv_csrrw_i128(CPURISCVState *env, int csrno,
 +                                Int128 *ret_value,
 +                                Int128 new_value, Int128 write_mask)
 +{
 +    RISCVException ret;
 +    RISCVCPU *cpu = env_archcpu(env);
 +
 +    ret = riscv_csrrw_check(env, csrno, int128_nz(write_mask), cpu);
 +    if (ret != RISCV_EXCP_NONE) {
 +        return ret;
      }
 +    if (csr_ops[csrno].read128) {
 +        return riscv_csrrw_do128(env, csrno, ret_value, new_value, write_mask);
 +    }
 +
 +    /*
 +     * Fall back to 64-bit version for now, if the 128-bit alternative isn't
 +     * at all defined.
 +     * Note, some CSRs don't need to extend to MXLEN (64 upper bits non
 +     * significant), for those, this fallback is correctly handling the accesses
 +     */
 +    target_ulong old_value;
 +    ret = riscv_csrrw_do64(env, csrno, &old_value,
 +                           int128_getlo(new_value),
 +                           int128_getlo(write_mask));
 +    if (ret == RISCV_EXCP_NONE && ret_value) {
 +        *ret_value = int128_make64(old_value);
 +    }
      return ret;
  }
@@ -XXX,XX +XXX,XX @@ riscv_csr_operations csr_ops[CSR_TABLE_SIZE] = {
      [CSR_MHARTID]   = { "mhartid",   any,   read_mhartid },
      /* Machine Trap Setup */
 -    [CSR_MSTATUS]     = { "mstatus",    any,   read_mstatus,     write_mstatus     },
 -    [CSR_MISA]        = { "misa",       any,   read_misa,        write_misa        },
 +    [CSR_MSTATUS]     = { "mstatus",    any,   read_mstatus,     write_mstatus, NULL,
 +                                               read_mstatus_i128                   },
 +    [CSR_MISA]        = { "misa",       any,   read_misa,        write_misa, NULL,
 +                                               read_misa_i128                      },
      [CSR_MIDELEG]     = { "mideleg",    any,   read_mideleg,     write_mideleg     },
      [CSR_MEDELEG]     = { "medeleg",    any,   read_medeleg,     write_medeleg     },
      [CSR_MIE]         = { "mie",        any,   read_mie,         write_mie         },
@@ -XXX,XX +XXX,XX @@ riscv_csr_operations csr_ops[CSR_TABLE_SIZE] = {
      [CSR_MSTATUSH]    = { "mstatush",   any32, read_mstatush,    write_mstatush    },
      /* Machine Trap Handling */
 -    [CSR_MSCRATCH] = { "mscratch", any,  read_mscratch, write_mscratch },
 +    [CSR_MSCRATCH] = { "mscratch", any,  read_mscratch,      write_mscratch, NULL,
 +                                         read_mscratch_i128, write_mscratch_i128   },
      [CSR_MEPC]     = { "mepc",     any,  read_mepc,     write_mepc     },
      [CSR_MCAUSE]   = { "mcause",   any,  read_mcause,   write_mcause   },
      [CSR_MTVAL]    = { "mtval",    any,  read_mtval,    write_mtval    },
      [CSR_MIP]      = { "mip",      any,  NULL,    NULL, rmw_mip        },
      /* Supervisor Trap Setup */
 -    [CSR_SSTATUS]    = { "sstatus",    smode, read_sstatus,    write_sstatus    },
 +    [CSR_SSTATUS]    = { "sstatus",    smode, read_sstatus,    write_sstatus, NULL,
 +                                              read_sstatus_i128                 },
      [CSR_SIE]        = { "sie",        smode, read_sie,        write_sie        },
      [CSR_STVEC]      = { "stvec",      smode, read_stvec,      write_stvec      },
      [CSR_SCOUNTEREN] = { "scounteren", smode, read_scounteren, write_scounteren },
      /* Supervisor Trap Handling */
 -    [CSR_SSCRATCH] = { "sscratch", smode, read_sscratch, write_sscratch },
 +    [CSR_SSCRATCH] = { "sscratch", smode, read_sscratch, write_sscratch, NULL,
 +                                          read_sscratch_i128, write_sscratch_i128  },
      [CSR_SEPC]     = { "sepc",     smode, read_sepc,     write_sepc     },
      [CSR_SCAUSE]   = { "scause",   smode, read_scause,   write_scause   },
      [CSR_STVAL]    = { "stval",    smode, read_stval,   write_stval   },
 --
-.31.1
+.41.0

-[PULL 23/37] target/riscv: setup everything for rv64 to support rv128 execution
+[PULL v2 36/45] target/riscv: fix satp_mode_finalize() when satp_mode.supported = 0
-From: Frédéric Pétrot <frederic.petrot@univ-grenoble-alpes.fr>
+From: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
-This patch adds the support of the '-cpu rv128' option to
+In the same emulated RISC-V host, the 'host' KVM CPU takes 4 times
-qemu-system-riscv64 so that we can indicate that we want to run rv128
+longer to boot than the 'rv64' KVM CPU.
 executables.
 Still, there is no support for 128-bit insns at that stage so qemu fails
 miserably (as expected) if launched with this option.
-Signed-off-by: Frédéric Pétrot <frederic.petrot@univ-grenoble-alpes.fr>
+The reason is an unintended behavior of riscv_cpu_satp_mode_finalize()
-Co-authored-by: Fabien Portas <fabien.portas@grenoble-inp.org>
+when satp_mode.supported = 0, i.e. when cpu_init() does not set
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+satp_mode_max_supported(). satp_mode_max_from_map(map) does:
-Message-id: 20220106210108.138226-8-frederic.petrot@univ-grenoble-alpes.fr
-[ Changed by AF
+- __builtin_clz(map)
- - Rename CPU to "x-rv128"
-]
+This means that, if satp_mode.supported = 0, satp_mode_supported_max
 wil be '31 - 32'. But this is C, so satp_mode_supported_max will gladly
 set it to UINT_MAX (4294967295). After that, if the user didn't set a
 satp_mode, set_satp_mode_default_map(cpu) will make
 cfg.satp_mode.map = cfg.satp_mode.supported
 So satp_mode.map = 0. And then satp_mode_map_max will be set to
 satp_mode_max_from_map(cpu->cfg.satp_mode.map), i.e. also UINT_MAX. The
 guard "satp_mode_map_max > satp_mode_supported_max" doesn't protect us
 here since both are UINT_MAX.
 And finally we have 2 loops:
         for (int i = satp_mode_map_max - 1; i >= 0; --i) {
 Which are, in fact, 2 loops from UINT_MAX -1 to -1. This is where the
 extra delay when booting the 'host' CPU is coming from.
 Commit 43d1de32f8 already set a precedence for satp_mode.supported = 0
 in a different manner. We're doing the same here. If supported == 0,
 interpret as 'the CPU wants the OS to handle satp mode alone' and skip
 satp_mode_finalize().
 We'll also put a guard in satp_mode_max_from_map() to assert out if map
 is 0 since the function is not ready to deal with it.
 Cc: Alexandre Ghiti <alexghiti@rivosinc.com>
 Fixes: 6f23aaeb9b ("riscv: Allow user to set the satp mode")
 Signed-off-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 Reviewed-by: Andrew Jones <ajones@ventanamicro.com>
 Message-ID: <20230817152903.694926-1-dbarboza@ventanamicro.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- include/disas/dis-asm.h |  1 +
+ target/riscv/cpu.c | 23 ++++++++++++++++++++---
- target/riscv/cpu.h      |  1 +
+file changed, 20 insertions(+), 3 deletions(-)
  disas/riscv.c           |  5 +++++
  target/riscv/cpu.c      | 20 ++++++++++++++++++++
  target/riscv/gdbstub.c  |  5 +++++
 files changed, 32 insertions(+)
-diff --git a/include/disas/dis-asm.h b/include/disas/dis-asm.h
-index XXXXXXX..XXXXXXX 100644
---- a/include/disas/dis-asm.h
-+++ b/include/disas/dis-asm.h
-@@ -XXX,XX +XXX,XX @@ int print_insn_nios2(bfd_vma, disassemble_info*);
- int print_insn_xtensa           (bfd_vma, disassemble_info*);
- int print_insn_riscv32          (bfd_vma, disassemble_info*);
- int print_insn_riscv64          (bfd_vma, disassemble_info*);
-+int print_insn_riscv128         (bfd_vma, disassemble_info*);
- int print_insn_rx(bfd_vma, disassemble_info *);
- int print_insn_hexagon(bfd_vma, disassemble_info *);
-diff --git a/target/riscv/cpu.h b/target/riscv/cpu.h
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/cpu.h
-+++ b/target/riscv/cpu.h
-@@ -XXX,XX +XXX,XX @@
- #define TYPE_RISCV_CPU_ANY              RISCV_CPU_TYPE_NAME("any")
- #define TYPE_RISCV_CPU_BASE32           RISCV_CPU_TYPE_NAME("rv32")
- #define TYPE_RISCV_CPU_BASE64           RISCV_CPU_TYPE_NAME("rv64")
-+#define TYPE_RISCV_CPU_BASE128          RISCV_CPU_TYPE_NAME("x-rv128")
- #define TYPE_RISCV_CPU_IBEX             RISCV_CPU_TYPE_NAME("lowrisc-ibex")
- #define TYPE_RISCV_CPU_SHAKTI_C         RISCV_CPU_TYPE_NAME("shakti-c")
- #define TYPE_RISCV_CPU_SIFIVE_E31       RISCV_CPU_TYPE_NAME("sifive-e31")
-diff --git a/disas/riscv.c b/disas/riscv.c
-index XXXXXXX..XXXXXXX 100644
---- a/disas/riscv.c
-+++ b/disas/riscv.c
-@@ -XXX,XX +XXX,XX @@ int print_insn_riscv64(bfd_vma memaddr, struct disassemble_info *info)
- {
-     return print_insn_riscv(memaddr, info, rv64);
- }
-+
-+int print_insn_riscv128(bfd_vma memaddr, struct disassemble_info *info)
-+{
-+    return print_insn_riscv(memaddr, info, rv128);
-+}
 diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/cpu.c
 +++ b/target/riscv/cpu.c
-@@ -XXX,XX +XXX,XX @@ static void rv64_sifive_e_cpu_init(Object *obj)
+@@ -XXX,XX +XXX,XX @@ static uint8_t satp_mode_from_str(const char *satp_mode_str)
-     set_priv_version(env, PRIV_VERSION_1_10_0);
-     qdev_prop_set_bit(DEVICE(obj), "mmu", false);
+ uint8_t satp_mode_max_from_map(uint32_t map)
  {
 +    /*
 +     * 'map = 0' will make us return (31 - 32), which C will
 +     * happily overflow to UINT_MAX. There's no good result to
 +     * return if 'map = 0' (e.g. returning 0 will be ambiguous
 +     * with the result for 'map = 1').
 +     *
 +     * Assert out if map = 0. Callers will have to deal with
 +     * it outside of this function.
 +     */
 +    g_assert(map > 0);
 +
      /* map here has at least one bit set, so no problem with clz */
      return 31 - __builtin_clz(map);
  }
+@@ -XXX,XX +XXX,XX @@ void riscv_cpu_validate_set_extensions(RISCVCPU *cpu, Error **errp)
+ static void riscv_cpu_satp_mode_finalize(RISCVCPU *cpu, Error **errp)
+ {
+     bool rv32 = riscv_cpu_mxl(&cpu->env) == MXL_RV32;
+-    uint8_t satp_mode_map_max;
+-    uint8_t satp_mode_supported_max =
+-                        satp_mode_max_from_map(cpu->cfg.satp_mode.supported);
++    uint8_t satp_mode_map_max, satp_mode_supported_max;
 +
-+static void rv128_base_cpu_init(Object *obj)
++    /* The CPU wants the OS to decide which satp mode to use */
-+{
++    if (cpu->cfg.satp_mode.supported == 0) {
-+    if (qemu_tcg_mttcg_enabled()) {
++        return;
 +        /* Missing 128-bit aligned atomics */
 +        error_report("128-bit RISC-V currently does not work with Multi "
 +                     "Threaded TCG. Please use: -accel tcg,thread=single");
 +        exit(EXIT_FAILURE);
 +    }
 +    CPURISCVState *env = &RISCV_CPU(obj)->env;
 +    /* We set this in the realise function */
 +    set_misa(env, MXL_RV128, 0);
 +}
  #else
  static void rv32_base_cpu_init(Object *obj)
  {
@@ -XXX,XX +XXX,XX @@ static void riscv_cpu_disas_set_info(CPUState *s, disassemble_info *info)
      case MXL_RV64:
          info->print_insn = print_insn_riscv64;
          break;
 +    case MXL_RV128:
 +        info->print_insn = print_insn_riscv128;
 +        break;
      default:
          g_assert_not_reached();
      }
@@ -XXX,XX +XXX,XX @@ static void riscv_cpu_realize(DeviceState *dev, Error **errp)
  #ifdef TARGET_RISCV64
      case MXL_RV64:
          break;
 +    case MXL_RV128:
 +        break;
  #endif
      case MXL_RV32:
          break;
@@ -XXX,XX +XXX,XX @@ static gchar *riscv_gdb_arch_name(CPUState *cs)
      case MXL_RV32:
          return g_strdup("riscv:rv32");
      case MXL_RV64:
 +    case MXL_RV128:
          return g_strdup("riscv:rv64");
      default:
          g_assert_not_reached();
@@ -XXX,XX +XXX,XX @@ static const TypeInfo riscv_cpu_type_infos[] = {
      DEFINE_CPU(TYPE_RISCV_CPU_SIFIVE_E51,       rv64_sifive_e_cpu_init),
      DEFINE_CPU(TYPE_RISCV_CPU_SIFIVE_U54,       rv64_sifive_u_cpu_init),
      DEFINE_CPU(TYPE_RISCV_CPU_SHAKTI_C,         rv64_sifive_u_cpu_init),
 +    DEFINE_CPU(TYPE_RISCV_CPU_BASE128,          rv128_base_cpu_init),
  #endif
  };
 diff --git a/target/riscv/gdbstub.c b/target/riscv/gdbstub.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/gdbstub.c
 +++ b/target/riscv/gdbstub.c
@@ -XXX,XX +XXX,XX @@ static int riscv_gen_dynamic_csr_xml(CPUState *cs, int base_reg)
      int bitsize = 16 << env->misa_mxl_max;
      int i;
 +    /* Until gdb knows about 128-bit registers */
 +    if (bitsize > 64) {
 +        bitsize = 64;
 +    }
 +
-     g_string_printf(s, "<?xml version=\"1.0\"?>");
++    satp_mode_supported_max =
-     g_string_append_printf(s, "<!DOCTYPE feature SYSTEM \"gdb-target.dtd\">");
++                    satp_mode_max_from_map(cpu->cfg.satp_mode.supported);
-     g_string_append_printf(s, "<feature name=\"org.gnu.gdb.riscv.csr\">");
      if (cpu->cfg.satp_mode.map == 0) {
          if (cpu->cfg.satp_mode.init == 0) {
 --
-.31.1
+.41.0

-[PULL 08/37] target/riscv: Mark the Hypervisor extension as non experimental
+[PULL v2 37/45] riscv: zicond: make non-experimental
-From: Alistair Francis <alistair.francis@wdc.com>
+From: Vineet Gupta <vineetg@rivosinc.com>
-The Hypervisor spec is now frozen, so remove the experimental tag.
+zicond is now codegen supported in both llvm and gcc.
+This change allows seamless enabling/testing of zicond in downstream
+projects. e.g. currently riscv-gnu-toolchain parses elf attributes
+to create a cmdline for qemu but fails short of enabling it because of
+the "x-" prefix.
+Signed-off-by: Vineet Gupta <vineetg@rivosinc.com>
+Message-ID: <20230808181715.436395-1-vineetg@rivosinc.com>
+Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
-Reviewed-by: Anup Patel <anup.patel@wdc.com>
-Reviewed-by: Bin Meng <bmeng.cn@gmail.com>
-Message-Id: <20220105213937.1113508-6-alistair.francis@opensource.wdc.com>
 ---
  target/riscv/cpu.c | 2 +-
 file changed, 1 insertion(+), 1 deletion(-)
 diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/cpu.c
 +++ b/target/riscv/cpu.c
-@@ -XXX,XX +XXX,XX @@ static Property riscv_cpu_properties[] = {
+@@ -XXX,XX +XXX,XX @@ static Property riscv_cpu_extensions[] = {
-     DEFINE_PROP_BOOL("s", RISCVCPU, cfg.ext_s, true),
+     DEFINE_PROP_BOOL("zcf", RISCVCPU, cfg.ext_zcf, false),
-     DEFINE_PROP_BOOL("u", RISCVCPU, cfg.ext_u, true),
+     DEFINE_PROP_BOOL("zcmp", RISCVCPU, cfg.ext_zcmp, false),
-     DEFINE_PROP_BOOL("v", RISCVCPU, cfg.ext_v, false),
+     DEFINE_PROP_BOOL("zcmt", RISCVCPU, cfg.ext_zcmt, false),
-+    DEFINE_PROP_BOOL("h", RISCVCPU, cfg.ext_h, false),
++    DEFINE_PROP_BOOL("zicond", RISCVCPU, cfg.ext_zicond, false),
-     DEFINE_PROP_BOOL("Counters", RISCVCPU, cfg.ext_counters, true),
-     DEFINE_PROP_BOOL("Zifencei", RISCVCPU, cfg.ext_ifencei, true),
+     /* Vendor-specific custom extensions */
-     DEFINE_PROP_BOOL("Zicsr", RISCVCPU, cfg.ext_icsr, true),
+     DEFINE_PROP_BOOL("xtheadba", RISCVCPU, cfg.ext_xtheadba, false),
-@@ -XXX,XX +XXX,XX @@ static Property riscv_cpu_properties[] = {
+@@ -XXX,XX +XXX,XX @@ static Property riscv_cpu_extensions[] = {
-     DEFINE_PROP_BOOL("zbb", RISCVCPU, cfg.ext_zbb, true),
+     DEFINE_PROP_BOOL("xventanacondops", RISCVCPU, cfg.ext_XVentanaCondOps, false),
-     DEFINE_PROP_BOOL("zbc", RISCVCPU, cfg.ext_zbc, true),
-     DEFINE_PROP_BOOL("zbs", RISCVCPU, cfg.ext_zbs, true),
+     /* These are experimental so mark with 'x-' */
--    DEFINE_PROP_BOOL("x-h", RISCVCPU, cfg.ext_h, false),
+-    DEFINE_PROP_BOOL("x-zicond", RISCVCPU, cfg.ext_zicond, false),
-     DEFINE_PROP_BOOL("x-j", RISCVCPU, cfg.ext_j, false),
      /* ePMP 0.9.3 */
      DEFINE_PROP_BOOL("x-epmp", RISCVCPU, cfg.epmp, false),
 --
-.31.1
+.41.0

-[PULL 06/37] hw/intc: sifive_plic: Cleanup the read function
+[PULL v2 38/45] hw/riscv/virt.c: fix non-KVM --enable-debug build
-From: Alistair Francis <alistair.francis@wdc.com>
+From: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
+A build with --enable-debug and without KVM will fail as follows:
+/usr/bin/ld: libqemu-riscv64-softmmu.fa.p/hw_riscv_virt.c.o: in function `virt_machine_init':
+./qemu/build/../hw/riscv/virt.c:1465: undefined reference to `kvm_riscv_aia_create'
+This happens because the code block with "if virt_use_kvm_aia(s)" isn't
+being ignored by the debug build, resulting in an undefined reference to
+a KVM only function.
+Add a 'kvm_enabled()' conditional together with virt_use_kvm_aia() will
+make the compiler crop the kvm_riscv_aia_create() call entirely from a
+non-KVM build. Note that adding the 'kvm_enabled()' conditional inside
+virt_use_kvm_aia() won't fix the build because this function would need
+to be inlined multiple times to make the compiler zero out the entire
+block.
+While we're at it, use kvm_enabled() in all instances where
+virt_use_kvm_aia() is checked to allow the compiler to elide these other
+kvm-only instances as well.
+Suggested-by: Richard Henderson <richard.henderson@linaro.org>
+Fixes: dbdb99948e ("target/riscv: select KVM AIA in riscv virt machine")
+Signed-off-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
+Reviewed-by: Andrew Jones <ajones@ventanamicro.com>
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+Message-ID: <20230830133503.711138-2-dbarboza@ventanamicro.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
-Reviewed-by: Bin Meng <bmeng.cn@gmail.com>
-Message-Id: <20220105213937.1113508-4-alistair.francis@opensource.wdc.com>
 ---
- hw/intc/sifive_plic.c | 55 +++++++++----------------------------------
+ hw/riscv/virt.c | 6 +++---
-file changed, 11 insertions(+), 44 deletions(-)
+file changed, 3 insertions(+), 3 deletions(-)
-diff --git a/hw/intc/sifive_plic.c b/hw/intc/sifive_plic.c
+diff --git a/hw/riscv/virt.c b/hw/riscv/virt.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/intc/sifive_plic.c
+--- a/hw/riscv/virt.c
-+++ b/hw/intc/sifive_plic.c
++++ b/hw/riscv/virt.c
-@@ -XXX,XX +XXX,XX @@ static uint64_t sifive_plic_read(void *opaque, hwaddr addr, unsigned size)
+@@ -XXX,XX +XXX,XX @@ static void create_fdt_sockets(RISCVVirtState *s, const MemMapEntry *memmap,
- {
+     }
-     SiFivePLICState *plic = opaque;
+     /* KVM AIA only has one APLIC instance */
--    /* writes must be 4 byte words */
+-    if (virt_use_kvm_aia(s)) {
--    if ((addr & 0x3) != 0) {
++    if (kvm_enabled() && virt_use_kvm_aia(s)) {
--        goto err;
+         create_fdt_socket_aplic(s, memmap, 0,
--    }
+                                 msi_m_phandle, msi_s_phandle, phandle,
--
+                                 &intc_phandles[0], xplic_phandles,
--    if (addr >= plic->priority_base && /* 4 bytes per source */
+@@ -XXX,XX +XXX,XX @@ static void create_fdt_sockets(RISCVVirtState *s, const MemMapEntry *memmap,
--        addr < plic->priority_base + (plic->num_sources << 2))
--    {
+     g_free(intc_phandles);
-+    if (addr_between(addr, plic->priority_base, plic->num_sources << 2)) {
-         uint32_t irq = ((addr - plic->priority_base) >> 2) + 1;
+-    if (virt_use_kvm_aia(s)) {
--        if (RISCV_DEBUG_PLIC) {
++    if (kvm_enabled() && virt_use_kvm_aia(s)) {
--            qemu_log("plic: read priority: irq=%d priority=%d\n",
+         *irq_mmio_phandle = xplic_phandles[0];
--                irq, plic->source_priority[irq]);
+         *irq_virtio_phandle = xplic_phandles[0];
--        }
+         *irq_pcie_phandle = xplic_phandles[0];
-+
+@@ -XXX,XX +XXX,XX @@ static void virt_machine_init(MachineState *machine)
          return plic->source_priority[irq];
 -    } else if (addr >= plic->pending_base && /* 1 bit per source */
 -               addr < plic->pending_base + (plic->num_sources >> 3))
 -    {
 +    } else if (addr_between(addr, plic->pending_base, plic->num_sources >> 3)) {
          uint32_t word = (addr - plic->pending_base) >> 2;
 -        if (RISCV_DEBUG_PLIC) {
 -            qemu_log("plic: read pending: word=%d value=%d\n",
 -                word, plic->pending[word]);
 -        }
 +
          return plic->pending[word];
 -    } else if (addr >= plic->enable_base && /* 1 bit per source */
 -             addr < plic->enable_base + plic->num_addrs * plic->enable_stride)
 -    {
 +    } else if (addr_between(addr, plic->enable_base,
 +                            plic->num_addrs * plic->enable_stride)) {
          uint32_t addrid = (addr - plic->enable_base) / plic->enable_stride;
          uint32_t wordid = (addr & (plic->enable_stride - 1)) >> 2;
 +
          if (wordid < plic->bitfield_words) {
 -            if (RISCV_DEBUG_PLIC) {
 -                qemu_log("plic: read enable: hart%d-%c word=%d value=%x\n",
 -                    plic->addr_config[addrid].hartid,
 -                    mode_to_char(plic->addr_config[addrid].mode), wordid,
 -                    plic->enable[addrid * plic->bitfield_words + wordid]);
 -            }
              return plic->enable[addrid * plic->bitfield_words + wordid];
          }
 -    } else if (addr >= plic->context_base && /* 1 bit per source */
 -             addr < plic->context_base + plic->num_addrs * plic->context_stride)
 -    {
 +    } else if (addr_between(addr, plic->context_base,
 +                            plic->num_addrs * plic->context_stride)) {
          uint32_t addrid = (addr - plic->context_base) / plic->context_stride;
          uint32_t contextid = (addr & (plic->context_stride - 1));
 +
          if (contextid == 0) {
 -            if (RISCV_DEBUG_PLIC) {
 -                qemu_log("plic: read priority: hart%d-%c priority=%x\n",
 -                    plic->addr_config[addrid].hartid,
 -                    mode_to_char(plic->addr_config[addrid].mode),
 -                    plic->target_priority[addrid]);
 -            }
              return plic->target_priority[addrid];
          } else if (contextid == 4) {
              uint32_t value = sifive_plic_claim(plic, addrid);
 -            if (RISCV_DEBUG_PLIC) {
 -                qemu_log("plic: read claim: hart%d-%c irq=%x\n",
 -                    plic->addr_config[addrid].hartid,
 -                    mode_to_char(plic->addr_config[addrid].mode),
 -                    value);
 -            }
 +
              sifive_plic_update(plic);
              return value;
          }
      }
--err:
+-    if (virt_use_kvm_aia(s)) {
-     qemu_log_mask(LOG_GUEST_ERROR,
++    if (kvm_enabled() && virt_use_kvm_aia(s)) {
-                   "%s: Invalid register read 0x%" HWADDR_PRIx "\n",
+         kvm_riscv_aia_create(machine, IMSIC_MMIO_GROUP_MIN_SHIFT,
-                   __func__, addr);
+                              VIRT_IRQCHIP_NUM_SOURCES, VIRT_IRQCHIP_NUM_MSIS,
                               memmap[VIRT_APLIC_S].base,
 --
-.31.1
+.41.0

-[PULL 27/37] target/riscv: support for 128-bit U-type instructions
+[PULL v2 39/45] hw/intc/riscv_aplic.c fix non-KVM --enable-debug build
-From: Frédéric Pétrot <frederic.petrot@univ-grenoble-alpes.fr>
+From: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
-Adding the 128-bit version of lui and auipc, and introducing to that end
+Commit 6df0b37e2ab breaks a --enable-debug build in a non-KVM
-a "set register with immediat" function to handle extension on 128 bits.
+environment with the following error:
-Signed-off-by: Frédéric Pétrot <frederic.petrot@univ-grenoble-alpes.fr>
+/usr/bin/ld: libqemu-riscv64-softmmu.fa.p/hw_intc_riscv_aplic.c.o: in function `riscv_kvm_aplic_request':
-Co-authored-by: Fabien Portas <fabien.portas@grenoble-inp.org>
+./qemu/build/../hw/intc/riscv_aplic.c:486: undefined reference to `kvm_set_irq'
 collect2: error: ld returned 1 exit status
 This happens because the debug build will poke into the
 'if (is_kvm_aia(aplic->msimode))' block and fail to find a reference to
 the KVM only function riscv_kvm_aplic_request().
 There are multiple solutions to fix this. We'll go with the same
 solution from the previous patch, i.e. add a kvm_enabled() conditional
 to filter out the block. But there's a catch: riscv_kvm_aplic_request()
 is a local function that would end up being used if the compiler crops
 the block, and this won't work. Quoting Richard Henderson's explanation
 in [1]:
 "(...) the compiler won't eliminate entire unused functions with -O0"
 We'll solve it by moving riscv_kvm_aplic_request() to kvm.c and add its
 declaration in kvm_riscv.h, where all other KVM specific public
 functions are already declared. Other archs handles KVM specific code in
 this manner and we expect to do the same from now on.
 [1] https://lore.kernel.org/qemu-riscv/d2f1ad02-eb03-138f-9d08-db676deeed05@linaro.org/
 Signed-off-by: Daniel Henrique Barboza <dbarboza@ventanamicro.com>
 Reviewed-by: Andrew Jones <ajones@ventanamicro.com>
 Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Message-ID: <20230830133503.711138-3-dbarboza@ventanamicro.com>
 Message-id: 20220106210108.138226-12-frederic.petrot@univ-grenoble-alpes.fr
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/translate.c                | 21 +++++++++++++++++++++
+ target/riscv/kvm_riscv.h | 1 +
- target/riscv/insn_trans/trans_rvi.c.inc |  8 ++++----
+ hw/intc/riscv_aplic.c    | 8 ++------
-files changed, 25 insertions(+), 4 deletions(-)
+ target/riscv/kvm.c       | 5 +++++
 files changed, 8 insertions(+), 6 deletions(-)
-diff --git a/target/riscv/translate.c b/target/riscv/translate.c
+diff --git a/target/riscv/kvm_riscv.h b/target/riscv/kvm_riscv.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/translate.c
+--- a/target/riscv/kvm_riscv.h
-+++ b/target/riscv/translate.c
++++ b/target/riscv/kvm_riscv.h
-@@ -XXX,XX +XXX,XX @@ static void gen_set_gpr(DisasContext *ctx, int reg_num, TCGv t)
+@@ -XXX,XX +XXX,XX @@ void kvm_riscv_aia_create(MachineState *machine, uint64_t group_shift,
-     }
+                           uint64_t aia_irq_num, uint64_t aia_msi_num,
                            uint64_t aplic_base, uint64_t imsic_base,
                            uint64_t guest_num);
 +void riscv_kvm_aplic_request(void *opaque, int irq, int level);
  #endif
 diff --git a/hw/intc/riscv_aplic.c b/hw/intc/riscv_aplic.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/intc/riscv_aplic.c
 +++ b/hw/intc/riscv_aplic.c
@@ -XXX,XX +XXX,XX @@
  #include "target/riscv/cpu.h"
  #include "sysemu/sysemu.h"
  #include "sysemu/kvm.h"
 +#include "kvm_riscv.h"
  #include "migration/vmstate.h"
  #define APLIC_MAX_IDC                  (1UL << 14)
@@ -XXX,XX +XXX,XX @@ static uint32_t riscv_aplic_idc_claimi(RISCVAPLICState *aplic, uint32_t idc)
      return topi;
  }
-+static void gen_set_gpri(DisasContext *ctx, int reg_num, target_long imm)
+-static void riscv_kvm_aplic_request(void *opaque, int irq, int level)
 -{
 -    kvm_set_irq(kvm_state, irq, !!level);
 -}
 -
  static void riscv_aplic_request(void *opaque, int irq, int level)
  {
      bool update = false;
@@ -XXX,XX +XXX,XX @@ static void riscv_aplic_realize(DeviceState *dev, Error **errp)
       * have IRQ lines delegated by their parent APLIC.
       */
      if (!aplic->parent) {
 -        if (is_kvm_aia(aplic->msimode)) {
 +        if (kvm_enabled() && is_kvm_aia(aplic->msimode)) {
              qdev_init_gpio_in(dev, riscv_kvm_aplic_request, aplic->num_irqs);
          } else {
              qdev_init_gpio_in(dev, riscv_aplic_request, aplic->num_irqs);
 diff --git a/target/riscv/kvm.c b/target/riscv/kvm.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/kvm.c
 +++ b/target/riscv/kvm.c
@@ -XXX,XX +XXX,XX @@
  #include "sysemu/runstate.h"
  #include "hw/riscv/numa.h"
 +void riscv_kvm_aplic_request(void *opaque, int irq, int level)
 +{
-+    if (reg_num != 0) {
++    kvm_set_irq(kvm_state, irq, !!level);
 +        switch (get_ol(ctx)) {
 +        case MXL_RV32:
 +            tcg_gen_movi_tl(cpu_gpr[reg_num], (int32_t)imm);
 +            break;
 +        case MXL_RV64:
 +        case MXL_RV128:
 +            tcg_gen_movi_tl(cpu_gpr[reg_num], imm);
 +            break;
 +        default:
 +            g_assert_not_reached();
 +        }
 +
 +        if (get_xl_max(ctx) == MXL_RV128) {
 +            tcg_gen_movi_tl(cpu_gprh[reg_num], -(imm < 0));
 +        }
 +    }
 +}
 +
- static void gen_set_gpr128(DisasContext *ctx, int reg_num, TCGv rl, TCGv rh)
+ static uint64_t kvm_riscv_reg_id(CPURISCVState *env, uint64_t type,
                                   uint64_t idx)
  {
-     assert(get_ol(ctx) == MXL_RV128);
-diff --git a/target/riscv/insn_trans/trans_rvi.c.inc b/target/riscv/insn_trans/trans_rvi.c.inc
-index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/insn_trans/trans_rvi.c.inc
-+++ b/target/riscv/insn_trans/trans_rvi.c.inc
-@@ -XXX,XX +XXX,XX @@ static bool trans_illegal(DisasContext *ctx, arg_empty *a)
- static bool trans_c64_illegal(DisasContext *ctx, arg_empty *a)
- {
--     REQUIRE_64BIT(ctx);
--     return trans_illegal(ctx, a);
-+    REQUIRE_64_OR_128BIT(ctx);
-+    return trans_illegal(ctx, a);
- }
- static bool trans_lui(DisasContext *ctx, arg_lui *a)
- {
-     if (a->rd != 0) {
--        tcg_gen_movi_tl(cpu_gpr[a->rd], a->imm);
-+        gen_set_gpri(ctx, a->rd, a->imm);
-     }
-     return true;
- }
-@@ -XXX,XX +XXX,XX @@ static bool trans_lui(DisasContext *ctx, arg_lui *a)
- static bool trans_auipc(DisasContext *ctx, arg_auipc *a)
- {
-     if (a->rd != 0) {
--        tcg_gen_movi_tl(cpu_gpr[a->rd], a->imm + ctx->base.pc_next);
-+        gen_set_gpri(ctx, a->rd, a->imm + ctx->base.pc_next);
-     }
-     return true;
- }
 --
-.31.1
+.41.0

-[PULL 18/37] exec/memop: Adding signed quad and octo defines
+[PULL v2 40/45] linux-user/riscv: Add new extensions to hwprobe
-From: Frédéric Pétrot <frederic.petrot@univ-grenoble-alpes.fr>
+From: Robbin Ehn <rehn@rivosinc.com>
-Adding defines to handle signed 64-bit and unsigned 128-bit quantities in
+This patch adds the new extensions in
-memory accesses.
+linux 6.5 to the hwprobe syscall.
-Signed-off-by: Frédéric Pétrot <frederic.petrot@univ-grenoble-alpes.fr>
+And fixes RVC check to OR with correct value.
-Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
+The previous variable contains 0 therefore it
-Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+did work.
-Message-id: 20220106210108.138226-3-frederic.petrot@univ-grenoble-alpes.fr
 Signed-off-by: Robbin Ehn <rehn@rivosinc.com>
 Acked-by: Richard Henderson <richard.henderson@linaro.org>
 Acked-by: Alistair Francis <alistair.francis@wdc.com>
 Message-ID: <bc82203b72d7efb30f1b4a8f9eb3d94699799dc8.camel@rivosinc.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- include/exec/memop.h | 7 +++++++
+ linux-user/syscall.c | 14 +++++++++++++-
-file changed, 7 insertions(+)
+file changed, 13 insertions(+), 1 deletion(-)
-diff --git a/include/exec/memop.h b/include/exec/memop.h
+diff --git a/linux-user/syscall.c b/linux-user/syscall.c
 index XXXXXXX..XXXXXXX 100644
---- a/include/exec/memop.h
+--- a/linux-user/syscall.c
-+++ b/include/exec/memop.h
++++ b/linux-user/syscall.c
-@@ -XXX,XX +XXX,XX @@ typedef enum MemOp {
+@@ -XXX,XX +XXX,XX @@ static int do_getdents64(abi_long dirfd, abi_long arg2, abi_long count)
-     MO_UW    = MO_16,
+ #define RISCV_HWPROBE_KEY_IMA_EXT_0     4
-     MO_UL    = MO_32,
+ #define     RISCV_HWPROBE_IMA_FD       (1 << 0)
-     MO_UQ    = MO_64,
+ #define     RISCV_HWPROBE_IMA_C        (1 << 1)
-+    MO_UO    = MO_128,
++#define     RISCV_HWPROBE_IMA_V        (1 << 2)
-     MO_SB    = MO_SIGN | MO_8,
++#define     RISCV_HWPROBE_EXT_ZBA      (1 << 3)
-     MO_SW    = MO_SIGN | MO_16,
++#define     RISCV_HWPROBE_EXT_ZBB      (1 << 4)
-     MO_SL    = MO_SIGN | MO_32,
++#define     RISCV_HWPROBE_EXT_ZBS      (1 << 5)
-+    MO_SQ    = MO_SIGN | MO_64,
-+    MO_SO    = MO_SIGN | MO_128,
+ #define RISCV_HWPROBE_KEY_CPUPERF_0     5
+ #define     RISCV_HWPROBE_MISALIGNED_UNKNOWN     (0 << 0)
-     MO_LEUW  = MO_LE | MO_UW,
+@@ -XXX,XX +XXX,XX @@ static void risc_hwprobe_fill_pairs(CPURISCVState *env,
-     MO_LEUL  = MO_LE | MO_UL,
+                     riscv_has_ext(env, RVD) ?
-     MO_LEUQ  = MO_LE | MO_UQ,
+                     RISCV_HWPROBE_IMA_FD : 0;
-     MO_LESW  = MO_LE | MO_SW,
+             value |= riscv_has_ext(env, RVC) ?
-     MO_LESL  = MO_LE | MO_SL,
+-                     RISCV_HWPROBE_IMA_C : pair->value;
-+    MO_LESQ  = MO_LE | MO_SQ,
++                     RISCV_HWPROBE_IMA_C : 0;
++            value |= riscv_has_ext(env, RVV) ?
-     MO_BEUW  = MO_BE | MO_UW,
++                     RISCV_HWPROBE_IMA_V : 0;
-     MO_BEUL  = MO_BE | MO_UL,
++            value |= cfg->ext_zba ?
-     MO_BEUQ  = MO_BE | MO_UQ,
++                     RISCV_HWPROBE_EXT_ZBA : 0;
-     MO_BESW  = MO_BE | MO_SW,
++            value |= cfg->ext_zbb ?
-     MO_BESL  = MO_BE | MO_SL,
++                     RISCV_HWPROBE_EXT_ZBB : 0;
-+    MO_BESQ  = MO_BE | MO_SQ,
++            value |= cfg->ext_zbs ?
++                     RISCV_HWPROBE_EXT_ZBS : 0;
- #ifdef NEED_CPU_H
+             __put_user(value, &pair->value);
-     MO_TEUW  = MO_TE | MO_UW,
+             break;
-     MO_TEUL  = MO_TE | MO_UL,
+         case RISCV_HWPROBE_KEY_CPUPERF_0:
      MO_TEUQ  = MO_TE | MO_UQ,
 +    MO_TEUO  = MO_TE | MO_UO,
      MO_TESW  = MO_TE | MO_SW,
      MO_TESL  = MO_TE | MO_SL,
 +    MO_TESQ  = MO_TE | MO_SQ,
  #endif
      MO_SSIZE = MO_SIZE | MO_SIGN,
 --
-.31.1
+.41.0

-[PULL 12/37] roms/opensbi: Upgrade from v0.9 to v1.0
+[PULL v2 41/45] target/riscv: Use accelerated helper for AES64KS1I
-From: Bin Meng <bmeng.cn@gmail.com>
+From: Ard Biesheuvel <ardb@kernel.org>
-Upgrade OpenSBI from v0.9 to v1.0 and the pre-built bios images.
+Use the accelerated SubBytes/ShiftRows/AddRoundKey AES helper to
 implement the first half of the key schedule derivation. This does not
 actually involve shifting rows, so clone the same value into all four
 columns of the AES vector to counter that operation.
-The v1.0 release includes the following commits:
+Cc: Richard Henderson <richard.henderson@linaro.org>
+Cc: Philippe Mathieu-Daudé <philmd@linaro.org>
-ec5274b platform: implement K210 system reset
+Cc: Palmer Dabbelt <palmer@dabbelt.com>
-cf0 include: sbi: Simplify HSM state define names
+Cc: Alistair Francis <alistair.francis@wdc.com>
-df1f9a lib: sbi: Use SBI_HSM_STATE_xyz defines instead of SBI_STATE_xyz defines
+Signed-off-by: Ard Biesheuvel <ardb@kernel.org>
-c867fd lib: sbi: Rename sbi_hsm_hart_started_mask() function
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
-c948 lib: sbi: Remove redundant sbi_hsm_hart_started() function
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
-ca864a9 lib: sbi: Fix error codes returned by HSM start() and stop() functions
+Message-ID: <20230831154118.138727-1-ardb@kernel.org>
 a22 include: sbi: Add HSM suspend related defines
 b05df6 lib: sbi: Add sbi_hart_reinit() function
 d71c include: sbi: Add hart_suspend() platform callback
 7475689 lib: sbi: Implement SBI HSM suspend function
 b9cf617 include: sbi: Upgrade SBI implementation version to v0.3
 d4fde lib: Remove redundant sbi_platform_ipi_clear() calls
 ff5bd94 include: sbi: SBI function IDs for RFENCE extension
 d8ee9 firmware: Use lla to access all global symbols
 f20e8a firmware: Support position independent execution
 ddad02d lib: sbi: illegal CSR 0x306 access in hpm_allowed()
 bfc85c7 include: headers: Replace __ASSEMBLY__ with __ASSEMBLER__
 ad1 lib/utils: Support the official clint DT bindings
 ca3f358 lib/utils: Drop the 'compat' parameter of fdt_plic_fixup()
 edc822 lib/utils: Support fixing up the official DT bindings of PLIC
 ef2f5d firware: optimize the exception exit code
 d8a952 lib: fix csr detect support
 e71a7c1 firmware: Remove redundant add instruction from trap restore path
 d4a94ea include: types: Add __aligned(x) to define the minimum alignement
 d0e406f include: sbi: Allow direct initialization via SPIN_LOCK_INIT()
 d8e2f1 lib: sbi: Replace test-and-set locks by ticket locks
 ffc3e lib: sbi: fix atomic_add_return
 a16b1 docs: fix link to OpenPiton documentation
 b1df1ac lib: sbi: Domains can be registered only before finalizing domains
 bce lib: sbi: Add sbi_domain_memregion_init() API
 dc0001 lib: sbi: Add sbi_domain_root_add_memregion() API
 b56980 lib: utils/sys: Add CLINT memregion in the root domain
 fc37c97 lib: sbi: Make the root domain instance global variable
 e7e4bcd lib: utils: Copy over restricted root domain memregions to FDT domains
 f41196a lib: sbi: Make sbi_domain_memregion_initfw() a local function
 c5d0645 lib: utils: Implement "64bit-mmio" property parsing
 e422c lib: utils: reset: Add T-HEAD sample platform reset driver
 d56293 lib: sbi: Fix sbi_domain_root_add_memregion() for merging memregions
 bf3ef53 firmware: Enable FW_PIC by default
 db8436 platform: Remove platform/thead
 d1642f docs: generic: Add T-HEAD C9xx series processors
 a3689db lib: sbi: Remove domains_root_regions() platform callback
 ca08 lib: sbi: Simplify console platform operations
 a8f1 lib: sbi: Simplify timer platform operations
 dc39c7b lib: sbi: Simplify ipi platform operations
 d088 lib: sbi: Simplify system reset platform operations
 a84a1dd lib: sbi: Simplify HSM platform operations
 e9a27ab lib: sbi: Show devices provided by platform in boot prints
 e27b docs/platform: sifive_fu540: Update U-Boot defconfig name
 fb6d lib: utils/serial: Add support for Gaisler APBUART
 f53f docs: platform: Sort platform names
 d4177e7 docs: platform: Describe sifive_fu540 as supported generic platform
 f3 platform: Remove sifive/fu540 platform
 f90c4c2 lib: sbi: Have spinlock checks return bool
 e822b75 lib: utils/serial: Support Synopsys DesignWare APB UART
 ab2 Makefile: unconditionally disable SSP
 c9ef2bc lib: utils: Add strncpy macro to libfdt_env.h
 ee7c2b2 lib: utils/fdt: Don't use sbi_string functions
 fe92347 lib: utils/fdt: Replace strcmp with strncmp
 b2dbbc0 lib: Check region base for merging in sbi_domain_root_add_memregion()
 d7def lib: utils: Try other FDT drivers when we see SBI_ENODEV
 d9ba653 docs: debugging OpenSBI
 c4fca lib: utils: consider ':' in stdout-path
 f30b189 lib: sbi_scratch: remove owner from sbi_scratch_alloc_offset
 a03ea2e platform: andes/ae350: Cosmetic fixes in plicsw.c
 b32fac4 docs/platform: andes-ae350: Fix missing spaces
 de446cc platform: andes/ae350: Drop plicsw_get_pending()
 e platform: andes/ae350: Drop plicsw_ipi_sync()
 da3d80 lib: sbi_scratch: zero out scratch memory on all harts
 ab88 lib: utils: missing initialization in thead_reset_init
 f9b42 lib: sbi: Fix GET_F64_REG inline assembly
 eb90e0a lib: utils/libfdt: Upgrade to v1.6.1 release
 cdcf907 lib: sign conflict in sbi_tlb_entry_process()
 9901794 lib: sign conflict in wake_coldboot_harts()
 c345f lib: simplify sbi_fifo_inplace_update()
 e29 lib: utils/timer: Add ACLINT MTIMER library
 a049fe lib: utils/ipi: Add ACLINT MSWI library
 bd5d208 lib: utils: Add FDT parsing API common for both ACLINT and CLINT
 fc5f7 lib: utils/ipi: Add FDT based ACLINT MSWI IPI driver
 d6bb5 lib: utils/timer: Add FDT based ACLINT MTIMER driver
 a731c7e platform: Replace CLINT library usage with ACLINT library
 b7f2cd2 lib: utils: reset: unify naming of 'sifive_test' device
 e089 docs/platform: thead-c9xx: Remove FW_PIC=y
 e23b6 platform: generic: Terminate platform.name with null
 e8b31a docs: Add device tree bindings for SBI PMU extension
 fde28fa lib: sbi: Detect mcountinihibit support at runtime
 d3a96cc lib: sbi: Remove stray '\' character
 f2b lib: sbi: Detect number of bits implemented in mhpmcounter
 c9b4ad lib: sbi: Disable m/scounteren & enable mcountinhibit
 ae63c include: Add a list empty check function
 fd9116b lib: sbi: Remove redundant boot time print statement
 db lib: sbi: Use csr_read/write_num to read/update PMU counters
 e7cc7a3 lib: sbi: Add PMU specific platform hooks
 d40f2 lib: sbi: Add PMU support
 ae72ec0 utils: fdt: Add fdt helper functions to parse PMU DT nodes
 f9b0f lib: sbi: Implement SBI PMU extension
 a17d lib: sbi: Implement firmware counters
 ec1b8bb lib: sbi: Improve TLB function naming
 e12aa8 platform: generic: Add PMU support
 c7f71 firmware: Minor optimization in _scratch_init()
 dafaa0f docs: Correct a typo in platform_guide.md
 abfce9b docs: Make <xyz> visible in the rendered platform guide
 dcb756b firmware: Remove the sanity checks in fw_save_info()
 b88b366 firmware: Define a macro for version of struct fw_dynamic_info
 a76ac44 lib: sbi: Fix sbi_pmu_exit() for systems not having MCOUNTINHIBIT csr
 f1be8a fw_base: Don't mark fw_platform_init as both global and weak
 afe5 fw_base: Put data in .data rather than .text
 a3d328a firmware: Explicitly pass -pie to the linker, not just the driver
 ad811 firmware: Only default FW_PIC to y if supported
 2942777 Makefile: Support building with Clang and LLVM binutils
 d4 lib: utils: Drop dependency on libgcc by importing part of FreeBSD's libquad
 e931f38 lib: utils/fdt: Add fdt_parse_phandle_with_args() API
 b8eff lib: utils/gpio: Add generic GPIO configuration library
 c14f1fe lib: utils/gpio: Add simple FDT based GPIO framework
 c3df2a lib: utils/gpio: Add minimal SiFive GPIO driver
 e3d6919 lib: utils/reset: Add generic GPIO reset driver
 e90 firmware: use __SIZEOF_LONG__ for field offsets in fw_dynamic.h
 f3a8f60 include: types: Use __builtin_offsetof when supported
 a1475b firmware: Remove the unhelpful alignment codes before fdt relocation
 a4555e5 docs: Document parameters passed to firmware and alignment requirement
 c74dc3 docs: Document FW_PIC compile time option
 eb708 README: Update toolchain information
 9890391 Makefile: Manually forward RELAX_FLAG to the assembler when linking with LLD
 db0ac firmware: use _fw_start for load address
 d5e4 generic: fu740: add workaround for CIP-1200 errata
 ce03c88 lib: utils: remove unused variable in fdt_reset_init
 e928472 lib: utils: support both of gpio-poweroff, gpio-reset
 d244f3d lib: sbi: Fix bug in strncmp function when count is 0
 a4765 lib: utils/fdt: Change addr and size to uint64_t
 e0d1b9d lib: utils/timer: Allow separate base addresses for MTIME and MTIMECMP
 a3a0cc lib: utils: Extend fdt_get_node_addr_size() for multiple register sets
 f3a0eb8 lib: utils/fdt: Extend fdt_parse_aclint_node() function
 b35f782 lib: utils/timer: Allow ACLINT MTIMER supporting only 32-bit MMIO
 aa6c9a lib: utils/timer: Simplify MTIMER synchronization
 eac76 lib: sbi: Fix bug in sbi_ecall_rfence that misses checking
 ee27437 lib: sbi_trap: Restore redirect for access faults
 b1d3e91 payloads/test: Add support for SBI v0.2 ecalls
 bd316e2 lib: sbi: Correct typo in faults delegation CSR name
 c262306 lib: sbi: protect dprintf output with spinlock
 b16 lib: sbi: Checking fifo validness in sbi_fifo_is_empty and is_full
 bd35521 lib: sbi: Refine the way to construct platform features
 a96 lib: utils/reset: Sort fdt_reset driver list
 ff7e lib: utils/reset: Add a sunxi watchdog reset driver
 f08 lib: sbi: fix ctz bug
 d2 lib: sbi: add some macros to detect BUG at runtime
 fe lib: sbi: Add BUG() macro for csr_read/write_num() and misa_string()
 f4 lib: utils/fdt: Add fdt_parse_timebase_frequency() function
 e7af9 lib: sbi: Add timer frequency to struct sbi_timer_device
 6355155 lib: sbi: Print timer frequency at boot time
 d0ab35 lib: sbi: Add generic timer delay loop function
 fa59dd3 lib: utils/reset: use sbi_timer_mdelay() in gpio reset driver
 d511 lib: utils: identify supported GPIO reset methods
 c lib: sbi: convert reset to list
 d50 lib: sbi: add priority for reset handler
 c38973e lib: sbi: Save context for all non-retentive suspend types
 cbbcb lib: sbi: system reset with invalid parameters
 eda4 Makefile: Add build time and compiler info string
 c2b19 lib: utils/irqchip: Automatically delegate T-HEAD PLIC access
 e8bd lib: utils/reset: Register separate GPIO system reset devices
 aa88 lib: sbi: Refine addr format in sbi_printf
 c891acc include: sbi_utils: Introduce an helper to get fdt base address
 ba4e lib: sbi: Fix GPA passed to __sbi_hfence_gvma_xyz() functions
 ffd lib: utils/gpio: use list for drivers
 fe2f55 lib: sbi: move sbi_boot_print_general()
 f094e platform: generic: move fdt_reset_init to final_init
 be245ac lib: sbi: error handling in fdt_reset_init()
 a74daf2 riscv: Add new CSRs introduced by Sscofpmf[1] extension
 ad9 lib: sbi: Update csr_read/write_num for PMU
 c653 lib: sbi: Detect Sscofpmf extension at run time
 c36 lib: sbi: Delegate PMU counter overflow interrupt to S mode
 f01b lib: sbi: Support sscofpmf extension in OpenSBI
 f95 lib: sbi: Always enable access for all counters
 c304b6 lib: sbi: Allow programmable counters to monitor cycle/instret events
 e14732 lib: sbi: Reset the mhpmevent value upon counter reset
 b628cfd lib: sbi: Counter info width should be zero indexed
 b28f070 lib: sbi: Enable PMU extension for platforms without mcountinhibit
 a3 lib: utils: Rename the prefix in PMU DT properties
 b8845e4 lib: sbi: Fix initial value mask while updating the counters
 fe5a7 lib: sbi: Fix PMP address bits detection
 eba23 lib: utils/reset: add priority to gpio reset
 d462e0 lib: utils/reset: separate driver init func
 c964a2 lib: utils/i2c: Add generic I2C configuration library
 ca6bca lib: utils/i2c: Add simple FDT based I2C framework
 a1158 lib: utils/i2c: Add minimal SiFive I2C driver
 f374496 platform: sifive_fu740: add platform reset driver
 d335a17 lib: sbi: clear pmpcfg.A before setting in pmp_set()
 af6e4 lib: utils: Add LiteX UART support
 d556d lib: sbi: Fix spelling of "address" in sbi_domain.c
 a22c78 lib: sbi: Fix missing space
 e77706 lib: sbi: Resolve the uninitialized complaint in sbi_pmu
 faee6 lib: sbi: Improve fatal error handling
 2428987 lib: pmu: support the event ID encoded by a bitmap.
 fbcc0 docs/platform: spike: Enhance Spike examples
 c lib: pmu: check SSCOF before masking
 d7e53 Makefile: Fix -msave-restore compile warning with CLANG-10 (or lower)
 d249d65 lib: sbi: Fix compile errors using -Os option
 f270359 Makefile: Improve the method to disable -m(no-)save-restore option
 2082153 lib: sbi: simplify pmp_set(), pmp_get()
 d30bde3 firmware: Move memcpy/memset mapping to fw_base.S
 f91ee include: Bump-up version to 1.0
 Signed-off-by: Bin Meng <bmeng.cn@gmail.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- .../opensbi-riscv32-generic-fw_dynamic.bin    | Bin 78680 -> 108504 bytes
+ target/riscv/crypto_helper.c | 17 +++++------------
- .../opensbi-riscv32-generic-fw_dynamic.elf    | Bin 727464 -> 838904 bytes
+file changed, 5 insertions(+), 12 deletions(-)
  .../opensbi-riscv64-generic-fw_dynamic.bin    | Bin 75096 -> 105296 bytes
  .../opensbi-riscv64-generic-fw_dynamic.elf    | Bin 781264 -> 934696 bytes
  roms/opensbi                                  |   2 +-
 files changed, 1 insertion(+), 1 deletion(-)
-diff --git a/pc-bios/opensbi-riscv32-generic-fw_dynamic.bin b/pc-bios/opensbi-riscv32-generic-fw_dynamic.bin
+diff --git a/target/riscv/crypto_helper.c b/target/riscv/crypto_helper.c
 index XXXXXXX..XXXXXXX 100644
-Binary files a/pc-bios/opensbi-riscv32-generic-fw_dynamic.bin and b/pc-bios/opensbi-riscv32-generic-fw_dynamic.bin differ
+--- a/target/riscv/crypto_helper.c
-diff --git a/pc-bios/opensbi-riscv32-generic-fw_dynamic.elf b/pc-bios/opensbi-riscv32-generic-fw_dynamic.elf
++++ b/target/riscv/crypto_helper.c
-index XXXXXXX..XXXXXXX 100644
+@@ -XXX,XX +XXX,XX @@ target_ulong HELPER(aes64ks1i)(target_ulong rs1, target_ulong rnum)
-Binary files a/pc-bios/opensbi-riscv32-generic-fw_dynamic.elf and b/pc-bios/opensbi-riscv32-generic-fw_dynamic.elf differ
-diff --git a/pc-bios/opensbi-riscv64-generic-fw_dynamic.bin b/pc-bios/opensbi-riscv64-generic-fw_dynamic.bin
+     uint8_t enc_rnum = rnum;
-index XXXXXXX..XXXXXXX 100644
+     uint32_t temp = (RS1 >> 32) & 0xFFFFFFFF;
-Binary files a/pc-bios/opensbi-riscv64-generic-fw_dynamic.bin and b/pc-bios/opensbi-riscv64-generic-fw_dynamic.bin differ
+-    uint8_t rcon_ = 0;
-diff --git a/pc-bios/opensbi-riscv64-generic-fw_dynamic.elf b/pc-bios/opensbi-riscv64-generic-fw_dynamic.elf
+-    target_ulong result;
-index XXXXXXX..XXXXXXX 100644
++    AESState t, rc = {};
-Binary files a/pc-bios/opensbi-riscv64-generic-fw_dynamic.elf and b/pc-bios/opensbi-riscv64-generic-fw_dynamic.elf differ
-diff --git a/roms/opensbi b/roms/opensbi
+     if (enc_rnum != 0xA) {
-index XXXXXXX..XXXXXXX 160000
+         temp = ror32(temp, 8); /* Rotate right by 8 */
---- a/roms/opensbi
+-        rcon_ = round_consts[enc_rnum];
-+++ b/roms/opensbi
++        rc.w[0] = rc.w[1] = round_consts[enc_rnum];
-@@ -1 +1 @@
+     }
--Subproject commit 234ed8e427f4d92903123199f6590d144e0d9351
-+Subproject commit 48f91ee9c960f048c4a7d1da4447d31e04931e38
+-    temp = ((uint32_t)AES_sbox[(temp >> 24) & 0xFF] << 24) |
 -           ((uint32_t)AES_sbox[(temp >> 16) & 0xFF] << 16) |
 -           ((uint32_t)AES_sbox[(temp >> 8) & 0xFF] << 8) |
 -           ((uint32_t)AES_sbox[(temp >> 0) & 0xFF] << 0);
 +    t.w[0] = t.w[1] = t.w[2] = t.w[3] = temp;
 +    aesenc_SB_SR_AK(&t, &t, &rc, false);
 -    temp ^= rcon_;
 -
 -    result = ((uint64_t)temp << 32) | temp;
 -
 -    return result;
 +    return t.d[0];
  }
  target_ulong HELPER(aes64im)(target_ulong rs1)
 --
-.31.1
+.41.0

-[PULL 04/37] hw/intc: sifive_plic: Add a reset function
+[PULL v2 42/45] target/riscv: Allocate itrigger timers only once
-From: Alistair Francis <alistair.francis@wdc.com>
+From: Akihiko Odaki <akihiko.odaki@daynix.com>
+riscv_trigger_init() had been called on reset events that can happen
+several times for a CPU and it allocated timers for itrigger. If old
+timers were present, they were simply overwritten by the new timers,
+resulting in a memory leak.
+Divide riscv_trigger_init() into two functions, namely
+riscv_trigger_realize() and riscv_trigger_reset() and call them in
+appropriate timing. The timer allocation will happen only once for a
+CPU in riscv_trigger_realize().
+Fixes: 5a4ae64cac ("target/riscv: Add itrigger support when icount is enabled")
+Signed-off-by: Akihiko Odaki <akihiko.odaki@daynix.com>
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
+Reviewed-by: LIU Zhiwei <zhiwei_liu@linux.alibaba.com>
+Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
+Message-ID: <20230818034059.9146-1-akihiko.odaki@daynix.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
-Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
-Reviewed-by: Bin Meng <bmeng.cn@gmail.com>
-Message-Id: <20220105213937.1113508-2-alistair.francis@opensource.wdc.com>
 ---
- hw/intc/sifive_plic.c | 18 ++++++++++++++++++
+ target/riscv/debug.h |  3 ++-
-file changed, 18 insertions(+)
+ target/riscv/cpu.c   |  8 +++++++-
  target/riscv/debug.c | 15 ++++++++++++---
 files changed, 21 insertions(+), 5 deletions(-)
-diff --git a/hw/intc/sifive_plic.c b/hw/intc/sifive_plic.c
+diff --git a/target/riscv/debug.h b/target/riscv/debug.h
 index XXXXXXX..XXXXXXX 100644
---- a/hw/intc/sifive_plic.c
+--- a/target/riscv/debug.h
-+++ b/hw/intc/sifive_plic.c
++++ b/target/riscv/debug.h
-@@ -XXX,XX +XXX,XX @@ static const MemoryRegionOps sifive_plic_ops = {
+@@ -XXX,XX +XXX,XX @@ void riscv_cpu_debug_excp_handler(CPUState *cs);
  bool riscv_cpu_debug_check_breakpoint(CPUState *cs);
  bool riscv_cpu_debug_check_watchpoint(CPUState *cs, CPUWatchpoint *wp);
 -void riscv_trigger_init(CPURISCVState *env);
 +void riscv_trigger_realize(CPURISCVState *env);
 +void riscv_trigger_reset_hold(CPURISCVState *env);
  bool riscv_itrigger_enabled(CPURISCVState *env);
  void riscv_itrigger_update_priv(CPURISCVState *env);
 diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/cpu.c
 +++ b/target/riscv/cpu.c
@@ -XXX,XX +XXX,XX @@ static void riscv_cpu_reset_hold(Object *obj)
  #ifndef CONFIG_USER_ONLY
      if (cpu->cfg.debug) {
 -        riscv_trigger_init(env);
 +        riscv_trigger_reset_hold(env);
      }
- };
+     if (kvm_enabled()) {
-+static void sifive_plic_reset(DeviceState *dev)
+@@ -XXX,XX +XXX,XX @@ static void riscv_cpu_realize(DeviceState *dev, Error **errp)
      riscv_cpu_register_gdb_regs_for_features(cs);
 +#ifndef CONFIG_USER_ONLY
 +    if (cpu->cfg.debug) {
 +        riscv_trigger_realize(&cpu->env);
 +    }
 +#endif
 +
      qemu_init_vcpu(cs);
      cpu_reset(cs);
 diff --git a/target/riscv/debug.c b/target/riscv/debug.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/riscv/debug.c
 +++ b/target/riscv/debug.c
@@ -XXX,XX +XXX,XX @@ bool riscv_cpu_debug_check_watchpoint(CPUState *cs, CPUWatchpoint *wp)
      return false;
  }
 -void riscv_trigger_init(CPURISCVState *env)
 +void riscv_trigger_realize(CPURISCVState *env)
 +{
-+    SiFivePLICState *s = SIFIVE_PLIC(dev);
 +    int i;
 +
-+    memset(s->source_priority, 0, sizeof(uint32_t) * s->num_sources);
++    for (i = 0; i < RV_MAX_TRIGGERS; i++) {
-+    memset(s->target_priority, 0, sizeof(uint32_t) * s->num_addrs);
++        env->itrigger_timer[i] = timer_new_ns(QEMU_CLOCK_VIRTUAL,
-+    memset(s->pending, 0, sizeof(uint32_t) * s->bitfield_words);
++                                              riscv_itrigger_timer_cb, env);
 +    memset(s->claimed, 0, sizeof(uint32_t) * s->bitfield_words);
 +    memset(s->enable, 0, sizeof(uint32_t) * s->num_enables);
 +
 +    for (i = 0; i < s->num_harts; i++) {
 +        qemu_set_irq(s->m_external_irqs[i], 0);
 +        qemu_set_irq(s->s_external_irqs[i], 0);
 +    }
 +}
 +
- /*
++void riscv_trigger_reset_hold(CPURISCVState *env)
   * parse PLIC hart/mode address offset config
   *
@@ -XXX,XX +XXX,XX @@ static void sifive_plic_class_init(ObjectClass *klass, void *data)
  {
-     DeviceClass *dc = DEVICE_CLASS(klass);
+     target_ulong tdata1 = build_tdata1(env, TRIGGER_TYPE_AD_MATCH, 0, 0);
+     int i;
-+    dc->reset = sifive_plic_reset;
+@@ -XXX,XX +XXX,XX @@ void riscv_trigger_init(CPURISCVState *env)
-     device_class_set_props(dc, sifive_plic_properties);
+         env->tdata3[i] = 0;
-     dc->realize = sifive_plic_realize;
+         env->cpu_breakpoint[i] = NULL;
-     dc->vmsd = &vmstate_sifive_plic;
+         env->cpu_watchpoint[i] = NULL;
 -        env->itrigger_timer[i] = timer_new_ns(QEMU_CLOCK_VIRTUAL,
 -                                              riscv_itrigger_timer_cb, env);
 +        timer_del(env->itrigger_timer[i]);
      }
  }
 --
-.31.1
+.41.0

-[PULL 03/37] hw/dma: sifive_pdma: permit 4/8-byte access size of PDMA registers
+[PULL v2 43/45] target/riscv/pmp.c: respect mseccfg.RLB for pmpaddrX changes
-From: Jim Shu <jim.shu@sifive.com>
+From: Leon Schuermann <leons@opentitan.org>
-It's obvious that PDMA supports 64-bit access of 64-bit registers, and
+When the rule-lock bypass (RLB) bit is set in the mseccfg CSR, the PMP
-in previous commit, we confirm that PDMA supports 32-bit access of
+configuration lock bits must not apply. While this behavior is
-both 32/64-bit registers. Thus, we configure 32/64-bit memory access
+implemented for the pmpcfgX CSRs, this bit is not respected for
-of PDMA registers as valid in general.
+changes to the pmpaddrX CSRs. This patch ensures that pmpaddrX CSR
 writes work even on locked regions when the global rule-lock bypass is
 enabled.
-Signed-off-by: Jim Shu <jim.shu@sifive.com>
+Signed-off-by: Leon Schuermann <leons@opentitan.org>
-Reviewed-by: Frank Chang <frank.chang@sifive.com>
+Reviewed-by: Mayuresh Chitale <mchitale@ventanamicro.com>
 Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Reviewed-by: Bin Meng <bmeng.cn@gmail.com>
+Message-ID: <20230829215046.1430463-1-leon@is.currently.online>
 Tested-by: Bin Meng <bmeng.cn@gmail.com>
 Message-id: 20220104063408.658169-3-jim.shu@sifive.com
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- hw/dma/sifive_pdma.c | 4 ++++
+ target/riscv/pmp.c | 4 ++++
 file changed, 4 insertions(+)
-diff --git a/hw/dma/sifive_pdma.c b/hw/dma/sifive_pdma.c
+diff --git a/target/riscv/pmp.c b/target/riscv/pmp.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/dma/sifive_pdma.c
+--- a/target/riscv/pmp.c
-+++ b/hw/dma/sifive_pdma.c
++++ b/target/riscv/pmp.c
-@@ -XXX,XX +XXX,XX @@ static const MemoryRegionOps sifive_pdma_ops = {
+@@ -XXX,XX +XXX,XX @@ static inline uint8_t pmp_get_a_field(uint8_t cfg)
-     .impl = {
+  */
-         .min_access_size = 4,
+ static inline int pmp_is_locked(CPURISCVState *env, uint32_t pmp_index)
-         .max_access_size = 8,
+ {
-+    },
++    /* mseccfg.RLB is set */
-+    .valid = {
++    if (MSECCFG_RLB_ISSET(env)) {
-+        .min_access_size = 4,
++        return 0;
-+        .max_access_size = 8,
++    }
-     }
- };
+     if (env->pmp_state.pmp[pmp_index].cfg_reg & PMP_LOCK) {
+         return 1;
 --
-.31.1
+.41.0

-[PULL 10/37] hw/riscv: Use error_fatal for SoC realisation
+[PULL v2 44/45] target/riscv: Align the AIA model to v1.0 ratified spec
-From: Alistair Francis <alistair.francis@wdc.com>
+From: Tommy Wu <tommy.wu@sifive.com>
-When realising the SoC use error_fatal instead of error_abort as the
+According to the new spec, when vsiselect has a reserved value, attempts
-process can fail and report useful information to the user.
+from M-mode or HS-mode to access vsireg, or from VS-mode to access
 sireg, should preferably raise an illegal instruction exception.
-Currently a user can see this:
+Signed-off-by: Tommy Wu <tommy.wu@sifive.com>
 Reviewed-by: Frank Chang <frank.chang@sifive.com>
 Message-ID: <20230816061647.600672-1-tommy.wu@sifive.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
  target/riscv/csr.c | 7 +++++--
 file changed, 5 insertions(+), 2 deletions(-)
-   $ ../qemu/bld/qemu-system-riscv64 -M sifive_u -S -monitor stdio -display none -drive if=pflash
+diff --git a/target/riscv/csr.c b/target/riscv/csr.c
     QEMU 6.1.93 monitor - type 'help' for more information
     (qemu) Unexpected error in sifive_u_otp_realize() at ../hw/misc/sifive_u_otp.c:229:
     qemu-system-riscv64: OTP drive size < 16K
     Aborted (core dumped)
 Which this patch addresses
 Reported-by: Markus Armbruster <armbru@redhat.com>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
 Reviewed-by: Markus Armbruster <armbru@redhat.com>
 Reviewed-by: Bin Meng <bmeng.cn@gmail.com>
 Tested-by: Bin Meng <bmeng.cn@gmail.com>
 Message-Id: <20220105213937.1113508-8-alistair.francis@opensource.wdc.com>
 ---
  hw/riscv/microchip_pfsoc.c | 2 +-
  hw/riscv/opentitan.c       | 2 +-
  hw/riscv/sifive_e.c        | 2 +-
  hw/riscv/sifive_u.c        | 2 +-
 files changed, 4 insertions(+), 4 deletions(-)
 diff --git a/hw/riscv/microchip_pfsoc.c b/hw/riscv/microchip_pfsoc.c
 index XXXXXXX..XXXXXXX 100644
---- a/hw/riscv/microchip_pfsoc.c
+--- a/target/riscv/csr.c
-+++ b/hw/riscv/microchip_pfsoc.c
++++ b/target/riscv/csr.c
-@@ -XXX,XX +XXX,XX @@ static void microchip_icicle_kit_machine_init(MachineState *machine)
+@@ -XXX,XX +XXX,XX @@ static int rmw_iprio(target_ulong xlen,
-     /* Initialize SoC */
+ static int rmw_xireg(CPURISCVState *env, int csrno, target_ulong *val,
-     object_initialize_child(OBJECT(machine), "soc", &s->soc,
+                      target_ulong new_val, target_ulong wr_mask)
-                             TYPE_MICROCHIP_PFSOC);
+ {
--    qdev_realize(DEVICE(&s->soc), NULL, &error_abort);
+-    bool virt;
-+    qdev_realize(DEVICE(&s->soc), NULL, &error_fatal);
++    bool virt, isel_reserved;
+     uint8_t *iprio;
-     /* Split RAM into low and high regions using aliases to machine->ram */
+     int ret = -EINVAL;
-     mem_low_size = memmap[MICROCHIP_PFSOC_DRAM_LO].size;
+     target_ulong priv, isel, vgein;
-diff --git a/hw/riscv/opentitan.c b/hw/riscv/opentitan.c
+@@ -XXX,XX +XXX,XX @@ static int rmw_xireg(CPURISCVState *env, int csrno, target_ulong *val,
-index XXXXXXX..XXXXXXX 100644
---- a/hw/riscv/opentitan.c
+     /* Decode register details from CSR number */
-+++ b/hw/riscv/opentitan.c
+     virt = false;
-@@ -XXX,XX +XXX,XX @@ static void opentitan_board_init(MachineState *machine)
++    isel_reserved = false;
-     /* Initialize SoC */
+     switch (csrno) {
-     object_initialize_child(OBJECT(machine), "soc", &s->soc,
+     case CSR_MIREG:
-                             TYPE_RISCV_IBEX_SOC);
+         iprio = env->miprio;
--    qdev_realize(DEVICE(&s->soc), NULL, &error_abort);
+@@ -XXX,XX +XXX,XX @@ static int rmw_xireg(CPURISCVState *env, int csrno, target_ulong *val,
-+    qdev_realize(DEVICE(&s->soc), NULL, &error_fatal);
+                                                   riscv_cpu_mxl_bits(env)),
+                                     val, new_val, wr_mask);
-     memory_region_add_subregion(sys_mem,
+         }
-         memmap[IBEX_DEV_RAM].base, machine->ram);
++    } else {
-diff --git a/hw/riscv/sifive_e.c b/hw/riscv/sifive_e.c
++        isel_reserved = true;
-index XXXXXXX..XXXXXXX 100644
+     }
---- a/hw/riscv/sifive_e.c
-+++ b/hw/riscv/sifive_e.c
+ done:
-@@ -XXX,XX +XXX,XX @@ static void sifive_e_machine_init(MachineState *machine)
+     if (ret) {
+-        return (env->virt_enabled && virt) ?
-     /* Initialize SoC */
++        return (env->virt_enabled && virt && !isel_reserved) ?
-     object_initialize_child(OBJECT(machine), "soc", &s->soc, TYPE_RISCV_E_SOC);
+                RISCV_EXCP_VIRT_INSTRUCTION_FAULT : RISCV_EXCP_ILLEGAL_INST;
--    qdev_realize(DEVICE(&s->soc), NULL, &error_abort);
+     }
-+    qdev_realize(DEVICE(&s->soc), NULL, &error_fatal);
+     return RISCV_EXCP_NONE;
      /* Data Tightly Integrated Memory */
      memory_region_add_subregion(sys_mem,
 diff --git a/hw/riscv/sifive_u.c b/hw/riscv/sifive_u.c
 index XXXXXXX..XXXXXXX 100644
 --- a/hw/riscv/sifive_u.c
 +++ b/hw/riscv/sifive_u.c
@@ -XXX,XX +XXX,XX @@ static void sifive_u_machine_init(MachineState *machine)
                               &error_abort);
      object_property_set_str(OBJECT(&s->soc), "cpu-type", machine->cpu_type,
                               &error_abort);
 -    qdev_realize(DEVICE(&s->soc), NULL, &error_abort);
 +    qdev_realize(DEVICE(&s->soc), NULL, &error_fatal);
      /* register RAM */
      memory_region_add_subregion(system_memory, memmap[SIFIVE_U_DEV_DRAM].base,
 --
-.31.1
+.41.0

-[PULL 01/37] target/riscv/pmp: fix no pmp illegal intrs
+[PULL v2 45/45] target/riscv: don't read CSR in riscv_csrrw_do64
 From: Nikita Shubin <n.shubin@yadro.com>
-As per the privilege specification, any access from S/U mode should fail
+As per ISA:
 if no pmp region is configured and pmp is present, othwerwise access
 should succeed.
-Fixes: d102f19a208 (target/riscv/pmp: Raise exception if no PMP entry is configured)
+"For CSRRWI, if rd=x0, then the instruction shall not read the CSR and
 shall not cause any of the side effects that might occur on a CSR read."
 trans_csrrwi() and trans_csrrw() call do_csrw() if rd=x0, do_csrw() calls
 riscv_csrrw_do64(), via helper_csrw() passing NULL as *ret_value.
 Signed-off-by: Nikita Shubin <n.shubin@yadro.com>
 Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
-Message-id: 20211214092659.15709-1-nikita.shubin@maquefel.me
+Message-ID: <20230808090914.17634-1-nikita.shubin@maquefel.me>
 Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
 ---
- target/riscv/op_helper.c | 3 ++-
+ target/riscv/csr.c | 24 +++++++++++++++---------
-file changed, 2 insertions(+), 1 deletion(-)
+file changed, 15 insertions(+), 9 deletions(-)
-diff --git a/target/riscv/op_helper.c b/target/riscv/op_helper.c
+diff --git a/target/riscv/csr.c b/target/riscv/csr.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/riscv/op_helper.c
+--- a/target/riscv/csr.c
-+++ b/target/riscv/op_helper.c
++++ b/target/riscv/csr.c
-@@ -XXX,XX +XXX,XX @@ target_ulong helper_mret(CPURISCVState *env, target_ulong cpu_pc_deb)
+@@ -XXX,XX +XXX,XX @@ static RISCVException riscv_csrrw_do64(CPURISCVState *env, int csrno,
-     uint64_t mstatus = env->mstatus;
+                                        target_ulong write_mask)
-     target_ulong prev_priv = get_field(mstatus, MSTATUS_MPP);
+ {
+     RISCVException ret;
--    if (!pmp_get_num_rules(env) && (prev_priv != PRV_M)) {
+-    target_ulong old_value;
-+    if (riscv_feature(env, RISCV_FEATURE_PMP) &&
++    target_ulong old_value = 0;
-+        !pmp_get_num_rules(env) && (prev_priv != PRV_M)) {
-         riscv_raise_exception(env, RISCV_EXCP_ILLEGAL_INST, GETPC());
+     /* execute combined read/write operation if it exists */
      if (csr_ops[csrno].op) {
          return csr_ops[csrno].op(env, csrno, ret_value, new_value, write_mask);
      }
+-    /* if no accessor exists then return failure */
+-    if (!csr_ops[csrno].read) {
+-        return RISCV_EXCP_ILLEGAL_INST;
+-    }
+-    /* read old value */
+-    ret = csr_ops[csrno].read(env, csrno, &old_value);
+-    if (ret != RISCV_EXCP_NONE) {
+-        return ret;
++    /*
++     * ret_value == NULL means that rd=x0 and we're coming from helper_csrw()
++     * and we can't throw side effects caused by CSR reads.
++     */
++    if (ret_value) {
++        /* if no accessor exists then return failure */
++        if (!csr_ops[csrno].read) {
++            return RISCV_EXCP_ILLEGAL_INST;
++        }
++        /* read old value */
++        ret = csr_ops[csrno].read(env, csrno, &old_value);
++        if (ret != RISCV_EXCP_NONE) {
++            return ret;
++        }
+     }
+     /* write value if writable and write mask set, otherwise drop writes */
 --
-.31.1
+.41.0

From: Alistair Francis <alistair.francis@wdc.com>

The following changes since commit d70075373af51b6aa1d637962c962120e201fc98:

Merge tag 'for_upstream' of git://git.kernel.org/pub/scm/virt/kvm/mst/qemu into staging (2022-01-07 17:24:24 -0800)

are available in the Git repository at:

git@github.com:alistair23/qemu.git tags/pull-riscv-to-apply-20220108

for you to fetch changes up to 48eaeb56debf91817dea00a2cd9c1f6c986eb531:

target/riscv: Implement the stval/mtval illegal instruction (2022-01-08 15:46:10 +1000)

----------------------------------------------------------------
Second RISC-V PR for QEMU 7.0

- Fix illegal instruction when PMP is disabled
 - SiFive PDMA 64-bit support
 - SiFive PLIC cleanups
 - Mark Hypervisor extension as non experimental
 - Enable Hypervisor extension by default
 - Support 32 cores on the virt machine
 - Corrections for the Vector extension
 - Experimental support for 128-bit CPUs
 - stval and mtval support for illegal instructions

----------------------------------------------------------------
Alistair Francis (11):
      hw/intc: sifive_plic: Add a reset function
      hw/intc: sifive_plic: Cleanup the write function
      hw/intc: sifive_plic: Cleanup the read function
      hw/intc: sifive_plic: Cleanup remaining functions
      target/riscv: Mark the Hypervisor extension as non experimental
      target/riscv: Enable the Hypervisor extension by default
      hw/riscv: Use error_fatal for SoC realisation
      hw/riscv: virt: Allow support for 32 cores
      target/riscv: Set the opcode in DisasContext
      target/riscv: Fixup setting GVA
      target/riscv: Implement the stval/mtval illegal instruction

Bin Meng (1):
      roms/opensbi: Upgrade from v0.9 to v1.0

Frank Chang (3):
      target/riscv: rvv-1.0: Call the correct RVF/RVD check function for widening fp insns
      target/riscv: rvv-1.0: Call the correct RVF/RVD check function for widening fp/int type-convert insns
      target/riscv: rvv-1.0: Call the correct RVF/RVD check function for narrowing fp/int type-convert insns

Frédéric Pétrot (18):
      exec/memop: Adding signedness to quad definitions
      exec/memop: Adding signed quad and octo defines
      qemu/int128: addition of div/rem 128-bit operations
      target/riscv: additional macros to check instruction support
      target/riscv: separation of bitwise logic and arithmetic helpers
      target/riscv: array for the 64 upper bits of 128-bit registers
      target/riscv: setup everything for rv64 to support rv128 execution
      target/riscv: moving some insns close to similar insns
      target/riscv: accessors to registers upper part and 128-bit load/store
      target/riscv: support for 128-bit bitwise instructions
      target/riscv: support for 128-bit U-type instructions
      target/riscv: support for 128-bit shift instructions
      target/riscv: support for 128-bit arithmetic instructions
      target/riscv: support for 128-bit M extension
      target/riscv: adding high part of some csrs
      target/riscv: helper functions to wrap calls to 128-bit csr insns
      target/riscv: modification of the trans_csrxx for 128-bit support
      target/riscv: actual functions to realize crs 128-bit insns

Jim Shu (2):
      hw/dma: sifive_pdma: support high 32-bit access of 64-bit register
      hw/dma: sifive_pdma: permit 4/8-byte access size of PDMA registers

Nikita Shubin (1):
      target/riscv/pmp: fix no pmp illegal intrs

Philipp Tomsich (1):
      target/riscv: Fix position of 'experimental' comment

From: Nikita Shubin <n.shubin@yadro.com>

As per the privilege specification, any access from S/U mode should fail
if no pmp region is configured and pmp is present, othwerwise access
should succeed.

Fixes: d102f19a208 (target/riscv/pmp: Raise exception if no PMP entry is configured)
Signed-off-by: Nikita Shubin <n.shubin@yadro.com>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Message-id: 20211214092659.15709-1-nikita.shubin@maquefel.me
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 target/riscv/op_helper.c | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/target/riscv/op_helper.c b/target/riscv/op_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/riscv/op_helper.c
+++ b/target/riscv/op_helper.c
@@ -XXX,XX +XXX,XX @@ target_ulong helper_mret(CPURISCVState *env, target_ulong cpu_pc_deb)
     uint64_t mstatus = env->mstatus;
     target_ulong prev_priv = get_field(mstatus, MSTATUS_MPP);
 
-    if (!pmp_get_num_rules(env) && (prev_priv != PRV_M)) {
+    if (riscv_feature(env, RISCV_FEATURE_PMP) &&
+        !pmp_get_num_rules(env) && (prev_priv != PRV_M)) {
         riscv_raise_exception(env, RISCV_EXCP_ILLEGAL_INST, GETPC());
     }
 
-- 
2.31.1

From: Jim Shu <jim.shu@sifive.com>

Real PDMA supports high 32-bit read/write memory access of 64-bit
register.

The following result is PDMA tested in U-Boot on Unmatched board:

1. Real PDMA allows high 32-bit read/write to 64-bit register.
=> mw.l 0x3000000 0x0                      <= Disclaim channel 0
=> mw.l 0x3000000 0x1                      <= Claim channel 0
=> mw.l 0x3000010 0x80000000               <= Write low 32-bit NextDest (NextDest = 0x280000000)
=> mw.l 0x3000014 0x2                      <= Write high 32-bit NextDest
=> md.l 0x3000010 1                        <= Dump low 32-bit NextDest
03000010: 80000000
=> md.l 0x3000014 1                        <= Dump high 32-bit NextDest
03000014: 00000002
=> mw.l 0x3000018 0x80001000               <= Write low 32-bit NextSrc (NextSrc = 0x280001000)
=> mw.l 0x300001c 0x2                      <= Write high 32-bit NextSrc
=> md.l 0x3000018 1                        <= Dump low 32-bit NextSrc
03000010: 80001000
=> md.l 0x300001c 1                        <= Dump high 32-bit NextSrc
03000014: 00000002

2. PDMA transfer from 0x280001000 to 0x280000000 is OK.
=> mw.q 0x3000008 0x4                      <= NextBytes = 4
=> mw.l 0x3000004 0x22000000               <= wsize = rsize = 2 (2^2 = 4 bytes)
=> mw.l 0x280000000 0x87654321             <= Fill test data to dst
=> mw.l 0x280001000 0x12345678             <= Fill test data to src
=> md.l 0x280000000 1; md.l 0x280001000 1  <= Dump src/dst memory contents
280000000: 87654321                              !Ce.
280001000: 12345678                              xV4.
=> md.l 0x3000000 8                        <= Dump PDMA status
03000000: 00000001 22000000 00000004 00000000    ......."........
03000010: 80000000 00000002 80001000 00000002    ................
=> mw.l 0x3000000 0x3                      <= Set channel 0 run and claim bits
=> md.l 0x3000000 8                        <= Dump PDMA status
03000000: 40000001 22000000 00000004 00000000    ...@..."........
03000010: 80000000 00000002 80001000 00000002    ................
=> md.l 0x280000000 1; md.l 0x280001000 1  <= Dump src/dst memory contents
280000000: 12345678                               xV4.
280001000: 12345678                               xV4.

Signed-off-by: Jim Shu <jim.shu@sifive.com>
Reviewed-by: Frank Chang <frank.chang@sifive.com>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Reviewed-by: Bin Meng <bmeng.cn@gmail.com>
Tested-by: Bin Meng <bmeng.cn@gmail.com>
Message-id: 20220104063408.658169-2-jim.shu@sifive.com
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 hw/dma/sifive_pdma.c | 177 +++++++++++++++++++++++++++++++++++++------
 1 file changed, 155 insertions(+), 22 deletions(-)

diff --git a/hw/dma/sifive_pdma.c b/hw/dma/sifive_pdma.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/dma/sifive_pdma.c
+++ b/hw/dma/sifive_pdma.c
@@ -XXX,XX +XXX,XX @@ static inline void sifive_pdma_update_irq(SiFivePDMAState *s, int ch)
     s->chan[ch].state = DMA_CHAN_STATE_IDLE;
 }
 
-static uint64_t sifive_pdma_read(void *opaque, hwaddr offset, unsigned size)
+static uint64_t sifive_pdma_readq(SiFivePDMAState *s, int ch, hwaddr offset)
 {
-    SiFivePDMAState *s = opaque;
-    int ch = SIFIVE_PDMA_CHAN_NO(offset);
     uint64_t val = 0;
 
-    if (ch >= SIFIVE_PDMA_CHANS) {
-        qemu_log_mask(LOG_GUEST_ERROR, "%s: Invalid channel no %d\n",
-                      __func__, ch);
-        return 0;
+    offset &= 0xfff;
+    switch (offset) {
+    case DMA_NEXT_BYTES:
+        val = s->chan[ch].next_bytes;
+        break;
+    case DMA_NEXT_DST:
+        val = s->chan[ch].next_dst;
+        break;
+    case DMA_NEXT_SRC:
+        val = s->chan[ch].next_src;
+        break;
+    case DMA_EXEC_BYTES:
+        val = s->chan[ch].exec_bytes;
+        break;
+    case DMA_EXEC_DST:
+        val = s->chan[ch].exec_dst;
+        break;
+    case DMA_EXEC_SRC:
+        val = s->chan[ch].exec_src;
+        break;
+    default:
+        qemu_log_mask(LOG_GUEST_ERROR,
+                      "%s: Unexpected 64-bit access to 0x%" HWADDR_PRIX "\n",
+                      __func__, offset);
+        break;
     }
 
+    return val;
+}
+
+static uint32_t sifive_pdma_readl(SiFivePDMAState *s, int ch, hwaddr offset)
+{
+    uint32_t val = 0;
+
     offset &= 0xfff;
     switch (offset) {
     case DMA_CONTROL:
@@ -XXX,XX +XXX,XX @@ static uint64_t sifive_pdma_read(void *opaque, hwaddr offset, unsigned size)
         val = s->chan[ch].next_config;
         break;
     case DMA_NEXT_BYTES:
-        val = s->chan[ch].next_bytes;
+        val = extract64(s->chan[ch].next_bytes, 0, 32);
+        break;
+    case DMA_NEXT_BYTES + 4:
+        val = extract64(s->chan[ch].next_bytes, 32, 32);
         break;
     case DMA_NEXT_DST:
-        val = s->chan[ch].next_dst;
+        val = extract64(s->chan[ch].next_dst, 0, 32);
+        break;
+    case DMA_NEXT_DST + 4:
+        val = extract64(s->chan[ch].next_dst, 32, 32);
         break;
     case DMA_NEXT_SRC:
-        val = s->chan[ch].next_src;
+        val = extract64(s->chan[ch].next_src, 0, 32);
+        break;
+    case DMA_NEXT_SRC + 4:
+        val = extract64(s->chan[ch].next_src, 32, 32);
         break;
     case DMA_EXEC_CONFIG:
         val = s->chan[ch].exec_config;
         break;
     case DMA_EXEC_BYTES:
-        val = s->chan[ch].exec_bytes;
+        val = extract64(s->chan[ch].exec_bytes, 0, 32);
+        break;
+    case DMA_EXEC_BYTES + 4:
+        val = extract64(s->chan[ch].exec_bytes, 32, 32);
         break;
     case DMA_EXEC_DST:
-        val = s->chan[ch].exec_dst;
+        val = extract64(s->chan[ch].exec_dst, 0, 32);
+        break;
+    case DMA_EXEC_DST + 4:
+        val = extract64(s->chan[ch].exec_dst, 32, 32);
         break;
     case DMA_EXEC_SRC:
-        val = s->chan[ch].exec_src;
+        val = extract64(s->chan[ch].exec_src, 0, 32);
+        break;
+    case DMA_EXEC_SRC + 4:
+        val = extract64(s->chan[ch].exec_src, 32, 32);
         break;
     default:
-        qemu_log_mask(LOG_GUEST_ERROR, "%s: Bad offset 0x%" HWADDR_PRIX "\n",
+        qemu_log_mask(LOG_GUEST_ERROR,
+                      "%s: Unexpected 32-bit access to 0x%" HWADDR_PRIX "\n",
                       __func__, offset);
         break;
     }
@@ -XXX,XX +XXX,XX @@ static uint64_t sifive_pdma_read(void *opaque, hwaddr offset, unsigned size)
     return val;
 }
 
-static void sifive_pdma_write(void *opaque, hwaddr offset,
-                              uint64_t value, unsigned size)
+static uint64_t sifive_pdma_read(void *opaque, hwaddr offset, unsigned size)
 {
     SiFivePDMAState *s = opaque;
     int ch = SIFIVE_PDMA_CHAN_NO(offset);
-    bool claimed, run;
+    uint64_t val = 0;
 
     if (ch >= SIFIVE_PDMA_CHANS) {
         qemu_log_mask(LOG_GUEST_ERROR, "%s: Invalid channel no %d\n",
                       __func__, ch);
-        return;
+        return 0;
+    }
+
+    switch (size) {
+    case 8:
+        val = sifive_pdma_readq(s, ch, offset);
+        break;
+    case 4:
+        val = sifive_pdma_readl(s, ch, offset);
+        break;
+    default:
+        qemu_log_mask(LOG_GUEST_ERROR, "%s: Invalid read size %u to PDMA\n",
+                      __func__, size);
+        return 0;
     }
 
+    return val;
+}
+
+static void sifive_pdma_writeq(SiFivePDMAState *s, int ch,
+                               hwaddr offset, uint64_t value)
+{
+    offset &= 0xfff;
+    switch (offset) {
+    case DMA_NEXT_BYTES:
+        s->chan[ch].next_bytes = value;
+        break;
+    case DMA_NEXT_DST:
+        s->chan[ch].next_dst = value;
+        break;
+    case DMA_NEXT_SRC:
+        s->chan[ch].next_src = value;
+        break;
+    case DMA_EXEC_BYTES:
+    case DMA_EXEC_DST:
+    case DMA_EXEC_SRC:
+        /* these are read-only registers */
+        break;
+    default:
+        qemu_log_mask(LOG_GUEST_ERROR,
+                      "%s: Unexpected 64-bit access to 0x%" HWADDR_PRIX "\n",
+                      __func__, offset);
+        break;
+    }
+}
+
+static void sifive_pdma_writel(SiFivePDMAState *s, int ch,
+                               hwaddr offset, uint32_t value)
+{
+    bool claimed, run;
+
     offset &= 0xfff;
     switch (offset) {
     case DMA_CONTROL:
@@ -XXX,XX +XXX,XX @@ static void sifive_pdma_write(void *opaque, hwaddr offset,
         s->chan[ch].next_config = value;
         break;
     case DMA_NEXT_BYTES:
-        s->chan[ch].next_bytes = value;
+        s->chan[ch].next_bytes =
+            deposit64(s->chan[ch].next_bytes, 0, 32, value);
+        break;
+    case DMA_NEXT_BYTES + 4:
+        s->chan[ch].next_bytes =
+            deposit64(s->chan[ch].next_bytes, 32, 32, value);
         break;
     case DMA_NEXT_DST:
-        s->chan[ch].next_dst = value;
+        s->chan[ch].next_dst = deposit64(s->chan[ch].next_dst, 0, 32, value);
+        break;
+    case DMA_NEXT_DST + 4:
+        s->chan[ch].next_dst = deposit64(s->chan[ch].next_dst, 32, 32, value);
         break;
     case DMA_NEXT_SRC:
-        s->chan[ch].next_src = value;
+        s->chan[ch].next_src = deposit64(s->chan[ch].next_src, 0, 32, value);
+        break;
+    case DMA_NEXT_SRC + 4:
+        s->chan[ch].next_src = deposit64(s->chan[ch].next_src, 32, 32, value);
         break;
     case DMA_EXEC_CONFIG:
     case DMA_EXEC_BYTES:
+    case DMA_EXEC_BYTES + 4:
     case DMA_EXEC_DST:
+    case DMA_EXEC_DST + 4:
     case DMA_EXEC_SRC:
+    case DMA_EXEC_SRC + 4:
         /* these are read-only registers */
         break;
     default:
-        qemu_log_mask(LOG_GUEST_ERROR, "%s: Bad offset 0x%" HWADDR_PRIX "\n",
+        qemu_log_mask(LOG_GUEST_ERROR,
+                      "%s: Unexpected 32-bit access to 0x%" HWADDR_PRIX "\n",
                       __func__, offset);
         break;
     }
 }
 
+static void sifive_pdma_write(void *opaque, hwaddr offset,
+                              uint64_t value, unsigned size)
+{
+    SiFivePDMAState *s = opaque;
+    int ch = SIFIVE_PDMA_CHAN_NO(offset);
+
+    if (ch >= SIFIVE_PDMA_CHANS) {
+        qemu_log_mask(LOG_GUEST_ERROR, "%s: Invalid channel no %d\n",
+                      __func__, ch);
+        return;
+    }
+
+    switch (size) {
+    case 8:
+        sifive_pdma_writeq(s, ch, offset, value);
+        break;
+    case 4:
+        sifive_pdma_writel(s, ch, offset, (uint32_t) value);
+        break;
+    default:
+        qemu_log_mask(LOG_GUEST_ERROR, "%s: Invalid write size %u to PDMA\n",
+                      __func__, size);
+        break;
+    }
+}
+
 static const MemoryRegionOps sifive_pdma_ops = {
     .read = sifive_pdma_read,
     .write = sifive_pdma_write,
-- 
2.31.1

From: Jim Shu <jim.shu@sifive.com>

It's obvious that PDMA supports 64-bit access of 64-bit registers, and
in previous commit, we confirm that PDMA supports 32-bit access of
both 32/64-bit registers. Thus, we configure 32/64-bit memory access
of PDMA registers as valid in general.

Signed-off-by: Jim Shu <jim.shu@sifive.com>
Reviewed-by: Frank Chang <frank.chang@sifive.com>
Reviewed-by: Philippe Mathieu-Daudé <philmd@redhat.com>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Reviewed-by: Bin Meng <bmeng.cn@gmail.com>
Tested-by: Bin Meng <bmeng.cn@gmail.com>
Message-id: 20220104063408.658169-3-jim.shu@sifive.com
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 hw/dma/sifive_pdma.c | 4 ++++
 1 file changed, 4 insertions(+)

diff --git a/hw/dma/sifive_pdma.c b/hw/dma/sifive_pdma.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/dma/sifive_pdma.c
+++ b/hw/dma/sifive_pdma.c
@@ -XXX,XX +XXX,XX @@ static const MemoryRegionOps sifive_pdma_ops = {
     .impl = {
         .min_access_size = 4,
         .max_access_size = 8,
+    },
+    .valid = {
+        .min_access_size = 4,
+        .max_access_size = 8,
     }
 };
 
-- 
2.31.1

From: Alistair Francis <alistair.francis@wdc.com>

Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Reviewed-by: Bin Meng <bmeng.cn@gmail.com>
Message-Id: <20220105213937.1113508-2-alistair.francis@opensource.wdc.com>
---
 hw/intc/sifive_plic.c | 18 ++++++++++++++++++
 1 file changed, 18 insertions(+)

diff --git a/hw/intc/sifive_plic.c b/hw/intc/sifive_plic.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/intc/sifive_plic.c
+++ b/hw/intc/sifive_plic.c
@@ -XXX,XX +XXX,XX @@ static const MemoryRegionOps sifive_plic_ops = {
     }
 };
 
+static void sifive_plic_reset(DeviceState *dev)
+{
+    SiFivePLICState *s = SIFIVE_PLIC(dev);
+    int i;
+
+    memset(s->source_priority, 0, sizeof(uint32_t) * s->num_sources);
+    memset(s->target_priority, 0, sizeof(uint32_t) * s->num_addrs);
+    memset(s->pending, 0, sizeof(uint32_t) * s->bitfield_words);
+    memset(s->claimed, 0, sizeof(uint32_t) * s->bitfield_words);
+    memset(s->enable, 0, sizeof(uint32_t) * s->num_enables);
+
+    for (i = 0; i < s->num_harts; i++) {
+        qemu_set_irq(s->m_external_irqs[i], 0);
+        qemu_set_irq(s->s_external_irqs[i], 0);
+    }
+}
+
 /*
  * parse PLIC hart/mode address offset config
  *
@@ -XXX,XX +XXX,XX @@ static void sifive_plic_class_init(ObjectClass *klass, void *data)
 {
     DeviceClass *dc = DEVICE_CLASS(klass);
 
+    dc->reset = sifive_plic_reset;
     device_class_set_props(dc, sifive_plic_properties);
     dc->realize = sifive_plic_realize;
     dc->vmsd = &vmstate_sifive_plic;
-- 
2.31.1

From: Alistair Francis <alistair.francis@wdc.com>

Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
Reviewed-by: Bin Meng <bmeng.cn@gmail.com>
Message-Id: <20220105213937.1113508-3-alistair.francis@opensource.wdc.com>
---
 hw/intc/sifive_plic.c | 76 +++++++++++++++----------------------------
 1 file changed, 27 insertions(+), 49 deletions(-)

diff --git a/hw/intc/sifive_plic.c b/hw/intc/sifive_plic.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/intc/sifive_plic.c
+++ b/hw/intc/sifive_plic.c
@@ -XXX,XX +XXX,XX @@
 
 #define RISCV_DEBUG_PLIC 0
 
+static bool addr_between(uint32_t addr, uint32_t base, uint32_t num)
+{
+    return addr >= base && addr - base < num;
+}
+
 static PLICMode char_to_mode(char c)
 {
     switch (c) {
@@ -XXX,XX +XXX,XX @@ static void sifive_plic_write(void *opaque, hwaddr addr, uint64_t value,
 {
     SiFivePLICState *plic = opaque;
 
-    /* writes must be 4 byte words */
-    if ((addr & 0x3) != 0) {
-        goto err;
-    }
-
-    if (addr >= plic->priority_base && /* 4 bytes per source */
-        addr < plic->priority_base + (plic->num_sources << 2))
-    {
+    if (addr_between(addr, plic->priority_base, plic->num_sources << 2)) {
         uint32_t irq = ((addr - plic->priority_base) >> 2) + 1;
+
         plic->source_priority[irq] = value & 7;
-        if (RISCV_DEBUG_PLIC) {
-            qemu_log("plic: write priority: irq=%d priority=%d\n",
-                irq, plic->source_priority[irq]);
-        }
         sifive_plic_update(plic);
-        return;
-    } else if (addr >= plic->pending_base && /* 1 bit per source */
-               addr < plic->pending_base + (plic->num_sources >> 3))
-    {
+    } else if (addr_between(addr, plic->pending_base,
+                            plic->num_sources >> 3)) {
         qemu_log_mask(LOG_GUEST_ERROR,
                       "%s: invalid pending write: 0x%" HWADDR_PRIx "",
                       __func__, addr);
-        return;
-    } else if (addr >= plic->enable_base && /* 1 bit per source */
-        addr < plic->enable_base + plic->num_addrs * plic->enable_stride)
-    {
+    } else if (addr_between(addr, plic->enable_base,
+                            plic->num_addrs * plic->enable_stride)) {
         uint32_t addrid = (addr - plic->enable_base) / plic->enable_stride;
         uint32_t wordid = (addr & (plic->enable_stride - 1)) >> 2;
+
         if (wordid < plic->bitfield_words) {
             plic->enable[addrid * plic->bitfield_words + wordid] = value;
-            if (RISCV_DEBUG_PLIC) {
-                qemu_log("plic: write enable: hart%d-%c word=%d value=%x\n",
-                    plic->addr_config[addrid].hartid,
-                    mode_to_char(plic->addr_config[addrid].mode), wordid,
-                    plic->enable[addrid * plic->bitfield_words + wordid]);
-            }
-            return;
+        } else {
+            qemu_log_mask(LOG_GUEST_ERROR,
+                          "%s: Invalid enable write 0x%" HWADDR_PRIx "\n",
+                          __func__, addr);
         }
-    } else if (addr >= plic->context_base && /* 4 bytes per reg */
-        addr < plic->context_base + plic->num_addrs * plic->context_stride)
-    {
+    } else if (addr_between(addr, plic->context_base,
+                            plic->num_addrs * plic->context_stride)) {
         uint32_t addrid = (addr - plic->context_base) / plic->context_stride;
         uint32_t contextid = (addr & (plic->context_stride - 1));
+
         if (contextid == 0) {
-            if (RISCV_DEBUG_PLIC) {
-                qemu_log("plic: write priority: hart%d-%c priority=%x\n",
-                    plic->addr_config[addrid].hartid,
-                    mode_to_char(plic->addr_config[addrid].mode),
-                    plic->target_priority[addrid]);
-            }
             if (value <= plic->num_priorities) {
                 plic->target_priority[addrid] = value;
                 sifive_plic_update(plic);
             }
-            return;
         } else if (contextid == 4) {
-            if (RISCV_DEBUG_PLIC) {
-                qemu_log("plic: write claim: hart%d-%c irq=%x\n",
-                    plic->addr_config[addrid].hartid,
-                    mode_to_char(plic->addr_config[addrid].mode),
-                    (uint32_t)value);
-            }
             if (value < plic->num_sources) {
                 sifive_plic_set_claimed(plic, value, false);
                 sifive_plic_update(plic);
             }
-            return;
+        } else {
+            qemu_log_mask(LOG_GUEST_ERROR,
+                          "%s: Invalid context write 0x%" HWADDR_PRIx "\n",
+                          __func__, addr);
         }
+    } else {
+        qemu_log_mask(LOG_GUEST_ERROR,
+                      "%s: Invalid register write 0x%" HWADDR_PRIx "\n",
+                      __func__, addr);
     }
-
-err:
-    qemu_log_mask(LOG_GUEST_ERROR,
-                  "%s: Invalid register write 0x%" HWADDR_PRIx "\n",
-                  __func__, addr);
 }
 
 static const MemoryRegionOps sifive_plic_ops = {
-- 
2.31.1

From: Alistair Francis <alistair.francis@wdc.com>

Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
Reviewed-by: Bin Meng <bmeng.cn@gmail.com>
Message-Id: <20220105213937.1113508-4-alistair.francis@opensource.wdc.com>
---
 hw/intc/sifive_plic.c | 55 +++++++++----------------------------------
 1 file changed, 11 insertions(+), 44 deletions(-)

diff --git a/hw/intc/sifive_plic.c b/hw/intc/sifive_plic.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/intc/sifive_plic.c
+++ b/hw/intc/sifive_plic.c
@@ -XXX,XX +XXX,XX @@ static uint64_t sifive_plic_read(void *opaque, hwaddr addr, unsigned size)
 {
     SiFivePLICState *plic = opaque;
 
-    /* writes must be 4 byte words */
-    if ((addr & 0x3) != 0) {
-        goto err;
-    }
-
-    if (addr >= plic->priority_base && /* 4 bytes per source */
-        addr < plic->priority_base + (plic->num_sources << 2))
-    {
+    if (addr_between(addr, plic->priority_base, plic->num_sources << 2)) {
         uint32_t irq = ((addr - plic->priority_base) >> 2) + 1;
-        if (RISCV_DEBUG_PLIC) {
-            qemu_log("plic: read priority: irq=%d priority=%d\n",
-                irq, plic->source_priority[irq]);
-        }
+
         return plic->source_priority[irq];
-    } else if (addr >= plic->pending_base && /* 1 bit per source */
-               addr < plic->pending_base + (plic->num_sources >> 3))
-    {
+    } else if (addr_between(addr, plic->pending_base, plic->num_sources >> 3)) {
         uint32_t word = (addr - plic->pending_base) >> 2;
-        if (RISCV_DEBUG_PLIC) {
-            qemu_log("plic: read pending: word=%d value=%d\n",
-                word, plic->pending[word]);
-        }
+
         return plic->pending[word];
-    } else if (addr >= plic->enable_base && /* 1 bit per source */
-             addr < plic->enable_base + plic->num_addrs * plic->enable_stride)
-    {
+    } else if (addr_between(addr, plic->enable_base,
+                            plic->num_addrs * plic->enable_stride)) {
         uint32_t addrid = (addr - plic->enable_base) / plic->enable_stride;
         uint32_t wordid = (addr & (plic->enable_stride - 1)) >> 2;
+
         if (wordid < plic->bitfield_words) {
-            if (RISCV_DEBUG_PLIC) {
-                qemu_log("plic: read enable: hart%d-%c word=%d value=%x\n",
-                    plic->addr_config[addrid].hartid,
-                    mode_to_char(plic->addr_config[addrid].mode), wordid,
-                    plic->enable[addrid * plic->bitfield_words + wordid]);
-            }
             return plic->enable[addrid * plic->bitfield_words + wordid];
         }
-    } else if (addr >= plic->context_base && /* 1 bit per source */
-             addr < plic->context_base + plic->num_addrs * plic->context_stride)
-    {
+    } else if (addr_between(addr, plic->context_base,
+                            plic->num_addrs * plic->context_stride)) {
         uint32_t addrid = (addr - plic->context_base) / plic->context_stride;
         uint32_t contextid = (addr & (plic->context_stride - 1));
+
         if (contextid == 0) {
-            if (RISCV_DEBUG_PLIC) {
-                qemu_log("plic: read priority: hart%d-%c priority=%x\n",
-                    plic->addr_config[addrid].hartid,
-                    mode_to_char(plic->addr_config[addrid].mode),
-                    plic->target_priority[addrid]);
-            }
             return plic->target_priority[addrid];
         } else if (contextid == 4) {
             uint32_t value = sifive_plic_claim(plic, addrid);
-            if (RISCV_DEBUG_PLIC) {
-                qemu_log("plic: read claim: hart%d-%c irq=%x\n",
-                    plic->addr_config[addrid].hartid,
-                    mode_to_char(plic->addr_config[addrid].mode),
-                    value);
-            }
+
             sifive_plic_update(plic);
             return value;
         }
     }
 
-err:
     qemu_log_mask(LOG_GUEST_ERROR,
                   "%s: Invalid register read 0x%" HWADDR_PRIx "\n",
                   __func__, addr);
-- 
2.31.1

From: Alistair Francis <alistair.francis@wdc.com>

We can remove the original sifive_plic_irqs_pending() function and
instead just use the sifive_plic_claim() function (renamed to
sifive_plic_claimed()) to determine if any interrupts are pending.

This requires move the side effects outside of sifive_plic_claimed(),
but as they are only invoked once that isn't a problem.

We have also removed all of the old #ifdef debugging logs, so let's
cleanup the last remaining debug function while we are here.

Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
Reviewed-by: Bin Meng <bmeng.cn@gmail.com>
Message-Id: <20220105213937.1113508-5-alistair.francis@opensource.wdc.com>
---
 hw/intc/sifive_plic.c | 109 +++++++++---------------------------------
 1 file changed, 22 insertions(+), 87 deletions(-)

diff --git a/hw/intc/sifive_plic.c b/hw/intc/sifive_plic.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/intc/sifive_plic.c
+++ b/hw/intc/sifive_plic.c
@@ -XXX,XX +XXX,XX @@
 #include "migration/vmstate.h"
 #include "hw/irq.h"
 
-#define RISCV_DEBUG_PLIC 0
-
 static bool addr_between(uint32_t addr, uint32_t base, uint32_t num)
 {
     return addr >= base && addr - base < num;
@@ -XXX,XX +XXX,XX @@ static PLICMode char_to_mode(char c)
     }
 }
 
-static char mode_to_char(PLICMode m)
-{
-    switch (m) {
-    case PLICMode_U: return 'U';
-    case PLICMode_S: return 'S';
-    case PLICMode_H: return 'H';
-    case PLICMode_M: return 'M';
-    default: return '?';
-    }
-}
-
-static void sifive_plic_print_state(SiFivePLICState *plic)
-{
-    int i;
-    int addrid;
-
-    /* pending */
-    qemu_log("pending       : ");
-    for (i = plic->bitfield_words - 1; i >= 0; i--) {
-        qemu_log("%08x", plic->pending[i]);
-    }
-    qemu_log("\n");
-
-    /* pending */
-    qemu_log("claimed       : ");
-    for (i = plic->bitfield_words - 1; i >= 0; i--) {
-        qemu_log("%08x", plic->claimed[i]);
-    }
-    qemu_log("\n");
-
-    for (addrid = 0; addrid < plic->num_addrs; addrid++) {
-        qemu_log("hart%d-%c enable: ",
-            plic->addr_config[addrid].hartid,
-            mode_to_char(plic->addr_config[addrid].mode));
-        for (i = plic->bitfield_words - 1; i >= 0; i--) {
-            qemu_log("%08x", plic->enable[addrid * plic->bitfield_words + i]);
-        }
-        qemu_log("\n");
-    }
-}
-
 static uint32_t atomic_set_masked(uint32_t *a, uint32_t mask, uint32_t value)
 {
     uint32_t old, new, cmp = qatomic_read(a);
@@ -XXX,XX +XXX,XX @@ static void sifive_plic_set_claimed(SiFivePLICState *plic, int irq, bool level)
     atomic_set_masked(&plic->claimed[irq >> 5], 1 << (irq & 31), -!!level);
 }
 
-static int sifive_plic_irqs_pending(SiFivePLICState *plic, uint32_t addrid)
+static uint32_t sifive_plic_claimed(SiFivePLICState *plic, uint32_t addrid)
 {
+    uint32_t max_irq = 0;
+    uint32_t max_prio = plic->target_priority[addrid];
     int i, j;
+
     for (i = 0; i < plic->bitfield_words; i++) {
         uint32_t pending_enabled_not_claimed =
-            (plic->pending[i] & ~plic->claimed[i]) &
-            plic->enable[addrid * plic->bitfield_words + i];
+                        (plic->pending[i] & ~plic->claimed[i]) &
+                            plic->enable[addrid * plic->bitfield_words + i];
+
         if (!pending_enabled_not_claimed) {
             continue;
         }
+
         for (j = 0; j < 32; j++) {
             int irq = (i << 5) + j;
             uint32_t prio = plic->source_priority[irq];
             int enabled = pending_enabled_not_claimed & (1 << j);
-            if (enabled && prio > plic->target_priority[addrid]) {
-                return 1;
+
+            if (enabled && prio > max_prio) {
+                max_irq = irq;
+                max_prio = prio;
             }
         }
     }
-    return 0;
+
+    return max_irq;
 }
 
 static void sifive_plic_update(SiFivePLICState *plic)
@@ -XXX,XX +XXX,XX @@ static void sifive_plic_update(SiFivePLICState *plic)
     for (addrid = 0; addrid < plic->num_addrs; addrid++) {
         uint32_t hartid = plic->addr_config[addrid].hartid;
         PLICMode mode = plic->addr_config[addrid].mode;
-        int level = sifive_plic_irqs_pending(plic, addrid);
+        bool level = !!sifive_plic_claimed(plic, addrid);
 
         switch (mode) {
         case PLICMode_M:
@@ -XXX,XX +XXX,XX @@ static void sifive_plic_update(SiFivePLICState *plic)
             break;
         }
     }
-
-    if (RISCV_DEBUG_PLIC) {
-        sifive_plic_print_state(plic);
-    }
-}
-
-static uint32_t sifive_plic_claim(SiFivePLICState *plic, uint32_t addrid)
-{
-    int i, j;
-    uint32_t max_irq = 0;
-    uint32_t max_prio = plic->target_priority[addrid];
-
-    for (i = 0; i < plic->bitfield_words; i++) {
-        uint32_t pending_enabled_not_claimed =
-            (plic->pending[i] & ~plic->claimed[i]) &
-            plic->enable[addrid * plic->bitfield_words + i];
-        if (!pending_enabled_not_claimed) {
-            continue;
-        }
-        for (j = 0; j < 32; j++) {
-            int irq = (i << 5) + j;
-            uint32_t prio = plic->source_priority[irq];
-            int enabled = pending_enabled_not_claimed & (1 << j);
-            if (enabled && prio > max_prio) {
-                max_irq = irq;
-                max_prio = prio;
-            }
-        }
-    }
-
-    if (max_irq) {
-        sifive_plic_set_pending(plic, max_irq, false);
-        sifive_plic_set_claimed(plic, max_irq, true);
-    }
-    return max_irq;
 }
 
 static uint64_t sifive_plic_read(void *opaque, hwaddr addr, unsigned size)
@@ -XXX,XX +XXX,XX @@ static uint64_t sifive_plic_read(void *opaque, hwaddr addr, unsigned size)
         if (contextid == 0) {
             return plic->target_priority[addrid];
         } else if (contextid == 4) {
-            uint32_t value = sifive_plic_claim(plic, addrid);
+            uint32_t max_irq = sifive_plic_claimed(plic, addrid);
+
+            if (max_irq) {
+                sifive_plic_set_pending(plic, max_irq, false);
+                sifive_plic_set_claimed(plic, max_irq, true);
+            }
 
             sifive_plic_update(plic);
-            return value;
+            return max_irq;
         }
     }
 
-- 
2.31.1

From: Alistair Francis <alistair.francis@wdc.com>

The Hypervisor spec is now frozen, so remove the experimental tag.

Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
Reviewed-by: Anup Patel <anup.patel@wdc.com>
Reviewed-by: Bin Meng <bmeng.cn@gmail.com>
Message-Id: <20220105213937.1113508-6-alistair.francis@opensource.wdc.com>
---
 target/riscv/cpu.c | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
index XXXXXXX..XXXXXXX 100644
--- a/target/riscv/cpu.c
+++ b/target/riscv/cpu.c
@@ -XXX,XX +XXX,XX @@ static Property riscv_cpu_properties[] = {
     DEFINE_PROP_BOOL("s", RISCVCPU, cfg.ext_s, true),
     DEFINE_PROP_BOOL("u", RISCVCPU, cfg.ext_u, true),
     DEFINE_PROP_BOOL("v", RISCVCPU, cfg.ext_v, false),
+    DEFINE_PROP_BOOL("h", RISCVCPU, cfg.ext_h, false),
     DEFINE_PROP_BOOL("Counters", RISCVCPU, cfg.ext_counters, true),
     DEFINE_PROP_BOOL("Zifencei", RISCVCPU, cfg.ext_ifencei, true),
     DEFINE_PROP_BOOL("Zicsr", RISCVCPU, cfg.ext_icsr, true),
@@ -XXX,XX +XXX,XX @@ static Property riscv_cpu_properties[] = {
     DEFINE_PROP_BOOL("zbb", RISCVCPU, cfg.ext_zbb, true),
     DEFINE_PROP_BOOL("zbc", RISCVCPU, cfg.ext_zbc, true),
     DEFINE_PROP_BOOL("zbs", RISCVCPU, cfg.ext_zbs, true),
-    DEFINE_PROP_BOOL("x-h", RISCVCPU, cfg.ext_h, false),
     DEFINE_PROP_BOOL("x-j", RISCVCPU, cfg.ext_j, false),
     /* ePMP 0.9.3 */
     DEFINE_PROP_BOOL("x-epmp", RISCVCPU, cfg.epmp, false),
-- 
2.31.1

From: Alistair Francis <alistair.francis@wdc.com>

Let's enable the Hypervisor extension by default. This doesn't affect
named CPUs (such as lowrisc-ibex or sifive-u54) but does enable the
Hypervisor extensions by default for the virt machine.

Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
Reviewed-by: Anup Patel <anup.patel@wdc.com>
Reviewed-by: Bin Meng <bmeng.cn@gmail.com>
Message-Id: <20220105213937.1113508-7-alistair.francis@opensource.wdc.com>
---
 target/riscv/cpu.c | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

From: Alistair Francis <alistair.francis@wdc.com>

When realising the SoC use error_fatal instead of error_abort as the
process can fail and report useful information to the user.

Currently a user can see this:

$ ../qemu/bld/qemu-system-riscv64 -M sifive_u -S -monitor stdio -display none -drive if=pflash
    QEMU 6.1.93 monitor - type 'help' for more information
    (qemu) Unexpected error in sifive_u_otp_realize() at ../hw/misc/sifive_u_otp.c:229:
    qemu-system-riscv64: OTP drive size < 16K
    Aborted (core dumped)

Which this patch addresses

Reported-by: Markus Armbruster <armbru@redhat.com>
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Reviewed-by: Markus Armbruster <armbru@redhat.com>
Reviewed-by: Bin Meng <bmeng.cn@gmail.com>
Tested-by: Bin Meng <bmeng.cn@gmail.com>
Message-Id: <20220105213937.1113508-8-alistair.francis@opensource.wdc.com>
---
 hw/riscv/microchip_pfsoc.c | 2 +-
 hw/riscv/opentitan.c       | 2 +-
 hw/riscv/sifive_e.c        | 2 +-
 hw/riscv/sifive_u.c        | 2 +-
 4 files changed, 4 insertions(+), 4 deletions(-)

diff --git a/hw/riscv/microchip_pfsoc.c b/hw/riscv/microchip_pfsoc.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/microchip_pfsoc.c
+++ b/hw/riscv/microchip_pfsoc.c
@@ -XXX,XX +XXX,XX @@ static void microchip_icicle_kit_machine_init(MachineState *machine)
     /* Initialize SoC */
     object_initialize_child(OBJECT(machine), "soc", &s->soc,
                             TYPE_MICROCHIP_PFSOC);
-    qdev_realize(DEVICE(&s->soc), NULL, &error_abort);
+    qdev_realize(DEVICE(&s->soc), NULL, &error_fatal);
 
     /* Split RAM into low and high regions using aliases to machine->ram */
     mem_low_size = memmap[MICROCHIP_PFSOC_DRAM_LO].size;
diff --git a/hw/riscv/opentitan.c b/hw/riscv/opentitan.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/opentitan.c
+++ b/hw/riscv/opentitan.c
@@ -XXX,XX +XXX,XX @@ static void opentitan_board_init(MachineState *machine)
     /* Initialize SoC */
     object_initialize_child(OBJECT(machine), "soc", &s->soc,
                             TYPE_RISCV_IBEX_SOC);
-    qdev_realize(DEVICE(&s->soc), NULL, &error_abort);
+    qdev_realize(DEVICE(&s->soc), NULL, &error_fatal);
 
     memory_region_add_subregion(sys_mem,
         memmap[IBEX_DEV_RAM].base, machine->ram);
diff --git a/hw/riscv/sifive_e.c b/hw/riscv/sifive_e.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/sifive_e.c
+++ b/hw/riscv/sifive_e.c
@@ -XXX,XX +XXX,XX @@ static void sifive_e_machine_init(MachineState *machine)
 
     /* Initialize SoC */
     object_initialize_child(OBJECT(machine), "soc", &s->soc, TYPE_RISCV_E_SOC);
-    qdev_realize(DEVICE(&s->soc), NULL, &error_abort);
+    qdev_realize(DEVICE(&s->soc), NULL, &error_fatal);
 
     /* Data Tightly Integrated Memory */
     memory_region_add_subregion(sys_mem,
diff --git a/hw/riscv/sifive_u.c b/hw/riscv/sifive_u.c
index XXXXXXX..XXXXXXX 100644
--- a/hw/riscv/sifive_u.c
+++ b/hw/riscv/sifive_u.c
@@ -XXX,XX +XXX,XX @@ static void sifive_u_machine_init(MachineState *machine)
                              &error_abort);
     object_property_set_str(OBJECT(&s->soc), "cpu-type", machine->cpu_type,
                              &error_abort);
-    qdev_realize(DEVICE(&s->soc), NULL, &error_abort);
+    qdev_realize(DEVICE(&s->soc), NULL, &error_fatal);
 
     /* register RAM */
     memory_region_add_subregion(system_memory, memmap[SIFIVE_U_DEV_DRAM].base,
-- 
2.31.1

From: Bin Meng <bmeng.cn@gmail.com>

Upgrade OpenSBI from v0.9 to v1.0 and the pre-built bios images.

The v1.0 release includes the following commits:

ec5274b platform: implement K210 system reset
5487cf0 include: sbi: Simplify HSM state define names
8df1f9a lib: sbi: Use SBI_HSM_STATE_xyz defines instead of SBI_STATE_xyz defines
7c867fd lib: sbi: Rename sbi_hsm_hart_started_mask() function
638c948 lib: sbi: Remove redundant sbi_hsm_hart_started() function
ca864a9 lib: sbi: Fix error codes returned by HSM start() and stop() functions
6290a22 include: sbi: Add HSM suspend related defines
4b05df6 lib: sbi: Add sbi_hart_reinit() function
807d71c include: sbi: Add hart_suspend() platform callback
7475689 lib: sbi: Implement SBI HSM suspend function
b9cf617 include: sbi: Upgrade SBI implementation version to v0.3
50d4fde lib: Remove redundant sbi_platform_ipi_clear() calls
ff5bd94 include: sbi: SBI function IDs for RFENCE extension
22d8ee9 firmware: Use lla to access all global symbols
0f20e8a firmware: Support position independent execution
ddad02d lib: sbi: illegal CSR 0x306 access in hpm_allowed()
bfc85c7 include: headers: Replace __ASSEMBLY__ with __ASSEMBLER__
9190ad1 lib/utils: Support the official clint DT bindings
ca3f358 lib/utils: Drop the 'compat' parameter of fdt_plic_fixup()
4edc822 lib/utils: Support fixing up the official DT bindings of PLIC
4ef2f5d firware: optimize the exception exit code
3d8a952 lib: fix csr detect support
e71a7c1 firmware: Remove redundant add instruction from trap restore path
d4a94ea include: types: Add __aligned(x) to define the minimum alignement
d0e406f include: sbi: Allow direct initialization via SPIN_LOCK_INIT()
4d8e2f1 lib: sbi: Replace test-and-set locks by ticket locks
70ffc3e lib: sbi: fix atomic_add_return
27a16b1 docs: fix link to OpenPiton documentation
b1df1ac lib: sbi: Domains can be registered only before finalizing domains
7495bce lib: sbi: Add sbi_domain_memregion_init() API
4dc0001 lib: sbi: Add sbi_domain_root_add_memregion() API
8b56980 lib: utils/sys: Add CLINT memregion in the root domain
fc37c97 lib: sbi: Make the root domain instance global variable
e7e4bcd lib: utils: Copy over restricted root domain memregions to FDT domains
f41196a lib: sbi: Make sbi_domain_memregion_initfw() a local function
c5d0645 lib: utils: Implement "64bit-mmio" property parsing
49e422c lib: utils: reset: Add T-HEAD sample platform reset driver
0d56293 lib: sbi: Fix sbi_domain_root_add_memregion() for merging memregions
bf3ef53 firmware: Enable FW_PIC by default
1db8436 platform: Remove platform/thead
6d1642f docs: generic: Add T-HEAD C9xx series processors
a3689db lib: sbi: Remove domains_root_regions() platform callback
068ca08 lib: sbi: Simplify console platform operations
559a8f1 lib: sbi: Simplify timer platform operations
dc39c7b lib: sbi: Simplify ipi platform operations
043d088 lib: sbi: Simplify system reset platform operations
a84a1dd lib: sbi: Simplify HSM platform operations
e9a27ab lib: sbi: Show devices provided by platform in boot prints
632e27b docs/platform: sifive_fu540: Update U-Boot defconfig name
117fb6d lib: utils/serial: Add support for Gaisler APBUART
552f53f docs: platform: Sort platform names
d4177e7 docs: platform: Describe sifive_fu540 as supported generic platform
26998f3 platform: Remove sifive/fu540 platform
f90c4c2 lib: sbi: Have spinlock checks return bool
e822b75 lib: utils/serial: Support Synopsys DesignWare APB UART
6139ab2 Makefile: unconditionally disable SSP
c9ef2bc lib: utils: Add strncpy macro to libfdt_env.h
ee7c2b2 lib: utils/fdt: Don't use sbi_string functions
fe92347 lib: utils/fdt: Replace strcmp with strncmp
b2dbbc0 lib: Check region base for merging in sbi_domain_root_add_memregion()
54d7def lib: utils: Try other FDT drivers when we see SBI_ENODEV
d9ba653 docs: debugging OpenSBI
66c4fca lib: utils: consider ':' in stdout-path
f30b189 lib: sbi_scratch: remove owner from sbi_scratch_alloc_offset
a03ea2e platform: andes/ae350: Cosmetic fixes in plicsw.c
b32fac4 docs/platform: andes-ae350: Fix missing spaces
de446cc platform: andes/ae350: Drop plicsw_get_pending()
434198e platform: andes/ae350: Drop plicsw_ipi_sync()
1da3d80 lib: sbi_scratch: zero out scratch memory on all harts
360ab88 lib: utils: missing initialization in thead_reset_init
79f9b42 lib: sbi: Fix GET_F64_REG inline assembly
eb90e0a lib: utils/libfdt: Upgrade to v1.6.1 release
cdcf907 lib: sign conflict in sbi_tlb_entry_process()
9901794 lib: sign conflict in wake_coldboot_harts()
11c345f lib: simplify sbi_fifo_inplace_update()
4519e29 lib: utils/timer: Add ACLINT MTIMER library
5a049fe lib: utils/ipi: Add ACLINT MSWI library
bd5d208 lib: utils: Add FDT parsing API common for both ACLINT and CLINT
56fc5f7 lib: utils/ipi: Add FDT based ACLINT MSWI IPI driver
03d6bb5 lib: utils/timer: Add FDT based ACLINT MTIMER driver
a731c7e platform: Replace CLINT library usage with ACLINT library
b7f2cd2 lib: utils: reset: unify naming of 'sifive_test' device
197e089 docs/platform: thead-c9xx: Remove FW_PIC=y
17e23b6 platform: generic: Terminate platform.name with null
3e8b31a docs: Add device tree bindings for SBI PMU extension
fde28fa lib: sbi: Detect mcountinihibit support at runtime
d3a96cc lib: sbi: Remove stray '\' character
0829f2b lib: sbi: Detect number of bits implemented in mhpmcounter
9c9b4ad lib: sbi: Disable m/scounteren & enable mcountinhibit
41ae63c include: Add a list empty check function
fd9116b lib: sbi: Remove redundant boot time print statement
49966db lib: sbi: Use csr_read/write_num to read/update PMU counters
e7cc7a3 lib: sbi: Add PMU specific platform hooks
13d40f2 lib: sbi: Add PMU support
ae72ec0 utils: fdt: Add fdt helper functions to parse PMU DT nodes
37f9b0f lib: sbi: Implement SBI PMU extension
764a17d lib: sbi: Implement firmware counters
ec1b8bb lib: sbi: Improve TLB function naming
0e12aa8 platform: generic: Add PMU support
14c7f71 firmware: Minor optimization in _scratch_init()
dafaa0f docs: Correct a typo in platform_guide.md
abfce9b docs: Make <xyz> visible in the rendered platform guide
dcb756b firmware: Remove the sanity checks in fw_save_info()
b88b366 firmware: Define a macro for version of struct fw_dynamic_info
a76ac44 lib: sbi: Fix sbi_pmu_exit() for systems not having MCOUNTINHIBIT csr
7f1be8a fw_base: Don't mark fw_platform_init as both global and weak
397afe5 fw_base: Put data in .data rather than .text
a3d328a firmware: Explicitly pass -pie to the linker, not just the driver
09ad811 firmware: Only default FW_PIC to y if supported
2942777 Makefile: Support building with Clang and LLVM binutils
17729d4 lib: utils: Drop dependency on libgcc by importing part of FreeBSD's libquad
e931f38 lib: utils/fdt: Add fdt_parse_phandle_with_args() API
36b8eff lib: utils/gpio: Add generic GPIO configuration library
c14f1fe lib: utils/gpio: Add simple FDT based GPIO framework
4c3df2a lib: utils/gpio: Add minimal SiFive GPIO driver
e3d6919 lib: utils/reset: Add generic GPIO reset driver
7210e90 firmware: use __SIZEOF_LONG__ for field offsets in fw_dynamic.h
f3a8f60 include: types: Use __builtin_offsetof when supported
8a1475b firmware: Remove the unhelpful alignment codes before fdt relocation
a4555e5 docs: Document parameters passed to firmware and alignment requirement
2c74dc3 docs: Document FW_PIC compile time option
81eb708 README: Update toolchain information
9890391 Makefile: Manually forward RELAX_FLAG to the assembler when linking with LLD
74db0ac firmware: use _fw_start for load address
217d5e4 generic: fu740: add workaround for CIP-1200 errata
ce03c88 lib: utils: remove unused variable in fdt_reset_init
e928472 lib: utils: support both of gpio-poweroff, gpio-reset
d244f3d lib: sbi: Fix bug in strncmp function when count is 0
47a4765 lib: utils/fdt: Change addr and size to uint64_t
e0d1b9d lib: utils/timer: Allow separate base addresses for MTIME and MTIMECMP
7a3a0cc lib: utils: Extend fdt_get_node_addr_size() for multiple register sets
f3a0eb8 lib: utils/fdt: Extend fdt_parse_aclint_node() function
b35f782 lib: utils/timer: Allow ACLINT MTIMER supporting only 32-bit MMIO
7aa6c9a lib: utils/timer: Simplify MTIMER synchronization
33eac76 lib: sbi: Fix bug in sbi_ecall_rfence that misses checking
ee27437 lib: sbi_trap: Restore redirect for access faults
b1d3e91 payloads/test: Add support for SBI v0.2 ecalls
bd316e2 lib: sbi: Correct typo in faults delegation CSR name
c262306 lib: sbi: protect dprintf output with spinlock
1718b16 lib: sbi: Checking fifo validness in sbi_fifo_is_empty and is_full
bd35521 lib: sbi: Refine the way to construct platform features
0274a96 lib: utils/reset: Sort fdt_reset driver list
395ff7e lib: utils/reset: Add a sunxi watchdog reset driver
3477f08 lib: sbi: fix ctz bug
12753d2 lib: sbi: add some macros to detect BUG at runtime
51113fe lib: sbi: Add BUG() macro for csr_read/write_num() and misa_string()
72154f4 lib: utils/fdt: Add fdt_parse_timebase_frequency() function
12e7af9 lib: sbi: Add timer frequency to struct sbi_timer_device
6355155 lib: sbi: Print timer frequency at boot time
9d0ab35 lib: sbi: Add generic timer delay loop function
fa59dd3 lib: utils/reset: use sbi_timer_mdelay() in gpio reset driver
754d511 lib: utils: identify supported GPIO reset methods
516161c lib: sbi: convert reset to list
9283d50 lib: sbi: add priority for reset handler
c38973e lib: sbi: Save context for all non-retentive suspend types
67cbbcb lib: sbi: system reset with invalid parameters
422eda4 Makefile: Add build time and compiler info string
78c2b19 lib: utils/irqchip: Automatically delegate T-HEAD PLIC access
309e8bd lib: utils/reset: Register separate GPIO system reset devices
723aa88 lib: sbi: Refine addr format in sbi_printf
c891acc include: sbi_utils: Introduce an helper to get fdt base address
013ba4e lib: sbi: Fix GPA passed to __sbi_hfence_gvma_xyz() functions
0979ffd lib: utils/gpio: use list for drivers
2fe2f55 lib: sbi: move sbi_boot_print_general()
57f094e platform: generic: move fdt_reset_init to final_init
be245ac lib: sbi: error handling in fdt_reset_init()
a74daf2 riscv: Add new CSRs introduced by Sscofpmf[1] extension
7084ad9 lib: sbi: Update csr_read/write_num for PMU
867c653 lib: sbi: Detect Sscofpmf extension at run time
9134c36 lib: sbi: Delegate PMU counter overflow interrupt to S mode
730f01b lib: sbi: Support sscofpmf extension in OpenSBI
2363f95 lib: sbi: Always enable access for all counters
0c304b6 lib: sbi: Allow programmable counters to monitor cycle/instret events
1e14732 lib: sbi: Reset the mhpmevent value upon counter reset
b628cfd lib: sbi: Counter info width should be zero indexed
b28f070 lib: sbi: Enable PMU extension for platforms without mcountinhibit
15906a3 lib: utils: Rename the prefix in PMU DT properties
b8845e4 lib: sbi: Fix initial value mask while updating the counters
31fe5a7 lib: sbi: Fix PMP address bits detection
94eba23 lib: utils/reset: add priority to gpio reset
1d462e0 lib: utils/reset: separate driver init func
2c964a2 lib: utils/i2c: Add generic I2C configuration library
6ca6bca lib: utils/i2c: Add simple FDT based I2C framework
13a1158 lib: utils/i2c: Add minimal SiFive I2C driver
f374496 platform: sifive_fu740: add platform reset driver
d335a17 lib: sbi: clear pmpcfg.A before setting in pmp_set()
52af6e4 lib: utils: Add LiteX UART support
22d556d lib: sbi: Fix spelling of "address" in sbi_domain.c
7a22c78 lib: sbi: Fix missing space
7e77706 lib: sbi: Resolve the uninitialized complaint in sbi_pmu
14faee6 lib: sbi: Improve fatal error handling
2428987 lib: pmu: support the event ID encoded by a bitmap.
66fbcc0 docs/platform: spike: Enhance Spike examples
460041c lib: pmu: check SSCOF before masking
69d7e53 Makefile: Fix -msave-restore compile warning with CLANG-10 (or lower)
d249d65 lib: sbi: Fix compile errors using -Os option
f270359 Makefile: Improve the method to disable -m(no-)save-restore option
2082153 lib: sbi: simplify pmp_set(), pmp_get()
d30bde3 firmware: Move memcpy/memset mapping to fw_base.S
48f91ee include: Bump-up version to 1.0

Signed-off-by: Bin Meng <bmeng.cn@gmail.com>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 .../opensbi-riscv32-generic-fw_dynamic.bin    | Bin 78680 -> 108504 bytes
 .../opensbi-riscv32-generic-fw_dynamic.elf    | Bin 727464 -> 838904 bytes
 .../opensbi-riscv64-generic-fw_dynamic.bin    | Bin 75096 -> 105296 bytes
 .../opensbi-riscv64-generic-fw_dynamic.elf    | Bin 781264 -> 934696 bytes
 roms/opensbi                                  |   2 +-
 5 files changed, 1 insertion(+), 1 deletion(-)

diff --git a/pc-bios/opensbi-riscv32-generic-fw_dynamic.bin b/pc-bios/opensbi-riscv32-generic-fw_dynamic.bin
index XXXXXXX..XXXXXXX 100644
Binary files a/pc-bios/opensbi-riscv32-generic-fw_dynamic.bin and b/pc-bios/opensbi-riscv32-generic-fw_dynamic.bin differ
diff --git a/pc-bios/opensbi-riscv32-generic-fw_dynamic.elf b/pc-bios/opensbi-riscv32-generic-fw_dynamic.elf
index XXXXXXX..XXXXXXX 100644
Binary files a/pc-bios/opensbi-riscv32-generic-fw_dynamic.elf and b/pc-bios/opensbi-riscv32-generic-fw_dynamic.elf differ
diff --git a/pc-bios/opensbi-riscv64-generic-fw_dynamic.bin b/pc-bios/opensbi-riscv64-generic-fw_dynamic.bin
index XXXXXXX..XXXXXXX 100644
Binary files a/pc-bios/opensbi-riscv64-generic-fw_dynamic.bin and b/pc-bios/opensbi-riscv64-generic-fw_dynamic.bin differ
diff --git a/pc-bios/opensbi-riscv64-generic-fw_dynamic.elf b/pc-bios/opensbi-riscv64-generic-fw_dynamic.elf
index XXXXXXX..XXXXXXX 100644
Binary files a/pc-bios/opensbi-riscv64-generic-fw_dynamic.elf and b/pc-bios/opensbi-riscv64-generic-fw_dynamic.elf differ
diff --git a/roms/opensbi b/roms/opensbi
index XXXXXXX..XXXXXXX 160000
--- a/roms/opensbi
+++ b/roms/opensbi
@@ -1 +1 @@
-Subproject commit 234ed8e427f4d92903123199f6590d144e0d9351
+Subproject commit 48f91ee9c960f048c4a7d1da4447d31e04931e38
-- 
2.31.1

From: Frank Chang <frank.chang@sifive.com>

Vector widening floating-point instructions should use
require_scale_rvf() instead of require_rvf() to check whether RVF/RVD is
enabled.

Signed-off-by: Frank Chang <frank.chang@sifive.com>
Acked-by: Alistair Francis <alistair.francis@wdc.com>
Message-Id: <20220105022247.21131-2-frank.chang@sifive.com>
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 target/riscv/insn_trans/trans_rvv.c.inc | 12 ++++++++----
 1 file changed, 8 insertions(+), 4 deletions(-)

From: Frank Chang <frank.chang@sifive.com>

vfwcvt.xu.f.v, vfwcvt.x.f.v, vfwcvt.rtz.xu.f.v and vfwcvt.rtz.x.f.v
convert single-width floating-point to double-width integer.
Therefore, should use require_rvf() to check whether RVF/RVD is enabled.

vfwcvt.f.xu.v, vfwcvt.f.x.v convert single-width integer to double-width
floating-point, and vfwcvt.f.f.v convert double-width floating-point to
single-width floating-point. Therefore, should use require_scale_rvf() to
check whether RVF/RVD is enabled.

Signed-off-by: Frank Chang <frank.chang@sifive.com>
Acked-by: Alistair Francis <alistair.francis@wdc.com>
Message-Id: <20220105022247.21131-3-frank.chang@sifive.com>
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 target/riscv/insn_trans/trans_rvv.c.inc | 34 ++++++++++++++++++-------
 1 file changed, 25 insertions(+), 9 deletions(-)

From: Frank Chang <frank.chang@sifive.com>

vfncvt.f.xu.w, vfncvt.f.x.w convert double-width integer to single-width
floating-point. Therefore, should use require_rvf() to check whether
RVF/RVD is enabled.

vfncvt.f.f.w, vfncvt.rod.f.f.w convert double-width floating-point to
single-width integer. Therefore, should use require_scale_rvf() to check
whether RVF/RVD is enabled.

Signed-off-by: Frank Chang <frank.chang@sifive.com>
Acked-by: Alistair Francis <alistair.francis@wdc.com>
Message-Id: <20220105022247.21131-4-frank.chang@sifive.com>
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 target/riscv/insn_trans/trans_rvv.c.inc | 32 ++++++++++++++++++-------
 1 file changed, 24 insertions(+), 8 deletions(-)

From: Philipp Tomsich <philipp.tomsich@vrull.eu>

When commit 0643c12e4b dropped the 'x-' prefix for Zb[abcs] and set
them to be enabled by default, the comment about experimental
extensions was kept in place above them.  This moves it down a few
lines to only cover experimental extensions.

References: 0643c12e4b ("target/riscv: Enable bitmanip Zb[abcs] instructions")

Signed-off-by: Philipp Tomsich <philipp.tomsich@vrull.eu>
Reviewed-by: Bin Meng <bmeng.cn@gmail.com>
Reviewed-by: Philippe Mathieu-Daudé <f4bug@amsat.org>
Reviewed-by: Alistair Francis <alistair.francis@wdc.com>
Message-id: 20220106134020.1628889-1-philipp.tomsich@vrull.eu
Signed-off-by: Alistair Francis <alistair.francis@wdc.com>
---
 target/riscv/cpu.c | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/target/riscv/cpu.c b/target/riscv/cpu.c
index XXXXXXX..XXXXXXX 100644
--- a/target/riscv/cpu.c
+++ b/target/riscv/cpu.c
@@ -XXX,XX +XXX,XX @@ static Property riscv_cpu_properties[] = {
     DEFINE_PROP_UINT16("vlen", RISCVCPU, cfg.vlen, 128),
     DEFINE_PROP_UINT16("elen", RISCVCPU, cfg.elen, 64),
 
-    /* These are experimental so mark with 'x-' */
     DEFINE_PROP_BOOL("zba", RISCVCPU, cfg.ext_zba, true),
     DEFINE_PROP_BOOL("zbb", RISCVCPU, cfg.ext_zbb, true),
     DEFINE_PROP_BOOL("zbc", RISCVCPU, cfg.ext_zbc, true),
     DEFINE_PROP_BOOL("zbs", RISCVCPU, cfg.ext_zbs, true),
+
+    /* These are experimental so mark with 'x-' */
     DEFINE_PROP_BOOL("x-j", RISCVCPU, cfg.ext_j, false),
     /* ePMP 0.9.3 */
     DEFINE_PROP_BOOL("x-epmp", RISCVCPU, cfg.epmp, false),
-- 
2.31.1