Series comparison

-[PULL 00/40] tcg patch queue
+[PULL 00/68] tcg patch queue
-The following changes since commit 579510e196a544b42bd8bca9cc61688d4d1211ac:
+Note that I have refreshed the expiry of my public key.
+and pushed to keys.openpgp.org.
-  Merge tag 'pull-monitor-2023-02-03-v2' of https://repo.or.cz/qemu/armbru into staging (2023-02-04 10:19:55 +0000)
 r~
 The following changes since commit 4d5d933bbc7cc52f6cc6b9021f91fa06266222d5:
   Merge tag 'pull-xenfv-20250116' of git://git.infradead.org/users/dwmw2/qemu into staging (2025-01-16 09:03:43 -0500)
 are available in the Git repository at:
-  https://gitlab.com/rth7680/qemu.git tags/pull-tcg-20230204
+  https://gitlab.com/rth7680/qemu.git tags/pull-tcg-20250117
-for you to fetch changes up to a2495ede07498ee36b18b03e7038ba30c9871bb2:
+for you to fetch changes up to db1649823d4f27b924a5aa5f9e0111457accb798:
-  tcg/aarch64: Fix patching of LDR in tb_target_set_jmp_target (2023-02-04 06:19:43 -1000)
+  softfloat: Constify helpers returning float_status field (2025-01-17 08:29:25 -0800)
 ----------------------------------------------------------------
-tcg: Add support for TCGv_i128 in parameters and returns.
+tcg:
-tcg: Add support for TCGv_i128 in cmpxchg.
+  - Add TCGOP_TYPE, TCGOP_FLAGS.
-tcg: Test CPUJumpCache in tb_jmp_cache_clear_page
+  - Pass type and flags to tcg_op_supported, tcg_target_op_def.
-tcg: Split out tcg_gen_nonatomic_cmpxchg_i{32,64}
+  - Split out tcg-target-has.h and unexport from tcg.h.
-tcg/aarch64: Fix patching of LDR in tb_target_set_jmp_target
+  - Reorg constraint processing; constify TCGOpDef.
-target/arm: Use tcg_gen_atomic_cmpxchg_i128
+  - Make extract, sextract, deposit opcodes mandatory.
-target/i386: Use tcg_gen_atomic_cmpxchg_i128
+  - Merge ext{8,16,32}{s,u} opcodes into {s}extract.
-target/i386: Use tcg_gen_nonatomic_cmpxchg_i{32,64}
+tcg/mips: Expand bswap unconditionally
-target/s390x: Use tcg_gen_atomic_cmpxchg_i128
+tcg/riscv: Use SRAIW, SRLIW for {s}extract_i64
-target/s390x: Use TCGv_i128 in passing and returning float128
+tcg/riscv: Use BEXTI for single-bit extractions
-target/s390x: Implement CC_OP_NZ in gen_op_calc_cc
+tcg/sparc64: Use SRA, SRL for {s}extract_i64
 disas/riscv: Guard dec->cfg dereference for host disassemble
 util/cpuinfo-riscv: Detect Zbs
 accel/tcg: Call tcg_tb_insert() for one-insn TBs
 linux-user: Add missing /proc/cpuinfo fields for sparc
 ----------------------------------------------------------------
-Eric Auger (1):
+Helge Deller (1):
-      accel/tcg: Test CPUJumpCache in tb_jmp_cache_clear_page
+      linux-user: Add missing /proc/cpuinfo fields for sparc
-Ilya Leoshkevich (3):
+Ilya Leoshkevich (2):
-      tests/tcg/s390x: Add div.c
+      tcg: Document tb_lookup() and tcg_tb_lookup()
-      tests/tcg/s390x: Add clst.c
+      accel/tcg: Call tcg_tb_insert() for one-insn TBs
-      tests/tcg/s390x: Add cdsg.c
+LIU Zhiwei (1):
-Richard Henderson (36):
+      disas/riscv: Guard dec->cfg dereference for host disassemble
-      tcg: Init temp_subindex in liveness_pass_2
-      tcg: Define TCG_TYPE_I128 and related helper macros
+Philippe Mathieu-Daudé (1):
-      tcg: Handle dh_typecode_i128 with TCG_CALL_{RET,ARG}_NORMAL
+      softfloat: Constify helpers returning float_status field
-      tcg: Allocate objects contiguously in temp_allocate_frame
-      tcg: Introduce tcg_out_addi_ptr
+Richard Henderson (63):
-      tcg: Add TCG_CALL_{RET,ARG}_BY_REF
+      tcg: Move call abi parameters from tcg-target.h to tcg-target.c.inc
-      tcg: Introduce tcg_target_call_oarg_reg
+      tcg: Replace TCGOP_VECL with TCGOP_TYPE
-      tcg: Add TCG_CALL_RET_BY_VEC
+      tcg: Move tcg_op_insert_{after,before} decls to tcg-internal.h
-      include/qemu/int128: Use Int128 structure for TCI
+      tcg: Copy TCGOP_TYPE in tcg_op_insert_{after,before}
-      tcg/i386: Add TCG_TARGET_CALL_{RET,ARG}_I128
+      tcg: Add TCGOP_FLAGS
-      tcg/tci: Fix big-endian return register ordering
+      tcg: Add type and flags arguments to tcg_op_supported
-      tcg/tci: Add TCG_TARGET_CALL_{RET,ARG}_I128
+      target/arm: Do not test TCG_TARGET_HAS_bitsel_vec
-      tcg: Add TCG_TARGET_CALL_{RET,ARG}_I128
+      target/arm: Use tcg_op_supported
-      tcg: Add temp allocation for TCGv_i128
+      target/tricore: Use tcg_op_supported
-      tcg: Add basic data movement for TCGv_i128
+      tcg: Add tcg_op_deposit_valid
-      tcg: Add guest load/store primitives for TCGv_i128
+      target/i386: Remove TCG_TARGET_extract_tl_valid
-      tcg: Add tcg_gen_{non}atomic_cmpxchg_i128
+      target/i386: Use tcg_op_deposit_valid
-      tcg: Split out tcg_gen_nonatomic_cmpxchg_i{32,64}
+      target/i386: Use tcg_op_supported
-      target/arm: Use tcg_gen_atomic_cmpxchg_i128 for STXP
+      tcg: Remove TCG_TARGET_NEED_LDST_LABELS and TCG_TARGET_NEED_POOL_LABELS
-      target/arm: Use tcg_gen_atomic_cmpxchg_i128 for CASP
+      tcg: Rename tcg-target.opc.h to tcg-target-opc.h.inc
-      target/ppc: Use tcg_gen_atomic_cmpxchg_i128 for STQCX
+      tcg/tci: Move TCI specific opcodes to tcg-target-opc.h.inc
-      tests/tcg/s390x: Add long-double.c
+      tcg: Move fallback tcg_can_emit_vec_op out of line
-      target/s390x: Use a single return for helper_divs32/u32
+      tcg/ppc: Remove TCGPowerISA enum
-      target/s390x: Use a single return for helper_divs64/u64
+      tcg: Extract default TCG_TARGET_HAS_foo definitions to 'tcg-has.h'
-      target/s390x: Use Int128 for return from CLST
+      tcg/aarch64: Extract TCG_TARGET_HAS_foo defs to 'tcg-target-has.h'
-      target/s390x: Use Int128 for return from CKSM
+      tcg/arm: Extract TCG_TARGET_HAS_foo defs to 'tcg-target-has.h'
-      target/s390x: Use Int128 for return from TRE
+      tcg/i386: Extract TCG_TARGET_HAS_foo defs to 'tcg-target-has.h'
-      target/s390x: Copy wout_x1 to wout_x1_P
+      tcg/loongarch64: Extract TCG_TARGET_HAS_foo defs to 'tcg-target-has.h'
-      target/s390x: Use Int128 for returning float128
+      tcg/mips: Extract TCG_TARGET_HAS_foo defs to 'tcg-target-has.h'
-      target/s390x: Use Int128 for passing float128
+      tcg/ppc: Extract TCG_TARGET_HAS_foo defs to 'tcg-target-has.h'
-      target/s390x: Use tcg_gen_atomic_cmpxchg_i128 for CDSG
+      tcg/riscv: Extract TCG_TARGET_HAS_foo defs to 'tcg-target-has.h'
-      target/s390x: Implement CC_OP_NZ in gen_op_calc_cc
+      tcg/s390x: Extract TCG_TARGET_HAS_foo defs to 'tcg-target-has.h'
-      target/i386: Split out gen_cmpxchg8b, gen_cmpxchg16b
+      tcg/sparc64: Extract TCG_TARGET_HAS_foo defs to 'tcg-target-has.h'
-      target/i386: Inline cmpxchg8b
+      tcg/tci: Extract TCG_TARGET_HAS_foo defs to 'tcg-target-has.h'
-      target/i386: Inline cmpxchg16b
+      tcg: Include 'tcg-target-has.h' once in 'tcg-has.h'
-      tcg/aarch64: Fix patching of LDR in tb_target_set_jmp_target
+      tcg: Only include 'tcg-has.h' when necessary
+      tcg: Split out tcg-target-mo.h
- accel/tcg/tcg-runtime.h          |  11 ++
+      tcg: Use C_NotImplemented in tcg_target_op_def
- include/exec/cpu_ldst.h          |  10 +
+      tcg: Change have_vec to has_type in tcg_op_supported
- include/exec/helper-head.h       |   7 +
+      tcg: Reorg process_op_defs
- include/qemu/atomic128.h         |  29 ++-
+      tcg: Remove args_ct from TCGOpDef
- include/qemu/int128.h            |  25 ++-
+      tcg: Constify tcg_op_defs
- include/tcg/tcg-op.h             |  15 ++
+      tcg: Validate op supported in opcode_args_ct
- include/tcg/tcg.h                |  49 ++++-
+      tcg: Add TCG_OPF_NOT_PRESENT to opcodes without inputs or outputs
- target/arm/helper-a64.h          |   8 -
+      tcg: Pass type and flags to tcg_target_op_def
- target/i386/helper.h             |   6 -
+      tcg: Add TCGType argument to tcg_out_op
- target/ppc/helper.h              |   2 -
+      tcg: Remove TCG_OPF_64BIT
- target/s390x/helper.h            |  54 +++---
+      tcg: Drop implementation checks from tcg-opc.h
- tcg/aarch64/tcg-target.h         |   2 +
+      tcg: Replace IMPLVEC with TCG_OPF_VECTOR
- tcg/arm/tcg-target.h             |   2 +
+      tcg/mips: Expand bswap unconditionally
- tcg/i386/tcg-target.h            |  10 +
+      tcg/i386: Handle all 8-bit extensions for i686
- tcg/loongarch64/tcg-target.h     |   2 +
+      tcg/i386: Fold the ext{8,16,32}[us] cases into {s}extract
- tcg/mips/tcg-target.h            |   2 +
+      tcg/aarch64: Provide TCG_TARGET_{s}extract_valid
- tcg/riscv/tcg-target.h           |   3 +
+      tcg/aarch64: Expand extract with offset 0 with andi
- tcg/s390x/tcg-target.h           |   2 +
+      tcg/arm: Add full [US]XT[BH] into {s}extract
- tcg/sparc64/tcg-target.h         |   2 +
+      tcg/loongarch64: Fold the ext{8,16,32}[us] cases into {s}extract
- tcg/tcg-internal.h               |  17 ++
+      tcg/mips: Fold the ext{8,16,32}[us] cases into {s}extract
- tcg/tci/tcg-target.h             |   3 +
+      tcg/ppc: Fold the ext{8,16,32}[us] cases into {s}extract
- target/s390x/tcg/insn-data.h.inc |  60 +++---
+      tcg/riscv64: Fold the ext{8,16,32}[us] cases into {s}extract
- accel/tcg/cputlb.c               | 119 +++++++++++-
+      tcg/riscv: Use SRAIW, SRLIW for {s}extract_i64
- accel/tcg/user-exec.c            |  66 +++++++
+      tcg/s390x: Fold the ext{8,16,32}[us] cases into {s}extract
- target/arm/helper-a64.c          | 147 ---------------
+      tcg/sparc64: Use SRA, SRL for {s}extract_i64
- target/arm/translate-a64.c       | 121 ++++++------
+      tcg/tci: Provide TCG_TARGET_{s}extract_valid
- target/i386/tcg/mem_helper.c     | 126 -------------
+      tcg/tci: Remove assertions for deposit and extract
- target/i386/tcg/translate.c      | 126 +++++++++++--
+      tcg: Remove TCG_TARGET_HAS_{s}extract_{i32,i64}
- target/ppc/mem_helper.c          |  44 -----
+      tcg: Remove TCG_TARGET_HAS_deposit_{i32,i64}
- target/ppc/translate.c           | 102 +++++-----
+      util/cpuinfo-riscv: Detect Zbs
- target/s390x/tcg/fpu_helper.c    | 103 +++++-----
+      tcg/riscv: Use BEXTI for single-bit extractions
- target/s390x/tcg/int_helper.c    |  64 +++----
- target/s390x/tcg/mem_helper.c    |  77 +-------
+ accel/tcg/internal-target.h                        |   1 +
- target/s390x/tcg/translate.c     | 212 ++++++++++++++-------
+ host/include/riscv/host/cpuinfo.h                  |   5 +-
- tcg/tcg-op.c                     | 393 +++++++++++++++++++++++++++++++++------
+ include/fpu/softfloat-helpers.h                    |  25 +-
- tcg/tcg.c                        | 308 ++++++++++++++++++++++++++----
+ include/tcg/tcg-opc.h                              | 355 +++++-------
- tcg/tci.c                        |  65 +++----
+ include/tcg/tcg.h                                  | 187 ++----
- tests/tcg/s390x/cdsg.c           |  93 +++++++++
+ linux-user/sparc/target_proc.h                     |  20 +-
- tests/tcg/s390x/clst.c           |  82 ++++++++
+ tcg/aarch64/tcg-target-has.h                       | 117 ++++
- tests/tcg/s390x/div.c            |  75 ++++++++
+ tcg/aarch64/tcg-target-mo.h                        |  12 +
- tests/tcg/s390x/long-double.c    |  24 +++
+ tcg/aarch64/tcg-target.h                           | 126 ----
- util/int128.c                    |  42 +++++
+ tcg/arm/tcg-target-has.h                           | 100 ++++
- accel/tcg/atomic_common.c.inc    |  45 +++++
+ tcg/arm/tcg-target-mo.h                            |  13 +
- tcg/aarch64/tcg-target.c.inc     |  19 +-
+ tcg/arm/tcg-target.h                               |  86 ---
- tcg/arm/tcg-target.c.inc         |  30 ++-
+ tcg/i386/tcg-target-has.h                          | 169 ++++++
- tcg/i386/tcg-target.c.inc        |  52 +++++-
+ tcg/i386/tcg-target-mo.h                           |  19 +
- tcg/loongarch64/tcg-target.c.inc |  17 +-
+ tcg/i386/tcg-target.h                              | 162 ------
- tcg/mips/tcg-target.c.inc        |  17 +-
+ tcg/loongarch64/tcg-target-has.h                   | 119 ++++
- tcg/ppc/tcg-target.c.inc         |  20 +-
+ tcg/loongarch64/tcg-target-mo.h                    |  12 +
- tcg/riscv/tcg-target.c.inc       |  17 +-
+ tcg/loongarch64/tcg-target.h                       | 115 ----
- tcg/s390x/tcg-target.c.inc       |  16 +-
+ tcg/mips/tcg-target-has.h                          | 135 +++++
- tcg/sparc64/tcg-target.c.inc     |  19 +-
+ tcg/mips/tcg-target-mo.h                           |  13 +
- tcg/tci/tcg-target.c.inc         |  27 ++-
+ tcg/mips/tcg-target.h                              | 130 -----
- tests/tcg/s390x/Makefile.target  |   7 +
+ tcg/ppc/tcg-target-has.h                           | 131 +++++
-files changed, 2040 insertions(+), 956 deletions(-)
+ tcg/ppc/tcg-target-mo.h                            |  12 +
- create mode 100644 tests/tcg/s390x/cdsg.c
+ tcg/ppc/tcg-target.h                               | 126 ----
- create mode 100644 tests/tcg/s390x/clst.c
+ tcg/riscv/tcg-target-has.h                         | 135 +++++
- create mode 100644 tests/tcg/s390x/div.c
+ tcg/riscv/tcg-target-mo.h                          |  12 +
- create mode 100644 tests/tcg/s390x/long-double.c
+ tcg/riscv/tcg-target.h                             | 116 ----
  tcg/s390x/tcg-target-has.h                         | 137 +++++
  tcg/s390x/tcg-target-mo.h                          |  12 +
  tcg/s390x/tcg-target.h                             | 126 ----
  tcg/sparc64/tcg-target-has.h                       |  87 +++
  tcg/sparc64/tcg-target-mo.h                        |  12 +
  tcg/sparc64/tcg-target.h                           |  91 ---
  tcg/tcg-has.h                                      | 101 ++++
  tcg/tcg-internal.h                                 |  18 +-
  tcg/tci/tcg-target-has.h                           |  81 +++
  tcg/tci/tcg-target-mo.h                            |  17 +
  tcg/tci/tcg-target.h                               |  94 ---
  accel/tcg/cpu-exec.c                               |  15 +-
  accel/tcg/translate-all.c                          |  29 +-
  disas/riscv.c                                      |  23 +-
  target/arm/tcg/translate-a64.c                     |  10 +-
  target/arm/tcg/translate-sve.c                     |  22 +-
  target/arm/tcg/translate.c                         |   2 +-
  target/tricore/translate.c                         |   4 +-
  tcg/optimize.c                                     |  27 +-
  tcg/tcg-common.c                                   |   5 +-
  tcg/tcg-op-gvec.c                                  |   1 +
  tcg/tcg-op-ldst.c                                  |  29 +-
  tcg/tcg-op-vec.c                                   |   9 +-
  tcg/tcg-op.c                                       | 149 ++---
  tcg/tcg.c                                          | 643 ++++++++++++++-------
  tcg/tci.c                                          |  13 +-
  util/cpuinfo-riscv.c                               |  18 +-
  docs/devel/tcg-ops.rst                             |  15 +-
  target/i386/tcg/emit.c.inc                         |  14 +-
  .../{tcg-target.opc.h => tcg-target-opc.h.inc}     |   4 +-
  tcg/aarch64/tcg-target.c.inc                       |  33 +-
  tcg/arm/{tcg-target.opc.h => tcg-target-opc.h.inc} |   6 +-
  tcg/arm/tcg-target.c.inc                           |  71 ++-
  .../{tcg-target.opc.h => tcg-target-opc.h.inc}     |  22 +-
  tcg/i386/tcg-target.c.inc                          | 121 +++-
  .../{tcg-target.opc.h => tcg-target-opc.h.inc}     |   0
  tcg/loongarch64/tcg-target.c.inc                   |  59 +-
  tcg/mips/tcg-target-opc.h.inc                      |   1 +
  tcg/mips/tcg-target.c.inc                          |  55 +-
  tcg/ppc/{tcg-target.opc.h => tcg-target-opc.h.inc} |  12 +-
  tcg/ppc/tcg-target.c.inc                           |  39 +-
  .../{tcg-target.opc.h => tcg-target-opc.h.inc}     |   0
  tcg/riscv/tcg-target.c.inc                         |  66 ++-
  .../{tcg-target.opc.h => tcg-target-opc.h.inc}     |   6 +-
  tcg/s390x/tcg-target.c.inc                         |  59 +-
  tcg/sparc64/tcg-target-opc.h.inc                   |   1 +
  tcg/sparc64/tcg-target.c.inc                       |  29 +-
  tcg/tcg-ldst.c.inc                                 |  65 ---
  tcg/tcg-pool.c.inc                                 | 162 ------
  tcg/tci/tcg-target-opc.h.inc                       |   4 +
  tcg/tci/tcg-target.c.inc                           |  53 +-
 files changed, 2856 insertions(+), 2269 deletions(-)
  create mode 100644 tcg/aarch64/tcg-target-has.h
  create mode 100644 tcg/aarch64/tcg-target-mo.h
  create mode 100644 tcg/arm/tcg-target-has.h
  create mode 100644 tcg/arm/tcg-target-mo.h
  create mode 100644 tcg/i386/tcg-target-has.h
  create mode 100644 tcg/i386/tcg-target-mo.h
  create mode 100644 tcg/loongarch64/tcg-target-has.h
  create mode 100644 tcg/loongarch64/tcg-target-mo.h
  create mode 100644 tcg/mips/tcg-target-has.h
  create mode 100644 tcg/mips/tcg-target-mo.h
  create mode 100644 tcg/ppc/tcg-target-has.h
  create mode 100644 tcg/ppc/tcg-target-mo.h
  create mode 100644 tcg/riscv/tcg-target-has.h
  create mode 100644 tcg/riscv/tcg-target-mo.h
  create mode 100644 tcg/s390x/tcg-target-has.h
  create mode 100644 tcg/s390x/tcg-target-mo.h
  create mode 100644 tcg/sparc64/tcg-target-has.h
  create mode 100644 tcg/sparc64/tcg-target-mo.h
  create mode 100644 tcg/tcg-has.h
  create mode 100644 tcg/tci/tcg-target-has.h
  create mode 100644 tcg/tci/tcg-target-mo.h
  rename tcg/aarch64/{tcg-target.opc.h => tcg-target-opc.h.inc} (82%)
  rename tcg/arm/{tcg-target.opc.h => tcg-target-opc.h.inc} (75%)
  rename tcg/i386/{tcg-target.opc.h => tcg-target-opc.h.inc} (72%)
  rename tcg/loongarch64/{tcg-target.opc.h => tcg-target-opc.h.inc} (100%)
  create mode 100644 tcg/mips/tcg-target-opc.h.inc
  rename tcg/ppc/{tcg-target.opc.h => tcg-target-opc.h.inc} (83%)
  rename tcg/riscv/{tcg-target.opc.h => tcg-target-opc.h.inc} (100%)
  rename tcg/s390x/{tcg-target.opc.h => tcg-target-opc.h.inc} (75%)
  create mode 100644 tcg/sparc64/tcg-target-opc.h.inc
  delete mode 100644 tcg/tcg-ldst.c.inc
  delete mode 100644 tcg/tcg-pool.c.inc
  create mode 100644 tcg/tci/tcg-target-opc.h.inc

-New patch
+[PULL 01/68] disas/riscv: Guard dec->cfg dereference for host disassemble
+From: LIU Zhiwei <zhiwei_liu@linux.alibaba.com>
+For riscv host, it will set dec->cfg to zero. Thus we shuld guard
+the dec->cfg deference for riscv host disassemble.
+And in general, we should only use dec->cfg for target in three cases:
+) For not incompatible encodings, such as zcmp/zcmt/zfinx.
+) For maybe-ops encodings, they are better to be disassembled to
+   the "real" extensions, such as zicfiss. The guard of dec->zimop
+   and dec->zcmop is for comment and avoid check for every extension
+   that encoded in maybe-ops area.
+) For custom encodings, we have to use dec->cfg to disassemble
+   custom encodings using the same encoding area.
+Signed-off-by: LIU Zhiwei <zhiwei_liu@linux.alibaba.com>
+Suggested-by: Richard Henderson <richard.henderson@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-ID: <20241206032411.52528-1-zhiwei_liu@linux.alibaba.com>
+---
+ disas/riscv.c | 23 ++++++++++++-----------
+file changed, 12 insertions(+), 11 deletions(-)
+diff --git a/disas/riscv.c b/disas/riscv.c
+index XXXXXXX..XXXXXXX 100644
+--- a/disas/riscv.c
++++ b/disas/riscv.c
+@@ -XXX,XX +XXX,XX @@ static void decode_inst_opcode(rv_decode *dec, rv_isa isa)
+             break;
+         case 2: op = rv_op_c_li; break;
+         case 3:
+-            if (dec->cfg->ext_zcmop) {
++            if (dec->cfg && dec->cfg->ext_zcmop) {
+                 if ((((inst >> 2) & 0b111111) == 0b100000) &&
+                     (((inst >> 11) & 0b11) == 0b0)) {
+                     unsigned int cmop_code = 0;
+@@ -XXX,XX +XXX,XX @@ static void decode_inst_opcode(rv_decode *dec, rv_isa isa)
+                 op = rv_op_c_sqsp;
+             } else {
+                 op = rv_op_c_fsdsp;
+-                if (dec->cfg->ext_zcmp && ((inst >> 12) & 0b01)) {
++                if (dec->cfg && dec->cfg->ext_zcmp && ((inst >> 12) & 0b01)) {
+                     switch ((inst >> 8) & 0b01111) {
+                     case 8:
+                         if (((inst >> 4) & 0b01111) >= 4) {
+@@ -XXX,XX +XXX,XX @@ static void decode_inst_opcode(rv_decode *dec, rv_isa isa)
+                 } else {
+                     switch ((inst >> 10) & 0b011) {
+                     case 0:
+-                        if (!dec->cfg->ext_zcmt) {
++                        if (dec->cfg && !dec->cfg->ext_zcmt) {
+                             break;
+                         }
+                         if (((inst >> 2) & 0xFF) >= 32) {
+@@ -XXX,XX +XXX,XX @@ static void decode_inst_opcode(rv_decode *dec, rv_isa isa)
+                         }
+                         break;
+                     case 3:
+-                        if (!dec->cfg->ext_zcmp) {
++                        if (dec->cfg && !dec->cfg->ext_zcmp) {
+                             break;
+                         }
+                         switch ((inst >> 5) & 0b011) {
+@@ -XXX,XX +XXX,XX @@ static void decode_inst_opcode(rv_decode *dec, rv_isa isa)
+             break;
+         case 5:
+             op = rv_op_auipc;
+-            if (dec->cfg->ext_zicfilp &&
++            if (dec->cfg && dec->cfg->ext_zicfilp &&
+                 (((inst >> 7) & 0b11111) == 0b00000)) {
+                 op = rv_op_lpad;
+             }
+@@ -XXX,XX +XXX,XX @@ static void decode_inst_opcode(rv_decode *dec, rv_isa isa)
+             case 2: op = rv_op_csrrs; break;
+             case 3: op = rv_op_csrrc; break;
+             case 4:
+-                if (dec->cfg->ext_zimop) {
++                if (dec->cfg && dec->cfg->ext_zimop) {
+                     int imm_mop5, imm_mop3, reg_num;
+                     if ((extract32(inst, 22, 10) & 0b1011001111)
+                         == 0b1000000111) {
+@@ -XXX,XX +XXX,XX @@ static GString *format_inst(size_t tab, rv_decode *dec)
+             g_string_append(buf, rv_ireg_name_sym[dec->rs2]);
+             break;
+         case '3':
+-            if (dec->cfg->ext_zfinx) {
++            if (dec->cfg && dec->cfg->ext_zfinx) {
+                 g_string_append(buf, rv_ireg_name_sym[dec->rd]);
+             } else {
+                 g_string_append(buf, rv_freg_name_sym[dec->rd]);
+             }
+             break;
+         case '4':
+-            if (dec->cfg->ext_zfinx) {
++            if (dec->cfg && dec->cfg->ext_zfinx) {
+                 g_string_append(buf, rv_ireg_name_sym[dec->rs1]);
+             } else {
+                 g_string_append(buf, rv_freg_name_sym[dec->rs1]);
+             }
+             break;
+         case '5':
+-            if (dec->cfg->ext_zfinx) {
++            if (dec->cfg && dec->cfg->ext_zfinx) {
+                 g_string_append(buf, rv_ireg_name_sym[dec->rs2]);
+             } else {
+                 g_string_append(buf, rv_freg_name_sym[dec->rs2]);
+             }
+             break;
+         case '6':
+-            if (dec->cfg->ext_zfinx) {
++            if (dec->cfg && dec->cfg->ext_zfinx) {
+                 g_string_append(buf, rv_ireg_name_sym[dec->rs3]);
+             } else {
+                 g_string_append(buf, rv_freg_name_sym[dec->rs3]);
+@@ -XXX,XX +XXX,XX @@ static GString *disasm_inst(rv_isa isa, uint64_t pc, rv_inst inst,
+         const rv_opcode_data *opcode_data = decoders[i].opcode_data;
+         void (*decode_func)(rv_decode *, rv_isa) = decoders[i].decode_func;
+-        if (guard_func(cfg)) {
++        /* always_true_p don't dereference cfg */
++        if (((i == 0) || cfg) && guard_func(cfg)) {
+             dec.opcode_data = opcode_data;
+             decode_func(&dec, isa);
+             if (dec.op != rv_op_illegal)
+--
+.43.0

-[PULL 11/40] tcg/i386: Add TCG_TARGET_CALL_{RET,ARG}_I128
+[PULL 02/68] tcg: Move call abi parameters from tcg-target.h to tcg-target.c.inc
-Fill in the parameters for the host ABI for Int128.
+These defines are not required outside of tcg/tcg.c,
-Adjust tcg_target_call_oarg_reg for _WIN64, and
+which includes tcg-target.c.inc before use.
-tcg_out_call for i386 sysv.  Allow TCG_TYPE_V128
+Reduces the exported symbol set of tcg-target.h.
 stores without AVX enabled.
-Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 ---
- tcg/i386/tcg-target.h     | 10 ++++++++++
+ tcg/aarch64/tcg-target.h         | 13 -------------
- tcg/i386/tcg-target.c.inc | 30 +++++++++++++++++++++++++++++-
+ tcg/arm/tcg-target.h             |  8 --------
-files changed, 39 insertions(+), 1 deletion(-)
+ tcg/i386/tcg-target.h            | 20 --------------------
  tcg/loongarch64/tcg-target.h     |  9 ---------
  tcg/mips/tcg-target.h            | 14 --------------
  tcg/riscv/tcg-target.h           |  9 ---------
  tcg/s390x/tcg-target.h           |  8 --------
  tcg/sparc64/tcg-target.h         | 11 -----------
  tcg/tci/tcg-target.h             | 14 --------------
  tcg/aarch64/tcg-target.c.inc     | 13 +++++++++++++
  tcg/arm/tcg-target.c.inc         |  8 ++++++++
  tcg/i386/tcg-target.c.inc        | 20 ++++++++++++++++++++
  tcg/loongarch64/tcg-target.c.inc |  9 +++++++++
  tcg/mips/tcg-target.c.inc        | 14 ++++++++++++++
  tcg/riscv/tcg-target.c.inc       |  9 +++++++++
  tcg/s390x/tcg-target.c.inc       |  8 ++++++++
  tcg/sparc64/tcg-target.c.inc     | 10 ++++++++++
  tcg/tci/tcg-target.c.inc         | 14 ++++++++++++++
 files changed, 105 insertions(+), 106 deletions(-)
+diff --git a/tcg/aarch64/tcg-target.h b/tcg/aarch64/tcg-target.h
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/aarch64/tcg-target.h
++++ b/tcg/aarch64/tcg-target.h
+@@ -XXX,XX +XXX,XX @@ typedef enum {
+ #define TCG_TARGET_NB_REGS 64
+-/* used for function call generation */
+-#define TCG_REG_CALL_STACK              TCG_REG_SP
+-#define TCG_TARGET_STACK_ALIGN          16
+-#define TCG_TARGET_CALL_STACK_OFFSET    0
+-#define TCG_TARGET_CALL_ARG_I32         TCG_CALL_ARG_NORMAL
+-#define TCG_TARGET_CALL_ARG_I64         TCG_CALL_ARG_NORMAL
+-#ifdef CONFIG_DARWIN
+-# define TCG_TARGET_CALL_ARG_I128       TCG_CALL_ARG_NORMAL
+-#else
+-# define TCG_TARGET_CALL_ARG_I128       TCG_CALL_ARG_EVEN
+-#endif
+-#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_NORMAL
+-
+ #define have_lse    (cpuinfo & CPUINFO_LSE)
+ #define have_lse2   (cpuinfo & CPUINFO_LSE2)
+diff --git a/tcg/arm/tcg-target.h b/tcg/arm/tcg-target.h
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/arm/tcg-target.h
++++ b/tcg/arm/tcg-target.h
+@@ -XXX,XX +XXX,XX @@ extern bool use_idiv_instructions;
+ extern bool use_neon_instructions;
+ #endif
+-/* used for function call generation */
+-#define TCG_TARGET_STACK_ALIGN        8
+-#define TCG_TARGET_CALL_STACK_OFFSET    0
+-#define TCG_TARGET_CALL_ARG_I32         TCG_CALL_ARG_NORMAL
+-#define TCG_TARGET_CALL_ARG_I64         TCG_CALL_ARG_EVEN
+-#define TCG_TARGET_CALL_ARG_I128        TCG_CALL_ARG_EVEN
+-#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_BY_REF
+-
+ /* optional instructions */
+ #define TCG_TARGET_HAS_ext8s_i32        1
+ #define TCG_TARGET_HAS_ext16s_i32       1
 diff --git a/tcg/i386/tcg-target.h b/tcg/i386/tcg-target.h
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/i386/tcg-target.h
 +++ b/tcg/i386/tcg-target.h
 @@ -XXX,XX +XXX,XX @@ typedef enum {
+     TCG_REG_CALL_STACK = TCG_REG_ESP
+ } TCGReg;
+-/* used for function call generation */
+-#define TCG_TARGET_STACK_ALIGN 16
+-#if defined(_WIN64)
+-#define TCG_TARGET_CALL_STACK_OFFSET 32
+-#else
+-#define TCG_TARGET_CALL_STACK_OFFSET 0
+-#endif
+-#define TCG_TARGET_CALL_ARG_I32      TCG_CALL_ARG_NORMAL
+-#define TCG_TARGET_CALL_ARG_I64      TCG_CALL_ARG_NORMAL
+-#if defined(_WIN64)
+-# define TCG_TARGET_CALL_ARG_I128    TCG_CALL_ARG_BY_REF
+-# define TCG_TARGET_CALL_RET_I128    TCG_CALL_RET_BY_VEC
+-#elif TCG_TARGET_REG_BITS == 64
+-# define TCG_TARGET_CALL_ARG_I128    TCG_CALL_ARG_NORMAL
+-# define TCG_TARGET_CALL_RET_I128    TCG_CALL_RET_NORMAL
+-#else
+-# define TCG_TARGET_CALL_ARG_I128    TCG_CALL_ARG_NORMAL
+-# define TCG_TARGET_CALL_RET_I128    TCG_CALL_RET_BY_REF
+-#endif
+-
+ #define have_bmi1         (cpuinfo & CPUINFO_BMI1)
+ #define have_popcnt       (cpuinfo & CPUINFO_POPCNT)
+ #define have_avx1         (cpuinfo & CPUINFO_AVX1)
+diff --git a/tcg/loongarch64/tcg-target.h b/tcg/loongarch64/tcg-target.h
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/loongarch64/tcg-target.h
++++ b/tcg/loongarch64/tcg-target.h
+@@ -XXX,XX +XXX,XX @@ typedef enum {
+     TCG_VEC_TMP0 = TCG_REG_V23,
+ } TCGReg;
+-/* used for function call generation */
+-#define TCG_REG_CALL_STACK              TCG_REG_SP
+-#define TCG_TARGET_STACK_ALIGN          16
+-#define TCG_TARGET_CALL_STACK_OFFSET    0
+-#define TCG_TARGET_CALL_ARG_I32         TCG_CALL_ARG_NORMAL
+-#define TCG_TARGET_CALL_ARG_I64         TCG_CALL_ARG_NORMAL
+-#define TCG_TARGET_CALL_ARG_I128        TCG_CALL_ARG_NORMAL
+-#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_NORMAL
+-
+ /* optional instructions */
+ #define TCG_TARGET_HAS_negsetcond_i32   0
+ #define TCG_TARGET_HAS_div_i32          1
+diff --git a/tcg/mips/tcg-target.h b/tcg/mips/tcg-target.h
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/mips/tcg-target.h
++++ b/tcg/mips/tcg-target.h
+@@ -XXX,XX +XXX,XX @@ typedef enum {
+     TCG_AREG0 = TCG_REG_S8,
+ } TCGReg;
+-/* used for function call generation */
+-#define TCG_TARGET_STACK_ALIGN        16
+-#if _MIPS_SIM == _ABIO32
+-# define TCG_TARGET_CALL_STACK_OFFSET 16
+-# define TCG_TARGET_CALL_ARG_I64      TCG_CALL_ARG_EVEN
+-# define TCG_TARGET_CALL_RET_I128     TCG_CALL_RET_BY_REF
+-#else
+-# define TCG_TARGET_CALL_STACK_OFFSET 0
+-# define TCG_TARGET_CALL_ARG_I64      TCG_CALL_ARG_NORMAL
+-# define TCG_TARGET_CALL_RET_I128     TCG_CALL_RET_NORMAL
+-#endif
+-#define TCG_TARGET_CALL_ARG_I32       TCG_CALL_ARG_NORMAL
+-#define TCG_TARGET_CALL_ARG_I128      TCG_CALL_ARG_EVEN
+-
+ /* MOVN/MOVZ instructions detection */
+ #if (defined(__mips_isa_rev) && (__mips_isa_rev >= 1)) || \
+     defined(_MIPS_ARCH_LOONGSON2E) || defined(_MIPS_ARCH_LOONGSON2F) || \
+diff --git a/tcg/riscv/tcg-target.h b/tcg/riscv/tcg-target.h
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/riscv/tcg-target.h
++++ b/tcg/riscv/tcg-target.h
+@@ -XXX,XX +XXX,XX @@ typedef enum {
+     TCG_REG_TMP2       = TCG_REG_T4,
+ } TCGReg;
+-/* used for function call generation */
+-#define TCG_REG_CALL_STACK              TCG_REG_SP
+-#define TCG_TARGET_STACK_ALIGN          16
+-#define TCG_TARGET_CALL_STACK_OFFSET    0
+-#define TCG_TARGET_CALL_ARG_I32         TCG_CALL_ARG_NORMAL
+-#define TCG_TARGET_CALL_ARG_I64         TCG_CALL_ARG_NORMAL
+-#define TCG_TARGET_CALL_ARG_I128        TCG_CALL_ARG_NORMAL
+-#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_NORMAL
+-
+ /* optional instructions */
+ #define TCG_TARGET_HAS_negsetcond_i32   1
+ #define TCG_TARGET_HAS_div_i32          1
+diff --git a/tcg/s390x/tcg-target.h b/tcg/s390x/tcg-target.h
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/s390x/tcg-target.h
++++ b/tcg/s390x/tcg-target.h
+@@ -XXX,XX +XXX,XX @@ extern uint64_t s390_facilities[3];
+ #define TCG_TARGET_HAS_cmpsel_vec     1
+ #define TCG_TARGET_HAS_tst_vec        0
+-/* used for function call generation */
+-#define TCG_TARGET_STACK_ALIGN        8
+-#define TCG_TARGET_CALL_STACK_OFFSET    160
+-#define TCG_TARGET_CALL_ARG_I32         TCG_CALL_ARG_EXTEND
+-#define TCG_TARGET_CALL_ARG_I64         TCG_CALL_ARG_NORMAL
+-#define TCG_TARGET_CALL_ARG_I128        TCG_CALL_ARG_BY_REF
+-#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_BY_REF
+-
+ #define TCG_TARGET_DEFAULT_MO (TCG_MO_ALL & ~TCG_MO_ST_LD)
+ #define TCG_TARGET_NEED_LDST_LABELS
+ #define TCG_TARGET_NEED_POOL_LABELS
+diff --git a/tcg/sparc64/tcg-target.h b/tcg/sparc64/tcg-target.h
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/sparc64/tcg-target.h
++++ b/tcg/sparc64/tcg-target.h
+@@ -XXX,XX +XXX,XX @@ typedef enum {
+     TCG_REG_I7,
+ } TCGReg;
+-/* used for function call generation */
+-#define TCG_REG_CALL_STACK TCG_REG_O6
+-
+-#define TCG_TARGET_STACK_BIAS           2047
+-#define TCG_TARGET_STACK_ALIGN          16
+-#define TCG_TARGET_CALL_STACK_OFFSET    (128 + 6*8 + TCG_TARGET_STACK_BIAS)
+-#define TCG_TARGET_CALL_ARG_I32         TCG_CALL_ARG_EXTEND
+-#define TCG_TARGET_CALL_ARG_I64         TCG_CALL_ARG_NORMAL
+-#define TCG_TARGET_CALL_ARG_I128        TCG_CALL_ARG_NORMAL
+-#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_NORMAL
+-
+ #if defined(__VIS__) && __VIS__ >= 0x300
+ #define use_vis3_instructions  1
+ #else
+diff --git a/tcg/tci/tcg-target.h b/tcg/tci/tcg-target.h
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/tci/tcg-target.h
++++ b/tcg/tci/tcg-target.h
+@@ -XXX,XX +XXX,XX @@ typedef enum {
+     TCG_REG_CALL_STACK = TCG_REG_R15,
+ } TCGReg;
+-/* Used for function call generation. */
+-#define TCG_TARGET_CALL_STACK_OFFSET    0
+-#define TCG_TARGET_STACK_ALIGN          8
+-#if TCG_TARGET_REG_BITS == 32
+-# define TCG_TARGET_CALL_ARG_I32        TCG_CALL_ARG_EVEN
+-# define TCG_TARGET_CALL_ARG_I64        TCG_CALL_ARG_EVEN
+-# define TCG_TARGET_CALL_ARG_I128       TCG_CALL_ARG_EVEN
+-#else
+-# define TCG_TARGET_CALL_ARG_I32        TCG_CALL_ARG_NORMAL
+-# define TCG_TARGET_CALL_ARG_I64        TCG_CALL_ARG_NORMAL
+-# define TCG_TARGET_CALL_ARG_I128       TCG_CALL_ARG_NORMAL
+-#endif
+-#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_NORMAL
+-
+ #define HAVE_TCG_QEMU_TB_EXEC
+ #define TCG_TARGET_NEED_POOL_LABELS
+diff --git a/tcg/aarch64/tcg-target.c.inc b/tcg/aarch64/tcg-target.c.inc
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/aarch64/tcg-target.c.inc
++++ b/tcg/aarch64/tcg-target.c.inc
+@@ -XXX,XX +XXX,XX @@
+ #include "../tcg-pool.c.inc"
+ #include "qemu/bitops.h"
++/* Used for function call generation. */
++#define TCG_REG_CALL_STACK              TCG_REG_SP
++#define TCG_TARGET_STACK_ALIGN          16
++#define TCG_TARGET_CALL_STACK_OFFSET    0
++#define TCG_TARGET_CALL_ARG_I32         TCG_CALL_ARG_NORMAL
++#define TCG_TARGET_CALL_ARG_I64         TCG_CALL_ARG_NORMAL
++#ifdef CONFIG_DARWIN
++# define TCG_TARGET_CALL_ARG_I128       TCG_CALL_ARG_NORMAL
++#else
++# define TCG_TARGET_CALL_ARG_I128       TCG_CALL_ARG_EVEN
++#endif
++#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_NORMAL
++
+ /* We're going to re-use TCGType in setting of the SF bit, which controls
+    the size of the operation performed.  If we know the values match, it
+    makes things much cleaner.  */
+diff --git a/tcg/arm/tcg-target.c.inc b/tcg/arm/tcg-target.c.inc
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/arm/tcg-target.c.inc
++++ b/tcg/arm/tcg-target.c.inc
+@@ -XXX,XX +XXX,XX @@ bool use_idiv_instructions;
+ bool use_neon_instructions;
  #endif
- #define TCG_TARGET_CALL_ARG_I32      TCG_CALL_ARG_NORMAL
- #define TCG_TARGET_CALL_ARG_I64      TCG_CALL_ARG_NORMAL
++/* Used for function call generation. */
 +#define TCG_TARGET_STACK_ALIGN          8
 +#define TCG_TARGET_CALL_STACK_OFFSET    0
 +#define TCG_TARGET_CALL_ARG_I32         TCG_CALL_ARG_NORMAL
 +#define TCG_TARGET_CALL_ARG_I64         TCG_CALL_ARG_EVEN
 +#define TCG_TARGET_CALL_ARG_I128        TCG_CALL_ARG_EVEN
 +#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_BY_REF
 +
  #ifdef CONFIG_DEBUG_TCG
  static const char * const tcg_target_reg_names[TCG_TARGET_NB_REGS] = {
      "%r0",  "%r1",  "%r2",  "%r3",  "%r4",  "%r5",  "%r6",  "%r7",
 diff --git a/tcg/i386/tcg-target.c.inc b/tcg/i386/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/i386/tcg-target.c.inc
 +++ b/tcg/i386/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@
  #include "../tcg-ldst.c.inc"
  #include "../tcg-pool.c.inc"
 +/* Used for function call generation. */
 +#define TCG_TARGET_STACK_ALIGN 16
 +#if defined(_WIN64)
 +#define TCG_TARGET_CALL_STACK_OFFSET 32
 +#else
 +#define TCG_TARGET_CALL_STACK_OFFSET 0
 +#endif
 +#define TCG_TARGET_CALL_ARG_I32      TCG_CALL_ARG_NORMAL
 +#define TCG_TARGET_CALL_ARG_I64      TCG_CALL_ARG_NORMAL
 +#if defined(_WIN64)
 +# define TCG_TARGET_CALL_ARG_I128    TCG_CALL_ARG_BY_REF
 +# define TCG_TARGET_CALL_RET_I128    TCG_CALL_RET_BY_VEC
 +#elif TCG_TARGET_REG_BITS == 64
 +# define TCG_TARGET_CALL_ARG_I128    TCG_CALL_ARG_NORMAL
 +# define TCG_TARGET_CALL_RET_I128    TCG_CALL_RET_NORMAL
 +#else
 +# define TCG_TARGET_CALL_ARG_I128    TCG_CALL_ARG_NORMAL
 +# define TCG_TARGET_CALL_RET_I128    TCG_CALL_RET_BY_REF
 +#endif
++
- extern bool have_bmi1;
+ #ifdef CONFIG_DEBUG_TCG
- extern bool have_popcnt;
+ static const char * const tcg_target_reg_names[TCG_TARGET_NB_REGS] = {
-diff --git a/tcg/i386/tcg-target.c.inc b/tcg/i386/tcg-target.c.inc
+ #if TCG_TARGET_REG_BITS == 64
-index XXXXXXX..XXXXXXX 100644
+diff --git a/tcg/loongarch64/tcg-target.c.inc b/tcg/loongarch64/tcg-target.c.inc
---- a/tcg/i386/tcg-target.c.inc
+index XXXXXXX..XXXXXXX 100644
-+++ b/tcg/i386/tcg-target.c.inc
+--- a/tcg/loongarch64/tcg-target.c.inc
-@@ -XXX,XX +XXX,XX @@ static TCGReg tcg_target_call_oarg_reg(TCGCallReturnKind kind, int slot)
++++ b/tcg/loongarch64/tcg-target.c.inc
-     case TCG_CALL_RET_NORMAL:
+@@ -XXX,XX +XXX,XX @@
-         tcg_debug_assert(slot >= 0 && slot <= 1);
+ #include "../tcg-ldst.c.inc"
-         return slot ? TCG_REG_EDX : TCG_REG_EAX;
+ #include <asm/hwcap.h>
-+#ifdef _WIN64
-+    case TCG_CALL_RET_BY_VEC:
++/* used for function call generation */
-+        tcg_debug_assert(slot == 0);
++#define TCG_REG_CALL_STACK              TCG_REG_SP
-+        return TCG_REG_XMM0;
++#define TCG_TARGET_STACK_ALIGN          16
 +#define TCG_TARGET_CALL_STACK_OFFSET    0
 +#define TCG_TARGET_CALL_ARG_I32         TCG_CALL_ARG_NORMAL
 +#define TCG_TARGET_CALL_ARG_I64         TCG_CALL_ARG_NORMAL
 +#define TCG_TARGET_CALL_ARG_I128        TCG_CALL_ARG_NORMAL
 +#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_NORMAL
 +
  #ifdef CONFIG_DEBUG_TCG
  static const char * const tcg_target_reg_names[TCG_TARGET_NB_REGS] = {
      "zero",
 diff --git a/tcg/mips/tcg-target.c.inc b/tcg/mips/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/mips/tcg-target.c.inc
 +++ b/tcg/mips/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@
  #include "../tcg-ldst.c.inc"
  #include "../tcg-pool.c.inc"
 +/* used for function call generation */
 +#define TCG_TARGET_STACK_ALIGN        16
 +#if _MIPS_SIM == _ABIO32
 +# define TCG_TARGET_CALL_STACK_OFFSET 16
 +# define TCG_TARGET_CALL_ARG_I64      TCG_CALL_ARG_EVEN
 +# define TCG_TARGET_CALL_RET_I128     TCG_CALL_RET_BY_REF
 +#else
 +# define TCG_TARGET_CALL_STACK_OFFSET 0
 +# define TCG_TARGET_CALL_ARG_I64      TCG_CALL_ARG_NORMAL
 +# define TCG_TARGET_CALL_RET_I128     TCG_CALL_RET_NORMAL
 +#endif
-     default:
++#define TCG_TARGET_CALL_ARG_I32       TCG_CALL_ARG_NORMAL
-         g_assert_not_reached();
++#define TCG_TARGET_CALL_ARG_I128      TCG_CALL_ARG_EVEN
-     }
++
-@@ -XXX,XX +XXX,XX @@ static void tcg_out_st(TCGContext *s, TCGType type, TCGReg arg,
+ #if TCG_TARGET_REG_BITS == 32
-          * The gvec infrastructure is asserts that v128 vector loads
+ # define LO_OFF  (HOST_BIG_ENDIAN * 4)
-          * and stores use a 16-byte aligned offset.  Validate that the
+ # define HI_OFF  (4 - LO_OFF)
-          * final pointer is aligned by using an insn that will SIGSEGV.
+diff --git a/tcg/riscv/tcg-target.c.inc b/tcg/riscv/tcg-target.c.inc
-+         *
+index XXXXXXX..XXXXXXX 100644
-+         * This specific instance is also used by TCG_CALL_RET_BY_VEC,
+--- a/tcg/riscv/tcg-target.c.inc
-+         * for _WIN64, which must have SSE2 but may not have AVX.
++++ b/tcg/riscv/tcg-target.c.inc
-          */
+@@ -XXX,XX +XXX,XX @@
-         tcg_debug_assert(arg >= 16);
+ #include "../tcg-ldst.c.inc"
--        tcg_out_vex_modrm_offset(s, OPC_MOVDQA_WxVx, arg, 0, arg1, arg2);
+ #include "../tcg-pool.c.inc"
-+        if (have_avx1) {
-+            tcg_out_vex_modrm_offset(s, OPC_MOVDQA_WxVx, arg, 0, arg1, arg2);
++/* Used for function call generation. */
-+        } else {
++#define TCG_REG_CALL_STACK              TCG_REG_SP
-+            tcg_out_modrm_offset(s, OPC_MOVDQA_WxVx, arg, arg1, arg2);
++#define TCG_TARGET_STACK_ALIGN          16
-+        }
++#define TCG_TARGET_CALL_STACK_OFFSET    0
-         break;
++#define TCG_TARGET_CALL_ARG_I32         TCG_CALL_ARG_NORMAL
-     case TCG_TYPE_V256:
++#define TCG_TARGET_CALL_ARG_I64         TCG_CALL_ARG_NORMAL
-         /*
++#define TCG_TARGET_CALL_ARG_I128        TCG_CALL_ARG_NORMAL
-@@ -XXX,XX +XXX,XX @@ static void tcg_out_call(TCGContext *s, const tcg_insn_unit *dest,
++#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_NORMAL
-                          const TCGHelperInfo *info)
++
  #ifdef CONFIG_DEBUG_TCG
  static const char * const tcg_target_reg_names[TCG_TARGET_NB_REGS] = {
      "zero", "ra",  "sp",  "gp",  "tp",  "t0",  "t1",  "t2",
 diff --git a/tcg/s390x/tcg-target.c.inc b/tcg/s390x/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/s390x/tcg-target.c.inc
 +++ b/tcg/s390x/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@
  #include "../tcg-pool.c.inc"
  #include "elf.h"
 +/* Used for function call generation. */
 +#define TCG_TARGET_STACK_ALIGN          8
 +#define TCG_TARGET_CALL_STACK_OFFSET    160
 +#define TCG_TARGET_CALL_ARG_I32         TCG_CALL_ARG_EXTEND
 +#define TCG_TARGET_CALL_ARG_I64         TCG_CALL_ARG_NORMAL
 +#define TCG_TARGET_CALL_ARG_I128        TCG_CALL_ARG_BY_REF
 +#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_BY_REF
 +
  #define TCG_CT_CONST_S16        (1 << 8)
  #define TCG_CT_CONST_S32        (1 << 9)
  #define TCG_CT_CONST_U32        (1 << 10)
 diff --git a/tcg/sparc64/tcg-target.c.inc b/tcg/sparc64/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/sparc64/tcg-target.c.inc
 +++ b/tcg/sparc64/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@
  #include "../tcg-ldst.c.inc"
  #include "../tcg-pool.c.inc"
 +/* Used for function call generation. */
 +#define TCG_REG_CALL_STACK              TCG_REG_O6
 +#define TCG_TARGET_STACK_BIAS           2047
 +#define TCG_TARGET_STACK_ALIGN          16
 +#define TCG_TARGET_CALL_STACK_OFFSET    (128 + 6 * 8 + TCG_TARGET_STACK_BIAS)
 +#define TCG_TARGET_CALL_ARG_I32         TCG_CALL_ARG_EXTEND
 +#define TCG_TARGET_CALL_ARG_I64         TCG_CALL_ARG_NORMAL
 +#define TCG_TARGET_CALL_ARG_I128        TCG_CALL_ARG_NORMAL
 +#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_NORMAL
 +
  #ifdef CONFIG_DEBUG_TCG
  static const char * const tcg_target_reg_names[TCG_TARGET_NB_REGS] = {
      "%g0",
 diff --git a/tcg/tci/tcg-target.c.inc b/tcg/tci/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tci/tcg-target.c.inc
 +++ b/tcg/tci/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@
  #include "../tcg-pool.c.inc"
 +/* Used for function call generation. */
 +#define TCG_TARGET_CALL_STACK_OFFSET    0
 +#define TCG_TARGET_STACK_ALIGN          8
 +#if TCG_TARGET_REG_BITS == 32
 +# define TCG_TARGET_CALL_ARG_I32        TCG_CALL_ARG_EVEN
 +# define TCG_TARGET_CALL_ARG_I64        TCG_CALL_ARG_EVEN
 +# define TCG_TARGET_CALL_ARG_I128       TCG_CALL_ARG_EVEN
 +#else
 +# define TCG_TARGET_CALL_ARG_I32        TCG_CALL_ARG_NORMAL
 +# define TCG_TARGET_CALL_ARG_I64        TCG_CALL_ARG_NORMAL
 +# define TCG_TARGET_CALL_ARG_I128       TCG_CALL_ARG_NORMAL
 +#endif
 +#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_NORMAL
 +
  static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
  {
-     tcg_out_branch(s, 1, dest);
+     switch (op) {
 +
 +#ifndef _WIN32
 +    if (TCG_TARGET_REG_BITS == 32 && info->out_kind == TCG_CALL_RET_BY_REF) {
 +        /*
 +         * The sysv i386 abi for struct return places a reference as the
 +         * first argument of the stack, and pops that argument with the
 +         * return statement.  Since we want to retain the aligned stack
 +         * pointer for the callee, we do not want to actually push that
 +         * argument before the call but rely on the normal store to the
 +         * stack slot.  But we do need to compensate for the pop in order
 +         * to reset our correct stack pointer value.
 +         * Pushing a garbage value back onto the stack is quickest.
 +         */
 +        tcg_out_push(s, TCG_REG_EAX);
 +    }
 +#endif
  }
  static void tcg_out_jmp(TCGContext *s, const tcg_insn_unit *dest)
 --
-.34.1
+.43.0

-[PULL 18/40] tcg: Add tcg_gen_{non}atomic_cmpxchg_i128
+[PULL 03/68] tcg: Replace TCGOP_VECL with TCGOP_TYPE
-This will allow targets to avoid rolling their own.
+In the replacement, drop the TCGType - TCG_TYPE_V64 adjustment,
 except for the call to tcg_out_vec_op.  Pass type to tcg_gen_op[1-6],
 so that all integer opcodes gain the type.
-Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
 Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 ---
- accel/tcg/tcg-runtime.h       | 11 +++++
+ include/tcg/tcg.h      |   2 +-
- include/tcg/tcg-op.h          |  5 +++
+ tcg/tcg-internal.h     |  13 ++---
- tcg/tcg-op.c                  | 85 +++++++++++++++++++++++++++++++++++
+ tcg/optimize.c         |  10 +---
- accel/tcg/atomic_common.c.inc | 45 +++++++++++++++++++
+ tcg/tcg-op-ldst.c      |  26 ++++++----
-files changed, 146 insertions(+)
+ tcg/tcg-op-vec.c       |   8 +--
  tcg/tcg-op.c           | 113 +++++++++++++++++++++++------------------
  tcg/tcg.c              |  11 ++--
  docs/devel/tcg-ops.rst |  15 +++---
 files changed, 105 insertions(+), 93 deletions(-)
-diff --git a/accel/tcg/tcg-runtime.h b/accel/tcg/tcg-runtime.h
+diff --git a/include/tcg/tcg.h b/include/tcg/tcg.h
 index XXXXXXX..XXXXXXX 100644
---- a/accel/tcg/tcg-runtime.h
+--- a/include/tcg/tcg.h
-+++ b/accel/tcg/tcg-runtime.h
++++ b/include/tcg/tcg.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(atomic_cmpxchgq_be, TCG_CALL_NO_WG,
+@@ -XXX,XX +XXX,XX @@ struct TCGOp {
- DEF_HELPER_FLAGS_5(atomic_cmpxchgq_le, TCG_CALL_NO_WG,
+ #define TCGOP_CALLI(X)    (X)->param1
-                    i64, env, tl, i64, i64, i32)
+ #define TCGOP_CALLO(X)    (X)->param2
- #endif
-+#ifdef CONFIG_CMPXCHG128
+-#define TCGOP_VECL(X)     (X)->param1
-+DEF_HELPER_FLAGS_5(atomic_cmpxchgo_be, TCG_CALL_NO_WG,
++#define TCGOP_TYPE(X)     (X)->param1
-+                   i128, env, tl, i128, i128, i32)
+ #define TCGOP_VECE(X)     (X)->param2
-+DEF_HELPER_FLAGS_5(atomic_cmpxchgo_le, TCG_CALL_NO_WG,
-+                   i128, env, tl, i128, i128, i32)
+ /* Make sure operands fit in the bitfields above.  */
-+#endif
+diff --git a/tcg/tcg-internal.h b/tcg/tcg-internal.h
 +
 +DEF_HELPER_FLAGS_5(nonatomic_cmpxchgo_be, TCG_CALL_NO_WG,
 +                   i128, env, tl, i128, i128, i32)
 +DEF_HELPER_FLAGS_5(nonatomic_cmpxchgo_le, TCG_CALL_NO_WG,
 +                   i128, env, tl, i128, i128, i32)
  #ifdef CONFIG_ATOMIC64
  #define GEN_ATOMIC_HELPERS(NAME)                                  \
 diff --git a/include/tcg/tcg-op.h b/include/tcg/tcg-op.h
 index XXXXXXX..XXXXXXX 100644
---- a/include/tcg/tcg-op.h
+--- a/tcg/tcg-internal.h
-+++ b/include/tcg/tcg-op.h
++++ b/tcg/tcg-internal.h
-@@ -XXX,XX +XXX,XX @@ void tcg_gen_atomic_cmpxchg_i32(TCGv_i32, TCGv, TCGv_i32, TCGv_i32,
+@@ -XXX,XX +XXX,XX @@ TCGTemp *tcg_temp_new_internal(TCGType type, TCGTempKind kind);
-                                 TCGArg, MemOp);
+  */
- void tcg_gen_atomic_cmpxchg_i64(TCGv_i64, TCGv, TCGv_i64, TCGv_i64,
+ TCGTemp *tcg_constant_internal(TCGType type, int64_t val);
-                                 TCGArg, MemOp);
-+void tcg_gen_atomic_cmpxchg_i128(TCGv_i128, TCGv, TCGv_i128, TCGv_i128,
+-TCGOp *tcg_gen_op1(TCGOpcode, TCGArg);
-+                                 TCGArg, MemOp);
+-TCGOp *tcg_gen_op2(TCGOpcode, TCGArg, TCGArg);
-+
+-TCGOp *tcg_gen_op3(TCGOpcode, TCGArg, TCGArg, TCGArg);
-+void tcg_gen_nonatomic_cmpxchg_i128(TCGv_i128, TCGv, TCGv_i128, TCGv_i128,
+-TCGOp *tcg_gen_op4(TCGOpcode, TCGArg, TCGArg, TCGArg, TCGArg);
-+                                    TCGArg, MemOp);
+-TCGOp *tcg_gen_op5(TCGOpcode, TCGArg, TCGArg, TCGArg, TCGArg, TCGArg);
+-TCGOp *tcg_gen_op6(TCGOpcode, TCGArg, TCGArg, TCGArg, TCGArg, TCGArg, TCGArg);
- void tcg_gen_atomic_xchg_i32(TCGv_i32, TCGv, TCGv_i32, TCGArg, MemOp);
++TCGOp *tcg_gen_op1(TCGOpcode, TCGType, TCGArg);
- void tcg_gen_atomic_xchg_i64(TCGv_i64, TCGv, TCGv_i64, TCGArg, MemOp);
++TCGOp *tcg_gen_op2(TCGOpcode, TCGType, TCGArg, TCGArg);
 +TCGOp *tcg_gen_op3(TCGOpcode, TCGType, TCGArg, TCGArg, TCGArg);
 +TCGOp *tcg_gen_op4(TCGOpcode, TCGType, TCGArg, TCGArg, TCGArg, TCGArg);
 +TCGOp *tcg_gen_op5(TCGOpcode, TCGType, TCGArg, TCGArg, TCGArg, TCGArg, TCGArg);
 +TCGOp *tcg_gen_op6(TCGOpcode, TCGType, TCGArg, TCGArg,
 +                   TCGArg, TCGArg, TCGArg, TCGArg);
  void vec_gen_2(TCGOpcode, TCGType, unsigned, TCGArg, TCGArg);
  void vec_gen_3(TCGOpcode, TCGType, unsigned, TCGArg, TCGArg, TCGArg);
 diff --git a/tcg/optimize.c b/tcg/optimize.c
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/optimize.c
 +++ b/tcg/optimize.c
@@ -XXX,XX +XXX,XX @@ static bool tcg_opt_gen_mov(OptContext *ctx, TCGOp *op, TCGArg dst, TCGArg src)
      case TCG_TYPE_V64:
      case TCG_TYPE_V128:
      case TCG_TYPE_V256:
 -        /* TCGOP_VECL and TCGOP_VECE remain unchanged.  */
 +        /* TCGOP_TYPE and TCGOP_VECE remain unchanged.  */
          new_op = INDEX_op_mov_vec;
          break;
      default:
@@ -XXX,XX +XXX,XX @@ void tcg_optimize(TCGContext *s)
          copy_propagate(&ctx, op, def->nb_oargs, def->nb_iargs);
          /* Pre-compute the type of the operation. */
 -        if (def->flags & TCG_OPF_VECTOR) {
 -            ctx.type = TCG_TYPE_V64 + TCGOP_VECL(op);
 -        } else if (def->flags & TCG_OPF_64BIT) {
 -            ctx.type = TCG_TYPE_I64;
 -        } else {
 -            ctx.type = TCG_TYPE_I32;
 -        }
 +        ctx.type = TCGOP_TYPE(op);
          /*
           * Process each opcode.
 diff --git a/tcg/tcg-op-ldst.c b/tcg/tcg-op-ldst.c
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tcg-op-ldst.c
 +++ b/tcg/tcg-op-ldst.c
@@ -XXX,XX +XXX,XX @@ static MemOp tcg_canonicalize_memop(MemOp op, bool is64, bool st)
      return op;
  }
 -static void gen_ldst(TCGOpcode opc, TCGTemp *vl, TCGTemp *vh,
 +static void gen_ldst(TCGOpcode opc, TCGType type, TCGTemp *vl, TCGTemp *vh,
                       TCGTemp *addr, MemOpIdx oi)
  {
      if (TCG_TARGET_REG_BITS == 64 || tcg_ctx->addr_type == TCG_TYPE_I32) {
          if (vh) {
 -            tcg_gen_op4(opc, temp_arg(vl), temp_arg(vh), temp_arg(addr), oi);
 +            tcg_gen_op4(opc, type, temp_arg(vl), temp_arg(vh),
 +                        temp_arg(addr), oi);
          } else {
 -            tcg_gen_op3(opc, temp_arg(vl), temp_arg(addr), oi);
 +            tcg_gen_op3(opc, type, temp_arg(vl), temp_arg(addr), oi);
          }
      } else {
          /* See TCGV_LOW/HIGH. */
@@ -XXX,XX +XXX,XX @@ static void gen_ldst(TCGOpcode opc, TCGTemp *vl, TCGTemp *vh,
          TCGTemp *ah = addr + !HOST_BIG_ENDIAN;
          if (vh) {
 -            tcg_gen_op5(opc, temp_arg(vl), temp_arg(vh),
 +            tcg_gen_op5(opc, type, temp_arg(vl), temp_arg(vh),
                          temp_arg(al), temp_arg(ah), oi);
          } else {
 -            tcg_gen_op4(opc, temp_arg(vl), temp_arg(al), temp_arg(ah), oi);
 +            tcg_gen_op4(opc, type, temp_arg(vl),
 +                        temp_arg(al), temp_arg(ah), oi);
          }
      }
  }
@@ -XXX,XX +XXX,XX @@ static void gen_ldst_i64(TCGOpcode opc, TCGv_i64 v, TCGTemp *addr, MemOpIdx oi)
      if (TCG_TARGET_REG_BITS == 32) {
          TCGTemp *vl = tcgv_i32_temp(TCGV_LOW(v));
          TCGTemp *vh = tcgv_i32_temp(TCGV_HIGH(v));
 -        gen_ldst(opc, vl, vh, addr, oi);
 +        gen_ldst(opc, TCG_TYPE_I64, vl, vh, addr, oi);
      } else {
 -        gen_ldst(opc, tcgv_i64_temp(v), NULL, addr, oi);
 +        gen_ldst(opc, TCG_TYPE_I64, tcgv_i64_temp(v), NULL, addr, oi);
      }
  }
@@ -XXX,XX +XXX,XX @@ static void tcg_gen_qemu_ld_i32_int(TCGv_i32 val, TCGTemp *addr,
      } else {
          opc = INDEX_op_qemu_ld_a64_i32;
      }
 -    gen_ldst(opc, tcgv_i32_temp(val), NULL, addr, oi);
 +    gen_ldst(opc, TCG_TYPE_I32, tcgv_i32_temp(val), NULL, addr, oi);
      plugin_gen_mem_callbacks_i32(val, copy_addr, addr, orig_oi,
                                   QEMU_PLUGIN_MEM_R);
@@ -XXX,XX +XXX,XX @@ static void tcg_gen_qemu_st_i32_int(TCGv_i32 val, TCGTemp *addr,
              opc = INDEX_op_qemu_st_a64_i32;
          }
      }
 -    gen_ldst(opc, tcgv_i32_temp(val), NULL, addr, oi);
 +    gen_ldst(opc, TCG_TYPE_I32, tcgv_i32_temp(val), NULL, addr, oi);
      plugin_gen_mem_callbacks_i32(val, NULL, addr, orig_oi, QEMU_PLUGIN_MEM_W);
      if (swap) {
@@ -XXX,XX +XXX,XX @@ static void tcg_gen_qemu_ld_i128_int(TCGv_i128 val, TCGTemp *addr,
          } else {
              opc = INDEX_op_qemu_ld_a64_i128;
          }
 -        gen_ldst(opc, tcgv_i64_temp(lo), tcgv_i64_temp(hi), addr, oi);
 +        gen_ldst(opc, TCG_TYPE_I128, tcgv_i64_temp(lo),
 +                 tcgv_i64_temp(hi), addr, oi);
          if (need_bswap) {
              tcg_gen_bswap64_i64(lo, lo);
@@ -XXX,XX +XXX,XX @@ static void tcg_gen_qemu_st_i128_int(TCGv_i128 val, TCGTemp *addr,
          } else {
              opc = INDEX_op_qemu_st_a64_i128;
          }
 -        gen_ldst(opc, tcgv_i64_temp(lo), tcgv_i64_temp(hi), addr, oi);
 +        gen_ldst(opc, TCG_TYPE_I128, tcgv_i64_temp(lo),
 +                 tcgv_i64_temp(hi), addr, oi);
          if (need_bswap) {
              tcg_temp_free_i64(lo);
 diff --git a/tcg/tcg-op-vec.c b/tcg/tcg-op-vec.c
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tcg-op-vec.c
 +++ b/tcg/tcg-op-vec.c
@@ -XXX,XX +XXX,XX @@ bool tcg_can_emit_vecop_list(const TCGOpcode *list,
  void vec_gen_2(TCGOpcode opc, TCGType type, unsigned vece, TCGArg r, TCGArg a)
  {
      TCGOp *op = tcg_emit_op(opc, 2);
 -    TCGOP_VECL(op) = type - TCG_TYPE_V64;
 +    TCGOP_TYPE(op) = type;
      TCGOP_VECE(op) = vece;
      op->args[0] = r;
      op->args[1] = a;
@@ -XXX,XX +XXX,XX @@ void vec_gen_3(TCGOpcode opc, TCGType type, unsigned vece,
                 TCGArg r, TCGArg a, TCGArg b)
  {
      TCGOp *op = tcg_emit_op(opc, 3);
 -    TCGOP_VECL(op) = type - TCG_TYPE_V64;
 +    TCGOP_TYPE(op) = type;
      TCGOP_VECE(op) = vece;
      op->args[0] = r;
      op->args[1] = a;
@@ -XXX,XX +XXX,XX @@ void vec_gen_4(TCGOpcode opc, TCGType type, unsigned vece,
                 TCGArg r, TCGArg a, TCGArg b, TCGArg c)
  {
      TCGOp *op = tcg_emit_op(opc, 4);
 -    TCGOP_VECL(op) = type - TCG_TYPE_V64;
 +    TCGOP_TYPE(op) = type;
      TCGOP_VECE(op) = vece;
      op->args[0] = r;
      op->args[1] = a;
@@ -XXX,XX +XXX,XX @@ void vec_gen_6(TCGOpcode opc, TCGType type, unsigned vece, TCGArg r,
                 TCGArg a, TCGArg b, TCGArg c, TCGArg d, TCGArg e)
  {
      TCGOp *op = tcg_emit_op(opc, 6);
 -    TCGOP_VECL(op) = type - TCG_TYPE_V64;
 +    TCGOP_TYPE(op) = type;
      TCGOP_VECE(op) = vece;
      op->args[0] = r;
      op->args[1] = a;
 diff --git a/tcg/tcg-op.c b/tcg/tcg-op.c
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tcg-op.c
 +++ b/tcg/tcg-op.c
-@@ -XXX,XX +XXX,XX @@ typedef void (*gen_atomic_cx_i32)(TCGv_i32, TCGv_env, TCGv,
+@@ -XXX,XX +XXX,XX @@
-                                   TCGv_i32, TCGv_i32, TCGv_i32);
+  */
- typedef void (*gen_atomic_cx_i64)(TCGv_i64, TCGv_env, TCGv,
+ #define NI  __attribute__((noinline))
-                                   TCGv_i64, TCGv_i64, TCGv_i32);
-+typedef void (*gen_atomic_cx_i128)(TCGv_i128, TCGv_env, TCGv,
+-TCGOp * NI tcg_gen_op1(TCGOpcode opc, TCGArg a1)
-+                                   TCGv_i128, TCGv_i128, TCGv_i32);
++TCGOp * NI tcg_gen_op1(TCGOpcode opc, TCGType type, TCGArg a1)
- typedef void (*gen_atomic_op_i32)(TCGv_i32, TCGv_env, TCGv,
+ {
-                                   TCGv_i32, TCGv_i32);
+     TCGOp *op = tcg_emit_op(opc, 1);
- typedef void (*gen_atomic_op_i64)(TCGv_i64, TCGv_env, TCGv,
++    TCGOP_TYPE(op) = type;
-@@ -XXX,XX +XXX,XX @@ typedef void (*gen_atomic_op_i64)(TCGv_i64, TCGv_env, TCGv,
+     op->args[0] = a1;
- #else
+     return op;
- # define WITH_ATOMIC64(X)
+ }
 -TCGOp * NI tcg_gen_op2(TCGOpcode opc, TCGArg a1, TCGArg a2)
 +TCGOp * NI tcg_gen_op2(TCGOpcode opc, TCGType type, TCGArg a1, TCGArg a2)
  {
      TCGOp *op = tcg_emit_op(opc, 2);
 +    TCGOP_TYPE(op) = type;
      op->args[0] = a1;
      op->args[1] = a2;
      return op;
  }
 -TCGOp * NI tcg_gen_op3(TCGOpcode opc, TCGArg a1, TCGArg a2, TCGArg a3)
 +TCGOp * NI tcg_gen_op3(TCGOpcode opc, TCGType type, TCGArg a1,
 +                       TCGArg a2, TCGArg a3)
  {
      TCGOp *op = tcg_emit_op(opc, 3);
 +    TCGOP_TYPE(op) = type;
      op->args[0] = a1;
      op->args[1] = a2;
      op->args[2] = a3;
      return op;
  }
 -TCGOp * NI tcg_gen_op4(TCGOpcode opc, TCGArg a1, TCGArg a2,
 +TCGOp * NI tcg_gen_op4(TCGOpcode opc, TCGType type, TCGArg a1, TCGArg a2,
                         TCGArg a3, TCGArg a4)
  {
      TCGOp *op = tcg_emit_op(opc, 4);
 +    TCGOP_TYPE(op) = type;
      op->args[0] = a1;
      op->args[1] = a2;
      op->args[2] = a3;
@@ -XXX,XX +XXX,XX @@ TCGOp * NI tcg_gen_op4(TCGOpcode opc, TCGArg a1, TCGArg a2,
      return op;
  }
 -TCGOp * NI tcg_gen_op5(TCGOpcode opc, TCGArg a1, TCGArg a2,
 +TCGOp * NI tcg_gen_op5(TCGOpcode opc, TCGType type, TCGArg a1, TCGArg a2,
                         TCGArg a3, TCGArg a4, TCGArg a5)
  {
      TCGOp *op = tcg_emit_op(opc, 5);
 +    TCGOP_TYPE(op) = type;
      op->args[0] = a1;
      op->args[1] = a2;
      op->args[2] = a3;
@@ -XXX,XX +XXX,XX @@ TCGOp * NI tcg_gen_op5(TCGOpcode opc, TCGArg a1, TCGArg a2,
      return op;
  }
 -TCGOp * NI tcg_gen_op6(TCGOpcode opc, TCGArg a1, TCGArg a2, TCGArg a3,
 -                       TCGArg a4, TCGArg a5, TCGArg a6)
 +TCGOp * NI tcg_gen_op6(TCGOpcode opc, TCGType type, TCGArg a1, TCGArg a2,
 +                       TCGArg a3, TCGArg a4, TCGArg a5, TCGArg a6)
  {
      TCGOp *op = tcg_emit_op(opc, 6);
 +    TCGOP_TYPE(op) = type;
      op->args[0] = a1;
      op->args[1] = a2;
      op->args[2] = a3;
@@ -XXX,XX +XXX,XX @@ TCGOp * NI tcg_gen_op6(TCGOpcode opc, TCGArg a1, TCGArg a2, TCGArg a3,
  # define DNI
  #endif
-+#ifdef CONFIG_CMPXCHG128
-+# define WITH_ATOMIC128(X) X,
+-static void DNI tcg_gen_op1_i32(TCGOpcode opc, TCGv_i32 a1)
-+#else
++static void DNI tcg_gen_op1_i32(TCGOpcode opc, TCGType type, TCGv_i32 a1)
-+# define WITH_ATOMIC128(X)
+ {
-+#endif
+-    tcg_gen_op1(opc, tcgv_i32_arg(a1));
++    tcg_gen_op1(opc, type, tcgv_i32_arg(a1));
- static void * const table_cmpxchg[(MO_SIZE | MO_BSWAP) + 1] = {
+ }
-     [MO_8] = gen_helper_atomic_cmpxchgb,
-@@ -XXX,XX +XXX,XX @@ static void * const table_cmpxchg[(MO_SIZE | MO_BSWAP) + 1] = {
+-static void DNI tcg_gen_op1_i64(TCGOpcode opc, TCGv_i64 a1)
-     [MO_32 | MO_BE] = gen_helper_atomic_cmpxchgl_be,
++static void DNI tcg_gen_op1_i64(TCGOpcode opc, TCGType type, TCGv_i64 a1)
-     WITH_ATOMIC64([MO_64 | MO_LE] = gen_helper_atomic_cmpxchgq_le)
+ {
-     WITH_ATOMIC64([MO_64 | MO_BE] = gen_helper_atomic_cmpxchgq_be)
+-    tcg_gen_op1(opc, tcgv_i64_arg(a1));
-+    WITH_ATOMIC128([MO_128 | MO_LE] = gen_helper_atomic_cmpxchgo_le)
++    tcg_gen_op1(opc, type, tcgv_i64_arg(a1));
-+    WITH_ATOMIC128([MO_128 | MO_BE] = gen_helper_atomic_cmpxchgo_be)
+ }
- };
+-static TCGOp * DNI tcg_gen_op1i(TCGOpcode opc, TCGArg a1)
- void tcg_gen_atomic_cmpxchg_i32(TCGv_i32 retv, TCGv addr, TCGv_i32 cmpv,
++static TCGOp * DNI tcg_gen_op1i(TCGOpcode opc, TCGType type, TCGArg a1)
-@@ -XXX,XX +XXX,XX @@ void tcg_gen_atomic_cmpxchg_i64(TCGv_i64 retv, TCGv addr, TCGv_i64 cmpv,
+ {
 -    return tcg_gen_op1(opc, a1);
 +    return tcg_gen_op1(opc, type, a1);
  }
  static void DNI tcg_gen_op2_i32(TCGOpcode opc, TCGv_i32 a1, TCGv_i32 a2)
  {
 -    tcg_gen_op2(opc, tcgv_i32_arg(a1), tcgv_i32_arg(a2));
 +    tcg_gen_op2(opc, TCG_TYPE_I32, tcgv_i32_arg(a1), tcgv_i32_arg(a2));
  }
  static void DNI tcg_gen_op2_i64(TCGOpcode opc, TCGv_i64 a1, TCGv_i64 a2)
  {
 -    tcg_gen_op2(opc, tcgv_i64_arg(a1), tcgv_i64_arg(a2));
 +    tcg_gen_op2(opc, TCG_TYPE_I64, tcgv_i64_arg(a1), tcgv_i64_arg(a2));
  }
  static void DNI tcg_gen_op3_i32(TCGOpcode opc, TCGv_i32 a1,
                                  TCGv_i32 a2, TCGv_i32 a3)
  {
 -    tcg_gen_op3(opc, tcgv_i32_arg(a1), tcgv_i32_arg(a2), tcgv_i32_arg(a3));
 +    tcg_gen_op3(opc, TCG_TYPE_I32, tcgv_i32_arg(a1),
 +                tcgv_i32_arg(a2), tcgv_i32_arg(a3));
  }
  static void DNI tcg_gen_op3_i64(TCGOpcode opc, TCGv_i64 a1,
                                  TCGv_i64 a2, TCGv_i64 a3)
  {
 -    tcg_gen_op3(opc, tcgv_i64_arg(a1), tcgv_i64_arg(a2), tcgv_i64_arg(a3));
 +    tcg_gen_op3(opc, TCG_TYPE_I64, tcgv_i64_arg(a1),
 +                tcgv_i64_arg(a2), tcgv_i64_arg(a3));
  }
  static void DNI tcg_gen_op3i_i32(TCGOpcode opc, TCGv_i32 a1,
                                   TCGv_i32 a2, TCGArg a3)
  {
 -    tcg_gen_op3(opc, tcgv_i32_arg(a1), tcgv_i32_arg(a2), a3);
 +    tcg_gen_op3(opc, TCG_TYPE_I32, tcgv_i32_arg(a1), tcgv_i32_arg(a2), a3);
  }
  static void DNI tcg_gen_op3i_i64(TCGOpcode opc, TCGv_i64 a1,
                                   TCGv_i64 a2, TCGArg a3)
  {
 -    tcg_gen_op3(opc, tcgv_i64_arg(a1), tcgv_i64_arg(a2), a3);
 +    tcg_gen_op3(opc, TCG_TYPE_I64, tcgv_i64_arg(a1), tcgv_i64_arg(a2), a3);
  }
  static void DNI tcg_gen_ldst_op_i32(TCGOpcode opc, TCGv_i32 val,
                                      TCGv_ptr base, TCGArg offset)
  {
 -    tcg_gen_op3(opc, tcgv_i32_arg(val), tcgv_ptr_arg(base), offset);
 +    tcg_gen_op3(opc, TCG_TYPE_I32, tcgv_i32_arg(val),
 +                tcgv_ptr_arg(base), offset);
  }
  static void DNI tcg_gen_ldst_op_i64(TCGOpcode opc, TCGv_i64 val,
                                      TCGv_ptr base, TCGArg offset)
  {
 -    tcg_gen_op3(opc, tcgv_i64_arg(val), tcgv_ptr_arg(base), offset);
 +    tcg_gen_op3(opc, TCG_TYPE_I64, tcgv_i64_arg(val),
 +                tcgv_ptr_arg(base), offset);
  }
  static void DNI tcg_gen_op4_i32(TCGOpcode opc, TCGv_i32 a1, TCGv_i32 a2,
                                  TCGv_i32 a3, TCGv_i32 a4)
  {
 -    tcg_gen_op4(opc, tcgv_i32_arg(a1), tcgv_i32_arg(a2),
 +    tcg_gen_op4(opc, TCG_TYPE_I32, tcgv_i32_arg(a1), tcgv_i32_arg(a2),
                  tcgv_i32_arg(a3), tcgv_i32_arg(a4));
  }
  static void DNI tcg_gen_op4_i64(TCGOpcode opc, TCGv_i64 a1, TCGv_i64 a2,
                                  TCGv_i64 a3, TCGv_i64 a4)
  {
 -    tcg_gen_op4(opc, tcgv_i64_arg(a1), tcgv_i64_arg(a2),
 +    tcg_gen_op4(opc, TCG_TYPE_I64, tcgv_i64_arg(a1), tcgv_i64_arg(a2),
                  tcgv_i64_arg(a3), tcgv_i64_arg(a4));
  }
  static void DNI tcg_gen_op4i_i32(TCGOpcode opc, TCGv_i32 a1, TCGv_i32 a2,
                                   TCGv_i32 a3, TCGArg a4)
  {
 -    tcg_gen_op4(opc, tcgv_i32_arg(a1), tcgv_i32_arg(a2),
 +    tcg_gen_op4(opc, TCG_TYPE_I32, tcgv_i32_arg(a1), tcgv_i32_arg(a2),
                  tcgv_i32_arg(a3), a4);
  }
  static void DNI tcg_gen_op4i_i64(TCGOpcode opc, TCGv_i64 a1, TCGv_i64 a2,
                                   TCGv_i64 a3, TCGArg a4)
  {
 -    tcg_gen_op4(opc, tcgv_i64_arg(a1), tcgv_i64_arg(a2),
 +    tcg_gen_op4(opc, TCG_TYPE_I64, tcgv_i64_arg(a1), tcgv_i64_arg(a2),
                  tcgv_i64_arg(a3), a4);
  }
  static TCGOp * DNI tcg_gen_op4ii_i32(TCGOpcode opc, TCGv_i32 a1, TCGv_i32 a2,
                                       TCGArg a3, TCGArg a4)
  {
 -    return tcg_gen_op4(opc, tcgv_i32_arg(a1), tcgv_i32_arg(a2), a3, a4);
 +    return tcg_gen_op4(opc, TCG_TYPE_I32,
 +                       tcgv_i32_arg(a1), tcgv_i32_arg(a2), a3, a4);
  }
  static TCGOp * DNI tcg_gen_op4ii_i64(TCGOpcode opc, TCGv_i64 a1, TCGv_i64 a2,
                                       TCGArg a3, TCGArg a4)
  {
 -    return tcg_gen_op4(opc, tcgv_i64_arg(a1), tcgv_i64_arg(a2), a3, a4);
 +    return tcg_gen_op4(opc, TCG_TYPE_I64,
 +                       tcgv_i64_arg(a1), tcgv_i64_arg(a2), a3, a4);
  }
  static void DNI tcg_gen_op5_i32(TCGOpcode opc, TCGv_i32 a1, TCGv_i32 a2,
                                  TCGv_i32 a3, TCGv_i32 a4, TCGv_i32 a5)
  {
 -    tcg_gen_op5(opc, tcgv_i32_arg(a1), tcgv_i32_arg(a2),
 +    tcg_gen_op5(opc, TCG_TYPE_I32, tcgv_i32_arg(a1), tcgv_i32_arg(a2),
                  tcgv_i32_arg(a3), tcgv_i32_arg(a4), tcgv_i32_arg(a5));
  }
  static void DNI tcg_gen_op5_i64(TCGOpcode opc, TCGv_i64 a1, TCGv_i64 a2,
                                  TCGv_i64 a3, TCGv_i64 a4, TCGv_i64 a5)
  {
 -    tcg_gen_op5(opc, tcgv_i64_arg(a1), tcgv_i64_arg(a2),
 +    tcg_gen_op5(opc, TCG_TYPE_I64, tcgv_i64_arg(a1), tcgv_i64_arg(a2),
                  tcgv_i64_arg(a3), tcgv_i64_arg(a4), tcgv_i64_arg(a5));
  }
  static void DNI tcg_gen_op5ii_i32(TCGOpcode opc, TCGv_i32 a1, TCGv_i32 a2,
                                    TCGv_i32 a3, TCGArg a4, TCGArg a5)
  {
 -    tcg_gen_op5(opc, tcgv_i32_arg(a1), tcgv_i32_arg(a2),
 +    tcg_gen_op5(opc, TCG_TYPE_I32, tcgv_i32_arg(a1), tcgv_i32_arg(a2),
                  tcgv_i32_arg(a3), a4, a5);
  }
  static void DNI tcg_gen_op5ii_i64(TCGOpcode opc, TCGv_i64 a1, TCGv_i64 a2,
                                    TCGv_i64 a3, TCGArg a4, TCGArg a5)
  {
 -    tcg_gen_op5(opc, tcgv_i64_arg(a1), tcgv_i64_arg(a2),
 +    tcg_gen_op5(opc, TCG_TYPE_I64, tcgv_i64_arg(a1), tcgv_i64_arg(a2),
                  tcgv_i64_arg(a3), a4, a5);
  }
@@ -XXX,XX +XXX,XX @@ static void DNI tcg_gen_op6_i32(TCGOpcode opc, TCGv_i32 a1, TCGv_i32 a2,
                                  TCGv_i32 a3, TCGv_i32 a4,
                                  TCGv_i32 a5, TCGv_i32 a6)
  {
 -    tcg_gen_op6(opc, tcgv_i32_arg(a1), tcgv_i32_arg(a2),
 +    tcg_gen_op6(opc, TCG_TYPE_I32, tcgv_i32_arg(a1), tcgv_i32_arg(a2),
                  tcgv_i32_arg(a3), tcgv_i32_arg(a4), tcgv_i32_arg(a5),
                  tcgv_i32_arg(a6));
  }
@@ -XXX,XX +XXX,XX @@ static void DNI tcg_gen_op6_i64(TCGOpcode opc, TCGv_i64 a1, TCGv_i64 a2,
                                  TCGv_i64 a3, TCGv_i64 a4,
                                  TCGv_i64 a5, TCGv_i64 a6)
  {
 -    tcg_gen_op6(opc, tcgv_i64_arg(a1), tcgv_i64_arg(a2),
 +    tcg_gen_op6(opc, TCG_TYPE_I64, tcgv_i64_arg(a1), tcgv_i64_arg(a2),
                  tcgv_i64_arg(a3), tcgv_i64_arg(a4), tcgv_i64_arg(a5),
                  tcgv_i64_arg(a6));
  }
@@ -XXX,XX +XXX,XX @@ static void DNI tcg_gen_op6i_i32(TCGOpcode opc, TCGv_i32 a1, TCGv_i32 a2,
                                   TCGv_i32 a3, TCGv_i32 a4,
                                   TCGv_i32 a5, TCGArg a6)
  {
 -    tcg_gen_op6(opc, tcgv_i32_arg(a1), tcgv_i32_arg(a2),
 +    tcg_gen_op6(opc, TCG_TYPE_I32, tcgv_i32_arg(a1), tcgv_i32_arg(a2),
                  tcgv_i32_arg(a3), tcgv_i32_arg(a4), tcgv_i32_arg(a5), a6);
  }
@@ -XXX,XX +XXX,XX @@ static void DNI tcg_gen_op6i_i64(TCGOpcode opc, TCGv_i64 a1, TCGv_i64 a2,
                                   TCGv_i64 a3, TCGv_i64 a4,
                                   TCGv_i64 a5, TCGArg a6)
  {
 -    tcg_gen_op6(opc, tcgv_i64_arg(a1), tcgv_i64_arg(a2),
 +    tcg_gen_op6(opc, TCG_TYPE_I64, tcgv_i64_arg(a1), tcgv_i64_arg(a2),
                  tcgv_i64_arg(a3), tcgv_i64_arg(a4), tcgv_i64_arg(a5), a6);
  }
@@ -XXX,XX +XXX,XX @@ static TCGOp * DNI tcg_gen_op6ii_i32(TCGOpcode opc, TCGv_i32 a1, TCGv_i32 a2,
                                       TCGv_i32 a3, TCGv_i32 a4,
                                       TCGArg a5, TCGArg a6)
  {
 -    return tcg_gen_op6(opc, tcgv_i32_arg(a1), tcgv_i32_arg(a2),
 +    return tcg_gen_op6(opc, TCG_TYPE_I32, tcgv_i32_arg(a1), tcgv_i32_arg(a2),
                         tcgv_i32_arg(a3), tcgv_i32_arg(a4), a5, a6);
  }
@@ -XXX,XX +XXX,XX @@ static TCGOp * DNI tcg_gen_op6ii_i32(TCGOpcode opc, TCGv_i32 a1, TCGv_i32 a2,
  void gen_set_label(TCGLabel *l)
  {
      l->present = 1;
 -    tcg_gen_op1(INDEX_op_set_label, label_arg(l));
 +    tcg_gen_op1(INDEX_op_set_label, 0, label_arg(l));
  }
  static void add_as_label_use(TCGLabel *l, TCGOp *op)
@@ -XXX,XX +XXX,XX @@ static void add_as_label_use(TCGLabel *l, TCGOp *op)
  void tcg_gen_br(TCGLabel *l)
  {
 -    add_as_label_use(l, tcg_gen_op1(INDEX_op_br, label_arg(l)));
 +    add_as_label_use(l, tcg_gen_op1(INDEX_op_br, 0, label_arg(l)));
  }
  void tcg_gen_mb(TCGBar mb_type)
@@ -XXX,XX +XXX,XX @@ void tcg_gen_mb(TCGBar mb_type)
  #endif
      if (parallel) {
 -        tcg_gen_op1(INDEX_op_mb, mb_type);
 +        tcg_gen_op1(INDEX_op_mb, 0, mb_type);
      }
  }
-+void tcg_gen_nonatomic_cmpxchg_i128(TCGv_i128 retv, TCGv addr, TCGv_i128 cmpv,
+ void tcg_gen_plugin_cb(unsigned from)
-+                                    TCGv_i128 newv, TCGArg idx, MemOp memop)
+ {
-+{
+-    tcg_gen_op1(INDEX_op_plugin_cb, from);
-+    if (TCG_TARGET_REG_BITS == 32) {
++    tcg_gen_op1(INDEX_op_plugin_cb, 0, from);
-+        /* Inline expansion below is simply too large for 32-bit hosts. */
+ }
-+        gen_atomic_cx_i128 gen = ((memop & MO_BSWAP) == MO_LE
-+                                  ? gen_helper_nonatomic_cmpxchgo_le
+ void tcg_gen_plugin_mem_cb(TCGv_i64 addr, unsigned meminfo)
-+                                  : gen_helper_nonatomic_cmpxchgo_be);
+ {
-+        MemOpIdx oi = make_memop_idx(memop, idx);
+-    tcg_gen_op2(INDEX_op_plugin_mem_cb, tcgv_i64_arg(addr), meminfo);
-+
++    tcg_gen_op2(INDEX_op_plugin_mem_cb, 0, tcgv_i64_arg(addr), meminfo);
-+        tcg_debug_assert((memop & MO_SIZE) == MO_128);
+ }
-+        tcg_debug_assert((memop & MO_SIGN) == 0);
-+
+ /* 32 bit ops */
-+        gen(retv, cpu_env, addr, cmpv, newv, tcg_constant_i32(oi));
-+    } else {
+ void tcg_gen_discard_i32(TCGv_i32 arg)
-+        TCGv_i128 oldv = tcg_temp_new_i128();
+ {
-+        TCGv_i128 tmpv = tcg_temp_new_i128();
+-    tcg_gen_op1_i32(INDEX_op_discard, arg);
-+        TCGv_i64 t0 = tcg_temp_new_i64();
++    tcg_gen_op1_i32(INDEX_op_discard, TCG_TYPE_I32, arg);
-+        TCGv_i64 t1 = tcg_temp_new_i64();
+ }
-+        TCGv_i64 z = tcg_constant_i64(0);
-+
+ void tcg_gen_mov_i32(TCGv_i32 ret, TCGv_i32 arg)
-+        tcg_gen_qemu_ld_i128(oldv, addr, idx, memop);
+@@ -XXX,XX +XXX,XX @@ void tcg_gen_st_i32(TCGv_i32 arg1, TCGv_ptr arg2, tcg_target_long offset)
-+
+ void tcg_gen_discard_i64(TCGv_i64 arg)
-+        /* Compare i128 */
+ {
-+        tcg_gen_xor_i64(t0, TCGV128_LOW(oldv), TCGV128_LOW(cmpv));
+     if (TCG_TARGET_REG_BITS == 64) {
-+        tcg_gen_xor_i64(t1, TCGV128_HIGH(oldv), TCGV128_HIGH(cmpv));
+-        tcg_gen_op1_i64(INDEX_op_discard, arg);
-+        tcg_gen_or_i64(t0, t0, t1);
++        tcg_gen_op1_i64(INDEX_op_discard, TCG_TYPE_I64, arg);
-+
+     } else {
-+        /* tmpv = equal ? newv : oldv */
+         tcg_gen_discard_i32(TCGV_LOW(arg));
-+        tcg_gen_movcond_i64(TCG_COND_EQ, TCGV128_LOW(tmpv), t0, z,
+         tcg_gen_discard_i32(TCGV_HIGH(arg));
-+                            TCGV128_LOW(newv), TCGV128_LOW(oldv));
+@@ -XXX,XX +XXX,XX @@ void tcg_gen_extrl_i64_i32(TCGv_i32 ret, TCGv_i64 arg)
-+        tcg_gen_movcond_i64(TCG_COND_EQ, TCGV128_HIGH(tmpv), t0, z,
+     if (TCG_TARGET_REG_BITS == 32) {
-+                            TCGV128_HIGH(newv), TCGV128_HIGH(oldv));
+         tcg_gen_mov_i32(ret, TCGV_LOW(arg));
-+
+     } else if (TCG_TARGET_HAS_extr_i64_i32) {
-+        /* Unconditional writeback. */
+-        tcg_gen_op2(INDEX_op_extrl_i64_i32,
-+        tcg_gen_qemu_st_i128(tmpv, addr, idx, memop);
++        tcg_gen_op2(INDEX_op_extrl_i64_i32, TCG_TYPE_I32,
-+        tcg_gen_mov_i128(retv, oldv);
+                     tcgv_i32_arg(ret), tcgv_i64_arg(arg));
-+
+     } else {
-+        tcg_temp_free_i64(t0);
+         tcg_gen_mov_i32(ret, (TCGv_i32)arg);
-+        tcg_temp_free_i64(t1);
+@@ -XXX,XX +XXX,XX @@ void tcg_gen_extrh_i64_i32(TCGv_i32 ret, TCGv_i64 arg)
-+        tcg_temp_free_i128(tmpv);
+     if (TCG_TARGET_REG_BITS == 32) {
-+        tcg_temp_free_i128(oldv);
+         tcg_gen_mov_i32(ret, TCGV_HIGH(arg));
-+    }
+     } else if (TCG_TARGET_HAS_extr_i64_i32) {
-+}
+-        tcg_gen_op2(INDEX_op_extrh_i64_i32,
-+
++        tcg_gen_op2(INDEX_op_extrh_i64_i32, TCG_TYPE_I32,
-+void tcg_gen_atomic_cmpxchg_i128(TCGv_i128 retv, TCGv addr, TCGv_i128 cmpv,
+                     tcgv_i32_arg(ret), tcgv_i64_arg(arg));
-+                                 TCGv_i128 newv, TCGArg idx, MemOp memop)
+     } else {
-+{
+         TCGv_i64 t = tcg_temp_ebb_new_i64();
-+    gen_atomic_cx_i128 gen;
+@@ -XXX,XX +XXX,XX @@ void tcg_gen_extu_i32_i64(TCGv_i64 ret, TCGv_i32 arg)
-+
+         tcg_gen_mov_i32(TCGV_LOW(ret), arg);
-+    if (!(tcg_ctx->gen_tb->cflags & CF_PARALLEL)) {
+         tcg_gen_movi_i32(TCGV_HIGH(ret), 0);
-+        tcg_gen_nonatomic_cmpxchg_i128(retv, addr, cmpv, newv, idx, memop);
+     } else {
-+        return;
+-        tcg_gen_op2(INDEX_op_extu_i32_i64,
-+    }
++        tcg_gen_op2(INDEX_op_extu_i32_i64, TCG_TYPE_I64,
-+
+                     tcgv_i64_arg(ret), tcgv_i32_arg(arg));
-+    tcg_debug_assert((memop & MO_SIZE) == MO_128);
+     }
-+    tcg_debug_assert((memop & MO_SIGN) == 0);
+ }
-+    gen = table_cmpxchg[memop & (MO_SIZE | MO_BSWAP)];
+@@ -XXX,XX +XXX,XX @@ void tcg_gen_ext_i32_i64(TCGv_i64 ret, TCGv_i32 arg)
-+
+         tcg_gen_mov_i32(TCGV_LOW(ret), arg);
-+    if (gen) {
+         tcg_gen_sari_i32(TCGV_HIGH(ret), TCGV_LOW(ret), 31);
-+        MemOpIdx oi = make_memop_idx(memop, idx);
+     } else {
-+        gen(retv, cpu_env, addr, cmpv, newv, tcg_constant_i32(oi));
+-        tcg_gen_op2(INDEX_op_ext_i32_i64,
-+        return;
++        tcg_gen_op2(INDEX_op_ext_i32_i64, TCG_TYPE_I64,
-+    }
+                     tcgv_i64_arg(ret), tcgv_i32_arg(arg));
-+
+     }
-+    gen_helper_exit_atomic(cpu_env);
+ }
-+
+@@ -XXX,XX +XXX,XX @@ void tcg_gen_exit_tb(const TranslationBlock *tb, unsigned idx)
-+    /*
+         tcg_debug_assert(idx == TB_EXIT_REQUESTED);
-+     * Produce a result for a well-formed opcode stream.  This satisfies
+     }
-+     * liveness for set before used, which happens before this dead code
-+     * is removed.
+-    tcg_gen_op1i(INDEX_op_exit_tb, val);
-+     */
++    tcg_gen_op1i(INDEX_op_exit_tb, 0, val);
-+    tcg_gen_movi_i64(TCGV128_LOW(retv), 0);
+ }
-+    tcg_gen_movi_i64(TCGV128_HIGH(retv), 0);
-+}
+ void tcg_gen_goto_tb(unsigned idx)
-+
+@@ -XXX,XX +XXX,XX @@ void tcg_gen_goto_tb(unsigned idx)
- static void do_nonatomic_op_i32(TCGv_i32 ret, TCGv addr, TCGv_i32 val,
+     tcg_ctx->goto_tb_issue_mask |= 1 << idx;
-                                 TCGArg idx, MemOp memop, bool new_val,
+ #endif
-                                 void (*gen)(TCGv_i32, TCGv_i32, TCGv_i32))
+     plugin_gen_disable_mem_helpers();
-diff --git a/accel/tcg/atomic_common.c.inc b/accel/tcg/atomic_common.c.inc
+-    tcg_gen_op1i(INDEX_op_goto_tb, idx);
 +    tcg_gen_op1i(INDEX_op_goto_tb, 0, idx);
  }
  void tcg_gen_lookup_and_goto_ptr(void)
@@ -XXX,XX +XXX,XX @@ void tcg_gen_lookup_and_goto_ptr(void)
      plugin_gen_disable_mem_helpers();
      ptr = tcg_temp_ebb_new_ptr();
      gen_helper_lookup_tb_ptr(ptr, tcg_env);
 -    tcg_gen_op1i(INDEX_op_goto_ptr, tcgv_ptr_arg(ptr));
 +    tcg_gen_op1i(INDEX_op_goto_ptr, TCG_TYPE_PTR, tcgv_ptr_arg(ptr));
      tcg_temp_free_ptr(ptr);
  }
 diff --git a/tcg/tcg.c b/tcg/tcg.c
 index XXXXXXX..XXXXXXX 100644
---- a/accel/tcg/atomic_common.c.inc
+--- a/tcg/tcg.c
-+++ b/accel/tcg/atomic_common.c.inc
++++ b/tcg/tcg.c
-@@ -XXX,XX +XXX,XX @@ CMPXCHG_HELPER(cmpxchgq_be, uint64_t)
+@@ -XXX,XX +XXX,XX @@ void tcg_dump_ops(TCGContext *s, FILE *f, bool have_prefs)
- CMPXCHG_HELPER(cmpxchgq_le, uint64_t)
+             nb_cargs = def->nb_cargs;
- #endif
+             if (def->flags & TCG_OPF_VECTOR) {
-+#ifdef CONFIG_CMPXCHG128
+-                col += ne_fprintf(f, "v%d,e%d,", 64 << TCGOP_VECL(op),
-+CMPXCHG_HELPER(cmpxchgo_be, Int128)
++                col += ne_fprintf(f, "v%d,e%d,",
-+CMPXCHG_HELPER(cmpxchgo_le, Int128)
++                                  8 * tcg_type_size(TCGOP_TYPE(op)),
-+#endif
+<< TCGOP_VECE(op));
-+
+             }
- #undef CMPXCHG_HELPER
+@@ -XXX,XX +XXX,XX @@ static void tcg_reg_alloc_dup(TCGContext *s, const TCGOp *op)
-+Int128 HELPER(nonatomic_cmpxchgo_be)(CPUArchState *env, target_ulong addr,
-+                                     Int128 cmpv, Int128 newv, uint32_t oi)
+     itype = its->type;
-+{
+     vece = TCGOP_VECE(op);
-+#if TCG_TARGET_REG_BITS == 32
+-    vtype = TCGOP_VECL(op) + TCG_TYPE_V64;
-+    uintptr_t ra = GETPC();
++    vtype = TCGOP_TYPE(op);
-+    Int128 oldv;
-+
+     if (its->val_type == TEMP_VAL_CONST) {
-+    oldv = cpu_ld16_be_mmu(env, addr, oi, ra);
+         /* Propagate constant via movi -> dupi.  */
-+    if (int128_eq(oldv, cmpv)) {
+@@ -XXX,XX +XXX,XX @@ static void tcg_reg_alloc_op(TCGContext *s, const TCGOp *op)
-+        cpu_st16_be_mmu(env, addr, newv, oi, ra);
+         break;
-+    } else {
+     default:
-+        /* Even with comparison failure, still need a write cycle. */
+         if (def->flags & TCG_OPF_VECTOR) {
-+        probe_write(env, addr, 16, get_mmuidx(oi), ra);
+-            tcg_out_vec_op(s, op->opc, TCGOP_VECL(op), TCGOP_VECE(op),
-+    }
+-                           new_args, const_args);
-+    return oldv;
++            tcg_out_vec_op(s, op->opc, TCGOP_TYPE(op) - TCG_TYPE_V64,
-+#else
++                           TCGOP_VECE(op), new_args, const_args);
-+    g_assert_not_reached();
+         } else {
-+#endif
+             tcg_out_op(s, op->opc, new_args, const_args);
-+}
+         }
-+
+@@ -XXX,XX +XXX,XX @@ static bool tcg_reg_alloc_dup2(TCGContext *s, const TCGOp *op)
-+Int128 HELPER(nonatomic_cmpxchgo_le)(CPUArchState *env, target_ulong addr,
+ {
-+                                     Int128 cmpv, Int128 newv, uint32_t oi)
+     const TCGLifeData arg_life = op->life;
-+{
+     TCGTemp *ots, *itsl, *itsh;
-+#if TCG_TARGET_REG_BITS == 32
+-    TCGType vtype = TCGOP_VECL(op) + TCG_TYPE_V64;
-+    uintptr_t ra = GETPC();
++    TCGType vtype = TCGOP_TYPE(op);
-+    Int128 oldv;
-+
+     /* This opcode is only valid for 32-bit hosts, for 64-bit elements. */
-+    oldv = cpu_ld16_le_mmu(env, addr, oi, ra);
+     tcg_debug_assert(TCG_TARGET_REG_BITS == 32);
-+    if (int128_eq(oldv, cmpv)) {
+diff --git a/docs/devel/tcg-ops.rst b/docs/devel/tcg-ops.rst
-+        cpu_st16_le_mmu(env, addr, newv, oi, ra);
+index XXXXXXX..XXXXXXX 100644
-+    } else {
+--- a/docs/devel/tcg-ops.rst
-+        /* Even with comparison failure, still need a write cycle. */
++++ b/docs/devel/tcg-ops.rst
-+        probe_write(env, addr, 16, get_mmuidx(oi), ra);
+@@ -XXX,XX +XXX,XX @@ QEMU specific operations
-+    }
+ Host vector operations
-+    return oldv;
+ ----------------------
-+#else
-+    g_assert_not_reached();
+-All of the vector ops have two parameters, ``TCGOP_VECL`` & ``TCGOP_VECE``.
-+#endif
+-The former specifies the length of the vector in log2 64-bit units; the
-+}
+-latter specifies the length of the element (if applicable) in log2 8-bit units.
-+
+-E.g. VECL = 1 -> 64 << 1 -> v128, and VECE = 2 -> 1 << 2 -> i32.
- #define ATOMIC_HELPER(OP, TYPE) \
++All of the vector ops have two parameters, ``TCGOP_TYPE`` & ``TCGOP_VECE``.
-     TYPE HELPER(glue(atomic_,OP))(CPUArchState *env, target_ulong addr,  \
++The former specifies the length of the vector as a TCGType; the latter
-                                   TYPE val, uint32_t oi)                 \
++specifies the length of the element (if applicable) in log2 8-bit units.
  .. list-table::
@@ -XXX,XX +XXX,XX @@ E.g. VECL = 1 -> 64 << 1 -> v128, and VECE = 2 -> 1 << 2 -> i32.
     * - dup_vec *v0*, *r1*
 -     - | Duplicate the low N bits of *r1* into VECL/VECE copies across *v0*.
 +     - | Duplicate the low N bits of *r1* into TYPE/VECE copies across *v0*.
     * - dupi_vec *v0*, *c*
@@ -XXX,XX +XXX,XX @@ E.g. VECL = 1 -> 64 << 1 -> v128, and VECE = 2 -> 1 << 2 -> i32.
     * - dup2_vec *v0*, *r1*, *r2*
 -     - | Duplicate *r2*:*r1* into VECL/64 copies across *v0*. This opcode is
 +     - | Duplicate *r2*:*r1* into TYPE/64 copies across *v0*. This opcode is
           only present for 32-bit hosts.
     * - add_vec *v0*, *v1*, *v2*
@@ -XXX,XX +XXX,XX @@ E.g. VECL = 1 -> 64 << 1 -> v128, and VECE = 2 -> 1 << 2 -> i32.
         .. code-block:: c
 -          for (i = 0; i < VECL/VECE; ++i) {
 +          for (i = 0; i < TYPE/VECE; ++i) {
                v0[i] = v1[i] << s2;
            }
@@ -XXX,XX +XXX,XX @@ E.g. VECL = 1 -> 64 << 1 -> v128, and VECE = 2 -> 1 << 2 -> i32.
         .. code-block:: c
 -          for (i = 0; i < VECL/VECE; ++i) {
 +          for (i = 0; i < TYPE/VECE; ++i) {
                v0[i] = v1[i] << v2[i];
            }
 --
-.34.1
+.43.0

-[PULL 16/40] tcg: Add basic data movement for TCGv_i128
+[PULL 04/68] tcg: Move tcg_op_insert_{after, before} decls to tcg-internal.h
-Add code generation functions for data movement between
+These are not particularly useful outside of optimization passes.
 TCGv_i128 (mov) and to/from TCGv_i64 (concat, extract).
-Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
 Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 ---
- include/tcg/tcg-op.h |  4 ++++
+ include/tcg/tcg.h  | 4 ----
- tcg/tcg-internal.h   | 13 +++++++++++++
+ tcg/tcg-internal.h | 5 +++++
- tcg/tcg-op.c         | 20 ++++++++++++++++++++
+files changed, 5 insertions(+), 4 deletions(-)
 files changed, 37 insertions(+)
-diff --git a/include/tcg/tcg-op.h b/include/tcg/tcg-op.h
+diff --git a/include/tcg/tcg.h b/include/tcg/tcg.h
 index XXXXXXX..XXXXXXX 100644
---- a/include/tcg/tcg-op.h
+--- a/include/tcg/tcg.h
-+++ b/include/tcg/tcg-op.h
++++ b/include/tcg/tcg.h
-@@ -XXX,XX +XXX,XX @@ void tcg_gen_extrh_i64_i32(TCGv_i32 ret, TCGv_i64 arg);
+@@ -XXX,XX +XXX,XX @@ void tcg_gen_call7(void *func, TCGHelperInfo *, TCGTemp *ret,
- void tcg_gen_extr_i64_i32(TCGv_i32 lo, TCGv_i32 hi, TCGv_i64 arg);
- void tcg_gen_extr32_i64(TCGv_i64 lo, TCGv_i64 hi, TCGv_i64 arg);
+ TCGOp *tcg_emit_op(TCGOpcode opc, unsigned nargs);
+ void tcg_op_remove(TCGContext *s, TCGOp *op);
-+void tcg_gen_mov_i128(TCGv_i128 dst, TCGv_i128 src);
+-TCGOp *tcg_op_insert_before(TCGContext *s, TCGOp *op,
-+void tcg_gen_extr_i128_i64(TCGv_i64 lo, TCGv_i64 hi, TCGv_i128 arg);
+-                            TCGOpcode opc, unsigned nargs);
-+void tcg_gen_concat_i64_i128(TCGv_i128 ret, TCGv_i64 lo, TCGv_i64 hi);
+-TCGOp *tcg_op_insert_after(TCGContext *s, TCGOp *op,
-+
+-                           TCGOpcode opc, unsigned nargs);
- static inline void tcg_gen_concat32_i64(TCGv_i64 ret, TCGv_i64 lo, TCGv_i64 hi)
- {
+ /**
-     tcg_gen_deposit_i64(ret, lo, hi, 32, 32);
+  * tcg_remove_ops_after:
 diff --git a/tcg/tcg-internal.h b/tcg/tcg-internal.h
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tcg-internal.h
 +++ b/tcg/tcg-internal.h
-@@ -XXX,XX +XXX,XX @@ extern TCGv_i32 TCGV_LOW(TCGv_i64) QEMU_ERROR("32-bit code path is reachable");
+@@ -XXX,XX +XXX,XX @@ void vec_gen_4(TCGOpcode, TCGType, unsigned, TCGArg, TCGArg, TCGArg, TCGArg);
- extern TCGv_i32 TCGV_HIGH(TCGv_i64) QEMU_ERROR("32-bit code path is reachable");
+ void vec_gen_6(TCGOpcode opc, TCGType type, unsigned vece, TCGArg r,
- #endif
+                TCGArg a, TCGArg b, TCGArg c, TCGArg d, TCGArg e);
-+static inline TCGv_i64 TCGV128_LOW(TCGv_i128 t)
++TCGOp *tcg_op_insert_before(TCGContext *s, TCGOp *op,
-+{
++                            TCGOpcode opc, unsigned nargs);
-+    /* For 32-bit, offset by 2, which may then have TCGV_{LOW,HIGH} applied. */
++TCGOp *tcg_op_insert_after(TCGContext *s, TCGOp *op,
-+    int o = HOST_BIG_ENDIAN ? 64 / TCG_TARGET_REG_BITS : 0;
++                           TCGOpcode opc, unsigned nargs);
 +    return temp_tcgv_i64(tcgv_i128_temp(t) + o);
 +}
 +
 +static inline TCGv_i64 TCGV128_HIGH(TCGv_i128 t)
 +{
 +    int o = HOST_BIG_ENDIAN ? 0 : 64 / TCG_TARGET_REG_BITS;
 +    return temp_tcgv_i64(tcgv_i128_temp(t) + o);
 +}
 +
  #endif /* TCG_INTERNAL_H */
-diff --git a/tcg/tcg-op.c b/tcg/tcg-op.c
-index XXXXXXX..XXXXXXX 100644
---- a/tcg/tcg-op.c
-+++ b/tcg/tcg-op.c
-@@ -XXX,XX +XXX,XX @@ void tcg_gen_extr32_i64(TCGv_i64 lo, TCGv_i64 hi, TCGv_i64 arg)
-     tcg_gen_shri_i64(hi, arg, 32);
- }
-+void tcg_gen_extr_i128_i64(TCGv_i64 lo, TCGv_i64 hi, TCGv_i128 arg)
-+{
-+    tcg_gen_mov_i64(lo, TCGV128_LOW(arg));
-+    tcg_gen_mov_i64(hi, TCGV128_HIGH(arg));
-+}
-+
-+void tcg_gen_concat_i64_i128(TCGv_i128 ret, TCGv_i64 lo, TCGv_i64 hi)
-+{
-+    tcg_gen_mov_i64(TCGV128_LOW(ret), lo);
-+    tcg_gen_mov_i64(TCGV128_HIGH(ret), hi);
-+}
-+
-+void tcg_gen_mov_i128(TCGv_i128 dst, TCGv_i128 src)
-+{
-+    if (dst != src) {
-+        tcg_gen_mov_i64(TCGV128_LOW(dst), TCGV128_LOW(src));
-+        tcg_gen_mov_i64(TCGV128_HIGH(dst), TCGV128_HIGH(src));
-+    }
-+}
-+
- /* QEMU specific operations.  */
- void tcg_gen_exit_tb(const TranslationBlock *tb, unsigned idx)
 --
-.34.1
+.43.0

-[PULL 04/40] tcg: Handle dh_typecode_i128 with TCG_CALL_{RET, ARG}_NORMAL
+[PULL 05/68] tcg: Copy TCGOP_TYPE in tcg_op_insert_{after,before}
-Many hosts pass and return 128-bit quantities like sequential
+Simplify use within the optimizers by defaulting the
--bit quantities.  Treat this just like we currently break
+new opcode to the same type as the old opcode.
 down 64-bit quantities for a 32-bit host.
-Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 ---
- tcg/tcg.c | 37 +++++++++++++++++++++++++++++++++----
+ tcg/tcg.c | 4 ++++
-file changed, 33 insertions(+), 4 deletions(-)
+file changed, 4 insertions(+)
 diff --git a/tcg/tcg.c b/tcg/tcg.c
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tcg.c
 +++ b/tcg/tcg.c
-@@ -XXX,XX +XXX,XX @@ static void init_call_layout(TCGHelperInfo *info)
+@@ -XXX,XX +XXX,XX @@ TCGOp *tcg_op_insert_before(TCGContext *s, TCGOp *old_op,
-     case dh_typecode_s64:
+                             TCGOpcode opc, unsigned nargs)
-         info->nr_out = 64 / TCG_TARGET_REG_BITS;
+ {
-         info->out_kind = TCG_CALL_RET_NORMAL;
+     TCGOp *new_op = tcg_op_alloc(opc, nargs);
 +        assert(info->nr_out <= ARRAY_SIZE(tcg_target_call_oarg_regs));
 +        break;
 +    case dh_typecode_i128:
 +        info->nr_out = 128 / TCG_TARGET_REG_BITS;
 +        info->out_kind = TCG_CALL_RET_NORMAL; /* TODO */
 +        switch (/* TODO */ TCG_CALL_RET_NORMAL) {
 +        case TCG_CALL_RET_NORMAL:
 +            assert(info->nr_out <= ARRAY_SIZE(tcg_target_call_oarg_regs));
 +            break;
 +        default:
 +            qemu_build_not_reached();
 +        }
          break;
      default:
          g_assert_not_reached();
      }
 -    assert(info->nr_out <= ARRAY_SIZE(tcg_target_call_oarg_regs));
      /*
       * Parse and place function arguments.
@@ -XXX,XX +XXX,XX @@ static void init_call_layout(TCGHelperInfo *info)
          case dh_typecode_ptr:
              type = TCG_TYPE_PTR;
              break;
 +        case dh_typecode_i128:
 +            type = TCG_TYPE_I128;
 +            break;
          default:
              g_assert_not_reached();
          }
@@ -XXX,XX +XXX,XX @@ static void init_call_layout(TCGHelperInfo *info)
              }
              break;
 +        case TCG_TYPE_I128:
 +            switch (/* TODO */ TCG_CALL_ARG_NORMAL) {
 +            case TCG_CALL_ARG_EVEN:
 +                layout_arg_even(&cum);
 +                /* fall through */
 +            case TCG_CALL_ARG_NORMAL:
 +                layout_arg_normal_n(&cum, info, 128 / TCG_TARGET_REG_BITS);
 +                break;
 +            default:
 +                qemu_build_not_reached();
 +            }
 +            break;
 +
-         default:
++    TCGOP_TYPE(new_op) = TCGOP_TYPE(old_op);
-             g_assert_not_reached();
+     QTAILQ_INSERT_BEFORE(old_op, new_op, link);
-         }
+     return new_op;
-@@ -XXX,XX +XXX,XX @@ void tcg_gen_callN(void *func, TCGTemp *ret, int nargs, TCGTemp **args)
+ }
-         op->args[pi++] = temp_arg(ret);
+@@ -XXX,XX +XXX,XX @@ TCGOp *tcg_op_insert_after(TCGContext *s, TCGOp *old_op,
-         break;
+                            TCGOpcode opc, unsigned nargs)
-     case 2:
+ {
-+    case 4:
+     TCGOp *new_op = tcg_op_alloc(opc, nargs);
-         tcg_debug_assert(ret != NULL);
++
--        tcg_debug_assert(ret->base_type == ret->type + 1);
++    TCGOP_TYPE(new_op) = TCGOP_TYPE(old_op);
-+        tcg_debug_assert(ret->base_type == ret->type + ctz32(n));
+     QTAILQ_INSERT_AFTER(&s->ops, old_op, new_op, link);
-         tcg_debug_assert(ret->temp_subindex == 0);
+     return new_op;
--        op->args[pi++] = temp_arg(ret);
+ }
 -        op->args[pi++] = temp_arg(ret + 1);
 +        for (i = 0; i < n; ++i) {
 +            op->args[pi++] = temp_arg(ret + i);
 +        }
          break;
      default:
          g_assert_not_reached();
 --
-.34.1
+.43.0

-New patch
+[PULL 06/68] tcg: Add TCGOP_FLAGS
+To be used by some integer operations instead of,
+or in addition to, a trailing constant argument.
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+---
+ include/tcg/tcg.h | 1 +
+file changed, 1 insertion(+)
+diff --git a/include/tcg/tcg.h b/include/tcg/tcg.h
+index XXXXXXX..XXXXXXX 100644
+--- a/include/tcg/tcg.h
++++ b/include/tcg/tcg.h
+@@ -XXX,XX +XXX,XX @@ struct TCGOp {
+ #define TCGOP_CALLO(X)    (X)->param2
+ #define TCGOP_TYPE(X)     (X)->param1
++#define TCGOP_FLAGS(X)    (X)->param2
+ #define TCGOP_VECE(X)     (X)->param2
+ /* Make sure operands fit in the bitfields above.  */
+--
+.43.0

-[PULL 09/40] tcg: Add TCG_CALL_RET_BY_VEC
+[PULL 07/68] tcg: Add type and flags arguments to tcg_op_supported
-This will be used by _WIN64 to return i128.  Not yet used,
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 because allocation is not yet enabled.
 Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 ---
- tcg/tcg-internal.h |  1 +
+ include/tcg/tcg.h |  7 ++++++-
- tcg/tcg.c          | 19 +++++++++++++++++++
+ tcg/tcg.c         | 11 +++++++----
-files changed, 20 insertions(+)
+files changed, 13 insertions(+), 5 deletions(-)
-diff --git a/tcg/tcg-internal.h b/tcg/tcg-internal.h
+diff --git a/include/tcg/tcg.h b/include/tcg/tcg.h
 index XXXXXXX..XXXXXXX 100644
---- a/tcg/tcg-internal.h
+--- a/include/tcg/tcg.h
-+++ b/tcg/tcg-internal.h
++++ b/include/tcg/tcg.h
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ typedef struct TCGTargetOpDef {
- typedef enum {
+     const char *args_ct_str[TCG_MAX_OP_ARGS];
-     TCG_CALL_RET_NORMAL,         /* by registers */
+ } TCGTargetOpDef;
-     TCG_CALL_RET_BY_REF,         /* for i128, by reference */
-+    TCG_CALL_RET_BY_VEC,         /* for i128, by vector register */
+-bool tcg_op_supported(TCGOpcode op);
- } TCGCallReturnKind;
++/*
++ * tcg_op_supported:
- typedef enum {
++ * Query if @op, for @type and @flags, is supported by the host
 + * on which we are currently executing.
 + */
 +bool tcg_op_supported(TCGOpcode op, TCGType type, unsigned flags);
  void tcg_gen_call0(void *func, TCGHelperInfo *, TCGTemp *ret);
  void tcg_gen_call1(void *func, TCGHelperInfo *, TCGTemp *ret, TCGTemp *);
 diff --git a/tcg/tcg.c b/tcg/tcg.c
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tcg.c
 +++ b/tcg/tcg.c
-@@ -XXX,XX +XXX,XX @@ static void init_call_layout(TCGHelperInfo *info)
+@@ -XXX,XX +XXX,XX @@ TCGTemp *tcgv_i32_temp(TCGv_i32 v)
-             /* Query the last register now to trigger any assert early. */
+ }
-             tcg_target_call_oarg_reg(info->out_kind, info->nr_out - 1);
+ #endif /* CONFIG_DEBUG_TCG */
-             break;
-+        case TCG_CALL_RET_BY_VEC:
+-/* Return true if OP may appear in the opcode stream.
-+            /* Query the single register now to trigger any assert early. */
+-   Test the runtime variable that controls each opcode.  */
-+            tcg_target_call_oarg_reg(TCG_CALL_RET_BY_VEC, 0);
+-bool tcg_op_supported(TCGOpcode op)
-+            break;
++/*
-         case TCG_CALL_RET_BY_REF:
++ * Return true if OP may appear in the opcode stream with TYPE.
-             /*
++ * Test the runtime variable that controls each opcode.
-              * Allocate the first argument to the output.
++ */
-@@ -XXX,XX +XXX,XX @@ static void tcg_reg_alloc_call(TCGContext *s, TCGOp *op)
++bool tcg_op_supported(TCGOpcode op, TCGType type, unsigned flags)
-         }
+ {
-         break;
+     const bool have_vec
+         = TCG_TARGET_HAS_v64 | TCG_TARGET_HAS_v128 | TCG_TARGET_HAS_v256;
-+    case TCG_CALL_RET_BY_VEC:
+@@ -XXX,XX +XXX,XX @@ int tcg_gen_code(TCGContext *s, TranslationBlock *tb, uint64_t pc_start)
-+        {
+             /* fall through */
-+            TCGTemp *ts = arg_temp(op->args[0]);
+         default:
-+
+             /* Sanity check that we've not introduced any unhandled opcodes. */
-+            tcg_debug_assert(ts->base_type == TCG_TYPE_I128);
+-            tcg_debug_assert(tcg_op_supported(opc));
-+            tcg_debug_assert(ts->temp_subindex == 0);
++            tcg_debug_assert(tcg_op_supported(opc, TCGOP_TYPE(op),
-+            if (!ts->mem_allocated) {
++                                              TCGOP_FLAGS(op)));
-+                temp_allocate_frame(s, ts);
+             /* Note: in order to speed up the code, it would be much
-+            }
+                faster to have specialized register allocator functions for
-+            tcg_out_st(s, TCG_TYPE_V128,
+                some common argument patterns */
 +                       tcg_target_call_oarg_reg(TCG_CALL_RET_BY_VEC, 0),
 +                       ts->mem_base->reg, ts->mem_offset);
 +        }
 +        /* fall through to mark all parts in memory */
 +
      case TCG_CALL_RET_BY_REF:
          /* The callee has performed a write through the reference. */
          for (i = 0; i < nb_oargs; i++) {
 --
-.34.1
+.43.0

-[PULL 30/40] target/s390x: Use Int128 for return from CKSM
+[PULL 08/68] target/arm: Do not test TCG_TARGET_HAS_bitsel_vec
-Acked-by: Ilya Leoshkevich <iii@linux.ibm.com>
+Rely on tcg-op-vec.c to expand the opcode if missing.
 Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 ---
- target/s390x/helper.h         | 2 +-
+ target/arm/tcg/translate-sve.c | 20 ++++----------------
- target/s390x/tcg/mem_helper.c | 7 +++----
+file changed, 4 insertions(+), 16 deletions(-)
  target/s390x/tcg/translate.c  | 6 ++++--
 files changed, 8 insertions(+), 7 deletions(-)
-diff --git a/target/s390x/helper.h b/target/s390x/helper.h
+diff --git a/target/arm/tcg/translate-sve.c b/target/arm/tcg/translate-sve.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/s390x/helper.h
+--- a/target/arm/tcg/translate-sve.c
-+++ b/target/s390x/helper.h
++++ b/target/arm/tcg/translate-sve.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_4(tre, i64, env, i64, i64, i64)
+@@ -XXX,XX +XXX,XX @@ static void gen_bsl1n_i64(TCGv_i64 d, TCGv_i64 n, TCGv_i64 m, TCGv_i64 k)
- DEF_HELPER_4(trt, i32, env, i32, i64, i64)
+ static void gen_bsl1n_vec(unsigned vece, TCGv_vec d, TCGv_vec n,
- DEF_HELPER_4(trtr, i32, env, i32, i64, i64)
+                           TCGv_vec m, TCGv_vec k)
- DEF_HELPER_5(trXX, i32, env, i32, i32, i32, i32)
+ {
--DEF_HELPER_4(cksm, i64, env, i64, i64, i64)
+-    if (TCG_TARGET_HAS_bitsel_vec) {
-+DEF_HELPER_4(cksm, i128, env, i64, i64, i64)
+-        tcg_gen_not_vec(vece, n, n);
- DEF_HELPER_FLAGS_5(calc_cc, TCG_CALL_NO_RWG_SE, i32, env, i32, i64, i64, i64)
+-        tcg_gen_bitsel_vec(vece, d, k, n, m);
- DEF_HELPER_FLAGS_2(sfpc, TCG_CALL_NO_WG, void, env, i64)
+-    } else {
- DEF_HELPER_FLAGS_2(sfas, TCG_CALL_NO_WG, void, env, i64)
+-        tcg_gen_andc_vec(vece, n, k, n);
-diff --git a/target/s390x/tcg/mem_helper.c b/target/s390x/tcg/mem_helper.c
+-        tcg_gen_andc_vec(vece, m, m, k);
-index XXXXXXX..XXXXXXX 100644
+-        tcg_gen_or_vec(vece, d, n, m);
---- a/target/s390x/tcg/mem_helper.c
+-    }
-+++ b/target/s390x/tcg/mem_helper.c
++    tcg_gen_not_vec(vece, n, n);
-@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(clclu)(CPUS390XState *env, uint32_t r1, uint64_t a2,
++    tcg_gen_bitsel_vec(vece, d, k, n, m);
  }
- /* checksum */
+ static void gen_bsl1n(unsigned vece, uint32_t d, uint32_t n, uint32_t m,
--uint64_t HELPER(cksm)(CPUS390XState *env, uint64_t r1,
+@@ -XXX,XX +XXX,XX @@ static void gen_bsl2n_i64(TCGv_i64 d, TCGv_i64 n, TCGv_i64 m, TCGv_i64 k)
--                      uint64_t src, uint64_t src_len)
+ static void gen_bsl2n_vec(unsigned vece, TCGv_vec d, TCGv_vec n,
-+Int128 HELPER(cksm)(CPUS390XState *env, uint64_t r1,
+                           TCGv_vec m, TCGv_vec k)
 +                    uint64_t src, uint64_t src_len)
  {
-     uintptr_t ra = GETPC();
+-    if (TCG_TARGET_HAS_bitsel_vec) {
-     uint64_t max_len, len;
+-        tcg_gen_not_vec(vece, m, m);
-@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(cksm)(CPUS390XState *env, uint64_t r1,
+-        tcg_gen_bitsel_vec(vece, d, k, n, m);
-     env->cc_op = (len == src_len ? 0 : 3);
+-    } else {
+-        tcg_gen_and_vec(vece, n, n, k);
-     /* Return both cksm and processed length.  */
+-        tcg_gen_or_vec(vece, m, m, k);
--    env->retxl = cksm;
+-        tcg_gen_orc_vec(vece, d, n, m);
--    return len;
+-    }
-+    return int128_make128(cksm, len);
++    tcg_gen_not_vec(vece, m, m);
 +    tcg_gen_bitsel_vec(vece, d, k, n, m);
  }
- void HELPER(pack)(CPUS390XState *env, uint32_t len, uint64_t dest, uint64_t src)
+ static void gen_bsl2n(unsigned vece, uint32_t d, uint32_t n, uint32_t m,
 diff --git a/target/s390x/tcg/translate.c b/target/s390x/tcg/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/s390x/tcg/translate.c
 +++ b/target/s390x/tcg/translate.c
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_cxlgb(DisasContext *s, DisasOps *o)
  static DisasJumpType op_cksm(DisasContext *s, DisasOps *o)
  {
      int r2 = get_field(s, r2);
 +    TCGv_i128 pair = tcg_temp_new_i128();
      TCGv_i64 len = tcg_temp_new_i64();
 -    gen_helper_cksm(len, cpu_env, o->in1, o->in2, regs[r2 + 1]);
 +    gen_helper_cksm(pair, cpu_env, o->in1, o->in2, regs[r2 + 1]);
      set_cc_static(s);
 -    return_low128(o->out);
 +    tcg_gen_extr_i128_i64(o->out, len, pair);
 +    tcg_temp_free_i128(pair);
      tcg_gen_add_i64(regs[r2], regs[r2], len);
      tcg_gen_sub_i64(regs[r2 + 1], regs[r2 + 1], len);
 --
-.34.1
+.43.0

-[PULL 29/40] target/s390x: Use Int128 for return from CLST
+[PULL 09/68] target/arm: Use tcg_op_supported
+Do not reference TCG_TARGET_HAS_* directly.
 Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
-Acked-by: Ilya Leoshkevich <iii@linux.ibm.com>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 ---
- target/s390x/helper.h         |  2 +-
+ target/arm/tcg/translate-a64.c | 10 ++++++----
- target/s390x/tcg/mem_helper.c | 11 ++++-------
+ target/arm/tcg/translate-sve.c |  2 +-
- target/s390x/tcg/translate.c  |  8 ++++++--
+ target/arm/tcg/translate.c     |  2 +-
-files changed, 11 insertions(+), 10 deletions(-)
+files changed, 8 insertions(+), 6 deletions(-)
-diff --git a/target/s390x/helper.h b/target/s390x/helper.h
+diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/s390x/helper.h
+--- a/target/arm/tcg/translate-a64.c
-+++ b/target/s390x/helper.h
++++ b/target/arm/tcg/translate-a64.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_3(divs64, TCG_CALL_NO_WG, i128, env, s64, s64)
+@@ -XXX,XX +XXX,XX @@ static bool trans_CCMP(DisasContext *s, arg_CCMP *a)
- DEF_HELPER_FLAGS_4(divu64, TCG_CALL_NO_WG, i128, env, i64, i64, i64)
+     TCGv_i64 tcg_rn, tcg_y;
- DEF_HELPER_3(srst, void, env, i32, i32)
+     DisasCompare c;
- DEF_HELPER_3(srstu, void, env, i32, i32)
+     unsigned nzcv;
--DEF_HELPER_4(clst, i64, env, i64, i64, i64)
++    bool has_andc;
-+DEF_HELPER_4(clst, i128, env, i64, i64, i64)
- DEF_HELPER_FLAGS_4(mvn, TCG_CALL_NO_WG, void, env, i32, i64, i64)
+     /* Set T0 = !COND.  */
- DEF_HELPER_FLAGS_4(mvo, TCG_CALL_NO_WG, void, env, i32, i64, i64)
+     arm_test_cc(&c, a->cond);
- DEF_HELPER_FLAGS_4(mvpg, TCG_CALL_NO_WG, i32, env, i64, i32, i32)
+@@ -XXX,XX +XXX,XX @@ static bool trans_CCMP(DisasContext *s, arg_CCMP *a)
-diff --git a/target/s390x/tcg/mem_helper.c b/target/s390x/tcg/mem_helper.c
+     tcg_gen_subi_i32(tcg_t2, tcg_t0, 1);
-index XXXXXXX..XXXXXXX 100644
---- a/target/s390x/tcg/mem_helper.c
+     nzcv = a->nzcv;
-+++ b/target/s390x/tcg/mem_helper.c
++    has_andc = tcg_op_supported(INDEX_op_andc_i32, TCG_TYPE_I32, 0);
-@@ -XXX,XX +XXX,XX @@ void HELPER(srstu)(CPUS390XState *env, uint32_t r1, uint32_t r2)
+     if (nzcv & 8) { /* N */
- }
+         tcg_gen_or_i32(cpu_NF, cpu_NF, tcg_t1);
+     } else {
- /* unsigned string compare (c is string terminator) */
+-        if (TCG_TARGET_HAS_andc_i32) {
--uint64_t HELPER(clst)(CPUS390XState *env, uint64_t c, uint64_t s1, uint64_t s2)
++        if (has_andc) {
-+Int128 HELPER(clst)(CPUS390XState *env, uint64_t c, uint64_t s1, uint64_t s2)
+             tcg_gen_andc_i32(cpu_NF, cpu_NF, tcg_t1);
  {
      uintptr_t ra = GETPC();
      uint32_t len;
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(clst)(CPUS390XState *env, uint64_t c, uint64_t s1, uint64_t s2)
              if (v1 == c) {
                  /* Equal.  CC=0, and don't advance the registers.  */
                  env->cc_op = 0;
 -                env->retxl = s2;
 -                return s1;
 +                return int128_make128(s2, s1);
              }
          } else {
-             /* Unequal.  CC={1,2}, and advance the registers.  Note that
+             tcg_gen_and_i32(cpu_NF, cpu_NF, tcg_t2);
                 the terminator need not be zero, but the string that contains
                 the terminator is by definition "low".  */
              env->cc_op = (v1 == c ? 1 : v2 == c ? 2 : v1 < v2 ? 1 : 2);
 -            env->retxl = s2 + len;
 -            return s1 + len;
 +            return int128_make128(s2 + len, s1 + len);
          }
      }
+     if (nzcv & 4) { /* Z */
-     /* CPU-determined bytes equal; advance the registers.  */
+-        if (TCG_TARGET_HAS_andc_i32) {
-     env->cc_op = 3;
++        if (has_andc) {
--    env->retxl = s2 + len;
+             tcg_gen_andc_i32(cpu_ZF, cpu_ZF, tcg_t1);
--    return s1 + len;
+         } else {
-+    return int128_make128(s2 + len, s1 + len);
+             tcg_gen_and_i32(cpu_ZF, cpu_ZF, tcg_t2);
- }
+@@ -XXX,XX +XXX,XX @@ static bool trans_CCMP(DisasContext *s, arg_CCMP *a)
+     if (nzcv & 2) { /* C */
- /* move page */
+         tcg_gen_or_i32(cpu_CF, cpu_CF, tcg_t0);
-diff --git a/target/s390x/tcg/translate.c b/target/s390x/tcg/translate.c
+     } else {
 -        if (TCG_TARGET_HAS_andc_i32) {
 +        if (has_andc) {
              tcg_gen_andc_i32(cpu_CF, cpu_CF, tcg_t1);
          } else {
              tcg_gen_and_i32(cpu_CF, cpu_CF, tcg_t2);
@@ -XXX,XX +XXX,XX @@ static bool trans_CCMP(DisasContext *s, arg_CCMP *a)
      if (nzcv & 1) { /* V */
          tcg_gen_or_i32(cpu_VF, cpu_VF, tcg_t1);
      } else {
 -        if (TCG_TARGET_HAS_andc_i32) {
 +        if (has_andc) {
              tcg_gen_andc_i32(cpu_VF, cpu_VF, tcg_t1);
          } else {
              tcg_gen_and_i32(cpu_VF, cpu_VF, tcg_t2);
 diff --git a/target/arm/tcg/translate-sve.c b/target/arm/tcg/translate-sve.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/s390x/tcg/translate.c
+--- a/target/arm/tcg/translate-sve.c
-+++ b/target/s390x/tcg/translate.c
++++ b/target/arm/tcg/translate-sve.c
-@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_clm(DisasContext *s, DisasOps *o)
+@@ -XXX,XX +XXX,XX @@ static void gen_bsl2n_i64(TCGv_i64 d, TCGv_i64 n, TCGv_i64 m, TCGv_i64 k)
+      *       =         | ~(m | k)
- static DisasJumpType op_clst(DisasContext *s, DisasOps *o)
+      */
      tcg_gen_and_i64(n, n, k);
 -    if (TCG_TARGET_HAS_orc_i64) {
 +    if (tcg_op_supported(INDEX_op_orc_i64, TCG_TYPE_I64, 0)) {
          tcg_gen_or_i64(m, m, k);
          tcg_gen_orc_i64(d, n, m);
      } else {
 diff --git a/target/arm/tcg/translate.c b/target/arm/tcg/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/tcg/translate.c
 +++ b/target/arm/tcg/translate.c
@@ -XXX,XX +XXX,XX @@ static void gen_add_CC(TCGv_i32 dest, TCGv_i32 t0, TCGv_i32 t1)
  static void gen_adc_CC(TCGv_i32 dest, TCGv_i32 t0, TCGv_i32 t1)
  {
--    gen_helper_clst(o->in1, cpu_env, regs[0], o->in1, o->in2);
+     TCGv_i32 tmp = tcg_temp_new_i32();
-+    TCGv_i128 pair = tcg_temp_new_i128();
+-    if (TCG_TARGET_HAS_add2_i32) {
-+
++    if (tcg_op_supported(INDEX_op_add2_i32, TCG_TYPE_I32, 0)) {
-+    gen_helper_clst(pair, cpu_env, regs[0], o->in1, o->in2);
+         tcg_gen_movi_i32(tmp, 0);
-+    tcg_gen_extr_i128_i64(o->in2, o->in1, pair);
+         tcg_gen_add2_i32(cpu_NF, cpu_CF, t0, tmp, cpu_CF, tmp);
-+    tcg_temp_free_i128(pair);
+         tcg_gen_add2_i32(cpu_NF, cpu_CF, cpu_NF, cpu_CF, t1, tmp);
 +
      set_cc_static(s);
 -    return_low128(o->in2);
      return DISAS_NEXT;
  }
 --
-.34.1
+.43.0

-New patch
+[PULL 10/68] target/tricore: Use tcg_op_supported
+Do not reference TCG_TARGET_HAS_* directly.
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+---
+ target/tricore/translate.c | 4 ++--
+file changed, 2 insertions(+), 2 deletions(-)
+diff --git a/target/tricore/translate.c b/target/tricore/translate.c
+index XXXXXXX..XXXXXXX 100644
+--- a/target/tricore/translate.c
++++ b/target/tricore/translate.c
+@@ -XXX,XX +XXX,XX @@ static void decode_bit_andacc(DisasContext *ctx)
+                     pos1, pos2, &tcg_gen_andc_tl, &tcg_gen_and_tl);
+         break;
+     case OPC2_32_BIT_AND_NOR_T:
+-        if (TCG_TARGET_HAS_andc_i32) {
++        if (tcg_op_supported(INDEX_op_andc_i32, TCG_TYPE_I32, 0)) {
+             gen_bit_2op(cpu_gpr_d[r3], cpu_gpr_d[r1], cpu_gpr_d[r2],
+                         pos1, pos2, &tcg_gen_or_tl, &tcg_gen_andc_tl);
+         } else {
+@@ -XXX,XX +XXX,XX @@ static void decode_bit_orand(DisasContext *ctx)
+                     pos1, pos2, &tcg_gen_andc_tl, &tcg_gen_or_tl);
+         break;
+     case OPC2_32_BIT_OR_NOR_T:
+-        if (TCG_TARGET_HAS_orc_i32) {
++        if (tcg_op_supported(INDEX_op_orc_i32, TCG_TYPE_I32, 0)) {
+             gen_bit_2op(cpu_gpr_d[r3], cpu_gpr_d[r1], cpu_gpr_d[r2],
+                         pos1, pos2, &tcg_gen_or_tl, &tcg_gen_orc_tl);
+         } else {
+--
+.43.0

-[PULL 17/40] tcg: Add guest load/store primitives for TCGv_i128
+[PULL 11/68] tcg: Add tcg_op_deposit_valid
-These are not yet considering atomicity of the 16-byte value;
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 this is a direct replacement for the current target code which
 uses a pair of 8-byte operations.
 Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 ---
- include/exec/cpu_ldst.h |  10 +++
+ include/tcg/tcg.h |  6 ++++++
- include/tcg/tcg-op.h    |   2 +
+ tcg/tcg.c         | 21 +++++++++++++++++++++
- accel/tcg/cputlb.c      | 112 +++++++++++++++++++++++++++++++++
+files changed, 27 insertions(+)
  accel/tcg/user-exec.c   |  66 ++++++++++++++++++++
  tcg/tcg-op.c            | 134 ++++++++++++++++++++++++++++++++++++++++
 files changed, 324 insertions(+)
-diff --git a/include/exec/cpu_ldst.h b/include/exec/cpu_ldst.h
+diff --git a/include/tcg/tcg.h b/include/tcg/tcg.h
 index XXXXXXX..XXXXXXX 100644
---- a/include/exec/cpu_ldst.h
+--- a/include/tcg/tcg.h
-+++ b/include/exec/cpu_ldst.h
++++ b/include/tcg/tcg.h
-@@ -XXX,XX +XXX,XX @@ uint32_t cpu_ldl_le_mmu(CPUArchState *env, abi_ptr ptr,
+@@ -XXX,XX +XXX,XX @@ typedef struct TCGTargetOpDef {
- uint64_t cpu_ldq_le_mmu(CPUArchState *env, abi_ptr ptr,
+  * on which we are currently executing.
-                         MemOpIdx oi, uintptr_t ra);
+  */
+ bool tcg_op_supported(TCGOpcode op, TCGType type, unsigned flags);
-+Int128 cpu_ld16_be_mmu(CPUArchState *env, abi_ptr addr,
++/*
-+                       MemOpIdx oi, uintptr_t ra);
++ * tcg_op_deposit_valid:
-+Int128 cpu_ld16_le_mmu(CPUArchState *env, abi_ptr addr,
++ * Query if a deposit into (ofs, len) is supported for @type by
-+                       MemOpIdx oi, uintptr_t ra);
++ * the host on which we are currently executing.
-+
++ */
- void cpu_stb_mmu(CPUArchState *env, abi_ptr ptr, uint8_t val,
++bool tcg_op_deposit_valid(TCGType type, unsigned ofs, unsigned len);
-                  MemOpIdx oi, uintptr_t ra);
- void cpu_stw_be_mmu(CPUArchState *env, abi_ptr ptr, uint16_t val,
+ void tcg_gen_call0(void *func, TCGHelperInfo *, TCGTemp *ret);
-@@ -XXX,XX +XXX,XX @@ void cpu_stl_le_mmu(CPUArchState *env, abi_ptr ptr, uint32_t val,
+ void tcg_gen_call1(void *func, TCGHelperInfo *, TCGTemp *ret, TCGTemp *);
- void cpu_stq_le_mmu(CPUArchState *env, abi_ptr ptr, uint64_t val,
+diff --git a/tcg/tcg.c b/tcg/tcg.c
                      MemOpIdx oi, uintptr_t ra);
 +void cpu_st16_be_mmu(CPUArchState *env, abi_ptr addr, Int128 val,
 +                     MemOpIdx oi, uintptr_t ra);
 +void cpu_st16_le_mmu(CPUArchState *env, abi_ptr addr, Int128 val,
 +                     MemOpIdx oi, uintptr_t ra);
 +
  uint32_t cpu_atomic_cmpxchgb_mmu(CPUArchState *env, target_ulong addr,
                                   uint32_t cmpv, uint32_t newv,
                                   MemOpIdx oi, uintptr_t retaddr);
 diff --git a/include/tcg/tcg-op.h b/include/tcg/tcg-op.h
 index XXXXXXX..XXXXXXX 100644
---- a/include/tcg/tcg-op.h
+--- a/tcg/tcg.c
-+++ b/include/tcg/tcg-op.h
++++ b/tcg/tcg.c
-@@ -XXX,XX +XXX,XX @@ void tcg_gen_qemu_ld_i32(TCGv_i32, TCGv, TCGArg, MemOp);
+@@ -XXX,XX +XXX,XX @@ bool tcg_op_supported(TCGOpcode op, TCGType type, unsigned flags)
  void tcg_gen_qemu_st_i32(TCGv_i32, TCGv, TCGArg, MemOp);
  void tcg_gen_qemu_ld_i64(TCGv_i64, TCGv, TCGArg, MemOp);
  void tcg_gen_qemu_st_i64(TCGv_i64, TCGv, TCGArg, MemOp);
 +void tcg_gen_qemu_ld_i128(TCGv_i128, TCGv, TCGArg, MemOp);
 +void tcg_gen_qemu_st_i128(TCGv_i128, TCGv, TCGArg, MemOp);
  static inline void tcg_gen_qemu_ld8u(TCGv ret, TCGv addr, int mem_index)
  {
 diff --git a/accel/tcg/cputlb.c b/accel/tcg/cputlb.c
 index XXXXXXX..XXXXXXX 100644
 --- a/accel/tcg/cputlb.c
 +++ b/accel/tcg/cputlb.c
@@ -XXX,XX +XXX,XX @@ uint64_t cpu_ldq_le_mmu(CPUArchState *env, abi_ptr addr,
      return cpu_load_helper(env, addr, oi, ra, helper_le_ldq_mmu);
  }
 +Int128 cpu_ld16_be_mmu(CPUArchState *env, abi_ptr addr,
 +                       MemOpIdx oi, uintptr_t ra)
 +{
 +    MemOp mop = get_memop(oi);
 +    int mmu_idx = get_mmuidx(oi);
 +    MemOpIdx new_oi;
 +    unsigned a_bits;
 +    uint64_t h, l;
 +
 +    tcg_debug_assert((mop & (MO_BSWAP|MO_SSIZE)) == (MO_BE|MO_128));
 +    a_bits = get_alignment_bits(mop);
 +
 +    /* Handle CPU specific unaligned behaviour */
 +    if (addr & ((1 << a_bits) - 1)) {
 +        cpu_unaligned_access(env_cpu(env), addr, MMU_DATA_LOAD,
 +                             mmu_idx, ra);
 +    }
 +
 +    /* Construct an unaligned 64-bit replacement MemOpIdx. */
 +    mop = (mop & ~(MO_SIZE | MO_AMASK)) | MO_64 | MO_UNALN;
 +    new_oi = make_memop_idx(mop, mmu_idx);
 +
 +    h = helper_be_ldq_mmu(env, addr, new_oi, ra);
 +    l = helper_be_ldq_mmu(env, addr + 8, new_oi, ra);
 +
 +    qemu_plugin_vcpu_mem_cb(env_cpu(env), addr, oi, QEMU_PLUGIN_MEM_R);
 +    return int128_make128(l, h);
 +}
 +
 +Int128 cpu_ld16_le_mmu(CPUArchState *env, abi_ptr addr,
 +                       MemOpIdx oi, uintptr_t ra)
 +{
 +    MemOp mop = get_memop(oi);
 +    int mmu_idx = get_mmuidx(oi);
 +    MemOpIdx new_oi;
 +    unsigned a_bits;
 +    uint64_t h, l;
 +
 +    tcg_debug_assert((mop & (MO_BSWAP|MO_SSIZE)) == (MO_LE|MO_128));
 +    a_bits = get_alignment_bits(mop);
 +
 +    /* Handle CPU specific unaligned behaviour */
 +    if (addr & ((1 << a_bits) - 1)) {
 +        cpu_unaligned_access(env_cpu(env), addr, MMU_DATA_LOAD,
 +                             mmu_idx, ra);
 +    }
 +
 +    /* Construct an unaligned 64-bit replacement MemOpIdx. */
 +    mop = (mop & ~(MO_SIZE | MO_AMASK)) | MO_64 | MO_UNALN;
 +    new_oi = make_memop_idx(mop, mmu_idx);
 +
 +    l = helper_le_ldq_mmu(env, addr, new_oi, ra);
 +    h = helper_le_ldq_mmu(env, addr + 8, new_oi, ra);
 +
 +    qemu_plugin_vcpu_mem_cb(env_cpu(env), addr, oi, QEMU_PLUGIN_MEM_R);
 +    return int128_make128(l, h);
 +}
 +
  /*
   * Store Helpers
   */
@@ -XXX,XX +XXX,XX @@ void cpu_stq_le_mmu(CPUArchState *env, target_ulong addr, uint64_t val,
      cpu_store_helper(env, addr, val, oi, retaddr, helper_le_stq_mmu);
  }
 +void cpu_st16_be_mmu(CPUArchState *env, abi_ptr addr, Int128 val,
 +                     MemOpIdx oi, uintptr_t ra)
 +{
 +    MemOp mop = get_memop(oi);
 +    int mmu_idx = get_mmuidx(oi);
 +    MemOpIdx new_oi;
 +    unsigned a_bits;
 +
 +    tcg_debug_assert((mop & (MO_BSWAP|MO_SSIZE)) == (MO_BE|MO_128));
 +    a_bits = get_alignment_bits(mop);
 +
 +    /* Handle CPU specific unaligned behaviour */
 +    if (addr & ((1 << a_bits) - 1)) {
 +        cpu_unaligned_access(env_cpu(env), addr, MMU_DATA_STORE,
 +                             mmu_idx, ra);
 +    }
 +
 +    /* Construct an unaligned 64-bit replacement MemOpIdx. */
 +    mop = (mop & ~(MO_SIZE | MO_AMASK)) | MO_64 | MO_UNALN;
 +    new_oi = make_memop_idx(mop, mmu_idx);
 +
 +    helper_be_stq_mmu(env, addr, int128_gethi(val), new_oi, ra);
 +    helper_be_stq_mmu(env, addr + 8, int128_getlo(val), new_oi, ra);
 +
 +    qemu_plugin_vcpu_mem_cb(env_cpu(env), addr, oi, QEMU_PLUGIN_MEM_W);
 +}
 +
 +void cpu_st16_le_mmu(CPUArchState *env, abi_ptr addr, Int128 val,
 +                     MemOpIdx oi, uintptr_t ra)
 +{
 +    MemOp mop = get_memop(oi);
 +    int mmu_idx = get_mmuidx(oi);
 +    MemOpIdx new_oi;
 +    unsigned a_bits;
 +
 +    tcg_debug_assert((mop & (MO_BSWAP|MO_SSIZE)) == (MO_LE|MO_128));
 +    a_bits = get_alignment_bits(mop);
 +
 +    /* Handle CPU specific unaligned behaviour */
 +    if (addr & ((1 << a_bits) - 1)) {
 +        cpu_unaligned_access(env_cpu(env), addr, MMU_DATA_STORE,
 +                             mmu_idx, ra);
 +    }
 +
 +    /* Construct an unaligned 64-bit replacement MemOpIdx. */
 +    mop = (mop & ~(MO_SIZE | MO_AMASK)) | MO_64 | MO_UNALN;
 +    new_oi = make_memop_idx(mop, mmu_idx);
 +
 +    helper_le_stq_mmu(env, addr, int128_getlo(val), new_oi, ra);
 +    helper_le_stq_mmu(env, addr + 8, int128_gethi(val), new_oi, ra);
 +
 +    qemu_plugin_vcpu_mem_cb(env_cpu(env), addr, oi, QEMU_PLUGIN_MEM_W);
 +}
 +
  #include "ldst_common.c.inc"
  /*
 diff --git a/accel/tcg/user-exec.c b/accel/tcg/user-exec.c
 index XXXXXXX..XXXXXXX 100644
 --- a/accel/tcg/user-exec.c
 +++ b/accel/tcg/user-exec.c
@@ -XXX,XX +XXX,XX @@ uint64_t cpu_ldq_le_mmu(CPUArchState *env, abi_ptr addr,
      return ret;
  }
 +Int128 cpu_ld16_be_mmu(CPUArchState *env, abi_ptr addr,
 +                       MemOpIdx oi, uintptr_t ra)
 +{
 +    void *haddr;
 +    Int128 ret;
 +
 +    validate_memop(oi, MO_128 | MO_BE);
 +    haddr = cpu_mmu_lookup(env, addr, oi, ra, MMU_DATA_LOAD);
 +    memcpy(&ret, haddr, 16);
 +    clear_helper_retaddr();
 +    qemu_plugin_vcpu_mem_cb(env_cpu(env), addr, oi, QEMU_PLUGIN_MEM_R);
 +
 +    if (!HOST_BIG_ENDIAN) {
 +        ret = bswap128(ret);
 +    }
 +    return ret;
 +}
 +
 +Int128 cpu_ld16_le_mmu(CPUArchState *env, abi_ptr addr,
 +                       MemOpIdx oi, uintptr_t ra)
 +{
 +    void *haddr;
 +    Int128 ret;
 +
 +    validate_memop(oi, MO_128 | MO_LE);
 +    haddr = cpu_mmu_lookup(env, addr, oi, ra, MMU_DATA_LOAD);
 +    memcpy(&ret, haddr, 16);
 +    clear_helper_retaddr();
 +    qemu_plugin_vcpu_mem_cb(env_cpu(env), addr, oi, QEMU_PLUGIN_MEM_R);
 +
 +    if (HOST_BIG_ENDIAN) {
 +        ret = bswap128(ret);
 +    }
 +    return ret;
 +}
 +
  void cpu_stb_mmu(CPUArchState *env, abi_ptr addr, uint8_t val,
                   MemOpIdx oi, uintptr_t ra)
  {
@@ -XXX,XX +XXX,XX @@ void cpu_stq_le_mmu(CPUArchState *env, abi_ptr addr, uint64_t val,
      qemu_plugin_vcpu_mem_cb(env_cpu(env), addr, oi, QEMU_PLUGIN_MEM_W);
  }
 +void cpu_st16_be_mmu(CPUArchState *env, abi_ptr addr,
 +                     Int128 val, MemOpIdx oi, uintptr_t ra)
 +{
 +    void *haddr;
 +
 +    validate_memop(oi, MO_128 | MO_BE);
 +    haddr = cpu_mmu_lookup(env, addr, oi, ra, MMU_DATA_STORE);
 +    if (!HOST_BIG_ENDIAN) {
 +        val = bswap128(val);
 +    }
 +    memcpy(haddr, &val, 16);
 +    clear_helper_retaddr();
 +    qemu_plugin_vcpu_mem_cb(env_cpu(env), addr, oi, QEMU_PLUGIN_MEM_W);
 +}
 +
 +void cpu_st16_le_mmu(CPUArchState *env, abi_ptr addr,
 +                     Int128 val, MemOpIdx oi, uintptr_t ra)
 +{
 +    void *haddr;
 +
 +    validate_memop(oi, MO_128 | MO_LE);
 +    haddr = cpu_mmu_lookup(env, addr, oi, ra, MMU_DATA_STORE);
 +    if (HOST_BIG_ENDIAN) {
 +        val = bswap128(val);
 +    }
 +    memcpy(haddr, &val, 16);
 +    clear_helper_retaddr();
 +    qemu_plugin_vcpu_mem_cb(env_cpu(env), addr, oi, QEMU_PLUGIN_MEM_W);
 +}
 +
  uint32_t cpu_ldub_code(CPUArchState *env, abi_ptr ptr)
  {
      uint32_t ret;
 diff --git a/tcg/tcg-op.c b/tcg/tcg-op.c
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tcg-op.c
 +++ b/tcg/tcg-op.c
@@ -XXX,XX +XXX,XX @@ void tcg_gen_qemu_st_i64(TCGv_i64 val, TCGv addr, TCGArg idx, MemOp memop)
      }
  }
-+static void canonicalize_memop_i128_as_i64(MemOp ret[2], MemOp orig)
++bool tcg_op_deposit_valid(TCGType type, unsigned ofs, unsigned len)
 +{
-+    MemOp mop_1 = orig, mop_2;
++    tcg_debug_assert(len > 0);
-+
++    switch (type) {
-+    tcg_debug_assert((orig & MO_SIZE) == MO_128);
++    case TCG_TYPE_I32:
-+    tcg_debug_assert((orig & MO_SIGN) == 0);
++        tcg_debug_assert(ofs < 32);
-+
++        tcg_debug_assert(len <= 32);
-+    /* Use a memory ordering implemented by the host. */
++        tcg_debug_assert(ofs + len <= 32);
-+    if (!TCG_TARGET_HAS_MEMORY_BSWAP && (orig & MO_BSWAP)) {
++        return TCG_TARGET_HAS_deposit_i32 &&
-+        mop_1 &= ~MO_BSWAP;
++               TCG_TARGET_deposit_i32_valid(ofs, len);
-+    }
++    case TCG_TYPE_I64:
-+
++        tcg_debug_assert(ofs < 64);
-+    /* Reduce the size to 64-bit. */
++        tcg_debug_assert(len <= 64);
-+    mop_1 = (mop_1 & ~MO_SIZE) | MO_64;
++        tcg_debug_assert(ofs + len <= 64);
-+
++        return TCG_TARGET_HAS_deposit_i64 &&
-+    /* Retain the alignment constraints of the original. */
++               TCG_TARGET_deposit_i64_valid(ofs, len);
 +    switch (orig & MO_AMASK) {
 +    case MO_UNALN:
 +    case MO_ALIGN_2:
 +    case MO_ALIGN_4:
 +        mop_2 = mop_1;
 +        break;
 +    case MO_ALIGN_8:
 +        /* Prefer MO_ALIGN+MO_64 to MO_ALIGN_8+MO_64. */
 +        mop_1 = (mop_1 & ~MO_AMASK) | MO_ALIGN;
 +        mop_2 = mop_1;
 +        break;
 +    case MO_ALIGN:
 +        /* Second has 8-byte alignment; first has 16-byte alignment. */
 +        mop_2 = mop_1;
 +        mop_1 = (mop_1 & ~MO_AMASK) | MO_ALIGN_16;
 +        break;
 +    case MO_ALIGN_16:
 +    case MO_ALIGN_32:
 +    case MO_ALIGN_64:
 +        /* Second has 8-byte alignment; first retains original. */
 +        mop_2 = (mop_1 & ~MO_AMASK) | MO_ALIGN;
 +        break;
 +    default:
 +        g_assert_not_reached();
 +    }
-+    ret[0] = mop_1;
-+    ret[1] = mop_2;
 +}
 +
-+void tcg_gen_qemu_ld_i128(TCGv_i128 val, TCGv addr, TCGArg idx, MemOp memop)
+ static TCGOp *tcg_op_alloc(TCGOpcode opc, unsigned nargs);
-+{
-+    MemOp mop[2];
+ static void tcg_gen_callN(void *func, TCGHelperInfo *info,
 +    TCGv addr_p8;
 +    TCGv_i64 x, y;
 +
 +    canonicalize_memop_i128_as_i64(mop, memop);
 +
 +    tcg_gen_req_mo(TCG_MO_LD_LD | TCG_MO_ST_LD);
 +    addr = plugin_prep_mem_callbacks(addr);
 +
 +    /* TODO: respect atomicity of the operation. */
 +    /* TODO: allow the tcg backend to see the whole operation. */
 +
 +    /*
 +     * Since there are no global TCGv_i128, there is no visible state
 +     * changed if the second load faults.  Load directly into the two
 +     * subwords.
 +     */
 +    if ((memop & MO_BSWAP) == MO_LE) {
 +        x = TCGV128_LOW(val);
 +        y = TCGV128_HIGH(val);
 +    } else {
 +        x = TCGV128_HIGH(val);
 +        y = TCGV128_LOW(val);
 +    }
 +
 +    gen_ldst_i64(INDEX_op_qemu_ld_i64, x, addr, mop[0], idx);
 +
 +    if ((mop[0] ^ memop) & MO_BSWAP) {
 +        tcg_gen_bswap64_i64(x, x);
 +    }
 +
 +    addr_p8 = tcg_temp_new();
 +    tcg_gen_addi_tl(addr_p8, addr, 8);
 +    gen_ldst_i64(INDEX_op_qemu_ld_i64, y, addr_p8, mop[1], idx);
 +    tcg_temp_free(addr_p8);
 +
 +    if ((mop[0] ^ memop) & MO_BSWAP) {
 +        tcg_gen_bswap64_i64(y, y);
 +    }
 +
 +    plugin_gen_mem_callbacks(addr, make_memop_idx(memop, idx),
 +                             QEMU_PLUGIN_MEM_R);
 +}
 +
 +void tcg_gen_qemu_st_i128(TCGv_i128 val, TCGv addr, TCGArg idx, MemOp memop)
 +{
 +    MemOp mop[2];
 +    TCGv addr_p8;
 +    TCGv_i64 x, y;
 +
 +    canonicalize_memop_i128_as_i64(mop, memop);
 +
 +    tcg_gen_req_mo(TCG_MO_ST_LD | TCG_MO_ST_ST);
 +    addr = plugin_prep_mem_callbacks(addr);
 +
 +    /* TODO: respect atomicity of the operation. */
 +    /* TODO: allow the tcg backend to see the whole operation. */
 +
 +    if ((memop & MO_BSWAP) == MO_LE) {
 +        x = TCGV128_LOW(val);
 +        y = TCGV128_HIGH(val);
 +    } else {
 +        x = TCGV128_HIGH(val);
 +        y = TCGV128_LOW(val);
 +    }
 +
 +    addr_p8 = tcg_temp_new();
 +    if ((mop[0] ^ memop) & MO_BSWAP) {
 +        TCGv_i64 t = tcg_temp_new_i64();
 +
 +        tcg_gen_bswap64_i64(t, x);
 +        gen_ldst_i64(INDEX_op_qemu_st_i64, t, addr, mop[0], idx);
 +        tcg_gen_bswap64_i64(t, y);
 +        tcg_gen_addi_tl(addr_p8, addr, 8);
 +        gen_ldst_i64(INDEX_op_qemu_st_i64, t, addr_p8, mop[1], idx);
 +        tcg_temp_free_i64(t);
 +    } else {
 +        gen_ldst_i64(INDEX_op_qemu_st_i64, x, addr, mop[0], idx);
 +        tcg_gen_addi_tl(addr_p8, addr, 8);
 +        gen_ldst_i64(INDEX_op_qemu_st_i64, y, addr_p8, mop[1], idx);
 +    }
 +    tcg_temp_free(addr_p8);
 +
 +    plugin_gen_mem_callbacks(addr, make_memop_idx(memop, idx),
 +                             QEMU_PLUGIN_MEM_W);
 +}
 +
  static void tcg_gen_ext_i32(TCGv_i32 ret, TCGv_i32 val, MemOp opc)
  {
      switch (opc & MO_SSIZE) {
 --
-.34.1
+.43.0

-New patch
+[PULL 12/68] target/i386: Remove TCG_TARGET_extract_tl_valid
+This macro is unused.
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+---
+ target/i386/tcg/emit.c.inc | 2 --
+file changed, 2 deletions(-)
+diff --git a/target/i386/tcg/emit.c.inc b/target/i386/tcg/emit.c.inc
+index XXXXXXX..XXXXXXX 100644
+--- a/target/i386/tcg/emit.c.inc
++++ b/target/i386/tcg/emit.c.inc
+@@ -XXX,XX +XXX,XX @@
+ #ifdef TARGET_X86_64
+ #define TCG_TARGET_HAS_extract2_tl      TCG_TARGET_HAS_extract2_i64
+ #define TCG_TARGET_deposit_tl_valid     TCG_TARGET_deposit_i64_valid
+-#define TCG_TARGET_extract_tl_valid     TCG_TARGET_extract_i64_valid
+ #else
+ #define TCG_TARGET_HAS_extract2_tl      TCG_TARGET_HAS_extract2_i32
+ #define TCG_TARGET_deposit_tl_valid     TCG_TARGET_deposit_i32_valid
+-#define TCG_TARGET_extract_tl_valid     TCG_TARGET_extract_i32_valid
+ #endif
+ #define MMX_OFFSET(reg)                        \
+--
+.43.0

-[PULL 27/40] target/s390x: Use a single return for helper_divs32/u32
+[PULL 13/68] target/i386: Use tcg_op_deposit_valid
-Pack the quotient and remainder into a single uint64_t.
+Avoid direct usage of TCG_TARGET_deposit_*_valid.
 Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
-Reviewed-by: David Hildenbrand <david@redhat.com>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 ---
-v2: Fix operand ordering; use tcg_extr32_i64.
+ target/i386/tcg/emit.c.inc | 6 ++----
----
+file changed, 2 insertions(+), 4 deletions(-)
  target/s390x/helper.h         |  2 +-
  target/s390x/tcg/int_helper.c | 26 +++++++++++++-------------
  target/s390x/tcg/translate.c  |  8 ++++----
 files changed, 18 insertions(+), 18 deletions(-)
-diff --git a/target/s390x/helper.h b/target/s390x/helper.h
+diff --git a/target/i386/tcg/emit.c.inc b/target/i386/tcg/emit.c.inc
 index XXXXXXX..XXXXXXX 100644
---- a/target/s390x/helper.h
+--- a/target/i386/tcg/emit.c.inc
-+++ b/target/s390x/helper.h
++++ b/target/i386/tcg/emit.c.inc
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(clc, TCG_CALL_NO_WG, i32, env, i32, i64, i64)
  DEF_HELPER_3(mvcl, i32, env, i32, i32)
  DEF_HELPER_3(clcl, i32, env, i32, i32)
  DEF_HELPER_FLAGS_4(clm, TCG_CALL_NO_WG, i32, env, i32, i32, i64)
 -DEF_HELPER_FLAGS_3(divs32, TCG_CALL_NO_WG, s64, env, s64, s64)
 +DEF_HELPER_FLAGS_3(divs32, TCG_CALL_NO_WG, i64, env, s64, s64)
  DEF_HELPER_FLAGS_3(divu32, TCG_CALL_NO_WG, i64, env, i64, i64)
  DEF_HELPER_FLAGS_3(divs64, TCG_CALL_NO_WG, s64, env, s64, s64)
  DEF_HELPER_FLAGS_4(divu64, TCG_CALL_NO_WG, i64, env, i64, i64, i64)
 diff --git a/target/s390x/tcg/int_helper.c b/target/s390x/tcg/int_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/s390x/tcg/int_helper.c
 +++ b/target/s390x/tcg/int_helper.c
 @@ -XXX,XX +XXX,XX @@
+  */
+ #ifdef TARGET_X86_64
+ #define TCG_TARGET_HAS_extract2_tl      TCG_TARGET_HAS_extract2_i64
+-#define TCG_TARGET_deposit_tl_valid     TCG_TARGET_deposit_i64_valid
+ #else
+ #define TCG_TARGET_HAS_extract2_tl      TCG_TARGET_HAS_extract2_i32
+-#define TCG_TARGET_deposit_tl_valid     TCG_TARGET_deposit_i32_valid
  #endif
- /* 64/32 -> 32 signed division */
+ #define MMX_OFFSET(reg)                        \
--int64_t HELPER(divs32)(CPUS390XState *env, int64_t a, int64_t b64)
+@@ -XXX,XX +XXX,XX @@ static void gen_RCL(DisasContext *s, X86DecodedInsn *decode)
 +uint64_t HELPER(divs32)(CPUS390XState *env, int64_t a, int64_t b64)
  {
 -    int32_t ret, b = b64;
 -    int64_t q;
 +    int32_t b = b64;
 +    int64_t q, r;
      if (b == 0) {
          tcg_s390_program_interrupt(env, PGM_FIXPT_DIVIDE, GETPC());
      }
--    ret = q = a / b;
+     /* Compute high part, including incoming carry.  */
--    env->retxl = a % b;
+-    if (!have_1bit_cin || TCG_TARGET_deposit_tl_valid(1, TARGET_LONG_BITS - 1)) {
-+    q = a / b;
++    if (!have_1bit_cin || tcg_op_deposit_valid(TCG_TYPE_TL, 1, TARGET_LONG_BITS - 1)) {
-+    r = a % b;
+         /* high = (T0 << 1) | cin */
+         TCGv cin = have_1bit_cin ? decode->cc_dst : decode->cc_src;
-     /* Catch non-representable quotient.  */
+         tcg_gen_deposit_tl(high, cin, s->T0, 1, TARGET_LONG_BITS - 1);
--    if (ret != q) {
+@@ -XXX,XX +XXX,XX @@ static void gen_RCR(DisasContext *s, X86DecodedInsn *decode)
 +    if (q != (int32_t)q) {
          tcg_s390_program_interrupt(env, PGM_FIXPT_DIVIDE, GETPC());
      }
--    return ret;
+     /* Save incoming carry into high, it will be shifted later.  */
-+    return deposit64(q, 32, 32, r);
+-    if (!have_1bit_cin || TCG_TARGET_deposit_tl_valid(1, TARGET_LONG_BITS - 1)) {
- }
++    if (!have_1bit_cin || tcg_op_deposit_valid(TCG_TYPE_TL, 1, TARGET_LONG_BITS - 1)) {
+         TCGv cin = have_1bit_cin ? decode->cc_dst : decode->cc_src;
- /* 64/32 -> 32 unsigned division */
+         tcg_gen_deposit_tl(high, cin, s->T0, 1, TARGET_LONG_BITS - 1);
- uint64_t HELPER(divu32)(CPUS390XState *env, uint64_t a, uint64_t b64)
+     } else {
  {
 -    uint32_t ret, b = b64;
 -    uint64_t q;
 +    uint32_t b = b64;
 +    uint64_t q, r;
      if (b == 0) {
          tcg_s390_program_interrupt(env, PGM_FIXPT_DIVIDE, GETPC());
      }
 -    ret = q = a / b;
 -    env->retxl = a % b;
 +    q = a / b;
 +    r = a % b;
      /* Catch non-representable quotient.  */
 -    if (ret != q) {
 +    if (q != (uint32_t)q) {
          tcg_s390_program_interrupt(env, PGM_FIXPT_DIVIDE, GETPC());
      }
 -    return ret;
 +    return deposit64(q, 32, 32, r);
  }
  /* 64/64 -> 64 signed division */
 diff --git a/target/s390x/tcg/translate.c b/target/s390x/tcg/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/s390x/tcg/translate.c
 +++ b/target/s390x/tcg/translate.c
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_diag(DisasContext *s, DisasOps *o)
  static DisasJumpType op_divs32(DisasContext *s, DisasOps *o)
  {
 -    gen_helper_divs32(o->out2, cpu_env, o->in1, o->in2);
 -    return_low128(o->out);
 +    gen_helper_divs32(o->out, cpu_env, o->in1, o->in2);
 +    tcg_gen_extr32_i64(o->out2, o->out, o->out);
      return DISAS_NEXT;
  }
  static DisasJumpType op_divu32(DisasContext *s, DisasOps *o)
  {
 -    gen_helper_divu32(o->out2, cpu_env, o->in1, o->in2);
 -    return_low128(o->out);
 +    gen_helper_divu32(o->out, cpu_env, o->in1, o->in2);
 +    tcg_gen_extr32_i64(o->out2, o->out, o->out);
      return DISAS_NEXT;
  }
 --
-.34.1
+.43.0

-New patch
+[PULL 14/68] target/i386: Use tcg_op_supported
+Do not reference TCG_TARGET_HAS_* directly.
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+---
+ target/i386/tcg/emit.c.inc | 6 +++---
+file changed, 3 insertions(+), 3 deletions(-)
+diff --git a/target/i386/tcg/emit.c.inc b/target/i386/tcg/emit.c.inc
+index XXXXXXX..XXXXXXX 100644
+--- a/target/i386/tcg/emit.c.inc
++++ b/target/i386/tcg/emit.c.inc
+@@ -XXX,XX +XXX,XX @@
+  * The exact opcode to check depends on 32- vs. 64-bit.
+  */
+ #ifdef TARGET_X86_64
+-#define TCG_TARGET_HAS_extract2_tl      TCG_TARGET_HAS_extract2_i64
++#define INDEX_op_extract2_tl            INDEX_op_extract2_i64
+ #else
+-#define TCG_TARGET_HAS_extract2_tl      TCG_TARGET_HAS_extract2_i32
++#define INDEX_op_extract2_tl            INDEX_op_extract2_i32
+ #endif
+ #define MMX_OFFSET(reg)                        \
+@@ -XXX,XX +XXX,XX @@ static void gen_PMOVMSKB(DisasContext *s, X86DecodedInsn *decode)
+     tcg_gen_ld8u_tl(s->T0, tcg_env, offsetof(CPUX86State, xmm_t0.ZMM_B(vec_len - 1)));
+     while (vec_len > 8) {
+         vec_len -= 8;
+-        if (TCG_TARGET_HAS_extract2_tl) {
++        if (tcg_op_supported(INDEX_op_extract2_tl, TCG_TYPE_TL, 0)) {
+             /*
+              * Load the next byte of the result into the high byte of T.
+              * TCG does a similar expansion of deposit to shl+extract2; by
+--
+.43.0

-[PULL 14/40] tcg: Add TCG_TARGET_CALL_{RET,ARG}_I128
+[PULL 15/68] tcg: Remove TCG_TARGET_NEED_LDST_LABELS and TCG_TARGET_NEED_POOL_LABELS
-Fill in the parameters for the host ABI for Int128 for
+Make these features unconditional, as they're used by most
-those backends which require no extra modification.
+tcg backends anyway.  Merge tcg-ldst.c.inc and tcg-pool.c.inc
 into tcg.c and mark some of the functions unused, so that
 when the features are not used we won't get Werrors.
-Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Reviewed-by: Daniel Henrique Barboza <danielhb413@gmail.com>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 ---
- tcg/aarch64/tcg-target.h     | 2 ++
+ include/tcg/tcg.h                |   4 -
- tcg/arm/tcg-target.h         | 2 ++
+ tcg/aarch64/tcg-target.h         |   2 -
- tcg/loongarch64/tcg-target.h | 2 ++
+ tcg/arm/tcg-target.h             |   2 -
- tcg/mips/tcg-target.h        | 2 ++
+ tcg/i386/tcg-target.h            |   2 -
- tcg/riscv/tcg-target.h       | 3 +++
+ tcg/loongarch64/tcg-target.h     |   2 -
- tcg/s390x/tcg-target.h       | 2 ++
+ tcg/mips/tcg-target.h            |   2 -
- tcg/sparc64/tcg-target.h     | 2 ++
+ tcg/ppc/tcg-target.h             |   2 -
- tcg/tcg.c                    | 6 +++---
+ tcg/riscv/tcg-target.h           |   3 -
- tcg/ppc/tcg-target.c.inc     | 3 +++
+ tcg/s390x/tcg-target.h           |   2 -
-files changed, 21 insertions(+), 3 deletions(-)
+ tcg/sparc64/tcg-target.h         |   2 -
  tcg/tcg.c                        | 211 +++++++++++++++++++++++++++++--
  tcg/aarch64/tcg-target.c.inc     |   2 -
  tcg/arm/tcg-target.c.inc         |   2 -
  tcg/i386/tcg-target.c.inc        |   3 -
  tcg/loongarch64/tcg-target.c.inc |   9 +-
  tcg/mips/tcg-target.c.inc        |   3 -
  tcg/ppc/tcg-target.c.inc         |   2 -
  tcg/riscv/tcg-target.c.inc       |   3 -
  tcg/s390x/tcg-target.c.inc       |   2 -
  tcg/sparc64/tcg-target.c.inc     |   3 -
  tcg/tcg-ldst.c.inc               |  65 ----------
  tcg/tcg-pool.c.inc               | 162 ------------------------
  tcg/tci/tcg-target.c.inc         |  12 +-
 files changed, 216 insertions(+), 286 deletions(-)
  delete mode 100644 tcg/tcg-ldst.c.inc
  delete mode 100644 tcg/tcg-pool.c.inc
+diff --git a/include/tcg/tcg.h b/include/tcg/tcg.h
+index XXXXXXX..XXXXXXX 100644
+--- a/include/tcg/tcg.h
++++ b/include/tcg/tcg.h
+@@ -XXX,XX +XXX,XX @@ struct TCGContext {
+     CPUState *cpu;                      /* *_trans */
+     /* These structures are private to tcg-target.c.inc.  */
+-#ifdef TCG_TARGET_NEED_LDST_LABELS
+     QSIMPLEQ_HEAD(, TCGLabelQemuLdst) ldst_labels;
+-#endif
+-#ifdef TCG_TARGET_NEED_POOL_LABELS
+     struct TCGLabelPoolData *pool_labels;
+-#endif
+     TCGLabel *exitreq_label;
 diff --git a/tcg/aarch64/tcg-target.h b/tcg/aarch64/tcg-target.h
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/aarch64/tcg-target.h
 +++ b/tcg/aarch64/tcg-target.h
 @@ -XXX,XX +XXX,XX @@ typedef enum {
- #define TCG_TARGET_CALL_STACK_OFFSET    0
+ #define TCG_TARGET_HAS_tst_vec          1
- #define TCG_TARGET_CALL_ARG_I32         TCG_CALL_ARG_NORMAL
- #define TCG_TARGET_CALL_ARG_I64         TCG_CALL_ARG_NORMAL
+ #define TCG_TARGET_DEFAULT_MO (0)
-+#define TCG_TARGET_CALL_ARG_I128        TCG_CALL_ARG_EVEN
+-#define TCG_TARGET_NEED_LDST_LABELS
-+#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_NORMAL
+-#define TCG_TARGET_NEED_POOL_LABELS
- /* optional instructions */
+ #endif /* AARCH64_TCG_TARGET_H */
  #define TCG_TARGET_HAS_div_i32          1
 diff --git a/tcg/arm/tcg-target.h b/tcg/arm/tcg-target.h
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/arm/tcg-target.h
 +++ b/tcg/arm/tcg-target.h
 @@ -XXX,XX +XXX,XX @@ extern bool use_neon_instructions;
- #define TCG_TARGET_CALL_STACK_OFFSET    0
+ #define TCG_TARGET_HAS_tst_vec          1
- #define TCG_TARGET_CALL_ARG_I32         TCG_CALL_ARG_NORMAL
- #define TCG_TARGET_CALL_ARG_I64         TCG_CALL_ARG_EVEN
+ #define TCG_TARGET_DEFAULT_MO (0)
-+#define TCG_TARGET_CALL_ARG_I128        TCG_CALL_ARG_EVEN
+-#define TCG_TARGET_NEED_LDST_LABELS
-+#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_BY_REF
+-#define TCG_TARGET_NEED_POOL_LABELS
- /* optional instructions */
+ #endif
- #define TCG_TARGET_HAS_ext8s_i32        1
+diff --git a/tcg/i386/tcg-target.h b/tcg/i386/tcg-target.h
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/i386/tcg-target.h
 +++ b/tcg/i386/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
  #include "tcg/tcg-mo.h"
  #define TCG_TARGET_DEFAULT_MO (TCG_MO_ALL & ~TCG_MO_ST_LD)
 -#define TCG_TARGET_NEED_LDST_LABELS
 -#define TCG_TARGET_NEED_POOL_LABELS
  #endif
 diff --git a/tcg/loongarch64/tcg-target.h b/tcg/loongarch64/tcg-target.h
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/loongarch64/tcg-target.h
 +++ b/tcg/loongarch64/tcg-target.h
 @@ -XXX,XX +XXX,XX @@ typedef enum {
- #define TCG_TARGET_CALL_STACK_OFFSET    0
- #define TCG_TARGET_CALL_ARG_I32         TCG_CALL_ARG_NORMAL
+ #define TCG_TARGET_DEFAULT_MO (0)
- #define TCG_TARGET_CALL_ARG_I64         TCG_CALL_ARG_NORMAL
-+#define TCG_TARGET_CALL_ARG_I128        TCG_CALL_ARG_NORMAL
+-#define TCG_TARGET_NEED_LDST_LABELS
-+#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_NORMAL
+-
+ #endif /* LOONGARCH_TCG_TARGET_H */
  /* optional instructions */
  #define TCG_TARGET_HAS_movcond_i32      1
 diff --git a/tcg/mips/tcg-target.h b/tcg/mips/tcg-target.h
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/mips/tcg-target.h
 +++ b/tcg/mips/tcg-target.h
+@@ -XXX,XX +XXX,XX @@ extern bool use_mips32r2_instructions;
+ #define TCG_TARGET_HAS_tst              0
+ #define TCG_TARGET_DEFAULT_MO           0
+-#define TCG_TARGET_NEED_LDST_LABELS
+-#define TCG_TARGET_NEED_POOL_LABELS
+ #endif
+diff --git a/tcg/ppc/tcg-target.h b/tcg/ppc/tcg-target.h
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/ppc/tcg-target.h
++++ b/tcg/ppc/tcg-target.h
 @@ -XXX,XX +XXX,XX @@ typedef enum {
- # define TCG_TARGET_CALL_ARG_I64      TCG_CALL_ARG_NORMAL
+ #define TCG_TARGET_HAS_tst_vec          0
  #define TCG_TARGET_DEFAULT_MO (0)
 -#define TCG_TARGET_NEED_LDST_LABELS
 -#define TCG_TARGET_NEED_POOL_LABELS
  #endif
- #define TCG_TARGET_CALL_ARG_I32       TCG_CALL_ARG_NORMAL
-+#define TCG_TARGET_CALL_ARG_I128      TCG_CALL_ARG_EVEN
-+#define TCG_TARGET_CALL_RET_I128      TCG_CALL_RET_NORMAL
- /* MOVN/MOVZ instructions detection */
- #if (defined(__mips_isa_rev) && (__mips_isa_rev >= 1)) || \
 diff --git a/tcg/riscv/tcg-target.h b/tcg/riscv/tcg-target.h
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/riscv/tcg-target.h
 +++ b/tcg/riscv/tcg-target.h
 @@ -XXX,XX +XXX,XX @@ typedef enum {
- #define TCG_TARGET_CALL_ARG_I32         TCG_CALL_ARG_NORMAL
- #if TCG_TARGET_REG_BITS == 32
+ #define TCG_TARGET_DEFAULT_MO (0)
- #define TCG_TARGET_CALL_ARG_I64         TCG_CALL_ARG_EVEN
-+#define TCG_TARGET_CALL_ARG_I128        TCG_CALL_ARG_EVEN
+-#define TCG_TARGET_NEED_LDST_LABELS
- #else
+-#define TCG_TARGET_NEED_POOL_LABELS
- #define TCG_TARGET_CALL_ARG_I64         TCG_CALL_ARG_NORMAL
+-
 +#define TCG_TARGET_CALL_ARG_I128        TCG_CALL_ARG_NORMAL
  #endif
-+#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_NORMAL
- /* optional instructions */
- #define TCG_TARGET_HAS_movcond_i32      0
 diff --git a/tcg/s390x/tcg-target.h b/tcg/s390x/tcg-target.h
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/s390x/tcg-target.h
 +++ b/tcg/s390x/tcg-target.h
 @@ -XXX,XX +XXX,XX @@ extern uint64_t s390_facilities[3];
- #define TCG_TARGET_CALL_STACK_OFFSET    160
+ #define TCG_TARGET_HAS_tst_vec        0
- #define TCG_TARGET_CALL_ARG_I32         TCG_CALL_ARG_EXTEND
- #define TCG_TARGET_CALL_ARG_I64         TCG_CALL_ARG_NORMAL
+ #define TCG_TARGET_DEFAULT_MO (TCG_MO_ALL & ~TCG_MO_ST_LD)
-+#define TCG_TARGET_CALL_ARG_I128        TCG_CALL_ARG_BY_REF
+-#define TCG_TARGET_NEED_LDST_LABELS
-+#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_BY_REF
+-#define TCG_TARGET_NEED_POOL_LABELS
- #define TCG_TARGET_HAS_MEMORY_BSWAP   1
+ #endif
 diff --git a/tcg/sparc64/tcg-target.h b/tcg/sparc64/tcg-target.h
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/sparc64/tcg-target.h
 +++ b/tcg/sparc64/tcg-target.h
-@@ -XXX,XX +XXX,XX @@ typedef enum {
+@@ -XXX,XX +XXX,XX @@ extern bool use_vis3_instructions;
- #define TCG_TARGET_CALL_STACK_OFFSET    (128 + 6*8 + TCG_TARGET_STACK_BIAS)
+ #define TCG_AREG0 TCG_REG_I0
- #define TCG_TARGET_CALL_ARG_I32         TCG_CALL_ARG_EXTEND
- #define TCG_TARGET_CALL_ARG_I64         TCG_CALL_ARG_NORMAL
+ #define TCG_TARGET_DEFAULT_MO (0)
-+#define TCG_TARGET_CALL_ARG_I128        TCG_CALL_ARG_NORMAL
+-#define TCG_TARGET_NEED_LDST_LABELS
-+#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_NORMAL
+-#define TCG_TARGET_NEED_POOL_LABELS
- #if defined(__VIS__) && __VIS__ >= 0x300
+ #endif
  #define use_vis3_instructions  1
 diff --git a/tcg/tcg.c b/tcg/tcg.c
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tcg.c
 +++ b/tcg/tcg.c
-@@ -XXX,XX +XXX,XX @@ static void init_call_layout(TCGHelperInfo *info)
+@@ -XXX,XX +XXX,XX @@ static void tcg_target_init(TCGContext *s);
-         break;
+ static void tcg_target_qemu_prologue(TCGContext *s);
-     case dh_typecode_i128:
+ static bool patch_reloc(tcg_insn_unit *code_ptr, int type,
-         info->nr_out = 128 / TCG_TARGET_REG_BITS;
+                         intptr_t value, intptr_t addend);
--        info->out_kind = TCG_CALL_RET_NORMAL; /* TODO */
++static void tcg_out_nop_fill(tcg_insn_unit *p, int count);
--        switch (/* TODO */ TCG_CALL_RET_NORMAL) {
++
-+        info->out_kind = TCG_TARGET_CALL_RET_I128;
++typedef struct TCGLabelQemuLdst TCGLabelQemuLdst;
-+        switch (TCG_TARGET_CALL_RET_I128) {
++static bool tcg_out_qemu_ld_slow_path(TCGContext *s, TCGLabelQemuLdst *l);
-         case TCG_CALL_RET_NORMAL:
++static bool tcg_out_qemu_st_slow_path(TCGContext *s, TCGLabelQemuLdst *l);
-             /* Query the last register now to trigger any assert early. */
-             tcg_target_call_oarg_reg(info->out_kind, info->nr_out - 1);
+ /* The CIE and FDE header definitions will be common to all hosts.  */
-@@ -XXX,XX +XXX,XX @@ static void init_call_layout(TCGHelperInfo *info)
+ typedef struct {
-             break;
+@@ -XXX,XX +XXX,XX @@ typedef struct QEMU_PACKED {
+     DebugFrameFDEHeader fde;
-         case TCG_TYPE_I128:
+ } DebugFrameHeader;
--            switch (/* TODO */ TCG_CALL_ARG_NORMAL) {
-+            switch (TCG_TARGET_CALL_ARG_I128) {
+-typedef struct TCGLabelQemuLdst {
-             case TCG_CALL_ARG_EVEN:
++struct TCGLabelQemuLdst {
-                 layout_arg_even(&cum);
+     bool is_ld;             /* qemu_ld: true, qemu_st: false */
-                 /* fall through */
+     MemOpIdx oi;
      TCGType type;           /* result type of a load */
@@ -XXX,XX +XXX,XX @@ typedef struct TCGLabelQemuLdst {
      const tcg_insn_unit *raddr;   /* addr of the next IR of qemu_ld/st IR */
      tcg_insn_unit *label_ptr[2]; /* label pointers to be updated */
      QSIMPLEQ_ENTRY(TCGLabelQemuLdst) next;
 -} TCGLabelQemuLdst;
 +};
  static void tcg_register_jit_int(const void *buf, size_t size,
                                   const void *debug_frame,
@@ -XXX,XX +XXX,XX @@ static void tcg_out_call(TCGContext *s, const tcg_insn_unit *target,
  static TCGReg tcg_target_call_oarg_reg(TCGCallReturnKind kind, int slot);
  static bool tcg_target_const_match(int64_t val, int ct,
                                     TCGType type, TCGCond cond, int vece);
 -#ifdef TCG_TARGET_NEED_LDST_LABELS
 -static int tcg_out_ldst_finalize(TCGContext *s);
 -#endif
  #ifndef CONFIG_USER_ONLY
  #define guest_base  ({ qemu_build_not_reached(); (uintptr_t)0; })
@@ -XXX,XX +XXX,XX @@ static void tcg_out_movext3(TCGContext *s, const TCGMovExtend *i1,
      }
  }
 +/*
 + * Allocate a new TCGLabelQemuLdst entry.
 + */
 +
 +__attribute__((unused))
 +static TCGLabelQemuLdst *new_ldst_label(TCGContext *s)
 +{
 +    TCGLabelQemuLdst *l = tcg_malloc(sizeof(*l));
 +
 +    memset(l, 0, sizeof(*l));
 +    QSIMPLEQ_INSERT_TAIL(&s->ldst_labels, l, next);
 +
 +    return l;
 +}
 +
 +/*
 + * Allocate new constant pool entries.
 + */
 +
 +typedef struct TCGLabelPoolData {
 +    struct TCGLabelPoolData *next;
 +    tcg_insn_unit *label;
 +    intptr_t addend;
 +    int rtype;
 +    unsigned nlong;
 +    tcg_target_ulong data[];
 +} TCGLabelPoolData;
 +
 +static TCGLabelPoolData *new_pool_alloc(TCGContext *s, int nlong, int rtype,
 +                                        tcg_insn_unit *label, intptr_t addend)
 +{
 +    TCGLabelPoolData *n = tcg_malloc(sizeof(TCGLabelPoolData)
 +                                     + sizeof(tcg_target_ulong) * nlong);
 +
 +    n->label = label;
 +    n->addend = addend;
 +    n->rtype = rtype;
 +    n->nlong = nlong;
 +    return n;
 +}
 +
 +static void new_pool_insert(TCGContext *s, TCGLabelPoolData *n)
 +{
 +    TCGLabelPoolData *i, **pp;
 +    int nlong = n->nlong;
 +
 +    /* Insertion sort on the pool.  */
 +    for (pp = &s->pool_labels; (i = *pp) != NULL; pp = &i->next) {
 +        if (nlong > i->nlong) {
 +            break;
 +        }
 +        if (nlong < i->nlong) {
 +            continue;
 +        }
 +        if (memcmp(n->data, i->data, sizeof(tcg_target_ulong) * nlong) >= 0) {
 +            break;
 +        }
 +    }
 +    n->next = *pp;
 +    *pp = n;
 +}
 +
 +/* The "usual" for generic integer code.  */
 +__attribute__((unused))
 +static void new_pool_label(TCGContext *s, tcg_target_ulong d, int rtype,
 +                           tcg_insn_unit *label, intptr_t addend)
 +{
 +    TCGLabelPoolData *n = new_pool_alloc(s, 1, rtype, label, addend);
 +    n->data[0] = d;
 +    new_pool_insert(s, n);
 +}
 +
 +/* For v64 or v128, depending on the host.  */
 +__attribute__((unused))
 +static void new_pool_l2(TCGContext *s, int rtype, tcg_insn_unit *label,
 +                        intptr_t addend, tcg_target_ulong d0,
 +                        tcg_target_ulong d1)
 +{
 +    TCGLabelPoolData *n = new_pool_alloc(s, 2, rtype, label, addend);
 +    n->data[0] = d0;
 +    n->data[1] = d1;
 +    new_pool_insert(s, n);
 +}
 +
 +/* For v128 or v256, depending on the host.  */
 +__attribute__((unused))
 +static void new_pool_l4(TCGContext *s, int rtype, tcg_insn_unit *label,
 +                        intptr_t addend, tcg_target_ulong d0,
 +                        tcg_target_ulong d1, tcg_target_ulong d2,
 +                        tcg_target_ulong d3)
 +{
 +    TCGLabelPoolData *n = new_pool_alloc(s, 4, rtype, label, addend);
 +    n->data[0] = d0;
 +    n->data[1] = d1;
 +    n->data[2] = d2;
 +    n->data[3] = d3;
 +    new_pool_insert(s, n);
 +}
 +
 +/* For v256, for 32-bit host.  */
 +__attribute__((unused))
 +static void new_pool_l8(TCGContext *s, int rtype, tcg_insn_unit *label,
 +                        intptr_t addend, tcg_target_ulong d0,
 +                        tcg_target_ulong d1, tcg_target_ulong d2,
 +                        tcg_target_ulong d3, tcg_target_ulong d4,
 +                        tcg_target_ulong d5, tcg_target_ulong d6,
 +                        tcg_target_ulong d7)
 +{
 +    TCGLabelPoolData *n = new_pool_alloc(s, 8, rtype, label, addend);
 +    n->data[0] = d0;
 +    n->data[1] = d1;
 +    n->data[2] = d2;
 +    n->data[3] = d3;
 +    n->data[4] = d4;
 +    n->data[5] = d5;
 +    n->data[6] = d6;
 +    n->data[7] = d7;
 +    new_pool_insert(s, n);
 +}
 +
 +/*
 + * Generate TB finalization at the end of block
 + */
 +
 +static int tcg_out_ldst_finalize(TCGContext *s)
 +{
 +    TCGLabelQemuLdst *lb;
 +
 +    /* qemu_ld/st slow paths */
 +    QSIMPLEQ_FOREACH(lb, &s->ldst_labels, next) {
 +        if (lb->is_ld
 +            ? !tcg_out_qemu_ld_slow_path(s, lb)
 +            : !tcg_out_qemu_st_slow_path(s, lb)) {
 +            return -2;
 +        }
 +
 +        /*
 +         * Test for (pending) buffer overflow.  The assumption is that any
 +         * one operation beginning below the high water mark cannot overrun
 +         * the buffer completely.  Thus we can test for overflow after
 +         * generating code without having to check during generation.
 +         */
 +        if (unlikely((void *)s->code_ptr > s->code_gen_highwater)) {
 +            return -1;
 +        }
 +    }
 +    return 0;
 +}
 +
 +static int tcg_out_pool_finalize(TCGContext *s)
 +{
 +    TCGLabelPoolData *p = s->pool_labels;
 +    TCGLabelPoolData *l = NULL;
 +    void *a;
 +
 +    if (p == NULL) {
 +        return 0;
 +    }
 +
 +    /*
 +     * ??? Round up to qemu_icache_linesize, but then do not round
 +     * again when allocating the next TranslationBlock structure.
 +     */
 +    a = (void *)ROUND_UP((uintptr_t)s->code_ptr,
 +                         sizeof(tcg_target_ulong) * p->nlong);
 +    tcg_out_nop_fill(s->code_ptr, (tcg_insn_unit *)a - s->code_ptr);
 +    s->data_gen_ptr = a;
 +
 +    for (; p != NULL; p = p->next) {
 +        size_t size = sizeof(tcg_target_ulong) * p->nlong;
 +        uintptr_t value;
 +
 +        if (!l || l->nlong != p->nlong || memcmp(l->data, p->data, size)) {
 +            if (unlikely(a > s->code_gen_highwater)) {
 +                return -1;
 +            }
 +            memcpy(a, p->data, size);
 +            a += size;
 +            l = p;
 +        }
 +
 +        value = (uintptr_t)tcg_splitwx_to_rx(a) - size;
 +        if (!patch_reloc(p->label, p->rtype, value, p->addend)) {
 +            return -2;
 +        }
 +    }
 +
 +    s->code_ptr = a;
 +    return 0;
 +}
 +
  #define C_PFX1(P, A)                    P##A
  #define C_PFX2(P, A, B)                 P##A##_##B
  #define C_PFX3(P, A, B, C)              P##A##_##B##_##C
@@ -XXX,XX +XXX,XX @@ int tcg_gen_code(TCGContext *s, TranslationBlock *tb, uint64_t pc_start)
      s->code_ptr = s->code_buf;
      s->data_gen_ptr = NULL;
 -#ifdef TCG_TARGET_NEED_LDST_LABELS
      QSIMPLEQ_INIT(&s->ldst_labels);
 -#endif
 -#ifdef TCG_TARGET_NEED_POOL_LABELS
      s->pool_labels = NULL;
 -#endif
      start_words = s->insn_start_words;
      s->gen_insn_data =
@@ -XXX,XX +XXX,XX @@ int tcg_gen_code(TCGContext *s, TranslationBlock *tb, uint64_t pc_start)
      s->gen_insn_end_off[num_insns] = tcg_current_code_size(s);
      /* Generate TB finalization at the end of block */
 -#ifdef TCG_TARGET_NEED_LDST_LABELS
      i = tcg_out_ldst_finalize(s);
      if (i < 0) {
          return i;
      }
 -#endif
 -#ifdef TCG_TARGET_NEED_POOL_LABELS
      i = tcg_out_pool_finalize(s);
      if (i < 0) {
          return i;
      }
 -#endif
      if (!tcg_resolve_relocs(s)) {
          return -2;
      }
 diff --git a/tcg/aarch64/tcg-target.c.inc b/tcg/aarch64/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/aarch64/tcg-target.c.inc
 +++ b/tcg/aarch64/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@
   * See the COPYING file in the top-level directory for details.
   */
 -#include "../tcg-ldst.c.inc"
 -#include "../tcg-pool.c.inc"
  #include "qemu/bitops.h"
  /* Used for function call generation. */
 diff --git a/tcg/arm/tcg-target.c.inc b/tcg/arm/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/arm/tcg-target.c.inc
 +++ b/tcg/arm/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@
   */
  #include "elf.h"
 -#include "../tcg-ldst.c.inc"
 -#include "../tcg-pool.c.inc"
  int arm_arch = __ARM_ARCH;
 diff --git a/tcg/i386/tcg-target.c.inc b/tcg/i386/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/i386/tcg-target.c.inc
 +++ b/tcg/i386/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@
   * THE SOFTWARE.
   */
 -#include "../tcg-ldst.c.inc"
 -#include "../tcg-pool.c.inc"
 -
  /* Used for function call generation. */
  #define TCG_TARGET_STACK_ALIGN 16
  #if defined(_WIN64)
 diff --git a/tcg/loongarch64/tcg-target.c.inc b/tcg/loongarch64/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/loongarch64/tcg-target.c.inc
 +++ b/tcg/loongarch64/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@
   * THE SOFTWARE.
   */
 -#include "../tcg-ldst.c.inc"
  #include <asm/hwcap.h>
  /* used for function call generation */
@@ -XXX,XX +XXX,XX @@ static void tcg_out_tb_start(TCGContext *s)
      /* nothing to do */
  }
 +static void tcg_out_nop_fill(tcg_insn_unit *p, int count)
 +{
 +    for (int i = 0; i < count; ++i) {
 +        /* Canonical nop is andi r0,r0,0 */
 +        p[i] = OPC_ANDI;
 +    }
 +}
 +
  static void tcg_target_init(TCGContext *s)
  {
      unsigned long hwcap = qemu_getauxval(AT_HWCAP);
 diff --git a/tcg/mips/tcg-target.c.inc b/tcg/mips/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/mips/tcg-target.c.inc
 +++ b/tcg/mips/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@
   * THE SOFTWARE.
   */
 -#include "../tcg-ldst.c.inc"
 -#include "../tcg-pool.c.inc"
 -
  /* used for function call generation */
  #define TCG_TARGET_STACK_ALIGN        16
  #if _MIPS_SIM == _ABIO32
 diff --git a/tcg/ppc/tcg-target.c.inc b/tcg/ppc/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/ppc/tcg-target.c.inc
 +++ b/tcg/ppc/tcg-target.c.inc
 @@ -XXX,XX +XXX,XX @@
- #else
+  */
- # define TCG_TARGET_CALL_ARG_I64   TCG_CALL_ARG_NORMAL
  #include "elf.h"
 -#include "../tcg-pool.c.inc"
 -#include "../tcg-ldst.c.inc"
  /*
   * Standardize on the _CALL_FOO symbols used by GCC:
 diff --git a/tcg/riscv/tcg-target.c.inc b/tcg/riscv/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/riscv/tcg-target.c.inc
 +++ b/tcg/riscv/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@
   * THE SOFTWARE.
   */
 -#include "../tcg-ldst.c.inc"
 -#include "../tcg-pool.c.inc"
 -
  /* Used for function call generation. */
  #define TCG_REG_CALL_STACK              TCG_REG_SP
  #define TCG_TARGET_STACK_ALIGN          16
 diff --git a/tcg/s390x/tcg-target.c.inc b/tcg/s390x/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/s390x/tcg-target.c.inc
 +++ b/tcg/s390x/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@
   * THE SOFTWARE.
   */
 -#include "../tcg-ldst.c.inc"
 -#include "../tcg-pool.c.inc"
  #include "elf.h"
  /* Used for function call generation. */
 diff --git a/tcg/sparc64/tcg-target.c.inc b/tcg/sparc64/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/sparc64/tcg-target.c.inc
 +++ b/tcg/sparc64/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@
  #error "unsupported code generation mode"
  #endif
-+/* Note sysv arg alignment applies only to 2-word types, not more. */
-+#define TCG_TARGET_CALL_ARG_I128   TCG_CALL_ARG_NORMAL
+-#include "../tcg-ldst.c.inc"
-+#define TCG_TARGET_CALL_RET_I128   TCG_CALL_RET_NORMAL
+-#include "../tcg-pool.c.inc"
+-
- /* For some memory operations, we need a scratch that isn't R0.  For the AIX
+ /* Used for function call generation. */
-    calling convention, we can re-use the TOC register since we'll be reloading
+ #define TCG_REG_CALL_STACK              TCG_REG_O6
  #define TCG_TARGET_STACK_BIAS           2047
 diff --git a/tcg/tcg-ldst.c.inc b/tcg/tcg-ldst.c.inc
 deleted file mode 100644
 index XXXXXXX..XXXXXXX
 --- a/tcg/tcg-ldst.c.inc
 +++ /dev/null
@@ -XXX,XX +XXX,XX @@
 -/*
 - * TCG Backend Data: load-store optimization only.
 - *
 - * Permission is hereby granted, free of charge, to any person obtaining a copy
 - * of this software and associated documentation files (the "Software"), to deal
 - * in the Software without restriction, including without limitation the rights
 - * to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
 - * copies of the Software, and to permit persons to whom the Software is
 - * furnished to do so, subject to the following conditions:
 - *
 - * The above copyright notice and this permission notice shall be included in
 - * all copies or substantial portions of the Software.
 - *
 - * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
 - * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
 - * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL
 - * THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
 - * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
 - * OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN
 - * THE SOFTWARE.
 - */
 -
 -/*
 - * Generate TB finalization at the end of block
 - */
 -
 -static bool tcg_out_qemu_ld_slow_path(TCGContext *s, TCGLabelQemuLdst *l);
 -static bool tcg_out_qemu_st_slow_path(TCGContext *s, TCGLabelQemuLdst *l);
 -
 -static int tcg_out_ldst_finalize(TCGContext *s)
 -{
 -    TCGLabelQemuLdst *lb;
 -
 -    /* qemu_ld/st slow paths */
 -    QSIMPLEQ_FOREACH(lb, &s->ldst_labels, next) {
 -        if (lb->is_ld
 -            ? !tcg_out_qemu_ld_slow_path(s, lb)
 -            : !tcg_out_qemu_st_slow_path(s, lb)) {
 -            return -2;
 -        }
 -
 -        /* Test for (pending) buffer overflow.  The assumption is that any
 -           one operation beginning below the high water mark cannot overrun
 -           the buffer completely.  Thus we can test for overflow after
 -           generating code without having to check during generation.  */
 -        if (unlikely((void *)s->code_ptr > s->code_gen_highwater)) {
 -            return -1;
 -        }
 -    }
 -    return 0;
 -}
 -
 -/*
 - * Allocate a new TCGLabelQemuLdst entry.
 - */
 -
 -static inline TCGLabelQemuLdst *new_ldst_label(TCGContext *s)
 -{
 -    TCGLabelQemuLdst *l = tcg_malloc(sizeof(*l));
 -
 -    memset(l, 0, sizeof(*l));
 -    QSIMPLEQ_INSERT_TAIL(&s->ldst_labels, l, next);
 -
 -    return l;
 -}
 diff --git a/tcg/tcg-pool.c.inc b/tcg/tcg-pool.c.inc
 deleted file mode 100644
 index XXXXXXX..XXXXXXX
 --- a/tcg/tcg-pool.c.inc
 +++ /dev/null
@@ -XXX,XX +XXX,XX @@
 -/*
 - * TCG Backend Data: constant pool.
 - *
 - * Permission is hereby granted, free of charge, to any person obtaining a copy
 - * of this software and associated documentation files (the "Software"), to deal
 - * in the Software without restriction, including without limitation the rights
 - * to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
 - * copies of the Software, and to permit persons to whom the Software is
 - * furnished to do so, subject to the following conditions:
 - *
 - * The above copyright notice and this permission notice shall be included in
 - * all copies or substantial portions of the Software.
 - *
 - * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
 - * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
 - * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL
 - * THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
 - * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
 - * OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN
 - * THE SOFTWARE.
 - */
 -
 -typedef struct TCGLabelPoolData {
 -    struct TCGLabelPoolData *next;
 -    tcg_insn_unit *label;
 -    intptr_t addend;
 -    int rtype;
 -    unsigned nlong;
 -    tcg_target_ulong data[];
 -} TCGLabelPoolData;
 -
 -
 -static TCGLabelPoolData *new_pool_alloc(TCGContext *s, int nlong, int rtype,
 -                                        tcg_insn_unit *label, intptr_t addend)
 -{
 -    TCGLabelPoolData *n = tcg_malloc(sizeof(TCGLabelPoolData)
 -                                     + sizeof(tcg_target_ulong) * nlong);
 -
 -    n->label = label;
 -    n->addend = addend;
 -    n->rtype = rtype;
 -    n->nlong = nlong;
 -    return n;
 -}
 -
 -static void new_pool_insert(TCGContext *s, TCGLabelPoolData *n)
 -{
 -    TCGLabelPoolData *i, **pp;
 -    int nlong = n->nlong;
 -
 -    /* Insertion sort on the pool.  */
 -    for (pp = &s->pool_labels; (i = *pp) != NULL; pp = &i->next) {
 -        if (nlong > i->nlong) {
 -            break;
 -        }
 -        if (nlong < i->nlong) {
 -            continue;
 -        }
 -        if (memcmp(n->data, i->data, sizeof(tcg_target_ulong) * nlong) >= 0) {
 -            break;
 -        }
 -    }
 -    n->next = *pp;
 -    *pp = n;
 -}
 -
 -/* The "usual" for generic integer code.  */
 -static inline void new_pool_label(TCGContext *s, tcg_target_ulong d, int rtype,
 -                                  tcg_insn_unit *label, intptr_t addend)
 -{
 -    TCGLabelPoolData *n = new_pool_alloc(s, 1, rtype, label, addend);
 -    n->data[0] = d;
 -    new_pool_insert(s, n);
 -}
 -
 -/* For v64 or v128, depending on the host.  */
 -static inline void new_pool_l2(TCGContext *s, int rtype, tcg_insn_unit *label,
 -                               intptr_t addend, tcg_target_ulong d0,
 -                               tcg_target_ulong d1)
 -{
 -    TCGLabelPoolData *n = new_pool_alloc(s, 2, rtype, label, addend);
 -    n->data[0] = d0;
 -    n->data[1] = d1;
 -    new_pool_insert(s, n);
 -}
 -
 -/* For v128 or v256, depending on the host.  */
 -static inline void new_pool_l4(TCGContext *s, int rtype, tcg_insn_unit *label,
 -                               intptr_t addend, tcg_target_ulong d0,
 -                               tcg_target_ulong d1, tcg_target_ulong d2,
 -                               tcg_target_ulong d3)
 -{
 -    TCGLabelPoolData *n = new_pool_alloc(s, 4, rtype, label, addend);
 -    n->data[0] = d0;
 -    n->data[1] = d1;
 -    n->data[2] = d2;
 -    n->data[3] = d3;
 -    new_pool_insert(s, n);
 -}
 -
 -/* For v256, for 32-bit host.  */
 -static inline void new_pool_l8(TCGContext *s, int rtype, tcg_insn_unit *label,
 -                               intptr_t addend, tcg_target_ulong d0,
 -                               tcg_target_ulong d1, tcg_target_ulong d2,
 -                               tcg_target_ulong d3, tcg_target_ulong d4,
 -                               tcg_target_ulong d5, tcg_target_ulong d6,
 -                               tcg_target_ulong d7)
 -{
 -    TCGLabelPoolData *n = new_pool_alloc(s, 8, rtype, label, addend);
 -    n->data[0] = d0;
 -    n->data[1] = d1;
 -    n->data[2] = d2;
 -    n->data[3] = d3;
 -    n->data[4] = d4;
 -    n->data[5] = d5;
 -    n->data[6] = d6;
 -    n->data[7] = d7;
 -    new_pool_insert(s, n);
 -}
 -
 -/* To be provided by cpu/tcg-target.c.inc.  */
 -static void tcg_out_nop_fill(tcg_insn_unit *p, int count);
 -
 -static int tcg_out_pool_finalize(TCGContext *s)
 -{
 -    TCGLabelPoolData *p = s->pool_labels;
 -    TCGLabelPoolData *l = NULL;
 -    void *a;
 -
 -    if (p == NULL) {
 -        return 0;
 -    }
 -
 -    /* ??? Round up to qemu_icache_linesize, but then do not round
 -       again when allocating the next TranslationBlock structure.  */
 -    a = (void *)ROUND_UP((uintptr_t)s->code_ptr,
 -                         sizeof(tcg_target_ulong) * p->nlong);
 -    tcg_out_nop_fill(s->code_ptr, (tcg_insn_unit *)a - s->code_ptr);
 -    s->data_gen_ptr = a;
 -
 -    for (; p != NULL; p = p->next) {
 -        size_t size = sizeof(tcg_target_ulong) * p->nlong;
 -        uintptr_t value;
 -
 -        if (!l || l->nlong != p->nlong || memcmp(l->data, p->data, size)) {
 -            if (unlikely(a > s->code_gen_highwater)) {
 -                return -1;
 -            }
 -            memcpy(a, p->data, size);
 -            a += size;
 -            l = p;
 -        }
 -
 -        value = (uintptr_t)tcg_splitwx_to_rx(a) - size;
 -        if (!patch_reloc(p->label, p->rtype, value, p->addend)) {
 -            return -2;
 -        }
 -    }
 -
 -    s->code_ptr = a;
 -    return 0;
 -}
 diff --git a/tcg/tci/tcg-target.c.inc b/tcg/tci/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tci/tcg-target.c.inc
 +++ b/tcg/tci/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@
   * THE SOFTWARE.
   */
 -#include "../tcg-pool.c.inc"
 -
  /* Used for function call generation. */
  #define TCG_TARGET_CALL_STACK_OFFSET    0
  #define TCG_TARGET_STACK_ALIGN          8
@@ -XXX,XX +XXX,XX @@ bool tcg_target_has_memory_bswap(MemOp memop)
  {
      return true;
  }
 +
 +static bool tcg_out_qemu_ld_slow_path(TCGContext *s, TCGLabelQemuLdst *l)
 +{
 +    g_assert_not_reached();
 +}
 +
 +static bool tcg_out_qemu_st_slow_path(TCGContext *s, TCGLabelQemuLdst *l)
 +{
 +    g_assert_not_reached();
 +}
 --
-.34.1
+.43.0

-[PULL 23/40] tests/tcg/s390x: Add div.c
+[PULL 16/68] tcg: Rename tcg-target.opc.h to tcg-target-opc.h.inc
-From: Ilya Leoshkevich <iii@linux.ibm.com>
+In addition, add empty files for mips, sparc64 and tci.
 Make the include unconditional within tcg-opc.h.
-Add a basic test to prevent regressions.
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Signed-off-by: Ilya Leoshkevich <iii@linux.ibm.com>
 Message-Id: <20221101111300.2539919-1-iii@linux.ibm.com>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 ---
- tests/tcg/s390x/div.c           | 40 +++++++++++++++++++++++++++++++++
+ include/tcg/tcg-opc.h                                      | 4 +---
- tests/tcg/s390x/Makefile.target |  1 +
+ tcg/aarch64/{tcg-target.opc.h => tcg-target-opc.h.inc}     | 0
-files changed, 41 insertions(+)
+ tcg/arm/{tcg-target.opc.h => tcg-target-opc.h.inc}         | 0
- create mode 100644 tests/tcg/s390x/div.c
+ tcg/i386/{tcg-target.opc.h => tcg-target-opc.h.inc}        | 0
  tcg/loongarch64/{tcg-target.opc.h => tcg-target-opc.h.inc} | 0
  tcg/mips/tcg-target-opc.h.inc                              | 1 +
  tcg/ppc/{tcg-target.opc.h => tcg-target-opc.h.inc}         | 0
  tcg/riscv/{tcg-target.opc.h => tcg-target-opc.h.inc}       | 0
  tcg/s390x/{tcg-target.opc.h => tcg-target-opc.h.inc}       | 0
  tcg/sparc64/tcg-target-opc.h.inc                           | 1 +
  tcg/tci/tcg-target-opc.h.inc                               | 1 +
 files changed, 4 insertions(+), 3 deletions(-)
  rename tcg/aarch64/{tcg-target.opc.h => tcg-target-opc.h.inc} (100%)
  rename tcg/arm/{tcg-target.opc.h => tcg-target-opc.h.inc} (100%)
  rename tcg/i386/{tcg-target.opc.h => tcg-target-opc.h.inc} (100%)
  rename tcg/loongarch64/{tcg-target.opc.h => tcg-target-opc.h.inc} (100%)
  create mode 100644 tcg/mips/tcg-target-opc.h.inc
  rename tcg/ppc/{tcg-target.opc.h => tcg-target-opc.h.inc} (100%)
  rename tcg/riscv/{tcg-target.opc.h => tcg-target-opc.h.inc} (100%)
  rename tcg/s390x/{tcg-target.opc.h => tcg-target-opc.h.inc} (100%)
  create mode 100644 tcg/sparc64/tcg-target-opc.h.inc
  create mode 100644 tcg/tci/tcg-target-opc.h.inc
-diff --git a/tests/tcg/s390x/div.c b/tests/tcg/s390x/div.c
+diff --git a/include/tcg/tcg-opc.h b/include/tcg/tcg-opc.h
 index XXXXXXX..XXXXXXX 100644
 --- a/include/tcg/tcg-opc.h
 +++ b/include/tcg/tcg-opc.h
@@ -XXX,XX +XXX,XX @@ DEF(cmpsel_vec, 1, 4, 1, IMPLVEC | IMPL(TCG_TARGET_HAS_cmpsel_vec))
  DEF(last_generic, 0, 0, 0, TCG_OPF_NOT_PRESENT)
 -#if TCG_TARGET_MAYBE_vec
 -#include "tcg-target.opc.h"
 -#endif
 +#include "tcg-target-opc.h.inc"
  #ifdef TCG_TARGET_INTERPRETER
  /* These opcodes are only for use between the tci generator and interpreter. */
 diff --git a/tcg/aarch64/tcg-target.opc.h b/tcg/aarch64/tcg-target-opc.h.inc
 similarity index 100%
 rename from tcg/aarch64/tcg-target.opc.h
 rename to tcg/aarch64/tcg-target-opc.h.inc
 diff --git a/tcg/arm/tcg-target.opc.h b/tcg/arm/tcg-target-opc.h.inc
 similarity index 100%
 rename from tcg/arm/tcg-target.opc.h
 rename to tcg/arm/tcg-target-opc.h.inc
 diff --git a/tcg/i386/tcg-target.opc.h b/tcg/i386/tcg-target-opc.h.inc
 similarity index 100%
 rename from tcg/i386/tcg-target.opc.h
 rename to tcg/i386/tcg-target-opc.h.inc
 diff --git a/tcg/loongarch64/tcg-target.opc.h b/tcg/loongarch64/tcg-target-opc.h.inc
 similarity index 100%
 rename from tcg/loongarch64/tcg-target.opc.h
 rename to tcg/loongarch64/tcg-target-opc.h.inc
 diff --git a/tcg/mips/tcg-target-opc.h.inc b/tcg/mips/tcg-target-opc.h.inc
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
-+++ b/tests/tcg/s390x/div.c
++++ b/tcg/mips/tcg-target-opc.h.inc
-@@ -XXX,XX +XXX,XX @@
+@@ -0,0 +1 @@
-+#include <assert.h>
++/* No target specific opcodes. */
-+#include <stdint.h>
+diff --git a/tcg/ppc/tcg-target.opc.h b/tcg/ppc/tcg-target-opc.h.inc
-+
+similarity index 100%
-+static void test_dr(void)
+rename from tcg/ppc/tcg-target.opc.h
-+{
+rename to tcg/ppc/tcg-target-opc.h.inc
-+    register int32_t r0 asm("r0") = -1;
+diff --git a/tcg/riscv/tcg-target.opc.h b/tcg/riscv/tcg-target-opc.h.inc
-+    register int32_t r1 asm("r1") = -4241;
+similarity index 100%
-+    int32_t b = 101, q, r;
+rename from tcg/riscv/tcg-target.opc.h
-+
+rename to tcg/riscv/tcg-target-opc.h.inc
-+    asm("dr %[r0],%[b]"
+diff --git a/tcg/s390x/tcg-target.opc.h b/tcg/s390x/tcg-target-opc.h.inc
-+        : [r0] "+r" (r0), [r1] "+r" (r1)
+similarity index 100%
-+        : [b] "r" (b)
+rename from tcg/s390x/tcg-target.opc.h
-+        : "cc");
+rename to tcg/s390x/tcg-target-opc.h.inc
-+    q = r1;
+diff --git a/tcg/sparc64/tcg-target-opc.h.inc b/tcg/sparc64/tcg-target-opc.h.inc
-+    r = r0;
+new file mode 100644
-+    assert(q == -41);
+index XXXXXXX..XXXXXXX
-+    assert(r == -100);
+--- /dev/null
-+}
++++ b/tcg/sparc64/tcg-target-opc.h.inc
-+
+@@ -0,0 +1 @@
-+static void test_dlr(void)
++/* No target specific opcodes. */
-+{
+diff --git a/tcg/tci/tcg-target-opc.h.inc b/tcg/tci/tcg-target-opc.h.inc
-+    register uint32_t r0 asm("r0") = 0;
+new file mode 100644
-+    register uint32_t r1 asm("r1") = 4243;
+index XXXXXXX..XXXXXXX
-+    uint32_t b = 101, q, r;
+--- /dev/null
-+
++++ b/tcg/tci/tcg-target-opc.h.inc
-+    asm("dlr %[r0],%[b]"
+@@ -0,0 +1 @@
-+        : [r0] "+r" (r0), [r1] "+r" (r1)
++/* No target specific opcodes. */
 +        : [b] "r" (b)
 +        : "cc");
 +    q = r1;
 +    r = r0;
 +    assert(q == 42);
 +    assert(r == 1);
 +}
 +
 +int main(void)
 +{
 +    test_dr();
 +    test_dlr();
 +}
 diff --git a/tests/tcg/s390x/Makefile.target b/tests/tcg/s390x/Makefile.target
 index XXXXXXX..XXXXXXX 100644
 --- a/tests/tcg/s390x/Makefile.target
 +++ b/tests/tcg/s390x/Makefile.target
@@ -XXX,XX +XXX,XX @@ TESTS+=trap
  TESTS+=signals-s390x
  TESTS+=branch-relative-long
  TESTS+=noexec
 +TESTS+=div
  Z13_TESTS=vistr
  $(Z13_TESTS): CFLAGS+=-march=z13 -O2
 --
-.34.1
+.43.0

-New patch
+[PULL 17/68] tcg/tci: Move TCI specific opcodes to tcg-target-opc.h.inc
+Now that tcg-target-opc.h.inc is unconditional,
+we can move these out of the generic header.
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+---
+ include/tcg/tcg-opc.h        | 6 ------
+ tcg/tci/tcg-target-opc.h.inc | 5 ++++-
+files changed, 4 insertions(+), 7 deletions(-)
+diff --git a/include/tcg/tcg-opc.h b/include/tcg/tcg-opc.h
+index XXXXXXX..XXXXXXX 100644
+--- a/include/tcg/tcg-opc.h
++++ b/include/tcg/tcg-opc.h
+@@ -XXX,XX +XXX,XX @@ DEF(last_generic, 0, 0, 0, TCG_OPF_NOT_PRESENT)
+ #include "tcg-target-opc.h.inc"
+-#ifdef TCG_TARGET_INTERPRETER
+-/* These opcodes are only for use between the tci generator and interpreter. */
+-DEF(tci_movi, 1, 0, 1, TCG_OPF_NOT_PRESENT)
+-DEF(tci_movl, 1, 0, 1, TCG_OPF_NOT_PRESENT)
+-#endif
+-
+ #undef DATA64_ARGS
+ #undef IMPL
+ #undef IMPL64
+diff --git a/tcg/tci/tcg-target-opc.h.inc b/tcg/tci/tcg-target-opc.h.inc
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/tci/tcg-target-opc.h.inc
++++ b/tcg/tci/tcg-target-opc.h.inc
+@@ -1 +1,4 @@
+-/* No target specific opcodes. */
++/* SPDX-License-Identifier: MIT */
++/* These opcodes for use between the tci generator and interpreter. */
++DEF(tci_movi, 1, 0, 1, TCG_OPF_NOT_PRESENT)
++DEF(tci_movl, 1, 0, 1, TCG_OPF_NOT_PRESENT)
+--
+.43.0

-[PULL 15/40] tcg: Add temp allocation for TCGv_i128
+[PULL 18/68] tcg: Move fallback tcg_can_emit_vec_op out of line
-This enables allocation of i128.  The type is not yet
+Don't reference TCG_TARGET_MAYBE_vec in a public header.
 usable, as we have not yet added data movement ops.
-Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
 Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 ---
- include/tcg/tcg.h | 32 +++++++++++++++++++++++++
+ include/tcg/tcg.h | 7 -------
- tcg/tcg.c         | 60 +++++++++++++++++++++++++++++++++--------------
+ tcg/tcg.c         | 4 ++++
-files changed, 74 insertions(+), 18 deletions(-)
+files changed, 4 insertions(+), 7 deletions(-)
 diff --git a/include/tcg/tcg.h b/include/tcg/tcg.h
 index XXXXXXX..XXXXXXX 100644
 --- a/include/tcg/tcg.h
 +++ b/include/tcg/tcg.h
-@@ -XXX,XX +XXX,XX @@ static inline TCGTemp *tcgv_i64_temp(TCGv_i64 v)
+@@ -XXX,XX +XXX,XX @@ extern tcg_prologue_fn *tcg_qemu_tb_exec;
-     return tcgv_i32_temp((TCGv_i32)v);
- }
+ void tcg_register_jit(const void *buf, size_t buf_size);
-+static inline TCGTemp *tcgv_i128_temp(TCGv_i128 v)
+-#if TCG_TARGET_MAYBE_vec
-+{
+ /* Return zero if the tuple (opc, type, vece) is unsupportable;
-+    return tcgv_i32_temp((TCGv_i32)v);
+    return > 0 if it is directly supportable;
-+}
+    return < 0 if we must call tcg_expand_vec_op.  */
-+
+ int tcg_can_emit_vec_op(TCGOpcode, TCGType, unsigned);
- static inline TCGTemp *tcgv_ptr_temp(TCGv_ptr v)
+-#else
- {
+-static inline int tcg_can_emit_vec_op(TCGOpcode o, TCGType t, unsigned ve)
-     return tcgv_i32_temp((TCGv_i32)v);
+-{
-@@ -XXX,XX +XXX,XX @@ static inline TCGArg tcgv_i64_arg(TCGv_i64 v)
+-    return 0;
-     return temp_arg(tcgv_i64_temp(v));
+-}
- }
+-#endif
-+static inline TCGArg tcgv_i128_arg(TCGv_i128 v)
+ /* Expand the tuple (opc, type, vece) on the given arguments.  */
-+{
+ void tcg_expand_vec_op(TCGOpcode, TCGType, unsigned, TCGArg, ...);
 +    return temp_arg(tcgv_i128_temp(v));
 +}
 +
  static inline TCGArg tcgv_ptr_arg(TCGv_ptr v)
  {
      return temp_arg(tcgv_ptr_temp(v));
@@ -XXX,XX +XXX,XX @@ static inline TCGv_i64 temp_tcgv_i64(TCGTemp *t)
      return (TCGv_i64)temp_tcgv_i32(t);
  }
 +static inline TCGv_i128 temp_tcgv_i128(TCGTemp *t)
 +{
 +    return (TCGv_i128)temp_tcgv_i32(t);
 +}
 +
  static inline TCGv_ptr temp_tcgv_ptr(TCGTemp *t)
  {
      return (TCGv_ptr)temp_tcgv_i32(t);
@@ -XXX,XX +XXX,XX @@ static inline void tcg_temp_free_i64(TCGv_i64 arg)
      tcg_temp_free_internal(tcgv_i64_temp(arg));
  }
 +static inline void tcg_temp_free_i128(TCGv_i128 arg)
 +{
 +    tcg_temp_free_internal(tcgv_i128_temp(arg));
 +}
 +
  static inline void tcg_temp_free_ptr(TCGv_ptr arg)
  {
      tcg_temp_free_internal(tcgv_ptr_temp(arg));
@@ -XXX,XX +XXX,XX @@ static inline TCGv_i64 tcg_temp_local_new_i64(void)
      return temp_tcgv_i64(t);
  }
 +static inline TCGv_i128 tcg_temp_new_i128(void)
 +{
 +    TCGTemp *t = tcg_temp_new_internal(TCG_TYPE_I128, false);
 +    return temp_tcgv_i128(t);
 +}
 +
 +static inline TCGv_i128 tcg_temp_local_new_i128(void)
 +{
 +    TCGTemp *t = tcg_temp_new_internal(TCG_TYPE_I128, true);
 +    return temp_tcgv_i128(t);
 +}
 +
  static inline TCGv_ptr tcg_global_mem_new_ptr(TCGv_ptr reg, intptr_t offset,
                                                const char *name)
  {
 diff --git a/tcg/tcg.c b/tcg/tcg.c
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tcg.c
 +++ b/tcg/tcg.c
-@@ -XXX,XX +XXX,XX @@ TCGTemp *tcg_temp_new_internal(TCGType type, bool temp_local)
+@@ -XXX,XX +XXX,XX @@ static inline void tcg_out_vec_op(TCGContext *s, TCGOpcode opc,
-         tcg_debug_assert(ts->base_type == type);
+ {
-         tcg_debug_assert(ts->kind == kind);
+     g_assert_not_reached();
-     } else {
+ }
-+        int i, n;
++int tcg_can_emit_vec_op(TCGOpcode o, TCGType t, unsigned ve)
-+
++{
-+        switch (type) {
++    return 0;
-+        case TCG_TYPE_I32:
++}
-+        case TCG_TYPE_V64:
+ #endif
-+        case TCG_TYPE_V128:
+ static void tcg_out_st(TCGContext *s, TCGType type, TCGReg arg, TCGReg arg1,
-+        case TCG_TYPE_V256:
+                        intptr_t arg2);
 +            n = 1;
 +            break;
 +        case TCG_TYPE_I64:
 +            n = 64 / TCG_TARGET_REG_BITS;
 +            break;
 +        case TCG_TYPE_I128:
 +            n = 128 / TCG_TARGET_REG_BITS;
 +            break;
 +        default:
 +            g_assert_not_reached();
 +        }
 +
          ts = tcg_temp_alloc(s);
 -        if (TCG_TARGET_REG_BITS == 32 && type == TCG_TYPE_I64) {
 -            TCGTemp *ts2 = tcg_temp_alloc(s);
 +        ts->base_type = type;
 +        ts->temp_allocated = 1;
 +        ts->kind = kind;
 -            ts->base_type = type;
 -            ts->type = TCG_TYPE_I32;
 -            ts->temp_allocated = 1;
 -            ts->kind = kind;
 -
 -            tcg_debug_assert(ts2 == ts + 1);
 -            ts2->base_type = TCG_TYPE_I64;
 -            ts2->type = TCG_TYPE_I32;
 -            ts2->temp_allocated = 1;
 -            ts2->temp_subindex = 1;
 -            ts2->kind = kind;
 -        } else {
 -            ts->base_type = type;
 +        if (n == 1) {
              ts->type = type;
 -            ts->temp_allocated = 1;
 -            ts->kind = kind;
 +        } else {
 +            ts->type = TCG_TYPE_REG;
 +
 +            for (i = 1; i < n; ++i) {
 +                TCGTemp *ts2 = tcg_temp_alloc(s);
 +
 +                tcg_debug_assert(ts2 == ts + i);
 +                ts2->base_type = type;
 +                ts2->type = TCG_TYPE_REG;
 +                ts2->temp_allocated = 1;
 +                ts2->temp_subindex = i;
 +                ts2->kind = kind;
 +            }
          }
      }
@@ -XXX,XX +XXX,XX @@ static void temp_allocate_frame(TCGContext *s, TCGTemp *ts)
      case TCG_TYPE_V64:
          align = 8;
          break;
 +    case TCG_TYPE_I128:
      case TCG_TYPE_V128:
      case TCG_TYPE_V256:
 -        /* Note that we do not require aligned storage for V256. */
 +        /*
 +         * Note that we do not require aligned storage for V256,
 +         * and that we provide alignment for I128 to match V128,
 +         * even if that's above what the host ABI requires.
 +         */
          align = 16;
          break;
      default:
 --
-.34.1
+.43.0

-New patch
+[PULL 19/68] tcg/ppc: Remove TCGPowerISA enum
+Left-over from commit 623d7e3551a ("util: Add cpuinfo-ppc.c").
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Signed-off-by: Philippe Mathieu-Daudé <philmd@linaro.org>
+Message-ID: <20250108215156.8731-2-philmd@linaro.org>
+---
+ tcg/ppc/tcg-target.h | 8 --------
+file changed, 8 deletions(-)
+diff --git a/tcg/ppc/tcg-target.h b/tcg/ppc/tcg-target.h
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/ppc/tcg-target.h
++++ b/tcg/ppc/tcg-target.h
+@@ -XXX,XX +XXX,XX @@ typedef enum {
+     TCG_AREG0 = TCG_REG_R27
+ } TCGReg;
+-typedef enum {
+-    tcg_isa_base,
+-    tcg_isa_2_06,
+-    tcg_isa_2_07,
+-    tcg_isa_3_00,
+-    tcg_isa_3_10,
+-} TCGPowerISA;
+-
+ #define have_isa_2_06  (cpuinfo & CPUINFO_V2_06)
+ #define have_isa_2_07  (cpuinfo & CPUINFO_V2_07)
+ #define have_isa_3_00  (cpuinfo & CPUINFO_V3_0)
+--
+.43.0

-New patch
+[PULL 20/68] tcg: Extract default TCG_TARGET_HAS_foo definitions to 'tcg-has.h'
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Signed-off-by: Philippe Mathieu-Daudé <philmd@linaro.org>
+Message-ID: <20250108215156.8731-3-philmd@linaro.org>
+---
+ include/tcg/tcg.h | 105 +-----------------------------------------
+ tcg/tcg-has.h     | 115 ++++++++++++++++++++++++++++++++++++++++++++++
+files changed, 116 insertions(+), 104 deletions(-)
+ create mode 100644 tcg/tcg-has.h
+diff --git a/include/tcg/tcg.h b/include/tcg/tcg.h
+index XXXXXXX..XXXXXXX 100644
+--- a/include/tcg/tcg.h
++++ b/include/tcg/tcg.h
+@@ -XXX,XX +XXX,XX @@ typedef uint64_t TCGRegSet;
+ #error unsupported
+ #endif
+-#if TCG_TARGET_REG_BITS == 32
+-/* Turn some undef macros into false macros.  */
+-#define TCG_TARGET_HAS_extr_i64_i32     0
+-#define TCG_TARGET_HAS_div_i64          0
+-#define TCG_TARGET_HAS_rem_i64          0
+-#define TCG_TARGET_HAS_div2_i64         0
+-#define TCG_TARGET_HAS_rot_i64          0
+-#define TCG_TARGET_HAS_ext8s_i64        0
+-#define TCG_TARGET_HAS_ext16s_i64       0
+-#define TCG_TARGET_HAS_ext32s_i64       0
+-#define TCG_TARGET_HAS_ext8u_i64        0
+-#define TCG_TARGET_HAS_ext16u_i64       0
+-#define TCG_TARGET_HAS_ext32u_i64       0
+-#define TCG_TARGET_HAS_bswap16_i64      0
+-#define TCG_TARGET_HAS_bswap32_i64      0
+-#define TCG_TARGET_HAS_bswap64_i64      0
+-#define TCG_TARGET_HAS_not_i64          0
+-#define TCG_TARGET_HAS_andc_i64         0
+-#define TCG_TARGET_HAS_orc_i64          0
+-#define TCG_TARGET_HAS_eqv_i64          0
+-#define TCG_TARGET_HAS_nand_i64         0
+-#define TCG_TARGET_HAS_nor_i64          0
+-#define TCG_TARGET_HAS_clz_i64          0
+-#define TCG_TARGET_HAS_ctz_i64          0
+-#define TCG_TARGET_HAS_ctpop_i64        0
+-#define TCG_TARGET_HAS_deposit_i64      0
+-#define TCG_TARGET_HAS_extract_i64      0
+-#define TCG_TARGET_HAS_sextract_i64     0
+-#define TCG_TARGET_HAS_extract2_i64     0
+-#define TCG_TARGET_HAS_negsetcond_i64   0
+-#define TCG_TARGET_HAS_add2_i64         0
+-#define TCG_TARGET_HAS_sub2_i64         0
+-#define TCG_TARGET_HAS_mulu2_i64        0
+-#define TCG_TARGET_HAS_muls2_i64        0
+-#define TCG_TARGET_HAS_muluh_i64        0
+-#define TCG_TARGET_HAS_mulsh_i64        0
+-/* Turn some undef macros into true macros.  */
+-#define TCG_TARGET_HAS_add2_i32         1
+-#define TCG_TARGET_HAS_sub2_i32         1
+-#endif
+-
+-#ifndef TCG_TARGET_deposit_i32_valid
+-#define TCG_TARGET_deposit_i32_valid(ofs, len) 1
+-#endif
+-#ifndef TCG_TARGET_deposit_i64_valid
+-#define TCG_TARGET_deposit_i64_valid(ofs, len) 1
+-#endif
+-#ifndef TCG_TARGET_extract_i32_valid
+-#define TCG_TARGET_extract_i32_valid(ofs, len) 1
+-#endif
+-#ifndef TCG_TARGET_extract_i64_valid
+-#define TCG_TARGET_extract_i64_valid(ofs, len) 1
+-#endif
+-
+-/* Only one of DIV or DIV2 should be defined.  */
+-#if defined(TCG_TARGET_HAS_div_i32)
+-#define TCG_TARGET_HAS_div2_i32         0
+-#elif defined(TCG_TARGET_HAS_div2_i32)
+-#define TCG_TARGET_HAS_div_i32          0
+-#define TCG_TARGET_HAS_rem_i32          0
+-#endif
+-#if defined(TCG_TARGET_HAS_div_i64)
+-#define TCG_TARGET_HAS_div2_i64         0
+-#elif defined(TCG_TARGET_HAS_div2_i64)
+-#define TCG_TARGET_HAS_div_i64          0
+-#define TCG_TARGET_HAS_rem_i64          0
+-#endif
+-
+-#if !defined(TCG_TARGET_HAS_v64) \
+-    && !defined(TCG_TARGET_HAS_v128) \
+-    && !defined(TCG_TARGET_HAS_v256)
+-#define TCG_TARGET_MAYBE_vec            0
+-#define TCG_TARGET_HAS_abs_vec          0
+-#define TCG_TARGET_HAS_neg_vec          0
+-#define TCG_TARGET_HAS_not_vec          0
+-#define TCG_TARGET_HAS_andc_vec         0
+-#define TCG_TARGET_HAS_orc_vec          0
+-#define TCG_TARGET_HAS_nand_vec         0
+-#define TCG_TARGET_HAS_nor_vec          0
+-#define TCG_TARGET_HAS_eqv_vec          0
+-#define TCG_TARGET_HAS_roti_vec         0
+-#define TCG_TARGET_HAS_rots_vec         0
+-#define TCG_TARGET_HAS_rotv_vec         0
+-#define TCG_TARGET_HAS_shi_vec          0
+-#define TCG_TARGET_HAS_shs_vec          0
+-#define TCG_TARGET_HAS_shv_vec          0
+-#define TCG_TARGET_HAS_mul_vec          0
+-#define TCG_TARGET_HAS_sat_vec          0
+-#define TCG_TARGET_HAS_minmax_vec       0
+-#define TCG_TARGET_HAS_bitsel_vec       0
+-#define TCG_TARGET_HAS_cmpsel_vec       0
+-#define TCG_TARGET_HAS_tst_vec          0
+-#else
+-#define TCG_TARGET_MAYBE_vec            1
+-#endif
+-#ifndef TCG_TARGET_HAS_v64
+-#define TCG_TARGET_HAS_v64              0
+-#endif
+-#ifndef TCG_TARGET_HAS_v128
+-#define TCG_TARGET_HAS_v128             0
+-#endif
+-#ifndef TCG_TARGET_HAS_v256
+-#define TCG_TARGET_HAS_v256             0
+-#endif
++#include "tcg/tcg-has.h"
+ typedef enum TCGOpcode {
+ #define DEF(name, oargs, iargs, cargs, flags) INDEX_op_ ## name,
+diff --git a/tcg/tcg-has.h b/tcg/tcg-has.h
+new file mode 100644
+index XXXXXXX..XXXXXXX
+--- /dev/null
++++ b/tcg/tcg-has.h
+@@ -XXX,XX +XXX,XX @@
++/* SPDX-License-Identifier: MIT */
++/*
++ * Define target-specific opcode support
++ * Copyright (c) 2024 Linaro, Ltd.
++ */
++
++#ifndef TCG_HAS_H
++#define TCG_HAS_H
++
++#if TCG_TARGET_REG_BITS == 32
++/* Turn some undef macros into false macros.  */
++#define TCG_TARGET_HAS_extr_i64_i32     0
++#define TCG_TARGET_HAS_div_i64          0
++#define TCG_TARGET_HAS_rem_i64          0
++#define TCG_TARGET_HAS_div2_i64         0
++#define TCG_TARGET_HAS_rot_i64          0
++#define TCG_TARGET_HAS_ext8s_i64        0
++#define TCG_TARGET_HAS_ext16s_i64       0
++#define TCG_TARGET_HAS_ext32s_i64       0
++#define TCG_TARGET_HAS_ext8u_i64        0
++#define TCG_TARGET_HAS_ext16u_i64       0
++#define TCG_TARGET_HAS_ext32u_i64       0
++#define TCG_TARGET_HAS_bswap16_i64      0
++#define TCG_TARGET_HAS_bswap32_i64      0
++#define TCG_TARGET_HAS_bswap64_i64      0
++#define TCG_TARGET_HAS_not_i64          0
++#define TCG_TARGET_HAS_andc_i64         0
++#define TCG_TARGET_HAS_orc_i64          0
++#define TCG_TARGET_HAS_eqv_i64          0
++#define TCG_TARGET_HAS_nand_i64         0
++#define TCG_TARGET_HAS_nor_i64          0
++#define TCG_TARGET_HAS_clz_i64          0
++#define TCG_TARGET_HAS_ctz_i64          0
++#define TCG_TARGET_HAS_ctpop_i64        0
++#define TCG_TARGET_HAS_deposit_i64      0
++#define TCG_TARGET_HAS_extract_i64      0
++#define TCG_TARGET_HAS_sextract_i64     0
++#define TCG_TARGET_HAS_extract2_i64     0
++#define TCG_TARGET_HAS_negsetcond_i64   0
++#define TCG_TARGET_HAS_add2_i64         0
++#define TCG_TARGET_HAS_sub2_i64         0
++#define TCG_TARGET_HAS_mulu2_i64        0
++#define TCG_TARGET_HAS_muls2_i64        0
++#define TCG_TARGET_HAS_muluh_i64        0
++#define TCG_TARGET_HAS_mulsh_i64        0
++/* Turn some undef macros into true macros.  */
++#define TCG_TARGET_HAS_add2_i32         1
++#define TCG_TARGET_HAS_sub2_i32         1
++#endif
++
++#ifndef TCG_TARGET_deposit_i32_valid
++#define TCG_TARGET_deposit_i32_valid(ofs, len) 1
++#endif
++#ifndef TCG_TARGET_deposit_i64_valid
++#define TCG_TARGET_deposit_i64_valid(ofs, len) 1
++#endif
++#ifndef TCG_TARGET_extract_i32_valid
++#define TCG_TARGET_extract_i32_valid(ofs, len) 1
++#endif
++#ifndef TCG_TARGET_extract_i64_valid
++#define TCG_TARGET_extract_i64_valid(ofs, len) 1
++#endif
++
++/* Only one of DIV or DIV2 should be defined.  */
++#if defined(TCG_TARGET_HAS_div_i32)
++#define TCG_TARGET_HAS_div2_i32         0
++#elif defined(TCG_TARGET_HAS_div2_i32)
++#define TCG_TARGET_HAS_div_i32          0
++#define TCG_TARGET_HAS_rem_i32          0
++#endif
++#if defined(TCG_TARGET_HAS_div_i64)
++#define TCG_TARGET_HAS_div2_i64         0
++#elif defined(TCG_TARGET_HAS_div2_i64)
++#define TCG_TARGET_HAS_div_i64          0
++#define TCG_TARGET_HAS_rem_i64          0
++#endif
++
++#if !defined(TCG_TARGET_HAS_v64) \
++    && !defined(TCG_TARGET_HAS_v128) \
++    && !defined(TCG_TARGET_HAS_v256)
++#define TCG_TARGET_MAYBE_vec            0
++#define TCG_TARGET_HAS_abs_vec          0
++#define TCG_TARGET_HAS_neg_vec          0
++#define TCG_TARGET_HAS_not_vec          0
++#define TCG_TARGET_HAS_andc_vec         0
++#define TCG_TARGET_HAS_orc_vec          0
++#define TCG_TARGET_HAS_nand_vec         0
++#define TCG_TARGET_HAS_nor_vec          0
++#define TCG_TARGET_HAS_eqv_vec          0
++#define TCG_TARGET_HAS_roti_vec         0
++#define TCG_TARGET_HAS_rots_vec         0
++#define TCG_TARGET_HAS_rotv_vec         0
++#define TCG_TARGET_HAS_shi_vec          0
++#define TCG_TARGET_HAS_shs_vec          0
++#define TCG_TARGET_HAS_shv_vec          0
++#define TCG_TARGET_HAS_mul_vec          0
++#define TCG_TARGET_HAS_sat_vec          0
++#define TCG_TARGET_HAS_minmax_vec       0
++#define TCG_TARGET_HAS_bitsel_vec       0
++#define TCG_TARGET_HAS_cmpsel_vec       0
++#define TCG_TARGET_HAS_tst_vec          0
++#else
++#define TCG_TARGET_MAYBE_vec            1
++#endif
++#ifndef TCG_TARGET_HAS_v64
++#define TCG_TARGET_HAS_v64              0
++#endif
++#ifndef TCG_TARGET_HAS_v128
++#define TCG_TARGET_HAS_v128             0
++#endif
++#ifndef TCG_TARGET_HAS_v256
++#define TCG_TARGET_HAS_v256             0
++#endif
++
++#endif
+--
+.43.0

-New patch
+[PULL 21/68] tcg/aarch64: Extract TCG_TARGET_HAS_foo defs to 'tcg-target-has.h'
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Signed-off-by: Philippe Mathieu-Daudé <philmd@linaro.org>
+Message-ID: <20250108215156.8731-4-philmd@linaro.org>
+---
+ tcg/aarch64/tcg-target-has.h | 119 +++++++++++++++++++++++++++++++++++
+ tcg/aarch64/tcg-target.h     | 109 +-------------------------------
+files changed, 120 insertions(+), 108 deletions(-)
+ create mode 100644 tcg/aarch64/tcg-target-has.h
+diff --git a/tcg/aarch64/tcg-target-has.h b/tcg/aarch64/tcg-target-has.h
+new file mode 100644
+index XXXXXXX..XXXXXXX
+--- /dev/null
++++ b/tcg/aarch64/tcg-target-has.h
+@@ -XXX,XX +XXX,XX @@
++/* SPDX-License-Identifier: GPL-2.0-or-later */
++/*
++ * Define target-specific opcode support
++ * Copyright (c) 2013 Huawei Technologies Duesseldorf GmbH
++ */
++
++#ifndef TCG_TARGET_HAS_H
++#define TCG_TARGET_HAS_H
++
++#include "host/cpuinfo.h"
++
++#define have_lse    (cpuinfo & CPUINFO_LSE)
++#define have_lse2   (cpuinfo & CPUINFO_LSE2)
++
++/* optional instructions */
++#define TCG_TARGET_HAS_div_i32          1
++#define TCG_TARGET_HAS_rem_i32          1
++#define TCG_TARGET_HAS_ext8s_i32        1
++#define TCG_TARGET_HAS_ext16s_i32       1
++#define TCG_TARGET_HAS_ext8u_i32        1
++#define TCG_TARGET_HAS_ext16u_i32       1
++#define TCG_TARGET_HAS_bswap16_i32      1
++#define TCG_TARGET_HAS_bswap32_i32      1
++#define TCG_TARGET_HAS_not_i32          1
++#define TCG_TARGET_HAS_rot_i32          1
++#define TCG_TARGET_HAS_andc_i32         1
++#define TCG_TARGET_HAS_orc_i32          1
++#define TCG_TARGET_HAS_eqv_i32          1
++#define TCG_TARGET_HAS_nand_i32         0
++#define TCG_TARGET_HAS_nor_i32          0
++#define TCG_TARGET_HAS_clz_i32          1
++#define TCG_TARGET_HAS_ctz_i32          1
++#define TCG_TARGET_HAS_ctpop_i32        0
++#define TCG_TARGET_HAS_deposit_i32      1
++#define TCG_TARGET_HAS_extract_i32      1
++#define TCG_TARGET_HAS_sextract_i32     1
++#define TCG_TARGET_HAS_extract2_i32     1
++#define TCG_TARGET_HAS_negsetcond_i32   1
++#define TCG_TARGET_HAS_add2_i32         1
++#define TCG_TARGET_HAS_sub2_i32         1
++#define TCG_TARGET_HAS_mulu2_i32        0
++#define TCG_TARGET_HAS_muls2_i32        0
++#define TCG_TARGET_HAS_muluh_i32        0
++#define TCG_TARGET_HAS_mulsh_i32        0
++#define TCG_TARGET_HAS_extr_i64_i32     0
++#define TCG_TARGET_HAS_qemu_st8_i32     0
++
++#define TCG_TARGET_HAS_div_i64          1
++#define TCG_TARGET_HAS_rem_i64          1
++#define TCG_TARGET_HAS_ext8s_i64        1
++#define TCG_TARGET_HAS_ext16s_i64       1
++#define TCG_TARGET_HAS_ext32s_i64       1
++#define TCG_TARGET_HAS_ext8u_i64        1
++#define TCG_TARGET_HAS_ext16u_i64       1
++#define TCG_TARGET_HAS_ext32u_i64       1
++#define TCG_TARGET_HAS_bswap16_i64      1
++#define TCG_TARGET_HAS_bswap32_i64      1
++#define TCG_TARGET_HAS_bswap64_i64      1
++#define TCG_TARGET_HAS_not_i64          1
++#define TCG_TARGET_HAS_rot_i64          1
++#define TCG_TARGET_HAS_andc_i64         1
++#define TCG_TARGET_HAS_orc_i64          1
++#define TCG_TARGET_HAS_eqv_i64          1
++#define TCG_TARGET_HAS_nand_i64         0
++#define TCG_TARGET_HAS_nor_i64          0
++#define TCG_TARGET_HAS_clz_i64          1
++#define TCG_TARGET_HAS_ctz_i64          1
++#define TCG_TARGET_HAS_ctpop_i64        0
++#define TCG_TARGET_HAS_deposit_i64      1
++#define TCG_TARGET_HAS_extract_i64      1
++#define TCG_TARGET_HAS_sextract_i64     1
++#define TCG_TARGET_HAS_extract2_i64     1
++#define TCG_TARGET_HAS_negsetcond_i64   1
++#define TCG_TARGET_HAS_add2_i64         1
++#define TCG_TARGET_HAS_sub2_i64         1
++#define TCG_TARGET_HAS_mulu2_i64        0
++#define TCG_TARGET_HAS_muls2_i64        0
++#define TCG_TARGET_HAS_muluh_i64        1
++#define TCG_TARGET_HAS_mulsh_i64        1
++
++/*
++ * Without FEAT_LSE2, we must use LDXP+STXP to implement atomic 128-bit load,
++ * which requires writable pages.  We must defer to the helper for user-only,
++ * but in system mode all ram is writable for the host.
++ */
++#ifdef CONFIG_USER_ONLY
++#define TCG_TARGET_HAS_qemu_ldst_i128   have_lse2
++#else
++#define TCG_TARGET_HAS_qemu_ldst_i128   1
++#endif
++
++#define TCG_TARGET_HAS_tst              1
++
++#define TCG_TARGET_HAS_v64              1
++#define TCG_TARGET_HAS_v128             1
++#define TCG_TARGET_HAS_v256             0
++
++#define TCG_TARGET_HAS_andc_vec         1
++#define TCG_TARGET_HAS_orc_vec          1
++#define TCG_TARGET_HAS_nand_vec         0
++#define TCG_TARGET_HAS_nor_vec          0
++#define TCG_TARGET_HAS_eqv_vec          0
++#define TCG_TARGET_HAS_not_vec          1
++#define TCG_TARGET_HAS_neg_vec          1
++#define TCG_TARGET_HAS_abs_vec          1
++#define TCG_TARGET_HAS_roti_vec         0
++#define TCG_TARGET_HAS_rots_vec         0
++#define TCG_TARGET_HAS_rotv_vec         0
++#define TCG_TARGET_HAS_shi_vec          1
++#define TCG_TARGET_HAS_shs_vec          0
++#define TCG_TARGET_HAS_shv_vec          1
++#define TCG_TARGET_HAS_mul_vec          1
++#define TCG_TARGET_HAS_sat_vec          1
++#define TCG_TARGET_HAS_minmax_vec       1
++#define TCG_TARGET_HAS_bitsel_vec       1
++#define TCG_TARGET_HAS_cmpsel_vec       0
++#define TCG_TARGET_HAS_tst_vec          1
++
++#endif
+diff --git a/tcg/aarch64/tcg-target.h b/tcg/aarch64/tcg-target.h
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/aarch64/tcg-target.h
++++ b/tcg/aarch64/tcg-target.h
+@@ -XXX,XX +XXX,XX @@
+ #ifndef AARCH64_TCG_TARGET_H
+ #define AARCH64_TCG_TARGET_H
+-#include "host/cpuinfo.h"
+-
+ #define TCG_TARGET_INSN_UNIT_SIZE  4
+ #define MAX_CODE_GEN_BUFFER_SIZE  ((size_t)-1)
+@@ -XXX,XX +XXX,XX @@ typedef enum {
+ #define TCG_TARGET_NB_REGS 64
+-#define have_lse    (cpuinfo & CPUINFO_LSE)
+-#define have_lse2   (cpuinfo & CPUINFO_LSE2)
+-
+-/* optional instructions */
+-#define TCG_TARGET_HAS_div_i32          1
+-#define TCG_TARGET_HAS_rem_i32          1
+-#define TCG_TARGET_HAS_ext8s_i32        1
+-#define TCG_TARGET_HAS_ext16s_i32       1
+-#define TCG_TARGET_HAS_ext8u_i32        1
+-#define TCG_TARGET_HAS_ext16u_i32       1
+-#define TCG_TARGET_HAS_bswap16_i32      1
+-#define TCG_TARGET_HAS_bswap32_i32      1
+-#define TCG_TARGET_HAS_not_i32          1
+-#define TCG_TARGET_HAS_rot_i32          1
+-#define TCG_TARGET_HAS_andc_i32         1
+-#define TCG_TARGET_HAS_orc_i32          1
+-#define TCG_TARGET_HAS_eqv_i32          1
+-#define TCG_TARGET_HAS_nand_i32         0
+-#define TCG_TARGET_HAS_nor_i32          0
+-#define TCG_TARGET_HAS_clz_i32          1
+-#define TCG_TARGET_HAS_ctz_i32          1
+-#define TCG_TARGET_HAS_ctpop_i32        0
+-#define TCG_TARGET_HAS_deposit_i32      1
+-#define TCG_TARGET_HAS_extract_i32      1
+-#define TCG_TARGET_HAS_sextract_i32     1
+-#define TCG_TARGET_HAS_extract2_i32     1
+-#define TCG_TARGET_HAS_negsetcond_i32   1
+-#define TCG_TARGET_HAS_add2_i32         1
+-#define TCG_TARGET_HAS_sub2_i32         1
+-#define TCG_TARGET_HAS_mulu2_i32        0
+-#define TCG_TARGET_HAS_muls2_i32        0
+-#define TCG_TARGET_HAS_muluh_i32        0
+-#define TCG_TARGET_HAS_mulsh_i32        0
+-#define TCG_TARGET_HAS_extr_i64_i32     0
+-#define TCG_TARGET_HAS_qemu_st8_i32     0
+-
+-#define TCG_TARGET_HAS_div_i64          1
+-#define TCG_TARGET_HAS_rem_i64          1
+-#define TCG_TARGET_HAS_ext8s_i64        1
+-#define TCG_TARGET_HAS_ext16s_i64       1
+-#define TCG_TARGET_HAS_ext32s_i64       1
+-#define TCG_TARGET_HAS_ext8u_i64        1
+-#define TCG_TARGET_HAS_ext16u_i64       1
+-#define TCG_TARGET_HAS_ext32u_i64       1
+-#define TCG_TARGET_HAS_bswap16_i64      1
+-#define TCG_TARGET_HAS_bswap32_i64      1
+-#define TCG_TARGET_HAS_bswap64_i64      1
+-#define TCG_TARGET_HAS_not_i64          1
+-#define TCG_TARGET_HAS_rot_i64          1
+-#define TCG_TARGET_HAS_andc_i64         1
+-#define TCG_TARGET_HAS_orc_i64          1
+-#define TCG_TARGET_HAS_eqv_i64          1
+-#define TCG_TARGET_HAS_nand_i64         0
+-#define TCG_TARGET_HAS_nor_i64          0
+-#define TCG_TARGET_HAS_clz_i64          1
+-#define TCG_TARGET_HAS_ctz_i64          1
+-#define TCG_TARGET_HAS_ctpop_i64        0
+-#define TCG_TARGET_HAS_deposit_i64      1
+-#define TCG_TARGET_HAS_extract_i64      1
+-#define TCG_TARGET_HAS_sextract_i64     1
+-#define TCG_TARGET_HAS_extract2_i64     1
+-#define TCG_TARGET_HAS_negsetcond_i64   1
+-#define TCG_TARGET_HAS_add2_i64         1
+-#define TCG_TARGET_HAS_sub2_i64         1
+-#define TCG_TARGET_HAS_mulu2_i64        0
+-#define TCG_TARGET_HAS_muls2_i64        0
+-#define TCG_TARGET_HAS_muluh_i64        1
+-#define TCG_TARGET_HAS_mulsh_i64        1
+-
+-/*
+- * Without FEAT_LSE2, we must use LDXP+STXP to implement atomic 128-bit load,
+- * which requires writable pages.  We must defer to the helper for user-only,
+- * but in system mode all ram is writable for the host.
+- */
+-#ifdef CONFIG_USER_ONLY
+-#define TCG_TARGET_HAS_qemu_ldst_i128   have_lse2
+-#else
+-#define TCG_TARGET_HAS_qemu_ldst_i128   1
+-#endif
+-
+-#define TCG_TARGET_HAS_tst              1
+-
+-#define TCG_TARGET_HAS_v64              1
+-#define TCG_TARGET_HAS_v128             1
+-#define TCG_TARGET_HAS_v256             0
+-
+-#define TCG_TARGET_HAS_andc_vec         1
+-#define TCG_TARGET_HAS_orc_vec          1
+-#define TCG_TARGET_HAS_nand_vec         0
+-#define TCG_TARGET_HAS_nor_vec          0
+-#define TCG_TARGET_HAS_eqv_vec          0
+-#define TCG_TARGET_HAS_not_vec          1
+-#define TCG_TARGET_HAS_neg_vec          1
+-#define TCG_TARGET_HAS_abs_vec          1
+-#define TCG_TARGET_HAS_roti_vec         0
+-#define TCG_TARGET_HAS_rots_vec         0
+-#define TCG_TARGET_HAS_rotv_vec         0
+-#define TCG_TARGET_HAS_shi_vec          1
+-#define TCG_TARGET_HAS_shs_vec          0
+-#define TCG_TARGET_HAS_shv_vec          1
+-#define TCG_TARGET_HAS_mul_vec          1
+-#define TCG_TARGET_HAS_sat_vec          1
+-#define TCG_TARGET_HAS_minmax_vec       1
+-#define TCG_TARGET_HAS_bitsel_vec       1
+-#define TCG_TARGET_HAS_cmpsel_vec       0
+-#define TCG_TARGET_HAS_tst_vec          1
++#include "tcg-target-has.h"
+ #define TCG_TARGET_DEFAULT_MO (0)
+--
+.43.0

-New patch
+[PULL 22/68] tcg/arm: Extract TCG_TARGET_HAS_foo defs to 'tcg-target-has.h'
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Signed-off-by: Philippe Mathieu-Daudé <philmd@linaro.org>
+Message-ID: <20250108215156.8731-5-philmd@linaro.org>
+---
+ tcg/arm/tcg-target-has.h | 85 ++++++++++++++++++++++++++++++++++++++++
+ tcg/arm/tcg-target.h     | 74 +---------------------------------
+files changed, 86 insertions(+), 73 deletions(-)
+ create mode 100644 tcg/arm/tcg-target-has.h
+diff --git a/tcg/arm/tcg-target-has.h b/tcg/arm/tcg-target-has.h
+new file mode 100644
+index XXXXXXX..XXXXXXX
+--- /dev/null
++++ b/tcg/arm/tcg-target-has.h
+@@ -XXX,XX +XXX,XX @@
++/* SPDX-License-Identifier: MIT */
++/*
++ * Define target-specific opcode support
++ * Copyright (c) 2008 Fabrice Bellard
++ * Copyright (c) 2008 Andrzej Zaborowski
++ */
++
++#ifndef TCG_TARGET_HAS_H
++#define TCG_TARGET_HAS_H
++
++extern int arm_arch;
++
++#define use_armv7_instructions  (__ARM_ARCH >= 7 || arm_arch >= 7)
++
++#ifdef __ARM_ARCH_EXT_IDIV__
++#define use_idiv_instructions  1
++#else
++extern bool use_idiv_instructions;
++#endif
++#ifdef __ARM_NEON__
++#define use_neon_instructions  1
++#else
++extern bool use_neon_instructions;
++#endif
++
++/* optional instructions */
++#define TCG_TARGET_HAS_ext8s_i32        1
++#define TCG_TARGET_HAS_ext16s_i32       1
++#define TCG_TARGET_HAS_ext8u_i32        0 /* and r0, r1, #0xff */
++#define TCG_TARGET_HAS_ext16u_i32       1
++#define TCG_TARGET_HAS_bswap16_i32      1
++#define TCG_TARGET_HAS_bswap32_i32      1
++#define TCG_TARGET_HAS_not_i32          1
++#define TCG_TARGET_HAS_rot_i32          1
++#define TCG_TARGET_HAS_andc_i32         1
++#define TCG_TARGET_HAS_orc_i32          0
++#define TCG_TARGET_HAS_eqv_i32          0
++#define TCG_TARGET_HAS_nand_i32         0
++#define TCG_TARGET_HAS_nor_i32          0
++#define TCG_TARGET_HAS_clz_i32          1
++#define TCG_TARGET_HAS_ctz_i32          use_armv7_instructions
++#define TCG_TARGET_HAS_ctpop_i32        0
++#define TCG_TARGET_HAS_deposit_i32      use_armv7_instructions
++#define TCG_TARGET_HAS_extract_i32      use_armv7_instructions
++#define TCG_TARGET_HAS_sextract_i32     use_armv7_instructions
++#define TCG_TARGET_HAS_extract2_i32     1
++#define TCG_TARGET_HAS_negsetcond_i32   1
++#define TCG_TARGET_HAS_mulu2_i32        1
++#define TCG_TARGET_HAS_muls2_i32        1
++#define TCG_TARGET_HAS_muluh_i32        0
++#define TCG_TARGET_HAS_mulsh_i32        0
++#define TCG_TARGET_HAS_div_i32          use_idiv_instructions
++#define TCG_TARGET_HAS_rem_i32          0
++#define TCG_TARGET_HAS_qemu_st8_i32     0
++
++#define TCG_TARGET_HAS_qemu_ldst_i128   0
++
++#define TCG_TARGET_HAS_tst              1
++
++#define TCG_TARGET_HAS_v64              use_neon_instructions
++#define TCG_TARGET_HAS_v128             use_neon_instructions
++#define TCG_TARGET_HAS_v256             0
++
++#define TCG_TARGET_HAS_andc_vec         1
++#define TCG_TARGET_HAS_orc_vec          1
++#define TCG_TARGET_HAS_nand_vec         0
++#define TCG_TARGET_HAS_nor_vec          0
++#define TCG_TARGET_HAS_eqv_vec          0
++#define TCG_TARGET_HAS_not_vec          1
++#define TCG_TARGET_HAS_neg_vec          1
++#define TCG_TARGET_HAS_abs_vec          1
++#define TCG_TARGET_HAS_roti_vec         0
++#define TCG_TARGET_HAS_rots_vec         0
++#define TCG_TARGET_HAS_rotv_vec         0
++#define TCG_TARGET_HAS_shi_vec          1
++#define TCG_TARGET_HAS_shs_vec          0
++#define TCG_TARGET_HAS_shv_vec          0
++#define TCG_TARGET_HAS_mul_vec          1
++#define TCG_TARGET_HAS_sat_vec          1
++#define TCG_TARGET_HAS_minmax_vec       1
++#define TCG_TARGET_HAS_bitsel_vec       1
++#define TCG_TARGET_HAS_cmpsel_vec       0
++#define TCG_TARGET_HAS_tst_vec          1
++
++#endif
+diff --git a/tcg/arm/tcg-target.h b/tcg/arm/tcg-target.h
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/arm/tcg-target.h
++++ b/tcg/arm/tcg-target.h
+@@ -XXX,XX +XXX,XX @@
+ #ifndef ARM_TCG_TARGET_H
+ #define ARM_TCG_TARGET_H
+-extern int arm_arch;
+-
+-#define use_armv7_instructions  (__ARM_ARCH >= 7 || arm_arch >= 7)
+-
+ #define TCG_TARGET_INSN_UNIT_SIZE 4
+ #define MAX_CODE_GEN_BUFFER_SIZE  UINT32_MAX
+@@ -XXX,XX +XXX,XX @@ typedef enum {
+ #define TCG_TARGET_NB_REGS 32
+-#ifdef __ARM_ARCH_EXT_IDIV__
+-#define use_idiv_instructions  1
+-#else
+-extern bool use_idiv_instructions;
+-#endif
+-#ifdef __ARM_NEON__
+-#define use_neon_instructions  1
+-#else
+-extern bool use_neon_instructions;
+-#endif
+-
+-/* optional instructions */
+-#define TCG_TARGET_HAS_ext8s_i32        1
+-#define TCG_TARGET_HAS_ext16s_i32       1
+-#define TCG_TARGET_HAS_ext8u_i32        0 /* and r0, r1, #0xff */
+-#define TCG_TARGET_HAS_ext16u_i32       1
+-#define TCG_TARGET_HAS_bswap16_i32      1
+-#define TCG_TARGET_HAS_bswap32_i32      1
+-#define TCG_TARGET_HAS_not_i32          1
+-#define TCG_TARGET_HAS_rot_i32          1
+-#define TCG_TARGET_HAS_andc_i32         1
+-#define TCG_TARGET_HAS_orc_i32          0
+-#define TCG_TARGET_HAS_eqv_i32          0
+-#define TCG_TARGET_HAS_nand_i32         0
+-#define TCG_TARGET_HAS_nor_i32          0
+-#define TCG_TARGET_HAS_clz_i32          1
+-#define TCG_TARGET_HAS_ctz_i32          use_armv7_instructions
+-#define TCG_TARGET_HAS_ctpop_i32        0
+-#define TCG_TARGET_HAS_deposit_i32      use_armv7_instructions
+-#define TCG_TARGET_HAS_extract_i32      use_armv7_instructions
+-#define TCG_TARGET_HAS_sextract_i32     use_armv7_instructions
+-#define TCG_TARGET_HAS_extract2_i32     1
+-#define TCG_TARGET_HAS_negsetcond_i32   1
+-#define TCG_TARGET_HAS_mulu2_i32        1
+-#define TCG_TARGET_HAS_muls2_i32        1
+-#define TCG_TARGET_HAS_muluh_i32        0
+-#define TCG_TARGET_HAS_mulsh_i32        0
+-#define TCG_TARGET_HAS_div_i32          use_idiv_instructions
+-#define TCG_TARGET_HAS_rem_i32          0
+-#define TCG_TARGET_HAS_qemu_st8_i32     0
+-
+-#define TCG_TARGET_HAS_qemu_ldst_i128   0
+-
+-#define TCG_TARGET_HAS_tst              1
+-
+-#define TCG_TARGET_HAS_v64              use_neon_instructions
+-#define TCG_TARGET_HAS_v128             use_neon_instructions
+-#define TCG_TARGET_HAS_v256             0
+-
+-#define TCG_TARGET_HAS_andc_vec         1
+-#define TCG_TARGET_HAS_orc_vec          1
+-#define TCG_TARGET_HAS_nand_vec         0
+-#define TCG_TARGET_HAS_nor_vec          0
+-#define TCG_TARGET_HAS_eqv_vec          0
+-#define TCG_TARGET_HAS_not_vec          1
+-#define TCG_TARGET_HAS_neg_vec          1
+-#define TCG_TARGET_HAS_abs_vec          1
+-#define TCG_TARGET_HAS_roti_vec         0
+-#define TCG_TARGET_HAS_rots_vec         0
+-#define TCG_TARGET_HAS_rotv_vec         0
+-#define TCG_TARGET_HAS_shi_vec          1
+-#define TCG_TARGET_HAS_shs_vec          0
+-#define TCG_TARGET_HAS_shv_vec          0
+-#define TCG_TARGET_HAS_mul_vec          1
+-#define TCG_TARGET_HAS_sat_vec          1
+-#define TCG_TARGET_HAS_minmax_vec       1
+-#define TCG_TARGET_HAS_bitsel_vec       1
+-#define TCG_TARGET_HAS_cmpsel_vec       0
+-#define TCG_TARGET_HAS_tst_vec          1
++#include "tcg-target-has.h"
+ #define TCG_TARGET_DEFAULT_MO (0)
+--
+.43.0

-New patch
+[PULL 23/68] tcg/i386: Extract TCG_TARGET_HAS_foo defs to 'tcg-target-has.h'
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Signed-off-by: Philippe Mathieu-Daudé <philmd@linaro.org>
+Message-ID: <20250108215156.8731-6-philmd@linaro.org>
+---
+ tcg/i386/tcg-target-has.h | 139 ++++++++++++++++++++++++++++++++++++++
+ tcg/i386/tcg-target.h     | 129 +----------------------------------
+files changed, 140 insertions(+), 128 deletions(-)
+ create mode 100644 tcg/i386/tcg-target-has.h
+diff --git a/tcg/i386/tcg-target-has.h b/tcg/i386/tcg-target-has.h
+new file mode 100644
+index XXXXXXX..XXXXXXX
+--- /dev/null
++++ b/tcg/i386/tcg-target-has.h
+@@ -XXX,XX +XXX,XX @@
++/* SPDX-License-Identifier: MIT */
++/*
++ * Define target-specific opcode support
++ * Copyright (c) 2008 Fabrice Bellard
++ */
++
++#ifndef TCG_TARGET_HAS_H
++#define TCG_TARGET_HAS_H
++
++#include "host/cpuinfo.h"
++
++#define have_bmi1         (cpuinfo & CPUINFO_BMI1)
++#define have_popcnt       (cpuinfo & CPUINFO_POPCNT)
++#define have_avx1         (cpuinfo & CPUINFO_AVX1)
++#define have_avx2         (cpuinfo & CPUINFO_AVX2)
++#define have_movbe        (cpuinfo & CPUINFO_MOVBE)
++
++/*
++ * There are interesting instructions in AVX512, so long as we have AVX512VL,
++ * which indicates support for EVEX on sizes smaller than 512 bits.
++ */
++#define have_avx512vl     ((cpuinfo & CPUINFO_AVX512VL) && \
++                           (cpuinfo & CPUINFO_AVX512F))
++#define have_avx512bw     ((cpuinfo & CPUINFO_AVX512BW) && have_avx512vl)
++#define have_avx512dq     ((cpuinfo & CPUINFO_AVX512DQ) && have_avx512vl)
++#define have_avx512vbmi2  ((cpuinfo & CPUINFO_AVX512VBMI2) && have_avx512vl)
++
++/* optional instructions */
++#define TCG_TARGET_HAS_div2_i32         1
++#define TCG_TARGET_HAS_rot_i32          1
++#define TCG_TARGET_HAS_ext8s_i32        1
++#define TCG_TARGET_HAS_ext16s_i32       1
++#define TCG_TARGET_HAS_ext8u_i32        1
++#define TCG_TARGET_HAS_ext16u_i32       1
++#define TCG_TARGET_HAS_bswap16_i32      1
++#define TCG_TARGET_HAS_bswap32_i32      1
++#define TCG_TARGET_HAS_not_i32          1
++#define TCG_TARGET_HAS_andc_i32         have_bmi1
++#define TCG_TARGET_HAS_orc_i32          0
++#define TCG_TARGET_HAS_eqv_i32          0
++#define TCG_TARGET_HAS_nand_i32         0
++#define TCG_TARGET_HAS_nor_i32          0
++#define TCG_TARGET_HAS_clz_i32          1
++#define TCG_TARGET_HAS_ctz_i32          1
++#define TCG_TARGET_HAS_ctpop_i32        have_popcnt
++#define TCG_TARGET_HAS_deposit_i32      1
++#define TCG_TARGET_HAS_extract_i32      1
++#define TCG_TARGET_HAS_sextract_i32     1
++#define TCG_TARGET_HAS_extract2_i32     1
++#define TCG_TARGET_HAS_negsetcond_i32   1
++#define TCG_TARGET_HAS_add2_i32         1
++#define TCG_TARGET_HAS_sub2_i32         1
++#define TCG_TARGET_HAS_mulu2_i32        1
++#define TCG_TARGET_HAS_muls2_i32        1
++#define TCG_TARGET_HAS_muluh_i32        0
++#define TCG_TARGET_HAS_mulsh_i32        0
++
++#if TCG_TARGET_REG_BITS == 64
++/* Keep 32-bit values zero-extended in a register.  */
++#define TCG_TARGET_HAS_extr_i64_i32     1
++#define TCG_TARGET_HAS_div2_i64         1
++#define TCG_TARGET_HAS_rot_i64          1
++#define TCG_TARGET_HAS_ext8s_i64        1
++#define TCG_TARGET_HAS_ext16s_i64       1
++#define TCG_TARGET_HAS_ext32s_i64       1
++#define TCG_TARGET_HAS_ext8u_i64        1
++#define TCG_TARGET_HAS_ext16u_i64       1
++#define TCG_TARGET_HAS_ext32u_i64       1
++#define TCG_TARGET_HAS_bswap16_i64      1
++#define TCG_TARGET_HAS_bswap32_i64      1
++#define TCG_TARGET_HAS_bswap64_i64      1
++#define TCG_TARGET_HAS_not_i64          1
++#define TCG_TARGET_HAS_andc_i64         have_bmi1
++#define TCG_TARGET_HAS_orc_i64          0
++#define TCG_TARGET_HAS_eqv_i64          0
++#define TCG_TARGET_HAS_nand_i64         0
++#define TCG_TARGET_HAS_nor_i64          0
++#define TCG_TARGET_HAS_clz_i64          1
++#define TCG_TARGET_HAS_ctz_i64          1
++#define TCG_TARGET_HAS_ctpop_i64        have_popcnt
++#define TCG_TARGET_HAS_deposit_i64      1
++#define TCG_TARGET_HAS_extract_i64      1
++#define TCG_TARGET_HAS_sextract_i64     0
++#define TCG_TARGET_HAS_extract2_i64     1
++#define TCG_TARGET_HAS_negsetcond_i64   1
++#define TCG_TARGET_HAS_add2_i64         1
++#define TCG_TARGET_HAS_sub2_i64         1
++#define TCG_TARGET_HAS_mulu2_i64        1
++#define TCG_TARGET_HAS_muls2_i64        1
++#define TCG_TARGET_HAS_muluh_i64        0
++#define TCG_TARGET_HAS_mulsh_i64        0
++#define TCG_TARGET_HAS_qemu_st8_i32     0
++#else
++#define TCG_TARGET_HAS_qemu_st8_i32     1
++#endif
++
++#define TCG_TARGET_HAS_qemu_ldst_i128 \
++    (TCG_TARGET_REG_BITS == 64 && (cpuinfo & CPUINFO_ATOMIC_VMOVDQA))
++
++#define TCG_TARGET_HAS_tst              1
++
++/* We do not support older SSE systems, only beginning with AVX1.  */
++#define TCG_TARGET_HAS_v64              have_avx1
++#define TCG_TARGET_HAS_v128             have_avx1
++#define TCG_TARGET_HAS_v256             have_avx2
++
++#define TCG_TARGET_HAS_andc_vec         1
++#define TCG_TARGET_HAS_orc_vec          have_avx512vl
++#define TCG_TARGET_HAS_nand_vec         have_avx512vl
++#define TCG_TARGET_HAS_nor_vec          have_avx512vl
++#define TCG_TARGET_HAS_eqv_vec          have_avx512vl
++#define TCG_TARGET_HAS_not_vec          have_avx512vl
++#define TCG_TARGET_HAS_neg_vec          0
++#define TCG_TARGET_HAS_abs_vec          1
++#define TCG_TARGET_HAS_roti_vec         have_avx512vl
++#define TCG_TARGET_HAS_rots_vec         0
++#define TCG_TARGET_HAS_rotv_vec         have_avx512vl
++#define TCG_TARGET_HAS_shi_vec          1
++#define TCG_TARGET_HAS_shs_vec          1
++#define TCG_TARGET_HAS_shv_vec          have_avx2
++#define TCG_TARGET_HAS_mul_vec          1
++#define TCG_TARGET_HAS_sat_vec          1
++#define TCG_TARGET_HAS_minmax_vec       1
++#define TCG_TARGET_HAS_bitsel_vec       have_avx512vl
++#define TCG_TARGET_HAS_cmpsel_vec       1
++#define TCG_TARGET_HAS_tst_vec          have_avx512bw
++
++#define TCG_TARGET_deposit_i32_valid(ofs, len) \
++    (((ofs) == 0 && ((len) == 8 || (len) == 16)) || \
++     (TCG_TARGET_REG_BITS == 32 && (ofs) == 8 && (len) == 8))
++#define TCG_TARGET_deposit_i64_valid    TCG_TARGET_deposit_i32_valid
++
++/* Check for the possibility of high-byte extraction and, for 64-bit,
++   zero-extending 32-bit right-shift.  */
++#define TCG_TARGET_extract_i32_valid(ofs, len) ((ofs) == 8 && (len) == 8)
++#define TCG_TARGET_extract_i64_valid(ofs, len) \
++    (((ofs) == 8 && (len) == 8) || ((ofs) + (len)) == 32)
++
++#endif
+diff --git a/tcg/i386/tcg-target.h b/tcg/i386/tcg-target.h
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/i386/tcg-target.h
++++ b/tcg/i386/tcg-target.h
+@@ -XXX,XX +XXX,XX @@
+ #ifndef I386_TCG_TARGET_H
+ #define I386_TCG_TARGET_H
+-#include "host/cpuinfo.h"
+-
+ #define TCG_TARGET_INSN_UNIT_SIZE  1
+ #ifdef __x86_64__
+@@ -XXX,XX +XXX,XX @@ typedef enum {
+     TCG_REG_CALL_STACK = TCG_REG_ESP
+ } TCGReg;
+-#define have_bmi1         (cpuinfo & CPUINFO_BMI1)
+-#define have_popcnt       (cpuinfo & CPUINFO_POPCNT)
+-#define have_avx1         (cpuinfo & CPUINFO_AVX1)
+-#define have_avx2         (cpuinfo & CPUINFO_AVX2)
+-#define have_movbe        (cpuinfo & CPUINFO_MOVBE)
+-
+-/*
+- * There are interesting instructions in AVX512, so long as we have AVX512VL,
+- * which indicates support for EVEX on sizes smaller than 512 bits.
+- */
+-#define have_avx512vl     ((cpuinfo & CPUINFO_AVX512VL) && \
+-                           (cpuinfo & CPUINFO_AVX512F))
+-#define have_avx512bw     ((cpuinfo & CPUINFO_AVX512BW) && have_avx512vl)
+-#define have_avx512dq     ((cpuinfo & CPUINFO_AVX512DQ) && have_avx512vl)
+-#define have_avx512vbmi2  ((cpuinfo & CPUINFO_AVX512VBMI2) && have_avx512vl)
+-
+-/* optional instructions */
+-#define TCG_TARGET_HAS_div2_i32         1
+-#define TCG_TARGET_HAS_rot_i32          1
+-#define TCG_TARGET_HAS_ext8s_i32        1
+-#define TCG_TARGET_HAS_ext16s_i32       1
+-#define TCG_TARGET_HAS_ext8u_i32        1
+-#define TCG_TARGET_HAS_ext16u_i32       1
+-#define TCG_TARGET_HAS_bswap16_i32      1
+-#define TCG_TARGET_HAS_bswap32_i32      1
+-#define TCG_TARGET_HAS_not_i32          1
+-#define TCG_TARGET_HAS_andc_i32         have_bmi1
+-#define TCG_TARGET_HAS_orc_i32          0
+-#define TCG_TARGET_HAS_eqv_i32          0
+-#define TCG_TARGET_HAS_nand_i32         0
+-#define TCG_TARGET_HAS_nor_i32          0
+-#define TCG_TARGET_HAS_clz_i32          1
+-#define TCG_TARGET_HAS_ctz_i32          1
+-#define TCG_TARGET_HAS_ctpop_i32        have_popcnt
+-#define TCG_TARGET_HAS_deposit_i32      1
+-#define TCG_TARGET_HAS_extract_i32      1
+-#define TCG_TARGET_HAS_sextract_i32     1
+-#define TCG_TARGET_HAS_extract2_i32     1
+-#define TCG_TARGET_HAS_negsetcond_i32   1
+-#define TCG_TARGET_HAS_add2_i32         1
+-#define TCG_TARGET_HAS_sub2_i32         1
+-#define TCG_TARGET_HAS_mulu2_i32        1
+-#define TCG_TARGET_HAS_muls2_i32        1
+-#define TCG_TARGET_HAS_muluh_i32        0
+-#define TCG_TARGET_HAS_mulsh_i32        0
+-
+-#if TCG_TARGET_REG_BITS == 64
+-/* Keep 32-bit values zero-extended in a register.  */
+-#define TCG_TARGET_HAS_extr_i64_i32     1
+-#define TCG_TARGET_HAS_div2_i64         1
+-#define TCG_TARGET_HAS_rot_i64          1
+-#define TCG_TARGET_HAS_ext8s_i64        1
+-#define TCG_TARGET_HAS_ext16s_i64       1
+-#define TCG_TARGET_HAS_ext32s_i64       1
+-#define TCG_TARGET_HAS_ext8u_i64        1
+-#define TCG_TARGET_HAS_ext16u_i64       1
+-#define TCG_TARGET_HAS_ext32u_i64       1
+-#define TCG_TARGET_HAS_bswap16_i64      1
+-#define TCG_TARGET_HAS_bswap32_i64      1
+-#define TCG_TARGET_HAS_bswap64_i64      1
+-#define TCG_TARGET_HAS_not_i64          1
+-#define TCG_TARGET_HAS_andc_i64         have_bmi1
+-#define TCG_TARGET_HAS_orc_i64          0
+-#define TCG_TARGET_HAS_eqv_i64          0
+-#define TCG_TARGET_HAS_nand_i64         0
+-#define TCG_TARGET_HAS_nor_i64          0
+-#define TCG_TARGET_HAS_clz_i64          1
+-#define TCG_TARGET_HAS_ctz_i64          1
+-#define TCG_TARGET_HAS_ctpop_i64        have_popcnt
+-#define TCG_TARGET_HAS_deposit_i64      1
+-#define TCG_TARGET_HAS_extract_i64      1
+-#define TCG_TARGET_HAS_sextract_i64     0
+-#define TCG_TARGET_HAS_extract2_i64     1
+-#define TCG_TARGET_HAS_negsetcond_i64   1
+-#define TCG_TARGET_HAS_add2_i64         1
+-#define TCG_TARGET_HAS_sub2_i64         1
+-#define TCG_TARGET_HAS_mulu2_i64        1
+-#define TCG_TARGET_HAS_muls2_i64        1
+-#define TCG_TARGET_HAS_muluh_i64        0
+-#define TCG_TARGET_HAS_mulsh_i64        0
+-#define TCG_TARGET_HAS_qemu_st8_i32     0
+-#else
+-#define TCG_TARGET_HAS_qemu_st8_i32     1
+-#endif
+-
+-#define TCG_TARGET_HAS_qemu_ldst_i128 \
+-    (TCG_TARGET_REG_BITS == 64 && (cpuinfo & CPUINFO_ATOMIC_VMOVDQA))
+-
+-#define TCG_TARGET_HAS_tst              1
+-
+-/* We do not support older SSE systems, only beginning with AVX1.  */
+-#define TCG_TARGET_HAS_v64              have_avx1
+-#define TCG_TARGET_HAS_v128             have_avx1
+-#define TCG_TARGET_HAS_v256             have_avx2
+-
+-#define TCG_TARGET_HAS_andc_vec         1
+-#define TCG_TARGET_HAS_orc_vec          have_avx512vl
+-#define TCG_TARGET_HAS_nand_vec         have_avx512vl
+-#define TCG_TARGET_HAS_nor_vec          have_avx512vl
+-#define TCG_TARGET_HAS_eqv_vec          have_avx512vl
+-#define TCG_TARGET_HAS_not_vec          have_avx512vl
+-#define TCG_TARGET_HAS_neg_vec          0
+-#define TCG_TARGET_HAS_abs_vec          1
+-#define TCG_TARGET_HAS_roti_vec         have_avx512vl
+-#define TCG_TARGET_HAS_rots_vec         0
+-#define TCG_TARGET_HAS_rotv_vec         have_avx512vl
+-#define TCG_TARGET_HAS_shi_vec          1
+-#define TCG_TARGET_HAS_shs_vec          1
+-#define TCG_TARGET_HAS_shv_vec          have_avx2
+-#define TCG_TARGET_HAS_mul_vec          1
+-#define TCG_TARGET_HAS_sat_vec          1
+-#define TCG_TARGET_HAS_minmax_vec       1
+-#define TCG_TARGET_HAS_bitsel_vec       have_avx512vl
+-#define TCG_TARGET_HAS_cmpsel_vec       1
+-#define TCG_TARGET_HAS_tst_vec          have_avx512bw
+-
+-#define TCG_TARGET_deposit_i32_valid(ofs, len) \
+-    (((ofs) == 0 && ((len) == 8 || (len) == 16)) || \
+-     (TCG_TARGET_REG_BITS == 32 && (ofs) == 8 && (len) == 8))
+-#define TCG_TARGET_deposit_i64_valid    TCG_TARGET_deposit_i32_valid
+-
+-/* Check for the possibility of high-byte extraction and, for 64-bit,
+-   zero-extending 32-bit right-shift.  */
+-#define TCG_TARGET_extract_i32_valid(ofs, len) ((ofs) == 8 && (len) == 8)
+-#define TCG_TARGET_extract_i64_valid(ofs, len) \
+-    (((ofs) == 8 && (len) == 8) || ((ofs) + (len)) == 32)
++#include "tcg-target-has.h"
+ /* This defines the natural memory order supported by this
+  * architecture before guarantees made by various barrier
+--
+.43.0

-New patch
+[PULL 24/68] tcg/loongarch64: Extract TCG_TARGET_HAS_foo defs to 'tcg-target-has.h'
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Signed-off-by: Philippe Mathieu-Daudé <philmd@linaro.org>
+Message-ID: <20250108215156.8731-7-philmd@linaro.org>
+---
+ tcg/loongarch64/tcg-target-has.h | 113 +++++++++++++++++++++++++++++++
+ tcg/loongarch64/tcg-target.h     | 102 +---------------------------
+files changed, 114 insertions(+), 101 deletions(-)
+ create mode 100644 tcg/loongarch64/tcg-target-has.h
+diff --git a/tcg/loongarch64/tcg-target-has.h b/tcg/loongarch64/tcg-target-has.h
+new file mode 100644
+index XXXXXXX..XXXXXXX
+--- /dev/null
++++ b/tcg/loongarch64/tcg-target-has.h
+@@ -XXX,XX +XXX,XX @@
++/* SPDX-License-Identifier: MIT */
++/*
++ * Define target-specific opcode support
++ * Copyright (c) 2021 WANG Xuerui <git@xen0n.name>
++ */
++
++#ifndef TCG_TARGET_HAS_H
++#define TCG_TARGET_HAS_H
++
++#include "host/cpuinfo.h"
++
++/* optional instructions */
++#define TCG_TARGET_HAS_negsetcond_i32   0
++#define TCG_TARGET_HAS_div_i32          1
++#define TCG_TARGET_HAS_rem_i32          1
++#define TCG_TARGET_HAS_div2_i32         0
++#define TCG_TARGET_HAS_rot_i32          1
++#define TCG_TARGET_HAS_deposit_i32      1
++#define TCG_TARGET_HAS_extract_i32      1
++#define TCG_TARGET_HAS_sextract_i32     0
++#define TCG_TARGET_HAS_extract2_i32     0
++#define TCG_TARGET_HAS_add2_i32         0
++#define TCG_TARGET_HAS_sub2_i32         0
++#define TCG_TARGET_HAS_mulu2_i32        0
++#define TCG_TARGET_HAS_muls2_i32        0
++#define TCG_TARGET_HAS_muluh_i32        1
++#define TCG_TARGET_HAS_mulsh_i32        1
++#define TCG_TARGET_HAS_ext8s_i32        1
++#define TCG_TARGET_HAS_ext16s_i32       1
++#define TCG_TARGET_HAS_ext8u_i32        1
++#define TCG_TARGET_HAS_ext16u_i32       1
++#define TCG_TARGET_HAS_bswap16_i32      1
++#define TCG_TARGET_HAS_bswap32_i32      1
++#define TCG_TARGET_HAS_not_i32          1
++#define TCG_TARGET_HAS_andc_i32         1
++#define TCG_TARGET_HAS_orc_i32          1
++#define TCG_TARGET_HAS_eqv_i32          0
++#define TCG_TARGET_HAS_nand_i32         0
++#define TCG_TARGET_HAS_nor_i32          1
++#define TCG_TARGET_HAS_clz_i32          1
++#define TCG_TARGET_HAS_ctz_i32          1
++#define TCG_TARGET_HAS_ctpop_i32        0
++#define TCG_TARGET_HAS_brcond2          0
++#define TCG_TARGET_HAS_setcond2         0
++#define TCG_TARGET_HAS_qemu_st8_i32     0
++
++/* 64-bit operations */
++#define TCG_TARGET_HAS_negsetcond_i64   0
++#define TCG_TARGET_HAS_div_i64          1
++#define TCG_TARGET_HAS_rem_i64          1
++#define TCG_TARGET_HAS_div2_i64         0
++#define TCG_TARGET_HAS_rot_i64          1
++#define TCG_TARGET_HAS_deposit_i64      1
++#define TCG_TARGET_HAS_extract_i64      1
++#define TCG_TARGET_HAS_sextract_i64     0
++#define TCG_TARGET_HAS_extract2_i64     0
++#define TCG_TARGET_HAS_extr_i64_i32     1
++#define TCG_TARGET_HAS_ext8s_i64        1
++#define TCG_TARGET_HAS_ext16s_i64       1
++#define TCG_TARGET_HAS_ext32s_i64       1
++#define TCG_TARGET_HAS_ext8u_i64        1
++#define TCG_TARGET_HAS_ext16u_i64       1
++#define TCG_TARGET_HAS_ext32u_i64       1
++#define TCG_TARGET_HAS_bswap16_i64      1
++#define TCG_TARGET_HAS_bswap32_i64      1
++#define TCG_TARGET_HAS_bswap64_i64      1
++#define TCG_TARGET_HAS_not_i64          1
++#define TCG_TARGET_HAS_andc_i64         1
++#define TCG_TARGET_HAS_orc_i64          1
++#define TCG_TARGET_HAS_eqv_i64          0
++#define TCG_TARGET_HAS_nand_i64         0
++#define TCG_TARGET_HAS_nor_i64          1
++#define TCG_TARGET_HAS_clz_i64          1
++#define TCG_TARGET_HAS_ctz_i64          1
++#define TCG_TARGET_HAS_ctpop_i64        0
++#define TCG_TARGET_HAS_add2_i64         0
++#define TCG_TARGET_HAS_sub2_i64         0
++#define TCG_TARGET_HAS_mulu2_i64        0
++#define TCG_TARGET_HAS_muls2_i64        0
++#define TCG_TARGET_HAS_muluh_i64        1
++#define TCG_TARGET_HAS_mulsh_i64        1
++
++#define TCG_TARGET_HAS_qemu_ldst_i128   (cpuinfo & CPUINFO_LSX)
++
++#define TCG_TARGET_HAS_tst              0
++
++#define TCG_TARGET_HAS_v64              (cpuinfo & CPUINFO_LSX)
++#define TCG_TARGET_HAS_v128             (cpuinfo & CPUINFO_LSX)
++#define TCG_TARGET_HAS_v256             (cpuinfo & CPUINFO_LASX)
++
++#define TCG_TARGET_HAS_not_vec          1
++#define TCG_TARGET_HAS_neg_vec          1
++#define TCG_TARGET_HAS_abs_vec          0
++#define TCG_TARGET_HAS_andc_vec         1
++#define TCG_TARGET_HAS_orc_vec          1
++#define TCG_TARGET_HAS_nand_vec         0
++#define TCG_TARGET_HAS_nor_vec          1
++#define TCG_TARGET_HAS_eqv_vec          0
++#define TCG_TARGET_HAS_mul_vec          1
++#define TCG_TARGET_HAS_shi_vec          1
++#define TCG_TARGET_HAS_shs_vec          0
++#define TCG_TARGET_HAS_shv_vec          1
++#define TCG_TARGET_HAS_roti_vec         1
++#define TCG_TARGET_HAS_rots_vec         0
++#define TCG_TARGET_HAS_rotv_vec         1
++#define TCG_TARGET_HAS_sat_vec          1
++#define TCG_TARGET_HAS_minmax_vec       1
++#define TCG_TARGET_HAS_bitsel_vec       1
++#define TCG_TARGET_HAS_cmpsel_vec       0
++#define TCG_TARGET_HAS_tst_vec          0
++
++
++#endif
+diff --git a/tcg/loongarch64/tcg-target.h b/tcg/loongarch64/tcg-target.h
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/loongarch64/tcg-target.h
++++ b/tcg/loongarch64/tcg-target.h
+@@ -XXX,XX +XXX,XX @@
+ #ifndef LOONGARCH_TCG_TARGET_H
+ #define LOONGARCH_TCG_TARGET_H
+-#include "host/cpuinfo.h"
+-
+ #define TCG_TARGET_INSN_UNIT_SIZE 4
+ #define TCG_TARGET_NB_REGS 64
+@@ -XXX,XX +XXX,XX @@ typedef enum {
+     TCG_VEC_TMP0 = TCG_REG_V23,
+ } TCGReg;
+-/* optional instructions */
+-#define TCG_TARGET_HAS_negsetcond_i32   0
+-#define TCG_TARGET_HAS_div_i32          1
+-#define TCG_TARGET_HAS_rem_i32          1
+-#define TCG_TARGET_HAS_div2_i32         0
+-#define TCG_TARGET_HAS_rot_i32          1
+-#define TCG_TARGET_HAS_deposit_i32      1
+-#define TCG_TARGET_HAS_extract_i32      1
+-#define TCG_TARGET_HAS_sextract_i32     0
+-#define TCG_TARGET_HAS_extract2_i32     0
+-#define TCG_TARGET_HAS_add2_i32         0
+-#define TCG_TARGET_HAS_sub2_i32         0
+-#define TCG_TARGET_HAS_mulu2_i32        0
+-#define TCG_TARGET_HAS_muls2_i32        0
+-#define TCG_TARGET_HAS_muluh_i32        1
+-#define TCG_TARGET_HAS_mulsh_i32        1
+-#define TCG_TARGET_HAS_ext8s_i32        1
+-#define TCG_TARGET_HAS_ext16s_i32       1
+-#define TCG_TARGET_HAS_ext8u_i32        1
+-#define TCG_TARGET_HAS_ext16u_i32       1
+-#define TCG_TARGET_HAS_bswap16_i32      1
+-#define TCG_TARGET_HAS_bswap32_i32      1
+-#define TCG_TARGET_HAS_not_i32          1
+-#define TCG_TARGET_HAS_andc_i32         1
+-#define TCG_TARGET_HAS_orc_i32          1
+-#define TCG_TARGET_HAS_eqv_i32          0
+-#define TCG_TARGET_HAS_nand_i32         0
+-#define TCG_TARGET_HAS_nor_i32          1
+-#define TCG_TARGET_HAS_clz_i32          1
+-#define TCG_TARGET_HAS_ctz_i32          1
+-#define TCG_TARGET_HAS_ctpop_i32        0
+-#define TCG_TARGET_HAS_brcond2          0
+-#define TCG_TARGET_HAS_setcond2         0
+-#define TCG_TARGET_HAS_qemu_st8_i32     0
+-
+-/* 64-bit operations */
+-#define TCG_TARGET_HAS_negsetcond_i64   0
+-#define TCG_TARGET_HAS_div_i64          1
+-#define TCG_TARGET_HAS_rem_i64          1
+-#define TCG_TARGET_HAS_div2_i64         0
+-#define TCG_TARGET_HAS_rot_i64          1
+-#define TCG_TARGET_HAS_deposit_i64      1
+-#define TCG_TARGET_HAS_extract_i64      1
+-#define TCG_TARGET_HAS_sextract_i64     0
+-#define TCG_TARGET_HAS_extract2_i64     0
+-#define TCG_TARGET_HAS_extr_i64_i32     1
+-#define TCG_TARGET_HAS_ext8s_i64        1
+-#define TCG_TARGET_HAS_ext16s_i64       1
+-#define TCG_TARGET_HAS_ext32s_i64       1
+-#define TCG_TARGET_HAS_ext8u_i64        1
+-#define TCG_TARGET_HAS_ext16u_i64       1
+-#define TCG_TARGET_HAS_ext32u_i64       1
+-#define TCG_TARGET_HAS_bswap16_i64      1
+-#define TCG_TARGET_HAS_bswap32_i64      1
+-#define TCG_TARGET_HAS_bswap64_i64      1
+-#define TCG_TARGET_HAS_not_i64          1
+-#define TCG_TARGET_HAS_andc_i64         1
+-#define TCG_TARGET_HAS_orc_i64          1
+-#define TCG_TARGET_HAS_eqv_i64          0
+-#define TCG_TARGET_HAS_nand_i64         0
+-#define TCG_TARGET_HAS_nor_i64          1
+-#define TCG_TARGET_HAS_clz_i64          1
+-#define TCG_TARGET_HAS_ctz_i64          1
+-#define TCG_TARGET_HAS_ctpop_i64        0
+-#define TCG_TARGET_HAS_add2_i64         0
+-#define TCG_TARGET_HAS_sub2_i64         0
+-#define TCG_TARGET_HAS_mulu2_i64        0
+-#define TCG_TARGET_HAS_muls2_i64        0
+-#define TCG_TARGET_HAS_muluh_i64        1
+-#define TCG_TARGET_HAS_mulsh_i64        1
+-
+-#define TCG_TARGET_HAS_qemu_ldst_i128   (cpuinfo & CPUINFO_LSX)
+-
+-#define TCG_TARGET_HAS_tst              0
+-
+-#define TCG_TARGET_HAS_v64              (cpuinfo & CPUINFO_LSX)
+-#define TCG_TARGET_HAS_v128             (cpuinfo & CPUINFO_LSX)
+-#define TCG_TARGET_HAS_v256             (cpuinfo & CPUINFO_LASX)
+-
+-#define TCG_TARGET_HAS_not_vec          1
+-#define TCG_TARGET_HAS_neg_vec          1
+-#define TCG_TARGET_HAS_abs_vec          0
+-#define TCG_TARGET_HAS_andc_vec         1
+-#define TCG_TARGET_HAS_orc_vec          1
+-#define TCG_TARGET_HAS_nand_vec         0
+-#define TCG_TARGET_HAS_nor_vec          1
+-#define TCG_TARGET_HAS_eqv_vec          0
+-#define TCG_TARGET_HAS_mul_vec          1
+-#define TCG_TARGET_HAS_shi_vec          1
+-#define TCG_TARGET_HAS_shs_vec          0
+-#define TCG_TARGET_HAS_shv_vec          1
+-#define TCG_TARGET_HAS_roti_vec         1
+-#define TCG_TARGET_HAS_rots_vec         0
+-#define TCG_TARGET_HAS_rotv_vec         1
+-#define TCG_TARGET_HAS_sat_vec          1
+-#define TCG_TARGET_HAS_minmax_vec       1
+-#define TCG_TARGET_HAS_bitsel_vec       1
+-#define TCG_TARGET_HAS_cmpsel_vec       0
+-#define TCG_TARGET_HAS_tst_vec          0
++#include "tcg-target-has.h"
+ #define TCG_TARGET_DEFAULT_MO (0)
+--
+.43.0

-New patch
+[PULL 25/68] tcg/mips: Extract TCG_TARGET_HAS_foo defs to 'tcg-target-has.h'
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Signed-off-by: Philippe Mathieu-Daudé <philmd@linaro.org>
+Message-ID: <20250108215156.8731-8-philmd@linaro.org>
+---
+ tcg/mips/tcg-target-has.h | 122 ++++++++++++++++++++++++++++++++++++++
+ tcg/mips/tcg-target.h     | 112 +---------------------------------
+files changed, 123 insertions(+), 111 deletions(-)
+ create mode 100644 tcg/mips/tcg-target-has.h
+diff --git a/tcg/mips/tcg-target-has.h b/tcg/mips/tcg-target-has.h
+new file mode 100644
+index XXXXXXX..XXXXXXX
+--- /dev/null
++++ b/tcg/mips/tcg-target-has.h
+@@ -XXX,XX +XXX,XX @@
++/* SPDX-License-Identifier: MIT */
++/*
++ * Define target-specific opcode support
++ * Copyright (c) 2008-2009 Arnaud Patard <arnaud.patard@rtp-net.org>
++ * Copyright (c) 2009 Aurelien Jarno <aurelien@aurel32.net>
++ */
++
++#ifndef TCG_TARGET_HAS_H
++#define TCG_TARGET_HAS_H
++
++/* MOVN/MOVZ instructions detection */
++#if (defined(__mips_isa_rev) && (__mips_isa_rev >= 1)) || \
++    defined(_MIPS_ARCH_LOONGSON2E) || defined(_MIPS_ARCH_LOONGSON2F) || \
++    defined(_MIPS_ARCH_MIPS4)
++#define use_movnz_instructions  1
++#else
++extern bool use_movnz_instructions;
++#endif
++
++/* MIPS32 instruction set detection */
++#if defined(__mips_isa_rev) && (__mips_isa_rev >= 1)
++#define use_mips32_instructions  1
++#else
++extern bool use_mips32_instructions;
++#endif
++
++/* MIPS32R2 instruction set detection */
++#if defined(__mips_isa_rev) && (__mips_isa_rev >= 2)
++#define use_mips32r2_instructions  1
++#else
++extern bool use_mips32r2_instructions;
++#endif
++
++/* MIPS32R6 instruction set detection */
++#if defined(__mips_isa_rev) && (__mips_isa_rev >= 6)
++#define use_mips32r6_instructions  1
++#else
++#define use_mips32r6_instructions  0
++#endif
++
++/* optional instructions */
++#define TCG_TARGET_HAS_div_i32          1
++#define TCG_TARGET_HAS_rem_i32          1
++#define TCG_TARGET_HAS_not_i32          1
++#define TCG_TARGET_HAS_nor_i32          1
++#define TCG_TARGET_HAS_andc_i32         0
++#define TCG_TARGET_HAS_orc_i32          0
++#define TCG_TARGET_HAS_eqv_i32          0
++#define TCG_TARGET_HAS_nand_i32         0
++#define TCG_TARGET_HAS_mulu2_i32        (!use_mips32r6_instructions)
++#define TCG_TARGET_HAS_muls2_i32        (!use_mips32r6_instructions)
++#define TCG_TARGET_HAS_muluh_i32        1
++#define TCG_TARGET_HAS_mulsh_i32        1
++#define TCG_TARGET_HAS_bswap32_i32      1
++#define TCG_TARGET_HAS_negsetcond_i32   0
++
++#if TCG_TARGET_REG_BITS == 64
++#define TCG_TARGET_HAS_add2_i32         0
++#define TCG_TARGET_HAS_sub2_i32         0
++#define TCG_TARGET_HAS_extr_i64_i32     1
++#define TCG_TARGET_HAS_div_i64          1
++#define TCG_TARGET_HAS_rem_i64          1
++#define TCG_TARGET_HAS_not_i64          1
++#define TCG_TARGET_HAS_nor_i64          1
++#define TCG_TARGET_HAS_andc_i64         0
++#define TCG_TARGET_HAS_orc_i64          0
++#define TCG_TARGET_HAS_eqv_i64          0
++#define TCG_TARGET_HAS_nand_i64         0
++#define TCG_TARGET_HAS_add2_i64         0
++#define TCG_TARGET_HAS_sub2_i64         0
++#define TCG_TARGET_HAS_mulu2_i64        (!use_mips32r6_instructions)
++#define TCG_TARGET_HAS_muls2_i64        (!use_mips32r6_instructions)
++#define TCG_TARGET_HAS_muluh_i64        1
++#define TCG_TARGET_HAS_mulsh_i64        1
++#define TCG_TARGET_HAS_ext32s_i64       1
++#define TCG_TARGET_HAS_ext32u_i64       1
++#define TCG_TARGET_HAS_negsetcond_i64   0
++#endif
++
++/* optional instructions detected at runtime */
++#define TCG_TARGET_HAS_bswap16_i32      use_mips32r2_instructions
++#define TCG_TARGET_HAS_deposit_i32      use_mips32r2_instructions
++#define TCG_TARGET_HAS_extract_i32      use_mips32r2_instructions
++#define TCG_TARGET_HAS_sextract_i32     0
++#define TCG_TARGET_HAS_extract2_i32     0
++#define TCG_TARGET_HAS_ext8s_i32        use_mips32r2_instructions
++#define TCG_TARGET_HAS_ext16s_i32       use_mips32r2_instructions
++#define TCG_TARGET_HAS_rot_i32          use_mips32r2_instructions
++#define TCG_TARGET_HAS_clz_i32          use_mips32r2_instructions
++#define TCG_TARGET_HAS_ctz_i32          0
++#define TCG_TARGET_HAS_ctpop_i32        0
++#define TCG_TARGET_HAS_qemu_st8_i32     0
++
++#if TCG_TARGET_REG_BITS == 64
++#define TCG_TARGET_HAS_bswap16_i64      use_mips32r2_instructions
++#define TCG_TARGET_HAS_bswap32_i64      use_mips32r2_instructions
++#define TCG_TARGET_HAS_bswap64_i64      use_mips32r2_instructions
++#define TCG_TARGET_HAS_deposit_i64      use_mips32r2_instructions
++#define TCG_TARGET_HAS_extract_i64      use_mips32r2_instructions
++#define TCG_TARGET_HAS_sextract_i64     0
++#define TCG_TARGET_HAS_extract2_i64     0
++#define TCG_TARGET_HAS_ext8s_i64        use_mips32r2_instructions
++#define TCG_TARGET_HAS_ext16s_i64       use_mips32r2_instructions
++#define TCG_TARGET_HAS_rot_i64          use_mips32r2_instructions
++#define TCG_TARGET_HAS_clz_i64          use_mips32r2_instructions
++#define TCG_TARGET_HAS_ctz_i64          0
++#define TCG_TARGET_HAS_ctpop_i64        0
++#endif
++
++/* optional instructions automatically implemented */
++#define TCG_TARGET_HAS_ext8u_i32        0 /* andi rt, rs, 0xff   */
++#define TCG_TARGET_HAS_ext16u_i32       0 /* andi rt, rs, 0xffff */
++
++#if TCG_TARGET_REG_BITS == 64
++#define TCG_TARGET_HAS_ext8u_i64        0 /* andi rt, rs, 0xff   */
++#define TCG_TARGET_HAS_ext16u_i64       0 /* andi rt, rs, 0xffff */
++#endif
++
++#define TCG_TARGET_HAS_qemu_ldst_i128   0
++#define TCG_TARGET_HAS_tst              0
++
++#endif
+diff --git a/tcg/mips/tcg-target.h b/tcg/mips/tcg-target.h
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/mips/tcg-target.h
++++ b/tcg/mips/tcg-target.h
+@@ -XXX,XX +XXX,XX @@ typedef enum {
+     TCG_AREG0 = TCG_REG_S8,
+ } TCGReg;
+-/* MOVN/MOVZ instructions detection */
+-#if (defined(__mips_isa_rev) && (__mips_isa_rev >= 1)) || \
+-    defined(_MIPS_ARCH_LOONGSON2E) || defined(_MIPS_ARCH_LOONGSON2F) || \
+-    defined(_MIPS_ARCH_MIPS4)
+-#define use_movnz_instructions  1
+-#else
+-extern bool use_movnz_instructions;
+-#endif
+-
+-/* MIPS32 instruction set detection */
+-#if defined(__mips_isa_rev) && (__mips_isa_rev >= 1)
+-#define use_mips32_instructions  1
+-#else
+-extern bool use_mips32_instructions;
+-#endif
+-
+-/* MIPS32R2 instruction set detection */
+-#if defined(__mips_isa_rev) && (__mips_isa_rev >= 2)
+-#define use_mips32r2_instructions  1
+-#else
+-extern bool use_mips32r2_instructions;
+-#endif
+-
+-/* MIPS32R6 instruction set detection */
+-#if defined(__mips_isa_rev) && (__mips_isa_rev >= 6)
+-#define use_mips32r6_instructions  1
+-#else
+-#define use_mips32r6_instructions  0
+-#endif
+-
+-/* optional instructions */
+-#define TCG_TARGET_HAS_div_i32          1
+-#define TCG_TARGET_HAS_rem_i32          1
+-#define TCG_TARGET_HAS_not_i32          1
+-#define TCG_TARGET_HAS_nor_i32          1
+-#define TCG_TARGET_HAS_andc_i32         0
+-#define TCG_TARGET_HAS_orc_i32          0
+-#define TCG_TARGET_HAS_eqv_i32          0
+-#define TCG_TARGET_HAS_nand_i32         0
+-#define TCG_TARGET_HAS_mulu2_i32        (!use_mips32r6_instructions)
+-#define TCG_TARGET_HAS_muls2_i32        (!use_mips32r6_instructions)
+-#define TCG_TARGET_HAS_muluh_i32        1
+-#define TCG_TARGET_HAS_mulsh_i32        1
+-#define TCG_TARGET_HAS_bswap32_i32      1
+-#define TCG_TARGET_HAS_negsetcond_i32   0
+-
+-#if TCG_TARGET_REG_BITS == 64
+-#define TCG_TARGET_HAS_add2_i32         0
+-#define TCG_TARGET_HAS_sub2_i32         0
+-#define TCG_TARGET_HAS_extr_i64_i32     1
+-#define TCG_TARGET_HAS_div_i64          1
+-#define TCG_TARGET_HAS_rem_i64          1
+-#define TCG_TARGET_HAS_not_i64          1
+-#define TCG_TARGET_HAS_nor_i64          1
+-#define TCG_TARGET_HAS_andc_i64         0
+-#define TCG_TARGET_HAS_orc_i64          0
+-#define TCG_TARGET_HAS_eqv_i64          0
+-#define TCG_TARGET_HAS_nand_i64         0
+-#define TCG_TARGET_HAS_add2_i64         0
+-#define TCG_TARGET_HAS_sub2_i64         0
+-#define TCG_TARGET_HAS_mulu2_i64        (!use_mips32r6_instructions)
+-#define TCG_TARGET_HAS_muls2_i64        (!use_mips32r6_instructions)
+-#define TCG_TARGET_HAS_muluh_i64        1
+-#define TCG_TARGET_HAS_mulsh_i64        1
+-#define TCG_TARGET_HAS_ext32s_i64       1
+-#define TCG_TARGET_HAS_ext32u_i64       1
+-#define TCG_TARGET_HAS_negsetcond_i64   0
+-#endif
+-
+-/* optional instructions detected at runtime */
+-#define TCG_TARGET_HAS_bswap16_i32      use_mips32r2_instructions
+-#define TCG_TARGET_HAS_deposit_i32      use_mips32r2_instructions
+-#define TCG_TARGET_HAS_extract_i32      use_mips32r2_instructions
+-#define TCG_TARGET_HAS_sextract_i32     0
+-#define TCG_TARGET_HAS_extract2_i32     0
+-#define TCG_TARGET_HAS_ext8s_i32        use_mips32r2_instructions
+-#define TCG_TARGET_HAS_ext16s_i32       use_mips32r2_instructions
+-#define TCG_TARGET_HAS_rot_i32          use_mips32r2_instructions
+-#define TCG_TARGET_HAS_clz_i32          use_mips32r2_instructions
+-#define TCG_TARGET_HAS_ctz_i32          0
+-#define TCG_TARGET_HAS_ctpop_i32        0
+-#define TCG_TARGET_HAS_qemu_st8_i32     0
+-
+-#if TCG_TARGET_REG_BITS == 64
+-#define TCG_TARGET_HAS_bswap16_i64      use_mips32r2_instructions
+-#define TCG_TARGET_HAS_bswap32_i64      use_mips32r2_instructions
+-#define TCG_TARGET_HAS_bswap64_i64      use_mips32r2_instructions
+-#define TCG_TARGET_HAS_deposit_i64      use_mips32r2_instructions
+-#define TCG_TARGET_HAS_extract_i64      use_mips32r2_instructions
+-#define TCG_TARGET_HAS_sextract_i64     0
+-#define TCG_TARGET_HAS_extract2_i64     0
+-#define TCG_TARGET_HAS_ext8s_i64        use_mips32r2_instructions
+-#define TCG_TARGET_HAS_ext16s_i64       use_mips32r2_instructions
+-#define TCG_TARGET_HAS_rot_i64          use_mips32r2_instructions
+-#define TCG_TARGET_HAS_clz_i64          use_mips32r2_instructions
+-#define TCG_TARGET_HAS_ctz_i64          0
+-#define TCG_TARGET_HAS_ctpop_i64        0
+-#endif
+-
+-/* optional instructions automatically implemented */
+-#define TCG_TARGET_HAS_ext8u_i32        0 /* andi rt, rs, 0xff   */
+-#define TCG_TARGET_HAS_ext16u_i32       0 /* andi rt, rs, 0xffff */
+-
+-#if TCG_TARGET_REG_BITS == 64
+-#define TCG_TARGET_HAS_ext8u_i64        0 /* andi rt, rs, 0xff   */
+-#define TCG_TARGET_HAS_ext16u_i64       0 /* andi rt, rs, 0xffff */
+-#endif
+-
+-#define TCG_TARGET_HAS_qemu_ldst_i128   0
+-
+-#define TCG_TARGET_HAS_tst              0
++#include "tcg-target-has.h"
+ #define TCG_TARGET_DEFAULT_MO           0
+--
+.43.0

-New patch
+[PULL 26/68] tcg/ppc: Extract TCG_TARGET_HAS_foo defs to 'tcg-target-has.h'
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Signed-off-by: Philippe Mathieu-Daudé <philmd@linaro.org>
+Message-ID: <20250108215156.8731-9-philmd@linaro.org>
+---
+ tcg/ppc/tcg-target-has.h | 124 +++++++++++++++++++++++++++++++++++++++
+ tcg/ppc/tcg-target.h     | 114 +----------------------------------
+files changed, 125 insertions(+), 113 deletions(-)
+ create mode 100644 tcg/ppc/tcg-target-has.h
+diff --git a/tcg/ppc/tcg-target-has.h b/tcg/ppc/tcg-target-has.h
+new file mode 100644
+index XXXXXXX..XXXXXXX
+--- /dev/null
++++ b/tcg/ppc/tcg-target-has.h
+@@ -XXX,XX +XXX,XX @@
++/* SPDX-License-Identifier: MIT */
++/*
++ * Define target-specific opcode support
++ * Copyright (c) 2008 Fabrice Bellard
++ */
++
++#ifndef TCG_TARGET_HAS_H
++#define TCG_TARGET_HAS_H
++
++#include "host/cpuinfo.h"
++
++#define have_isa_2_06  (cpuinfo & CPUINFO_V2_06)
++#define have_isa_2_07  (cpuinfo & CPUINFO_V2_07)
++#define have_isa_3_00  (cpuinfo & CPUINFO_V3_0)
++#define have_isa_3_10  (cpuinfo & CPUINFO_V3_1)
++#define have_altivec   (cpuinfo & CPUINFO_ALTIVEC)
++#define have_vsx       (cpuinfo & CPUINFO_VSX)
++
++/* optional instructions automatically implemented */
++#define TCG_TARGET_HAS_ext8u_i32        0 /* andi */
++#define TCG_TARGET_HAS_ext16u_i32       0
++
++/* optional instructions */
++#define TCG_TARGET_HAS_div_i32          1
++#define TCG_TARGET_HAS_rem_i32          have_isa_3_00
++#define TCG_TARGET_HAS_rot_i32          1
++#define TCG_TARGET_HAS_ext8s_i32        1
++#define TCG_TARGET_HAS_ext16s_i32       1
++#define TCG_TARGET_HAS_bswap16_i32      1
++#define TCG_TARGET_HAS_bswap32_i32      1
++#define TCG_TARGET_HAS_not_i32          1
++#define TCG_TARGET_HAS_andc_i32         1
++#define TCG_TARGET_HAS_orc_i32          1
++#define TCG_TARGET_HAS_eqv_i32          1
++#define TCG_TARGET_HAS_nand_i32         1
++#define TCG_TARGET_HAS_nor_i32          1
++#define TCG_TARGET_HAS_clz_i32          1
++#define TCG_TARGET_HAS_ctz_i32          have_isa_3_00
++#define TCG_TARGET_HAS_ctpop_i32        have_isa_2_06
++#define TCG_TARGET_HAS_deposit_i32      1
++#define TCG_TARGET_HAS_extract_i32      1
++#define TCG_TARGET_HAS_sextract_i32     0
++#define TCG_TARGET_HAS_extract2_i32     0
++#define TCG_TARGET_HAS_negsetcond_i32   1
++#define TCG_TARGET_HAS_mulu2_i32        0
++#define TCG_TARGET_HAS_muls2_i32        0
++#define TCG_TARGET_HAS_muluh_i32        1
++#define TCG_TARGET_HAS_mulsh_i32        1
++#define TCG_TARGET_HAS_qemu_st8_i32     0
++
++#if TCG_TARGET_REG_BITS == 64
++#define TCG_TARGET_HAS_add2_i32         0
++#define TCG_TARGET_HAS_sub2_i32         0
++#define TCG_TARGET_HAS_extr_i64_i32     0
++#define TCG_TARGET_HAS_div_i64          1
++#define TCG_TARGET_HAS_rem_i64          have_isa_3_00
++#define TCG_TARGET_HAS_rot_i64          1
++#define TCG_TARGET_HAS_ext8s_i64        1
++#define TCG_TARGET_HAS_ext16s_i64       1
++#define TCG_TARGET_HAS_ext32s_i64       1
++#define TCG_TARGET_HAS_ext8u_i64        0
++#define TCG_TARGET_HAS_ext16u_i64       0
++#define TCG_TARGET_HAS_ext32u_i64       0
++#define TCG_TARGET_HAS_bswap16_i64      1
++#define TCG_TARGET_HAS_bswap32_i64      1
++#define TCG_TARGET_HAS_bswap64_i64      1
++#define TCG_TARGET_HAS_not_i64          1
++#define TCG_TARGET_HAS_andc_i64         1
++#define TCG_TARGET_HAS_orc_i64          1
++#define TCG_TARGET_HAS_eqv_i64          1
++#define TCG_TARGET_HAS_nand_i64         1
++#define TCG_TARGET_HAS_nor_i64          1
++#define TCG_TARGET_HAS_clz_i64          1
++#define TCG_TARGET_HAS_ctz_i64          have_isa_3_00
++#define TCG_TARGET_HAS_ctpop_i64        have_isa_2_06
++#define TCG_TARGET_HAS_deposit_i64      1
++#define TCG_TARGET_HAS_extract_i64      1
++#define TCG_TARGET_HAS_sextract_i64     0
++#define TCG_TARGET_HAS_extract2_i64     0
++#define TCG_TARGET_HAS_negsetcond_i64   1
++#define TCG_TARGET_HAS_add2_i64         1
++#define TCG_TARGET_HAS_sub2_i64         1
++#define TCG_TARGET_HAS_mulu2_i64        0
++#define TCG_TARGET_HAS_muls2_i64        0
++#define TCG_TARGET_HAS_muluh_i64        1
++#define TCG_TARGET_HAS_mulsh_i64        1
++#endif
++
++#define TCG_TARGET_HAS_qemu_ldst_i128   \
++    (TCG_TARGET_REG_BITS == 64 && have_isa_2_07)
++
++#define TCG_TARGET_HAS_tst              1
++
++/*
++ * While technically Altivec could support V64, it has no 64-bit store
++ * instruction and substituting two 32-bit stores makes the generated
++ * code quite large.
++ */
++#define TCG_TARGET_HAS_v64              have_vsx
++#define TCG_TARGET_HAS_v128             have_altivec
++#define TCG_TARGET_HAS_v256             0
++
++#define TCG_TARGET_HAS_andc_vec         1
++#define TCG_TARGET_HAS_orc_vec          have_isa_2_07
++#define TCG_TARGET_HAS_nand_vec         have_isa_2_07
++#define TCG_TARGET_HAS_nor_vec          1
++#define TCG_TARGET_HAS_eqv_vec          have_isa_2_07
++#define TCG_TARGET_HAS_not_vec          1
++#define TCG_TARGET_HAS_neg_vec          have_isa_3_00
++#define TCG_TARGET_HAS_abs_vec          0
++#define TCG_TARGET_HAS_roti_vec         0
++#define TCG_TARGET_HAS_rots_vec         0
++#define TCG_TARGET_HAS_rotv_vec         1
++#define TCG_TARGET_HAS_shi_vec          0
++#define TCG_TARGET_HAS_shs_vec          0
++#define TCG_TARGET_HAS_shv_vec          1
++#define TCG_TARGET_HAS_mul_vec          1
++#define TCG_TARGET_HAS_sat_vec          1
++#define TCG_TARGET_HAS_minmax_vec       1
++#define TCG_TARGET_HAS_bitsel_vec       have_vsx
++#define TCG_TARGET_HAS_cmpsel_vec       1
++#define TCG_TARGET_HAS_tst_vec          0
++
++#endif
+diff --git a/tcg/ppc/tcg-target.h b/tcg/ppc/tcg-target.h
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/ppc/tcg-target.h
++++ b/tcg/ppc/tcg-target.h
+@@ -XXX,XX +XXX,XX @@
+ #ifndef PPC_TCG_TARGET_H
+ #define PPC_TCG_TARGET_H
+-#include "host/cpuinfo.h"
+-
+ #define MAX_CODE_GEN_BUFFER_SIZE  ((size_t)-1)
+ #define TCG_TARGET_NB_REGS 64
+@@ -XXX,XX +XXX,XX @@ typedef enum {
+     TCG_AREG0 = TCG_REG_R27
+ } TCGReg;
+-#define have_isa_2_06  (cpuinfo & CPUINFO_V2_06)
+-#define have_isa_2_07  (cpuinfo & CPUINFO_V2_07)
+-#define have_isa_3_00  (cpuinfo & CPUINFO_V3_0)
+-#define have_isa_3_10  (cpuinfo & CPUINFO_V3_1)
+-#define have_altivec   (cpuinfo & CPUINFO_ALTIVEC)
+-#define have_vsx       (cpuinfo & CPUINFO_VSX)
+-
+-/* optional instructions automatically implemented */
+-#define TCG_TARGET_HAS_ext8u_i32        0 /* andi */
+-#define TCG_TARGET_HAS_ext16u_i32       0
+-
+-/* optional instructions */
+-#define TCG_TARGET_HAS_div_i32          1
+-#define TCG_TARGET_HAS_rem_i32          have_isa_3_00
+-#define TCG_TARGET_HAS_rot_i32          1
+-#define TCG_TARGET_HAS_ext8s_i32        1
+-#define TCG_TARGET_HAS_ext16s_i32       1
+-#define TCG_TARGET_HAS_bswap16_i32      1
+-#define TCG_TARGET_HAS_bswap32_i32      1
+-#define TCG_TARGET_HAS_not_i32          1
+-#define TCG_TARGET_HAS_andc_i32         1
+-#define TCG_TARGET_HAS_orc_i32          1
+-#define TCG_TARGET_HAS_eqv_i32          1
+-#define TCG_TARGET_HAS_nand_i32         1
+-#define TCG_TARGET_HAS_nor_i32          1
+-#define TCG_TARGET_HAS_clz_i32          1
+-#define TCG_TARGET_HAS_ctz_i32          have_isa_3_00
+-#define TCG_TARGET_HAS_ctpop_i32        have_isa_2_06
+-#define TCG_TARGET_HAS_deposit_i32      1
+-#define TCG_TARGET_HAS_extract_i32      1
+-#define TCG_TARGET_HAS_sextract_i32     0
+-#define TCG_TARGET_HAS_extract2_i32     0
+-#define TCG_TARGET_HAS_negsetcond_i32   1
+-#define TCG_TARGET_HAS_mulu2_i32        0
+-#define TCG_TARGET_HAS_muls2_i32        0
+-#define TCG_TARGET_HAS_muluh_i32        1
+-#define TCG_TARGET_HAS_mulsh_i32        1
+-#define TCG_TARGET_HAS_qemu_st8_i32     0
+-
+-#if TCG_TARGET_REG_BITS == 64
+-#define TCG_TARGET_HAS_add2_i32         0
+-#define TCG_TARGET_HAS_sub2_i32         0
+-#define TCG_TARGET_HAS_extr_i64_i32     0
+-#define TCG_TARGET_HAS_div_i64          1
+-#define TCG_TARGET_HAS_rem_i64          have_isa_3_00
+-#define TCG_TARGET_HAS_rot_i64          1
+-#define TCG_TARGET_HAS_ext8s_i64        1
+-#define TCG_TARGET_HAS_ext16s_i64       1
+-#define TCG_TARGET_HAS_ext32s_i64       1
+-#define TCG_TARGET_HAS_ext8u_i64        0
+-#define TCG_TARGET_HAS_ext16u_i64       0
+-#define TCG_TARGET_HAS_ext32u_i64       0
+-#define TCG_TARGET_HAS_bswap16_i64      1
+-#define TCG_TARGET_HAS_bswap32_i64      1
+-#define TCG_TARGET_HAS_bswap64_i64      1
+-#define TCG_TARGET_HAS_not_i64          1
+-#define TCG_TARGET_HAS_andc_i64         1
+-#define TCG_TARGET_HAS_orc_i64          1
+-#define TCG_TARGET_HAS_eqv_i64          1
+-#define TCG_TARGET_HAS_nand_i64         1
+-#define TCG_TARGET_HAS_nor_i64          1
+-#define TCG_TARGET_HAS_clz_i64          1
+-#define TCG_TARGET_HAS_ctz_i64          have_isa_3_00
+-#define TCG_TARGET_HAS_ctpop_i64        have_isa_2_06
+-#define TCG_TARGET_HAS_deposit_i64      1
+-#define TCG_TARGET_HAS_extract_i64      1
+-#define TCG_TARGET_HAS_sextract_i64     0
+-#define TCG_TARGET_HAS_extract2_i64     0
+-#define TCG_TARGET_HAS_negsetcond_i64   1
+-#define TCG_TARGET_HAS_add2_i64         1
+-#define TCG_TARGET_HAS_sub2_i64         1
+-#define TCG_TARGET_HAS_mulu2_i64        0
+-#define TCG_TARGET_HAS_muls2_i64        0
+-#define TCG_TARGET_HAS_muluh_i64        1
+-#define TCG_TARGET_HAS_mulsh_i64        1
+-#endif
+-
+-#define TCG_TARGET_HAS_qemu_ldst_i128   \
+-    (TCG_TARGET_REG_BITS == 64 && have_isa_2_07)
+-
+-#define TCG_TARGET_HAS_tst              1
+-
+-/*
+- * While technically Altivec could support V64, it has no 64-bit store
+- * instruction and substituting two 32-bit stores makes the generated
+- * code quite large.
+- */
+-#define TCG_TARGET_HAS_v64              have_vsx
+-#define TCG_TARGET_HAS_v128             have_altivec
+-#define TCG_TARGET_HAS_v256             0
+-
+-#define TCG_TARGET_HAS_andc_vec         1
+-#define TCG_TARGET_HAS_orc_vec          have_isa_2_07
+-#define TCG_TARGET_HAS_nand_vec         have_isa_2_07
+-#define TCG_TARGET_HAS_nor_vec          1
+-#define TCG_TARGET_HAS_eqv_vec          have_isa_2_07
+-#define TCG_TARGET_HAS_not_vec          1
+-#define TCG_TARGET_HAS_neg_vec          have_isa_3_00
+-#define TCG_TARGET_HAS_abs_vec          0
+-#define TCG_TARGET_HAS_roti_vec         0
+-#define TCG_TARGET_HAS_rots_vec         0
+-#define TCG_TARGET_HAS_rotv_vec         1
+-#define TCG_TARGET_HAS_shi_vec          0
+-#define TCG_TARGET_HAS_shs_vec          0
+-#define TCG_TARGET_HAS_shv_vec          1
+-#define TCG_TARGET_HAS_mul_vec          1
+-#define TCG_TARGET_HAS_sat_vec          1
+-#define TCG_TARGET_HAS_minmax_vec       1
+-#define TCG_TARGET_HAS_bitsel_vec       have_vsx
+-#define TCG_TARGET_HAS_cmpsel_vec       1
+-#define TCG_TARGET_HAS_tst_vec          0
++#include "tcg-target-has.h"
+ #define TCG_TARGET_DEFAULT_MO (0)
+--
+.43.0

-New patch
+[PULL 27/68] tcg/riscv: Extract TCG_TARGET_HAS_foo defs to 'tcg-target-has.h'
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Signed-off-by: Philippe Mathieu-Daudé <philmd@linaro.org>
+Message-ID: <20250108215156.8731-10-philmd@linaro.org>
+---
+ tcg/riscv/tcg-target-has.h | 112 +++++++++++++++++++++++++++++++++++++
+ tcg/riscv/tcg-target.h     | 102 +--------------------------------
+files changed, 113 insertions(+), 101 deletions(-)
+ create mode 100644 tcg/riscv/tcg-target-has.h
+diff --git a/tcg/riscv/tcg-target-has.h b/tcg/riscv/tcg-target-has.h
+new file mode 100644
+index XXXXXXX..XXXXXXX
+--- /dev/null
++++ b/tcg/riscv/tcg-target-has.h
+@@ -XXX,XX +XXX,XX @@
++/* SPDX-License-Identifier: MIT */
++/*
++ * Define target-specific opcode support
++ * Copyright (c) 2018 SiFive, Inc
++ */
++
++#ifndef TCG_TARGET_HAS_H
++#define TCG_TARGET_HAS_H
++
++#include "host/cpuinfo.h"
++
++/* optional instructions */
++#define TCG_TARGET_HAS_negsetcond_i32   1
++#define TCG_TARGET_HAS_div_i32          1
++#define TCG_TARGET_HAS_rem_i32          1
++#define TCG_TARGET_HAS_div2_i32         0
++#define TCG_TARGET_HAS_rot_i32          (cpuinfo & CPUINFO_ZBB)
++#define TCG_TARGET_HAS_deposit_i32      0
++#define TCG_TARGET_HAS_extract_i32      0
++#define TCG_TARGET_HAS_sextract_i32     0
++#define TCG_TARGET_HAS_extract2_i32     0
++#define TCG_TARGET_HAS_add2_i32         1
++#define TCG_TARGET_HAS_sub2_i32         1
++#define TCG_TARGET_HAS_mulu2_i32        0
++#define TCG_TARGET_HAS_muls2_i32        0
++#define TCG_TARGET_HAS_muluh_i32        0
++#define TCG_TARGET_HAS_mulsh_i32        0
++#define TCG_TARGET_HAS_ext8s_i32        1
++#define TCG_TARGET_HAS_ext16s_i32       1
++#define TCG_TARGET_HAS_ext8u_i32        1
++#define TCG_TARGET_HAS_ext16u_i32       1
++#define TCG_TARGET_HAS_bswap16_i32      (cpuinfo & CPUINFO_ZBB)
++#define TCG_TARGET_HAS_bswap32_i32      (cpuinfo & CPUINFO_ZBB)
++#define TCG_TARGET_HAS_not_i32          1
++#define TCG_TARGET_HAS_andc_i32         (cpuinfo & CPUINFO_ZBB)
++#define TCG_TARGET_HAS_orc_i32          (cpuinfo & CPUINFO_ZBB)
++#define TCG_TARGET_HAS_eqv_i32          (cpuinfo & CPUINFO_ZBB)
++#define TCG_TARGET_HAS_nand_i32         0
++#define TCG_TARGET_HAS_nor_i32          0
++#define TCG_TARGET_HAS_clz_i32          (cpuinfo & CPUINFO_ZBB)
++#define TCG_TARGET_HAS_ctz_i32          (cpuinfo & CPUINFO_ZBB)
++#define TCG_TARGET_HAS_ctpop_i32        (cpuinfo & CPUINFO_ZBB)
++#define TCG_TARGET_HAS_brcond2          1
++#define TCG_TARGET_HAS_setcond2         1
++#define TCG_TARGET_HAS_qemu_st8_i32     0
++
++#define TCG_TARGET_HAS_negsetcond_i64   1
++#define TCG_TARGET_HAS_div_i64          1
++#define TCG_TARGET_HAS_rem_i64          1
++#define TCG_TARGET_HAS_div2_i64         0
++#define TCG_TARGET_HAS_rot_i64          (cpuinfo & CPUINFO_ZBB)
++#define TCG_TARGET_HAS_deposit_i64      0
++#define TCG_TARGET_HAS_extract_i64      0
++#define TCG_TARGET_HAS_sextract_i64     0
++#define TCG_TARGET_HAS_extract2_i64     0
++#define TCG_TARGET_HAS_extr_i64_i32     1
++#define TCG_TARGET_HAS_ext8s_i64        1
++#define TCG_TARGET_HAS_ext16s_i64       1
++#define TCG_TARGET_HAS_ext32s_i64       1
++#define TCG_TARGET_HAS_ext8u_i64        1
++#define TCG_TARGET_HAS_ext16u_i64       1
++#define TCG_TARGET_HAS_ext32u_i64       1
++#define TCG_TARGET_HAS_bswap16_i64      (cpuinfo & CPUINFO_ZBB)
++#define TCG_TARGET_HAS_bswap32_i64      (cpuinfo & CPUINFO_ZBB)
++#define TCG_TARGET_HAS_bswap64_i64      (cpuinfo & CPUINFO_ZBB)
++#define TCG_TARGET_HAS_not_i64          1
++#define TCG_TARGET_HAS_andc_i64         (cpuinfo & CPUINFO_ZBB)
++#define TCG_TARGET_HAS_orc_i64          (cpuinfo & CPUINFO_ZBB)
++#define TCG_TARGET_HAS_eqv_i64          (cpuinfo & CPUINFO_ZBB)
++#define TCG_TARGET_HAS_nand_i64         0
++#define TCG_TARGET_HAS_nor_i64          0
++#define TCG_TARGET_HAS_clz_i64          (cpuinfo & CPUINFO_ZBB)
++#define TCG_TARGET_HAS_ctz_i64          (cpuinfo & CPUINFO_ZBB)
++#define TCG_TARGET_HAS_ctpop_i64        (cpuinfo & CPUINFO_ZBB)
++#define TCG_TARGET_HAS_add2_i64         1
++#define TCG_TARGET_HAS_sub2_i64         1
++#define TCG_TARGET_HAS_mulu2_i64        0
++#define TCG_TARGET_HAS_muls2_i64        0
++#define TCG_TARGET_HAS_muluh_i64        1
++#define TCG_TARGET_HAS_mulsh_i64        1
++
++#define TCG_TARGET_HAS_qemu_ldst_i128   0
++
++#define TCG_TARGET_HAS_tst              0
++
++/* vector instructions */
++#define TCG_TARGET_HAS_v64              (cpuinfo & CPUINFO_ZVE64X)
++#define TCG_TARGET_HAS_v128             (cpuinfo & CPUINFO_ZVE64X)
++#define TCG_TARGET_HAS_v256             (cpuinfo & CPUINFO_ZVE64X)
++#define TCG_TARGET_HAS_andc_vec         0
++#define TCG_TARGET_HAS_orc_vec          0
++#define TCG_TARGET_HAS_nand_vec         0
++#define TCG_TARGET_HAS_nor_vec          0
++#define TCG_TARGET_HAS_eqv_vec          0
++#define TCG_TARGET_HAS_not_vec          1
++#define TCG_TARGET_HAS_neg_vec          1
++#define TCG_TARGET_HAS_abs_vec          0
++#define TCG_TARGET_HAS_roti_vec         1
++#define TCG_TARGET_HAS_rots_vec         1
++#define TCG_TARGET_HAS_rotv_vec         1
++#define TCG_TARGET_HAS_shi_vec          1
++#define TCG_TARGET_HAS_shs_vec          1
++#define TCG_TARGET_HAS_shv_vec          1
++#define TCG_TARGET_HAS_mul_vec          1
++#define TCG_TARGET_HAS_sat_vec          1
++#define TCG_TARGET_HAS_minmax_vec       1
++#define TCG_TARGET_HAS_bitsel_vec       0
++#define TCG_TARGET_HAS_cmpsel_vec       1
++
++#define TCG_TARGET_HAS_tst_vec          0
++
++#endif
+diff --git a/tcg/riscv/tcg-target.h b/tcg/riscv/tcg-target.h
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/riscv/tcg-target.h
++++ b/tcg/riscv/tcg-target.h
+@@ -XXX,XX +XXX,XX @@
+ #ifndef RISCV_TCG_TARGET_H
+ #define RISCV_TCG_TARGET_H
+-#include "host/cpuinfo.h"
+-
+ #define TCG_TARGET_INSN_UNIT_SIZE 4
+ #define TCG_TARGET_NB_REGS 64
+ #define MAX_CODE_GEN_BUFFER_SIZE  ((size_t)-1)
+@@ -XXX,XX +XXX,XX @@ typedef enum {
+     TCG_REG_TMP2       = TCG_REG_T4,
+ } TCGReg;
+-/* optional instructions */
+-#define TCG_TARGET_HAS_negsetcond_i32   1
+-#define TCG_TARGET_HAS_div_i32          1
+-#define TCG_TARGET_HAS_rem_i32          1
+-#define TCG_TARGET_HAS_div2_i32         0
+-#define TCG_TARGET_HAS_rot_i32          (cpuinfo & CPUINFO_ZBB)
+-#define TCG_TARGET_HAS_deposit_i32      0
+-#define TCG_TARGET_HAS_extract_i32      0
+-#define TCG_TARGET_HAS_sextract_i32     0
+-#define TCG_TARGET_HAS_extract2_i32     0
+-#define TCG_TARGET_HAS_add2_i32         1
+-#define TCG_TARGET_HAS_sub2_i32         1
+-#define TCG_TARGET_HAS_mulu2_i32        0
+-#define TCG_TARGET_HAS_muls2_i32        0
+-#define TCG_TARGET_HAS_muluh_i32        0
+-#define TCG_TARGET_HAS_mulsh_i32        0
+-#define TCG_TARGET_HAS_ext8s_i32        1
+-#define TCG_TARGET_HAS_ext16s_i32       1
+-#define TCG_TARGET_HAS_ext8u_i32        1
+-#define TCG_TARGET_HAS_ext16u_i32       1
+-#define TCG_TARGET_HAS_bswap16_i32      (cpuinfo & CPUINFO_ZBB)
+-#define TCG_TARGET_HAS_bswap32_i32      (cpuinfo & CPUINFO_ZBB)
+-#define TCG_TARGET_HAS_not_i32          1
+-#define TCG_TARGET_HAS_andc_i32         (cpuinfo & CPUINFO_ZBB)
+-#define TCG_TARGET_HAS_orc_i32          (cpuinfo & CPUINFO_ZBB)
+-#define TCG_TARGET_HAS_eqv_i32          (cpuinfo & CPUINFO_ZBB)
+-#define TCG_TARGET_HAS_nand_i32         0
+-#define TCG_TARGET_HAS_nor_i32          0
+-#define TCG_TARGET_HAS_clz_i32          (cpuinfo & CPUINFO_ZBB)
+-#define TCG_TARGET_HAS_ctz_i32          (cpuinfo & CPUINFO_ZBB)
+-#define TCG_TARGET_HAS_ctpop_i32        (cpuinfo & CPUINFO_ZBB)
+-#define TCG_TARGET_HAS_brcond2          1
+-#define TCG_TARGET_HAS_setcond2         1
+-#define TCG_TARGET_HAS_qemu_st8_i32     0
+-
+-#define TCG_TARGET_HAS_negsetcond_i64   1
+-#define TCG_TARGET_HAS_div_i64          1
+-#define TCG_TARGET_HAS_rem_i64          1
+-#define TCG_TARGET_HAS_div2_i64         0
+-#define TCG_TARGET_HAS_rot_i64          (cpuinfo & CPUINFO_ZBB)
+-#define TCG_TARGET_HAS_deposit_i64      0
+-#define TCG_TARGET_HAS_extract_i64      0
+-#define TCG_TARGET_HAS_sextract_i64     0
+-#define TCG_TARGET_HAS_extract2_i64     0
+-#define TCG_TARGET_HAS_extr_i64_i32     1
+-#define TCG_TARGET_HAS_ext8s_i64        1
+-#define TCG_TARGET_HAS_ext16s_i64       1
+-#define TCG_TARGET_HAS_ext32s_i64       1
+-#define TCG_TARGET_HAS_ext8u_i64        1
+-#define TCG_TARGET_HAS_ext16u_i64       1
+-#define TCG_TARGET_HAS_ext32u_i64       1
+-#define TCG_TARGET_HAS_bswap16_i64      (cpuinfo & CPUINFO_ZBB)
+-#define TCG_TARGET_HAS_bswap32_i64      (cpuinfo & CPUINFO_ZBB)
+-#define TCG_TARGET_HAS_bswap64_i64      (cpuinfo & CPUINFO_ZBB)
+-#define TCG_TARGET_HAS_not_i64          1
+-#define TCG_TARGET_HAS_andc_i64         (cpuinfo & CPUINFO_ZBB)
+-#define TCG_TARGET_HAS_orc_i64          (cpuinfo & CPUINFO_ZBB)
+-#define TCG_TARGET_HAS_eqv_i64          (cpuinfo & CPUINFO_ZBB)
+-#define TCG_TARGET_HAS_nand_i64         0
+-#define TCG_TARGET_HAS_nor_i64          0
+-#define TCG_TARGET_HAS_clz_i64          (cpuinfo & CPUINFO_ZBB)
+-#define TCG_TARGET_HAS_ctz_i64          (cpuinfo & CPUINFO_ZBB)
+-#define TCG_TARGET_HAS_ctpop_i64        (cpuinfo & CPUINFO_ZBB)
+-#define TCG_TARGET_HAS_add2_i64         1
+-#define TCG_TARGET_HAS_sub2_i64         1
+-#define TCG_TARGET_HAS_mulu2_i64        0
+-#define TCG_TARGET_HAS_muls2_i64        0
+-#define TCG_TARGET_HAS_muluh_i64        1
+-#define TCG_TARGET_HAS_mulsh_i64        1
+-
+-#define TCG_TARGET_HAS_qemu_ldst_i128   0
+-
+-#define TCG_TARGET_HAS_tst              0
+-
+-/* vector instructions */
+-#define TCG_TARGET_HAS_v64              (cpuinfo & CPUINFO_ZVE64X)
+-#define TCG_TARGET_HAS_v128             (cpuinfo & CPUINFO_ZVE64X)
+-#define TCG_TARGET_HAS_v256             (cpuinfo & CPUINFO_ZVE64X)
+-#define TCG_TARGET_HAS_andc_vec         0
+-#define TCG_TARGET_HAS_orc_vec          0
+-#define TCG_TARGET_HAS_nand_vec         0
+-#define TCG_TARGET_HAS_nor_vec          0
+-#define TCG_TARGET_HAS_eqv_vec          0
+-#define TCG_TARGET_HAS_not_vec          1
+-#define TCG_TARGET_HAS_neg_vec          1
+-#define TCG_TARGET_HAS_abs_vec          0
+-#define TCG_TARGET_HAS_roti_vec         1
+-#define TCG_TARGET_HAS_rots_vec         1
+-#define TCG_TARGET_HAS_rotv_vec         1
+-#define TCG_TARGET_HAS_shi_vec          1
+-#define TCG_TARGET_HAS_shs_vec          1
+-#define TCG_TARGET_HAS_shv_vec          1
+-#define TCG_TARGET_HAS_mul_vec          1
+-#define TCG_TARGET_HAS_sat_vec          1
+-#define TCG_TARGET_HAS_minmax_vec       1
+-#define TCG_TARGET_HAS_bitsel_vec       0
+-#define TCG_TARGET_HAS_cmpsel_vec       1
+-
+-#define TCG_TARGET_HAS_tst_vec          0
++#include "tcg-target-has.h"
+ #define TCG_TARGET_DEFAULT_MO (0)
+--
+.43.0

-New patch
+[PULL 28/68] tcg/s390x: Extract TCG_TARGET_HAS_foo defs to 'tcg-target-has.h'
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Signed-off-by: Philippe Mathieu-Daudé <philmd@linaro.org>
+Message-ID: <20250108215156.8731-11-philmd@linaro.org>
+---
+ tcg/s390x/tcg-target-has.h | 124 +++++++++++++++++++++++++++++++++++++
+ tcg/s390x/tcg-target.h     | 114 +---------------------------------
+files changed, 125 insertions(+), 113 deletions(-)
+ create mode 100644 tcg/s390x/tcg-target-has.h
+diff --git a/tcg/s390x/tcg-target-has.h b/tcg/s390x/tcg-target-has.h
+new file mode 100644
+index XXXXXXX..XXXXXXX
+--- /dev/null
++++ b/tcg/s390x/tcg-target-has.h
+@@ -XXX,XX +XXX,XX @@
++/* SPDX-License-Identifier: MIT */
++/*
++ * Define target-specific opcode support
++ * Copyright (c) 2009 Ulrich Hecht <uli@suse.de>
++ */
++
++#ifndef TCG_TARGET_HAS_H
++#define TCG_TARGET_HAS_H
++
++/* Facilities required for proper operation; checked at startup. */
++
++#define FACILITY_ZARCH_ACTIVE         2
++#define FACILITY_LONG_DISP            18
++#define FACILITY_EXT_IMM              21
++#define FACILITY_GEN_INST_EXT         34
++#define FACILITY_45                   45
++
++/* Facilities that are checked at runtime. */
++
++#define FACILITY_LOAD_ON_COND2        53
++#define FACILITY_MISC_INSN_EXT2       58
++#define FACILITY_MISC_INSN_EXT3       61
++#define FACILITY_VECTOR               129
++#define FACILITY_VECTOR_ENH1          135
++
++extern uint64_t s390_facilities[3];
++
++#define HAVE_FACILITY(X) \
++    ((s390_facilities[FACILITY_##X / 64] >> (63 - FACILITY_##X % 64)) & 1)
++
++/* optional instructions */
++#define TCG_TARGET_HAS_div2_i32       1
++#define TCG_TARGET_HAS_rot_i32        1
++#define TCG_TARGET_HAS_ext8s_i32      1
++#define TCG_TARGET_HAS_ext16s_i32     1
++#define TCG_TARGET_HAS_ext8u_i32      1
++#define TCG_TARGET_HAS_ext16u_i32     1
++#define TCG_TARGET_HAS_bswap16_i32    1
++#define TCG_TARGET_HAS_bswap32_i32    1
++#define TCG_TARGET_HAS_not_i32        HAVE_FACILITY(MISC_INSN_EXT3)
++#define TCG_TARGET_HAS_andc_i32       HAVE_FACILITY(MISC_INSN_EXT3)
++#define TCG_TARGET_HAS_orc_i32        HAVE_FACILITY(MISC_INSN_EXT3)
++#define TCG_TARGET_HAS_eqv_i32        HAVE_FACILITY(MISC_INSN_EXT3)
++#define TCG_TARGET_HAS_nand_i32       HAVE_FACILITY(MISC_INSN_EXT3)
++#define TCG_TARGET_HAS_nor_i32        HAVE_FACILITY(MISC_INSN_EXT3)
++#define TCG_TARGET_HAS_clz_i32        0
++#define TCG_TARGET_HAS_ctz_i32        0
++#define TCG_TARGET_HAS_ctpop_i32      1
++#define TCG_TARGET_HAS_deposit_i32    1
++#define TCG_TARGET_HAS_extract_i32    1
++#define TCG_TARGET_HAS_sextract_i32   0
++#define TCG_TARGET_HAS_extract2_i32   0
++#define TCG_TARGET_HAS_negsetcond_i32 1
++#define TCG_TARGET_HAS_add2_i32       1
++#define TCG_TARGET_HAS_sub2_i32       1
++#define TCG_TARGET_HAS_mulu2_i32      0
++#define TCG_TARGET_HAS_muls2_i32      0
++#define TCG_TARGET_HAS_muluh_i32      0
++#define TCG_TARGET_HAS_mulsh_i32      0
++#define TCG_TARGET_HAS_extr_i64_i32   0
++#define TCG_TARGET_HAS_qemu_st8_i32   0
++
++#define TCG_TARGET_HAS_div2_i64       1
++#define TCG_TARGET_HAS_rot_i64        1
++#define TCG_TARGET_HAS_ext8s_i64      1
++#define TCG_TARGET_HAS_ext16s_i64     1
++#define TCG_TARGET_HAS_ext32s_i64     1
++#define TCG_TARGET_HAS_ext8u_i64      1
++#define TCG_TARGET_HAS_ext16u_i64     1
++#define TCG_TARGET_HAS_ext32u_i64     1
++#define TCG_TARGET_HAS_bswap16_i64    1
++#define TCG_TARGET_HAS_bswap32_i64    1
++#define TCG_TARGET_HAS_bswap64_i64    1
++#define TCG_TARGET_HAS_not_i64        HAVE_FACILITY(MISC_INSN_EXT3)
++#define TCG_TARGET_HAS_andc_i64       HAVE_FACILITY(MISC_INSN_EXT3)
++#define TCG_TARGET_HAS_orc_i64        HAVE_FACILITY(MISC_INSN_EXT3)
++#define TCG_TARGET_HAS_eqv_i64        HAVE_FACILITY(MISC_INSN_EXT3)
++#define TCG_TARGET_HAS_nand_i64       HAVE_FACILITY(MISC_INSN_EXT3)
++#define TCG_TARGET_HAS_nor_i64        HAVE_FACILITY(MISC_INSN_EXT3)
++#define TCG_TARGET_HAS_clz_i64        1
++#define TCG_TARGET_HAS_ctz_i64        0
++#define TCG_TARGET_HAS_ctpop_i64      1
++#define TCG_TARGET_HAS_deposit_i64    1
++#define TCG_TARGET_HAS_extract_i64    1
++#define TCG_TARGET_HAS_sextract_i64   0
++#define TCG_TARGET_HAS_extract2_i64   0
++#define TCG_TARGET_HAS_negsetcond_i64 1
++#define TCG_TARGET_HAS_add2_i64       1
++#define TCG_TARGET_HAS_sub2_i64       1
++#define TCG_TARGET_HAS_mulu2_i64      1
++#define TCG_TARGET_HAS_muls2_i64      HAVE_FACILITY(MISC_INSN_EXT2)
++#define TCG_TARGET_HAS_muluh_i64      0
++#define TCG_TARGET_HAS_mulsh_i64      0
++
++#define TCG_TARGET_HAS_qemu_ldst_i128 1
++
++#define TCG_TARGET_HAS_tst            1
++
++#define TCG_TARGET_HAS_v64            HAVE_FACILITY(VECTOR)
++#define TCG_TARGET_HAS_v128           HAVE_FACILITY(VECTOR)
++#define TCG_TARGET_HAS_v256           0
++
++#define TCG_TARGET_HAS_andc_vec       1
++#define TCG_TARGET_HAS_orc_vec        HAVE_FACILITY(VECTOR_ENH1)
++#define TCG_TARGET_HAS_nand_vec       HAVE_FACILITY(VECTOR_ENH1)
++#define TCG_TARGET_HAS_nor_vec        1
++#define TCG_TARGET_HAS_eqv_vec        HAVE_FACILITY(VECTOR_ENH1)
++#define TCG_TARGET_HAS_not_vec        1
++#define TCG_TARGET_HAS_neg_vec        1
++#define TCG_TARGET_HAS_abs_vec        1
++#define TCG_TARGET_HAS_roti_vec       1
++#define TCG_TARGET_HAS_rots_vec       1
++#define TCG_TARGET_HAS_rotv_vec       1
++#define TCG_TARGET_HAS_shi_vec        1
++#define TCG_TARGET_HAS_shs_vec        1
++#define TCG_TARGET_HAS_shv_vec        1
++#define TCG_TARGET_HAS_mul_vec        1
++#define TCG_TARGET_HAS_sat_vec        0
++#define TCG_TARGET_HAS_minmax_vec     1
++#define TCG_TARGET_HAS_bitsel_vec     1
++#define TCG_TARGET_HAS_cmpsel_vec     1
++#define TCG_TARGET_HAS_tst_vec        0
++
++#endif
+diff --git a/tcg/s390x/tcg-target.h b/tcg/s390x/tcg-target.h
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/s390x/tcg-target.h
++++ b/tcg/s390x/tcg-target.h
+@@ -XXX,XX +XXX,XX @@ typedef enum TCGReg {
+ #define TCG_TARGET_NB_REGS 64
+-/* Facilities required for proper operation; checked at startup. */
+-
+-#define FACILITY_ZARCH_ACTIVE         2
+-#define FACILITY_LONG_DISP            18
+-#define FACILITY_EXT_IMM              21
+-#define FACILITY_GEN_INST_EXT         34
+-#define FACILITY_45                   45
+-
+-/* Facilities that are checked at runtime. */
+-
+-#define FACILITY_LOAD_ON_COND2        53
+-#define FACILITY_MISC_INSN_EXT2       58
+-#define FACILITY_MISC_INSN_EXT3       61
+-#define FACILITY_VECTOR               129
+-#define FACILITY_VECTOR_ENH1          135
+-
+-extern uint64_t s390_facilities[3];
+-
+-#define HAVE_FACILITY(X) \
+-    ((s390_facilities[FACILITY_##X / 64] >> (63 - FACILITY_##X % 64)) & 1)
+-
+-/* optional instructions */
+-#define TCG_TARGET_HAS_div2_i32       1
+-#define TCG_TARGET_HAS_rot_i32        1
+-#define TCG_TARGET_HAS_ext8s_i32      1
+-#define TCG_TARGET_HAS_ext16s_i32     1
+-#define TCG_TARGET_HAS_ext8u_i32      1
+-#define TCG_TARGET_HAS_ext16u_i32     1
+-#define TCG_TARGET_HAS_bswap16_i32    1
+-#define TCG_TARGET_HAS_bswap32_i32    1
+-#define TCG_TARGET_HAS_not_i32        HAVE_FACILITY(MISC_INSN_EXT3)
+-#define TCG_TARGET_HAS_andc_i32       HAVE_FACILITY(MISC_INSN_EXT3)
+-#define TCG_TARGET_HAS_orc_i32        HAVE_FACILITY(MISC_INSN_EXT3)
+-#define TCG_TARGET_HAS_eqv_i32        HAVE_FACILITY(MISC_INSN_EXT3)
+-#define TCG_TARGET_HAS_nand_i32       HAVE_FACILITY(MISC_INSN_EXT3)
+-#define TCG_TARGET_HAS_nor_i32        HAVE_FACILITY(MISC_INSN_EXT3)
+-#define TCG_TARGET_HAS_clz_i32        0
+-#define TCG_TARGET_HAS_ctz_i32        0
+-#define TCG_TARGET_HAS_ctpop_i32      1
+-#define TCG_TARGET_HAS_deposit_i32    1
+-#define TCG_TARGET_HAS_extract_i32    1
+-#define TCG_TARGET_HAS_sextract_i32   0
+-#define TCG_TARGET_HAS_extract2_i32   0
+-#define TCG_TARGET_HAS_negsetcond_i32 1
+-#define TCG_TARGET_HAS_add2_i32       1
+-#define TCG_TARGET_HAS_sub2_i32       1
+-#define TCG_TARGET_HAS_mulu2_i32      0
+-#define TCG_TARGET_HAS_muls2_i32      0
+-#define TCG_TARGET_HAS_muluh_i32      0
+-#define TCG_TARGET_HAS_mulsh_i32      0
+-#define TCG_TARGET_HAS_extr_i64_i32   0
+-#define TCG_TARGET_HAS_qemu_st8_i32   0
+-
+-#define TCG_TARGET_HAS_div2_i64       1
+-#define TCG_TARGET_HAS_rot_i64        1
+-#define TCG_TARGET_HAS_ext8s_i64      1
+-#define TCG_TARGET_HAS_ext16s_i64     1
+-#define TCG_TARGET_HAS_ext32s_i64     1
+-#define TCG_TARGET_HAS_ext8u_i64      1
+-#define TCG_TARGET_HAS_ext16u_i64     1
+-#define TCG_TARGET_HAS_ext32u_i64     1
+-#define TCG_TARGET_HAS_bswap16_i64    1
+-#define TCG_TARGET_HAS_bswap32_i64    1
+-#define TCG_TARGET_HAS_bswap64_i64    1
+-#define TCG_TARGET_HAS_not_i64        HAVE_FACILITY(MISC_INSN_EXT3)
+-#define TCG_TARGET_HAS_andc_i64       HAVE_FACILITY(MISC_INSN_EXT3)
+-#define TCG_TARGET_HAS_orc_i64        HAVE_FACILITY(MISC_INSN_EXT3)
+-#define TCG_TARGET_HAS_eqv_i64        HAVE_FACILITY(MISC_INSN_EXT3)
+-#define TCG_TARGET_HAS_nand_i64       HAVE_FACILITY(MISC_INSN_EXT3)
+-#define TCG_TARGET_HAS_nor_i64        HAVE_FACILITY(MISC_INSN_EXT3)
+-#define TCG_TARGET_HAS_clz_i64        1
+-#define TCG_TARGET_HAS_ctz_i64        0
+-#define TCG_TARGET_HAS_ctpop_i64      1
+-#define TCG_TARGET_HAS_deposit_i64    1
+-#define TCG_TARGET_HAS_extract_i64    1
+-#define TCG_TARGET_HAS_sextract_i64   0
+-#define TCG_TARGET_HAS_extract2_i64   0
+-#define TCG_TARGET_HAS_negsetcond_i64 1
+-#define TCG_TARGET_HAS_add2_i64       1
+-#define TCG_TARGET_HAS_sub2_i64       1
+-#define TCG_TARGET_HAS_mulu2_i64      1
+-#define TCG_TARGET_HAS_muls2_i64      HAVE_FACILITY(MISC_INSN_EXT2)
+-#define TCG_TARGET_HAS_muluh_i64      0
+-#define TCG_TARGET_HAS_mulsh_i64      0
+-
+-#define TCG_TARGET_HAS_qemu_ldst_i128 1
+-
+-#define TCG_TARGET_HAS_tst            1
+-
+-#define TCG_TARGET_HAS_v64            HAVE_FACILITY(VECTOR)
+-#define TCG_TARGET_HAS_v128           HAVE_FACILITY(VECTOR)
+-#define TCG_TARGET_HAS_v256           0
+-
+-#define TCG_TARGET_HAS_andc_vec       1
+-#define TCG_TARGET_HAS_orc_vec        HAVE_FACILITY(VECTOR_ENH1)
+-#define TCG_TARGET_HAS_nand_vec       HAVE_FACILITY(VECTOR_ENH1)
+-#define TCG_TARGET_HAS_nor_vec        1
+-#define TCG_TARGET_HAS_eqv_vec        HAVE_FACILITY(VECTOR_ENH1)
+-#define TCG_TARGET_HAS_not_vec        1
+-#define TCG_TARGET_HAS_neg_vec        1
+-#define TCG_TARGET_HAS_abs_vec        1
+-#define TCG_TARGET_HAS_roti_vec       1
+-#define TCG_TARGET_HAS_rots_vec       1
+-#define TCG_TARGET_HAS_rotv_vec       1
+-#define TCG_TARGET_HAS_shi_vec        1
+-#define TCG_TARGET_HAS_shs_vec        1
+-#define TCG_TARGET_HAS_shv_vec        1
+-#define TCG_TARGET_HAS_mul_vec        1
+-#define TCG_TARGET_HAS_sat_vec        0
+-#define TCG_TARGET_HAS_minmax_vec     1
+-#define TCG_TARGET_HAS_bitsel_vec     1
+-#define TCG_TARGET_HAS_cmpsel_vec     1
+-#define TCG_TARGET_HAS_tst_vec        0
++#include "tcg-target-has.h"
+ #define TCG_TARGET_DEFAULT_MO (TCG_MO_ALL & ~TCG_MO_ST_LD)
+--
+.43.0

-New patch
+[PULL 29/68] tcg/sparc64: Extract TCG_TARGET_HAS_foo defs to 'tcg-target-has.h'
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Signed-off-by: Philippe Mathieu-Daudé <philmd@linaro.org>
+Message-ID: <20250108215156.8731-12-philmd@linaro.org>
+---
+ tcg/sparc64/tcg-target-has.h | 86 ++++++++++++++++++++++++++++++++++++
+ tcg/sparc64/tcg-target.h     | 78 +-------------------------------
+files changed, 88 insertions(+), 76 deletions(-)
+ create mode 100644 tcg/sparc64/tcg-target-has.h
+diff --git a/tcg/sparc64/tcg-target-has.h b/tcg/sparc64/tcg-target-has.h
+new file mode 100644
+index XXXXXXX..XXXXXXX
+--- /dev/null
++++ b/tcg/sparc64/tcg-target-has.h
+@@ -XXX,XX +XXX,XX @@
++/* SPDX-License-Identifier: MIT */
++/*
++ * Define target-specific opcode support
++ * Copyright (c) 2008 Fabrice Bellard
++ */
++
++#ifndef TCG_TARGET_HAS_H
++#define TCG_TARGET_HAS_H
++
++#if defined(__VIS__) && __VIS__ >= 0x300
++#define use_vis3_instructions  1
++#else
++extern bool use_vis3_instructions;
++#endif
++
++/* optional instructions */
++#define TCG_TARGET_HAS_div_i32        1
++#define TCG_TARGET_HAS_rem_i32        0
++#define TCG_TARGET_HAS_rot_i32          0
++#define TCG_TARGET_HAS_ext8s_i32        0
++#define TCG_TARGET_HAS_ext16s_i32       0
++#define TCG_TARGET_HAS_ext8u_i32        0
++#define TCG_TARGET_HAS_ext16u_i32       0
++#define TCG_TARGET_HAS_bswap16_i32      0
++#define TCG_TARGET_HAS_bswap32_i32      0
++#define TCG_TARGET_HAS_not_i32          1
++#define TCG_TARGET_HAS_andc_i32         1
++#define TCG_TARGET_HAS_orc_i32          1
++#define TCG_TARGET_HAS_eqv_i32          0
++#define TCG_TARGET_HAS_nand_i32         0
++#define TCG_TARGET_HAS_nor_i32          0
++#define TCG_TARGET_HAS_clz_i32          0
++#define TCG_TARGET_HAS_ctz_i32          0
++#define TCG_TARGET_HAS_ctpop_i32        0
++#define TCG_TARGET_HAS_deposit_i32      0
++#define TCG_TARGET_HAS_extract_i32      0
++#define TCG_TARGET_HAS_sextract_i32     0
++#define TCG_TARGET_HAS_extract2_i32     0
++#define TCG_TARGET_HAS_negsetcond_i32   1
++#define TCG_TARGET_HAS_add2_i32         1
++#define TCG_TARGET_HAS_sub2_i32         1
++#define TCG_TARGET_HAS_mulu2_i32        1
++#define TCG_TARGET_HAS_muls2_i32        1
++#define TCG_TARGET_HAS_muluh_i32        0
++#define TCG_TARGET_HAS_mulsh_i32        0
++#define TCG_TARGET_HAS_qemu_st8_i32     0
++
++#define TCG_TARGET_HAS_extr_i64_i32     0
++#define TCG_TARGET_HAS_div_i64          1
++#define TCG_TARGET_HAS_rem_i64          0
++#define TCG_TARGET_HAS_rot_i64          0
++#define TCG_TARGET_HAS_ext8s_i64        0
++#define TCG_TARGET_HAS_ext16s_i64       0
++#define TCG_TARGET_HAS_ext32s_i64       1
++#define TCG_TARGET_HAS_ext8u_i64        0
++#define TCG_TARGET_HAS_ext16u_i64       0
++#define TCG_TARGET_HAS_ext32u_i64       1
++#define TCG_TARGET_HAS_bswap16_i64      0
++#define TCG_TARGET_HAS_bswap32_i64      0
++#define TCG_TARGET_HAS_bswap64_i64      0
++#define TCG_TARGET_HAS_not_i64          1
++#define TCG_TARGET_HAS_andc_i64         1
++#define TCG_TARGET_HAS_orc_i64          1
++#define TCG_TARGET_HAS_eqv_i64          0
++#define TCG_TARGET_HAS_nand_i64         0
++#define TCG_TARGET_HAS_nor_i64          0
++#define TCG_TARGET_HAS_clz_i64          0
++#define TCG_TARGET_HAS_ctz_i64          0
++#define TCG_TARGET_HAS_ctpop_i64        0
++#define TCG_TARGET_HAS_deposit_i64      0
++#define TCG_TARGET_HAS_extract_i64      0
++#define TCG_TARGET_HAS_sextract_i64     0
++#define TCG_TARGET_HAS_extract2_i64     0
++#define TCG_TARGET_HAS_negsetcond_i64   1
++#define TCG_TARGET_HAS_add2_i64         1
++#define TCG_TARGET_HAS_sub2_i64         1
++#define TCG_TARGET_HAS_mulu2_i64        0
++#define TCG_TARGET_HAS_muls2_i64        0
++#define TCG_TARGET_HAS_muluh_i64        use_vis3_instructions
++#define TCG_TARGET_HAS_mulsh_i64        0
++
++#define TCG_TARGET_HAS_qemu_ldst_i128   0
++
++#define TCG_TARGET_HAS_tst              1
++
++#endif
+diff --git a/tcg/sparc64/tcg-target.h b/tcg/sparc64/tcg-target.h
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/sparc64/tcg-target.h
++++ b/tcg/sparc64/tcg-target.h
+@@ -XXX,XX +XXX,XX @@ typedef enum {
+     TCG_REG_I7,
+ } TCGReg;
+-#if defined(__VIS__) && __VIS__ >= 0x300
+-#define use_vis3_instructions  1
+-#else
+-extern bool use_vis3_instructions;
+-#endif
+-
+-/* optional instructions */
+-#define TCG_TARGET_HAS_div_i32        1
+-#define TCG_TARGET_HAS_rem_i32        0
+-#define TCG_TARGET_HAS_rot_i32          0
+-#define TCG_TARGET_HAS_ext8s_i32        0
+-#define TCG_TARGET_HAS_ext16s_i32       0
+-#define TCG_TARGET_HAS_ext8u_i32        0
+-#define TCG_TARGET_HAS_ext16u_i32       0
+-#define TCG_TARGET_HAS_bswap16_i32      0
+-#define TCG_TARGET_HAS_bswap32_i32      0
+-#define TCG_TARGET_HAS_not_i32          1
+-#define TCG_TARGET_HAS_andc_i32         1
+-#define TCG_TARGET_HAS_orc_i32          1
+-#define TCG_TARGET_HAS_eqv_i32          0
+-#define TCG_TARGET_HAS_nand_i32         0
+-#define TCG_TARGET_HAS_nor_i32          0
+-#define TCG_TARGET_HAS_clz_i32          0
+-#define TCG_TARGET_HAS_ctz_i32          0
+-#define TCG_TARGET_HAS_ctpop_i32        0
+-#define TCG_TARGET_HAS_deposit_i32      0
+-#define TCG_TARGET_HAS_extract_i32      0
+-#define TCG_TARGET_HAS_sextract_i32     0
+-#define TCG_TARGET_HAS_extract2_i32     0
+-#define TCG_TARGET_HAS_negsetcond_i32   1
+-#define TCG_TARGET_HAS_add2_i32         1
+-#define TCG_TARGET_HAS_sub2_i32         1
+-#define TCG_TARGET_HAS_mulu2_i32        1
+-#define TCG_TARGET_HAS_muls2_i32        1
+-#define TCG_TARGET_HAS_muluh_i32        0
+-#define TCG_TARGET_HAS_mulsh_i32        0
+-#define TCG_TARGET_HAS_qemu_st8_i32     0
+-
+-#define TCG_TARGET_HAS_extr_i64_i32     0
+-#define TCG_TARGET_HAS_div_i64          1
+-#define TCG_TARGET_HAS_rem_i64          0
+-#define TCG_TARGET_HAS_rot_i64          0
+-#define TCG_TARGET_HAS_ext8s_i64        0
+-#define TCG_TARGET_HAS_ext16s_i64       0
+-#define TCG_TARGET_HAS_ext32s_i64       1
+-#define TCG_TARGET_HAS_ext8u_i64        0
+-#define TCG_TARGET_HAS_ext16u_i64       0
+-#define TCG_TARGET_HAS_ext32u_i64       1
+-#define TCG_TARGET_HAS_bswap16_i64      0
+-#define TCG_TARGET_HAS_bswap32_i64      0
+-#define TCG_TARGET_HAS_bswap64_i64      0
+-#define TCG_TARGET_HAS_not_i64          1
+-#define TCG_TARGET_HAS_andc_i64         1
+-#define TCG_TARGET_HAS_orc_i64          1
+-#define TCG_TARGET_HAS_eqv_i64          0
+-#define TCG_TARGET_HAS_nand_i64         0
+-#define TCG_TARGET_HAS_nor_i64          0
+-#define TCG_TARGET_HAS_clz_i64          0
+-#define TCG_TARGET_HAS_ctz_i64          0
+-#define TCG_TARGET_HAS_ctpop_i64        0
+-#define TCG_TARGET_HAS_deposit_i64      0
+-#define TCG_TARGET_HAS_extract_i64      0
+-#define TCG_TARGET_HAS_sextract_i64     0
+-#define TCG_TARGET_HAS_extract2_i64     0
+-#define TCG_TARGET_HAS_negsetcond_i64   1
+-#define TCG_TARGET_HAS_add2_i64         1
+-#define TCG_TARGET_HAS_sub2_i64         1
+-#define TCG_TARGET_HAS_mulu2_i64        0
+-#define TCG_TARGET_HAS_muls2_i64        0
+-#define TCG_TARGET_HAS_muluh_i64        use_vis3_instructions
+-#define TCG_TARGET_HAS_mulsh_i64        0
+-
+-#define TCG_TARGET_HAS_qemu_ldst_i128   0
+-
+-#define TCG_TARGET_HAS_tst              1
+-
+ #define TCG_AREG0 TCG_REG_I0
++#include "tcg-target-has.h"
++
+ #define TCG_TARGET_DEFAULT_MO (0)
+ #endif
+--
+.43.0

-New patch
+[PULL 30/68] tcg/tci: Extract TCG_TARGET_HAS_foo defs to 'tcg-target-has.h'
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Signed-off-by: Philippe Mathieu-Daudé <philmd@linaro.org>
+Message-ID: <20250108215156.8731-13-philmd@linaro.org>
+---
+ tcg/tci/tcg-target-has.h | 83 ++++++++++++++++++++++++++++++++++++++++
+ tcg/tci/tcg-target.h     | 75 +-----------------------------------
+files changed, 84 insertions(+), 74 deletions(-)
+ create mode 100644 tcg/tci/tcg-target-has.h
+diff --git a/tcg/tci/tcg-target-has.h b/tcg/tci/tcg-target-has.h
+new file mode 100644
+index XXXXXXX..XXXXXXX
+--- /dev/null
++++ b/tcg/tci/tcg-target-has.h
+@@ -XXX,XX +XXX,XX @@
++/* SPDX-License-Identifier: MIT */
++/*
++ * Define target-specific opcode support
++ * Copyright (c) 2009, 2011 Stefan Weil
++ */
++
++#ifndef TCG_TARGET_HAS_H
++#define TCG_TARGET_HAS_H
++
++#define TCG_TARGET_HAS_bswap16_i32      1
++#define TCG_TARGET_HAS_bswap32_i32      1
++#define TCG_TARGET_HAS_div_i32          1
++#define TCG_TARGET_HAS_rem_i32          1
++#define TCG_TARGET_HAS_ext8s_i32        1
++#define TCG_TARGET_HAS_ext16s_i32       1
++#define TCG_TARGET_HAS_ext8u_i32        1
++#define TCG_TARGET_HAS_ext16u_i32       1
++#define TCG_TARGET_HAS_andc_i32         1
++#define TCG_TARGET_HAS_deposit_i32      1
++#define TCG_TARGET_HAS_extract_i32      1
++#define TCG_TARGET_HAS_sextract_i32     1
++#define TCG_TARGET_HAS_extract2_i32     0
++#define TCG_TARGET_HAS_eqv_i32          1
++#define TCG_TARGET_HAS_nand_i32         1
++#define TCG_TARGET_HAS_nor_i32          1
++#define TCG_TARGET_HAS_clz_i32          1
++#define TCG_TARGET_HAS_ctz_i32          1
++#define TCG_TARGET_HAS_ctpop_i32        1
++#define TCG_TARGET_HAS_not_i32          1
++#define TCG_TARGET_HAS_orc_i32          1
++#define TCG_TARGET_HAS_rot_i32          1
++#define TCG_TARGET_HAS_negsetcond_i32   0
++#define TCG_TARGET_HAS_muls2_i32        1
++#define TCG_TARGET_HAS_muluh_i32        0
++#define TCG_TARGET_HAS_mulsh_i32        0
++#define TCG_TARGET_HAS_qemu_st8_i32     0
++
++#if TCG_TARGET_REG_BITS == 64
++#define TCG_TARGET_HAS_extr_i64_i32     0
++#define TCG_TARGET_HAS_bswap16_i64      1
++#define TCG_TARGET_HAS_bswap32_i64      1
++#define TCG_TARGET_HAS_bswap64_i64      1
++#define TCG_TARGET_HAS_deposit_i64      1
++#define TCG_TARGET_HAS_extract_i64      1
++#define TCG_TARGET_HAS_sextract_i64     1
++#define TCG_TARGET_HAS_extract2_i64     0
++#define TCG_TARGET_HAS_div_i64          1
++#define TCG_TARGET_HAS_rem_i64          1
++#define TCG_TARGET_HAS_ext8s_i64        1
++#define TCG_TARGET_HAS_ext16s_i64       1
++#define TCG_TARGET_HAS_ext32s_i64       1
++#define TCG_TARGET_HAS_ext8u_i64        1
++#define TCG_TARGET_HAS_ext16u_i64       1
++#define TCG_TARGET_HAS_ext32u_i64       1
++#define TCG_TARGET_HAS_andc_i64         1
++#define TCG_TARGET_HAS_eqv_i64          1
++#define TCG_TARGET_HAS_nand_i64         1
++#define TCG_TARGET_HAS_nor_i64          1
++#define TCG_TARGET_HAS_clz_i64          1
++#define TCG_TARGET_HAS_ctz_i64          1
++#define TCG_TARGET_HAS_ctpop_i64        1
++#define TCG_TARGET_HAS_not_i64          1
++#define TCG_TARGET_HAS_orc_i64          1
++#define TCG_TARGET_HAS_rot_i64          1
++#define TCG_TARGET_HAS_negsetcond_i64   0
++#define TCG_TARGET_HAS_muls2_i64        1
++#define TCG_TARGET_HAS_add2_i32         1
++#define TCG_TARGET_HAS_sub2_i32         1
++#define TCG_TARGET_HAS_mulu2_i32        1
++#define TCG_TARGET_HAS_add2_i64         1
++#define TCG_TARGET_HAS_sub2_i64         1
++#define TCG_TARGET_HAS_mulu2_i64        1
++#define TCG_TARGET_HAS_muluh_i64        0
++#define TCG_TARGET_HAS_mulsh_i64        0
++#else
++#define TCG_TARGET_HAS_mulu2_i32        1
++#endif /* TCG_TARGET_REG_BITS == 64 */
++
++#define TCG_TARGET_HAS_qemu_ldst_i128   0
++
++#define TCG_TARGET_HAS_tst              1
++
++#endif
+diff --git a/tcg/tci/tcg-target.h b/tcg/tci/tcg-target.h
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/tci/tcg-target.h
++++ b/tcg/tci/tcg-target.h
+@@ -XXX,XX +XXX,XX @@
+ #define TCG_TARGET_INSN_UNIT_SIZE 4
+ #define MAX_CODE_GEN_BUFFER_SIZE  ((size_t)-1)
+-/* Optional instructions. */
+-
+-#define TCG_TARGET_HAS_bswap16_i32      1
+-#define TCG_TARGET_HAS_bswap32_i32      1
+-#define TCG_TARGET_HAS_div_i32          1
+-#define TCG_TARGET_HAS_rem_i32          1
+-#define TCG_TARGET_HAS_ext8s_i32        1
+-#define TCG_TARGET_HAS_ext16s_i32       1
+-#define TCG_TARGET_HAS_ext8u_i32        1
+-#define TCG_TARGET_HAS_ext16u_i32       1
+-#define TCG_TARGET_HAS_andc_i32         1
+-#define TCG_TARGET_HAS_deposit_i32      1
+-#define TCG_TARGET_HAS_extract_i32      1
+-#define TCG_TARGET_HAS_sextract_i32     1
+-#define TCG_TARGET_HAS_extract2_i32     0
+-#define TCG_TARGET_HAS_eqv_i32          1
+-#define TCG_TARGET_HAS_nand_i32         1
+-#define TCG_TARGET_HAS_nor_i32          1
+-#define TCG_TARGET_HAS_clz_i32          1
+-#define TCG_TARGET_HAS_ctz_i32          1
+-#define TCG_TARGET_HAS_ctpop_i32        1
+-#define TCG_TARGET_HAS_not_i32          1
+-#define TCG_TARGET_HAS_orc_i32          1
+-#define TCG_TARGET_HAS_rot_i32          1
+-#define TCG_TARGET_HAS_negsetcond_i32   0
+-#define TCG_TARGET_HAS_muls2_i32        1
+-#define TCG_TARGET_HAS_muluh_i32        0
+-#define TCG_TARGET_HAS_mulsh_i32        0
+-#define TCG_TARGET_HAS_qemu_st8_i32     0
+-
+-#if TCG_TARGET_REG_BITS == 64
+-#define TCG_TARGET_HAS_extr_i64_i32     0
+-#define TCG_TARGET_HAS_bswap16_i64      1
+-#define TCG_TARGET_HAS_bswap32_i64      1
+-#define TCG_TARGET_HAS_bswap64_i64      1
+-#define TCG_TARGET_HAS_deposit_i64      1
+-#define TCG_TARGET_HAS_extract_i64      1
+-#define TCG_TARGET_HAS_sextract_i64     1
+-#define TCG_TARGET_HAS_extract2_i64     0
+-#define TCG_TARGET_HAS_div_i64          1
+-#define TCG_TARGET_HAS_rem_i64          1
+-#define TCG_TARGET_HAS_ext8s_i64        1
+-#define TCG_TARGET_HAS_ext16s_i64       1
+-#define TCG_TARGET_HAS_ext32s_i64       1
+-#define TCG_TARGET_HAS_ext8u_i64        1
+-#define TCG_TARGET_HAS_ext16u_i64       1
+-#define TCG_TARGET_HAS_ext32u_i64       1
+-#define TCG_TARGET_HAS_andc_i64         1
+-#define TCG_TARGET_HAS_eqv_i64          1
+-#define TCG_TARGET_HAS_nand_i64         1
+-#define TCG_TARGET_HAS_nor_i64          1
+-#define TCG_TARGET_HAS_clz_i64          1
+-#define TCG_TARGET_HAS_ctz_i64          1
+-#define TCG_TARGET_HAS_ctpop_i64        1
+-#define TCG_TARGET_HAS_not_i64          1
+-#define TCG_TARGET_HAS_orc_i64          1
+-#define TCG_TARGET_HAS_rot_i64          1
+-#define TCG_TARGET_HAS_negsetcond_i64   0
+-#define TCG_TARGET_HAS_muls2_i64        1
+-#define TCG_TARGET_HAS_add2_i32         1
+-#define TCG_TARGET_HAS_sub2_i32         1
+-#define TCG_TARGET_HAS_mulu2_i32        1
+-#define TCG_TARGET_HAS_add2_i64         1
+-#define TCG_TARGET_HAS_sub2_i64         1
+-#define TCG_TARGET_HAS_mulu2_i64        1
+-#define TCG_TARGET_HAS_muluh_i64        0
+-#define TCG_TARGET_HAS_mulsh_i64        0
+-#else
+-#define TCG_TARGET_HAS_mulu2_i32        1
+-#endif /* TCG_TARGET_REG_BITS == 64 */
+-
+-#define TCG_TARGET_HAS_qemu_ldst_i128   0
+-
+-#define TCG_TARGET_HAS_tst              1
++#include "tcg-target-has.h"
+ /* Number of registers available. */
+ #define TCG_TARGET_NB_REGS 16
+--
+.43.0

-[PULL 21/40] target/arm: Use tcg_gen_atomic_cmpxchg_i128 for CASP
+[PULL 31/68] tcg: Include 'tcg-target-has.h' once in 'tcg-has.h'
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Signed-off-by: Philippe Mathieu-Daudé <philmd@linaro.org>
-Message-Id: <20221112042555.2622152-3-richard.henderson@linaro.org>
+Message-ID: <20250108215156.8731-14-philmd@linaro.org>
 ---
- target/arm/helper-a64.h    |  2 --
+ tcg/aarch64/tcg-target.h     | 2 --
- target/arm/helper-a64.c    | 43 ---------------------------
+ tcg/arm/tcg-target.h         | 2 --
- target/arm/translate-a64.c | 61 +++++++++++---------------------------
+ tcg/i386/tcg-target.h        | 2 --
-files changed, 18 insertions(+), 88 deletions(-)
+ tcg/loongarch64/tcg-target.h | 2 --
  tcg/mips/tcg-target.h        | 2 --
  tcg/ppc/tcg-target.h         | 2 --
  tcg/riscv/tcg-target.h       | 2 --
  tcg/s390x/tcg-target.h       | 2 --
  tcg/sparc64/tcg-target.h     | 2 --
  tcg/tcg-has.h                | 2 ++
  tcg/tci/tcg-target.h         | 2 --
 files changed, 2 insertions(+), 20 deletions(-)
-diff --git a/target/arm/helper-a64.h b/target/arm/helper-a64.h
+diff --git a/tcg/aarch64/tcg-target.h b/tcg/aarch64/tcg-target.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper-a64.h
+--- a/tcg/aarch64/tcg-target.h
-+++ b/target/arm/helper-a64.h
++++ b/tcg/aarch64/tcg-target.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_2(frecpx_f16, TCG_CALL_NO_RWG, f16, f16, ptr)
+@@ -XXX,XX +XXX,XX @@ typedef enum {
- DEF_HELPER_FLAGS_2(fcvtx_f64_to_f32, TCG_CALL_NO_RWG, f32, f64, env)
- DEF_HELPER_FLAGS_3(crc32_64, TCG_CALL_NO_RWG_SE, i64, i64, i64, i32)
+ #define TCG_TARGET_NB_REGS 64
- DEF_HELPER_FLAGS_3(crc32c_64, TCG_CALL_NO_RWG_SE, i64, i64, i64, i32)
--DEF_HELPER_5(casp_le_parallel, void, env, i32, i64, i64, i64)
+-#include "tcg-target-has.h"
--DEF_HELPER_5(casp_be_parallel, void, env, i32, i64, i64, i64)
+-
- DEF_HELPER_FLAGS_3(advsimd_maxh, TCG_CALL_NO_RWG, f16, f16, f16, ptr)
+ #define TCG_TARGET_DEFAULT_MO (0)
- DEF_HELPER_FLAGS_3(advsimd_minh, TCG_CALL_NO_RWG, f16, f16, f16, ptr)
- DEF_HELPER_FLAGS_3(advsimd_maxnumh, TCG_CALL_NO_RWG, f16, f16, f16, ptr)
+ #endif /* AARCH64_TCG_TARGET_H */
-diff --git a/target/arm/helper-a64.c b/target/arm/helper-a64.c
+diff --git a/tcg/arm/tcg-target.h b/tcg/arm/tcg-target.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper-a64.c
+--- a/tcg/arm/tcg-target.h
-+++ b/target/arm/helper-a64.c
++++ b/tcg/arm/tcg-target.h
-@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(crc32c_64)(uint64_t acc, uint64_t val, uint32_t bytes)
+@@ -XXX,XX +XXX,XX @@ typedef enum {
-     return crc32c(acc, buf, bytes) ^ 0xffffffff;
- }
+ #define TCG_TARGET_NB_REGS 32
--/* Writes back the old data into Rs.  */
+-#include "tcg-target-has.h"
 -void HELPER(casp_le_parallel)(CPUARMState *env, uint32_t rs, uint64_t addr,
 -                              uint64_t new_lo, uint64_t new_hi)
 -{
 -    Int128 oldv, cmpv, newv;
 -    uintptr_t ra = GETPC();
 -    int mem_idx;
 -    MemOpIdx oi;
 -
--    assert(HAVE_CMPXCHG128);
+ #define TCG_TARGET_DEFAULT_MO (0)
  #endif
 diff --git a/tcg/i386/tcg-target.h b/tcg/i386/tcg-target.h
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/i386/tcg-target.h
 +++ b/tcg/i386/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
      TCG_REG_CALL_STACK = TCG_REG_ESP
  } TCGReg;
 -#include "tcg-target-has.h"
 -
--    mem_idx = cpu_mmu_index(env, false);
+ /* This defines the natural memory order supported by this
--    oi = make_memop_idx(MO_LE | MO_128 | MO_ALIGN, mem_idx);
+  * architecture before guarantees made by various barrier
   * instructions.
 diff --git a/tcg/loongarch64/tcg-target.h b/tcg/loongarch64/tcg-target.h
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/loongarch64/tcg-target.h
 +++ b/tcg/loongarch64/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
      TCG_VEC_TMP0 = TCG_REG_V23,
  } TCGReg;
 -#include "tcg-target-has.h"
 -
--    cmpv = int128_make128(env->xregs[rs], env->xregs[rs + 1]);
+ #define TCG_TARGET_DEFAULT_MO (0)
--    newv = int128_make128(new_lo, new_hi);
--    oldv = cpu_atomic_cmpxchgo_le_mmu(env, addr, cmpv, newv, oi, ra);
+ #endif /* LOONGARCH_TCG_TARGET_H */
 diff --git a/tcg/mips/tcg-target.h b/tcg/mips/tcg-target.h
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/mips/tcg-target.h
 +++ b/tcg/mips/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
      TCG_AREG0 = TCG_REG_S8,
  } TCGReg;
 -#include "tcg-target-has.h"
 -
--    env->xregs[rs] = int128_getlo(oldv);
+ #define TCG_TARGET_DEFAULT_MO           0
--    env->xregs[rs + 1] = int128_gethi(oldv);
--}
+ #endif
 diff --git a/tcg/ppc/tcg-target.h b/tcg/ppc/tcg-target.h
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/ppc/tcg-target.h
 +++ b/tcg/ppc/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
      TCG_AREG0 = TCG_REG_R27
  } TCGReg;
 -#include "tcg-target-has.h"
 -
--void HELPER(casp_be_parallel)(CPUARMState *env, uint32_t rs, uint64_t addr,
+ #define TCG_TARGET_DEFAULT_MO (0)
--                              uint64_t new_hi, uint64_t new_lo)
--{
+ #endif
--    Int128 oldv, cmpv, newv;
+diff --git a/tcg/riscv/tcg-target.h b/tcg/riscv/tcg-target.h
--    uintptr_t ra = GETPC();
+index XXXXXXX..XXXXXXX 100644
--    int mem_idx;
+--- a/tcg/riscv/tcg-target.h
--    MemOpIdx oi;
++++ b/tcg/riscv/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
      TCG_REG_TMP2       = TCG_REG_T4,
  } TCGReg;
 -#include "tcg-target-has.h"
 -
--    assert(HAVE_CMPXCHG128);
+ #define TCG_TARGET_DEFAULT_MO (0)
  #endif
 diff --git a/tcg/s390x/tcg-target.h b/tcg/s390x/tcg-target.h
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/s390x/tcg-target.h
 +++ b/tcg/s390x/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum TCGReg {
  #define TCG_TARGET_NB_REGS 64
 -#include "tcg-target-has.h"
 -
--    mem_idx = cpu_mmu_index(env, false);
+ #define TCG_TARGET_DEFAULT_MO (TCG_MO_ALL & ~TCG_MO_ST_LD)
--    oi = make_memop_idx(MO_LE | MO_128 | MO_ALIGN, mem_idx);
  #endif
 diff --git a/tcg/sparc64/tcg-target.h b/tcg/sparc64/tcg-target.h
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/sparc64/tcg-target.h
 +++ b/tcg/sparc64/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
  #define TCG_AREG0 TCG_REG_I0
 -#include "tcg-target-has.h"
 -
--    cmpv = int128_make128(env->xregs[rs + 1], env->xregs[rs]);
+ #define TCG_TARGET_DEFAULT_MO (0)
--    newv = int128_make128(new_lo, new_hi);
--    oldv = cpu_atomic_cmpxchgo_be_mmu(env, addr, cmpv, newv, oi, ra);
+ #endif
 diff --git a/tcg/tcg-has.h b/tcg/tcg-has.h
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tcg-has.h
 +++ b/tcg/tcg-has.h
@@ -XXX,XX +XXX,XX @@
  #ifndef TCG_HAS_H
  #define TCG_HAS_H
 +#include "tcg-target-has.h"
 +
  #if TCG_TARGET_REG_BITS == 32
  /* Turn some undef macros into false macros.  */
  #define TCG_TARGET_HAS_extr_i64_i32     0
 diff --git a/tcg/tci/tcg-target.h b/tcg/tci/tcg-target.h
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tci/tcg-target.h
 +++ b/tcg/tci/tcg-target.h
@@ -XXX,XX +XXX,XX @@
  #define TCG_TARGET_INSN_UNIT_SIZE 4
  #define MAX_CODE_GEN_BUFFER_SIZE  ((size_t)-1)
 -#include "tcg-target-has.h"
 -
--    env->xregs[rs + 1] = int128_getlo(oldv);
+ /* Number of registers available. */
--    env->xregs[rs] = int128_gethi(oldv);
+ #define TCG_TARGET_NB_REGS 16
 -}
 -
  /*
   * AdvSIMD half-precision
   */
 diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-a64.c
 +++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void gen_compare_and_swap_pair(DisasContext *s, int rs, int rt,
              tcg_gen_extr32_i64(s2, s1, cmp);
          }
          tcg_temp_free_i64(cmp);
 -    } else if (tb_cflags(s->base.tb) & CF_PARALLEL) {
 -        if (HAVE_CMPXCHG128) {
 -            TCGv_i32 tcg_rs = tcg_constant_i32(rs);
 -            if (s->be_data == MO_LE) {
 -                gen_helper_casp_le_parallel(cpu_env, tcg_rs,
 -                                            clean_addr, t1, t2);
 -            } else {
 -                gen_helper_casp_be_parallel(cpu_env, tcg_rs,
 -                                            clean_addr, t1, t2);
 -            }
 -        } else {
 -            gen_helper_exit_atomic(cpu_env);
 -            s->base.is_jmp = DISAS_NORETURN;
 -        }
      } else {
 -        TCGv_i64 d1 = tcg_temp_new_i64();
 -        TCGv_i64 d2 = tcg_temp_new_i64();
 -        TCGv_i64 a2 = tcg_temp_new_i64();
 -        TCGv_i64 c1 = tcg_temp_new_i64();
 -        TCGv_i64 c2 = tcg_temp_new_i64();
 -        TCGv_i64 zero = tcg_constant_i64(0);
 +        TCGv_i128 cmp = tcg_temp_new_i128();
 +        TCGv_i128 val = tcg_temp_new_i128();
 -        /* Load the two words, in memory order.  */
 -        tcg_gen_qemu_ld_i64(d1, clean_addr, memidx,
 -                            MO_64 | MO_ALIGN_16 | s->be_data);
 -        tcg_gen_addi_i64(a2, clean_addr, 8);
 -        tcg_gen_qemu_ld_i64(d2, a2, memidx, MO_64 | s->be_data);
 +        if (s->be_data == MO_LE) {
 +            tcg_gen_concat_i64_i128(val, t1, t2);
 +            tcg_gen_concat_i64_i128(cmp, s1, s2);
 +        } else {
 +            tcg_gen_concat_i64_i128(val, t2, t1);
 +            tcg_gen_concat_i64_i128(cmp, s2, s1);
 +        }
 -        /* Compare the two words, also in memory order.  */
 -        tcg_gen_setcond_i64(TCG_COND_EQ, c1, d1, s1);
 -        tcg_gen_setcond_i64(TCG_COND_EQ, c2, d2, s2);
 -        tcg_gen_and_i64(c2, c2, c1);
 +        tcg_gen_atomic_cmpxchg_i128(cmp, clean_addr, cmp, val, memidx,
 +                                    MO_128 | MO_ALIGN | s->be_data);
 +        tcg_temp_free_i128(val);
 -        /* If compare equal, write back new data, else write back old data.  */
 -        tcg_gen_movcond_i64(TCG_COND_NE, c1, c2, zero, t1, d1);
 -        tcg_gen_movcond_i64(TCG_COND_NE, c2, c2, zero, t2, d2);
 -        tcg_gen_qemu_st_i64(c1, clean_addr, memidx, MO_64 | s->be_data);
 -        tcg_gen_qemu_st_i64(c2, a2, memidx, MO_64 | s->be_data);
 -        tcg_temp_free_i64(a2);
 -        tcg_temp_free_i64(c1);
 -        tcg_temp_free_i64(c2);
 -
 -        /* Write back the data from memory to Rs.  */
 -        tcg_gen_mov_i64(s1, d1);
 -        tcg_gen_mov_i64(s2, d2);
 -        tcg_temp_free_i64(d1);
 -        tcg_temp_free_i64(d2);
 +        if (s->be_data == MO_LE) {
 +            tcg_gen_extr_i128_i64(s1, s2, cmp);
 +        } else {
 +            tcg_gen_extr_i128_i64(s2, s1, cmp);
 +        }
 +        tcg_temp_free_i128(cmp);
      }
  }
 --
-.34.1
+.43.0

-[PULL 22/40] target/ppc: Use tcg_gen_atomic_cmpxchg_i128 for STQCX
+[PULL 32/68] tcg: Only include 'tcg-has.h' when necessary
-Note that the previous direct reference to reserve_val,
+TCG_TARGET_HAS_* definitions don't need to be exposed
+by "tcg/tcg.h". Only include 'tcg-has.h' when necessary.
 -   tcg_gen_ld_i64(t1, cpu_env, (ctx->le_mode
 -                                ? offsetof(CPUPPCState, reserve_val2)
 -                                : offsetof(CPUPPCState, reserve_val)));
 was incorrect because all references should have gone through
 cpu_reserve_val.  Create a cpu_reserve_val2 tcg temp to fix this.
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Daniel Henrique Barboza <danielhb413@gmail.com>
+Signed-off-by: Philippe Mathieu-Daudé <philmd@linaro.org>
-Message-Id: <20221112061122.2720163-2-richard.henderson@linaro.org>
+Message-ID: <20250108215156.8731-15-philmd@linaro.org>
 ---
- target/ppc/helper.h     |   2 -
+ include/tcg/tcg.h | 2 --
- target/ppc/mem_helper.c |  44 -----------------
+ tcg/optimize.c    | 1 +
- target/ppc/translate.c  | 102 ++++++++++++++++++----------------------
+ tcg/tcg-common.c  | 1 +
-files changed, 47 insertions(+), 101 deletions(-)
+ tcg/tcg-op-gvec.c | 1 +
  tcg/tcg-op-ldst.c | 2 +-
  tcg/tcg-op-vec.c  | 1 +
  tcg/tcg-op.c      | 2 +-
  tcg/tcg.c         | 1 +
  tcg/tci.c         | 1 +
 files changed, 8 insertions(+), 4 deletions(-)
-diff --git a/target/ppc/helper.h b/target/ppc/helper.h
+diff --git a/include/tcg/tcg.h b/include/tcg/tcg.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/ppc/helper.h
+--- a/include/tcg/tcg.h
-+++ b/target/ppc/helper.h
++++ b/include/tcg/tcg.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(stq_le_parallel, TCG_CALL_NO_WG,
+@@ -XXX,XX +XXX,XX @@ typedef uint64_t TCGRegSet;
-                    void, env, tl, i64, i64, i32)
+ #error unsupported
  DEF_HELPER_FLAGS_5(stq_be_parallel, TCG_CALL_NO_WG,
                     void, env, tl, i64, i64, i32)
 -DEF_HELPER_5(stqcx_le_parallel, i32, env, tl, i64, i64, i32)
 -DEF_HELPER_5(stqcx_be_parallel, i32, env, tl, i64, i64, i32)
  #endif
-diff --git a/target/ppc/mem_helper.c b/target/ppc/mem_helper.c
 -#include "tcg/tcg-has.h"
 -
  typedef enum TCGOpcode {
  #define DEF(name, oargs, iargs, cargs, flags) INDEX_op_ ## name,
  #include "tcg/tcg-opc.h"
 diff --git a/tcg/optimize.c b/tcg/optimize.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/ppc/mem_helper.c
+--- a/tcg/optimize.c
-+++ b/target/ppc/mem_helper.c
++++ b/tcg/optimize.c
-@@ -XXX,XX +XXX,XX @@ void helper_stq_be_parallel(CPUPPCState *env, target_ulong addr,
+@@ -XXX,XX +XXX,XX @@
-     val = int128_make128(lo, hi);
+ #include "qemu/interval-tree.h"
-     cpu_atomic_sto_be_mmu(env, addr, val, opidx, GETPC());
+ #include "tcg/tcg-op-common.h"
- }
+ #include "tcg-internal.h"
 +#include "tcg-has.h"
  #define CASE_OP_32_64(x)                        \
          glue(glue(case INDEX_op_, x), _i32):    \
 diff --git a/tcg/tcg-common.c b/tcg/tcg-common.c
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tcg-common.c
 +++ b/tcg/tcg-common.c
@@ -XXX,XX +XXX,XX @@
  #include "qemu/osdep.h"
  #include "tcg/tcg.h"
 +#include "tcg-has.h"
  TCGOpDef tcg_op_defs[] = {
  #define DEF(s, oargs, iargs, cargs, flags) \
 diff --git a/tcg/tcg-op-gvec.c b/tcg/tcg-op-gvec.c
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tcg-op-gvec.c
 +++ b/tcg/tcg-op-gvec.c
@@ -XXX,XX +XXX,XX @@
  #include "tcg/tcg-op-common.h"
  #include "tcg/tcg-op-gvec-common.h"
  #include "tcg/tcg-gvec-desc.h"
 +#include "tcg-has.h"
  #define MAX_UNROLL  4
 diff --git a/tcg/tcg-op-ldst.c b/tcg/tcg-op-ldst.c
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tcg-op-ldst.c
 +++ b/tcg/tcg-op-ldst.c
@@ -XXX,XX +XXX,XX @@
  #include "exec/translation-block.h"
  #include "exec/plugin-gen.h"
  #include "tcg-internal.h"
 -
--uint32_t helper_stqcx_le_parallel(CPUPPCState *env, target_ulong addr,
++#include "tcg-has.h"
--                                  uint64_t new_lo, uint64_t new_hi,
--                                  uint32_t opidx)
+ static void check_max_alignment(unsigned a_bits)
--{
+ {
--    bool success = false;
+diff --git a/tcg/tcg-op-vec.c b/tcg/tcg-op-vec.c
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tcg-op-vec.c
 +++ b/tcg/tcg-op-vec.c
@@ -XXX,XX +XXX,XX @@
  #include "tcg/tcg-op-common.h"
  #include "tcg/tcg-mo.h"
  #include "tcg-internal.h"
 +#include "tcg-has.h"
  /*
   * Vector optional opcode tracking.
 diff --git a/tcg/tcg-op.c b/tcg/tcg-op.c
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tcg-op.c
 +++ b/tcg/tcg-op.c
@@ -XXX,XX +XXX,XX @@
  #include "exec/translation-block.h"
  #include "exec/plugin-gen.h"
  #include "tcg-internal.h"
 -
--    /* We will have raised EXCP_ATOMIC from the translator.  */
++#include "tcg-has.h"
--    assert(HAVE_CMPXCHG128);
--
+ /*
--    if (likely(addr == env->reserve_addr)) {
+  * Encourage the compiler to tail-call to a function, rather than inlining.
--        Int128 oldv, cmpv, newv;
+diff --git a/tcg/tcg.c b/tcg/tcg.c
--
+index XXXXXXX..XXXXXXX 100644
--        cmpv = int128_make128(env->reserve_val2, env->reserve_val);
+--- a/tcg/tcg.c
--        newv = int128_make128(new_lo, new_hi);
++++ b/tcg/tcg.c
--        oldv = cpu_atomic_cmpxchgo_le_mmu(env, addr, cmpv, newv,
+@@ -XXX,XX +XXX,XX @@
--                                          opidx, GETPC());
+ #include "tcg/tcg-temp-internal.h"
--        success = int128_eq(oldv, cmpv);
+ #include "tcg-internal.h"
--    }
+ #include "tcg/perf.h"
--    env->reserve_addr = -1;
++#include "tcg-has.h"
--    return env->so + success * CRF_EQ_BIT;
+ #ifdef CONFIG_USER_ONLY
--}
+ #include "user/guest-base.h"
 -
 -uint32_t helper_stqcx_be_parallel(CPUPPCState *env, target_ulong addr,
 -                                  uint64_t new_lo, uint64_t new_hi,
 -                                  uint32_t opidx)
 -{
 -    bool success = false;
 -
 -    /* We will have raised EXCP_ATOMIC from the translator.  */
 -    assert(HAVE_CMPXCHG128);
 -
 -    if (likely(addr == env->reserve_addr)) {
 -        Int128 oldv, cmpv, newv;
 -
 -        cmpv = int128_make128(env->reserve_val2, env->reserve_val);
 -        newv = int128_make128(new_lo, new_hi);
 -        oldv = cpu_atomic_cmpxchgo_be_mmu(env, addr, cmpv, newv,
 -                                          opidx, GETPC());
 -        success = int128_eq(oldv, cmpv);
 -    }
 -    env->reserve_addr = -1;
 -    return env->so + success * CRF_EQ_BIT;
 -}
  #endif
+diff --git a/tcg/tci.c b/tcg/tci.c
  /*****************************************************************************/
 diff --git a/target/ppc/translate.c b/target/ppc/translate.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/ppc/translate.c
+--- a/tcg/tci.c
-+++ b/target/ppc/translate.c
++++ b/tcg/tci.c
-@@ -XXX,XX +XXX,XX @@ static TCGv cpu_cfar;
+@@ -XXX,XX +XXX,XX @@
- static TCGv cpu_xer, cpu_so, cpu_ov, cpu_ca, cpu_ov32, cpu_ca32;
+ #include "tcg/helper-info.h"
- static TCGv cpu_reserve;
+ #include "tcg/tcg-ldst.h"
- static TCGv cpu_reserve_val;
+ #include "disas/dis-asm.h"
-+static TCGv cpu_reserve_val2;
++#include "tcg-has.h"
- static TCGv cpu_fpscr;
+ #include <ffi.h>
- static TCGv_i32 cpu_access_type;
@@ -XXX,XX +XXX,XX @@ void ppc_translate_init(void)
                                       offsetof(CPUPPCState, reserve_addr),
                                       "reserve_addr");
      cpu_reserve_val = tcg_global_mem_new(cpu_env,
 -                                     offsetof(CPUPPCState, reserve_val),
 -                                     "reserve_val");
 +                                         offsetof(CPUPPCState, reserve_val),
 +                                         "reserve_val");
 +    cpu_reserve_val2 = tcg_global_mem_new(cpu_env,
 +                                          offsetof(CPUPPCState, reserve_val2),
 +                                          "reserve_val2");
      cpu_fpscr = tcg_global_mem_new(cpu_env,
                                     offsetof(CPUPPCState, fpscr), "fpscr");
@@ -XXX,XX +XXX,XX @@ static void gen_lqarx(DisasContext *ctx)
  /* stqcx. */
  static void gen_stqcx_(DisasContext *ctx)
  {
 +    TCGLabel *lab_fail, *lab_over;
      int rs = rS(ctx->opcode);
 -    TCGv EA, hi, lo;
 +    TCGv EA, t0, t1;
 +    TCGv_i128 cmp, val;
      if (unlikely(rs & 1)) {
          gen_inval_exception(ctx, POWERPC_EXCP_INVAL_INVAL);
          return;
      }
 +    lab_fail = gen_new_label();
 +    lab_over = gen_new_label();
 +
      gen_set_access_type(ctx, ACCESS_RES);
      EA = tcg_temp_new();
      gen_addr_reg_index(ctx, EA);
 +    tcg_gen_brcond_tl(TCG_COND_NE, EA, cpu_reserve, lab_fail);
 +    tcg_temp_free(EA);
 +
 +    cmp = tcg_temp_new_i128();
 +    val = tcg_temp_new_i128();
 +
 +    tcg_gen_concat_i64_i128(cmp, cpu_reserve_val2, cpu_reserve_val);
 +
      /* Note that the low part is always in RS+1, even in LE mode.  */
 -    lo = cpu_gpr[rs + 1];
 -    hi = cpu_gpr[rs];
 +    tcg_gen_concat_i64_i128(val, cpu_gpr[rs + 1], cpu_gpr[rs]);
 -    if (tb_cflags(ctx->base.tb) & CF_PARALLEL) {
 -        if (HAVE_CMPXCHG128) {
 -            TCGv_i32 oi = tcg_const_i32(DEF_MEMOP(MO_128) | MO_ALIGN);
 -            if (ctx->le_mode) {
 -                gen_helper_stqcx_le_parallel(cpu_crf[0], cpu_env,
 -                                             EA, lo, hi, oi);
 -            } else {
 -                gen_helper_stqcx_be_parallel(cpu_crf[0], cpu_env,
 -                                             EA, lo, hi, oi);
 -            }
 -            tcg_temp_free_i32(oi);
 -        } else {
 -            /* Restart with exclusive lock.  */
 -            gen_helper_exit_atomic(cpu_env);
 -            ctx->base.is_jmp = DISAS_NORETURN;
 -        }
 -        tcg_temp_free(EA);
 -    } else {
 -        TCGLabel *lab_fail = gen_new_label();
 -        TCGLabel *lab_over = gen_new_label();
 -        TCGv_i64 t0 = tcg_temp_new_i64();
 -        TCGv_i64 t1 = tcg_temp_new_i64();
 +    tcg_gen_atomic_cmpxchg_i128(val, cpu_reserve, cmp, val, ctx->mem_idx,
 +                                DEF_MEMOP(MO_128 | MO_ALIGN));
 +    tcg_temp_free_i128(cmp);
 -        tcg_gen_brcond_tl(TCG_COND_NE, EA, cpu_reserve, lab_fail);
 -        tcg_temp_free(EA);
 +    t0 = tcg_temp_new();
 +    t1 = tcg_temp_new();
 +    tcg_gen_extr_i128_i64(t1, t0, val);
 +    tcg_temp_free_i128(val);
 -        gen_qemu_ld64_i64(ctx, t0, cpu_reserve);
 -        tcg_gen_ld_i64(t1, cpu_env, (ctx->le_mode
 -                                     ? offsetof(CPUPPCState, reserve_val2)
 -                                     : offsetof(CPUPPCState, reserve_val)));
 -        tcg_gen_brcond_i64(TCG_COND_NE, t0, t1, lab_fail);
 +    tcg_gen_xor_tl(t1, t1, cpu_reserve_val2);
 +    tcg_gen_xor_tl(t0, t0, cpu_reserve_val);
 +    tcg_gen_or_tl(t0, t0, t1);
 +    tcg_temp_free(t1);
 -        tcg_gen_addi_i64(t0, cpu_reserve, 8);
 -        gen_qemu_ld64_i64(ctx, t0, t0);
 -        tcg_gen_ld_i64(t1, cpu_env, (ctx->le_mode
 -                                     ? offsetof(CPUPPCState, reserve_val)
 -                                     : offsetof(CPUPPCState, reserve_val2)));
 -        tcg_gen_brcond_i64(TCG_COND_NE, t0, t1, lab_fail);
 +    tcg_gen_setcondi_tl(TCG_COND_EQ, t0, t0, 0);
 +    tcg_gen_shli_tl(t0, t0, CRF_EQ_BIT);
 +    tcg_gen_or_tl(t0, t0, cpu_so);
 +    tcg_gen_trunc_tl_i32(cpu_crf[0], t0);
 +    tcg_temp_free(t0);
 -        /* Success */
 -        gen_qemu_st64_i64(ctx, ctx->le_mode ? lo : hi, cpu_reserve);
 -        tcg_gen_addi_i64(t0, cpu_reserve, 8);
 -        gen_qemu_st64_i64(ctx, ctx->le_mode ? hi : lo, t0);
 +    tcg_gen_br(lab_over);
 +    gen_set_label(lab_fail);
 -        tcg_gen_trunc_tl_i32(cpu_crf[0], cpu_so);
 -        tcg_gen_ori_i32(cpu_crf[0], cpu_crf[0], CRF_EQ);
 -        tcg_gen_br(lab_over);
 +    /*
 +     * Address mismatch implies failure.  But we still need to provide
 +     * the memory barrier semantics of the instruction.
 +     */
 +    tcg_gen_mb(TCG_MO_ALL | TCG_BAR_STRL);
 +    tcg_gen_trunc_tl_i32(cpu_crf[0], cpu_so);
 -        gen_set_label(lab_fail);
 -        tcg_gen_trunc_tl_i32(cpu_crf[0], cpu_so);
 -
 -        gen_set_label(lab_over);
 -        tcg_gen_movi_tl(cpu_reserve, -1);
 -        tcg_temp_free_i64(t0);
 -        tcg_temp_free_i64(t1);
 -    }
 +    gen_set_label(lab_over);
 +    tcg_gen_movi_tl(cpu_reserve, -1);
  }
  #endif /* defined(TARGET_PPC64) */
 --
-.34.1
+.43.0

-[PULL 37/40] target/i386: Split out gen_cmpxchg8b, gen_cmpxchg16b
+[PULL 33/68] tcg: Split out tcg-target-mo.h
 Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 ---
- target/i386/tcg/translate.c | 48 ++++++++++++++++++++++++-------------
+ accel/tcg/internal-target.h     |  1 +
-file changed, 31 insertions(+), 17 deletions(-)
+ tcg/aarch64/tcg-target-mo.h     | 12 ++++++++++++
  tcg/aarch64/tcg-target.h        |  2 --
  tcg/arm/tcg-target-mo.h         | 13 +++++++++++++
  tcg/arm/tcg-target.h            |  2 --
  tcg/i386/tcg-target-mo.h        | 19 +++++++++++++++++++
  tcg/i386/tcg-target.h           | 11 -----------
  tcg/loongarch64/tcg-target-mo.h | 12 ++++++++++++
  tcg/loongarch64/tcg-target.h    |  2 --
  tcg/mips/tcg-target-mo.h        | 13 +++++++++++++
  tcg/mips/tcg-target.h           |  2 --
  tcg/ppc/tcg-target-mo.h         | 12 ++++++++++++
  tcg/ppc/tcg-target.h            |  2 --
  tcg/riscv/tcg-target-mo.h       | 12 ++++++++++++
  tcg/riscv/tcg-target.h          |  2 --
  tcg/s390x/tcg-target-mo.h       | 12 ++++++++++++
  tcg/s390x/tcg-target.h          |  2 --
  tcg/sparc64/tcg-target-mo.h     | 12 ++++++++++++
  tcg/sparc64/tcg-target.h        |  2 --
  tcg/tci/tcg-target-mo.h         | 17 +++++++++++++++++
  tcg/tci/tcg-target.h            |  5 -----
  tcg/tcg-op-ldst.c               |  1 +
 files changed, 136 insertions(+), 32 deletions(-)
  create mode 100644 tcg/aarch64/tcg-target-mo.h
  create mode 100644 tcg/arm/tcg-target-mo.h
  create mode 100644 tcg/i386/tcg-target-mo.h
  create mode 100644 tcg/loongarch64/tcg-target-mo.h
  create mode 100644 tcg/mips/tcg-target-mo.h
  create mode 100644 tcg/ppc/tcg-target-mo.h
  create mode 100644 tcg/riscv/tcg-target-mo.h
  create mode 100644 tcg/s390x/tcg-target-mo.h
  create mode 100644 tcg/sparc64/tcg-target-mo.h
  create mode 100644 tcg/tci/tcg-target-mo.h
-diff --git a/target/i386/tcg/translate.c b/target/i386/tcg/translate.c
+diff --git a/accel/tcg/internal-target.h b/accel/tcg/internal-target.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/i386/tcg/translate.c
+--- a/accel/tcg/internal-target.h
-+++ b/target/i386/tcg/translate.c
++++ b/accel/tcg/internal-target.h
-@@ -XXX,XX +XXX,XX @@ static void gen_sty_env_A0(DisasContext *s, int offset, bool align)
+@@ -XXX,XX +XXX,XX @@
- #include "emit.c.inc"
+ #include "exec/exec-all.h"
- #include "decode-new.c.inc"
+ #include "exec/translation-block.h"
+ #include "tb-internal.h"
-+static void gen_cmpxchg8b(DisasContext *s, CPUX86State *env, int modrm)
++#include "tcg-target-mo.h"
-+{
-+    gen_lea_modrm(env, s, modrm);
+ /*
-+
+  * Access to the various translations structures need to be serialised
-+    if ((s->prefix & PREFIX_LOCK) &&
+diff --git a/tcg/aarch64/tcg-target-mo.h b/tcg/aarch64/tcg-target-mo.h
-+        (tb_cflags(s->base.tb) & CF_PARALLEL)) {
+new file mode 100644
-+        gen_helper_cmpxchg8b(cpu_env, s->A0);
+index XXXXXXX..XXXXXXX
-+    } else {
+--- /dev/null
-+        gen_helper_cmpxchg8b_unlocked(cpu_env, s->A0);
++++ b/tcg/aarch64/tcg-target-mo.h
-+    }
+@@ -XXX,XX +XXX,XX @@
-+    set_cc_op(s, CC_OP_EFLAGS);
++/* SPDX-License-Identifier: GPL-2.0-or-later */
-+}
++/*
-+
++ * Define target-specific memory model
-+#ifdef TARGET_X86_64
++ * Copyright (c) 2013 Huawei Technologies Duesseldorf GmbH
-+static void gen_cmpxchg16b(DisasContext *s, CPUX86State *env, int modrm)
++ */
-+{
++
-+    gen_lea_modrm(env, s, modrm);
++#ifndef TCG_TARGET_MO_H
-+
++#define TCG_TARGET_MO_H
-+    if ((s->prefix & PREFIX_LOCK) &&
++
-+        (tb_cflags(s->base.tb) & CF_PARALLEL)) {
++#define TCG_TARGET_DEFAULT_MO  0
-+        gen_helper_cmpxchg16b(cpu_env, s->A0);
++
-+    } else {
++#endif
-+        gen_helper_cmpxchg16b_unlocked(cpu_env, s->A0);
+diff --git a/tcg/aarch64/tcg-target.h b/tcg/aarch64/tcg-target.h
-+    }
+index XXXXXXX..XXXXXXX 100644
-+    set_cc_op(s, CC_OP_EFLAGS);
+--- a/tcg/aarch64/tcg-target.h
-+}
++++ b/tcg/aarch64/tcg-target.h
-+#endif
+@@ -XXX,XX +XXX,XX @@ typedef enum {
-+
- /* convert one instruction. s->base.is_jmp is set if the translation must
+ #define TCG_TARGET_NB_REGS 64
-    be stopped. Return the next pc value */
- static bool disas_insn(DisasContext *s, CPUState *cpu)
+-#define TCG_TARGET_DEFAULT_MO (0)
-@@ -XXX,XX +XXX,XX @@ static bool disas_insn(DisasContext *s, CPUState *cpu)
+-
-                 if (!(s->cpuid_ext_features & CPUID_EXT_CX16)) {
+ #endif /* AARCH64_TCG_TARGET_H */
-                     goto illegal_op;
+diff --git a/tcg/arm/tcg-target-mo.h b/tcg/arm/tcg-target-mo.h
-                 }
+new file mode 100644
--                gen_lea_modrm(env, s, modrm);
+index XXXXXXX..XXXXXXX
--                if ((s->prefix & PREFIX_LOCK) &&
+--- /dev/null
--                    (tb_cflags(s->base.tb) & CF_PARALLEL)) {
++++ b/tcg/arm/tcg-target-mo.h
--                    gen_helper_cmpxchg16b(cpu_env, s->A0);
+@@ -XXX,XX +XXX,XX @@
--                } else {
++/* SPDX-License-Identifier: MIT */
--                    gen_helper_cmpxchg16b_unlocked(cpu_env, s->A0);
++/*
--                }
++ * Define target-specific memory model
--                set_cc_op(s, CC_OP_EFLAGS);
++ * Copyright (c) 2008 Fabrice Bellard
-+                gen_cmpxchg16b(s, env, modrm);
++ * Copyright (c) 2008 Andrzej Zaborowski
-                 break;
++ */
-             }
++
--#endif
++#ifndef TCG_TARGET_MO_H
-+#endif
++#define TCG_TARGET_MO_H
-             if (!(s->cpuid_features & CPUID_CX8)) {
++
-                 goto illegal_op;
++#define TCG_TARGET_DEFAULT_MO  0
-             }
++
--            gen_lea_modrm(env, s, modrm);
++#endif
--            if ((s->prefix & PREFIX_LOCK) &&
+diff --git a/tcg/arm/tcg-target.h b/tcg/arm/tcg-target.h
--                (tb_cflags(s->base.tb) & CF_PARALLEL)) {
+index XXXXXXX..XXXXXXX 100644
--                gen_helper_cmpxchg8b(cpu_env, s->A0);
+--- a/tcg/arm/tcg-target.h
--            } else {
++++ b/tcg/arm/tcg-target.h
--                gen_helper_cmpxchg8b_unlocked(cpu_env, s->A0);
+@@ -XXX,XX +XXX,XX @@ typedef enum {
--            }
--            set_cc_op(s, CC_OP_EFLAGS);
+ #define TCG_TARGET_NB_REGS 32
-+            gen_cmpxchg8b(s, env, modrm);
-             break;
+-#define TCG_TARGET_DEFAULT_MO (0)
+-
-         case 7: /* RDSEED */
+ #endif
 diff --git a/tcg/i386/tcg-target-mo.h b/tcg/i386/tcg-target-mo.h
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
 +++ b/tcg/i386/tcg-target-mo.h
@@ -XXX,XX +XXX,XX @@
 +/* SPDX-License-Identifier: MIT */
 +/*
 + * Define target-specific memory model
 + * Copyright (c) 2008 Fabrice Bellard
 + */
 +
 +#ifndef TCG_TARGET_MO_H
 +#define TCG_TARGET_MO_H
 +
 +/*
 + * This defines the natural memory order supported by this architecture
 + * before guarantees made by various barrier instructions.
 + *
 + * The x86 has a pretty strong memory ordering which only really
 + * allows for some stores to be re-ordered after loads.
 + */
 +#define TCG_TARGET_DEFAULT_MO (TCG_MO_ALL & ~TCG_MO_ST_LD)
 +
 +#endif
 diff --git a/tcg/i386/tcg-target.h b/tcg/i386/tcg-target.h
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/i386/tcg-target.h
 +++ b/tcg/i386/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
      TCG_REG_CALL_STACK = TCG_REG_ESP
  } TCGReg;
 -/* This defines the natural memory order supported by this
 - * architecture before guarantees made by various barrier
 - * instructions.
 - *
 - * The x86 has a pretty strong memory ordering which only really
 - * allows for some stores to be re-ordered after loads.
 - */
 -#include "tcg/tcg-mo.h"
 -
 -#define TCG_TARGET_DEFAULT_MO (TCG_MO_ALL & ~TCG_MO_ST_LD)
 -
  #endif
 diff --git a/tcg/loongarch64/tcg-target-mo.h b/tcg/loongarch64/tcg-target-mo.h
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
 +++ b/tcg/loongarch64/tcg-target-mo.h
@@ -XXX,XX +XXX,XX @@
 +/* SPDX-License-Identifier: MIT */
 +/*
 + * Define target-specific memory model
 + * Copyright (c) 2021 WANG Xuerui <git@xen0n.name>
 + */
 +
 +#ifndef TCG_TARGET_MO_H
 +#define TCG_TARGET_MO_H
 +
 +#define TCG_TARGET_DEFAULT_MO  0
 +
 +#endif
 diff --git a/tcg/loongarch64/tcg-target.h b/tcg/loongarch64/tcg-target.h
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/loongarch64/tcg-target.h
 +++ b/tcg/loongarch64/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
      TCG_VEC_TMP0 = TCG_REG_V23,
  } TCGReg;
 -#define TCG_TARGET_DEFAULT_MO (0)
 -
  #endif /* LOONGARCH_TCG_TARGET_H */
 diff --git a/tcg/mips/tcg-target-mo.h b/tcg/mips/tcg-target-mo.h
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
 +++ b/tcg/mips/tcg-target-mo.h
@@ -XXX,XX +XXX,XX @@
 +/* SPDX-License-Identifier: MIT */
 +/*
 + * Define target-specific memory model
 + * Copyright (c) 2008-2009 Arnaud Patard <arnaud.patard@rtp-net.org>
 + * Copyright (c) 2009 Aurelien Jarno <aurelien@aurel32.net>
 + */
 +
 +#ifndef TCG_TARGET_MO_H
 +#define TCG_TARGET_MO_H
 +
 +#define TCG_TARGET_DEFAULT_MO  0
 +
 +#endif
 diff --git a/tcg/mips/tcg-target.h b/tcg/mips/tcg-target.h
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/mips/tcg-target.h
 +++ b/tcg/mips/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
      TCG_AREG0 = TCG_REG_S8,
  } TCGReg;
 -#define TCG_TARGET_DEFAULT_MO           0
 -
  #endif
 diff --git a/tcg/ppc/tcg-target-mo.h b/tcg/ppc/tcg-target-mo.h
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
 +++ b/tcg/ppc/tcg-target-mo.h
@@ -XXX,XX +XXX,XX @@
 +/* SPDX-License-Identifier: MIT */
 +/*
 + * Define target-specific memory model
 + * Copyright (c) 2008 Fabrice Bellard
 + */
 +
 +#ifndef TCG_TARGET_MO_H
 +#define TCG_TARGET_MO_H
 +
 +#define TCG_TARGET_DEFAULT_MO  0
 +
 +#endif
 diff --git a/tcg/ppc/tcg-target.h b/tcg/ppc/tcg-target.h
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/ppc/tcg-target.h
 +++ b/tcg/ppc/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
      TCG_AREG0 = TCG_REG_R27
  } TCGReg;
 -#define TCG_TARGET_DEFAULT_MO (0)
 -
  #endif
 diff --git a/tcg/riscv/tcg-target-mo.h b/tcg/riscv/tcg-target-mo.h
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
 +++ b/tcg/riscv/tcg-target-mo.h
@@ -XXX,XX +XXX,XX @@
 +/* SPDX-License-Identifier: MIT */
 +/*
 + * Define target-specific memory model
 + * Copyright (c) 2018 SiFive, Inc
 + */
 +
 +#ifndef TCG_TARGET_MO_H
 +#define TCG_TARGET_MO_H
 +
 +#define TCG_TARGET_DEFAULT_MO  0
 +
 +#endif
 diff --git a/tcg/riscv/tcg-target.h b/tcg/riscv/tcg-target.h
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/riscv/tcg-target.h
 +++ b/tcg/riscv/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
      TCG_REG_TMP2       = TCG_REG_T4,
  } TCGReg;
 -#define TCG_TARGET_DEFAULT_MO (0)
 -
  #endif
 diff --git a/tcg/s390x/tcg-target-mo.h b/tcg/s390x/tcg-target-mo.h
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
 +++ b/tcg/s390x/tcg-target-mo.h
@@ -XXX,XX +XXX,XX @@
 +/* SPDX-License-Identifier: MIT */
 +/*
 + * Define target-specific memory model
 + * Copyright (c) 2009 Ulrich Hecht <uli@suse.de>
 + */
 +
 +#ifndef TCG_TARGET_MO_H
 +#define TCG_TARGET_MO_H
 +
 +#define TCG_TARGET_DEFAULT_MO (TCG_MO_ALL & ~TCG_MO_ST_LD)
 +
 +#endif
 diff --git a/tcg/s390x/tcg-target.h b/tcg/s390x/tcg-target.h
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/s390x/tcg-target.h
 +++ b/tcg/s390x/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum TCGReg {
  #define TCG_TARGET_NB_REGS 64
 -#define TCG_TARGET_DEFAULT_MO (TCG_MO_ALL & ~TCG_MO_ST_LD)
 -
  #endif
 diff --git a/tcg/sparc64/tcg-target-mo.h b/tcg/sparc64/tcg-target-mo.h
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
 +++ b/tcg/sparc64/tcg-target-mo.h
@@ -XXX,XX +XXX,XX @@
 +/* SPDX-License-Identifier: MIT */
 +/*
 + * Define target-specific memory model
 + * Copyright (c) 2008 Fabrice Bellard
 + */
 +
 +#ifndef TCG_TARGET_MO_H
 +#define TCG_TARGET_MO_H
 +
 +#define TCG_TARGET_DEFAULT_MO  0
 +
 +#endif
 diff --git a/tcg/sparc64/tcg-target.h b/tcg/sparc64/tcg-target.h
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/sparc64/tcg-target.h
 +++ b/tcg/sparc64/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
  #define TCG_AREG0 TCG_REG_I0
 -#define TCG_TARGET_DEFAULT_MO (0)
 -
  #endif
 diff --git a/tcg/tci/tcg-target-mo.h b/tcg/tci/tcg-target-mo.h
 new file mode 100644
 index XXXXXXX..XXXXXXX
 --- /dev/null
 +++ b/tcg/tci/tcg-target-mo.h
@@ -XXX,XX +XXX,XX @@
 +/* SPDX-License-Identifier: MIT */
 +/*
 + * Define target-specific memory model
 + * Copyright (c) 2009, 2011 Stefan Weil
 + */
 +
 +#ifndef TCG_TARGET_MO_H
 +#define TCG_TARGET_MO_H
 +
 +/*
 + * We could notice __i386__ or __s390x__ and reduce the barriers depending
 + * on the host.  But if you want performance, you use the normal backend.
 + * We prefer consistency across hosts on this.
 + */
 +#define TCG_TARGET_DEFAULT_MO  0
 +
 +#endif
 diff --git a/tcg/tci/tcg-target.h b/tcg/tci/tcg-target.h
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tci/tcg-target.h
 +++ b/tcg/tci/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
  #define HAVE_TCG_QEMU_TB_EXEC
  #define TCG_TARGET_NEED_POOL_LABELS
 -/* We could notice __i386__ or __s390x__ and reduce the barriers depending
 -   on the host.  But if you want performance, you use the normal backend.
 -   We prefer consistency across hosts on this.  */
 -#define TCG_TARGET_DEFAULT_MO  (0)
 -
  #endif /* TCG_TARGET_H */
 diff --git a/tcg/tcg-op-ldst.c b/tcg/tcg-op-ldst.c
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tcg-op-ldst.c
 +++ b/tcg/tcg-op-ldst.c
@@ -XXX,XX +XXX,XX @@
  #include "exec/plugin-gen.h"
  #include "tcg-internal.h"
  #include "tcg-has.h"
 +#include "tcg-target-mo.h"
  static void check_max_alignment(unsigned a_bits)
  {
 --
-.34.1
+.43.0

-[PULL 06/40] tcg: Introduce tcg_out_addi_ptr
+[PULL 34/68] tcg: Use C_NotImplemented in tcg_target_op_def
-Implement the function for arm, i386, and s390x, which will use it.
+Return C_NotImplemented instead of asserting for opcodes
-Add stubs for all other backends.
+not implemented by the backend.  For now, the assertion
 moves to process_op_defs.
-Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Reviewed-by: Daniel Henrique Barboza <danielhb413@gmail.com>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 ---
- tcg/tcg.c                        |  2 ++
+ tcg/tcg.c                        | 10 ++++++----
- tcg/aarch64/tcg-target.c.inc     |  7 +++++++
+ tcg/aarch64/tcg-target.c.inc     |  2 +-
- tcg/arm/tcg-target.c.inc         | 20 ++++++++++++++++++++
+ tcg/arm/tcg-target.c.inc         |  2 +-
- tcg/i386/tcg-target.c.inc        |  8 ++++++++
+ tcg/i386/tcg-target.c.inc        |  2 +-
- tcg/loongarch64/tcg-target.c.inc |  7 +++++++
+ tcg/loongarch64/tcg-target.c.inc |  2 +-
- tcg/mips/tcg-target.c.inc        |  7 +++++++
+ tcg/mips/tcg-target.c.inc        |  2 +-
- tcg/ppc/tcg-target.c.inc         |  7 +++++++
+ tcg/ppc/tcg-target.c.inc         |  2 +-
- tcg/riscv/tcg-target.c.inc       |  7 +++++++
+ tcg/riscv/tcg-target.c.inc       |  2 +-
- tcg/s390x/tcg-target.c.inc       |  7 +++++++
+ tcg/s390x/tcg-target.c.inc       |  2 +-
- tcg/sparc64/tcg-target.c.inc     |  7 +++++++
+ tcg/sparc64/tcg-target.c.inc     |  2 +-
- tcg/tci/tcg-target.c.inc         |  7 +++++++
+ tcg/tci/tcg-target.c.inc         |  2 +-
-files changed, 86 insertions(+)
+files changed, 16 insertions(+), 14 deletions(-)
 diff --git a/tcg/tcg.c b/tcg/tcg.c
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tcg.c
 +++ b/tcg/tcg.c
-@@ -XXX,XX +XXX,XX @@ static void tcg_out_ld(TCGContext *s, TCGType type, TCGReg ret, TCGReg arg1,
+@@ -XXX,XX +XXX,XX @@ static int tcg_out_pool_finalize(TCGContext *s)
- static bool tcg_out_mov(TCGContext *s, TCGType type, TCGReg ret, TCGReg arg);
+ #define C_N1_O1_I4(O1, O2, I1, I2, I3, I4) C_PFX6(c_n1_o1_i4_, O1, O2, I1, I2, I3, I4),
- static void tcg_out_movi(TCGContext *s, TCGType type,
-                          TCGReg ret, tcg_target_long arg);
+ typedef enum {
-+static void tcg_out_addi_ptr(TCGContext *s, TCGReg, TCGReg, tcg_target_long)
++    C_NotImplemented = -1,
-+    __attribute__((unused));
+ #include "tcg-target-con-set.h"
- static void tcg_out_exit_tb(TCGContext *s, uintptr_t arg);
+ } TCGConstraintSetIndex;
- static void tcg_out_goto_tb(TCGContext *s, int which);
- static void tcg_out_op(TCGContext *s, TCGOpcode opc,
+@@ -XXX,XX +XXX,XX @@ static void process_op_defs(TCGContext *s)
          const TCGTargetOpDef *tdefs;
          bool saw_alias_pair = false;
          int i, o, i2, o2, nb_args;
 +        TCGConstraintSetIndex con_set;
          if (def->flags & TCG_OPF_NOT_PRESENT) {
              continue;
@@ -XXX,XX +XXX,XX @@ static void process_op_defs(TCGContext *s)
          /*
           * Macro magic should make it impossible, but double-check that
 -         * the array index is in range.  Since the signness of an enum
 -         * is implementation defined, force the result to unsigned.
 +         * the array index is in range.  At the same time, double-check
 +         * that the opcode is implemented, i.e. not C_NotImplemented.
           */
 -        unsigned con_set = tcg_target_op_def(op);
 -        tcg_debug_assert(con_set < ARRAY_SIZE(constraint_sets));
 +        con_set = tcg_target_op_def(op);
 +        tcg_debug_assert(con_set >= 0 && con_set < ARRAY_SIZE(constraint_sets));
          tdefs = &constraint_sets[con_set];
          for (i = 0; i < nb_args; i++) {
 diff --git a/tcg/aarch64/tcg-target.c.inc b/tcg/aarch64/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/aarch64/tcg-target.c.inc
 +++ b/tcg/aarch64/tcg-target.c.inc
-@@ -XXX,XX +XXX,XX @@ static void tcg_out_movi(TCGContext *s, TCGType type, TCGReg rd,
+@@ -XXX,XX +XXX,XX @@ static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
-     tcg_out_insn(s, 3305, LDR, 0, rd);
+         return C_O1_I2(w, 0, w);
      default:
 -        g_assert_not_reached();
 +        return C_NotImplemented;
      }
  }
-+static void tcg_out_addi_ptr(TCGContext *s, TCGReg rd, TCGReg rs,
-+                             tcg_target_long imm)
-+{
-+    /* This function is only used for passing structs by reference. */
-+    g_assert_not_reached();
-+}
-+
- /* Define something more legible for general use.  */
- #define tcg_out_ldst_r  tcg_out_insn_3310
 diff --git a/tcg/arm/tcg-target.c.inc b/tcg/arm/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/arm/tcg-target.c.inc
 +++ b/tcg/arm/tcg-target.c.inc
-@@ -XXX,XX +XXX,XX @@ static void tcg_out_movi(TCGContext *s, TCGType type,
+@@ -XXX,XX +XXX,XX @@ static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
-     tcg_out_movi32(s, COND_AL, ret, arg);
+     case INDEX_op_bitsel_vec:
          return C_O1_I3(w, w, w, w);
      default:
 -        g_assert_not_reached();
 +        return C_NotImplemented;
      }
  }
-+static void tcg_out_addi_ptr(TCGContext *s, TCGReg rd, TCGReg rs,
-+                             tcg_target_long imm)
-+{
-+    int enc, opc = ARITH_ADD;
-+
-+    /* All of the easiest immediates to encode are positive. */
-+    if (imm < 0) {
-+        imm = -imm;
-+        opc = ARITH_SUB;
-+    }
-+    enc = encode_imm(imm);
-+    if (enc >= 0) {
-+        tcg_out_dat_imm(s, COND_AL, opc, rd, rs, enc);
-+    } else {
-+        tcg_out_movi32(s, COND_AL, TCG_REG_TMP, imm);
-+        tcg_out_dat_reg(s, COND_AL, opc, rd, rs,
-+                        TCG_REG_TMP, SHIFT_IMM_LSL(0));
-+    }
-+}
-+
- /* Type is always V128, with I64 elements.  */
- static void tcg_out_dup2_vec(TCGContext *s, TCGReg rd, TCGReg rl, TCGReg rh)
- {
 diff --git a/tcg/i386/tcg-target.c.inc b/tcg/i386/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/i386/tcg-target.c.inc
 +++ b/tcg/i386/tcg-target.c.inc
-@@ -XXX,XX +XXX,XX @@ static void tcg_out_movi(TCGContext *s, TCGType type,
+@@ -XXX,XX +XXX,XX @@ static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
          return C_O1_I4(x, x, x, xO, x);
      default:
 -        g_assert_not_reached();
 +        return C_NotImplemented;
      }
  }
-+static void tcg_out_addi_ptr(TCGContext *s, TCGReg rd, TCGReg rs,
-+                             tcg_target_long imm)
-+{
-+    /* This function is only used for passing structs by reference. */
-+    tcg_debug_assert(TCG_TARGET_REG_BITS == 32);
-+    tcg_out_modrm_offset(s, OPC_LEA, rd, rs, imm);
-+}
-+
- static inline void tcg_out_pushi(TCGContext *s, tcg_target_long val)
- {
-     if (val == (int8_t)val) {
 diff --git a/tcg/loongarch64/tcg-target.c.inc b/tcg/loongarch64/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/loongarch64/tcg-target.c.inc
 +++ b/tcg/loongarch64/tcg-target.c.inc
-@@ -XXX,XX +XXX,XX @@ static void tcg_out_addi(TCGContext *s, TCGType type, TCGReg rd,
+@@ -XXX,XX +XXX,XX @@ static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
          return C_O1_I3(w, w, w, w);
      default:
 -        g_assert_not_reached();
 +        return C_NotImplemented;
      }
  }
-+static void tcg_out_addi_ptr(TCGContext *s, TCGReg rd, TCGReg rs,
-+                             tcg_target_long imm)
-+{
-+    /* This function is only used for passing structs by reference. */
-+    g_assert_not_reached();
-+}
-+
- static void tcg_out_ext8u(TCGContext *s, TCGReg ret, TCGReg arg)
- {
-     tcg_out_opc_andi(s, ret, arg, 0xff);
 diff --git a/tcg/mips/tcg-target.c.inc b/tcg/mips/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/mips/tcg-target.c.inc
 +++ b/tcg/mips/tcg-target.c.inc
-@@ -XXX,XX +XXX,XX @@ static void tcg_out_movi(TCGContext *s, TCGType type,
+@@ -XXX,XX +XXX,XX @@ static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
                  : C_O0_I4(rZ, rZ, r, r));
      default:
 -        g_assert_not_reached();
 +        return C_NotImplemented;
      }
  }
-+static void tcg_out_addi_ptr(TCGContext *s, TCGReg rd, TCGReg rs,
-+                             tcg_target_long imm)
-+{
-+    /* This function is only used for passing structs by reference. */
-+    g_assert_not_reached();
-+}
-+
- static void tcg_out_bswap16(TCGContext *s, TCGReg ret, TCGReg arg, int flags)
- {
-     /* ret and arg can't be register tmp0 */
 diff --git a/tcg/ppc/tcg-target.c.inc b/tcg/ppc/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/ppc/tcg-target.c.inc
 +++ b/tcg/ppc/tcg-target.c.inc
-@@ -XXX,XX +XXX,XX @@ static void tcg_out_movi(TCGContext *s, TCGType type, TCGReg ret,
+@@ -XXX,XX +XXX,XX @@ static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
          return C_O1_I4(v, v, v, vZM, v);
      default:
 -        g_assert_not_reached();
 +        return C_NotImplemented;
      }
  }
-+static void tcg_out_addi_ptr(TCGContext *s, TCGReg rd, TCGReg rs,
-+                             tcg_target_long imm)
-+{
-+    /* This function is only used for passing structs by reference. */
-+    g_assert_not_reached();
-+}
-+
- static bool mask_operand(uint32_t c, int *mb, int *me)
- {
-     uint32_t lsb, test;
 diff --git a/tcg/riscv/tcg-target.c.inc b/tcg/riscv/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/riscv/tcg-target.c.inc
 +++ b/tcg/riscv/tcg-target.c.inc
-@@ -XXX,XX +XXX,XX @@ static void tcg_out_movi(TCGContext *s, TCGType type, TCGReg rd,
+@@ -XXX,XX +XXX,XX @@ static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
-     tcg_out_opc_imm(s, OPC_LD, rd, rd, 0);
+     case INDEX_op_cmpsel_vec:
          return C_O1_I4(v, v, vL, vK, vK);
      default:
 -        g_assert_not_reached();
 +        return C_NotImplemented;
      }
  }
-+static void tcg_out_addi_ptr(TCGContext *s, TCGReg rd, TCGReg rs,
-+                             tcg_target_long imm)
-+{
-+    /* This function is only used for passing structs by reference. */
-+    g_assert_not_reached();
-+}
-+
- static void tcg_out_ext8u(TCGContext *s, TCGReg ret, TCGReg arg)
- {
-     tcg_out_opc_imm(s, OPC_ANDI, ret, arg, 0xff);
 diff --git a/tcg/s390x/tcg-target.c.inc b/tcg/s390x/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/s390x/tcg-target.c.inc
 +++ b/tcg/s390x/tcg-target.c.inc
-@@ -XXX,XX +XXX,XX @@ static inline bool tcg_out_sti(TCGContext *s, TCGType type, TCGArg val,
+@@ -XXX,XX +XXX,XX @@ static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
-     return false;
+                 : C_O1_I4(v, v, v, vZ, v));
      default:
 -        g_assert_not_reached();
 +        return C_NotImplemented;
      }
  }
-+static void tcg_out_addi_ptr(TCGContext *s, TCGReg rd, TCGReg rs,
-+                             tcg_target_long imm)
-+{
-+    /* This function is only used for passing structs by reference. */
-+    tcg_out_mem(s, RX_LA, RXY_LAY, rd, rs, TCG_REG_NONE, imm);
-+}
-+
- static inline void tcg_out_risbg(TCGContext *s, TCGReg dest, TCGReg src,
-                                  int msb, int lsb, int ofs, int z)
- {
 diff --git a/tcg/sparc64/tcg-target.c.inc b/tcg/sparc64/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/sparc64/tcg-target.c.inc
 +++ b/tcg/sparc64/tcg-target.c.inc
-@@ -XXX,XX +XXX,XX @@ static void tcg_out_movi(TCGContext *s, TCGType type,
+@@ -XXX,XX +XXX,XX @@ static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
-     tcg_out_movi_int(s, type, ret, arg, false, TCG_REG_T2);
+         return C_O1_I2(r, r, r);
      default:
 -        g_assert_not_reached();
 +        return C_NotImplemented;
      }
  }
-+static void tcg_out_addi_ptr(TCGContext *s, TCGReg rd, TCGReg rs,
-+                             tcg_target_long imm)
-+{
-+    /* This function is only used for passing structs by reference. */
-+    g_assert_not_reached();
-+}
-+
- static void tcg_out_ldst_rr(TCGContext *s, TCGReg data, TCGReg a1,
-                             TCGReg a2, int op)
- {
 diff --git a/tcg/tci/tcg-target.c.inc b/tcg/tci/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tci/tcg-target.c.inc
 +++ b/tcg/tci/tcg-target.c.inc
-@@ -XXX,XX +XXX,XX @@ static void tcg_out_movi(TCGContext *s, TCGType type,
+@@ -XXX,XX +XXX,XX @@ static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
          return TCG_TARGET_REG_BITS == 64 ? C_O0_I2(r, r) : C_O0_I4(r, r, r, r);
      default:
 -        g_assert_not_reached();
 +        return C_NotImplemented;
      }
  }
-+static void tcg_out_addi_ptr(TCGContext *s, TCGReg rd, TCGReg rs,
-+                             tcg_target_long imm)
-+{
-+    /* This function is only used for passing structs by reference. */
-+    g_assert_not_reached();
-+}
-+
- static void tcg_out_call(TCGContext *s, const tcg_insn_unit *func,
-                          const TCGHelperInfo *info)
- {
 --
-.34.1
+.43.0

-[PULL 02/40] tcg: Init temp_subindex in liveness_pass_2
+[PULL 35/68] tcg: Change have_vec to has_type in tcg_op_supported
-Correctly handle large types while lowering.
+Test each vector type, not just lumping them all together.
 Add tests for I32 (always true) and I64 (64-bit hosts).
-Fixes: fac87bd2a49b ("tcg: Add temp_subindex to TCGTemp")
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 ---
- tcg/tcg.c | 1 +
+ tcg/tcg.c | 66 ++++++++++++++++++++++++++++++++++++-------------------
-file changed, 1 insertion(+)
+file changed, 43 insertions(+), 23 deletions(-)
 diff --git a/tcg/tcg.c b/tcg/tcg.c
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tcg.c
 +++ b/tcg/tcg.c
-@@ -XXX,XX +XXX,XX @@ static bool liveness_pass_2(TCGContext *s)
+@@ -XXX,XX +XXX,XX @@ TCGTemp *tcgv_i32_temp(TCGv_i32 v)
-             TCGTemp *dts = tcg_temp_alloc(s);
+  */
-             dts->type = its->type;
+ bool tcg_op_supported(TCGOpcode op, TCGType type, unsigned flags)
-             dts->base_type = its->base_type;
+ {
-+            dts->temp_subindex = its->temp_subindex;
+-    const bool have_vec
-             dts->kind = TEMP_EBB;
+-        = TCG_TARGET_HAS_v64 | TCG_TARGET_HAS_v128 | TCG_TARGET_HAS_v256;
-             its->state_ptr = dts;
++    bool has_type;
-         } else {
++
 +    switch (type) {
 +    case TCG_TYPE_I32:
 +        has_type = true;
 +        break;
 +    case TCG_TYPE_I64:
 +        has_type = TCG_TARGET_REG_BITS == 64;
 +        break;
 +    case TCG_TYPE_V64:
 +        has_type = TCG_TARGET_HAS_v64;
 +        break;
 +    case TCG_TYPE_V128:
 +        has_type = TCG_TARGET_HAS_v128;
 +        break;
 +    case TCG_TYPE_V256:
 +        has_type = TCG_TARGET_HAS_v256;
 +        break;
 +    default:
 +        has_type = false;
 +        break;
 +    }
      switch (op) {
      case INDEX_op_discard:
@@ -XXX,XX +XXX,XX @@ bool tcg_op_supported(TCGOpcode op, TCGType type, unsigned flags)
      case INDEX_op_or_vec:
      case INDEX_op_xor_vec:
      case INDEX_op_cmp_vec:
 -        return have_vec;
 +        return has_type;
      case INDEX_op_dup2_vec:
 -        return have_vec && TCG_TARGET_REG_BITS == 32;
 +        return has_type && TCG_TARGET_REG_BITS == 32;
      case INDEX_op_not_vec:
 -        return have_vec && TCG_TARGET_HAS_not_vec;
 +        return has_type && TCG_TARGET_HAS_not_vec;
      case INDEX_op_neg_vec:
 -        return have_vec && TCG_TARGET_HAS_neg_vec;
 +        return has_type && TCG_TARGET_HAS_neg_vec;
      case INDEX_op_abs_vec:
 -        return have_vec && TCG_TARGET_HAS_abs_vec;
 +        return has_type && TCG_TARGET_HAS_abs_vec;
      case INDEX_op_andc_vec:
 -        return have_vec && TCG_TARGET_HAS_andc_vec;
 +        return has_type && TCG_TARGET_HAS_andc_vec;
      case INDEX_op_orc_vec:
 -        return have_vec && TCG_TARGET_HAS_orc_vec;
 +        return has_type && TCG_TARGET_HAS_orc_vec;
      case INDEX_op_nand_vec:
 -        return have_vec && TCG_TARGET_HAS_nand_vec;
 +        return has_type && TCG_TARGET_HAS_nand_vec;
      case INDEX_op_nor_vec:
 -        return have_vec && TCG_TARGET_HAS_nor_vec;
 +        return has_type && TCG_TARGET_HAS_nor_vec;
      case INDEX_op_eqv_vec:
 -        return have_vec && TCG_TARGET_HAS_eqv_vec;
 +        return has_type && TCG_TARGET_HAS_eqv_vec;
      case INDEX_op_mul_vec:
 -        return have_vec && TCG_TARGET_HAS_mul_vec;
 +        return has_type && TCG_TARGET_HAS_mul_vec;
      case INDEX_op_shli_vec:
      case INDEX_op_shri_vec:
      case INDEX_op_sari_vec:
 -        return have_vec && TCG_TARGET_HAS_shi_vec;
 +        return has_type && TCG_TARGET_HAS_shi_vec;
      case INDEX_op_shls_vec:
      case INDEX_op_shrs_vec:
      case INDEX_op_sars_vec:
 -        return have_vec && TCG_TARGET_HAS_shs_vec;
 +        return has_type && TCG_TARGET_HAS_shs_vec;
      case INDEX_op_shlv_vec:
      case INDEX_op_shrv_vec:
      case INDEX_op_sarv_vec:
 -        return have_vec && TCG_TARGET_HAS_shv_vec;
 +        return has_type && TCG_TARGET_HAS_shv_vec;
      case INDEX_op_rotli_vec:
 -        return have_vec && TCG_TARGET_HAS_roti_vec;
 +        return has_type && TCG_TARGET_HAS_roti_vec;
      case INDEX_op_rotls_vec:
 -        return have_vec && TCG_TARGET_HAS_rots_vec;
 +        return has_type && TCG_TARGET_HAS_rots_vec;
      case INDEX_op_rotlv_vec:
      case INDEX_op_rotrv_vec:
 -        return have_vec && TCG_TARGET_HAS_rotv_vec;
 +        return has_type && TCG_TARGET_HAS_rotv_vec;
      case INDEX_op_ssadd_vec:
      case INDEX_op_usadd_vec:
      case INDEX_op_sssub_vec:
      case INDEX_op_ussub_vec:
 -        return have_vec && TCG_TARGET_HAS_sat_vec;
 +        return has_type && TCG_TARGET_HAS_sat_vec;
      case INDEX_op_smin_vec:
      case INDEX_op_umin_vec:
      case INDEX_op_smax_vec:
      case INDEX_op_umax_vec:
 -        return have_vec && TCG_TARGET_HAS_minmax_vec;
 +        return has_type && TCG_TARGET_HAS_minmax_vec;
      case INDEX_op_bitsel_vec:
 -        return have_vec && TCG_TARGET_HAS_bitsel_vec;
 +        return has_type && TCG_TARGET_HAS_bitsel_vec;
      case INDEX_op_cmpsel_vec:
 -        return have_vec && TCG_TARGET_HAS_cmpsel_vec;
 +        return has_type && TCG_TARGET_HAS_cmpsel_vec;
      default:
          tcg_debug_assert(op > INDEX_op_last_generic && op < NB_OPS);
 --
-.34.1
+.43.0

-[PULL 07/40] tcg: Add TCG_CALL_{RET,ARG}_BY_REF
+[PULL 36/68] tcg: Reorg process_op_defs
-These will be used by some hosts, both 32 and 64-bit, to pass and
+Process each TCGConstraintSetIndex first.  Allocate TCGArgConstraint
-return i128.  Not yet used, because allocation is not yet enabled.
+arrays based on those.  Only afterward process the TCGOpcodes and
 share those TCGArgConstraint arrays.
-Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 ---
- tcg/tcg-internal.h |   3 +
+ include/tcg/tcg.h |   7 +-
- tcg/tcg.c          | 135 ++++++++++++++++++++++++++++++++++++++++++++-
+ tcg/tcg.c         | 272 +++++++++++++++++++++++-----------------------
-files changed, 135 insertions(+), 3 deletions(-)
+files changed, 136 insertions(+), 143 deletions(-)
-diff --git a/tcg/tcg-internal.h b/tcg/tcg-internal.h
+diff --git a/include/tcg/tcg.h b/include/tcg/tcg.h
 index XXXXXXX..XXXXXXX 100644
---- a/tcg/tcg-internal.h
+--- a/include/tcg/tcg.h
-+++ b/tcg/tcg-internal.h
++++ b/include/tcg/tcg.h
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ typedef struct TCGOpDef {
-  */
+     const char *name;
- typedef enum {
+     uint8_t nb_oargs, nb_iargs, nb_cargs, nb_args;
-     TCG_CALL_RET_NORMAL,         /* by registers */
+     uint8_t flags;
-+    TCG_CALL_RET_BY_REF,         /* for i128, by reference */
+-    TCGArgConstraint *args_ct;
- } TCGCallReturnKind;
++    const TCGArgConstraint *args_ct;
+ } TCGOpDef;
- typedef enum {
-@@ -XXX,XX +XXX,XX @@ typedef enum {
+ extern TCGOpDef tcg_op_defs[];
-     TCG_CALL_ARG_EXTEND,         /* for i32, as a sign/zero-extended i64 */
+ extern const size_t tcg_op_defs_max;
-     TCG_CALL_ARG_EXTEND_U,       /*      ... as a zero-extended i64 */
-     TCG_CALL_ARG_EXTEND_S,       /*      ... as a sign-extended i64 */
+-typedef struct TCGTargetOpDef {
-+    TCG_CALL_ARG_BY_REF,         /* for i128, by reference, first */
+-    TCGOpcode op;
-+    TCG_CALL_ARG_BY_REF_N,       /*       ... by reference, subsequent */
+-    const char *args_ct_str[TCG_MAX_OP_ARGS];
- } TCGCallArgumentKind;
+-} TCGTargetOpDef;
+-
- typedef struct TCGCallArgumentLoc {
+ /*
   * tcg_op_supported:
   * Query if @op, for @type and @flags, is supported by the host
 diff --git a/tcg/tcg.c b/tcg/tcg.c
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tcg.c
 +++ b/tcg/tcg.c
-@@ -XXX,XX +XXX,XX @@ static void tcg_out_ld(TCGContext *s, TCGType type, TCGReg ret, TCGReg arg1,
+@@ -XXX,XX +XXX,XX @@ static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode);
- static bool tcg_out_mov(TCGContext *s, TCGType type, TCGReg ret, TCGReg arg);
- static void tcg_out_movi(TCGContext *s, TCGType type,
+ /* Put all of the constraint sets into an array, indexed by the enum. */
-                          TCGReg ret, tcg_target_long arg);
--static void tcg_out_addi_ptr(TCGContext *s, TCGReg, TCGReg, tcg_target_long)
+-#define C_O0_I1(I1)                     { .args_ct_str = { #I1 } },
--    __attribute__((unused));
+-#define C_O0_I2(I1, I2)                 { .args_ct_str = { #I1, #I2 } },
-+static void tcg_out_addi_ptr(TCGContext *s, TCGReg, TCGReg, tcg_target_long);
+-#define C_O0_I3(I1, I2, I3)             { .args_ct_str = { #I1, #I2, #I3 } },
- static void tcg_out_exit_tb(TCGContext *s, uintptr_t arg);
+-#define C_O0_I4(I1, I2, I3, I4)         { .args_ct_str = { #I1, #I2, #I3, #I4 } },
- static void tcg_out_goto_tb(TCGContext *s, int which);
++typedef struct TCGConstraintSet {
- static void tcg_out_op(TCGContext *s, TCGOpcode opc,
++    uint8_t nb_oargs, nb_iargs;
-@@ -XXX,XX +XXX,XX @@ static void layout_arg_normal_n(TCGCumulativeArgs *cum,
++    const char *args_ct_str[TCG_MAX_OP_ARGS];
-     cum->arg_slot += n;
++} TCGConstraintSet;
 -#define C_O1_I1(O1, I1)                 { .args_ct_str = { #O1, #I1 } },
 -#define C_O1_I2(O1, I1, I2)             { .args_ct_str = { #O1, #I1, #I2 } },
 -#define C_O1_I3(O1, I1, I2, I3)         { .args_ct_str = { #O1, #I1, #I2, #I3 } },
 -#define C_O1_I4(O1, I1, I2, I3, I4)     { .args_ct_str = { #O1, #I1, #I2, #I3, #I4 } },
 +#define C_O0_I1(I1)                     { 0, 1, { #I1 } },
 +#define C_O0_I2(I1, I2)                 { 0, 2, { #I1, #I2 } },
 +#define C_O0_I3(I1, I2, I3)             { 0, 3, { #I1, #I2, #I3 } },
 +#define C_O0_I4(I1, I2, I3, I4)         { 0, 4, { #I1, #I2, #I3, #I4 } },
 -#define C_N1_I2(O1, I1, I2)             { .args_ct_str = { "&" #O1, #I1, #I2 } },
 -#define C_N1O1_I1(O1, O2, I1)           { .args_ct_str = { "&" #O1, #O2, #I1 } },
 -#define C_N2_I1(O1, O2, I1)             { .args_ct_str = { "&" #O1, "&" #O2, #I1 } },
 +#define C_O1_I1(O1, I1)                 { 1, 1, { #O1, #I1 } },
 +#define C_O1_I2(O1, I1, I2)             { 1, 2, { #O1, #I1, #I2 } },
 +#define C_O1_I3(O1, I1, I2, I3)         { 1, 3, { #O1, #I1, #I2, #I3 } },
 +#define C_O1_I4(O1, I1, I2, I3, I4)     { 1, 4, { #O1, #I1, #I2, #I3, #I4 } },
 -#define C_O2_I1(O1, O2, I1)             { .args_ct_str = { #O1, #O2, #I1 } },
 -#define C_O2_I2(O1, O2, I1, I2)         { .args_ct_str = { #O1, #O2, #I1, #I2 } },
 -#define C_O2_I3(O1, O2, I1, I2, I3)     { .args_ct_str = { #O1, #O2, #I1, #I2, #I3 } },
 -#define C_O2_I4(O1, O2, I1, I2, I3, I4) { .args_ct_str = { #O1, #O2, #I1, #I2, #I3, #I4 } },
 -#define C_N1_O1_I4(O1, O2, I1, I2, I3, I4) { .args_ct_str = { "&" #O1, #O2, #I1, #I2, #I3, #I4 } },
 +#define C_N1_I2(O1, I1, I2)             { 1, 2, { "&" #O1, #I1, #I2 } },
 +#define C_N1O1_I1(O1, O2, I1)           { 2, 1, { "&" #O1, #O2, #I1 } },
 +#define C_N2_I1(O1, O2, I1)             { 2, 1, { "&" #O1, "&" #O2, #I1 } },
 -static const TCGTargetOpDef constraint_sets[] = {
 +#define C_O2_I1(O1, O2, I1)             { 2, 1, { #O1, #O2, #I1 } },
 +#define C_O2_I2(O1, O2, I1, I2)         { 2, 2, { #O1, #O2, #I1, #I2 } },
 +#define C_O2_I3(O1, O2, I1, I2, I3)     { 2, 3, { #O1, #O2, #I1, #I2, #I3 } },
 +#define C_O2_I4(O1, O2, I1, I2, I3, I4) { 2, 4, { #O1, #O2, #I1, #I2, #I3, #I4 } },
 +#define C_N1_O1_I4(O1, O2, I1, I2, I3, I4) { 2, 4, { "&" #O1, #O2, #I1, #I2, #I3, #I4 } },
 +
 +static const TCGConstraintSet constraint_sets[] = {
  #include "tcg-target-con-set.h"
  };
 -
  #undef C_O0_I1
  #undef C_O0_I2
  #undef C_O0_I3
@@ -XXX,XX +XXX,XX @@ static TCGTemp *tcg_global_reg_new_internal(TCGContext *s, TCGType type,
  static void tcg_context_init(unsigned max_cpus)
  {
      TCGContext *s = &tcg_init_ctx;
 -    int op, total_args, n, i;
 -    TCGOpDef *def;
 -    TCGArgConstraint *args_ct;
 +    int n, i;
      TCGTemp *ts;
      memset(s, 0, sizeof(*s));
      s->nb_globals = 0;
 -    /* Count total number of arguments and allocate the corresponding
 -       space */
 -    total_args = 0;
 -    for(op = 0; op < NB_OPS; op++) {
 -        def = &tcg_op_defs[op];
 -        n = def->nb_iargs + def->nb_oargs;
 -        total_args += n;
 -    }
 -
 -    args_ct = g_new0(TCGArgConstraint, total_args);
 -
 -    for(op = 0; op < NB_OPS; op++) {
 -        def = &tcg_op_defs[op];
 -        def->args_ct = args_ct;
 -        n = def->nb_iargs + def->nb_oargs;
 -        args_ct += n;
 -    }
 -
      init_call_layout(&info_helper_ld32_mmu);
      init_call_layout(&info_helper_ld64_mmu);
      init_call_layout(&info_helper_ld128_mmu);
@@ -XXX,XX +XXX,XX @@ void tcg_dump_ops(TCGContext *s, FILE *f, bool have_prefs)
  }
-+static void layout_arg_by_ref(TCGCumulativeArgs *cum, TCGHelperInfo *info)
+ /* we give more priority to constraints with less registers */
-+{
+-static int get_constraint_priority(const TCGOpDef *def, int k)
-+    TCGCallArgumentLoc *loc = &info->in[cum->info_in_idx];
++static int get_constraint_priority(const TCGArgConstraint *arg_ct, int k)
 +    int n = 128 / TCG_TARGET_REG_BITS;
 +
 +    /* The first subindex carries the pointer. */
 +    layout_arg_1(cum, info, TCG_CALL_ARG_BY_REF);
 +
 +    /*
 +     * The callee is allowed to clobber memory associated with
 +     * structure pass by-reference.  Therefore we must make copies.
 +     * Allocate space from "ref_slot", which will be adjusted to
 +     * follow the parameters on the stack.
 +     */
 +    loc[0].ref_slot = cum->ref_slot;
 +
 +    /*
 +     * Subsequent words also go into the reference slot, but
 +     * do not accumulate into the regular arguments.
 +     */
 +    for (int i = 1; i < n; ++i) {
 +        loc[i] = (TCGCallArgumentLoc){
 +            .kind = TCG_CALL_ARG_BY_REF_N,
 +            .arg_idx = cum->arg_idx,
 +            .tmp_subindex = i,
 +            .ref_slot = cum->ref_slot + i,
 +        };
 +    }
 +    cum->info_in_idx += n;
 +    cum->ref_slot += n;
 +}
 +
  static void init_call_layout(TCGHelperInfo *info)
  {
-     int max_reg_slots = ARRAY_SIZE(tcg_target_call_iarg_regs);
+-    const TCGArgConstraint *arg_ct = &def->args_ct[k];
-@@ -XXX,XX +XXX,XX @@ static void init_call_layout(TCGHelperInfo *info)
+-    int n = ctpop64(arg_ct->regs);
-         case TCG_CALL_RET_NORMAL:
++    int n;
-             assert(info->nr_out <= ARRAY_SIZE(tcg_target_call_oarg_regs));
++
-             break;
++    arg_ct += k;
-+        case TCG_CALL_RET_BY_REF:
++    n = ctpop64(arg_ct->regs);
-+            /*
-+             * Allocate the first argument to the output.
+     /*
-+             * We don't need to store this anywhere, just make it
+      * Sort constraints of a single register first, which includes output
-+             * unavailable for use in the input loop below.
+@@ -XXX,XX +XXX,XX @@ static int get_constraint_priority(const TCGOpDef *def, int k)
 +             */
 +            cum.arg_slot = 1;
 +            break;
          default:
              qemu_build_not_reached();
          }
@@ -XXX,XX +XXX,XX @@ static void init_call_layout(TCGHelperInfo *info)
              case TCG_CALL_ARG_NORMAL:
                  layout_arg_normal_n(&cum, info, 128 / TCG_TARGET_REG_BITS);
                  break;
 +            case TCG_CALL_ARG_BY_REF:
 +                layout_arg_by_ref(&cum, info);
 +                break;
              default:
                  qemu_build_not_reached();
              }
@@ -XXX,XX +XXX,XX @@ static void init_call_layout(TCGHelperInfo *info)
      assert(cum.info_in_idx <= ARRAY_SIZE(info->in));
      /* Validate the backend has enough argument space. */
      assert(cum.arg_slot <= max_reg_slots + max_stk_slots);
 -    assert(cum.ref_slot <= max_stk_slots);
 +
 +    /*
 +     * Relocate the "ref_slot" area to the end of the parameters.
 +     * Minimizing this stack offset helps code size for x86,
 +     * which has a signed 8-bit offset encoding.
 +     */
 +    if (cum.ref_slot != 0) {
 +        int ref_base = 0;
 +
 +        if (cum.arg_slot > max_reg_slots) {
 +            int align = __alignof(Int128) / sizeof(tcg_target_long);
 +
 +            ref_base = cum.arg_slot - max_reg_slots;
 +            if (align > 1) {
 +                ref_base = ROUND_UP(ref_base, align);
 +            }
 +        }
 +        assert(ref_base + cum.ref_slot <= max_stk_slots);
 +
 +        if (ref_base != 0) {
 +            for (int i = cum.info_in_idx - 1; i >= 0; --i) {
 +                TCGCallArgumentLoc *loc = &info->in[i];
 +                switch (loc->kind) {
 +                case TCG_CALL_ARG_BY_REF:
 +                case TCG_CALL_ARG_BY_REF_N:
 +                    loc->ref_slot += ref_base;
 +                    break;
 +                default:
 +                    break;
 +                }
 +            }
 +        }
 +    }
  }
- static int indirect_reg_alloc_order[ARRAY_SIZE(tcg_target_reg_alloc_order)];
+ /* sort from highest priority to lowest */
-@@ -XXX,XX +XXX,XX @@ void tcg_gen_callN(void *func, TCGTemp *ret, int nargs, TCGTemp **args)
+-static void sort_constraints(TCGOpDef *def, int start, int n)
++static void sort_constraints(TCGArgConstraint *a, int start, int n)
-         switch (loc->kind) {
+ {
-         case TCG_CALL_ARG_NORMAL:
+     int i, j;
-+        case TCG_CALL_ARG_BY_REF:
+-    TCGArgConstraint *a = def->args_ct;
-+        case TCG_CALL_ARG_BY_REF_N:
-             op->args[pi++] = temp_arg(ts);
+     for (i = 0; i < n; i++) {
-             break;
+         a[start + i].sort_index = start + i;
+@@ -XXX,XX +XXX,XX @@ static void sort_constraints(TCGOpDef *def, int start, int n)
-@@ -XXX,XX +XXX,XX @@ static void load_arg_normal(TCGContext *s, const TCGCallArgumentLoc *l,
+     }
      for (i = 0; i < n - 1; i++) {
          for (j = i + 1; j < n; j++) {
 -            int p1 = get_constraint_priority(def, a[start + i].sort_index);
 -            int p2 = get_constraint_priority(def, a[start + j].sort_index);
 +            int p1 = get_constraint_priority(a, a[start + i].sort_index);
 +            int p2 = get_constraint_priority(a, a[start + j].sort_index);
              if (p1 < p2) {
                  int tmp = a[start + i].sort_index;
                  a[start + i].sort_index = a[start + j].sort_index;
@@ -XXX,XX +XXX,XX @@ static void sort_constraints(TCGOpDef *def, int start, int n)
      }
  }
-+static void load_arg_ref(TCGContext *s, int arg_slot, TCGReg ref_base,
++static const TCGArgConstraint empty_cts[TCG_MAX_OP_ARGS];
-+                         intptr_t ref_off, TCGRegSet *allocated_regs)
++static TCGArgConstraint all_cts[ARRAY_SIZE(constraint_sets)][TCG_MAX_OP_ARGS];
-+{
++
-+    TCGReg reg;
+ static void process_op_defs(TCGContext *s)
-+    int stk_slot = arg_slot - ARRAY_SIZE(tcg_target_call_iarg_regs);
+ {
-+
+-    TCGOpcode op;
-+    if (stk_slot < 0) {
+-
-+        reg = tcg_target_call_iarg_regs[arg_slot];
+-    for (op = 0; op < NB_OPS; op++) {
-+        tcg_reg_free(s, reg, *allocated_regs);
+-        TCGOpDef *def = &tcg_op_defs[op];
-+        tcg_out_addi_ptr(s, reg, ref_base, ref_off);
+-        const TCGTargetOpDef *tdefs;
-+        tcg_regset_set_reg(*allocated_regs, reg);
++    for (size_t c = 0; c < ARRAY_SIZE(constraint_sets); ++c) {
-+    } else {
++        const TCGConstraintSet *tdefs = &constraint_sets[c];
-+        reg = tcg_reg_alloc(s, tcg_target_available_regs[TCG_TYPE_PTR],
++        TCGArgConstraint *args_ct = all_cts[c];
-+                            *allocated_regs, 0, false);
++        int nb_oargs = tdefs->nb_oargs;
-+        tcg_out_addi_ptr(s, reg, ref_base, ref_off);
++        int nb_iargs = tdefs->nb_iargs;
-+        tcg_out_st(s, TCG_TYPE_PTR, reg, TCG_REG_CALL_STACK,
++        int nb_args = nb_oargs + nb_iargs;
-+                   TCG_TARGET_CALL_STACK_OFFSET
+         bool saw_alias_pair = false;
-+                   + stk_slot * sizeof(tcg_target_long));
+-        int i, o, i2, o2, nb_args;
 -        TCGConstraintSetIndex con_set;
 -        if (def->flags & TCG_OPF_NOT_PRESENT) {
 -            continue;
 -        }
 -
 -        nb_args = def->nb_iargs + def->nb_oargs;
 -        if (nb_args == 0) {
 -            continue;
 -        }
 -
 -        /*
 -         * Macro magic should make it impossible, but double-check that
 -         * the array index is in range.  At the same time, double-check
 -         * that the opcode is implemented, i.e. not C_NotImplemented.
 -         */
 -        con_set = tcg_target_op_def(op);
 -        tcg_debug_assert(con_set >= 0 && con_set < ARRAY_SIZE(constraint_sets));
 -        tdefs = &constraint_sets[con_set];
 -
 -        for (i = 0; i < nb_args; i++) {
 +        for (int i = 0; i < nb_args; i++) {
              const char *ct_str = tdefs->args_ct_str[i];
 -            bool input_p = i >= def->nb_oargs;
 -
 -            /* Incomplete TCGTargetOpDef entry. */
 -            tcg_debug_assert(ct_str != NULL);
 +            bool input_p = i >= nb_oargs;
 +            int o;
              switch (*ct_str) {
              case '0' ... '9':
                  o = *ct_str - '0';
                  tcg_debug_assert(input_p);
 -                tcg_debug_assert(o < def->nb_oargs);
 -                tcg_debug_assert(def->args_ct[o].regs != 0);
 -                tcg_debug_assert(!def->args_ct[o].oalias);
 -                def->args_ct[i] = def->args_ct[o];
 +                tcg_debug_assert(o < nb_oargs);
 +                tcg_debug_assert(args_ct[o].regs != 0);
 +                tcg_debug_assert(!args_ct[o].oalias);
 +                args_ct[i] = args_ct[o];
                  /* The output sets oalias.  */
 -                def->args_ct[o].oalias = 1;
 -                def->args_ct[o].alias_index = i;
 +                args_ct[o].oalias = 1;
 +                args_ct[o].alias_index = i;
                  /* The input sets ialias. */
 -                def->args_ct[i].ialias = 1;
 -                def->args_ct[i].alias_index = o;
 -                if (def->args_ct[i].pair) {
 +                args_ct[i].ialias = 1;
 +                args_ct[i].alias_index = o;
 +                if (args_ct[i].pair) {
                      saw_alias_pair = true;
                  }
                  tcg_debug_assert(ct_str[1] == '\0');
@@ -XXX,XX +XXX,XX @@ static void process_op_defs(TCGContext *s)
              case '&':
                  tcg_debug_assert(!input_p);
 -                def->args_ct[i].newreg = true;
 +                args_ct[i].newreg = true;
                  ct_str++;
                  break;
              case 'p': /* plus */
                  /* Allocate to the register after the previous. */
 -                tcg_debug_assert(i > (input_p ? def->nb_oargs : 0));
 +                tcg_debug_assert(i > (input_p ? nb_oargs : 0));
                  o = i - 1;
 -                tcg_debug_assert(!def->args_ct[o].pair);
 -                tcg_debug_assert(!def->args_ct[o].ct);
 -                def->args_ct[i] = (TCGArgConstraint){
 +                tcg_debug_assert(!args_ct[o].pair);
 +                tcg_debug_assert(!args_ct[o].ct);
 +                args_ct[i] = (TCGArgConstraint){
                      .pair = 2,
                      .pair_index = o,
 -                    .regs = def->args_ct[o].regs << 1,
 -                    .newreg = def->args_ct[o].newreg,
 +                    .regs = args_ct[o].regs << 1,
 +                    .newreg = args_ct[o].newreg,
                  };
 -                def->args_ct[o].pair = 1;
 -                def->args_ct[o].pair_index = i;
 +                args_ct[o].pair = 1;
 +                args_ct[o].pair_index = i;
                  tcg_debug_assert(ct_str[1] == '\0');
                  continue;
              case 'm': /* minus */
                  /* Allocate to the register before the previous. */
 -                tcg_debug_assert(i > (input_p ? def->nb_oargs : 0));
 +                tcg_debug_assert(i > (input_p ? nb_oargs : 0));
                  o = i - 1;
 -                tcg_debug_assert(!def->args_ct[o].pair);
 -                tcg_debug_assert(!def->args_ct[o].ct);
 -                def->args_ct[i] = (TCGArgConstraint){
 +                tcg_debug_assert(!args_ct[o].pair);
 +                tcg_debug_assert(!args_ct[o].ct);
 +                args_ct[i] = (TCGArgConstraint){
                      .pair = 1,
                      .pair_index = o,
 -                    .regs = def->args_ct[o].regs >> 1,
 -                    .newreg = def->args_ct[o].newreg,
 +                    .regs = args_ct[o].regs >> 1,
 +                    .newreg = args_ct[o].newreg,
                  };
 -                def->args_ct[o].pair = 2;
 -                def->args_ct[o].pair_index = i;
 +                args_ct[o].pair = 2;
 +                args_ct[o].pair_index = i;
                  tcg_debug_assert(ct_str[1] == '\0');
                  continue;
              }
@@ -XXX,XX +XXX,XX @@ static void process_op_defs(TCGContext *s)
              do {
                  switch (*ct_str) {
                  case 'i':
 -                    def->args_ct[i].ct |= TCG_CT_CONST;
 +                    args_ct[i].ct |= TCG_CT_CONST;
                      break;
                  /* Include all of the target-specific constraints. */
  #undef CONST
  #define CONST(CASE, MASK) \
 -    case CASE: def->args_ct[i].ct |= MASK; break;
 +    case CASE: args_ct[i].ct |= MASK; break;
  #define REGS(CASE, MASK) \
 -    case CASE: def->args_ct[i].regs |= MASK; break;
 +    case CASE: args_ct[i].regs |= MASK; break;
  #include "tcg-target-con-str.h"
@@ -XXX,XX +XXX,XX @@ static void process_op_defs(TCGContext *s)
                  case '&':
                  case 'p':
                  case 'm':
 -                    /* Typo in TCGTargetOpDef constraint. */
 +                    /* Typo in TCGConstraintSet constraint. */
                      g_assert_not_reached();
                  }
              } while (*++ct_str != '\0');
          }
 -        /* TCGTargetOpDef entry with too much information? */
 -        tcg_debug_assert(i == TCG_MAX_OP_ARGS || tdefs->args_ct_str[i] == NULL);
 -
          /*
           * Fix up output pairs that are aliased with inputs.
           * When we created the alias, we copied pair from the output.
@@ -XXX,XX +XXX,XX @@ static void process_op_defs(TCGContext *s)
           * first output to pair=3, and the pair_index'es to match.
           */
          if (saw_alias_pair) {
 -            for (i = def->nb_oargs; i < nb_args; i++) {
 +            for (int i = nb_oargs; i < nb_args; i++) {
 +                int o, o2, i2;
 +
                  /*
                   * Since [0-9pm] must be alone in the constraint string,
                   * the only way they can both be set is if the pair comes
                   * from the output alias.
                   */
 -                if (!def->args_ct[i].ialias) {
 +                if (!args_ct[i].ialias) {
                      continue;
                  }
 -                switch (def->args_ct[i].pair) {
 +                switch (args_ct[i].pair) {
                  case 0:
                      break;
                  case 1:
 -                    o = def->args_ct[i].alias_index;
 -                    o2 = def->args_ct[o].pair_index;
 -                    tcg_debug_assert(def->args_ct[o].pair == 1);
 -                    tcg_debug_assert(def->args_ct[o2].pair == 2);
 -                    if (def->args_ct[o2].oalias) {
 +                    o = args_ct[i].alias_index;
 +                    o2 = args_ct[o].pair_index;
 +                    tcg_debug_assert(args_ct[o].pair == 1);
 +                    tcg_debug_assert(args_ct[o2].pair == 2);
 +                    if (args_ct[o2].oalias) {
                          /* Case 1a */
 -                        i2 = def->args_ct[o2].alias_index;
 -                        tcg_debug_assert(def->args_ct[i2].pair == 2);
 -                        def->args_ct[i2].pair_index = i;
 -                        def->args_ct[i].pair_index = i2;
 +                        i2 = args_ct[o2].alias_index;
 +                        tcg_debug_assert(args_ct[i2].pair == 2);
 +                        args_ct[i2].pair_index = i;
 +                        args_ct[i].pair_index = i2;
                      } else {
                          /* Case 1b */
 -                        def->args_ct[i].pair_index = i;
 +                        args_ct[i].pair_index = i;
                      }
                      break;
                  case 2:
 -                    o = def->args_ct[i].alias_index;
 -                    o2 = def->args_ct[o].pair_index;
 -                    tcg_debug_assert(def->args_ct[o].pair == 2);
 -                    tcg_debug_assert(def->args_ct[o2].pair == 1);
 -                    if (def->args_ct[o2].oalias) {
 +                    o = args_ct[i].alias_index;
 +                    o2 = args_ct[o].pair_index;
 +                    tcg_debug_assert(args_ct[o].pair == 2);
 +                    tcg_debug_assert(args_ct[o2].pair == 1);
 +                    if (args_ct[o2].oalias) {
                          /* Case 1a */
 -                        i2 = def->args_ct[o2].alias_index;
 -                        tcg_debug_assert(def->args_ct[i2].pair == 1);
 -                        def->args_ct[i2].pair_index = i;
 -                        def->args_ct[i].pair_index = i2;
 +                        i2 = args_ct[o2].alias_index;
 +                        tcg_debug_assert(args_ct[i2].pair == 1);
 +                        args_ct[i2].pair_index = i;
 +                        args_ct[i].pair_index = i2;
                      } else {
                          /* Case 2 */
 -                        def->args_ct[i].pair = 3;
 -                        def->args_ct[o2].pair = 3;
 -                        def->args_ct[i].pair_index = o2;
 -                        def->args_ct[o2].pair_index = i;
 +                        args_ct[i].pair = 3;
 +                        args_ct[o2].pair = 3;
 +                        args_ct[i].pair_index = o2;
 +                        args_ct[o2].pair_index = i;
                      }
                      break;
                  default:
@@ -XXX,XX +XXX,XX @@ static void process_op_defs(TCGContext *s)
          }
          /* sort the constraints (XXX: this is just an heuristic) */
 -        sort_constraints(def, 0, def->nb_oargs);
 -        sort_constraints(def, def->nb_oargs, def->nb_iargs);
 +        sort_constraints(args_ct, 0, nb_oargs);
 +        sort_constraints(args_ct, nb_oargs, nb_iargs);
 +    }
-+}
++
-+
++    for (TCGOpcode op = 0; op < NB_OPS; op++) {
- static void tcg_reg_alloc_call(TCGContext *s, TCGOp *op)
++        TCGOpDef *def = &tcg_op_defs[op];
- {
++        const TCGConstraintSet *tdefs;
-     const int nb_oargs = TCGOP_CALLO(op);
++        TCGConstraintSetIndex con_set;
-@@ -XXX,XX +XXX,XX @@ static void tcg_reg_alloc_call(TCGContext *s, TCGOp *op)
++        int nb_args;
-         case TCG_CALL_ARG_EXTEND_S:
++
-             load_arg_normal(s, loc, ts, &allocated_regs);
++        nb_args = def->nb_iargs + def->nb_oargs;
-             break;
++        if (nb_args == 0) {
-+        case TCG_CALL_ARG_BY_REF:
++            continue;
-+            load_arg_stk(s, loc->ref_slot, ts, allocated_regs);
++        }
-+            load_arg_ref(s, loc->arg_slot, TCG_REG_CALL_STACK,
++
-+                         TCG_TARGET_CALL_STACK_OFFSET
++        if (def->flags & TCG_OPF_NOT_PRESENT) {
-+                         + loc->ref_slot * sizeof(tcg_target_long),
++            def->args_ct = empty_cts;
-+                         &allocated_regs);
++            continue;
-+            break;
++        }
-+        case TCG_CALL_ARG_BY_REF_N:
++
-+            load_arg_stk(s, loc->ref_slot, ts, allocated_regs);
++        /*
-+            break;
++         * Macro magic should make it impossible, but double-check that
-         default:
++         * the array index is in range.  At the same time, double-check
-             g_assert_not_reached();
++         * that the opcode is implemented, i.e. not C_NotImplemented.
-         }
++         */
-@@ -XXX,XX +XXX,XX @@ static void tcg_reg_alloc_call(TCGContext *s, TCGOp *op)
++        con_set = tcg_target_op_def(op);
-         save_globals(s, allocated_regs);
++        tcg_debug_assert(con_set >= 0 && con_set < ARRAY_SIZE(constraint_sets));
 +
 +        /* The constraint arguments must match TCGOpcode arguments. */
 +        tdefs = &constraint_sets[con_set];
 +        tcg_debug_assert(tdefs->nb_oargs == def->nb_oargs);
 +        tcg_debug_assert(tdefs->nb_iargs == def->nb_iargs);
 +
 +        def->args_ct = all_cts[con_set];
      }
+ }
-+    /*
 +     * If the ABI passes a pointer to the returned struct as the first
 +     * argument, load that now.  Pass a pointer to the output home slot.
 +     */
 +    if (info->out_kind == TCG_CALL_RET_BY_REF) {
 +        TCGTemp *ts = arg_temp(op->args[0]);
 +
 +        if (!ts->mem_allocated) {
 +            temp_allocate_frame(s, ts);
 +        }
 +        load_arg_ref(s, 0, ts->mem_base->reg, ts->mem_offset, &allocated_regs);
 +    }
 +
      tcg_out_call(s, tcg_call_func(op), info);
      /* Assign output registers and emit moves if needed.  */
@@ -XXX,XX +XXX,XX @@ static void tcg_reg_alloc_call(TCGContext *s, TCGOp *op)
              ts->mem_coherent = 0;
          }
          break;
 +
 +    case TCG_CALL_RET_BY_REF:
 +        /* The callee has performed a write through the reference. */
 +        for (i = 0; i < nb_oargs; i++) {
 +            TCGTemp *ts = arg_temp(op->args[i]);
 +            ts->val_type = TEMP_VAL_MEM;
 +        }
 +        break;
 +
      default:
          g_assert_not_reached();
      }
 --
-.34.1
+.43.0

-[PULL 35/40] target/s390x: Use tcg_gen_atomic_cmpxchg_i128 for CDSG
+[PULL 37/68] tcg: Remove args_ct from TCGOpDef
-Acked-by: Ilya Leoshkevich <iii@linux.ibm.com>
+Introduce a new function, opcode_args_ct, to look up the argument
 set for an opcode.  We lose the ability to assert the correctness
 of the map from TCGOpcode to constraint sets at startup, but we can
 still validate at runtime upon lookup.
 Rename process_op_defs to process_constraint_sets, as it now does
 nothing to TCGOpDef.
 Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 ---
- target/s390x/helper.h            |  2 --
+ include/tcg/tcg.h |  1 -
- target/s390x/tcg/insn-data.h.inc |  2 +-
+ tcg/tcg-common.c  |  2 +-
- target/s390x/tcg/mem_helper.c    | 52 ------------------------------
+ tcg/tcg.c         | 82 ++++++++++++++++++++++-------------------------
- target/s390x/tcg/translate.c     | 55 +++++++++++++++++++-------------
+files changed, 40 insertions(+), 45 deletions(-)
-files changed, 33 insertions(+), 78 deletions(-)
+diff --git a/include/tcg/tcg.h b/include/tcg/tcg.h
 diff --git a/target/s390x/helper.h b/target/s390x/helper.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/s390x/helper.h
+--- a/include/tcg/tcg.h
-+++ b/target/s390x/helper.h
++++ b/include/tcg/tcg.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_3(cxgb, i128, env, s64, i32)
+@@ -XXX,XX +XXX,XX @@ typedef struct TCGOpDef {
- DEF_HELPER_3(celgb, i64, env, i64, i32)
+     const char *name;
- DEF_HELPER_3(cdlgb, i64, env, i64, i32)
+     uint8_t nb_oargs, nb_iargs, nb_cargs, nb_args;
- DEF_HELPER_3(cxlgb, i128, env, i64, i32)
+     uint8_t flags;
--DEF_HELPER_4(cdsg, void, env, i64, i32, i32)
+-    const TCGArgConstraint *args_ct;
--DEF_HELPER_4(cdsg_parallel, void, env, i64, i32, i32)
+ } TCGOpDef;
- DEF_HELPER_4(csst, i32, env, i32, i64, i64)
- DEF_HELPER_4(csst_parallel, i32, env, i32, i64, i64)
+ extern TCGOpDef tcg_op_defs[];
- DEF_HELPER_FLAGS_3(aeb, TCG_CALL_NO_WG, i64, env, i64, i64)
+diff --git a/tcg/tcg-common.c b/tcg/tcg-common.c
 diff --git a/target/s390x/tcg/insn-data.h.inc b/target/s390x/tcg/insn-data.h.inc
 index XXXXXXX..XXXXXXX 100644
---- a/target/s390x/tcg/insn-data.h.inc
+--- a/tcg/tcg-common.c
-+++ b/target/s390x/tcg/insn-data.h.inc
++++ b/tcg/tcg-common.c
 @@ -XXX,XX +XXX,XX @@
- /* COMPARE DOUBLE AND SWAP */
-     D(0xbb00, CDS,     RS_a,  Z,   r3_D32, r1_D32, new, r1_D32, cs, 0, MO_TEUQ)
+ TCGOpDef tcg_op_defs[] = {
-     D(0xeb31, CDSY,    RSY_a, LD,  r3_D32, r1_D32, new, r1_D32, cs, 0, MO_TEUQ)
+ #define DEF(s, oargs, iargs, cargs, flags) \
--    C(0xeb3e, CDSG,    RSY_a, Z,   0, 0, 0, 0, cdsg, 0)
+-         { #s, oargs, iargs, cargs, iargs + oargs + cargs, flags, NULL },
-+    C(0xeb3e, CDSG,    RSY_a, Z,   la2, r3_D64, 0, r1_D64, cdsg, 0)
++         { #s, oargs, iargs, cargs, iargs + oargs + cargs, flags },
- /* COMPARE AND SWAP AND STORE */
+ #include "tcg/tcg-opc.h"
-     C(0xc802, CSST,    SSF,   CASS, la1, a2, 0, 0, csst, 0)
+ #undef DEF
+ };
-diff --git a/target/s390x/tcg/mem_helper.c b/target/s390x/tcg/mem_helper.c
+diff --git a/tcg/tcg.c b/tcg/tcg.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/s390x/tcg/mem_helper.c
+--- a/tcg/tcg.c
-+++ b/target/s390x/tcg/mem_helper.c
++++ b/tcg/tcg.c
-@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(trXX)(CPUS390XState *env, uint32_t r1, uint32_t r2,
+@@ -XXX,XX +XXX,XX @@ static void init_call_layout(TCGHelperInfo *info)
      return cc;
  }
--void HELPER(cdsg)(CPUS390XState *env, uint64_t addr,
+ static int indirect_reg_alloc_order[ARRAY_SIZE(tcg_target_reg_alloc_order)];
--                  uint32_t r1, uint32_t r3)
+-static void process_op_defs(TCGContext *s);
--{
++static void process_constraint_sets(void);
--    uintptr_t ra = GETPC();
+ static TCGTemp *tcg_global_reg_new_internal(TCGContext *s, TCGType type,
--    Int128 cmpv = int128_make128(env->regs[r1 + 1], env->regs[r1]);
+                                             TCGReg reg, const char *name);
--    Int128 newv = int128_make128(env->regs[r3 + 1], env->regs[r3]);
--    Int128 oldv;
+@@ -XXX,XX +XXX,XX @@ static void tcg_context_init(unsigned max_cpus)
--    uint64_t oldh, oldl;
+     init_call_layout(&info_helper_st128_mmu);
--    bool fail;
--
+     tcg_target_init(s);
--    check_alignment(env, addr, 16, ra);
+-    process_op_defs(s);
--
++    process_constraint_sets();
--    oldh = cpu_ldq_data_ra(env, addr + 0, ra);
--    oldl = cpu_ldq_data_ra(env, addr + 8, ra);
+     /* Reverse the order of the saved registers, assuming they're all at
--
+        the start of tcg_target_reg_alloc_order.  */
--    oldv = int128_make128(oldl, oldh);
+@@ -XXX,XX +XXX,XX @@ static void sort_constraints(TCGArgConstraint *a, int start, int n)
--    fail = !int128_eq(oldv, cmpv);
+ static const TCGArgConstraint empty_cts[TCG_MAX_OP_ARGS];
--    if (fail) {
+ static TCGArgConstraint all_cts[ARRAY_SIZE(constraint_sets)][TCG_MAX_OP_ARGS];
--        newv = oldv;
--    }
+-static void process_op_defs(TCGContext *s)
--
++static void process_constraint_sets(void)
 -    cpu_stq_data_ra(env, addr + 0, int128_gethi(newv), ra);
 -    cpu_stq_data_ra(env, addr + 8, int128_getlo(newv), ra);
 -
 -    env->cc_op = fail;
 -    env->regs[r1] = int128_gethi(oldv);
 -    env->regs[r1 + 1] = int128_getlo(oldv);
 -}
 -
 -void HELPER(cdsg_parallel)(CPUS390XState *env, uint64_t addr,
 -                           uint32_t r1, uint32_t r3)
 -{
 -    uintptr_t ra = GETPC();
 -    Int128 cmpv = int128_make128(env->regs[r1 + 1], env->regs[r1]);
 -    Int128 newv = int128_make128(env->regs[r3 + 1], env->regs[r3]);
 -    int mem_idx;
 -    MemOpIdx oi;
 -    Int128 oldv;
 -    bool fail;
 -
 -    assert(HAVE_CMPXCHG128);
 -
 -    mem_idx = cpu_mmu_index(env, false);
 -    oi = make_memop_idx(MO_TE | MO_128 | MO_ALIGN, mem_idx);
 -    oldv = cpu_atomic_cmpxchgo_be_mmu(env, addr, cmpv, newv, oi, ra);
 -    fail = !int128_eq(oldv, cmpv);
 -
 -    env->cc_op = fail;
 -    env->regs[r1] = int128_gethi(oldv);
 -    env->regs[r1 + 1] = int128_getlo(oldv);
 -}
 -
  static uint32_t do_csst(CPUS390XState *env, uint32_t r3, uint64_t a1,
                          uint64_t a2, bool parallel)
  {
-diff --git a/target/s390x/tcg/translate.c b/target/s390x/tcg/translate.c
+     for (size_t c = 0; c < ARRAY_SIZE(constraint_sets); ++c) {
-index XXXXXXX..XXXXXXX 100644
+         const TCGConstraintSet *tdefs = &constraint_sets[c];
---- a/target/s390x/tcg/translate.c
+@@ -XXX,XX +XXX,XX @@ static void process_op_defs(TCGContext *s)
-+++ b/target/s390x/tcg/translate.c
+         sort_constraints(args_ct, 0, nb_oargs);
-@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_cs(DisasContext *s, DisasOps *o)
+         sort_constraints(args_ct, nb_oargs, nb_iargs);
- static DisasJumpType op_cdsg(DisasContext *s, DisasOps *o)
+     }
 +}
 -    for (TCGOpcode op = 0; op < NB_OPS; op++) {
 -        TCGOpDef *def = &tcg_op_defs[op];
 -        const TCGConstraintSet *tdefs;
 -        TCGConstraintSetIndex con_set;
 -        int nb_args;
 +static const TCGArgConstraint *opcode_args_ct(const TCGOp *op)
 +{
 +    TCGOpDef *def = &tcg_op_defs[op->opc];
 +    TCGConstraintSetIndex con_set;
 -        nb_args = def->nb_iargs + def->nb_oargs;
 -        if (nb_args == 0) {
 -            continue;
 -        }
 -
 -        if (def->flags & TCG_OPF_NOT_PRESENT) {
 -            def->args_ct = empty_cts;
 -            continue;
 -        }
 -
 -        /*
 -         * Macro magic should make it impossible, but double-check that
 -         * the array index is in range.  At the same time, double-check
 -         * that the opcode is implemented, i.e. not C_NotImplemented.
 -         */
 -        con_set = tcg_target_op_def(op);
 -        tcg_debug_assert(con_set >= 0 && con_set < ARRAY_SIZE(constraint_sets));
 -
 -        /* The constraint arguments must match TCGOpcode arguments. */
 -        tdefs = &constraint_sets[con_set];
 -        tcg_debug_assert(tdefs->nb_oargs == def->nb_oargs);
 -        tcg_debug_assert(tdefs->nb_iargs == def->nb_iargs);
 -
 -        def->args_ct = all_cts[con_set];
 +    if (def->nb_iargs + def->nb_oargs == 0) {
 +        return NULL;
      }
 +    if (def->flags & TCG_OPF_NOT_PRESENT) {
 +        return empty_cts;
 +    }
 +
 +    con_set = tcg_target_op_def(op->opc);
 +    tcg_debug_assert(con_set >= 0 && con_set < ARRAY_SIZE(constraint_sets));
 +
 +    /* The constraint arguments must match TCGOpcode arguments. */
 +    tcg_debug_assert(constraint_sets[con_set].nb_oargs == def->nb_oargs);
 +    tcg_debug_assert(constraint_sets[con_set].nb_iargs == def->nb_iargs);
 +
 +    return all_cts[con_set];
  }
  static void remove_label_use(TCGOp *op, int idx)
@@ -XXX,XX +XXX,XX @@ liveness_pass_1(TCGContext *s)
          TCGTemp *ts;
          TCGOpcode opc = op->opc;
          const TCGOpDef *def = &tcg_op_defs[opc];
 +        const TCGArgConstraint *args_ct;
          switch (opc) {
          case INDEX_op_call:
@@ -XXX,XX +XXX,XX @@ liveness_pass_1(TCGContext *s)
                  break;
              default:
 +                args_ct = opcode_args_ct(op);
                  for (i = nb_oargs; i < nb_oargs + nb_iargs; i++) {
 -                    const TCGArgConstraint *ct = &def->args_ct[i];
 +                    const TCGArgConstraint *ct = &args_ct[i];
                      TCGRegSet set, *pset;
                      ts = arg_temp(op->args[i]);
@@ -XXX,XX +XXX,XX @@ static void tcg_reg_alloc_dup(TCGContext *s, const TCGOp *op)
  {
-     int r1 = get_field(s, r1);
+     const TCGLifeData arg_life = op->life;
--    int r3 = get_field(s, r3);
+     TCGRegSet dup_out_regs, dup_in_regs;
--    int d2 = get_field(s, d2);
++    const TCGArgConstraint *dup_args_ct;
--    int b2 = get_field(s, b2);
+     TCGTemp *its, *ots;
--    DisasJumpType ret = DISAS_NEXT;
+     TCGType itype, vtype;
--    TCGv_i64 addr;
+     unsigned vece;
--    TCGv_i32 t_r1, t_r3;
+@@ -XXX,XX +XXX,XX @@ static void tcg_reg_alloc_dup(TCGContext *s, const TCGOp *op)
+         return;
--    /* Note that R1:R1+1 = expected value and R3:R3+1 = new value.  */
+     }
--    addr = get_address(s, 0, b2, d2);
--    t_r1 = tcg_const_i32(r1);
+-    dup_out_regs = tcg_op_defs[INDEX_op_dup_vec].args_ct[0].regs;
--    t_r3 = tcg_const_i32(r3);
+-    dup_in_regs = tcg_op_defs[INDEX_op_dup_vec].args_ct[1].regs;
--    if (!(tb_cflags(s->base.tb) & CF_PARALLEL)) {
++    dup_args_ct = opcode_args_ct(op);
--        gen_helper_cdsg(cpu_env, addr, t_r1, t_r3);
++    dup_out_regs = dup_args_ct[0].regs;
--    } else if (HAVE_CMPXCHG128) {
++    dup_in_regs = dup_args_ct[1].regs;
--        gen_helper_cdsg_parallel(cpu_env, addr, t_r1, t_r3);
--    } else {
+     /* Allocate the output register now.  */
--        gen_helper_exit_atomic(cpu_env);
+     if (ots->val_type != TEMP_VAL_REG) {
--        ret = DISAS_NORETURN;
+@@ -XXX,XX +XXX,XX @@ static void tcg_reg_alloc_op(TCGContext *s, const TCGOp *op)
--    }
+     int i, k, nb_iargs, nb_oargs;
--    tcg_temp_free_i64(addr);
+     TCGReg reg;
--    tcg_temp_free_i32(t_r1);
+     TCGArg arg;
--    tcg_temp_free_i32(t_r3);
++    const TCGArgConstraint *args_ct;
-+    o->out_128 = tcg_temp_new_i128();
+     const TCGArgConstraint *arg_ct;
-+    tcg_gen_concat_i64_i128(o->out_128, regs[r1 + 1], regs[r1]);
+     TCGTemp *ts;
+     TCGArg new_args[TCG_MAX_OP_ARGS];
--    set_cc_static(s);
+@@ -XXX,XX +XXX,XX @@ static void tcg_reg_alloc_op(TCGContext *s, const TCGOp *op)
--    return ret;
+         break;
-+    /* Note out (R1:R1+1) = expected value and in2 (R3:R3+1) = new value.  */
+     }
-+    tcg_gen_atomic_cmpxchg_i128(o->out_128, o->addr1, o->out_128, o->in2_128,
-+                                get_mem_index(s), MO_BE | MO_128 | MO_ALIGN);
++    args_ct = opcode_args_ct(op);
 +
-+    /*
+     /* satisfy input constraints */
-+     * Extract result into cc_dst:cc_src, compare vs the expected value
+     for (k = 0; k < nb_iargs; k++) {
-+     * in the as yet unmodified input registers, then update CC_OP.
+         TCGRegSet i_preferred_regs, i_required_regs;
-+     */
+@@ -XXX,XX +XXX,XX @@ static void tcg_reg_alloc_op(TCGContext *s, const TCGOp *op)
-+    tcg_gen_extr_i128_i64(cc_src, cc_dst, o->out_128);
+         TCGTemp *ts2;
-+    tcg_gen_xor_i64(cc_dst, cc_dst, regs[r1]);
+         int i1, i2;
-+    tcg_gen_xor_i64(cc_src, cc_src, regs[r1 + 1]);
-+    tcg_gen_or_i64(cc_dst, cc_dst, cc_src);
+-        i = def->args_ct[nb_oargs + k].sort_index;
-+    set_cc_nz_u64(s, cc_dst);
++        i = args_ct[nb_oargs + k].sort_index;
-+
+         arg = op->args[i];
-+    return DISAS_NEXT;
+-        arg_ct = &def->args_ct[i];
- }
++        arg_ct = &args_ct[i];
+         ts = arg_temp(arg);
- static DisasJumpType op_csst(DisasContext *s, DisasOps *o)
-@@ -XXX,XX +XXX,XX @@ static void wout_r1_D32(DisasContext *s, DisasOps *o)
+         if (ts->val_type == TEMP_VAL_CONST
- }
+@@ -XXX,XX +XXX,XX @@ static void tcg_reg_alloc_op(TCGContext *s, const TCGOp *op)
- #define SPEC_wout_r1_D32 SPEC_r1_even
+                  * register and move it.
+                  */
-+static void wout_r1_D64(DisasContext *s, DisasOps *o)
+                 if (temp_readonly(ts) || !IS_DEAD_ARG(i)
-+{
+-                    || def->args_ct[arg_ct->alias_index].newreg) {
-+    int r1 = get_field(s, r1);
++                    || args_ct[arg_ct->alias_index].newreg) {
-+    tcg_gen_extr_i128_i64(regs[r1 + 1], regs[r1], o->out_128);
+                     allocate_new_reg = true;
-+}
+                 } else if (ts->val_type == TEMP_VAL_REG) {
-+#define SPEC_wout_r1_D64 SPEC_r1_even
+                     /*
-+
+@@ -XXX,XX +XXX,XX @@ static void tcg_reg_alloc_op(TCGContext *s, const TCGOp *op)
- static void wout_r3_P32(DisasContext *s, DisasOps *o)
+         }
- {
-     int r3 = get_field(s, r3);
+         /* satisfy the output constraints */
-@@ -XXX,XX +XXX,XX @@ static void in2_r3(DisasContext *s, DisasOps *o)
+-        for(k = 0; k < nb_oargs; k++) {
- }
+-            i = def->args_ct[k].sort_index;
- #define SPEC_in2_r3 0
++        for (k = 0; k < nb_oargs; k++) {
++            i = args_ct[k].sort_index;
-+static void in2_r3_D64(DisasContext *s, DisasOps *o)
+             arg = op->args[i];
-+{
+-            arg_ct = &def->args_ct[i];
-+    int r3 = get_field(s, r3);
++            arg_ct = &args_ct[i];
-+    o->in2_128 = tcg_temp_new_i128();
+             ts = arg_temp(arg);
-+    tcg_gen_concat_i64_i128(o->in2_128, regs[r3 + 1], regs[r3]);
-+}
+             /* ENV should not be modified.  */
-+#define SPEC_in2_r3_D64 SPEC_r3_even
+@@ -XXX,XX +XXX,XX @@ static bool tcg_reg_alloc_dup2(TCGContext *s, const TCGOp *op)
-+
+     /* Allocate the output register now.  */
- static void in2_r3_sr32(DisasContext *s, DisasOps *o)
+     if (ots->val_type != TEMP_VAL_REG) {
- {
+         TCGRegSet allocated_regs = s->reserved_regs;
-     o->in2 = tcg_temp_new_i64();
+-        TCGRegSet dup_out_regs =
 -            tcg_op_defs[INDEX_op_dup_vec].args_ct[0].regs;
 +        TCGRegSet dup_out_regs = opcode_args_ct(op)[0].regs;
          TCGReg oreg;
          /* Make sure to not spill the input registers. */
 --
-.34.1
+.43.0

-[PULL 38/40] target/i386: Inline cmpxchg8b
+[PULL 38/68] tcg: Constify tcg_op_defs
-Use tcg_gen_atomic_cmpxchg_i64 for the atomic case,
+Now that we're no longer assigning to TCGOpDef.args_ct,
-and tcg_gen_nonatomic_cmpxchg_i64 otherwise.
+we can make the array constant.
-Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
 Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 ---
- target/i386/helper.h         |  2 --
+ include/tcg/tcg.h | 2 +-
- target/i386/tcg/mem_helper.c | 57 ------------------------------------
+ tcg/tcg-common.c  | 2 +-
- target/i386/tcg/translate.c  | 54 ++++++++++++++++++++++++++++++----
+ tcg/tcg.c         | 2 +-
-files changed, 49 insertions(+), 64 deletions(-)
+files changed, 3 insertions(+), 3 deletions(-)
-diff --git a/target/i386/helper.h b/target/i386/helper.h
+diff --git a/include/tcg/tcg.h b/include/tcg/tcg.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/i386/helper.h
+--- a/include/tcg/tcg.h
-+++ b/target/i386/helper.h
++++ b/include/tcg/tcg.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_1(rsm, void, env)
+@@ -XXX,XX +XXX,XX @@ typedef struct TCGOpDef {
- #endif /* !CONFIG_USER_ONLY */
+     uint8_t flags;
+ } TCGOpDef;
- DEF_HELPER_2(into, void, env, int)
--DEF_HELPER_2(cmpxchg8b_unlocked, void, env, tl)
+-extern TCGOpDef tcg_op_defs[];
--DEF_HELPER_2(cmpxchg8b, void, env, tl)
++extern const TCGOpDef tcg_op_defs[];
- #ifdef TARGET_X86_64
+ extern const size_t tcg_op_defs_max;
- DEF_HELPER_2(cmpxchg16b_unlocked, void, env, tl)
- DEF_HELPER_2(cmpxchg16b, void, env, tl)
+ /*
-diff --git a/target/i386/tcg/mem_helper.c b/target/i386/tcg/mem_helper.c
+diff --git a/tcg/tcg-common.c b/tcg/tcg-common.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/i386/tcg/mem_helper.c
+--- a/tcg/tcg-common.c
-+++ b/target/i386/tcg/mem_helper.c
++++ b/tcg/tcg-common.c
 @@ -XXX,XX +XXX,XX @@
  #include "tcg/tcg.h"
- #include "helper-tcg.h"
+ #include "tcg-has.h"
--void helper_cmpxchg8b_unlocked(CPUX86State *env, target_ulong a0)
+-TCGOpDef tcg_op_defs[] = {
--{
++const TCGOpDef tcg_op_defs[] = {
--    uintptr_t ra = GETPC();
+ #define DEF(s, oargs, iargs, cargs, flags) \
--    uint64_t oldv, cmpv, newv;
+          { #s, oargs, iargs, cargs, iargs + oargs + cargs, flags },
--    int eflags;
+ #include "tcg/tcg-opc.h"
--
+diff --git a/tcg/tcg.c b/tcg/tcg.c
--    eflags = cpu_cc_compute_all(env, CC_OP);
+index XXXXXXX..XXXXXXX 100644
--
+--- a/tcg/tcg.c
--    cmpv = deposit64(env->regs[R_EAX], 32, 32, env->regs[R_EDX]);
++++ b/tcg/tcg.c
--    newv = deposit64(env->regs[R_EBX], 32, 32, env->regs[R_ECX]);
+@@ -XXX,XX +XXX,XX @@ static void process_constraint_sets(void)
--
--    oldv = cpu_ldq_data_ra(env, a0, ra);
+ static const TCGArgConstraint *opcode_args_ct(const TCGOp *op)
 -    newv = (cmpv == oldv ? newv : oldv);
 -    /* always do the store */
 -    cpu_stq_data_ra(env, a0, newv, ra);
 -
 -    if (oldv == cmpv) {
 -        eflags |= CC_Z;
 -    } else {
 -        env->regs[R_EAX] = (uint32_t)oldv;
 -        env->regs[R_EDX] = (uint32_t)(oldv >> 32);
 -        eflags &= ~CC_Z;
 -    }
 -    CC_SRC = eflags;
 -}
 -
 -void helper_cmpxchg8b(CPUX86State *env, target_ulong a0)
 -{
 -#ifdef CONFIG_ATOMIC64
 -    uint64_t oldv, cmpv, newv;
 -    int eflags;
 -
 -    eflags = cpu_cc_compute_all(env, CC_OP);
 -
 -    cmpv = deposit64(env->regs[R_EAX], 32, 32, env->regs[R_EDX]);
 -    newv = deposit64(env->regs[R_EBX], 32, 32, env->regs[R_ECX]);
 -
 -    {
 -        uintptr_t ra = GETPC();
 -        int mem_idx = cpu_mmu_index(env, false);
 -        MemOpIdx oi = make_memop_idx(MO_TEUQ, mem_idx);
 -        oldv = cpu_atomic_cmpxchgq_le_mmu(env, a0, cmpv, newv, oi, ra);
 -    }
 -
 -    if (oldv == cmpv) {
 -        eflags |= CC_Z;
 -    } else {
 -        env->regs[R_EAX] = (uint32_t)oldv;
 -        env->regs[R_EDX] = (uint32_t)(oldv >> 32);
 -        eflags &= ~CC_Z;
 -    }
 -    CC_SRC = eflags;
 -#else
 -    cpu_loop_exit_atomic(env_cpu(env), GETPC());
 -#endif /* CONFIG_ATOMIC64 */
 -}
 -
  #ifdef TARGET_X86_64
  void helper_cmpxchg16b_unlocked(CPUX86State *env, target_ulong a0)
  {
-diff --git a/target/i386/tcg/translate.c b/target/i386/tcg/translate.c
+-    TCGOpDef *def = &tcg_op_defs[op->opc];
-index XXXXXXX..XXXXXXX 100644
++    const TCGOpDef *def = &tcg_op_defs[op->opc];
---- a/target/i386/tcg/translate.c
+     TCGConstraintSetIndex con_set;
-+++ b/target/i386/tcg/translate.c
-@@ -XXX,XX +XXX,XX @@ static void gen_sty_env_A0(DisasContext *s, int offset, bool align)
+     if (def->nb_iargs + def->nb_oargs == 0) {
  static void gen_cmpxchg8b(DisasContext *s, CPUX86State *env, int modrm)
  {
 +    TCGv_i64 cmp, val, old;
 +    TCGv Z;
 +
      gen_lea_modrm(env, s, modrm);
 -    if ((s->prefix & PREFIX_LOCK) &&
 -        (tb_cflags(s->base.tb) & CF_PARALLEL)) {
 -        gen_helper_cmpxchg8b(cpu_env, s->A0);
 +    cmp = tcg_temp_new_i64();
 +    val = tcg_temp_new_i64();
 +    old = tcg_temp_new_i64();
 +
 +    /* Construct the comparison values from the register pair. */
 +    tcg_gen_concat_tl_i64(cmp, cpu_regs[R_EAX], cpu_regs[R_EDX]);
 +    tcg_gen_concat_tl_i64(val, cpu_regs[R_EBX], cpu_regs[R_ECX]);
 +
 +    /* Only require atomic with LOCK; non-parallel handled in generator. */
 +    if (s->prefix & PREFIX_LOCK) {
 +        tcg_gen_atomic_cmpxchg_i64(old, s->A0, cmp, val, s->mem_index, MO_TEUQ);
      } else {
 -        gen_helper_cmpxchg8b_unlocked(cpu_env, s->A0);
 +        tcg_gen_nonatomic_cmpxchg_i64(old, s->A0, cmp, val,
 +                                      s->mem_index, MO_TEUQ);
      }
 -    set_cc_op(s, CC_OP_EFLAGS);
 +    tcg_temp_free_i64(val);
 +
 +    /* Set tmp0 to match the required value of Z. */
 +    tcg_gen_setcond_i64(TCG_COND_EQ, cmp, old, cmp);
 +    Z = tcg_temp_new();
 +    tcg_gen_trunc_i64_tl(Z, cmp);
 +    tcg_temp_free_i64(cmp);
 +
 +    /*
 +     * Extract the result values for the register pair.
 +     * For 32-bit, we may do this unconditionally, because on success (Z=1),
 +     * the old value matches the previous value in EDX:EAX.  For x86_64,
 +     * the store must be conditional, because we must leave the source
 +     * registers unchanged on success, and zero-extend the writeback
 +     * on failure (Z=0).
 +     */
 +    if (TARGET_LONG_BITS == 32) {
 +        tcg_gen_extr_i64_tl(cpu_regs[R_EAX], cpu_regs[R_EDX], old);
 +    } else {
 +        TCGv zero = tcg_constant_tl(0);
 +
 +        tcg_gen_extr_i64_tl(s->T0, s->T1, old);
 +        tcg_gen_movcond_tl(TCG_COND_EQ, cpu_regs[R_EAX], Z, zero,
 +                           s->T0, cpu_regs[R_EAX]);
 +        tcg_gen_movcond_tl(TCG_COND_EQ, cpu_regs[R_EDX], Z, zero,
 +                           s->T1, cpu_regs[R_EDX]);
 +    }
 +    tcg_temp_free_i64(old);
 +
 +    /* Update Z. */
 +    gen_compute_eflags(s);
 +    tcg_gen_deposit_tl(cpu_cc_src, cpu_cc_src, Z, ctz32(CC_Z), 1);
 +    tcg_temp_free(Z);
  }
  #ifdef TARGET_X86_64
 --
-.34.1
+.43.0

-[PULL 05/40] tcg: Allocate objects contiguously in temp_allocate_frame
+[PULL 39/68] tcg: Validate op supported in opcode_args_ct
-When allocating a temp to the stack frame, consider the
+We should have checked that the op is supported before
-base type and allocate all parts at once.
+emitting it.  The backend cannot be expected to have a
 constraint set for unsupported ops.
-Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 ---
- tcg/tcg.c | 34 ++++++++++++++++++++++++++--------
+ tcg/tcg.c | 4 ++++
-file changed, 26 insertions(+), 8 deletions(-)
+file changed, 4 insertions(+)
 diff --git a/tcg/tcg.c b/tcg/tcg.c
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tcg.c
 +++ b/tcg/tcg.c
-@@ -XXX,XX +XXX,XX @@ static bool liveness_pass_2(TCGContext *s)
+@@ -XXX,XX +XXX,XX @@ static const TCGArgConstraint *opcode_args_ct(const TCGOp *op)
+     const TCGOpDef *def = &tcg_op_defs[op->opc];
- static void temp_allocate_frame(TCGContext *s, TCGTemp *ts)
+     TCGConstraintSetIndex con_set;
- {
--    int size = tcg_type_size(ts->type);
++#ifdef CONFIG_DEBUG_TCG
--    int align;
++    assert(tcg_op_supported(op->opc, TCGOP_TYPE(op), TCGOP_FLAGS(op)));
-     intptr_t off;
++#endif
-+    int size, align;
++
+     if (def->nb_iargs + def->nb_oargs == 0) {
--    switch (ts->type) {
+         return NULL;
 +    /* When allocating an object, look at the full type. */
 +    size = tcg_type_size(ts->base_type);
 +    switch (ts->base_type) {
      case TCG_TYPE_I32:
          align = 4;
          break;
@@ -XXX,XX +XXX,XX @@ static void temp_allocate_frame(TCGContext *s, TCGTemp *ts)
          tcg_raise_tb_overflow(s);
      }
-     s->current_frame_offset = off + size;
--
--    ts->mem_offset = off;
- #if defined(__sparc__)
--    ts->mem_offset += TCG_TARGET_STACK_BIAS;
-+    off += TCG_TARGET_STACK_BIAS;
- #endif
--    ts->mem_base = s->frame_temp;
--    ts->mem_allocated = 1;
-+
-+    /* If the object was subdivided, assign memory to all the parts. */
-+    if (ts->base_type != ts->type) {
-+        int part_size = tcg_type_size(ts->type);
-+        int part_count = size / part_size;
-+
-+        /*
-+         * Each part is allocated sequentially in tcg_temp_new_internal.
-+         * Jump back to the first part by subtracting the current index.
-+         */
-+        ts -= ts->temp_subindex;
-+        for (int i = 0; i < part_count; ++i) {
-+            ts[i].mem_offset = off + i * part_size;
-+            ts[i].mem_base = s->frame_temp;
-+            ts[i].mem_allocated = 1;
-+        }
-+    } else {
-+        ts->mem_offset = off;
-+        ts->mem_base = s->frame_temp;
-+        ts->mem_allocated = 1;
-+    }
- }
- /* Assign @reg to @ts, and update reg_to_temp[]. */
 --
-.34.1
+.43.0

-[PULL 01/40] accel/tcg: Test CPUJumpCache in tb_jmp_cache_clear_page
+[PULL 40/68] tcg: Add TCG_OPF_NOT_PRESENT to opcodes without inputs or outputs
-From: Eric Auger <eric.auger@redhat.com>
+The br, mb, goto_tb and exit_tb opcodes do not have
 register operands, only constants, flags, or labels.
 Remove the special case in opcode_args_ct by including
 TCG_OPF_NOT_PRESENT in the flags for these opcodes.
-After commit 4e4fa6c12d ("accel/tcg: Complete cpu initialization
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 before registration"), it looks the CPUJumpCache pointer can be NULL.
 This causes a SIGSEV when running debug-wp-migration kvm unit test.
 At the first place it should be clarified why this TCG code is called
 with KVM acceleration. This may hide another bug.
 Fixes: 4e4fa6c12d ("accel/tcg: Complete cpu initialization before registration")
 Signed-off-by: Eric Auger <eric.auger@redhat.com>
 Message-Id: <20230203171510.2867451-1-eric.auger@redhat.com>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 ---
- accel/tcg/cputlb.c | 7 ++++++-
+ include/tcg/tcg-opc.h | 8 ++++----
-file changed, 6 insertions(+), 1 deletion(-)
+ tcg/tcg.c             | 3 ---
 files changed, 4 insertions(+), 7 deletions(-)
-diff --git a/accel/tcg/cputlb.c b/accel/tcg/cputlb.c
+diff --git a/include/tcg/tcg-opc.h b/include/tcg/tcg-opc.h
 index XXXXXXX..XXXXXXX 100644
---- a/accel/tcg/cputlb.c
+--- a/include/tcg/tcg-opc.h
-+++ b/accel/tcg/cputlb.c
++++ b/include/tcg/tcg-opc.h
-@@ -XXX,XX +XXX,XX @@ static void tlb_window_reset(CPUTLBDesc *desc, int64_t ns,
+@@ -XXX,XX +XXX,XX @@ DEF(set_label, 0, 0, 1, TCG_OPF_BB_END | TCG_OPF_NOT_PRESENT)
+ /* variable number of parameters */
- static void tb_jmp_cache_clear_page(CPUState *cpu, target_ulong page_addr)
+ DEF(call, 0, 0, 3, TCG_OPF_CALL_CLOBBER | TCG_OPF_NOT_PRESENT)
- {
--    int i, i0 = tb_jmp_cache_hash_page(page_addr);
+-DEF(br, 0, 0, 1, TCG_OPF_BB_END)
-     CPUJumpCache *jc = cpu->tb_jmp_cache;
++DEF(br, 0, 0, 1, TCG_OPF_BB_END | TCG_OPF_NOT_PRESENT)
-+    int i, i0;
+ #define IMPL(X) (__builtin_constant_p(X) && (X) <= 0 ? TCG_OPF_NOT_PRESENT : 0)
-+    if (unlikely(!jc)) {
+ #if TCG_TARGET_REG_BITS == 32
-+        return;
+@@ -XXX,XX +XXX,XX @@ DEF(br, 0, 0, 1, TCG_OPF_BB_END)
-+    }
+ # define IMPL64  TCG_OPF_64BIT
-+
+ #endif
-+    i0 = tb_jmp_cache_hash_page(page_addr);
-     for (i = 0; i < TB_JMP_PAGE_SIZE; i++) {
+-DEF(mb, 0, 0, 1, 0)
-         qatomic_set(&jc->array[i0 + i].tb, NULL);
++DEF(mb, 0, 0, 1, TCG_OPF_NOT_PRESENT)
  DEF(mov_i32, 1, 1, 0, TCG_OPF_NOT_PRESENT)
  DEF(setcond_i32, 1, 2, 1, 0)
@@ -XXX,XX +XXX,XX @@ DEF(mulsh_i64, 1, 2, 0, IMPL64 | IMPL(TCG_TARGET_HAS_mulsh_i64))
  /* There are tcg_ctx->insn_start_words here, not just one. */
  DEF(insn_start, 0, 0, DATA64_ARGS, TCG_OPF_NOT_PRESENT)
 -DEF(exit_tb, 0, 0, 1, TCG_OPF_BB_EXIT | TCG_OPF_BB_END)
 -DEF(goto_tb, 0, 0, 1, TCG_OPF_BB_EXIT | TCG_OPF_BB_END)
 +DEF(exit_tb, 0, 0, 1, TCG_OPF_BB_EXIT | TCG_OPF_BB_END | TCG_OPF_NOT_PRESENT)
 +DEF(goto_tb, 0, 0, 1, TCG_OPF_BB_EXIT | TCG_OPF_BB_END | TCG_OPF_NOT_PRESENT)
  DEF(goto_ptr, 0, 1, 0, TCG_OPF_BB_EXIT | TCG_OPF_BB_END)
  DEF(plugin_cb, 0, 0, 1, TCG_OPF_NOT_PRESENT)
 diff --git a/tcg/tcg.c b/tcg/tcg.c
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tcg.c
 +++ b/tcg/tcg.c
@@ -XXX,XX +XXX,XX @@ static const TCGArgConstraint *opcode_args_ct(const TCGOp *op)
      assert(tcg_op_supported(op->opc, TCGOP_TYPE(op), TCGOP_FLAGS(op)));
  #endif
 -    if (def->nb_iargs + def->nb_oargs == 0) {
 -        return NULL;
 -    }
      if (def->flags & TCG_OPF_NOT_PRESENT) {
          return empty_cts;
      }
 --
-.34.1
+.43.0

-[PULL 28/40] target/s390x: Use a single return for helper_divs64/u64
+[PULL 41/68] tcg: Pass type and flags to tcg_target_op_def
-Pack the quotient and remainder into a single Int128.
+Allow the backend to make constraint choices based on more parameters.
 Use the divu128 primitive to remove the cpu_abort on
 -bit hosts.
 Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
-Acked-by: Ilya Leoshkevich <iii@linux.ibm.com>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 ---
-v2: Extended div test case to cover these insns.
+ tcg/tcg.c                        | 4 ++--
----
+ tcg/aarch64/tcg-target.c.inc     | 3 ++-
- target/s390x/helper.h         |  4 ++--
+ tcg/arm/tcg-target.c.inc         | 3 ++-
- target/s390x/tcg/int_helper.c | 38 +++++++++--------------------------
+ tcg/i386/tcg-target.c.inc        | 3 ++-
- target/s390x/tcg/translate.c  | 14 +++++++++----
+ tcg/loongarch64/tcg-target.c.inc | 3 ++-
- tests/tcg/s390x/div.c         | 35 ++++++++++++++++++++++++++++++++
+ tcg/mips/tcg-target.c.inc        | 3 ++-
-files changed, 56 insertions(+), 35 deletions(-)
+ tcg/ppc/tcg-target.c.inc         | 3 ++-
  tcg/riscv/tcg-target.c.inc       | 3 ++-
  tcg/s390x/tcg-target.c.inc       | 3 ++-
  tcg/sparc64/tcg-target.c.inc     | 3 ++-
  tcg/tci/tcg-target.c.inc         | 3 ++-
 files changed, 22 insertions(+), 12 deletions(-)
-diff --git a/target/s390x/helper.h b/target/s390x/helper.h
+diff --git a/tcg/tcg.c b/tcg/tcg.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/s390x/helper.h
+--- a/tcg/tcg.c
-+++ b/target/s390x/helper.h
++++ b/tcg/tcg.c
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_3(clcl, i32, env, i32, i32)
+@@ -XXX,XX +XXX,XX @@ typedef enum {
- DEF_HELPER_FLAGS_4(clm, TCG_CALL_NO_WG, i32, env, i32, i32, i64)
+ #include "tcg-target-con-set.h"
- DEF_HELPER_FLAGS_3(divs32, TCG_CALL_NO_WG, i64, env, s64, s64)
+ } TCGConstraintSetIndex;
- DEF_HELPER_FLAGS_3(divu32, TCG_CALL_NO_WG, i64, env, i64, i64)
--DEF_HELPER_FLAGS_3(divs64, TCG_CALL_NO_WG, s64, env, s64, s64)
+-static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode);
--DEF_HELPER_FLAGS_4(divu64, TCG_CALL_NO_WG, i64, env, i64, i64, i64)
++static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode, TCGType, unsigned);
-+DEF_HELPER_FLAGS_3(divs64, TCG_CALL_NO_WG, i128, env, s64, s64)
-+DEF_HELPER_FLAGS_4(divu64, TCG_CALL_NO_WG, i128, env, i64, i64, i64)
+ #undef C_O0_I1
- DEF_HELPER_3(srst, void, env, i32, i32)
+ #undef C_O0_I2
- DEF_HELPER_3(srstu, void, env, i32, i32)
+@@ -XXX,XX +XXX,XX @@ static const TCGArgConstraint *opcode_args_ct(const TCGOp *op)
- DEF_HELPER_4(clst, i64, env, i64, i64, i64)
+         return empty_cts;
-diff --git a/target/s390x/tcg/int_helper.c b/target/s390x/tcg/int_helper.c
+     }
 -    con_set = tcg_target_op_def(op->opc);
 +    con_set = tcg_target_op_def(op->opc, TCGOP_TYPE(op), TCGOP_FLAGS(op));
      tcg_debug_assert(con_set >= 0 && con_set < ARRAY_SIZE(constraint_sets));
      /* The constraint arguments must match TCGOpcode arguments. */
 diff --git a/tcg/aarch64/tcg-target.c.inc b/tcg/aarch64/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
---- a/target/s390x/tcg/int_helper.c
+--- a/tcg/aarch64/tcg-target.c.inc
-+++ b/target/s390x/tcg/int_helper.c
++++ b/tcg/aarch64/tcg-target.c.inc
-@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(divu32)(CPUS390XState *env, uint64_t a, uint64_t b64)
+@@ -XXX,XX +XXX,XX @@ void tcg_expand_vec_op(TCGOpcode opc, TCGType type, unsigned vece,
      }
  }
- /* 64/64 -> 64 signed division */
+-static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
--int64_t HELPER(divs64)(CPUS390XState *env, int64_t a, int64_t b)
++static TCGConstraintSetIndex
-+Int128 HELPER(divs64)(CPUS390XState *env, int64_t a, int64_t b)
++tcg_target_op_def(TCGOpcode op, TCGType type, unsigned flags)
  {
-     /* Catch divide by zero, and non-representable quotient (MIN / -1).  */
+     switch (op) {
-     if (b == 0 || (b == -1 && a == (1ll << 63))) {
+     case INDEX_op_goto_ptr:
-         tcg_s390_program_interrupt(env, PGM_FIXPT_DIVIDE, GETPC());
+diff --git a/tcg/arm/tcg-target.c.inc b/tcg/arm/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/arm/tcg-target.c.inc
 +++ b/tcg/arm/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static void tcg_out_op(TCGContext *s, TCGOpcode opc,
      }
--    env->retxl = a % b;
--    return a / b;
-+    return int128_make128(a / b, a % b);
  }
- /* 128 -> 64/64 unsigned division */
+-static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
--uint64_t HELPER(divu64)(CPUS390XState *env, uint64_t ah, uint64_t al,
++static TCGConstraintSetIndex
--                        uint64_t b)
++tcg_target_op_def(TCGOpcode op, TCGType type, unsigned flags)
 +Int128 HELPER(divu64)(CPUS390XState *env, uint64_t ah, uint64_t al, uint64_t b)
  {
--    uint64_t ret;
+     switch (op) {
--    /* Signal divide by zero.  */
+     case INDEX_op_goto_ptr:
--    if (b == 0) {
+diff --git a/tcg/i386/tcg-target.c.inc b/tcg/i386/tcg-target.c.inc
--        tcg_s390_program_interrupt(env, PGM_FIXPT_DIVIDE, GETPC());
+index XXXXXXX..XXXXXXX 100644
--    }
+--- a/tcg/i386/tcg-target.c.inc
--    if (ah == 0) {
++++ b/tcg/i386/tcg-target.c.inc
--        /* 64 -> 64/64 case */
+@@ -XXX,XX +XXX,XX @@ static void tcg_out_vec_op(TCGContext *s, TCGOpcode opc,
 -        env->retxl = al % b;
 -        ret = al / b;
 -    } else {
 -        /* ??? Move i386 idivq helper to host-utils.  */
 -#ifdef CONFIG_INT128
 -        __uint128_t a = ((__uint128_t)ah << 64) | al;
 -        __uint128_t q = a / b;
 -        env->retxl = a % b;
 -        ret = q;
 -        if (ret != q) {
 -            tcg_s390_program_interrupt(env, PGM_FIXPT_DIVIDE, GETPC());
 +    if (b != 0) {
 +        uint64_t r = divu128(&al, &ah, b);
 +        if (ah == 0) {
 +            return int128_make128(al, r);
          }
 -#else
 -        /* 32-bit hosts would need special wrapper functionality - just abort if
 -           we encounter such a case; it's very unlikely anyways. */
 -        cpu_abort(env_cpu(env), "128 -> 64/64 division not implemented\n");
 -#endif
      }
--    return ret;
-+    /* divide by zero or overflow */
-+    tcg_s390_program_interrupt(env, PGM_FIXPT_DIVIDE, GETPC());
  }
- uint64_t HELPER(cvd)(int32_t reg)
+-static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
-diff --git a/target/s390x/tcg/translate.c b/target/s390x/tcg/translate.c
++static TCGConstraintSetIndex
 +tcg_target_op_def(TCGOpcode op, TCGType type, unsigned flags)
  {
      switch (op) {
      case INDEX_op_goto_ptr:
 diff --git a/tcg/loongarch64/tcg-target.c.inc b/tcg/loongarch64/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
---- a/target/s390x/tcg/translate.c
+--- a/tcg/loongarch64/tcg-target.c.inc
-+++ b/target/s390x/tcg/translate.c
++++ b/tcg/loongarch64/tcg-target.c.inc
-@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_divu32(DisasContext *s, DisasOps *o)
+@@ -XXX,XX +XXX,XX @@ void tcg_expand_vec_op(TCGOpcode opc, TCGType type, unsigned vece,
+     g_assert_not_reached();
- static DisasJumpType op_divs64(DisasContext *s, DisasOps *o)
+ }
 -static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
 +static TCGConstraintSetIndex
 +tcg_target_op_def(TCGOpcode op, TCGType type, unsigned flags)
  {
--    gen_helper_divs64(o->out2, cpu_env, o->in1, o->in2);
+     switch (op) {
--    return_low128(o->out);
+     case INDEX_op_goto_ptr:
-+    TCGv_i128 t = tcg_temp_new_i128();
+diff --git a/tcg/mips/tcg-target.c.inc b/tcg/mips/tcg-target.c.inc
-+
+index XXXXXXX..XXXXXXX 100644
-+    gen_helper_divs64(t, cpu_env, o->in1, o->in2);
+--- a/tcg/mips/tcg-target.c.inc
-+    tcg_gen_extr_i128_i64(o->out2, o->out, t);
++++ b/tcg/mips/tcg-target.c.inc
-+    tcg_temp_free_i128(t);
+@@ -XXX,XX +XXX,XX @@ static void tcg_out_op(TCGContext *s, TCGOpcode opc,
-     return DISAS_NEXT;
+     }
  }
- static DisasJumpType op_divu64(DisasContext *s, DisasOps *o)
+-static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
 +static TCGConstraintSetIndex
 +tcg_target_op_def(TCGOpcode op, TCGType type, unsigned flags)
  {
--    gen_helper_divu64(o->out2, cpu_env, o->out, o->out2, o->in2);
+     switch (op) {
--    return_low128(o->out);
+     case INDEX_op_goto_ptr:
-+    TCGv_i128 t = tcg_temp_new_i128();
+diff --git a/tcg/ppc/tcg-target.c.inc b/tcg/ppc/tcg-target.c.inc
-+
+index XXXXXXX..XXXXXXX 100644
-+    gen_helper_divu64(t, cpu_env, o->out, o->out2, o->in2);
+--- a/tcg/ppc/tcg-target.c.inc
-+    tcg_gen_extr_i128_i64(o->out2, o->out, t);
++++ b/tcg/ppc/tcg-target.c.inc
-+    tcg_temp_free_i128(t);
+@@ -XXX,XX +XXX,XX @@ void tcg_expand_vec_op(TCGOpcode opc, TCGType type, unsigned vece,
-     return DISAS_NEXT;
+     va_end(va);
  }
-diff --git a/tests/tcg/s390x/div.c b/tests/tcg/s390x/div.c
+-static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
 +static TCGConstraintSetIndex
 +tcg_target_op_def(TCGOpcode op, TCGType type, unsigned flags)
  {
      switch (op) {
      case INDEX_op_goto_ptr:
 diff --git a/tcg/riscv/tcg-target.c.inc b/tcg/riscv/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
---- a/tests/tcg/s390x/div.c
+--- a/tcg/riscv/tcg-target.c.inc
-+++ b/tests/tcg/s390x/div.c
++++ b/tcg/riscv/tcg-target.c.inc
-@@ -XXX,XX +XXX,XX @@ static void test_dlr(void)
+@@ -XXX,XX +XXX,XX @@ int tcg_can_emit_vec_op(TCGOpcode opc, TCGType type, unsigned vece)
-     assert(r == 1);
+     }
  }
-+static void test_dsgr(void)
+-static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
-+{
++static TCGConstraintSetIndex
-+    register int64_t r0 asm("r0") = -1;
++tcg_target_op_def(TCGOpcode op, TCGType type, unsigned flags)
 +    register int64_t r1 asm("r1") = -4241;
 +    int64_t b = 101, q, r;
 +
 +    asm("dsgr %[r0],%[b]"
 +        : [r0] "+r" (r0), [r1] "+r" (r1)
 +        : [b] "r" (b)
 +        : "cc");
 +    q = r1;
 +    r = r0;
 +    assert(q == -41);
 +    assert(r == -100);
 +}
 +
 +static void test_dlgr(void)
 +{
 +    register uint64_t r0 asm("r0") = 0;
 +    register uint64_t r1 asm("r1") = 4243;
 +    uint64_t b = 101, q, r;
 +
 +    asm("dlgr %[r0],%[b]"
 +        : [r0] "+r" (r0), [r1] "+r" (r1)
 +        : [b] "r" (b)
 +        : "cc");
 +    q = r1;
 +    r = r0;
 +    assert(q == 42);
 +    assert(r == 1);
 +}
 +
  int main(void)
  {
-     test_dr();
+     switch (op) {
-     test_dlr();
+     case INDEX_op_goto_ptr:
-+    test_dsgr();
+diff --git a/tcg/s390x/tcg-target.c.inc b/tcg/s390x/tcg-target.c.inc
-+    test_dlgr();
+index XXXXXXX..XXXXXXX 100644
-+    return 0;
+--- a/tcg/s390x/tcg-target.c.inc
 +++ b/tcg/s390x/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ void tcg_expand_vec_op(TCGOpcode opc, TCGType type, unsigned vece,
      va_end(va);
  }
+-static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
++static TCGConstraintSetIndex
++tcg_target_op_def(TCGOpcode op, TCGType type, unsigned flags)
+ {
+     switch (op) {
+     case INDEX_op_goto_ptr:
+diff --git a/tcg/sparc64/tcg-target.c.inc b/tcg/sparc64/tcg-target.c.inc
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/sparc64/tcg-target.c.inc
++++ b/tcg/sparc64/tcg-target.c.inc
+@@ -XXX,XX +XXX,XX @@ static void tcg_out_op(TCGContext *s, TCGOpcode opc,
+     }
+ }
+-static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
++static TCGConstraintSetIndex
++tcg_target_op_def(TCGOpcode op, TCGType type, unsigned flags)
+ {
+     switch (op) {
+     case INDEX_op_goto_ptr:
+diff --git a/tcg/tci/tcg-target.c.inc b/tcg/tci/tcg-target.c.inc
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/tci/tcg-target.c.inc
++++ b/tcg/tci/tcg-target.c.inc
+@@ -XXX,XX +XXX,XX @@
+ #endif
+ #define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_NORMAL
+-static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
++static TCGConstraintSetIndex
++tcg_target_op_def(TCGOpcode op, TCGType type, unsigned flags)
+ {
+     switch (op) {
+     case INDEX_op_goto_ptr:
 --
-.34.1
+.43.0

-[PULL 08/40] tcg: Introduce tcg_target_call_oarg_reg
+[PULL 42/68] tcg: Add TCGType argument to tcg_out_op
-Replace the flat array tcg_target_call_oarg_regs[] with
+Pass TCGOp.type to the output function.
-a function call including the TCGCallReturnKind.
+For aarch64 and tci, use this instead of testing TCG_OPF_64BIT.
+For s390x, use this instead of testing INDEX_op_deposit_i64.
-Extend the set of registers for ARM to r0-r3 to match the ABI:
+For i386, use this to initialize rexw.
-https://github.com/ARM-software/abi-aa/blob/main/aapcs32/aapcs32.rst#result-return
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
 Reviewed-by: Daniel Henrique Barboza <danielhb413@gmail.com>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 ---
- tcg/tcg.c                        |  9 ++++++---
+ tcg/tcg.c                        |  4 ++--
- tcg/aarch64/tcg-target.c.inc     | 10 +++++++---
+ tcg/aarch64/tcg-target.c.inc     |  6 +-----
- tcg/arm/tcg-target.c.inc         | 10 +++++++---
+ tcg/arm/tcg-target.c.inc         |  2 +-
- tcg/i386/tcg-target.c.inc        | 16 ++++++++++------
+ tcg/i386/tcg-target.c.inc        | 10 +++++-----
- tcg/loongarch64/tcg-target.c.inc | 10 ++++++----
+ tcg/loongarch64/tcg-target.c.inc |  2 +-
- tcg/mips/tcg-target.c.inc        | 10 ++++++----
+ tcg/mips/tcg-target.c.inc        |  2 +-
- tcg/ppc/tcg-target.c.inc         | 10 ++++++----
+ tcg/ppc/tcg-target.c.inc         |  2 +-
- tcg/riscv/tcg-target.c.inc       | 10 ++++++----
+ tcg/riscv/tcg-target.c.inc       |  2 +-
- tcg/s390x/tcg-target.c.inc       |  9 ++++++---
+ tcg/s390x/tcg-target.c.inc       |  7 +++----
- tcg/sparc64/tcg-target.c.inc     | 12 ++++++------
+ tcg/sparc64/tcg-target.c.inc     |  2 +-
- tcg/tci/tcg-target.c.inc         | 12 ++++++------
+ tcg/tci/tcg-target.c.inc         |  4 ++--
-files changed, 72 insertions(+), 46 deletions(-)
+files changed, 19 insertions(+), 24 deletions(-)
 diff --git a/tcg/tcg.c b/tcg/tcg.c
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tcg.c
 +++ b/tcg/tcg.c
-@@ -XXX,XX +XXX,XX @@ static bool tcg_out_sti(TCGContext *s, TCGType type, TCGArg val,
+@@ -XXX,XX +XXX,XX @@ static void tcg_out_addi_ptr(TCGContext *s, TCGReg, TCGReg, tcg_target_long);
-                         TCGReg base, intptr_t ofs);
+ static bool tcg_out_xchg(TCGContext *s, TCGType type, TCGReg r1, TCGReg r2);
- static void tcg_out_call(TCGContext *s, const tcg_insn_unit *target,
+ static void tcg_out_exit_tb(TCGContext *s, uintptr_t arg);
-                          const TCGHelperInfo *info);
+ static void tcg_out_goto_tb(TCGContext *s, int which);
-+static TCGReg tcg_target_call_oarg_reg(TCGCallReturnKind kind, int slot);
+-static void tcg_out_op(TCGContext *s, TCGOpcode opc,
- static bool tcg_target_const_match(int64_t val, TCGType type, int ct);
++static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
- #ifdef TCG_TARGET_NEED_LDST_LABELS
+                        const TCGArg args[TCG_MAX_OP_ARGS],
- static int tcg_out_ldst_finalize(TCGContext *s);
+                        const int const_args[TCG_MAX_OP_ARGS]);
-@@ -XXX,XX +XXX,XX @@ static void init_call_layout(TCGHelperInfo *info)
+ #if TCG_TARGET_MAYBE_vec
-     case dh_typecode_s64:
+@@ -XXX,XX +XXX,XX @@ static void tcg_reg_alloc_op(TCGContext *s, const TCGOp *op)
-         info->nr_out = 64 / TCG_TARGET_REG_BITS;
+             tcg_out_vec_op(s, op->opc, TCGOP_TYPE(op) - TCG_TYPE_V64,
-         info->out_kind = TCG_CALL_RET_NORMAL;
+                            TCGOP_VECE(op), new_args, const_args);
--        assert(info->nr_out <= ARRAY_SIZE(tcg_target_call_oarg_regs));
+         } else {
-+        /* Query the last register now to trigger any assert early. */
+-            tcg_out_op(s, op->opc, new_args, const_args);
-+        tcg_target_call_oarg_reg(info->out_kind, info->nr_out - 1);
++            tcg_out_op(s, op->opc, TCGOP_TYPE(op), new_args, const_args);
          }
          break;
-     case dh_typecode_i128:
+     }
          info->nr_out = 128 / TCG_TARGET_REG_BITS;
          info->out_kind = TCG_CALL_RET_NORMAL; /* TODO */
          switch (/* TODO */ TCG_CALL_RET_NORMAL) {
          case TCG_CALL_RET_NORMAL:
 -            assert(info->nr_out <= ARRAY_SIZE(tcg_target_call_oarg_regs));
 +            /* Query the last register now to trigger any assert early. */
 +            tcg_target_call_oarg_reg(info->out_kind, info->nr_out - 1);
              break;
          case TCG_CALL_RET_BY_REF:
              /*
@@ -XXX,XX +XXX,XX @@ static void tcg_reg_alloc_call(TCGContext *s, TCGOp *op)
      case TCG_CALL_RET_NORMAL:
          for (i = 0; i < nb_oargs; i++) {
              TCGTemp *ts = arg_temp(op->args[i]);
 -            TCGReg reg = tcg_target_call_oarg_regs[i];
 +            TCGReg reg = tcg_target_call_oarg_reg(TCG_CALL_RET_NORMAL, i);
              /* ENV should not be modified.  */
              tcg_debug_assert(!temp_readonly(ts));
 diff --git a/tcg/aarch64/tcg-target.c.inc b/tcg/aarch64/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/aarch64/tcg-target.c.inc
 +++ b/tcg/aarch64/tcg-target.c.inc
-@@ -XXX,XX +XXX,XX @@ static const int tcg_target_call_iarg_regs[8] = {
+@@ -XXX,XX +XXX,XX @@ void tb_target_set_jmp_target(const TranslationBlock *tb, int n,
-     TCG_REG_X0, TCG_REG_X1, TCG_REG_X2, TCG_REG_X3,
+     flush_idcache_range(jmp_rx, jmp_rw, 4);
-     TCG_REG_X4, TCG_REG_X5, TCG_REG_X6, TCG_REG_X7
+ }
- };
--static const int tcg_target_call_oarg_regs[1] = {
+-static void tcg_out_op(TCGContext *s, TCGOpcode opc,
--    TCG_REG_X0
++static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType ext,
--};
+                        const TCGArg args[TCG_MAX_OP_ARGS],
-+
+                        const int const_args[TCG_MAX_OP_ARGS])
-+static TCGReg tcg_target_call_oarg_reg(TCGCallReturnKind kind, int slot)
+ {
-+{
+-    /* 99% of the time, we can signal the use of extension registers
-+    tcg_debug_assert(kind == TCG_CALL_RET_NORMAL);
+-       by looking to see if the opcode handles 64-bit data.  */
-+    tcg_debug_assert(slot >= 0 && slot <= 1);
+-    TCGType ext = (tcg_op_defs[opc].flags & TCG_OPF_64BIT) != 0;
-+    return TCG_REG_X0 + slot;
+-
-+}
+     /* Hoist the loads of the most common arguments.  */
+     TCGArg a0 = args[0];
- #define TCG_REG_TMP TCG_REG_X30
+     TCGArg a1 = args[1];
  #define TCG_VEC_TMP TCG_REG_V31
 diff --git a/tcg/arm/tcg-target.c.inc b/tcg/arm/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/arm/tcg-target.c.inc
 +++ b/tcg/arm/tcg-target.c.inc
-@@ -XXX,XX +XXX,XX @@ static const int tcg_target_reg_alloc_order[] = {
+@@ -XXX,XX +XXX,XX @@ void tb_target_set_jmp_target(const TranslationBlock *tb, int n,
- static const int tcg_target_call_iarg_regs[4] = {
+     flush_idcache_range(jmp_rx, jmp_rw, 4);
-     TCG_REG_R0, TCG_REG_R1, TCG_REG_R2, TCG_REG_R3
+ }
- };
--static const int tcg_target_call_oarg_regs[2] = {
+-static void tcg_out_op(TCGContext *s, TCGOpcode opc,
--    TCG_REG_R0, TCG_REG_R1
++static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
--};
+                        const TCGArg args[TCG_MAX_OP_ARGS],
-+
+                        const int const_args[TCG_MAX_OP_ARGS])
-+static TCGReg tcg_target_call_oarg_reg(TCGCallReturnKind kind, int slot)
+ {
 +{
 +    tcg_debug_assert(kind == TCG_CALL_RET_NORMAL);
 +    tcg_debug_assert(slot >= 0 && slot <= 3);
 +    return TCG_REG_R0 + slot;
 +}
  #define TCG_REG_TMP  TCG_REG_R12
  #define TCG_VEC_TMP  TCG_REG_Q15
 diff --git a/tcg/i386/tcg-target.c.inc b/tcg/i386/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/i386/tcg-target.c.inc
 +++ b/tcg/i386/tcg-target.c.inc
-@@ -XXX,XX +XXX,XX @@ static const int tcg_target_call_iarg_regs[] = {
+@@ -XXX,XX +XXX,XX @@ void tb_target_set_jmp_target(const TranslationBlock *tb, int n,
- #endif
+     /* no need to flush icache explicitly */
- };
+ }
--static const int tcg_target_call_oarg_regs[] = {
+-static inline void tcg_out_op(TCGContext *s, TCGOpcode opc,
--    TCG_REG_EAX,
+-                              const TCGArg args[TCG_MAX_OP_ARGS],
--#if TCG_TARGET_REG_BITS == 32
+-                              const int const_args[TCG_MAX_OP_ARGS])
--    TCG_REG_EDX
++static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
--#endif
++                       const TCGArg args[TCG_MAX_OP_ARGS],
--};
++                       const int const_args[TCG_MAX_OP_ARGS])
-+static TCGReg tcg_target_call_oarg_reg(TCGCallReturnKind kind, int slot)
+ {
-+{
+     TCGArg a0, a1, a2;
-+    switch (kind) {
+-    int c, const_a2, vexop, rexw = 0;
-+    case TCG_CALL_RET_NORMAL:
++    int c, const_a2, vexop, rexw;
-+        tcg_debug_assert(slot >= 0 && slot <= 1);
-+        return slot ? TCG_REG_EDX : TCG_REG_EAX;
+ #if TCG_TARGET_REG_BITS == 64
-+    default:
+ # define OP_32_64(x) \
-+        g_assert_not_reached();
+         case glue(glue(INDEX_op_, x), _i64): \
-+    }
+-            rexw = P_REXW; /* FALLTHRU */    \
-+}
+         case glue(glue(INDEX_op_, x), _i32)
+ #else
- /* Constants we accept.  */
+ # define OP_32_64(x) \
- #define TCG_CT_CONST_S32 0x100
+@@ -XXX,XX +XXX,XX @@ static inline void tcg_out_op(TCGContext *s, TCGOpcode opc,
      a1 = args[1];
      a2 = args[2];
      const_a2 = const_args[2];
 +    rexw = type == TCG_TYPE_I32 ? 0 : P_REXW;
      switch (opc) {
      case INDEX_op_goto_ptr:
 diff --git a/tcg/loongarch64/tcg-target.c.inc b/tcg/loongarch64/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/loongarch64/tcg-target.c.inc
 +++ b/tcg/loongarch64/tcg-target.c.inc
-@@ -XXX,XX +XXX,XX @@ static const int tcg_target_call_iarg_regs[] = {
+@@ -XXX,XX +XXX,XX @@ void tb_target_set_jmp_target(const TranslationBlock *tb, int n,
-     TCG_REG_A7,
+     flush_idcache_range(jmp_rx, jmp_rw, 4);
- };
+ }
--static const int tcg_target_call_oarg_regs[] = {
+-static void tcg_out_op(TCGContext *s, TCGOpcode opc,
--    TCG_REG_A0,
++static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
--    TCG_REG_A1,
+                        const TCGArg args[TCG_MAX_OP_ARGS],
--};
+                        const int const_args[TCG_MAX_OP_ARGS])
-+static TCGReg tcg_target_call_oarg_reg(TCGCallReturnKind kind, int slot)
+ {
 +{
 +    tcg_debug_assert(kind == TCG_CALL_RET_NORMAL);
 +    tcg_debug_assert(slot >= 0 && slot <= 1);
 +    return TCG_REG_A0 + slot;
 +}
  #ifndef CONFIG_SOFTMMU
  #define USE_GUEST_BASE     (guest_base != 0)
 diff --git a/tcg/mips/tcg-target.c.inc b/tcg/mips/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/mips/tcg-target.c.inc
 +++ b/tcg/mips/tcg-target.c.inc
-@@ -XXX,XX +XXX,XX @@ static const TCGReg tcg_target_call_iarg_regs[] = {
+@@ -XXX,XX +XXX,XX @@ void tb_target_set_jmp_target(const TranslationBlock *tb, int n,
- #endif
+     /* Always indirect, nothing to do */
- };
+ }
--static const TCGReg tcg_target_call_oarg_regs[2] = {
+-static void tcg_out_op(TCGContext *s, TCGOpcode opc,
--    TCG_REG_V0,
++static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
--    TCG_REG_V1
+                        const TCGArg args[TCG_MAX_OP_ARGS],
--};
+                        const int const_args[TCG_MAX_OP_ARGS])
-+static TCGReg tcg_target_call_oarg_reg(TCGCallReturnKind kind, int slot)
+ {
 +{
 +    tcg_debug_assert(kind == TCG_CALL_RET_NORMAL);
 +    tcg_debug_assert(slot >= 0 && slot <= 1);
 +    return TCG_REG_V0 + slot;
 +}
  static const tcg_insn_unit *tb_ret_addr;
  static const tcg_insn_unit *bswap32_addr;
 diff --git a/tcg/ppc/tcg-target.c.inc b/tcg/ppc/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/ppc/tcg-target.c.inc
 +++ b/tcg/ppc/tcg-target.c.inc
-@@ -XXX,XX +XXX,XX @@ static const int tcg_target_call_iarg_regs[] = {
+@@ -XXX,XX +XXX,XX @@ void tb_target_set_jmp_target(const TranslationBlock *tb, int n,
-     TCG_REG_R10
+     flush_idcache_range(jmp_rx, jmp_rw, 4);
- };
+ }
--static const int tcg_target_call_oarg_regs[] = {
+-static void tcg_out_op(TCGContext *s, TCGOpcode opc,
--    TCG_REG_R3,
++static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
--    TCG_REG_R4
+                        const TCGArg args[TCG_MAX_OP_ARGS],
--};
+                        const int const_args[TCG_MAX_OP_ARGS])
-+static TCGReg tcg_target_call_oarg_reg(TCGCallReturnKind kind, int slot)
+ {
 +{
 +    tcg_debug_assert(kind == TCG_CALL_RET_NORMAL);
 +    tcg_debug_assert(slot >= 0 && slot <= 1);
 +    return TCG_REG_R3 + slot;
 +}
  static const int tcg_target_callee_save_regs[] = {
  #ifdef _CALL_DARWIN
 diff --git a/tcg/riscv/tcg-target.c.inc b/tcg/riscv/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/riscv/tcg-target.c.inc
 +++ b/tcg/riscv/tcg-target.c.inc
-@@ -XXX,XX +XXX,XX @@ static const int tcg_target_call_iarg_regs[] = {
+@@ -XXX,XX +XXX,XX @@ void tb_target_set_jmp_target(const TranslationBlock *tb, int n,
-     TCG_REG_A7,
+     flush_idcache_range(jmp_rx, jmp_rw, 4);
- };
+ }
--static const int tcg_target_call_oarg_regs[] = {
+-static void tcg_out_op(TCGContext *s, TCGOpcode opc,
--    TCG_REG_A0,
++static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
--    TCG_REG_A1,
+                        const TCGArg args[TCG_MAX_OP_ARGS],
--};
+                        const int const_args[TCG_MAX_OP_ARGS])
-+static TCGReg tcg_target_call_oarg_reg(TCGCallReturnKind kind, int slot)
+ {
 +{
 +    tcg_debug_assert(kind == TCG_CALL_RET_NORMAL);
 +    tcg_debug_assert(slot >= 0 && slot <= 1);
 +    return TCG_REG_A0 + slot;
 +}
  #define TCG_CT_CONST_ZERO  0x100
  #define TCG_CT_CONST_S12   0x200
 diff --git a/tcg/s390x/tcg-target.c.inc b/tcg/s390x/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/s390x/tcg-target.c.inc
 +++ b/tcg/s390x/tcg-target.c.inc
-@@ -XXX,XX +XXX,XX @@ static const int tcg_target_call_iarg_regs[] = {
+@@ -XXX,XX +XXX,XX @@ void tb_target_set_jmp_target(const TranslationBlock *tb, int n,
-     TCG_REG_R6,
+         case glue(glue(INDEX_op_,x),_i32): \
- };
+         case glue(glue(INDEX_op_,x),_i64)
--static const int tcg_target_call_oarg_regs[] = {
+-static inline void tcg_out_op(TCGContext *s, TCGOpcode opc,
--    TCG_REG_R2,
+-                              const TCGArg args[TCG_MAX_OP_ARGS],
--};
+-                              const int const_args[TCG_MAX_OP_ARGS])
-+static TCGReg tcg_target_call_oarg_reg(TCGCallReturnKind kind, int slot)
++static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
-+{
++                       const TCGArg args[TCG_MAX_OP_ARGS],
-+    tcg_debug_assert(kind == TCG_CALL_RET_NORMAL);
++                       const int const_args[TCG_MAX_OP_ARGS])
-+    tcg_debug_assert(slot == 0);
+ {
-+    return TCG_REG_R2;
+     S390Opcode op, op2;
-+}
+     TCGArg a0, a1, a2;
+@@ -XXX,XX +XXX,XX @@ static inline void tcg_out_op(TCGContext *s, TCGOpcode opc,
- #define S390_CC_EQ      8
+             /* Since we can't support "0Z" as a constraint, we allow a1 in
- #define S390_CC_LT      4
+                any register.  Fix things up as if a matching constraint.  */
              if (a0 != a1) {
 -                TCGType type = (opc == INDEX_op_deposit_i64);
                  if (a0 == a2) {
                      tcg_out_mov(s, type, TCG_TMP0, a2);
                      a2 = TCG_TMP0;
 diff --git a/tcg/sparc64/tcg-target.c.inc b/tcg/sparc64/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/sparc64/tcg-target.c.inc
 +++ b/tcg/sparc64/tcg-target.c.inc
-@@ -XXX,XX +XXX,XX @@ static const int tcg_target_call_iarg_regs[6] = {
+@@ -XXX,XX +XXX,XX @@ void tb_target_set_jmp_target(const TranslationBlock *tb, int n,
-     TCG_REG_O5,
+ {
- };
+ }
--static const int tcg_target_call_oarg_regs[] = {
+-static void tcg_out_op(TCGContext *s, TCGOpcode opc,
--    TCG_REG_O0,
++static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
--    TCG_REG_O1,
+                        const TCGArg args[TCG_MAX_OP_ARGS],
--    TCG_REG_O2,
+                        const int const_args[TCG_MAX_OP_ARGS])
--    TCG_REG_O3,
+ {
 -};
 +static TCGReg tcg_target_call_oarg_reg(TCGCallReturnKind kind, int slot)
 +{
 +    tcg_debug_assert(kind == TCG_CALL_RET_NORMAL);
 +    tcg_debug_assert(slot >= 0 && slot <= 3);
 +    return TCG_REG_O0 + slot;
 +}
  #define INSN_OP(x)  ((x) << 30)
  #define INSN_OP2(x) ((x) << 22)
 diff --git a/tcg/tci/tcg-target.c.inc b/tcg/tci/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tci/tcg-target.c.inc
 +++ b/tcg/tci/tcg-target.c.inc
-@@ -XXX,XX +XXX,XX @@ static const int tcg_target_reg_alloc_order[] = {
+@@ -XXX,XX +XXX,XX @@ void tb_target_set_jmp_target(const TranslationBlock *tb, int n,
- /* No call arguments via registers.  All will be stored on the "stack". */
+     /* Always indirect, nothing to do */
- static const int tcg_target_call_iarg_regs[] = { };
+ }
--static const int tcg_target_call_oarg_regs[] = {
+-static void tcg_out_op(TCGContext *s, TCGOpcode opc,
--    TCG_REG_R0,
++static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
--#if TCG_TARGET_REG_BITS == 32
+                        const TCGArg args[TCG_MAX_OP_ARGS],
--    TCG_REG_R1
+                        const int const_args[TCG_MAX_OP_ARGS])
--#endif
+ {
--};
+@@ -XXX,XX +XXX,XX @@ static void tcg_out_op(TCGContext *s, TCGOpcode opc,
-+static TCGReg tcg_target_call_oarg_reg(TCGCallReturnKind kind, int slot)
+     CASE_32_64(sextract) /* Optional (TCG_TARGET_HAS_sextract_*). */
-+{
+         {
-+    tcg_debug_assert(kind == TCG_CALL_RET_NORMAL);
+             TCGArg pos = args[2], len = args[3];
-+    tcg_debug_assert(slot >= 0 && slot < 64 / TCG_TARGET_REG_BITS);
+-            TCGArg max = tcg_op_defs[opc].flags & TCG_OPF_64BIT ? 64 : 32;
-+    return TCG_REG_R0 + slot;
++            TCGArg max = type == TCG_TYPE_I32 ? 32 : 64;
-+}
+             tcg_debug_assert(pos < max);
- #ifdef CONFIG_DEBUG_TCG
+             tcg_debug_assert(pos + len <= max);
  static const char *const tcg_target_reg_names[TCG_TARGET_NB_REGS] = {
 --
-.34.1
+.43.0

-[PULL 03/40] tcg: Define TCG_TYPE_I128 and related helper macros
+[PULL 43/68] tcg: Remove TCG_OPF_64BIT
-Begin staging in support for TCGv_i128 with Int128.
+This flag is no longer used.
 Define the type enumerator, the typedef, and the
 helper-head.h macros.
-This cannot yet be used, because you can't allocate
-temporaries of this new type.
-Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
 Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 ---
- include/exec/helper-head.h |  7 +++++++
+ include/tcg/tcg-opc.h | 22 +++++++++++-----------
- include/tcg/tcg.h          | 17 ++++++++++-------
+ include/tcg/tcg.h     |  2 --
-files changed, 17 insertions(+), 7 deletions(-)
+files changed, 11 insertions(+), 13 deletions(-)
-diff --git a/include/exec/helper-head.h b/include/exec/helper-head.h
+diff --git a/include/tcg/tcg-opc.h b/include/tcg/tcg-opc.h
 index XXXXXXX..XXXXXXX 100644
---- a/include/exec/helper-head.h
+--- a/include/tcg/tcg-opc.h
-+++ b/include/exec/helper-head.h
++++ b/include/tcg/tcg-opc.h
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ DEF(br, 0, 0, 1, TCG_OPF_BB_END | TCG_OPF_NOT_PRESENT)
- #define dh_alias_int i32
- #define dh_alias_i64 i64
+ #define IMPL(X) (__builtin_constant_p(X) && (X) <= 0 ? TCG_OPF_NOT_PRESENT : 0)
- #define dh_alias_s64 i64
+ #if TCG_TARGET_REG_BITS == 32
-+#define dh_alias_i128 i128
+-# define IMPL64  TCG_OPF_64BIT | TCG_OPF_NOT_PRESENT
- #define dh_alias_f16 i32
++# define IMPL64  TCG_OPF_NOT_PRESENT
- #define dh_alias_f32 i32
+ #else
- #define dh_alias_f64 i64
+-# define IMPL64  TCG_OPF_64BIT
-@@ -XXX,XX +XXX,XX @@
++# define IMPL64  0
- #define dh_ctype_int int
+ #endif
- #define dh_ctype_i64 uint64_t
- #define dh_ctype_s64 int64_t
+ DEF(mb, 0, 0, 1, TCG_OPF_NOT_PRESENT)
-+#define dh_ctype_i128 Int128
+@@ -XXX,XX +XXX,XX @@ DEF(clz_i32, 1, 2, 0, IMPL(TCG_TARGET_HAS_clz_i32))
- #define dh_ctype_f16 uint32_t
+ DEF(ctz_i32, 1, 2, 0, IMPL(TCG_TARGET_HAS_ctz_i32))
- #define dh_ctype_f32 float32
+ DEF(ctpop_i32, 1, 1, 0, IMPL(TCG_TARGET_HAS_ctpop_i32))
- #define dh_ctype_f64 float64
-@@ -XXX,XX +XXX,XX @@
+-DEF(mov_i64, 1, 1, 0, TCG_OPF_64BIT | TCG_OPF_NOT_PRESENT)
- #define dh_retvar_decl0_noreturn void
++DEF(mov_i64, 1, 1, 0, TCG_OPF_NOT_PRESENT)
- #define dh_retvar_decl0_i32 TCGv_i32 retval
+ DEF(setcond_i64, 1, 2, 1, IMPL64)
- #define dh_retvar_decl0_i64 TCGv_i64 retval
+ DEF(negsetcond_i64, 1, 2, 1, IMPL64 | IMPL(TCG_TARGET_HAS_negsetcond_i64))
-+#define dh_retval_decl0_i128 TCGv_i128 retval
+ DEF(movcond_i64, 1, 4, 1, IMPL64)
- #define dh_retvar_decl0_ptr TCGv_ptr retval
+@@ -XXX,XX +XXX,XX @@ DEF(qemu_ld_a32_i32, 1, 1, 1,
- #define dh_retvar_decl0(t) glue(dh_retvar_decl0_, dh_alias(t))
+ DEF(qemu_st_a32_i32, 0, 1 + 1, 1,
+     TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS)
-@@ -XXX,XX +XXX,XX @@
+ DEF(qemu_ld_a32_i64, DATA64_ARGS, 1, 1,
- #define dh_retvar_decl_noreturn
+-    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS | TCG_OPF_64BIT)
- #define dh_retvar_decl_i32 TCGv_i32 retval,
++    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS)
- #define dh_retvar_decl_i64 TCGv_i64 retval,
+ DEF(qemu_st_a32_i64, 0, DATA64_ARGS + 1, 1,
-+#define dh_retvar_decl_i128 TCGv_i128 retval,
+-    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS | TCG_OPF_64BIT)
- #define dh_retvar_decl_ptr TCGv_ptr retval,
++    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS)
- #define dh_retvar_decl(t) glue(dh_retvar_decl_, dh_alias(t))
+ DEF(qemu_ld_a64_i32, 1, DATA64_ARGS, 1,
-@@ -XXX,XX +XXX,XX @@
+     TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS)
- #define dh_retvar_noreturn NULL
+ DEF(qemu_st_a64_i32, 0, 1 + DATA64_ARGS, 1,
- #define dh_retvar_i32 tcgv_i32_temp(retval)
+     TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS)
- #define dh_retvar_i64 tcgv_i64_temp(retval)
+ DEF(qemu_ld_a64_i64, DATA64_ARGS, DATA64_ARGS, 1,
-+#define dh_retvar_i128 tcgv_i128_temp(retval)
+-    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS | TCG_OPF_64BIT)
- #define dh_retvar_ptr tcgv_ptr_temp(retval)
++    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS)
- #define dh_retvar(t) glue(dh_retvar_, dh_alias(t))
+ DEF(qemu_st_a64_i64, 0, DATA64_ARGS + DATA64_ARGS, 1,
+-    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS | TCG_OPF_64BIT)
-@@ -XXX,XX +XXX,XX @@
++    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS)
- #define dh_typecode_i64 4
- #define dh_typecode_s64 5
+ /* Only used by i386 to cope with stupid register constraints. */
- #define dh_typecode_ptr 6
+ DEF(qemu_st8_a32_i32, 0, 1 + 1, 1,
-+#define dh_typecode_i128 7
+@@ -XXX,XX +XXX,XX @@ DEF(qemu_st8_a64_i32, 0, 1 + DATA64_ARGS, 1,
- #define dh_typecode_int dh_typecode_s32
- #define dh_typecode_f16 dh_typecode_i32
+ /* Only for 64-bit hosts at the moment. */
- #define dh_typecode_f32 dh_typecode_i32
+ DEF(qemu_ld_a32_i128, 2, 1, 1,
-@@ -XXX,XX +XXX,XX @@
+-    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS | TCG_OPF_64BIT |
++    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS |
- #define dh_callflag_i32  0
+     IMPL(TCG_TARGET_HAS_qemu_ldst_i128))
- #define dh_callflag_i64  0
+ DEF(qemu_ld_a64_i128, 2, 1, 1,
-+#define dh_callflag_i128 0
+-    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS | TCG_OPF_64BIT |
- #define dh_callflag_ptr  0
++    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS |
- #define dh_callflag_void 0
+     IMPL(TCG_TARGET_HAS_qemu_ldst_i128))
- #define dh_callflag_noreturn TCG_CALL_NO_RETURN
+ DEF(qemu_st_a32_i128, 0, 3, 1,
 -    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS | TCG_OPF_64BIT |
 +    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS |
      IMPL(TCG_TARGET_HAS_qemu_ldst_i128))
  DEF(qemu_st_a64_i128, 0, 3, 1,
 -    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS | TCG_OPF_64BIT |
 +    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS |
      IMPL(TCG_TARGET_HAS_qemu_ldst_i128))
  /* Host vector support.  */
 diff --git a/include/tcg/tcg.h b/include/tcg/tcg.h
 index XXXXXXX..XXXXXXX 100644
 --- a/include/tcg/tcg.h
 +++ b/include/tcg/tcg.h
-@@ -XXX,XX +XXX,XX @@ typedef struct TCGPool {
+@@ -XXX,XX +XXX,XX @@ enum {
- typedef enum TCGType {
+     /* Instruction has side effects: it cannot be removed if its outputs
-     TCG_TYPE_I32,
+        are not used, and might trigger exceptions.  */
-     TCG_TYPE_I64,
+     TCG_OPF_SIDE_EFFECTS = 0x08,
-+    TCG_TYPE_I128,
+-    /* Instruction operands are 64-bits (otherwise 32-bits).  */
+-    TCG_OPF_64BIT        = 0x10,
-     TCG_TYPE_V64,
+     /* Instruction is optional and not implemented by the host, or insn
-     TCG_TYPE_V128,
+        is generic and should not be implemented by the host.  */
-@@ -XXX,XX +XXX,XX @@ typedef tcg_target_ulong TCGArg;
+     TCG_OPF_NOT_PRESENT  = 0x20,
     in tcg/README. Target CPU front-end code uses these types to deal
     with TCG variables as it emits TCG code via the tcg_gen_* functions.
     They come in several flavours:
 -    * TCGv_i32 : 32 bit integer type
 -    * TCGv_i64 : 64 bit integer type
 -    * TCGv_ptr : a host pointer type
 -    * TCGv_vec : a host vector type; the exact size is not exposed
 -                 to the CPU front-end code.
 -    * TCGv : an integer type the same size as target_ulong
 -             (an alias for either TCGv_i32 or TCGv_i64)
 +    * TCGv_i32  : 32 bit integer type
 +    * TCGv_i64  : 64 bit integer type
 +    * TCGv_i128 : 128 bit integer type
 +    * TCGv_ptr  : a host pointer type
 +    * TCGv_vec  : a host vector type; the exact size is not exposed
 +                  to the CPU front-end code.
 +    * TCGv      : an integer type the same size as target_ulong
 +                  (an alias for either TCGv_i32 or TCGv_i64)
     The compiler's type checking will complain if you mix them
     up and pass the wrong sized TCGv to a function.
@@ -XXX,XX +XXX,XX @@ typedef tcg_target_ulong TCGArg;
  typedef struct TCGv_i32_d *TCGv_i32;
  typedef struct TCGv_i64_d *TCGv_i64;
 +typedef struct TCGv_i128_d *TCGv_i128;
  typedef struct TCGv_ptr_d *TCGv_ptr;
  typedef struct TCGv_vec_d *TCGv_vec;
  typedef TCGv_ptr TCGv_env;
 --
-.34.1
+.43.0

-New patch
+[PULL 44/68] tcg: Drop implementation checks from tcg-opc.h
+Now that we use a functional interface to query whether the opcode
+is supported, we can drop the TCG_OPF_NOT_PRESENT bit mapping from
+TCG_TARGET_HAS_foo in tcg-opc.h
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+---
+ include/tcg/tcg-opc.h | 306 +++++++++++++++++++-----------------------
+file changed, 141 insertions(+), 165 deletions(-)
+diff --git a/include/tcg/tcg-opc.h b/include/tcg/tcg-opc.h
+index XXXXXXX..XXXXXXX 100644
+--- a/include/tcg/tcg-opc.h
++++ b/include/tcg/tcg-opc.h
+@@ -XXX,XX +XXX,XX @@ DEF(call, 0, 0, 3, TCG_OPF_CALL_CLOBBER | TCG_OPF_NOT_PRESENT)
+ DEF(br, 0, 0, 1, TCG_OPF_BB_END | TCG_OPF_NOT_PRESENT)
+-#define IMPL(X) (__builtin_constant_p(X) && (X) <= 0 ? TCG_OPF_NOT_PRESENT : 0)
+-#if TCG_TARGET_REG_BITS == 32
+-# define IMPL64  TCG_OPF_NOT_PRESENT
+-#else
+-# define IMPL64  0
+-#endif
+-
+ DEF(mb, 0, 0, 1, TCG_OPF_NOT_PRESENT)
+ DEF(mov_i32, 1, 1, 0, TCG_OPF_NOT_PRESENT)
+ DEF(setcond_i32, 1, 2, 1, 0)
+-DEF(negsetcond_i32, 1, 2, 1, IMPL(TCG_TARGET_HAS_negsetcond_i32))
++DEF(negsetcond_i32, 1, 2, 1, 0)
+ DEF(movcond_i32, 1, 4, 1, 0)
+ /* load/store */
+ DEF(ld8u_i32, 1, 1, 1, 0)
+@@ -XXX,XX +XXX,XX @@ DEF(st_i32, 0, 2, 1, 0)
+ DEF(add_i32, 1, 2, 0, 0)
+ DEF(sub_i32, 1, 2, 0, 0)
+ DEF(mul_i32, 1, 2, 0, 0)
+-DEF(div_i32, 1, 2, 0, IMPL(TCG_TARGET_HAS_div_i32))
+-DEF(divu_i32, 1, 2, 0, IMPL(TCG_TARGET_HAS_div_i32))
+-DEF(rem_i32, 1, 2, 0, IMPL(TCG_TARGET_HAS_rem_i32))
+-DEF(remu_i32, 1, 2, 0, IMPL(TCG_TARGET_HAS_rem_i32))
+-DEF(div2_i32, 2, 3, 0, IMPL(TCG_TARGET_HAS_div2_i32))
+-DEF(divu2_i32, 2, 3, 0, IMPL(TCG_TARGET_HAS_div2_i32))
++DEF(div_i32, 1, 2, 0, 0)
++DEF(divu_i32, 1, 2, 0, 0)
++DEF(rem_i32, 1, 2, 0, 0)
++DEF(remu_i32, 1, 2, 0, 0)
++DEF(div2_i32, 2, 3, 0, 0)
++DEF(divu2_i32, 2, 3, 0, 0)
+ DEF(and_i32, 1, 2, 0, 0)
+ DEF(or_i32, 1, 2, 0, 0)
+ DEF(xor_i32, 1, 2, 0, 0)
+@@ -XXX,XX +XXX,XX @@ DEF(xor_i32, 1, 2, 0, 0)
+ DEF(shl_i32, 1, 2, 0, 0)
+ DEF(shr_i32, 1, 2, 0, 0)
+ DEF(sar_i32, 1, 2, 0, 0)
+-DEF(rotl_i32, 1, 2, 0, IMPL(TCG_TARGET_HAS_rot_i32))
+-DEF(rotr_i32, 1, 2, 0, IMPL(TCG_TARGET_HAS_rot_i32))
+-DEF(deposit_i32, 1, 2, 2, IMPL(TCG_TARGET_HAS_deposit_i32))
+-DEF(extract_i32, 1, 1, 2, IMPL(TCG_TARGET_HAS_extract_i32))
+-DEF(sextract_i32, 1, 1, 2, IMPL(TCG_TARGET_HAS_sextract_i32))
+-DEF(extract2_i32, 1, 2, 1, IMPL(TCG_TARGET_HAS_extract2_i32))
++DEF(rotl_i32, 1, 2, 0, 0)
++DEF(rotr_i32, 1, 2, 0, 0)
++DEF(deposit_i32, 1, 2, 2, 0)
++DEF(extract_i32, 1, 1, 2, 0)
++DEF(sextract_i32, 1, 1, 2, 0)
++DEF(extract2_i32, 1, 2, 1, 0)
+ DEF(brcond_i32, 0, 2, 2, TCG_OPF_BB_END | TCG_OPF_COND_BRANCH)
+-DEF(add2_i32, 2, 4, 0, IMPL(TCG_TARGET_HAS_add2_i32))
+-DEF(sub2_i32, 2, 4, 0, IMPL(TCG_TARGET_HAS_sub2_i32))
+-DEF(mulu2_i32, 2, 2, 0, IMPL(TCG_TARGET_HAS_mulu2_i32))
+-DEF(muls2_i32, 2, 2, 0, IMPL(TCG_TARGET_HAS_muls2_i32))
+-DEF(muluh_i32, 1, 2, 0, IMPL(TCG_TARGET_HAS_muluh_i32))
+-DEF(mulsh_i32, 1, 2, 0, IMPL(TCG_TARGET_HAS_mulsh_i32))
+-DEF(brcond2_i32, 0, 4, 2,
+-    TCG_OPF_BB_END | TCG_OPF_COND_BRANCH | IMPL(TCG_TARGET_REG_BITS == 32))
+-DEF(setcond2_i32, 1, 4, 1, IMPL(TCG_TARGET_REG_BITS == 32))
++DEF(add2_i32, 2, 4, 0, 0)
++DEF(sub2_i32, 2, 4, 0, 0)
++DEF(mulu2_i32, 2, 2, 0, 0)
++DEF(muls2_i32, 2, 2, 0, 0)
++DEF(muluh_i32, 1, 2, 0, 0)
++DEF(mulsh_i32, 1, 2, 0, 0)
++DEF(brcond2_i32, 0, 4, 2, TCG_OPF_BB_END | TCG_OPF_COND_BRANCH)
++DEF(setcond2_i32, 1, 4, 1, 0)
+-DEF(ext8s_i32, 1, 1, 0, IMPL(TCG_TARGET_HAS_ext8s_i32))
+-DEF(ext16s_i32, 1, 1, 0, IMPL(TCG_TARGET_HAS_ext16s_i32))
+-DEF(ext8u_i32, 1, 1, 0, IMPL(TCG_TARGET_HAS_ext8u_i32))
+-DEF(ext16u_i32, 1, 1, 0, IMPL(TCG_TARGET_HAS_ext16u_i32))
+-DEF(bswap16_i32, 1, 1, 1, IMPL(TCG_TARGET_HAS_bswap16_i32))
+-DEF(bswap32_i32, 1, 1, 1, IMPL(TCG_TARGET_HAS_bswap32_i32))
+-DEF(not_i32, 1, 1, 0, IMPL(TCG_TARGET_HAS_not_i32))
++DEF(ext8s_i32, 1, 1, 0, 0)
++DEF(ext16s_i32, 1, 1, 0, 0)
++DEF(ext8u_i32, 1, 1, 0, 0)
++DEF(ext16u_i32, 1, 1, 0, 0)
++DEF(bswap16_i32, 1, 1, 1, 0)
++DEF(bswap32_i32, 1, 1, 1, 0)
++DEF(not_i32, 1, 1, 0, 0)
+ DEF(neg_i32, 1, 1, 0, 0)
+-DEF(andc_i32, 1, 2, 0, IMPL(TCG_TARGET_HAS_andc_i32))
+-DEF(orc_i32, 1, 2, 0, IMPL(TCG_TARGET_HAS_orc_i32))
+-DEF(eqv_i32, 1, 2, 0, IMPL(TCG_TARGET_HAS_eqv_i32))
+-DEF(nand_i32, 1, 2, 0, IMPL(TCG_TARGET_HAS_nand_i32))
+-DEF(nor_i32, 1, 2, 0, IMPL(TCG_TARGET_HAS_nor_i32))
+-DEF(clz_i32, 1, 2, 0, IMPL(TCG_TARGET_HAS_clz_i32))
+-DEF(ctz_i32, 1, 2, 0, IMPL(TCG_TARGET_HAS_ctz_i32))
+-DEF(ctpop_i32, 1, 1, 0, IMPL(TCG_TARGET_HAS_ctpop_i32))
++DEF(andc_i32, 1, 2, 0, 0)
++DEF(orc_i32, 1, 2, 0, 0)
++DEF(eqv_i32, 1, 2, 0, 0)
++DEF(nand_i32, 1, 2, 0, 0)
++DEF(nor_i32, 1, 2, 0, 0)
++DEF(clz_i32, 1, 2, 0, 0)
++DEF(ctz_i32, 1, 2, 0, 0)
++DEF(ctpop_i32, 1, 1, 0, 0)
+ DEF(mov_i64, 1, 1, 0, TCG_OPF_NOT_PRESENT)
+-DEF(setcond_i64, 1, 2, 1, IMPL64)
+-DEF(negsetcond_i64, 1, 2, 1, IMPL64 | IMPL(TCG_TARGET_HAS_negsetcond_i64))
+-DEF(movcond_i64, 1, 4, 1, IMPL64)
++DEF(setcond_i64, 1, 2, 1, 0)
++DEF(negsetcond_i64, 1, 2, 1, 0)
++DEF(movcond_i64, 1, 4, 1, 0)
+ /* load/store */
+-DEF(ld8u_i64, 1, 1, 1, IMPL64)
+-DEF(ld8s_i64, 1, 1, 1, IMPL64)
+-DEF(ld16u_i64, 1, 1, 1, IMPL64)
+-DEF(ld16s_i64, 1, 1, 1, IMPL64)
+-DEF(ld32u_i64, 1, 1, 1, IMPL64)
+-DEF(ld32s_i64, 1, 1, 1, IMPL64)
+-DEF(ld_i64, 1, 1, 1, IMPL64)
+-DEF(st8_i64, 0, 2, 1, IMPL64)
+-DEF(st16_i64, 0, 2, 1, IMPL64)
+-DEF(st32_i64, 0, 2, 1, IMPL64)
+-DEF(st_i64, 0, 2, 1, IMPL64)
++DEF(ld8u_i64, 1, 1, 1, 0)
++DEF(ld8s_i64, 1, 1, 1, 0)
++DEF(ld16u_i64, 1, 1, 1, 0)
++DEF(ld16s_i64, 1, 1, 1, 0)
++DEF(ld32u_i64, 1, 1, 1, 0)
++DEF(ld32s_i64, 1, 1, 1, 0)
++DEF(ld_i64, 1, 1, 1, 0)
++DEF(st8_i64, 0, 2, 1, 0)
++DEF(st16_i64, 0, 2, 1, 0)
++DEF(st32_i64, 0, 2, 1, 0)
++DEF(st_i64, 0, 2, 1, 0)
+ /* arith */
+-DEF(add_i64, 1, 2, 0, IMPL64)
+-DEF(sub_i64, 1, 2, 0, IMPL64)
+-DEF(mul_i64, 1, 2, 0, IMPL64)
+-DEF(div_i64, 1, 2, 0, IMPL64 | IMPL(TCG_TARGET_HAS_div_i64))
+-DEF(divu_i64, 1, 2, 0, IMPL64 | IMPL(TCG_TARGET_HAS_div_i64))
+-DEF(rem_i64, 1, 2, 0, IMPL64 | IMPL(TCG_TARGET_HAS_rem_i64))
+-DEF(remu_i64, 1, 2, 0, IMPL64 | IMPL(TCG_TARGET_HAS_rem_i64))
+-DEF(div2_i64, 2, 3, 0, IMPL64 | IMPL(TCG_TARGET_HAS_div2_i64))
+-DEF(divu2_i64, 2, 3, 0, IMPL64 | IMPL(TCG_TARGET_HAS_div2_i64))
+-DEF(and_i64, 1, 2, 0, IMPL64)
+-DEF(or_i64, 1, 2, 0, IMPL64)
+-DEF(xor_i64, 1, 2, 0, IMPL64)
++DEF(add_i64, 1, 2, 0, 0)
++DEF(sub_i64, 1, 2, 0, 0)
++DEF(mul_i64, 1, 2, 0, 0)
++DEF(div_i64, 1, 2, 0, 0)
++DEF(divu_i64, 1, 2, 0, 0)
++DEF(rem_i64, 1, 2, 0, 0)
++DEF(remu_i64, 1, 2, 0, 0)
++DEF(div2_i64, 2, 3, 0, 0)
++DEF(divu2_i64, 2, 3, 0, 0)
++DEF(and_i64, 1, 2, 0, 0)
++DEF(or_i64, 1, 2, 0, 0)
++DEF(xor_i64, 1, 2, 0, 0)
+ /* shifts/rotates */
+-DEF(shl_i64, 1, 2, 0, IMPL64)
+-DEF(shr_i64, 1, 2, 0, IMPL64)
+-DEF(sar_i64, 1, 2, 0, IMPL64)
+-DEF(rotl_i64, 1, 2, 0, IMPL64 | IMPL(TCG_TARGET_HAS_rot_i64))
+-DEF(rotr_i64, 1, 2, 0, IMPL64 | IMPL(TCG_TARGET_HAS_rot_i64))
+-DEF(deposit_i64, 1, 2, 2, IMPL64 | IMPL(TCG_TARGET_HAS_deposit_i64))
+-DEF(extract_i64, 1, 1, 2, IMPL64 | IMPL(TCG_TARGET_HAS_extract_i64))
+-DEF(sextract_i64, 1, 1, 2, IMPL64 | IMPL(TCG_TARGET_HAS_sextract_i64))
+-DEF(extract2_i64, 1, 2, 1, IMPL64 | IMPL(TCG_TARGET_HAS_extract2_i64))
++DEF(shl_i64, 1, 2, 0, 0)
++DEF(shr_i64, 1, 2, 0, 0)
++DEF(sar_i64, 1, 2, 0, 0)
++DEF(rotl_i64, 1, 2, 0, 0)
++DEF(rotr_i64, 1, 2, 0, 0)
++DEF(deposit_i64, 1, 2, 2, 0)
++DEF(extract_i64, 1, 1, 2, 0)
++DEF(sextract_i64, 1, 1, 2, 0)
++DEF(extract2_i64, 1, 2, 1, 0)
+ /* size changing ops */
+-DEF(ext_i32_i64, 1, 1, 0, IMPL64)
+-DEF(extu_i32_i64, 1, 1, 0, IMPL64)
+-DEF(extrl_i64_i32, 1, 1, 0,
+-    IMPL(TCG_TARGET_HAS_extr_i64_i32)
+-    | (TCG_TARGET_REG_BITS == 32 ? TCG_OPF_NOT_PRESENT : 0))
+-DEF(extrh_i64_i32, 1, 1, 0,
+-    IMPL(TCG_TARGET_HAS_extr_i64_i32)
+-    | (TCG_TARGET_REG_BITS == 32 ? TCG_OPF_NOT_PRESENT : 0))
++DEF(ext_i32_i64, 1, 1, 0, 0)
++DEF(extu_i32_i64, 1, 1, 0, 0)
++DEF(extrl_i64_i32, 1, 1, 0, 0)
++DEF(extrh_i64_i32, 1, 1, 0, 0)
+-DEF(brcond_i64, 0, 2, 2, TCG_OPF_BB_END | TCG_OPF_COND_BRANCH | IMPL64)
+-DEF(ext8s_i64, 1, 1, 0, IMPL64 | IMPL(TCG_TARGET_HAS_ext8s_i64))
+-DEF(ext16s_i64, 1, 1, 0, IMPL64 | IMPL(TCG_TARGET_HAS_ext16s_i64))
+-DEF(ext32s_i64, 1, 1, 0, IMPL64 | IMPL(TCG_TARGET_HAS_ext32s_i64))
+-DEF(ext8u_i64, 1, 1, 0, IMPL64 | IMPL(TCG_TARGET_HAS_ext8u_i64))
+-DEF(ext16u_i64, 1, 1, 0, IMPL64 | IMPL(TCG_TARGET_HAS_ext16u_i64))
+-DEF(ext32u_i64, 1, 1, 0, IMPL64 | IMPL(TCG_TARGET_HAS_ext32u_i64))
+-DEF(bswap16_i64, 1, 1, 1, IMPL64 | IMPL(TCG_TARGET_HAS_bswap16_i64))
+-DEF(bswap32_i64, 1, 1, 1, IMPL64 | IMPL(TCG_TARGET_HAS_bswap32_i64))
+-DEF(bswap64_i64, 1, 1, 1, IMPL64 | IMPL(TCG_TARGET_HAS_bswap64_i64))
+-DEF(not_i64, 1, 1, 0, IMPL64 | IMPL(TCG_TARGET_HAS_not_i64))
+-DEF(neg_i64, 1, 1, 0, IMPL64)
+-DEF(andc_i64, 1, 2, 0, IMPL64 | IMPL(TCG_TARGET_HAS_andc_i64))
+-DEF(orc_i64, 1, 2, 0, IMPL64 | IMPL(TCG_TARGET_HAS_orc_i64))
+-DEF(eqv_i64, 1, 2, 0, IMPL64 | IMPL(TCG_TARGET_HAS_eqv_i64))
+-DEF(nand_i64, 1, 2, 0, IMPL64 | IMPL(TCG_TARGET_HAS_nand_i64))
+-DEF(nor_i64, 1, 2, 0, IMPL64 | IMPL(TCG_TARGET_HAS_nor_i64))
+-DEF(clz_i64, 1, 2, 0, IMPL64 | IMPL(TCG_TARGET_HAS_clz_i64))
+-DEF(ctz_i64, 1, 2, 0, IMPL64 | IMPL(TCG_TARGET_HAS_ctz_i64))
+-DEF(ctpop_i64, 1, 1, 0, IMPL64 | IMPL(TCG_TARGET_HAS_ctpop_i64))
++DEF(brcond_i64, 0, 2, 2, TCG_OPF_BB_END | TCG_OPF_COND_BRANCH)
++DEF(ext8s_i64, 1, 1, 0, 0)
++DEF(ext16s_i64, 1, 1, 0, 0)
++DEF(ext32s_i64, 1, 1, 0, 0)
++DEF(ext8u_i64, 1, 1, 0, 0)
++DEF(ext16u_i64, 1, 1, 0, 0)
++DEF(ext32u_i64, 1, 1, 0, 0)
++DEF(bswap16_i64, 1, 1, 1, 0)
++DEF(bswap32_i64, 1, 1, 1, 0)
++DEF(bswap64_i64, 1, 1, 1, 0)
++DEF(not_i64, 1, 1, 0, 0)
++DEF(neg_i64, 1, 1, 0, 0)
++DEF(andc_i64, 1, 2, 0, 0)
++DEF(orc_i64, 1, 2, 0, 0)
++DEF(eqv_i64, 1, 2, 0, 0)
++DEF(nand_i64, 1, 2, 0, 0)
++DEF(nor_i64, 1, 2, 0, 0)
++DEF(clz_i64, 1, 2, 0, 0)
++DEF(ctz_i64, 1, 2, 0, 0)
++DEF(ctpop_i64, 1, 1, 0, 0)
+-DEF(add2_i64, 2, 4, 0, IMPL64 | IMPL(TCG_TARGET_HAS_add2_i64))
+-DEF(sub2_i64, 2, 4, 0, IMPL64 | IMPL(TCG_TARGET_HAS_sub2_i64))
+-DEF(mulu2_i64, 2, 2, 0, IMPL64 | IMPL(TCG_TARGET_HAS_mulu2_i64))
+-DEF(muls2_i64, 2, 2, 0, IMPL64 | IMPL(TCG_TARGET_HAS_muls2_i64))
+-DEF(muluh_i64, 1, 2, 0, IMPL64 | IMPL(TCG_TARGET_HAS_muluh_i64))
+-DEF(mulsh_i64, 1, 2, 0, IMPL64 | IMPL(TCG_TARGET_HAS_mulsh_i64))
++DEF(add2_i64, 2, 4, 0, 0)
++DEF(sub2_i64, 2, 4, 0, 0)
++DEF(mulu2_i64, 2, 2, 0, 0)
++DEF(muls2_i64, 2, 2, 0, 0)
++DEF(muluh_i64, 1, 2, 0, 0)
++DEF(mulsh_i64, 1, 2, 0, 0)
+ #define DATA64_ARGS  (TCG_TARGET_REG_BITS == 64 ? 1 : 2)
+@@ -XXX,XX +XXX,XX @@ DEF(qemu_st_a64_i64, 0, DATA64_ARGS + DATA64_ARGS, 1,
+ /* Only used by i386 to cope with stupid register constraints. */
+ DEF(qemu_st8_a32_i32, 0, 1 + 1, 1,
+-    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS |
+-    IMPL(TCG_TARGET_HAS_qemu_st8_i32))
++    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS)
+ DEF(qemu_st8_a64_i32, 0, 1 + DATA64_ARGS, 1,
+-    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS |
+-    IMPL(TCG_TARGET_HAS_qemu_st8_i32))
++    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS)
+ /* Only for 64-bit hosts at the moment. */
+-DEF(qemu_ld_a32_i128, 2, 1, 1,
+-    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS |
+-    IMPL(TCG_TARGET_HAS_qemu_ldst_i128))
+-DEF(qemu_ld_a64_i128, 2, 1, 1,
+-    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS |
+-    IMPL(TCG_TARGET_HAS_qemu_ldst_i128))
+-DEF(qemu_st_a32_i128, 0, 3, 1,
+-    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS |
+-    IMPL(TCG_TARGET_HAS_qemu_ldst_i128))
+-DEF(qemu_st_a64_i128, 0, 3, 1,
+-    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS |
+-    IMPL(TCG_TARGET_HAS_qemu_ldst_i128))
++DEF(qemu_ld_a32_i128, 2, 1, 1, TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS)
++DEF(qemu_ld_a64_i128, 2, 1, 1, TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS)
++DEF(qemu_st_a32_i128, 0, 3, 1, TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS)
++DEF(qemu_st_a64_i128, 0, 3, 1, TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS)
+ /* Host vector support.  */
+-#define IMPLVEC  TCG_OPF_VECTOR | IMPL(TCG_TARGET_MAYBE_vec)
++#define IMPLVEC  TCG_OPF_VECTOR
+ DEF(mov_vec, 1, 1, 0, TCG_OPF_VECTOR | TCG_OPF_NOT_PRESENT)
+ DEF(dup_vec, 1, 1, 0, IMPLVEC)
+-DEF(dup2_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_REG_BITS == 32))
++DEF(dup2_vec, 1, 2, 0, IMPLVEC)
+ DEF(ld_vec, 1, 1, 1, IMPLVEC)
+ DEF(st_vec, 0, 2, 1, IMPLVEC)
+@@ -XXX,XX +XXX,XX @@ DEF(dupm_vec, 1, 1, 1, IMPLVEC)
+ DEF(add_vec, 1, 2, 0, IMPLVEC)
+ DEF(sub_vec, 1, 2, 0, IMPLVEC)
+-DEF(mul_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_mul_vec))
+-DEF(neg_vec, 1, 1, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_neg_vec))
+-DEF(abs_vec, 1, 1, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_abs_vec))
+-DEF(ssadd_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_sat_vec))
+-DEF(usadd_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_sat_vec))
+-DEF(sssub_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_sat_vec))
+-DEF(ussub_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_sat_vec))
+-DEF(smin_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_minmax_vec))
+-DEF(umin_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_minmax_vec))
+-DEF(smax_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_minmax_vec))
+-DEF(umax_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_minmax_vec))
++DEF(mul_vec, 1, 2, 0, IMPLVEC)
++DEF(neg_vec, 1, 1, 0, IMPLVEC)
++DEF(abs_vec, 1, 1, 0, IMPLVEC)
++DEF(ssadd_vec, 1, 2, 0, IMPLVEC)
++DEF(usadd_vec, 1, 2, 0, IMPLVEC)
++DEF(sssub_vec, 1, 2, 0, IMPLVEC)
++DEF(ussub_vec, 1, 2, 0, IMPLVEC)
++DEF(smin_vec, 1, 2, 0, IMPLVEC)
++DEF(umin_vec, 1, 2, 0, IMPLVEC)
++DEF(smax_vec, 1, 2, 0, IMPLVEC)
++DEF(umax_vec, 1, 2, 0, IMPLVEC)
+ DEF(and_vec, 1, 2, 0, IMPLVEC)
+ DEF(or_vec, 1, 2, 0, IMPLVEC)
+ DEF(xor_vec, 1, 2, 0, IMPLVEC)
+-DEF(andc_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_andc_vec))
+-DEF(orc_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_orc_vec))
+-DEF(nand_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_nand_vec))
+-DEF(nor_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_nor_vec))
+-DEF(eqv_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_eqv_vec))
+-DEF(not_vec, 1, 1, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_not_vec))
++DEF(andc_vec, 1, 2, 0, IMPLVEC)
++DEF(orc_vec, 1, 2, 0, IMPLVEC)
++DEF(nand_vec, 1, 2, 0, IMPLVEC)
++DEF(nor_vec, 1, 2, 0, IMPLVEC)
++DEF(eqv_vec, 1, 2, 0, IMPLVEC)
++DEF(not_vec, 1, 1, 0, IMPLVEC)
+-DEF(shli_vec, 1, 1, 1, IMPLVEC | IMPL(TCG_TARGET_HAS_shi_vec))
+-DEF(shri_vec, 1, 1, 1, IMPLVEC | IMPL(TCG_TARGET_HAS_shi_vec))
+-DEF(sari_vec, 1, 1, 1, IMPLVEC | IMPL(TCG_TARGET_HAS_shi_vec))
+-DEF(rotli_vec, 1, 1, 1, IMPLVEC | IMPL(TCG_TARGET_HAS_roti_vec))
++DEF(shli_vec, 1, 1, 1, IMPLVEC)
++DEF(shri_vec, 1, 1, 1, IMPLVEC)
++DEF(sari_vec, 1, 1, 1, IMPLVEC)
++DEF(rotli_vec, 1, 1, 1, IMPLVEC)
+-DEF(shls_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_shs_vec))
+-DEF(shrs_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_shs_vec))
+-DEF(sars_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_shs_vec))
+-DEF(rotls_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_rots_vec))
++DEF(shls_vec, 1, 2, 0, IMPLVEC)
++DEF(shrs_vec, 1, 2, 0, IMPLVEC)
++DEF(sars_vec, 1, 2, 0, IMPLVEC)
++DEF(rotls_vec, 1, 2, 0, IMPLVEC)
+-DEF(shlv_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_shv_vec))
+-DEF(shrv_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_shv_vec))
+-DEF(sarv_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_shv_vec))
+-DEF(rotlv_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_rotv_vec))
+-DEF(rotrv_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_rotv_vec))
++DEF(shlv_vec, 1, 2, 0, IMPLVEC)
++DEF(shrv_vec, 1, 2, 0, IMPLVEC)
++DEF(sarv_vec, 1, 2, 0, IMPLVEC)
++DEF(rotlv_vec, 1, 2, 0, IMPLVEC)
++DEF(rotrv_vec, 1, 2, 0, IMPLVEC)
+ DEF(cmp_vec, 1, 2, 1, IMPLVEC)
+-DEF(bitsel_vec, 1, 3, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_bitsel_vec))
+-DEF(cmpsel_vec, 1, 4, 1, IMPLVEC | IMPL(TCG_TARGET_HAS_cmpsel_vec))
++DEF(bitsel_vec, 1, 3, 0, IMPLVEC)
++DEF(cmpsel_vec, 1, 4, 1, IMPLVEC)
+ DEF(last_generic, 0, 0, 0, TCG_OPF_NOT_PRESENT)
+ #include "tcg-target-opc.h.inc"
+ #undef DATA64_ARGS
+-#undef IMPL
+-#undef IMPL64
+ #undef IMPLVEC
+ #undef DEF
+--
+.43.0

-New patch
+[PULL 45/68] tcg: Replace IMPLVEC with TCG_OPF_VECTOR
+This is now a direct replacement.
 Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 ---
  include/tcg/tcg-opc.h            | 89 +++++++++++++++-----------------
  tcg/aarch64/tcg-target-opc.h.inc |  4 +-
  tcg/arm/tcg-target-opc.h.inc     |  6 +--
  tcg/i386/tcg-target-opc.h.inc    | 22 ++++----
  tcg/ppc/tcg-target-opc.h.inc     | 12 ++---
  tcg/s390x/tcg-target-opc.h.inc   |  6 +--
 files changed, 68 insertions(+), 71 deletions(-)
 diff --git a/include/tcg/tcg-opc.h b/include/tcg/tcg-opc.h
 index XXXXXXX..XXXXXXX 100644
 --- a/include/tcg/tcg-opc.h
 +++ b/include/tcg/tcg-opc.h
@@ -XXX,XX +XXX,XX @@ DEF(qemu_st_a64_i128, 0, 3, 1, TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS)
  /* Host vector support.  */
 -#define IMPLVEC  TCG_OPF_VECTOR
 -
  DEF(mov_vec, 1, 1, 0, TCG_OPF_VECTOR | TCG_OPF_NOT_PRESENT)
 -DEF(dup_vec, 1, 1, 0, IMPLVEC)
 -DEF(dup2_vec, 1, 2, 0, IMPLVEC)
 +DEF(dup_vec, 1, 1, 0, TCG_OPF_VECTOR)
 +DEF(dup2_vec, 1, 2, 0, TCG_OPF_VECTOR)
 -DEF(ld_vec, 1, 1, 1, IMPLVEC)
 -DEF(st_vec, 0, 2, 1, IMPLVEC)
 -DEF(dupm_vec, 1, 1, 1, IMPLVEC)
 +DEF(ld_vec, 1, 1, 1, TCG_OPF_VECTOR)
 +DEF(st_vec, 0, 2, 1, TCG_OPF_VECTOR)
 +DEF(dupm_vec, 1, 1, 1, TCG_OPF_VECTOR)
 -DEF(add_vec, 1, 2, 0, IMPLVEC)
 -DEF(sub_vec, 1, 2, 0, IMPLVEC)
 -DEF(mul_vec, 1, 2, 0, IMPLVEC)
 -DEF(neg_vec, 1, 1, 0, IMPLVEC)
 -DEF(abs_vec, 1, 1, 0, IMPLVEC)
 -DEF(ssadd_vec, 1, 2, 0, IMPLVEC)
 -DEF(usadd_vec, 1, 2, 0, IMPLVEC)
 -DEF(sssub_vec, 1, 2, 0, IMPLVEC)
 -DEF(ussub_vec, 1, 2, 0, IMPLVEC)
 -DEF(smin_vec, 1, 2, 0, IMPLVEC)
 -DEF(umin_vec, 1, 2, 0, IMPLVEC)
 -DEF(smax_vec, 1, 2, 0, IMPLVEC)
 -DEF(umax_vec, 1, 2, 0, IMPLVEC)
 +DEF(add_vec, 1, 2, 0, TCG_OPF_VECTOR)
 +DEF(sub_vec, 1, 2, 0, TCG_OPF_VECTOR)
 +DEF(mul_vec, 1, 2, 0, TCG_OPF_VECTOR)
 +DEF(neg_vec, 1, 1, 0, TCG_OPF_VECTOR)
 +DEF(abs_vec, 1, 1, 0, TCG_OPF_VECTOR)
 +DEF(ssadd_vec, 1, 2, 0, TCG_OPF_VECTOR)
 +DEF(usadd_vec, 1, 2, 0, TCG_OPF_VECTOR)
 +DEF(sssub_vec, 1, 2, 0, TCG_OPF_VECTOR)
 +DEF(ussub_vec, 1, 2, 0, TCG_OPF_VECTOR)
 +DEF(smin_vec, 1, 2, 0, TCG_OPF_VECTOR)
 +DEF(umin_vec, 1, 2, 0, TCG_OPF_VECTOR)
 +DEF(smax_vec, 1, 2, 0, TCG_OPF_VECTOR)
 +DEF(umax_vec, 1, 2, 0, TCG_OPF_VECTOR)
 -DEF(and_vec, 1, 2, 0, IMPLVEC)
 -DEF(or_vec, 1, 2, 0, IMPLVEC)
 -DEF(xor_vec, 1, 2, 0, IMPLVEC)
 -DEF(andc_vec, 1, 2, 0, IMPLVEC)
 -DEF(orc_vec, 1, 2, 0, IMPLVEC)
 -DEF(nand_vec, 1, 2, 0, IMPLVEC)
 -DEF(nor_vec, 1, 2, 0, IMPLVEC)
 -DEF(eqv_vec, 1, 2, 0, IMPLVEC)
 -DEF(not_vec, 1, 1, 0, IMPLVEC)
 +DEF(and_vec, 1, 2, 0, TCG_OPF_VECTOR)
 +DEF(or_vec, 1, 2, 0, TCG_OPF_VECTOR)
 +DEF(xor_vec, 1, 2, 0, TCG_OPF_VECTOR)
 +DEF(andc_vec, 1, 2, 0, TCG_OPF_VECTOR)
 +DEF(orc_vec, 1, 2, 0, TCG_OPF_VECTOR)
 +DEF(nand_vec, 1, 2, 0, TCG_OPF_VECTOR)
 +DEF(nor_vec, 1, 2, 0, TCG_OPF_VECTOR)
 +DEF(eqv_vec, 1, 2, 0, TCG_OPF_VECTOR)
 +DEF(not_vec, 1, 1, 0, TCG_OPF_VECTOR)
 -DEF(shli_vec, 1, 1, 1, IMPLVEC)
 -DEF(shri_vec, 1, 1, 1, IMPLVEC)
 -DEF(sari_vec, 1, 1, 1, IMPLVEC)
 -DEF(rotli_vec, 1, 1, 1, IMPLVEC)
 +DEF(shli_vec, 1, 1, 1, TCG_OPF_VECTOR)
 +DEF(shri_vec, 1, 1, 1, TCG_OPF_VECTOR)
 +DEF(sari_vec, 1, 1, 1, TCG_OPF_VECTOR)
 +DEF(rotli_vec, 1, 1, 1, TCG_OPF_VECTOR)
 -DEF(shls_vec, 1, 2, 0, IMPLVEC)
 -DEF(shrs_vec, 1, 2, 0, IMPLVEC)
 -DEF(sars_vec, 1, 2, 0, IMPLVEC)
 -DEF(rotls_vec, 1, 2, 0, IMPLVEC)
 +DEF(shls_vec, 1, 2, 0, TCG_OPF_VECTOR)
 +DEF(shrs_vec, 1, 2, 0, TCG_OPF_VECTOR)
 +DEF(sars_vec, 1, 2, 0, TCG_OPF_VECTOR)
 +DEF(rotls_vec, 1, 2, 0, TCG_OPF_VECTOR)
 -DEF(shlv_vec, 1, 2, 0, IMPLVEC)
 -DEF(shrv_vec, 1, 2, 0, IMPLVEC)
 -DEF(sarv_vec, 1, 2, 0, IMPLVEC)
 -DEF(rotlv_vec, 1, 2, 0, IMPLVEC)
 -DEF(rotrv_vec, 1, 2, 0, IMPLVEC)
 +DEF(shlv_vec, 1, 2, 0, TCG_OPF_VECTOR)
 +DEF(shrv_vec, 1, 2, 0, TCG_OPF_VECTOR)
 +DEF(sarv_vec, 1, 2, 0, TCG_OPF_VECTOR)
 +DEF(rotlv_vec, 1, 2, 0, TCG_OPF_VECTOR)
 +DEF(rotrv_vec, 1, 2, 0, TCG_OPF_VECTOR)
 -DEF(cmp_vec, 1, 2, 1, IMPLVEC)
 +DEF(cmp_vec, 1, 2, 1, TCG_OPF_VECTOR)
 -DEF(bitsel_vec, 1, 3, 0, IMPLVEC)
 -DEF(cmpsel_vec, 1, 4, 1, IMPLVEC)
 +DEF(bitsel_vec, 1, 3, 0, TCG_OPF_VECTOR)
 +DEF(cmpsel_vec, 1, 4, 1, TCG_OPF_VECTOR)
  DEF(last_generic, 0, 0, 0, TCG_OPF_NOT_PRESENT)
  #include "tcg-target-opc.h.inc"
  #undef DATA64_ARGS
 -#undef IMPLVEC
  #undef DEF
 diff --git a/tcg/aarch64/tcg-target-opc.h.inc b/tcg/aarch64/tcg-target-opc.h.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/aarch64/tcg-target-opc.h.inc
 +++ b/tcg/aarch64/tcg-target-opc.h.inc
@@ -XXX,XX +XXX,XX @@
   * consider these to be UNSPEC with names.
   */
 -DEF(aa64_sshl_vec, 1, 2, 0, IMPLVEC)
 -DEF(aa64_sli_vec, 1, 2, 1, IMPLVEC)
 +DEF(aa64_sshl_vec, 1, 2, 0, TCG_OPF_VECTOR)
 +DEF(aa64_sli_vec, 1, 2, 1, TCG_OPF_VECTOR)
 diff --git a/tcg/arm/tcg-target-opc.h.inc b/tcg/arm/tcg-target-opc.h.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/arm/tcg-target-opc.h.inc
 +++ b/tcg/arm/tcg-target-opc.h.inc
@@ -XXX,XX +XXX,XX @@
   * consider these to be UNSPEC with names.
   */
 -DEF(arm_sli_vec, 1, 2, 1, IMPLVEC)
 -DEF(arm_sshl_vec, 1, 2, 0, IMPLVEC)
 -DEF(arm_ushl_vec, 1, 2, 0, IMPLVEC)
 +DEF(arm_sli_vec, 1, 2, 1, TCG_OPF_VECTOR)
 +DEF(arm_sshl_vec, 1, 2, 0, TCG_OPF_VECTOR)
 +DEF(arm_ushl_vec, 1, 2, 0, TCG_OPF_VECTOR)
 diff --git a/tcg/i386/tcg-target-opc.h.inc b/tcg/i386/tcg-target-opc.h.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/i386/tcg-target-opc.h.inc
 +++ b/tcg/i386/tcg-target-opc.h.inc
@@ -XXX,XX +XXX,XX @@
   * consider these to be UNSPEC with names.
   */
 -DEF(x86_shufps_vec, 1, 2, 1, IMPLVEC)
 -DEF(x86_blend_vec, 1, 2, 1, IMPLVEC)
 -DEF(x86_packss_vec, 1, 2, 0, IMPLVEC)
 -DEF(x86_packus_vec, 1, 2, 0, IMPLVEC)
 -DEF(x86_psrldq_vec, 1, 1, 1, IMPLVEC)
 -DEF(x86_vperm2i128_vec, 1, 2, 1, IMPLVEC)
 -DEF(x86_punpckl_vec, 1, 2, 0, IMPLVEC)
 -DEF(x86_punpckh_vec, 1, 2, 0, IMPLVEC)
 -DEF(x86_vpshldi_vec, 1, 2, 1, IMPLVEC)
 -DEF(x86_vpshldv_vec, 1, 3, 0, IMPLVEC)
 -DEF(x86_vpshrdv_vec, 1, 3, 0, IMPLVEC)
 +DEF(x86_shufps_vec, 1, 2, 1, TCG_OPF_VECTOR)
 +DEF(x86_blend_vec, 1, 2, 1, TCG_OPF_VECTOR)
 +DEF(x86_packss_vec, 1, 2, 0, TCG_OPF_VECTOR)
 +DEF(x86_packus_vec, 1, 2, 0, TCG_OPF_VECTOR)
 +DEF(x86_psrldq_vec, 1, 1, 1, TCG_OPF_VECTOR)
 +DEF(x86_vperm2i128_vec, 1, 2, 1, TCG_OPF_VECTOR)
 +DEF(x86_punpckl_vec, 1, 2, 0, TCG_OPF_VECTOR)
 +DEF(x86_punpckh_vec, 1, 2, 0, TCG_OPF_VECTOR)
 +DEF(x86_vpshldi_vec, 1, 2, 1, TCG_OPF_VECTOR)
 +DEF(x86_vpshldv_vec, 1, 3, 0, TCG_OPF_VECTOR)
 +DEF(x86_vpshrdv_vec, 1, 3, 0, TCG_OPF_VECTOR)
 diff --git a/tcg/ppc/tcg-target-opc.h.inc b/tcg/ppc/tcg-target-opc.h.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/ppc/tcg-target-opc.h.inc
 +++ b/tcg/ppc/tcg-target-opc.h.inc
@@ -XXX,XX +XXX,XX @@
   * consider these to be UNSPEC with names.
   */
 -DEF(ppc_mrgh_vec, 1, 2, 0, IMPLVEC)
 -DEF(ppc_mrgl_vec, 1, 2, 0, IMPLVEC)
 -DEF(ppc_msum_vec, 1, 3, 0, IMPLVEC)
 -DEF(ppc_muleu_vec, 1, 2, 0, IMPLVEC)
 -DEF(ppc_mulou_vec, 1, 2, 0, IMPLVEC)
 -DEF(ppc_pkum_vec, 1, 2, 0, IMPLVEC)
 +DEF(ppc_mrgh_vec, 1, 2, 0, TCG_OPF_VECTOR)
 +DEF(ppc_mrgl_vec, 1, 2, 0, TCG_OPF_VECTOR)
 +DEF(ppc_msum_vec, 1, 3, 0, TCG_OPF_VECTOR)
 +DEF(ppc_muleu_vec, 1, 2, 0, TCG_OPF_VECTOR)
 +DEF(ppc_mulou_vec, 1, 2, 0, TCG_OPF_VECTOR)
 +DEF(ppc_pkum_vec, 1, 2, 0, TCG_OPF_VECTOR)
 diff --git a/tcg/s390x/tcg-target-opc.h.inc b/tcg/s390x/tcg-target-opc.h.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/s390x/tcg-target-opc.h.inc
 +++ b/tcg/s390x/tcg-target-opc.h.inc
@@ -XXX,XX +XXX,XX @@
   * emitted by tcg_expand_vec_op.  For those familiar with GCC internals,
   * consider these to be UNSPEC with names.
   */
 -DEF(s390_vuph_vec, 1, 1, 0, IMPLVEC)
 -DEF(s390_vupl_vec, 1, 1, 0, IMPLVEC)
 -DEF(s390_vpks_vec, 1, 2, 0, IMPLVEC)
 +DEF(s390_vuph_vec, 1, 1, 0, TCG_OPF_VECTOR)
 +DEF(s390_vupl_vec, 1, 1, 0, TCG_OPF_VECTOR)
 +DEF(s390_vpks_vec, 1, 2, 0, TCG_OPF_VECTOR)
 --
 .43.0

-[PULL 39/40] target/i386: Inline cmpxchg16b
+[PULL 46/68] tcg/mips: Expand bswap unconditionally
-Use tcg_gen_atomic_cmpxchg_i128 for the atomic case,
+We always provide bswap subroutines, whether they are optimized
-and tcg_gen_qemu_ld/st_i128 otherwise.
+using mips32r2 when available or not.
 Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 ---
- target/i386/helper.h         |  4 ---
+ tcg/mips/tcg-target-has.h | 8 ++++----
- target/i386/tcg/mem_helper.c | 69 ------------------------------------
+file changed, 4 insertions(+), 4 deletions(-)
  target/i386/tcg/translate.c  | 44 ++++++++++++++++++++---
 files changed, 39 insertions(+), 78 deletions(-)
-diff --git a/target/i386/helper.h b/target/i386/helper.h
+diff --git a/tcg/mips/tcg-target-has.h b/tcg/mips/tcg-target-has.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/i386/helper.h
+--- a/tcg/mips/tcg-target-has.h
-+++ b/target/i386/helper.h
++++ b/tcg/mips/tcg-target-has.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_1(rsm, void, env)
+@@ -XXX,XX +XXX,XX @@ extern bool use_mips32r2_instructions;
- #endif /* !CONFIG_USER_ONLY */
+ #define TCG_TARGET_HAS_muls2_i32        (!use_mips32r6_instructions)
+ #define TCG_TARGET_HAS_muluh_i32        1
- DEF_HELPER_2(into, void, env, int)
+ #define TCG_TARGET_HAS_mulsh_i32        1
--#ifdef TARGET_X86_64
++#define TCG_TARGET_HAS_bswap16_i32      1
--DEF_HELPER_2(cmpxchg16b_unlocked, void, env, tl)
+ #define TCG_TARGET_HAS_bswap32_i32      1
--DEF_HELPER_2(cmpxchg16b, void, env, tl)
+ #define TCG_TARGET_HAS_negsetcond_i32   0
--#endif
- DEF_HELPER_FLAGS_1(single_step, TCG_CALL_NO_WG, noreturn, env)
+@@ -XXX,XX +XXX,XX @@ extern bool use_mips32r2_instructions;
  DEF_HELPER_1(rechecking_single_step, void, env)
  DEF_HELPER_1(cpuid, void, env)
 diff --git a/target/i386/tcg/mem_helper.c b/target/i386/tcg/mem_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/i386/tcg/mem_helper.c
 +++ b/target/i386/tcg/mem_helper.c
@@ -XXX,XX +XXX,XX @@
  #include "tcg/tcg.h"
  #include "helper-tcg.h"
 -#ifdef TARGET_X86_64
 -void helper_cmpxchg16b_unlocked(CPUX86State *env, target_ulong a0)
 -{
 -    uintptr_t ra = GETPC();
 -    Int128 oldv, cmpv, newv;
 -    uint64_t o0, o1;
 -    int eflags;
 -    bool success;
 -
 -    if ((a0 & 0xf) != 0) {
 -        raise_exception_ra(env, EXCP0D_GPF, GETPC());
 -    }
 -    eflags = cpu_cc_compute_all(env, CC_OP);
 -
 -    cmpv = int128_make128(env->regs[R_EAX], env->regs[R_EDX]);
 -    newv = int128_make128(env->regs[R_EBX], env->regs[R_ECX]);
 -
 -    o0 = cpu_ldq_data_ra(env, a0 + 0, ra);
 -    o1 = cpu_ldq_data_ra(env, a0 + 8, ra);
 -
 -    oldv = int128_make128(o0, o1);
 -    success = int128_eq(oldv, cmpv);
 -    if (!success) {
 -        newv = oldv;
 -    }
 -
 -    cpu_stq_data_ra(env, a0 + 0, int128_getlo(newv), ra);
 -    cpu_stq_data_ra(env, a0 + 8, int128_gethi(newv), ra);
 -
 -    if (success) {
 -        eflags |= CC_Z;
 -    } else {
 -        env->regs[R_EAX] = int128_getlo(oldv);
 -        env->regs[R_EDX] = int128_gethi(oldv);
 -        eflags &= ~CC_Z;
 -    }
 -    CC_SRC = eflags;
 -}
 -
 -void helper_cmpxchg16b(CPUX86State *env, target_ulong a0)
 -{
 -    uintptr_t ra = GETPC();
 -
 -    if ((a0 & 0xf) != 0) {
 -        raise_exception_ra(env, EXCP0D_GPF, ra);
 -    } else if (HAVE_CMPXCHG128) {
 -        int eflags = cpu_cc_compute_all(env, CC_OP);
 -
 -        Int128 cmpv = int128_make128(env->regs[R_EAX], env->regs[R_EDX]);
 -        Int128 newv = int128_make128(env->regs[R_EBX], env->regs[R_ECX]);
 -
 -        int mem_idx = cpu_mmu_index(env, false);
 -        MemOpIdx oi = make_memop_idx(MO_TE | MO_128 | MO_ALIGN, mem_idx);
 -        Int128 oldv = cpu_atomic_cmpxchgo_le_mmu(env, a0, cmpv, newv, oi, ra);
 -
 -        if (int128_eq(oldv, cmpv)) {
 -            eflags |= CC_Z;
 -        } else {
 -            env->regs[R_EAX] = int128_getlo(oldv);
 -            env->regs[R_EDX] = int128_gethi(oldv);
 -            eflags &= ~CC_Z;
 -        }
 -        CC_SRC = eflags;
 -    } else {
 -        cpu_loop_exit_atomic(env_cpu(env), ra);
 -    }
 -}
 -#endif
 -
  void helper_boundw(CPUX86State *env, target_ulong a0, int v)
  {
      int low, high;
 diff --git a/target/i386/tcg/translate.c b/target/i386/tcg/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/i386/tcg/translate.c
 +++ b/target/i386/tcg/translate.c
@@ -XXX,XX +XXX,XX @@ static void gen_cmpxchg8b(DisasContext *s, CPUX86State *env, int modrm)
  #ifdef TARGET_X86_64
  static void gen_cmpxchg16b(DisasContext *s, CPUX86State *env, int modrm)
  {
 +    MemOp mop = MO_TE | MO_128 | MO_ALIGN;
 +    TCGv_i64 t0, t1;
 +    TCGv_i128 cmp, val;
 +
      gen_lea_modrm(env, s, modrm);
 -    if ((s->prefix & PREFIX_LOCK) &&
 -        (tb_cflags(s->base.tb) & CF_PARALLEL)) {
 -        gen_helper_cmpxchg16b(cpu_env, s->A0);
 +    cmp = tcg_temp_new_i128();
 +    val = tcg_temp_new_i128();
 +    tcg_gen_concat_i64_i128(cmp, cpu_regs[R_EAX], cpu_regs[R_EDX]);
 +    tcg_gen_concat_i64_i128(val, cpu_regs[R_EBX], cpu_regs[R_ECX]);
 +
 +    /* Only require atomic with LOCK; non-parallel handled in generator. */
 +    if (s->prefix & PREFIX_LOCK) {
 +        tcg_gen_atomic_cmpxchg_i128(val, s->A0, cmp, val, s->mem_index, mop);
      } else {
 -        gen_helper_cmpxchg16b_unlocked(cpu_env, s->A0);
 +        tcg_gen_nonatomic_cmpxchg_i128(val, s->A0, cmp, val, s->mem_index, mop);
      }
 -    set_cc_op(s, CC_OP_EFLAGS);
 +
 +    tcg_gen_extr_i128_i64(s->T0, s->T1, val);
 +    tcg_temp_free_i128(cmp);
 +    tcg_temp_free_i128(val);
 +
 +    /* Determine success after the fact. */
 +    t0 = tcg_temp_new_i64();
 +    t1 = tcg_temp_new_i64();
 +    tcg_gen_xor_i64(t0, s->T0, cpu_regs[R_EAX]);
 +    tcg_gen_xor_i64(t1, s->T1, cpu_regs[R_EDX]);
 +    tcg_gen_or_i64(t0, t0, t1);
 +    tcg_temp_free_i64(t1);
 +
 +    /* Update Z. */
 +    gen_compute_eflags(s);
 +    tcg_gen_setcondi_i64(TCG_COND_EQ, t0, t0, 0);
 +    tcg_gen_deposit_tl(cpu_cc_src, cpu_cc_src, t0, ctz32(CC_Z), 1);
 +    tcg_temp_free_i64(t0);
 +
 +    /*
 +     * Extract the result values for the register pair.  We may do this
 +     * unconditionally, because on success (Z=1), the old value matches
 +     * the previous value in RDX:RAX.
 +     */
 +    tcg_gen_mov_i64(cpu_regs[R_EAX], s->T0);
 +    tcg_gen_mov_i64(cpu_regs[R_EDX], s->T1);
  }
  #endif
+ /* optional instructions detected at runtime */
+-#define TCG_TARGET_HAS_bswap16_i32      use_mips32r2_instructions
+ #define TCG_TARGET_HAS_deposit_i32      use_mips32r2_instructions
+ #define TCG_TARGET_HAS_extract_i32      use_mips32r2_instructions
+ #define TCG_TARGET_HAS_sextract_i32     0
+@@ -XXX,XX +XXX,XX @@ extern bool use_mips32r2_instructions;
+ #define TCG_TARGET_HAS_qemu_st8_i32     0
+ #if TCG_TARGET_REG_BITS == 64
+-#define TCG_TARGET_HAS_bswap16_i64      use_mips32r2_instructions
+-#define TCG_TARGET_HAS_bswap32_i64      use_mips32r2_instructions
+-#define TCG_TARGET_HAS_bswap64_i64      use_mips32r2_instructions
++#define TCG_TARGET_HAS_bswap16_i64      1
++#define TCG_TARGET_HAS_bswap32_i64      1
++#define TCG_TARGET_HAS_bswap64_i64      1
+ #define TCG_TARGET_HAS_deposit_i64      use_mips32r2_instructions
+ #define TCG_TARGET_HAS_extract_i64      use_mips32r2_instructions
+ #define TCG_TARGET_HAS_sextract_i64     0
 --
-.34.1
+.43.0

-[PULL 31/40] target/s390x: Use Int128 for return from TRE
+[PULL 47/68] tcg/i386: Handle all 8-bit extensions for i686
-Acked-by: Ilya Leoshkevich <iii@linux.ibm.com>
+When we generalize {s}extract_i32, we'll lose the
 specific register constraints on ext8u and ext8s.
 It's just as easy to emit a couple of insns instead.
 Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 ---
- target/s390x/helper.h         | 2 +-
+ tcg/i386/tcg-target.c.inc | 23 +++++++++++++++++++----
- target/s390x/tcg/mem_helper.c | 7 +++----
+file changed, 19 insertions(+), 4 deletions(-)
  target/s390x/tcg/translate.c  | 7 +++++--
 files changed, 9 insertions(+), 7 deletions(-)
-diff --git a/target/s390x/helper.h b/target/s390x/helper.h
+diff --git a/tcg/i386/tcg-target.c.inc b/tcg/i386/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
---- a/target/s390x/helper.h
+--- a/tcg/i386/tcg-target.c.inc
-+++ b/target/s390x/helper.h
++++ b/tcg/i386/tcg-target.c.inc
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(unpka, TCG_CALL_NO_WG, i32, env, i64, i32, i64)
+@@ -XXX,XX +XXX,XX @@ static inline void tcg_out_rolw_8(TCGContext *s, int reg)
- DEF_HELPER_FLAGS_4(unpku, TCG_CALL_NO_WG, i32, env, i64, i32, i64)
- DEF_HELPER_FLAGS_3(tp, TCG_CALL_NO_WG, i32, env, i64, i32)
+ static void tcg_out_ext8u(TCGContext *s, TCGReg dest, TCGReg src)
- DEF_HELPER_FLAGS_4(tr, TCG_CALL_NO_WG, void, env, i32, i64, i64)
+ {
--DEF_HELPER_4(tre, i64, env, i64, i64, i64)
+-    /* movzbl */
-+DEF_HELPER_4(tre, i128, env, i64, i64, i64)
+-    tcg_debug_assert(src < 4 || TCG_TARGET_REG_BITS == 64);
- DEF_HELPER_4(trt, i32, env, i32, i64, i64)
++    if (TCG_TARGET_REG_BITS == 32 && src >= 4) {
- DEF_HELPER_4(trtr, i32, env, i32, i64, i64)
++        tcg_out_mov(s, TCG_TYPE_I32, dest, src);
- DEF_HELPER_5(trXX, i32, env, i32, i32, i32, i32)
++        if (dest >= 4) {
-diff --git a/target/s390x/tcg/mem_helper.c b/target/s390x/tcg/mem_helper.c
++            tcg_out_modrm(s, OPC_ARITH_EvIz, ARITH_AND, dest);
-index XXXXXXX..XXXXXXX 100644
++            tcg_out32(s, 0xff);
---- a/target/s390x/tcg/mem_helper.c
++            return;
-+++ b/target/s390x/tcg/mem_helper.c
++        }
-@@ -XXX,XX +XXX,XX @@ void HELPER(tr)(CPUS390XState *env, uint32_t len, uint64_t array,
++        src = dest;
-     do_helper_tr(env, len, array, trans, GETPC());
++    }
      tcg_out_modrm(s, OPC_MOVZBL + P_REXB_RM, dest, src);
  }
--uint64_t HELPER(tre)(CPUS390XState *env, uint64_t array,
+ static void tcg_out_ext8s(TCGContext *s, TCGType type, TCGReg dest, TCGReg src)
 -                     uint64_t len, uint64_t trans)
 +Int128 HELPER(tre)(CPUS390XState *env, uint64_t array,
 +                   uint64_t len, uint64_t trans)
  {
-     uintptr_t ra = GETPC();
+     int rexw = type == TCG_TYPE_I32 ? 0 : P_REXW;
-     uint8_t end = env->regs[0] & 0xff;
+-    /* movsbl */
-@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(tre)(CPUS390XState *env, uint64_t array,
+-    tcg_debug_assert(src < 4 || TCG_TARGET_REG_BITS == 64);
-     }
++
++    if (TCG_TARGET_REG_BITS == 32 && src >= 4) {
-     env->cc_op = cc;
++        tcg_out_mov(s, TCG_TYPE_I32, dest, src);
--    env->retxl = len - i;
++        if (dest >= 4) {
--    return array + i;
++            tcg_out_shifti(s, SHIFT_SHL, dest, 24);
-+    return int128_make128(len - i, array + i);
++            tcg_out_shifti(s, SHIFT_SAR, dest, 24);
 +            return;
 +        }
 +        src = dest;
 +    }
      tcg_out_modrm(s, OPC_MOVSBL + P_REXB_RM + rexw, dest, src);
  }
- static inline uint32_t do_helper_trt(CPUS390XState *env, int len,
-diff --git a/target/s390x/tcg/translate.c b/target/s390x/tcg/translate.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/s390x/tcg/translate.c
-+++ b/target/s390x/tcg/translate.c
-@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_tr(DisasContext *s, DisasOps *o)
- static DisasJumpType op_tre(DisasContext *s, DisasOps *o)
- {
--    gen_helper_tre(o->out, cpu_env, o->out, o->out2, o->in2);
--    return_low128(o->out2);
-+    TCGv_i128 pair = tcg_temp_new_i128();
-+
-+    gen_helper_tre(pair, cpu_env, o->out, o->out2, o->in2);
-+    tcg_gen_extr_i128_i64(o->out2, o->out, pair);
-+    tcg_temp_free_i128(pair);
-     set_cc_static(s);
-     return DISAS_NEXT;
- }
 --
-.34.1
+.43.0

-New patch
+[PULL 48/68] tcg/i386: Fold the ext{8, 16, 32}[us] cases into {s}extract
+Accept byte and word extensions with the extract opcodes.
 This is preparatory to removing the specialized extracts.
 Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 ---
  tcg/i386/tcg-target-has.h | 49 +++++++++++++++++++++++++++----
  tcg/tcg-has.h             | 12 +++++---
  tcg/optimize.c            |  8 +++--
  tcg/tcg-op.c              | 12 +++-----
  tcg/i386/tcg-target.c.inc | 62 +++++++++++++++++++++++++++++----------
 files changed, 107 insertions(+), 36 deletions(-)
 diff --git a/tcg/i386/tcg-target-has.h b/tcg/i386/tcg-target-has.h
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/i386/tcg-target-has.h
 +++ b/tcg/i386/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@
  #define TCG_TARGET_HAS_ctpop_i64        have_popcnt
  #define TCG_TARGET_HAS_deposit_i64      1
  #define TCG_TARGET_HAS_extract_i64      1
 -#define TCG_TARGET_HAS_sextract_i64     0
 +#define TCG_TARGET_HAS_sextract_i64     1
  #define TCG_TARGET_HAS_extract2_i64     1
  #define TCG_TARGET_HAS_negsetcond_i64   1
  #define TCG_TARGET_HAS_add2_i64         1
@@ -XXX,XX +XXX,XX @@
       (TCG_TARGET_REG_BITS == 32 && (ofs) == 8 && (len) == 8))
  #define TCG_TARGET_deposit_i64_valid    TCG_TARGET_deposit_i32_valid
 -/* Check for the possibility of high-byte extraction and, for 64-bit,
 -   zero-extending 32-bit right-shift.  */
 -#define TCG_TARGET_extract_i32_valid(ofs, len) ((ofs) == 8 && (len) == 8)
 -#define TCG_TARGET_extract_i64_valid(ofs, len) \
 -    (((ofs) == 8 && (len) == 8) || ((ofs) + (len)) == 32)
 +/*
 + * Check for the possibility of low byte/word extraction, high-byte extraction
 + * and zero-extending 32-bit right-shift.
 + *
 + * We cannot sign-extend from high byte to 64-bits without using the
 + * REX prefix that explicitly excludes access to the high-byte registers.
 + */
 +static inline bool
 +tcg_target_sextract_valid(TCGType type, unsigned ofs, unsigned len)
 +{
 +    switch (ofs) {
 +    case 0:
 +        switch (len) {
 +        case 8:
 +        case 16:
 +            return true;
 +        case 32:
 +            return type == TCG_TYPE_I64;
 +        }
 +        return false;
 +    case 8:
 +        return len == 8 && type == TCG_TYPE_I32;
 +    }
 +    return false;
 +}
 +#define TCG_TARGET_sextract_valid  tcg_target_sextract_valid
 +
 +static inline bool
 +tcg_target_extract_valid(TCGType type, unsigned ofs, unsigned len)
 +{
 +    if (type == TCG_TYPE_I64 && ofs + len == 32) {
 +        return true;
 +    }
 +    switch (ofs) {
 +    case 0:
 +        return len == 8 || len == 16;
 +    case 8:
 +        return len == 8;
 +    }
 +    return false;
 +}
 +#define TCG_TARGET_extract_valid  tcg_target_extract_valid
  #endif
 diff --git a/tcg/tcg-has.h b/tcg/tcg-has.h
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tcg-has.h
 +++ b/tcg/tcg-has.h
@@ -XXX,XX +XXX,XX @@
  #ifndef TCG_TARGET_deposit_i64_valid
  #define TCG_TARGET_deposit_i64_valid(ofs, len) 1
  #endif
 -#ifndef TCG_TARGET_extract_i32_valid
 -#define TCG_TARGET_extract_i32_valid(ofs, len) 1
 +#ifndef TCG_TARGET_extract_valid
 +#define TCG_TARGET_extract_valid(type, ofs, len) \
 +    ((type) == TCG_TYPE_I32 ? TCG_TARGET_HAS_extract_i32 \
 +     : TCG_TARGET_HAS_extract_i64)
  #endif
 -#ifndef TCG_TARGET_extract_i64_valid
 -#define TCG_TARGET_extract_i64_valid(ofs, len) 1
 +#ifndef TCG_TARGET_sextract_valid
 +#define TCG_TARGET_sextract_valid(type, ofs, len) \
 +    ((type) == TCG_TYPE_I32 ? TCG_TARGET_HAS_sextract_i32 \
 +     : TCG_TARGET_HAS_sextract_i64)
  #endif
  /* Only one of DIV or DIV2 should be defined.  */
 diff --git a/tcg/optimize.c b/tcg/optimize.c
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/optimize.c
 +++ b/tcg/optimize.c
@@ -XXX,XX +XXX,XX @@ static void fold_setcond_tst_pow2(OptContext *ctx, TCGOp *op, bool neg)
          xor_opc = INDEX_op_xor_i32;
          shr_opc = INDEX_op_shr_i32;
          neg_opc = INDEX_op_neg_i32;
 -        if (TCG_TARGET_extract_i32_valid(sh, 1)) {
 +        if (TCG_TARGET_extract_valid(TCG_TYPE_I32, sh, 1)) {
              uext_opc = TCG_TARGET_HAS_extract_i32 ? INDEX_op_extract_i32 : 0;
 +        }
 +        if (TCG_TARGET_sextract_valid(TCG_TYPE_I32, sh, 1)) {
              sext_opc = TCG_TARGET_HAS_sextract_i32 ? INDEX_op_sextract_i32 : 0;
          }
          break;
@@ -XXX,XX +XXX,XX @@ static void fold_setcond_tst_pow2(OptContext *ctx, TCGOp *op, bool neg)
          xor_opc = INDEX_op_xor_i64;
          shr_opc = INDEX_op_shr_i64;
          neg_opc = INDEX_op_neg_i64;
 -        if (TCG_TARGET_extract_i64_valid(sh, 1)) {
 +        if (TCG_TARGET_extract_valid(TCG_TYPE_I64, sh, 1)) {
              uext_opc = TCG_TARGET_HAS_extract_i64 ? INDEX_op_extract_i64 : 0;
 +        }
 +        if (TCG_TARGET_sextract_valid(TCG_TYPE_I64, sh, 1)) {
              sext_opc = TCG_TARGET_HAS_sextract_i64 ? INDEX_op_sextract_i64 : 0;
          }
          break;
 diff --git a/tcg/tcg-op.c b/tcg/tcg-op.c
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tcg-op.c
 +++ b/tcg/tcg-op.c
@@ -XXX,XX +XXX,XX @@ void tcg_gen_extract_i32(TCGv_i32 ret, TCGv_i32 arg,
          return;
      }
 -    if (TCG_TARGET_HAS_extract_i32
 -        && TCG_TARGET_extract_i32_valid(ofs, len)) {
 +    if (TCG_TARGET_extract_valid(TCG_TYPE_I32, ofs, len)) {
          tcg_gen_op4ii_i32(INDEX_op_extract_i32, ret, arg, ofs, len);
          return;
      }
@@ -XXX,XX +XXX,XX @@ void tcg_gen_sextract_i32(TCGv_i32 ret, TCGv_i32 arg,
          }
      }
 -    if (TCG_TARGET_HAS_sextract_i32
 -        && TCG_TARGET_extract_i32_valid(ofs, len)) {
 +    if (TCG_TARGET_sextract_valid(TCG_TYPE_I32, ofs, len)) {
          tcg_gen_op4ii_i32(INDEX_op_sextract_i32, ret, arg, ofs, len);
          return;
      }
@@ -XXX,XX +XXX,XX @@ void tcg_gen_extract_i64(TCGv_i64 ret, TCGv_i64 arg,
          goto do_shift_and;
      }
 -    if (TCG_TARGET_HAS_extract_i64
 -        && TCG_TARGET_extract_i64_valid(ofs, len)) {
 +    if (TCG_TARGET_extract_valid(TCG_TYPE_I64, ofs, len)) {
          tcg_gen_op4ii_i64(INDEX_op_extract_i64, ret, arg, ofs, len);
          return;
      }
@@ -XXX,XX +XXX,XX @@ void tcg_gen_sextract_i64(TCGv_i64 ret, TCGv_i64 arg,
          return;
      }
 -    if (TCG_TARGET_HAS_sextract_i64
 -        && TCG_TARGET_extract_i64_valid(ofs, len)) {
 +    if (TCG_TARGET_sextract_valid(TCG_TYPE_I64, ofs, len)) {
          tcg_gen_op4ii_i64(INDEX_op_sextract_i64, ret, arg, ofs, len);
          return;
      }
 diff --git a/tcg/i386/tcg-target.c.inc b/tcg/i386/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/i386/tcg-target.c.inc
 +++ b/tcg/i386/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
      case INDEX_op_extract_i64:
          if (a2 + args[3] == 32) {
 +            if (a2 == 0) {
 +                tcg_out_ext32u(s, a0, a1);
 +                break;
 +            }
              /* This is a 32-bit zero-extending right shift.  */
              tcg_out_mov(s, TCG_TYPE_I32, a0, a1);
              tcg_out_shifti(s, SHIFT_SHR, a0, a2);
@@ -XXX,XX +XXX,XX @@ static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
          }
          /* FALLTHRU */
      case INDEX_op_extract_i32:
 -        /* On the off-chance that we can use the high-byte registers.
 -           Otherwise we emit the same ext16 + shift pattern that we
 -           would have gotten from the normal tcg-op.c expansion.  */
 -        tcg_debug_assert(a2 == 8 && args[3] == 8);
 -        if (a1 < 4 && a0 < 8) {
 -            tcg_out_modrm(s, OPC_MOVZBL, a0, a1 + 4);
 -        } else {
 +        if (a2 == 0 && args[3] == 8) {
 +            tcg_out_ext8u(s, a0, a1);
 +        } else if (a2 == 0 && args[3] == 16) {
              tcg_out_ext16u(s, a0, a1);
 -            tcg_out_shifti(s, SHIFT_SHR, a0, 8);
 +        } else if (a2 == 8 && args[3] == 8) {
 +            /*
 +             * On the off-chance that we can use the high-byte registers.
 +             * Otherwise we emit the same ext16 + shift pattern that we
 +             * would have gotten from the normal tcg-op.c expansion.
 +             */
 +            if (a1 < 4 && a0 < 8) {
 +                tcg_out_modrm(s, OPC_MOVZBL, a0, a1 + 4);
 +            } else {
 +                tcg_out_ext16u(s, a0, a1);
 +                tcg_out_shifti(s, SHIFT_SHR, a0, 8);
 +            }
 +        } else {
 +            g_assert_not_reached();
 +        }
 +        break;
 +
 +    case INDEX_op_sextract_i64:
 +        if (a2 == 0 && args[3] == 8) {
 +            tcg_out_ext8s(s, TCG_TYPE_I64, a0, a1);
 +        } else if (a2 == 0 && args[3] == 16) {
 +            tcg_out_ext16s(s, TCG_TYPE_I64, a0, a1);
 +        } else if (a2 == 0 && args[3] == 32) {
 +            tcg_out_ext32s(s, a0, a1);
 +        } else {
 +            g_assert_not_reached();
          }
          break;
      case INDEX_op_sextract_i32:
 -        /* We don't implement sextract_i64, as we cannot sign-extend to
 -           64-bits without using the REX prefix that explicitly excludes
 -           access to the high-byte registers.  */
 -        tcg_debug_assert(a2 == 8 && args[3] == 8);
 -        if (a1 < 4 && a0 < 8) {
 -            tcg_out_modrm(s, OPC_MOVSBL, a0, a1 + 4);
 -        } else {
 +        if (a2 == 0 && args[3] == 8) {
 +            tcg_out_ext8s(s, TCG_TYPE_I32, a0, a1);
 +        } else if (a2 == 0 && args[3] == 16) {
              tcg_out_ext16s(s, TCG_TYPE_I32, a0, a1);
 -            tcg_out_shifti(s, SHIFT_SAR, a0, 8);
 +        } else if (a2 == 8 && args[3] == 8) {
 +            if (a1 < 4 && a0 < 8) {
 +                tcg_out_modrm(s, OPC_MOVSBL, a0, a1 + 4);
 +            } else {
 +                tcg_out_ext16s(s, TCG_TYPE_I32, a0, a1);
 +                tcg_out_shifti(s, SHIFT_SAR, a0, 8);
 +            }
 +        } else {
 +            g_assert_not_reached();
          }
          break;
@@ -XXX,XX +XXX,XX @@ tcg_target_op_def(TCGOpcode op, TCGType type, unsigned flags)
      case INDEX_op_extract_i32:
      case INDEX_op_extract_i64:
      case INDEX_op_sextract_i32:
 +    case INDEX_op_sextract_i64:
      case INDEX_op_ctpop_i32:
      case INDEX_op_ctpop_i64:
          return C_O1_I1(r, r);
 --
 .43.0

-[PULL 36/40] target/s390x: Implement CC_OP_NZ in gen_op_calc_cc
+[PULL 49/68] tcg/aarch64: Provide TCG_TARGET_{s}extract_valid
-This case is trivial to implement inline.
+Trivially mirrors TCG_TARGET_HAS_{s}extract_*.
-Reviewed-by: David Hildenbrand <david@redhat.com>
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 ---
- target/s390x/tcg/translate.c | 3 +++
+ tcg/aarch64/tcg-target-has.h | 3 +++
 file changed, 3 insertions(+)
-diff --git a/target/s390x/tcg/translate.c b/target/s390x/tcg/translate.c
+diff --git a/tcg/aarch64/tcg-target-has.h b/tcg/aarch64/tcg-target-has.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/s390x/tcg/translate.c
+--- a/tcg/aarch64/tcg-target-has.h
-+++ b/target/s390x/tcg/translate.c
++++ b/tcg/aarch64/tcg-target-has.h
-@@ -XXX,XX +XXX,XX @@ static void gen_op_calc_cc(DisasContext *s)
+@@ -XXX,XX +XXX,XX @@
-         /* env->cc_op already is the cc value */
+ #define TCG_TARGET_HAS_cmpsel_vec       0
-         break;
+ #define TCG_TARGET_HAS_tst_vec          1
-     case CC_OP_NZ:
-+        tcg_gen_setcondi_i64(TCG_COND_NE, cc_dst, cc_dst, 0);
++#define TCG_TARGET_extract_valid(type, ofs, len)   1
-+        tcg_gen_extrl_i64_i32(cc_op, cc_dst);
++#define TCG_TARGET_sextract_valid(type, ofs, len)  1
-+        break;
++
-     case CC_OP_ABS_64:
+ #endif
      case CC_OP_NABS_64:
      case CC_OP_ABS_32:
 --
-.34.1
+.43.0

-[PULL 40/40] tcg/aarch64: Fix patching of LDR in tb_target_set_jmp_target
+[PULL 50/68] tcg/aarch64: Expand extract with offset 0 with andi
-'offset' should be bits [23:5] of LDR instruction, rather than [4:0].
+We're about to change canonicalization of masks as extract
 instead of and.  Retain the andi expansion here.
-Fixes: d59d83a1c388 ("tcg/aarch64: Reorg goto_tb implementation")
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Reviewed-by: Zenghui Yu <yuzenghui@huawei.com>
 Reported-by: Zenghui Yu <yuzenghui@huawei.com>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 ---
- tcg/aarch64/tcg-target.c.inc | 2 +-
+ tcg/aarch64/tcg-target.c.inc | 7 ++++++-
-file changed, 1 insertion(+), 1 deletion(-)
+file changed, 6 insertions(+), 1 deletion(-)
 diff --git a/tcg/aarch64/tcg-target.c.inc b/tcg/aarch64/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/aarch64/tcg-target.c.inc
 +++ b/tcg/aarch64/tcg-target.c.inc
-@@ -XXX,XX +XXX,XX @@ void tb_target_set_jmp_target(const TranslationBlock *tb, int n,
+@@ -XXX,XX +XXX,XX @@ static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType ext,
-         ptrdiff_t i_offset = i_addr - jmp_rx;
+     case INDEX_op_extract_i64:
-         /* Note that we asserted this in range in tcg_out_goto_tb. */
+     case INDEX_op_extract_i32:
--        insn = deposit32(I3305_LDR | TCG_REG_TMP, 0, 5, i_offset >> 2);
+-        tcg_out_ubfm(s, ext, a0, a1, a2, a2 + args[3] - 1);
-+        insn = deposit32(I3305_LDR | TCG_REG_TMP, 5, 19, i_offset >> 2);
++        if (a2 == 0) {
-     }
++            uint64_t mask = MAKE_64BIT_MASK(0, args[3]);
-     qatomic_set((uint32_t *)jmp_rw, insn);
++            tcg_out_logicali(s, I3404_ANDI, ext, a0, a1, mask);
-     flush_idcache_range(jmp_rx, jmp_rw, 4);
++        } else {
 +            tcg_out_ubfm(s, ext, a0, a1, a2, a2 + args[3] - 1);
 +        }
          break;
      case INDEX_op_sextract_i64:
 --
-.34.1
+.43.0

-[PULL 19/40] tcg: Split out tcg_gen_nonatomic_cmpxchg_i{32,64}
+[PULL 51/68] tcg/arm: Add full [US]XT[BH] into {s}extract
-Normally this is automatically handled by the CF_PARALLEL checks
+The armv6 uxt and sxt opcodes have a 2-bit rotate field
-with in tcg_gen_atomic_cmpxchg_i{32,64}, but x86 has a special
+which supports extractions from ofs = {0,8,16,24}.
-case of !PREFIX_LOCK where it always wants the non-atomic version.
+Special case ofs = 0, len <= 8 as AND.
-Split these out so that x86 does not have to roll its own.
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 ---
- include/tcg/tcg-op.h |   4 ++
+ tcg/arm/tcg-target-has.h | 21 ++++++++++++++--
- tcg/tcg-op.c         | 154 +++++++++++++++++++++++++++----------------
+ tcg/arm/tcg-target.c.inc | 54 +++++++++++++++++++++++++++++++++++-----
-files changed, 101 insertions(+), 57 deletions(-)
+files changed, 67 insertions(+), 8 deletions(-)
-diff --git a/include/tcg/tcg-op.h b/include/tcg/tcg-op.h
+diff --git a/tcg/arm/tcg-target-has.h b/tcg/arm/tcg-target-has.h
 index XXXXXXX..XXXXXXX 100644
---- a/include/tcg/tcg-op.h
+--- a/tcg/arm/tcg-target-has.h
-+++ b/include/tcg/tcg-op.h
++++ b/tcg/arm/tcg-target-has.h
-@@ -XXX,XX +XXX,XX @@ void tcg_gen_atomic_cmpxchg_i64(TCGv_i64, TCGv, TCGv_i64, TCGv_i64,
+@@ -XXX,XX +XXX,XX @@ extern bool use_neon_instructions;
- void tcg_gen_atomic_cmpxchg_i128(TCGv_i128, TCGv, TCGv_i128, TCGv_i128,
+ #define TCG_TARGET_HAS_ctz_i32          use_armv7_instructions
-                                  TCGArg, MemOp);
+ #define TCG_TARGET_HAS_ctpop_i32        0
+ #define TCG_TARGET_HAS_deposit_i32      use_armv7_instructions
-+void tcg_gen_nonatomic_cmpxchg_i32(TCGv_i32, TCGv, TCGv_i32, TCGv_i32,
+-#define TCG_TARGET_HAS_extract_i32      use_armv7_instructions
-+                                   TCGArg, MemOp);
+-#define TCG_TARGET_HAS_sextract_i32     use_armv7_instructions
-+void tcg_gen_nonatomic_cmpxchg_i64(TCGv_i64, TCGv, TCGv_i64, TCGv_i64,
++#define TCG_TARGET_HAS_extract_i32      1
-+                                   TCGArg, MemOp);
++#define TCG_TARGET_HAS_sextract_i32     1
- void tcg_gen_nonatomic_cmpxchg_i128(TCGv_i128, TCGv, TCGv_i128, TCGv_i128,
+ #define TCG_TARGET_HAS_extract2_i32     1
-                                     TCGArg, MemOp);
+ #define TCG_TARGET_HAS_negsetcond_i32   1
+ #define TCG_TARGET_HAS_mulu2_i32        1
-diff --git a/tcg/tcg-op.c b/tcg/tcg-op.c
+@@ -XXX,XX +XXX,XX @@ extern bool use_neon_instructions;
-index XXXXXXX..XXXXXXX 100644
+ #define TCG_TARGET_HAS_cmpsel_vec       0
---- a/tcg/tcg-op.c
+ #define TCG_TARGET_HAS_tst_vec          1
-+++ b/tcg/tcg-op.c
-@@ -XXX,XX +XXX,XX @@ static void * const table_cmpxchg[(MO_SIZE | MO_BSWAP) + 1] = {
++static inline bool
-     WITH_ATOMIC128([MO_128 | MO_BE] = gen_helper_atomic_cmpxchgo_be)
++tcg_target_extract_valid(TCGType type, unsigned ofs, unsigned len)
  };
 +void tcg_gen_nonatomic_cmpxchg_i32(TCGv_i32 retv, TCGv addr, TCGv_i32 cmpv,
 +                                   TCGv_i32 newv, TCGArg idx, MemOp memop)
 +{
-+    TCGv_i32 t1 = tcg_temp_new_i32();
++    if (use_armv7_instructions) {
-+    TCGv_i32 t2 = tcg_temp_new_i32();
++        return true;  /* SBFX or UBFX */
 +
 +    tcg_gen_ext_i32(t2, cmpv, memop & MO_SIZE);
 +
 +    tcg_gen_qemu_ld_i32(t1, addr, idx, memop & ~MO_SIGN);
 +    tcg_gen_movcond_i32(TCG_COND_EQ, t2, t1, t2, newv, t1);
 +    tcg_gen_qemu_st_i32(t2, addr, idx, memop);
 +    tcg_temp_free_i32(t2);
 +
 +    if (memop & MO_SIGN) {
 +        tcg_gen_ext_i32(retv, t1, memop);
 +    } else {
 +        tcg_gen_mov_i32(retv, t1);
 +    }
-+    tcg_temp_free_i32(t1);
++    switch (len) {
 +    case 8:   /* SXTB or UXTB */
 +    case 16:  /* SXTH or UXTH */
 +        return (ofs % 8) == 0;
 +    }
 +    return false;
 +}
 +
- void tcg_gen_atomic_cmpxchg_i32(TCGv_i32 retv, TCGv addr, TCGv_i32 cmpv,
++#define TCG_TARGET_extract_valid   tcg_target_extract_valid
-                                 TCGv_i32 newv, TCGArg idx, MemOp memop)
++#define TCG_TARGET_sextract_valid  tcg_target_extract_valid
 +
  #endif
 diff --git a/tcg/arm/tcg-target.c.inc b/tcg/arm/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/arm/tcg-target.c.inc
 +++ b/tcg/arm/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static void tcg_out_deposit(TCGContext *s, ARMCond cond, TCGReg rd,
  static void tcg_out_extract(TCGContext *s, ARMCond cond, TCGReg rd,
                              TCGReg rn, int ofs, int len)
  {
--    memop = tcg_canonicalize_memop(memop, 0, 0);
+-    /* ubfx */
-+    gen_atomic_cx_i32 gen;
+-    tcg_out32(s, 0x07e00050 | (cond << 28) | (rd << 12) | rn
-+    MemOpIdx oi;
+-              | (ofs << 7) | ((len - 1) << 16));
++    /* According to gcc, AND can be faster. */
-     if (!(tcg_ctx->gen_tb->cflags & CF_PARALLEL)) {
++    if (ofs == 0 && len <= 8) {
--        TCGv_i32 t1 = tcg_temp_new_i32();
++        tcg_out_dat_imm(s, cond, ARITH_AND, rd, rn,
--        TCGv_i32 t2 = tcg_temp_new_i32();
++                        encode_imm_nofail((1 << len) - 1));
 -
 -        tcg_gen_ext_i32(t2, cmpv, memop & MO_SIZE);
 -
 -        tcg_gen_qemu_ld_i32(t1, addr, idx, memop & ~MO_SIGN);
 -        tcg_gen_movcond_i32(TCG_COND_EQ, t2, t1, t2, newv, t1);
 -        tcg_gen_qemu_st_i32(t2, addr, idx, memop);
 -        tcg_temp_free_i32(t2);
 -
 -        if (memop & MO_SIGN) {
 -            tcg_gen_ext_i32(retv, t1, memop);
 -        } else {
 -            tcg_gen_mov_i32(retv, t1);
 -        }
 -        tcg_temp_free_i32(t1);
 -    } else {
 -        gen_atomic_cx_i32 gen;
 -        MemOpIdx oi;
 -
 -        gen = table_cmpxchg[memop & (MO_SIZE | MO_BSWAP)];
 -        tcg_debug_assert(gen != NULL);
 -
 -        oi = make_memop_idx(memop & ~MO_SIGN, idx);
 -        gen(retv, cpu_env, addr, cmpv, newv, tcg_constant_i32(oi));
 -
 -        if (memop & MO_SIGN) {
 -            tcg_gen_ext_i32(retv, retv, memop);
 -        }
 +        tcg_gen_nonatomic_cmpxchg_i32(retv, addr, cmpv, newv, idx, memop);
 +        return;
      }
 +
 +    memop = tcg_canonicalize_memop(memop, 0, 0);
 +    gen = table_cmpxchg[memop & (MO_SIZE | MO_BSWAP)];
 +    tcg_debug_assert(gen != NULL);
 +
 +    oi = make_memop_idx(memop & ~MO_SIGN, idx);
 +    gen(retv, cpu_env, addr, cmpv, newv, tcg_constant_i32(oi));
 +
 +    if (memop & MO_SIGN) {
 +        tcg_gen_ext_i32(retv, retv, memop);
 +    }
 +}
 +
 +void tcg_gen_nonatomic_cmpxchg_i64(TCGv_i64 retv, TCGv addr, TCGv_i64 cmpv,
 +                                   TCGv_i64 newv, TCGArg idx, MemOp memop)
 +{
 +    TCGv_i64 t1, t2;
 +
 +    if (TCG_TARGET_REG_BITS == 32 && (memop & MO_SIZE) < MO_64) {
 +        tcg_gen_nonatomic_cmpxchg_i32(TCGV_LOW(retv), addr, TCGV_LOW(cmpv),
 +                                      TCGV_LOW(newv), idx, memop);
 +        if (memop & MO_SIGN) {
 +            tcg_gen_sari_i32(TCGV_HIGH(retv), TCGV_LOW(retv), 31);
 +        } else {
 +            tcg_gen_movi_i32(TCGV_HIGH(retv), 0);
 +        }
 +        return;
 +    }
 +
-+    t1 = tcg_temp_new_i64();
++    if (use_armv7_instructions) {
-+    t2 = tcg_temp_new_i64();
++        /* ubfx */
-+
++        tcg_out32(s, 0x07e00050 | (cond << 28) | (rd << 12) | rn
-+    tcg_gen_ext_i64(t2, cmpv, memop & MO_SIZE);
++                  | (ofs << 7) | ((len - 1) << 16));
 +
 +    tcg_gen_qemu_ld_i64(t1, addr, idx, memop & ~MO_SIGN);
 +    tcg_gen_movcond_i64(TCG_COND_EQ, t2, t1, t2, newv, t1);
 +    tcg_gen_qemu_st_i64(t2, addr, idx, memop);
 +    tcg_temp_free_i64(t2);
 +
 +    if (memop & MO_SIGN) {
 +        tcg_gen_ext_i64(retv, t1, memop);
 +    } else {
 +        tcg_gen_mov_i64(retv, t1);
 +    }
 +    tcg_temp_free_i64(t1);
  }
  void tcg_gen_atomic_cmpxchg_i64(TCGv_i64 retv, TCGv addr, TCGv_i64 cmpv,
                                  TCGv_i64 newv, TCGArg idx, MemOp memop)
  {
 -    memop = tcg_canonicalize_memop(memop, 1, 0);
 -
      if (!(tcg_ctx->gen_tb->cflags & CF_PARALLEL)) {
 -        TCGv_i64 t1 = tcg_temp_new_i64();
 -        TCGv_i64 t2 = tcg_temp_new_i64();
 +        tcg_gen_nonatomic_cmpxchg_i64(retv, addr, cmpv, newv, idx, memop);
 +        return;
 +    }
 -        tcg_gen_ext_i64(t2, cmpv, memop & MO_SIZE);
 -
 -        tcg_gen_qemu_ld_i64(t1, addr, idx, memop & ~MO_SIGN);
 -        tcg_gen_movcond_i64(TCG_COND_EQ, t2, t1, t2, newv, t1);
 -        tcg_gen_qemu_st_i64(t2, addr, idx, memop);
 -        tcg_temp_free_i64(t2);
 -
 -        if (memop & MO_SIGN) {
 -            tcg_gen_ext_i64(retv, t1, memop);
 -        } else {
 -            tcg_gen_mov_i64(retv, t1);
 -        }
 -        tcg_temp_free_i64(t1);
 -    } else if ((memop & MO_SIZE) == MO_64) {
 -#ifdef CONFIG_ATOMIC64
 +    if ((memop & MO_SIZE) == MO_64) {
          gen_atomic_cx_i64 gen;
 -        MemOpIdx oi;
 +        memop = tcg_canonicalize_memop(memop, 1, 0);
          gen = table_cmpxchg[memop & (MO_SIZE | MO_BSWAP)];
 -        tcg_debug_assert(gen != NULL);
 +        if (gen) {
 +            MemOpIdx oi = make_memop_idx(memop, idx);
 +            gen(retv, cpu_env, addr, cmpv, newv, tcg_constant_i32(oi));
 +            return;
 +        }
 -        oi = make_memop_idx(memop, idx);
 -        gen(retv, cpu_env, addr, cmpv, newv, tcg_constant_i32(oi));
 -#else
          gen_helper_exit_atomic(cpu_env);
 -        /* Produce a result, so that we have a well-formed opcode stream
 -           with respect to uses of the result in the (dead) code following.  */
 +
 +        /*
 +         * Produce a result for a well-formed opcode stream.  This satisfies
 +         * liveness for set before used, which happens before this dead code
 +         * is removed.
 +         */
          tcg_gen_movi_i64(retv, 0);
 -#endif /* CONFIG_ATOMIC64 */
 +        return;
 +    }
 +
-+    if (TCG_TARGET_REG_BITS == 32) {
++    assert(ofs % 8 == 0);
-+        tcg_gen_atomic_cmpxchg_i32(TCGV_LOW(retv), addr, TCGV_LOW(cmpv),
++    switch (len) {
-+                                   TCGV_LOW(newv), idx, memop);
++    case 8:
-+        if (memop & MO_SIGN) {
++        /* uxtb */
-+            tcg_gen_sari_i32(TCGV_HIGH(retv), TCGV_LOW(retv), 31);
++        tcg_out32(s, 0x06ef0070 | (cond << 28) | (rd << 12) | (ofs << 7) | rn);
-+        } else {
++        break;
-+            tcg_gen_movi_i32(TCGV_HIGH(retv), 0);
++    case 16:
-+        }
++        /* uxth */
-     } else {
++        tcg_out32(s, 0x06ff0070 | (cond << 28) | (rd << 12) | (ofs << 7) | rn);
-         TCGv_i32 c32 = tcg_temp_new_i32();
++        break;
-         TCGv_i32 n32 = tcg_temp_new_i32();
++    default:
 +        g_assert_not_reached();
 +    }
  }
  static void tcg_out_sextract(TCGContext *s, ARMCond cond, TCGReg rd,
                               TCGReg rn, int ofs, int len)
  {
 -    /* sbfx */
 -    tcg_out32(s, 0x07a00050 | (cond << 28) | (rd << 12) | rn
 -              | (ofs << 7) | ((len - 1) << 16));
 +    if (use_armv7_instructions) {
 +        /* sbfx */
 +        tcg_out32(s, 0x07a00050 | (cond << 28) | (rd << 12) | rn
 +                  | (ofs << 7) | ((len - 1) << 16));
 +        return;
 +    }
 +
 +    assert(ofs % 8 == 0);
 +    switch (len) {
 +    case 8:
 +        /* sxtb */
 +        tcg_out32(s, 0x06af0070 | (cond << 28) | (rd << 12) | (ofs << 7) | rn);
 +        break;
 +    case 16:
 +        /* sxth */
 +        tcg_out32(s, 0x06bf0070 | (cond << 28) | (rd << 12) | (ofs << 7) | rn);
 +        break;
 +    default:
 +        g_assert_not_reached();
 +    }
  }
 +
  static void tcg_out_ld32u(TCGContext *s, ARMCond cond,
                            TCGReg rd, TCGReg rn, int32_t offset)
  {
 --
-.34.1
+.43.0

-New patch
+[PULL 52/68] tcg/loongarch64: Fold the ext{8, 16, 32}[us] cases into {s}extract
+Accept byte and word extensions with the extract opcodes.
+This is preparatory to removing the specialized extracts.
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+---
+ tcg/loongarch64/tcg-target-has.h | 15 ++++++++++++--
+ tcg/loongarch64/tcg-target.c.inc | 34 ++++++++++++++++++++++++++++++--
+files changed, 45 insertions(+), 4 deletions(-)
+diff --git a/tcg/loongarch64/tcg-target-has.h b/tcg/loongarch64/tcg-target-has.h
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/loongarch64/tcg-target-has.h
++++ b/tcg/loongarch64/tcg-target-has.h
+@@ -XXX,XX +XXX,XX @@
+ #define TCG_TARGET_HAS_rot_i32          1
+ #define TCG_TARGET_HAS_deposit_i32      1
+ #define TCG_TARGET_HAS_extract_i32      1
+-#define TCG_TARGET_HAS_sextract_i32     0
++#define TCG_TARGET_HAS_sextract_i32     1
+ #define TCG_TARGET_HAS_extract2_i32     0
+ #define TCG_TARGET_HAS_add2_i32         0
+ #define TCG_TARGET_HAS_sub2_i32         0
+@@ -XXX,XX +XXX,XX @@
+ #define TCG_TARGET_HAS_rot_i64          1
+ #define TCG_TARGET_HAS_deposit_i64      1
+ #define TCG_TARGET_HAS_extract_i64      1
+-#define TCG_TARGET_HAS_sextract_i64     0
++#define TCG_TARGET_HAS_sextract_i64     1
+ #define TCG_TARGET_HAS_extract2_i64     0
+ #define TCG_TARGET_HAS_extr_i64_i32     1
+ #define TCG_TARGET_HAS_ext8s_i64        1
+@@ -XXX,XX +XXX,XX @@
+ #define TCG_TARGET_HAS_cmpsel_vec       0
+ #define TCG_TARGET_HAS_tst_vec          0
++#define TCG_TARGET_extract_valid(type, ofs, len)   1
++
++static inline bool
++tcg_target_sextract_valid(TCGType type, unsigned ofs, unsigned len)
++{
++    if (type == TCG_TYPE_I64 && ofs + len == 32) {
++        return true;
++    }
++    return ofs == 0 && (len == 8 || len == 16);
++}
++#define TCG_TARGET_sextract_valid  tcg_target_sextract_valid
+ #endif
+diff --git a/tcg/loongarch64/tcg-target.c.inc b/tcg/loongarch64/tcg-target.c.inc
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/loongarch64/tcg-target.c.inc
++++ b/tcg/loongarch64/tcg-target.c.inc
+@@ -XXX,XX +XXX,XX @@ static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
+         break;
+     case INDEX_op_extract_i32:
+-        tcg_out_opc_bstrpick_w(s, a0, a1, a2, a2 + args[3] - 1);
++        if (a2 == 0 && args[3] <= 12) {
++            tcg_out_opc_andi(s, a0, a1, (1 << args[3]) - 1);
++        } else {
++            tcg_out_opc_bstrpick_w(s, a0, a1, a2, a2 + args[3] - 1);
++        }
+         break;
+     case INDEX_op_extract_i64:
+-        tcg_out_opc_bstrpick_d(s, a0, a1, a2, a2 + args[3] - 1);
++        if (a2 == 0 && args[3] <= 12) {
++            tcg_out_opc_andi(s, a0, a1, (1 << args[3]) - 1);
++        } else {
++            tcg_out_opc_bstrpick_d(s, a0, a1, a2, a2 + args[3] - 1);
++        }
++        break;
++
++    case INDEX_op_sextract_i64:
++        if (a2 + args[3] == 32) {
++            if (a2 == 0) {
++                tcg_out_ext32s(s, a0, a1);
++            } else {
++                tcg_out_opc_srai_w(s, a0, a1, a2);
++            }
++            break;
++        }
++        /* FALLTHRU */
++    case INDEX_op_sextract_i32:
++        if (a2 == 0 && args[3] == 8) {
++            tcg_out_ext8s(s, TCG_TYPE_REG, a0, a1);
++        } else if (a2 == 0 && args[3] == 16) {
++            tcg_out_ext16s(s, TCG_TYPE_REG, a0, a1);
++        } else {
++            g_assert_not_reached();
++        }
+         break;
+     case INDEX_op_deposit_i32:
+@@ -XXX,XX +XXX,XX @@ tcg_target_op_def(TCGOpcode op, TCGType type, unsigned flags)
+     case INDEX_op_not_i64:
+     case INDEX_op_extract_i32:
+     case INDEX_op_extract_i64:
++    case INDEX_op_sextract_i32:
++    case INDEX_op_sextract_i64:
+     case INDEX_op_bswap16_i32:
+     case INDEX_op_bswap16_i64:
+     case INDEX_op_bswap32_i32:
+--
+.43.0

-New patch
+[PULL 53/68] tcg/mips: Fold the ext{8, 16, 32}[us] cases into {s}extract
+Accept AND, ext32u, ext32s extensions with the extract opcodes.
+This is preparatory to removing the specialized extracts.
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+---
+ tcg/mips/tcg-target-has.h | 26 ++++++++++++++++++++++----
+ tcg/mips/tcg-target.c.inc | 33 ++++++++++++++++++++++++++++++---
+files changed, 52 insertions(+), 7 deletions(-)
+diff --git a/tcg/mips/tcg-target-has.h b/tcg/mips/tcg-target-has.h
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/mips/tcg-target-has.h
++++ b/tcg/mips/tcg-target-has.h
+@@ -XXX,XX +XXX,XX @@ extern bool use_mips32r2_instructions;
+ /* optional instructions detected at runtime */
+ #define TCG_TARGET_HAS_deposit_i32      use_mips32r2_instructions
+-#define TCG_TARGET_HAS_extract_i32      use_mips32r2_instructions
+-#define TCG_TARGET_HAS_sextract_i32     0
++#define TCG_TARGET_HAS_extract_i32      1
++#define TCG_TARGET_HAS_sextract_i32     1
+ #define TCG_TARGET_HAS_extract2_i32     0
+ #define TCG_TARGET_HAS_ext8s_i32        use_mips32r2_instructions
+ #define TCG_TARGET_HAS_ext16s_i32       use_mips32r2_instructions
+@@ -XXX,XX +XXX,XX @@ extern bool use_mips32r2_instructions;
+ #define TCG_TARGET_HAS_bswap32_i64      1
+ #define TCG_TARGET_HAS_bswap64_i64      1
+ #define TCG_TARGET_HAS_deposit_i64      use_mips32r2_instructions
+-#define TCG_TARGET_HAS_extract_i64      use_mips32r2_instructions
+-#define TCG_TARGET_HAS_sextract_i64     0
++#define TCG_TARGET_HAS_extract_i64      1
++#define TCG_TARGET_HAS_sextract_i64     1
+ #define TCG_TARGET_HAS_extract2_i64     0
+ #define TCG_TARGET_HAS_ext8s_i64        use_mips32r2_instructions
+ #define TCG_TARGET_HAS_ext16s_i64       use_mips32r2_instructions
+@@ -XXX,XX +XXX,XX @@ extern bool use_mips32r2_instructions;
+ #define TCG_TARGET_HAS_qemu_ldst_i128   0
+ #define TCG_TARGET_HAS_tst              0
++#define TCG_TARGET_extract_valid(type, ofs, len)  use_mips32r2_instructions
++
++static inline bool
++tcg_target_sextract_valid(TCGType type, unsigned ofs, unsigned len)
++{
++    if (ofs == 0) {
++        switch (len) {
++        case 8:
++        case 16:
++            return use_mips32r2_instructions;
++        case 32:
++            return type == TCG_TYPE_I64;
++        }
++    }
++    return false;
++}
++#define TCG_TARGET_sextract_valid  tcg_target_sextract_valid
++
+ #endif
+diff --git a/tcg/mips/tcg-target.c.inc b/tcg/mips/tcg-target.c.inc
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/mips/tcg-target.c.inc
++++ b/tcg/mips/tcg-target.c.inc
+@@ -XXX,XX +XXX,XX @@ static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
+         tcg_out_opc_bf64(s, OPC_DINS, OPC_DINSM, OPC_DINSU, a0, a2,
+                          args[3] + args[4] - 1, args[3]);
+         break;
++
+     case INDEX_op_extract_i32:
+-        tcg_out_opc_bf(s, OPC_EXT, a0, a1, args[3] - 1, a2);
++        if (a2 == 0 && args[3] <= 16) {
++            tcg_out_opc_imm(s, OPC_ANDI, a0, a1, (1 << args[3]) - 1);
++        } else {
++            tcg_out_opc_bf(s, OPC_EXT, a0, a1, args[3] - 1, a2);
++        }
+         break;
+     case INDEX_op_extract_i64:
+-        tcg_out_opc_bf64(s, OPC_DEXT, OPC_DEXTM, OPC_DEXTU, a0, a1,
+-                         args[3] - 1, a2);
++        if (a2 == 0 && args[3] <= 16) {
++            tcg_out_opc_imm(s, OPC_ANDI, a0, a1, (1 << args[3]) - 1);
++        } else {
++            tcg_out_opc_bf64(s, OPC_DEXT, OPC_DEXTM, OPC_DEXTU,
++                             a0, a1, args[3] - 1, a2);
++        }
++        break;
++
++    case INDEX_op_sextract_i64:
++        if (a2 == 0 && args[3] == 32) {
++            tcg_out_ext32s(s, a0, a1);
++            break;
++        }
++        /* FALLTHRU */
++    case INDEX_op_sextract_i32:
++        if (a2 == 0 && args[3] == 8) {
++            tcg_out_ext8s(s, TCG_TYPE_REG, a0, a1);
++        } else if (a2 == 0 && args[3] == 16) {
++            tcg_out_ext16s(s, TCG_TYPE_REG, a0, a1);
++        } else {
++            g_assert_not_reached();
++        }
+         break;
+     case INDEX_op_brcond_i32:
+@@ -XXX,XX +XXX,XX @@ tcg_target_op_def(TCGOpcode op, TCGType type, unsigned flags)
+     case INDEX_op_ext8s_i32:
+     case INDEX_op_ext16s_i32:
+     case INDEX_op_extract_i32:
++    case INDEX_op_sextract_i32:
+     case INDEX_op_ld8u_i64:
+     case INDEX_op_ld8s_i64:
+     case INDEX_op_ld16u_i64:
+@@ -XXX,XX +XXX,XX @@ tcg_target_op_def(TCGOpcode op, TCGType type, unsigned flags)
+     case INDEX_op_extrl_i64_i32:
+     case INDEX_op_extrh_i64_i32:
+     case INDEX_op_extract_i64:
++    case INDEX_op_sextract_i64:
+         return C_O1_I1(r, r);
+     case INDEX_op_st8_i32:
+--
+.43.0

-New patch
+[PULL 54/68] tcg/ppc: Fold the ext{8, 16, 32}[us] cases into {s}extract
+Accept byte and word extensions with the extract opcodes.
+This is preparatory to removing the specialized extracts.
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+---
+ tcg/ppc/tcg-target-has.h | 16 ++++++++++++++--
+ tcg/ppc/tcg-target.c.inc | 30 ++++++++++++++++++++++++++++++
+files changed, 44 insertions(+), 2 deletions(-)
+diff --git a/tcg/ppc/tcg-target-has.h b/tcg/ppc/tcg-target-has.h
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/ppc/tcg-target-has.h
++++ b/tcg/ppc/tcg-target-has.h
+@@ -XXX,XX +XXX,XX @@
+ #define TCG_TARGET_HAS_ctpop_i32        have_isa_2_06
+ #define TCG_TARGET_HAS_deposit_i32      1
+ #define TCG_TARGET_HAS_extract_i32      1
+-#define TCG_TARGET_HAS_sextract_i32     0
++#define TCG_TARGET_HAS_sextract_i32     1
+ #define TCG_TARGET_HAS_extract2_i32     0
+ #define TCG_TARGET_HAS_negsetcond_i32   1
+ #define TCG_TARGET_HAS_mulu2_i32        0
+@@ -XXX,XX +XXX,XX @@
+ #define TCG_TARGET_HAS_ctpop_i64        have_isa_2_06
+ #define TCG_TARGET_HAS_deposit_i64      1
+ #define TCG_TARGET_HAS_extract_i64      1
+-#define TCG_TARGET_HAS_sextract_i64     0
++#define TCG_TARGET_HAS_sextract_i64     1
+ #define TCG_TARGET_HAS_extract2_i64     0
+ #define TCG_TARGET_HAS_negsetcond_i64   1
+ #define TCG_TARGET_HAS_add2_i64         1
+@@ -XXX,XX +XXX,XX @@
+ #define TCG_TARGET_HAS_cmpsel_vec       1
+ #define TCG_TARGET_HAS_tst_vec          0
++#define TCG_TARGET_extract_valid(type, ofs, len)   1
++
++static inline bool
++tcg_target_sextract_valid(TCGType type, unsigned ofs, unsigned len)
++{
++    if (type == TCG_TYPE_I64 && ofs + len == 32) {
++        return true;
++    }
++    return ofs == 0 && (len == 8 || len == 16);
++}
++#define TCG_TARGET_sextract_valid  tcg_target_sextract_valid
++
+ #endif
+diff --git a/tcg/ppc/tcg-target.c.inc b/tcg/ppc/tcg-target.c.inc
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/ppc/tcg-target.c.inc
++++ b/tcg/ppc/tcg-target.c.inc
+@@ -XXX,XX +XXX,XX @@ static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
+         break;
+     case INDEX_op_extract_i32:
++        if (args[2] == 0 && args[3] <= 16) {
++            tcg_out32(s, ANDI | SAI(args[1], args[0], (1 << args[3]) - 1));
++            break;
++        }
+         tcg_out_rlw(s, RLWINM, args[0], args[1],
+- args[2], 32 - args[3], 31);
+         break;
+     case INDEX_op_extract_i64:
++        if (args[2] == 0 && args[3] <= 16) {
++            tcg_out32(s, ANDI | SAI(args[1], args[0], (1 << args[3]) - 1));
++            break;
++        }
+         tcg_out_rld(s, RLDICL, args[0], args[1], 64 - args[2], 64 - args[3]);
+         break;
++    case INDEX_op_sextract_i64:
++        if (args[2] + args[3] == 32) {
++            if (args[2] == 0) {
++                tcg_out_ext32s(s, args[0], args[1]);
++            } else {
++                tcg_out_sari32(s, args[0], args[1], args[2]);
++            }
++            break;
++        }
++        /* FALLTHRU */
++    case INDEX_op_sextract_i32:
++        if (args[2] == 0 && args[3] == 8) {
++            tcg_out_ext8s(s, TCG_TYPE_I32, args[0], args[1]);
++        } else if (args[2] == 0 && args[3] == 16) {
++            tcg_out_ext16s(s, TCG_TYPE_I32, args[0], args[1]);
++        } else {
++            g_assert_not_reached();
++        }
++        break;
++
+     case INDEX_op_movcond_i32:
+         tcg_out_movcond(s, TCG_TYPE_I32, args[5], args[0], args[1], args[2],
+                         args[3], args[4], const_args[2]);
+@@ -XXX,XX +XXX,XX @@ tcg_target_op_def(TCGOpcode op, TCGType type, unsigned flags)
+     case INDEX_op_bswap16_i32:
+     case INDEX_op_bswap32_i32:
+     case INDEX_op_extract_i32:
++    case INDEX_op_sextract_i32:
+     case INDEX_op_ld8u_i64:
+     case INDEX_op_ld8s_i64:
+     case INDEX_op_ld16u_i64:
+@@ -XXX,XX +XXX,XX @@ tcg_target_op_def(TCGOpcode op, TCGType type, unsigned flags)
+     case INDEX_op_bswap32_i64:
+     case INDEX_op_bswap64_i64:
+     case INDEX_op_extract_i64:
++    case INDEX_op_sextract_i64:
+         return C_O1_I1(r, r);
+     case INDEX_op_st8_i32:
+--
+.43.0

-[PULL 25/40] tests/tcg/s390x: Add long-double.c
+[PULL 55/68] tcg/riscv64: Fold the ext{8, 16, 32}[us] cases into {s}extract
-Acked-by: Ilya Leoshkevich <iii@linux.ibm.com>
+Accept byte and word extensions with the extract opcodes.
 This is preparatory to removing the specialized extracts.
 Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 ---
- tests/tcg/s390x/long-double.c   | 24 ++++++++++++++++++++++++
+ tcg/riscv/tcg-target-has.h | 39 ++++++++++++++++++++++++++++++++++----
- tests/tcg/s390x/Makefile.target |  1 +
+ tcg/riscv/tcg-target.c.inc | 34 +++++++++++++++++++++++++++++++++
-files changed, 25 insertions(+)
+files changed, 69 insertions(+), 4 deletions(-)
  create mode 100644 tests/tcg/s390x/long-double.c
-diff --git a/tests/tcg/s390x/long-double.c b/tests/tcg/s390x/long-double.c
+diff --git a/tcg/riscv/tcg-target-has.h b/tcg/riscv/tcg-target-has.h
-new file mode 100644
+index XXXXXXX..XXXXXXX 100644
-index XXXXXXX..XXXXXXX
+--- a/tcg/riscv/tcg-target-has.h
---- /dev/null
++++ b/tcg/riscv/tcg-target-has.h
 +++ b/tests/tcg/s390x/long-double.c
 @@ -XXX,XX +XXX,XX @@
-+/*
+ #define TCG_TARGET_HAS_div2_i32         0
-+ * Perform some basic arithmetic with long double, as a sanity check.
+ #define TCG_TARGET_HAS_rot_i32          (cpuinfo & CPUINFO_ZBB)
-+ * With small integral numbers, we can cross-check with integers.
+ #define TCG_TARGET_HAS_deposit_i32      0
-+ */
+-#define TCG_TARGET_HAS_extract_i32      0
-+
+-#define TCG_TARGET_HAS_sextract_i32     0
-+#include <assert.h>
++#define TCG_TARGET_HAS_extract_i32      1
-+
++#define TCG_TARGET_HAS_sextract_i32     1
-+int main()
+ #define TCG_TARGET_HAS_extract2_i32     0
  #define TCG_TARGET_HAS_add2_i32         1
  #define TCG_TARGET_HAS_sub2_i32         1
@@ -XXX,XX +XXX,XX @@
  #define TCG_TARGET_HAS_div2_i64         0
  #define TCG_TARGET_HAS_rot_i64          (cpuinfo & CPUINFO_ZBB)
  #define TCG_TARGET_HAS_deposit_i64      0
 -#define TCG_TARGET_HAS_extract_i64      0
 -#define TCG_TARGET_HAS_sextract_i64     0
 +#define TCG_TARGET_HAS_extract_i64      1
 +#define TCG_TARGET_HAS_sextract_i64     1
  #define TCG_TARGET_HAS_extract2_i64     0
  #define TCG_TARGET_HAS_extr_i64_i32     1
  #define TCG_TARGET_HAS_ext8s_i64        1
@@ -XXX,XX +XXX,XX @@
  #define TCG_TARGET_HAS_tst_vec          0
 +static inline bool
 +tcg_target_extract_valid(TCGType type, unsigned ofs, unsigned len)
 +{
-+    int i, j;
++    if (ofs == 0) {
-+
++        switch (len) {
-+    for (i = 1; i < 5; i++) {
++        case 16:
-+        for (j = 1; j < 5; j++) {
++            return cpuinfo & CPUINFO_ZBB;
-+            long double la = (long double)i + j;
++        case 32:
-+            long double lm = (long double)i * j;
++            return (cpuinfo & CPUINFO_ZBA) && type == TCG_TYPE_I64;
 +            long double ls = (long double)i - j;
 +
 +            assert(la == i + j);
 +            assert(lm == i * j);
 +            assert(ls == i - j);
 +        }
 +    }
-+    return 0;
++    return false;
 +}
-diff --git a/tests/tcg/s390x/Makefile.target b/tests/tcg/s390x/Makefile.target
++#define TCG_TARGET_extract_valid  tcg_target_extract_valid
 +
 +static inline bool
 +tcg_target_sextract_valid(TCGType type, unsigned ofs, unsigned len)
 +{
 +    if (ofs == 0) {
 +        switch (len) {
 +        case 8:
 +        case 16:
 +            return cpuinfo & CPUINFO_ZBB;
 +        case 32:
 +            return type == TCG_TYPE_I64;
 +        }
 +    }
 +    return false;
 +}
 +#define TCG_TARGET_sextract_valid  tcg_target_sextract_valid
 +
  #endif
 diff --git a/tcg/riscv/tcg-target.c.inc b/tcg/riscv/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
---- a/tests/tcg/s390x/Makefile.target
+--- a/tcg/riscv/tcg-target.c.inc
-+++ b/tests/tcg/s390x/Makefile.target
++++ b/tcg/riscv/tcg-target.c.inc
-@@ -XXX,XX +XXX,XX @@ TESTS+=branch-relative-long
+@@ -XXX,XX +XXX,XX @@ static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
- TESTS+=noexec
+         tcg_out_mb(s, a0);
- TESTS+=div
+         break;
- TESTS+=clst
-+TESTS+=long-double
++    case INDEX_op_extract_i64:
++        if (a2 == 0 && args[3] == 32) {
- Z13_TESTS=vistr
++            tcg_out_ext32u(s, a0, a1);
- $(Z13_TESTS): CFLAGS+=-march=z13 -O2
++            break;
 +        }
 +        /* FALLTHRU */
 +    case INDEX_op_extract_i32:
 +        if (a2 == 0 && args[3] == 16) {
 +            tcg_out_ext16u(s, a0, a1);
 +        } else {
 +            g_assert_not_reached();
 +        }
 +        break;
 +
 +    case INDEX_op_sextract_i64:
 +        if (a2 == 0 && args[3] == 32) {
 +            tcg_out_ext32s(s, a0, a1);
 +            break;
 +        }
 +        /* FALLTHRU */
 +    case INDEX_op_sextract_i32:
 +        if (a2 == 0 && args[3] == 8) {
 +            tcg_out_ext8s(s, TCG_TYPE_REG, a0, a1);
 +        } else if (a2 == 0 && args[3] == 16) {
 +            tcg_out_ext16s(s, TCG_TYPE_REG, a0, a1);
 +        } else {
 +            g_assert_not_reached();
 +        }
 +        break;
 +
      case INDEX_op_mov_i32:  /* Always emitted via tcg_out_mov.  */
      case INDEX_op_mov_i64:
      case INDEX_op_call:     /* Always emitted via tcg_out_call.  */
@@ -XXX,XX +XXX,XX @@ tcg_target_op_def(TCGOpcode op, TCGType type, unsigned flags)
      case INDEX_op_extrl_i64_i32:
      case INDEX_op_extrh_i64_i32:
      case INDEX_op_ext_i32_i64:
 +    case INDEX_op_extract_i32:
 +    case INDEX_op_extract_i64:
 +    case INDEX_op_sextract_i32:
 +    case INDEX_op_sextract_i64:
      case INDEX_op_bswap16_i32:
      case INDEX_op_bswap32_i32:
      case INDEX_op_bswap16_i64:
 --
-.34.1
+.43.0

-New patch
+[PULL 56/68] tcg/riscv: Use SRAIW, SRLIW for {s}extract_i64
+Extracts which abut bit 32 may use 32-bit shifts.
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+---
+ tcg/riscv/tcg-target-has.h | 24 +++++++-----------------
+ tcg/riscv/tcg-target.c.inc | 16 ++++++++++++----
+files changed, 19 insertions(+), 21 deletions(-)
+diff --git a/tcg/riscv/tcg-target-has.h b/tcg/riscv/tcg-target-has.h
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/riscv/tcg-target-has.h
++++ b/tcg/riscv/tcg-target-has.h
+@@ -XXX,XX +XXX,XX @@
+ static inline bool
+ tcg_target_extract_valid(TCGType type, unsigned ofs, unsigned len)
+ {
+-    if (ofs == 0) {
+-        switch (len) {
+-        case 16:
+-            return cpuinfo & CPUINFO_ZBB;
+-        case 32:
+-            return (cpuinfo & CPUINFO_ZBA) && type == TCG_TYPE_I64;
+-        }
++    if (type == TCG_TYPE_I64 && ofs + len == 32) {
++        /* ofs > 0 uses SRLIW; ofs == 0 uses add.uw. */
++        return ofs || (cpuinfo & CPUINFO_ZBA);
+     }
+-    return false;
++    return (cpuinfo & CPUINFO_ZBB) && ofs == 0 && len == 16;
+ }
+ #define TCG_TARGET_extract_valid  tcg_target_extract_valid
+ static inline bool
+ tcg_target_sextract_valid(TCGType type, unsigned ofs, unsigned len)
+ {
+-    if (ofs == 0) {
+-        switch (len) {
+-        case 8:
+-        case 16:
+-            return cpuinfo & CPUINFO_ZBB;
+-        case 32:
+-            return type == TCG_TYPE_I64;
+-        }
++    if (type == TCG_TYPE_I64 && ofs + len == 32) {
++        return true;
+     }
+-    return false;
++    return (cpuinfo & CPUINFO_ZBB) && ofs == 0 && (len == 8 || len == 16);
+ }
+ #define TCG_TARGET_sextract_valid  tcg_target_sextract_valid
+diff --git a/tcg/riscv/tcg-target.c.inc b/tcg/riscv/tcg-target.c.inc
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/riscv/tcg-target.c.inc
++++ b/tcg/riscv/tcg-target.c.inc
+@@ -XXX,XX +XXX,XX @@ static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
+         break;
+     case INDEX_op_extract_i64:
+-        if (a2 == 0 && args[3] == 32) {
+-            tcg_out_ext32u(s, a0, a1);
++        if (a2 + args[3] == 32) {
++            if (a2 == 0) {
++                tcg_out_ext32u(s, a0, a1);
++            } else {
++                tcg_out_opc_imm(s, OPC_SRLIW, a0, a1, a2);
++            }
+             break;
+         }
+         /* FALLTHRU */
+@@ -XXX,XX +XXX,XX @@ static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
+         break;
+     case INDEX_op_sextract_i64:
+-        if (a2 == 0 && args[3] == 32) {
+-            tcg_out_ext32s(s, a0, a1);
++        if (a2 + args[3] == 32) {
++            if (a2 == 0) {
++                tcg_out_ext32s(s, a0, a1);
++            } else {
++                tcg_out_opc_imm(s, OPC_SRAIW, a0, a1, a2);
++            }
+             break;
+         }
+         /* FALLTHRU */
+--
+.43.0

-[PULL 34/40] target/s390x: Use Int128 for passing float128
+[PULL 57/68] tcg/s390x: Fold the ext{8, 16, 32}[us] cases into {s}extract
-Acked-by: David Hildenbrand <david@redhat.com>
+Accept byte and word extensions with the extract opcodes.
 This is preparatory to removing the specialized extracts.
 Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 ---
-v2: Fix SPEC_in1_x1.
+ tcg/s390x/tcg-target-has.h | 22 ++++++++++++++++++++--
----
+ tcg/s390x/tcg-target.c.inc | 37 +++++++++++++++++++++++++++++++++++++
- target/s390x/helper.h            | 32 ++++++------
+files changed, 57 insertions(+), 2 deletions(-)
  target/s390x/tcg/insn-data.h.inc | 30 +++++------
  target/s390x/tcg/fpu_helper.c    | 88 ++++++++++++++------------------
  target/s390x/tcg/translate.c     | 76 ++++++++++++++++++---------
 files changed, 121 insertions(+), 105 deletions(-)
-diff --git a/target/s390x/helper.h b/target/s390x/helper.h
+diff --git a/tcg/s390x/tcg-target-has.h b/tcg/s390x/tcg-target-has.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/s390x/helper.h
+--- a/tcg/s390x/tcg-target-has.h
-+++ b/target/s390x/helper.h
++++ b/tcg/s390x/tcg-target-has.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_4(csst, i32, env, i32, i64, i64)
+@@ -XXX,XX +XXX,XX @@ extern uint64_t s390_facilities[3];
- DEF_HELPER_4(csst_parallel, i32, env, i32, i64, i64)
+ #define TCG_TARGET_HAS_ctpop_i32      1
- DEF_HELPER_FLAGS_3(aeb, TCG_CALL_NO_WG, i64, env, i64, i64)
+ #define TCG_TARGET_HAS_deposit_i32    1
- DEF_HELPER_FLAGS_3(adb, TCG_CALL_NO_WG, i64, env, i64, i64)
+ #define TCG_TARGET_HAS_extract_i32    1
--DEF_HELPER_FLAGS_5(axb, TCG_CALL_NO_WG, i128, env, i64, i64, i64, i64)
+-#define TCG_TARGET_HAS_sextract_i32   0
-+DEF_HELPER_FLAGS_3(axb, TCG_CALL_NO_WG, i128, env, i128, i128)
++#define TCG_TARGET_HAS_sextract_i32   1
- DEF_HELPER_FLAGS_3(seb, TCG_CALL_NO_WG, i64, env, i64, i64)
+ #define TCG_TARGET_HAS_extract2_i32   0
- DEF_HELPER_FLAGS_3(sdb, TCG_CALL_NO_WG, i64, env, i64, i64)
+ #define TCG_TARGET_HAS_negsetcond_i32 1
--DEF_HELPER_FLAGS_5(sxb, TCG_CALL_NO_WG, i128, env, i64, i64, i64, i64)
+ #define TCG_TARGET_HAS_add2_i32       1
-+DEF_HELPER_FLAGS_3(sxb, TCG_CALL_NO_WG, i128, env, i128, i128)
+@@ -XXX,XX +XXX,XX @@ extern uint64_t s390_facilities[3];
- DEF_HELPER_FLAGS_3(deb, TCG_CALL_NO_WG, i64, env, i64, i64)
+ #define TCG_TARGET_HAS_ctpop_i64      1
- DEF_HELPER_FLAGS_3(ddb, TCG_CALL_NO_WG, i64, env, i64, i64)
+ #define TCG_TARGET_HAS_deposit_i64    1
--DEF_HELPER_FLAGS_5(dxb, TCG_CALL_NO_WG, i128, env, i64, i64, i64, i64)
+ #define TCG_TARGET_HAS_extract_i64    1
-+DEF_HELPER_FLAGS_3(dxb, TCG_CALL_NO_WG, i128, env, i128, i128)
+-#define TCG_TARGET_HAS_sextract_i64   0
- DEF_HELPER_FLAGS_3(meeb, TCG_CALL_NO_WG, i64, env, i64, i64)
++#define TCG_TARGET_HAS_sextract_i64   1
- DEF_HELPER_FLAGS_3(mdeb, TCG_CALL_NO_WG, i64, env, i64, i64)
+ #define TCG_TARGET_HAS_extract2_i64   0
- DEF_HELPER_FLAGS_3(mdb, TCG_CALL_NO_WG, i64, env, i64, i64)
+ #define TCG_TARGET_HAS_negsetcond_i64 1
--DEF_HELPER_FLAGS_5(mxb, TCG_CALL_NO_WG, i128, env, i64, i64, i64, i64)
+ #define TCG_TARGET_HAS_add2_i64       1
--DEF_HELPER_FLAGS_4(mxdb, TCG_CALL_NO_WG, i128, env, i64, i64, i64)
+@@ -XXX,XX +XXX,XX @@ extern uint64_t s390_facilities[3];
-+DEF_HELPER_FLAGS_3(mxb, TCG_CALL_NO_WG, i128, env, i128, i128)
+ #define TCG_TARGET_HAS_cmpsel_vec     1
-+DEF_HELPER_FLAGS_3(mxdb, TCG_CALL_NO_WG, i128, env, i128, i64)
+ #define TCG_TARGET_HAS_tst_vec        0
- DEF_HELPER_FLAGS_2(ldeb, TCG_CALL_NO_WG, i64, env, i64)
--DEF_HELPER_FLAGS_4(ldxb, TCG_CALL_NO_WG, i64, env, i64, i64, i32)
++#define TCG_TARGET_extract_valid(type, ofs, len)   1
-+DEF_HELPER_FLAGS_3(ldxb, TCG_CALL_NO_WG, i64, env, i128, i32)
++
- DEF_HELPER_FLAGS_2(lxdb, TCG_CALL_NO_WG, i128, env, i64)
++static inline bool
- DEF_HELPER_FLAGS_2(lxeb, TCG_CALL_NO_WG, i128, env, i64)
++tcg_target_sextract_valid(TCGType type, unsigned ofs, unsigned len)
- DEF_HELPER_FLAGS_3(ledb, TCG_CALL_NO_WG, i64, env, i64, i32)
++{
--DEF_HELPER_FLAGS_4(lexb, TCG_CALL_NO_WG, i64, env, i64, i64, i32)
++    if (ofs == 0) {
-+DEF_HELPER_FLAGS_3(lexb, TCG_CALL_NO_WG, i64, env, i128, i32)
++        switch (len) {
- DEF_HELPER_FLAGS_3(ceb, TCG_CALL_NO_WG_SE, i32, env, i64, i64)
++        case 8:
- DEF_HELPER_FLAGS_3(cdb, TCG_CALL_NO_WG_SE, i32, env, i64, i64)
++        case 16:
--DEF_HELPER_FLAGS_5(cxb, TCG_CALL_NO_WG_SE, i32, env, i64, i64, i64, i64)
++            return true;
-+DEF_HELPER_FLAGS_3(cxb, TCG_CALL_NO_WG_SE, i32, env, i128, i128)
++        case 32:
- DEF_HELPER_FLAGS_3(keb, TCG_CALL_NO_WG, i32, env, i64, i64)
++            return type == TCG_TYPE_I64;
- DEF_HELPER_FLAGS_3(kdb, TCG_CALL_NO_WG, i32, env, i64, i64)
++        }
--DEF_HELPER_FLAGS_5(kxb, TCG_CALL_NO_WG, i32, env, i64, i64, i64, i64)
++    }
-+DEF_HELPER_FLAGS_3(kxb, TCG_CALL_NO_WG, i32, env, i128, i128)
++    return false;
- DEF_HELPER_3(cgeb, i64, env, i64, i32)
++}
- DEF_HELPER_3(cgdb, i64, env, i64, i32)
++#define TCG_TARGET_sextract_valid  tcg_target_sextract_valid
--DEF_HELPER_4(cgxb, i64, env, i64, i64, i32)
++
-+DEF_HELPER_3(cgxb, i64, env, i128, i32)
+ #endif
- DEF_HELPER_3(cfeb, i64, env, i64, i32)
+diff --git a/tcg/s390x/tcg-target.c.inc b/tcg/s390x/tcg-target.c.inc
  DEF_HELPER_3(cfdb, i64, env, i64, i32)
 -DEF_HELPER_4(cfxb, i64, env, i64, i64, i32)
 +DEF_HELPER_3(cfxb, i64, env, i128, i32)
  DEF_HELPER_3(clgeb, i64, env, i64, i32)
  DEF_HELPER_3(clgdb, i64, env, i64, i32)
 -DEF_HELPER_4(clgxb, i64, env, i64, i64, i32)
 +DEF_HELPER_3(clgxb, i64, env, i128, i32)
  DEF_HELPER_3(clfeb, i64, env, i64, i32)
  DEF_HELPER_3(clfdb, i64, env, i64, i32)
 -DEF_HELPER_4(clfxb, i64, env, i64, i64, i32)
 +DEF_HELPER_3(clfxb, i64, env, i128, i32)
  DEF_HELPER_FLAGS_3(fieb, TCG_CALL_NO_WG, i64, env, i64, i32)
  DEF_HELPER_FLAGS_3(fidb, TCG_CALL_NO_WG, i64, env, i64, i32)
 -DEF_HELPER_FLAGS_4(fixb, TCG_CALL_NO_WG, i128, env, i64, i64, i32)
 +DEF_HELPER_FLAGS_3(fixb, TCG_CALL_NO_WG, i128, env, i128, i32)
  DEF_HELPER_FLAGS_4(maeb, TCG_CALL_NO_WG, i64, env, i64, i64, i64)
  DEF_HELPER_FLAGS_4(madb, TCG_CALL_NO_WG, i64, env, i64, i64, i64)
  DEF_HELPER_FLAGS_4(mseb, TCG_CALL_NO_WG, i64, env, i64, i64, i64)
  DEF_HELPER_FLAGS_4(msdb, TCG_CALL_NO_WG, i64, env, i64, i64, i64)
  DEF_HELPER_FLAGS_3(tceb, TCG_CALL_NO_RWG_SE, i32, env, i64, i64)
  DEF_HELPER_FLAGS_3(tcdb, TCG_CALL_NO_RWG_SE, i32, env, i64, i64)
 -DEF_HELPER_FLAGS_4(tcxb, TCG_CALL_NO_RWG_SE, i32, env, i64, i64, i64)
 +DEF_HELPER_FLAGS_3(tcxb, TCG_CALL_NO_RWG_SE, i32, env, i128, i64)
  DEF_HELPER_FLAGS_2(sqeb, TCG_CALL_NO_WG, i64, env, i64)
  DEF_HELPER_FLAGS_2(sqdb, TCG_CALL_NO_WG, i64, env, i64)
 -DEF_HELPER_FLAGS_3(sqxb, TCG_CALL_NO_WG, i128, env, i64, i64)
 +DEF_HELPER_FLAGS_2(sqxb, TCG_CALL_NO_WG, i128, env, i128)
  DEF_HELPER_FLAGS_1(cvd, TCG_CALL_NO_RWG_SE, i64, s32)
  DEF_HELPER_FLAGS_4(pack, TCG_CALL_NO_WG, void, env, i32, i64, i64)
  DEF_HELPER_FLAGS_4(pka, TCG_CALL_NO_WG, void, env, i64, i64, i32)
 diff --git a/target/s390x/tcg/insn-data.h.inc b/target/s390x/tcg/insn-data.h.inc
 index XXXXXXX..XXXXXXX 100644
---- a/target/s390x/tcg/insn-data.h.inc
+--- a/tcg/s390x/tcg-target.c.inc
-+++ b/target/s390x/tcg/insn-data.h.inc
++++ b/tcg/s390x/tcg-target.c.inc
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ static void tgen_deposit(TCGContext *s, TCGReg dest, TCGReg src,
-     C(0xe318, AGF,     RXY_a, Z,   r1, m2_32s, r1, 0, add, adds64)
+ static void tgen_extract(TCGContext *s, TCGReg dest, TCGReg src,
-     F(0xb30a, AEBR,    RRE,   Z,   e1, e2, new, e1, aeb, f32, IF_BFP)
+                          int ofs, int len)
-     F(0xb31a, ADBR,    RRE,   Z,   f1, f2, new, f1, adb, f64, IF_BFP)
+ {
--    F(0xb34a, AXBR,    RRE,   Z,   x2h, x2l, x1, x1, axb, f128, IF_BFP)
++    if (ofs == 0) {
-+    F(0xb34a, AXBR,    RRE,   Z,   x1, x2, new_x, x1, axb, f128, IF_BFP)
++        switch (len) {
-     F(0xed0a, AEB,     RXE,   Z,   e1, m2_32u, new, e1, aeb, f32, IF_BFP)
++        case 8:
-     F(0xed1a, ADB,     RXE,   Z,   f1, m2_64, new, f1, adb, f64, IF_BFP)
++            tcg_out_ext8u(s, dest, src);
- /* ADD HIGH */
++            return;
-@@ -XXX,XX +XXX,XX @@
++        case 16:
-     C(0xe330, CGF,     RXY_a, Z,   r1_o, m2_32s, 0, 0, 0, cmps64)
++            tcg_out_ext16u(s, dest, src);
-     F(0xb309, CEBR,    RRE,   Z,   e1, e2, 0, 0, ceb, 0, IF_BFP)
++            return;
-     F(0xb319, CDBR,    RRE,   Z,   f1, f2, 0, 0, cdb, 0, IF_BFP)
++        case 32:
--    F(0xb349, CXBR,    RRE,   Z,   x2h, x2l, x1, 0, cxb, 0, IF_BFP)
++            tcg_out_ext32u(s, dest, src);
-+    F(0xb349, CXBR,    RRE,   Z,   x1, x2, 0, 0, cxb, 0, IF_BFP)
++            return;
-     F(0xed09, CEB,     RXE,   Z,   e1, m2_32u, 0, 0, ceb, 0, IF_BFP)
++        }
-     F(0xed19, CDB,     RXE,   Z,   f1, m2_64, 0, 0, cdb, 0, IF_BFP)
++    }
- /* COMPARE AND SIGNAL */
+     tcg_out_risbg(s, dest, src, 64 - len, 63, 64 - ofs, 1);
      F(0xb308, KEBR,    RRE,   Z,   e1, e2, 0, 0, keb, 0, IF_BFP)
      F(0xb318, KDBR,    RRE,   Z,   f1, f2, 0, 0, kdb, 0, IF_BFP)
 -    F(0xb348, KXBR,    RRE,   Z,   x2h, x2l, x1, 0, kxb, 0, IF_BFP)
 +    F(0xb348, KXBR,    RRE,   Z,   x1, x2, 0, 0, kxb, 0, IF_BFP)
      F(0xed08, KEB,     RXE,   Z,   e1, m2_32u, 0, 0, keb, 0, IF_BFP)
      F(0xed18, KDB,     RXE,   Z,   f1, m2_64, 0, 0, kdb, 0, IF_BFP)
  /* COMPARE IMMEDIATE */
@@ -XXX,XX +XXX,XX @@
  /* CONVERT TO FIXED */
      F(0xb398, CFEBR,   RRF_e, Z,   0, e2, new, r1_32, cfeb, 0, IF_BFP)
      F(0xb399, CFDBR,   RRF_e, Z,   0, f2, new, r1_32, cfdb, 0, IF_BFP)
 -    F(0xb39a, CFXBR,   RRF_e, Z,   x2h, x2l, new, r1_32, cfxb, 0, IF_BFP)
 +    F(0xb39a, CFXBR,   RRF_e, Z,   0, x2, new, r1_32, cfxb, 0, IF_BFP)
      F(0xb3a8, CGEBR,   RRF_e, Z,   0, e2, r1, 0, cgeb, 0, IF_BFP)
      F(0xb3a9, CGDBR,   RRF_e, Z,   0, f2, r1, 0, cgdb, 0, IF_BFP)
 -    F(0xb3aa, CGXBR,   RRF_e, Z,   x2h, x2l, r1, 0, cgxb, 0, IF_BFP)
 +    F(0xb3aa, CGXBR,   RRF_e, Z,   0, x2, r1, 0, cgxb, 0, IF_BFP)
  /* CONVERT FROM FIXED */
      F(0xb394, CEFBR,   RRF_e, Z,   0, r2_32s, new, e1, cegb, 0, IF_BFP)
      F(0xb395, CDFBR,   RRF_e, Z,   0, r2_32s, new, f1, cdgb, 0, IF_BFP)
@@ -XXX,XX +XXX,XX @@
  /* CONVERT TO LOGICAL */
      F(0xb39c, CLFEBR,  RRF_e, FPE, 0, e2, new, r1_32, clfeb, 0, IF_BFP)
      F(0xb39d, CLFDBR,  RRF_e, FPE, 0, f2, new, r1_32, clfdb, 0, IF_BFP)
 -    F(0xb39e, CLFXBR,  RRF_e, FPE, x2h, x2l, new, r1_32, clfxb, 0, IF_BFP)
 +    F(0xb39e, CLFXBR,  RRF_e, FPE, 0, x2, new, r1_32, clfxb, 0, IF_BFP)
      F(0xb3ac, CLGEBR,  RRF_e, FPE, 0, e2, r1, 0, clgeb, 0, IF_BFP)
      F(0xb3ad, CLGDBR,  RRF_e, FPE, 0, f2, r1, 0, clgdb, 0, IF_BFP)
 -    F(0xb3ae, CLGXBR,  RRF_e, FPE, x2h, x2l, r1, 0, clgxb, 0, IF_BFP)
 +    F(0xb3ae, CLGXBR,  RRF_e, FPE, 0, x2, r1, 0, clgxb, 0, IF_BFP)
  /* CONVERT FROM LOGICAL */
      F(0xb390, CELFBR,  RRF_e, FPE, 0, r2_32u, new, e1, celgb, 0, IF_BFP)
      F(0xb391, CDLFBR,  RRF_e, FPE, 0, r2_32u, new, f1, cdlgb, 0, IF_BFP)
@@ -XXX,XX +XXX,XX @@
      C(0x5d00, D,       RX_a,  Z,   r1_D32, m2_32s, new_P, r1_P32, divs32, 0)
      F(0xb30d, DEBR,    RRE,   Z,   e1, e2, new, e1, deb, 0, IF_BFP)
      F(0xb31d, DDBR,    RRE,   Z,   f1, f2, new, f1, ddb, 0, IF_BFP)
 -    F(0xb34d, DXBR,    RRE,   Z,   x2h, x2l, x1, x1, dxb, 0, IF_BFP)
 +    F(0xb34d, DXBR,    RRE,   Z,   x1, x2, new_x, x1, dxb, 0, IF_BFP)
      F(0xed0d, DEB,     RXE,   Z,   e1, m2_32u, new, e1, deb, 0, IF_BFP)
      F(0xed1d, DDB,     RXE,   Z,   f1, m2_64, new, f1, ddb, 0, IF_BFP)
  /* DIVIDE LOGICAL */
@@ -XXX,XX +XXX,XX @@
  /* LOAD FP INTEGER */
      F(0xb357, FIEBR,   RRF_e, Z,   0, e2, new, e1, fieb, 0, IF_BFP)
      F(0xb35f, FIDBR,   RRF_e, Z,   0, f2, new, f1, fidb, 0, IF_BFP)
 -    F(0xb347, FIXBR,   RRF_e, Z,   x2h, x2l, new_x, x1, fixb, 0, IF_BFP)
 +    F(0xb347, FIXBR,   RRF_e, Z,   0, x2, new_x, x1, fixb, 0, IF_BFP)
  /* LOAD LENGTHENED */
      F(0xb304, LDEBR,   RRE,   Z,   0, e2, new, f1, ldeb, 0, IF_BFP)
@@ -XXX,XX +XXX,XX @@
      F(0xed24, LDE,     RXE,   Z,   0, m2_32u, new, f1, lde, 0, IF_AFP1)
  /* LOAD ROUNDED */
      F(0xb344, LEDBR,   RRF_e, Z,   0, f2, new, e1, ledb, 0, IF_BFP)
 -    F(0xb345, LDXBR,   RRF_e, Z,   x2h, x2l, new, f1, ldxb, 0, IF_BFP)
 -    F(0xb346, LEXBR,   RRF_e, Z,   x2h, x2l, new, e1, lexb, 0, IF_BFP)
 +    F(0xb345, LDXBR,   RRF_e, Z,   0, x2, new, f1, ldxb, 0, IF_BFP)
 +    F(0xb346, LEXBR,   RRF_e, Z,   0, x2, new, e1, lexb, 0, IF_BFP)
  /* LOAD MULTIPLE */
      C(0x9800, LM,      RS_a,  Z,   0, a2, 0, 0, lm32, 0)
@@ -XXX,XX +XXX,XX @@
      C(0xe384, MG,      RXY_a, MIE2,r1p1_o, m2_64, r1_P, 0, muls128, 0)
      F(0xb317, MEEBR,   RRE,   Z,   e1, e2, new, e1, meeb, 0, IF_BFP)
      F(0xb31c, MDBR,    RRE,   Z,   f1, f2, new, f1, mdb, 0, IF_BFP)
 -    F(0xb34c, MXBR,    RRE,   Z,   x2h, x2l, x1, x1, mxb, 0, IF_BFP)
 +    F(0xb34c, MXBR,    RRE,   Z,   x1, x2, new_x, x1, mxb, 0, IF_BFP)
      F(0xb30c, MDEBR,   RRE,   Z,   f1, e2, new, f1, mdeb, 0, IF_BFP)
      F(0xb307, MXDBR,   RRE,   Z,   0, f2, x1, x1, mxdb, 0, IF_BFP)
      F(0xed17, MEEB,    RXE,   Z,   e1, m2_32u, new, e1, meeb, 0, IF_BFP)
@@ -XXX,XX +XXX,XX @@
  /* SQUARE ROOT */
      F(0xb314, SQEBR,   RRE,   Z,   0, e2, new, e1, sqeb, 0, IF_BFP)
      F(0xb315, SQDBR,   RRE,   Z,   0, f2, new, f1, sqdb, 0, IF_BFP)
 -    F(0xb316, SQXBR,   RRE,   Z,   x2h, x2l, new_x, x1, sqxb, 0, IF_BFP)
 +    F(0xb316, SQXBR,   RRE,   Z,   0, x2, new_x, x1, sqxb, 0, IF_BFP)
      F(0xed14, SQEB,    RXE,   Z,   0, m2_32u, new, e1, sqeb, 0, IF_BFP)
      F(0xed15, SQDB,    RXE,   Z,   0, m2_64, new, f1, sqdb, 0, IF_BFP)
@@ -XXX,XX +XXX,XX @@
      C(0xe319, SGF,     RXY_a, Z,   r1, m2_32s, r1, 0, sub, subs64)
      F(0xb30b, SEBR,    RRE,   Z,   e1, e2, new, e1, seb, f32, IF_BFP)
      F(0xb31b, SDBR,    RRE,   Z,   f1, f2, new, f1, sdb, f64, IF_BFP)
 -    F(0xb34b, SXBR,    RRE,   Z,   x2h, x2l, x1, x1, sxb, f128, IF_BFP)
 +    F(0xb34b, SXBR,    RRE,   Z,   x1, x2, new_x, x1, sxb, f128, IF_BFP)
      F(0xed0b, SEB,     RXE,   Z,   e1, m2_32u, new, e1, seb, f32, IF_BFP)
      F(0xed1b, SDB,     RXE,   Z,   f1, m2_64, new, f1, sdb, f64, IF_BFP)
  /* SUBTRACT HALFWORD */
@@ -XXX,XX +XXX,XX @@
  /* TEST DATA CLASS */
      F(0xed10, TCEB,    RXE,   Z,   e1, a2, 0, 0, tceb, 0, IF_BFP)
      F(0xed11, TCDB,    RXE,   Z,   f1, a2, 0, 0, tcdb, 0, IF_BFP)
 -    F(0xed12, TCXB,    RXE,   Z,   0, a2, x1, 0, tcxb, 0, IF_BFP)
 +    F(0xed12, TCXB,    RXE,   Z,   x1, a2, 0, 0, tcxb, 0, IF_BFP)
  /* TEST DECIMAL */
      C(0xebc0, TP,      RSL,   E2,  la1, 0, 0, 0, tp, 0)
 diff --git a/target/s390x/tcg/fpu_helper.c b/target/s390x/tcg/fpu_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/s390x/tcg/fpu_helper.c
 +++ b/target/s390x/tcg/fpu_helper.c
@@ -XXX,XX +XXX,XX @@ static inline Int128 RET128(float128 f)
      return int128_make128(f.low, f.high);
  }
-+static inline float128 ARG128(Int128 i)
++static void tgen_sextract(TCGContext *s, TCGReg dest, TCGReg src,
 +                          int ofs, int len)
 +{
-+    return make_float128(int128_gethi(i), int128_getlo(i));
++    if (ofs == 0) {
 +        switch (len) {
 +        case 8:
 +            tcg_out_ext8s(s, TCG_TYPE_REG, dest, src);
 +            return;
 +        case 16:
 +            tcg_out_ext16s(s, TCG_TYPE_REG, dest, src);
 +            return;
 +        case 32:
 +            tcg_out_ext32s(s, dest, src);
 +            return;
 +        }
 +    }
 +    g_assert_not_reached();
 +}
 +
- uint8_t s390_softfloat_exc_to_ieee(unsigned int exc)
+ static void tgen_gotoi(TCGContext *s, int cc, const tcg_insn_unit *dest)
  {
-     uint8_t s390_exc = 0;
+     ptrdiff_t off = tcg_pcrel_diff(s, dest) >> 1;
-@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(adb)(CPUS390XState *env, uint64_t f1, uint64_t f2)
+@@ -XXX,XX +XXX,XX @@ static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
- }
+     OP_32_64(extract):
+         tgen_extract(s, args[0], args[1], args[2], args[3]);
- /* 128-bit FP addition */
+         break;
--Int128 HELPER(axb)(CPUS390XState *env, uint64_t ah, uint64_t al,
++    OP_32_64(sextract):
--                     uint64_t bh, uint64_t bl)
++        tgen_sextract(s, args[0], args[1], args[2], args[3]);
-+Int128 HELPER(axb)(CPUS390XState *env, Int128 a, Int128 b)
++        break;
- {
--    float128 ret = float128_add(make_float128(ah, al),
+     case INDEX_op_clz_i64:
--                                make_float128(bh, bl),
+         tgen_clz(s, args[0], args[1], args[2], const_args[2]);
--                                &env->fpu_status);
+@@ -XXX,XX +XXX,XX @@ tcg_target_op_def(TCGOpcode op, TCGType type, unsigned flags)
-+    float128 ret = float128_add(ARG128(a), ARG128(b), &env->fpu_status);
+     case INDEX_op_extu_i32_i64:
-     handle_exceptions(env, false, GETPC());
+     case INDEX_op_extract_i32:
-     return RET128(ret);
+     case INDEX_op_extract_i64:
- }
++    case INDEX_op_sextract_i32:
-@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(sdb)(CPUS390XState *env, uint64_t f1, uint64_t f2)
++    case INDEX_op_sextract_i64:
- }
+     case INDEX_op_ctpop_i32:
+     case INDEX_op_ctpop_i64:
- /* 128-bit FP subtraction */
+         return C_O1_I1(r, r);
 -Int128 HELPER(sxb)(CPUS390XState *env, uint64_t ah, uint64_t al,
 -                     uint64_t bh, uint64_t bl)
 +Int128 HELPER(sxb)(CPUS390XState *env, Int128 a, Int128 b)
  {
 -    float128 ret = float128_sub(make_float128(ah, al),
 -                                make_float128(bh, bl),
 -                                &env->fpu_status);
 +    float128 ret = float128_sub(ARG128(a), ARG128(b), &env->fpu_status);
      handle_exceptions(env, false, GETPC());
      return RET128(ret);
  }
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(ddb)(CPUS390XState *env, uint64_t f1, uint64_t f2)
  }
  /* 128-bit FP division */
 -Int128 HELPER(dxb)(CPUS390XState *env, uint64_t ah, uint64_t al,
 -                     uint64_t bh, uint64_t bl)
 +Int128 HELPER(dxb)(CPUS390XState *env, Int128 a, Int128 b)
  {
 -    float128 ret = float128_div(make_float128(ah, al),
 -                                make_float128(bh, bl),
 -                                &env->fpu_status);
 +    float128 ret = float128_div(ARG128(a), ARG128(b), &env->fpu_status);
      handle_exceptions(env, false, GETPC());
      return RET128(ret);
  }
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(mdeb)(CPUS390XState *env, uint64_t f1, uint64_t f2)
  }
  /* 128-bit FP multiplication */
 -Int128 HELPER(mxb)(CPUS390XState *env, uint64_t ah, uint64_t al,
 -                     uint64_t bh, uint64_t bl)
 +Int128 HELPER(mxb)(CPUS390XState *env, Int128 a, Int128 b)
  {
 -    float128 ret = float128_mul(make_float128(ah, al),
 -                                make_float128(bh, bl),
 -                                &env->fpu_status);
 +    float128 ret = float128_mul(ARG128(a), ARG128(b), &env->fpu_status);
      handle_exceptions(env, false, GETPC());
      return RET128(ret);
  }
  /* 128/64-bit FP multiplication */
 -Int128 HELPER(mxdb)(CPUS390XState *env, uint64_t ah, uint64_t al, uint64_t f2)
 +Int128 HELPER(mxdb)(CPUS390XState *env, Int128 a, uint64_t f2)
  {
      float128 ret = float64_to_float128(f2, &env->fpu_status);
 -    ret = float128_mul(make_float128(ah, al), ret, &env->fpu_status);
 +    ret = float128_mul(ARG128(a), ret, &env->fpu_status);
      handle_exceptions(env, false, GETPC());
      return RET128(ret);
  }
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(ldeb)(CPUS390XState *env, uint64_t f2)
  }
  /* convert 128-bit float to 64-bit float */
 -uint64_t HELPER(ldxb)(CPUS390XState *env, uint64_t ah, uint64_t al,
 -                      uint32_t m34)
 +uint64_t HELPER(ldxb)(CPUS390XState *env, Int128 a, uint32_t m34)
  {
      int old_mode = s390_swap_bfp_rounding_mode(env, round_from_m34(m34));
 -    float64 ret = float128_to_float64(make_float128(ah, al), &env->fpu_status);
 +    float64 ret = float128_to_float64(ARG128(a), &env->fpu_status);
      s390_restore_bfp_rounding_mode(env, old_mode);
      handle_exceptions(env, xxc_from_m34(m34), GETPC());
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(ledb)(CPUS390XState *env, uint64_t f2, uint32_t m34)
  }
  /* convert 128-bit float to 32-bit float */
 -uint64_t HELPER(lexb)(CPUS390XState *env, uint64_t ah, uint64_t al,
 -                      uint32_t m34)
 +uint64_t HELPER(lexb)(CPUS390XState *env, Int128 a, uint32_t m34)
  {
      int old_mode = s390_swap_bfp_rounding_mode(env, round_from_m34(m34));
 -    float32 ret = float128_to_float32(make_float128(ah, al), &env->fpu_status);
 +    float32 ret = float128_to_float32(ARG128(a), &env->fpu_status);
      s390_restore_bfp_rounding_mode(env, old_mode);
      handle_exceptions(env, xxc_from_m34(m34), GETPC());
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(cdb)(CPUS390XState *env, uint64_t f1, uint64_t f2)
  }
  /* 128-bit FP compare */
 -uint32_t HELPER(cxb)(CPUS390XState *env, uint64_t ah, uint64_t al,
 -                     uint64_t bh, uint64_t bl)
 +uint32_t HELPER(cxb)(CPUS390XState *env, Int128 a, Int128 b)
  {
 -    FloatRelation cmp = float128_compare_quiet(make_float128(ah, al),
 -                                               make_float128(bh, bl),
 +    FloatRelation cmp = float128_compare_quiet(ARG128(a), ARG128(b),
                                                 &env->fpu_status);
      handle_exceptions(env, false, GETPC());
      return float_comp_to_cc(env, cmp);
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(cgdb)(CPUS390XState *env, uint64_t v2, uint32_t m34)
  }
  /* convert 128-bit float to 64-bit int */
 -uint64_t HELPER(cgxb)(CPUS390XState *env, uint64_t h, uint64_t l, uint32_t m34)
 +uint64_t HELPER(cgxb)(CPUS390XState *env, Int128 i2, uint32_t m34)
  {
      int old_mode = s390_swap_bfp_rounding_mode(env, round_from_m34(m34));
 -    float128 v2 = make_float128(h, l);
 +    float128 v2 = ARG128(i2);
      int64_t ret = float128_to_int64(v2, &env->fpu_status);
      uint32_t cc = set_cc_conv_f128(v2, &env->fpu_status);
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(cfdb)(CPUS390XState *env, uint64_t v2, uint32_t m34)
  }
  /* convert 128-bit float to 32-bit int */
 -uint64_t HELPER(cfxb)(CPUS390XState *env, uint64_t h, uint64_t l, uint32_t m34)
 +uint64_t HELPER(cfxb)(CPUS390XState *env, Int128 i2, uint32_t m34)
  {
      int old_mode = s390_swap_bfp_rounding_mode(env, round_from_m34(m34));
 -    float128 v2 = make_float128(h, l);
 +    float128 v2 = ARG128(i2);
      int32_t ret = float128_to_int32(v2, &env->fpu_status);
      uint32_t cc = set_cc_conv_f128(v2, &env->fpu_status);
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(clgdb)(CPUS390XState *env, uint64_t v2, uint32_t m34)
  }
  /* convert 128-bit float to 64-bit uint */
 -uint64_t HELPER(clgxb)(CPUS390XState *env, uint64_t h, uint64_t l, uint32_t m34)
 +uint64_t HELPER(clgxb)(CPUS390XState *env, Int128 i2, uint32_t m34)
  {
      int old_mode = s390_swap_bfp_rounding_mode(env, round_from_m34(m34));
 -    float128 v2 = make_float128(h, l);
 +    float128 v2 = ARG128(i2);
      uint64_t ret = float128_to_uint64(v2, &env->fpu_status);
      uint32_t cc = set_cc_conv_f128(v2, &env->fpu_status);
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(clfdb)(CPUS390XState *env, uint64_t v2, uint32_t m34)
  }
  /* convert 128-bit float to 32-bit uint */
 -uint64_t HELPER(clfxb)(CPUS390XState *env, uint64_t h, uint64_t l, uint32_t m34)
 +uint64_t HELPER(clfxb)(CPUS390XState *env, Int128 i2, uint32_t m34)
  {
      int old_mode = s390_swap_bfp_rounding_mode(env, round_from_m34(m34));
 -    float128 v2 = make_float128(h, l);
 +    float128 v2 = ARG128(i2);
      uint32_t ret = float128_to_uint32(v2, &env->fpu_status);
      uint32_t cc = set_cc_conv_f128(v2, &env->fpu_status);
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(fidb)(CPUS390XState *env, uint64_t f2, uint32_t m34)
  }
  /* round to integer 128-bit */
 -Int128 HELPER(fixb)(CPUS390XState *env, uint64_t ah, uint64_t al, uint32_t m34)
 +Int128 HELPER(fixb)(CPUS390XState *env, Int128 a, uint32_t m34)
  {
      int old_mode = s390_swap_bfp_rounding_mode(env, round_from_m34(m34));
 -    float128 ret = float128_round_to_int(make_float128(ah, al),
 -                                         &env->fpu_status);
 +    float128 ret = float128_round_to_int(ARG128(a), &env->fpu_status);
      s390_restore_bfp_rounding_mode(env, old_mode);
      handle_exceptions(env, xxc_from_m34(m34), GETPC());
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(kdb)(CPUS390XState *env, uint64_t f1, uint64_t f2)
  }
  /* 128-bit FP compare and signal */
 -uint32_t HELPER(kxb)(CPUS390XState *env, uint64_t ah, uint64_t al,
 -                     uint64_t bh, uint64_t bl)
 +uint32_t HELPER(kxb)(CPUS390XState *env, Int128 a, Int128 b)
  {
 -    FloatRelation cmp = float128_compare(make_float128(ah, al),
 -                                         make_float128(bh, bl),
 +    FloatRelation cmp = float128_compare(ARG128(a), ARG128(b),
                                           &env->fpu_status);
      handle_exceptions(env, false, GETPC());
      return float_comp_to_cc(env, cmp);
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(tcdb)(CPUS390XState *env, uint64_t v1, uint64_t m2)
  }
  /* test data class 128-bit */
 -uint32_t HELPER(tcxb)(CPUS390XState *env, uint64_t ah, uint64_t al, uint64_t m2)
 +uint32_t HELPER(tcxb)(CPUS390XState *env, Int128 a, uint64_t m2)
  {
 -    return (m2 & float128_dcmask(env, make_float128(ah, al))) != 0;
 +    return (m2 & float128_dcmask(env, ARG128(a))) != 0;
  }
  /* square root 32-bit */
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(sqdb)(CPUS390XState *env, uint64_t f2)
  }
  /* square root 128-bit */
 -Int128 HELPER(sqxb)(CPUS390XState *env, uint64_t ah, uint64_t al)
 +Int128 HELPER(sqxb)(CPUS390XState *env, Int128 a)
  {
 -    float128 ret = float128_sqrt(make_float128(ah, al), &env->fpu_status);
 +    float128 ret = float128_sqrt(ARG128(a), &env->fpu_status);
      handle_exceptions(env, false, GETPC());
      return RET128(ret);
  }
 diff --git a/target/s390x/tcg/translate.c b/target/s390x/tcg/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/s390x/tcg/translate.c
 +++ b/target/s390x/tcg/translate.c
@@ -XXX,XX +XXX,XX @@ static TCGv_i64 load_freg32_i64(int reg)
      return r;
  }
 +static TCGv_i128 load_freg_128(int reg)
 +{
 +    TCGv_i64 h = load_freg(reg);
 +    TCGv_i64 l = load_freg(reg + 2);
 +    TCGv_i128 r = tcg_temp_new_i128();
 +
 +    tcg_gen_concat_i64_i128(r, l, h);
 +    tcg_temp_free_i64(h);
 +    tcg_temp_free_i64(l);
 +    return r;
 +}
 +
  static void store_reg(int reg, TCGv_i64 v)
  {
      tcg_gen_mov_i64(regs[reg], v);
@@ -XXX,XX +XXX,XX @@ typedef struct {
      bool g_out, g_out2, g_in1, g_in2;
      TCGv_i64 out, out2, in1, in2;
      TCGv_i64 addr1;
 -    TCGv_i128 out_128;
 +    TCGv_i128 out_128, in1_128, in2_128;
  } DisasOps;
  /* Instructions can place constraints on their operands, raising specification
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_adb(DisasContext *s, DisasOps *o)
  static DisasJumpType op_axb(DisasContext *s, DisasOps *o)
  {
 -    gen_helper_axb(o->out_128, cpu_env, o->out, o->out2, o->in1, o->in2);
 +    gen_helper_axb(o->out_128, cpu_env, o->in1_128, o->in2_128);
      return DISAS_NEXT;
  }
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_cdb(DisasContext *s, DisasOps *o)
  static DisasJumpType op_cxb(DisasContext *s, DisasOps *o)
  {
 -    gen_helper_cxb(cc_op, cpu_env, o->out, o->out2, o->in1, o->in2);
 +    gen_helper_cxb(cc_op, cpu_env, o->in1_128, o->in2_128);
      set_cc_static(s);
      return DISAS_NEXT;
  }
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_cfxb(DisasContext *s, DisasOps *o)
      if (!m34) {
          return DISAS_NORETURN;
      }
 -    gen_helper_cfxb(o->out, cpu_env, o->in1, o->in2, m34);
 +    gen_helper_cfxb(o->out, cpu_env, o->in2_128, m34);
      tcg_temp_free_i32(m34);
      set_cc_static(s);
      return DISAS_NEXT;
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_cgxb(DisasContext *s, DisasOps *o)
      if (!m34) {
          return DISAS_NORETURN;
      }
 -    gen_helper_cgxb(o->out, cpu_env, o->in1, o->in2, m34);
 +    gen_helper_cgxb(o->out, cpu_env, o->in2_128, m34);
      tcg_temp_free_i32(m34);
      set_cc_static(s);
      return DISAS_NEXT;
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_clfxb(DisasContext *s, DisasOps *o)
      if (!m34) {
          return DISAS_NORETURN;
      }
 -    gen_helper_clfxb(o->out, cpu_env, o->in1, o->in2, m34);
 +    gen_helper_clfxb(o->out, cpu_env, o->in2_128, m34);
      tcg_temp_free_i32(m34);
      set_cc_static(s);
      return DISAS_NEXT;
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_clgxb(DisasContext *s, DisasOps *o)
      if (!m34) {
          return DISAS_NORETURN;
      }
 -    gen_helper_clgxb(o->out, cpu_env, o->in1, o->in2, m34);
 +    gen_helper_clgxb(o->out, cpu_env, o->in2_128, m34);
      tcg_temp_free_i32(m34);
      set_cc_static(s);
      return DISAS_NEXT;
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_ddb(DisasContext *s, DisasOps *o)
  static DisasJumpType op_dxb(DisasContext *s, DisasOps *o)
  {
 -    gen_helper_dxb(o->out_128, cpu_env, o->out, o->out2, o->in1, o->in2);
 +    gen_helper_dxb(o->out_128, cpu_env, o->in1_128, o->in2_128);
      return DISAS_NEXT;
  }
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_fixb(DisasContext *s, DisasOps *o)
      if (!m34) {
          return DISAS_NORETURN;
      }
 -    gen_helper_fixb(o->out_128, cpu_env, o->in1, o->in2, m34);
 +    gen_helper_fixb(o->out_128, cpu_env, o->in2_128, m34);
      tcg_temp_free_i32(m34);
      return DISAS_NEXT;
  }
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_kdb(DisasContext *s, DisasOps *o)
  static DisasJumpType op_kxb(DisasContext *s, DisasOps *o)
  {
 -    gen_helper_kxb(cc_op, cpu_env, o->out, o->out2, o->in1, o->in2);
 +    gen_helper_kxb(cc_op, cpu_env, o->in1_128, o->in2_128);
      set_cc_static(s);
      return DISAS_NEXT;
  }
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_ldxb(DisasContext *s, DisasOps *o)
      if (!m34) {
          return DISAS_NORETURN;
      }
 -    gen_helper_ldxb(o->out, cpu_env, o->in1, o->in2, m34);
 +    gen_helper_ldxb(o->out, cpu_env, o->in2_128, m34);
      tcg_temp_free_i32(m34);
      return DISAS_NEXT;
  }
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_lexb(DisasContext *s, DisasOps *o)
      if (!m34) {
          return DISAS_NORETURN;
      }
 -    gen_helper_lexb(o->out, cpu_env, o->in1, o->in2, m34);
 +    gen_helper_lexb(o->out, cpu_env, o->in2_128, m34);
      tcg_temp_free_i32(m34);
      return DISAS_NEXT;
  }
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_mdb(DisasContext *s, DisasOps *o)
  static DisasJumpType op_mxb(DisasContext *s, DisasOps *o)
  {
 -    gen_helper_mxb(o->out_128, cpu_env, o->out, o->out2, o->in1, o->in2);
 +    gen_helper_mxb(o->out_128, cpu_env, o->in1_128, o->in2_128);
      return DISAS_NEXT;
  }
  static DisasJumpType op_mxdb(DisasContext *s, DisasOps *o)
  {
 -    gen_helper_mxdb(o->out_128, cpu_env, o->out, o->out2, o->in2);
 +    gen_helper_mxdb(o->out_128, cpu_env, o->in1_128, o->in2);
      return DISAS_NEXT;
  }
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_sdb(DisasContext *s, DisasOps *o)
  static DisasJumpType op_sxb(DisasContext *s, DisasOps *o)
  {
 -    gen_helper_sxb(o->out_128, cpu_env, o->out, o->out2, o->in1, o->in2);
 +    gen_helper_sxb(o->out_128, cpu_env, o->in1_128, o->in2_128);
      return DISAS_NEXT;
  }
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_sqdb(DisasContext *s, DisasOps *o)
  static DisasJumpType op_sqxb(DisasContext *s, DisasOps *o)
  {
 -    gen_helper_sqxb(o->out_128, cpu_env, o->in1, o->in2);
 +    gen_helper_sqxb(o->out_128, cpu_env, o->in2_128);
      return DISAS_NEXT;
  }
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_tcdb(DisasContext *s, DisasOps *o)
  static DisasJumpType op_tcxb(DisasContext *s, DisasOps *o)
  {
 -    gen_helper_tcxb(cc_op, cpu_env, o->out, o->out2, o->in2);
 +    gen_helper_tcxb(cc_op, cpu_env, o->in1_128, o->in2);
      set_cc_static(s);
      return DISAS_NEXT;
  }
@@ -XXX,XX +XXX,XX @@ static void prep_new_P(DisasContext *s, DisasOps *o)
  static void prep_new_x(DisasContext *s, DisasOps *o)
  {
 -    o->out = tcg_temp_new_i64();
 -    o->out2 = tcg_temp_new_i64();
      o->out_128 = tcg_temp_new_i128();
  }
  #define SPEC_prep_new_x 0
@@ -XXX,XX +XXX,XX @@ static void prep_r1_P(DisasContext *s, DisasOps *o)
  static void prep_x1(DisasContext *s, DisasOps *o)
  {
 -    o->out = load_freg(get_field(s, r1));
 -    o->out2 = load_freg(get_field(s, r1) + 2);
 -    o->out_128 = tcg_temp_new_i128();
 -    tcg_gen_concat_i64_i128(o->out_128, o->out2, o->out);
 +    o->out_128 = load_freg_128(get_field(s, r1));
  }
  #define SPEC_prep_x1 SPEC_r1_f128
@@ -XXX,XX +XXX,XX @@ static void wout_x1(DisasContext *s, DisasOps *o)
  {
      int f1 = get_field(s, r1);
 +    /* Split out_128 into out+out2 for cout_f128. */
 +    tcg_debug_assert(o->out == NULL);
 +    o->out = tcg_temp_new_i64();
 +    o->out2 = tcg_temp_new_i64();
 +
      tcg_gen_extr_i128_i64(o->out2, o->out, o->out_128);
      store_freg(f1, o->out);
      store_freg(f1 + 2, o->out2);
@@ -XXX,XX +XXX,XX @@ static void in1_f1(DisasContext *s, DisasOps *o)
  }
  #define SPEC_in1_f1 0
 +static void in1_x1(DisasContext *s, DisasOps *o)
 +{
 +    o->in1_128 = load_freg_128(get_field(s, r1));
 +}
 +#define SPEC_in1_x1 SPEC_r1_f128
 +
  /* Load the high double word of an extended (128-bit) format FP number */
  static void in1_x2h(DisasContext *s, DisasOps *o)
  {
@@ -XXX,XX +XXX,XX @@ static void in2_f2(DisasContext *s, DisasOps *o)
  }
  #define SPEC_in2_f2 0
 +static void in2_x2(DisasContext *s, DisasOps *o)
 +{
 +    o->in2_128 = load_freg_128(get_field(s, r2));
 +}
 +#define SPEC_in2_x2 SPEC_r2_f128
 +
  /* Load the low double word of an extended (128-bit) format FP number */
  static void in2_x2l(DisasContext *s, DisasOps *o)
  {
@@ -XXX,XX +XXX,XX @@ static DisasJumpType translate_one(CPUS390XState *env, DisasContext *s)
      if (o.out_128) {
          tcg_temp_free_i128(o.out_128);
      }
 +    if (o.in1_128) {
 +        tcg_temp_free_i128(o.in1_128);
 +    }
 +    if (o.in2_128) {
 +        tcg_temp_free_i128(o.in2_128);
 +    }
      /* io should be the last instruction in tb when icount is enabled */
      if (unlikely(icount && ret == DISAS_NEXT)) {
          ret = DISAS_TOO_MANY;
 --
-.34.1
+.43.0

-New patch
+[PULL 58/68] tcg/sparc64: Use SRA, SRL for {s}extract_i64
+Extracts which abut bit 32 may use 32-bit shifts.
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+---
+ tcg/sparc64/tcg-target-has.h | 13 +++++++++----
+ tcg/sparc64/tcg-target.c.inc | 11 +++++++++++
+files changed, 20 insertions(+), 4 deletions(-)
+diff --git a/tcg/sparc64/tcg-target-has.h b/tcg/sparc64/tcg-target-has.h
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/sparc64/tcg-target-has.h
++++ b/tcg/sparc64/tcg-target-has.h
+@@ -XXX,XX +XXX,XX @@ extern bool use_vis3_instructions;
+ #define TCG_TARGET_HAS_ctz_i32          0
+ #define TCG_TARGET_HAS_ctpop_i32        0
+ #define TCG_TARGET_HAS_deposit_i32      0
+-#define TCG_TARGET_HAS_extract_i32      0
+-#define TCG_TARGET_HAS_sextract_i32     0
++#define TCG_TARGET_HAS_extract_i32      1
++#define TCG_TARGET_HAS_sextract_i32     1
+ #define TCG_TARGET_HAS_extract2_i32     0
+ #define TCG_TARGET_HAS_negsetcond_i32   1
+ #define TCG_TARGET_HAS_add2_i32         1
+@@ -XXX,XX +XXX,XX @@ extern bool use_vis3_instructions;
+ #define TCG_TARGET_HAS_ctz_i64          0
+ #define TCG_TARGET_HAS_ctpop_i64        0
+ #define TCG_TARGET_HAS_deposit_i64      0
+-#define TCG_TARGET_HAS_extract_i64      0
+-#define TCG_TARGET_HAS_sextract_i64     0
++#define TCG_TARGET_HAS_extract_i64      1
++#define TCG_TARGET_HAS_sextract_i64     1
+ #define TCG_TARGET_HAS_extract2_i64     0
+ #define TCG_TARGET_HAS_negsetcond_i64   1
+ #define TCG_TARGET_HAS_add2_i64         1
+@@ -XXX,XX +XXX,XX @@ extern bool use_vis3_instructions;
+ #define TCG_TARGET_HAS_tst              1
++#define TCG_TARGET_extract_valid(type, ofs, len) \
++    ((type) == TCG_TYPE_I64 && (ofs) + (len) == 32)
++
++#define TCG_TARGET_sextract_valid  TCG_TARGET_extract_valid
++
+ #endif
+diff --git a/tcg/sparc64/tcg-target.c.inc b/tcg/sparc64/tcg-target.c.inc
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/sparc64/tcg-target.c.inc
++++ b/tcg/sparc64/tcg-target.c.inc
+@@ -XXX,XX +XXX,XX @@ static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
+         tcg_out_mb(s, a0);
+         break;
++    case INDEX_op_extract_i64:
++        tcg_debug_assert(a2 + args[3] == 32);
++        tcg_out_arithi(s, a0, a1, a2, SHIFT_SRL);
++        break;
++    case INDEX_op_sextract_i64:
++        tcg_debug_assert(a2 + args[3] == 32);
++        tcg_out_arithi(s, a0, a1, a2, SHIFT_SRA);
++        break;
++
+     case INDEX_op_mov_i32:  /* Always emitted via tcg_out_mov.  */
+     case INDEX_op_mov_i64:
+     case INDEX_op_call:     /* Always emitted via tcg_out_call.  */
+@@ -XXX,XX +XXX,XX @@ tcg_target_op_def(TCGOpcode op, TCGType type, unsigned flags)
+     case INDEX_op_ext32u_i64:
+     case INDEX_op_ext_i32_i64:
+     case INDEX_op_extu_i32_i64:
++    case INDEX_op_extract_i64:
++    case INDEX_op_sextract_i64:
+     case INDEX_op_qemu_ld_a32_i32:
+     case INDEX_op_qemu_ld_a64_i32:
+     case INDEX_op_qemu_ld_a32_i64:
+--
+.43.0

-[PULL 10/40] include/qemu/int128: Use Int128 structure for TCI
+[PULL 59/68] tcg/tci: Provide TCG_TARGET_{s}extract_valid
-We are about to allow passing Int128 to/from tcg helper functions,
+Trivially mirrors TCG_TARGET_HAS_{s}extract_*.
 but libffi doesn't support __int128_t, so use the structure.
-In order for atomic128.h to continue working, we must provide
-a mechanism to frob between real __int128_t and the structure.
-Provide a new union, Int128Alias, for this.  We cannot modify
-Int128 itself, as any changed alignment would also break libffi.
-Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
 Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 ---
- include/qemu/atomic128.h | 29 +++++++++++++++++++++------
+ tcg/tci/tcg-target-has.h | 3 +++
- include/qemu/int128.h    | 25 +++++++++++++++++++++---
+file changed, 3 insertions(+)
  util/int128.c            | 42 ++++++++++++++++++++++++++++++++++++++++
 files changed, 87 insertions(+), 9 deletions(-)
-diff --git a/include/qemu/atomic128.h b/include/qemu/atomic128.h
+diff --git a/tcg/tci/tcg-target-has.h b/tcg/tci/tcg-target-has.h
 index XXXXXXX..XXXXXXX 100644
---- a/include/qemu/atomic128.h
+--- a/tcg/tci/tcg-target-has.h
-+++ b/include/qemu/atomic128.h
++++ b/tcg/tci/tcg-target-has.h
 @@ -XXX,XX +XXX,XX @@
- #if defined(CONFIG_ATOMIC128)
- static inline Int128 atomic16_cmpxchg(Int128 *ptr, Int128 cmp, Int128 new)
+ #define TCG_TARGET_HAS_tst              1
- {
--    return qatomic_cmpxchg__nocheck(ptr, cmp, new);
++#define TCG_TARGET_extract_valid(type, ofs, len)   1
-+    Int128Alias r, c, n;
++#define TCG_TARGET_sextract_valid(type, ofs, len)  1
 +
 +    c.s = cmp;
 +    n.s = new;
 +    r.i = qatomic_cmpxchg__nocheck((__int128_t *)ptr, c.i, n.i);
 +    return r.s;
  }
  # define HAVE_CMPXCHG128 1
  #elif defined(CONFIG_CMPXCHG128)
  static inline Int128 atomic16_cmpxchg(Int128 *ptr, Int128 cmp, Int128 new)
  {
 -    return __sync_val_compare_and_swap_16(ptr, cmp, new);
 +    Int128Alias r, c, n;
 +
 +    c.s = cmp;
 +    n.s = new;
 +    r.i = __sync_val_compare_and_swap_16((__int128_t *)ptr, c.i, n.i);
 +    return r.s;
  }
  # define HAVE_CMPXCHG128 1
  #elif defined(__aarch64__)
@@ -XXX,XX +XXX,XX @@ Int128 QEMU_ERROR("unsupported atomic")
  #if defined(CONFIG_ATOMIC128)
  static inline Int128 atomic16_read(Int128 *ptr)
  {
 -    return qatomic_read__nocheck(ptr);
 +    Int128Alias r;
 +
 +    r.i = qatomic_read__nocheck((__int128_t *)ptr);
 +    return r.s;
  }
  static inline void atomic16_set(Int128 *ptr, Int128 val)
  {
 -    qatomic_set__nocheck(ptr, val);
 +    Int128Alias v;
 +
 +    v.s = val;
 +    qatomic_set__nocheck((__int128_t *)ptr, v.i);
  }
  # define HAVE_ATOMIC128 1
@@ -XXX,XX +XXX,XX @@ static inline void atomic16_set(Int128 *ptr, Int128 val)
  static inline Int128 atomic16_read(Int128 *ptr)
  {
      /* Maybe replace 0 with 0, returning the old value.  */
 -    return atomic16_cmpxchg(ptr, 0, 0);
 +    Int128 z = int128_make64(0);
 +    return atomic16_cmpxchg(ptr, z, z);
  }
  static inline void atomic16_set(Int128 *ptr, Int128 val)
@@ -XXX,XX +XXX,XX @@ static inline void atomic16_set(Int128 *ptr, Int128 val)
      do {
          cmp = old;
          old = atomic16_cmpxchg(ptr, cmp, val);
 -    } while (old != cmp);
 +    } while (int128_ne(old, cmp));
  }
  # define HAVE_ATOMIC128 1
 diff --git a/include/qemu/int128.h b/include/qemu/int128.h
 index XXXXXXX..XXXXXXX 100644
 --- a/include/qemu/int128.h
 +++ b/include/qemu/int128.h
@@ -XXX,XX +XXX,XX @@
  #include "qemu/bswap.h"
 -#ifdef CONFIG_INT128
 +/*
 + * With TCI, we need to use libffi for interfacing with TCG helpers.
 + * But libffi does not support __int128_t, and therefore cannot pass
 + * or return values of this type, force use of the Int128 struct.
 + */
 +#if defined(CONFIG_INT128) && !defined(CONFIG_TCG_INTERPRETER)
  typedef __int128_t Int128;
  static inline Int128 int128_make64(uint64_t a)
@@ -XXX,XX +XXX,XX @@ Int128 int128_divu(Int128, Int128);
  Int128 int128_remu(Int128, Int128);
  Int128 int128_divs(Int128, Int128);
  Int128 int128_rems(Int128, Int128);
 -
 -#endif /* CONFIG_INT128 */
 +#endif /* CONFIG_INT128 && !CONFIG_TCG_INTERPRETER */
  static inline void bswap128s(Int128 *s)
  {
@@ -XXX,XX +XXX,XX @@ static inline void bswap128s(Int128 *s)
  #define INT128_MAX int128_make128(UINT64_MAX, INT64_MAX)
  #define INT128_MIN int128_make128(0, INT64_MIN)
 +/*
 + * When compiler supports a 128-bit type, define a combination of
 + * a possible structure and the native types.  Ease parameter passing
 + * via use of the transparent union extension.
 + */
 +#ifdef CONFIG_INT128
 +typedef union {
 +    Int128 s;
 +    __int128_t i;
 +    __uint128_t u;
 +} Int128Alias __attribute__((transparent_union));
 +#else
 +typedef Int128 Int128Alias;
 +#endif /* CONFIG_INT128 */
 +
  #endif /* INT128_H */
 diff --git a/util/int128.c b/util/int128.c
 index XXXXXXX..XXXXXXX 100644
 --- a/util/int128.c
 +++ b/util/int128.c
@@ -XXX,XX +XXX,XX @@ Int128 int128_rems(Int128 a, Int128 b)
      return r;
  }
 +#elif defined(CONFIG_TCG_INTERPRETER)
 +
 +Int128 int128_divu(Int128 a_s, Int128 b_s)
 +{
 +    Int128Alias r, a, b;
 +
 +    a.s = a_s;
 +    b.s = b_s;
 +    r.u = a.u / b.u;
 +    return r.s;
 +}
 +
 +Int128 int128_remu(Int128 a_s, Int128 b_s)
 +{
 +    Int128Alias r, a, b;
 +
 +    a.s = a_s;
 +    b.s = b_s;
 +    r.u = a.u % b.u;
 +    return r.s;
 +}
 +
 +Int128 int128_divs(Int128 a_s, Int128 b_s)
 +{
 +    Int128Alias r, a, b;
 +
 +    a.s = a_s;
 +    b.s = b_s;
 +    r.i = a.i / b.i;
 +    return r.s;
 +}
 +
 +Int128 int128_rems(Int128 a_s, Int128 b_s)
 +{
 +    Int128Alias r, a, b;
 +
 +    a.s = a_s;
 +    b.s = b_s;
 +    r.i = a.i % b.i;
 +    return r.s;
 +}
 +
  #endif
 --
-.34.1
+.43.0

-[PULL 32/40] target/s390x: Copy wout_x1 to wout_x1_P
+[PULL 60/68] tcg/tci: Remove assertions for deposit and extract
-Make a copy of wout_x1 before modifying it, as wout_x1_P
+We already have these assertions during opcode creation.
 emphasizing that it operates on the out/out2 pair.  The insns
 that use x1_P are data movement that will not change to Int128.
-Acked-by: Ilya Leoshkevich <iii@linux.ibm.com>
 Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 ---
- target/s390x/tcg/insn-data.h.inc | 12 ++++++------
+ tcg/tci/tcg-target.c.inc | 20 ++------------------
- target/s390x/tcg/translate.c     |  8 ++++++++
+file changed, 2 insertions(+), 18 deletions(-)
 files changed, 14 insertions(+), 6 deletions(-)
-diff --git a/target/s390x/tcg/insn-data.h.inc b/target/s390x/tcg/insn-data.h.inc
+diff --git a/tcg/tci/tcg-target.c.inc b/tcg/tci/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
---- a/target/s390x/tcg/insn-data.h.inc
+--- a/tcg/tci/tcg-target.c.inc
-+++ b/target/s390x/tcg/insn-data.h.inc
++++ b/tcg/tci/tcg-target.c.inc
-@@ -XXX,XX +XXX,XX @@
+@@ -XXX,XX +XXX,XX @@ static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
-     F(0x3800, LER,     RR_a,  Z,   0, e2, 0, cond_e1e2, mov2, 0, IF_AFP1 | IF_AFP2)
+         break;
-     F(0x7800, LE,      RX_a,  Z,   0, m2_32u, 0, e1, mov2, 0, IF_AFP1)
-     F(0xed64, LEY,     RXY_a, LD,  0, m2_32u, 0, e1, mov2, 0, IF_AFP1)
+     CASE_32_64(deposit)  /* Optional (TCG_TARGET_HAS_deposit_*). */
--    F(0xb365, LXR,     RRE,   Z,   x2h, x2l, 0, x1, movx, 0, IF_AFP1)
+-        {
-+    F(0xb365, LXR,     RRE,   Z,   x2h, x2l, 0, x1_P, movx, 0, IF_AFP1)
+-            TCGArg pos = args[3], len = args[4];
- /* LOAD IMMEDIATE */
+-            TCGArg max = opc == INDEX_op_deposit_i32 ? 32 : 64;
-     C(0xc001, LGFI,    RIL_a, EI,  0, i2, 0, r1, mov2, 0)
+-
- /* LOAD RELATIVE LONG */
+-            tcg_debug_assert(pos < max);
-@@ -XXX,XX +XXX,XX @@
+-            tcg_debug_assert(pos + len <= max);
-     C(0xe332, LTGF,    RXY_a, GIE, 0, a2, r1, 0, ld32s, s64)
+-
-     F(0xb302, LTEBR,   RRE,   Z,   0, e2, 0, cond_e1e2, mov2, f32, IF_BFP)
+-            tcg_out_op_rrrbb(s, opc, args[0], args[1], args[2], pos, len);
-     F(0xb312, LTDBR,   RRE,   Z,   0, f2, 0, f1, mov2, f64, IF_BFP)
+-        }
--    F(0xb342, LTXBR,   RRE,   Z,   x2h, x2l, 0, x1, movx, f128, IF_BFP)
++        tcg_out_op_rrrbb(s, opc, args[0], args[1], args[2], args[3], args[4]);
-+    F(0xb342, LTXBR,   RRE,   Z,   x2h, x2l, 0, x1_P, movx, f128, IF_BFP)
+         break;
- /* LOAD AND TRAP */
-     C(0xe39f, LAT,     RXY_a, LAT, 0, m2_32u, r1, 0, lat, 0)
+     CASE_32_64(extract)  /* Optional (TCG_TARGET_HAS_extract_*). */
-     C(0xe385, LGAT,    RXY_a, LAT, 0, a2, r1, 0, lgat, 0)
+     CASE_32_64(sextract) /* Optional (TCG_TARGET_HAS_sextract_*). */
-@@ -XXX,XX +XXX,XX @@
+-        {
-     C(0xb913, LCGFR,   RRE,   Z,   0, r2_32s, r1, 0, neg, neg64)
+-            TCGArg pos = args[2], len = args[3];
-     F(0xb303, LCEBR,   RRE,   Z,   0, e2, new, e1, negf32, f32, IF_BFP)
+-            TCGArg max = type == TCG_TYPE_I32 ? 32 : 64;
-     F(0xb313, LCDBR,   RRE,   Z,   0, f2, new, f1, negf64, f64, IF_BFP)
+-
--    F(0xb343, LCXBR,   RRE,   Z,   x2h, x2l, new_P, x1, negf128, f128, IF_BFP)
+-            tcg_debug_assert(pos < max);
-+    F(0xb343, LCXBR,   RRE,   Z,   x2h, x2l, new_P, x1_P, negf128, f128, IF_BFP)
+-            tcg_debug_assert(pos + len <= max);
-     F(0xb373, LCDFR,   RRE,   FPSSH, 0, f2, new, f1, negf64, 0, IF_AFP1 | IF_AFP2)
+-
- /* LOAD COUNT TO BLOCK BOUNDARY */
+-            tcg_out_op_rrbb(s, opc, args[0], args[1], pos, len);
-     C(0xe727, LCBB,    RXE,   V,   la2, 0, r1, 0, lcbb, 0)
+-        }
-@@ -XXX,XX +XXX,XX @@
++        tcg_out_op_rrbb(s, opc, args[0], args[1], args[2], args[3]);
-     C(0xb911, LNGFR,   RRE,   Z,   0, r2_32s, r1, 0, nabs, nabs64)
+         break;
-     F(0xb301, LNEBR,   RRE,   Z,   0, e2, new, e1, nabsf32, f32, IF_BFP)
-     F(0xb311, LNDBR,   RRE,   Z,   0, f2, new, f1, nabsf64, f64, IF_BFP)
+     CASE_32_64(brcond)
 -    F(0xb341, LNXBR,   RRE,   Z,   x2h, x2l, new_P, x1, nabsf128, f128, IF_BFP)
 +    F(0xb341, LNXBR,   RRE,   Z,   x2h, x2l, new_P, x1_P, nabsf128, f128, IF_BFP)
      F(0xb371, LNDFR,   RRE,   FPSSH, 0, f2, new, f1, nabsf64, 0, IF_AFP1 | IF_AFP2)
  /* LOAD ON CONDITION */
      C(0xb9f2, LOCR,    RRF_c, LOC, r1, r2, new, r1_32, loc, 0)
@@ -XXX,XX +XXX,XX @@
      C(0xb910, LPGFR,   RRE,   Z,   0, r2_32s, r1, 0, abs, abs64)
      F(0xb300, LPEBR,   RRE,   Z,   0, e2, new, e1, absf32, f32, IF_BFP)
      F(0xb310, LPDBR,   RRE,   Z,   0, f2, new, f1, absf64, f64, IF_BFP)
 -    F(0xb340, LPXBR,   RRE,   Z,   x2h, x2l, new_P, x1, absf128, f128, IF_BFP)
 +    F(0xb340, LPXBR,   RRE,   Z,   x2h, x2l, new_P, x1_P, absf128, f128, IF_BFP)
      F(0xb370, LPDFR,   RRE,   FPSSH, 0, f2, new, f1, absf64, 0, IF_AFP1 | IF_AFP2)
  /* LOAD REVERSED */
      C(0xb91f, LRVR,    RRE,   Z,   0, r2_32u, new, r1_32, rev32, 0)
@@ -XXX,XX +XXX,XX @@
  /* LOAD ZERO */
      F(0xb374, LZER,    RRE,   Z,   0, 0, 0, e1, zero, 0, IF_AFP1)
      F(0xb375, LZDR,    RRE,   Z,   0, 0, 0, f1, zero, 0, IF_AFP1)
 -    F(0xb376, LZXR,    RRE,   Z,   0, 0, 0, x1, zero2, 0, IF_AFP1)
 +    F(0xb376, LZXR,    RRE,   Z,   0, 0, 0, x1_P, zero2, 0, IF_AFP1)
  /* LOAD FPC */
      F(0xb29d, LFPC,    S,     Z,   0, m2_32u, 0, 0, sfpc, 0, IF_BFP)
 diff --git a/target/s390x/tcg/translate.c b/target/s390x/tcg/translate.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/s390x/tcg/translate.c
 +++ b/target/s390x/tcg/translate.c
@@ -XXX,XX +XXX,XX @@ static void wout_x1(DisasContext *s, DisasOps *o)
  }
  #define SPEC_wout_x1 SPEC_r1_f128
 +static void wout_x1_P(DisasContext *s, DisasOps *o)
 +{
 +    int f1 = get_field(s, r1);
 +    store_freg(f1, o->out);
 +    store_freg(f1 + 2, o->out2);
 +}
 +#define SPEC_wout_x1_P SPEC_r1_f128
 +
  static void wout_cond_r1r2_32(DisasContext *s, DisasOps *o)
  {
      if (get_field(s, r1) != get_field(s, r2)) {
 --
-.34.1
+.43.0

-[PULL 12/40] tcg/tci: Fix big-endian return register ordering
+[PULL 61/68] tcg: Remove TCG_TARGET_HAS_{s}extract_{i32,i64}
-We expect the backend to require register pairs in
+Make extract and sextract "unconditional" in the sense
-host-endian ordering, thus for big-endian the first
+that the opcodes are always present.  Rely instead on
-register of a pair contains the high part.
+TCG_TARGET_HAS_{s}extract_valid, now always defined.
 We were forcing R0 to contain the low part for calls.
-Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
 Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 ---
- tcg/tci.c | 21 +++++++++++----------
+ tcg/aarch64/tcg-target-has.h     |  4 ----
-file changed, 11 insertions(+), 10 deletions(-)
+ tcg/arm/tcg-target-has.h         |  2 --
  tcg/i386/tcg-target-has.h        |  4 ----
  tcg/loongarch64/tcg-target-has.h |  4 ----
  tcg/mips/tcg-target-has.h        |  4 ----
  tcg/ppc/tcg-target-has.h         |  4 ----
  tcg/riscv/tcg-target-has.h       |  4 ----
  tcg/s390x/tcg-target-has.h       |  4 ----
  tcg/sparc64/tcg-target-has.h     |  4 ----
  tcg/tcg-has.h                    | 12 ------------
  tcg/tci/tcg-target-has.h         |  4 ----
  tcg/optimize.c                   |  8 ++++----
  tcg/tcg.c                        | 12 ++++--------
  tcg/tci.c                        |  8 --------
 files changed, 8 insertions(+), 70 deletions(-)
+diff --git a/tcg/aarch64/tcg-target-has.h b/tcg/aarch64/tcg-target-has.h
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/aarch64/tcg-target-has.h
++++ b/tcg/aarch64/tcg-target-has.h
+@@ -XXX,XX +XXX,XX @@
+ #define TCG_TARGET_HAS_ctz_i32          1
+ #define TCG_TARGET_HAS_ctpop_i32        0
+ #define TCG_TARGET_HAS_deposit_i32      1
+-#define TCG_TARGET_HAS_extract_i32      1
+-#define TCG_TARGET_HAS_sextract_i32     1
+ #define TCG_TARGET_HAS_extract2_i32     1
+ #define TCG_TARGET_HAS_negsetcond_i32   1
+ #define TCG_TARGET_HAS_add2_i32         1
+@@ -XXX,XX +XXX,XX @@
+ #define TCG_TARGET_HAS_ctz_i64          1
+ #define TCG_TARGET_HAS_ctpop_i64        0
+ #define TCG_TARGET_HAS_deposit_i64      1
+-#define TCG_TARGET_HAS_extract_i64      1
+-#define TCG_TARGET_HAS_sextract_i64     1
+ #define TCG_TARGET_HAS_extract2_i64     1
+ #define TCG_TARGET_HAS_negsetcond_i64   1
+ #define TCG_TARGET_HAS_add2_i64         1
+diff --git a/tcg/arm/tcg-target-has.h b/tcg/arm/tcg-target-has.h
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/arm/tcg-target-has.h
++++ b/tcg/arm/tcg-target-has.h
+@@ -XXX,XX +XXX,XX @@ extern bool use_neon_instructions;
+ #define TCG_TARGET_HAS_ctz_i32          use_armv7_instructions
+ #define TCG_TARGET_HAS_ctpop_i32        0
+ #define TCG_TARGET_HAS_deposit_i32      use_armv7_instructions
+-#define TCG_TARGET_HAS_extract_i32      1
+-#define TCG_TARGET_HAS_sextract_i32     1
+ #define TCG_TARGET_HAS_extract2_i32     1
+ #define TCG_TARGET_HAS_negsetcond_i32   1
+ #define TCG_TARGET_HAS_mulu2_i32        1
+diff --git a/tcg/i386/tcg-target-has.h b/tcg/i386/tcg-target-has.h
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/i386/tcg-target-has.h
++++ b/tcg/i386/tcg-target-has.h
+@@ -XXX,XX +XXX,XX @@
+ #define TCG_TARGET_HAS_ctz_i32          1
+ #define TCG_TARGET_HAS_ctpop_i32        have_popcnt
+ #define TCG_TARGET_HAS_deposit_i32      1
+-#define TCG_TARGET_HAS_extract_i32      1
+-#define TCG_TARGET_HAS_sextract_i32     1
+ #define TCG_TARGET_HAS_extract2_i32     1
+ #define TCG_TARGET_HAS_negsetcond_i32   1
+ #define TCG_TARGET_HAS_add2_i32         1
+@@ -XXX,XX +XXX,XX @@
+ #define TCG_TARGET_HAS_ctz_i64          1
+ #define TCG_TARGET_HAS_ctpop_i64        have_popcnt
+ #define TCG_TARGET_HAS_deposit_i64      1
+-#define TCG_TARGET_HAS_extract_i64      1
+-#define TCG_TARGET_HAS_sextract_i64     1
+ #define TCG_TARGET_HAS_extract2_i64     1
+ #define TCG_TARGET_HAS_negsetcond_i64   1
+ #define TCG_TARGET_HAS_add2_i64         1
+diff --git a/tcg/loongarch64/tcg-target-has.h b/tcg/loongarch64/tcg-target-has.h
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/loongarch64/tcg-target-has.h
++++ b/tcg/loongarch64/tcg-target-has.h
+@@ -XXX,XX +XXX,XX @@
+ #define TCG_TARGET_HAS_div2_i32         0
+ #define TCG_TARGET_HAS_rot_i32          1
+ #define TCG_TARGET_HAS_deposit_i32      1
+-#define TCG_TARGET_HAS_extract_i32      1
+-#define TCG_TARGET_HAS_sextract_i32     1
+ #define TCG_TARGET_HAS_extract2_i32     0
+ #define TCG_TARGET_HAS_add2_i32         0
+ #define TCG_TARGET_HAS_sub2_i32         0
+@@ -XXX,XX +XXX,XX @@
+ #define TCG_TARGET_HAS_div2_i64         0
+ #define TCG_TARGET_HAS_rot_i64          1
+ #define TCG_TARGET_HAS_deposit_i64      1
+-#define TCG_TARGET_HAS_extract_i64      1
+-#define TCG_TARGET_HAS_sextract_i64     1
+ #define TCG_TARGET_HAS_extract2_i64     0
+ #define TCG_TARGET_HAS_extr_i64_i32     1
+ #define TCG_TARGET_HAS_ext8s_i64        1
+diff --git a/tcg/mips/tcg-target-has.h b/tcg/mips/tcg-target-has.h
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/mips/tcg-target-has.h
++++ b/tcg/mips/tcg-target-has.h
+@@ -XXX,XX +XXX,XX @@ extern bool use_mips32r2_instructions;
+ /* optional instructions detected at runtime */
+ #define TCG_TARGET_HAS_deposit_i32      use_mips32r2_instructions
+-#define TCG_TARGET_HAS_extract_i32      1
+-#define TCG_TARGET_HAS_sextract_i32     1
+ #define TCG_TARGET_HAS_extract2_i32     0
+ #define TCG_TARGET_HAS_ext8s_i32        use_mips32r2_instructions
+ #define TCG_TARGET_HAS_ext16s_i32       use_mips32r2_instructions
+@@ -XXX,XX +XXX,XX @@ extern bool use_mips32r2_instructions;
+ #define TCG_TARGET_HAS_bswap32_i64      1
+ #define TCG_TARGET_HAS_bswap64_i64      1
+ #define TCG_TARGET_HAS_deposit_i64      use_mips32r2_instructions
+-#define TCG_TARGET_HAS_extract_i64      1
+-#define TCG_TARGET_HAS_sextract_i64     1
+ #define TCG_TARGET_HAS_extract2_i64     0
+ #define TCG_TARGET_HAS_ext8s_i64        use_mips32r2_instructions
+ #define TCG_TARGET_HAS_ext16s_i64       use_mips32r2_instructions
+diff --git a/tcg/ppc/tcg-target-has.h b/tcg/ppc/tcg-target-has.h
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/ppc/tcg-target-has.h
++++ b/tcg/ppc/tcg-target-has.h
+@@ -XXX,XX +XXX,XX @@
+ #define TCG_TARGET_HAS_ctz_i32          have_isa_3_00
+ #define TCG_TARGET_HAS_ctpop_i32        have_isa_2_06
+ #define TCG_TARGET_HAS_deposit_i32      1
+-#define TCG_TARGET_HAS_extract_i32      1
+-#define TCG_TARGET_HAS_sextract_i32     1
+ #define TCG_TARGET_HAS_extract2_i32     0
+ #define TCG_TARGET_HAS_negsetcond_i32   1
+ #define TCG_TARGET_HAS_mulu2_i32        0
+@@ -XXX,XX +XXX,XX @@
+ #define TCG_TARGET_HAS_ctz_i64          have_isa_3_00
+ #define TCG_TARGET_HAS_ctpop_i64        have_isa_2_06
+ #define TCG_TARGET_HAS_deposit_i64      1
+-#define TCG_TARGET_HAS_extract_i64      1
+-#define TCG_TARGET_HAS_sextract_i64     1
+ #define TCG_TARGET_HAS_extract2_i64     0
+ #define TCG_TARGET_HAS_negsetcond_i64   1
+ #define TCG_TARGET_HAS_add2_i64         1
+diff --git a/tcg/riscv/tcg-target-has.h b/tcg/riscv/tcg-target-has.h
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/riscv/tcg-target-has.h
++++ b/tcg/riscv/tcg-target-has.h
+@@ -XXX,XX +XXX,XX @@
+ #define TCG_TARGET_HAS_div2_i32         0
+ #define TCG_TARGET_HAS_rot_i32          (cpuinfo & CPUINFO_ZBB)
+ #define TCG_TARGET_HAS_deposit_i32      0
+-#define TCG_TARGET_HAS_extract_i32      1
+-#define TCG_TARGET_HAS_sextract_i32     1
+ #define TCG_TARGET_HAS_extract2_i32     0
+ #define TCG_TARGET_HAS_add2_i32         1
+ #define TCG_TARGET_HAS_sub2_i32         1
+@@ -XXX,XX +XXX,XX @@
+ #define TCG_TARGET_HAS_div2_i64         0
+ #define TCG_TARGET_HAS_rot_i64          (cpuinfo & CPUINFO_ZBB)
+ #define TCG_TARGET_HAS_deposit_i64      0
+-#define TCG_TARGET_HAS_extract_i64      1
+-#define TCG_TARGET_HAS_sextract_i64     1
+ #define TCG_TARGET_HAS_extract2_i64     0
+ #define TCG_TARGET_HAS_extr_i64_i32     1
+ #define TCG_TARGET_HAS_ext8s_i64        1
+diff --git a/tcg/s390x/tcg-target-has.h b/tcg/s390x/tcg-target-has.h
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/s390x/tcg-target-has.h
++++ b/tcg/s390x/tcg-target-has.h
+@@ -XXX,XX +XXX,XX @@ extern uint64_t s390_facilities[3];
+ #define TCG_TARGET_HAS_ctz_i32        0
+ #define TCG_TARGET_HAS_ctpop_i32      1
+ #define TCG_TARGET_HAS_deposit_i32    1
+-#define TCG_TARGET_HAS_extract_i32    1
+-#define TCG_TARGET_HAS_sextract_i32   1
+ #define TCG_TARGET_HAS_extract2_i32   0
+ #define TCG_TARGET_HAS_negsetcond_i32 1
+ #define TCG_TARGET_HAS_add2_i32       1
+@@ -XXX,XX +XXX,XX @@ extern uint64_t s390_facilities[3];
+ #define TCG_TARGET_HAS_ctz_i64        0
+ #define TCG_TARGET_HAS_ctpop_i64      1
+ #define TCG_TARGET_HAS_deposit_i64    1
+-#define TCG_TARGET_HAS_extract_i64    1
+-#define TCG_TARGET_HAS_sextract_i64   1
+ #define TCG_TARGET_HAS_extract2_i64   0
+ #define TCG_TARGET_HAS_negsetcond_i64 1
+ #define TCG_TARGET_HAS_add2_i64       1
+diff --git a/tcg/sparc64/tcg-target-has.h b/tcg/sparc64/tcg-target-has.h
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/sparc64/tcg-target-has.h
++++ b/tcg/sparc64/tcg-target-has.h
+@@ -XXX,XX +XXX,XX @@ extern bool use_vis3_instructions;
+ #define TCG_TARGET_HAS_ctz_i32          0
+ #define TCG_TARGET_HAS_ctpop_i32        0
+ #define TCG_TARGET_HAS_deposit_i32      0
+-#define TCG_TARGET_HAS_extract_i32      1
+-#define TCG_TARGET_HAS_sextract_i32     1
+ #define TCG_TARGET_HAS_extract2_i32     0
+ #define TCG_TARGET_HAS_negsetcond_i32   1
+ #define TCG_TARGET_HAS_add2_i32         1
+@@ -XXX,XX +XXX,XX @@ extern bool use_vis3_instructions;
+ #define TCG_TARGET_HAS_ctz_i64          0
+ #define TCG_TARGET_HAS_ctpop_i64        0
+ #define TCG_TARGET_HAS_deposit_i64      0
+-#define TCG_TARGET_HAS_extract_i64      1
+-#define TCG_TARGET_HAS_sextract_i64     1
+ #define TCG_TARGET_HAS_extract2_i64     0
+ #define TCG_TARGET_HAS_negsetcond_i64   1
+ #define TCG_TARGET_HAS_add2_i64         1
+diff --git a/tcg/tcg-has.h b/tcg/tcg-has.h
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/tcg-has.h
++++ b/tcg/tcg-has.h
+@@ -XXX,XX +XXX,XX @@
+ #define TCG_TARGET_HAS_ctz_i64          0
+ #define TCG_TARGET_HAS_ctpop_i64        0
+ #define TCG_TARGET_HAS_deposit_i64      0
+-#define TCG_TARGET_HAS_extract_i64      0
+-#define TCG_TARGET_HAS_sextract_i64     0
+ #define TCG_TARGET_HAS_extract2_i64     0
+ #define TCG_TARGET_HAS_negsetcond_i64   0
+ #define TCG_TARGET_HAS_add2_i64         0
+@@ -XXX,XX +XXX,XX @@
+ #ifndef TCG_TARGET_deposit_i64_valid
+ #define TCG_TARGET_deposit_i64_valid(ofs, len) 1
+ #endif
+-#ifndef TCG_TARGET_extract_valid
+-#define TCG_TARGET_extract_valid(type, ofs, len) \
+-    ((type) == TCG_TYPE_I32 ? TCG_TARGET_HAS_extract_i32 \
+-     : TCG_TARGET_HAS_extract_i64)
+-#endif
+-#ifndef TCG_TARGET_sextract_valid
+-#define TCG_TARGET_sextract_valid(type, ofs, len) \
+-    ((type) == TCG_TYPE_I32 ? TCG_TARGET_HAS_sextract_i32 \
+-     : TCG_TARGET_HAS_sextract_i64)
+-#endif
+ /* Only one of DIV or DIV2 should be defined.  */
+ #if defined(TCG_TARGET_HAS_div_i32)
+diff --git a/tcg/tci/tcg-target-has.h b/tcg/tci/tcg-target-has.h
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/tci/tcg-target-has.h
++++ b/tcg/tci/tcg-target-has.h
+@@ -XXX,XX +XXX,XX @@
+ #define TCG_TARGET_HAS_ext16u_i32       1
+ #define TCG_TARGET_HAS_andc_i32         1
+ #define TCG_TARGET_HAS_deposit_i32      1
+-#define TCG_TARGET_HAS_extract_i32      1
+-#define TCG_TARGET_HAS_sextract_i32     1
+ #define TCG_TARGET_HAS_extract2_i32     0
+ #define TCG_TARGET_HAS_eqv_i32          1
+ #define TCG_TARGET_HAS_nand_i32         1
+@@ -XXX,XX +XXX,XX @@
+ #define TCG_TARGET_HAS_bswap32_i64      1
+ #define TCG_TARGET_HAS_bswap64_i64      1
+ #define TCG_TARGET_HAS_deposit_i64      1
+-#define TCG_TARGET_HAS_extract_i64      1
+-#define TCG_TARGET_HAS_sextract_i64     1
+ #define TCG_TARGET_HAS_extract2_i64     0
+ #define TCG_TARGET_HAS_div_i64          1
+ #define TCG_TARGET_HAS_rem_i64          1
+diff --git a/tcg/optimize.c b/tcg/optimize.c
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/optimize.c
++++ b/tcg/optimize.c
+@@ -XXX,XX +XXX,XX @@ static void fold_setcond_tst_pow2(OptContext *ctx, TCGOp *op, bool neg)
+         shr_opc = INDEX_op_shr_i32;
+         neg_opc = INDEX_op_neg_i32;
+         if (TCG_TARGET_extract_valid(TCG_TYPE_I32, sh, 1)) {
+-            uext_opc = TCG_TARGET_HAS_extract_i32 ? INDEX_op_extract_i32 : 0;
++            uext_opc = INDEX_op_extract_i32;
+         }
+         if (TCG_TARGET_sextract_valid(TCG_TYPE_I32, sh, 1)) {
+-            sext_opc = TCG_TARGET_HAS_sextract_i32 ? INDEX_op_sextract_i32 : 0;
++            sext_opc = INDEX_op_sextract_i32;
+         }
+         break;
+     case TCG_TYPE_I64:
+@@ -XXX,XX +XXX,XX @@ static void fold_setcond_tst_pow2(OptContext *ctx, TCGOp *op, bool neg)
+         shr_opc = INDEX_op_shr_i64;
+         neg_opc = INDEX_op_neg_i64;
+         if (TCG_TARGET_extract_valid(TCG_TYPE_I64, sh, 1)) {
+-            uext_opc = TCG_TARGET_HAS_extract_i64 ? INDEX_op_extract_i64 : 0;
++            uext_opc = INDEX_op_extract_i64;
+         }
+         if (TCG_TARGET_sextract_valid(TCG_TYPE_I64, sh, 1)) {
+-            sext_opc = TCG_TARGET_HAS_sextract_i64 ? INDEX_op_sextract_i64 : 0;
++            sext_opc = INDEX_op_sextract_i64;
+         }
+         break;
+     default:
+diff --git a/tcg/tcg.c b/tcg/tcg.c
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/tcg.c
++++ b/tcg/tcg.c
+@@ -XXX,XX +XXX,XX @@ bool tcg_op_supported(TCGOpcode op, TCGType type, unsigned flags)
+     case INDEX_op_shl_i32:
+     case INDEX_op_shr_i32:
+     case INDEX_op_sar_i32:
++    case INDEX_op_extract_i32:
++    case INDEX_op_sextract_i32:
+         return true;
+     case INDEX_op_negsetcond_i32:
+@@ -XXX,XX +XXX,XX @@ bool tcg_op_supported(TCGOpcode op, TCGType type, unsigned flags)
+         return TCG_TARGET_HAS_rot_i32;
+     case INDEX_op_deposit_i32:
+         return TCG_TARGET_HAS_deposit_i32;
+-    case INDEX_op_extract_i32:
+-        return TCG_TARGET_HAS_extract_i32;
+-    case INDEX_op_sextract_i32:
+-        return TCG_TARGET_HAS_sextract_i32;
+     case INDEX_op_extract2_i32:
+         return TCG_TARGET_HAS_extract2_i32;
+     case INDEX_op_add2_i32:
+@@ -XXX,XX +XXX,XX @@ bool tcg_op_supported(TCGOpcode op, TCGType type, unsigned flags)
+     case INDEX_op_sar_i64:
+     case INDEX_op_ext_i32_i64:
+     case INDEX_op_extu_i32_i64:
++    case INDEX_op_extract_i64:
++    case INDEX_op_sextract_i64:
+         return TCG_TARGET_REG_BITS == 64;
+     case INDEX_op_negsetcond_i64:
+@@ -XXX,XX +XXX,XX @@ bool tcg_op_supported(TCGOpcode op, TCGType type, unsigned flags)
+         return TCG_TARGET_HAS_rot_i64;
+     case INDEX_op_deposit_i64:
+         return TCG_TARGET_HAS_deposit_i64;
+-    case INDEX_op_extract_i64:
+-        return TCG_TARGET_HAS_extract_i64;
+-    case INDEX_op_sextract_i64:
+-        return TCG_TARGET_HAS_sextract_i64;
+     case INDEX_op_extract2_i64:
+         return TCG_TARGET_HAS_extract2_i64;
+     case INDEX_op_extrl_i64_i32:
 diff --git a/tcg/tci.c b/tcg/tci.c
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tci.c
 +++ b/tcg/tci.c
 @@ -XXX,XX +XXX,XX @@ uintptr_t QEMU_DISABLE_CFI tcg_qemu_tb_exec(CPUArchState *env,
-                 ffi_call(pptr[1], pptr[0], stack, call_slots);
+             regs[r0] = deposit32(regs[r1], pos, len, regs[r2]);
-             }
+             break;
+ #endif
--            /* Any result winds up "left-aligned" in the stack[0] slot. */
+-#if TCG_TARGET_HAS_extract_i32
-             switch (len) {
+         case INDEX_op_extract_i32:
-             case 0: /* void */
+             tci_args_rrbb(insn, &r0, &r1, &pos, &len);
-                 break;
+             regs[r0] = extract32(regs[r1], pos, len);
-             case 1: /* uint32_t */
+             break;
-                 /*
+-#endif
-+                 * The result winds up "left-aligned" in the stack[0] slot.
+-#if TCG_TARGET_HAS_sextract_i32
-                  * Note that libffi has an odd special case in that it will
+         case INDEX_op_sextract_i32:
-                  * always widen an integral result to ffi_arg.
+             tci_args_rrbb(insn, &r0, &r1, &pos, &len);
-                  */
+             regs[r0] = sextract32(regs[r1], pos, len);
--                if (sizeof(ffi_arg) == 4) {
+             break;
--                    regs[TCG_REG_R0] = *(uint32_t *)stack;
+-#endif
--                    break;
+         case INDEX_op_brcond_i32:
--                }
+             tci_args_rl(insn, tb_ptr, &r0, &ptr);
--                /* fall through */
+             if ((uint32_t)regs[r0]) {
--            case 2: /* uint64_t */
+@@ -XXX,XX +XXX,XX @@ uintptr_t QEMU_DISABLE_CFI tcg_qemu_tb_exec(CPUArchState *env,
--                if (TCG_TARGET_REG_BITS == 32) {
+             regs[r0] = deposit64(regs[r1], pos, len, regs[r2]);
--                    tci_write_reg64(regs, TCG_REG_R1, TCG_REG_R0, stack[0]);
+             break;
-+                if (sizeof(ffi_arg) == 8) {
+ #endif
-+                    regs[TCG_REG_R0] = (uint32_t)stack[0];
+-#if TCG_TARGET_HAS_extract_i64
-                 } else {
+         case INDEX_op_extract_i64:
--                    regs[TCG_REG_R0] = stack[0];
+             tci_args_rrbb(insn, &r0, &r1, &pos, &len);
-+                    regs[TCG_REG_R0] = *(uint32_t *)stack;
+             regs[r0] = extract64(regs[r1], pos, len);
-                 }
+             break;
-                 break;
+-#endif
-+            case 2: /* uint64_t */
+-#if TCG_TARGET_HAS_sextract_i64
-+                /*
+         case INDEX_op_sextract_i64:
-+                 * For TCG_TARGET_REG_BITS == 32, the register pair
+             tci_args_rrbb(insn, &r0, &r1, &pos, &len);
-+                 * must stay in host memory order.
+             regs[r0] = sextract64(regs[r1], pos, len);
-+                 */
+             break;
-+                memcpy(&regs[TCG_REG_R0], stack, 8);
+-#endif
-+                break;
+         case INDEX_op_brcond_i64:
-             default:
+             tci_args_rl(insn, tb_ptr, &r0, &ptr);
-                 g_assert_not_reached();
+             if (regs[r0]) {
              }
 --
-.34.1
+.43.0

-[PULL 13/40] tcg/tci: Add TCG_TARGET_CALL_{RET,ARG}_I128
+[PULL 62/68] tcg: Remove TCG_TARGET_HAS_deposit_{i32,i64}
-Fill in the parameters for libffi for Int128.
+Make deposit "unconditional" in the sense that the opcode is
-Adjust the interpreter to allow for 16-byte return values.
+always present.  Rely instead on TCG_TARGET_deposit_valid,
-Adjust tcg_out_call to record the return value length.
+now always defined.
-Call parameters are no longer all the same size, so we
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 cannot reuse the same call_slots array for every function.
 Compute it each time now, but only fill in slots required
 for the call we're about to make.
 Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
 ---
- tcg/tci/tcg-target.h     |  3 +++
+ tcg/aarch64/tcg-target-has.h     |  3 +--
- tcg/tcg.c                | 19 +++++++++++++++++
+ tcg/arm/tcg-target-has.h         |  2 +-
- tcg/tci.c                | 44 ++++++++++++++++++++--------------------
+ tcg/i386/tcg-target-has.h        |  5 +----
- tcg/tci/tcg-target.c.inc | 10 ++++-----
+ tcg/loongarch64/tcg-target-has.h |  3 +--
-files changed, 49 insertions(+), 27 deletions(-)
+ tcg/mips/tcg-target-has.h        |  3 +--
  tcg/ppc/tcg-target-has.h         |  3 +--
  tcg/riscv/tcg-target-has.h       |  4 ++--
  tcg/s390x/tcg-target-has.h       |  3 +--
  tcg/sparc64/tcg-target-has.h     |  4 ++--
  tcg/tcg-has.h                    |  8 --------
  tcg/tci/tcg-target-has.h         |  3 +--
  tcg/tcg-op.c                     | 22 +++++++++++-----------
  tcg/tcg.c                        | 31 +++++++++++--------------------
  tcg/tci.c                        |  4 ----
  tcg/tci/tcg-target.c.inc         |  2 +-
 files changed, 35 insertions(+), 65 deletions(-)
-diff --git a/tcg/tci/tcg-target.h b/tcg/tci/tcg-target.h
+diff --git a/tcg/aarch64/tcg-target-has.h b/tcg/aarch64/tcg-target-has.h
 index XXXXXXX..XXXXXXX 100644
---- a/tcg/tci/tcg-target.h
+--- a/tcg/aarch64/tcg-target-has.h
-+++ b/tcg/tci/tcg-target.h
++++ b/tcg/aarch64/tcg-target-has.h
-@@ -XXX,XX +XXX,XX @@ typedef enum {
+@@ -XXX,XX +XXX,XX @@
- #if TCG_TARGET_REG_BITS == 32
+ #define TCG_TARGET_HAS_clz_i32          1
- # define TCG_TARGET_CALL_ARG_I32        TCG_CALL_ARG_EVEN
+ #define TCG_TARGET_HAS_ctz_i32          1
- # define TCG_TARGET_CALL_ARG_I64        TCG_CALL_ARG_EVEN
+ #define TCG_TARGET_HAS_ctpop_i32        0
-+# define TCG_TARGET_CALL_ARG_I128       TCG_CALL_ARG_EVEN
+-#define TCG_TARGET_HAS_deposit_i32      1
- #else
+ #define TCG_TARGET_HAS_extract2_i32     1
- # define TCG_TARGET_CALL_ARG_I32        TCG_CALL_ARG_NORMAL
+ #define TCG_TARGET_HAS_negsetcond_i32   1
- # define TCG_TARGET_CALL_ARG_I64        TCG_CALL_ARG_NORMAL
+ #define TCG_TARGET_HAS_add2_i32         1
-+# define TCG_TARGET_CALL_ARG_I128       TCG_CALL_ARG_NORMAL
+@@ -XXX,XX +XXX,XX @@
- #endif
+ #define TCG_TARGET_HAS_clz_i64          1
-+#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_NORMAL
+ #define TCG_TARGET_HAS_ctz_i64          1
+ #define TCG_TARGET_HAS_ctpop_i64        0
- #define HAVE_TCG_QEMU_TB_EXEC
+-#define TCG_TARGET_HAS_deposit_i64      1
- #define TCG_TARGET_NEED_POOL_LABELS
+ #define TCG_TARGET_HAS_extract2_i64     1
  #define TCG_TARGET_HAS_negsetcond_i64   1
  #define TCG_TARGET_HAS_add2_i64         1
@@ -XXX,XX +XXX,XX @@
  #define TCG_TARGET_extract_valid(type, ofs, len)   1
  #define TCG_TARGET_sextract_valid(type, ofs, len)  1
 +#define TCG_TARGET_deposit_valid(type, ofs, len)   1
  #endif
 diff --git a/tcg/arm/tcg-target-has.h b/tcg/arm/tcg-target-has.h
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/arm/tcg-target-has.h
 +++ b/tcg/arm/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@ extern bool use_neon_instructions;
  #define TCG_TARGET_HAS_clz_i32          1
  #define TCG_TARGET_HAS_ctz_i32          use_armv7_instructions
  #define TCG_TARGET_HAS_ctpop_i32        0
 -#define TCG_TARGET_HAS_deposit_i32      use_armv7_instructions
  #define TCG_TARGET_HAS_extract2_i32     1
  #define TCG_TARGET_HAS_negsetcond_i32   1
  #define TCG_TARGET_HAS_mulu2_i32        1
@@ -XXX,XX +XXX,XX @@ tcg_target_extract_valid(TCGType type, unsigned ofs, unsigned len)
  #define TCG_TARGET_extract_valid   tcg_target_extract_valid
  #define TCG_TARGET_sextract_valid  tcg_target_extract_valid
 +#define TCG_TARGET_deposit_valid(type, ofs, len)  use_armv7_instructions
  #endif
 diff --git a/tcg/i386/tcg-target-has.h b/tcg/i386/tcg-target-has.h
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/i386/tcg-target-has.h
 +++ b/tcg/i386/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@
  #define TCG_TARGET_HAS_clz_i32          1
  #define TCG_TARGET_HAS_ctz_i32          1
  #define TCG_TARGET_HAS_ctpop_i32        have_popcnt
 -#define TCG_TARGET_HAS_deposit_i32      1
  #define TCG_TARGET_HAS_extract2_i32     1
  #define TCG_TARGET_HAS_negsetcond_i32   1
  #define TCG_TARGET_HAS_add2_i32         1
@@ -XXX,XX +XXX,XX @@
  #define TCG_TARGET_HAS_clz_i64          1
  #define TCG_TARGET_HAS_ctz_i64          1
  #define TCG_TARGET_HAS_ctpop_i64        have_popcnt
 -#define TCG_TARGET_HAS_deposit_i64      1
  #define TCG_TARGET_HAS_extract2_i64     1
  #define TCG_TARGET_HAS_negsetcond_i64   1
  #define TCG_TARGET_HAS_add2_i64         1
@@ -XXX,XX +XXX,XX @@
  #define TCG_TARGET_HAS_cmpsel_vec       1
  #define TCG_TARGET_HAS_tst_vec          have_avx512bw
 -#define TCG_TARGET_deposit_i32_valid(ofs, len) \
 +#define TCG_TARGET_deposit_valid(type, ofs, len) \
      (((ofs) == 0 && ((len) == 8 || (len) == 16)) || \
       (TCG_TARGET_REG_BITS == 32 && (ofs) == 8 && (len) == 8))
 -#define TCG_TARGET_deposit_i64_valid    TCG_TARGET_deposit_i32_valid
  /*
   * Check for the possibility of low byte/word extraction, high-byte extraction
 diff --git a/tcg/loongarch64/tcg-target-has.h b/tcg/loongarch64/tcg-target-has.h
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/loongarch64/tcg-target-has.h
 +++ b/tcg/loongarch64/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@
  #define TCG_TARGET_HAS_rem_i32          1
  #define TCG_TARGET_HAS_div2_i32         0
  #define TCG_TARGET_HAS_rot_i32          1
 -#define TCG_TARGET_HAS_deposit_i32      1
  #define TCG_TARGET_HAS_extract2_i32     0
  #define TCG_TARGET_HAS_add2_i32         0
  #define TCG_TARGET_HAS_sub2_i32         0
@@ -XXX,XX +XXX,XX @@
  #define TCG_TARGET_HAS_rem_i64          1
  #define TCG_TARGET_HAS_div2_i64         0
  #define TCG_TARGET_HAS_rot_i64          1
 -#define TCG_TARGET_HAS_deposit_i64      1
  #define TCG_TARGET_HAS_extract2_i64     0
  #define TCG_TARGET_HAS_extr_i64_i32     1
  #define TCG_TARGET_HAS_ext8s_i64        1
@@ -XXX,XX +XXX,XX @@
  #define TCG_TARGET_HAS_tst_vec          0
  #define TCG_TARGET_extract_valid(type, ofs, len)   1
 +#define TCG_TARGET_deposit_valid(type, ofs, len)   1
  static inline bool
  tcg_target_sextract_valid(TCGType type, unsigned ofs, unsigned len)
 diff --git a/tcg/mips/tcg-target-has.h b/tcg/mips/tcg-target-has.h
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/mips/tcg-target-has.h
 +++ b/tcg/mips/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@ extern bool use_mips32r2_instructions;
  #endif
  /* optional instructions detected at runtime */
 -#define TCG_TARGET_HAS_deposit_i32      use_mips32r2_instructions
  #define TCG_TARGET_HAS_extract2_i32     0
  #define TCG_TARGET_HAS_ext8s_i32        use_mips32r2_instructions
  #define TCG_TARGET_HAS_ext16s_i32       use_mips32r2_instructions
@@ -XXX,XX +XXX,XX @@ extern bool use_mips32r2_instructions;
  #define TCG_TARGET_HAS_bswap16_i64      1
  #define TCG_TARGET_HAS_bswap32_i64      1
  #define TCG_TARGET_HAS_bswap64_i64      1
 -#define TCG_TARGET_HAS_deposit_i64      use_mips32r2_instructions
  #define TCG_TARGET_HAS_extract2_i64     0
  #define TCG_TARGET_HAS_ext8s_i64        use_mips32r2_instructions
  #define TCG_TARGET_HAS_ext16s_i64       use_mips32r2_instructions
@@ -XXX,XX +XXX,XX @@ extern bool use_mips32r2_instructions;
  #define TCG_TARGET_HAS_tst              0
  #define TCG_TARGET_extract_valid(type, ofs, len)  use_mips32r2_instructions
 +#define TCG_TARGET_deposit_valid(type, ofs, len)  use_mips32r2_instructions
  static inline bool
  tcg_target_sextract_valid(TCGType type, unsigned ofs, unsigned len)
 diff --git a/tcg/ppc/tcg-target-has.h b/tcg/ppc/tcg-target-has.h
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/ppc/tcg-target-has.h
 +++ b/tcg/ppc/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@
  #define TCG_TARGET_HAS_clz_i32          1
  #define TCG_TARGET_HAS_ctz_i32          have_isa_3_00
  #define TCG_TARGET_HAS_ctpop_i32        have_isa_2_06
 -#define TCG_TARGET_HAS_deposit_i32      1
  #define TCG_TARGET_HAS_extract2_i32     0
  #define TCG_TARGET_HAS_negsetcond_i32   1
  #define TCG_TARGET_HAS_mulu2_i32        0
@@ -XXX,XX +XXX,XX @@
  #define TCG_TARGET_HAS_clz_i64          1
  #define TCG_TARGET_HAS_ctz_i64          have_isa_3_00
  #define TCG_TARGET_HAS_ctpop_i64        have_isa_2_06
 -#define TCG_TARGET_HAS_deposit_i64      1
  #define TCG_TARGET_HAS_extract2_i64     0
  #define TCG_TARGET_HAS_negsetcond_i64   1
  #define TCG_TARGET_HAS_add2_i64         1
@@ -XXX,XX +XXX,XX @@
  #define TCG_TARGET_HAS_tst_vec          0
  #define TCG_TARGET_extract_valid(type, ofs, len)   1
 +#define TCG_TARGET_deposit_valid(type, ofs, len)   1
  static inline bool
  tcg_target_sextract_valid(TCGType type, unsigned ofs, unsigned len)
 diff --git a/tcg/riscv/tcg-target-has.h b/tcg/riscv/tcg-target-has.h
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/riscv/tcg-target-has.h
 +++ b/tcg/riscv/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@
  #define TCG_TARGET_HAS_rem_i32          1
  #define TCG_TARGET_HAS_div2_i32         0
  #define TCG_TARGET_HAS_rot_i32          (cpuinfo & CPUINFO_ZBB)
 -#define TCG_TARGET_HAS_deposit_i32      0
  #define TCG_TARGET_HAS_extract2_i32     0
  #define TCG_TARGET_HAS_add2_i32         1
  #define TCG_TARGET_HAS_sub2_i32         1
@@ -XXX,XX +XXX,XX @@
  #define TCG_TARGET_HAS_rem_i64          1
  #define TCG_TARGET_HAS_div2_i64         0
  #define TCG_TARGET_HAS_rot_i64          (cpuinfo & CPUINFO_ZBB)
 -#define TCG_TARGET_HAS_deposit_i64      0
  #define TCG_TARGET_HAS_extract2_i64     0
  #define TCG_TARGET_HAS_extr_i64_i32     1
  #define TCG_TARGET_HAS_ext8s_i64        1
@@ -XXX,XX +XXX,XX @@ tcg_target_sextract_valid(TCGType type, unsigned ofs, unsigned len)
  }
  #define TCG_TARGET_sextract_valid  tcg_target_sextract_valid
 +#define TCG_TARGET_deposit_valid(type, ofs, len)  0
 +
  #endif
 diff --git a/tcg/s390x/tcg-target-has.h b/tcg/s390x/tcg-target-has.h
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/s390x/tcg-target-has.h
 +++ b/tcg/s390x/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@ extern uint64_t s390_facilities[3];
  #define TCG_TARGET_HAS_clz_i32        0
  #define TCG_TARGET_HAS_ctz_i32        0
  #define TCG_TARGET_HAS_ctpop_i32      1
 -#define TCG_TARGET_HAS_deposit_i32    1
  #define TCG_TARGET_HAS_extract2_i32   0
  #define TCG_TARGET_HAS_negsetcond_i32 1
  #define TCG_TARGET_HAS_add2_i32       1
@@ -XXX,XX +XXX,XX @@ extern uint64_t s390_facilities[3];
  #define TCG_TARGET_HAS_clz_i64        1
  #define TCG_TARGET_HAS_ctz_i64        0
  #define TCG_TARGET_HAS_ctpop_i64      1
 -#define TCG_TARGET_HAS_deposit_i64    1
  #define TCG_TARGET_HAS_extract2_i64   0
  #define TCG_TARGET_HAS_negsetcond_i64 1
  #define TCG_TARGET_HAS_add2_i64       1
@@ -XXX,XX +XXX,XX @@ extern uint64_t s390_facilities[3];
  #define TCG_TARGET_HAS_tst_vec        0
  #define TCG_TARGET_extract_valid(type, ofs, len)   1
 +#define TCG_TARGET_deposit_valid(type, ofs, len)   1
  static inline bool
  tcg_target_sextract_valid(TCGType type, unsigned ofs, unsigned len)
 diff --git a/tcg/sparc64/tcg-target-has.h b/tcg/sparc64/tcg-target-has.h
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/sparc64/tcg-target-has.h
 +++ b/tcg/sparc64/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@ extern bool use_vis3_instructions;
  #define TCG_TARGET_HAS_clz_i32          0
  #define TCG_TARGET_HAS_ctz_i32          0
  #define TCG_TARGET_HAS_ctpop_i32        0
 -#define TCG_TARGET_HAS_deposit_i32      0
  #define TCG_TARGET_HAS_extract2_i32     0
  #define TCG_TARGET_HAS_negsetcond_i32   1
  #define TCG_TARGET_HAS_add2_i32         1
@@ -XXX,XX +XXX,XX @@ extern bool use_vis3_instructions;
  #define TCG_TARGET_HAS_clz_i64          0
  #define TCG_TARGET_HAS_ctz_i64          0
  #define TCG_TARGET_HAS_ctpop_i64        0
 -#define TCG_TARGET_HAS_deposit_i64      0
  #define TCG_TARGET_HAS_extract2_i64     0
  #define TCG_TARGET_HAS_negsetcond_i64   1
  #define TCG_TARGET_HAS_add2_i64         1
@@ -XXX,XX +XXX,XX @@ extern bool use_vis3_instructions;
  #define TCG_TARGET_sextract_valid  TCG_TARGET_extract_valid
 +#define TCG_TARGET_deposit_valid(type, ofs, len) 0
 +
  #endif
 diff --git a/tcg/tcg-has.h b/tcg/tcg-has.h
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tcg-has.h
 +++ b/tcg/tcg-has.h
@@ -XXX,XX +XXX,XX @@
  #define TCG_TARGET_HAS_clz_i64          0
  #define TCG_TARGET_HAS_ctz_i64          0
  #define TCG_TARGET_HAS_ctpop_i64        0
 -#define TCG_TARGET_HAS_deposit_i64      0
  #define TCG_TARGET_HAS_extract2_i64     0
  #define TCG_TARGET_HAS_negsetcond_i64   0
  #define TCG_TARGET_HAS_add2_i64         0
@@ -XXX,XX +XXX,XX @@
  #define TCG_TARGET_HAS_sub2_i32         1
  #endif
 -#ifndef TCG_TARGET_deposit_i32_valid
 -#define TCG_TARGET_deposit_i32_valid(ofs, len) 1
 -#endif
 -#ifndef TCG_TARGET_deposit_i64_valid
 -#define TCG_TARGET_deposit_i64_valid(ofs, len) 1
 -#endif
 -
  /* Only one of DIV or DIV2 should be defined.  */
  #if defined(TCG_TARGET_HAS_div_i32)
  #define TCG_TARGET_HAS_div2_i32         0
 diff --git a/tcg/tci/tcg-target-has.h b/tcg/tci/tcg-target-has.h
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tci/tcg-target-has.h
 +++ b/tcg/tci/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@
  #define TCG_TARGET_HAS_ext8u_i32        1
  #define TCG_TARGET_HAS_ext16u_i32       1
  #define TCG_TARGET_HAS_andc_i32         1
 -#define TCG_TARGET_HAS_deposit_i32      1
  #define TCG_TARGET_HAS_extract2_i32     0
  #define TCG_TARGET_HAS_eqv_i32          1
  #define TCG_TARGET_HAS_nand_i32         1
@@ -XXX,XX +XXX,XX @@
  #define TCG_TARGET_HAS_bswap16_i64      1
  #define TCG_TARGET_HAS_bswap32_i64      1
  #define TCG_TARGET_HAS_bswap64_i64      1
 -#define TCG_TARGET_HAS_deposit_i64      1
  #define TCG_TARGET_HAS_extract2_i64     0
  #define TCG_TARGET_HAS_div_i64          1
  #define TCG_TARGET_HAS_rem_i64          1
@@ -XXX,XX +XXX,XX @@
  #define TCG_TARGET_extract_valid(type, ofs, len)   1
  #define TCG_TARGET_sextract_valid(type, ofs, len)  1
 +#define TCG_TARGET_deposit_valid(type, ofs, len)   1
  #endif
 diff --git a/tcg/tcg-op.c b/tcg/tcg-op.c
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tcg-op.c
 +++ b/tcg/tcg-op.c
@@ -XXX,XX +XXX,XX @@ void tcg_gen_deposit_i32(TCGv_i32 ret, TCGv_i32 arg1, TCGv_i32 arg2,
          tcg_gen_mov_i32(ret, arg2);
          return;
      }
 -    if (TCG_TARGET_HAS_deposit_i32 && TCG_TARGET_deposit_i32_valid(ofs, len)) {
 +    if (TCG_TARGET_deposit_valid(TCG_TYPE_I32, ofs, len)) {
          tcg_gen_op5ii_i32(INDEX_op_deposit_i32, ret, arg1, arg2, ofs, len);
          return;
      }
@@ -XXX,XX +XXX,XX @@ void tcg_gen_deposit_z_i32(TCGv_i32 ret, TCGv_i32 arg,
          tcg_gen_shli_i32(ret, arg, ofs);
      } else if (ofs == 0) {
          tcg_gen_andi_i32(ret, arg, (1u << len) - 1);
 -    } else if (TCG_TARGET_HAS_deposit_i32
 -               && TCG_TARGET_deposit_i32_valid(ofs, len)) {
 +    } else if (TCG_TARGET_deposit_valid(TCG_TYPE_I32, ofs, len)) {
          TCGv_i32 zero = tcg_constant_i32(0);
          tcg_gen_op5ii_i32(INDEX_op_deposit_i32, ret, zero, arg, ofs, len);
      } else {
@@ -XXX,XX +XXX,XX @@ void tcg_gen_deposit_i64(TCGv_i64 ret, TCGv_i64 arg1, TCGv_i64 arg2,
          tcg_gen_mov_i64(ret, arg2);
          return;
      }
 -    if (TCG_TARGET_HAS_deposit_i64 && TCG_TARGET_deposit_i64_valid(ofs, len)) {
 -        tcg_gen_op5ii_i64(INDEX_op_deposit_i64, ret, arg1, arg2, ofs, len);
 -        return;
 -    }
 -    if (TCG_TARGET_REG_BITS == 32) {
 +    if (TCG_TARGET_REG_BITS == 64) {
 +        if (TCG_TARGET_deposit_valid(TCG_TYPE_I64, ofs, len)) {
 +            tcg_gen_op5ii_i64(INDEX_op_deposit_i64, ret, arg1, arg2, ofs, len);
 +            return;
 +        }
 +    } else {
          if (ofs >= 32) {
              tcg_gen_deposit_i32(TCGV_HIGH(ret), TCGV_HIGH(arg1),
                                  TCGV_LOW(arg2), ofs - 32, len);
@@ -XXX,XX +XXX,XX @@ void tcg_gen_deposit_z_i64(TCGv_i64 ret, TCGv_i64 arg,
          tcg_gen_shli_i64(ret, arg, ofs);
      } else if (ofs == 0) {
          tcg_gen_andi_i64(ret, arg, (1ull << len) - 1);
 -    } else if (TCG_TARGET_HAS_deposit_i64
 -               && TCG_TARGET_deposit_i64_valid(ofs, len)) {
 +    } else if (TCG_TARGET_REG_BITS == 64 &&
 +               TCG_TARGET_deposit_valid(TCG_TYPE_I64, ofs, len)) {
          TCGv_i64 zero = tcg_constant_i64(0);
          tcg_gen_op5ii_i64(INDEX_op_deposit_i64, ret, zero, arg, ofs, len);
      } else {
@@ -XXX,XX +XXX,XX @@ void tcg_gen_concat_i32_i64(TCGv_i64 dest, TCGv_i32 low, TCGv_i32 high)
      tcg_gen_extu_i32_i64(dest, low);
      /* If deposit is available, use it.  Otherwise use the extra
         knowledge that we have of the zero-extensions above.  */
 -    if (TCG_TARGET_HAS_deposit_i64 && TCG_TARGET_deposit_i64_valid(32, 32)) {
 +    if (TCG_TARGET_deposit_valid(TCG_TYPE_I64, 32, 32)) {
          tcg_gen_deposit_i64(dest, dest, tmp, 32, 32);
      } else {
          tcg_gen_shli_i64(tmp, tmp, 32);
 diff --git a/tcg/tcg.c b/tcg/tcg.c
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tcg.c
 +++ b/tcg/tcg.c
-@@ -XXX,XX +XXX,XX @@ static GHashTable *helper_table;
+@@ -XXX,XX +XXX,XX @@ bool tcg_op_supported(TCGOpcode op, TCGType type, unsigned flags)
- #ifdef CONFIG_TCG_INTERPRETER
+     case INDEX_op_sar_i32:
- static ffi_type *typecode_to_ffi(int argmask)
+     case INDEX_op_extract_i32:
      case INDEX_op_sextract_i32:
 +    case INDEX_op_deposit_i32:
          return true;
      case INDEX_op_negsetcond_i32:
@@ -XXX,XX +XXX,XX @@ bool tcg_op_supported(TCGOpcode op, TCGType type, unsigned flags)
      case INDEX_op_rotl_i32:
      case INDEX_op_rotr_i32:
          return TCG_TARGET_HAS_rot_i32;
 -    case INDEX_op_deposit_i32:
 -        return TCG_TARGET_HAS_deposit_i32;
      case INDEX_op_extract2_i32:
          return TCG_TARGET_HAS_extract2_i32;
      case INDEX_op_add2_i32:
@@ -XXX,XX +XXX,XX @@ bool tcg_op_supported(TCGOpcode op, TCGType type, unsigned flags)
      case INDEX_op_extu_i32_i64:
      case INDEX_op_extract_i64:
      case INDEX_op_sextract_i64:
 +    case INDEX_op_deposit_i64:
          return TCG_TARGET_REG_BITS == 64;
      case INDEX_op_negsetcond_i64:
@@ -XXX,XX +XXX,XX @@ bool tcg_op_supported(TCGOpcode op, TCGType type, unsigned flags)
      case INDEX_op_rotl_i64:
      case INDEX_op_rotr_i64:
          return TCG_TARGET_HAS_rot_i64;
 -    case INDEX_op_deposit_i64:
 -        return TCG_TARGET_HAS_deposit_i64;
      case INDEX_op_extract2_i64:
          return TCG_TARGET_HAS_extract2_i64;
      case INDEX_op_extrl_i64_i32:
@@ -XXX,XX +XXX,XX @@ bool tcg_op_supported(TCGOpcode op, TCGType type, unsigned flags)
  bool tcg_op_deposit_valid(TCGType type, unsigned ofs, unsigned len)
  {
-+    /*
++    unsigned width;
 +     * libffi does not support __int128_t, so we have forced Int128
 +     * to use the structure definition instead of the builtin type.
 +     */
 +    static ffi_type *ffi_type_i128_elements[3] = {
 +        &ffi_type_uint64,
 +        &ffi_type_uint64,
 +        NULL
 +    };
 +    static ffi_type ffi_type_i128 = {
 +        .size = 16,
 +        .alignment = __alignof__(Int128),
 +        .type = FFI_TYPE_STRUCT,
 +        .elements = ffi_type_i128_elements,
 +    };
 +
-     switch (argmask) {
++    tcg_debug_assert(type == TCG_TYPE_I32 || type == TCG_TYPE_I64);
-     case dh_typecode_void:
++    width = (type == TCG_TYPE_I32 ? 32 : 64);
-         return &ffi_type_void;
++
-@@ -XXX,XX +XXX,XX @@ static ffi_type *typecode_to_ffi(int argmask)
++    tcg_debug_assert(ofs < width);
-         return &ffi_type_sint64;
+     tcg_debug_assert(len > 0);
-     case dh_typecode_ptr:
+-    switch (type) {
-         return &ffi_type_pointer;
+-    case TCG_TYPE_I32:
-+    case dh_typecode_i128:
+-        tcg_debug_assert(ofs < 32);
-+        return &ffi_type_i128;
+-        tcg_debug_assert(len <= 32);
-     }
+-        tcg_debug_assert(ofs + len <= 32);
-     g_assert_not_reached();
+-        return TCG_TARGET_HAS_deposit_i32 &&
 -               TCG_TARGET_deposit_i32_valid(ofs, len);
 -    case TCG_TYPE_I64:
 -        tcg_debug_assert(ofs < 64);
 -        tcg_debug_assert(len <= 64);
 -        tcg_debug_assert(ofs + len <= 64);
 -        return TCG_TARGET_HAS_deposit_i64 &&
 -               TCG_TARGET_deposit_i64_valid(ofs, len);
 -    default:
 -        g_assert_not_reached();
 -    }
 +    tcg_debug_assert(len <= width - ofs);
 +
 +    return TCG_TARGET_deposit_valid(type, ofs, len);
  }
-@@ -XXX,XX +XXX,XX @@ static void init_ffi_layouts(void)
-         /* Ignoring the return type, find the last non-zero field. */
+ static TCGOp *tcg_op_alloc(TCGOpcode opc, unsigned nargs);
          nargs = 32 - clz32(typemask >> 3);
          nargs = DIV_ROUND_UP(nargs, 3);
 +        assert(nargs <= MAX_CALL_IARGS);
          ca = g_malloc0(sizeof(*ca) + nargs * sizeof(ffi_type *));
          ca->cif.rtype = typecode_to_ffi(typemask & 7);
 diff --git a/tcg/tci.c b/tcg/tci.c
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tci.c
 +++ b/tcg/tci.c
 @@ -XXX,XX +XXX,XX @@ uintptr_t QEMU_DISABLE_CFI tcg_qemu_tb_exec(CPUArchState *env,
-     tcg_target_ulong regs[TCG_TARGET_NB_REGS];
+             regs[r0] = ror32(regs[r1], regs[r2] & 31);
-     uint64_t stack[(TCG_STATIC_CALL_ARGS_SIZE + TCG_STATIC_FRAME_SIZE)
+             break;
-                    / sizeof(uint64_t)];
+ #endif
--    void *call_slots[TCG_STATIC_CALL_ARGS_SIZE / sizeof(uint64_t)];
+-#if TCG_TARGET_HAS_deposit_i32
+         case INDEX_op_deposit_i32:
-     regs[TCG_AREG0] = (tcg_target_ulong)env;
+             tci_args_rrrbb(insn, &r0, &r1, &r2, &pos, &len);
-     regs[TCG_REG_CALL_STACK] = (uintptr_t)stack;
+             regs[r0] = deposit32(regs[r1], pos, len, regs[r2]);
--    /* Other call_slots entries initialized at first use (see below). */
+             break;
--    call_slots[0] = NULL;
+-#endif
-     tci_assert(tb_ptr);
+         case INDEX_op_extract_i32:
+             tci_args_rrbb(insn, &r0, &r1, &pos, &len);
-     for (;;) {
+             regs[r0] = extract32(regs[r1], pos, len);
 @@ -XXX,XX +XXX,XX @@ uintptr_t QEMU_DISABLE_CFI tcg_qemu_tb_exec(CPUArchState *env,
+             regs[r0] = ror64(regs[r1], regs[r2] & 63);
-         switch (opc) {
+             break;
-         case INDEX_op_call:
+ #endif
--            /*
+-#if TCG_TARGET_HAS_deposit_i64
--             * Set up the ffi_avalue array once, delayed until now
+         case INDEX_op_deposit_i64:
--             * because many TB's do not make any calls. In tcg_gen_callN,
+             tci_args_rrrbb(insn, &r0, &r1, &r2, &pos, &len);
--             * we arranged for every real argument to be "left-aligned"
+             regs[r0] = deposit64(regs[r1], pos, len, regs[r2]);
--             * in each 64-bit slot.
+             break;
--             */
+-#endif
--            if (unlikely(call_slots[0] == NULL)) {
+         case INDEX_op_extract_i64:
--                for (int i = 0; i < ARRAY_SIZE(call_slots); ++i) {
+             tci_args_rrbb(insn, &r0, &r1, &pos, &len);
--                    call_slots[i] = &stack[i];
+             regs[r0] = extract64(regs[r1], pos, len);
 -                }
 -            }
 -
 -            tci_args_nl(insn, tb_ptr, &len, &ptr);
 -
 -            /* Helper functions may need to access the "return address" */
 -            tci_tb_ptr = (uintptr_t)tb_ptr;
 -
              {
 -                void **pptr = ptr;
 -                ffi_call(pptr[1], pptr[0], stack, call_slots);
 +                void *call_slots[MAX_CALL_IARGS];
 +                ffi_cif *cif;
 +                void *func;
 +                unsigned i, s, n;
 +
 +                tci_args_nl(insn, tb_ptr, &len, &ptr);
 +                func = ((void **)ptr)[0];
 +                cif = ((void **)ptr)[1];
 +
 +                n = cif->nargs;
 +                for (i = s = 0; i < n; ++i) {
 +                    ffi_type *t = cif->arg_types[i];
 +                    call_slots[i] = &stack[s];
 +                    s += DIV_ROUND_UP(t->size, 8);
 +                }
 +
 +                /* Helper functions may need to access the "return address" */
 +                tci_tb_ptr = (uintptr_t)tb_ptr;
 +                ffi_call(cif, func, stack, call_slots);
              }
              switch (len) {
@@ -XXX,XX +XXX,XX @@ uintptr_t QEMU_DISABLE_CFI tcg_qemu_tb_exec(CPUArchState *env,
                   */
                  memcpy(&regs[TCG_REG_R0], stack, 8);
                  break;
 +            case 3: /* Int128 */
 +                memcpy(&regs[TCG_REG_R0], stack, 16);
 +                break;
              default:
                  g_assert_not_reached();
              }
 diff --git a/tcg/tci/tcg-target.c.inc b/tcg/tci/tcg-target.c.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/tcg/tci/tcg-target.c.inc
 +++ b/tcg/tci/tcg-target.c.inc
-@@ -XXX,XX +XXX,XX @@ static const int tcg_target_call_iarg_regs[] = { };
+@@ -XXX,XX +XXX,XX @@ static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
- static TCGReg tcg_target_call_oarg_reg(TCGCallReturnKind kind, int slot)
+         tcg_out_op_rrr(s, opc, args[0], args[1], args[2]);
- {
+         break;
-     tcg_debug_assert(kind == TCG_CALL_RET_NORMAL);
--    tcg_debug_assert(slot >= 0 && slot < 64 / TCG_TARGET_REG_BITS);
+-    CASE_32_64(deposit)  /* Optional (TCG_TARGET_HAS_deposit_*). */
-+    tcg_debug_assert(slot >= 0 && slot < 128 / TCG_TARGET_REG_BITS);
++    CASE_32_64(deposit)
-     return TCG_REG_R0 + slot;
+         tcg_out_op_rrrbb(s, opc, args[0], args[1], args[2], args[3], args[4]);
- }
+         break;
@@ -XXX,XX +XXX,XX @@ static void tcg_out_call(TCGContext *s, const tcg_insn_unit *func,
      if (cif->rtype == &ffi_type_void) {
          which = 0;
 -    } else if (cif->rtype->size == 4) {
 -        which = 1;
      } else {
 -        tcg_debug_assert(cif->rtype->size == 8);
 -        which = 2;
 +        tcg_debug_assert(cif->rtype->size == 4 ||
 +                         cif->rtype->size == 8 ||
 +                         cif->rtype->size == 16);
 +        which = ctz32(cif->rtype->size) - 1;
      }
      new_pool_l2(s, 20, s->code_ptr, 0, (uintptr_t)func, (uintptr_t)cif);
      insn = deposit32(insn, 0, 8, INDEX_op_call);
 --
-.34.1
+.43.0

-New patch
+[PULL 63/68] util/cpuinfo-riscv: Detect Zbs
+Acked-by: Alistair Francis <alistair.francis@wdc.com>
+Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-ID: <20250102181601.1421059-2-richard.henderson@linaro.org>
+---
+ host/include/riscv/host/cpuinfo.h |  5 +++--
+ util/cpuinfo-riscv.c              | 18 ++++++++++++++++--
+files changed, 19 insertions(+), 4 deletions(-)
+diff --git a/host/include/riscv/host/cpuinfo.h b/host/include/riscv/host/cpuinfo.h
+index XXXXXXX..XXXXXXX 100644
+--- a/host/include/riscv/host/cpuinfo.h
++++ b/host/include/riscv/host/cpuinfo.h
+@@ -XXX,XX +XXX,XX @@
+ #define CPUINFO_ALWAYS          (1u << 0)  /* so cpuinfo is nonzero */
+ #define CPUINFO_ZBA             (1u << 1)
+ #define CPUINFO_ZBB             (1u << 2)
+-#define CPUINFO_ZICOND          (1u << 3)
+-#define CPUINFO_ZVE64X          (1u << 4)
++#define CPUINFO_ZBS             (1u << 3)
++#define CPUINFO_ZICOND          (1u << 4)
++#define CPUINFO_ZVE64X          (1u << 5)
+ /* Initialized with a constructor. */
+ extern unsigned cpuinfo;
+diff --git a/util/cpuinfo-riscv.c b/util/cpuinfo-riscv.c
+index XXXXXXX..XXXXXXX 100644
+--- a/util/cpuinfo-riscv.c
++++ b/util/cpuinfo-riscv.c
+@@ -XXX,XX +XXX,XX @@ static void sigill_handler(int signo, siginfo_t *si, void *data)
+ /* Called both as constructor and (possibly) via other constructors. */
+ unsigned __attribute__((constructor)) cpuinfo_init(void)
+ {
+-    unsigned left = CPUINFO_ZBA | CPUINFO_ZBB | CPUINFO_ZICOND | CPUINFO_ZVE64X;
++    unsigned left = CPUINFO_ZBA | CPUINFO_ZBB | CPUINFO_ZBS
++                  | CPUINFO_ZICOND | CPUINFO_ZVE64X;
+     unsigned info = cpuinfo;
+     if (info) {
+@@ -XXX,XX +XXX,XX @@ unsigned __attribute__((constructor)) cpuinfo_init(void)
+ #if defined(__riscv_arch_test) && defined(__riscv_zbb)
+     info |= CPUINFO_ZBB;
+ #endif
++#if defined(__riscv_arch_test) && defined(__riscv_zbs)
++    info |= CPUINFO_ZBS;
++#endif
+ #if defined(__riscv_arch_test) && defined(__riscv_zicond)
+     info |= CPUINFO_ZICOND;
+ #endif
+@@ -XXX,XX +XXX,XX @@ unsigned __attribute__((constructor)) cpuinfo_init(void)
+             && pair.key >= 0) {
+             info |= pair.value & RISCV_HWPROBE_EXT_ZBA ? CPUINFO_ZBA : 0;
+             info |= pair.value & RISCV_HWPROBE_EXT_ZBB ? CPUINFO_ZBB : 0;
+-            left &= ~(CPUINFO_ZBA | CPUINFO_ZBB);
++            info |= pair.value & RISCV_HWPROBE_EXT_ZBS ? CPUINFO_ZBS : 0;
++            left &= ~(CPUINFO_ZBA | CPUINFO_ZBB | CPUINFO_ZBS);
+ #ifdef RISCV_HWPROBE_EXT_ZICOND
+             info |= pair.value & RISCV_HWPROBE_EXT_ZICOND ? CPUINFO_ZICOND : 0;
+             left &= ~CPUINFO_ZICOND;
+@@ -XXX,XX +XXX,XX @@ unsigned __attribute__((constructor)) cpuinfo_init(void)
+             left &= ~CPUINFO_ZBB;
+         }
++        if (left & CPUINFO_ZBS) {
++            /* Probe for Zbs: bext zero,zero,zero. */
++            got_sigill = 0;
++            asm volatile(".insn r 0x33, 5, 0x24, zero, zero, zero"
++                         : : : "memory");
++            info |= got_sigill ? 0 : CPUINFO_ZBS;
++            left &= ~CPUINFO_ZBS;
++        }
++
+         if (left & CPUINFO_ZICOND) {
+             /* Probe for Zicond: czero.eqz zero,zero,zero. */
+             got_sigill = 0;
+--
+.43.0

-New patch
+[PULL 64/68] tcg/riscv: Use BEXTI for single-bit extractions
+Acked-by: Alistair Francis <alistair.francis@wdc.com>
+Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-ID: <20250102181601.1421059-3-richard.henderson@linaro.org>
+---
+ tcg/riscv/tcg-target-has.h |  8 +++++++-
+ tcg/riscv/tcg-target.c.inc | 11 +++++++++--
+files changed, 16 insertions(+), 3 deletions(-)
+diff --git a/tcg/riscv/tcg-target-has.h b/tcg/riscv/tcg-target-has.h
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/riscv/tcg-target-has.h
++++ b/tcg/riscv/tcg-target-has.h
+@@ -XXX,XX +XXX,XX @@ tcg_target_extract_valid(TCGType type, unsigned ofs, unsigned len)
+         /* ofs > 0 uses SRLIW; ofs == 0 uses add.uw. */
+         return ofs || (cpuinfo & CPUINFO_ZBA);
+     }
+-    return (cpuinfo & CPUINFO_ZBB) && ofs == 0 && len == 16;
++    switch (len) {
++    case 1:
++        return (cpuinfo & CPUINFO_ZBS) && ofs != 0;
++    case 16:
++        return (cpuinfo & CPUINFO_ZBB) && ofs == 0;
++    }
++    return false;
+ }
+ #define TCG_TARGET_extract_valid  tcg_target_extract_valid
+diff --git a/tcg/riscv/tcg-target.c.inc b/tcg/riscv/tcg-target.c.inc
+index XXXXXXX..XXXXXXX 100644
+--- a/tcg/riscv/tcg-target.c.inc
++++ b/tcg/riscv/tcg-target.c.inc
+@@ -XXX,XX +XXX,XX @@ typedef enum {
+     OPC_ANDI = 0x7013,
+     OPC_AUIPC = 0x17,
+     OPC_BEQ = 0x63,
++    OPC_BEXTI = 0x48005013,
+     OPC_BGE = 0x5063,
+     OPC_BGEU = 0x7063,
+     OPC_BLT = 0x4063,
+@@ -XXX,XX +XXX,XX @@ static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
+         }
+         /* FALLTHRU */
+     case INDEX_op_extract_i32:
+-        if (a2 == 0 && args[3] == 16) {
++        switch (args[3]) {
++        case 1:
++            tcg_out_opc_imm(s, OPC_BEXTI, a0, a1, a2);
++            break;
++        case 16:
++            tcg_debug_assert(a2 == 0);
+             tcg_out_ext16u(s, a0, a1);
+-        } else {
++            break;
++        default:
+             g_assert_not_reached();
+         }
+         break;
+--
+.43.0

-[PULL 26/40] tests/tcg/s390x: Add cdsg.c
+[PULL 65/68] linux-user: Add missing /proc/cpuinfo fields for sparc
-From: Ilya Leoshkevich <iii@linux.ibm.com>
+From: Helge Deller <deller@kernel.org>
-Add a simple test to prevent regressions.
+Add some missing fields which may be parsed by userspace applications.
-Signed-off-by: Ilya Leoshkevich <iii@linux.ibm.com>
+Signed-off-by: Helge Deller <deller@gmx.de>
-Message-Id: <20230201133257.3223115-1-iii@linux.ibm.com>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-ID: <Z39B1wzNNpndmOxZ@p100>
 ---
- tests/tcg/s390x/cdsg.c          | 93 +++++++++++++++++++++++++++++++++
+ linux-user/sparc/target_proc.h | 20 +++++++++++++++++++-
- tests/tcg/s390x/Makefile.target |  4 ++
+file changed, 19 insertions(+), 1 deletion(-)
 files changed, 97 insertions(+)
  create mode 100644 tests/tcg/s390x/cdsg.c
-diff --git a/tests/tcg/s390x/cdsg.c b/tests/tcg/s390x/cdsg.c
+diff --git a/linux-user/sparc/target_proc.h b/linux-user/sparc/target_proc.h
-new file mode 100644
+index XXXXXXX..XXXXXXX 100644
-index XXXXXXX..XXXXXXX
+--- a/linux-user/sparc/target_proc.h
---- /dev/null
++++ b/linux-user/sparc/target_proc.h
 +++ b/tests/tcg/s390x/cdsg.c
 @@ -XXX,XX +XXX,XX @@
-+/*
-+ * Test CDSG instruction.
+ static int open_cpuinfo(CPUArchState *cpu_env, int fd)
-+ *
+ {
-+ * Increment the first half of aligned_quadword by 1, and the second half by 2
+-    dprintf(fd, "type\t\t: sun4u\n");
-+ * from 2 threads. Verify that the result is consistent.
++    int i, num_cpus;
-+ *
++    const char *cpu_type;
 + * SPDX-License-Identifier: GPL-2.0-or-later
 + */
 +#include <assert.h>
 +#include <pthread.h>
 +#include <stdbool.h>
 +#include <stdlib.h>
 +
-+static volatile bool start;
++    num_cpus = sysconf(_SC_NPROCESSORS_ONLN);
-+typedef unsigned long aligned_quadword[2] __attribute__((__aligned__(16)));
++    if (cpu_env->def.features & CPU_FEATURE_HYPV) {
-+static aligned_quadword val;
++        cpu_type = "sun4v";
-+static const int n_iterations = 1000000;
++    } else {
-+
++        cpu_type = "sun4u";
 +static inline int cdsg(unsigned long *orig0, unsigned long *orig1,
 +                       unsigned long new0, unsigned long new1,
 +                       aligned_quadword *mem)
 +{
 +    register unsigned long r0 asm("r0");
 +    register unsigned long r1 asm("r1");
 +    register unsigned long r2 asm("r2");
 +    register unsigned long r3 asm("r3");
 +    int cc;
 +
 +    r0 = *orig0;
 +    r1 = *orig1;
 +    r2 = new0;
 +    r3 = new1;
 +    asm("cdsg %[r0],%[r2],%[db2]\n"
 +        "ipm %[cc]"
 +        : [r0] "+r" (r0)
 +        , [r1] "+r" (r1)
 +        , [db2] "+m" (*mem)
 +        , [cc] "=r" (cc)
 +        : [r2] "r" (r2)
 +        , [r3] "r" (r3)
 +        : "cc");
 +    *orig0 = r0;
 +    *orig1 = r1;
 +
 +    return (cc >> 28) & 3;
 +}
 +
 +void *cdsg_loop(void *arg)
 +{
 +    unsigned long orig0, orig1, new0, new1;
 +    int cc;
 +    int i;
 +
 +    while (!start) {
 +    }
 +
-+    orig0 = val[0];
++    dprintf(fd, "cpu\t\t: %s (QEMU)\n", cpu_env->def.name);
-+    orig1 = val[1];
++    dprintf(fd, "type\t\t: %s\n", cpu_type);
-+    for (i = 0; i < n_iterations;) {
++    dprintf(fd, "ncpus probed\t: %d\n", num_cpus);
-+        new0 = orig0 + 1;
++    dprintf(fd, "ncpus active\t: %d\n", num_cpus);
-+        new1 = orig1 + 2;
++    dprintf(fd, "State:\n");
-+
++    for (i = 0; i < num_cpus; i++) {
-+        cc = cdsg(&orig0, &orig1, new0, new1, &val);
++        dprintf(fd, "CPU%d:\t\t: online\n", i);
 +
 +        if (cc == 0) {
 +            orig0 = new0;
 +            orig1 = new1;
 +            i++;
 +        } else {
 +            assert(cc == 1);
 +        }
 +    }
 +
-+    return NULL;
+     return 0;
-+}
+ }
-+
+ #define HAVE_ARCH_PROC_CPUINFO
 +int main(void)
 +{
 +    pthread_t thread;
 +    int ret;
 +
 +    ret = pthread_create(&thread, NULL, cdsg_loop, NULL);
 +    assert(ret == 0);
 +    start = true;
 +    cdsg_loop(NULL);
 +    ret = pthread_join(thread, NULL);
 +    assert(ret == 0);
 +
 +    assert(val[0] == n_iterations * 2);
 +    assert(val[1] == n_iterations * 4);
 +
 +    return EXIT_SUCCESS;
 +}
 diff --git a/tests/tcg/s390x/Makefile.target b/tests/tcg/s390x/Makefile.target
 index XXXXXXX..XXXXXXX 100644
 --- a/tests/tcg/s390x/Makefile.target
 +++ b/tests/tcg/s390x/Makefile.target
@@ -XXX,XX +XXX,XX @@ TESTS+=noexec
  TESTS+=div
  TESTS+=clst
  TESTS+=long-double
 +TESTS+=cdsg
 +
 +cdsg: CFLAGS+=-pthread
 +cdsg: LDFLAGS+=-pthread
  Z13_TESTS=vistr
  $(Z13_TESTS): CFLAGS+=-march=z13 -O2
 --
-.34.1
+.43.0

-[PULL 20/40] target/arm: Use tcg_gen_atomic_cmpxchg_i128 for STXP
+[PULL 66/68] tcg: Document tb_lookup() and tcg_tb_lookup()
+From: Ilya Leoshkevich <iii@linux.ibm.com>
+These similarly named functions serve different purposes; add
+docstrings to highlight them.
+Suggested-by: Alex Bennée <alex.bennee@linaro.org>
+Signed-off-by: Ilya Leoshkevich <iii@linux.ibm.com>
+Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
-Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
+Message-ID: <20250116213214.5695-1-iii@linux.ibm.com>
 Message-Id: <20221112042555.2622152-2-richard.henderson@linaro.org>
 ---
- target/arm/helper-a64.h    |   6 ---
+ include/tcg/tcg.h    | 41 +++++++++++++++++++++++++++++++++++++++++
- target/arm/helper-a64.c    | 104 -------------------------------------
+ accel/tcg/cpu-exec.c | 15 ++++++++++++++-
- target/arm/translate-a64.c |  60 ++++++++++++---------
+files changed, 55 insertions(+), 1 deletion(-)
 files changed, 35 insertions(+), 135 deletions(-)
-diff --git a/target/arm/helper-a64.h b/target/arm/helper-a64.h
+diff --git a/include/tcg/tcg.h b/include/tcg/tcg.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper-a64.h
+--- a/include/tcg/tcg.h
-+++ b/target/arm/helper-a64.h
++++ b/include/tcg/tcg.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_2(frecpx_f16, TCG_CALL_NO_RWG, f16, f16, ptr)
+@@ -XXX,XX +XXX,XX @@ void tcg_region_reset_all(void);
- DEF_HELPER_FLAGS_2(fcvtx_f64_to_f32, TCG_CALL_NO_RWG, f32, f64, env)
+ size_t tcg_code_size(void);
- DEF_HELPER_FLAGS_3(crc32_64, TCG_CALL_NO_RWG_SE, i64, i64, i64, i32)
+ size_t tcg_code_capacity(void);
- DEF_HELPER_FLAGS_3(crc32c_64, TCG_CALL_NO_RWG_SE, i64, i64, i64, i32)
--DEF_HELPER_FLAGS_4(paired_cmpxchg64_le, TCG_CALL_NO_WG, i64, env, i64, i64, i64)
++/**
--DEF_HELPER_FLAGS_4(paired_cmpxchg64_le_parallel, TCG_CALL_NO_WG,
++ * tcg_tb_insert:
--                   i64, env, i64, i64, i64)
++ * @tb: translation block to insert
--DEF_HELPER_FLAGS_4(paired_cmpxchg64_be, TCG_CALL_NO_WG, i64, env, i64, i64, i64)
++ *
--DEF_HELPER_FLAGS_4(paired_cmpxchg64_be_parallel, TCG_CALL_NO_WG,
++ * Insert @tb into the region trees.
--                   i64, env, i64, i64, i64)
++ */
- DEF_HELPER_5(casp_le_parallel, void, env, i32, i64, i64, i64)
+ void tcg_tb_insert(TranslationBlock *tb);
- DEF_HELPER_5(casp_be_parallel, void, env, i32, i64, i64, i64)
++
- DEF_HELPER_FLAGS_3(advsimd_maxh, TCG_CALL_NO_RWG, f16, f16, f16, ptr)
++/**
-diff --git a/target/arm/helper-a64.c b/target/arm/helper-a64.c
++ * tcg_tb_remove:
 + * @tb: translation block to remove
 + *
 + * Remove @tb from the region trees.
 + */
  void tcg_tb_remove(TranslationBlock *tb);
 +
 +/**
 + * tcg_tb_lookup:
 + * @tc_ptr: host PC to look up
 + *
 + * Look up a translation block inside the region trees by @tc_ptr. This is
 + * useful for exception handling, but must not be used for the purposes of
 + * executing the returned translation block. See struct tb_tc for more
 + * information.
 + *
 + * Returns: a translation block previously inserted into the region trees,
 + * such that @tc_ptr points anywhere inside the code generated for it, or
 + * NULL.
 + */
  TranslationBlock *tcg_tb_lookup(uintptr_t tc_ptr);
 +
 +/**
 + * tcg_tb_foreach:
 + * @func: callback
 + * @user_data: opaque value to pass to @callback
 + *
 + * Call @func for each translation block inserted into the region trees.
 + */
  void tcg_tb_foreach(GTraverseFunc func, gpointer user_data);
 +
 +/**
 + * tcg_nb_tbs:
 + *
 + * Returns: the number of translation blocks inserted into the region trees.
 + */
  size_t tcg_nb_tbs(void);
  /* user-mode: Called with mmap_lock held.  */
 diff --git a/accel/tcg/cpu-exec.c b/accel/tcg/cpu-exec.c
 index XXXXXXX..XXXXXXX 100644
---- a/target/arm/helper-a64.c
+--- a/accel/tcg/cpu-exec.c
-+++ b/target/arm/helper-a64.c
++++ b/accel/tcg/cpu-exec.c
-@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(crc32c_64)(uint64_t acc, uint64_t val, uint32_t bytes)
+@@ -XXX,XX +XXX,XX @@ static TranslationBlock *tb_htable_lookup(CPUState *cpu, vaddr pc,
-     return crc32c(acc, buf, bytes) ^ 0xffffffff;
+     return qht_lookup_custom(&tb_ctx.htable, &desc, h, tb_lookup_cmp);
  }
--uint64_t HELPER(paired_cmpxchg64_le)(CPUARMState *env, uint64_t addr,
+-/* Might cause an exception, so have a longjmp destination ready */
--                                     uint64_t new_lo, uint64_t new_hi)
++/**
--{
++ * tb_lookup:
--    Int128 cmpv = int128_make128(env->exclusive_val, env->exclusive_high);
++ * @cpu: CPU that will execute the returned translation block
--    Int128 newv = int128_make128(new_lo, new_hi);
++ * @pc: guest PC
--    Int128 oldv;
++ * @cs_base: arch-specific value associated with translation block
--    uintptr_t ra = GETPC();
++ * @flags: arch-specific translation block flags
--    uint64_t o0, o1;
++ * @cflags: CF_* flags
--    bool success;
++ *
--    int mem_idx = cpu_mmu_index(env, false);
++ * Look up a translation block inside the QHT using @pc, @cs_base, @flags and
--    MemOpIdx oi0 = make_memop_idx(MO_LEUQ | MO_ALIGN_16, mem_idx);
++ * @cflags. Uses @cpu's tb_jmp_cache. Might cause an exception, so have a
--    MemOpIdx oi1 = make_memop_idx(MO_LEUQ, mem_idx);
++ * longjmp destination ready.
--
++ *
--    o0 = cpu_ldq_le_mmu(env, addr + 0, oi0, ra);
++ * Returns: an existing translation block or NULL.
--    o1 = cpu_ldq_le_mmu(env, addr + 8, oi1, ra);
++ */
--    oldv = int128_make128(o0, o1);
+ static inline TranslationBlock *tb_lookup(CPUState *cpu, vaddr pc,
--
+                                           uint64_t cs_base, uint32_t flags,
--    success = int128_eq(oldv, cmpv);
+                                           uint32_t cflags)
 -    if (success) {
 -        cpu_stq_le_mmu(env, addr + 0, int128_getlo(newv), oi1, ra);
 -        cpu_stq_le_mmu(env, addr + 8, int128_gethi(newv), oi1, ra);
 -    }
 -
 -    return !success;
 -}
 -
 -uint64_t HELPER(paired_cmpxchg64_le_parallel)(CPUARMState *env, uint64_t addr,
 -                                              uint64_t new_lo, uint64_t new_hi)
 -{
 -    Int128 oldv, cmpv, newv;
 -    uintptr_t ra = GETPC();
 -    bool success;
 -    int mem_idx;
 -    MemOpIdx oi;
 -
 -    assert(HAVE_CMPXCHG128);
 -
 -    mem_idx = cpu_mmu_index(env, false);
 -    oi = make_memop_idx(MO_LE | MO_128 | MO_ALIGN, mem_idx);
 -
 -    cmpv = int128_make128(env->exclusive_val, env->exclusive_high);
 -    newv = int128_make128(new_lo, new_hi);
 -    oldv = cpu_atomic_cmpxchgo_le_mmu(env, addr, cmpv, newv, oi, ra);
 -
 -    success = int128_eq(oldv, cmpv);
 -    return !success;
 -}
 -
 -uint64_t HELPER(paired_cmpxchg64_be)(CPUARMState *env, uint64_t addr,
 -                                     uint64_t new_lo, uint64_t new_hi)
 -{
 -    /*
 -     * High and low need to be switched here because this is not actually a
 -     * 128bit store but two doublewords stored consecutively
 -     */
 -    Int128 cmpv = int128_make128(env->exclusive_high, env->exclusive_val);
 -    Int128 newv = int128_make128(new_hi, new_lo);
 -    Int128 oldv;
 -    uintptr_t ra = GETPC();
 -    uint64_t o0, o1;
 -    bool success;
 -    int mem_idx = cpu_mmu_index(env, false);
 -    MemOpIdx oi0 = make_memop_idx(MO_BEUQ | MO_ALIGN_16, mem_idx);
 -    MemOpIdx oi1 = make_memop_idx(MO_BEUQ, mem_idx);
 -
 -    o1 = cpu_ldq_be_mmu(env, addr + 0, oi0, ra);
 -    o0 = cpu_ldq_be_mmu(env, addr + 8, oi1, ra);
 -    oldv = int128_make128(o0, o1);
 -
 -    success = int128_eq(oldv, cmpv);
 -    if (success) {
 -        cpu_stq_be_mmu(env, addr + 0, int128_gethi(newv), oi1, ra);
 -        cpu_stq_be_mmu(env, addr + 8, int128_getlo(newv), oi1, ra);
 -    }
 -
 -    return !success;
 -}
 -
 -uint64_t HELPER(paired_cmpxchg64_be_parallel)(CPUARMState *env, uint64_t addr,
 -                                              uint64_t new_lo, uint64_t new_hi)
 -{
 -    Int128 oldv, cmpv, newv;
 -    uintptr_t ra = GETPC();
 -    bool success;
 -    int mem_idx;
 -    MemOpIdx oi;
 -
 -    assert(HAVE_CMPXCHG128);
 -
 -    mem_idx = cpu_mmu_index(env, false);
 -    oi = make_memop_idx(MO_BE | MO_128 | MO_ALIGN, mem_idx);
 -
 -    /*
 -     * High and low need to be switched here because this is not actually a
 -     * 128bit store but two doublewords stored consecutively
 -     */
 -    cmpv = int128_make128(env->exclusive_high, env->exclusive_val);
 -    newv = int128_make128(new_hi, new_lo);
 -    oldv = cpu_atomic_cmpxchgo_be_mmu(env, addr, cmpv, newv, oi, ra);
 -
 -    success = int128_eq(oldv, cmpv);
 -    return !success;
 -}
 -
  /* Writes back the old data into Rs.  */
  void HELPER(casp_le_parallel)(CPUARMState *env, uint32_t rs, uint64_t addr,
                                uint64_t new_lo, uint64_t new_hi)
 diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/arm/translate-a64.c
 +++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void gen_store_exclusive(DisasContext *s, int rd, int rt, int rt2,
                                         get_mem_index(s),
                                         MO_64 | MO_ALIGN | s->be_data);
              tcg_gen_setcond_i64(TCG_COND_NE, tmp, tmp, cpu_exclusive_val);
 -        } else if (tb_cflags(s->base.tb) & CF_PARALLEL) {
 -            if (!HAVE_CMPXCHG128) {
 -                gen_helper_exit_atomic(cpu_env);
 -                /*
 -                 * Produce a result so we have a well-formed opcode
 -                 * stream when the following (dead) code uses 'tmp'.
 -                 * TCG will remove the dead ops for us.
 -                 */
 -                tcg_gen_movi_i64(tmp, 0);
 -            } else if (s->be_data == MO_LE) {
 -                gen_helper_paired_cmpxchg64_le_parallel(tmp, cpu_env,
 -                                                        cpu_exclusive_addr,
 -                                                        cpu_reg(s, rt),
 -                                                        cpu_reg(s, rt2));
 -            } else {
 -                gen_helper_paired_cmpxchg64_be_parallel(tmp, cpu_env,
 -                                                        cpu_exclusive_addr,
 -                                                        cpu_reg(s, rt),
 -                                                        cpu_reg(s, rt2));
 -            }
 -        } else if (s->be_data == MO_LE) {
 -            gen_helper_paired_cmpxchg64_le(tmp, cpu_env, cpu_exclusive_addr,
 -                                           cpu_reg(s, rt), cpu_reg(s, rt2));
          } else {
 -            gen_helper_paired_cmpxchg64_be(tmp, cpu_env, cpu_exclusive_addr,
 -                                           cpu_reg(s, rt), cpu_reg(s, rt2));
 +            TCGv_i128 t16 = tcg_temp_new_i128();
 +            TCGv_i128 c16 = tcg_temp_new_i128();
 +            TCGv_i64 a, b;
 +
 +            if (s->be_data == MO_LE) {
 +                tcg_gen_concat_i64_i128(t16, cpu_reg(s, rt), cpu_reg(s, rt2));
 +                tcg_gen_concat_i64_i128(c16, cpu_exclusive_val,
 +                                        cpu_exclusive_high);
 +            } else {
 +                tcg_gen_concat_i64_i128(t16, cpu_reg(s, rt2), cpu_reg(s, rt));
 +                tcg_gen_concat_i64_i128(c16, cpu_exclusive_high,
 +                                        cpu_exclusive_val);
 +            }
 +
 +            tcg_gen_atomic_cmpxchg_i128(t16, cpu_exclusive_addr, c16, t16,
 +                                        get_mem_index(s),
 +                                        MO_128 | MO_ALIGN | s->be_data);
 +            tcg_temp_free_i128(c16);
 +
 +            a = tcg_temp_new_i64();
 +            b = tcg_temp_new_i64();
 +            if (s->be_data == MO_LE) {
 +                tcg_gen_extr_i128_i64(a, b, t16);
 +            } else {
 +                tcg_gen_extr_i128_i64(b, a, t16);
 +            }
 +
 +            tcg_gen_xor_i64(a, a, cpu_exclusive_val);
 +            tcg_gen_xor_i64(b, b, cpu_exclusive_high);
 +            tcg_gen_or_i64(tmp, a, b);
 +            tcg_temp_free_i64(a);
 +            tcg_temp_free_i64(b);
 +            tcg_temp_free_i128(t16);
 +
 +            tcg_gen_setcondi_i64(TCG_COND_NE, tmp, tmp, 0);
          }
      } else {
          tcg_gen_atomic_cmpxchg_i64(tmp, cpu_exclusive_addr, cpu_exclusive_val,
 --
-.34.1
+.43.0

-[PULL 24/40] tests/tcg/s390x: Add clst.c
+[PULL 67/68] accel/tcg: Call tcg_tb_insert() for one-insn TBs
 From: Ilya Leoshkevich <iii@linux.ibm.com>
-Add a basic test to prevent regressions.
+Currently one-insn TBs created from I/O memory are not added to
 region_trees. Therefore, when they generate exceptions, they are not
 handled by cpu_restore_state_from_tb().
+For x86 this is not a problem, because x86_restore_state_to_opc() only
+restores pc and cc, which already have the correct values if the first
+TB instruction causes an exception. However, on several other
+architectures, restore_state_to_opc() is not stricly limited to state
+restoration and affects some exception-related registers, where guests
+can notice incorrect values, for example:
+- arm's exception.syndrome;
+- hppa's unwind_breg;
+- riscv's excp_uw2;
+- s390x's int_pgm_ilen.
+Fix by always calling tcg_tb_insert(). This may increase the size of
+region_trees, but tcg_region_reset_all() clears it once code_gen_buffer
+fills up, so it will not grow uncontrollably.
+Do not call tb_link_page(), which would add such TBs to the QHT, to
+prevent tb_lookup() from finding them. These TBs are single-use, since
+subsequent reads from I/O memory may return different values; they are
+not removed from code_gen_buffer only in order to keep things simple.
+Co-developed-by: Nina Schoetterl-Glausch <nsg@linux.ibm.com>
+Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Signed-off-by: Ilya Leoshkevich <iii@linux.ibm.com>
-Message-Id: <20221025213008.2209006-2-iii@linux.ibm.com>
+Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-ID: <20250116213214.5695-2-iii@linux.ibm.com>
 ---
- tests/tcg/s390x/clst.c          | 82 +++++++++++++++++++++++++++++++++
+ accel/tcg/translate-all.c | 29 +++++++++++++++++++----------
- tests/tcg/s390x/Makefile.target |  1 +
+file changed, 19 insertions(+), 10 deletions(-)
 files changed, 83 insertions(+)
  create mode 100644 tests/tcg/s390x/clst.c
-diff --git a/tests/tcg/s390x/clst.c b/tests/tcg/s390x/clst.c
+diff --git a/accel/tcg/translate-all.c b/accel/tcg/translate-all.c
-new file mode 100644
+index XXXXXXX..XXXXXXX 100644
-index XXXXXXX..XXXXXXX
+--- a/accel/tcg/translate-all.c
---- /dev/null
++++ b/accel/tcg/translate-all.c
-+++ b/tests/tcg/s390x/clst.c
+@@ -XXX,XX +XXX,XX @@ TranslationBlock *tb_gen_code(CPUState *cpu,
-@@ -XXX,XX +XXX,XX @@
+         tb_reset_jump(tb, 1);
-+#define _GNU_SOURCE
+     }
-+#include <stdio.h>
-+#include <stdlib.h>
+-    /*
-+
+-     * If the TB is not associated with a physical RAM page then it must be
-+static int clst(char sep, const char **s1, const char **s2)
+-     * a temporary one-insn TB, and we have nothing left to do. Return early
-+{
+-     * before attempting to link to other TBs or add to the lookup table.
-+    const char *r1 = *s1;
+-     */
-+    const char *r2 = *s2;
+-    if (tb_page_addr0(tb) == -1) {
-+    int cc;
+-        assert_no_pages_locked();
-+
+-        return tb;
-+    do {
+-    }
-+        register int r0 asm("r0") = sep;
+-
-+
+     /*
-+        asm("clst %[r1],%[r2]\n"
+      * Insert TB into the corresponding region tree before publishing it
-+            "ipm %[cc]\n"
+      * through QHT. Otherwise rewinding happened in the TB might fail to
-+            "srl %[cc],28"
+@@ -XXX,XX +XXX,XX @@ TranslationBlock *tb_gen_code(CPUState *cpu,
-+            : [r1] "+r" (r1), [r2] "+r" (r2), "+r" (r0), [cc] "=r" (cc)
+      */
-+            :
+     tcg_tb_insert(tb);
-+            : "cc");
-+        *s1 = r1;
++    /*
-+        *s2 = r2;
++     * If the TB is not associated with a physical RAM page then it must be
-+    } while (cc == 3);
++     * a temporary one-insn TB.
-+
++     *
-+    return cc;
++     * Such TBs must be added to region trees in order to make sure that
-+}
++     * restore_state_to_opc() - which on some architectures is not limited to
-+
++     * rewinding, but also affects exception handling! - is called when such a
-+static const struct test {
++     * TB causes an exception.
-+    const char *name;
++     *
-+    char sep;
++     * At the same time, temporary one-insn TBs must be executed at most once,
-+    const char *s1;
++     * because subsequent reads from, e.g., I/O memory may return different
-+    const char *s2;
++     * values. So return early before attempting to link to other TBs or add
-+    int exp_cc;
++     * to the QHT.
-+    int exp_off;
++     */
-+} tests[] = {
++    if (tb_page_addr0(tb) == -1) {
-+    {
++        assert_no_pages_locked();
-+        .name = "cc0",
++        return tb;
 +        .sep = 0,
 +        .s1 = "aa",
 +        .s2 = "aa",
 +        .exp_cc = 0,
 +        .exp_off = 0,
 +    },
 +    {
 +        .name = "cc1",
 +        .sep = 1,
 +        .s1 = "a\x01",
 +        .s2 = "aa\x01",
 +        .exp_cc = 1,
 +        .exp_off = 1,
 +    },
 +    {
 +        .name = "cc2",
 +        .sep = 2,
 +        .s1 = "abc\x02",
 +        .s2 = "abb\x02",
 +        .exp_cc = 2,
 +        .exp_off = 2,
 +    },
 +};
 +
 +int main(void)
 +{
 +    const struct test *t;
 +    const char *s1, *s2;
 +    size_t i;
 +    int cc;
 +
 +    for (i = 0; i < sizeof(tests) / sizeof(tests[0]); i++) {
 +        t = &tests[i];
 +        s1 = t->s1;
 +        s2 = t->s2;
 +        cc = clst(t->sep, &s1, &s2);
 +        if (cc != t->exp_cc ||
 +                s1 != t->s1 + t->exp_off ||
 +                s2 != t->s2 + t->exp_off) {
 +            fprintf(stderr, "%s\n", t->name);
 +            return EXIT_FAILURE;
 +        }
 +    }
 +
-+    return EXIT_SUCCESS;
+     /*
-+}
+      * No explicit memory barrier is required -- tb_link_page() makes the
-diff --git a/tests/tcg/s390x/Makefile.target b/tests/tcg/s390x/Makefile.target
+      * TB visible in a consistent state.
 index XXXXXXX..XXXXXXX 100644
 --- a/tests/tcg/s390x/Makefile.target
 +++ b/tests/tcg/s390x/Makefile.target
@@ -XXX,XX +XXX,XX @@ TESTS+=signals-s390x
  TESTS+=branch-relative-long
  TESTS+=noexec
  TESTS+=div
 +TESTS+=clst
  Z13_TESTS=vistr
  $(Z13_TESTS): CFLAGS+=-march=z13 -O2
 --
-.34.1
+.43.0

-[PULL 33/40] target/s390x: Use Int128 for returning float128
+[PULL 68/68] softfloat: Constify helpers returning float_status field
-Acked-by: David Hildenbrand <david@redhat.com>
+From: Philippe Mathieu-Daudé <philmd@linaro.org>
-Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 These helpers don't alter float_status. Make it const.
 Signed-off-by: Philippe Mathieu-Daudé <philmd@linaro.org>
 Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
 Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
+Message-ID: <20250116214359.67295-1-philmd@linaro.org>
 ---
-v2: Remove extraneous return_low128.
+ include/fpu/softfloat-helpers.h | 25 ++++++++++++++-----------
----
+file changed, 14 insertions(+), 11 deletions(-)
  target/s390x/helper.h            | 22 +++++++-------
  target/s390x/tcg/insn-data.h.inc | 20 ++++++-------
  target/s390x/tcg/fpu_helper.c    | 29 +++++++++---------
  target/s390x/tcg/translate.c     | 51 +++++++++++++++++---------------
 files changed, 63 insertions(+), 59 deletions(-)
-diff --git a/target/s390x/helper.h b/target/s390x/helper.h
+diff --git a/include/fpu/softfloat-helpers.h b/include/fpu/softfloat-helpers.h
 index XXXXXXX..XXXXXXX 100644
---- a/target/s390x/helper.h
+--- a/include/fpu/softfloat-helpers.h
-+++ b/target/s390x/helper.h
++++ b/include/fpu/softfloat-helpers.h
-@@ -XXX,XX +XXX,XX @@ DEF_HELPER_4(clcle, i32, env, i32, i64, i32)
+@@ -XXX,XX +XXX,XX @@ static inline void set_no_signaling_nans(bool val, float_status *status)
- DEF_HELPER_4(clclu, i32, env, i32, i64, i32)
+     status->no_signaling_nans = val;
- DEF_HELPER_3(cegb, i64, env, s64, i32)
+ }
- DEF_HELPER_3(cdgb, i64, env, s64, i32)
--DEF_HELPER_3(cxgb, i64, env, s64, i32)
+-static inline bool get_float_detect_tininess(float_status *status)
-+DEF_HELPER_3(cxgb, i128, env, s64, i32)
++static inline bool get_float_detect_tininess(const float_status *status)
  DEF_HELPER_3(celgb, i64, env, i64, i32)
  DEF_HELPER_3(cdlgb, i64, env, i64, i32)
 -DEF_HELPER_3(cxlgb, i64, env, i64, i32)
 +DEF_HELPER_3(cxlgb, i128, env, i64, i32)
  DEF_HELPER_4(cdsg, void, env, i64, i32, i32)
  DEF_HELPER_4(cdsg_parallel, void, env, i64, i32, i32)
  DEF_HELPER_4(csst, i32, env, i32, i64, i64)
  DEF_HELPER_4(csst_parallel, i32, env, i32, i64, i64)
  DEF_HELPER_FLAGS_3(aeb, TCG_CALL_NO_WG, i64, env, i64, i64)
  DEF_HELPER_FLAGS_3(adb, TCG_CALL_NO_WG, i64, env, i64, i64)
 -DEF_HELPER_FLAGS_5(axb, TCG_CALL_NO_WG, i64, env, i64, i64, i64, i64)
 +DEF_HELPER_FLAGS_5(axb, TCG_CALL_NO_WG, i128, env, i64, i64, i64, i64)
  DEF_HELPER_FLAGS_3(seb, TCG_CALL_NO_WG, i64, env, i64, i64)
  DEF_HELPER_FLAGS_3(sdb, TCG_CALL_NO_WG, i64, env, i64, i64)
 -DEF_HELPER_FLAGS_5(sxb, TCG_CALL_NO_WG, i64, env, i64, i64, i64, i64)
 +DEF_HELPER_FLAGS_5(sxb, TCG_CALL_NO_WG, i128, env, i64, i64, i64, i64)
  DEF_HELPER_FLAGS_3(deb, TCG_CALL_NO_WG, i64, env, i64, i64)
  DEF_HELPER_FLAGS_3(ddb, TCG_CALL_NO_WG, i64, env, i64, i64)
 -DEF_HELPER_FLAGS_5(dxb, TCG_CALL_NO_WG, i64, env, i64, i64, i64, i64)
 +DEF_HELPER_FLAGS_5(dxb, TCG_CALL_NO_WG, i128, env, i64, i64, i64, i64)
  DEF_HELPER_FLAGS_3(meeb, TCG_CALL_NO_WG, i64, env, i64, i64)
  DEF_HELPER_FLAGS_3(mdeb, TCG_CALL_NO_WG, i64, env, i64, i64)
  DEF_HELPER_FLAGS_3(mdb, TCG_CALL_NO_WG, i64, env, i64, i64)
 -DEF_HELPER_FLAGS_5(mxb, TCG_CALL_NO_WG, i64, env, i64, i64, i64, i64)
 -DEF_HELPER_FLAGS_4(mxdb, TCG_CALL_NO_WG, i64, env, i64, i64, i64)
 +DEF_HELPER_FLAGS_5(mxb, TCG_CALL_NO_WG, i128, env, i64, i64, i64, i64)
 +DEF_HELPER_FLAGS_4(mxdb, TCG_CALL_NO_WG, i128, env, i64, i64, i64)
  DEF_HELPER_FLAGS_2(ldeb, TCG_CALL_NO_WG, i64, env, i64)
  DEF_HELPER_FLAGS_4(ldxb, TCG_CALL_NO_WG, i64, env, i64, i64, i32)
 -DEF_HELPER_FLAGS_2(lxdb, TCG_CALL_NO_WG, i64, env, i64)
 -DEF_HELPER_FLAGS_2(lxeb, TCG_CALL_NO_WG, i64, env, i64)
 +DEF_HELPER_FLAGS_2(lxdb, TCG_CALL_NO_WG, i128, env, i64)
 +DEF_HELPER_FLAGS_2(lxeb, TCG_CALL_NO_WG, i128, env, i64)
  DEF_HELPER_FLAGS_3(ledb, TCG_CALL_NO_WG, i64, env, i64, i32)
  DEF_HELPER_FLAGS_4(lexb, TCG_CALL_NO_WG, i64, env, i64, i64, i32)
  DEF_HELPER_FLAGS_3(ceb, TCG_CALL_NO_WG_SE, i32, env, i64, i64)
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_3(clfdb, i64, env, i64, i32)
  DEF_HELPER_4(clfxb, i64, env, i64, i64, i32)
  DEF_HELPER_FLAGS_3(fieb, TCG_CALL_NO_WG, i64, env, i64, i32)
  DEF_HELPER_FLAGS_3(fidb, TCG_CALL_NO_WG, i64, env, i64, i32)
 -DEF_HELPER_FLAGS_4(fixb, TCG_CALL_NO_WG, i64, env, i64, i64, i32)
 +DEF_HELPER_FLAGS_4(fixb, TCG_CALL_NO_WG, i128, env, i64, i64, i32)
  DEF_HELPER_FLAGS_4(maeb, TCG_CALL_NO_WG, i64, env, i64, i64, i64)
  DEF_HELPER_FLAGS_4(madb, TCG_CALL_NO_WG, i64, env, i64, i64, i64)
  DEF_HELPER_FLAGS_4(mseb, TCG_CALL_NO_WG, i64, env, i64, i64, i64)
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_3(tcdb, TCG_CALL_NO_RWG_SE, i32, env, i64, i64)
  DEF_HELPER_FLAGS_4(tcxb, TCG_CALL_NO_RWG_SE, i32, env, i64, i64, i64)
  DEF_HELPER_FLAGS_2(sqeb, TCG_CALL_NO_WG, i64, env, i64)
  DEF_HELPER_FLAGS_2(sqdb, TCG_CALL_NO_WG, i64, env, i64)
 -DEF_HELPER_FLAGS_3(sqxb, TCG_CALL_NO_WG, i64, env, i64, i64)
 +DEF_HELPER_FLAGS_3(sqxb, TCG_CALL_NO_WG, i128, env, i64, i64)
  DEF_HELPER_FLAGS_1(cvd, TCG_CALL_NO_RWG_SE, i64, s32)
  DEF_HELPER_FLAGS_4(pack, TCG_CALL_NO_WG, void, env, i32, i64, i64)
  DEF_HELPER_FLAGS_4(pka, TCG_CALL_NO_WG, void, env, i64, i64, i32)
 diff --git a/target/s390x/tcg/insn-data.h.inc b/target/s390x/tcg/insn-data.h.inc
 index XXXXXXX..XXXXXXX 100644
 --- a/target/s390x/tcg/insn-data.h.inc
 +++ b/target/s390x/tcg/insn-data.h.inc
@@ -XXX,XX +XXX,XX @@
  /* CONVERT FROM FIXED */
      F(0xb394, CEFBR,   RRF_e, Z,   0, r2_32s, new, e1, cegb, 0, IF_BFP)
      F(0xb395, CDFBR,   RRF_e, Z,   0, r2_32s, new, f1, cdgb, 0, IF_BFP)
 -    F(0xb396, CXFBR,   RRF_e, Z,   0, r2_32s, new_P, x1, cxgb, 0, IF_BFP)
 +    F(0xb396, CXFBR,   RRF_e, Z,   0, r2_32s, new_x, x1, cxgb, 0, IF_BFP)
      F(0xb3a4, CEGBR,   RRF_e, Z,   0, r2_o, new, e1, cegb, 0, IF_BFP)
      F(0xb3a5, CDGBR,   RRF_e, Z,   0, r2_o, new, f1, cdgb, 0, IF_BFP)
 -    F(0xb3a6, CXGBR,   RRF_e, Z,   0, r2_o, new_P, x1, cxgb, 0, IF_BFP)
 +    F(0xb3a6, CXGBR,   RRF_e, Z,   0, r2_o, new_x, x1, cxgb, 0, IF_BFP)
  /* CONVERT TO LOGICAL */
      F(0xb39c, CLFEBR,  RRF_e, FPE, 0, e2, new, r1_32, clfeb, 0, IF_BFP)
      F(0xb39d, CLFDBR,  RRF_e, FPE, 0, f2, new, r1_32, clfdb, 0, IF_BFP)
@@ -XXX,XX +XXX,XX @@
  /* CONVERT FROM LOGICAL */
      F(0xb390, CELFBR,  RRF_e, FPE, 0, r2_32u, new, e1, celgb, 0, IF_BFP)
      F(0xb391, CDLFBR,  RRF_e, FPE, 0, r2_32u, new, f1, cdlgb, 0, IF_BFP)
 -    F(0xb392, CXLFBR,  RRF_e, FPE, 0, r2_32u, new_P, x1, cxlgb, 0, IF_BFP)
 +    F(0xb392, CXLFBR,  RRF_e, FPE, 0, r2_32u, new_x, x1, cxlgb, 0, IF_BFP)
      F(0xb3a0, CELGBR,  RRF_e, FPE, 0, r2_o, new, e1, celgb, 0, IF_BFP)
      F(0xb3a1, CDLGBR,  RRF_e, FPE, 0, r2_o, new, f1, cdlgb, 0, IF_BFP)
 -    F(0xb3a2, CXLGBR,  RRF_e, FPE, 0, r2_o, new_P, x1, cxlgb, 0, IF_BFP)
 +    F(0xb3a2, CXLGBR,  RRF_e, FPE, 0, r2_o, new_x, x1, cxlgb, 0, IF_BFP)
  /* CONVERT UTF-8 TO UTF-16 */
      D(0xb2a7, CU12,    RRF_c, Z,   0, 0, 0, 0, cuXX, 0, 12)
@@ -XXX,XX +XXX,XX @@
  /* LOAD FP INTEGER */
      F(0xb357, FIEBR,   RRF_e, Z,   0, e2, new, e1, fieb, 0, IF_BFP)
      F(0xb35f, FIDBR,   RRF_e, Z,   0, f2, new, f1, fidb, 0, IF_BFP)
 -    F(0xb347, FIXBR,   RRF_e, Z,   x2h, x2l, new_P, x1, fixb, 0, IF_BFP)
 +    F(0xb347, FIXBR,   RRF_e, Z,   x2h, x2l, new_x, x1, fixb, 0, IF_BFP)
  /* LOAD LENGTHENED */
      F(0xb304, LDEBR,   RRE,   Z,   0, e2, new, f1, ldeb, 0, IF_BFP)
 -    F(0xb305, LXDBR,   RRE,   Z,   0, f2, new_P, x1, lxdb, 0, IF_BFP)
 -    F(0xb306, LXEBR,   RRE,   Z,   0, e2, new_P, x1, lxeb, 0, IF_BFP)
 +    F(0xb305, LXDBR,   RRE,   Z,   0, f2, new_x, x1, lxdb, 0, IF_BFP)
 +    F(0xb306, LXEBR,   RRE,   Z,   0, e2, new_x, x1, lxeb, 0, IF_BFP)
      F(0xed04, LDEB,    RXE,   Z,   0, m2_32u, new, f1, ldeb, 0, IF_BFP)
 -    F(0xed05, LXDB,    RXE,   Z,   0, m2_64, new_P, x1, lxdb, 0, IF_BFP)
 -    F(0xed06, LXEB,    RXE,   Z,   0, m2_32u, new_P, x1, lxeb, 0, IF_BFP)
 +    F(0xed05, LXDB,    RXE,   Z,   0, m2_64, new_x, x1, lxdb, 0, IF_BFP)
 +    F(0xed06, LXEB,    RXE,   Z,   0, m2_32u, new_x, x1, lxeb, 0, IF_BFP)
      F(0xb324, LDER,    RXE,   Z,   0, e2, new, f1, lde, 0, IF_AFP1)
      F(0xed24, LDE,     RXE,   Z,   0, m2_32u, new, f1, lde, 0, IF_AFP1)
  /* LOAD ROUNDED */
@@ -XXX,XX +XXX,XX @@
  /* SQUARE ROOT */
      F(0xb314, SQEBR,   RRE,   Z,   0, e2, new, e1, sqeb, 0, IF_BFP)
      F(0xb315, SQDBR,   RRE,   Z,   0, f2, new, f1, sqdb, 0, IF_BFP)
 -    F(0xb316, SQXBR,   RRE,   Z,   x2h, x2l, new_P, x1, sqxb, 0, IF_BFP)
 +    F(0xb316, SQXBR,   RRE,   Z,   x2h, x2l, new_x, x1, sqxb, 0, IF_BFP)
      F(0xed14, SQEB,    RXE,   Z,   0, m2_32u, new, e1, sqeb, 0, IF_BFP)
      F(0xed15, SQDB,    RXE,   Z,   0, m2_64, new, f1, sqdb, 0, IF_BFP)
 diff --git a/target/s390x/tcg/fpu_helper.c b/target/s390x/tcg/fpu_helper.c
 index XXXXXXX..XXXXXXX 100644
 --- a/target/s390x/tcg/fpu_helper.c
 +++ b/target/s390x/tcg/fpu_helper.c
@@ -XXX,XX +XXX,XX @@
  #define HELPER_LOG(x...)
  #endif
 -#define RET128(F) (env->retxl = F.low, F.high)
 +static inline Int128 RET128(float128 f)
 +{
 +    return int128_make128(f.low, f.high);
 +}
  uint8_t s390_softfloat_exc_to_ieee(unsigned int exc)
  {
-@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(adb)(CPUS390XState *env, uint64_t f1, uint64_t f2)
+     return status->tininess_before_rounding;
  }
- /* 128-bit FP addition */
+-static inline FloatRoundMode get_float_rounding_mode(float_status *status)
--uint64_t HELPER(axb)(CPUS390XState *env, uint64_t ah, uint64_t al,
++static inline FloatRoundMode get_float_rounding_mode(const float_status *status)
 +Int128 HELPER(axb)(CPUS390XState *env, uint64_t ah, uint64_t al,
                       uint64_t bh, uint64_t bl)
  {
-     float128 ret = float128_add(make_float128(ah, al),
+     return status->float_rounding_mode;
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(sdb)(CPUS390XState *env, uint64_t f1, uint64_t f2)
  }
- /* 128-bit FP subtraction */
+-static inline int get_float_exception_flags(float_status *status)
--uint64_t HELPER(sxb)(CPUS390XState *env, uint64_t ah, uint64_t al,
++static inline int get_float_exception_flags(const float_status *status)
 +Int128 HELPER(sxb)(CPUS390XState *env, uint64_t ah, uint64_t al,
                       uint64_t bh, uint64_t bl)
  {
-     float128 ret = float128_sub(make_float128(ah, al),
+     return status->float_exception_flags;
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(ddb)(CPUS390XState *env, uint64_t f1, uint64_t f2)
  }
- /* 128-bit FP division */
+ static inline FloatX80RoundPrec
--uint64_t HELPER(dxb)(CPUS390XState *env, uint64_t ah, uint64_t al,
+-get_floatx80_rounding_precision(float_status *status)
-+Int128 HELPER(dxb)(CPUS390XState *env, uint64_t ah, uint64_t al,
++get_floatx80_rounding_precision(const float_status *status)
                       uint64_t bh, uint64_t bl)
  {
-     float128 ret = float128_div(make_float128(ah, al),
+     return status->floatx80_rounding_precision;
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(mdeb)(CPUS390XState *env, uint64_t f1, uint64_t f2)
  }
- /* 128-bit FP multiplication */
+-static inline Float2NaNPropRule get_float_2nan_prop_rule(float_status *status)
--uint64_t HELPER(mxb)(CPUS390XState *env, uint64_t ah, uint64_t al,
++static inline Float2NaNPropRule
-+Int128 HELPER(mxb)(CPUS390XState *env, uint64_t ah, uint64_t al,
++get_float_2nan_prop_rule(const float_status *status)
                       uint64_t bh, uint64_t bl)
  {
-     float128 ret = float128_mul(make_float128(ah, al),
+     return status->float_2nan_prop_rule;
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(mxb)(CPUS390XState *env, uint64_t ah, uint64_t al,
  }
- /* 128/64-bit FP multiplication */
+-static inline Float3NaNPropRule get_float_3nan_prop_rule(float_status *status)
--uint64_t HELPER(mxdb)(CPUS390XState *env, uint64_t ah, uint64_t al,
++static inline Float3NaNPropRule
--                      uint64_t f2)
++get_float_3nan_prop_rule(const float_status *status)
 +Int128 HELPER(mxdb)(CPUS390XState *env, uint64_t ah, uint64_t al, uint64_t f2)
  {
-     float128 ret = float64_to_float128(f2, &env->fpu_status);
+     return status->float_3nan_prop_rule;
      ret = float128_mul(make_float128(ah, al), ret, &env->fpu_status);
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(ldxb)(CPUS390XState *env, uint64_t ah, uint64_t al,
  }
- /* convert 64-bit float to 128-bit float */
+-static inline FloatInfZeroNaNRule get_float_infzeronan_rule(float_status *status)
--uint64_t HELPER(lxdb)(CPUS390XState *env, uint64_t f2)
++static inline FloatInfZeroNaNRule
-+Int128 HELPER(lxdb)(CPUS390XState *env, uint64_t f2)
++get_float_infzeronan_rule(const float_status *status)
  {
-     float128 ret = float64_to_float128(f2, &env->fpu_status);
+     return status->float_infzeronan_rule;
      handle_exceptions(env, false, GETPC());
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(lxdb)(CPUS390XState *env, uint64_t f2)
  }
- /* convert 32-bit float to 128-bit float */
+-static inline uint8_t get_float_default_nan_pattern(float_status *status)
--uint64_t HELPER(lxeb)(CPUS390XState *env, uint64_t f2)
++static inline uint8_t get_float_default_nan_pattern(const float_status *status)
 +Int128 HELPER(lxeb)(CPUS390XState *env, uint64_t f2)
  {
-     float128 ret = float32_to_float128(f2, &env->fpu_status);
+     return status->default_nan_pattern;
      handle_exceptions(env, false, GETPC());
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(cdgb)(CPUS390XState *env, int64_t v2, uint32_t m34)
  }
- /* convert 64-bit int to 128-bit float */
+-static inline bool get_flush_to_zero(float_status *status)
--uint64_t HELPER(cxgb)(CPUS390XState *env, int64_t v2, uint32_t m34)
++static inline bool get_flush_to_zero(const float_status *status)
 +Int128 HELPER(cxgb)(CPUS390XState *env, int64_t v2, uint32_t m34)
  {
-     int old_mode = s390_swap_bfp_rounding_mode(env, round_from_m34(m34));
+     return status->flush_to_zero;
      float128 ret = int64_to_float128(v2, &env->fpu_status);
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(cdlgb)(CPUS390XState *env, uint64_t v2, uint32_t m34)
  }
- /* convert 64-bit uint to 128-bit float */
+-static inline bool get_flush_inputs_to_zero(float_status *status)
--uint64_t HELPER(cxlgb)(CPUS390XState *env, uint64_t v2, uint32_t m34)
++static inline bool get_flush_inputs_to_zero(const float_status *status)
 +Int128 HELPER(cxlgb)(CPUS390XState *env, uint64_t v2, uint32_t m34)
  {
-     int old_mode = s390_swap_bfp_rounding_mode(env, round_from_m34(m34));
+     return status->flush_inputs_to_zero;
      float128 ret = uint64_to_float128(v2, &env->fpu_status);
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(fidb)(CPUS390XState *env, uint64_t f2, uint32_t m34)
  }
- /* round to integer 128-bit */
+-static inline bool get_default_nan_mode(float_status *status)
--uint64_t HELPER(fixb)(CPUS390XState *env, uint64_t ah, uint64_t al,
++static inline bool get_default_nan_mode(const float_status *status)
 -                      uint32_t m34)
 +Int128 HELPER(fixb)(CPUS390XState *env, uint64_t ah, uint64_t al, uint32_t m34)
  {
-     int old_mode = s390_swap_bfp_rounding_mode(env, round_from_m34(m34));
+     return status->default_nan_mode;
      float128 ret = float128_round_to_int(make_float128(ah, al),
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(sqdb)(CPUS390XState *env, uint64_t f2)
  }
- /* square root 128-bit */
--uint64_t HELPER(sqxb)(CPUS390XState *env, uint64_t ah, uint64_t al)
-+Int128 HELPER(sqxb)(CPUS390XState *env, uint64_t ah, uint64_t al)
- {
-     float128 ret = float128_sqrt(make_float128(ah, al), &env->fpu_status);
-     handle_exceptions(env, false, GETPC());
-diff --git a/target/s390x/tcg/translate.c b/target/s390x/tcg/translate.c
-index XXXXXXX..XXXXXXX 100644
---- a/target/s390x/tcg/translate.c
-+++ b/target/s390x/tcg/translate.c
-@@ -XXX,XX +XXX,XX @@ typedef struct {
-     bool g_out, g_out2, g_in1, g_in2;
-     TCGv_i64 out, out2, in1, in2;
-     TCGv_i64 addr1;
-+    TCGv_i128 out_128;
- } DisasOps;
- /* Instructions can place constraints on their operands, raising specification
-@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_adb(DisasContext *s, DisasOps *o)
- static DisasJumpType op_axb(DisasContext *s, DisasOps *o)
- {
--    gen_helper_axb(o->out, cpu_env, o->out, o->out2, o->in1, o->in2);
--    return_low128(o->out2);
-+    gen_helper_axb(o->out_128, cpu_env, o->out, o->out2, o->in1, o->in2);
-     return DISAS_NEXT;
- }
-@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_cxgb(DisasContext *s, DisasOps *o)
-     if (!m34) {
-         return DISAS_NORETURN;
-     }
--    gen_helper_cxgb(o->out, cpu_env, o->in2, m34);
-+    gen_helper_cxgb(o->out_128, cpu_env, o->in2, m34);
-     tcg_temp_free_i32(m34);
--    return_low128(o->out2);
-     return DISAS_NEXT;
- }
-@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_cxlgb(DisasContext *s, DisasOps *o)
-     if (!m34) {
-         return DISAS_NORETURN;
-     }
--    gen_helper_cxlgb(o->out, cpu_env, o->in2, m34);
-+    gen_helper_cxlgb(o->out_128, cpu_env, o->in2, m34);
-     tcg_temp_free_i32(m34);
--    return_low128(o->out2);
-     return DISAS_NEXT;
- }
-@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_ddb(DisasContext *s, DisasOps *o)
- static DisasJumpType op_dxb(DisasContext *s, DisasOps *o)
- {
--    gen_helper_dxb(o->out, cpu_env, o->out, o->out2, o->in1, o->in2);
--    return_low128(o->out2);
-+    gen_helper_dxb(o->out_128, cpu_env, o->out, o->out2, o->in1, o->in2);
-     return DISAS_NEXT;
- }
-@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_fixb(DisasContext *s, DisasOps *o)
-     if (!m34) {
-         return DISAS_NORETURN;
-     }
--    gen_helper_fixb(o->out, cpu_env, o->in1, o->in2, m34);
--    return_low128(o->out2);
-+    gen_helper_fixb(o->out_128, cpu_env, o->in1, o->in2, m34);
-     tcg_temp_free_i32(m34);
-     return DISAS_NEXT;
- }
-@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_lexb(DisasContext *s, DisasOps *o)
- static DisasJumpType op_lxdb(DisasContext *s, DisasOps *o)
- {
--    gen_helper_lxdb(o->out, cpu_env, o->in2);
--    return_low128(o->out2);
-+    gen_helper_lxdb(o->out_128, cpu_env, o->in2);
-     return DISAS_NEXT;
- }
- static DisasJumpType op_lxeb(DisasContext *s, DisasOps *o)
- {
--    gen_helper_lxeb(o->out, cpu_env, o->in2);
--    return_low128(o->out2);
-+    gen_helper_lxeb(o->out_128, cpu_env, o->in2);
-     return DISAS_NEXT;
- }
-@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_mdb(DisasContext *s, DisasOps *o)
- static DisasJumpType op_mxb(DisasContext *s, DisasOps *o)
- {
--    gen_helper_mxb(o->out, cpu_env, o->out, o->out2, o->in1, o->in2);
--    return_low128(o->out2);
-+    gen_helper_mxb(o->out_128, cpu_env, o->out, o->out2, o->in1, o->in2);
-     return DISAS_NEXT;
- }
- static DisasJumpType op_mxdb(DisasContext *s, DisasOps *o)
- {
--    gen_helper_mxdb(o->out, cpu_env, o->out, o->out2, o->in2);
--    return_low128(o->out2);
-+    gen_helper_mxdb(o->out_128, cpu_env, o->out, o->out2, o->in2);
-     return DISAS_NEXT;
- }
-@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_sdb(DisasContext *s, DisasOps *o)
- static DisasJumpType op_sxb(DisasContext *s, DisasOps *o)
- {
--    gen_helper_sxb(o->out, cpu_env, o->out, o->out2, o->in1, o->in2);
--    return_low128(o->out2);
-+    gen_helper_sxb(o->out_128, cpu_env, o->out, o->out2, o->in1, o->in2);
-     return DISAS_NEXT;
- }
-@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_sqdb(DisasContext *s, DisasOps *o)
- static DisasJumpType op_sqxb(DisasContext *s, DisasOps *o)
- {
--    gen_helper_sqxb(o->out, cpu_env, o->in1, o->in2);
--    return_low128(o->out2);
-+    gen_helper_sqxb(o->out_128, cpu_env, o->in1, o->in2);
-     return DISAS_NEXT;
- }
-@@ -XXX,XX +XXX,XX @@ static void prep_new_P(DisasContext *s, DisasOps *o)
- }
- #define SPEC_prep_new_P 0
-+static void prep_new_x(DisasContext *s, DisasOps *o)
-+{
-+    o->out = tcg_temp_new_i64();
-+    o->out2 = tcg_temp_new_i64();
-+    o->out_128 = tcg_temp_new_i128();
-+}
-+#define SPEC_prep_new_x 0
-+
- static void prep_r1(DisasContext *s, DisasOps *o)
- {
-     o->out = regs[get_field(s, r1)];
-@@ -XXX,XX +XXX,XX @@ static void prep_r1_P(DisasContext *s, DisasOps *o)
- }
- #define SPEC_prep_r1_P SPEC_r1_even
--/* Whenever we need x1 in addition to other inputs, we'll load it to out/out2 */
- static void prep_x1(DisasContext *s, DisasOps *o)
- {
-     o->out = load_freg(get_field(s, r1));
-     o->out2 = load_freg(get_field(s, r1) + 2);
-+    o->out_128 = tcg_temp_new_i128();
-+    tcg_gen_concat_i64_i128(o->out_128, o->out2, o->out);
- }
- #define SPEC_prep_x1 SPEC_r1_f128
-@@ -XXX,XX +XXX,XX @@ static void wout_f1(DisasContext *s, DisasOps *o)
- static void wout_x1(DisasContext *s, DisasOps *o)
- {
-     int f1 = get_field(s, r1);
-+
-+    tcg_gen_extr_i128_i64(o->out2, o->out, o->out_128);
-     store_freg(f1, o->out);
-     store_freg(f1 + 2, o->out2);
- }
-@@ -XXX,XX +XXX,XX @@ static DisasJumpType translate_one(CPUS390XState *env, DisasContext *s)
-     if (o.addr1) {
-         tcg_temp_free_i64(o.addr1);
-     }
--
-+    if (o.out_128) {
-+        tcg_temp_free_i128(o.out_128);
-+    }
-     /* io should be the last instruction in tb when icount is enabled */
-     if (unlikely(icount && ret == DISAS_NEXT)) {
-         ret = DISAS_TOO_MANY;
 --
-.34.1
+.43.0

The following changes since commit 579510e196a544b42bd8bca9cc61688d4d1211ac:

Merge tag 'pull-monitor-2023-02-03-v2' of https://repo.or.cz/qemu/armbru into staging (2023-02-04 10:19:55 +0000)

are available in the Git repository at:

https://gitlab.com/rth7680/qemu.git tags/pull-tcg-20230204

for you to fetch changes up to a2495ede07498ee36b18b03e7038ba30c9871bb2:

tcg/aarch64: Fix patching of LDR in tb_target_set_jmp_target (2023-02-04 06:19:43 -1000)

----------------------------------------------------------------
tcg: Add support for TCGv_i128 in parameters and returns.
tcg: Add support for TCGv_i128 in cmpxchg.
tcg: Test CPUJumpCache in tb_jmp_cache_clear_page
tcg: Split out tcg_gen_nonatomic_cmpxchg_i{32,64}
tcg/aarch64: Fix patching of LDR in tb_target_set_jmp_target
target/arm: Use tcg_gen_atomic_cmpxchg_i128
target/i386: Use tcg_gen_atomic_cmpxchg_i128
target/i386: Use tcg_gen_nonatomic_cmpxchg_i{32,64}
target/s390x: Use tcg_gen_atomic_cmpxchg_i128
target/s390x: Use TCGv_i128 in passing and returning float128
target/s390x: Implement CC_OP_NZ in gen_op_calc_cc

----------------------------------------------------------------
Eric Auger (1):
      accel/tcg: Test CPUJumpCache in tb_jmp_cache_clear_page

Ilya Leoshkevich (3):
      tests/tcg/s390x: Add div.c
      tests/tcg/s390x: Add clst.c
      tests/tcg/s390x: Add cdsg.c

Richard Henderson (36):
      tcg: Init temp_subindex in liveness_pass_2
      tcg: Define TCG_TYPE_I128 and related helper macros
      tcg: Handle dh_typecode_i128 with TCG_CALL_{RET,ARG}_NORMAL
      tcg: Allocate objects contiguously in temp_allocate_frame
      tcg: Introduce tcg_out_addi_ptr
      tcg: Add TCG_CALL_{RET,ARG}_BY_REF
      tcg: Introduce tcg_target_call_oarg_reg
      tcg: Add TCG_CALL_RET_BY_VEC
      include/qemu/int128: Use Int128 structure for TCI
      tcg/i386: Add TCG_TARGET_CALL_{RET,ARG}_I128
      tcg/tci: Fix big-endian return register ordering
      tcg/tci: Add TCG_TARGET_CALL_{RET,ARG}_I128
      tcg: Add TCG_TARGET_CALL_{RET,ARG}_I128
      tcg: Add temp allocation for TCGv_i128
      tcg: Add basic data movement for TCGv_i128
      tcg: Add guest load/store primitives for TCGv_i128
      tcg: Add tcg_gen_{non}atomic_cmpxchg_i128
      tcg: Split out tcg_gen_nonatomic_cmpxchg_i{32,64}
      target/arm: Use tcg_gen_atomic_cmpxchg_i128 for STXP
      target/arm: Use tcg_gen_atomic_cmpxchg_i128 for CASP
      target/ppc: Use tcg_gen_atomic_cmpxchg_i128 for STQCX
      tests/tcg/s390x: Add long-double.c
      target/s390x: Use a single return for helper_divs32/u32
      target/s390x: Use a single return for helper_divs64/u64
      target/s390x: Use Int128 for return from CLST
      target/s390x: Use Int128 for return from CKSM
      target/s390x: Use Int128 for return from TRE
      target/s390x: Copy wout_x1 to wout_x1_P
      target/s390x: Use Int128 for returning float128
      target/s390x: Use Int128 for passing float128
      target/s390x: Use tcg_gen_atomic_cmpxchg_i128 for CDSG
      target/s390x: Implement CC_OP_NZ in gen_op_calc_cc
      target/i386: Split out gen_cmpxchg8b, gen_cmpxchg16b
      target/i386: Inline cmpxchg8b
      target/i386: Inline cmpxchg16b
      tcg/aarch64: Fix patching of LDR in tb_target_set_jmp_target

From: Eric Auger <eric.auger@redhat.com>

After commit 4e4fa6c12d ("accel/tcg: Complete cpu initialization
before registration"), it looks the CPUJumpCache pointer can be NULL.
This causes a SIGSEV when running debug-wp-migration kvm unit test.

At the first place it should be clarified why this TCG code is called
with KVM acceleration. This may hide another bug.

Fixes: 4e4fa6c12d ("accel/tcg: Complete cpu initialization before registration")
Signed-off-by: Eric Auger <eric.auger@redhat.com>
Message-Id: <20230203171510.2867451-1-eric.auger@redhat.com>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 accel/tcg/cputlb.c | 7 ++++++-
 1 file changed, 6 insertions(+), 1 deletion(-)

diff --git a/accel/tcg/cputlb.c b/accel/tcg/cputlb.c
index XXXXXXX..XXXXXXX 100644
--- a/accel/tcg/cputlb.c
+++ b/accel/tcg/cputlb.c
@@ -XXX,XX +XXX,XX @@ static void tlb_window_reset(CPUTLBDesc *desc, int64_t ns,
 
 static void tb_jmp_cache_clear_page(CPUState *cpu, target_ulong page_addr)
 {
-    int i, i0 = tb_jmp_cache_hash_page(page_addr);
     CPUJumpCache *jc = cpu->tb_jmp_cache;
+    int i, i0;
 
+    if (unlikely(!jc)) {
+        return;
+    }
+
+    i0 = tb_jmp_cache_hash_page(page_addr);
     for (i = 0; i < TB_JMP_PAGE_SIZE; i++) {
         qatomic_set(&jc->array[i0 + i].tb, NULL);
     }
-- 
2.34.1

Begin staging in support for TCGv_i128 with Int128.
Define the type enumerator, the typedef, and the
helper-head.h macros.

This cannot yet be used, because you can't allocate
temporaries of this new type.

Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 include/exec/helper-head.h |  7 +++++++
 include/tcg/tcg.h          | 17 ++++++++++-------
 2 files changed, 17 insertions(+), 7 deletions(-)

diff --git a/include/exec/helper-head.h b/include/exec/helper-head.h
index XXXXXXX..XXXXXXX 100644
--- a/include/exec/helper-head.h
+++ b/include/exec/helper-head.h
@@ -XXX,XX +XXX,XX @@
 #define dh_alias_int i32
 #define dh_alias_i64 i64
 #define dh_alias_s64 i64
+#define dh_alias_i128 i128
 #define dh_alias_f16 i32
 #define dh_alias_f32 i32
 #define dh_alias_f64 i64
@@ -XXX,XX +XXX,XX @@
 #define dh_ctype_int int
 #define dh_ctype_i64 uint64_t
 #define dh_ctype_s64 int64_t
+#define dh_ctype_i128 Int128
 #define dh_ctype_f16 uint32_t
 #define dh_ctype_f32 float32
 #define dh_ctype_f64 float64
@@ -XXX,XX +XXX,XX @@
 #define dh_retvar_decl0_noreturn void
 #define dh_retvar_decl0_i32 TCGv_i32 retval
 #define dh_retvar_decl0_i64 TCGv_i64 retval
+#define dh_retval_decl0_i128 TCGv_i128 retval
 #define dh_retvar_decl0_ptr TCGv_ptr retval
 #define dh_retvar_decl0(t) glue(dh_retvar_decl0_, dh_alias(t))
 
@@ -XXX,XX +XXX,XX @@
 #define dh_retvar_decl_noreturn
 #define dh_retvar_decl_i32 TCGv_i32 retval,
 #define dh_retvar_decl_i64 TCGv_i64 retval,
+#define dh_retvar_decl_i128 TCGv_i128 retval,
 #define dh_retvar_decl_ptr TCGv_ptr retval,
 #define dh_retvar_decl(t) glue(dh_retvar_decl_, dh_alias(t))
 
@@ -XXX,XX +XXX,XX @@
 #define dh_retvar_noreturn NULL
 #define dh_retvar_i32 tcgv_i32_temp(retval)
 #define dh_retvar_i64 tcgv_i64_temp(retval)
+#define dh_retvar_i128 tcgv_i128_temp(retval)
 #define dh_retvar_ptr tcgv_ptr_temp(retval)
 #define dh_retvar(t) glue(dh_retvar_, dh_alias(t))
 
@@ -XXX,XX +XXX,XX @@
 #define dh_typecode_i64 4
 #define dh_typecode_s64 5
 #define dh_typecode_ptr 6
+#define dh_typecode_i128 7
 #define dh_typecode_int dh_typecode_s32
 #define dh_typecode_f16 dh_typecode_i32
 #define dh_typecode_f32 dh_typecode_i32
@@ -XXX,XX +XXX,XX @@
 
 #define dh_callflag_i32  0
 #define dh_callflag_i64  0
+#define dh_callflag_i128 0
 #define dh_callflag_ptr  0
 #define dh_callflag_void 0
 #define dh_callflag_noreturn TCG_CALL_NO_RETURN
diff --git a/include/tcg/tcg.h b/include/tcg/tcg.h
index XXXXXXX..XXXXXXX 100644
--- a/include/tcg/tcg.h
+++ b/include/tcg/tcg.h
@@ -XXX,XX +XXX,XX @@ typedef struct TCGPool {
 typedef enum TCGType {
     TCG_TYPE_I32,
     TCG_TYPE_I64,
+    TCG_TYPE_I128,
 
     TCG_TYPE_V64,
     TCG_TYPE_V128,
@@ -XXX,XX +XXX,XX @@ typedef tcg_target_ulong TCGArg;
    in tcg/README. Target CPU front-end code uses these types to deal
    with TCG variables as it emits TCG code via the tcg_gen_* functions.
    They come in several flavours:
-    * TCGv_i32 : 32 bit integer type
-    * TCGv_i64 : 64 bit integer type
-    * TCGv_ptr : a host pointer type
-    * TCGv_vec : a host vector type; the exact size is not exposed
-                 to the CPU front-end code.
-    * TCGv : an integer type the same size as target_ulong
-             (an alias for either TCGv_i32 or TCGv_i64)
+    * TCGv_i32  : 32 bit integer type
+    * TCGv_i64  : 64 bit integer type
+    * TCGv_i128 : 128 bit integer type
+    * TCGv_ptr  : a host pointer type
+    * TCGv_vec  : a host vector type; the exact size is not exposed
+                  to the CPU front-end code.
+    * TCGv      : an integer type the same size as target_ulong
+                  (an alias for either TCGv_i32 or TCGv_i64)
    The compiler's type checking will complain if you mix them
    up and pass the wrong sized TCGv to a function.
 
@@ -XXX,XX +XXX,XX @@ typedef tcg_target_ulong TCGArg;
 
 typedef struct TCGv_i32_d *TCGv_i32;
 typedef struct TCGv_i64_d *TCGv_i64;
+typedef struct TCGv_i128_d *TCGv_i128;
 typedef struct TCGv_ptr_d *TCGv_ptr;
 typedef struct TCGv_vec_d *TCGv_vec;
 typedef TCGv_ptr TCGv_env;
-- 
2.34.1

Many hosts pass and return 128-bit quantities like sequential
64-bit quantities.  Treat this just like we currently break
down 64-bit quantities for a 32-bit host.

Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 tcg/tcg.c | 37 +++++++++++++++++++++++++++++++++----
 1 file changed, 33 insertions(+), 4 deletions(-)

diff --git a/tcg/tcg.c b/tcg/tcg.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg.c
+++ b/tcg/tcg.c
@@ -XXX,XX +XXX,XX @@ static void init_call_layout(TCGHelperInfo *info)
     case dh_typecode_s64:
         info->nr_out = 64 / TCG_TARGET_REG_BITS;
         info->out_kind = TCG_CALL_RET_NORMAL;
+        assert(info->nr_out <= ARRAY_SIZE(tcg_target_call_oarg_regs));
+        break;
+    case dh_typecode_i128:
+        info->nr_out = 128 / TCG_TARGET_REG_BITS;
+        info->out_kind = TCG_CALL_RET_NORMAL; /* TODO */
+        switch (/* TODO */ TCG_CALL_RET_NORMAL) {
+        case TCG_CALL_RET_NORMAL:
+            assert(info->nr_out <= ARRAY_SIZE(tcg_target_call_oarg_regs));
+            break;
+        default:
+            qemu_build_not_reached();
+        }
         break;
     default:
         g_assert_not_reached();
     }
-    assert(info->nr_out <= ARRAY_SIZE(tcg_target_call_oarg_regs));
 
     /*
      * Parse and place function arguments.
@@ -XXX,XX +XXX,XX @@ static void init_call_layout(TCGHelperInfo *info)
         case dh_typecode_ptr:
             type = TCG_TYPE_PTR;
             break;
+        case dh_typecode_i128:
+            type = TCG_TYPE_I128;
+            break;
         default:
             g_assert_not_reached();
         }
@@ -XXX,XX +XXX,XX @@ static void init_call_layout(TCGHelperInfo *info)
             }
             break;
 
+        case TCG_TYPE_I128:
+            switch (/* TODO */ TCG_CALL_ARG_NORMAL) {
+            case TCG_CALL_ARG_EVEN:
+                layout_arg_even(&cum);
+                /* fall through */
+            case TCG_CALL_ARG_NORMAL:
+                layout_arg_normal_n(&cum, info, 128 / TCG_TARGET_REG_BITS);
+                break;
+            default:
+                qemu_build_not_reached();
+            }
+            break;
+
         default:
             g_assert_not_reached();
         }
@@ -XXX,XX +XXX,XX @@ void tcg_gen_callN(void *func, TCGTemp *ret, int nargs, TCGTemp **args)
         op->args[pi++] = temp_arg(ret);
         break;
     case 2:
+    case 4:
         tcg_debug_assert(ret != NULL);
-        tcg_debug_assert(ret->base_type == ret->type + 1);
+        tcg_debug_assert(ret->base_type == ret->type + ctz32(n));
         tcg_debug_assert(ret->temp_subindex == 0);
-        op->args[pi++] = temp_arg(ret);
-        op->args[pi++] = temp_arg(ret + 1);
+        for (i = 0; i < n; ++i) {
+            op->args[pi++] = temp_arg(ret + i);
+        }
         break;
     default:
         g_assert_not_reached();
-- 
2.34.1

When allocating a temp to the stack frame, consider the
base type and allocate all parts at once.

Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 tcg/tcg.c | 34 ++++++++++++++++++++++++++--------
 1 file changed, 26 insertions(+), 8 deletions(-)

diff --git a/tcg/tcg.c b/tcg/tcg.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg.c
+++ b/tcg/tcg.c
@@ -XXX,XX +XXX,XX @@ static bool liveness_pass_2(TCGContext *s)
 
 static void temp_allocate_frame(TCGContext *s, TCGTemp *ts)
 {
-    int size = tcg_type_size(ts->type);
-    int align;
     intptr_t off;
+    int size, align;
 
-    switch (ts->type) {
+    /* When allocating an object, look at the full type. */
+    size = tcg_type_size(ts->base_type);
+    switch (ts->base_type) {
     case TCG_TYPE_I32:
         align = 4;
         break;
@@ -XXX,XX +XXX,XX @@ static void temp_allocate_frame(TCGContext *s, TCGTemp *ts)
         tcg_raise_tb_overflow(s);
     }
     s->current_frame_offset = off + size;
-
-    ts->mem_offset = off;
 #if defined(__sparc__)
-    ts->mem_offset += TCG_TARGET_STACK_BIAS;
+    off += TCG_TARGET_STACK_BIAS;
 #endif
-    ts->mem_base = s->frame_temp;
-    ts->mem_allocated = 1;
+
+    /* If the object was subdivided, assign memory to all the parts. */
+    if (ts->base_type != ts->type) {
+        int part_size = tcg_type_size(ts->type);
+        int part_count = size / part_size;
+
+        /*
+         * Each part is allocated sequentially in tcg_temp_new_internal.
+         * Jump back to the first part by subtracting the current index.
+         */
+        ts -= ts->temp_subindex;
+        for (int i = 0; i < part_count; ++i) {
+            ts[i].mem_offset = off + i * part_size;
+            ts[i].mem_base = s->frame_temp;
+            ts[i].mem_allocated = 1;
+        }
+    } else {
+        ts->mem_offset = off;
+        ts->mem_base = s->frame_temp;
+        ts->mem_allocated = 1;
+    }
 }
 
 /* Assign @reg to @ts, and update reg_to_temp[]. */
-- 
2.34.1

Implement the function for arm, i386, and s390x, which will use it.
Add stubs for all other backends.

Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Daniel Henrique Barboza <danielhb413@gmail.com>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 tcg/tcg.c                        |  2 ++
 tcg/aarch64/tcg-target.c.inc     |  7 +++++++
 tcg/arm/tcg-target.c.inc         | 20 ++++++++++++++++++++
 tcg/i386/tcg-target.c.inc        |  8 ++++++++
 tcg/loongarch64/tcg-target.c.inc |  7 +++++++
 tcg/mips/tcg-target.c.inc        |  7 +++++++
 tcg/ppc/tcg-target.c.inc         |  7 +++++++
 tcg/riscv/tcg-target.c.inc       |  7 +++++++
 tcg/s390x/tcg-target.c.inc       |  7 +++++++
 tcg/sparc64/tcg-target.c.inc     |  7 +++++++
 tcg/tci/tcg-target.c.inc         |  7 +++++++
 11 files changed, 86 insertions(+)

diff --git a/tcg/tcg.c b/tcg/tcg.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg.c
+++ b/tcg/tcg.c
@@ -XXX,XX +XXX,XX @@ static void tcg_out_ld(TCGContext *s, TCGType type, TCGReg ret, TCGReg arg1,
 static bool tcg_out_mov(TCGContext *s, TCGType type, TCGReg ret, TCGReg arg);
 static void tcg_out_movi(TCGContext *s, TCGType type,
                          TCGReg ret, tcg_target_long arg);
+static void tcg_out_addi_ptr(TCGContext *s, TCGReg, TCGReg, tcg_target_long)
+    __attribute__((unused));
 static void tcg_out_exit_tb(TCGContext *s, uintptr_t arg);
 static void tcg_out_goto_tb(TCGContext *s, int which);
 static void tcg_out_op(TCGContext *s, TCGOpcode opc,
diff --git a/tcg/aarch64/tcg-target.c.inc b/tcg/aarch64/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/aarch64/tcg-target.c.inc
+++ b/tcg/aarch64/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static void tcg_out_movi(TCGContext *s, TCGType type, TCGReg rd,
     tcg_out_insn(s, 3305, LDR, 0, rd);
 }
 
+static void tcg_out_addi_ptr(TCGContext *s, TCGReg rd, TCGReg rs,
+                             tcg_target_long imm)
+{
+    /* This function is only used for passing structs by reference. */
+    g_assert_not_reached();
+}
+
 /* Define something more legible for general use.  */
 #define tcg_out_ldst_r  tcg_out_insn_3310
 
diff --git a/tcg/arm/tcg-target.c.inc b/tcg/arm/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/arm/tcg-target.c.inc
+++ b/tcg/arm/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static void tcg_out_movi(TCGContext *s, TCGType type,
     tcg_out_movi32(s, COND_AL, ret, arg);
 }
 
+static void tcg_out_addi_ptr(TCGContext *s, TCGReg rd, TCGReg rs,
+                             tcg_target_long imm)
+{
+    int enc, opc = ARITH_ADD;
+
+    /* All of the easiest immediates to encode are positive. */
+    if (imm < 0) {
+        imm = -imm;
+        opc = ARITH_SUB;
+    }
+    enc = encode_imm(imm);
+    if (enc >= 0) {
+        tcg_out_dat_imm(s, COND_AL, opc, rd, rs, enc);
+    } else {
+        tcg_out_movi32(s, COND_AL, TCG_REG_TMP, imm);
+        tcg_out_dat_reg(s, COND_AL, opc, rd, rs,
+                        TCG_REG_TMP, SHIFT_IMM_LSL(0));
+    }
+}
+
 /* Type is always V128, with I64 elements.  */
 static void tcg_out_dup2_vec(TCGContext *s, TCGReg rd, TCGReg rl, TCGReg rh)
 {
diff --git a/tcg/i386/tcg-target.c.inc b/tcg/i386/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/i386/tcg-target.c.inc
+++ b/tcg/i386/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static void tcg_out_movi(TCGContext *s, TCGType type,
     }
 }
 
+static void tcg_out_addi_ptr(TCGContext *s, TCGReg rd, TCGReg rs,
+                             tcg_target_long imm)
+{
+    /* This function is only used for passing structs by reference. */
+    tcg_debug_assert(TCG_TARGET_REG_BITS == 32);
+    tcg_out_modrm_offset(s, OPC_LEA, rd, rs, imm);
+}
+
 static inline void tcg_out_pushi(TCGContext *s, tcg_target_long val)
 {
     if (val == (int8_t)val) {
diff --git a/tcg/loongarch64/tcg-target.c.inc b/tcg/loongarch64/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/loongarch64/tcg-target.c.inc
+++ b/tcg/loongarch64/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static void tcg_out_addi(TCGContext *s, TCGType type, TCGReg rd,
     }
 }
 
+static void tcg_out_addi_ptr(TCGContext *s, TCGReg rd, TCGReg rs,
+                             tcg_target_long imm)
+{
+    /* This function is only used for passing structs by reference. */
+    g_assert_not_reached();
+}
+
 static void tcg_out_ext8u(TCGContext *s, TCGReg ret, TCGReg arg)
 {
     tcg_out_opc_andi(s, ret, arg, 0xff);
diff --git a/tcg/mips/tcg-target.c.inc b/tcg/mips/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/mips/tcg-target.c.inc
+++ b/tcg/mips/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static void tcg_out_movi(TCGContext *s, TCGType type,
     }
 }
 
+static void tcg_out_addi_ptr(TCGContext *s, TCGReg rd, TCGReg rs,
+                             tcg_target_long imm)
+{
+    /* This function is only used for passing structs by reference. */
+    g_assert_not_reached();
+}
+
 static void tcg_out_bswap16(TCGContext *s, TCGReg ret, TCGReg arg, int flags)
 {
     /* ret and arg can't be register tmp0 */
diff --git a/tcg/ppc/tcg-target.c.inc b/tcg/ppc/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/ppc/tcg-target.c.inc
+++ b/tcg/ppc/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static void tcg_out_movi(TCGContext *s, TCGType type, TCGReg ret,
     }
 }
 
+static void tcg_out_addi_ptr(TCGContext *s, TCGReg rd, TCGReg rs,
+                             tcg_target_long imm)
+{
+    /* This function is only used for passing structs by reference. */
+    g_assert_not_reached();
+}
+
 static bool mask_operand(uint32_t c, int *mb, int *me)
 {
     uint32_t lsb, test;
diff --git a/tcg/riscv/tcg-target.c.inc b/tcg/riscv/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/riscv/tcg-target.c.inc
+++ b/tcg/riscv/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static void tcg_out_movi(TCGContext *s, TCGType type, TCGReg rd,
     tcg_out_opc_imm(s, OPC_LD, rd, rd, 0);
 }
 
+static void tcg_out_addi_ptr(TCGContext *s, TCGReg rd, TCGReg rs,
+                             tcg_target_long imm)
+{
+    /* This function is only used for passing structs by reference. */
+    g_assert_not_reached();
+}
+
 static void tcg_out_ext8u(TCGContext *s, TCGReg ret, TCGReg arg)
 {
     tcg_out_opc_imm(s, OPC_ANDI, ret, arg, 0xff);
diff --git a/tcg/s390x/tcg-target.c.inc b/tcg/s390x/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/s390x/tcg-target.c.inc
+++ b/tcg/s390x/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static inline bool tcg_out_sti(TCGContext *s, TCGType type, TCGArg val,
     return false;
 }
 
+static void tcg_out_addi_ptr(TCGContext *s, TCGReg rd, TCGReg rs,
+                             tcg_target_long imm)
+{
+    /* This function is only used for passing structs by reference. */
+    tcg_out_mem(s, RX_LA, RXY_LAY, rd, rs, TCG_REG_NONE, imm);
+}
+
 static inline void tcg_out_risbg(TCGContext *s, TCGReg dest, TCGReg src,
                                  int msb, int lsb, int ofs, int z)
 {
diff --git a/tcg/sparc64/tcg-target.c.inc b/tcg/sparc64/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/sparc64/tcg-target.c.inc
+++ b/tcg/sparc64/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static void tcg_out_movi(TCGContext *s, TCGType type,
     tcg_out_movi_int(s, type, ret, arg, false, TCG_REG_T2);
 }
 
+static void tcg_out_addi_ptr(TCGContext *s, TCGReg rd, TCGReg rs,
+                             tcg_target_long imm)
+{
+    /* This function is only used for passing structs by reference. */
+    g_assert_not_reached();
+}
+
 static void tcg_out_ldst_rr(TCGContext *s, TCGReg data, TCGReg a1,
                             TCGReg a2, int op)
 {
diff --git a/tcg/tci/tcg-target.c.inc b/tcg/tci/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tci/tcg-target.c.inc
+++ b/tcg/tci/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static void tcg_out_movi(TCGContext *s, TCGType type,
     }
 }
 
+static void tcg_out_addi_ptr(TCGContext *s, TCGReg rd, TCGReg rs,
+                             tcg_target_long imm)
+{
+    /* This function is only used for passing structs by reference. */
+    g_assert_not_reached();
+}
+
 static void tcg_out_call(TCGContext *s, const tcg_insn_unit *func,
                          const TCGHelperInfo *info)
 {
-- 
2.34.1

These will be used by some hosts, both 32 and 64-bit, to pass and
return i128.  Not yet used, because allocation is not yet enabled.

Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 tcg/tcg-internal.h |   3 +
 tcg/tcg.c          | 135 ++++++++++++++++++++++++++++++++++++++++++++-
 2 files changed, 135 insertions(+), 3 deletions(-)

diff --git a/tcg/tcg-internal.h b/tcg/tcg-internal.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg-internal.h
+++ b/tcg/tcg-internal.h
@@ -XXX,XX +XXX,XX @@
  */
 typedef enum {
     TCG_CALL_RET_NORMAL,         /* by registers */
+    TCG_CALL_RET_BY_REF,         /* for i128, by reference */
 } TCGCallReturnKind;
 
 typedef enum {
@@ -XXX,XX +XXX,XX @@ typedef enum {
     TCG_CALL_ARG_EXTEND,         /* for i32, as a sign/zero-extended i64 */
     TCG_CALL_ARG_EXTEND_U,       /*      ... as a zero-extended i64 */
     TCG_CALL_ARG_EXTEND_S,       /*      ... as a sign-extended i64 */
+    TCG_CALL_ARG_BY_REF,         /* for i128, by reference, first */
+    TCG_CALL_ARG_BY_REF_N,       /*       ... by reference, subsequent */
 } TCGCallArgumentKind;
 
 typedef struct TCGCallArgumentLoc {
diff --git a/tcg/tcg.c b/tcg/tcg.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg.c
+++ b/tcg/tcg.c
@@ -XXX,XX +XXX,XX @@ static void tcg_out_ld(TCGContext *s, TCGType type, TCGReg ret, TCGReg arg1,
 static bool tcg_out_mov(TCGContext *s, TCGType type, TCGReg ret, TCGReg arg);
 static void tcg_out_movi(TCGContext *s, TCGType type,
                          TCGReg ret, tcg_target_long arg);
-static void tcg_out_addi_ptr(TCGContext *s, TCGReg, TCGReg, tcg_target_long)
-    __attribute__((unused));
+static void tcg_out_addi_ptr(TCGContext *s, TCGReg, TCGReg, tcg_target_long);
 static void tcg_out_exit_tb(TCGContext *s, uintptr_t arg);
 static void tcg_out_goto_tb(TCGContext *s, int which);
 static void tcg_out_op(TCGContext *s, TCGOpcode opc,
@@ -XXX,XX +XXX,XX @@ static void layout_arg_normal_n(TCGCumulativeArgs *cum,
     cum->arg_slot += n;
 }
 
+static void layout_arg_by_ref(TCGCumulativeArgs *cum, TCGHelperInfo *info)
+{
+    TCGCallArgumentLoc *loc = &info->in[cum->info_in_idx];
+    int n = 128 / TCG_TARGET_REG_BITS;
+
+    /* The first subindex carries the pointer. */
+    layout_arg_1(cum, info, TCG_CALL_ARG_BY_REF);
+
+    /*
+     * The callee is allowed to clobber memory associated with
+     * structure pass by-reference.  Therefore we must make copies.
+     * Allocate space from "ref_slot", which will be adjusted to
+     * follow the parameters on the stack.
+     */
+    loc[0].ref_slot = cum->ref_slot;
+
+    /*
+     * Subsequent words also go into the reference slot, but
+     * do not accumulate into the regular arguments.
+     */
+    for (int i = 1; i < n; ++i) {
+        loc[i] = (TCGCallArgumentLoc){
+            .kind = TCG_CALL_ARG_BY_REF_N,
+            .arg_idx = cum->arg_idx,
+            .tmp_subindex = i,
+            .ref_slot = cum->ref_slot + i,
+        };
+    }
+    cum->info_in_idx += n;
+    cum->ref_slot += n;
+}
+
 static void init_call_layout(TCGHelperInfo *info)
 {
     int max_reg_slots = ARRAY_SIZE(tcg_target_call_iarg_regs);
@@ -XXX,XX +XXX,XX @@ static void init_call_layout(TCGHelperInfo *info)
         case TCG_CALL_RET_NORMAL:
             assert(info->nr_out <= ARRAY_SIZE(tcg_target_call_oarg_regs));
             break;
+        case TCG_CALL_RET_BY_REF:
+            /*
+             * Allocate the first argument to the output.
+             * We don't need to store this anywhere, just make it
+             * unavailable for use in the input loop below.
+             */
+            cum.arg_slot = 1;
+            break;
         default:
             qemu_build_not_reached();
         }
@@ -XXX,XX +XXX,XX @@ static void init_call_layout(TCGHelperInfo *info)
             case TCG_CALL_ARG_NORMAL:
                 layout_arg_normal_n(&cum, info, 128 / TCG_TARGET_REG_BITS);
                 break;
+            case TCG_CALL_ARG_BY_REF:
+                layout_arg_by_ref(&cum, info);
+                break;
             default:
                 qemu_build_not_reached();
             }
@@ -XXX,XX +XXX,XX @@ static void init_call_layout(TCGHelperInfo *info)
     assert(cum.info_in_idx <= ARRAY_SIZE(info->in));
     /* Validate the backend has enough argument space. */
     assert(cum.arg_slot <= max_reg_slots + max_stk_slots);
-    assert(cum.ref_slot <= max_stk_slots);
+
+    /*
+     * Relocate the "ref_slot" area to the end of the parameters.
+     * Minimizing this stack offset helps code size for x86,
+     * which has a signed 8-bit offset encoding.
+     */
+    if (cum.ref_slot != 0) {
+        int ref_base = 0;
+
+        if (cum.arg_slot > max_reg_slots) {
+            int align = __alignof(Int128) / sizeof(tcg_target_long);
+
+            ref_base = cum.arg_slot - max_reg_slots;
+            if (align > 1) {
+                ref_base = ROUND_UP(ref_base, align);
+            }
+        }
+        assert(ref_base + cum.ref_slot <= max_stk_slots);
+
+        if (ref_base != 0) {
+            for (int i = cum.info_in_idx - 1; i >= 0; --i) {
+                TCGCallArgumentLoc *loc = &info->in[i];
+                switch (loc->kind) {
+                case TCG_CALL_ARG_BY_REF:
+                case TCG_CALL_ARG_BY_REF_N:
+                    loc->ref_slot += ref_base;
+                    break;
+                default:
+                    break;
+                }
+            }
+        }
+    }
 }
 
 static int indirect_reg_alloc_order[ARRAY_SIZE(tcg_target_reg_alloc_order)];
@@ -XXX,XX +XXX,XX @@ void tcg_gen_callN(void *func, TCGTemp *ret, int nargs, TCGTemp **args)
 
         switch (loc->kind) {
         case TCG_CALL_ARG_NORMAL:
+        case TCG_CALL_ARG_BY_REF:
+        case TCG_CALL_ARG_BY_REF_N:
             op->args[pi++] = temp_arg(ts);
             break;
 
@@ -XXX,XX +XXX,XX @@ static void load_arg_normal(TCGContext *s, const TCGCallArgumentLoc *l,
     }
 }
 
+static void load_arg_ref(TCGContext *s, int arg_slot, TCGReg ref_base,
+                         intptr_t ref_off, TCGRegSet *allocated_regs)
+{
+    TCGReg reg;
+    int stk_slot = arg_slot - ARRAY_SIZE(tcg_target_call_iarg_regs);
+
+    if (stk_slot < 0) {
+        reg = tcg_target_call_iarg_regs[arg_slot];
+        tcg_reg_free(s, reg, *allocated_regs);
+        tcg_out_addi_ptr(s, reg, ref_base, ref_off);
+        tcg_regset_set_reg(*allocated_regs, reg);
+    } else {
+        reg = tcg_reg_alloc(s, tcg_target_available_regs[TCG_TYPE_PTR],
+                            *allocated_regs, 0, false);
+        tcg_out_addi_ptr(s, reg, ref_base, ref_off);
+        tcg_out_st(s, TCG_TYPE_PTR, reg, TCG_REG_CALL_STACK,
+                   TCG_TARGET_CALL_STACK_OFFSET
+                   + stk_slot * sizeof(tcg_target_long));
+    }
+}
+
 static void tcg_reg_alloc_call(TCGContext *s, TCGOp *op)
 {
     const int nb_oargs = TCGOP_CALLO(op);
@@ -XXX,XX +XXX,XX @@ static void tcg_reg_alloc_call(TCGContext *s, TCGOp *op)
         case TCG_CALL_ARG_EXTEND_S:
             load_arg_normal(s, loc, ts, &allocated_regs);
             break;
+        case TCG_CALL_ARG_BY_REF:
+            load_arg_stk(s, loc->ref_slot, ts, allocated_regs);
+            load_arg_ref(s, loc->arg_slot, TCG_REG_CALL_STACK,
+                         TCG_TARGET_CALL_STACK_OFFSET
+                         + loc->ref_slot * sizeof(tcg_target_long),
+                         &allocated_regs);
+            break;
+        case TCG_CALL_ARG_BY_REF_N:
+            load_arg_stk(s, loc->ref_slot, ts, allocated_regs);
+            break;
         default:
             g_assert_not_reached();
         }
@@ -XXX,XX +XXX,XX @@ static void tcg_reg_alloc_call(TCGContext *s, TCGOp *op)
         save_globals(s, allocated_regs);
     }
 
+    /*
+     * If the ABI passes a pointer to the returned struct as the first
+     * argument, load that now.  Pass a pointer to the output home slot.
+     */
+    if (info->out_kind == TCG_CALL_RET_BY_REF) {
+        TCGTemp *ts = arg_temp(op->args[0]);
+
+        if (!ts->mem_allocated) {
+            temp_allocate_frame(s, ts);
+        }
+        load_arg_ref(s, 0, ts->mem_base->reg, ts->mem_offset, &allocated_regs);
+    }
+
     tcg_out_call(s, tcg_call_func(op), info);
 
     /* Assign output registers and emit moves if needed.  */
@@ -XXX,XX +XXX,XX @@ static void tcg_reg_alloc_call(TCGContext *s, TCGOp *op)
             ts->mem_coherent = 0;
         }
         break;
+
+    case TCG_CALL_RET_BY_REF:
+        /* The callee has performed a write through the reference. */
+        for (i = 0; i < nb_oargs; i++) {
+            TCGTemp *ts = arg_temp(op->args[i]);
+            ts->val_type = TEMP_VAL_MEM;
+        }
+        break;
+
     default:
         g_assert_not_reached();
     }
-- 
2.34.1

Replace the flat array tcg_target_call_oarg_regs[] with
a function call including the TCGCallReturnKind.

Extend the set of registers for ARM to r0-r3 to match the ABI:
https://github.com/ARM-software/abi-aa/blob/main/aapcs32/aapcs32.rst#result-return

Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Daniel Henrique Barboza <danielhb413@gmail.com>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 tcg/tcg.c                        |  9 ++++++---
 tcg/aarch64/tcg-target.c.inc     | 10 +++++++---
 tcg/arm/tcg-target.c.inc         | 10 +++++++---
 tcg/i386/tcg-target.c.inc        | 16 ++++++++++------
 tcg/loongarch64/tcg-target.c.inc | 10 ++++++----
 tcg/mips/tcg-target.c.inc        | 10 ++++++----
 tcg/ppc/tcg-target.c.inc         | 10 ++++++----
 tcg/riscv/tcg-target.c.inc       | 10 ++++++----
 tcg/s390x/tcg-target.c.inc       |  9 ++++++---
 tcg/sparc64/tcg-target.c.inc     | 12 ++++++------
 tcg/tci/tcg-target.c.inc         | 12 ++++++------
 11 files changed, 72 insertions(+), 46 deletions(-)

diff --git a/tcg/tcg.c b/tcg/tcg.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg.c
+++ b/tcg/tcg.c
@@ -XXX,XX +XXX,XX @@ static bool tcg_out_sti(TCGContext *s, TCGType type, TCGArg val,
                         TCGReg base, intptr_t ofs);
 static void tcg_out_call(TCGContext *s, const tcg_insn_unit *target,
                          const TCGHelperInfo *info);
+static TCGReg tcg_target_call_oarg_reg(TCGCallReturnKind kind, int slot);
 static bool tcg_target_const_match(int64_t val, TCGType type, int ct);
 #ifdef TCG_TARGET_NEED_LDST_LABELS
 static int tcg_out_ldst_finalize(TCGContext *s);
@@ -XXX,XX +XXX,XX @@ static void init_call_layout(TCGHelperInfo *info)
     case dh_typecode_s64:
         info->nr_out = 64 / TCG_TARGET_REG_BITS;
         info->out_kind = TCG_CALL_RET_NORMAL;
-        assert(info->nr_out <= ARRAY_SIZE(tcg_target_call_oarg_regs));
+        /* Query the last register now to trigger any assert early. */
+        tcg_target_call_oarg_reg(info->out_kind, info->nr_out - 1);
         break;
     case dh_typecode_i128:
         info->nr_out = 128 / TCG_TARGET_REG_BITS;
         info->out_kind = TCG_CALL_RET_NORMAL; /* TODO */
         switch (/* TODO */ TCG_CALL_RET_NORMAL) {
         case TCG_CALL_RET_NORMAL:
-            assert(info->nr_out <= ARRAY_SIZE(tcg_target_call_oarg_regs));
+            /* Query the last register now to trigger any assert early. */
+            tcg_target_call_oarg_reg(info->out_kind, info->nr_out - 1);
             break;
         case TCG_CALL_RET_BY_REF:
             /*
@@ -XXX,XX +XXX,XX @@ static void tcg_reg_alloc_call(TCGContext *s, TCGOp *op)
     case TCG_CALL_RET_NORMAL:
         for (i = 0; i < nb_oargs; i++) {
             TCGTemp *ts = arg_temp(op->args[i]);
-            TCGReg reg = tcg_target_call_oarg_regs[i];
+            TCGReg reg = tcg_target_call_oarg_reg(TCG_CALL_RET_NORMAL, i);
 
             /* ENV should not be modified.  */
             tcg_debug_assert(!temp_readonly(ts));
diff --git a/tcg/aarch64/tcg-target.c.inc b/tcg/aarch64/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/aarch64/tcg-target.c.inc
+++ b/tcg/aarch64/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static const int tcg_target_call_iarg_regs[8] = {
     TCG_REG_X0, TCG_REG_X1, TCG_REG_X2, TCG_REG_X3,
     TCG_REG_X4, TCG_REG_X5, TCG_REG_X6, TCG_REG_X7
 };
-static const int tcg_target_call_oarg_regs[1] = {
-    TCG_REG_X0
-};
+
+static TCGReg tcg_target_call_oarg_reg(TCGCallReturnKind kind, int slot)
+{
+    tcg_debug_assert(kind == TCG_CALL_RET_NORMAL);
+    tcg_debug_assert(slot >= 0 && slot <= 1);
+    return TCG_REG_X0 + slot;
+}
 
 #define TCG_REG_TMP TCG_REG_X30
 #define TCG_VEC_TMP TCG_REG_V31
diff --git a/tcg/arm/tcg-target.c.inc b/tcg/arm/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/arm/tcg-target.c.inc
+++ b/tcg/arm/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static const int tcg_target_reg_alloc_order[] = {
 static const int tcg_target_call_iarg_regs[4] = {
     TCG_REG_R0, TCG_REG_R1, TCG_REG_R2, TCG_REG_R3
 };
-static const int tcg_target_call_oarg_regs[2] = {
-    TCG_REG_R0, TCG_REG_R1
-};
+
+static TCGReg tcg_target_call_oarg_reg(TCGCallReturnKind kind, int slot)
+{
+    tcg_debug_assert(kind == TCG_CALL_RET_NORMAL);
+    tcg_debug_assert(slot >= 0 && slot <= 3);
+    return TCG_REG_R0 + slot;
+}
 
 #define TCG_REG_TMP  TCG_REG_R12
 #define TCG_VEC_TMP  TCG_REG_Q15
diff --git a/tcg/i386/tcg-target.c.inc b/tcg/i386/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/i386/tcg-target.c.inc
+++ b/tcg/i386/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static const int tcg_target_call_iarg_regs[] = {
 #endif
 };
 
-static const int tcg_target_call_oarg_regs[] = {
-    TCG_REG_EAX,
-#if TCG_TARGET_REG_BITS == 32
-    TCG_REG_EDX
-#endif
-};
+static TCGReg tcg_target_call_oarg_reg(TCGCallReturnKind kind, int slot)
+{
+    switch (kind) {
+    case TCG_CALL_RET_NORMAL:
+        tcg_debug_assert(slot >= 0 && slot <= 1);
+        return slot ? TCG_REG_EDX : TCG_REG_EAX;
+    default:
+        g_assert_not_reached();
+    }
+}
 
 /* Constants we accept.  */
 #define TCG_CT_CONST_S32 0x100
diff --git a/tcg/loongarch64/tcg-target.c.inc b/tcg/loongarch64/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/loongarch64/tcg-target.c.inc
+++ b/tcg/loongarch64/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static const int tcg_target_call_iarg_regs[] = {
     TCG_REG_A7,
 };
 
-static const int tcg_target_call_oarg_regs[] = {
-    TCG_REG_A0,
-    TCG_REG_A1,
-};
+static TCGReg tcg_target_call_oarg_reg(TCGCallReturnKind kind, int slot)
+{
+    tcg_debug_assert(kind == TCG_CALL_RET_NORMAL);
+    tcg_debug_assert(slot >= 0 && slot <= 1);
+    return TCG_REG_A0 + slot;
+}
 
 #ifndef CONFIG_SOFTMMU
 #define USE_GUEST_BASE     (guest_base != 0)
diff --git a/tcg/mips/tcg-target.c.inc b/tcg/mips/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/mips/tcg-target.c.inc
+++ b/tcg/mips/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static const TCGReg tcg_target_call_iarg_regs[] = {
 #endif
 };
 
-static const TCGReg tcg_target_call_oarg_regs[2] = {
-    TCG_REG_V0,
-    TCG_REG_V1
-};
+static TCGReg tcg_target_call_oarg_reg(TCGCallReturnKind kind, int slot)
+{
+    tcg_debug_assert(kind == TCG_CALL_RET_NORMAL);
+    tcg_debug_assert(slot >= 0 && slot <= 1);
+    return TCG_REG_V0 + slot;
+}
 
 static const tcg_insn_unit *tb_ret_addr;
 static const tcg_insn_unit *bswap32_addr;
diff --git a/tcg/ppc/tcg-target.c.inc b/tcg/ppc/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/ppc/tcg-target.c.inc
+++ b/tcg/ppc/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static const int tcg_target_call_iarg_regs[] = {
     TCG_REG_R10
 };
 
-static const int tcg_target_call_oarg_regs[] = {
-    TCG_REG_R3,
-    TCG_REG_R4
-};
+static TCGReg tcg_target_call_oarg_reg(TCGCallReturnKind kind, int slot)
+{
+    tcg_debug_assert(kind == TCG_CALL_RET_NORMAL);
+    tcg_debug_assert(slot >= 0 && slot <= 1);
+    return TCG_REG_R3 + slot;
+}
 
 static const int tcg_target_callee_save_regs[] = {
 #ifdef _CALL_DARWIN
diff --git a/tcg/riscv/tcg-target.c.inc b/tcg/riscv/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/riscv/tcg-target.c.inc
+++ b/tcg/riscv/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static const int tcg_target_call_iarg_regs[] = {
     TCG_REG_A7,
 };
 
-static const int tcg_target_call_oarg_regs[] = {
-    TCG_REG_A0,
-    TCG_REG_A1,
-};
+static TCGReg tcg_target_call_oarg_reg(TCGCallReturnKind kind, int slot)
+{
+    tcg_debug_assert(kind == TCG_CALL_RET_NORMAL);
+    tcg_debug_assert(slot >= 0 && slot <= 1);
+    return TCG_REG_A0 + slot;
+}
 
 #define TCG_CT_CONST_ZERO  0x100
 #define TCG_CT_CONST_S12   0x200
diff --git a/tcg/s390x/tcg-target.c.inc b/tcg/s390x/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/s390x/tcg-target.c.inc
+++ b/tcg/s390x/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static const int tcg_target_call_iarg_regs[] = {
     TCG_REG_R6,
 };
 
-static const int tcg_target_call_oarg_regs[] = {
-    TCG_REG_R2,
-};
+static TCGReg tcg_target_call_oarg_reg(TCGCallReturnKind kind, int slot)
+{
+    tcg_debug_assert(kind == TCG_CALL_RET_NORMAL);
+    tcg_debug_assert(slot == 0);
+    return TCG_REG_R2;
+}
 
 #define S390_CC_EQ      8
 #define S390_CC_LT      4
diff --git a/tcg/sparc64/tcg-target.c.inc b/tcg/sparc64/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/sparc64/tcg-target.c.inc
+++ b/tcg/sparc64/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static const int tcg_target_call_iarg_regs[6] = {
     TCG_REG_O5,
 };
 
-static const int tcg_target_call_oarg_regs[] = {
-    TCG_REG_O0,
-    TCG_REG_O1,
-    TCG_REG_O2,
-    TCG_REG_O3,
-};
+static TCGReg tcg_target_call_oarg_reg(TCGCallReturnKind kind, int slot)
+{
+    tcg_debug_assert(kind == TCG_CALL_RET_NORMAL);
+    tcg_debug_assert(slot >= 0 && slot <= 3);
+    return TCG_REG_O0 + slot;
+}
 
 #define INSN_OP(x)  ((x) << 30)
 #define INSN_OP2(x) ((x) << 22)
diff --git a/tcg/tci/tcg-target.c.inc b/tcg/tci/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tci/tcg-target.c.inc
+++ b/tcg/tci/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static const int tcg_target_reg_alloc_order[] = {
 /* No call arguments via registers.  All will be stored on the "stack". */
 static const int tcg_target_call_iarg_regs[] = { };
 
-static const int tcg_target_call_oarg_regs[] = {
-    TCG_REG_R0,
-#if TCG_TARGET_REG_BITS == 32
-    TCG_REG_R1
-#endif
-};
+static TCGReg tcg_target_call_oarg_reg(TCGCallReturnKind kind, int slot)
+{
+    tcg_debug_assert(kind == TCG_CALL_RET_NORMAL);
+    tcg_debug_assert(slot >= 0 && slot < 64 / TCG_TARGET_REG_BITS);
+    return TCG_REG_R0 + slot;
+}
 
 #ifdef CONFIG_DEBUG_TCG
 static const char *const tcg_target_reg_names[TCG_TARGET_NB_REGS] = {
-- 
2.34.1

This will be used by _WIN64 to return i128.  Not yet used,
because allocation is not yet enabled.

Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 tcg/tcg-internal.h |  1 +
 tcg/tcg.c          | 19 +++++++++++++++++++
 2 files changed, 20 insertions(+)

diff --git a/tcg/tcg-internal.h b/tcg/tcg-internal.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg-internal.h
+++ b/tcg/tcg-internal.h
@@ -XXX,XX +XXX,XX @@
 typedef enum {
     TCG_CALL_RET_NORMAL,         /* by registers */
     TCG_CALL_RET_BY_REF,         /* for i128, by reference */
+    TCG_CALL_RET_BY_VEC,         /* for i128, by vector register */
 } TCGCallReturnKind;
 
 typedef enum {
diff --git a/tcg/tcg.c b/tcg/tcg.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg.c
+++ b/tcg/tcg.c
@@ -XXX,XX +XXX,XX @@ static void init_call_layout(TCGHelperInfo *info)
             /* Query the last register now to trigger any assert early. */
             tcg_target_call_oarg_reg(info->out_kind, info->nr_out - 1);
             break;
+        case TCG_CALL_RET_BY_VEC:
+            /* Query the single register now to trigger any assert early. */
+            tcg_target_call_oarg_reg(TCG_CALL_RET_BY_VEC, 0);
+            break;
         case TCG_CALL_RET_BY_REF:
             /*
              * Allocate the first argument to the output.
@@ -XXX,XX +XXX,XX @@ static void tcg_reg_alloc_call(TCGContext *s, TCGOp *op)
         }
         break;
 
+    case TCG_CALL_RET_BY_VEC:
+        {
+            TCGTemp *ts = arg_temp(op->args[0]);
+
+            tcg_debug_assert(ts->base_type == TCG_TYPE_I128);
+            tcg_debug_assert(ts->temp_subindex == 0);
+            if (!ts->mem_allocated) {
+                temp_allocate_frame(s, ts);
+            }
+            tcg_out_st(s, TCG_TYPE_V128,
+                       tcg_target_call_oarg_reg(TCG_CALL_RET_BY_VEC, 0),
+                       ts->mem_base->reg, ts->mem_offset);
+        }
+        /* fall through to mark all parts in memory */
+
     case TCG_CALL_RET_BY_REF:
         /* The callee has performed a write through the reference. */
         for (i = 0; i < nb_oargs; i++) {
-- 
2.34.1

We are about to allow passing Int128 to/from tcg helper functions,
but libffi doesn't support __int128_t, so use the structure.

In order for atomic128.h to continue working, we must provide
a mechanism to frob between real __int128_t and the structure.
Provide a new union, Int128Alias, for this.  We cannot modify
Int128 itself, as any changed alignment would also break libffi.

Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 include/qemu/atomic128.h | 29 +++++++++++++++++++++------
 include/qemu/int128.h    | 25 +++++++++++++++++++++---
 util/int128.c            | 42 ++++++++++++++++++++++++++++++++++++++++
 3 files changed, 87 insertions(+), 9 deletions(-)

diff --git a/include/qemu/atomic128.h b/include/qemu/atomic128.h
index XXXXXXX..XXXXXXX 100644
--- a/include/qemu/atomic128.h
+++ b/include/qemu/atomic128.h
@@ -XXX,XX +XXX,XX @@
 #if defined(CONFIG_ATOMIC128)
 static inline Int128 atomic16_cmpxchg(Int128 *ptr, Int128 cmp, Int128 new)
 {
-    return qatomic_cmpxchg__nocheck(ptr, cmp, new);
+    Int128Alias r, c, n;
+
+    c.s = cmp;
+    n.s = new;
+    r.i = qatomic_cmpxchg__nocheck((__int128_t *)ptr, c.i, n.i);
+    return r.s;
 }
 # define HAVE_CMPXCHG128 1
 #elif defined(CONFIG_CMPXCHG128)
 static inline Int128 atomic16_cmpxchg(Int128 *ptr, Int128 cmp, Int128 new)
 {
-    return __sync_val_compare_and_swap_16(ptr, cmp, new);
+    Int128Alias r, c, n;
+
+    c.s = cmp;
+    n.s = new;
+    r.i = __sync_val_compare_and_swap_16((__int128_t *)ptr, c.i, n.i);
+    return r.s;
 }
 # define HAVE_CMPXCHG128 1
 #elif defined(__aarch64__)
@@ -XXX,XX +XXX,XX @@ Int128 QEMU_ERROR("unsupported atomic")
 #if defined(CONFIG_ATOMIC128)
 static inline Int128 atomic16_read(Int128 *ptr)
 {
-    return qatomic_read__nocheck(ptr);
+    Int128Alias r;
+
+    r.i = qatomic_read__nocheck((__int128_t *)ptr);
+    return r.s;
 }
 
 static inline void atomic16_set(Int128 *ptr, Int128 val)
 {
-    qatomic_set__nocheck(ptr, val);
+    Int128Alias v;
+
+    v.s = val;
+    qatomic_set__nocheck((__int128_t *)ptr, v.i);
 }
 
 # define HAVE_ATOMIC128 1
@@ -XXX,XX +XXX,XX @@ static inline void atomic16_set(Int128 *ptr, Int128 val)
 static inline Int128 atomic16_read(Int128 *ptr)
 {
     /* Maybe replace 0 with 0, returning the old value.  */
-    return atomic16_cmpxchg(ptr, 0, 0);
+    Int128 z = int128_make64(0);
+    return atomic16_cmpxchg(ptr, z, z);
 }
 
 static inline void atomic16_set(Int128 *ptr, Int128 val)
@@ -XXX,XX +XXX,XX @@ static inline void atomic16_set(Int128 *ptr, Int128 val)
     do {
         cmp = old;
         old = atomic16_cmpxchg(ptr, cmp, val);
-    } while (old != cmp);
+    } while (int128_ne(old, cmp));
 }
 
 # define HAVE_ATOMIC128 1
diff --git a/include/qemu/int128.h b/include/qemu/int128.h
index XXXXXXX..XXXXXXX 100644
--- a/include/qemu/int128.h
+++ b/include/qemu/int128.h
@@ -XXX,XX +XXX,XX @@
 
 #include "qemu/bswap.h"
 
-#ifdef CONFIG_INT128
+/*
+ * With TCI, we need to use libffi for interfacing with TCG helpers.
+ * But libffi does not support __int128_t, and therefore cannot pass
+ * or return values of this type, force use of the Int128 struct.
+ */
+#if defined(CONFIG_INT128) && !defined(CONFIG_TCG_INTERPRETER)
 typedef __int128_t Int128;
 
 static inline Int128 int128_make64(uint64_t a)
@@ -XXX,XX +XXX,XX @@ Int128 int128_divu(Int128, Int128);
 Int128 int128_remu(Int128, Int128);
 Int128 int128_divs(Int128, Int128);
 Int128 int128_rems(Int128, Int128);
-
-#endif /* CONFIG_INT128 */
+#endif /* CONFIG_INT128 && !CONFIG_TCG_INTERPRETER */
 
 static inline void bswap128s(Int128 *s)
 {
@@ -XXX,XX +XXX,XX @@ static inline void bswap128s(Int128 *s)
 #define INT128_MAX int128_make128(UINT64_MAX, INT64_MAX)
 #define INT128_MIN int128_make128(0, INT64_MIN)
 
+/*
+ * When compiler supports a 128-bit type, define a combination of
+ * a possible structure and the native types.  Ease parameter passing
+ * via use of the transparent union extension.
+ */
+#ifdef CONFIG_INT128
+typedef union {
+    Int128 s;
+    __int128_t i;
+    __uint128_t u;
+} Int128Alias __attribute__((transparent_union));
+#else
+typedef Int128 Int128Alias;
+#endif /* CONFIG_INT128 */
+
 #endif /* INT128_H */
diff --git a/util/int128.c b/util/int128.c
index XXXXXXX..XXXXXXX 100644
--- a/util/int128.c
+++ b/util/int128.c
@@ -XXX,XX +XXX,XX @@ Int128 int128_rems(Int128 a, Int128 b)
     return r;
 }
 
+#elif defined(CONFIG_TCG_INTERPRETER)
+
+Int128 int128_divu(Int128 a_s, Int128 b_s)
+{
+    Int128Alias r, a, b;
+
+    a.s = a_s;
+    b.s = b_s;
+    r.u = a.u / b.u;
+    return r.s;
+}
+
+Int128 int128_remu(Int128 a_s, Int128 b_s)
+{
+    Int128Alias r, a, b;
+
+    a.s = a_s;
+    b.s = b_s;
+    r.u = a.u % b.u;
+    return r.s;
+}
+
+Int128 int128_divs(Int128 a_s, Int128 b_s)
+{
+    Int128Alias r, a, b;
+
+    a.s = a_s;
+    b.s = b_s;
+    r.i = a.i / b.i;
+    return r.s;
+}
+
+Int128 int128_rems(Int128 a_s, Int128 b_s)
+{
+    Int128Alias r, a, b;
+
+    a.s = a_s;
+    b.s = b_s;
+    r.i = a.i % b.i;
+    return r.s;
+}
+
 #endif
-- 
2.34.1

Fill in the parameters for the host ABI for Int128.
Adjust tcg_target_call_oarg_reg for _WIN64, and
tcg_out_call for i386 sysv.  Allow TCG_TYPE_V128
stores without AVX enabled.

Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 tcg/i386/tcg-target.h     | 10 ++++++++++
 tcg/i386/tcg-target.c.inc | 30 +++++++++++++++++++++++++++++-
 2 files changed, 39 insertions(+), 1 deletion(-)

diff --git a/tcg/i386/tcg-target.h b/tcg/i386/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/i386/tcg-target.h
+++ b/tcg/i386/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
 #endif
 #define TCG_TARGET_CALL_ARG_I32      TCG_CALL_ARG_NORMAL
 #define TCG_TARGET_CALL_ARG_I64      TCG_CALL_ARG_NORMAL
+#if defined(_WIN64)
+# define TCG_TARGET_CALL_ARG_I128    TCG_CALL_ARG_BY_REF
+# define TCG_TARGET_CALL_RET_I128    TCG_CALL_RET_BY_VEC
+#elif TCG_TARGET_REG_BITS == 64
+# define TCG_TARGET_CALL_ARG_I128    TCG_CALL_ARG_NORMAL
+# define TCG_TARGET_CALL_RET_I128    TCG_CALL_RET_NORMAL
+#else
+# define TCG_TARGET_CALL_ARG_I128    TCG_CALL_ARG_NORMAL
+# define TCG_TARGET_CALL_RET_I128    TCG_CALL_RET_BY_REF
+#endif
 
 extern bool have_bmi1;
 extern bool have_popcnt;
diff --git a/tcg/i386/tcg-target.c.inc b/tcg/i386/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/i386/tcg-target.c.inc
+++ b/tcg/i386/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static TCGReg tcg_target_call_oarg_reg(TCGCallReturnKind kind, int slot)
     case TCG_CALL_RET_NORMAL:
         tcg_debug_assert(slot >= 0 && slot <= 1);
         return slot ? TCG_REG_EDX : TCG_REG_EAX;
+#ifdef _WIN64
+    case TCG_CALL_RET_BY_VEC:
+        tcg_debug_assert(slot == 0);
+        return TCG_REG_XMM0;
+#endif
     default:
         g_assert_not_reached();
     }
@@ -XXX,XX +XXX,XX @@ static void tcg_out_st(TCGContext *s, TCGType type, TCGReg arg,
          * The gvec infrastructure is asserts that v128 vector loads
          * and stores use a 16-byte aligned offset.  Validate that the
          * final pointer is aligned by using an insn that will SIGSEGV.
+         *
+         * This specific instance is also used by TCG_CALL_RET_BY_VEC,
+         * for _WIN64, which must have SSE2 but may not have AVX.
          */
         tcg_debug_assert(arg >= 16);
-        tcg_out_vex_modrm_offset(s, OPC_MOVDQA_WxVx, arg, 0, arg1, arg2);
+        if (have_avx1) {
+            tcg_out_vex_modrm_offset(s, OPC_MOVDQA_WxVx, arg, 0, arg1, arg2);
+        } else {
+            tcg_out_modrm_offset(s, OPC_MOVDQA_WxVx, arg, arg1, arg2);
+        }
         break;
     case TCG_TYPE_V256:
         /*
@@ -XXX,XX +XXX,XX @@ static void tcg_out_call(TCGContext *s, const tcg_insn_unit *dest,
                          const TCGHelperInfo *info)
 {
     tcg_out_branch(s, 1, dest);
+
+#ifndef _WIN32
+    if (TCG_TARGET_REG_BITS == 32 && info->out_kind == TCG_CALL_RET_BY_REF) {
+        /*
+         * The sysv i386 abi for struct return places a reference as the
+         * first argument of the stack, and pops that argument with the
+         * return statement.  Since we want to retain the aligned stack
+         * pointer for the callee, we do not want to actually push that
+         * argument before the call but rely on the normal store to the
+         * stack slot.  But we do need to compensate for the pop in order
+         * to reset our correct stack pointer value.
+         * Pushing a garbage value back onto the stack is quickest.
+         */
+        tcg_out_push(s, TCG_REG_EAX);
+    }
+#endif
 }
 
 static void tcg_out_jmp(TCGContext *s, const tcg_insn_unit *dest)
-- 
2.34.1

We expect the backend to require register pairs in
host-endian ordering, thus for big-endian the first
register of a pair contains the high part.
We were forcing R0 to contain the low part for calls.

diff --git a/tcg/tci.c b/tcg/tci.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tci.c
+++ b/tcg/tci.c
@@ -XXX,XX +XXX,XX @@ uintptr_t QEMU_DISABLE_CFI tcg_qemu_tb_exec(CPUArchState *env,
                 ffi_call(pptr[1], pptr[0], stack, call_slots);
             }
 
-            /* Any result winds up "left-aligned" in the stack[0] slot. */
             switch (len) {
             case 0: /* void */
                 break;
             case 1: /* uint32_t */
                 /*
+                 * The result winds up "left-aligned" in the stack[0] slot.
                  * Note that libffi has an odd special case in that it will
                  * always widen an integral result to ffi_arg.
                  */
-                if (sizeof(ffi_arg) == 4) {
-                    regs[TCG_REG_R0] = *(uint32_t *)stack;
-                    break;
-                }
-                /* fall through */
-            case 2: /* uint64_t */
-                if (TCG_TARGET_REG_BITS == 32) {
-                    tci_write_reg64(regs, TCG_REG_R1, TCG_REG_R0, stack[0]);
+                if (sizeof(ffi_arg) == 8) {
+                    regs[TCG_REG_R0] = (uint32_t)stack[0];
                 } else {
-                    regs[TCG_REG_R0] = stack[0];
+                    regs[TCG_REG_R0] = *(uint32_t *)stack;
                 }
                 break;
+            case 2: /* uint64_t */
+                /*
+                 * For TCG_TARGET_REG_BITS == 32, the register pair
+                 * must stay in host memory order.
+                 */
+                memcpy(&regs[TCG_REG_R0], stack, 8);
+                break;
             default:
                 g_assert_not_reached();
             }
-- 
2.34.1

Fill in the parameters for libffi for Int128.
Adjust the interpreter to allow for 16-byte return values.
Adjust tcg_out_call to record the return value length.

Call parameters are no longer all the same size, so we
cannot reuse the same call_slots array for every function.
Compute it each time now, but only fill in slots required
for the call we're about to make.

Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 tcg/tci/tcg-target.h     |  3 +++
 tcg/tcg.c                | 19 +++++++++++++++++
 tcg/tci.c                | 44 ++++++++++++++++++++--------------------
 tcg/tci/tcg-target.c.inc | 10 ++++-----
 4 files changed, 49 insertions(+), 27 deletions(-)

diff --git a/tcg/tci/tcg-target.h b/tcg/tci/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tci/tcg-target.h
+++ b/tcg/tci/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
 #if TCG_TARGET_REG_BITS == 32
 # define TCG_TARGET_CALL_ARG_I32        TCG_CALL_ARG_EVEN
 # define TCG_TARGET_CALL_ARG_I64        TCG_CALL_ARG_EVEN
+# define TCG_TARGET_CALL_ARG_I128       TCG_CALL_ARG_EVEN
 #else
 # define TCG_TARGET_CALL_ARG_I32        TCG_CALL_ARG_NORMAL
 # define TCG_TARGET_CALL_ARG_I64        TCG_CALL_ARG_NORMAL
+# define TCG_TARGET_CALL_ARG_I128       TCG_CALL_ARG_NORMAL
 #endif
+#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_NORMAL
 
 #define HAVE_TCG_QEMU_TB_EXEC
 #define TCG_TARGET_NEED_POOL_LABELS
diff --git a/tcg/tcg.c b/tcg/tcg.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg.c
+++ b/tcg/tcg.c
@@ -XXX,XX +XXX,XX @@ static GHashTable *helper_table;
 #ifdef CONFIG_TCG_INTERPRETER
 static ffi_type *typecode_to_ffi(int argmask)
 {
+    /*
+     * libffi does not support __int128_t, so we have forced Int128
+     * to use the structure definition instead of the builtin type.
+     */
+    static ffi_type *ffi_type_i128_elements[3] = {
+        &ffi_type_uint64,
+        &ffi_type_uint64,
+        NULL
+    };
+    static ffi_type ffi_type_i128 = {
+        .size = 16,
+        .alignment = __alignof__(Int128),
+        .type = FFI_TYPE_STRUCT,
+        .elements = ffi_type_i128_elements,
+    };
+
     switch (argmask) {
     case dh_typecode_void:
         return &ffi_type_void;
@@ -XXX,XX +XXX,XX @@ static ffi_type *typecode_to_ffi(int argmask)
         return &ffi_type_sint64;
     case dh_typecode_ptr:
         return &ffi_type_pointer;
+    case dh_typecode_i128:
+        return &ffi_type_i128;
     }
     g_assert_not_reached();
 }
@@ -XXX,XX +XXX,XX @@ static void init_ffi_layouts(void)
         /* Ignoring the return type, find the last non-zero field. */
         nargs = 32 - clz32(typemask >> 3);
         nargs = DIV_ROUND_UP(nargs, 3);
+        assert(nargs <= MAX_CALL_IARGS);
 
         ca = g_malloc0(sizeof(*ca) + nargs * sizeof(ffi_type *));
         ca->cif.rtype = typecode_to_ffi(typemask & 7);
diff --git a/tcg/tci.c b/tcg/tci.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tci.c
+++ b/tcg/tci.c
@@ -XXX,XX +XXX,XX @@ uintptr_t QEMU_DISABLE_CFI tcg_qemu_tb_exec(CPUArchState *env,
     tcg_target_ulong regs[TCG_TARGET_NB_REGS];
     uint64_t stack[(TCG_STATIC_CALL_ARGS_SIZE + TCG_STATIC_FRAME_SIZE)
                    / sizeof(uint64_t)];
-    void *call_slots[TCG_STATIC_CALL_ARGS_SIZE / sizeof(uint64_t)];
 
     regs[TCG_AREG0] = (tcg_target_ulong)env;
     regs[TCG_REG_CALL_STACK] = (uintptr_t)stack;
-    /* Other call_slots entries initialized at first use (see below). */
-    call_slots[0] = NULL;
     tci_assert(tb_ptr);
 
     for (;;) {
@@ -XXX,XX +XXX,XX @@ uintptr_t QEMU_DISABLE_CFI tcg_qemu_tb_exec(CPUArchState *env,
 
         switch (opc) {
         case INDEX_op_call:
-            /*
-             * Set up the ffi_avalue array once, delayed until now
-             * because many TB's do not make any calls. In tcg_gen_callN,
-             * we arranged for every real argument to be "left-aligned"
-             * in each 64-bit slot.
-             */
-            if (unlikely(call_slots[0] == NULL)) {
-                for (int i = 0; i < ARRAY_SIZE(call_slots); ++i) {
-                    call_slots[i] = &stack[i];
-                }
-            }
-
-            tci_args_nl(insn, tb_ptr, &len, &ptr);
-
-            /* Helper functions may need to access the "return address" */
-            tci_tb_ptr = (uintptr_t)tb_ptr;
-
             {
-                void **pptr = ptr;
-                ffi_call(pptr[1], pptr[0], stack, call_slots);
+                void *call_slots[MAX_CALL_IARGS];
+                ffi_cif *cif;
+                void *func;
+                unsigned i, s, n;
+
+                tci_args_nl(insn, tb_ptr, &len, &ptr);
+                func = ((void **)ptr)[0];
+                cif = ((void **)ptr)[1];
+
+                n = cif->nargs;
+                for (i = s = 0; i < n; ++i) {
+                    ffi_type *t = cif->arg_types[i];
+                    call_slots[i] = &stack[s];
+                    s += DIV_ROUND_UP(t->size, 8);
+                }
+
+                /* Helper functions may need to access the "return address" */
+                tci_tb_ptr = (uintptr_t)tb_ptr;
+                ffi_call(cif, func, stack, call_slots);
             }
 
             switch (len) {
@@ -XXX,XX +XXX,XX @@ uintptr_t QEMU_DISABLE_CFI tcg_qemu_tb_exec(CPUArchState *env,
                  */
                 memcpy(&regs[TCG_REG_R0], stack, 8);
                 break;
+            case 3: /* Int128 */
+                memcpy(&regs[TCG_REG_R0], stack, 16);
+                break;
             default:
                 g_assert_not_reached();
             }
diff --git a/tcg/tci/tcg-target.c.inc b/tcg/tci/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tci/tcg-target.c.inc
+++ b/tcg/tci/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static const int tcg_target_call_iarg_regs[] = { };
 static TCGReg tcg_target_call_oarg_reg(TCGCallReturnKind kind, int slot)
 {
     tcg_debug_assert(kind == TCG_CALL_RET_NORMAL);
-    tcg_debug_assert(slot >= 0 && slot < 64 / TCG_TARGET_REG_BITS);
+    tcg_debug_assert(slot >= 0 && slot < 128 / TCG_TARGET_REG_BITS);
     return TCG_REG_R0 + slot;
 }
 
@@ -XXX,XX +XXX,XX @@ static void tcg_out_call(TCGContext *s, const tcg_insn_unit *func,
 
     if (cif->rtype == &ffi_type_void) {
         which = 0;
-    } else if (cif->rtype->size == 4) {
-        which = 1;
     } else {
-        tcg_debug_assert(cif->rtype->size == 8);
-        which = 2;
+        tcg_debug_assert(cif->rtype->size == 4 ||
+                         cif->rtype->size == 8 ||
+                         cif->rtype->size == 16);
+        which = ctz32(cif->rtype->size) - 1;
     }
     new_pool_l2(s, 20, s->code_ptr, 0, (uintptr_t)func, (uintptr_t)cif);
     insn = deposit32(insn, 0, 8, INDEX_op_call);
-- 
2.34.1

Fill in the parameters for the host ABI for Int128 for
those backends which require no extra modification.

Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Daniel Henrique Barboza <danielhb413@gmail.com>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 tcg/aarch64/tcg-target.h     | 2 ++
 tcg/arm/tcg-target.h         | 2 ++
 tcg/loongarch64/tcg-target.h | 2 ++
 tcg/mips/tcg-target.h        | 2 ++
 tcg/riscv/tcg-target.h       | 3 +++
 tcg/s390x/tcg-target.h       | 2 ++
 tcg/sparc64/tcg-target.h     | 2 ++
 tcg/tcg.c                    | 6 +++---
 tcg/ppc/tcg-target.c.inc     | 3 +++
 9 files changed, 21 insertions(+), 3 deletions(-)

diff --git a/tcg/aarch64/tcg-target.h b/tcg/aarch64/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/aarch64/tcg-target.h
+++ b/tcg/aarch64/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
 #define TCG_TARGET_CALL_STACK_OFFSET    0
 #define TCG_TARGET_CALL_ARG_I32         TCG_CALL_ARG_NORMAL
 #define TCG_TARGET_CALL_ARG_I64         TCG_CALL_ARG_NORMAL
+#define TCG_TARGET_CALL_ARG_I128        TCG_CALL_ARG_EVEN
+#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_NORMAL
 
 /* optional instructions */
 #define TCG_TARGET_HAS_div_i32          1
diff --git a/tcg/arm/tcg-target.h b/tcg/arm/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/arm/tcg-target.h
+++ b/tcg/arm/tcg-target.h
@@ -XXX,XX +XXX,XX @@ extern bool use_neon_instructions;
 #define TCG_TARGET_CALL_STACK_OFFSET	0
 #define TCG_TARGET_CALL_ARG_I32         TCG_CALL_ARG_NORMAL
 #define TCG_TARGET_CALL_ARG_I64         TCG_CALL_ARG_EVEN
+#define TCG_TARGET_CALL_ARG_I128        TCG_CALL_ARG_EVEN
+#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_BY_REF
 
 /* optional instructions */
 #define TCG_TARGET_HAS_ext8s_i32        1
diff --git a/tcg/loongarch64/tcg-target.h b/tcg/loongarch64/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/loongarch64/tcg-target.h
+++ b/tcg/loongarch64/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
 #define TCG_TARGET_CALL_STACK_OFFSET    0
 #define TCG_TARGET_CALL_ARG_I32         TCG_CALL_ARG_NORMAL
 #define TCG_TARGET_CALL_ARG_I64         TCG_CALL_ARG_NORMAL
+#define TCG_TARGET_CALL_ARG_I128        TCG_CALL_ARG_NORMAL
+#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_NORMAL
 
 /* optional instructions */
 #define TCG_TARGET_HAS_movcond_i32      1
diff --git a/tcg/mips/tcg-target.h b/tcg/mips/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/mips/tcg-target.h
+++ b/tcg/mips/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
 # define TCG_TARGET_CALL_ARG_I64      TCG_CALL_ARG_NORMAL
 #endif
 #define TCG_TARGET_CALL_ARG_I32       TCG_CALL_ARG_NORMAL
+#define TCG_TARGET_CALL_ARG_I128      TCG_CALL_ARG_EVEN
+#define TCG_TARGET_CALL_RET_I128      TCG_CALL_RET_NORMAL
 
 /* MOVN/MOVZ instructions detection */
 #if (defined(__mips_isa_rev) && (__mips_isa_rev >= 1)) || \
diff --git a/tcg/riscv/tcg-target.h b/tcg/riscv/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/riscv/tcg-target.h
+++ b/tcg/riscv/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
 #define TCG_TARGET_CALL_ARG_I32         TCG_CALL_ARG_NORMAL
 #if TCG_TARGET_REG_BITS == 32
 #define TCG_TARGET_CALL_ARG_I64         TCG_CALL_ARG_EVEN
+#define TCG_TARGET_CALL_ARG_I128        TCG_CALL_ARG_EVEN
 #else
 #define TCG_TARGET_CALL_ARG_I64         TCG_CALL_ARG_NORMAL
+#define TCG_TARGET_CALL_ARG_I128        TCG_CALL_ARG_NORMAL
 #endif
+#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_NORMAL
 
 /* optional instructions */
 #define TCG_TARGET_HAS_movcond_i32      0
diff --git a/tcg/s390x/tcg-target.h b/tcg/s390x/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/s390x/tcg-target.h
+++ b/tcg/s390x/tcg-target.h
@@ -XXX,XX +XXX,XX @@ extern uint64_t s390_facilities[3];
 #define TCG_TARGET_CALL_STACK_OFFSET	160
 #define TCG_TARGET_CALL_ARG_I32         TCG_CALL_ARG_EXTEND
 #define TCG_TARGET_CALL_ARG_I64         TCG_CALL_ARG_NORMAL
+#define TCG_TARGET_CALL_ARG_I128        TCG_CALL_ARG_BY_REF
+#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_BY_REF
 
 #define TCG_TARGET_HAS_MEMORY_BSWAP   1
 
diff --git a/tcg/sparc64/tcg-target.h b/tcg/sparc64/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/sparc64/tcg-target.h
+++ b/tcg/sparc64/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
 #define TCG_TARGET_CALL_STACK_OFFSET    (128 + 6*8 + TCG_TARGET_STACK_BIAS)
 #define TCG_TARGET_CALL_ARG_I32         TCG_CALL_ARG_EXTEND
 #define TCG_TARGET_CALL_ARG_I64         TCG_CALL_ARG_NORMAL
+#define TCG_TARGET_CALL_ARG_I128        TCG_CALL_ARG_NORMAL
+#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_NORMAL
 
 #if defined(__VIS__) && __VIS__ >= 0x300
 #define use_vis3_instructions  1
diff --git a/tcg/tcg.c b/tcg/tcg.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg.c
+++ b/tcg/tcg.c
@@ -XXX,XX +XXX,XX @@ static void init_call_layout(TCGHelperInfo *info)
         break;
     case dh_typecode_i128:
         info->nr_out = 128 / TCG_TARGET_REG_BITS;
-        info->out_kind = TCG_CALL_RET_NORMAL; /* TODO */
-        switch (/* TODO */ TCG_CALL_RET_NORMAL) {
+        info->out_kind = TCG_TARGET_CALL_RET_I128;
+        switch (TCG_TARGET_CALL_RET_I128) {
         case TCG_CALL_RET_NORMAL:
             /* Query the last register now to trigger any assert early. */
             tcg_target_call_oarg_reg(info->out_kind, info->nr_out - 1);
@@ -XXX,XX +XXX,XX @@ static void init_call_layout(TCGHelperInfo *info)
             break;
 
         case TCG_TYPE_I128:
-            switch (/* TODO */ TCG_CALL_ARG_NORMAL) {
+            switch (TCG_TARGET_CALL_ARG_I128) {
             case TCG_CALL_ARG_EVEN:
                 layout_arg_even(&cum);
                 /* fall through */
diff --git a/tcg/ppc/tcg-target.c.inc b/tcg/ppc/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/ppc/tcg-target.c.inc
+++ b/tcg/ppc/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@
 #else
 # define TCG_TARGET_CALL_ARG_I64   TCG_CALL_ARG_NORMAL
 #endif
+/* Note sysv arg alignment applies only to 2-word types, not more. */
+#define TCG_TARGET_CALL_ARG_I128   TCG_CALL_ARG_NORMAL
+#define TCG_TARGET_CALL_RET_I128   TCG_CALL_RET_NORMAL
 
 /* For some memory operations, we need a scratch that isn't R0.  For the AIX
    calling convention, we can re-use the TOC register since we'll be reloading
-- 
2.34.1

This enables allocation of i128.  The type is not yet
usable, as we have not yet added data movement ops.

Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 include/tcg/tcg.h | 32 +++++++++++++++++++++++++
 tcg/tcg.c         | 60 +++++++++++++++++++++++++++++++++--------------
 2 files changed, 74 insertions(+), 18 deletions(-)

diff --git a/include/tcg/tcg.h b/include/tcg/tcg.h
index XXXXXXX..XXXXXXX 100644
--- a/include/tcg/tcg.h
+++ b/include/tcg/tcg.h
@@ -XXX,XX +XXX,XX @@ static inline TCGTemp *tcgv_i64_temp(TCGv_i64 v)
     return tcgv_i32_temp((TCGv_i32)v);
 }
 
+static inline TCGTemp *tcgv_i128_temp(TCGv_i128 v)
+{
+    return tcgv_i32_temp((TCGv_i32)v);
+}
+
 static inline TCGTemp *tcgv_ptr_temp(TCGv_ptr v)
 {
     return tcgv_i32_temp((TCGv_i32)v);
@@ -XXX,XX +XXX,XX @@ static inline TCGArg tcgv_i64_arg(TCGv_i64 v)
     return temp_arg(tcgv_i64_temp(v));
 }
 
+static inline TCGArg tcgv_i128_arg(TCGv_i128 v)
+{
+    return temp_arg(tcgv_i128_temp(v));
+}
+
 static inline TCGArg tcgv_ptr_arg(TCGv_ptr v)
 {
     return temp_arg(tcgv_ptr_temp(v));
@@ -XXX,XX +XXX,XX @@ static inline TCGv_i64 temp_tcgv_i64(TCGTemp *t)
     return (TCGv_i64)temp_tcgv_i32(t);
 }
 
+static inline TCGv_i128 temp_tcgv_i128(TCGTemp *t)
+{
+    return (TCGv_i128)temp_tcgv_i32(t);
+}
+
 static inline TCGv_ptr temp_tcgv_ptr(TCGTemp *t)
 {
     return (TCGv_ptr)temp_tcgv_i32(t);
@@ -XXX,XX +XXX,XX @@ static inline void tcg_temp_free_i64(TCGv_i64 arg)
     tcg_temp_free_internal(tcgv_i64_temp(arg));
 }
 
+static inline void tcg_temp_free_i128(TCGv_i128 arg)
+{
+    tcg_temp_free_internal(tcgv_i128_temp(arg));
+}
+
 static inline void tcg_temp_free_ptr(TCGv_ptr arg)
 {
     tcg_temp_free_internal(tcgv_ptr_temp(arg));
@@ -XXX,XX +XXX,XX @@ static inline TCGv_i64 tcg_temp_local_new_i64(void)
     return temp_tcgv_i64(t);
 }
 
+static inline TCGv_i128 tcg_temp_new_i128(void)
+{
+    TCGTemp *t = tcg_temp_new_internal(TCG_TYPE_I128, false);
+    return temp_tcgv_i128(t);
+}
+
+static inline TCGv_i128 tcg_temp_local_new_i128(void)
+{
+    TCGTemp *t = tcg_temp_new_internal(TCG_TYPE_I128, true);
+    return temp_tcgv_i128(t);
+}
+
 static inline TCGv_ptr tcg_global_mem_new_ptr(TCGv_ptr reg, intptr_t offset,
                                               const char *name)
 {
diff --git a/tcg/tcg.c b/tcg/tcg.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg.c
+++ b/tcg/tcg.c
@@ -XXX,XX +XXX,XX @@ TCGTemp *tcg_temp_new_internal(TCGType type, bool temp_local)
         tcg_debug_assert(ts->base_type == type);
         tcg_debug_assert(ts->kind == kind);
     } else {
+        int i, n;
+
+        switch (type) {
+        case TCG_TYPE_I32:
+        case TCG_TYPE_V64:
+        case TCG_TYPE_V128:
+        case TCG_TYPE_V256:
+            n = 1;
+            break;
+        case TCG_TYPE_I64:
+            n = 64 / TCG_TARGET_REG_BITS;
+            break;
+        case TCG_TYPE_I128:
+            n = 128 / TCG_TARGET_REG_BITS;
+            break;
+        default:
+            g_assert_not_reached();
+        }
+
         ts = tcg_temp_alloc(s);
-        if (TCG_TARGET_REG_BITS == 32 && type == TCG_TYPE_I64) {
-            TCGTemp *ts2 = tcg_temp_alloc(s);
+        ts->base_type = type;
+        ts->temp_allocated = 1;
+        ts->kind = kind;
 
-            ts->base_type = type;
-            ts->type = TCG_TYPE_I32;
-            ts->temp_allocated = 1;
-            ts->kind = kind;
-
-            tcg_debug_assert(ts2 == ts + 1);
-            ts2->base_type = TCG_TYPE_I64;
-            ts2->type = TCG_TYPE_I32;
-            ts2->temp_allocated = 1;
-            ts2->temp_subindex = 1;
-            ts2->kind = kind;
-        } else {
-            ts->base_type = type;
+        if (n == 1) {
             ts->type = type;
-            ts->temp_allocated = 1;
-            ts->kind = kind;
+        } else {
+            ts->type = TCG_TYPE_REG;
+
+            for (i = 1; i < n; ++i) {
+                TCGTemp *ts2 = tcg_temp_alloc(s);
+
+                tcg_debug_assert(ts2 == ts + i);
+                ts2->base_type = type;
+                ts2->type = TCG_TYPE_REG;
+                ts2->temp_allocated = 1;
+                ts2->temp_subindex = i;
+                ts2->kind = kind;
+            }
         }
     }
 
@@ -XXX,XX +XXX,XX @@ static void temp_allocate_frame(TCGContext *s, TCGTemp *ts)
     case TCG_TYPE_V64:
         align = 8;
         break;
+    case TCG_TYPE_I128:
     case TCG_TYPE_V128:
     case TCG_TYPE_V256:
-        /* Note that we do not require aligned storage for V256. */
+        /*
+         * Note that we do not require aligned storage for V256,
+         * and that we provide alignment for I128 to match V128,
+         * even if that's above what the host ABI requires.
+         */
         align = 16;
         break;
     default:
-- 
2.34.1

Add code generation functions for data movement between
TCGv_i128 (mov) and to/from TCGv_i64 (concat, extract).

Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 include/tcg/tcg-op.h |  4 ++++
 tcg/tcg-internal.h   | 13 +++++++++++++
 tcg/tcg-op.c         | 20 ++++++++++++++++++++
 3 files changed, 37 insertions(+)

diff --git a/include/tcg/tcg-op.h b/include/tcg/tcg-op.h
index XXXXXXX..XXXXXXX 100644
--- a/include/tcg/tcg-op.h
+++ b/include/tcg/tcg-op.h
@@ -XXX,XX +XXX,XX @@ void tcg_gen_extrh_i64_i32(TCGv_i32 ret, TCGv_i64 arg);
 void tcg_gen_extr_i64_i32(TCGv_i32 lo, TCGv_i32 hi, TCGv_i64 arg);
 void tcg_gen_extr32_i64(TCGv_i64 lo, TCGv_i64 hi, TCGv_i64 arg);
 
+void tcg_gen_mov_i128(TCGv_i128 dst, TCGv_i128 src);
+void tcg_gen_extr_i128_i64(TCGv_i64 lo, TCGv_i64 hi, TCGv_i128 arg);
+void tcg_gen_concat_i64_i128(TCGv_i128 ret, TCGv_i64 lo, TCGv_i64 hi);
+
 static inline void tcg_gen_concat32_i64(TCGv_i64 ret, TCGv_i64 lo, TCGv_i64 hi)
 {
     tcg_gen_deposit_i64(ret, lo, hi, 32, 32);
diff --git a/tcg/tcg-internal.h b/tcg/tcg-internal.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg-internal.h
+++ b/tcg/tcg-internal.h
@@ -XXX,XX +XXX,XX @@ extern TCGv_i32 TCGV_LOW(TCGv_i64) QEMU_ERROR("32-bit code path is reachable");
 extern TCGv_i32 TCGV_HIGH(TCGv_i64) QEMU_ERROR("32-bit code path is reachable");
 #endif
 
+static inline TCGv_i64 TCGV128_LOW(TCGv_i128 t)
+{
+    /* For 32-bit, offset by 2, which may then have TCGV_{LOW,HIGH} applied. */
+    int o = HOST_BIG_ENDIAN ? 64 / TCG_TARGET_REG_BITS : 0;
+    return temp_tcgv_i64(tcgv_i128_temp(t) + o);
+}
+
+static inline TCGv_i64 TCGV128_HIGH(TCGv_i128 t)
+{
+    int o = HOST_BIG_ENDIAN ? 0 : 64 / TCG_TARGET_REG_BITS;
+    return temp_tcgv_i64(tcgv_i128_temp(t) + o);
+}
+
 #endif /* TCG_INTERNAL_H */
diff --git a/tcg/tcg-op.c b/tcg/tcg-op.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg-op.c
+++ b/tcg/tcg-op.c
@@ -XXX,XX +XXX,XX @@ void tcg_gen_extr32_i64(TCGv_i64 lo, TCGv_i64 hi, TCGv_i64 arg)
     tcg_gen_shri_i64(hi, arg, 32);
 }
 
+void tcg_gen_extr_i128_i64(TCGv_i64 lo, TCGv_i64 hi, TCGv_i128 arg)
+{
+    tcg_gen_mov_i64(lo, TCGV128_LOW(arg));
+    tcg_gen_mov_i64(hi, TCGV128_HIGH(arg));
+}
+
+void tcg_gen_concat_i64_i128(TCGv_i128 ret, TCGv_i64 lo, TCGv_i64 hi)
+{
+    tcg_gen_mov_i64(TCGV128_LOW(ret), lo);
+    tcg_gen_mov_i64(TCGV128_HIGH(ret), hi);
+}
+
+void tcg_gen_mov_i128(TCGv_i128 dst, TCGv_i128 src)
+{
+    if (dst != src) {
+        tcg_gen_mov_i64(TCGV128_LOW(dst), TCGV128_LOW(src));
+        tcg_gen_mov_i64(TCGV128_HIGH(dst), TCGV128_HIGH(src));
+    }
+}
+
 /* QEMU specific operations.  */
 
 void tcg_gen_exit_tb(const TranslationBlock *tb, unsigned idx)
-- 
2.34.1

These are not yet considering atomicity of the 16-byte value;
this is a direct replacement for the current target code which
uses a pair of 8-byte operations.

Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 include/exec/cpu_ldst.h |  10 +++
 include/tcg/tcg-op.h    |   2 +
 accel/tcg/cputlb.c      | 112 +++++++++++++++++++++++++++++++++
 accel/tcg/user-exec.c   |  66 ++++++++++++++++++++
 tcg/tcg-op.c            | 134 ++++++++++++++++++++++++++++++++++++++++
 5 files changed, 324 insertions(+)

diff --git a/include/exec/cpu_ldst.h b/include/exec/cpu_ldst.h
index XXXXXXX..XXXXXXX 100644
--- a/include/exec/cpu_ldst.h
+++ b/include/exec/cpu_ldst.h
@@ -XXX,XX +XXX,XX @@ uint32_t cpu_ldl_le_mmu(CPUArchState *env, abi_ptr ptr,
 uint64_t cpu_ldq_le_mmu(CPUArchState *env, abi_ptr ptr,
                         MemOpIdx oi, uintptr_t ra);
 
+Int128 cpu_ld16_be_mmu(CPUArchState *env, abi_ptr addr,
+                       MemOpIdx oi, uintptr_t ra);
+Int128 cpu_ld16_le_mmu(CPUArchState *env, abi_ptr addr,
+                       MemOpIdx oi, uintptr_t ra);
+
 void cpu_stb_mmu(CPUArchState *env, abi_ptr ptr, uint8_t val,
                  MemOpIdx oi, uintptr_t ra);
 void cpu_stw_be_mmu(CPUArchState *env, abi_ptr ptr, uint16_t val,
@@ -XXX,XX +XXX,XX @@ void cpu_stl_le_mmu(CPUArchState *env, abi_ptr ptr, uint32_t val,
 void cpu_stq_le_mmu(CPUArchState *env, abi_ptr ptr, uint64_t val,
                     MemOpIdx oi, uintptr_t ra);
 
+void cpu_st16_be_mmu(CPUArchState *env, abi_ptr addr, Int128 val,
+                     MemOpIdx oi, uintptr_t ra);
+void cpu_st16_le_mmu(CPUArchState *env, abi_ptr addr, Int128 val,
+                     MemOpIdx oi, uintptr_t ra);
+
 uint32_t cpu_atomic_cmpxchgb_mmu(CPUArchState *env, target_ulong addr,
                                  uint32_t cmpv, uint32_t newv,
                                  MemOpIdx oi, uintptr_t retaddr);
diff --git a/include/tcg/tcg-op.h b/include/tcg/tcg-op.h
index XXXXXXX..XXXXXXX 100644
--- a/include/tcg/tcg-op.h
+++ b/include/tcg/tcg-op.h
@@ -XXX,XX +XXX,XX @@ void tcg_gen_qemu_ld_i32(TCGv_i32, TCGv, TCGArg, MemOp);
 void tcg_gen_qemu_st_i32(TCGv_i32, TCGv, TCGArg, MemOp);
 void tcg_gen_qemu_ld_i64(TCGv_i64, TCGv, TCGArg, MemOp);
 void tcg_gen_qemu_st_i64(TCGv_i64, TCGv, TCGArg, MemOp);
+void tcg_gen_qemu_ld_i128(TCGv_i128, TCGv, TCGArg, MemOp);
+void tcg_gen_qemu_st_i128(TCGv_i128, TCGv, TCGArg, MemOp);
 
 static inline void tcg_gen_qemu_ld8u(TCGv ret, TCGv addr, int mem_index)
 {
diff --git a/accel/tcg/cputlb.c b/accel/tcg/cputlb.c
index XXXXXXX..XXXXXXX 100644
--- a/accel/tcg/cputlb.c
+++ b/accel/tcg/cputlb.c
@@ -XXX,XX +XXX,XX @@ uint64_t cpu_ldq_le_mmu(CPUArchState *env, abi_ptr addr,
     return cpu_load_helper(env, addr, oi, ra, helper_le_ldq_mmu);
 }
 
+Int128 cpu_ld16_be_mmu(CPUArchState *env, abi_ptr addr,
+                       MemOpIdx oi, uintptr_t ra)
+{
+    MemOp mop = get_memop(oi);
+    int mmu_idx = get_mmuidx(oi);
+    MemOpIdx new_oi;
+    unsigned a_bits;
+    uint64_t h, l;
+
+    tcg_debug_assert((mop & (MO_BSWAP|MO_SSIZE)) == (MO_BE|MO_128));
+    a_bits = get_alignment_bits(mop);
+
+    /* Handle CPU specific unaligned behaviour */
+    if (addr & ((1 << a_bits) - 1)) {
+        cpu_unaligned_access(env_cpu(env), addr, MMU_DATA_LOAD,
+                             mmu_idx, ra);
+    }
+
+    /* Construct an unaligned 64-bit replacement MemOpIdx. */
+    mop = (mop & ~(MO_SIZE | MO_AMASK)) | MO_64 | MO_UNALN;
+    new_oi = make_memop_idx(mop, mmu_idx);
+
+    h = helper_be_ldq_mmu(env, addr, new_oi, ra);
+    l = helper_be_ldq_mmu(env, addr + 8, new_oi, ra);
+
+    qemu_plugin_vcpu_mem_cb(env_cpu(env), addr, oi, QEMU_PLUGIN_MEM_R);
+    return int128_make128(l, h);
+}
+
+Int128 cpu_ld16_le_mmu(CPUArchState *env, abi_ptr addr,
+                       MemOpIdx oi, uintptr_t ra)
+{
+    MemOp mop = get_memop(oi);
+    int mmu_idx = get_mmuidx(oi);
+    MemOpIdx new_oi;
+    unsigned a_bits;
+    uint64_t h, l;
+
+    tcg_debug_assert((mop & (MO_BSWAP|MO_SSIZE)) == (MO_LE|MO_128));
+    a_bits = get_alignment_bits(mop);
+
+    /* Handle CPU specific unaligned behaviour */
+    if (addr & ((1 << a_bits) - 1)) {
+        cpu_unaligned_access(env_cpu(env), addr, MMU_DATA_LOAD,
+                             mmu_idx, ra);
+    }
+
+    /* Construct an unaligned 64-bit replacement MemOpIdx. */
+    mop = (mop & ~(MO_SIZE | MO_AMASK)) | MO_64 | MO_UNALN;
+    new_oi = make_memop_idx(mop, mmu_idx);
+
+    l = helper_le_ldq_mmu(env, addr, new_oi, ra);
+    h = helper_le_ldq_mmu(env, addr + 8, new_oi, ra);
+
+    qemu_plugin_vcpu_mem_cb(env_cpu(env), addr, oi, QEMU_PLUGIN_MEM_R);
+    return int128_make128(l, h);
+}
+
 /*
  * Store Helpers
  */
@@ -XXX,XX +XXX,XX @@ void cpu_stq_le_mmu(CPUArchState *env, target_ulong addr, uint64_t val,
     cpu_store_helper(env, addr, val, oi, retaddr, helper_le_stq_mmu);
 }
 
+void cpu_st16_be_mmu(CPUArchState *env, abi_ptr addr, Int128 val,
+                     MemOpIdx oi, uintptr_t ra)
+{
+    MemOp mop = get_memop(oi);
+    int mmu_idx = get_mmuidx(oi);
+    MemOpIdx new_oi;
+    unsigned a_bits;
+
+    tcg_debug_assert((mop & (MO_BSWAP|MO_SSIZE)) == (MO_BE|MO_128));
+    a_bits = get_alignment_bits(mop);
+
+    /* Handle CPU specific unaligned behaviour */
+    if (addr & ((1 << a_bits) - 1)) {
+        cpu_unaligned_access(env_cpu(env), addr, MMU_DATA_STORE,
+                             mmu_idx, ra);
+    }
+
+    /* Construct an unaligned 64-bit replacement MemOpIdx. */
+    mop = (mop & ~(MO_SIZE | MO_AMASK)) | MO_64 | MO_UNALN;
+    new_oi = make_memop_idx(mop, mmu_idx);
+
+    helper_be_stq_mmu(env, addr, int128_gethi(val), new_oi, ra);
+    helper_be_stq_mmu(env, addr + 8, int128_getlo(val), new_oi, ra);
+
+    qemu_plugin_vcpu_mem_cb(env_cpu(env), addr, oi, QEMU_PLUGIN_MEM_W);
+}
+
+void cpu_st16_le_mmu(CPUArchState *env, abi_ptr addr, Int128 val,
+                     MemOpIdx oi, uintptr_t ra)
+{
+    MemOp mop = get_memop(oi);
+    int mmu_idx = get_mmuidx(oi);
+    MemOpIdx new_oi;
+    unsigned a_bits;
+
+    tcg_debug_assert((mop & (MO_BSWAP|MO_SSIZE)) == (MO_LE|MO_128));
+    a_bits = get_alignment_bits(mop);
+
+    /* Handle CPU specific unaligned behaviour */
+    if (addr & ((1 << a_bits) - 1)) {
+        cpu_unaligned_access(env_cpu(env), addr, MMU_DATA_STORE,
+                             mmu_idx, ra);
+    }
+
+    /* Construct an unaligned 64-bit replacement MemOpIdx. */
+    mop = (mop & ~(MO_SIZE | MO_AMASK)) | MO_64 | MO_UNALN;
+    new_oi = make_memop_idx(mop, mmu_idx);
+
+    helper_le_stq_mmu(env, addr, int128_getlo(val), new_oi, ra);
+    helper_le_stq_mmu(env, addr + 8, int128_gethi(val), new_oi, ra);
+
+    qemu_plugin_vcpu_mem_cb(env_cpu(env), addr, oi, QEMU_PLUGIN_MEM_W);
+}
+
 #include "ldst_common.c.inc"
 
 /*
diff --git a/accel/tcg/user-exec.c b/accel/tcg/user-exec.c
index XXXXXXX..XXXXXXX 100644
--- a/accel/tcg/user-exec.c
+++ b/accel/tcg/user-exec.c
@@ -XXX,XX +XXX,XX @@ uint64_t cpu_ldq_le_mmu(CPUArchState *env, abi_ptr addr,
     return ret;
 }
 
+Int128 cpu_ld16_be_mmu(CPUArchState *env, abi_ptr addr,
+                       MemOpIdx oi, uintptr_t ra)
+{
+    void *haddr;
+    Int128 ret;
+
+    validate_memop(oi, MO_128 | MO_BE);
+    haddr = cpu_mmu_lookup(env, addr, oi, ra, MMU_DATA_LOAD);
+    memcpy(&ret, haddr, 16);
+    clear_helper_retaddr();
+    qemu_plugin_vcpu_mem_cb(env_cpu(env), addr, oi, QEMU_PLUGIN_MEM_R);
+
+    if (!HOST_BIG_ENDIAN) {
+        ret = bswap128(ret);
+    }
+    return ret;
+}
+
+Int128 cpu_ld16_le_mmu(CPUArchState *env, abi_ptr addr,
+                       MemOpIdx oi, uintptr_t ra)
+{
+    void *haddr;
+    Int128 ret;
+
+    validate_memop(oi, MO_128 | MO_LE);
+    haddr = cpu_mmu_lookup(env, addr, oi, ra, MMU_DATA_LOAD);
+    memcpy(&ret, haddr, 16);
+    clear_helper_retaddr();
+    qemu_plugin_vcpu_mem_cb(env_cpu(env), addr, oi, QEMU_PLUGIN_MEM_R);
+
+    if (HOST_BIG_ENDIAN) {
+        ret = bswap128(ret);
+    }
+    return ret;
+}
+
 void cpu_stb_mmu(CPUArchState *env, abi_ptr addr, uint8_t val,
                  MemOpIdx oi, uintptr_t ra)
 {
@@ -XXX,XX +XXX,XX @@ void cpu_stq_le_mmu(CPUArchState *env, abi_ptr addr, uint64_t val,
     qemu_plugin_vcpu_mem_cb(env_cpu(env), addr, oi, QEMU_PLUGIN_MEM_W);
 }
 
+void cpu_st16_be_mmu(CPUArchState *env, abi_ptr addr,
+                     Int128 val, MemOpIdx oi, uintptr_t ra)
+{
+    void *haddr;
+
+    validate_memop(oi, MO_128 | MO_BE);
+    haddr = cpu_mmu_lookup(env, addr, oi, ra, MMU_DATA_STORE);
+    if (!HOST_BIG_ENDIAN) {
+        val = bswap128(val);
+    }
+    memcpy(haddr, &val, 16);
+    clear_helper_retaddr();
+    qemu_plugin_vcpu_mem_cb(env_cpu(env), addr, oi, QEMU_PLUGIN_MEM_W);
+}
+
+void cpu_st16_le_mmu(CPUArchState *env, abi_ptr addr,
+                     Int128 val, MemOpIdx oi, uintptr_t ra)
+{
+    void *haddr;
+
+    validate_memop(oi, MO_128 | MO_LE);
+    haddr = cpu_mmu_lookup(env, addr, oi, ra, MMU_DATA_STORE);
+    if (HOST_BIG_ENDIAN) {
+        val = bswap128(val);
+    }
+    memcpy(haddr, &val, 16);
+    clear_helper_retaddr();
+    qemu_plugin_vcpu_mem_cb(env_cpu(env), addr, oi, QEMU_PLUGIN_MEM_W);
+}
+
 uint32_t cpu_ldub_code(CPUArchState *env, abi_ptr ptr)
 {
     uint32_t ret;
diff --git a/tcg/tcg-op.c b/tcg/tcg-op.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg-op.c
+++ b/tcg/tcg-op.c
@@ -XXX,XX +XXX,XX @@ void tcg_gen_qemu_st_i64(TCGv_i64 val, TCGv addr, TCGArg idx, MemOp memop)
     }
 }
 
+static void canonicalize_memop_i128_as_i64(MemOp ret[2], MemOp orig)
+{
+    MemOp mop_1 = orig, mop_2;
+
+    tcg_debug_assert((orig & MO_SIZE) == MO_128);
+    tcg_debug_assert((orig & MO_SIGN) == 0);
+
+    /* Use a memory ordering implemented by the host. */
+    if (!TCG_TARGET_HAS_MEMORY_BSWAP && (orig & MO_BSWAP)) {
+        mop_1 &= ~MO_BSWAP;
+    }
+
+    /* Reduce the size to 64-bit. */
+    mop_1 = (mop_1 & ~MO_SIZE) | MO_64;
+
+    /* Retain the alignment constraints of the original. */
+    switch (orig & MO_AMASK) {
+    case MO_UNALN:
+    case MO_ALIGN_2:
+    case MO_ALIGN_4:
+        mop_2 = mop_1;
+        break;
+    case MO_ALIGN_8:
+        /* Prefer MO_ALIGN+MO_64 to MO_ALIGN_8+MO_64. */
+        mop_1 = (mop_1 & ~MO_AMASK) | MO_ALIGN;
+        mop_2 = mop_1;
+        break;
+    case MO_ALIGN:
+        /* Second has 8-byte alignment; first has 16-byte alignment. */
+        mop_2 = mop_1;
+        mop_1 = (mop_1 & ~MO_AMASK) | MO_ALIGN_16;
+        break;
+    case MO_ALIGN_16:
+    case MO_ALIGN_32:
+    case MO_ALIGN_64:
+        /* Second has 8-byte alignment; first retains original. */
+        mop_2 = (mop_1 & ~MO_AMASK) | MO_ALIGN;
+        break;
+    default:
+        g_assert_not_reached();
+    }
+    ret[0] = mop_1;
+    ret[1] = mop_2;
+}
+
+void tcg_gen_qemu_ld_i128(TCGv_i128 val, TCGv addr, TCGArg idx, MemOp memop)
+{
+    MemOp mop[2];
+    TCGv addr_p8;
+    TCGv_i64 x, y;
+
+    canonicalize_memop_i128_as_i64(mop, memop);
+
+    tcg_gen_req_mo(TCG_MO_LD_LD | TCG_MO_ST_LD);
+    addr = plugin_prep_mem_callbacks(addr);
+
+    /* TODO: respect atomicity of the operation. */
+    /* TODO: allow the tcg backend to see the whole operation. */
+
+    /*
+     * Since there are no global TCGv_i128, there is no visible state
+     * changed if the second load faults.  Load directly into the two
+     * subwords.
+     */
+    if ((memop & MO_BSWAP) == MO_LE) {
+        x = TCGV128_LOW(val);
+        y = TCGV128_HIGH(val);
+    } else {
+        x = TCGV128_HIGH(val);
+        y = TCGV128_LOW(val);
+    }
+
+    gen_ldst_i64(INDEX_op_qemu_ld_i64, x, addr, mop[0], idx);
+
+    if ((mop[0] ^ memop) & MO_BSWAP) {
+        tcg_gen_bswap64_i64(x, x);
+    }
+
+    addr_p8 = tcg_temp_new();
+    tcg_gen_addi_tl(addr_p8, addr, 8);
+    gen_ldst_i64(INDEX_op_qemu_ld_i64, y, addr_p8, mop[1], idx);
+    tcg_temp_free(addr_p8);
+
+    if ((mop[0] ^ memop) & MO_BSWAP) {
+        tcg_gen_bswap64_i64(y, y);
+    }
+
+    plugin_gen_mem_callbacks(addr, make_memop_idx(memop, idx),
+                             QEMU_PLUGIN_MEM_R);
+}
+
+void tcg_gen_qemu_st_i128(TCGv_i128 val, TCGv addr, TCGArg idx, MemOp memop)
+{
+    MemOp mop[2];
+    TCGv addr_p8;
+    TCGv_i64 x, y;
+
+    canonicalize_memop_i128_as_i64(mop, memop);
+
+    tcg_gen_req_mo(TCG_MO_ST_LD | TCG_MO_ST_ST);
+    addr = plugin_prep_mem_callbacks(addr);
+
+    /* TODO: respect atomicity of the operation. */
+    /* TODO: allow the tcg backend to see the whole operation. */
+
+    if ((memop & MO_BSWAP) == MO_LE) {
+        x = TCGV128_LOW(val);
+        y = TCGV128_HIGH(val);
+    } else {
+        x = TCGV128_HIGH(val);
+        y = TCGV128_LOW(val);
+    }
+
+    addr_p8 = tcg_temp_new();
+    if ((mop[0] ^ memop) & MO_BSWAP) {
+        TCGv_i64 t = tcg_temp_new_i64();
+
+        tcg_gen_bswap64_i64(t, x);
+        gen_ldst_i64(INDEX_op_qemu_st_i64, t, addr, mop[0], idx);
+        tcg_gen_bswap64_i64(t, y);
+        tcg_gen_addi_tl(addr_p8, addr, 8);
+        gen_ldst_i64(INDEX_op_qemu_st_i64, t, addr_p8, mop[1], idx);
+        tcg_temp_free_i64(t);
+    } else {
+        gen_ldst_i64(INDEX_op_qemu_st_i64, x, addr, mop[0], idx);
+        tcg_gen_addi_tl(addr_p8, addr, 8);
+        gen_ldst_i64(INDEX_op_qemu_st_i64, y, addr_p8, mop[1], idx);
+    }
+    tcg_temp_free(addr_p8);
+
+    plugin_gen_mem_callbacks(addr, make_memop_idx(memop, idx),
+                             QEMU_PLUGIN_MEM_W);
+}
+
 static void tcg_gen_ext_i32(TCGv_i32 ret, TCGv_i32 val, MemOp opc)
 {
     switch (opc & MO_SSIZE) {
-- 
2.34.1

This will allow targets to avoid rolling their own.

Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 accel/tcg/tcg-runtime.h       | 11 +++++
 include/tcg/tcg-op.h          |  5 +++
 tcg/tcg-op.c                  | 85 +++++++++++++++++++++++++++++++++++
 accel/tcg/atomic_common.c.inc | 45 +++++++++++++++++++
 4 files changed, 146 insertions(+)

diff --git a/accel/tcg/tcg-runtime.h b/accel/tcg/tcg-runtime.h
index XXXXXXX..XXXXXXX 100644
--- a/accel/tcg/tcg-runtime.h
+++ b/accel/tcg/tcg-runtime.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(atomic_cmpxchgq_be, TCG_CALL_NO_WG,
 DEF_HELPER_FLAGS_5(atomic_cmpxchgq_le, TCG_CALL_NO_WG,
                    i64, env, tl, i64, i64, i32)
 #endif
+#ifdef CONFIG_CMPXCHG128
+DEF_HELPER_FLAGS_5(atomic_cmpxchgo_be, TCG_CALL_NO_WG,
+                   i128, env, tl, i128, i128, i32)
+DEF_HELPER_FLAGS_5(atomic_cmpxchgo_le, TCG_CALL_NO_WG,
+                   i128, env, tl, i128, i128, i32)
+#endif
+
+DEF_HELPER_FLAGS_5(nonatomic_cmpxchgo_be, TCG_CALL_NO_WG,
+                   i128, env, tl, i128, i128, i32)
+DEF_HELPER_FLAGS_5(nonatomic_cmpxchgo_le, TCG_CALL_NO_WG,
+                   i128, env, tl, i128, i128, i32)
 
 #ifdef CONFIG_ATOMIC64
 #define GEN_ATOMIC_HELPERS(NAME)                                  \
diff --git a/include/tcg/tcg-op.h b/include/tcg/tcg-op.h
index XXXXXXX..XXXXXXX 100644
--- a/include/tcg/tcg-op.h
+++ b/include/tcg/tcg-op.h
@@ -XXX,XX +XXX,XX @@ void tcg_gen_atomic_cmpxchg_i32(TCGv_i32, TCGv, TCGv_i32, TCGv_i32,
                                 TCGArg, MemOp);
 void tcg_gen_atomic_cmpxchg_i64(TCGv_i64, TCGv, TCGv_i64, TCGv_i64,
                                 TCGArg, MemOp);
+void tcg_gen_atomic_cmpxchg_i128(TCGv_i128, TCGv, TCGv_i128, TCGv_i128,
+                                 TCGArg, MemOp);
+
+void tcg_gen_nonatomic_cmpxchg_i128(TCGv_i128, TCGv, TCGv_i128, TCGv_i128,
+                                    TCGArg, MemOp);
 
 void tcg_gen_atomic_xchg_i32(TCGv_i32, TCGv, TCGv_i32, TCGArg, MemOp);
 void tcg_gen_atomic_xchg_i64(TCGv_i64, TCGv, TCGv_i64, TCGArg, MemOp);
diff --git a/tcg/tcg-op.c b/tcg/tcg-op.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg-op.c
+++ b/tcg/tcg-op.c
@@ -XXX,XX +XXX,XX @@ typedef void (*gen_atomic_cx_i32)(TCGv_i32, TCGv_env, TCGv,
                                   TCGv_i32, TCGv_i32, TCGv_i32);
 typedef void (*gen_atomic_cx_i64)(TCGv_i64, TCGv_env, TCGv,
                                   TCGv_i64, TCGv_i64, TCGv_i32);
+typedef void (*gen_atomic_cx_i128)(TCGv_i128, TCGv_env, TCGv,
+                                   TCGv_i128, TCGv_i128, TCGv_i32);
 typedef void (*gen_atomic_op_i32)(TCGv_i32, TCGv_env, TCGv,
                                   TCGv_i32, TCGv_i32);
 typedef void (*gen_atomic_op_i64)(TCGv_i64, TCGv_env, TCGv,
@@ -XXX,XX +XXX,XX @@ typedef void (*gen_atomic_op_i64)(TCGv_i64, TCGv_env, TCGv,
 #else
 # define WITH_ATOMIC64(X)
 #endif
+#ifdef CONFIG_CMPXCHG128
+# define WITH_ATOMIC128(X) X,
+#else
+# define WITH_ATOMIC128(X)
+#endif
 
 static void * const table_cmpxchg[(MO_SIZE | MO_BSWAP) + 1] = {
     [MO_8] = gen_helper_atomic_cmpxchgb,
@@ -XXX,XX +XXX,XX @@ static void * const table_cmpxchg[(MO_SIZE | MO_BSWAP) + 1] = {
     [MO_32 | MO_BE] = gen_helper_atomic_cmpxchgl_be,
     WITH_ATOMIC64([MO_64 | MO_LE] = gen_helper_atomic_cmpxchgq_le)
     WITH_ATOMIC64([MO_64 | MO_BE] = gen_helper_atomic_cmpxchgq_be)
+    WITH_ATOMIC128([MO_128 | MO_LE] = gen_helper_atomic_cmpxchgo_le)
+    WITH_ATOMIC128([MO_128 | MO_BE] = gen_helper_atomic_cmpxchgo_be)
 };
 
 void tcg_gen_atomic_cmpxchg_i32(TCGv_i32 retv, TCGv addr, TCGv_i32 cmpv,
@@ -XXX,XX +XXX,XX @@ void tcg_gen_atomic_cmpxchg_i64(TCGv_i64 retv, TCGv addr, TCGv_i64 cmpv,
     }
 }
 
+void tcg_gen_nonatomic_cmpxchg_i128(TCGv_i128 retv, TCGv addr, TCGv_i128 cmpv,
+                                    TCGv_i128 newv, TCGArg idx, MemOp memop)
+{
+    if (TCG_TARGET_REG_BITS == 32) {
+        /* Inline expansion below is simply too large for 32-bit hosts. */
+        gen_atomic_cx_i128 gen = ((memop & MO_BSWAP) == MO_LE
+                                  ? gen_helper_nonatomic_cmpxchgo_le 
+                                  : gen_helper_nonatomic_cmpxchgo_be);
+        MemOpIdx oi = make_memop_idx(memop, idx);
+
+        tcg_debug_assert((memop & MO_SIZE) == MO_128);
+        tcg_debug_assert((memop & MO_SIGN) == 0);
+
+        gen(retv, cpu_env, addr, cmpv, newv, tcg_constant_i32(oi));
+    } else {
+        TCGv_i128 oldv = tcg_temp_new_i128();
+        TCGv_i128 tmpv = tcg_temp_new_i128();
+        TCGv_i64 t0 = tcg_temp_new_i64();
+        TCGv_i64 t1 = tcg_temp_new_i64();
+        TCGv_i64 z = tcg_constant_i64(0);
+
+        tcg_gen_qemu_ld_i128(oldv, addr, idx, memop);
+
+        /* Compare i128 */
+        tcg_gen_xor_i64(t0, TCGV128_LOW(oldv), TCGV128_LOW(cmpv));
+        tcg_gen_xor_i64(t1, TCGV128_HIGH(oldv), TCGV128_HIGH(cmpv));
+        tcg_gen_or_i64(t0, t0, t1);
+
+        /* tmpv = equal ? newv : oldv */
+        tcg_gen_movcond_i64(TCG_COND_EQ, TCGV128_LOW(tmpv), t0, z,
+                            TCGV128_LOW(newv), TCGV128_LOW(oldv));
+        tcg_gen_movcond_i64(TCG_COND_EQ, TCGV128_HIGH(tmpv), t0, z,
+                            TCGV128_HIGH(newv), TCGV128_HIGH(oldv));
+
+        /* Unconditional writeback. */
+        tcg_gen_qemu_st_i128(tmpv, addr, idx, memop);
+        tcg_gen_mov_i128(retv, oldv);
+
+        tcg_temp_free_i64(t0);
+        tcg_temp_free_i64(t1);
+        tcg_temp_free_i128(tmpv);
+        tcg_temp_free_i128(oldv);
+    }
+}
+
+void tcg_gen_atomic_cmpxchg_i128(TCGv_i128 retv, TCGv addr, TCGv_i128 cmpv,
+                                 TCGv_i128 newv, TCGArg idx, MemOp memop)
+{
+    gen_atomic_cx_i128 gen;
+
+    if (!(tcg_ctx->gen_tb->cflags & CF_PARALLEL)) {
+        tcg_gen_nonatomic_cmpxchg_i128(retv, addr, cmpv, newv, idx, memop);
+        return;
+    }
+
+    tcg_debug_assert((memop & MO_SIZE) == MO_128);
+    tcg_debug_assert((memop & MO_SIGN) == 0);
+    gen = table_cmpxchg[memop & (MO_SIZE | MO_BSWAP)];
+
+    if (gen) {
+        MemOpIdx oi = make_memop_idx(memop, idx);
+        gen(retv, cpu_env, addr, cmpv, newv, tcg_constant_i32(oi));
+        return;
+    }
+
+    gen_helper_exit_atomic(cpu_env);
+
+    /*
+     * Produce a result for a well-formed opcode stream.  This satisfies
+     * liveness for set before used, which happens before this dead code
+     * is removed.
+     */
+    tcg_gen_movi_i64(TCGV128_LOW(retv), 0);
+    tcg_gen_movi_i64(TCGV128_HIGH(retv), 0);
+}
+
 static void do_nonatomic_op_i32(TCGv_i32 ret, TCGv addr, TCGv_i32 val,
                                 TCGArg idx, MemOp memop, bool new_val,
                                 void (*gen)(TCGv_i32, TCGv_i32, TCGv_i32))
diff --git a/accel/tcg/atomic_common.c.inc b/accel/tcg/atomic_common.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/accel/tcg/atomic_common.c.inc
+++ b/accel/tcg/atomic_common.c.inc
@@ -XXX,XX +XXX,XX @@ CMPXCHG_HELPER(cmpxchgq_be, uint64_t)
 CMPXCHG_HELPER(cmpxchgq_le, uint64_t)
 #endif
 
+#ifdef CONFIG_CMPXCHG128
+CMPXCHG_HELPER(cmpxchgo_be, Int128)
+CMPXCHG_HELPER(cmpxchgo_le, Int128)
+#endif
+
 #undef CMPXCHG_HELPER
 
+Int128 HELPER(nonatomic_cmpxchgo_be)(CPUArchState *env, target_ulong addr,
+                                     Int128 cmpv, Int128 newv, uint32_t oi)
+{
+#if TCG_TARGET_REG_BITS == 32
+    uintptr_t ra = GETPC();
+    Int128 oldv;
+
+    oldv = cpu_ld16_be_mmu(env, addr, oi, ra);
+    if (int128_eq(oldv, cmpv)) {
+        cpu_st16_be_mmu(env, addr, newv, oi, ra);
+    } else {
+        /* Even with comparison failure, still need a write cycle. */
+        probe_write(env, addr, 16, get_mmuidx(oi), ra);
+    }
+    return oldv;
+#else
+    g_assert_not_reached();
+#endif
+}
+
+Int128 HELPER(nonatomic_cmpxchgo_le)(CPUArchState *env, target_ulong addr,
+                                     Int128 cmpv, Int128 newv, uint32_t oi)
+{
+#if TCG_TARGET_REG_BITS == 32
+    uintptr_t ra = GETPC();
+    Int128 oldv;
+
+    oldv = cpu_ld16_le_mmu(env, addr, oi, ra);
+    if (int128_eq(oldv, cmpv)) {
+        cpu_st16_le_mmu(env, addr, newv, oi, ra);
+    } else {
+        /* Even with comparison failure, still need a write cycle. */
+        probe_write(env, addr, 16, get_mmuidx(oi), ra);
+    }
+    return oldv;
+#else
+    g_assert_not_reached();
+#endif
+}
+
 #define ATOMIC_HELPER(OP, TYPE) \
     TYPE HELPER(glue(atomic_,OP))(CPUArchState *env, target_ulong addr,  \
                                   TYPE val, uint32_t oi)                 \
-- 
2.34.1

Normally this is automatically handled by the CF_PARALLEL checks
with in tcg_gen_atomic_cmpxchg_i{32,64}, but x86 has a special
case of !PREFIX_LOCK where it always wants the non-atomic version.

Split these out so that x86 does not have to roll its own.

Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 include/tcg/tcg-op.h |   4 ++
 tcg/tcg-op.c         | 154 +++++++++++++++++++++++++++----------------
 2 files changed, 101 insertions(+), 57 deletions(-)

diff --git a/include/tcg/tcg-op.h b/include/tcg/tcg-op.h
index XXXXXXX..XXXXXXX 100644
--- a/include/tcg/tcg-op.h
+++ b/include/tcg/tcg-op.h
@@ -XXX,XX +XXX,XX @@ void tcg_gen_atomic_cmpxchg_i64(TCGv_i64, TCGv, TCGv_i64, TCGv_i64,
 void tcg_gen_atomic_cmpxchg_i128(TCGv_i128, TCGv, TCGv_i128, TCGv_i128,
                                  TCGArg, MemOp);
 
+void tcg_gen_nonatomic_cmpxchg_i32(TCGv_i32, TCGv, TCGv_i32, TCGv_i32,
+                                   TCGArg, MemOp);
+void tcg_gen_nonatomic_cmpxchg_i64(TCGv_i64, TCGv, TCGv_i64, TCGv_i64,
+                                   TCGArg, MemOp);
 void tcg_gen_nonatomic_cmpxchg_i128(TCGv_i128, TCGv, TCGv_i128, TCGv_i128,
                                     TCGArg, MemOp);
 
diff --git a/tcg/tcg-op.c b/tcg/tcg-op.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg-op.c
+++ b/tcg/tcg-op.c
@@ -XXX,XX +XXX,XX @@ static void * const table_cmpxchg[(MO_SIZE | MO_BSWAP) + 1] = {
     WITH_ATOMIC128([MO_128 | MO_BE] = gen_helper_atomic_cmpxchgo_be)
 };
 
+void tcg_gen_nonatomic_cmpxchg_i32(TCGv_i32 retv, TCGv addr, TCGv_i32 cmpv,
+                                   TCGv_i32 newv, TCGArg idx, MemOp memop)
+{
+    TCGv_i32 t1 = tcg_temp_new_i32();
+    TCGv_i32 t2 = tcg_temp_new_i32();
+
+    tcg_gen_ext_i32(t2, cmpv, memop & MO_SIZE);
+
+    tcg_gen_qemu_ld_i32(t1, addr, idx, memop & ~MO_SIGN);
+    tcg_gen_movcond_i32(TCG_COND_EQ, t2, t1, t2, newv, t1);
+    tcg_gen_qemu_st_i32(t2, addr, idx, memop);
+    tcg_temp_free_i32(t2);
+
+    if (memop & MO_SIGN) {
+        tcg_gen_ext_i32(retv, t1, memop);
+    } else {
+        tcg_gen_mov_i32(retv, t1);
+    }
+    tcg_temp_free_i32(t1);
+}
+
 void tcg_gen_atomic_cmpxchg_i32(TCGv_i32 retv, TCGv addr, TCGv_i32 cmpv,
                                 TCGv_i32 newv, TCGArg idx, MemOp memop)
 {
-    memop = tcg_canonicalize_memop(memop, 0, 0);
+    gen_atomic_cx_i32 gen;
+    MemOpIdx oi;
 
     if (!(tcg_ctx->gen_tb->cflags & CF_PARALLEL)) {
-        TCGv_i32 t1 = tcg_temp_new_i32();
-        TCGv_i32 t2 = tcg_temp_new_i32();
-
-        tcg_gen_ext_i32(t2, cmpv, memop & MO_SIZE);
-
-        tcg_gen_qemu_ld_i32(t1, addr, idx, memop & ~MO_SIGN);
-        tcg_gen_movcond_i32(TCG_COND_EQ, t2, t1, t2, newv, t1);
-        tcg_gen_qemu_st_i32(t2, addr, idx, memop);
-        tcg_temp_free_i32(t2);
-
-        if (memop & MO_SIGN) {
-            tcg_gen_ext_i32(retv, t1, memop);
-        } else {
-            tcg_gen_mov_i32(retv, t1);
-        }
-        tcg_temp_free_i32(t1);
-    } else {
-        gen_atomic_cx_i32 gen;
-        MemOpIdx oi;
-
-        gen = table_cmpxchg[memop & (MO_SIZE | MO_BSWAP)];
-        tcg_debug_assert(gen != NULL);
-
-        oi = make_memop_idx(memop & ~MO_SIGN, idx);
-        gen(retv, cpu_env, addr, cmpv, newv, tcg_constant_i32(oi));
-
-        if (memop & MO_SIGN) {
-            tcg_gen_ext_i32(retv, retv, memop);
-        }
+        tcg_gen_nonatomic_cmpxchg_i32(retv, addr, cmpv, newv, idx, memop);
+        return;
     }
+
+    memop = tcg_canonicalize_memop(memop, 0, 0);
+    gen = table_cmpxchg[memop & (MO_SIZE | MO_BSWAP)];
+    tcg_debug_assert(gen != NULL);
+
+    oi = make_memop_idx(memop & ~MO_SIGN, idx);
+    gen(retv, cpu_env, addr, cmpv, newv, tcg_constant_i32(oi));
+
+    if (memop & MO_SIGN) {
+        tcg_gen_ext_i32(retv, retv, memop);
+    }
+}
+
+void tcg_gen_nonatomic_cmpxchg_i64(TCGv_i64 retv, TCGv addr, TCGv_i64 cmpv,
+                                   TCGv_i64 newv, TCGArg idx, MemOp memop)
+{
+    TCGv_i64 t1, t2;
+
+    if (TCG_TARGET_REG_BITS == 32 && (memop & MO_SIZE) < MO_64) {
+        tcg_gen_nonatomic_cmpxchg_i32(TCGV_LOW(retv), addr, TCGV_LOW(cmpv),
+                                      TCGV_LOW(newv), idx, memop);
+        if (memop & MO_SIGN) {
+            tcg_gen_sari_i32(TCGV_HIGH(retv), TCGV_LOW(retv), 31);
+        } else {
+            tcg_gen_movi_i32(TCGV_HIGH(retv), 0);
+        }
+        return;
+    }
+
+    t1 = tcg_temp_new_i64();
+    t2 = tcg_temp_new_i64();
+
+    tcg_gen_ext_i64(t2, cmpv, memop & MO_SIZE);
+
+    tcg_gen_qemu_ld_i64(t1, addr, idx, memop & ~MO_SIGN);
+    tcg_gen_movcond_i64(TCG_COND_EQ, t2, t1, t2, newv, t1);
+    tcg_gen_qemu_st_i64(t2, addr, idx, memop);
+    tcg_temp_free_i64(t2);
+
+    if (memop & MO_SIGN) {
+        tcg_gen_ext_i64(retv, t1, memop);
+    } else {
+        tcg_gen_mov_i64(retv, t1);
+    }
+    tcg_temp_free_i64(t1);
 }
 
 void tcg_gen_atomic_cmpxchg_i64(TCGv_i64 retv, TCGv addr, TCGv_i64 cmpv,
                                 TCGv_i64 newv, TCGArg idx, MemOp memop)
 {
-    memop = tcg_canonicalize_memop(memop, 1, 0);
-
     if (!(tcg_ctx->gen_tb->cflags & CF_PARALLEL)) {
-        TCGv_i64 t1 = tcg_temp_new_i64();
-        TCGv_i64 t2 = tcg_temp_new_i64();
+        tcg_gen_nonatomic_cmpxchg_i64(retv, addr, cmpv, newv, idx, memop);
+        return;
+    }
 
-        tcg_gen_ext_i64(t2, cmpv, memop & MO_SIZE);
-
-        tcg_gen_qemu_ld_i64(t1, addr, idx, memop & ~MO_SIGN);
-        tcg_gen_movcond_i64(TCG_COND_EQ, t2, t1, t2, newv, t1);
-        tcg_gen_qemu_st_i64(t2, addr, idx, memop);
-        tcg_temp_free_i64(t2);
-
-        if (memop & MO_SIGN) {
-            tcg_gen_ext_i64(retv, t1, memop);
-        } else {
-            tcg_gen_mov_i64(retv, t1);
-        }
-        tcg_temp_free_i64(t1);
-    } else if ((memop & MO_SIZE) == MO_64) {
-#ifdef CONFIG_ATOMIC64
+    if ((memop & MO_SIZE) == MO_64) {
         gen_atomic_cx_i64 gen;
-        MemOpIdx oi;
 
+        memop = tcg_canonicalize_memop(memop, 1, 0);
         gen = table_cmpxchg[memop & (MO_SIZE | MO_BSWAP)];
-        tcg_debug_assert(gen != NULL);
+        if (gen) {
+            MemOpIdx oi = make_memop_idx(memop, idx);
+            gen(retv, cpu_env, addr, cmpv, newv, tcg_constant_i32(oi));
+            return;
+        }
 
-        oi = make_memop_idx(memop, idx);
-        gen(retv, cpu_env, addr, cmpv, newv, tcg_constant_i32(oi));
-#else
         gen_helper_exit_atomic(cpu_env);
-        /* Produce a result, so that we have a well-formed opcode stream
-           with respect to uses of the result in the (dead) code following.  */
+
+        /*
+         * Produce a result for a well-formed opcode stream.  This satisfies
+         * liveness for set before used, which happens before this dead code
+         * is removed.
+         */
         tcg_gen_movi_i64(retv, 0);
-#endif /* CONFIG_ATOMIC64 */
+        return;
+    }
+
+    if (TCG_TARGET_REG_BITS == 32) {
+        tcg_gen_atomic_cmpxchg_i32(TCGV_LOW(retv), addr, TCGV_LOW(cmpv),
+                                   TCGV_LOW(newv), idx, memop);
+        if (memop & MO_SIGN) {
+            tcg_gen_sari_i32(TCGV_HIGH(retv), TCGV_LOW(retv), 31);
+        } else {
+            tcg_gen_movi_i32(TCGV_HIGH(retv), 0);
+        }
     } else {
         TCGv_i32 c32 = tcg_temp_new_i32();
         TCGv_i32 n32 = tcg_temp_new_i32();
-- 
2.34.1

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Message-Id: <20221112042555.2622152-2-richard.henderson@linaro.org>
---
 target/arm/helper-a64.h    |   6 ---
 target/arm/helper-a64.c    | 104 -------------------------------------
 target/arm/translate-a64.c |  60 ++++++++++++---------
 3 files changed, 35 insertions(+), 135 deletions(-)

diff --git a/target/arm/helper-a64.h b/target/arm/helper-a64.h
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper-a64.h
+++ b/target/arm/helper-a64.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_2(frecpx_f16, TCG_CALL_NO_RWG, f16, f16, ptr)
 DEF_HELPER_FLAGS_2(fcvtx_f64_to_f32, TCG_CALL_NO_RWG, f32, f64, env)
 DEF_HELPER_FLAGS_3(crc32_64, TCG_CALL_NO_RWG_SE, i64, i64, i64, i32)
 DEF_HELPER_FLAGS_3(crc32c_64, TCG_CALL_NO_RWG_SE, i64, i64, i64, i32)
-DEF_HELPER_FLAGS_4(paired_cmpxchg64_le, TCG_CALL_NO_WG, i64, env, i64, i64, i64)
-DEF_HELPER_FLAGS_4(paired_cmpxchg64_le_parallel, TCG_CALL_NO_WG,
-                   i64, env, i64, i64, i64)
-DEF_HELPER_FLAGS_4(paired_cmpxchg64_be, TCG_CALL_NO_WG, i64, env, i64, i64, i64)
-DEF_HELPER_FLAGS_4(paired_cmpxchg64_be_parallel, TCG_CALL_NO_WG,
-                   i64, env, i64, i64, i64)
 DEF_HELPER_5(casp_le_parallel, void, env, i32, i64, i64, i64)
 DEF_HELPER_5(casp_be_parallel, void, env, i32, i64, i64, i64)
 DEF_HELPER_FLAGS_3(advsimd_maxh, TCG_CALL_NO_RWG, f16, f16, f16, ptr)
diff --git a/target/arm/helper-a64.c b/target/arm/helper-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/helper-a64.c
+++ b/target/arm/helper-a64.c
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(crc32c_64)(uint64_t acc, uint64_t val, uint32_t bytes)
     return crc32c(acc, buf, bytes) ^ 0xffffffff;
 }
 
-uint64_t HELPER(paired_cmpxchg64_le)(CPUARMState *env, uint64_t addr,
-                                     uint64_t new_lo, uint64_t new_hi)
-{
-    Int128 cmpv = int128_make128(env->exclusive_val, env->exclusive_high);
-    Int128 newv = int128_make128(new_lo, new_hi);
-    Int128 oldv;
-    uintptr_t ra = GETPC();
-    uint64_t o0, o1;
-    bool success;
-    int mem_idx = cpu_mmu_index(env, false);
-    MemOpIdx oi0 = make_memop_idx(MO_LEUQ | MO_ALIGN_16, mem_idx);
-    MemOpIdx oi1 = make_memop_idx(MO_LEUQ, mem_idx);
-
-    o0 = cpu_ldq_le_mmu(env, addr + 0, oi0, ra);
-    o1 = cpu_ldq_le_mmu(env, addr + 8, oi1, ra);
-    oldv = int128_make128(o0, o1);
-
-    success = int128_eq(oldv, cmpv);
-    if (success) {
-        cpu_stq_le_mmu(env, addr + 0, int128_getlo(newv), oi1, ra);
-        cpu_stq_le_mmu(env, addr + 8, int128_gethi(newv), oi1, ra);
-    }
-
-    return !success;
-}
-
-uint64_t HELPER(paired_cmpxchg64_le_parallel)(CPUARMState *env, uint64_t addr,
-                                              uint64_t new_lo, uint64_t new_hi)
-{
-    Int128 oldv, cmpv, newv;
-    uintptr_t ra = GETPC();
-    bool success;
-    int mem_idx;
-    MemOpIdx oi;
-
-    assert(HAVE_CMPXCHG128);
-
-    mem_idx = cpu_mmu_index(env, false);
-    oi = make_memop_idx(MO_LE | MO_128 | MO_ALIGN, mem_idx);
-
-    cmpv = int128_make128(env->exclusive_val, env->exclusive_high);
-    newv = int128_make128(new_lo, new_hi);
-    oldv = cpu_atomic_cmpxchgo_le_mmu(env, addr, cmpv, newv, oi, ra);
-
-    success = int128_eq(oldv, cmpv);
-    return !success;
-}
-
-uint64_t HELPER(paired_cmpxchg64_be)(CPUARMState *env, uint64_t addr,
-                                     uint64_t new_lo, uint64_t new_hi)
-{
-    /*
-     * High and low need to be switched here because this is not actually a
-     * 128bit store but two doublewords stored consecutively
-     */
-    Int128 cmpv = int128_make128(env->exclusive_high, env->exclusive_val);
-    Int128 newv = int128_make128(new_hi, new_lo);
-    Int128 oldv;
-    uintptr_t ra = GETPC();
-    uint64_t o0, o1;
-    bool success;
-    int mem_idx = cpu_mmu_index(env, false);
-    MemOpIdx oi0 = make_memop_idx(MO_BEUQ | MO_ALIGN_16, mem_idx);
-    MemOpIdx oi1 = make_memop_idx(MO_BEUQ, mem_idx);
-
-    o1 = cpu_ldq_be_mmu(env, addr + 0, oi0, ra);
-    o0 = cpu_ldq_be_mmu(env, addr + 8, oi1, ra);
-    oldv = int128_make128(o0, o1);
-
-    success = int128_eq(oldv, cmpv);
-    if (success) {
-        cpu_stq_be_mmu(env, addr + 0, int128_gethi(newv), oi1, ra);
-        cpu_stq_be_mmu(env, addr + 8, int128_getlo(newv), oi1, ra);
-    }
-
-    return !success;
-}
-
-uint64_t HELPER(paired_cmpxchg64_be_parallel)(CPUARMState *env, uint64_t addr,
-                                              uint64_t new_lo, uint64_t new_hi)
-{
-    Int128 oldv, cmpv, newv;
-    uintptr_t ra = GETPC();
-    bool success;
-    int mem_idx;
-    MemOpIdx oi;
-
-    assert(HAVE_CMPXCHG128);
-
-    mem_idx = cpu_mmu_index(env, false);
-    oi = make_memop_idx(MO_BE | MO_128 | MO_ALIGN, mem_idx);
-
-    /*
-     * High and low need to be switched here because this is not actually a
-     * 128bit store but two doublewords stored consecutively
-     */
-    cmpv = int128_make128(env->exclusive_high, env->exclusive_val);
-    newv = int128_make128(new_hi, new_lo);
-    oldv = cpu_atomic_cmpxchgo_be_mmu(env, addr, cmpv, newv, oi, ra);
-
-    success = int128_eq(oldv, cmpv);
-    return !success;
-}
-
 /* Writes back the old data into Rs.  */
 void HELPER(casp_le_parallel)(CPUARMState *env, uint32_t rs, uint64_t addr,
                               uint64_t new_lo, uint64_t new_hi)
diff --git a/target/arm/translate-a64.c b/target/arm/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/translate-a64.c
+++ b/target/arm/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static void gen_store_exclusive(DisasContext *s, int rd, int rt, int rt2,
                                        get_mem_index(s),
                                        MO_64 | MO_ALIGN | s->be_data);
             tcg_gen_setcond_i64(TCG_COND_NE, tmp, tmp, cpu_exclusive_val);
-        } else if (tb_cflags(s->base.tb) & CF_PARALLEL) {
-            if (!HAVE_CMPXCHG128) {
-                gen_helper_exit_atomic(cpu_env);
-                /*
-                 * Produce a result so we have a well-formed opcode
-                 * stream when the following (dead) code uses 'tmp'.
-                 * TCG will remove the dead ops for us.
-                 */
-                tcg_gen_movi_i64(tmp, 0);
-            } else if (s->be_data == MO_LE) {
-                gen_helper_paired_cmpxchg64_le_parallel(tmp, cpu_env,
-                                                        cpu_exclusive_addr,
-                                                        cpu_reg(s, rt),
-                                                        cpu_reg(s, rt2));
-            } else {
-                gen_helper_paired_cmpxchg64_be_parallel(tmp, cpu_env,
-                                                        cpu_exclusive_addr,
-                                                        cpu_reg(s, rt),
-                                                        cpu_reg(s, rt2));
-            }
-        } else if (s->be_data == MO_LE) {
-            gen_helper_paired_cmpxchg64_le(tmp, cpu_env, cpu_exclusive_addr,
-                                           cpu_reg(s, rt), cpu_reg(s, rt2));
         } else {
-            gen_helper_paired_cmpxchg64_be(tmp, cpu_env, cpu_exclusive_addr,
-                                           cpu_reg(s, rt), cpu_reg(s, rt2));
+            TCGv_i128 t16 = tcg_temp_new_i128();
+            TCGv_i128 c16 = tcg_temp_new_i128();
+            TCGv_i64 a, b;
+
+            if (s->be_data == MO_LE) {
+                tcg_gen_concat_i64_i128(t16, cpu_reg(s, rt), cpu_reg(s, rt2));
+                tcg_gen_concat_i64_i128(c16, cpu_exclusive_val,
+                                        cpu_exclusive_high);
+            } else {
+                tcg_gen_concat_i64_i128(t16, cpu_reg(s, rt2), cpu_reg(s, rt));
+                tcg_gen_concat_i64_i128(c16, cpu_exclusive_high,
+                                        cpu_exclusive_val);
+            }
+
+            tcg_gen_atomic_cmpxchg_i128(t16, cpu_exclusive_addr, c16, t16,
+                                        get_mem_index(s),
+                                        MO_128 | MO_ALIGN | s->be_data);
+            tcg_temp_free_i128(c16);
+
+            a = tcg_temp_new_i64();
+            b = tcg_temp_new_i64();
+            if (s->be_data == MO_LE) {
+                tcg_gen_extr_i128_i64(a, b, t16);
+            } else {
+                tcg_gen_extr_i128_i64(b, a, t16);
+            }
+
+            tcg_gen_xor_i64(a, a, cpu_exclusive_val);
+            tcg_gen_xor_i64(b, b, cpu_exclusive_high);
+            tcg_gen_or_i64(tmp, a, b);
+            tcg_temp_free_i64(a);
+            tcg_temp_free_i64(b);
+            tcg_temp_free_i128(t16);
+
+            tcg_gen_setcondi_i64(TCG_COND_NE, tmp, tmp, 0);
         }
     } else {
         tcg_gen_atomic_cmpxchg_i64(tmp, cpu_exclusive_addr, cpu_exclusive_val,
-- 
2.34.1

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Peter Maydell <peter.maydell@linaro.org>
Message-Id: <20221112042555.2622152-3-richard.henderson@linaro.org>
---
 target/arm/helper-a64.h    |  2 --
 target/arm/helper-a64.c    | 43 ---------------------------
 target/arm/translate-a64.c | 61 +++++++++++---------------------------
 3 files changed, 18 insertions(+), 88 deletions(-)

Note that the previous direct reference to reserve_val,

-   tcg_gen_ld_i64(t1, cpu_env, (ctx->le_mode
-                                ? offsetof(CPUPPCState, reserve_val2)
-                                : offsetof(CPUPPCState, reserve_val)));

was incorrect because all references should have gone through
cpu_reserve_val.  Create a cpu_reserve_val2 tcg temp to fix this.

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Reviewed-by: Daniel Henrique Barboza <danielhb413@gmail.com>
Message-Id: <20221112061122.2720163-2-richard.henderson@linaro.org>
---
 target/ppc/helper.h     |   2 -
 target/ppc/mem_helper.c |  44 -----------------
 target/ppc/translate.c  | 102 ++++++++++++++++++----------------------
 3 files changed, 47 insertions(+), 101 deletions(-)

diff --git a/target/ppc/helper.h b/target/ppc/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/ppc/helper.h
+++ b/target/ppc/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_5(stq_le_parallel, TCG_CALL_NO_WG,
                    void, env, tl, i64, i64, i32)
 DEF_HELPER_FLAGS_5(stq_be_parallel, TCG_CALL_NO_WG,
                    void, env, tl, i64, i64, i32)
-DEF_HELPER_5(stqcx_le_parallel, i32, env, tl, i64, i64, i32)
-DEF_HELPER_5(stqcx_be_parallel, i32, env, tl, i64, i64, i32)
 #endif
diff --git a/target/ppc/mem_helper.c b/target/ppc/mem_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/ppc/mem_helper.c
+++ b/target/ppc/mem_helper.c
@@ -XXX,XX +XXX,XX @@ void helper_stq_be_parallel(CPUPPCState *env, target_ulong addr,
     val = int128_make128(lo, hi);
     cpu_atomic_sto_be_mmu(env, addr, val, opidx, GETPC());
 }
-
-uint32_t helper_stqcx_le_parallel(CPUPPCState *env, target_ulong addr,
-                                  uint64_t new_lo, uint64_t new_hi,
-                                  uint32_t opidx)
-{
-    bool success = false;
-
-    /* We will have raised EXCP_ATOMIC from the translator.  */
-    assert(HAVE_CMPXCHG128);
-
-    if (likely(addr == env->reserve_addr)) {
-        Int128 oldv, cmpv, newv;
-
-        cmpv = int128_make128(env->reserve_val2, env->reserve_val);
-        newv = int128_make128(new_lo, new_hi);
-        oldv = cpu_atomic_cmpxchgo_le_mmu(env, addr, cmpv, newv,
-                                          opidx, GETPC());
-        success = int128_eq(oldv, cmpv);
-    }
-    env->reserve_addr = -1;
-    return env->so + success * CRF_EQ_BIT;
-}
-
-uint32_t helper_stqcx_be_parallel(CPUPPCState *env, target_ulong addr,
-                                  uint64_t new_lo, uint64_t new_hi,
-                                  uint32_t opidx)
-{
-    bool success = false;
-
-    /* We will have raised EXCP_ATOMIC from the translator.  */
-    assert(HAVE_CMPXCHG128);
-
-    if (likely(addr == env->reserve_addr)) {
-        Int128 oldv, cmpv, newv;
-
-        cmpv = int128_make128(env->reserve_val2, env->reserve_val);
-        newv = int128_make128(new_lo, new_hi);
-        oldv = cpu_atomic_cmpxchgo_be_mmu(env, addr, cmpv, newv,
-                                          opidx, GETPC());
-        success = int128_eq(oldv, cmpv);
-    }
-    env->reserve_addr = -1;
-    return env->so + success * CRF_EQ_BIT;
-}
 #endif
 
 /*****************************************************************************/
diff --git a/target/ppc/translate.c b/target/ppc/translate.c
index XXXXXXX..XXXXXXX 100644
--- a/target/ppc/translate.c
+++ b/target/ppc/translate.c
@@ -XXX,XX +XXX,XX @@ static TCGv cpu_cfar;
 static TCGv cpu_xer, cpu_so, cpu_ov, cpu_ca, cpu_ov32, cpu_ca32;
 static TCGv cpu_reserve;
 static TCGv cpu_reserve_val;
+static TCGv cpu_reserve_val2;
 static TCGv cpu_fpscr;
 static TCGv_i32 cpu_access_type;
 
@@ -XXX,XX +XXX,XX @@ void ppc_translate_init(void)
                                      offsetof(CPUPPCState, reserve_addr),
                                      "reserve_addr");
     cpu_reserve_val = tcg_global_mem_new(cpu_env,
-                                     offsetof(CPUPPCState, reserve_val),
-                                     "reserve_val");
+                                         offsetof(CPUPPCState, reserve_val),
+                                         "reserve_val");
+    cpu_reserve_val2 = tcg_global_mem_new(cpu_env,
+                                          offsetof(CPUPPCState, reserve_val2),
+                                          "reserve_val2");
 
     cpu_fpscr = tcg_global_mem_new(cpu_env,
                                    offsetof(CPUPPCState, fpscr), "fpscr");
@@ -XXX,XX +XXX,XX @@ static void gen_lqarx(DisasContext *ctx)
 /* stqcx. */
 static void gen_stqcx_(DisasContext *ctx)
 {
+    TCGLabel *lab_fail, *lab_over;
     int rs = rS(ctx->opcode);
-    TCGv EA, hi, lo;
+    TCGv EA, t0, t1;
+    TCGv_i128 cmp, val;
 
     if (unlikely(rs & 1)) {
         gen_inval_exception(ctx, POWERPC_EXCP_INVAL_INVAL);
         return;
     }
 
+    lab_fail = gen_new_label();
+    lab_over = gen_new_label();
+
     gen_set_access_type(ctx, ACCESS_RES);
     EA = tcg_temp_new();
     gen_addr_reg_index(ctx, EA);
 
+    tcg_gen_brcond_tl(TCG_COND_NE, EA, cpu_reserve, lab_fail);
+    tcg_temp_free(EA);
+
+    cmp = tcg_temp_new_i128();
+    val = tcg_temp_new_i128();
+
+    tcg_gen_concat_i64_i128(cmp, cpu_reserve_val2, cpu_reserve_val);
+
     /* Note that the low part is always in RS+1, even in LE mode.  */
-    lo = cpu_gpr[rs + 1];
-    hi = cpu_gpr[rs];
+    tcg_gen_concat_i64_i128(val, cpu_gpr[rs + 1], cpu_gpr[rs]);
 
-    if (tb_cflags(ctx->base.tb) & CF_PARALLEL) {
-        if (HAVE_CMPXCHG128) {
-            TCGv_i32 oi = tcg_const_i32(DEF_MEMOP(MO_128) | MO_ALIGN);
-            if (ctx->le_mode) {
-                gen_helper_stqcx_le_parallel(cpu_crf[0], cpu_env,
-                                             EA, lo, hi, oi);
-            } else {
-                gen_helper_stqcx_be_parallel(cpu_crf[0], cpu_env,
-                                             EA, lo, hi, oi);
-            }
-            tcg_temp_free_i32(oi);
-        } else {
-            /* Restart with exclusive lock.  */
-            gen_helper_exit_atomic(cpu_env);
-            ctx->base.is_jmp = DISAS_NORETURN;
-        }
-        tcg_temp_free(EA);
-    } else {
-        TCGLabel *lab_fail = gen_new_label();
-        TCGLabel *lab_over = gen_new_label();
-        TCGv_i64 t0 = tcg_temp_new_i64();
-        TCGv_i64 t1 = tcg_temp_new_i64();
+    tcg_gen_atomic_cmpxchg_i128(val, cpu_reserve, cmp, val, ctx->mem_idx,
+                                DEF_MEMOP(MO_128 | MO_ALIGN));
+    tcg_temp_free_i128(cmp);
 
-        tcg_gen_brcond_tl(TCG_COND_NE, EA, cpu_reserve, lab_fail);
-        tcg_temp_free(EA);
+    t0 = tcg_temp_new();
+    t1 = tcg_temp_new();
+    tcg_gen_extr_i128_i64(t1, t0, val);
+    tcg_temp_free_i128(val);
 
-        gen_qemu_ld64_i64(ctx, t0, cpu_reserve);
-        tcg_gen_ld_i64(t1, cpu_env, (ctx->le_mode
-                                     ? offsetof(CPUPPCState, reserve_val2)
-                                     : offsetof(CPUPPCState, reserve_val)));
-        tcg_gen_brcond_i64(TCG_COND_NE, t0, t1, lab_fail);
+    tcg_gen_xor_tl(t1, t1, cpu_reserve_val2);
+    tcg_gen_xor_tl(t0, t0, cpu_reserve_val);
+    tcg_gen_or_tl(t0, t0, t1);
+    tcg_temp_free(t1);
 
-        tcg_gen_addi_i64(t0, cpu_reserve, 8);
-        gen_qemu_ld64_i64(ctx, t0, t0);
-        tcg_gen_ld_i64(t1, cpu_env, (ctx->le_mode
-                                     ? offsetof(CPUPPCState, reserve_val)
-                                     : offsetof(CPUPPCState, reserve_val2)));
-        tcg_gen_brcond_i64(TCG_COND_NE, t0, t1, lab_fail);
+    tcg_gen_setcondi_tl(TCG_COND_EQ, t0, t0, 0);
+    tcg_gen_shli_tl(t0, t0, CRF_EQ_BIT);
+    tcg_gen_or_tl(t0, t0, cpu_so);
+    tcg_gen_trunc_tl_i32(cpu_crf[0], t0);
+    tcg_temp_free(t0);
 
-        /* Success */
-        gen_qemu_st64_i64(ctx, ctx->le_mode ? lo : hi, cpu_reserve);
-        tcg_gen_addi_i64(t0, cpu_reserve, 8);
-        gen_qemu_st64_i64(ctx, ctx->le_mode ? hi : lo, t0);
+    tcg_gen_br(lab_over);
+    gen_set_label(lab_fail);
 
-        tcg_gen_trunc_tl_i32(cpu_crf[0], cpu_so);
-        tcg_gen_ori_i32(cpu_crf[0], cpu_crf[0], CRF_EQ);
-        tcg_gen_br(lab_over);
+    /*
+     * Address mismatch implies failure.  But we still need to provide
+     * the memory barrier semantics of the instruction.
+     */
+    tcg_gen_mb(TCG_MO_ALL | TCG_BAR_STRL);
+    tcg_gen_trunc_tl_i32(cpu_crf[0], cpu_so);
 
-        gen_set_label(lab_fail);
-        tcg_gen_trunc_tl_i32(cpu_crf[0], cpu_so);
-
-        gen_set_label(lab_over);
-        tcg_gen_movi_tl(cpu_reserve, -1);
-        tcg_temp_free_i64(t0);
-        tcg_temp_free_i64(t1);
-    }
+    gen_set_label(lab_over);
+    tcg_gen_movi_tl(cpu_reserve, -1);
 }
 #endif /* defined(TARGET_PPC64) */
 
-- 
2.34.1

From: Ilya Leoshkevich <iii@linux.ibm.com>

Add a basic test to prevent regressions.

Signed-off-by: Ilya Leoshkevich <iii@linux.ibm.com>
Message-Id: <20221101111300.2539919-1-iii@linux.ibm.com>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 tests/tcg/s390x/div.c           | 40 +++++++++++++++++++++++++++++++++
 tests/tcg/s390x/Makefile.target |  1 +
 2 files changed, 41 insertions(+)
 create mode 100644 tests/tcg/s390x/div.c

diff --git a/tests/tcg/s390x/div.c b/tests/tcg/s390x/div.c
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/tests/tcg/s390x/div.c
@@ -XXX,XX +XXX,XX @@
+#include <assert.h>
+#include <stdint.h>
+
+static void test_dr(void)
+{
+    register int32_t r0 asm("r0") = -1;
+    register int32_t r1 asm("r1") = -4241;
+    int32_t b = 101, q, r;
+
+    asm("dr %[r0],%[b]"
+        : [r0] "+r" (r0), [r1] "+r" (r1)
+        : [b] "r" (b)
+        : "cc");
+    q = r1;
+    r = r0;
+    assert(q == -41);
+    assert(r == -100);
+}
+
+static void test_dlr(void)
+{
+    register uint32_t r0 asm("r0") = 0;
+    register uint32_t r1 asm("r1") = 4243;
+    uint32_t b = 101, q, r;
+
+    asm("dlr %[r0],%[b]"
+        : [r0] "+r" (r0), [r1] "+r" (r1)
+        : [b] "r" (b)
+        : "cc");
+    q = r1;
+    r = r0;
+    assert(q == 42);
+    assert(r == 1);
+}
+
+int main(void)
+{
+    test_dr();
+    test_dlr();
+}
diff --git a/tests/tcg/s390x/Makefile.target b/tests/tcg/s390x/Makefile.target
index XXXXXXX..XXXXXXX 100644
--- a/tests/tcg/s390x/Makefile.target
+++ b/tests/tcg/s390x/Makefile.target
@@ -XXX,XX +XXX,XX @@ TESTS+=trap
 TESTS+=signals-s390x
 TESTS+=branch-relative-long
 TESTS+=noexec
+TESTS+=div
 
 Z13_TESTS=vistr
 $(Z13_TESTS): CFLAGS+=-march=z13 -O2
-- 
2.34.1

From: Ilya Leoshkevich <iii@linux.ibm.com>

Add a basic test to prevent regressions.

Signed-off-by: Ilya Leoshkevich <iii@linux.ibm.com>
Message-Id: <20221025213008.2209006-2-iii@linux.ibm.com>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 tests/tcg/s390x/clst.c          | 82 +++++++++++++++++++++++++++++++++
 tests/tcg/s390x/Makefile.target |  1 +
 2 files changed, 83 insertions(+)
 create mode 100644 tests/tcg/s390x/clst.c

diff --git a/tests/tcg/s390x/clst.c b/tests/tcg/s390x/clst.c
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/tests/tcg/s390x/clst.c
@@ -XXX,XX +XXX,XX @@
+#define _GNU_SOURCE
+#include <stdio.h>
+#include <stdlib.h>
+
+static int clst(char sep, const char **s1, const char **s2)
+{
+    const char *r1 = *s1;
+    const char *r2 = *s2;
+    int cc;
+
+    do {
+        register int r0 asm("r0") = sep;
+
+        asm("clst %[r1],%[r2]\n"
+            "ipm %[cc]\n"
+            "srl %[cc],28"
+            : [r1] "+r" (r1), [r2] "+r" (r2), "+r" (r0), [cc] "=r" (cc)
+            :
+            : "cc");
+        *s1 = r1;
+        *s2 = r2;
+    } while (cc == 3);
+
+    return cc;
+}
+
+static const struct test {
+    const char *name;
+    char sep;
+    const char *s1;
+    const char *s2;
+    int exp_cc;
+    int exp_off;
+} tests[] = {
+    {
+        .name = "cc0",
+        .sep = 0,
+        .s1 = "aa",
+        .s2 = "aa",
+        .exp_cc = 0,
+        .exp_off = 0,
+    },
+    {
+        .name = "cc1",
+        .sep = 1,
+        .s1 = "a\x01",
+        .s2 = "aa\x01",
+        .exp_cc = 1,
+        .exp_off = 1,
+    },
+    {
+        .name = "cc2",
+        .sep = 2,
+        .s1 = "abc\x02",
+        .s2 = "abb\x02",
+        .exp_cc = 2,
+        .exp_off = 2,
+    },
+};
+
+int main(void)
+{
+    const struct test *t;
+    const char *s1, *s2;
+    size_t i;
+    int cc;
+
+    for (i = 0; i < sizeof(tests) / sizeof(tests[0]); i++) {
+        t = &tests[i];
+        s1 = t->s1;
+        s2 = t->s2;
+        cc = clst(t->sep, &s1, &s2);
+        if (cc != t->exp_cc ||
+                s1 != t->s1 + t->exp_off ||
+                s2 != t->s2 + t->exp_off) {
+            fprintf(stderr, "%s\n", t->name);
+            return EXIT_FAILURE;
+        }
+    }
+
+    return EXIT_SUCCESS;
+}
diff --git a/tests/tcg/s390x/Makefile.target b/tests/tcg/s390x/Makefile.target
index XXXXXXX..XXXXXXX 100644
--- a/tests/tcg/s390x/Makefile.target
+++ b/tests/tcg/s390x/Makefile.target
@@ -XXX,XX +XXX,XX @@ TESTS+=signals-s390x
 TESTS+=branch-relative-long
 TESTS+=noexec
 TESTS+=div
+TESTS+=clst
 
 Z13_TESTS=vistr
 $(Z13_TESTS): CFLAGS+=-march=z13 -O2
-- 
2.34.1

Acked-by: Ilya Leoshkevich <iii@linux.ibm.com>
Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 tests/tcg/s390x/long-double.c   | 24 ++++++++++++++++++++++++
 tests/tcg/s390x/Makefile.target |  1 +
 2 files changed, 25 insertions(+)
 create mode 100644 tests/tcg/s390x/long-double.c

diff --git a/tests/tcg/s390x/long-double.c b/tests/tcg/s390x/long-double.c
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/tests/tcg/s390x/long-double.c
@@ -XXX,XX +XXX,XX @@
+/*
+ * Perform some basic arithmetic with long double, as a sanity check.
+ * With small integral numbers, we can cross-check with integers.
+ */
+
+#include <assert.h>
+
+int main()
+{
+    int i, j;
+
+    for (i = 1; i < 5; i++) {
+        for (j = 1; j < 5; j++) {
+            long double la = (long double)i + j;
+            long double lm = (long double)i * j;
+            long double ls = (long double)i - j;
+
+            assert(la == i + j);
+            assert(lm == i * j);
+            assert(ls == i - j);
+        }
+    }
+    return 0;
+}
diff --git a/tests/tcg/s390x/Makefile.target b/tests/tcg/s390x/Makefile.target
index XXXXXXX..XXXXXXX 100644
--- a/tests/tcg/s390x/Makefile.target
+++ b/tests/tcg/s390x/Makefile.target
@@ -XXX,XX +XXX,XX @@ TESTS+=branch-relative-long
 TESTS+=noexec
 TESTS+=div
 TESTS+=clst
+TESTS+=long-double
 
 Z13_TESTS=vistr
 $(Z13_TESTS): CFLAGS+=-march=z13 -O2
-- 
2.34.1

From: Ilya Leoshkevich <iii@linux.ibm.com>

Add a simple test to prevent regressions.

Signed-off-by: Ilya Leoshkevich <iii@linux.ibm.com>
Message-Id: <20230201133257.3223115-1-iii@linux.ibm.com>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 tests/tcg/s390x/cdsg.c          | 93 +++++++++++++++++++++++++++++++++
 tests/tcg/s390x/Makefile.target |  4 ++
 2 files changed, 97 insertions(+)
 create mode 100644 tests/tcg/s390x/cdsg.c

diff --git a/tests/tcg/s390x/cdsg.c b/tests/tcg/s390x/cdsg.c
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/tests/tcg/s390x/cdsg.c
@@ -XXX,XX +XXX,XX @@
+/*
+ * Test CDSG instruction.
+ *
+ * Increment the first half of aligned_quadword by 1, and the second half by 2
+ * from 2 threads. Verify that the result is consistent.
+ *
+ * SPDX-License-Identifier: GPL-2.0-or-later
+ */
+#include <assert.h>
+#include <pthread.h>
+#include <stdbool.h>
+#include <stdlib.h>
+
+static volatile bool start;
+typedef unsigned long aligned_quadword[2] __attribute__((__aligned__(16)));
+static aligned_quadword val;
+static const int n_iterations = 1000000;
+
+static inline int cdsg(unsigned long *orig0, unsigned long *orig1,
+                       unsigned long new0, unsigned long new1,
+                       aligned_quadword *mem)
+{
+    register unsigned long r0 asm("r0");
+    register unsigned long r1 asm("r1");
+    register unsigned long r2 asm("r2");
+    register unsigned long r3 asm("r3");
+    int cc;
+
+    r0 = *orig0;
+    r1 = *orig1;
+    r2 = new0;
+    r3 = new1;
+    asm("cdsg %[r0],%[r2],%[db2]\n"
+        "ipm %[cc]"
+        : [r0] "+r" (r0)
+        , [r1] "+r" (r1)
+        , [db2] "+m" (*mem)
+        , [cc] "=r" (cc)
+        : [r2] "r" (r2)
+        , [r3] "r" (r3)
+        : "cc");
+    *orig0 = r0;
+    *orig1 = r1;
+
+    return (cc >> 28) & 3;
+}
+
+void *cdsg_loop(void *arg)
+{
+    unsigned long orig0, orig1, new0, new1;
+    int cc;
+    int i;
+
+    while (!start) {
+    }
+
+    orig0 = val[0];
+    orig1 = val[1];
+    for (i = 0; i < n_iterations;) {
+        new0 = orig0 + 1;
+        new1 = orig1 + 2;
+
+        cc = cdsg(&orig0, &orig1, new0, new1, &val);
+
+        if (cc == 0) {
+            orig0 = new0;
+            orig1 = new1;
+            i++;
+        } else {
+            assert(cc == 1);
+        }
+    }
+
+    return NULL;
+}
+
+int main(void)
+{
+    pthread_t thread;
+    int ret;
+
+    ret = pthread_create(&thread, NULL, cdsg_loop, NULL);
+    assert(ret == 0);
+    start = true;
+    cdsg_loop(NULL);
+    ret = pthread_join(thread, NULL);
+    assert(ret == 0);
+
+    assert(val[0] == n_iterations * 2);
+    assert(val[1] == n_iterations * 4);
+
+    return EXIT_SUCCESS;
+}
diff --git a/tests/tcg/s390x/Makefile.target b/tests/tcg/s390x/Makefile.target
index XXXXXXX..XXXXXXX 100644
--- a/tests/tcg/s390x/Makefile.target
+++ b/tests/tcg/s390x/Makefile.target
@@ -XXX,XX +XXX,XX @@ TESTS+=noexec
 TESTS+=div
 TESTS+=clst
 TESTS+=long-double
+TESTS+=cdsg
+
+cdsg: CFLAGS+=-pthread
+cdsg: LDFLAGS+=-pthread
 
 Z13_TESTS=vistr
 $(Z13_TESTS): CFLAGS+=-march=z13 -O2
-- 
2.34.1

Pack the quotient and remainder into a single uint64_t.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Reviewed-by: David Hildenbrand <david@redhat.com>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
v2: Fix operand ordering; use tcg_extr32_i64.
---
 target/s390x/helper.h         |  2 +-
 target/s390x/tcg/int_helper.c | 26 +++++++++++++-------------
 target/s390x/tcg/translate.c  |  8 ++++----
 3 files changed, 18 insertions(+), 18 deletions(-)

diff --git a/target/s390x/helper.h b/target/s390x/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/s390x/helper.h
+++ b/target/s390x/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(clc, TCG_CALL_NO_WG, i32, env, i32, i64, i64)
 DEF_HELPER_3(mvcl, i32, env, i32, i32)
 DEF_HELPER_3(clcl, i32, env, i32, i32)
 DEF_HELPER_FLAGS_4(clm, TCG_CALL_NO_WG, i32, env, i32, i32, i64)
-DEF_HELPER_FLAGS_3(divs32, TCG_CALL_NO_WG, s64, env, s64, s64)
+DEF_HELPER_FLAGS_3(divs32, TCG_CALL_NO_WG, i64, env, s64, s64)
 DEF_HELPER_FLAGS_3(divu32, TCG_CALL_NO_WG, i64, env, i64, i64)
 DEF_HELPER_FLAGS_3(divs64, TCG_CALL_NO_WG, s64, env, s64, s64)
 DEF_HELPER_FLAGS_4(divu64, TCG_CALL_NO_WG, i64, env, i64, i64, i64)
diff --git a/target/s390x/tcg/int_helper.c b/target/s390x/tcg/int_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/s390x/tcg/int_helper.c
+++ b/target/s390x/tcg/int_helper.c
@@ -XXX,XX +XXX,XX @@
 #endif
 
 /* 64/32 -> 32 signed division */
-int64_t HELPER(divs32)(CPUS390XState *env, int64_t a, int64_t b64)
+uint64_t HELPER(divs32)(CPUS390XState *env, int64_t a, int64_t b64)
 {
-    int32_t ret, b = b64;
-    int64_t q;
+    int32_t b = b64;
+    int64_t q, r;
 
     if (b == 0) {
         tcg_s390_program_interrupt(env, PGM_FIXPT_DIVIDE, GETPC());
     }
 
-    ret = q = a / b;
-    env->retxl = a % b;
+    q = a / b;
+    r = a % b;
 
     /* Catch non-representable quotient.  */
-    if (ret != q) {
+    if (q != (int32_t)q) {
         tcg_s390_program_interrupt(env, PGM_FIXPT_DIVIDE, GETPC());
     }
 
-    return ret;
+    return deposit64(q, 32, 32, r);
 }
 
 /* 64/32 -> 32 unsigned division */
 uint64_t HELPER(divu32)(CPUS390XState *env, uint64_t a, uint64_t b64)
 {
-    uint32_t ret, b = b64;
-    uint64_t q;
+    uint32_t b = b64;
+    uint64_t q, r;
 
     if (b == 0) {
         tcg_s390_program_interrupt(env, PGM_FIXPT_DIVIDE, GETPC());
     }
 
-    ret = q = a / b;
-    env->retxl = a % b;
+    q = a / b;
+    r = a % b;
 
     /* Catch non-representable quotient.  */
-    if (ret != q) {
+    if (q != (uint32_t)q) {
         tcg_s390_program_interrupt(env, PGM_FIXPT_DIVIDE, GETPC());
     }
 
-    return ret;
+    return deposit64(q, 32, 32, r);
 }
 
 /* 64/64 -> 64 signed division */
diff --git a/target/s390x/tcg/translate.c b/target/s390x/tcg/translate.c
index XXXXXXX..XXXXXXX 100644
--- a/target/s390x/tcg/translate.c
+++ b/target/s390x/tcg/translate.c
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_diag(DisasContext *s, DisasOps *o)
 
 static DisasJumpType op_divs32(DisasContext *s, DisasOps *o)
 {
-    gen_helper_divs32(o->out2, cpu_env, o->in1, o->in2);
-    return_low128(o->out);
+    gen_helper_divs32(o->out, cpu_env, o->in1, o->in2);
+    tcg_gen_extr32_i64(o->out2, o->out, o->out);
     return DISAS_NEXT;
 }
 
 static DisasJumpType op_divu32(DisasContext *s, DisasOps *o)
 {
-    gen_helper_divu32(o->out2, cpu_env, o->in1, o->in2);
-    return_low128(o->out);
+    gen_helper_divu32(o->out, cpu_env, o->in1, o->in2);
+    tcg_gen_extr32_i64(o->out2, o->out, o->out);
     return DISAS_NEXT;
 }
 
-- 
2.34.1

Pack the quotient and remainder into a single Int128.
Use the divu128 primitive to remove the cpu_abort on
32-bit hosts.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Acked-by: Ilya Leoshkevich <iii@linux.ibm.com>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
v2: Extended div test case to cover these insns.
---
 target/s390x/helper.h         |  4 ++--
 target/s390x/tcg/int_helper.c | 38 +++++++++--------------------------
 target/s390x/tcg/translate.c  | 14 +++++++++----
 tests/tcg/s390x/div.c         | 35 ++++++++++++++++++++++++++++++++
 4 files changed, 56 insertions(+), 35 deletions(-)

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Acked-by: Ilya Leoshkevich <iii@linux.ibm.com>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 target/s390x/helper.h         |  2 +-
 target/s390x/tcg/mem_helper.c | 11 ++++-------
 target/s390x/tcg/translate.c  |  8 ++++++--
 3 files changed, 11 insertions(+), 10 deletions(-)

diff --git a/target/s390x/helper.h b/target/s390x/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/s390x/helper.h
+++ b/target/s390x/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_3(divs64, TCG_CALL_NO_WG, i128, env, s64, s64)
 DEF_HELPER_FLAGS_4(divu64, TCG_CALL_NO_WG, i128, env, i64, i64, i64)
 DEF_HELPER_3(srst, void, env, i32, i32)
 DEF_HELPER_3(srstu, void, env, i32, i32)
-DEF_HELPER_4(clst, i64, env, i64, i64, i64)
+DEF_HELPER_4(clst, i128, env, i64, i64, i64)
 DEF_HELPER_FLAGS_4(mvn, TCG_CALL_NO_WG, void, env, i32, i64, i64)
 DEF_HELPER_FLAGS_4(mvo, TCG_CALL_NO_WG, void, env, i32, i64, i64)
 DEF_HELPER_FLAGS_4(mvpg, TCG_CALL_NO_WG, i32, env, i64, i32, i32)
diff --git a/target/s390x/tcg/mem_helper.c b/target/s390x/tcg/mem_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/s390x/tcg/mem_helper.c
+++ b/target/s390x/tcg/mem_helper.c
@@ -XXX,XX +XXX,XX @@ void HELPER(srstu)(CPUS390XState *env, uint32_t r1, uint32_t r2)
 }
 
 /* unsigned string compare (c is string terminator) */
-uint64_t HELPER(clst)(CPUS390XState *env, uint64_t c, uint64_t s1, uint64_t s2)
+Int128 HELPER(clst)(CPUS390XState *env, uint64_t c, uint64_t s1, uint64_t s2)
 {
     uintptr_t ra = GETPC();
     uint32_t len;
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(clst)(CPUS390XState *env, uint64_t c, uint64_t s1, uint64_t s2)
             if (v1 == c) {
                 /* Equal.  CC=0, and don't advance the registers.  */
                 env->cc_op = 0;
-                env->retxl = s2;
-                return s1;
+                return int128_make128(s2, s1);
             }
         } else {
             /* Unequal.  CC={1,2}, and advance the registers.  Note that
                the terminator need not be zero, but the string that contains
                the terminator is by definition "low".  */
             env->cc_op = (v1 == c ? 1 : v2 == c ? 2 : v1 < v2 ? 1 : 2);
-            env->retxl = s2 + len;
-            return s1 + len;
+            return int128_make128(s2 + len, s1 + len);
         }
     }
 
     /* CPU-determined bytes equal; advance the registers.  */
     env->cc_op = 3;
-    env->retxl = s2 + len;
-    return s1 + len;
+    return int128_make128(s2 + len, s1 + len);
 }
 
 /* move page */
diff --git a/target/s390x/tcg/translate.c b/target/s390x/tcg/translate.c
index XXXXXXX..XXXXXXX 100644
--- a/target/s390x/tcg/translate.c
+++ b/target/s390x/tcg/translate.c
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_clm(DisasContext *s, DisasOps *o)
 
 static DisasJumpType op_clst(DisasContext *s, DisasOps *o)
 {
-    gen_helper_clst(o->in1, cpu_env, regs[0], o->in1, o->in2);
+    TCGv_i128 pair = tcg_temp_new_i128();
+
+    gen_helper_clst(pair, cpu_env, regs[0], o->in1, o->in2);
+    tcg_gen_extr_i128_i64(o->in2, o->in1, pair);
+    tcg_temp_free_i128(pair);
+
     set_cc_static(s);
-    return_low128(o->in2);
     return DISAS_NEXT;
 }
 
-- 
2.34.1

Acked-by: Ilya Leoshkevich <iii@linux.ibm.com>
Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 target/s390x/helper.h         | 2 +-
 target/s390x/tcg/mem_helper.c | 7 +++----
 target/s390x/tcg/translate.c  | 6 ++++--
 3 files changed, 8 insertions(+), 7 deletions(-)

Acked-by: Ilya Leoshkevich <iii@linux.ibm.com>
Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 target/s390x/helper.h         | 2 +-
 target/s390x/tcg/mem_helper.c | 7 +++----
 target/s390x/tcg/translate.c  | 7 +++++--
 3 files changed, 9 insertions(+), 7 deletions(-)

diff --git a/target/s390x/helper.h b/target/s390x/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/s390x/helper.h
+++ b/target/s390x/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_FLAGS_4(unpka, TCG_CALL_NO_WG, i32, env, i64, i32, i64)
 DEF_HELPER_FLAGS_4(unpku, TCG_CALL_NO_WG, i32, env, i64, i32, i64)
 DEF_HELPER_FLAGS_3(tp, TCG_CALL_NO_WG, i32, env, i64, i32)
 DEF_HELPER_FLAGS_4(tr, TCG_CALL_NO_WG, void, env, i32, i64, i64)
-DEF_HELPER_4(tre, i64, env, i64, i64, i64)
+DEF_HELPER_4(tre, i128, env, i64, i64, i64)
 DEF_HELPER_4(trt, i32, env, i32, i64, i64)
 DEF_HELPER_4(trtr, i32, env, i32, i64, i64)
 DEF_HELPER_5(trXX, i32, env, i32, i32, i32, i32)
diff --git a/target/s390x/tcg/mem_helper.c b/target/s390x/tcg/mem_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/s390x/tcg/mem_helper.c
+++ b/target/s390x/tcg/mem_helper.c
@@ -XXX,XX +XXX,XX @@ void HELPER(tr)(CPUS390XState *env, uint32_t len, uint64_t array,
     do_helper_tr(env, len, array, trans, GETPC());
 }
 
-uint64_t HELPER(tre)(CPUS390XState *env, uint64_t array,
-                     uint64_t len, uint64_t trans)
+Int128 HELPER(tre)(CPUS390XState *env, uint64_t array,
+                   uint64_t len, uint64_t trans)
 {
     uintptr_t ra = GETPC();
     uint8_t end = env->regs[0] & 0xff;
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(tre)(CPUS390XState *env, uint64_t array,
     }
 
     env->cc_op = cc;
-    env->retxl = len - i;
-    return array + i;
+    return int128_make128(len - i, array + i);
 }
 
 static inline uint32_t do_helper_trt(CPUS390XState *env, int len,
diff --git a/target/s390x/tcg/translate.c b/target/s390x/tcg/translate.c
index XXXXXXX..XXXXXXX 100644
--- a/target/s390x/tcg/translate.c
+++ b/target/s390x/tcg/translate.c
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_tr(DisasContext *s, DisasOps *o)
 
 static DisasJumpType op_tre(DisasContext *s, DisasOps *o)
 {
-    gen_helper_tre(o->out, cpu_env, o->out, o->out2, o->in2);
-    return_low128(o->out2);
+    TCGv_i128 pair = tcg_temp_new_i128();
+
+    gen_helper_tre(pair, cpu_env, o->out, o->out2, o->in2);
+    tcg_gen_extr_i128_i64(o->out2, o->out, pair);
+    tcg_temp_free_i128(pair);
     set_cc_static(s);
     return DISAS_NEXT;
 }
-- 
2.34.1

Make a copy of wout_x1 before modifying it, as wout_x1_P
emphasizing that it operates on the out/out2 pair.  The insns
that use x1_P are data movement that will not change to Int128.

Acked-by: Ilya Leoshkevich <iii@linux.ibm.com>
Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 target/s390x/tcg/insn-data.h.inc | 12 ++++++------
 target/s390x/tcg/translate.c     |  8 ++++++++
 2 files changed, 14 insertions(+), 6 deletions(-)

diff --git a/target/s390x/tcg/insn-data.h.inc b/target/s390x/tcg/insn-data.h.inc
index XXXXXXX..XXXXXXX 100644
--- a/target/s390x/tcg/insn-data.h.inc
+++ b/target/s390x/tcg/insn-data.h.inc
@@ -XXX,XX +XXX,XX @@
     F(0x3800, LER,     RR_a,  Z,   0, e2, 0, cond_e1e2, mov2, 0, IF_AFP1 | IF_AFP2)
     F(0x7800, LE,      RX_a,  Z,   0, m2_32u, 0, e1, mov2, 0, IF_AFP1)
     F(0xed64, LEY,     RXY_a, LD,  0, m2_32u, 0, e1, mov2, 0, IF_AFP1)
-    F(0xb365, LXR,     RRE,   Z,   x2h, x2l, 0, x1, movx, 0, IF_AFP1)
+    F(0xb365, LXR,     RRE,   Z,   x2h, x2l, 0, x1_P, movx, 0, IF_AFP1)
 /* LOAD IMMEDIATE */
     C(0xc001, LGFI,    RIL_a, EI,  0, i2, 0, r1, mov2, 0)
 /* LOAD RELATIVE LONG */
@@ -XXX,XX +XXX,XX @@
     C(0xe332, LTGF,    RXY_a, GIE, 0, a2, r1, 0, ld32s, s64)
     F(0xb302, LTEBR,   RRE,   Z,   0, e2, 0, cond_e1e2, mov2, f32, IF_BFP)
     F(0xb312, LTDBR,   RRE,   Z,   0, f2, 0, f1, mov2, f64, IF_BFP)
-    F(0xb342, LTXBR,   RRE,   Z,   x2h, x2l, 0, x1, movx, f128, IF_BFP)
+    F(0xb342, LTXBR,   RRE,   Z,   x2h, x2l, 0, x1_P, movx, f128, IF_BFP)
 /* LOAD AND TRAP */
     C(0xe39f, LAT,     RXY_a, LAT, 0, m2_32u, r1, 0, lat, 0)
     C(0xe385, LGAT,    RXY_a, LAT, 0, a2, r1, 0, lgat, 0)
@@ -XXX,XX +XXX,XX @@
     C(0xb913, LCGFR,   RRE,   Z,   0, r2_32s, r1, 0, neg, neg64)
     F(0xb303, LCEBR,   RRE,   Z,   0, e2, new, e1, negf32, f32, IF_BFP)
     F(0xb313, LCDBR,   RRE,   Z,   0, f2, new, f1, negf64, f64, IF_BFP)
-    F(0xb343, LCXBR,   RRE,   Z,   x2h, x2l, new_P, x1, negf128, f128, IF_BFP)
+    F(0xb343, LCXBR,   RRE,   Z,   x2h, x2l, new_P, x1_P, negf128, f128, IF_BFP)
     F(0xb373, LCDFR,   RRE,   FPSSH, 0, f2, new, f1, negf64, 0, IF_AFP1 | IF_AFP2)
 /* LOAD COUNT TO BLOCK BOUNDARY */
     C(0xe727, LCBB,    RXE,   V,   la2, 0, r1, 0, lcbb, 0)
@@ -XXX,XX +XXX,XX @@
     C(0xb911, LNGFR,   RRE,   Z,   0, r2_32s, r1, 0, nabs, nabs64)
     F(0xb301, LNEBR,   RRE,   Z,   0, e2, new, e1, nabsf32, f32, IF_BFP)
     F(0xb311, LNDBR,   RRE,   Z,   0, f2, new, f1, nabsf64, f64, IF_BFP)
-    F(0xb341, LNXBR,   RRE,   Z,   x2h, x2l, new_P, x1, nabsf128, f128, IF_BFP)
+    F(0xb341, LNXBR,   RRE,   Z,   x2h, x2l, new_P, x1_P, nabsf128, f128, IF_BFP)
     F(0xb371, LNDFR,   RRE,   FPSSH, 0, f2, new, f1, nabsf64, 0, IF_AFP1 | IF_AFP2)
 /* LOAD ON CONDITION */
     C(0xb9f2, LOCR,    RRF_c, LOC, r1, r2, new, r1_32, loc, 0)
@@ -XXX,XX +XXX,XX @@
     C(0xb910, LPGFR,   RRE,   Z,   0, r2_32s, r1, 0, abs, abs64)
     F(0xb300, LPEBR,   RRE,   Z,   0, e2, new, e1, absf32, f32, IF_BFP)
     F(0xb310, LPDBR,   RRE,   Z,   0, f2, new, f1, absf64, f64, IF_BFP)
-    F(0xb340, LPXBR,   RRE,   Z,   x2h, x2l, new_P, x1, absf128, f128, IF_BFP)
+    F(0xb340, LPXBR,   RRE,   Z,   x2h, x2l, new_P, x1_P, absf128, f128, IF_BFP)
     F(0xb370, LPDFR,   RRE,   FPSSH, 0, f2, new, f1, absf64, 0, IF_AFP1 | IF_AFP2)
 /* LOAD REVERSED */
     C(0xb91f, LRVR,    RRE,   Z,   0, r2_32u, new, r1_32, rev32, 0)
@@ -XXX,XX +XXX,XX @@
 /* LOAD ZERO */
     F(0xb374, LZER,    RRE,   Z,   0, 0, 0, e1, zero, 0, IF_AFP1)
     F(0xb375, LZDR,    RRE,   Z,   0, 0, 0, f1, zero, 0, IF_AFP1)
-    F(0xb376, LZXR,    RRE,   Z,   0, 0, 0, x1, zero2, 0, IF_AFP1)
+    F(0xb376, LZXR,    RRE,   Z,   0, 0, 0, x1_P, zero2, 0, IF_AFP1)
 
 /* LOAD FPC */
     F(0xb29d, LFPC,    S,     Z,   0, m2_32u, 0, 0, sfpc, 0, IF_BFP)
diff --git a/target/s390x/tcg/translate.c b/target/s390x/tcg/translate.c
index XXXXXXX..XXXXXXX 100644
--- a/target/s390x/tcg/translate.c
+++ b/target/s390x/tcg/translate.c
@@ -XXX,XX +XXX,XX @@ static void wout_x1(DisasContext *s, DisasOps *o)
 }
 #define SPEC_wout_x1 SPEC_r1_f128
 
+static void wout_x1_P(DisasContext *s, DisasOps *o)
+{
+    int f1 = get_field(s, r1);
+    store_freg(f1, o->out);
+    store_freg(f1 + 2, o->out2);
+}
+#define SPEC_wout_x1_P SPEC_r1_f128
+
 static void wout_cond_r1r2_32(DisasContext *s, DisasOps *o)
 {
     if (get_field(s, r1) != get_field(s, r2)) {
-- 
2.34.1

Acked-by: David Hildenbrand <david@redhat.com>
Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
v2: Remove extraneous return_low128.
---
 target/s390x/helper.h            | 22 +++++++-------
 target/s390x/tcg/insn-data.h.inc | 20 ++++++-------
 target/s390x/tcg/fpu_helper.c    | 29 +++++++++---------
 target/s390x/tcg/translate.c     | 51 +++++++++++++++++---------------
 4 files changed, 63 insertions(+), 59 deletions(-)

Acked-by: David Hildenbrand <david@redhat.com>
Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
v2: Fix SPEC_in1_x1.
---
 target/s390x/helper.h            | 32 ++++++------
 target/s390x/tcg/insn-data.h.inc | 30 +++++------
 target/s390x/tcg/fpu_helper.c    | 88 ++++++++++++++------------------
 target/s390x/tcg/translate.c     | 76 ++++++++++++++++++---------
 4 files changed, 121 insertions(+), 105 deletions(-)

diff --git a/target/s390x/helper.h b/target/s390x/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/s390x/helper.h
+++ b/target/s390x/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_4(csst, i32, env, i32, i64, i64)
 DEF_HELPER_4(csst_parallel, i32, env, i32, i64, i64)
 DEF_HELPER_FLAGS_3(aeb, TCG_CALL_NO_WG, i64, env, i64, i64)
 DEF_HELPER_FLAGS_3(adb, TCG_CALL_NO_WG, i64, env, i64, i64)
-DEF_HELPER_FLAGS_5(axb, TCG_CALL_NO_WG, i128, env, i64, i64, i64, i64)
+DEF_HELPER_FLAGS_3(axb, TCG_CALL_NO_WG, i128, env, i128, i128)
 DEF_HELPER_FLAGS_3(seb, TCG_CALL_NO_WG, i64, env, i64, i64)
 DEF_HELPER_FLAGS_3(sdb, TCG_CALL_NO_WG, i64, env, i64, i64)
-DEF_HELPER_FLAGS_5(sxb, TCG_CALL_NO_WG, i128, env, i64, i64, i64, i64)
+DEF_HELPER_FLAGS_3(sxb, TCG_CALL_NO_WG, i128, env, i128, i128)
 DEF_HELPER_FLAGS_3(deb, TCG_CALL_NO_WG, i64, env, i64, i64)
 DEF_HELPER_FLAGS_3(ddb, TCG_CALL_NO_WG, i64, env, i64, i64)
-DEF_HELPER_FLAGS_5(dxb, TCG_CALL_NO_WG, i128, env, i64, i64, i64, i64)
+DEF_HELPER_FLAGS_3(dxb, TCG_CALL_NO_WG, i128, env, i128, i128)
 DEF_HELPER_FLAGS_3(meeb, TCG_CALL_NO_WG, i64, env, i64, i64)
 DEF_HELPER_FLAGS_3(mdeb, TCG_CALL_NO_WG, i64, env, i64, i64)
 DEF_HELPER_FLAGS_3(mdb, TCG_CALL_NO_WG, i64, env, i64, i64)
-DEF_HELPER_FLAGS_5(mxb, TCG_CALL_NO_WG, i128, env, i64, i64, i64, i64)
-DEF_HELPER_FLAGS_4(mxdb, TCG_CALL_NO_WG, i128, env, i64, i64, i64)
+DEF_HELPER_FLAGS_3(mxb, TCG_CALL_NO_WG, i128, env, i128, i128)
+DEF_HELPER_FLAGS_3(mxdb, TCG_CALL_NO_WG, i128, env, i128, i64)
 DEF_HELPER_FLAGS_2(ldeb, TCG_CALL_NO_WG, i64, env, i64)
-DEF_HELPER_FLAGS_4(ldxb, TCG_CALL_NO_WG, i64, env, i64, i64, i32)
+DEF_HELPER_FLAGS_3(ldxb, TCG_CALL_NO_WG, i64, env, i128, i32)
 DEF_HELPER_FLAGS_2(lxdb, TCG_CALL_NO_WG, i128, env, i64)
 DEF_HELPER_FLAGS_2(lxeb, TCG_CALL_NO_WG, i128, env, i64)
 DEF_HELPER_FLAGS_3(ledb, TCG_CALL_NO_WG, i64, env, i64, i32)
-DEF_HELPER_FLAGS_4(lexb, TCG_CALL_NO_WG, i64, env, i64, i64, i32)
+DEF_HELPER_FLAGS_3(lexb, TCG_CALL_NO_WG, i64, env, i128, i32)
 DEF_HELPER_FLAGS_3(ceb, TCG_CALL_NO_WG_SE, i32, env, i64, i64)
 DEF_HELPER_FLAGS_3(cdb, TCG_CALL_NO_WG_SE, i32, env, i64, i64)
-DEF_HELPER_FLAGS_5(cxb, TCG_CALL_NO_WG_SE, i32, env, i64, i64, i64, i64)
+DEF_HELPER_FLAGS_3(cxb, TCG_CALL_NO_WG_SE, i32, env, i128, i128)
 DEF_HELPER_FLAGS_3(keb, TCG_CALL_NO_WG, i32, env, i64, i64)
 DEF_HELPER_FLAGS_3(kdb, TCG_CALL_NO_WG, i32, env, i64, i64)
-DEF_HELPER_FLAGS_5(kxb, TCG_CALL_NO_WG, i32, env, i64, i64, i64, i64)
+DEF_HELPER_FLAGS_3(kxb, TCG_CALL_NO_WG, i32, env, i128, i128)
 DEF_HELPER_3(cgeb, i64, env, i64, i32)
 DEF_HELPER_3(cgdb, i64, env, i64, i32)
-DEF_HELPER_4(cgxb, i64, env, i64, i64, i32)
+DEF_HELPER_3(cgxb, i64, env, i128, i32)
 DEF_HELPER_3(cfeb, i64, env, i64, i32)
 DEF_HELPER_3(cfdb, i64, env, i64, i32)
-DEF_HELPER_4(cfxb, i64, env, i64, i64, i32)
+DEF_HELPER_3(cfxb, i64, env, i128, i32)
 DEF_HELPER_3(clgeb, i64, env, i64, i32)
 DEF_HELPER_3(clgdb, i64, env, i64, i32)
-DEF_HELPER_4(clgxb, i64, env, i64, i64, i32)
+DEF_HELPER_3(clgxb, i64, env, i128, i32)
 DEF_HELPER_3(clfeb, i64, env, i64, i32)
 DEF_HELPER_3(clfdb, i64, env, i64, i32)
-DEF_HELPER_4(clfxb, i64, env, i64, i64, i32)
+DEF_HELPER_3(clfxb, i64, env, i128, i32)
 DEF_HELPER_FLAGS_3(fieb, TCG_CALL_NO_WG, i64, env, i64, i32)
 DEF_HELPER_FLAGS_3(fidb, TCG_CALL_NO_WG, i64, env, i64, i32)
-DEF_HELPER_FLAGS_4(fixb, TCG_CALL_NO_WG, i128, env, i64, i64, i32)
+DEF_HELPER_FLAGS_3(fixb, TCG_CALL_NO_WG, i128, env, i128, i32)
 DEF_HELPER_FLAGS_4(maeb, TCG_CALL_NO_WG, i64, env, i64, i64, i64)
 DEF_HELPER_FLAGS_4(madb, TCG_CALL_NO_WG, i64, env, i64, i64, i64)
 DEF_HELPER_FLAGS_4(mseb, TCG_CALL_NO_WG, i64, env, i64, i64, i64)
 DEF_HELPER_FLAGS_4(msdb, TCG_CALL_NO_WG, i64, env, i64, i64, i64)
 DEF_HELPER_FLAGS_3(tceb, TCG_CALL_NO_RWG_SE, i32, env, i64, i64)
 DEF_HELPER_FLAGS_3(tcdb, TCG_CALL_NO_RWG_SE, i32, env, i64, i64)
-DEF_HELPER_FLAGS_4(tcxb, TCG_CALL_NO_RWG_SE, i32, env, i64, i64, i64)
+DEF_HELPER_FLAGS_3(tcxb, TCG_CALL_NO_RWG_SE, i32, env, i128, i64)
 DEF_HELPER_FLAGS_2(sqeb, TCG_CALL_NO_WG, i64, env, i64)
 DEF_HELPER_FLAGS_2(sqdb, TCG_CALL_NO_WG, i64, env, i64)
-DEF_HELPER_FLAGS_3(sqxb, TCG_CALL_NO_WG, i128, env, i64, i64)
+DEF_HELPER_FLAGS_2(sqxb, TCG_CALL_NO_WG, i128, env, i128)
 DEF_HELPER_FLAGS_1(cvd, TCG_CALL_NO_RWG_SE, i64, s32)
 DEF_HELPER_FLAGS_4(pack, TCG_CALL_NO_WG, void, env, i32, i64, i64)
 DEF_HELPER_FLAGS_4(pka, TCG_CALL_NO_WG, void, env, i64, i64, i32)
diff --git a/target/s390x/tcg/insn-data.h.inc b/target/s390x/tcg/insn-data.h.inc
index XXXXXXX..XXXXXXX 100644
--- a/target/s390x/tcg/insn-data.h.inc
+++ b/target/s390x/tcg/insn-data.h.inc
@@ -XXX,XX +XXX,XX @@
     C(0xe318, AGF,     RXY_a, Z,   r1, m2_32s, r1, 0, add, adds64)
     F(0xb30a, AEBR,    RRE,   Z,   e1, e2, new, e1, aeb, f32, IF_BFP)
     F(0xb31a, ADBR,    RRE,   Z,   f1, f2, new, f1, adb, f64, IF_BFP)
-    F(0xb34a, AXBR,    RRE,   Z,   x2h, x2l, x1, x1, axb, f128, IF_BFP)
+    F(0xb34a, AXBR,    RRE,   Z,   x1, x2, new_x, x1, axb, f128, IF_BFP)
     F(0xed0a, AEB,     RXE,   Z,   e1, m2_32u, new, e1, aeb, f32, IF_BFP)
     F(0xed1a, ADB,     RXE,   Z,   f1, m2_64, new, f1, adb, f64, IF_BFP)
 /* ADD HIGH */
@@ -XXX,XX +XXX,XX @@
     C(0xe330, CGF,     RXY_a, Z,   r1_o, m2_32s, 0, 0, 0, cmps64)
     F(0xb309, CEBR,    RRE,   Z,   e1, e2, 0, 0, ceb, 0, IF_BFP)
     F(0xb319, CDBR,    RRE,   Z,   f1, f2, 0, 0, cdb, 0, IF_BFP)
-    F(0xb349, CXBR,    RRE,   Z,   x2h, x2l, x1, 0, cxb, 0, IF_BFP)
+    F(0xb349, CXBR,    RRE,   Z,   x1, x2, 0, 0, cxb, 0, IF_BFP)
     F(0xed09, CEB,     RXE,   Z,   e1, m2_32u, 0, 0, ceb, 0, IF_BFP)
     F(0xed19, CDB,     RXE,   Z,   f1, m2_64, 0, 0, cdb, 0, IF_BFP)
 /* COMPARE AND SIGNAL */
     F(0xb308, KEBR,    RRE,   Z,   e1, e2, 0, 0, keb, 0, IF_BFP)
     F(0xb318, KDBR,    RRE,   Z,   f1, f2, 0, 0, kdb, 0, IF_BFP)
-    F(0xb348, KXBR,    RRE,   Z,   x2h, x2l, x1, 0, kxb, 0, IF_BFP)
+    F(0xb348, KXBR,    RRE,   Z,   x1, x2, 0, 0, kxb, 0, IF_BFP)
     F(0xed08, KEB,     RXE,   Z,   e1, m2_32u, 0, 0, keb, 0, IF_BFP)
     F(0xed18, KDB,     RXE,   Z,   f1, m2_64, 0, 0, kdb, 0, IF_BFP)
 /* COMPARE IMMEDIATE */
@@ -XXX,XX +XXX,XX @@
 /* CONVERT TO FIXED */
     F(0xb398, CFEBR,   RRF_e, Z,   0, e2, new, r1_32, cfeb, 0, IF_BFP)
     F(0xb399, CFDBR,   RRF_e, Z,   0, f2, new, r1_32, cfdb, 0, IF_BFP)
-    F(0xb39a, CFXBR,   RRF_e, Z,   x2h, x2l, new, r1_32, cfxb, 0, IF_BFP)
+    F(0xb39a, CFXBR,   RRF_e, Z,   0, x2, new, r1_32, cfxb, 0, IF_BFP)
     F(0xb3a8, CGEBR,   RRF_e, Z,   0, e2, r1, 0, cgeb, 0, IF_BFP)
     F(0xb3a9, CGDBR,   RRF_e, Z,   0, f2, r1, 0, cgdb, 0, IF_BFP)
-    F(0xb3aa, CGXBR,   RRF_e, Z,   x2h, x2l, r1, 0, cgxb, 0, IF_BFP)
+    F(0xb3aa, CGXBR,   RRF_e, Z,   0, x2, r1, 0, cgxb, 0, IF_BFP)
 /* CONVERT FROM FIXED */
     F(0xb394, CEFBR,   RRF_e, Z,   0, r2_32s, new, e1, cegb, 0, IF_BFP)
     F(0xb395, CDFBR,   RRF_e, Z,   0, r2_32s, new, f1, cdgb, 0, IF_BFP)
@@ -XXX,XX +XXX,XX @@
 /* CONVERT TO LOGICAL */
     F(0xb39c, CLFEBR,  RRF_e, FPE, 0, e2, new, r1_32, clfeb, 0, IF_BFP)
     F(0xb39d, CLFDBR,  RRF_e, FPE, 0, f2, new, r1_32, clfdb, 0, IF_BFP)
-    F(0xb39e, CLFXBR,  RRF_e, FPE, x2h, x2l, new, r1_32, clfxb, 0, IF_BFP)
+    F(0xb39e, CLFXBR,  RRF_e, FPE, 0, x2, new, r1_32, clfxb, 0, IF_BFP)
     F(0xb3ac, CLGEBR,  RRF_e, FPE, 0, e2, r1, 0, clgeb, 0, IF_BFP)
     F(0xb3ad, CLGDBR,  RRF_e, FPE, 0, f2, r1, 0, clgdb, 0, IF_BFP)
-    F(0xb3ae, CLGXBR,  RRF_e, FPE, x2h, x2l, r1, 0, clgxb, 0, IF_BFP)
+    F(0xb3ae, CLGXBR,  RRF_e, FPE, 0, x2, r1, 0, clgxb, 0, IF_BFP)
 /* CONVERT FROM LOGICAL */
     F(0xb390, CELFBR,  RRF_e, FPE, 0, r2_32u, new, e1, celgb, 0, IF_BFP)
     F(0xb391, CDLFBR,  RRF_e, FPE, 0, r2_32u, new, f1, cdlgb, 0, IF_BFP)
@@ -XXX,XX +XXX,XX @@
     C(0x5d00, D,       RX_a,  Z,   r1_D32, m2_32s, new_P, r1_P32, divs32, 0)
     F(0xb30d, DEBR,    RRE,   Z,   e1, e2, new, e1, deb, 0, IF_BFP)
     F(0xb31d, DDBR,    RRE,   Z,   f1, f2, new, f1, ddb, 0, IF_BFP)
-    F(0xb34d, DXBR,    RRE,   Z,   x2h, x2l, x1, x1, dxb, 0, IF_BFP)
+    F(0xb34d, DXBR,    RRE,   Z,   x1, x2, new_x, x1, dxb, 0, IF_BFP)
     F(0xed0d, DEB,     RXE,   Z,   e1, m2_32u, new, e1, deb, 0, IF_BFP)
     F(0xed1d, DDB,     RXE,   Z,   f1, m2_64, new, f1, ddb, 0, IF_BFP)
 /* DIVIDE LOGICAL */
@@ -XXX,XX +XXX,XX @@
 /* LOAD FP INTEGER */
     F(0xb357, FIEBR,   RRF_e, Z,   0, e2, new, e1, fieb, 0, IF_BFP)
     F(0xb35f, FIDBR,   RRF_e, Z,   0, f2, new, f1, fidb, 0, IF_BFP)
-    F(0xb347, FIXBR,   RRF_e, Z,   x2h, x2l, new_x, x1, fixb, 0, IF_BFP)
+    F(0xb347, FIXBR,   RRF_e, Z,   0, x2, new_x, x1, fixb, 0, IF_BFP)
 
 /* LOAD LENGTHENED */
     F(0xb304, LDEBR,   RRE,   Z,   0, e2, new, f1, ldeb, 0, IF_BFP)
@@ -XXX,XX +XXX,XX @@
     F(0xed24, LDE,     RXE,   Z,   0, m2_32u, new, f1, lde, 0, IF_AFP1)
 /* LOAD ROUNDED */
     F(0xb344, LEDBR,   RRF_e, Z,   0, f2, new, e1, ledb, 0, IF_BFP)
-    F(0xb345, LDXBR,   RRF_e, Z,   x2h, x2l, new, f1, ldxb, 0, IF_BFP)
-    F(0xb346, LEXBR,   RRF_e, Z,   x2h, x2l, new, e1, lexb, 0, IF_BFP)
+    F(0xb345, LDXBR,   RRF_e, Z,   0, x2, new, f1, ldxb, 0, IF_BFP)
+    F(0xb346, LEXBR,   RRF_e, Z,   0, x2, new, e1, lexb, 0, IF_BFP)
 
 /* LOAD MULTIPLE */
     C(0x9800, LM,      RS_a,  Z,   0, a2, 0, 0, lm32, 0)
@@ -XXX,XX +XXX,XX @@
     C(0xe384, MG,      RXY_a, MIE2,r1p1_o, m2_64, r1_P, 0, muls128, 0)
     F(0xb317, MEEBR,   RRE,   Z,   e1, e2, new, e1, meeb, 0, IF_BFP)
     F(0xb31c, MDBR,    RRE,   Z,   f1, f2, new, f1, mdb, 0, IF_BFP)
-    F(0xb34c, MXBR,    RRE,   Z,   x2h, x2l, x1, x1, mxb, 0, IF_BFP)
+    F(0xb34c, MXBR,    RRE,   Z,   x1, x2, new_x, x1, mxb, 0, IF_BFP)
     F(0xb30c, MDEBR,   RRE,   Z,   f1, e2, new, f1, mdeb, 0, IF_BFP)
     F(0xb307, MXDBR,   RRE,   Z,   0, f2, x1, x1, mxdb, 0, IF_BFP)
     F(0xed17, MEEB,    RXE,   Z,   e1, m2_32u, new, e1, meeb, 0, IF_BFP)
@@ -XXX,XX +XXX,XX @@
 /* SQUARE ROOT */
     F(0xb314, SQEBR,   RRE,   Z,   0, e2, new, e1, sqeb, 0, IF_BFP)
     F(0xb315, SQDBR,   RRE,   Z,   0, f2, new, f1, sqdb, 0, IF_BFP)
-    F(0xb316, SQXBR,   RRE,   Z,   x2h, x2l, new_x, x1, sqxb, 0, IF_BFP)
+    F(0xb316, SQXBR,   RRE,   Z,   0, x2, new_x, x1, sqxb, 0, IF_BFP)
     F(0xed14, SQEB,    RXE,   Z,   0, m2_32u, new, e1, sqeb, 0, IF_BFP)
     F(0xed15, SQDB,    RXE,   Z,   0, m2_64, new, f1, sqdb, 0, IF_BFP)
 
@@ -XXX,XX +XXX,XX @@
     C(0xe319, SGF,     RXY_a, Z,   r1, m2_32s, r1, 0, sub, subs64)
     F(0xb30b, SEBR,    RRE,   Z,   e1, e2, new, e1, seb, f32, IF_BFP)
     F(0xb31b, SDBR,    RRE,   Z,   f1, f2, new, f1, sdb, f64, IF_BFP)
-    F(0xb34b, SXBR,    RRE,   Z,   x2h, x2l, x1, x1, sxb, f128, IF_BFP)
+    F(0xb34b, SXBR,    RRE,   Z,   x1, x2, new_x, x1, sxb, f128, IF_BFP)
     F(0xed0b, SEB,     RXE,   Z,   e1, m2_32u, new, e1, seb, f32, IF_BFP)
     F(0xed1b, SDB,     RXE,   Z,   f1, m2_64, new, f1, sdb, f64, IF_BFP)
 /* SUBTRACT HALFWORD */
@@ -XXX,XX +XXX,XX @@
 /* TEST DATA CLASS */
     F(0xed10, TCEB,    RXE,   Z,   e1, a2, 0, 0, tceb, 0, IF_BFP)
     F(0xed11, TCDB,    RXE,   Z,   f1, a2, 0, 0, tcdb, 0, IF_BFP)
-    F(0xed12, TCXB,    RXE,   Z,   0, a2, x1, 0, tcxb, 0, IF_BFP)
+    F(0xed12, TCXB,    RXE,   Z,   x1, a2, 0, 0, tcxb, 0, IF_BFP)
 
 /* TEST DECIMAL */
     C(0xebc0, TP,      RSL,   E2,  la1, 0, 0, 0, tp, 0)
diff --git a/target/s390x/tcg/fpu_helper.c b/target/s390x/tcg/fpu_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/s390x/tcg/fpu_helper.c
+++ b/target/s390x/tcg/fpu_helper.c
@@ -XXX,XX +XXX,XX @@ static inline Int128 RET128(float128 f)
     return int128_make128(f.low, f.high);
 }
 
+static inline float128 ARG128(Int128 i)
+{
+    return make_float128(int128_gethi(i), int128_getlo(i));
+}
+
 uint8_t s390_softfloat_exc_to_ieee(unsigned int exc)
 {
     uint8_t s390_exc = 0;
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(adb)(CPUS390XState *env, uint64_t f1, uint64_t f2)
 }
 
 /* 128-bit FP addition */
-Int128 HELPER(axb)(CPUS390XState *env, uint64_t ah, uint64_t al,
-                     uint64_t bh, uint64_t bl)
+Int128 HELPER(axb)(CPUS390XState *env, Int128 a, Int128 b)
 {
-    float128 ret = float128_add(make_float128(ah, al),
-                                make_float128(bh, bl),
-                                &env->fpu_status);
+    float128 ret = float128_add(ARG128(a), ARG128(b), &env->fpu_status);
     handle_exceptions(env, false, GETPC());
     return RET128(ret);
 }
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(sdb)(CPUS390XState *env, uint64_t f1, uint64_t f2)
 }
 
 /* 128-bit FP subtraction */
-Int128 HELPER(sxb)(CPUS390XState *env, uint64_t ah, uint64_t al,
-                     uint64_t bh, uint64_t bl)
+Int128 HELPER(sxb)(CPUS390XState *env, Int128 a, Int128 b)
 {
-    float128 ret = float128_sub(make_float128(ah, al),
-                                make_float128(bh, bl),
-                                &env->fpu_status);
+    float128 ret = float128_sub(ARG128(a), ARG128(b), &env->fpu_status);
     handle_exceptions(env, false, GETPC());
     return RET128(ret);
 }
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(ddb)(CPUS390XState *env, uint64_t f1, uint64_t f2)
 }
 
 /* 128-bit FP division */
-Int128 HELPER(dxb)(CPUS390XState *env, uint64_t ah, uint64_t al,
-                     uint64_t bh, uint64_t bl)
+Int128 HELPER(dxb)(CPUS390XState *env, Int128 a, Int128 b)
 {
-    float128 ret = float128_div(make_float128(ah, al),
-                                make_float128(bh, bl),
-                                &env->fpu_status);
+    float128 ret = float128_div(ARG128(a), ARG128(b), &env->fpu_status);
     handle_exceptions(env, false, GETPC());
     return RET128(ret);
 }
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(mdeb)(CPUS390XState *env, uint64_t f1, uint64_t f2)
 }
 
 /* 128-bit FP multiplication */
-Int128 HELPER(mxb)(CPUS390XState *env, uint64_t ah, uint64_t al,
-                     uint64_t bh, uint64_t bl)
+Int128 HELPER(mxb)(CPUS390XState *env, Int128 a, Int128 b)
 {
-    float128 ret = float128_mul(make_float128(ah, al),
-                                make_float128(bh, bl),
-                                &env->fpu_status);
+    float128 ret = float128_mul(ARG128(a), ARG128(b), &env->fpu_status);
     handle_exceptions(env, false, GETPC());
     return RET128(ret);
 }
 
 /* 128/64-bit FP multiplication */
-Int128 HELPER(mxdb)(CPUS390XState *env, uint64_t ah, uint64_t al, uint64_t f2)
+Int128 HELPER(mxdb)(CPUS390XState *env, Int128 a, uint64_t f2)
 {
     float128 ret = float64_to_float128(f2, &env->fpu_status);
-    ret = float128_mul(make_float128(ah, al), ret, &env->fpu_status);
+    ret = float128_mul(ARG128(a), ret, &env->fpu_status);
     handle_exceptions(env, false, GETPC());
     return RET128(ret);
 }
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(ldeb)(CPUS390XState *env, uint64_t f2)
 }
 
 /* convert 128-bit float to 64-bit float */
-uint64_t HELPER(ldxb)(CPUS390XState *env, uint64_t ah, uint64_t al,
-                      uint32_t m34)
+uint64_t HELPER(ldxb)(CPUS390XState *env, Int128 a, uint32_t m34)
 {
     int old_mode = s390_swap_bfp_rounding_mode(env, round_from_m34(m34));
-    float64 ret = float128_to_float64(make_float128(ah, al), &env->fpu_status);
+    float64 ret = float128_to_float64(ARG128(a), &env->fpu_status);
 
     s390_restore_bfp_rounding_mode(env, old_mode);
     handle_exceptions(env, xxc_from_m34(m34), GETPC());
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(ledb)(CPUS390XState *env, uint64_t f2, uint32_t m34)
 }
 
 /* convert 128-bit float to 32-bit float */
-uint64_t HELPER(lexb)(CPUS390XState *env, uint64_t ah, uint64_t al,
-                      uint32_t m34)
+uint64_t HELPER(lexb)(CPUS390XState *env, Int128 a, uint32_t m34)
 {
     int old_mode = s390_swap_bfp_rounding_mode(env, round_from_m34(m34));
-    float32 ret = float128_to_float32(make_float128(ah, al), &env->fpu_status);
+    float32 ret = float128_to_float32(ARG128(a), &env->fpu_status);
 
     s390_restore_bfp_rounding_mode(env, old_mode);
     handle_exceptions(env, xxc_from_m34(m34), GETPC());
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(cdb)(CPUS390XState *env, uint64_t f1, uint64_t f2)
 }
 
 /* 128-bit FP compare */
-uint32_t HELPER(cxb)(CPUS390XState *env, uint64_t ah, uint64_t al,
-                     uint64_t bh, uint64_t bl)
+uint32_t HELPER(cxb)(CPUS390XState *env, Int128 a, Int128 b)
 {
-    FloatRelation cmp = float128_compare_quiet(make_float128(ah, al),
-                                               make_float128(bh, bl),
+    FloatRelation cmp = float128_compare_quiet(ARG128(a), ARG128(b),
                                                &env->fpu_status);
     handle_exceptions(env, false, GETPC());
     return float_comp_to_cc(env, cmp);
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(cgdb)(CPUS390XState *env, uint64_t v2, uint32_t m34)
 }
 
 /* convert 128-bit float to 64-bit int */
-uint64_t HELPER(cgxb)(CPUS390XState *env, uint64_t h, uint64_t l, uint32_t m34)
+uint64_t HELPER(cgxb)(CPUS390XState *env, Int128 i2, uint32_t m34)
 {
     int old_mode = s390_swap_bfp_rounding_mode(env, round_from_m34(m34));
-    float128 v2 = make_float128(h, l);
+    float128 v2 = ARG128(i2);
     int64_t ret = float128_to_int64(v2, &env->fpu_status);
     uint32_t cc = set_cc_conv_f128(v2, &env->fpu_status);
 
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(cfdb)(CPUS390XState *env, uint64_t v2, uint32_t m34)
 }
 
 /* convert 128-bit float to 32-bit int */
-uint64_t HELPER(cfxb)(CPUS390XState *env, uint64_t h, uint64_t l, uint32_t m34)
+uint64_t HELPER(cfxb)(CPUS390XState *env, Int128 i2, uint32_t m34)
 {
     int old_mode = s390_swap_bfp_rounding_mode(env, round_from_m34(m34));
-    float128 v2 = make_float128(h, l);
+    float128 v2 = ARG128(i2);
     int32_t ret = float128_to_int32(v2, &env->fpu_status);
     uint32_t cc = set_cc_conv_f128(v2, &env->fpu_status);
 
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(clgdb)(CPUS390XState *env, uint64_t v2, uint32_t m34)
 }
 
 /* convert 128-bit float to 64-bit uint */
-uint64_t HELPER(clgxb)(CPUS390XState *env, uint64_t h, uint64_t l, uint32_t m34)
+uint64_t HELPER(clgxb)(CPUS390XState *env, Int128 i2, uint32_t m34)
 {
     int old_mode = s390_swap_bfp_rounding_mode(env, round_from_m34(m34));
-    float128 v2 = make_float128(h, l);
+    float128 v2 = ARG128(i2);
     uint64_t ret = float128_to_uint64(v2, &env->fpu_status);
     uint32_t cc = set_cc_conv_f128(v2, &env->fpu_status);
 
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(clfdb)(CPUS390XState *env, uint64_t v2, uint32_t m34)
 }
 
 /* convert 128-bit float to 32-bit uint */
-uint64_t HELPER(clfxb)(CPUS390XState *env, uint64_t h, uint64_t l, uint32_t m34)
+uint64_t HELPER(clfxb)(CPUS390XState *env, Int128 i2, uint32_t m34)
 {
     int old_mode = s390_swap_bfp_rounding_mode(env, round_from_m34(m34));
-    float128 v2 = make_float128(h, l);
+    float128 v2 = ARG128(i2);
     uint32_t ret = float128_to_uint32(v2, &env->fpu_status);
     uint32_t cc = set_cc_conv_f128(v2, &env->fpu_status);
 
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(fidb)(CPUS390XState *env, uint64_t f2, uint32_t m34)
 }
 
 /* round to integer 128-bit */
-Int128 HELPER(fixb)(CPUS390XState *env, uint64_t ah, uint64_t al, uint32_t m34)
+Int128 HELPER(fixb)(CPUS390XState *env, Int128 a, uint32_t m34)
 {
     int old_mode = s390_swap_bfp_rounding_mode(env, round_from_m34(m34));
-    float128 ret = float128_round_to_int(make_float128(ah, al),
-                                         &env->fpu_status);
+    float128 ret = float128_round_to_int(ARG128(a), &env->fpu_status);
 
     s390_restore_bfp_rounding_mode(env, old_mode);
     handle_exceptions(env, xxc_from_m34(m34), GETPC());
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(kdb)(CPUS390XState *env, uint64_t f1, uint64_t f2)
 }
 
 /* 128-bit FP compare and signal */
-uint32_t HELPER(kxb)(CPUS390XState *env, uint64_t ah, uint64_t al,
-                     uint64_t bh, uint64_t bl)
+uint32_t HELPER(kxb)(CPUS390XState *env, Int128 a, Int128 b)
 {
-    FloatRelation cmp = float128_compare(make_float128(ah, al),
-                                         make_float128(bh, bl),
+    FloatRelation cmp = float128_compare(ARG128(a), ARG128(b),
                                          &env->fpu_status);
     handle_exceptions(env, false, GETPC());
     return float_comp_to_cc(env, cmp);
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(tcdb)(CPUS390XState *env, uint64_t v1, uint64_t m2)
 }
 
 /* test data class 128-bit */
-uint32_t HELPER(tcxb)(CPUS390XState *env, uint64_t ah, uint64_t al, uint64_t m2)
+uint32_t HELPER(tcxb)(CPUS390XState *env, Int128 a, uint64_t m2)
 {
-    return (m2 & float128_dcmask(env, make_float128(ah, al))) != 0;
+    return (m2 & float128_dcmask(env, ARG128(a))) != 0;
 }
 
 /* square root 32-bit */
@@ -XXX,XX +XXX,XX @@ uint64_t HELPER(sqdb)(CPUS390XState *env, uint64_t f2)
 }
 
 /* square root 128-bit */
-Int128 HELPER(sqxb)(CPUS390XState *env, uint64_t ah, uint64_t al)
+Int128 HELPER(sqxb)(CPUS390XState *env, Int128 a)
 {
-    float128 ret = float128_sqrt(make_float128(ah, al), &env->fpu_status);
+    float128 ret = float128_sqrt(ARG128(a), &env->fpu_status);
     handle_exceptions(env, false, GETPC());
     return RET128(ret);
 }
diff --git a/target/s390x/tcg/translate.c b/target/s390x/tcg/translate.c
index XXXXXXX..XXXXXXX 100644
--- a/target/s390x/tcg/translate.c
+++ b/target/s390x/tcg/translate.c
@@ -XXX,XX +XXX,XX @@ static TCGv_i64 load_freg32_i64(int reg)
     return r;
 }
 
+static TCGv_i128 load_freg_128(int reg)
+{
+    TCGv_i64 h = load_freg(reg);
+    TCGv_i64 l = load_freg(reg + 2);
+    TCGv_i128 r = tcg_temp_new_i128();
+
+    tcg_gen_concat_i64_i128(r, l, h);
+    tcg_temp_free_i64(h);
+    tcg_temp_free_i64(l);
+    return r;
+}
+
 static void store_reg(int reg, TCGv_i64 v)
 {
     tcg_gen_mov_i64(regs[reg], v);
@@ -XXX,XX +XXX,XX @@ typedef struct {
     bool g_out, g_out2, g_in1, g_in2;
     TCGv_i64 out, out2, in1, in2;
     TCGv_i64 addr1;
-    TCGv_i128 out_128;
+    TCGv_i128 out_128, in1_128, in2_128;
 } DisasOps;
 
 /* Instructions can place constraints on their operands, raising specification
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_adb(DisasContext *s, DisasOps *o)
 
 static DisasJumpType op_axb(DisasContext *s, DisasOps *o)
 {
-    gen_helper_axb(o->out_128, cpu_env, o->out, o->out2, o->in1, o->in2);
+    gen_helper_axb(o->out_128, cpu_env, o->in1_128, o->in2_128);
     return DISAS_NEXT;
 }
 
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_cdb(DisasContext *s, DisasOps *o)
 
 static DisasJumpType op_cxb(DisasContext *s, DisasOps *o)
 {
-    gen_helper_cxb(cc_op, cpu_env, o->out, o->out2, o->in1, o->in2);
+    gen_helper_cxb(cc_op, cpu_env, o->in1_128, o->in2_128);
     set_cc_static(s);
     return DISAS_NEXT;
 }
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_cfxb(DisasContext *s, DisasOps *o)
     if (!m34) {
         return DISAS_NORETURN;
     }
-    gen_helper_cfxb(o->out, cpu_env, o->in1, o->in2, m34);
+    gen_helper_cfxb(o->out, cpu_env, o->in2_128, m34);
     tcg_temp_free_i32(m34);
     set_cc_static(s);
     return DISAS_NEXT;
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_cgxb(DisasContext *s, DisasOps *o)
     if (!m34) {
         return DISAS_NORETURN;
     }
-    gen_helper_cgxb(o->out, cpu_env, o->in1, o->in2, m34);
+    gen_helper_cgxb(o->out, cpu_env, o->in2_128, m34);
     tcg_temp_free_i32(m34);
     set_cc_static(s);
     return DISAS_NEXT;
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_clfxb(DisasContext *s, DisasOps *o)
     if (!m34) {
         return DISAS_NORETURN;
     }
-    gen_helper_clfxb(o->out, cpu_env, o->in1, o->in2, m34);
+    gen_helper_clfxb(o->out, cpu_env, o->in2_128, m34);
     tcg_temp_free_i32(m34);
     set_cc_static(s);
     return DISAS_NEXT;
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_clgxb(DisasContext *s, DisasOps *o)
     if (!m34) {
         return DISAS_NORETURN;
     }
-    gen_helper_clgxb(o->out, cpu_env, o->in1, o->in2, m34);
+    gen_helper_clgxb(o->out, cpu_env, o->in2_128, m34);
     tcg_temp_free_i32(m34);
     set_cc_static(s);
     return DISAS_NEXT;
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_ddb(DisasContext *s, DisasOps *o)
 
 static DisasJumpType op_dxb(DisasContext *s, DisasOps *o)
 {
-    gen_helper_dxb(o->out_128, cpu_env, o->out, o->out2, o->in1, o->in2);
+    gen_helper_dxb(o->out_128, cpu_env, o->in1_128, o->in2_128);
     return DISAS_NEXT;
 }
 
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_fixb(DisasContext *s, DisasOps *o)
     if (!m34) {
         return DISAS_NORETURN;
     }
-    gen_helper_fixb(o->out_128, cpu_env, o->in1, o->in2, m34);
+    gen_helper_fixb(o->out_128, cpu_env, o->in2_128, m34);
     tcg_temp_free_i32(m34);
     return DISAS_NEXT;
 }
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_kdb(DisasContext *s, DisasOps *o)
 
 static DisasJumpType op_kxb(DisasContext *s, DisasOps *o)
 {
-    gen_helper_kxb(cc_op, cpu_env, o->out, o->out2, o->in1, o->in2);
+    gen_helper_kxb(cc_op, cpu_env, o->in1_128, o->in2_128);
     set_cc_static(s);
     return DISAS_NEXT;
 }
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_ldxb(DisasContext *s, DisasOps *o)
     if (!m34) {
         return DISAS_NORETURN;
     }
-    gen_helper_ldxb(o->out, cpu_env, o->in1, o->in2, m34);
+    gen_helper_ldxb(o->out, cpu_env, o->in2_128, m34);
     tcg_temp_free_i32(m34);
     return DISAS_NEXT;
 }
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_lexb(DisasContext *s, DisasOps *o)
     if (!m34) {
         return DISAS_NORETURN;
     }
-    gen_helper_lexb(o->out, cpu_env, o->in1, o->in2, m34);
+    gen_helper_lexb(o->out, cpu_env, o->in2_128, m34);
     tcg_temp_free_i32(m34);
     return DISAS_NEXT;
 }
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_mdb(DisasContext *s, DisasOps *o)
 
 static DisasJumpType op_mxb(DisasContext *s, DisasOps *o)
 {
-    gen_helper_mxb(o->out_128, cpu_env, o->out, o->out2, o->in1, o->in2);
+    gen_helper_mxb(o->out_128, cpu_env, o->in1_128, o->in2_128);
     return DISAS_NEXT;
 }
 
 static DisasJumpType op_mxdb(DisasContext *s, DisasOps *o)
 {
-    gen_helper_mxdb(o->out_128, cpu_env, o->out, o->out2, o->in2);
+    gen_helper_mxdb(o->out_128, cpu_env, o->in1_128, o->in2);
     return DISAS_NEXT;
 }
 
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_sdb(DisasContext *s, DisasOps *o)
 
 static DisasJumpType op_sxb(DisasContext *s, DisasOps *o)
 {
-    gen_helper_sxb(o->out_128, cpu_env, o->out, o->out2, o->in1, o->in2);
+    gen_helper_sxb(o->out_128, cpu_env, o->in1_128, o->in2_128);
     return DISAS_NEXT;
 }
 
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_sqdb(DisasContext *s, DisasOps *o)
 
 static DisasJumpType op_sqxb(DisasContext *s, DisasOps *o)
 {
-    gen_helper_sqxb(o->out_128, cpu_env, o->in1, o->in2);
+    gen_helper_sqxb(o->out_128, cpu_env, o->in2_128);
     return DISAS_NEXT;
 }
 
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_tcdb(DisasContext *s, DisasOps *o)
 
 static DisasJumpType op_tcxb(DisasContext *s, DisasOps *o)
 {
-    gen_helper_tcxb(cc_op, cpu_env, o->out, o->out2, o->in2);
+    gen_helper_tcxb(cc_op, cpu_env, o->in1_128, o->in2);
     set_cc_static(s);
     return DISAS_NEXT;
 }
@@ -XXX,XX +XXX,XX @@ static void prep_new_P(DisasContext *s, DisasOps *o)
 
 static void prep_new_x(DisasContext *s, DisasOps *o)
 {
-    o->out = tcg_temp_new_i64();
-    o->out2 = tcg_temp_new_i64();
     o->out_128 = tcg_temp_new_i128();
 }
 #define SPEC_prep_new_x 0
@@ -XXX,XX +XXX,XX @@ static void prep_r1_P(DisasContext *s, DisasOps *o)
 
 static void prep_x1(DisasContext *s, DisasOps *o)
 {
-    o->out = load_freg(get_field(s, r1));
-    o->out2 = load_freg(get_field(s, r1) + 2);
-    o->out_128 = tcg_temp_new_i128();
-    tcg_gen_concat_i64_i128(o->out_128, o->out2, o->out);
+    o->out_128 = load_freg_128(get_field(s, r1));
 }
 #define SPEC_prep_x1 SPEC_r1_f128
 
@@ -XXX,XX +XXX,XX @@ static void wout_x1(DisasContext *s, DisasOps *o)
 {
     int f1 = get_field(s, r1);
 
+    /* Split out_128 into out+out2 for cout_f128. */
+    tcg_debug_assert(o->out == NULL);
+    o->out = tcg_temp_new_i64();
+    o->out2 = tcg_temp_new_i64();
+
     tcg_gen_extr_i128_i64(o->out2, o->out, o->out_128);
     store_freg(f1, o->out);
     store_freg(f1 + 2, o->out2);
@@ -XXX,XX +XXX,XX @@ static void in1_f1(DisasContext *s, DisasOps *o)
 }
 #define SPEC_in1_f1 0
 
+static void in1_x1(DisasContext *s, DisasOps *o)
+{
+    o->in1_128 = load_freg_128(get_field(s, r1));
+}
+#define SPEC_in1_x1 SPEC_r1_f128
+
 /* Load the high double word of an extended (128-bit) format FP number */
 static void in1_x2h(DisasContext *s, DisasOps *o)
 {
@@ -XXX,XX +XXX,XX @@ static void in2_f2(DisasContext *s, DisasOps *o)
 }
 #define SPEC_in2_f2 0
 
+static void in2_x2(DisasContext *s, DisasOps *o)
+{
+    o->in2_128 = load_freg_128(get_field(s, r2));
+}
+#define SPEC_in2_x2 SPEC_r2_f128
+
 /* Load the low double word of an extended (128-bit) format FP number */
 static void in2_x2l(DisasContext *s, DisasOps *o)
 {
@@ -XXX,XX +XXX,XX @@ static DisasJumpType translate_one(CPUS390XState *env, DisasContext *s)
     if (o.out_128) {
         tcg_temp_free_i128(o.out_128);
     }
+    if (o.in1_128) {
+        tcg_temp_free_i128(o.in1_128);
+    }
+    if (o.in2_128) {
+        tcg_temp_free_i128(o.in2_128);
+    }
     /* io should be the last instruction in tb when icount is enabled */
     if (unlikely(icount && ret == DISAS_NEXT)) {
         ret = DISAS_TOO_MANY;
-- 
2.34.1

Acked-by: Ilya Leoshkevich <iii@linux.ibm.com>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 target/s390x/helper.h            |  2 --
 target/s390x/tcg/insn-data.h.inc |  2 +-
 target/s390x/tcg/mem_helper.c    | 52 ------------------------------
 target/s390x/tcg/translate.c     | 55 +++++++++++++++++++-------------
 4 files changed, 33 insertions(+), 78 deletions(-)

diff --git a/target/s390x/helper.h b/target/s390x/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/s390x/helper.h
+++ b/target/s390x/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_3(cxgb, i128, env, s64, i32)
 DEF_HELPER_3(celgb, i64, env, i64, i32)
 DEF_HELPER_3(cdlgb, i64, env, i64, i32)
 DEF_HELPER_3(cxlgb, i128, env, i64, i32)
-DEF_HELPER_4(cdsg, void, env, i64, i32, i32)
-DEF_HELPER_4(cdsg_parallel, void, env, i64, i32, i32)
 DEF_HELPER_4(csst, i32, env, i32, i64, i64)
 DEF_HELPER_4(csst_parallel, i32, env, i32, i64, i64)
 DEF_HELPER_FLAGS_3(aeb, TCG_CALL_NO_WG, i64, env, i64, i64)
diff --git a/target/s390x/tcg/insn-data.h.inc b/target/s390x/tcg/insn-data.h.inc
index XXXXXXX..XXXXXXX 100644
--- a/target/s390x/tcg/insn-data.h.inc
+++ b/target/s390x/tcg/insn-data.h.inc
@@ -XXX,XX +XXX,XX @@
 /* COMPARE DOUBLE AND SWAP */
     D(0xbb00, CDS,     RS_a,  Z,   r3_D32, r1_D32, new, r1_D32, cs, 0, MO_TEUQ)
     D(0xeb31, CDSY,    RSY_a, LD,  r3_D32, r1_D32, new, r1_D32, cs, 0, MO_TEUQ)
-    C(0xeb3e, CDSG,    RSY_a, Z,   0, 0, 0, 0, cdsg, 0)
+    C(0xeb3e, CDSG,    RSY_a, Z,   la2, r3_D64, 0, r1_D64, cdsg, 0)
 /* COMPARE AND SWAP AND STORE */
     C(0xc802, CSST,    SSF,   CASS, la1, a2, 0, 0, csst, 0)
 
diff --git a/target/s390x/tcg/mem_helper.c b/target/s390x/tcg/mem_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/s390x/tcg/mem_helper.c
+++ b/target/s390x/tcg/mem_helper.c
@@ -XXX,XX +XXX,XX @@ uint32_t HELPER(trXX)(CPUS390XState *env, uint32_t r1, uint32_t r2,
     return cc;
 }
 
-void HELPER(cdsg)(CPUS390XState *env, uint64_t addr,
-                  uint32_t r1, uint32_t r3)
-{
-    uintptr_t ra = GETPC();
-    Int128 cmpv = int128_make128(env->regs[r1 + 1], env->regs[r1]);
-    Int128 newv = int128_make128(env->regs[r3 + 1], env->regs[r3]);
-    Int128 oldv;
-    uint64_t oldh, oldl;
-    bool fail;
-
-    check_alignment(env, addr, 16, ra);
-
-    oldh = cpu_ldq_data_ra(env, addr + 0, ra);
-    oldl = cpu_ldq_data_ra(env, addr + 8, ra);
-
-    oldv = int128_make128(oldl, oldh);
-    fail = !int128_eq(oldv, cmpv);
-    if (fail) {
-        newv = oldv;
-    }
-
-    cpu_stq_data_ra(env, addr + 0, int128_gethi(newv), ra);
-    cpu_stq_data_ra(env, addr + 8, int128_getlo(newv), ra);
-
-    env->cc_op = fail;
-    env->regs[r1] = int128_gethi(oldv);
-    env->regs[r1 + 1] = int128_getlo(oldv);
-}
-
-void HELPER(cdsg_parallel)(CPUS390XState *env, uint64_t addr,
-                           uint32_t r1, uint32_t r3)
-{
-    uintptr_t ra = GETPC();
-    Int128 cmpv = int128_make128(env->regs[r1 + 1], env->regs[r1]);
-    Int128 newv = int128_make128(env->regs[r3 + 1], env->regs[r3]);
-    int mem_idx;
-    MemOpIdx oi;
-    Int128 oldv;
-    bool fail;
-
-    assert(HAVE_CMPXCHG128);
-
-    mem_idx = cpu_mmu_index(env, false);
-    oi = make_memop_idx(MO_TE | MO_128 | MO_ALIGN, mem_idx);
-    oldv = cpu_atomic_cmpxchgo_be_mmu(env, addr, cmpv, newv, oi, ra);
-    fail = !int128_eq(oldv, cmpv);
-
-    env->cc_op = fail;
-    env->regs[r1] = int128_gethi(oldv);
-    env->regs[r1 + 1] = int128_getlo(oldv);
-}
-
 static uint32_t do_csst(CPUS390XState *env, uint32_t r3, uint64_t a1,
                         uint64_t a2, bool parallel)
 {
diff --git a/target/s390x/tcg/translate.c b/target/s390x/tcg/translate.c
index XXXXXXX..XXXXXXX 100644
--- a/target/s390x/tcg/translate.c
+++ b/target/s390x/tcg/translate.c
@@ -XXX,XX +XXX,XX @@ static DisasJumpType op_cs(DisasContext *s, DisasOps *o)
 static DisasJumpType op_cdsg(DisasContext *s, DisasOps *o)
 {
     int r1 = get_field(s, r1);
-    int r3 = get_field(s, r3);
-    int d2 = get_field(s, d2);
-    int b2 = get_field(s, b2);
-    DisasJumpType ret = DISAS_NEXT;
-    TCGv_i64 addr;
-    TCGv_i32 t_r1, t_r3;
 
-    /* Note that R1:R1+1 = expected value and R3:R3+1 = new value.  */
-    addr = get_address(s, 0, b2, d2);
-    t_r1 = tcg_const_i32(r1);
-    t_r3 = tcg_const_i32(r3);
-    if (!(tb_cflags(s->base.tb) & CF_PARALLEL)) {
-        gen_helper_cdsg(cpu_env, addr, t_r1, t_r3);
-    } else if (HAVE_CMPXCHG128) {
-        gen_helper_cdsg_parallel(cpu_env, addr, t_r1, t_r3);
-    } else {
-        gen_helper_exit_atomic(cpu_env);
-        ret = DISAS_NORETURN;
-    }
-    tcg_temp_free_i64(addr);
-    tcg_temp_free_i32(t_r1);
-    tcg_temp_free_i32(t_r3);
+    o->out_128 = tcg_temp_new_i128();
+    tcg_gen_concat_i64_i128(o->out_128, regs[r1 + 1], regs[r1]);
 
-    set_cc_static(s);
-    return ret;
+    /* Note out (R1:R1+1) = expected value and in2 (R3:R3+1) = new value.  */
+    tcg_gen_atomic_cmpxchg_i128(o->out_128, o->addr1, o->out_128, o->in2_128,
+                                get_mem_index(s), MO_BE | MO_128 | MO_ALIGN);
+
+    /*
+     * Extract result into cc_dst:cc_src, compare vs the expected value
+     * in the as yet unmodified input registers, then update CC_OP.
+     */
+    tcg_gen_extr_i128_i64(cc_src, cc_dst, o->out_128);
+    tcg_gen_xor_i64(cc_dst, cc_dst, regs[r1]);
+    tcg_gen_xor_i64(cc_src, cc_src, regs[r1 + 1]);
+    tcg_gen_or_i64(cc_dst, cc_dst, cc_src);
+    set_cc_nz_u64(s, cc_dst);
+
+    return DISAS_NEXT;
 }
 
 static DisasJumpType op_csst(DisasContext *s, DisasOps *o)
@@ -XXX,XX +XXX,XX @@ static void wout_r1_D32(DisasContext *s, DisasOps *o)
 }
 #define SPEC_wout_r1_D32 SPEC_r1_even
 
+static void wout_r1_D64(DisasContext *s, DisasOps *o)
+{
+    int r1 = get_field(s, r1);
+    tcg_gen_extr_i128_i64(regs[r1 + 1], regs[r1], o->out_128);
+}
+#define SPEC_wout_r1_D64 SPEC_r1_even
+
 static void wout_r3_P32(DisasContext *s, DisasOps *o)
 {
     int r3 = get_field(s, r3);
@@ -XXX,XX +XXX,XX @@ static void in2_r3(DisasContext *s, DisasOps *o)
 }
 #define SPEC_in2_r3 0
 
+static void in2_r3_D64(DisasContext *s, DisasOps *o)
+{
+    int r3 = get_field(s, r3);
+    o->in2_128 = tcg_temp_new_i128();
+    tcg_gen_concat_i64_i128(o->in2_128, regs[r3 + 1], regs[r3]);
+}
+#define SPEC_in2_r3_D64 SPEC_r3_even
+
 static void in2_r3_sr32(DisasContext *s, DisasOps *o)
 {
     o->in2 = tcg_temp_new_i64();
-- 
2.34.1

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 target/i386/tcg/translate.c | 48 ++++++++++++++++++++++++-------------
 1 file changed, 31 insertions(+), 17 deletions(-)

diff --git a/target/i386/tcg/translate.c b/target/i386/tcg/translate.c
index XXXXXXX..XXXXXXX 100644
--- a/target/i386/tcg/translate.c
+++ b/target/i386/tcg/translate.c
@@ -XXX,XX +XXX,XX @@ static void gen_sty_env_A0(DisasContext *s, int offset, bool align)
 #include "emit.c.inc"
 #include "decode-new.c.inc"
 
+static void gen_cmpxchg8b(DisasContext *s, CPUX86State *env, int modrm)
+{
+    gen_lea_modrm(env, s, modrm);
+
+    if ((s->prefix & PREFIX_LOCK) &&
+        (tb_cflags(s->base.tb) & CF_PARALLEL)) {
+        gen_helper_cmpxchg8b(cpu_env, s->A0);
+    } else {
+        gen_helper_cmpxchg8b_unlocked(cpu_env, s->A0);
+    }
+    set_cc_op(s, CC_OP_EFLAGS);
+}
+
+#ifdef TARGET_X86_64
+static void gen_cmpxchg16b(DisasContext *s, CPUX86State *env, int modrm)
+{
+    gen_lea_modrm(env, s, modrm);
+
+    if ((s->prefix & PREFIX_LOCK) &&
+        (tb_cflags(s->base.tb) & CF_PARALLEL)) {
+        gen_helper_cmpxchg16b(cpu_env, s->A0);
+    } else {
+        gen_helper_cmpxchg16b_unlocked(cpu_env, s->A0);
+    }
+    set_cc_op(s, CC_OP_EFLAGS);
+}
+#endif
+
 /* convert one instruction. s->base.is_jmp is set if the translation must
    be stopped. Return the next pc value */
 static bool disas_insn(DisasContext *s, CPUState *cpu)
@@ -XXX,XX +XXX,XX @@ static bool disas_insn(DisasContext *s, CPUState *cpu)
                 if (!(s->cpuid_ext_features & CPUID_EXT_CX16)) {
                     goto illegal_op;
                 }
-                gen_lea_modrm(env, s, modrm);
-                if ((s->prefix & PREFIX_LOCK) &&
-                    (tb_cflags(s->base.tb) & CF_PARALLEL)) {
-                    gen_helper_cmpxchg16b(cpu_env, s->A0);
-                } else {
-                    gen_helper_cmpxchg16b_unlocked(cpu_env, s->A0);
-                }
-                set_cc_op(s, CC_OP_EFLAGS);
+                gen_cmpxchg16b(s, env, modrm);
                 break;
             }
-#endif        
+#endif
             if (!(s->cpuid_features & CPUID_CX8)) {
                 goto illegal_op;
             }
-            gen_lea_modrm(env, s, modrm);
-            if ((s->prefix & PREFIX_LOCK) &&
-                (tb_cflags(s->base.tb) & CF_PARALLEL)) {
-                gen_helper_cmpxchg8b(cpu_env, s->A0);
-            } else {
-                gen_helper_cmpxchg8b_unlocked(cpu_env, s->A0);
-            }
-            set_cc_op(s, CC_OP_EFLAGS);
+            gen_cmpxchg8b(s, env, modrm);
             break;
 
         case 7: /* RDSEED */
-- 
2.34.1

Use tcg_gen_atomic_cmpxchg_i64 for the atomic case,
and tcg_gen_nonatomic_cmpxchg_i64 otherwise.

Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 target/i386/helper.h         |  2 --
 target/i386/tcg/mem_helper.c | 57 ------------------------------------
 target/i386/tcg/translate.c  | 54 ++++++++++++++++++++++++++++++----
 3 files changed, 49 insertions(+), 64 deletions(-)

diff --git a/target/i386/helper.h b/target/i386/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/i386/helper.h
+++ b/target/i386/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_1(rsm, void, env)
 #endif /* !CONFIG_USER_ONLY */
 
 DEF_HELPER_2(into, void, env, int)
-DEF_HELPER_2(cmpxchg8b_unlocked, void, env, tl)
-DEF_HELPER_2(cmpxchg8b, void, env, tl)
 #ifdef TARGET_X86_64
 DEF_HELPER_2(cmpxchg16b_unlocked, void, env, tl)
 DEF_HELPER_2(cmpxchg16b, void, env, tl)
diff --git a/target/i386/tcg/mem_helper.c b/target/i386/tcg/mem_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/i386/tcg/mem_helper.c
+++ b/target/i386/tcg/mem_helper.c
@@ -XXX,XX +XXX,XX @@
 #include "tcg/tcg.h"
 #include "helper-tcg.h"
 
-void helper_cmpxchg8b_unlocked(CPUX86State *env, target_ulong a0)
-{
-    uintptr_t ra = GETPC();
-    uint64_t oldv, cmpv, newv;
-    int eflags;
-
-    eflags = cpu_cc_compute_all(env, CC_OP);
-
-    cmpv = deposit64(env->regs[R_EAX], 32, 32, env->regs[R_EDX]);
-    newv = deposit64(env->regs[R_EBX], 32, 32, env->regs[R_ECX]);
-
-    oldv = cpu_ldq_data_ra(env, a0, ra);
-    newv = (cmpv == oldv ? newv : oldv);
-    /* always do the store */
-    cpu_stq_data_ra(env, a0, newv, ra);
-
-    if (oldv == cmpv) {
-        eflags |= CC_Z;
-    } else {
-        env->regs[R_EAX] = (uint32_t)oldv;
-        env->regs[R_EDX] = (uint32_t)(oldv >> 32);
-        eflags &= ~CC_Z;
-    }
-    CC_SRC = eflags;
-}
-
-void helper_cmpxchg8b(CPUX86State *env, target_ulong a0)
-{
-#ifdef CONFIG_ATOMIC64
-    uint64_t oldv, cmpv, newv;
-    int eflags;
-
-    eflags = cpu_cc_compute_all(env, CC_OP);
-
-    cmpv = deposit64(env->regs[R_EAX], 32, 32, env->regs[R_EDX]);
-    newv = deposit64(env->regs[R_EBX], 32, 32, env->regs[R_ECX]);
-
-    {
-        uintptr_t ra = GETPC();
-        int mem_idx = cpu_mmu_index(env, false);
-        MemOpIdx oi = make_memop_idx(MO_TEUQ, mem_idx);
-        oldv = cpu_atomic_cmpxchgq_le_mmu(env, a0, cmpv, newv, oi, ra);
-    }
-
-    if (oldv == cmpv) {
-        eflags |= CC_Z;
-    } else {
-        env->regs[R_EAX] = (uint32_t)oldv;
-        env->regs[R_EDX] = (uint32_t)(oldv >> 32);
-        eflags &= ~CC_Z;
-    }
-    CC_SRC = eflags;
-#else
-    cpu_loop_exit_atomic(env_cpu(env), GETPC());
-#endif /* CONFIG_ATOMIC64 */
-}
-
 #ifdef TARGET_X86_64
 void helper_cmpxchg16b_unlocked(CPUX86State *env, target_ulong a0)
 {
diff --git a/target/i386/tcg/translate.c b/target/i386/tcg/translate.c
index XXXXXXX..XXXXXXX 100644
--- a/target/i386/tcg/translate.c
+++ b/target/i386/tcg/translate.c
@@ -XXX,XX +XXX,XX @@ static void gen_sty_env_A0(DisasContext *s, int offset, bool align)
 
 static void gen_cmpxchg8b(DisasContext *s, CPUX86State *env, int modrm)
 {
+    TCGv_i64 cmp, val, old;
+    TCGv Z;
+
     gen_lea_modrm(env, s, modrm);
 
-    if ((s->prefix & PREFIX_LOCK) &&
-        (tb_cflags(s->base.tb) & CF_PARALLEL)) {
-        gen_helper_cmpxchg8b(cpu_env, s->A0);
+    cmp = tcg_temp_new_i64();
+    val = tcg_temp_new_i64();
+    old = tcg_temp_new_i64();
+
+    /* Construct the comparison values from the register pair. */
+    tcg_gen_concat_tl_i64(cmp, cpu_regs[R_EAX], cpu_regs[R_EDX]);
+    tcg_gen_concat_tl_i64(val, cpu_regs[R_EBX], cpu_regs[R_ECX]);
+
+    /* Only require atomic with LOCK; non-parallel handled in generator. */
+    if (s->prefix & PREFIX_LOCK) {
+        tcg_gen_atomic_cmpxchg_i64(old, s->A0, cmp, val, s->mem_index, MO_TEUQ);
     } else {
-        gen_helper_cmpxchg8b_unlocked(cpu_env, s->A0);
+        tcg_gen_nonatomic_cmpxchg_i64(old, s->A0, cmp, val,
+                                      s->mem_index, MO_TEUQ);
     }
-    set_cc_op(s, CC_OP_EFLAGS);
+    tcg_temp_free_i64(val);
+
+    /* Set tmp0 to match the required value of Z. */
+    tcg_gen_setcond_i64(TCG_COND_EQ, cmp, old, cmp);
+    Z = tcg_temp_new();
+    tcg_gen_trunc_i64_tl(Z, cmp);
+    tcg_temp_free_i64(cmp);
+
+    /*
+     * Extract the result values for the register pair.
+     * For 32-bit, we may do this unconditionally, because on success (Z=1),
+     * the old value matches the previous value in EDX:EAX.  For x86_64,
+     * the store must be conditional, because we must leave the source
+     * registers unchanged on success, and zero-extend the writeback
+     * on failure (Z=0).
+     */
+    if (TARGET_LONG_BITS == 32) {
+        tcg_gen_extr_i64_tl(cpu_regs[R_EAX], cpu_regs[R_EDX], old);
+    } else {
+        TCGv zero = tcg_constant_tl(0);
+
+        tcg_gen_extr_i64_tl(s->T0, s->T1, old);
+        tcg_gen_movcond_tl(TCG_COND_EQ, cpu_regs[R_EAX], Z, zero,
+                           s->T0, cpu_regs[R_EAX]);
+        tcg_gen_movcond_tl(TCG_COND_EQ, cpu_regs[R_EDX], Z, zero,
+                           s->T1, cpu_regs[R_EDX]);
+    }
+    tcg_temp_free_i64(old);
+
+    /* Update Z. */
+    gen_compute_eflags(s);
+    tcg_gen_deposit_tl(cpu_cc_src, cpu_cc_src, Z, ctz32(CC_Z), 1);
+    tcg_temp_free(Z);
 }
 
 #ifdef TARGET_X86_64
-- 
2.34.1

Use tcg_gen_atomic_cmpxchg_i128 for the atomic case,
and tcg_gen_qemu_ld/st_i128 otherwise.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 target/i386/helper.h         |  4 ---
 target/i386/tcg/mem_helper.c | 69 ------------------------------------
 target/i386/tcg/translate.c  | 44 ++++++++++++++++++++---
 3 files changed, 39 insertions(+), 78 deletions(-)

diff --git a/target/i386/helper.h b/target/i386/helper.h
index XXXXXXX..XXXXXXX 100644
--- a/target/i386/helper.h
+++ b/target/i386/helper.h
@@ -XXX,XX +XXX,XX @@ DEF_HELPER_1(rsm, void, env)
 #endif /* !CONFIG_USER_ONLY */
 
 DEF_HELPER_2(into, void, env, int)
-#ifdef TARGET_X86_64
-DEF_HELPER_2(cmpxchg16b_unlocked, void, env, tl)
-DEF_HELPER_2(cmpxchg16b, void, env, tl)
-#endif
 DEF_HELPER_FLAGS_1(single_step, TCG_CALL_NO_WG, noreturn, env)
 DEF_HELPER_1(rechecking_single_step, void, env)
 DEF_HELPER_1(cpuid, void, env)
diff --git a/target/i386/tcg/mem_helper.c b/target/i386/tcg/mem_helper.c
index XXXXXXX..XXXXXXX 100644
--- a/target/i386/tcg/mem_helper.c
+++ b/target/i386/tcg/mem_helper.c
@@ -XXX,XX +XXX,XX @@
 #include "tcg/tcg.h"
 #include "helper-tcg.h"
 
-#ifdef TARGET_X86_64
-void helper_cmpxchg16b_unlocked(CPUX86State *env, target_ulong a0)
-{
-    uintptr_t ra = GETPC();
-    Int128 oldv, cmpv, newv;
-    uint64_t o0, o1;
-    int eflags;
-    bool success;
-
-    if ((a0 & 0xf) != 0) {
-        raise_exception_ra(env, EXCP0D_GPF, GETPC());
-    }
-    eflags = cpu_cc_compute_all(env, CC_OP);
-
-    cmpv = int128_make128(env->regs[R_EAX], env->regs[R_EDX]);
-    newv = int128_make128(env->regs[R_EBX], env->regs[R_ECX]);
-
-    o0 = cpu_ldq_data_ra(env, a0 + 0, ra);
-    o1 = cpu_ldq_data_ra(env, a0 + 8, ra);
-
-    oldv = int128_make128(o0, o1);
-    success = int128_eq(oldv, cmpv);
-    if (!success) {
-        newv = oldv;
-    }
-
-    cpu_stq_data_ra(env, a0 + 0, int128_getlo(newv), ra);
-    cpu_stq_data_ra(env, a0 + 8, int128_gethi(newv), ra);
-
-    if (success) {
-        eflags |= CC_Z;
-    } else {
-        env->regs[R_EAX] = int128_getlo(oldv);
-        env->regs[R_EDX] = int128_gethi(oldv);
-        eflags &= ~CC_Z;
-    }
-    CC_SRC = eflags;
-}
-
-void helper_cmpxchg16b(CPUX86State *env, target_ulong a0)
-{
-    uintptr_t ra = GETPC();
-
-    if ((a0 & 0xf) != 0) {
-        raise_exception_ra(env, EXCP0D_GPF, ra);
-    } else if (HAVE_CMPXCHG128) {
-        int eflags = cpu_cc_compute_all(env, CC_OP);
-
-        Int128 cmpv = int128_make128(env->regs[R_EAX], env->regs[R_EDX]);
-        Int128 newv = int128_make128(env->regs[R_EBX], env->regs[R_ECX]);
-
-        int mem_idx = cpu_mmu_index(env, false);
-        MemOpIdx oi = make_memop_idx(MO_TE | MO_128 | MO_ALIGN, mem_idx);
-        Int128 oldv = cpu_atomic_cmpxchgo_le_mmu(env, a0, cmpv, newv, oi, ra);
-
-        if (int128_eq(oldv, cmpv)) {
-            eflags |= CC_Z;
-        } else {
-            env->regs[R_EAX] = int128_getlo(oldv);
-            env->regs[R_EDX] = int128_gethi(oldv);
-            eflags &= ~CC_Z;
-        }
-        CC_SRC = eflags;
-    } else {
-        cpu_loop_exit_atomic(env_cpu(env), ra);
-    }
-}
-#endif
-
 void helper_boundw(CPUX86State *env, target_ulong a0, int v)
 {
     int low, high;
diff --git a/target/i386/tcg/translate.c b/target/i386/tcg/translate.c
index XXXXXXX..XXXXXXX 100644
--- a/target/i386/tcg/translate.c
+++ b/target/i386/tcg/translate.c
@@ -XXX,XX +XXX,XX @@ static void gen_cmpxchg8b(DisasContext *s, CPUX86State *env, int modrm)
 #ifdef TARGET_X86_64
 static void gen_cmpxchg16b(DisasContext *s, CPUX86State *env, int modrm)
 {
+    MemOp mop = MO_TE | MO_128 | MO_ALIGN;
+    TCGv_i64 t0, t1;
+    TCGv_i128 cmp, val;
+
     gen_lea_modrm(env, s, modrm);
 
-    if ((s->prefix & PREFIX_LOCK) &&
-        (tb_cflags(s->base.tb) & CF_PARALLEL)) {
-        gen_helper_cmpxchg16b(cpu_env, s->A0);
+    cmp = tcg_temp_new_i128();
+    val = tcg_temp_new_i128();
+    tcg_gen_concat_i64_i128(cmp, cpu_regs[R_EAX], cpu_regs[R_EDX]);
+    tcg_gen_concat_i64_i128(val, cpu_regs[R_EBX], cpu_regs[R_ECX]);
+
+    /* Only require atomic with LOCK; non-parallel handled in generator. */
+    if (s->prefix & PREFIX_LOCK) {
+        tcg_gen_atomic_cmpxchg_i128(val, s->A0, cmp, val, s->mem_index, mop);
     } else {
-        gen_helper_cmpxchg16b_unlocked(cpu_env, s->A0);
+        tcg_gen_nonatomic_cmpxchg_i128(val, s->A0, cmp, val, s->mem_index, mop);
     }
-    set_cc_op(s, CC_OP_EFLAGS);
+
+    tcg_gen_extr_i128_i64(s->T0, s->T1, val);
+    tcg_temp_free_i128(cmp);
+    tcg_temp_free_i128(val);
+
+    /* Determine success after the fact. */
+    t0 = tcg_temp_new_i64();
+    t1 = tcg_temp_new_i64();
+    tcg_gen_xor_i64(t0, s->T0, cpu_regs[R_EAX]);
+    tcg_gen_xor_i64(t1, s->T1, cpu_regs[R_EDX]);
+    tcg_gen_or_i64(t0, t0, t1);
+    tcg_temp_free_i64(t1);
+
+    /* Update Z. */
+    gen_compute_eflags(s);
+    tcg_gen_setcondi_i64(TCG_COND_EQ, t0, t0, 0);
+    tcg_gen_deposit_tl(cpu_cc_src, cpu_cc_src, t0, ctz32(CC_Z), 1);
+    tcg_temp_free_i64(t0);
+
+    /*
+     * Extract the result values for the register pair.  We may do this
+     * unconditionally, because on success (Z=1), the old value matches
+     * the previous value in RDX:RAX.
+     */
+    tcg_gen_mov_i64(cpu_regs[R_EAX], s->T0);
+    tcg_gen_mov_i64(cpu_regs[R_EDX], s->T1);
 }
 #endif
 
-- 
2.34.1

'offset' should be bits [23:5] of LDR instruction, rather than [4:0].

Fixes: d59d83a1c388 ("tcg/aarch64: Reorg goto_tb implementation")
Reviewed-by: Zenghui Yu <yuzenghui@huawei.com>
Reported-by: Zenghui Yu <yuzenghui@huawei.com>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 tcg/aarch64/tcg-target.c.inc | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/tcg/aarch64/tcg-target.c.inc b/tcg/aarch64/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/aarch64/tcg-target.c.inc
+++ b/tcg/aarch64/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ void tb_target_set_jmp_target(const TranslationBlock *tb, int n,
         ptrdiff_t i_offset = i_addr - jmp_rx;
 
         /* Note that we asserted this in range in tcg_out_goto_tb. */
-        insn = deposit32(I3305_LDR | TCG_REG_TMP, 0, 5, i_offset >> 2);
+        insn = deposit32(I3305_LDR | TCG_REG_TMP, 5, 19, i_offset >> 2);
     }
     qatomic_set((uint32_t *)jmp_rw, insn);
     flush_idcache_range(jmp_rx, jmp_rw, 4);
-- 
2.34.1

Note that I have refreshed the expiry of my public key.
and pushed to keys.openpgp.org.

The following changes since commit 4d5d933bbc7cc52f6cc6b9021f91fa06266222d5:

Merge tag 'pull-xenfv-20250116' of git://git.infradead.org/users/dwmw2/qemu into staging (2025-01-16 09:03:43 -0500)

are available in the Git repository at:

https://gitlab.com/rth7680/qemu.git tags/pull-tcg-20250117

for you to fetch changes up to db1649823d4f27b924a5aa5f9e0111457accb798:

softfloat: Constify helpers returning float_status field (2025-01-17 08:29:25 -0800)

----------------------------------------------------------------
tcg:
  - Add TCGOP_TYPE, TCGOP_FLAGS.
  - Pass type and flags to tcg_op_supported, tcg_target_op_def.
  - Split out tcg-target-has.h and unexport from tcg.h.
  - Reorg constraint processing; constify TCGOpDef.
  - Make extract, sextract, deposit opcodes mandatory.
  - Merge ext{8,16,32}{s,u} opcodes into {s}extract.
tcg/mips: Expand bswap unconditionally
tcg/riscv: Use SRAIW, SRLIW for {s}extract_i64
tcg/riscv: Use BEXTI for single-bit extractions
tcg/sparc64: Use SRA, SRL for {s}extract_i64

disas/riscv: Guard dec->cfg dereference for host disassemble
util/cpuinfo-riscv: Detect Zbs
accel/tcg: Call tcg_tb_insert() for one-insn TBs
linux-user: Add missing /proc/cpuinfo fields for sparc

----------------------------------------------------------------
Helge Deller (1):
      linux-user: Add missing /proc/cpuinfo fields for sparc

Ilya Leoshkevich (2):
      tcg: Document tb_lookup() and tcg_tb_lookup()
      accel/tcg: Call tcg_tb_insert() for one-insn TBs

LIU Zhiwei (1):
      disas/riscv: Guard dec->cfg dereference for host disassemble

Philippe Mathieu-Daudé (1):
      softfloat: Constify helpers returning float_status field

Richard Henderson (63):
      tcg: Move call abi parameters from tcg-target.h to tcg-target.c.inc
      tcg: Replace TCGOP_VECL with TCGOP_TYPE
      tcg: Move tcg_op_insert_{after,before} decls to tcg-internal.h
      tcg: Copy TCGOP_TYPE in tcg_op_insert_{after,before}
      tcg: Add TCGOP_FLAGS
      tcg: Add type and flags arguments to tcg_op_supported
      target/arm: Do not test TCG_TARGET_HAS_bitsel_vec
      target/arm: Use tcg_op_supported
      target/tricore: Use tcg_op_supported
      tcg: Add tcg_op_deposit_valid
      target/i386: Remove TCG_TARGET_extract_tl_valid
      target/i386: Use tcg_op_deposit_valid
      target/i386: Use tcg_op_supported
      tcg: Remove TCG_TARGET_NEED_LDST_LABELS and TCG_TARGET_NEED_POOL_LABELS
      tcg: Rename tcg-target.opc.h to tcg-target-opc.h.inc
      tcg/tci: Move TCI specific opcodes to tcg-target-opc.h.inc
      tcg: Move fallback tcg_can_emit_vec_op out of line
      tcg/ppc: Remove TCGPowerISA enum
      tcg: Extract default TCG_TARGET_HAS_foo definitions to 'tcg-has.h'
      tcg/aarch64: Extract TCG_TARGET_HAS_foo defs to 'tcg-target-has.h'
      tcg/arm: Extract TCG_TARGET_HAS_foo defs to 'tcg-target-has.h'
      tcg/i386: Extract TCG_TARGET_HAS_foo defs to 'tcg-target-has.h'
      tcg/loongarch64: Extract TCG_TARGET_HAS_foo defs to 'tcg-target-has.h'
      tcg/mips: Extract TCG_TARGET_HAS_foo defs to 'tcg-target-has.h'
      tcg/ppc: Extract TCG_TARGET_HAS_foo defs to 'tcg-target-has.h'
      tcg/riscv: Extract TCG_TARGET_HAS_foo defs to 'tcg-target-has.h'
      tcg/s390x: Extract TCG_TARGET_HAS_foo defs to 'tcg-target-has.h'
      tcg/sparc64: Extract TCG_TARGET_HAS_foo defs to 'tcg-target-has.h'
      tcg/tci: Extract TCG_TARGET_HAS_foo defs to 'tcg-target-has.h'
      tcg: Include 'tcg-target-has.h' once in 'tcg-has.h'
      tcg: Only include 'tcg-has.h' when necessary
      tcg: Split out tcg-target-mo.h
      tcg: Use C_NotImplemented in tcg_target_op_def
      tcg: Change have_vec to has_type in tcg_op_supported
      tcg: Reorg process_op_defs
      tcg: Remove args_ct from TCGOpDef
      tcg: Constify tcg_op_defs
      tcg: Validate op supported in opcode_args_ct
      tcg: Add TCG_OPF_NOT_PRESENT to opcodes without inputs or outputs
      tcg: Pass type and flags to tcg_target_op_def
      tcg: Add TCGType argument to tcg_out_op
      tcg: Remove TCG_OPF_64BIT
      tcg: Drop implementation checks from tcg-opc.h
      tcg: Replace IMPLVEC with TCG_OPF_VECTOR
      tcg/mips: Expand bswap unconditionally
      tcg/i386: Handle all 8-bit extensions for i686
      tcg/i386: Fold the ext{8,16,32}[us] cases into {s}extract
      tcg/aarch64: Provide TCG_TARGET_{s}extract_valid
      tcg/aarch64: Expand extract with offset 0 with andi
      tcg/arm: Add full [US]XT[BH] into {s}extract
      tcg/loongarch64: Fold the ext{8,16,32}[us] cases into {s}extract
      tcg/mips: Fold the ext{8,16,32}[us] cases into {s}extract
      tcg/ppc: Fold the ext{8,16,32}[us] cases into {s}extract
      tcg/riscv64: Fold the ext{8,16,32}[us] cases into {s}extract
      tcg/riscv: Use SRAIW, SRLIW for {s}extract_i64
      tcg/s390x: Fold the ext{8,16,32}[us] cases into {s}extract
      tcg/sparc64: Use SRA, SRL for {s}extract_i64
      tcg/tci: Provide TCG_TARGET_{s}extract_valid
      tcg/tci: Remove assertions for deposit and extract
      tcg: Remove TCG_TARGET_HAS_{s}extract_{i32,i64}
      tcg: Remove TCG_TARGET_HAS_deposit_{i32,i64}
      util/cpuinfo-riscv: Detect Zbs
      tcg/riscv: Use BEXTI for single-bit extractions

accel/tcg/internal-target.h                        |   1 +
 host/include/riscv/host/cpuinfo.h                  |   5 +-
 include/fpu/softfloat-helpers.h                    |  25 +-
 include/tcg/tcg-opc.h                              | 355 +++++-------
 include/tcg/tcg.h                                  | 187 ++----
 linux-user/sparc/target_proc.h                     |  20 +-
 tcg/aarch64/tcg-target-has.h                       | 117 ++++
 tcg/aarch64/tcg-target-mo.h                        |  12 +
 tcg/aarch64/tcg-target.h                           | 126 ----
 tcg/arm/tcg-target-has.h                           | 100 ++++
 tcg/arm/tcg-target-mo.h                            |  13 +
 tcg/arm/tcg-target.h                               |  86 ---
 tcg/i386/tcg-target-has.h                          | 169 ++++++
 tcg/i386/tcg-target-mo.h                           |  19 +
 tcg/i386/tcg-target.h                              | 162 ------
 tcg/loongarch64/tcg-target-has.h                   | 119 ++++
 tcg/loongarch64/tcg-target-mo.h                    |  12 +
 tcg/loongarch64/tcg-target.h                       | 115 ----
 tcg/mips/tcg-target-has.h                          | 135 +++++
 tcg/mips/tcg-target-mo.h                           |  13 +
 tcg/mips/tcg-target.h                              | 130 -----
 tcg/ppc/tcg-target-has.h                           | 131 +++++
 tcg/ppc/tcg-target-mo.h                            |  12 +
 tcg/ppc/tcg-target.h                               | 126 ----
 tcg/riscv/tcg-target-has.h                         | 135 +++++
 tcg/riscv/tcg-target-mo.h                          |  12 +
 tcg/riscv/tcg-target.h                             | 116 ----
 tcg/s390x/tcg-target-has.h                         | 137 +++++
 tcg/s390x/tcg-target-mo.h                          |  12 +
 tcg/s390x/tcg-target.h                             | 126 ----
 tcg/sparc64/tcg-target-has.h                       |  87 +++
 tcg/sparc64/tcg-target-mo.h                        |  12 +
 tcg/sparc64/tcg-target.h                           |  91 ---
 tcg/tcg-has.h                                      | 101 ++++
 tcg/tcg-internal.h                                 |  18 +-
 tcg/tci/tcg-target-has.h                           |  81 +++
 tcg/tci/tcg-target-mo.h                            |  17 +
 tcg/tci/tcg-target.h                               |  94 ---
 accel/tcg/cpu-exec.c                               |  15 +-
 accel/tcg/translate-all.c                          |  29 +-
 disas/riscv.c                                      |  23 +-
 target/arm/tcg/translate-a64.c                     |  10 +-
 target/arm/tcg/translate-sve.c                     |  22 +-
 target/arm/tcg/translate.c                         |   2 +-
 target/tricore/translate.c                         |   4 +-
 tcg/optimize.c                                     |  27 +-
 tcg/tcg-common.c                                   |   5 +-
 tcg/tcg-op-gvec.c                                  |   1 +
 tcg/tcg-op-ldst.c                                  |  29 +-
 tcg/tcg-op-vec.c                                   |   9 +-
 tcg/tcg-op.c                                       | 149 ++---
 tcg/tcg.c                                          | 643 ++++++++++++++-------
 tcg/tci.c                                          |  13 +-
 util/cpuinfo-riscv.c                               |  18 +-
 docs/devel/tcg-ops.rst                             |  15 +-
 target/i386/tcg/emit.c.inc                         |  14 +-
 .../{tcg-target.opc.h => tcg-target-opc.h.inc}     |   4 +-
 tcg/aarch64/tcg-target.c.inc                       |  33 +-
 tcg/arm/{tcg-target.opc.h => tcg-target-opc.h.inc} |   6 +-
 tcg/arm/tcg-target.c.inc                           |  71 ++-
 .../{tcg-target.opc.h => tcg-target-opc.h.inc}     |  22 +-
 tcg/i386/tcg-target.c.inc                          | 121 +++-
 .../{tcg-target.opc.h => tcg-target-opc.h.inc}     |   0
 tcg/loongarch64/tcg-target.c.inc                   |  59 +-
 tcg/mips/tcg-target-opc.h.inc                      |   1 +
 tcg/mips/tcg-target.c.inc                          |  55 +-
 tcg/ppc/{tcg-target.opc.h => tcg-target-opc.h.inc} |  12 +-
 tcg/ppc/tcg-target.c.inc                           |  39 +-
 .../{tcg-target.opc.h => tcg-target-opc.h.inc}     |   0
 tcg/riscv/tcg-target.c.inc                         |  66 ++-
 .../{tcg-target.opc.h => tcg-target-opc.h.inc}     |   6 +-
 tcg/s390x/tcg-target.c.inc                         |  59 +-
 tcg/sparc64/tcg-target-opc.h.inc                   |   1 +
 tcg/sparc64/tcg-target.c.inc                       |  29 +-
 tcg/tcg-ldst.c.inc                                 |  65 ---
 tcg/tcg-pool.c.inc                                 | 162 ------
 tcg/tci/tcg-target-opc.h.inc                       |   4 +
 tcg/tci/tcg-target.c.inc                           |  53 +-
 78 files changed, 2856 insertions(+), 2269 deletions(-)
 create mode 100644 tcg/aarch64/tcg-target-has.h
 create mode 100644 tcg/aarch64/tcg-target-mo.h
 create mode 100644 tcg/arm/tcg-target-has.h
 create mode 100644 tcg/arm/tcg-target-mo.h
 create mode 100644 tcg/i386/tcg-target-has.h
 create mode 100644 tcg/i386/tcg-target-mo.h
 create mode 100644 tcg/loongarch64/tcg-target-has.h
 create mode 100644 tcg/loongarch64/tcg-target-mo.h
 create mode 100644 tcg/mips/tcg-target-has.h
 create mode 100644 tcg/mips/tcg-target-mo.h
 create mode 100644 tcg/ppc/tcg-target-has.h
 create mode 100644 tcg/ppc/tcg-target-mo.h
 create mode 100644 tcg/riscv/tcg-target-has.h
 create mode 100644 tcg/riscv/tcg-target-mo.h
 create mode 100644 tcg/s390x/tcg-target-has.h
 create mode 100644 tcg/s390x/tcg-target-mo.h
 create mode 100644 tcg/sparc64/tcg-target-has.h
 create mode 100644 tcg/sparc64/tcg-target-mo.h
 create mode 100644 tcg/tcg-has.h
 create mode 100644 tcg/tci/tcg-target-has.h
 create mode 100644 tcg/tci/tcg-target-mo.h
 rename tcg/aarch64/{tcg-target.opc.h => tcg-target-opc.h.inc} (82%)
 rename tcg/arm/{tcg-target.opc.h => tcg-target-opc.h.inc} (75%)
 rename tcg/i386/{tcg-target.opc.h => tcg-target-opc.h.inc} (72%)
 rename tcg/loongarch64/{tcg-target.opc.h => tcg-target-opc.h.inc} (100%)
 create mode 100644 tcg/mips/tcg-target-opc.h.inc
 rename tcg/ppc/{tcg-target.opc.h => tcg-target-opc.h.inc} (83%)
 rename tcg/riscv/{tcg-target.opc.h => tcg-target-opc.h.inc} (100%)
 rename tcg/s390x/{tcg-target.opc.h => tcg-target-opc.h.inc} (75%)
 create mode 100644 tcg/sparc64/tcg-target-opc.h.inc
 delete mode 100644 tcg/tcg-ldst.c.inc
 delete mode 100644 tcg/tcg-pool.c.inc
 create mode 100644 tcg/tci/tcg-target-opc.h.inc

From: LIU Zhiwei <zhiwei_liu@linux.alibaba.com>

For riscv host, it will set dec->cfg to zero. Thus we shuld guard
the dec->cfg deference for riscv host disassemble.

And in general, we should only use dec->cfg for target in three cases:

1) For not incompatible encodings, such as zcmp/zcmt/zfinx.
2) For maybe-ops encodings, they are better to be disassembled to
   the "real" extensions, such as zicfiss. The guard of dec->zimop
   and dec->zcmop is for comment and avoid check for every extension
   that encoded in maybe-ops area.
3) For custom encodings, we have to use dec->cfg to disassemble
   custom encodings using the same encoding area.

Signed-off-by: LIU Zhiwei <zhiwei_liu@linux.alibaba.com>
Suggested-by: Richard Henderson <richard.henderson@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-ID: <20241206032411.52528-1-zhiwei_liu@linux.alibaba.com>
---
 disas/riscv.c | 23 ++++++++++++-----------
 1 file changed, 12 insertions(+), 11 deletions(-)

diff --git a/disas/riscv.c b/disas/riscv.c
index XXXXXXX..XXXXXXX 100644
--- a/disas/riscv.c
+++ b/disas/riscv.c
@@ -XXX,XX +XXX,XX @@ static void decode_inst_opcode(rv_decode *dec, rv_isa isa)
             break;
         case 2: op = rv_op_c_li; break;
         case 3:
-            if (dec->cfg->ext_zcmop) {
+            if (dec->cfg && dec->cfg->ext_zcmop) {
                 if ((((inst >> 2) & 0b111111) == 0b100000) &&
                     (((inst >> 11) & 0b11) == 0b0)) {
                     unsigned int cmop_code = 0;
@@ -XXX,XX +XXX,XX @@ static void decode_inst_opcode(rv_decode *dec, rv_isa isa)
                 op = rv_op_c_sqsp;
             } else {
                 op = rv_op_c_fsdsp;
-                if (dec->cfg->ext_zcmp && ((inst >> 12) & 0b01)) {
+                if (dec->cfg && dec->cfg->ext_zcmp && ((inst >> 12) & 0b01)) {
                     switch ((inst >> 8) & 0b01111) {
                     case 8:
                         if (((inst >> 4) & 0b01111) >= 4) {
@@ -XXX,XX +XXX,XX @@ static void decode_inst_opcode(rv_decode *dec, rv_isa isa)
                 } else {
                     switch ((inst >> 10) & 0b011) {
                     case 0:
-                        if (!dec->cfg->ext_zcmt) {
+                        if (dec->cfg && !dec->cfg->ext_zcmt) {
                             break;
                         }
                         if (((inst >> 2) & 0xFF) >= 32) {
@@ -XXX,XX +XXX,XX @@ static void decode_inst_opcode(rv_decode *dec, rv_isa isa)
                         }
                         break;
                     case 3:
-                        if (!dec->cfg->ext_zcmp) {
+                        if (dec->cfg && !dec->cfg->ext_zcmp) {
                             break;
                         }
                         switch ((inst >> 5) & 0b011) {
@@ -XXX,XX +XXX,XX @@ static void decode_inst_opcode(rv_decode *dec, rv_isa isa)
             break;
         case 5:
             op = rv_op_auipc;
-            if (dec->cfg->ext_zicfilp &&
+            if (dec->cfg && dec->cfg->ext_zicfilp &&
                 (((inst >> 7) & 0b11111) == 0b00000)) {
                 op = rv_op_lpad;
             }
@@ -XXX,XX +XXX,XX @@ static void decode_inst_opcode(rv_decode *dec, rv_isa isa)
             case 2: op = rv_op_csrrs; break;
             case 3: op = rv_op_csrrc; break;
             case 4:
-                if (dec->cfg->ext_zimop) {
+                if (dec->cfg && dec->cfg->ext_zimop) {
                     int imm_mop5, imm_mop3, reg_num;
                     if ((extract32(inst, 22, 10) & 0b1011001111)
                         == 0b1000000111) {
@@ -XXX,XX +XXX,XX @@ static GString *format_inst(size_t tab, rv_decode *dec)
             g_string_append(buf, rv_ireg_name_sym[dec->rs2]);
             break;
         case '3':
-            if (dec->cfg->ext_zfinx) {
+            if (dec->cfg && dec->cfg->ext_zfinx) {
                 g_string_append(buf, rv_ireg_name_sym[dec->rd]);
             } else {
                 g_string_append(buf, rv_freg_name_sym[dec->rd]);
             }
             break;
         case '4':
-            if (dec->cfg->ext_zfinx) {
+            if (dec->cfg && dec->cfg->ext_zfinx) {
                 g_string_append(buf, rv_ireg_name_sym[dec->rs1]);
             } else {
                 g_string_append(buf, rv_freg_name_sym[dec->rs1]);
             }
             break;
         case '5':
-            if (dec->cfg->ext_zfinx) {
+            if (dec->cfg && dec->cfg->ext_zfinx) {
                 g_string_append(buf, rv_ireg_name_sym[dec->rs2]);
             } else {
                 g_string_append(buf, rv_freg_name_sym[dec->rs2]);
             }
             break;
         case '6':
-            if (dec->cfg->ext_zfinx) {
+            if (dec->cfg && dec->cfg->ext_zfinx) {
                 g_string_append(buf, rv_ireg_name_sym[dec->rs3]);
             } else {
                 g_string_append(buf, rv_freg_name_sym[dec->rs3]);
@@ -XXX,XX +XXX,XX @@ static GString *disasm_inst(rv_isa isa, uint64_t pc, rv_inst inst,
         const rv_opcode_data *opcode_data = decoders[i].opcode_data;
         void (*decode_func)(rv_decode *, rv_isa) = decoders[i].decode_func;
 
-        if (guard_func(cfg)) {
+        /* always_true_p don't dereference cfg */
+        if (((i == 0) || cfg) && guard_func(cfg)) {
             dec.opcode_data = opcode_data;
             decode_func(&dec, isa);
             if (dec.op != rv_op_illegal)
-- 
2.43.0

These defines are not required outside of tcg/tcg.c,
which includes tcg-target.c.inc before use.
Reduces the exported symbol set of tcg-target.h.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 tcg/aarch64/tcg-target.h         | 13 -------------
 tcg/arm/tcg-target.h             |  8 --------
 tcg/i386/tcg-target.h            | 20 --------------------
 tcg/loongarch64/tcg-target.h     |  9 ---------
 tcg/mips/tcg-target.h            | 14 --------------
 tcg/riscv/tcg-target.h           |  9 ---------
 tcg/s390x/tcg-target.h           |  8 --------
 tcg/sparc64/tcg-target.h         | 11 -----------
 tcg/tci/tcg-target.h             | 14 --------------
 tcg/aarch64/tcg-target.c.inc     | 13 +++++++++++++
 tcg/arm/tcg-target.c.inc         |  8 ++++++++
 tcg/i386/tcg-target.c.inc        | 20 ++++++++++++++++++++
 tcg/loongarch64/tcg-target.c.inc |  9 +++++++++
 tcg/mips/tcg-target.c.inc        | 14 ++++++++++++++
 tcg/riscv/tcg-target.c.inc       |  9 +++++++++
 tcg/s390x/tcg-target.c.inc       |  8 ++++++++
 tcg/sparc64/tcg-target.c.inc     | 10 ++++++++++
 tcg/tci/tcg-target.c.inc         | 14 ++++++++++++++
 18 files changed, 105 insertions(+), 106 deletions(-)

diff --git a/tcg/aarch64/tcg-target.h b/tcg/aarch64/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/aarch64/tcg-target.h
+++ b/tcg/aarch64/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
 
 #define TCG_TARGET_NB_REGS 64
 
-/* used for function call generation */
-#define TCG_REG_CALL_STACK              TCG_REG_SP
-#define TCG_TARGET_STACK_ALIGN          16
-#define TCG_TARGET_CALL_STACK_OFFSET    0
-#define TCG_TARGET_CALL_ARG_I32         TCG_CALL_ARG_NORMAL
-#define TCG_TARGET_CALL_ARG_I64         TCG_CALL_ARG_NORMAL
-#ifdef CONFIG_DARWIN
-# define TCG_TARGET_CALL_ARG_I128       TCG_CALL_ARG_NORMAL
-#else
-# define TCG_TARGET_CALL_ARG_I128       TCG_CALL_ARG_EVEN
-#endif
-#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_NORMAL
-
 #define have_lse    (cpuinfo & CPUINFO_LSE)
 #define have_lse2   (cpuinfo & CPUINFO_LSE2)
 
diff --git a/tcg/arm/tcg-target.h b/tcg/arm/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/arm/tcg-target.h
+++ b/tcg/arm/tcg-target.h
@@ -XXX,XX +XXX,XX @@ extern bool use_idiv_instructions;
 extern bool use_neon_instructions;
 #endif
 
-/* used for function call generation */
-#define TCG_TARGET_STACK_ALIGN		8
-#define TCG_TARGET_CALL_STACK_OFFSET	0
-#define TCG_TARGET_CALL_ARG_I32         TCG_CALL_ARG_NORMAL
-#define TCG_TARGET_CALL_ARG_I64         TCG_CALL_ARG_EVEN
-#define TCG_TARGET_CALL_ARG_I128        TCG_CALL_ARG_EVEN
-#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_BY_REF
-
 /* optional instructions */
 #define TCG_TARGET_HAS_ext8s_i32        1
 #define TCG_TARGET_HAS_ext16s_i32       1
diff --git a/tcg/i386/tcg-target.h b/tcg/i386/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/i386/tcg-target.h
+++ b/tcg/i386/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
     TCG_REG_CALL_STACK = TCG_REG_ESP
 } TCGReg;
 
-/* used for function call generation */
-#define TCG_TARGET_STACK_ALIGN 16
-#if defined(_WIN64)
-#define TCG_TARGET_CALL_STACK_OFFSET 32
-#else
-#define TCG_TARGET_CALL_STACK_OFFSET 0
-#endif
-#define TCG_TARGET_CALL_ARG_I32      TCG_CALL_ARG_NORMAL
-#define TCG_TARGET_CALL_ARG_I64      TCG_CALL_ARG_NORMAL
-#if defined(_WIN64)
-# define TCG_TARGET_CALL_ARG_I128    TCG_CALL_ARG_BY_REF
-# define TCG_TARGET_CALL_RET_I128    TCG_CALL_RET_BY_VEC
-#elif TCG_TARGET_REG_BITS == 64
-# define TCG_TARGET_CALL_ARG_I128    TCG_CALL_ARG_NORMAL
-# define TCG_TARGET_CALL_RET_I128    TCG_CALL_RET_NORMAL
-#else
-# define TCG_TARGET_CALL_ARG_I128    TCG_CALL_ARG_NORMAL
-# define TCG_TARGET_CALL_RET_I128    TCG_CALL_RET_BY_REF
-#endif
-
 #define have_bmi1         (cpuinfo & CPUINFO_BMI1)
 #define have_popcnt       (cpuinfo & CPUINFO_POPCNT)
 #define have_avx1         (cpuinfo & CPUINFO_AVX1)
diff --git a/tcg/loongarch64/tcg-target.h b/tcg/loongarch64/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/loongarch64/tcg-target.h
+++ b/tcg/loongarch64/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
     TCG_VEC_TMP0 = TCG_REG_V23,
 } TCGReg;
 
-/* used for function call generation */
-#define TCG_REG_CALL_STACK              TCG_REG_SP
-#define TCG_TARGET_STACK_ALIGN          16
-#define TCG_TARGET_CALL_STACK_OFFSET    0
-#define TCG_TARGET_CALL_ARG_I32         TCG_CALL_ARG_NORMAL
-#define TCG_TARGET_CALL_ARG_I64         TCG_CALL_ARG_NORMAL
-#define TCG_TARGET_CALL_ARG_I128        TCG_CALL_ARG_NORMAL
-#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_NORMAL
-
 /* optional instructions */
 #define TCG_TARGET_HAS_negsetcond_i32   0
 #define TCG_TARGET_HAS_div_i32          1
diff --git a/tcg/mips/tcg-target.h b/tcg/mips/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/mips/tcg-target.h
+++ b/tcg/mips/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
     TCG_AREG0 = TCG_REG_S8,
 } TCGReg;
 
-/* used for function call generation */
-#define TCG_TARGET_STACK_ALIGN        16
-#if _MIPS_SIM == _ABIO32
-# define TCG_TARGET_CALL_STACK_OFFSET 16
-# define TCG_TARGET_CALL_ARG_I64      TCG_CALL_ARG_EVEN
-# define TCG_TARGET_CALL_RET_I128     TCG_CALL_RET_BY_REF
-#else
-# define TCG_TARGET_CALL_STACK_OFFSET 0
-# define TCG_TARGET_CALL_ARG_I64      TCG_CALL_ARG_NORMAL
-# define TCG_TARGET_CALL_RET_I128     TCG_CALL_RET_NORMAL
-#endif
-#define TCG_TARGET_CALL_ARG_I32       TCG_CALL_ARG_NORMAL
-#define TCG_TARGET_CALL_ARG_I128      TCG_CALL_ARG_EVEN
-
 /* MOVN/MOVZ instructions detection */
 #if (defined(__mips_isa_rev) && (__mips_isa_rev >= 1)) || \
     defined(_MIPS_ARCH_LOONGSON2E) || defined(_MIPS_ARCH_LOONGSON2F) || \
diff --git a/tcg/riscv/tcg-target.h b/tcg/riscv/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/riscv/tcg-target.h
+++ b/tcg/riscv/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
     TCG_REG_TMP2       = TCG_REG_T4,
 } TCGReg;
 
-/* used for function call generation */
-#define TCG_REG_CALL_STACK              TCG_REG_SP
-#define TCG_TARGET_STACK_ALIGN          16
-#define TCG_TARGET_CALL_STACK_OFFSET    0
-#define TCG_TARGET_CALL_ARG_I32         TCG_CALL_ARG_NORMAL
-#define TCG_TARGET_CALL_ARG_I64         TCG_CALL_ARG_NORMAL
-#define TCG_TARGET_CALL_ARG_I128        TCG_CALL_ARG_NORMAL
-#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_NORMAL
-
 /* optional instructions */
 #define TCG_TARGET_HAS_negsetcond_i32   1
 #define TCG_TARGET_HAS_div_i32          1
diff --git a/tcg/s390x/tcg-target.h b/tcg/s390x/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/s390x/tcg-target.h
+++ b/tcg/s390x/tcg-target.h
@@ -XXX,XX +XXX,XX @@ extern uint64_t s390_facilities[3];
 #define TCG_TARGET_HAS_cmpsel_vec     1
 #define TCG_TARGET_HAS_tst_vec        0
 
-/* used for function call generation */
-#define TCG_TARGET_STACK_ALIGN		8
-#define TCG_TARGET_CALL_STACK_OFFSET	160
-#define TCG_TARGET_CALL_ARG_I32         TCG_CALL_ARG_EXTEND
-#define TCG_TARGET_CALL_ARG_I64         TCG_CALL_ARG_NORMAL
-#define TCG_TARGET_CALL_ARG_I128        TCG_CALL_ARG_BY_REF
-#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_BY_REF
-
 #define TCG_TARGET_DEFAULT_MO (TCG_MO_ALL & ~TCG_MO_ST_LD)
 #define TCG_TARGET_NEED_LDST_LABELS
 #define TCG_TARGET_NEED_POOL_LABELS
diff --git a/tcg/sparc64/tcg-target.h b/tcg/sparc64/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/sparc64/tcg-target.h
+++ b/tcg/sparc64/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
     TCG_REG_I7,
 } TCGReg;
 
-/* used for function call generation */
-#define TCG_REG_CALL_STACK TCG_REG_O6
-
-#define TCG_TARGET_STACK_BIAS           2047
-#define TCG_TARGET_STACK_ALIGN          16
-#define TCG_TARGET_CALL_STACK_OFFSET    (128 + 6*8 + TCG_TARGET_STACK_BIAS)
-#define TCG_TARGET_CALL_ARG_I32         TCG_CALL_ARG_EXTEND
-#define TCG_TARGET_CALL_ARG_I64         TCG_CALL_ARG_NORMAL
-#define TCG_TARGET_CALL_ARG_I128        TCG_CALL_ARG_NORMAL
-#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_NORMAL
-
 #if defined(__VIS__) && __VIS__ >= 0x300
 #define use_vis3_instructions  1
 #else
diff --git a/tcg/tci/tcg-target.h b/tcg/tci/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tci/tcg-target.h
+++ b/tcg/tci/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
     TCG_REG_CALL_STACK = TCG_REG_R15,
 } TCGReg;
 
-/* Used for function call generation. */
-#define TCG_TARGET_CALL_STACK_OFFSET    0
-#define TCG_TARGET_STACK_ALIGN          8
-#if TCG_TARGET_REG_BITS == 32
-# define TCG_TARGET_CALL_ARG_I32        TCG_CALL_ARG_EVEN
-# define TCG_TARGET_CALL_ARG_I64        TCG_CALL_ARG_EVEN
-# define TCG_TARGET_CALL_ARG_I128       TCG_CALL_ARG_EVEN
-#else
-# define TCG_TARGET_CALL_ARG_I32        TCG_CALL_ARG_NORMAL
-# define TCG_TARGET_CALL_ARG_I64        TCG_CALL_ARG_NORMAL
-# define TCG_TARGET_CALL_ARG_I128       TCG_CALL_ARG_NORMAL
-#endif
-#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_NORMAL
-
 #define HAVE_TCG_QEMU_TB_EXEC
 #define TCG_TARGET_NEED_POOL_LABELS
 
diff --git a/tcg/aarch64/tcg-target.c.inc b/tcg/aarch64/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/aarch64/tcg-target.c.inc
+++ b/tcg/aarch64/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@
 #include "../tcg-pool.c.inc"
 #include "qemu/bitops.h"
 
+/* Used for function call generation. */
+#define TCG_REG_CALL_STACK              TCG_REG_SP
+#define TCG_TARGET_STACK_ALIGN          16
+#define TCG_TARGET_CALL_STACK_OFFSET    0
+#define TCG_TARGET_CALL_ARG_I32         TCG_CALL_ARG_NORMAL
+#define TCG_TARGET_CALL_ARG_I64         TCG_CALL_ARG_NORMAL
+#ifdef CONFIG_DARWIN
+# define TCG_TARGET_CALL_ARG_I128       TCG_CALL_ARG_NORMAL
+#else
+# define TCG_TARGET_CALL_ARG_I128       TCG_CALL_ARG_EVEN
+#endif
+#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_NORMAL
+
 /* We're going to re-use TCGType in setting of the SF bit, which controls
    the size of the operation performed.  If we know the values match, it
    makes things much cleaner.  */
diff --git a/tcg/arm/tcg-target.c.inc b/tcg/arm/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/arm/tcg-target.c.inc
+++ b/tcg/arm/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ bool use_idiv_instructions;
 bool use_neon_instructions;
 #endif
 
+/* Used for function call generation. */
+#define TCG_TARGET_STACK_ALIGN          8
+#define TCG_TARGET_CALL_STACK_OFFSET    0
+#define TCG_TARGET_CALL_ARG_I32         TCG_CALL_ARG_NORMAL
+#define TCG_TARGET_CALL_ARG_I64         TCG_CALL_ARG_EVEN
+#define TCG_TARGET_CALL_ARG_I128        TCG_CALL_ARG_EVEN
+#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_BY_REF
+
 #ifdef CONFIG_DEBUG_TCG
 static const char * const tcg_target_reg_names[TCG_TARGET_NB_REGS] = {
     "%r0",  "%r1",  "%r2",  "%r3",  "%r4",  "%r5",  "%r6",  "%r7",
diff --git a/tcg/i386/tcg-target.c.inc b/tcg/i386/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/i386/tcg-target.c.inc
+++ b/tcg/i386/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@
 #include "../tcg-ldst.c.inc"
 #include "../tcg-pool.c.inc"
 
+/* Used for function call generation. */
+#define TCG_TARGET_STACK_ALIGN 16
+#if defined(_WIN64)
+#define TCG_TARGET_CALL_STACK_OFFSET 32
+#else
+#define TCG_TARGET_CALL_STACK_OFFSET 0
+#endif
+#define TCG_TARGET_CALL_ARG_I32      TCG_CALL_ARG_NORMAL
+#define TCG_TARGET_CALL_ARG_I64      TCG_CALL_ARG_NORMAL
+#if defined(_WIN64)
+# define TCG_TARGET_CALL_ARG_I128    TCG_CALL_ARG_BY_REF
+# define TCG_TARGET_CALL_RET_I128    TCG_CALL_RET_BY_VEC
+#elif TCG_TARGET_REG_BITS == 64
+# define TCG_TARGET_CALL_ARG_I128    TCG_CALL_ARG_NORMAL
+# define TCG_TARGET_CALL_RET_I128    TCG_CALL_RET_NORMAL
+#else
+# define TCG_TARGET_CALL_ARG_I128    TCG_CALL_ARG_NORMAL
+# define TCG_TARGET_CALL_RET_I128    TCG_CALL_RET_BY_REF
+#endif
+
 #ifdef CONFIG_DEBUG_TCG
 static const char * const tcg_target_reg_names[TCG_TARGET_NB_REGS] = {
 #if TCG_TARGET_REG_BITS == 64
diff --git a/tcg/loongarch64/tcg-target.c.inc b/tcg/loongarch64/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/loongarch64/tcg-target.c.inc
+++ b/tcg/loongarch64/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@
 #include "../tcg-ldst.c.inc"
 #include <asm/hwcap.h>
 
+/* used for function call generation */
+#define TCG_REG_CALL_STACK              TCG_REG_SP
+#define TCG_TARGET_STACK_ALIGN          16
+#define TCG_TARGET_CALL_STACK_OFFSET    0
+#define TCG_TARGET_CALL_ARG_I32         TCG_CALL_ARG_NORMAL
+#define TCG_TARGET_CALL_ARG_I64         TCG_CALL_ARG_NORMAL
+#define TCG_TARGET_CALL_ARG_I128        TCG_CALL_ARG_NORMAL
+#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_NORMAL
+
 #ifdef CONFIG_DEBUG_TCG
 static const char * const tcg_target_reg_names[TCG_TARGET_NB_REGS] = {
     "zero",
diff --git a/tcg/mips/tcg-target.c.inc b/tcg/mips/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/mips/tcg-target.c.inc
+++ b/tcg/mips/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@
 #include "../tcg-ldst.c.inc"
 #include "../tcg-pool.c.inc"
 
+/* used for function call generation */
+#define TCG_TARGET_STACK_ALIGN        16
+#if _MIPS_SIM == _ABIO32
+# define TCG_TARGET_CALL_STACK_OFFSET 16
+# define TCG_TARGET_CALL_ARG_I64      TCG_CALL_ARG_EVEN
+# define TCG_TARGET_CALL_RET_I128     TCG_CALL_RET_BY_REF
+#else
+# define TCG_TARGET_CALL_STACK_OFFSET 0
+# define TCG_TARGET_CALL_ARG_I64      TCG_CALL_ARG_NORMAL
+# define TCG_TARGET_CALL_RET_I128     TCG_CALL_RET_NORMAL
+#endif
+#define TCG_TARGET_CALL_ARG_I32       TCG_CALL_ARG_NORMAL
+#define TCG_TARGET_CALL_ARG_I128      TCG_CALL_ARG_EVEN
+
 #if TCG_TARGET_REG_BITS == 32
 # define LO_OFF  (HOST_BIG_ENDIAN * 4)
 # define HI_OFF  (4 - LO_OFF)
diff --git a/tcg/riscv/tcg-target.c.inc b/tcg/riscv/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/riscv/tcg-target.c.inc
+++ b/tcg/riscv/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@
 #include "../tcg-ldst.c.inc"
 #include "../tcg-pool.c.inc"
 
+/* Used for function call generation. */
+#define TCG_REG_CALL_STACK              TCG_REG_SP
+#define TCG_TARGET_STACK_ALIGN          16
+#define TCG_TARGET_CALL_STACK_OFFSET    0
+#define TCG_TARGET_CALL_ARG_I32         TCG_CALL_ARG_NORMAL
+#define TCG_TARGET_CALL_ARG_I64         TCG_CALL_ARG_NORMAL
+#define TCG_TARGET_CALL_ARG_I128        TCG_CALL_ARG_NORMAL
+#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_NORMAL
+
 #ifdef CONFIG_DEBUG_TCG
 static const char * const tcg_target_reg_names[TCG_TARGET_NB_REGS] = {
     "zero", "ra",  "sp",  "gp",  "tp",  "t0",  "t1",  "t2",
diff --git a/tcg/s390x/tcg-target.c.inc b/tcg/s390x/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/s390x/tcg-target.c.inc
+++ b/tcg/s390x/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@
 #include "../tcg-pool.c.inc"
 #include "elf.h"
 
+/* Used for function call generation. */
+#define TCG_TARGET_STACK_ALIGN          8
+#define TCG_TARGET_CALL_STACK_OFFSET    160
+#define TCG_TARGET_CALL_ARG_I32         TCG_CALL_ARG_EXTEND
+#define TCG_TARGET_CALL_ARG_I64         TCG_CALL_ARG_NORMAL
+#define TCG_TARGET_CALL_ARG_I128        TCG_CALL_ARG_BY_REF
+#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_BY_REF
+
 #define TCG_CT_CONST_S16        (1 << 8)
 #define TCG_CT_CONST_S32        (1 << 9)
 #define TCG_CT_CONST_U32        (1 << 10)
diff --git a/tcg/sparc64/tcg-target.c.inc b/tcg/sparc64/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/sparc64/tcg-target.c.inc
+++ b/tcg/sparc64/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@
 #include "../tcg-ldst.c.inc"
 #include "../tcg-pool.c.inc"
 
+/* Used for function call generation. */
+#define TCG_REG_CALL_STACK              TCG_REG_O6
+#define TCG_TARGET_STACK_BIAS           2047
+#define TCG_TARGET_STACK_ALIGN          16
+#define TCG_TARGET_CALL_STACK_OFFSET    (128 + 6 * 8 + TCG_TARGET_STACK_BIAS)
+#define TCG_TARGET_CALL_ARG_I32         TCG_CALL_ARG_EXTEND
+#define TCG_TARGET_CALL_ARG_I64         TCG_CALL_ARG_NORMAL
+#define TCG_TARGET_CALL_ARG_I128        TCG_CALL_ARG_NORMAL
+#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_NORMAL
+
 #ifdef CONFIG_DEBUG_TCG
 static const char * const tcg_target_reg_names[TCG_TARGET_NB_REGS] = {
     "%g0",
diff --git a/tcg/tci/tcg-target.c.inc b/tcg/tci/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tci/tcg-target.c.inc
+++ b/tcg/tci/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@
 
 #include "../tcg-pool.c.inc"
 
+/* Used for function call generation. */
+#define TCG_TARGET_CALL_STACK_OFFSET    0
+#define TCG_TARGET_STACK_ALIGN          8
+#if TCG_TARGET_REG_BITS == 32
+# define TCG_TARGET_CALL_ARG_I32        TCG_CALL_ARG_EVEN
+# define TCG_TARGET_CALL_ARG_I64        TCG_CALL_ARG_EVEN
+# define TCG_TARGET_CALL_ARG_I128       TCG_CALL_ARG_EVEN
+#else
+# define TCG_TARGET_CALL_ARG_I32        TCG_CALL_ARG_NORMAL
+# define TCG_TARGET_CALL_ARG_I64        TCG_CALL_ARG_NORMAL
+# define TCG_TARGET_CALL_ARG_I128       TCG_CALL_ARG_NORMAL
+#endif
+#define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_NORMAL
+
 static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
 {
     switch (op) {
-- 
2.43.0

In the replacement, drop the TCGType - TCG_TYPE_V64 adjustment,
except for the call to tcg_out_vec_op.  Pass type to tcg_gen_op[1-6],
so that all integer opcodes gain the type.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 include/tcg/tcg.h      |   2 +-
 tcg/tcg-internal.h     |  13 ++---
 tcg/optimize.c         |  10 +---
 tcg/tcg-op-ldst.c      |  26 ++++++----
 tcg/tcg-op-vec.c       |   8 +--
 tcg/tcg-op.c           | 113 +++++++++++++++++++++++------------------
 tcg/tcg.c              |  11 ++--
 docs/devel/tcg-ops.rst |  15 +++---
 8 files changed, 105 insertions(+), 93 deletions(-)

diff --git a/include/tcg/tcg.h b/include/tcg/tcg.h
index XXXXXXX..XXXXXXX 100644
--- a/include/tcg/tcg.h
+++ b/include/tcg/tcg.h
@@ -XXX,XX +XXX,XX @@ struct TCGOp {
 #define TCGOP_CALLI(X)    (X)->param1
 #define TCGOP_CALLO(X)    (X)->param2
 
-#define TCGOP_VECL(X)     (X)->param1
+#define TCGOP_TYPE(X)     (X)->param1
 #define TCGOP_VECE(X)     (X)->param2
 
 /* Make sure operands fit in the bitfields above.  */
diff --git a/tcg/tcg-internal.h b/tcg/tcg-internal.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg-internal.h
+++ b/tcg/tcg-internal.h
@@ -XXX,XX +XXX,XX @@ TCGTemp *tcg_temp_new_internal(TCGType type, TCGTempKind kind);
  */
 TCGTemp *tcg_constant_internal(TCGType type, int64_t val);
 
-TCGOp *tcg_gen_op1(TCGOpcode, TCGArg);
-TCGOp *tcg_gen_op2(TCGOpcode, TCGArg, TCGArg);
-TCGOp *tcg_gen_op3(TCGOpcode, TCGArg, TCGArg, TCGArg);
-TCGOp *tcg_gen_op4(TCGOpcode, TCGArg, TCGArg, TCGArg, TCGArg);
-TCGOp *tcg_gen_op5(TCGOpcode, TCGArg, TCGArg, TCGArg, TCGArg, TCGArg);
-TCGOp *tcg_gen_op6(TCGOpcode, TCGArg, TCGArg, TCGArg, TCGArg, TCGArg, TCGArg);
+TCGOp *tcg_gen_op1(TCGOpcode, TCGType, TCGArg);
+TCGOp *tcg_gen_op2(TCGOpcode, TCGType, TCGArg, TCGArg);
+TCGOp *tcg_gen_op3(TCGOpcode, TCGType, TCGArg, TCGArg, TCGArg);
+TCGOp *tcg_gen_op4(TCGOpcode, TCGType, TCGArg, TCGArg, TCGArg, TCGArg);
+TCGOp *tcg_gen_op5(TCGOpcode, TCGType, TCGArg, TCGArg, TCGArg, TCGArg, TCGArg);
+TCGOp *tcg_gen_op6(TCGOpcode, TCGType, TCGArg, TCGArg,
+                   TCGArg, TCGArg, TCGArg, TCGArg);
 
 void vec_gen_2(TCGOpcode, TCGType, unsigned, TCGArg, TCGArg);
 void vec_gen_3(TCGOpcode, TCGType, unsigned, TCGArg, TCGArg, TCGArg);
diff --git a/tcg/optimize.c b/tcg/optimize.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/optimize.c
+++ b/tcg/optimize.c
@@ -XXX,XX +XXX,XX @@ static bool tcg_opt_gen_mov(OptContext *ctx, TCGOp *op, TCGArg dst, TCGArg src)
     case TCG_TYPE_V64:
     case TCG_TYPE_V128:
     case TCG_TYPE_V256:
-        /* TCGOP_VECL and TCGOP_VECE remain unchanged.  */
+        /* TCGOP_TYPE and TCGOP_VECE remain unchanged.  */
         new_op = INDEX_op_mov_vec;
         break;
     default:
@@ -XXX,XX +XXX,XX @@ void tcg_optimize(TCGContext *s)
         copy_propagate(&ctx, op, def->nb_oargs, def->nb_iargs);
 
         /* Pre-compute the type of the operation. */
-        if (def->flags & TCG_OPF_VECTOR) {
-            ctx.type = TCG_TYPE_V64 + TCGOP_VECL(op);
-        } else if (def->flags & TCG_OPF_64BIT) {
-            ctx.type = TCG_TYPE_I64;
-        } else {
-            ctx.type = TCG_TYPE_I32;
-        }
+        ctx.type = TCGOP_TYPE(op);
 
         /*
          * Process each opcode.
diff --git a/tcg/tcg-op-ldst.c b/tcg/tcg-op-ldst.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg-op-ldst.c
+++ b/tcg/tcg-op-ldst.c
@@ -XXX,XX +XXX,XX @@ static MemOp tcg_canonicalize_memop(MemOp op, bool is64, bool st)
     return op;
 }
 
-static void gen_ldst(TCGOpcode opc, TCGTemp *vl, TCGTemp *vh,
+static void gen_ldst(TCGOpcode opc, TCGType type, TCGTemp *vl, TCGTemp *vh,
                      TCGTemp *addr, MemOpIdx oi)
 {
     if (TCG_TARGET_REG_BITS == 64 || tcg_ctx->addr_type == TCG_TYPE_I32) {
         if (vh) {
-            tcg_gen_op4(opc, temp_arg(vl), temp_arg(vh), temp_arg(addr), oi);
+            tcg_gen_op4(opc, type, temp_arg(vl), temp_arg(vh),
+                        temp_arg(addr), oi);
         } else {
-            tcg_gen_op3(opc, temp_arg(vl), temp_arg(addr), oi);
+            tcg_gen_op3(opc, type, temp_arg(vl), temp_arg(addr), oi);
         }
     } else {
         /* See TCGV_LOW/HIGH. */
@@ -XXX,XX +XXX,XX @@ static void gen_ldst(TCGOpcode opc, TCGTemp *vl, TCGTemp *vh,
         TCGTemp *ah = addr + !HOST_BIG_ENDIAN;
 
         if (vh) {
-            tcg_gen_op5(opc, temp_arg(vl), temp_arg(vh),
+            tcg_gen_op5(opc, type, temp_arg(vl), temp_arg(vh),
                         temp_arg(al), temp_arg(ah), oi);
         } else {
-            tcg_gen_op4(opc, temp_arg(vl), temp_arg(al), temp_arg(ah), oi);
+            tcg_gen_op4(opc, type, temp_arg(vl),
+                        temp_arg(al), temp_arg(ah), oi);
         }
     }
 }
@@ -XXX,XX +XXX,XX @@ static void gen_ldst_i64(TCGOpcode opc, TCGv_i64 v, TCGTemp *addr, MemOpIdx oi)
     if (TCG_TARGET_REG_BITS == 32) {
         TCGTemp *vl = tcgv_i32_temp(TCGV_LOW(v));
         TCGTemp *vh = tcgv_i32_temp(TCGV_HIGH(v));
-        gen_ldst(opc, vl, vh, addr, oi);
+        gen_ldst(opc, TCG_TYPE_I64, vl, vh, addr, oi);
     } else {
-        gen_ldst(opc, tcgv_i64_temp(v), NULL, addr, oi);
+        gen_ldst(opc, TCG_TYPE_I64, tcgv_i64_temp(v), NULL, addr, oi);
     }
 }
 
@@ -XXX,XX +XXX,XX @@ static void tcg_gen_qemu_ld_i32_int(TCGv_i32 val, TCGTemp *addr,
     } else {
         opc = INDEX_op_qemu_ld_a64_i32;
     }
-    gen_ldst(opc, tcgv_i32_temp(val), NULL, addr, oi);
+    gen_ldst(opc, TCG_TYPE_I32, tcgv_i32_temp(val), NULL, addr, oi);
     plugin_gen_mem_callbacks_i32(val, copy_addr, addr, orig_oi,
                                  QEMU_PLUGIN_MEM_R);
 
@@ -XXX,XX +XXX,XX @@ static void tcg_gen_qemu_st_i32_int(TCGv_i32 val, TCGTemp *addr,
             opc = INDEX_op_qemu_st_a64_i32;
         }
     }
-    gen_ldst(opc, tcgv_i32_temp(val), NULL, addr, oi);
+    gen_ldst(opc, TCG_TYPE_I32, tcgv_i32_temp(val), NULL, addr, oi);
     plugin_gen_mem_callbacks_i32(val, NULL, addr, orig_oi, QEMU_PLUGIN_MEM_W);
 
     if (swap) {
@@ -XXX,XX +XXX,XX @@ static void tcg_gen_qemu_ld_i128_int(TCGv_i128 val, TCGTemp *addr,
         } else {
             opc = INDEX_op_qemu_ld_a64_i128;
         }
-        gen_ldst(opc, tcgv_i64_temp(lo), tcgv_i64_temp(hi), addr, oi);
+        gen_ldst(opc, TCG_TYPE_I128, tcgv_i64_temp(lo),
+                 tcgv_i64_temp(hi), addr, oi);
 
         if (need_bswap) {
             tcg_gen_bswap64_i64(lo, lo);
@@ -XXX,XX +XXX,XX @@ static void tcg_gen_qemu_st_i128_int(TCGv_i128 val, TCGTemp *addr,
         } else {
             opc = INDEX_op_qemu_st_a64_i128;
         }
-        gen_ldst(opc, tcgv_i64_temp(lo), tcgv_i64_temp(hi), addr, oi);
+        gen_ldst(opc, TCG_TYPE_I128, tcgv_i64_temp(lo),
+                 tcgv_i64_temp(hi), addr, oi);
 
         if (need_bswap) {
             tcg_temp_free_i64(lo);
diff --git a/tcg/tcg-op-vec.c b/tcg/tcg-op-vec.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg-op-vec.c
+++ b/tcg/tcg-op-vec.c
@@ -XXX,XX +XXX,XX @@ bool tcg_can_emit_vecop_list(const TCGOpcode *list,
 void vec_gen_2(TCGOpcode opc, TCGType type, unsigned vece, TCGArg r, TCGArg a)
 {
     TCGOp *op = tcg_emit_op(opc, 2);
-    TCGOP_VECL(op) = type - TCG_TYPE_V64;
+    TCGOP_TYPE(op) = type;
     TCGOP_VECE(op) = vece;
     op->args[0] = r;
     op->args[1] = a;
@@ -XXX,XX +XXX,XX @@ void vec_gen_3(TCGOpcode opc, TCGType type, unsigned vece,
                TCGArg r, TCGArg a, TCGArg b)
 {
     TCGOp *op = tcg_emit_op(opc, 3);
-    TCGOP_VECL(op) = type - TCG_TYPE_V64;
+    TCGOP_TYPE(op) = type;
     TCGOP_VECE(op) = vece;
     op->args[0] = r;
     op->args[1] = a;
@@ -XXX,XX +XXX,XX @@ void vec_gen_4(TCGOpcode opc, TCGType type, unsigned vece,
                TCGArg r, TCGArg a, TCGArg b, TCGArg c)
 {
     TCGOp *op = tcg_emit_op(opc, 4);
-    TCGOP_VECL(op) = type - TCG_TYPE_V64;
+    TCGOP_TYPE(op) = type;
     TCGOP_VECE(op) = vece;
     op->args[0] = r;
     op->args[1] = a;
@@ -XXX,XX +XXX,XX @@ void vec_gen_6(TCGOpcode opc, TCGType type, unsigned vece, TCGArg r,
                TCGArg a, TCGArg b, TCGArg c, TCGArg d, TCGArg e)
 {
     TCGOp *op = tcg_emit_op(opc, 6);
-    TCGOP_VECL(op) = type - TCG_TYPE_V64;
+    TCGOP_TYPE(op) = type;
     TCGOP_VECE(op) = vece;
     op->args[0] = r;
     op->args[1] = a;
diff --git a/tcg/tcg-op.c b/tcg/tcg-op.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg-op.c
+++ b/tcg/tcg-op.c
@@ -XXX,XX +XXX,XX @@
  */
 #define NI  __attribute__((noinline))
 
-TCGOp * NI tcg_gen_op1(TCGOpcode opc, TCGArg a1)
+TCGOp * NI tcg_gen_op1(TCGOpcode opc, TCGType type, TCGArg a1)
 {
     TCGOp *op = tcg_emit_op(opc, 1);
+    TCGOP_TYPE(op) = type;
     op->args[0] = a1;
     return op;
 }
 
-TCGOp * NI tcg_gen_op2(TCGOpcode opc, TCGArg a1, TCGArg a2)
+TCGOp * NI tcg_gen_op2(TCGOpcode opc, TCGType type, TCGArg a1, TCGArg a2)
 {
     TCGOp *op = tcg_emit_op(opc, 2);
+    TCGOP_TYPE(op) = type;
     op->args[0] = a1;
     op->args[1] = a2;
     return op;
 }
 
-TCGOp * NI tcg_gen_op3(TCGOpcode opc, TCGArg a1, TCGArg a2, TCGArg a3)
+TCGOp * NI tcg_gen_op3(TCGOpcode opc, TCGType type, TCGArg a1,
+                       TCGArg a2, TCGArg a3)
 {
     TCGOp *op = tcg_emit_op(opc, 3);
+    TCGOP_TYPE(op) = type;
     op->args[0] = a1;
     op->args[1] = a2;
     op->args[2] = a3;
     return op;
 }
 
-TCGOp * NI tcg_gen_op4(TCGOpcode opc, TCGArg a1, TCGArg a2,
+TCGOp * NI tcg_gen_op4(TCGOpcode opc, TCGType type, TCGArg a1, TCGArg a2,
                        TCGArg a3, TCGArg a4)
 {
     TCGOp *op = tcg_emit_op(opc, 4);
+    TCGOP_TYPE(op) = type;
     op->args[0] = a1;
     op->args[1] = a2;
     op->args[2] = a3;
@@ -XXX,XX +XXX,XX @@ TCGOp * NI tcg_gen_op4(TCGOpcode opc, TCGArg a1, TCGArg a2,
     return op;
 }
 
-TCGOp * NI tcg_gen_op5(TCGOpcode opc, TCGArg a1, TCGArg a2,
+TCGOp * NI tcg_gen_op5(TCGOpcode opc, TCGType type, TCGArg a1, TCGArg a2,
                        TCGArg a3, TCGArg a4, TCGArg a5)
 {
     TCGOp *op = tcg_emit_op(opc, 5);
+    TCGOP_TYPE(op) = type;
     op->args[0] = a1;
     op->args[1] = a2;
     op->args[2] = a3;
@@ -XXX,XX +XXX,XX @@ TCGOp * NI tcg_gen_op5(TCGOpcode opc, TCGArg a1, TCGArg a2,
     return op;
 }
 
-TCGOp * NI tcg_gen_op6(TCGOpcode opc, TCGArg a1, TCGArg a2, TCGArg a3,
-                       TCGArg a4, TCGArg a5, TCGArg a6)
+TCGOp * NI tcg_gen_op6(TCGOpcode opc, TCGType type, TCGArg a1, TCGArg a2,
+                       TCGArg a3, TCGArg a4, TCGArg a5, TCGArg a6)
 {
     TCGOp *op = tcg_emit_op(opc, 6);
+    TCGOP_TYPE(op) = type;
     op->args[0] = a1;
     op->args[1] = a2;
     op->args[2] = a3;
@@ -XXX,XX +XXX,XX @@ TCGOp * NI tcg_gen_op6(TCGOpcode opc, TCGArg a1, TCGArg a2, TCGArg a3,
 # define DNI
 #endif
 
-static void DNI tcg_gen_op1_i32(TCGOpcode opc, TCGv_i32 a1)
+static void DNI tcg_gen_op1_i32(TCGOpcode opc, TCGType type, TCGv_i32 a1)
 {
-    tcg_gen_op1(opc, tcgv_i32_arg(a1));
+    tcg_gen_op1(opc, type, tcgv_i32_arg(a1));
 }
 
-static void DNI tcg_gen_op1_i64(TCGOpcode opc, TCGv_i64 a1)
+static void DNI tcg_gen_op1_i64(TCGOpcode opc, TCGType type, TCGv_i64 a1)
 {
-    tcg_gen_op1(opc, tcgv_i64_arg(a1));
+    tcg_gen_op1(opc, type, tcgv_i64_arg(a1));
 }
 
-static TCGOp * DNI tcg_gen_op1i(TCGOpcode opc, TCGArg a1)
+static TCGOp * DNI tcg_gen_op1i(TCGOpcode opc, TCGType type, TCGArg a1)
 {
-    return tcg_gen_op1(opc, a1);
+    return tcg_gen_op1(opc, type, a1);
 }
 
 static void DNI tcg_gen_op2_i32(TCGOpcode opc, TCGv_i32 a1, TCGv_i32 a2)
 {
-    tcg_gen_op2(opc, tcgv_i32_arg(a1), tcgv_i32_arg(a2));
+    tcg_gen_op2(opc, TCG_TYPE_I32, tcgv_i32_arg(a1), tcgv_i32_arg(a2));
 }
 
 static void DNI tcg_gen_op2_i64(TCGOpcode opc, TCGv_i64 a1, TCGv_i64 a2)
 {
-    tcg_gen_op2(opc, tcgv_i64_arg(a1), tcgv_i64_arg(a2));
+    tcg_gen_op2(opc, TCG_TYPE_I64, tcgv_i64_arg(a1), tcgv_i64_arg(a2));
 }
 
 static void DNI tcg_gen_op3_i32(TCGOpcode opc, TCGv_i32 a1,
                                 TCGv_i32 a2, TCGv_i32 a3)
 {
-    tcg_gen_op3(opc, tcgv_i32_arg(a1), tcgv_i32_arg(a2), tcgv_i32_arg(a3));
+    tcg_gen_op3(opc, TCG_TYPE_I32, tcgv_i32_arg(a1),
+                tcgv_i32_arg(a2), tcgv_i32_arg(a3));
 }
 
 static void DNI tcg_gen_op3_i64(TCGOpcode opc, TCGv_i64 a1,
                                 TCGv_i64 a2, TCGv_i64 a3)
 {
-    tcg_gen_op3(opc, tcgv_i64_arg(a1), tcgv_i64_arg(a2), tcgv_i64_arg(a3));
+    tcg_gen_op3(opc, TCG_TYPE_I64, tcgv_i64_arg(a1),
+                tcgv_i64_arg(a2), tcgv_i64_arg(a3));
 }
 
 static void DNI tcg_gen_op3i_i32(TCGOpcode opc, TCGv_i32 a1,
                                  TCGv_i32 a2, TCGArg a3)
 {
-    tcg_gen_op3(opc, tcgv_i32_arg(a1), tcgv_i32_arg(a2), a3);
+    tcg_gen_op3(opc, TCG_TYPE_I32, tcgv_i32_arg(a1), tcgv_i32_arg(a2), a3);
 }
 
 static void DNI tcg_gen_op3i_i64(TCGOpcode opc, TCGv_i64 a1,
                                  TCGv_i64 a2, TCGArg a3)
 {
-    tcg_gen_op3(opc, tcgv_i64_arg(a1), tcgv_i64_arg(a2), a3);
+    tcg_gen_op3(opc, TCG_TYPE_I64, tcgv_i64_arg(a1), tcgv_i64_arg(a2), a3);
 }
 
 static void DNI tcg_gen_ldst_op_i32(TCGOpcode opc, TCGv_i32 val,
                                     TCGv_ptr base, TCGArg offset)
 {
-    tcg_gen_op3(opc, tcgv_i32_arg(val), tcgv_ptr_arg(base), offset);
+    tcg_gen_op3(opc, TCG_TYPE_I32, tcgv_i32_arg(val),
+                tcgv_ptr_arg(base), offset);
 }
 
 static void DNI tcg_gen_ldst_op_i64(TCGOpcode opc, TCGv_i64 val,
                                     TCGv_ptr base, TCGArg offset)
 {
-    tcg_gen_op3(opc, tcgv_i64_arg(val), tcgv_ptr_arg(base), offset);
+    tcg_gen_op3(opc, TCG_TYPE_I64, tcgv_i64_arg(val),
+                tcgv_ptr_arg(base), offset);
 }
 
 static void DNI tcg_gen_op4_i32(TCGOpcode opc, TCGv_i32 a1, TCGv_i32 a2,
                                 TCGv_i32 a3, TCGv_i32 a4)
 {
-    tcg_gen_op4(opc, tcgv_i32_arg(a1), tcgv_i32_arg(a2),
+    tcg_gen_op4(opc, TCG_TYPE_I32, tcgv_i32_arg(a1), tcgv_i32_arg(a2),
                 tcgv_i32_arg(a3), tcgv_i32_arg(a4));
 }
 
 static void DNI tcg_gen_op4_i64(TCGOpcode opc, TCGv_i64 a1, TCGv_i64 a2,
                                 TCGv_i64 a3, TCGv_i64 a4)
 {
-    tcg_gen_op4(opc, tcgv_i64_arg(a1), tcgv_i64_arg(a2),
+    tcg_gen_op4(opc, TCG_TYPE_I64, tcgv_i64_arg(a1), tcgv_i64_arg(a2),
                 tcgv_i64_arg(a3), tcgv_i64_arg(a4));
 }
 
 static void DNI tcg_gen_op4i_i32(TCGOpcode opc, TCGv_i32 a1, TCGv_i32 a2,
                                  TCGv_i32 a3, TCGArg a4)
 {
-    tcg_gen_op4(opc, tcgv_i32_arg(a1), tcgv_i32_arg(a2),
+    tcg_gen_op4(opc, TCG_TYPE_I32, tcgv_i32_arg(a1), tcgv_i32_arg(a2),
                 tcgv_i32_arg(a3), a4);
 }
 
 static void DNI tcg_gen_op4i_i64(TCGOpcode opc, TCGv_i64 a1, TCGv_i64 a2,
                                  TCGv_i64 a3, TCGArg a4)
 {
-    tcg_gen_op4(opc, tcgv_i64_arg(a1), tcgv_i64_arg(a2),
+    tcg_gen_op4(opc, TCG_TYPE_I64, tcgv_i64_arg(a1), tcgv_i64_arg(a2),
                 tcgv_i64_arg(a3), a4);
 }
 
 static TCGOp * DNI tcg_gen_op4ii_i32(TCGOpcode opc, TCGv_i32 a1, TCGv_i32 a2,
                                      TCGArg a3, TCGArg a4)
 {
-    return tcg_gen_op4(opc, tcgv_i32_arg(a1), tcgv_i32_arg(a2), a3, a4);
+    return tcg_gen_op4(opc, TCG_TYPE_I32,
+                       tcgv_i32_arg(a1), tcgv_i32_arg(a2), a3, a4);
 }
 
 static TCGOp * DNI tcg_gen_op4ii_i64(TCGOpcode opc, TCGv_i64 a1, TCGv_i64 a2,
                                      TCGArg a3, TCGArg a4)
 {
-    return tcg_gen_op4(opc, tcgv_i64_arg(a1), tcgv_i64_arg(a2), a3, a4);
+    return tcg_gen_op4(opc, TCG_TYPE_I64,
+                       tcgv_i64_arg(a1), tcgv_i64_arg(a2), a3, a4);
 }
 
 static void DNI tcg_gen_op5_i32(TCGOpcode opc, TCGv_i32 a1, TCGv_i32 a2,
                                 TCGv_i32 a3, TCGv_i32 a4, TCGv_i32 a5)
 {
-    tcg_gen_op5(opc, tcgv_i32_arg(a1), tcgv_i32_arg(a2),
+    tcg_gen_op5(opc, TCG_TYPE_I32, tcgv_i32_arg(a1), tcgv_i32_arg(a2),
                 tcgv_i32_arg(a3), tcgv_i32_arg(a4), tcgv_i32_arg(a5));
 }
 
 static void DNI tcg_gen_op5_i64(TCGOpcode opc, TCGv_i64 a1, TCGv_i64 a2,
                                 TCGv_i64 a3, TCGv_i64 a4, TCGv_i64 a5)
 {
-    tcg_gen_op5(opc, tcgv_i64_arg(a1), tcgv_i64_arg(a2),
+    tcg_gen_op5(opc, TCG_TYPE_I64, tcgv_i64_arg(a1), tcgv_i64_arg(a2),
                 tcgv_i64_arg(a3), tcgv_i64_arg(a4), tcgv_i64_arg(a5));
 }
 
 static void DNI tcg_gen_op5ii_i32(TCGOpcode opc, TCGv_i32 a1, TCGv_i32 a2,
                                   TCGv_i32 a3, TCGArg a4, TCGArg a5)
 {
-    tcg_gen_op5(opc, tcgv_i32_arg(a1), tcgv_i32_arg(a2),
+    tcg_gen_op5(opc, TCG_TYPE_I32, tcgv_i32_arg(a1), tcgv_i32_arg(a2),
                 tcgv_i32_arg(a3), a4, a5);
 }
 
 static void DNI tcg_gen_op5ii_i64(TCGOpcode opc, TCGv_i64 a1, TCGv_i64 a2,
                                   TCGv_i64 a3, TCGArg a4, TCGArg a5)
 {
-    tcg_gen_op5(opc, tcgv_i64_arg(a1), tcgv_i64_arg(a2),
+    tcg_gen_op5(opc, TCG_TYPE_I64, tcgv_i64_arg(a1), tcgv_i64_arg(a2),
                 tcgv_i64_arg(a3), a4, a5);
 }
 
@@ -XXX,XX +XXX,XX @@ static void DNI tcg_gen_op6_i32(TCGOpcode opc, TCGv_i32 a1, TCGv_i32 a2,
                                 TCGv_i32 a3, TCGv_i32 a4,
                                 TCGv_i32 a5, TCGv_i32 a6)
 {
-    tcg_gen_op6(opc, tcgv_i32_arg(a1), tcgv_i32_arg(a2),
+    tcg_gen_op6(opc, TCG_TYPE_I32, tcgv_i32_arg(a1), tcgv_i32_arg(a2),
                 tcgv_i32_arg(a3), tcgv_i32_arg(a4), tcgv_i32_arg(a5),
                 tcgv_i32_arg(a6));
 }
@@ -XXX,XX +XXX,XX @@ static void DNI tcg_gen_op6_i64(TCGOpcode opc, TCGv_i64 a1, TCGv_i64 a2,
                                 TCGv_i64 a3, TCGv_i64 a4,
                                 TCGv_i64 a5, TCGv_i64 a6)
 {
-    tcg_gen_op6(opc, tcgv_i64_arg(a1), tcgv_i64_arg(a2),
+    tcg_gen_op6(opc, TCG_TYPE_I64, tcgv_i64_arg(a1), tcgv_i64_arg(a2),
                 tcgv_i64_arg(a3), tcgv_i64_arg(a4), tcgv_i64_arg(a5),
                 tcgv_i64_arg(a6));
 }
@@ -XXX,XX +XXX,XX @@ static void DNI tcg_gen_op6i_i32(TCGOpcode opc, TCGv_i32 a1, TCGv_i32 a2,
                                  TCGv_i32 a3, TCGv_i32 a4,
                                  TCGv_i32 a5, TCGArg a6)
 {
-    tcg_gen_op6(opc, tcgv_i32_arg(a1), tcgv_i32_arg(a2),
+    tcg_gen_op6(opc, TCG_TYPE_I32, tcgv_i32_arg(a1), tcgv_i32_arg(a2),
                 tcgv_i32_arg(a3), tcgv_i32_arg(a4), tcgv_i32_arg(a5), a6);
 }
 
@@ -XXX,XX +XXX,XX @@ static void DNI tcg_gen_op6i_i64(TCGOpcode opc, TCGv_i64 a1, TCGv_i64 a2,
                                  TCGv_i64 a3, TCGv_i64 a4,
                                  TCGv_i64 a5, TCGArg a6)
 {
-    tcg_gen_op6(opc, tcgv_i64_arg(a1), tcgv_i64_arg(a2),
+    tcg_gen_op6(opc, TCG_TYPE_I64, tcgv_i64_arg(a1), tcgv_i64_arg(a2),
                 tcgv_i64_arg(a3), tcgv_i64_arg(a4), tcgv_i64_arg(a5), a6);
 }
 
@@ -XXX,XX +XXX,XX @@ static TCGOp * DNI tcg_gen_op6ii_i32(TCGOpcode opc, TCGv_i32 a1, TCGv_i32 a2,
                                      TCGv_i32 a3, TCGv_i32 a4,
                                      TCGArg a5, TCGArg a6)
 {
-    return tcg_gen_op6(opc, tcgv_i32_arg(a1), tcgv_i32_arg(a2),
+    return tcg_gen_op6(opc, TCG_TYPE_I32, tcgv_i32_arg(a1), tcgv_i32_arg(a2),
                        tcgv_i32_arg(a3), tcgv_i32_arg(a4), a5, a6);
 }
 
@@ -XXX,XX +XXX,XX @@ static TCGOp * DNI tcg_gen_op6ii_i32(TCGOpcode opc, TCGv_i32 a1, TCGv_i32 a2,
 void gen_set_label(TCGLabel *l)
 {
     l->present = 1;
-    tcg_gen_op1(INDEX_op_set_label, label_arg(l));
+    tcg_gen_op1(INDEX_op_set_label, 0, label_arg(l));
 }
 
 static void add_as_label_use(TCGLabel *l, TCGOp *op)
@@ -XXX,XX +XXX,XX @@ static void add_as_label_use(TCGLabel *l, TCGOp *op)
 
 void tcg_gen_br(TCGLabel *l)
 {
-    add_as_label_use(l, tcg_gen_op1(INDEX_op_br, label_arg(l)));
+    add_as_label_use(l, tcg_gen_op1(INDEX_op_br, 0, label_arg(l)));
 }
 
 void tcg_gen_mb(TCGBar mb_type)
@@ -XXX,XX +XXX,XX @@ void tcg_gen_mb(TCGBar mb_type)
 #endif
 
     if (parallel) {
-        tcg_gen_op1(INDEX_op_mb, mb_type);
+        tcg_gen_op1(INDEX_op_mb, 0, mb_type);
     }
 }
 
 void tcg_gen_plugin_cb(unsigned from)
 {
-    tcg_gen_op1(INDEX_op_plugin_cb, from);
+    tcg_gen_op1(INDEX_op_plugin_cb, 0, from);
 }
 
 void tcg_gen_plugin_mem_cb(TCGv_i64 addr, unsigned meminfo)
 {
-    tcg_gen_op2(INDEX_op_plugin_mem_cb, tcgv_i64_arg(addr), meminfo);
+    tcg_gen_op2(INDEX_op_plugin_mem_cb, 0, tcgv_i64_arg(addr), meminfo);
 }
 
 /* 32 bit ops */
 
 void tcg_gen_discard_i32(TCGv_i32 arg)
 {
-    tcg_gen_op1_i32(INDEX_op_discard, arg);
+    tcg_gen_op1_i32(INDEX_op_discard, TCG_TYPE_I32, arg);
 }
 
 void tcg_gen_mov_i32(TCGv_i32 ret, TCGv_i32 arg)
@@ -XXX,XX +XXX,XX @@ void tcg_gen_st_i32(TCGv_i32 arg1, TCGv_ptr arg2, tcg_target_long offset)
 void tcg_gen_discard_i64(TCGv_i64 arg)
 {
     if (TCG_TARGET_REG_BITS == 64) {
-        tcg_gen_op1_i64(INDEX_op_discard, arg);
+        tcg_gen_op1_i64(INDEX_op_discard, TCG_TYPE_I64, arg);
     } else {
         tcg_gen_discard_i32(TCGV_LOW(arg));
         tcg_gen_discard_i32(TCGV_HIGH(arg));
@@ -XXX,XX +XXX,XX @@ void tcg_gen_extrl_i64_i32(TCGv_i32 ret, TCGv_i64 arg)
     if (TCG_TARGET_REG_BITS == 32) {
         tcg_gen_mov_i32(ret, TCGV_LOW(arg));
     } else if (TCG_TARGET_HAS_extr_i64_i32) {
-        tcg_gen_op2(INDEX_op_extrl_i64_i32,
+        tcg_gen_op2(INDEX_op_extrl_i64_i32, TCG_TYPE_I32,
                     tcgv_i32_arg(ret), tcgv_i64_arg(arg));
     } else {
         tcg_gen_mov_i32(ret, (TCGv_i32)arg);
@@ -XXX,XX +XXX,XX @@ void tcg_gen_extrh_i64_i32(TCGv_i32 ret, TCGv_i64 arg)
     if (TCG_TARGET_REG_BITS == 32) {
         tcg_gen_mov_i32(ret, TCGV_HIGH(arg));
     } else if (TCG_TARGET_HAS_extr_i64_i32) {
-        tcg_gen_op2(INDEX_op_extrh_i64_i32,
+        tcg_gen_op2(INDEX_op_extrh_i64_i32, TCG_TYPE_I32,
                     tcgv_i32_arg(ret), tcgv_i64_arg(arg));
     } else {
         TCGv_i64 t = tcg_temp_ebb_new_i64();
@@ -XXX,XX +XXX,XX @@ void tcg_gen_extu_i32_i64(TCGv_i64 ret, TCGv_i32 arg)
         tcg_gen_mov_i32(TCGV_LOW(ret), arg);
         tcg_gen_movi_i32(TCGV_HIGH(ret), 0);
     } else {
-        tcg_gen_op2(INDEX_op_extu_i32_i64,
+        tcg_gen_op2(INDEX_op_extu_i32_i64, TCG_TYPE_I64,
                     tcgv_i64_arg(ret), tcgv_i32_arg(arg));
     }
 }
@@ -XXX,XX +XXX,XX @@ void tcg_gen_ext_i32_i64(TCGv_i64 ret, TCGv_i32 arg)
         tcg_gen_mov_i32(TCGV_LOW(ret), arg);
         tcg_gen_sari_i32(TCGV_HIGH(ret), TCGV_LOW(ret), 31);
     } else {
-        tcg_gen_op2(INDEX_op_ext_i32_i64,
+        tcg_gen_op2(INDEX_op_ext_i32_i64, TCG_TYPE_I64,
                     tcgv_i64_arg(ret), tcgv_i32_arg(arg));
     }
 }
@@ -XXX,XX +XXX,XX @@ void tcg_gen_exit_tb(const TranslationBlock *tb, unsigned idx)
         tcg_debug_assert(idx == TB_EXIT_REQUESTED);
     }
 
-    tcg_gen_op1i(INDEX_op_exit_tb, val);
+    tcg_gen_op1i(INDEX_op_exit_tb, 0, val);
 }
 
 void tcg_gen_goto_tb(unsigned idx)
@@ -XXX,XX +XXX,XX @@ void tcg_gen_goto_tb(unsigned idx)
     tcg_ctx->goto_tb_issue_mask |= 1 << idx;
 #endif
     plugin_gen_disable_mem_helpers();
-    tcg_gen_op1i(INDEX_op_goto_tb, idx);
+    tcg_gen_op1i(INDEX_op_goto_tb, 0, idx);
 }
 
 void tcg_gen_lookup_and_goto_ptr(void)
@@ -XXX,XX +XXX,XX @@ void tcg_gen_lookup_and_goto_ptr(void)
     plugin_gen_disable_mem_helpers();
     ptr = tcg_temp_ebb_new_ptr();
     gen_helper_lookup_tb_ptr(ptr, tcg_env);
-    tcg_gen_op1i(INDEX_op_goto_ptr, tcgv_ptr_arg(ptr));
+    tcg_gen_op1i(INDEX_op_goto_ptr, TCG_TYPE_PTR, tcgv_ptr_arg(ptr));
     tcg_temp_free_ptr(ptr);
 }
diff --git a/tcg/tcg.c b/tcg/tcg.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg.c
+++ b/tcg/tcg.c
@@ -XXX,XX +XXX,XX @@ void tcg_dump_ops(TCGContext *s, FILE *f, bool have_prefs)
             nb_cargs = def->nb_cargs;
 
             if (def->flags & TCG_OPF_VECTOR) {
-                col += ne_fprintf(f, "v%d,e%d,", 64 << TCGOP_VECL(op),
+                col += ne_fprintf(f, "v%d,e%d,",
+                                  8 * tcg_type_size(TCGOP_TYPE(op)),
                                   8 << TCGOP_VECE(op));
             }
 
@@ -XXX,XX +XXX,XX @@ static void tcg_reg_alloc_dup(TCGContext *s, const TCGOp *op)
 
     itype = its->type;
     vece = TCGOP_VECE(op);
-    vtype = TCGOP_VECL(op) + TCG_TYPE_V64;
+    vtype = TCGOP_TYPE(op);
 
     if (its->val_type == TEMP_VAL_CONST) {
         /* Propagate constant via movi -> dupi.  */
@@ -XXX,XX +XXX,XX @@ static void tcg_reg_alloc_op(TCGContext *s, const TCGOp *op)
         break;
     default:
         if (def->flags & TCG_OPF_VECTOR) {
-            tcg_out_vec_op(s, op->opc, TCGOP_VECL(op), TCGOP_VECE(op),
-                           new_args, const_args);
+            tcg_out_vec_op(s, op->opc, TCGOP_TYPE(op) - TCG_TYPE_V64,
+                           TCGOP_VECE(op), new_args, const_args);
         } else {
             tcg_out_op(s, op->opc, new_args, const_args);
         }
@@ -XXX,XX +XXX,XX @@ static bool tcg_reg_alloc_dup2(TCGContext *s, const TCGOp *op)
 {
     const TCGLifeData arg_life = op->life;
     TCGTemp *ots, *itsl, *itsh;
-    TCGType vtype = TCGOP_VECL(op) + TCG_TYPE_V64;
+    TCGType vtype = TCGOP_TYPE(op);
 
     /* This opcode is only valid for 32-bit hosts, for 64-bit elements. */
     tcg_debug_assert(TCG_TARGET_REG_BITS == 32);
diff --git a/docs/devel/tcg-ops.rst b/docs/devel/tcg-ops.rst
index XXXXXXX..XXXXXXX 100644
--- a/docs/devel/tcg-ops.rst
+++ b/docs/devel/tcg-ops.rst
@@ -XXX,XX +XXX,XX @@ QEMU specific operations
 Host vector operations
 ----------------------
 
-All of the vector ops have two parameters, ``TCGOP_VECL`` & ``TCGOP_VECE``.
-The former specifies the length of the vector in log2 64-bit units; the
-latter specifies the length of the element (if applicable) in log2 8-bit units.
-E.g. VECL = 1 -> 64 << 1 -> v128, and VECE = 2 -> 1 << 2 -> i32.
+All of the vector ops have two parameters, ``TCGOP_TYPE`` & ``TCGOP_VECE``.
+The former specifies the length of the vector as a TCGType; the latter
+specifies the length of the element (if applicable) in log2 8-bit units.
 
 .. list-table::
 
@@ -XXX,XX +XXX,XX @@ E.g. VECL = 1 -> 64 << 1 -> v128, and VECE = 2 -> 1 << 2 -> i32.
 
    * - dup_vec *v0*, *r1*
 
-     - | Duplicate the low N bits of *r1* into VECL/VECE copies across *v0*.
+     - | Duplicate the low N bits of *r1* into TYPE/VECE copies across *v0*.
 
    * - dupi_vec *v0*, *c*
 
@@ -XXX,XX +XXX,XX @@ E.g. VECL = 1 -> 64 << 1 -> v128, and VECE = 2 -> 1 << 2 -> i32.
 
    * - dup2_vec *v0*, *r1*, *r2*
 
-     - | Duplicate *r2*:*r1* into VECL/64 copies across *v0*. This opcode is
+     - | Duplicate *r2*:*r1* into TYPE/64 copies across *v0*. This opcode is
          only present for 32-bit hosts.
 
    * - add_vec *v0*, *v1*, *v2*
@@ -XXX,XX +XXX,XX @@ E.g. VECL = 1 -> 64 << 1 -> v128, and VECE = 2 -> 1 << 2 -> i32.
 
        .. code-block:: c
 
-          for (i = 0; i < VECL/VECE; ++i) {
+          for (i = 0; i < TYPE/VECE; ++i) {
               v0[i] = v1[i] << s2;
           }
 
@@ -XXX,XX +XXX,XX @@ E.g. VECL = 1 -> 64 << 1 -> v128, and VECE = 2 -> 1 << 2 -> i32.
 
        .. code-block:: c
 
-          for (i = 0; i < VECL/VECE; ++i) {
+          for (i = 0; i < TYPE/VECE; ++i) {
               v0[i] = v1[i] << v2[i];
           }
 
-- 
2.43.0

These are not particularly useful outside of optimization passes.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 include/tcg/tcg.h  | 4 ----
 tcg/tcg-internal.h | 5 +++++
 2 files changed, 5 insertions(+), 4 deletions(-)

diff --git a/include/tcg/tcg.h b/include/tcg/tcg.h
index XXXXXXX..XXXXXXX 100644
--- a/include/tcg/tcg.h
+++ b/include/tcg/tcg.h
@@ -XXX,XX +XXX,XX @@ void tcg_gen_call7(void *func, TCGHelperInfo *, TCGTemp *ret,
 
 TCGOp *tcg_emit_op(TCGOpcode opc, unsigned nargs);
 void tcg_op_remove(TCGContext *s, TCGOp *op);
-TCGOp *tcg_op_insert_before(TCGContext *s, TCGOp *op,
-                            TCGOpcode opc, unsigned nargs);
-TCGOp *tcg_op_insert_after(TCGContext *s, TCGOp *op,
-                           TCGOpcode opc, unsigned nargs);
 
 /**
  * tcg_remove_ops_after:
diff --git a/tcg/tcg-internal.h b/tcg/tcg-internal.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg-internal.h
+++ b/tcg/tcg-internal.h
@@ -XXX,XX +XXX,XX @@ void vec_gen_4(TCGOpcode, TCGType, unsigned, TCGArg, TCGArg, TCGArg, TCGArg);
 void vec_gen_6(TCGOpcode opc, TCGType type, unsigned vece, TCGArg r,
                TCGArg a, TCGArg b, TCGArg c, TCGArg d, TCGArg e);
 
+TCGOp *tcg_op_insert_before(TCGContext *s, TCGOp *op,
+                            TCGOpcode opc, unsigned nargs);
+TCGOp *tcg_op_insert_after(TCGContext *s, TCGOp *op,
+                           TCGOpcode opc, unsigned nargs);
+
 #endif /* TCG_INTERNAL_H */
-- 
2.43.0

Simplify use within the optimizers by defaulting the
new opcode to the same type as the old opcode.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 tcg/tcg.c | 4 ++++
 1 file changed, 4 insertions(+)

diff --git a/tcg/tcg.c b/tcg/tcg.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg.c
+++ b/tcg/tcg.c
@@ -XXX,XX +XXX,XX @@ TCGOp *tcg_op_insert_before(TCGContext *s, TCGOp *old_op,
                             TCGOpcode opc, unsigned nargs)
 {
     TCGOp *new_op = tcg_op_alloc(opc, nargs);
+
+    TCGOP_TYPE(new_op) = TCGOP_TYPE(old_op);
     QTAILQ_INSERT_BEFORE(old_op, new_op, link);
     return new_op;
 }
@@ -XXX,XX +XXX,XX @@ TCGOp *tcg_op_insert_after(TCGContext *s, TCGOp *old_op,
                            TCGOpcode opc, unsigned nargs)
 {
     TCGOp *new_op = tcg_op_alloc(opc, nargs);
+
+    TCGOP_TYPE(new_op) = TCGOP_TYPE(old_op);
     QTAILQ_INSERT_AFTER(&s->ops, old_op, new_op, link);
     return new_op;
 }
-- 
2.43.0

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 include/tcg/tcg.h |  7 ++++++-
 tcg/tcg.c         | 11 +++++++----
 2 files changed, 13 insertions(+), 5 deletions(-)

diff --git a/include/tcg/tcg.h b/include/tcg/tcg.h
index XXXXXXX..XXXXXXX 100644
--- a/include/tcg/tcg.h
+++ b/include/tcg/tcg.h
@@ -XXX,XX +XXX,XX @@ typedef struct TCGTargetOpDef {
     const char *args_ct_str[TCG_MAX_OP_ARGS];
 } TCGTargetOpDef;
 
-bool tcg_op_supported(TCGOpcode op);
+/*
+ * tcg_op_supported:
+ * Query if @op, for @type and @flags, is supported by the host
+ * on which we are currently executing.
+ */
+bool tcg_op_supported(TCGOpcode op, TCGType type, unsigned flags);
 
 void tcg_gen_call0(void *func, TCGHelperInfo *, TCGTemp *ret);
 void tcg_gen_call1(void *func, TCGHelperInfo *, TCGTemp *ret, TCGTemp *);
diff --git a/tcg/tcg.c b/tcg/tcg.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg.c
+++ b/tcg/tcg.c
@@ -XXX,XX +XXX,XX @@ TCGTemp *tcgv_i32_temp(TCGv_i32 v)
 }
 #endif /* CONFIG_DEBUG_TCG */
 
-/* Return true if OP may appear in the opcode stream.
-   Test the runtime variable that controls each opcode.  */
-bool tcg_op_supported(TCGOpcode op)
+/*
+ * Return true if OP may appear in the opcode stream with TYPE.
+ * Test the runtime variable that controls each opcode.
+ */
+bool tcg_op_supported(TCGOpcode op, TCGType type, unsigned flags)
 {
     const bool have_vec
         = TCG_TARGET_HAS_v64 | TCG_TARGET_HAS_v128 | TCG_TARGET_HAS_v256;
@@ -XXX,XX +XXX,XX @@ int tcg_gen_code(TCGContext *s, TranslationBlock *tb, uint64_t pc_start)
             /* fall through */
         default:
             /* Sanity check that we've not introduced any unhandled opcodes. */
-            tcg_debug_assert(tcg_op_supported(opc));
+            tcg_debug_assert(tcg_op_supported(opc, TCGOP_TYPE(op),
+                                              TCGOP_FLAGS(op)));
             /* Note: in order to speed up the code, it would be much
                faster to have specialized register allocator functions for
                some common argument patterns */
-- 
2.43.0

Rely on tcg-op-vec.c to expand the opcode if missing.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 target/arm/tcg/translate-sve.c | 20 ++++----------------
 1 file changed, 4 insertions(+), 16 deletions(-)

diff --git a/target/arm/tcg/translate-sve.c b/target/arm/tcg/translate-sve.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-sve.c
+++ b/target/arm/tcg/translate-sve.c
@@ -XXX,XX +XXX,XX @@ static void gen_bsl1n_i64(TCGv_i64 d, TCGv_i64 n, TCGv_i64 m, TCGv_i64 k)
 static void gen_bsl1n_vec(unsigned vece, TCGv_vec d, TCGv_vec n,
                           TCGv_vec m, TCGv_vec k)
 {
-    if (TCG_TARGET_HAS_bitsel_vec) {
-        tcg_gen_not_vec(vece, n, n);
-        tcg_gen_bitsel_vec(vece, d, k, n, m);
-    } else {
-        tcg_gen_andc_vec(vece, n, k, n);
-        tcg_gen_andc_vec(vece, m, m, k);
-        tcg_gen_or_vec(vece, d, n, m);
-    }
+    tcg_gen_not_vec(vece, n, n);
+    tcg_gen_bitsel_vec(vece, d, k, n, m);
 }
 
 static void gen_bsl1n(unsigned vece, uint32_t d, uint32_t n, uint32_t m,
@@ -XXX,XX +XXX,XX @@ static void gen_bsl2n_i64(TCGv_i64 d, TCGv_i64 n, TCGv_i64 m, TCGv_i64 k)
 static void gen_bsl2n_vec(unsigned vece, TCGv_vec d, TCGv_vec n,
                           TCGv_vec m, TCGv_vec k)
 {
-    if (TCG_TARGET_HAS_bitsel_vec) {
-        tcg_gen_not_vec(vece, m, m);
-        tcg_gen_bitsel_vec(vece, d, k, n, m);
-    } else {
-        tcg_gen_and_vec(vece, n, n, k);
-        tcg_gen_or_vec(vece, m, m, k);
-        tcg_gen_orc_vec(vece, d, n, m);
-    }
+    tcg_gen_not_vec(vece, m, m);
+    tcg_gen_bitsel_vec(vece, d, k, n, m);
 }
 
 static void gen_bsl2n(unsigned vece, uint32_t d, uint32_t n, uint32_t m,
-- 
2.43.0

Do not reference TCG_TARGET_HAS_* directly.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 target/arm/tcg/translate-a64.c | 10 ++++++----
 target/arm/tcg/translate-sve.c |  2 +-
 target/arm/tcg/translate.c     |  2 +-
 3 files changed, 8 insertions(+), 6 deletions(-)

diff --git a/target/arm/tcg/translate-a64.c b/target/arm/tcg/translate-a64.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-a64.c
+++ b/target/arm/tcg/translate-a64.c
@@ -XXX,XX +XXX,XX @@ static bool trans_CCMP(DisasContext *s, arg_CCMP *a)
     TCGv_i64 tcg_rn, tcg_y;
     DisasCompare c;
     unsigned nzcv;
+    bool has_andc;
 
     /* Set T0 = !COND.  */
     arm_test_cc(&c, a->cond);
@@ -XXX,XX +XXX,XX @@ static bool trans_CCMP(DisasContext *s, arg_CCMP *a)
     tcg_gen_subi_i32(tcg_t2, tcg_t0, 1);
 
     nzcv = a->nzcv;
+    has_andc = tcg_op_supported(INDEX_op_andc_i32, TCG_TYPE_I32, 0);
     if (nzcv & 8) { /* N */
         tcg_gen_or_i32(cpu_NF, cpu_NF, tcg_t1);
     } else {
-        if (TCG_TARGET_HAS_andc_i32) {
+        if (has_andc) {
             tcg_gen_andc_i32(cpu_NF, cpu_NF, tcg_t1);
         } else {
             tcg_gen_and_i32(cpu_NF, cpu_NF, tcg_t2);
         }
     }
     if (nzcv & 4) { /* Z */
-        if (TCG_TARGET_HAS_andc_i32) {
+        if (has_andc) {
             tcg_gen_andc_i32(cpu_ZF, cpu_ZF, tcg_t1);
         } else {
             tcg_gen_and_i32(cpu_ZF, cpu_ZF, tcg_t2);
@@ -XXX,XX +XXX,XX @@ static bool trans_CCMP(DisasContext *s, arg_CCMP *a)
     if (nzcv & 2) { /* C */
         tcg_gen_or_i32(cpu_CF, cpu_CF, tcg_t0);
     } else {
-        if (TCG_TARGET_HAS_andc_i32) {
+        if (has_andc) {
             tcg_gen_andc_i32(cpu_CF, cpu_CF, tcg_t1);
         } else {
             tcg_gen_and_i32(cpu_CF, cpu_CF, tcg_t2);
@@ -XXX,XX +XXX,XX @@ static bool trans_CCMP(DisasContext *s, arg_CCMP *a)
     if (nzcv & 1) { /* V */
         tcg_gen_or_i32(cpu_VF, cpu_VF, tcg_t1);
     } else {
-        if (TCG_TARGET_HAS_andc_i32) {
+        if (has_andc) {
             tcg_gen_andc_i32(cpu_VF, cpu_VF, tcg_t1);
         } else {
             tcg_gen_and_i32(cpu_VF, cpu_VF, tcg_t2);
diff --git a/target/arm/tcg/translate-sve.c b/target/arm/tcg/translate-sve.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate-sve.c
+++ b/target/arm/tcg/translate-sve.c
@@ -XXX,XX +XXX,XX @@ static void gen_bsl2n_i64(TCGv_i64 d, TCGv_i64 n, TCGv_i64 m, TCGv_i64 k)
      *       =         | ~(m | k)
      */
     tcg_gen_and_i64(n, n, k);
-    if (TCG_TARGET_HAS_orc_i64) {
+    if (tcg_op_supported(INDEX_op_orc_i64, TCG_TYPE_I64, 0)) {
         tcg_gen_or_i64(m, m, k);
         tcg_gen_orc_i64(d, n, m);
     } else {
diff --git a/target/arm/tcg/translate.c b/target/arm/tcg/translate.c
index XXXXXXX..XXXXXXX 100644
--- a/target/arm/tcg/translate.c
+++ b/target/arm/tcg/translate.c
@@ -XXX,XX +XXX,XX @@ static void gen_add_CC(TCGv_i32 dest, TCGv_i32 t0, TCGv_i32 t1)
 static void gen_adc_CC(TCGv_i32 dest, TCGv_i32 t0, TCGv_i32 t1)
 {
     TCGv_i32 tmp = tcg_temp_new_i32();
-    if (TCG_TARGET_HAS_add2_i32) {
+    if (tcg_op_supported(INDEX_op_add2_i32, TCG_TYPE_I32, 0)) {
         tcg_gen_movi_i32(tmp, 0);
         tcg_gen_add2_i32(cpu_NF, cpu_CF, t0, tmp, cpu_CF, tmp);
         tcg_gen_add2_i32(cpu_NF, cpu_CF, cpu_NF, cpu_CF, t1, tmp);
-- 
2.43.0

Do not reference TCG_TARGET_HAS_* directly.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 target/tricore/translate.c | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/target/tricore/translate.c b/target/tricore/translate.c
index XXXXXXX..XXXXXXX 100644
--- a/target/tricore/translate.c
+++ b/target/tricore/translate.c
@@ -XXX,XX +XXX,XX @@ static void decode_bit_andacc(DisasContext *ctx)
                     pos1, pos2, &tcg_gen_andc_tl, &tcg_gen_and_tl);
         break;
     case OPC2_32_BIT_AND_NOR_T:
-        if (TCG_TARGET_HAS_andc_i32) {
+        if (tcg_op_supported(INDEX_op_andc_i32, TCG_TYPE_I32, 0)) {
             gen_bit_2op(cpu_gpr_d[r3], cpu_gpr_d[r1], cpu_gpr_d[r2],
                         pos1, pos2, &tcg_gen_or_tl, &tcg_gen_andc_tl);
         } else {
@@ -XXX,XX +XXX,XX @@ static void decode_bit_orand(DisasContext *ctx)
                     pos1, pos2, &tcg_gen_andc_tl, &tcg_gen_or_tl);
         break;
     case OPC2_32_BIT_OR_NOR_T:
-        if (TCG_TARGET_HAS_orc_i32) {
+        if (tcg_op_supported(INDEX_op_orc_i32, TCG_TYPE_I32, 0)) {
             gen_bit_2op(cpu_gpr_d[r3], cpu_gpr_d[r1], cpu_gpr_d[r2],
                         pos1, pos2, &tcg_gen_or_tl, &tcg_gen_orc_tl);
         } else {
-- 
2.43.0

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 include/tcg/tcg.h |  6 ++++++
 tcg/tcg.c         | 21 +++++++++++++++++++++
 2 files changed, 27 insertions(+)

diff --git a/include/tcg/tcg.h b/include/tcg/tcg.h
index XXXXXXX..XXXXXXX 100644
--- a/include/tcg/tcg.h
+++ b/include/tcg/tcg.h
@@ -XXX,XX +XXX,XX @@ typedef struct TCGTargetOpDef {
  * on which we are currently executing.
  */
 bool tcg_op_supported(TCGOpcode op, TCGType type, unsigned flags);
+/*
+ * tcg_op_deposit_valid:
+ * Query if a deposit into (ofs, len) is supported for @type by
+ * the host on which we are currently executing.
+ */
+bool tcg_op_deposit_valid(TCGType type, unsigned ofs, unsigned len);
 
 void tcg_gen_call0(void *func, TCGHelperInfo *, TCGTemp *ret);
 void tcg_gen_call1(void *func, TCGHelperInfo *, TCGTemp *ret, TCGTemp *);
diff --git a/tcg/tcg.c b/tcg/tcg.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg.c
+++ b/tcg/tcg.c
@@ -XXX,XX +XXX,XX @@ bool tcg_op_supported(TCGOpcode op, TCGType type, unsigned flags)
     }
 }
 
+bool tcg_op_deposit_valid(TCGType type, unsigned ofs, unsigned len)
+{
+    tcg_debug_assert(len > 0);
+    switch (type) {
+    case TCG_TYPE_I32:
+        tcg_debug_assert(ofs < 32);
+        tcg_debug_assert(len <= 32);
+        tcg_debug_assert(ofs + len <= 32);
+        return TCG_TARGET_HAS_deposit_i32 &&
+               TCG_TARGET_deposit_i32_valid(ofs, len);
+    case TCG_TYPE_I64:
+        tcg_debug_assert(ofs < 64);
+        tcg_debug_assert(len <= 64);
+        tcg_debug_assert(ofs + len <= 64);
+        return TCG_TARGET_HAS_deposit_i64 &&
+               TCG_TARGET_deposit_i64_valid(ofs, len);
+    default:
+        g_assert_not_reached();
+    }
+}
+
 static TCGOp *tcg_op_alloc(TCGOpcode opc, unsigned nargs);
 
 static void tcg_gen_callN(void *func, TCGHelperInfo *info,
-- 
2.43.0

Avoid direct usage of TCG_TARGET_deposit_*_valid.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 target/i386/tcg/emit.c.inc | 6 ++----
 1 file changed, 2 insertions(+), 4 deletions(-)

diff --git a/target/i386/tcg/emit.c.inc b/target/i386/tcg/emit.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/target/i386/tcg/emit.c.inc
+++ b/target/i386/tcg/emit.c.inc
@@ -XXX,XX +XXX,XX @@
  */
 #ifdef TARGET_X86_64
 #define TCG_TARGET_HAS_extract2_tl      TCG_TARGET_HAS_extract2_i64
-#define TCG_TARGET_deposit_tl_valid     TCG_TARGET_deposit_i64_valid
 #else
 #define TCG_TARGET_HAS_extract2_tl      TCG_TARGET_HAS_extract2_i32
-#define TCG_TARGET_deposit_tl_valid     TCG_TARGET_deposit_i32_valid
 #endif
 
 #define MMX_OFFSET(reg)                        \
@@ -XXX,XX +XXX,XX @@ static void gen_RCL(DisasContext *s, X86DecodedInsn *decode)
     }
 
     /* Compute high part, including incoming carry.  */
-    if (!have_1bit_cin || TCG_TARGET_deposit_tl_valid(1, TARGET_LONG_BITS - 1)) {
+    if (!have_1bit_cin || tcg_op_deposit_valid(TCG_TYPE_TL, 1, TARGET_LONG_BITS - 1)) {
         /* high = (T0 << 1) | cin */
         TCGv cin = have_1bit_cin ? decode->cc_dst : decode->cc_src;
         tcg_gen_deposit_tl(high, cin, s->T0, 1, TARGET_LONG_BITS - 1);
@@ -XXX,XX +XXX,XX @@ static void gen_RCR(DisasContext *s, X86DecodedInsn *decode)
     }
 
     /* Save incoming carry into high, it will be shifted later.  */
-    if (!have_1bit_cin || TCG_TARGET_deposit_tl_valid(1, TARGET_LONG_BITS - 1)) {
+    if (!have_1bit_cin || tcg_op_deposit_valid(TCG_TYPE_TL, 1, TARGET_LONG_BITS - 1)) {
         TCGv cin = have_1bit_cin ? decode->cc_dst : decode->cc_src;
         tcg_gen_deposit_tl(high, cin, s->T0, 1, TARGET_LONG_BITS - 1);
     } else {
-- 
2.43.0

Do not reference TCG_TARGET_HAS_* directly.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 target/i386/tcg/emit.c.inc | 6 +++---
 1 file changed, 3 insertions(+), 3 deletions(-)

diff --git a/target/i386/tcg/emit.c.inc b/target/i386/tcg/emit.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/target/i386/tcg/emit.c.inc
+++ b/target/i386/tcg/emit.c.inc
@@ -XXX,XX +XXX,XX @@
  * The exact opcode to check depends on 32- vs. 64-bit.
  */
 #ifdef TARGET_X86_64
-#define TCG_TARGET_HAS_extract2_tl      TCG_TARGET_HAS_extract2_i64
+#define INDEX_op_extract2_tl            INDEX_op_extract2_i64
 #else
-#define TCG_TARGET_HAS_extract2_tl      TCG_TARGET_HAS_extract2_i32
+#define INDEX_op_extract2_tl            INDEX_op_extract2_i32
 #endif
 
 #define MMX_OFFSET(reg)                        \
@@ -XXX,XX +XXX,XX @@ static void gen_PMOVMSKB(DisasContext *s, X86DecodedInsn *decode)
     tcg_gen_ld8u_tl(s->T0, tcg_env, offsetof(CPUX86State, xmm_t0.ZMM_B(vec_len - 1)));
     while (vec_len > 8) {
         vec_len -= 8;
-        if (TCG_TARGET_HAS_extract2_tl) {
+        if (tcg_op_supported(INDEX_op_extract2_tl, TCG_TYPE_TL, 0)) {
             /*
              * Load the next byte of the result into the high byte of T.
              * TCG does a similar expansion of deposit to shl+extract2; by
-- 
2.43.0

Make these features unconditional, as they're used by most
tcg backends anyway.  Merge tcg-ldst.c.inc and tcg-pool.c.inc
into tcg.c and mark some of the functions unused, so that
when the features are not used we won't get Werrors.

diff --git a/include/tcg/tcg.h b/include/tcg/tcg.h
index XXXXXXX..XXXXXXX 100644
--- a/include/tcg/tcg.h
+++ b/include/tcg/tcg.h
@@ -XXX,XX +XXX,XX @@ struct TCGContext {
     CPUState *cpu;                      /* *_trans */
 
     /* These structures are private to tcg-target.c.inc.  */
-#ifdef TCG_TARGET_NEED_LDST_LABELS
     QSIMPLEQ_HEAD(, TCGLabelQemuLdst) ldst_labels;
-#endif
-#ifdef TCG_TARGET_NEED_POOL_LABELS
     struct TCGLabelPoolData *pool_labels;
-#endif
 
     TCGLabel *exitreq_label;
 
diff --git a/tcg/aarch64/tcg-target.h b/tcg/aarch64/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/aarch64/tcg-target.h
+++ b/tcg/aarch64/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
 #define TCG_TARGET_HAS_tst_vec          1
 
 #define TCG_TARGET_DEFAULT_MO (0)
-#define TCG_TARGET_NEED_LDST_LABELS
-#define TCG_TARGET_NEED_POOL_LABELS
 
 #endif /* AARCH64_TCG_TARGET_H */
diff --git a/tcg/arm/tcg-target.h b/tcg/arm/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/arm/tcg-target.h
+++ b/tcg/arm/tcg-target.h
@@ -XXX,XX +XXX,XX @@ extern bool use_neon_instructions;
 #define TCG_TARGET_HAS_tst_vec          1
 
 #define TCG_TARGET_DEFAULT_MO (0)
-#define TCG_TARGET_NEED_LDST_LABELS
-#define TCG_TARGET_NEED_POOL_LABELS
 
 #endif
diff --git a/tcg/i386/tcg-target.h b/tcg/i386/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/i386/tcg-target.h
+++ b/tcg/i386/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
 #include "tcg/tcg-mo.h"
 
 #define TCG_TARGET_DEFAULT_MO (TCG_MO_ALL & ~TCG_MO_ST_LD)
-#define TCG_TARGET_NEED_LDST_LABELS
-#define TCG_TARGET_NEED_POOL_LABELS
 
 #endif
diff --git a/tcg/loongarch64/tcg-target.h b/tcg/loongarch64/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/loongarch64/tcg-target.h
+++ b/tcg/loongarch64/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
 
 #define TCG_TARGET_DEFAULT_MO (0)
 
-#define TCG_TARGET_NEED_LDST_LABELS
-
 #endif /* LOONGARCH_TCG_TARGET_H */
diff --git a/tcg/mips/tcg-target.h b/tcg/mips/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/mips/tcg-target.h
+++ b/tcg/mips/tcg-target.h
@@ -XXX,XX +XXX,XX @@ extern bool use_mips32r2_instructions;
 #define TCG_TARGET_HAS_tst              0
 
 #define TCG_TARGET_DEFAULT_MO           0
-#define TCG_TARGET_NEED_LDST_LABELS
-#define TCG_TARGET_NEED_POOL_LABELS
 
 #endif
diff --git a/tcg/ppc/tcg-target.h b/tcg/ppc/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/ppc/tcg-target.h
+++ b/tcg/ppc/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
 #define TCG_TARGET_HAS_tst_vec          0
 
 #define TCG_TARGET_DEFAULT_MO (0)
-#define TCG_TARGET_NEED_LDST_LABELS
-#define TCG_TARGET_NEED_POOL_LABELS
 
 #endif
diff --git a/tcg/riscv/tcg-target.h b/tcg/riscv/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/riscv/tcg-target.h
+++ b/tcg/riscv/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
 
 #define TCG_TARGET_DEFAULT_MO (0)
 
-#define TCG_TARGET_NEED_LDST_LABELS
-#define TCG_TARGET_NEED_POOL_LABELS
-
 #endif
diff --git a/tcg/s390x/tcg-target.h b/tcg/s390x/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/s390x/tcg-target.h
+++ b/tcg/s390x/tcg-target.h
@@ -XXX,XX +XXX,XX @@ extern uint64_t s390_facilities[3];
 #define TCG_TARGET_HAS_tst_vec        0
 
 #define TCG_TARGET_DEFAULT_MO (TCG_MO_ALL & ~TCG_MO_ST_LD)
-#define TCG_TARGET_NEED_LDST_LABELS
-#define TCG_TARGET_NEED_POOL_LABELS
 
 #endif
diff --git a/tcg/sparc64/tcg-target.h b/tcg/sparc64/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/sparc64/tcg-target.h
+++ b/tcg/sparc64/tcg-target.h
@@ -XXX,XX +XXX,XX @@ extern bool use_vis3_instructions;
 #define TCG_AREG0 TCG_REG_I0
 
 #define TCG_TARGET_DEFAULT_MO (0)
-#define TCG_TARGET_NEED_LDST_LABELS
-#define TCG_TARGET_NEED_POOL_LABELS
 
 #endif
diff --git a/tcg/tcg.c b/tcg/tcg.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg.c
+++ b/tcg/tcg.c
@@ -XXX,XX +XXX,XX @@ static void tcg_target_init(TCGContext *s);
 static void tcg_target_qemu_prologue(TCGContext *s);
 static bool patch_reloc(tcg_insn_unit *code_ptr, int type,
                         intptr_t value, intptr_t addend);
+static void tcg_out_nop_fill(tcg_insn_unit *p, int count);
+
+typedef struct TCGLabelQemuLdst TCGLabelQemuLdst;
+static bool tcg_out_qemu_ld_slow_path(TCGContext *s, TCGLabelQemuLdst *l);
+static bool tcg_out_qemu_st_slow_path(TCGContext *s, TCGLabelQemuLdst *l);
 
 /* The CIE and FDE header definitions will be common to all hosts.  */
 typedef struct {
@@ -XXX,XX +XXX,XX @@ typedef struct QEMU_PACKED {
     DebugFrameFDEHeader fde;
 } DebugFrameHeader;
 
-typedef struct TCGLabelQemuLdst {
+struct TCGLabelQemuLdst {
     bool is_ld;             /* qemu_ld: true, qemu_st: false */
     MemOpIdx oi;
     TCGType type;           /* result type of a load */
@@ -XXX,XX +XXX,XX @@ typedef struct TCGLabelQemuLdst {
     const tcg_insn_unit *raddr;   /* addr of the next IR of qemu_ld/st IR */
     tcg_insn_unit *label_ptr[2]; /* label pointers to be updated */
     QSIMPLEQ_ENTRY(TCGLabelQemuLdst) next;
-} TCGLabelQemuLdst;
+};
 
 static void tcg_register_jit_int(const void *buf, size_t size,
                                  const void *debug_frame,
@@ -XXX,XX +XXX,XX @@ static void tcg_out_call(TCGContext *s, const tcg_insn_unit *target,
 static TCGReg tcg_target_call_oarg_reg(TCGCallReturnKind kind, int slot);
 static bool tcg_target_const_match(int64_t val, int ct,
                                    TCGType type, TCGCond cond, int vece);
-#ifdef TCG_TARGET_NEED_LDST_LABELS
-static int tcg_out_ldst_finalize(TCGContext *s);
-#endif
 
 #ifndef CONFIG_USER_ONLY
 #define guest_base  ({ qemu_build_not_reached(); (uintptr_t)0; })
@@ -XXX,XX +XXX,XX @@ static void tcg_out_movext3(TCGContext *s, const TCGMovExtend *i1,
     }
 }
 
+/*
+ * Allocate a new TCGLabelQemuLdst entry.
+ */
+
+__attribute__((unused))
+static TCGLabelQemuLdst *new_ldst_label(TCGContext *s)
+{
+    TCGLabelQemuLdst *l = tcg_malloc(sizeof(*l));
+
+    memset(l, 0, sizeof(*l));
+    QSIMPLEQ_INSERT_TAIL(&s->ldst_labels, l, next);
+
+    return l;
+}
+
+/*
+ * Allocate new constant pool entries.
+ */
+
+typedef struct TCGLabelPoolData {
+    struct TCGLabelPoolData *next;
+    tcg_insn_unit *label;
+    intptr_t addend;
+    int rtype;
+    unsigned nlong;
+    tcg_target_ulong data[];
+} TCGLabelPoolData;
+
+static TCGLabelPoolData *new_pool_alloc(TCGContext *s, int nlong, int rtype,
+                                        tcg_insn_unit *label, intptr_t addend)
+{
+    TCGLabelPoolData *n = tcg_malloc(sizeof(TCGLabelPoolData)
+                                     + sizeof(tcg_target_ulong) * nlong);
+
+    n->label = label;
+    n->addend = addend;
+    n->rtype = rtype;
+    n->nlong = nlong;
+    return n;
+}
+
+static void new_pool_insert(TCGContext *s, TCGLabelPoolData *n)
+{
+    TCGLabelPoolData *i, **pp;
+    int nlong = n->nlong;
+
+    /* Insertion sort on the pool.  */
+    for (pp = &s->pool_labels; (i = *pp) != NULL; pp = &i->next) {
+        if (nlong > i->nlong) {
+            break;
+        }
+        if (nlong < i->nlong) {
+            continue;
+        }
+        if (memcmp(n->data, i->data, sizeof(tcg_target_ulong) * nlong) >= 0) {
+            break;
+        }
+    }
+    n->next = *pp;
+    *pp = n;
+}
+
+/* The "usual" for generic integer code.  */
+__attribute__((unused))
+static void new_pool_label(TCGContext *s, tcg_target_ulong d, int rtype,
+                           tcg_insn_unit *label, intptr_t addend)
+{
+    TCGLabelPoolData *n = new_pool_alloc(s, 1, rtype, label, addend);
+    n->data[0] = d;
+    new_pool_insert(s, n);
+}
+
+/* For v64 or v128, depending on the host.  */
+__attribute__((unused))
+static void new_pool_l2(TCGContext *s, int rtype, tcg_insn_unit *label,
+                        intptr_t addend, tcg_target_ulong d0,
+                        tcg_target_ulong d1)
+{
+    TCGLabelPoolData *n = new_pool_alloc(s, 2, rtype, label, addend);
+    n->data[0] = d0;
+    n->data[1] = d1;
+    new_pool_insert(s, n);
+}
+
+/* For v128 or v256, depending on the host.  */
+__attribute__((unused))
+static void new_pool_l4(TCGContext *s, int rtype, tcg_insn_unit *label,
+                        intptr_t addend, tcg_target_ulong d0,
+                        tcg_target_ulong d1, tcg_target_ulong d2,
+                        tcg_target_ulong d3)
+{
+    TCGLabelPoolData *n = new_pool_alloc(s, 4, rtype, label, addend);
+    n->data[0] = d0;
+    n->data[1] = d1;
+    n->data[2] = d2;
+    n->data[3] = d3;
+    new_pool_insert(s, n);
+}
+
+/* For v256, for 32-bit host.  */
+__attribute__((unused))
+static void new_pool_l8(TCGContext *s, int rtype, tcg_insn_unit *label,
+                        intptr_t addend, tcg_target_ulong d0,
+                        tcg_target_ulong d1, tcg_target_ulong d2,
+                        tcg_target_ulong d3, tcg_target_ulong d4,
+                        tcg_target_ulong d5, tcg_target_ulong d6,
+                        tcg_target_ulong d7)
+{
+    TCGLabelPoolData *n = new_pool_alloc(s, 8, rtype, label, addend);
+    n->data[0] = d0;
+    n->data[1] = d1;
+    n->data[2] = d2;
+    n->data[3] = d3;
+    n->data[4] = d4;
+    n->data[5] = d5;
+    n->data[6] = d6;
+    n->data[7] = d7;
+    new_pool_insert(s, n);
+}
+
+/*
+ * Generate TB finalization at the end of block
+ */
+
+static int tcg_out_ldst_finalize(TCGContext *s)
+{
+    TCGLabelQemuLdst *lb;
+
+    /* qemu_ld/st slow paths */
+    QSIMPLEQ_FOREACH(lb, &s->ldst_labels, next) {
+        if (lb->is_ld
+            ? !tcg_out_qemu_ld_slow_path(s, lb)
+            : !tcg_out_qemu_st_slow_path(s, lb)) {
+            return -2;
+        }
+
+        /*
+         * Test for (pending) buffer overflow.  The assumption is that any
+         * one operation beginning below the high water mark cannot overrun
+         * the buffer completely.  Thus we can test for overflow after
+         * generating code without having to check during generation.
+         */
+        if (unlikely((void *)s->code_ptr > s->code_gen_highwater)) {
+            return -1;
+        }
+    }
+    return 0;
+}
+
+static int tcg_out_pool_finalize(TCGContext *s)
+{
+    TCGLabelPoolData *p = s->pool_labels;
+    TCGLabelPoolData *l = NULL;
+    void *a;
+
+    if (p == NULL) {
+        return 0;
+    }
+
+    /*
+     * ??? Round up to qemu_icache_linesize, but then do not round
+     * again when allocating the next TranslationBlock structure.
+     */
+    a = (void *)ROUND_UP((uintptr_t)s->code_ptr,
+                         sizeof(tcg_target_ulong) * p->nlong);
+    tcg_out_nop_fill(s->code_ptr, (tcg_insn_unit *)a - s->code_ptr);
+    s->data_gen_ptr = a;
+
+    for (; p != NULL; p = p->next) {
+        size_t size = sizeof(tcg_target_ulong) * p->nlong;
+        uintptr_t value;
+
+        if (!l || l->nlong != p->nlong || memcmp(l->data, p->data, size)) {
+            if (unlikely(a > s->code_gen_highwater)) {
+                return -1;
+            }
+            memcpy(a, p->data, size);
+            a += size;
+            l = p;
+        }
+
+        value = (uintptr_t)tcg_splitwx_to_rx(a) - size;
+        if (!patch_reloc(p->label, p->rtype, value, p->addend)) {
+            return -2;
+        }
+    }
+
+    s->code_ptr = a;
+    return 0;
+}
+
 #define C_PFX1(P, A)                    P##A
 #define C_PFX2(P, A, B)                 P##A##_##B
 #define C_PFX3(P, A, B, C)              P##A##_##B##_##C
@@ -XXX,XX +XXX,XX @@ int tcg_gen_code(TCGContext *s, TranslationBlock *tb, uint64_t pc_start)
     s->code_ptr = s->code_buf;
     s->data_gen_ptr = NULL;
 
-#ifdef TCG_TARGET_NEED_LDST_LABELS
     QSIMPLEQ_INIT(&s->ldst_labels);
-#endif
-#ifdef TCG_TARGET_NEED_POOL_LABELS
     s->pool_labels = NULL;
-#endif
 
     start_words = s->insn_start_words;
     s->gen_insn_data =
@@ -XXX,XX +XXX,XX @@ int tcg_gen_code(TCGContext *s, TranslationBlock *tb, uint64_t pc_start)
     s->gen_insn_end_off[num_insns] = tcg_current_code_size(s);
 
     /* Generate TB finalization at the end of block */
-#ifdef TCG_TARGET_NEED_LDST_LABELS
     i = tcg_out_ldst_finalize(s);
     if (i < 0) {
         return i;
     }
-#endif
-#ifdef TCG_TARGET_NEED_POOL_LABELS
     i = tcg_out_pool_finalize(s);
     if (i < 0) {
         return i;
     }
-#endif
     if (!tcg_resolve_relocs(s)) {
         return -2;
     }
diff --git a/tcg/aarch64/tcg-target.c.inc b/tcg/aarch64/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/aarch64/tcg-target.c.inc
+++ b/tcg/aarch64/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@
  * See the COPYING file in the top-level directory for details.
  */
 
-#include "../tcg-ldst.c.inc"
-#include "../tcg-pool.c.inc"
 #include "qemu/bitops.h"
 
 /* Used for function call generation. */
diff --git a/tcg/arm/tcg-target.c.inc b/tcg/arm/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/arm/tcg-target.c.inc
+++ b/tcg/arm/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@
  */
 
 #include "elf.h"
-#include "../tcg-ldst.c.inc"
-#include "../tcg-pool.c.inc"
 
 int arm_arch = __ARM_ARCH;
 
diff --git a/tcg/i386/tcg-target.c.inc b/tcg/i386/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/i386/tcg-target.c.inc
+++ b/tcg/i386/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@
  * THE SOFTWARE.
  */
 
-#include "../tcg-ldst.c.inc"
-#include "../tcg-pool.c.inc"
-
 /* Used for function call generation. */
 #define TCG_TARGET_STACK_ALIGN 16
 #if defined(_WIN64)
diff --git a/tcg/loongarch64/tcg-target.c.inc b/tcg/loongarch64/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/loongarch64/tcg-target.c.inc
+++ b/tcg/loongarch64/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@
  * THE SOFTWARE.
  */
 
-#include "../tcg-ldst.c.inc"
 #include <asm/hwcap.h>
 
 /* used for function call generation */
@@ -XXX,XX +XXX,XX @@ static void tcg_out_tb_start(TCGContext *s)
     /* nothing to do */
 }
 
+static void tcg_out_nop_fill(tcg_insn_unit *p, int count)
+{
+    for (int i = 0; i < count; ++i) {
+        /* Canonical nop is andi r0,r0,0 */
+        p[i] = OPC_ANDI;
+    }
+}
+
 static void tcg_target_init(TCGContext *s)
 {
     unsigned long hwcap = qemu_getauxval(AT_HWCAP);
diff --git a/tcg/mips/tcg-target.c.inc b/tcg/mips/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/mips/tcg-target.c.inc
+++ b/tcg/mips/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@
  * THE SOFTWARE.
  */
 
-#include "../tcg-ldst.c.inc"
-#include "../tcg-pool.c.inc"
-
 /* used for function call generation */
 #define TCG_TARGET_STACK_ALIGN        16
 #if _MIPS_SIM == _ABIO32
diff --git a/tcg/ppc/tcg-target.c.inc b/tcg/ppc/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/ppc/tcg-target.c.inc
+++ b/tcg/ppc/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@
  */
 
 #include "elf.h"
-#include "../tcg-pool.c.inc"
-#include "../tcg-ldst.c.inc"
 
 /*
  * Standardize on the _CALL_FOO symbols used by GCC:
diff --git a/tcg/riscv/tcg-target.c.inc b/tcg/riscv/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/riscv/tcg-target.c.inc
+++ b/tcg/riscv/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@
  * THE SOFTWARE.
  */
 
-#include "../tcg-ldst.c.inc"
-#include "../tcg-pool.c.inc"
-
 /* Used for function call generation. */
 #define TCG_REG_CALL_STACK              TCG_REG_SP
 #define TCG_TARGET_STACK_ALIGN          16
diff --git a/tcg/s390x/tcg-target.c.inc b/tcg/s390x/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/s390x/tcg-target.c.inc
+++ b/tcg/s390x/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@
  * THE SOFTWARE.
  */
 
-#include "../tcg-ldst.c.inc"
-#include "../tcg-pool.c.inc"
 #include "elf.h"
 
 /* Used for function call generation. */
diff --git a/tcg/sparc64/tcg-target.c.inc b/tcg/sparc64/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/sparc64/tcg-target.c.inc
+++ b/tcg/sparc64/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@
 #error "unsupported code generation mode"
 #endif
 
-#include "../tcg-ldst.c.inc"
-#include "../tcg-pool.c.inc"
-
 /* Used for function call generation. */
 #define TCG_REG_CALL_STACK              TCG_REG_O6
 #define TCG_TARGET_STACK_BIAS           2047
diff --git a/tcg/tcg-ldst.c.inc b/tcg/tcg-ldst.c.inc
deleted file mode 100644
index XXXXXXX..XXXXXXX
--- a/tcg/tcg-ldst.c.inc
+++ /dev/null
@@ -XXX,XX +XXX,XX @@
-/*
- * TCG Backend Data: load-store optimization only.
- *
- * Permission is hereby granted, free of charge, to any person obtaining a copy
- * of this software and associated documentation files (the "Software"), to deal
- * in the Software without restriction, including without limitation the rights
- * to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
- * copies of the Software, and to permit persons to whom the Software is
- * furnished to do so, subject to the following conditions:
- *
- * The above copyright notice and this permission notice shall be included in
- * all copies or substantial portions of the Software.
- *
- * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
- * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
- * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL
- * THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
- * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
- * OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN
- * THE SOFTWARE.
- */
-
-/*
- * Generate TB finalization at the end of block
- */
-
-static bool tcg_out_qemu_ld_slow_path(TCGContext *s, TCGLabelQemuLdst *l);
-static bool tcg_out_qemu_st_slow_path(TCGContext *s, TCGLabelQemuLdst *l);
-
-static int tcg_out_ldst_finalize(TCGContext *s)
-{
-    TCGLabelQemuLdst *lb;
-
-    /* qemu_ld/st slow paths */
-    QSIMPLEQ_FOREACH(lb, &s->ldst_labels, next) {
-        if (lb->is_ld
-            ? !tcg_out_qemu_ld_slow_path(s, lb)
-            : !tcg_out_qemu_st_slow_path(s, lb)) {
-            return -2;
-        }
-
-        /* Test for (pending) buffer overflow.  The assumption is that any
-           one operation beginning below the high water mark cannot overrun
-           the buffer completely.  Thus we can test for overflow after
-           generating code without having to check during generation.  */
-        if (unlikely((void *)s->code_ptr > s->code_gen_highwater)) {
-            return -1;
-        }
-    }
-    return 0;
-}
-
-/*
- * Allocate a new TCGLabelQemuLdst entry.
- */
-
-static inline TCGLabelQemuLdst *new_ldst_label(TCGContext *s)
-{
-    TCGLabelQemuLdst *l = tcg_malloc(sizeof(*l));
-
-    memset(l, 0, sizeof(*l));
-    QSIMPLEQ_INSERT_TAIL(&s->ldst_labels, l, next);
-
-    return l;
-}
diff --git a/tcg/tcg-pool.c.inc b/tcg/tcg-pool.c.inc
deleted file mode 100644
index XXXXXXX..XXXXXXX
--- a/tcg/tcg-pool.c.inc
+++ /dev/null
@@ -XXX,XX +XXX,XX @@
-/*
- * TCG Backend Data: constant pool.
- *
- * Permission is hereby granted, free of charge, to any person obtaining a copy
- * of this software and associated documentation files (the "Software"), to deal
- * in the Software without restriction, including without limitation the rights
- * to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
- * copies of the Software, and to permit persons to whom the Software is
- * furnished to do so, subject to the following conditions:
- *
- * The above copyright notice and this permission notice shall be included in
- * all copies or substantial portions of the Software.
- *
- * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
- * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
- * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL
- * THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
- * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
- * OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN
- * THE SOFTWARE.
- */
-
-typedef struct TCGLabelPoolData {
-    struct TCGLabelPoolData *next;
-    tcg_insn_unit *label;
-    intptr_t addend;
-    int rtype;
-    unsigned nlong;
-    tcg_target_ulong data[];
-} TCGLabelPoolData;
-
-
-static TCGLabelPoolData *new_pool_alloc(TCGContext *s, int nlong, int rtype,
-                                        tcg_insn_unit *label, intptr_t addend)
-{
-    TCGLabelPoolData *n = tcg_malloc(sizeof(TCGLabelPoolData)
-                                     + sizeof(tcg_target_ulong) * nlong);
-
-    n->label = label;
-    n->addend = addend;
-    n->rtype = rtype;
-    n->nlong = nlong;
-    return n;
-}
-
-static void new_pool_insert(TCGContext *s, TCGLabelPoolData *n)
-{
-    TCGLabelPoolData *i, **pp;
-    int nlong = n->nlong;
-
-    /* Insertion sort on the pool.  */
-    for (pp = &s->pool_labels; (i = *pp) != NULL; pp = &i->next) {
-        if (nlong > i->nlong) {
-            break;
-        }
-        if (nlong < i->nlong) {
-            continue;
-        }
-        if (memcmp(n->data, i->data, sizeof(tcg_target_ulong) * nlong) >= 0) {
-            break;
-        }
-    }
-    n->next = *pp;
-    *pp = n;
-}
-
-/* The "usual" for generic integer code.  */
-static inline void new_pool_label(TCGContext *s, tcg_target_ulong d, int rtype,
-                                  tcg_insn_unit *label, intptr_t addend)
-{
-    TCGLabelPoolData *n = new_pool_alloc(s, 1, rtype, label, addend);
-    n->data[0] = d;
-    new_pool_insert(s, n);
-}
-
-/* For v64 or v128, depending on the host.  */
-static inline void new_pool_l2(TCGContext *s, int rtype, tcg_insn_unit *label,
-                               intptr_t addend, tcg_target_ulong d0,
-                               tcg_target_ulong d1)
-{
-    TCGLabelPoolData *n = new_pool_alloc(s, 2, rtype, label, addend);
-    n->data[0] = d0;
-    n->data[1] = d1;
-    new_pool_insert(s, n);
-}
-
-/* For v128 or v256, depending on the host.  */
-static inline void new_pool_l4(TCGContext *s, int rtype, tcg_insn_unit *label,
-                               intptr_t addend, tcg_target_ulong d0,
-                               tcg_target_ulong d1, tcg_target_ulong d2,
-                               tcg_target_ulong d3)
-{
-    TCGLabelPoolData *n = new_pool_alloc(s, 4, rtype, label, addend);
-    n->data[0] = d0;
-    n->data[1] = d1;
-    n->data[2] = d2;
-    n->data[3] = d3;
-    new_pool_insert(s, n);
-}
-
-/* For v256, for 32-bit host.  */
-static inline void new_pool_l8(TCGContext *s, int rtype, tcg_insn_unit *label,
-                               intptr_t addend, tcg_target_ulong d0,
-                               tcg_target_ulong d1, tcg_target_ulong d2,
-                               tcg_target_ulong d3, tcg_target_ulong d4,
-                               tcg_target_ulong d5, tcg_target_ulong d6,
-                               tcg_target_ulong d7)
-{
-    TCGLabelPoolData *n = new_pool_alloc(s, 8, rtype, label, addend);
-    n->data[0] = d0;
-    n->data[1] = d1;
-    n->data[2] = d2;
-    n->data[3] = d3;
-    n->data[4] = d4;
-    n->data[5] = d5;
-    n->data[6] = d6;
-    n->data[7] = d7;
-    new_pool_insert(s, n);
-}
-
-/* To be provided by cpu/tcg-target.c.inc.  */
-static void tcg_out_nop_fill(tcg_insn_unit *p, int count);
-
-static int tcg_out_pool_finalize(TCGContext *s)
-{
-    TCGLabelPoolData *p = s->pool_labels;
-    TCGLabelPoolData *l = NULL;
-    void *a;
-
-    if (p == NULL) {
-        return 0;
-    }
-
-    /* ??? Round up to qemu_icache_linesize, but then do not round
-       again when allocating the next TranslationBlock structure.  */
-    a = (void *)ROUND_UP((uintptr_t)s->code_ptr,
-                         sizeof(tcg_target_ulong) * p->nlong);
-    tcg_out_nop_fill(s->code_ptr, (tcg_insn_unit *)a - s->code_ptr);
-    s->data_gen_ptr = a;
-
-    for (; p != NULL; p = p->next) {
-        size_t size = sizeof(tcg_target_ulong) * p->nlong;
-        uintptr_t value;
-
-        if (!l || l->nlong != p->nlong || memcmp(l->data, p->data, size)) {
-            if (unlikely(a > s->code_gen_highwater)) {
-                return -1;
-            }
-            memcpy(a, p->data, size);
-            a += size;
-            l = p;
-        }
-
-        value = (uintptr_t)tcg_splitwx_to_rx(a) - size;
-        if (!patch_reloc(p->label, p->rtype, value, p->addend)) {
-            return -2;
-        }
-    }
-
-    s->code_ptr = a;
-    return 0;
-}
diff --git a/tcg/tci/tcg-target.c.inc b/tcg/tci/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tci/tcg-target.c.inc
+++ b/tcg/tci/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@
  * THE SOFTWARE.
  */
 
-#include "../tcg-pool.c.inc"
-
 /* Used for function call generation. */
 #define TCG_TARGET_CALL_STACK_OFFSET    0
 #define TCG_TARGET_STACK_ALIGN          8
@@ -XXX,XX +XXX,XX @@ bool tcg_target_has_memory_bswap(MemOp memop)
 {
     return true;
 }
+
+static bool tcg_out_qemu_ld_slow_path(TCGContext *s, TCGLabelQemuLdst *l)
+{
+    g_assert_not_reached();
+}
+
+static bool tcg_out_qemu_st_slow_path(TCGContext *s, TCGLabelQemuLdst *l)
+{
+    g_assert_not_reached();
+}
-- 
2.43.0

In addition, add empty files for mips, sparc64 and tci.
Make the include unconditional within tcg-opc.h.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 include/tcg/tcg-opc.h                                      | 4 +---
 tcg/aarch64/{tcg-target.opc.h => tcg-target-opc.h.inc}     | 0
 tcg/arm/{tcg-target.opc.h => tcg-target-opc.h.inc}         | 0
 tcg/i386/{tcg-target.opc.h => tcg-target-opc.h.inc}        | 0
 tcg/loongarch64/{tcg-target.opc.h => tcg-target-opc.h.inc} | 0
 tcg/mips/tcg-target-opc.h.inc                              | 1 +
 tcg/ppc/{tcg-target.opc.h => tcg-target-opc.h.inc}         | 0
 tcg/riscv/{tcg-target.opc.h => tcg-target-opc.h.inc}       | 0
 tcg/s390x/{tcg-target.opc.h => tcg-target-opc.h.inc}       | 0
 tcg/sparc64/tcg-target-opc.h.inc                           | 1 +
 tcg/tci/tcg-target-opc.h.inc                               | 1 +
 11 files changed, 4 insertions(+), 3 deletions(-)
 rename tcg/aarch64/{tcg-target.opc.h => tcg-target-opc.h.inc} (100%)
 rename tcg/arm/{tcg-target.opc.h => tcg-target-opc.h.inc} (100%)
 rename tcg/i386/{tcg-target.opc.h => tcg-target-opc.h.inc} (100%)
 rename tcg/loongarch64/{tcg-target.opc.h => tcg-target-opc.h.inc} (100%)
 create mode 100644 tcg/mips/tcg-target-opc.h.inc
 rename tcg/ppc/{tcg-target.opc.h => tcg-target-opc.h.inc} (100%)
 rename tcg/riscv/{tcg-target.opc.h => tcg-target-opc.h.inc} (100%)
 rename tcg/s390x/{tcg-target.opc.h => tcg-target-opc.h.inc} (100%)
 create mode 100644 tcg/sparc64/tcg-target-opc.h.inc
 create mode 100644 tcg/tci/tcg-target-opc.h.inc

diff --git a/include/tcg/tcg-opc.h b/include/tcg/tcg-opc.h
index XXXXXXX..XXXXXXX 100644
--- a/include/tcg/tcg-opc.h
+++ b/include/tcg/tcg-opc.h
@@ -XXX,XX +XXX,XX @@ DEF(cmpsel_vec, 1, 4, 1, IMPLVEC | IMPL(TCG_TARGET_HAS_cmpsel_vec))
 
 DEF(last_generic, 0, 0, 0, TCG_OPF_NOT_PRESENT)
 
-#if TCG_TARGET_MAYBE_vec
-#include "tcg-target.opc.h"
-#endif
+#include "tcg-target-opc.h.inc"
 
 #ifdef TCG_TARGET_INTERPRETER
 /* These opcodes are only for use between the tci generator and interpreter. */
diff --git a/tcg/aarch64/tcg-target.opc.h b/tcg/aarch64/tcg-target-opc.h.inc
similarity index 100%
rename from tcg/aarch64/tcg-target.opc.h
rename to tcg/aarch64/tcg-target-opc.h.inc
diff --git a/tcg/arm/tcg-target.opc.h b/tcg/arm/tcg-target-opc.h.inc
similarity index 100%
rename from tcg/arm/tcg-target.opc.h
rename to tcg/arm/tcg-target-opc.h.inc
diff --git a/tcg/i386/tcg-target.opc.h b/tcg/i386/tcg-target-opc.h.inc
similarity index 100%
rename from tcg/i386/tcg-target.opc.h
rename to tcg/i386/tcg-target-opc.h.inc
diff --git a/tcg/loongarch64/tcg-target.opc.h b/tcg/loongarch64/tcg-target-opc.h.inc
similarity index 100%
rename from tcg/loongarch64/tcg-target.opc.h
rename to tcg/loongarch64/tcg-target-opc.h.inc
diff --git a/tcg/mips/tcg-target-opc.h.inc b/tcg/mips/tcg-target-opc.h.inc
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/tcg/mips/tcg-target-opc.h.inc
@@ -0,0 +1 @@
+/* No target specific opcodes. */
diff --git a/tcg/ppc/tcg-target.opc.h b/tcg/ppc/tcg-target-opc.h.inc
similarity index 100%
rename from tcg/ppc/tcg-target.opc.h
rename to tcg/ppc/tcg-target-opc.h.inc
diff --git a/tcg/riscv/tcg-target.opc.h b/tcg/riscv/tcg-target-opc.h.inc
similarity index 100%
rename from tcg/riscv/tcg-target.opc.h
rename to tcg/riscv/tcg-target-opc.h.inc
diff --git a/tcg/s390x/tcg-target.opc.h b/tcg/s390x/tcg-target-opc.h.inc
similarity index 100%
rename from tcg/s390x/tcg-target.opc.h
rename to tcg/s390x/tcg-target-opc.h.inc
diff --git a/tcg/sparc64/tcg-target-opc.h.inc b/tcg/sparc64/tcg-target-opc.h.inc
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/tcg/sparc64/tcg-target-opc.h.inc
@@ -0,0 +1 @@
+/* No target specific opcodes. */
diff --git a/tcg/tci/tcg-target-opc.h.inc b/tcg/tci/tcg-target-opc.h.inc
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/tcg/tci/tcg-target-opc.h.inc
@@ -0,0 +1 @@
+/* No target specific opcodes. */
-- 
2.43.0

Now that tcg-target-opc.h.inc is unconditional,
we can move these out of the generic header.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 include/tcg/tcg-opc.h        | 6 ------
 tcg/tci/tcg-target-opc.h.inc | 5 ++++-
 2 files changed, 4 insertions(+), 7 deletions(-)

diff --git a/include/tcg/tcg-opc.h b/include/tcg/tcg-opc.h
index XXXXXXX..XXXXXXX 100644
--- a/include/tcg/tcg-opc.h
+++ b/include/tcg/tcg-opc.h
@@ -XXX,XX +XXX,XX @@ DEF(last_generic, 0, 0, 0, TCG_OPF_NOT_PRESENT)
 
 #include "tcg-target-opc.h.inc"
 
-#ifdef TCG_TARGET_INTERPRETER
-/* These opcodes are only for use between the tci generator and interpreter. */
-DEF(tci_movi, 1, 0, 1, TCG_OPF_NOT_PRESENT)
-DEF(tci_movl, 1, 0, 1, TCG_OPF_NOT_PRESENT)
-#endif
-
 #undef DATA64_ARGS
 #undef IMPL
 #undef IMPL64
diff --git a/tcg/tci/tcg-target-opc.h.inc b/tcg/tci/tcg-target-opc.h.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tci/tcg-target-opc.h.inc
+++ b/tcg/tci/tcg-target-opc.h.inc
@@ -1 +1,4 @@
-/* No target specific opcodes. */
+/* SPDX-License-Identifier: MIT */
+/* These opcodes for use between the tci generator and interpreter. */
+DEF(tci_movi, 1, 0, 1, TCG_OPF_NOT_PRESENT)
+DEF(tci_movl, 1, 0, 1, TCG_OPF_NOT_PRESENT)
-- 
2.43.0

Don't reference TCG_TARGET_MAYBE_vec in a public header.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 include/tcg/tcg.h | 7 -------
 tcg/tcg.c         | 4 ++++
 2 files changed, 4 insertions(+), 7 deletions(-)

diff --git a/include/tcg/tcg.h b/include/tcg/tcg.h
index XXXXXXX..XXXXXXX 100644
--- a/include/tcg/tcg.h
+++ b/include/tcg/tcg.h
@@ -XXX,XX +XXX,XX @@ extern tcg_prologue_fn *tcg_qemu_tb_exec;
 
 void tcg_register_jit(const void *buf, size_t buf_size);
 
-#if TCG_TARGET_MAYBE_vec
 /* Return zero if the tuple (opc, type, vece) is unsupportable;
    return > 0 if it is directly supportable;
    return < 0 if we must call tcg_expand_vec_op.  */
 int tcg_can_emit_vec_op(TCGOpcode, TCGType, unsigned);
-#else
-static inline int tcg_can_emit_vec_op(TCGOpcode o, TCGType t, unsigned ve)
-{
-    return 0;
-}
-#endif
 
 /* Expand the tuple (opc, type, vece) on the given arguments.  */
 void tcg_expand_vec_op(TCGOpcode, TCGType, unsigned, TCGArg, ...);
diff --git a/tcg/tcg.c b/tcg/tcg.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg.c
+++ b/tcg/tcg.c
@@ -XXX,XX +XXX,XX @@ static inline void tcg_out_vec_op(TCGContext *s, TCGOpcode opc,
 {
     g_assert_not_reached();
 }
+int tcg_can_emit_vec_op(TCGOpcode o, TCGType t, unsigned ve)
+{
+    return 0;
+}
 #endif
 static void tcg_out_st(TCGContext *s, TCGType type, TCGReg arg, TCGReg arg1,
                        intptr_t arg2);
-- 
2.43.0

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Signed-off-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Message-ID: <20250108215156.8731-3-philmd@linaro.org>
---
 include/tcg/tcg.h | 105 +-----------------------------------------
 tcg/tcg-has.h     | 115 ++++++++++++++++++++++++++++++++++++++++++++++
 2 files changed, 116 insertions(+), 104 deletions(-)
 create mode 100644 tcg/tcg-has.h

diff --git a/include/tcg/tcg.h b/include/tcg/tcg.h
index XXXXXXX..XXXXXXX 100644
--- a/include/tcg/tcg.h
+++ b/include/tcg/tcg.h
@@ -XXX,XX +XXX,XX @@ typedef uint64_t TCGRegSet;
 #error unsupported
 #endif
 
-#if TCG_TARGET_REG_BITS == 32
-/* Turn some undef macros into false macros.  */
-#define TCG_TARGET_HAS_extr_i64_i32     0
-#define TCG_TARGET_HAS_div_i64          0
-#define TCG_TARGET_HAS_rem_i64          0
-#define TCG_TARGET_HAS_div2_i64         0
-#define TCG_TARGET_HAS_rot_i64          0
-#define TCG_TARGET_HAS_ext8s_i64        0
-#define TCG_TARGET_HAS_ext16s_i64       0
-#define TCG_TARGET_HAS_ext32s_i64       0
-#define TCG_TARGET_HAS_ext8u_i64        0
-#define TCG_TARGET_HAS_ext16u_i64       0
-#define TCG_TARGET_HAS_ext32u_i64       0
-#define TCG_TARGET_HAS_bswap16_i64      0
-#define TCG_TARGET_HAS_bswap32_i64      0
-#define TCG_TARGET_HAS_bswap64_i64      0
-#define TCG_TARGET_HAS_not_i64          0
-#define TCG_TARGET_HAS_andc_i64         0
-#define TCG_TARGET_HAS_orc_i64          0
-#define TCG_TARGET_HAS_eqv_i64          0
-#define TCG_TARGET_HAS_nand_i64         0
-#define TCG_TARGET_HAS_nor_i64          0
-#define TCG_TARGET_HAS_clz_i64          0
-#define TCG_TARGET_HAS_ctz_i64          0
-#define TCG_TARGET_HAS_ctpop_i64        0
-#define TCG_TARGET_HAS_deposit_i64      0
-#define TCG_TARGET_HAS_extract_i64      0
-#define TCG_TARGET_HAS_sextract_i64     0
-#define TCG_TARGET_HAS_extract2_i64     0
-#define TCG_TARGET_HAS_negsetcond_i64   0
-#define TCG_TARGET_HAS_add2_i64         0
-#define TCG_TARGET_HAS_sub2_i64         0
-#define TCG_TARGET_HAS_mulu2_i64        0
-#define TCG_TARGET_HAS_muls2_i64        0
-#define TCG_TARGET_HAS_muluh_i64        0
-#define TCG_TARGET_HAS_mulsh_i64        0
-/* Turn some undef macros into true macros.  */
-#define TCG_TARGET_HAS_add2_i32         1
-#define TCG_TARGET_HAS_sub2_i32         1
-#endif
-
-#ifndef TCG_TARGET_deposit_i32_valid
-#define TCG_TARGET_deposit_i32_valid(ofs, len) 1
-#endif
-#ifndef TCG_TARGET_deposit_i64_valid
-#define TCG_TARGET_deposit_i64_valid(ofs, len) 1
-#endif
-#ifndef TCG_TARGET_extract_i32_valid
-#define TCG_TARGET_extract_i32_valid(ofs, len) 1
-#endif
-#ifndef TCG_TARGET_extract_i64_valid
-#define TCG_TARGET_extract_i64_valid(ofs, len) 1
-#endif
-
-/* Only one of DIV or DIV2 should be defined.  */
-#if defined(TCG_TARGET_HAS_div_i32)
-#define TCG_TARGET_HAS_div2_i32         0
-#elif defined(TCG_TARGET_HAS_div2_i32)
-#define TCG_TARGET_HAS_div_i32          0
-#define TCG_TARGET_HAS_rem_i32          0
-#endif
-#if defined(TCG_TARGET_HAS_div_i64)
-#define TCG_TARGET_HAS_div2_i64         0
-#elif defined(TCG_TARGET_HAS_div2_i64)
-#define TCG_TARGET_HAS_div_i64          0
-#define TCG_TARGET_HAS_rem_i64          0
-#endif
-
-#if !defined(TCG_TARGET_HAS_v64) \
-    && !defined(TCG_TARGET_HAS_v128) \
-    && !defined(TCG_TARGET_HAS_v256)
-#define TCG_TARGET_MAYBE_vec            0
-#define TCG_TARGET_HAS_abs_vec          0
-#define TCG_TARGET_HAS_neg_vec          0
-#define TCG_TARGET_HAS_not_vec          0
-#define TCG_TARGET_HAS_andc_vec         0
-#define TCG_TARGET_HAS_orc_vec          0
-#define TCG_TARGET_HAS_nand_vec         0
-#define TCG_TARGET_HAS_nor_vec          0
-#define TCG_TARGET_HAS_eqv_vec          0
-#define TCG_TARGET_HAS_roti_vec         0
-#define TCG_TARGET_HAS_rots_vec         0
-#define TCG_TARGET_HAS_rotv_vec         0
-#define TCG_TARGET_HAS_shi_vec          0
-#define TCG_TARGET_HAS_shs_vec          0
-#define TCG_TARGET_HAS_shv_vec          0
-#define TCG_TARGET_HAS_mul_vec          0
-#define TCG_TARGET_HAS_sat_vec          0
-#define TCG_TARGET_HAS_minmax_vec       0
-#define TCG_TARGET_HAS_bitsel_vec       0
-#define TCG_TARGET_HAS_cmpsel_vec       0
-#define TCG_TARGET_HAS_tst_vec          0
-#else
-#define TCG_TARGET_MAYBE_vec            1
-#endif
-#ifndef TCG_TARGET_HAS_v64
-#define TCG_TARGET_HAS_v64              0
-#endif
-#ifndef TCG_TARGET_HAS_v128
-#define TCG_TARGET_HAS_v128             0
-#endif
-#ifndef TCG_TARGET_HAS_v256
-#define TCG_TARGET_HAS_v256             0
-#endif
+#include "tcg/tcg-has.h"
 
 typedef enum TCGOpcode {
 #define DEF(name, oargs, iargs, cargs, flags) INDEX_op_ ## name,
diff --git a/tcg/tcg-has.h b/tcg/tcg-has.h
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/tcg/tcg-has.h
@@ -XXX,XX +XXX,XX @@
+/* SPDX-License-Identifier: MIT */
+/*
+ * Define target-specific opcode support
+ * Copyright (c) 2024 Linaro, Ltd.
+ */
+
+#ifndef TCG_HAS_H
+#define TCG_HAS_H
+
+#if TCG_TARGET_REG_BITS == 32
+/* Turn some undef macros into false macros.  */
+#define TCG_TARGET_HAS_extr_i64_i32     0
+#define TCG_TARGET_HAS_div_i64          0
+#define TCG_TARGET_HAS_rem_i64          0
+#define TCG_TARGET_HAS_div2_i64         0
+#define TCG_TARGET_HAS_rot_i64          0
+#define TCG_TARGET_HAS_ext8s_i64        0
+#define TCG_TARGET_HAS_ext16s_i64       0
+#define TCG_TARGET_HAS_ext32s_i64       0
+#define TCG_TARGET_HAS_ext8u_i64        0
+#define TCG_TARGET_HAS_ext16u_i64       0
+#define TCG_TARGET_HAS_ext32u_i64       0
+#define TCG_TARGET_HAS_bswap16_i64      0
+#define TCG_TARGET_HAS_bswap32_i64      0
+#define TCG_TARGET_HAS_bswap64_i64      0
+#define TCG_TARGET_HAS_not_i64          0
+#define TCG_TARGET_HAS_andc_i64         0
+#define TCG_TARGET_HAS_orc_i64          0
+#define TCG_TARGET_HAS_eqv_i64          0
+#define TCG_TARGET_HAS_nand_i64         0
+#define TCG_TARGET_HAS_nor_i64          0
+#define TCG_TARGET_HAS_clz_i64          0
+#define TCG_TARGET_HAS_ctz_i64          0
+#define TCG_TARGET_HAS_ctpop_i64        0
+#define TCG_TARGET_HAS_deposit_i64      0
+#define TCG_TARGET_HAS_extract_i64      0
+#define TCG_TARGET_HAS_sextract_i64     0
+#define TCG_TARGET_HAS_extract2_i64     0
+#define TCG_TARGET_HAS_negsetcond_i64   0
+#define TCG_TARGET_HAS_add2_i64         0
+#define TCG_TARGET_HAS_sub2_i64         0
+#define TCG_TARGET_HAS_mulu2_i64        0
+#define TCG_TARGET_HAS_muls2_i64        0
+#define TCG_TARGET_HAS_muluh_i64        0
+#define TCG_TARGET_HAS_mulsh_i64        0
+/* Turn some undef macros into true macros.  */
+#define TCG_TARGET_HAS_add2_i32         1
+#define TCG_TARGET_HAS_sub2_i32         1
+#endif
+
+#ifndef TCG_TARGET_deposit_i32_valid
+#define TCG_TARGET_deposit_i32_valid(ofs, len) 1
+#endif
+#ifndef TCG_TARGET_deposit_i64_valid
+#define TCG_TARGET_deposit_i64_valid(ofs, len) 1
+#endif
+#ifndef TCG_TARGET_extract_i32_valid
+#define TCG_TARGET_extract_i32_valid(ofs, len) 1
+#endif
+#ifndef TCG_TARGET_extract_i64_valid
+#define TCG_TARGET_extract_i64_valid(ofs, len) 1
+#endif
+
+/* Only one of DIV or DIV2 should be defined.  */
+#if defined(TCG_TARGET_HAS_div_i32)
+#define TCG_TARGET_HAS_div2_i32         0
+#elif defined(TCG_TARGET_HAS_div2_i32)
+#define TCG_TARGET_HAS_div_i32          0
+#define TCG_TARGET_HAS_rem_i32          0
+#endif
+#if defined(TCG_TARGET_HAS_div_i64)
+#define TCG_TARGET_HAS_div2_i64         0
+#elif defined(TCG_TARGET_HAS_div2_i64)
+#define TCG_TARGET_HAS_div_i64          0
+#define TCG_TARGET_HAS_rem_i64          0
+#endif
+
+#if !defined(TCG_TARGET_HAS_v64) \
+    && !defined(TCG_TARGET_HAS_v128) \
+    && !defined(TCG_TARGET_HAS_v256)
+#define TCG_TARGET_MAYBE_vec            0
+#define TCG_TARGET_HAS_abs_vec          0
+#define TCG_TARGET_HAS_neg_vec          0
+#define TCG_TARGET_HAS_not_vec          0
+#define TCG_TARGET_HAS_andc_vec         0
+#define TCG_TARGET_HAS_orc_vec          0
+#define TCG_TARGET_HAS_nand_vec         0
+#define TCG_TARGET_HAS_nor_vec          0
+#define TCG_TARGET_HAS_eqv_vec          0
+#define TCG_TARGET_HAS_roti_vec         0
+#define TCG_TARGET_HAS_rots_vec         0
+#define TCG_TARGET_HAS_rotv_vec         0
+#define TCG_TARGET_HAS_shi_vec          0
+#define TCG_TARGET_HAS_shs_vec          0
+#define TCG_TARGET_HAS_shv_vec          0
+#define TCG_TARGET_HAS_mul_vec          0
+#define TCG_TARGET_HAS_sat_vec          0
+#define TCG_TARGET_HAS_minmax_vec       0
+#define TCG_TARGET_HAS_bitsel_vec       0
+#define TCG_TARGET_HAS_cmpsel_vec       0
+#define TCG_TARGET_HAS_tst_vec          0
+#else
+#define TCG_TARGET_MAYBE_vec            1
+#endif
+#ifndef TCG_TARGET_HAS_v64
+#define TCG_TARGET_HAS_v64              0
+#endif
+#ifndef TCG_TARGET_HAS_v128
+#define TCG_TARGET_HAS_v128             0
+#endif
+#ifndef TCG_TARGET_HAS_v256
+#define TCG_TARGET_HAS_v256             0
+#endif
+
+#endif
-- 
2.43.0

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Signed-off-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Message-ID: <20250108215156.8731-4-philmd@linaro.org>
---
 tcg/aarch64/tcg-target-has.h | 119 +++++++++++++++++++++++++++++++++++
 tcg/aarch64/tcg-target.h     | 109 +-------------------------------
 2 files changed, 120 insertions(+), 108 deletions(-)
 create mode 100644 tcg/aarch64/tcg-target-has.h

diff --git a/tcg/aarch64/tcg-target-has.h b/tcg/aarch64/tcg-target-has.h
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/tcg/aarch64/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@
+/* SPDX-License-Identifier: GPL-2.0-or-later */
+/*
+ * Define target-specific opcode support
+ * Copyright (c) 2013 Huawei Technologies Duesseldorf GmbH
+ */
+
+#ifndef TCG_TARGET_HAS_H
+#define TCG_TARGET_HAS_H
+
+#include "host/cpuinfo.h"
+
+#define have_lse    (cpuinfo & CPUINFO_LSE)
+#define have_lse2   (cpuinfo & CPUINFO_LSE2)
+
+/* optional instructions */
+#define TCG_TARGET_HAS_div_i32          1
+#define TCG_TARGET_HAS_rem_i32          1
+#define TCG_TARGET_HAS_ext8s_i32        1
+#define TCG_TARGET_HAS_ext16s_i32       1
+#define TCG_TARGET_HAS_ext8u_i32        1
+#define TCG_TARGET_HAS_ext16u_i32       1
+#define TCG_TARGET_HAS_bswap16_i32      1
+#define TCG_TARGET_HAS_bswap32_i32      1
+#define TCG_TARGET_HAS_not_i32          1
+#define TCG_TARGET_HAS_rot_i32          1
+#define TCG_TARGET_HAS_andc_i32         1
+#define TCG_TARGET_HAS_orc_i32          1
+#define TCG_TARGET_HAS_eqv_i32          1
+#define TCG_TARGET_HAS_nand_i32         0
+#define TCG_TARGET_HAS_nor_i32          0
+#define TCG_TARGET_HAS_clz_i32          1
+#define TCG_TARGET_HAS_ctz_i32          1
+#define TCG_TARGET_HAS_ctpop_i32        0
+#define TCG_TARGET_HAS_deposit_i32      1
+#define TCG_TARGET_HAS_extract_i32      1
+#define TCG_TARGET_HAS_sextract_i32     1
+#define TCG_TARGET_HAS_extract2_i32     1
+#define TCG_TARGET_HAS_negsetcond_i32   1
+#define TCG_TARGET_HAS_add2_i32         1
+#define TCG_TARGET_HAS_sub2_i32         1
+#define TCG_TARGET_HAS_mulu2_i32        0
+#define TCG_TARGET_HAS_muls2_i32        0
+#define TCG_TARGET_HAS_muluh_i32        0
+#define TCG_TARGET_HAS_mulsh_i32        0
+#define TCG_TARGET_HAS_extr_i64_i32     0
+#define TCG_TARGET_HAS_qemu_st8_i32     0
+
+#define TCG_TARGET_HAS_div_i64          1
+#define TCG_TARGET_HAS_rem_i64          1
+#define TCG_TARGET_HAS_ext8s_i64        1
+#define TCG_TARGET_HAS_ext16s_i64       1
+#define TCG_TARGET_HAS_ext32s_i64       1
+#define TCG_TARGET_HAS_ext8u_i64        1
+#define TCG_TARGET_HAS_ext16u_i64       1
+#define TCG_TARGET_HAS_ext32u_i64       1
+#define TCG_TARGET_HAS_bswap16_i64      1
+#define TCG_TARGET_HAS_bswap32_i64      1
+#define TCG_TARGET_HAS_bswap64_i64      1
+#define TCG_TARGET_HAS_not_i64          1
+#define TCG_TARGET_HAS_rot_i64          1
+#define TCG_TARGET_HAS_andc_i64         1
+#define TCG_TARGET_HAS_orc_i64          1
+#define TCG_TARGET_HAS_eqv_i64          1
+#define TCG_TARGET_HAS_nand_i64         0
+#define TCG_TARGET_HAS_nor_i64          0
+#define TCG_TARGET_HAS_clz_i64          1
+#define TCG_TARGET_HAS_ctz_i64          1
+#define TCG_TARGET_HAS_ctpop_i64        0
+#define TCG_TARGET_HAS_deposit_i64      1
+#define TCG_TARGET_HAS_extract_i64      1
+#define TCG_TARGET_HAS_sextract_i64     1
+#define TCG_TARGET_HAS_extract2_i64     1
+#define TCG_TARGET_HAS_negsetcond_i64   1
+#define TCG_TARGET_HAS_add2_i64         1
+#define TCG_TARGET_HAS_sub2_i64         1
+#define TCG_TARGET_HAS_mulu2_i64        0
+#define TCG_TARGET_HAS_muls2_i64        0
+#define TCG_TARGET_HAS_muluh_i64        1
+#define TCG_TARGET_HAS_mulsh_i64        1
+
+/*
+ * Without FEAT_LSE2, we must use LDXP+STXP to implement atomic 128-bit load,
+ * which requires writable pages.  We must defer to the helper for user-only,
+ * but in system mode all ram is writable for the host.
+ */
+#ifdef CONFIG_USER_ONLY
+#define TCG_TARGET_HAS_qemu_ldst_i128   have_lse2
+#else
+#define TCG_TARGET_HAS_qemu_ldst_i128   1
+#endif
+
+#define TCG_TARGET_HAS_tst              1
+
+#define TCG_TARGET_HAS_v64              1
+#define TCG_TARGET_HAS_v128             1
+#define TCG_TARGET_HAS_v256             0
+
+#define TCG_TARGET_HAS_andc_vec         1
+#define TCG_TARGET_HAS_orc_vec          1
+#define TCG_TARGET_HAS_nand_vec         0
+#define TCG_TARGET_HAS_nor_vec          0
+#define TCG_TARGET_HAS_eqv_vec          0
+#define TCG_TARGET_HAS_not_vec          1
+#define TCG_TARGET_HAS_neg_vec          1
+#define TCG_TARGET_HAS_abs_vec          1
+#define TCG_TARGET_HAS_roti_vec         0
+#define TCG_TARGET_HAS_rots_vec         0
+#define TCG_TARGET_HAS_rotv_vec         0
+#define TCG_TARGET_HAS_shi_vec          1
+#define TCG_TARGET_HAS_shs_vec          0
+#define TCG_TARGET_HAS_shv_vec          1
+#define TCG_TARGET_HAS_mul_vec          1
+#define TCG_TARGET_HAS_sat_vec          1
+#define TCG_TARGET_HAS_minmax_vec       1
+#define TCG_TARGET_HAS_bitsel_vec       1
+#define TCG_TARGET_HAS_cmpsel_vec       0
+#define TCG_TARGET_HAS_tst_vec          1
+
+#endif
diff --git a/tcg/aarch64/tcg-target.h b/tcg/aarch64/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/aarch64/tcg-target.h
+++ b/tcg/aarch64/tcg-target.h
@@ -XXX,XX +XXX,XX @@
 #ifndef AARCH64_TCG_TARGET_H
 #define AARCH64_TCG_TARGET_H
 
-#include "host/cpuinfo.h"
-
 #define TCG_TARGET_INSN_UNIT_SIZE  4
 #define MAX_CODE_GEN_BUFFER_SIZE  ((size_t)-1)
 
@@ -XXX,XX +XXX,XX @@ typedef enum {
 
 #define TCG_TARGET_NB_REGS 64
 
-#define have_lse    (cpuinfo & CPUINFO_LSE)
-#define have_lse2   (cpuinfo & CPUINFO_LSE2)
-
-/* optional instructions */
-#define TCG_TARGET_HAS_div_i32          1
-#define TCG_TARGET_HAS_rem_i32          1
-#define TCG_TARGET_HAS_ext8s_i32        1
-#define TCG_TARGET_HAS_ext16s_i32       1
-#define TCG_TARGET_HAS_ext8u_i32        1
-#define TCG_TARGET_HAS_ext16u_i32       1
-#define TCG_TARGET_HAS_bswap16_i32      1
-#define TCG_TARGET_HAS_bswap32_i32      1
-#define TCG_TARGET_HAS_not_i32          1
-#define TCG_TARGET_HAS_rot_i32          1
-#define TCG_TARGET_HAS_andc_i32         1
-#define TCG_TARGET_HAS_orc_i32          1
-#define TCG_TARGET_HAS_eqv_i32          1
-#define TCG_TARGET_HAS_nand_i32         0
-#define TCG_TARGET_HAS_nor_i32          0
-#define TCG_TARGET_HAS_clz_i32          1
-#define TCG_TARGET_HAS_ctz_i32          1
-#define TCG_TARGET_HAS_ctpop_i32        0
-#define TCG_TARGET_HAS_deposit_i32      1
-#define TCG_TARGET_HAS_extract_i32      1
-#define TCG_TARGET_HAS_sextract_i32     1
-#define TCG_TARGET_HAS_extract2_i32     1
-#define TCG_TARGET_HAS_negsetcond_i32   1
-#define TCG_TARGET_HAS_add2_i32         1
-#define TCG_TARGET_HAS_sub2_i32         1
-#define TCG_TARGET_HAS_mulu2_i32        0
-#define TCG_TARGET_HAS_muls2_i32        0
-#define TCG_TARGET_HAS_muluh_i32        0
-#define TCG_TARGET_HAS_mulsh_i32        0
-#define TCG_TARGET_HAS_extr_i64_i32     0
-#define TCG_TARGET_HAS_qemu_st8_i32     0
-
-#define TCG_TARGET_HAS_div_i64          1
-#define TCG_TARGET_HAS_rem_i64          1
-#define TCG_TARGET_HAS_ext8s_i64        1
-#define TCG_TARGET_HAS_ext16s_i64       1
-#define TCG_TARGET_HAS_ext32s_i64       1
-#define TCG_TARGET_HAS_ext8u_i64        1
-#define TCG_TARGET_HAS_ext16u_i64       1
-#define TCG_TARGET_HAS_ext32u_i64       1
-#define TCG_TARGET_HAS_bswap16_i64      1
-#define TCG_TARGET_HAS_bswap32_i64      1
-#define TCG_TARGET_HAS_bswap64_i64      1
-#define TCG_TARGET_HAS_not_i64          1
-#define TCG_TARGET_HAS_rot_i64          1
-#define TCG_TARGET_HAS_andc_i64         1
-#define TCG_TARGET_HAS_orc_i64          1
-#define TCG_TARGET_HAS_eqv_i64          1
-#define TCG_TARGET_HAS_nand_i64         0
-#define TCG_TARGET_HAS_nor_i64          0
-#define TCG_TARGET_HAS_clz_i64          1
-#define TCG_TARGET_HAS_ctz_i64          1
-#define TCG_TARGET_HAS_ctpop_i64        0
-#define TCG_TARGET_HAS_deposit_i64      1
-#define TCG_TARGET_HAS_extract_i64      1
-#define TCG_TARGET_HAS_sextract_i64     1
-#define TCG_TARGET_HAS_extract2_i64     1
-#define TCG_TARGET_HAS_negsetcond_i64   1
-#define TCG_TARGET_HAS_add2_i64         1
-#define TCG_TARGET_HAS_sub2_i64         1
-#define TCG_TARGET_HAS_mulu2_i64        0
-#define TCG_TARGET_HAS_muls2_i64        0
-#define TCG_TARGET_HAS_muluh_i64        1
-#define TCG_TARGET_HAS_mulsh_i64        1
-
-/*
- * Without FEAT_LSE2, we must use LDXP+STXP to implement atomic 128-bit load,
- * which requires writable pages.  We must defer to the helper for user-only,
- * but in system mode all ram is writable for the host.
- */
-#ifdef CONFIG_USER_ONLY
-#define TCG_TARGET_HAS_qemu_ldst_i128   have_lse2
-#else
-#define TCG_TARGET_HAS_qemu_ldst_i128   1
-#endif
-
-#define TCG_TARGET_HAS_tst              1
-
-#define TCG_TARGET_HAS_v64              1
-#define TCG_TARGET_HAS_v128             1
-#define TCG_TARGET_HAS_v256             0
-
-#define TCG_TARGET_HAS_andc_vec         1
-#define TCG_TARGET_HAS_orc_vec          1
-#define TCG_TARGET_HAS_nand_vec         0
-#define TCG_TARGET_HAS_nor_vec          0
-#define TCG_TARGET_HAS_eqv_vec          0
-#define TCG_TARGET_HAS_not_vec          1
-#define TCG_TARGET_HAS_neg_vec          1
-#define TCG_TARGET_HAS_abs_vec          1
-#define TCG_TARGET_HAS_roti_vec         0
-#define TCG_TARGET_HAS_rots_vec         0
-#define TCG_TARGET_HAS_rotv_vec         0
-#define TCG_TARGET_HAS_shi_vec          1
-#define TCG_TARGET_HAS_shs_vec          0
-#define TCG_TARGET_HAS_shv_vec          1
-#define TCG_TARGET_HAS_mul_vec          1
-#define TCG_TARGET_HAS_sat_vec          1
-#define TCG_TARGET_HAS_minmax_vec       1
-#define TCG_TARGET_HAS_bitsel_vec       1
-#define TCG_TARGET_HAS_cmpsel_vec       0
-#define TCG_TARGET_HAS_tst_vec          1
+#include "tcg-target-has.h"
 
 #define TCG_TARGET_DEFAULT_MO (0)
 
-- 
2.43.0

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Signed-off-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Message-ID: <20250108215156.8731-5-philmd@linaro.org>
---
 tcg/arm/tcg-target-has.h | 85 ++++++++++++++++++++++++++++++++++++++++
 tcg/arm/tcg-target.h     | 74 +---------------------------------
 2 files changed, 86 insertions(+), 73 deletions(-)
 create mode 100644 tcg/arm/tcg-target-has.h

diff --git a/tcg/arm/tcg-target-has.h b/tcg/arm/tcg-target-has.h
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/tcg/arm/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@
+/* SPDX-License-Identifier: MIT */
+/*
+ * Define target-specific opcode support
+ * Copyright (c) 2008 Fabrice Bellard
+ * Copyright (c) 2008 Andrzej Zaborowski
+ */
+
+#ifndef TCG_TARGET_HAS_H
+#define TCG_TARGET_HAS_H
+
+extern int arm_arch;
+
+#define use_armv7_instructions  (__ARM_ARCH >= 7 || arm_arch >= 7)
+
+#ifdef __ARM_ARCH_EXT_IDIV__
+#define use_idiv_instructions  1
+#else
+extern bool use_idiv_instructions;
+#endif
+#ifdef __ARM_NEON__
+#define use_neon_instructions  1
+#else
+extern bool use_neon_instructions;
+#endif
+
+/* optional instructions */
+#define TCG_TARGET_HAS_ext8s_i32        1
+#define TCG_TARGET_HAS_ext16s_i32       1
+#define TCG_TARGET_HAS_ext8u_i32        0 /* and r0, r1, #0xff */
+#define TCG_TARGET_HAS_ext16u_i32       1
+#define TCG_TARGET_HAS_bswap16_i32      1
+#define TCG_TARGET_HAS_bswap32_i32      1
+#define TCG_TARGET_HAS_not_i32          1
+#define TCG_TARGET_HAS_rot_i32          1
+#define TCG_TARGET_HAS_andc_i32         1
+#define TCG_TARGET_HAS_orc_i32          0
+#define TCG_TARGET_HAS_eqv_i32          0
+#define TCG_TARGET_HAS_nand_i32         0
+#define TCG_TARGET_HAS_nor_i32          0
+#define TCG_TARGET_HAS_clz_i32          1
+#define TCG_TARGET_HAS_ctz_i32          use_armv7_instructions
+#define TCG_TARGET_HAS_ctpop_i32        0
+#define TCG_TARGET_HAS_deposit_i32      use_armv7_instructions
+#define TCG_TARGET_HAS_extract_i32      use_armv7_instructions
+#define TCG_TARGET_HAS_sextract_i32     use_armv7_instructions
+#define TCG_TARGET_HAS_extract2_i32     1
+#define TCG_TARGET_HAS_negsetcond_i32   1
+#define TCG_TARGET_HAS_mulu2_i32        1
+#define TCG_TARGET_HAS_muls2_i32        1
+#define TCG_TARGET_HAS_muluh_i32        0
+#define TCG_TARGET_HAS_mulsh_i32        0
+#define TCG_TARGET_HAS_div_i32          use_idiv_instructions
+#define TCG_TARGET_HAS_rem_i32          0
+#define TCG_TARGET_HAS_qemu_st8_i32     0
+
+#define TCG_TARGET_HAS_qemu_ldst_i128   0
+
+#define TCG_TARGET_HAS_tst              1
+
+#define TCG_TARGET_HAS_v64              use_neon_instructions
+#define TCG_TARGET_HAS_v128             use_neon_instructions
+#define TCG_TARGET_HAS_v256             0
+
+#define TCG_TARGET_HAS_andc_vec         1
+#define TCG_TARGET_HAS_orc_vec          1
+#define TCG_TARGET_HAS_nand_vec         0
+#define TCG_TARGET_HAS_nor_vec          0
+#define TCG_TARGET_HAS_eqv_vec          0
+#define TCG_TARGET_HAS_not_vec          1
+#define TCG_TARGET_HAS_neg_vec          1
+#define TCG_TARGET_HAS_abs_vec          1
+#define TCG_TARGET_HAS_roti_vec         0
+#define TCG_TARGET_HAS_rots_vec         0
+#define TCG_TARGET_HAS_rotv_vec         0
+#define TCG_TARGET_HAS_shi_vec          1
+#define TCG_TARGET_HAS_shs_vec          0
+#define TCG_TARGET_HAS_shv_vec          0
+#define TCG_TARGET_HAS_mul_vec          1
+#define TCG_TARGET_HAS_sat_vec          1
+#define TCG_TARGET_HAS_minmax_vec       1
+#define TCG_TARGET_HAS_bitsel_vec       1
+#define TCG_TARGET_HAS_cmpsel_vec       0
+#define TCG_TARGET_HAS_tst_vec          1
+
+#endif
diff --git a/tcg/arm/tcg-target.h b/tcg/arm/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/arm/tcg-target.h
+++ b/tcg/arm/tcg-target.h
@@ -XXX,XX +XXX,XX @@
 #ifndef ARM_TCG_TARGET_H
 #define ARM_TCG_TARGET_H
 
-extern int arm_arch;
-
-#define use_armv7_instructions  (__ARM_ARCH >= 7 || arm_arch >= 7)
-
 #define TCG_TARGET_INSN_UNIT_SIZE 4
 #define MAX_CODE_GEN_BUFFER_SIZE  UINT32_MAX
 
@@ -XXX,XX +XXX,XX @@ typedef enum {
 
 #define TCG_TARGET_NB_REGS 32
 
-#ifdef __ARM_ARCH_EXT_IDIV__
-#define use_idiv_instructions  1
-#else
-extern bool use_idiv_instructions;
-#endif
-#ifdef __ARM_NEON__
-#define use_neon_instructions  1
-#else
-extern bool use_neon_instructions;
-#endif
-
-/* optional instructions */
-#define TCG_TARGET_HAS_ext8s_i32        1
-#define TCG_TARGET_HAS_ext16s_i32       1
-#define TCG_TARGET_HAS_ext8u_i32        0 /* and r0, r1, #0xff */
-#define TCG_TARGET_HAS_ext16u_i32       1
-#define TCG_TARGET_HAS_bswap16_i32      1
-#define TCG_TARGET_HAS_bswap32_i32      1
-#define TCG_TARGET_HAS_not_i32          1
-#define TCG_TARGET_HAS_rot_i32          1
-#define TCG_TARGET_HAS_andc_i32         1
-#define TCG_TARGET_HAS_orc_i32          0
-#define TCG_TARGET_HAS_eqv_i32          0
-#define TCG_TARGET_HAS_nand_i32         0
-#define TCG_TARGET_HAS_nor_i32          0
-#define TCG_TARGET_HAS_clz_i32          1
-#define TCG_TARGET_HAS_ctz_i32          use_armv7_instructions
-#define TCG_TARGET_HAS_ctpop_i32        0
-#define TCG_TARGET_HAS_deposit_i32      use_armv7_instructions
-#define TCG_TARGET_HAS_extract_i32      use_armv7_instructions
-#define TCG_TARGET_HAS_sextract_i32     use_armv7_instructions
-#define TCG_TARGET_HAS_extract2_i32     1
-#define TCG_TARGET_HAS_negsetcond_i32   1
-#define TCG_TARGET_HAS_mulu2_i32        1
-#define TCG_TARGET_HAS_muls2_i32        1
-#define TCG_TARGET_HAS_muluh_i32        0
-#define TCG_TARGET_HAS_mulsh_i32        0
-#define TCG_TARGET_HAS_div_i32          use_idiv_instructions
-#define TCG_TARGET_HAS_rem_i32          0
-#define TCG_TARGET_HAS_qemu_st8_i32     0
-
-#define TCG_TARGET_HAS_qemu_ldst_i128   0
-
-#define TCG_TARGET_HAS_tst              1
-
-#define TCG_TARGET_HAS_v64              use_neon_instructions
-#define TCG_TARGET_HAS_v128             use_neon_instructions
-#define TCG_TARGET_HAS_v256             0
-
-#define TCG_TARGET_HAS_andc_vec         1
-#define TCG_TARGET_HAS_orc_vec          1
-#define TCG_TARGET_HAS_nand_vec         0
-#define TCG_TARGET_HAS_nor_vec          0
-#define TCG_TARGET_HAS_eqv_vec          0
-#define TCG_TARGET_HAS_not_vec          1
-#define TCG_TARGET_HAS_neg_vec          1
-#define TCG_TARGET_HAS_abs_vec          1
-#define TCG_TARGET_HAS_roti_vec         0
-#define TCG_TARGET_HAS_rots_vec         0
-#define TCG_TARGET_HAS_rotv_vec         0
-#define TCG_TARGET_HAS_shi_vec          1
-#define TCG_TARGET_HAS_shs_vec          0
-#define TCG_TARGET_HAS_shv_vec          0
-#define TCG_TARGET_HAS_mul_vec          1
-#define TCG_TARGET_HAS_sat_vec          1
-#define TCG_TARGET_HAS_minmax_vec       1
-#define TCG_TARGET_HAS_bitsel_vec       1
-#define TCG_TARGET_HAS_cmpsel_vec       0
-#define TCG_TARGET_HAS_tst_vec          1
+#include "tcg-target-has.h"
 
 #define TCG_TARGET_DEFAULT_MO (0)
 
-- 
2.43.0

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Signed-off-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Message-ID: <20250108215156.8731-6-philmd@linaro.org>
---
 tcg/i386/tcg-target-has.h | 139 ++++++++++++++++++++++++++++++++++++++
 tcg/i386/tcg-target.h     | 129 +----------------------------------
 2 files changed, 140 insertions(+), 128 deletions(-)
 create mode 100644 tcg/i386/tcg-target-has.h

diff --git a/tcg/i386/tcg-target-has.h b/tcg/i386/tcg-target-has.h
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/tcg/i386/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@
+/* SPDX-License-Identifier: MIT */
+/*
+ * Define target-specific opcode support
+ * Copyright (c) 2008 Fabrice Bellard
+ */
+
+#ifndef TCG_TARGET_HAS_H
+#define TCG_TARGET_HAS_H
+
+#include "host/cpuinfo.h"
+
+#define have_bmi1         (cpuinfo & CPUINFO_BMI1)
+#define have_popcnt       (cpuinfo & CPUINFO_POPCNT)
+#define have_avx1         (cpuinfo & CPUINFO_AVX1)
+#define have_avx2         (cpuinfo & CPUINFO_AVX2)
+#define have_movbe        (cpuinfo & CPUINFO_MOVBE)
+
+/*
+ * There are interesting instructions in AVX512, so long as we have AVX512VL,
+ * which indicates support for EVEX on sizes smaller than 512 bits.
+ */
+#define have_avx512vl     ((cpuinfo & CPUINFO_AVX512VL) && \
+                           (cpuinfo & CPUINFO_AVX512F))
+#define have_avx512bw     ((cpuinfo & CPUINFO_AVX512BW) && have_avx512vl)
+#define have_avx512dq     ((cpuinfo & CPUINFO_AVX512DQ) && have_avx512vl)
+#define have_avx512vbmi2  ((cpuinfo & CPUINFO_AVX512VBMI2) && have_avx512vl)
+
+/* optional instructions */
+#define TCG_TARGET_HAS_div2_i32         1
+#define TCG_TARGET_HAS_rot_i32          1
+#define TCG_TARGET_HAS_ext8s_i32        1
+#define TCG_TARGET_HAS_ext16s_i32       1
+#define TCG_TARGET_HAS_ext8u_i32        1
+#define TCG_TARGET_HAS_ext16u_i32       1
+#define TCG_TARGET_HAS_bswap16_i32      1
+#define TCG_TARGET_HAS_bswap32_i32      1
+#define TCG_TARGET_HAS_not_i32          1
+#define TCG_TARGET_HAS_andc_i32         have_bmi1
+#define TCG_TARGET_HAS_orc_i32          0
+#define TCG_TARGET_HAS_eqv_i32          0
+#define TCG_TARGET_HAS_nand_i32         0
+#define TCG_TARGET_HAS_nor_i32          0
+#define TCG_TARGET_HAS_clz_i32          1
+#define TCG_TARGET_HAS_ctz_i32          1
+#define TCG_TARGET_HAS_ctpop_i32        have_popcnt
+#define TCG_TARGET_HAS_deposit_i32      1
+#define TCG_TARGET_HAS_extract_i32      1
+#define TCG_TARGET_HAS_sextract_i32     1
+#define TCG_TARGET_HAS_extract2_i32     1
+#define TCG_TARGET_HAS_negsetcond_i32   1
+#define TCG_TARGET_HAS_add2_i32         1
+#define TCG_TARGET_HAS_sub2_i32         1
+#define TCG_TARGET_HAS_mulu2_i32        1
+#define TCG_TARGET_HAS_muls2_i32        1
+#define TCG_TARGET_HAS_muluh_i32        0
+#define TCG_TARGET_HAS_mulsh_i32        0
+
+#if TCG_TARGET_REG_BITS == 64
+/* Keep 32-bit values zero-extended in a register.  */
+#define TCG_TARGET_HAS_extr_i64_i32     1
+#define TCG_TARGET_HAS_div2_i64         1
+#define TCG_TARGET_HAS_rot_i64          1
+#define TCG_TARGET_HAS_ext8s_i64        1
+#define TCG_TARGET_HAS_ext16s_i64       1
+#define TCG_TARGET_HAS_ext32s_i64       1
+#define TCG_TARGET_HAS_ext8u_i64        1
+#define TCG_TARGET_HAS_ext16u_i64       1
+#define TCG_TARGET_HAS_ext32u_i64       1
+#define TCG_TARGET_HAS_bswap16_i64      1
+#define TCG_TARGET_HAS_bswap32_i64      1
+#define TCG_TARGET_HAS_bswap64_i64      1
+#define TCG_TARGET_HAS_not_i64          1
+#define TCG_TARGET_HAS_andc_i64         have_bmi1
+#define TCG_TARGET_HAS_orc_i64          0
+#define TCG_TARGET_HAS_eqv_i64          0
+#define TCG_TARGET_HAS_nand_i64         0
+#define TCG_TARGET_HAS_nor_i64          0
+#define TCG_TARGET_HAS_clz_i64          1
+#define TCG_TARGET_HAS_ctz_i64          1
+#define TCG_TARGET_HAS_ctpop_i64        have_popcnt
+#define TCG_TARGET_HAS_deposit_i64      1
+#define TCG_TARGET_HAS_extract_i64      1
+#define TCG_TARGET_HAS_sextract_i64     0
+#define TCG_TARGET_HAS_extract2_i64     1
+#define TCG_TARGET_HAS_negsetcond_i64   1
+#define TCG_TARGET_HAS_add2_i64         1
+#define TCG_TARGET_HAS_sub2_i64         1
+#define TCG_TARGET_HAS_mulu2_i64        1
+#define TCG_TARGET_HAS_muls2_i64        1
+#define TCG_TARGET_HAS_muluh_i64        0
+#define TCG_TARGET_HAS_mulsh_i64        0
+#define TCG_TARGET_HAS_qemu_st8_i32     0
+#else
+#define TCG_TARGET_HAS_qemu_st8_i32     1
+#endif
+
+#define TCG_TARGET_HAS_qemu_ldst_i128 \
+    (TCG_TARGET_REG_BITS == 64 && (cpuinfo & CPUINFO_ATOMIC_VMOVDQA))
+
+#define TCG_TARGET_HAS_tst              1
+
+/* We do not support older SSE systems, only beginning with AVX1.  */
+#define TCG_TARGET_HAS_v64              have_avx1
+#define TCG_TARGET_HAS_v128             have_avx1
+#define TCG_TARGET_HAS_v256             have_avx2
+
+#define TCG_TARGET_HAS_andc_vec         1
+#define TCG_TARGET_HAS_orc_vec          have_avx512vl
+#define TCG_TARGET_HAS_nand_vec         have_avx512vl
+#define TCG_TARGET_HAS_nor_vec          have_avx512vl
+#define TCG_TARGET_HAS_eqv_vec          have_avx512vl
+#define TCG_TARGET_HAS_not_vec          have_avx512vl
+#define TCG_TARGET_HAS_neg_vec          0
+#define TCG_TARGET_HAS_abs_vec          1
+#define TCG_TARGET_HAS_roti_vec         have_avx512vl
+#define TCG_TARGET_HAS_rots_vec         0
+#define TCG_TARGET_HAS_rotv_vec         have_avx512vl
+#define TCG_TARGET_HAS_shi_vec          1
+#define TCG_TARGET_HAS_shs_vec          1
+#define TCG_TARGET_HAS_shv_vec          have_avx2
+#define TCG_TARGET_HAS_mul_vec          1
+#define TCG_TARGET_HAS_sat_vec          1
+#define TCG_TARGET_HAS_minmax_vec       1
+#define TCG_TARGET_HAS_bitsel_vec       have_avx512vl
+#define TCG_TARGET_HAS_cmpsel_vec       1
+#define TCG_TARGET_HAS_tst_vec          have_avx512bw
+
+#define TCG_TARGET_deposit_i32_valid(ofs, len) \
+    (((ofs) == 0 && ((len) == 8 || (len) == 16)) || \
+     (TCG_TARGET_REG_BITS == 32 && (ofs) == 8 && (len) == 8))
+#define TCG_TARGET_deposit_i64_valid    TCG_TARGET_deposit_i32_valid
+
+/* Check for the possibility of high-byte extraction and, for 64-bit,
+   zero-extending 32-bit right-shift.  */
+#define TCG_TARGET_extract_i32_valid(ofs, len) ((ofs) == 8 && (len) == 8)
+#define TCG_TARGET_extract_i64_valid(ofs, len) \
+    (((ofs) == 8 && (len) == 8) || ((ofs) + (len)) == 32)
+
+#endif
diff --git a/tcg/i386/tcg-target.h b/tcg/i386/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/i386/tcg-target.h
+++ b/tcg/i386/tcg-target.h
@@ -XXX,XX +XXX,XX @@
 #ifndef I386_TCG_TARGET_H
 #define I386_TCG_TARGET_H
 
-#include "host/cpuinfo.h"
-
 #define TCG_TARGET_INSN_UNIT_SIZE  1
 
 #ifdef __x86_64__
@@ -XXX,XX +XXX,XX @@ typedef enum {
     TCG_REG_CALL_STACK = TCG_REG_ESP
 } TCGReg;
 
-#define have_bmi1         (cpuinfo & CPUINFO_BMI1)
-#define have_popcnt       (cpuinfo & CPUINFO_POPCNT)
-#define have_avx1         (cpuinfo & CPUINFO_AVX1)
-#define have_avx2         (cpuinfo & CPUINFO_AVX2)
-#define have_movbe        (cpuinfo & CPUINFO_MOVBE)
-
-/*
- * There are interesting instructions in AVX512, so long as we have AVX512VL,
- * which indicates support for EVEX on sizes smaller than 512 bits.
- */
-#define have_avx512vl     ((cpuinfo & CPUINFO_AVX512VL) && \
-                           (cpuinfo & CPUINFO_AVX512F))
-#define have_avx512bw     ((cpuinfo & CPUINFO_AVX512BW) && have_avx512vl)
-#define have_avx512dq     ((cpuinfo & CPUINFO_AVX512DQ) && have_avx512vl)
-#define have_avx512vbmi2  ((cpuinfo & CPUINFO_AVX512VBMI2) && have_avx512vl)
-
-/* optional instructions */
-#define TCG_TARGET_HAS_div2_i32         1
-#define TCG_TARGET_HAS_rot_i32          1
-#define TCG_TARGET_HAS_ext8s_i32        1
-#define TCG_TARGET_HAS_ext16s_i32       1
-#define TCG_TARGET_HAS_ext8u_i32        1
-#define TCG_TARGET_HAS_ext16u_i32       1
-#define TCG_TARGET_HAS_bswap16_i32      1
-#define TCG_TARGET_HAS_bswap32_i32      1
-#define TCG_TARGET_HAS_not_i32          1
-#define TCG_TARGET_HAS_andc_i32         have_bmi1
-#define TCG_TARGET_HAS_orc_i32          0
-#define TCG_TARGET_HAS_eqv_i32          0
-#define TCG_TARGET_HAS_nand_i32         0
-#define TCG_TARGET_HAS_nor_i32          0
-#define TCG_TARGET_HAS_clz_i32          1
-#define TCG_TARGET_HAS_ctz_i32          1
-#define TCG_TARGET_HAS_ctpop_i32        have_popcnt
-#define TCG_TARGET_HAS_deposit_i32      1
-#define TCG_TARGET_HAS_extract_i32      1
-#define TCG_TARGET_HAS_sextract_i32     1
-#define TCG_TARGET_HAS_extract2_i32     1
-#define TCG_TARGET_HAS_negsetcond_i32   1
-#define TCG_TARGET_HAS_add2_i32         1
-#define TCG_TARGET_HAS_sub2_i32         1
-#define TCG_TARGET_HAS_mulu2_i32        1
-#define TCG_TARGET_HAS_muls2_i32        1
-#define TCG_TARGET_HAS_muluh_i32        0
-#define TCG_TARGET_HAS_mulsh_i32        0
-
-#if TCG_TARGET_REG_BITS == 64
-/* Keep 32-bit values zero-extended in a register.  */
-#define TCG_TARGET_HAS_extr_i64_i32     1
-#define TCG_TARGET_HAS_div2_i64         1
-#define TCG_TARGET_HAS_rot_i64          1
-#define TCG_TARGET_HAS_ext8s_i64        1
-#define TCG_TARGET_HAS_ext16s_i64       1
-#define TCG_TARGET_HAS_ext32s_i64       1
-#define TCG_TARGET_HAS_ext8u_i64        1
-#define TCG_TARGET_HAS_ext16u_i64       1
-#define TCG_TARGET_HAS_ext32u_i64       1
-#define TCG_TARGET_HAS_bswap16_i64      1
-#define TCG_TARGET_HAS_bswap32_i64      1
-#define TCG_TARGET_HAS_bswap64_i64      1
-#define TCG_TARGET_HAS_not_i64          1
-#define TCG_TARGET_HAS_andc_i64         have_bmi1
-#define TCG_TARGET_HAS_orc_i64          0
-#define TCG_TARGET_HAS_eqv_i64          0
-#define TCG_TARGET_HAS_nand_i64         0
-#define TCG_TARGET_HAS_nor_i64          0
-#define TCG_TARGET_HAS_clz_i64          1
-#define TCG_TARGET_HAS_ctz_i64          1
-#define TCG_TARGET_HAS_ctpop_i64        have_popcnt
-#define TCG_TARGET_HAS_deposit_i64      1
-#define TCG_TARGET_HAS_extract_i64      1
-#define TCG_TARGET_HAS_sextract_i64     0
-#define TCG_TARGET_HAS_extract2_i64     1
-#define TCG_TARGET_HAS_negsetcond_i64   1
-#define TCG_TARGET_HAS_add2_i64         1
-#define TCG_TARGET_HAS_sub2_i64         1
-#define TCG_TARGET_HAS_mulu2_i64        1
-#define TCG_TARGET_HAS_muls2_i64        1
-#define TCG_TARGET_HAS_muluh_i64        0
-#define TCG_TARGET_HAS_mulsh_i64        0
-#define TCG_TARGET_HAS_qemu_st8_i32     0
-#else
-#define TCG_TARGET_HAS_qemu_st8_i32     1
-#endif
-
-#define TCG_TARGET_HAS_qemu_ldst_i128 \
-    (TCG_TARGET_REG_BITS == 64 && (cpuinfo & CPUINFO_ATOMIC_VMOVDQA))
-
-#define TCG_TARGET_HAS_tst              1
-
-/* We do not support older SSE systems, only beginning with AVX1.  */
-#define TCG_TARGET_HAS_v64              have_avx1
-#define TCG_TARGET_HAS_v128             have_avx1
-#define TCG_TARGET_HAS_v256             have_avx2
-
-#define TCG_TARGET_HAS_andc_vec         1
-#define TCG_TARGET_HAS_orc_vec          have_avx512vl
-#define TCG_TARGET_HAS_nand_vec         have_avx512vl
-#define TCG_TARGET_HAS_nor_vec          have_avx512vl
-#define TCG_TARGET_HAS_eqv_vec          have_avx512vl
-#define TCG_TARGET_HAS_not_vec          have_avx512vl
-#define TCG_TARGET_HAS_neg_vec          0
-#define TCG_TARGET_HAS_abs_vec          1
-#define TCG_TARGET_HAS_roti_vec         have_avx512vl
-#define TCG_TARGET_HAS_rots_vec         0
-#define TCG_TARGET_HAS_rotv_vec         have_avx512vl
-#define TCG_TARGET_HAS_shi_vec          1
-#define TCG_TARGET_HAS_shs_vec          1
-#define TCG_TARGET_HAS_shv_vec          have_avx2
-#define TCG_TARGET_HAS_mul_vec          1
-#define TCG_TARGET_HAS_sat_vec          1
-#define TCG_TARGET_HAS_minmax_vec       1
-#define TCG_TARGET_HAS_bitsel_vec       have_avx512vl
-#define TCG_TARGET_HAS_cmpsel_vec       1
-#define TCG_TARGET_HAS_tst_vec          have_avx512bw
-
-#define TCG_TARGET_deposit_i32_valid(ofs, len) \
-    (((ofs) == 0 && ((len) == 8 || (len) == 16)) || \
-     (TCG_TARGET_REG_BITS == 32 && (ofs) == 8 && (len) == 8))
-#define TCG_TARGET_deposit_i64_valid    TCG_TARGET_deposit_i32_valid
-
-/* Check for the possibility of high-byte extraction and, for 64-bit,
-   zero-extending 32-bit right-shift.  */
-#define TCG_TARGET_extract_i32_valid(ofs, len) ((ofs) == 8 && (len) == 8)
-#define TCG_TARGET_extract_i64_valid(ofs, len) \
-    (((ofs) == 8 && (len) == 8) || ((ofs) + (len)) == 32)
+#include "tcg-target-has.h"
 
 /* This defines the natural memory order supported by this
  * architecture before guarantees made by various barrier
-- 
2.43.0

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Signed-off-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Message-ID: <20250108215156.8731-7-philmd@linaro.org>
---
 tcg/loongarch64/tcg-target-has.h | 113 +++++++++++++++++++++++++++++++
 tcg/loongarch64/tcg-target.h     | 102 +---------------------------
 2 files changed, 114 insertions(+), 101 deletions(-)
 create mode 100644 tcg/loongarch64/tcg-target-has.h

diff --git a/tcg/loongarch64/tcg-target-has.h b/tcg/loongarch64/tcg-target-has.h
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/tcg/loongarch64/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@
+/* SPDX-License-Identifier: MIT */
+/*
+ * Define target-specific opcode support
+ * Copyright (c) 2021 WANG Xuerui <git@xen0n.name>
+ */
+
+#ifndef TCG_TARGET_HAS_H
+#define TCG_TARGET_HAS_H
+
+#include "host/cpuinfo.h"
+
+/* optional instructions */
+#define TCG_TARGET_HAS_negsetcond_i32   0
+#define TCG_TARGET_HAS_div_i32          1
+#define TCG_TARGET_HAS_rem_i32          1
+#define TCG_TARGET_HAS_div2_i32         0
+#define TCG_TARGET_HAS_rot_i32          1
+#define TCG_TARGET_HAS_deposit_i32      1
+#define TCG_TARGET_HAS_extract_i32      1
+#define TCG_TARGET_HAS_sextract_i32     0
+#define TCG_TARGET_HAS_extract2_i32     0
+#define TCG_TARGET_HAS_add2_i32         0
+#define TCG_TARGET_HAS_sub2_i32         0
+#define TCG_TARGET_HAS_mulu2_i32        0
+#define TCG_TARGET_HAS_muls2_i32        0
+#define TCG_TARGET_HAS_muluh_i32        1
+#define TCG_TARGET_HAS_mulsh_i32        1
+#define TCG_TARGET_HAS_ext8s_i32        1
+#define TCG_TARGET_HAS_ext16s_i32       1
+#define TCG_TARGET_HAS_ext8u_i32        1
+#define TCG_TARGET_HAS_ext16u_i32       1
+#define TCG_TARGET_HAS_bswap16_i32      1
+#define TCG_TARGET_HAS_bswap32_i32      1
+#define TCG_TARGET_HAS_not_i32          1
+#define TCG_TARGET_HAS_andc_i32         1
+#define TCG_TARGET_HAS_orc_i32          1
+#define TCG_TARGET_HAS_eqv_i32          0
+#define TCG_TARGET_HAS_nand_i32         0
+#define TCG_TARGET_HAS_nor_i32          1
+#define TCG_TARGET_HAS_clz_i32          1
+#define TCG_TARGET_HAS_ctz_i32          1
+#define TCG_TARGET_HAS_ctpop_i32        0
+#define TCG_TARGET_HAS_brcond2          0
+#define TCG_TARGET_HAS_setcond2         0
+#define TCG_TARGET_HAS_qemu_st8_i32     0
+
+/* 64-bit operations */
+#define TCG_TARGET_HAS_negsetcond_i64   0
+#define TCG_TARGET_HAS_div_i64          1
+#define TCG_TARGET_HAS_rem_i64          1
+#define TCG_TARGET_HAS_div2_i64         0
+#define TCG_TARGET_HAS_rot_i64          1
+#define TCG_TARGET_HAS_deposit_i64      1
+#define TCG_TARGET_HAS_extract_i64      1
+#define TCG_TARGET_HAS_sextract_i64     0
+#define TCG_TARGET_HAS_extract2_i64     0
+#define TCG_TARGET_HAS_extr_i64_i32     1
+#define TCG_TARGET_HAS_ext8s_i64        1
+#define TCG_TARGET_HAS_ext16s_i64       1
+#define TCG_TARGET_HAS_ext32s_i64       1
+#define TCG_TARGET_HAS_ext8u_i64        1
+#define TCG_TARGET_HAS_ext16u_i64       1
+#define TCG_TARGET_HAS_ext32u_i64       1
+#define TCG_TARGET_HAS_bswap16_i64      1
+#define TCG_TARGET_HAS_bswap32_i64      1
+#define TCG_TARGET_HAS_bswap64_i64      1
+#define TCG_TARGET_HAS_not_i64          1
+#define TCG_TARGET_HAS_andc_i64         1
+#define TCG_TARGET_HAS_orc_i64          1
+#define TCG_TARGET_HAS_eqv_i64          0
+#define TCG_TARGET_HAS_nand_i64         0
+#define TCG_TARGET_HAS_nor_i64          1
+#define TCG_TARGET_HAS_clz_i64          1
+#define TCG_TARGET_HAS_ctz_i64          1
+#define TCG_TARGET_HAS_ctpop_i64        0
+#define TCG_TARGET_HAS_add2_i64         0
+#define TCG_TARGET_HAS_sub2_i64         0
+#define TCG_TARGET_HAS_mulu2_i64        0
+#define TCG_TARGET_HAS_muls2_i64        0
+#define TCG_TARGET_HAS_muluh_i64        1
+#define TCG_TARGET_HAS_mulsh_i64        1
+
+#define TCG_TARGET_HAS_qemu_ldst_i128   (cpuinfo & CPUINFO_LSX)
+
+#define TCG_TARGET_HAS_tst              0
+
+#define TCG_TARGET_HAS_v64              (cpuinfo & CPUINFO_LSX)
+#define TCG_TARGET_HAS_v128             (cpuinfo & CPUINFO_LSX)
+#define TCG_TARGET_HAS_v256             (cpuinfo & CPUINFO_LASX)
+
+#define TCG_TARGET_HAS_not_vec          1
+#define TCG_TARGET_HAS_neg_vec          1
+#define TCG_TARGET_HAS_abs_vec          0
+#define TCG_TARGET_HAS_andc_vec         1
+#define TCG_TARGET_HAS_orc_vec          1
+#define TCG_TARGET_HAS_nand_vec         0
+#define TCG_TARGET_HAS_nor_vec          1
+#define TCG_TARGET_HAS_eqv_vec          0
+#define TCG_TARGET_HAS_mul_vec          1
+#define TCG_TARGET_HAS_shi_vec          1
+#define TCG_TARGET_HAS_shs_vec          0
+#define TCG_TARGET_HAS_shv_vec          1
+#define TCG_TARGET_HAS_roti_vec         1
+#define TCG_TARGET_HAS_rots_vec         0
+#define TCG_TARGET_HAS_rotv_vec         1
+#define TCG_TARGET_HAS_sat_vec          1
+#define TCG_TARGET_HAS_minmax_vec       1
+#define TCG_TARGET_HAS_bitsel_vec       1
+#define TCG_TARGET_HAS_cmpsel_vec       0
+#define TCG_TARGET_HAS_tst_vec          0
+
+
+#endif
diff --git a/tcg/loongarch64/tcg-target.h b/tcg/loongarch64/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/loongarch64/tcg-target.h
+++ b/tcg/loongarch64/tcg-target.h
@@ -XXX,XX +XXX,XX @@
 #ifndef LOONGARCH_TCG_TARGET_H
 #define LOONGARCH_TCG_TARGET_H
 
-#include "host/cpuinfo.h"
-
 #define TCG_TARGET_INSN_UNIT_SIZE 4
 #define TCG_TARGET_NB_REGS 64
 
@@ -XXX,XX +XXX,XX @@ typedef enum {
     TCG_VEC_TMP0 = TCG_REG_V23,
 } TCGReg;
 
-/* optional instructions */
-#define TCG_TARGET_HAS_negsetcond_i32   0
-#define TCG_TARGET_HAS_div_i32          1
-#define TCG_TARGET_HAS_rem_i32          1
-#define TCG_TARGET_HAS_div2_i32         0
-#define TCG_TARGET_HAS_rot_i32          1
-#define TCG_TARGET_HAS_deposit_i32      1
-#define TCG_TARGET_HAS_extract_i32      1
-#define TCG_TARGET_HAS_sextract_i32     0
-#define TCG_TARGET_HAS_extract2_i32     0
-#define TCG_TARGET_HAS_add2_i32         0
-#define TCG_TARGET_HAS_sub2_i32         0
-#define TCG_TARGET_HAS_mulu2_i32        0
-#define TCG_TARGET_HAS_muls2_i32        0
-#define TCG_TARGET_HAS_muluh_i32        1
-#define TCG_TARGET_HAS_mulsh_i32        1
-#define TCG_TARGET_HAS_ext8s_i32        1
-#define TCG_TARGET_HAS_ext16s_i32       1
-#define TCG_TARGET_HAS_ext8u_i32        1
-#define TCG_TARGET_HAS_ext16u_i32       1
-#define TCG_TARGET_HAS_bswap16_i32      1
-#define TCG_TARGET_HAS_bswap32_i32      1
-#define TCG_TARGET_HAS_not_i32          1
-#define TCG_TARGET_HAS_andc_i32         1
-#define TCG_TARGET_HAS_orc_i32          1
-#define TCG_TARGET_HAS_eqv_i32          0
-#define TCG_TARGET_HAS_nand_i32         0
-#define TCG_TARGET_HAS_nor_i32          1
-#define TCG_TARGET_HAS_clz_i32          1
-#define TCG_TARGET_HAS_ctz_i32          1
-#define TCG_TARGET_HAS_ctpop_i32        0
-#define TCG_TARGET_HAS_brcond2          0
-#define TCG_TARGET_HAS_setcond2         0
-#define TCG_TARGET_HAS_qemu_st8_i32     0
-
-/* 64-bit operations */
-#define TCG_TARGET_HAS_negsetcond_i64   0
-#define TCG_TARGET_HAS_div_i64          1
-#define TCG_TARGET_HAS_rem_i64          1
-#define TCG_TARGET_HAS_div2_i64         0
-#define TCG_TARGET_HAS_rot_i64          1
-#define TCG_TARGET_HAS_deposit_i64      1
-#define TCG_TARGET_HAS_extract_i64      1
-#define TCG_TARGET_HAS_sextract_i64     0
-#define TCG_TARGET_HAS_extract2_i64     0
-#define TCG_TARGET_HAS_extr_i64_i32     1
-#define TCG_TARGET_HAS_ext8s_i64        1
-#define TCG_TARGET_HAS_ext16s_i64       1
-#define TCG_TARGET_HAS_ext32s_i64       1
-#define TCG_TARGET_HAS_ext8u_i64        1
-#define TCG_TARGET_HAS_ext16u_i64       1
-#define TCG_TARGET_HAS_ext32u_i64       1
-#define TCG_TARGET_HAS_bswap16_i64      1
-#define TCG_TARGET_HAS_bswap32_i64      1
-#define TCG_TARGET_HAS_bswap64_i64      1
-#define TCG_TARGET_HAS_not_i64          1
-#define TCG_TARGET_HAS_andc_i64         1
-#define TCG_TARGET_HAS_orc_i64          1
-#define TCG_TARGET_HAS_eqv_i64          0
-#define TCG_TARGET_HAS_nand_i64         0
-#define TCG_TARGET_HAS_nor_i64          1
-#define TCG_TARGET_HAS_clz_i64          1
-#define TCG_TARGET_HAS_ctz_i64          1
-#define TCG_TARGET_HAS_ctpop_i64        0
-#define TCG_TARGET_HAS_add2_i64         0
-#define TCG_TARGET_HAS_sub2_i64         0
-#define TCG_TARGET_HAS_mulu2_i64        0
-#define TCG_TARGET_HAS_muls2_i64        0
-#define TCG_TARGET_HAS_muluh_i64        1
-#define TCG_TARGET_HAS_mulsh_i64        1
-
-#define TCG_TARGET_HAS_qemu_ldst_i128   (cpuinfo & CPUINFO_LSX)
-
-#define TCG_TARGET_HAS_tst              0
-
-#define TCG_TARGET_HAS_v64              (cpuinfo & CPUINFO_LSX)
-#define TCG_TARGET_HAS_v128             (cpuinfo & CPUINFO_LSX)
-#define TCG_TARGET_HAS_v256             (cpuinfo & CPUINFO_LASX)
-
-#define TCG_TARGET_HAS_not_vec          1
-#define TCG_TARGET_HAS_neg_vec          1
-#define TCG_TARGET_HAS_abs_vec          0
-#define TCG_TARGET_HAS_andc_vec         1
-#define TCG_TARGET_HAS_orc_vec          1
-#define TCG_TARGET_HAS_nand_vec         0
-#define TCG_TARGET_HAS_nor_vec          1
-#define TCG_TARGET_HAS_eqv_vec          0
-#define TCG_TARGET_HAS_mul_vec          1
-#define TCG_TARGET_HAS_shi_vec          1
-#define TCG_TARGET_HAS_shs_vec          0
-#define TCG_TARGET_HAS_shv_vec          1
-#define TCG_TARGET_HAS_roti_vec         1
-#define TCG_TARGET_HAS_rots_vec         0
-#define TCG_TARGET_HAS_rotv_vec         1
-#define TCG_TARGET_HAS_sat_vec          1
-#define TCG_TARGET_HAS_minmax_vec       1
-#define TCG_TARGET_HAS_bitsel_vec       1
-#define TCG_TARGET_HAS_cmpsel_vec       0
-#define TCG_TARGET_HAS_tst_vec          0
+#include "tcg-target-has.h"
 
 #define TCG_TARGET_DEFAULT_MO (0)
 
-- 
2.43.0

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Signed-off-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Message-ID: <20250108215156.8731-8-philmd@linaro.org>
---
 tcg/mips/tcg-target-has.h | 122 ++++++++++++++++++++++++++++++++++++++
 tcg/mips/tcg-target.h     | 112 +---------------------------------
 2 files changed, 123 insertions(+), 111 deletions(-)
 create mode 100644 tcg/mips/tcg-target-has.h

diff --git a/tcg/mips/tcg-target-has.h b/tcg/mips/tcg-target-has.h
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/tcg/mips/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@
+/* SPDX-License-Identifier: MIT */
+/*
+ * Define target-specific opcode support
+ * Copyright (c) 2008-2009 Arnaud Patard <arnaud.patard@rtp-net.org>
+ * Copyright (c) 2009 Aurelien Jarno <aurelien@aurel32.net>
+ */
+
+#ifndef TCG_TARGET_HAS_H
+#define TCG_TARGET_HAS_H
+
+/* MOVN/MOVZ instructions detection */
+#if (defined(__mips_isa_rev) && (__mips_isa_rev >= 1)) || \
+    defined(_MIPS_ARCH_LOONGSON2E) || defined(_MIPS_ARCH_LOONGSON2F) || \
+    defined(_MIPS_ARCH_MIPS4)
+#define use_movnz_instructions  1
+#else
+extern bool use_movnz_instructions;
+#endif
+
+/* MIPS32 instruction set detection */
+#if defined(__mips_isa_rev) && (__mips_isa_rev >= 1)
+#define use_mips32_instructions  1
+#else
+extern bool use_mips32_instructions;
+#endif
+
+/* MIPS32R2 instruction set detection */
+#if defined(__mips_isa_rev) && (__mips_isa_rev >= 2)
+#define use_mips32r2_instructions  1
+#else
+extern bool use_mips32r2_instructions;
+#endif
+
+/* MIPS32R6 instruction set detection */
+#if defined(__mips_isa_rev) && (__mips_isa_rev >= 6)
+#define use_mips32r6_instructions  1
+#else
+#define use_mips32r6_instructions  0
+#endif
+
+/* optional instructions */
+#define TCG_TARGET_HAS_div_i32          1
+#define TCG_TARGET_HAS_rem_i32          1
+#define TCG_TARGET_HAS_not_i32          1
+#define TCG_TARGET_HAS_nor_i32          1
+#define TCG_TARGET_HAS_andc_i32         0
+#define TCG_TARGET_HAS_orc_i32          0
+#define TCG_TARGET_HAS_eqv_i32          0
+#define TCG_TARGET_HAS_nand_i32         0
+#define TCG_TARGET_HAS_mulu2_i32        (!use_mips32r6_instructions)
+#define TCG_TARGET_HAS_muls2_i32        (!use_mips32r6_instructions)
+#define TCG_TARGET_HAS_muluh_i32        1
+#define TCG_TARGET_HAS_mulsh_i32        1
+#define TCG_TARGET_HAS_bswap32_i32      1
+#define TCG_TARGET_HAS_negsetcond_i32   0
+
+#if TCG_TARGET_REG_BITS == 64
+#define TCG_TARGET_HAS_add2_i32         0
+#define TCG_TARGET_HAS_sub2_i32         0
+#define TCG_TARGET_HAS_extr_i64_i32     1
+#define TCG_TARGET_HAS_div_i64          1
+#define TCG_TARGET_HAS_rem_i64          1
+#define TCG_TARGET_HAS_not_i64          1
+#define TCG_TARGET_HAS_nor_i64          1
+#define TCG_TARGET_HAS_andc_i64         0
+#define TCG_TARGET_HAS_orc_i64          0
+#define TCG_TARGET_HAS_eqv_i64          0
+#define TCG_TARGET_HAS_nand_i64         0
+#define TCG_TARGET_HAS_add2_i64         0
+#define TCG_TARGET_HAS_sub2_i64         0
+#define TCG_TARGET_HAS_mulu2_i64        (!use_mips32r6_instructions)
+#define TCG_TARGET_HAS_muls2_i64        (!use_mips32r6_instructions)
+#define TCG_TARGET_HAS_muluh_i64        1
+#define TCG_TARGET_HAS_mulsh_i64        1
+#define TCG_TARGET_HAS_ext32s_i64       1
+#define TCG_TARGET_HAS_ext32u_i64       1
+#define TCG_TARGET_HAS_negsetcond_i64   0
+#endif
+
+/* optional instructions detected at runtime */
+#define TCG_TARGET_HAS_bswap16_i32      use_mips32r2_instructions
+#define TCG_TARGET_HAS_deposit_i32      use_mips32r2_instructions
+#define TCG_TARGET_HAS_extract_i32      use_mips32r2_instructions
+#define TCG_TARGET_HAS_sextract_i32     0
+#define TCG_TARGET_HAS_extract2_i32     0
+#define TCG_TARGET_HAS_ext8s_i32        use_mips32r2_instructions
+#define TCG_TARGET_HAS_ext16s_i32       use_mips32r2_instructions
+#define TCG_TARGET_HAS_rot_i32          use_mips32r2_instructions
+#define TCG_TARGET_HAS_clz_i32          use_mips32r2_instructions
+#define TCG_TARGET_HAS_ctz_i32          0
+#define TCG_TARGET_HAS_ctpop_i32        0
+#define TCG_TARGET_HAS_qemu_st8_i32     0
+
+#if TCG_TARGET_REG_BITS == 64
+#define TCG_TARGET_HAS_bswap16_i64      use_mips32r2_instructions
+#define TCG_TARGET_HAS_bswap32_i64      use_mips32r2_instructions
+#define TCG_TARGET_HAS_bswap64_i64      use_mips32r2_instructions
+#define TCG_TARGET_HAS_deposit_i64      use_mips32r2_instructions
+#define TCG_TARGET_HAS_extract_i64      use_mips32r2_instructions
+#define TCG_TARGET_HAS_sextract_i64     0
+#define TCG_TARGET_HAS_extract2_i64     0
+#define TCG_TARGET_HAS_ext8s_i64        use_mips32r2_instructions
+#define TCG_TARGET_HAS_ext16s_i64       use_mips32r2_instructions
+#define TCG_TARGET_HAS_rot_i64          use_mips32r2_instructions
+#define TCG_TARGET_HAS_clz_i64          use_mips32r2_instructions
+#define TCG_TARGET_HAS_ctz_i64          0
+#define TCG_TARGET_HAS_ctpop_i64        0
+#endif
+
+/* optional instructions automatically implemented */
+#define TCG_TARGET_HAS_ext8u_i32        0 /* andi rt, rs, 0xff   */
+#define TCG_TARGET_HAS_ext16u_i32       0 /* andi rt, rs, 0xffff */
+
+#if TCG_TARGET_REG_BITS == 64
+#define TCG_TARGET_HAS_ext8u_i64        0 /* andi rt, rs, 0xff   */
+#define TCG_TARGET_HAS_ext16u_i64       0 /* andi rt, rs, 0xffff */
+#endif
+
+#define TCG_TARGET_HAS_qemu_ldst_i128   0
+#define TCG_TARGET_HAS_tst              0
+
+#endif
diff --git a/tcg/mips/tcg-target.h b/tcg/mips/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/mips/tcg-target.h
+++ b/tcg/mips/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
     TCG_AREG0 = TCG_REG_S8,
 } TCGReg;
 
-/* MOVN/MOVZ instructions detection */
-#if (defined(__mips_isa_rev) && (__mips_isa_rev >= 1)) || \
-    defined(_MIPS_ARCH_LOONGSON2E) || defined(_MIPS_ARCH_LOONGSON2F) || \
-    defined(_MIPS_ARCH_MIPS4)
-#define use_movnz_instructions  1
-#else
-extern bool use_movnz_instructions;
-#endif
-
-/* MIPS32 instruction set detection */
-#if defined(__mips_isa_rev) && (__mips_isa_rev >= 1)
-#define use_mips32_instructions  1
-#else
-extern bool use_mips32_instructions;
-#endif
-
-/* MIPS32R2 instruction set detection */
-#if defined(__mips_isa_rev) && (__mips_isa_rev >= 2)
-#define use_mips32r2_instructions  1
-#else
-extern bool use_mips32r2_instructions;
-#endif
-
-/* MIPS32R6 instruction set detection */
-#if defined(__mips_isa_rev) && (__mips_isa_rev >= 6)
-#define use_mips32r6_instructions  1
-#else
-#define use_mips32r6_instructions  0
-#endif
-
-/* optional instructions */
-#define TCG_TARGET_HAS_div_i32          1
-#define TCG_TARGET_HAS_rem_i32          1
-#define TCG_TARGET_HAS_not_i32          1
-#define TCG_TARGET_HAS_nor_i32          1
-#define TCG_TARGET_HAS_andc_i32         0
-#define TCG_TARGET_HAS_orc_i32          0
-#define TCG_TARGET_HAS_eqv_i32          0
-#define TCG_TARGET_HAS_nand_i32         0
-#define TCG_TARGET_HAS_mulu2_i32        (!use_mips32r6_instructions)
-#define TCG_TARGET_HAS_muls2_i32        (!use_mips32r6_instructions)
-#define TCG_TARGET_HAS_muluh_i32        1
-#define TCG_TARGET_HAS_mulsh_i32        1
-#define TCG_TARGET_HAS_bswap32_i32      1
-#define TCG_TARGET_HAS_negsetcond_i32   0
-
-#if TCG_TARGET_REG_BITS == 64
-#define TCG_TARGET_HAS_add2_i32         0
-#define TCG_TARGET_HAS_sub2_i32         0
-#define TCG_TARGET_HAS_extr_i64_i32     1
-#define TCG_TARGET_HAS_div_i64          1
-#define TCG_TARGET_HAS_rem_i64          1
-#define TCG_TARGET_HAS_not_i64          1
-#define TCG_TARGET_HAS_nor_i64          1
-#define TCG_TARGET_HAS_andc_i64         0
-#define TCG_TARGET_HAS_orc_i64          0
-#define TCG_TARGET_HAS_eqv_i64          0
-#define TCG_TARGET_HAS_nand_i64         0
-#define TCG_TARGET_HAS_add2_i64         0
-#define TCG_TARGET_HAS_sub2_i64         0
-#define TCG_TARGET_HAS_mulu2_i64        (!use_mips32r6_instructions)
-#define TCG_TARGET_HAS_muls2_i64        (!use_mips32r6_instructions)
-#define TCG_TARGET_HAS_muluh_i64        1
-#define TCG_TARGET_HAS_mulsh_i64        1
-#define TCG_TARGET_HAS_ext32s_i64       1
-#define TCG_TARGET_HAS_ext32u_i64       1
-#define TCG_TARGET_HAS_negsetcond_i64   0
-#endif
-
-/* optional instructions detected at runtime */
-#define TCG_TARGET_HAS_bswap16_i32      use_mips32r2_instructions
-#define TCG_TARGET_HAS_deposit_i32      use_mips32r2_instructions
-#define TCG_TARGET_HAS_extract_i32      use_mips32r2_instructions
-#define TCG_TARGET_HAS_sextract_i32     0
-#define TCG_TARGET_HAS_extract2_i32     0
-#define TCG_TARGET_HAS_ext8s_i32        use_mips32r2_instructions
-#define TCG_TARGET_HAS_ext16s_i32       use_mips32r2_instructions
-#define TCG_TARGET_HAS_rot_i32          use_mips32r2_instructions
-#define TCG_TARGET_HAS_clz_i32          use_mips32r2_instructions
-#define TCG_TARGET_HAS_ctz_i32          0
-#define TCG_TARGET_HAS_ctpop_i32        0
-#define TCG_TARGET_HAS_qemu_st8_i32     0
-
-#if TCG_TARGET_REG_BITS == 64
-#define TCG_TARGET_HAS_bswap16_i64      use_mips32r2_instructions
-#define TCG_TARGET_HAS_bswap32_i64      use_mips32r2_instructions
-#define TCG_TARGET_HAS_bswap64_i64      use_mips32r2_instructions
-#define TCG_TARGET_HAS_deposit_i64      use_mips32r2_instructions
-#define TCG_TARGET_HAS_extract_i64      use_mips32r2_instructions
-#define TCG_TARGET_HAS_sextract_i64     0
-#define TCG_TARGET_HAS_extract2_i64     0
-#define TCG_TARGET_HAS_ext8s_i64        use_mips32r2_instructions
-#define TCG_TARGET_HAS_ext16s_i64       use_mips32r2_instructions
-#define TCG_TARGET_HAS_rot_i64          use_mips32r2_instructions
-#define TCG_TARGET_HAS_clz_i64          use_mips32r2_instructions
-#define TCG_TARGET_HAS_ctz_i64          0
-#define TCG_TARGET_HAS_ctpop_i64        0
-#endif
-
-/* optional instructions automatically implemented */
-#define TCG_TARGET_HAS_ext8u_i32        0 /* andi rt, rs, 0xff   */
-#define TCG_TARGET_HAS_ext16u_i32       0 /* andi rt, rs, 0xffff */
-
-#if TCG_TARGET_REG_BITS == 64
-#define TCG_TARGET_HAS_ext8u_i64        0 /* andi rt, rs, 0xff   */
-#define TCG_TARGET_HAS_ext16u_i64       0 /* andi rt, rs, 0xffff */
-#endif
-
-#define TCG_TARGET_HAS_qemu_ldst_i128   0
-
-#define TCG_TARGET_HAS_tst              0
+#include "tcg-target-has.h"
 
 #define TCG_TARGET_DEFAULT_MO           0
 
-- 
2.43.0

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Signed-off-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Message-ID: <20250108215156.8731-9-philmd@linaro.org>
---
 tcg/ppc/tcg-target-has.h | 124 +++++++++++++++++++++++++++++++++++++++
 tcg/ppc/tcg-target.h     | 114 +----------------------------------
 2 files changed, 125 insertions(+), 113 deletions(-)
 create mode 100644 tcg/ppc/tcg-target-has.h

diff --git a/tcg/ppc/tcg-target-has.h b/tcg/ppc/tcg-target-has.h
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/tcg/ppc/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@
+/* SPDX-License-Identifier: MIT */
+/*
+ * Define target-specific opcode support
+ * Copyright (c) 2008 Fabrice Bellard
+ */
+
+#ifndef TCG_TARGET_HAS_H
+#define TCG_TARGET_HAS_H
+
+#include "host/cpuinfo.h"
+
+#define have_isa_2_06  (cpuinfo & CPUINFO_V2_06)
+#define have_isa_2_07  (cpuinfo & CPUINFO_V2_07)
+#define have_isa_3_00  (cpuinfo & CPUINFO_V3_0)
+#define have_isa_3_10  (cpuinfo & CPUINFO_V3_1)
+#define have_altivec   (cpuinfo & CPUINFO_ALTIVEC)
+#define have_vsx       (cpuinfo & CPUINFO_VSX)
+
+/* optional instructions automatically implemented */
+#define TCG_TARGET_HAS_ext8u_i32        0 /* andi */
+#define TCG_TARGET_HAS_ext16u_i32       0
+
+/* optional instructions */
+#define TCG_TARGET_HAS_div_i32          1
+#define TCG_TARGET_HAS_rem_i32          have_isa_3_00
+#define TCG_TARGET_HAS_rot_i32          1
+#define TCG_TARGET_HAS_ext8s_i32        1
+#define TCG_TARGET_HAS_ext16s_i32       1
+#define TCG_TARGET_HAS_bswap16_i32      1
+#define TCG_TARGET_HAS_bswap32_i32      1
+#define TCG_TARGET_HAS_not_i32          1
+#define TCG_TARGET_HAS_andc_i32         1
+#define TCG_TARGET_HAS_orc_i32          1
+#define TCG_TARGET_HAS_eqv_i32          1
+#define TCG_TARGET_HAS_nand_i32         1
+#define TCG_TARGET_HAS_nor_i32          1
+#define TCG_TARGET_HAS_clz_i32          1
+#define TCG_TARGET_HAS_ctz_i32          have_isa_3_00
+#define TCG_TARGET_HAS_ctpop_i32        have_isa_2_06
+#define TCG_TARGET_HAS_deposit_i32      1
+#define TCG_TARGET_HAS_extract_i32      1
+#define TCG_TARGET_HAS_sextract_i32     0
+#define TCG_TARGET_HAS_extract2_i32     0
+#define TCG_TARGET_HAS_negsetcond_i32   1
+#define TCG_TARGET_HAS_mulu2_i32        0
+#define TCG_TARGET_HAS_muls2_i32        0
+#define TCG_TARGET_HAS_muluh_i32        1
+#define TCG_TARGET_HAS_mulsh_i32        1
+#define TCG_TARGET_HAS_qemu_st8_i32     0
+
+#if TCG_TARGET_REG_BITS == 64
+#define TCG_TARGET_HAS_add2_i32         0
+#define TCG_TARGET_HAS_sub2_i32         0
+#define TCG_TARGET_HAS_extr_i64_i32     0
+#define TCG_TARGET_HAS_div_i64          1
+#define TCG_TARGET_HAS_rem_i64          have_isa_3_00
+#define TCG_TARGET_HAS_rot_i64          1
+#define TCG_TARGET_HAS_ext8s_i64        1
+#define TCG_TARGET_HAS_ext16s_i64       1
+#define TCG_TARGET_HAS_ext32s_i64       1
+#define TCG_TARGET_HAS_ext8u_i64        0
+#define TCG_TARGET_HAS_ext16u_i64       0
+#define TCG_TARGET_HAS_ext32u_i64       0
+#define TCG_TARGET_HAS_bswap16_i64      1
+#define TCG_TARGET_HAS_bswap32_i64      1
+#define TCG_TARGET_HAS_bswap64_i64      1
+#define TCG_TARGET_HAS_not_i64          1
+#define TCG_TARGET_HAS_andc_i64         1
+#define TCG_TARGET_HAS_orc_i64          1
+#define TCG_TARGET_HAS_eqv_i64          1
+#define TCG_TARGET_HAS_nand_i64         1
+#define TCG_TARGET_HAS_nor_i64          1
+#define TCG_TARGET_HAS_clz_i64          1
+#define TCG_TARGET_HAS_ctz_i64          have_isa_3_00
+#define TCG_TARGET_HAS_ctpop_i64        have_isa_2_06
+#define TCG_TARGET_HAS_deposit_i64      1
+#define TCG_TARGET_HAS_extract_i64      1
+#define TCG_TARGET_HAS_sextract_i64     0
+#define TCG_TARGET_HAS_extract2_i64     0
+#define TCG_TARGET_HAS_negsetcond_i64   1
+#define TCG_TARGET_HAS_add2_i64         1
+#define TCG_TARGET_HAS_sub2_i64         1
+#define TCG_TARGET_HAS_mulu2_i64        0
+#define TCG_TARGET_HAS_muls2_i64        0
+#define TCG_TARGET_HAS_muluh_i64        1
+#define TCG_TARGET_HAS_mulsh_i64        1
+#endif
+
+#define TCG_TARGET_HAS_qemu_ldst_i128   \
+    (TCG_TARGET_REG_BITS == 64 && have_isa_2_07)
+
+#define TCG_TARGET_HAS_tst              1
+
+/*
+ * While technically Altivec could support V64, it has no 64-bit store
+ * instruction and substituting two 32-bit stores makes the generated
+ * code quite large.
+ */
+#define TCG_TARGET_HAS_v64              have_vsx
+#define TCG_TARGET_HAS_v128             have_altivec
+#define TCG_TARGET_HAS_v256             0
+
+#define TCG_TARGET_HAS_andc_vec         1
+#define TCG_TARGET_HAS_orc_vec          have_isa_2_07
+#define TCG_TARGET_HAS_nand_vec         have_isa_2_07
+#define TCG_TARGET_HAS_nor_vec          1
+#define TCG_TARGET_HAS_eqv_vec          have_isa_2_07
+#define TCG_TARGET_HAS_not_vec          1
+#define TCG_TARGET_HAS_neg_vec          have_isa_3_00
+#define TCG_TARGET_HAS_abs_vec          0
+#define TCG_TARGET_HAS_roti_vec         0
+#define TCG_TARGET_HAS_rots_vec         0
+#define TCG_TARGET_HAS_rotv_vec         1
+#define TCG_TARGET_HAS_shi_vec          0
+#define TCG_TARGET_HAS_shs_vec          0
+#define TCG_TARGET_HAS_shv_vec          1
+#define TCG_TARGET_HAS_mul_vec          1
+#define TCG_TARGET_HAS_sat_vec          1
+#define TCG_TARGET_HAS_minmax_vec       1
+#define TCG_TARGET_HAS_bitsel_vec       have_vsx
+#define TCG_TARGET_HAS_cmpsel_vec       1
+#define TCG_TARGET_HAS_tst_vec          0
+
+#endif
diff --git a/tcg/ppc/tcg-target.h b/tcg/ppc/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/ppc/tcg-target.h
+++ b/tcg/ppc/tcg-target.h
@@ -XXX,XX +XXX,XX @@
 #ifndef PPC_TCG_TARGET_H
 #define PPC_TCG_TARGET_H
 
-#include "host/cpuinfo.h"
-
 #define MAX_CODE_GEN_BUFFER_SIZE  ((size_t)-1)
 
 #define TCG_TARGET_NB_REGS 64
@@ -XXX,XX +XXX,XX @@ typedef enum {
     TCG_AREG0 = TCG_REG_R27
 } TCGReg;
 
-#define have_isa_2_06  (cpuinfo & CPUINFO_V2_06)
-#define have_isa_2_07  (cpuinfo & CPUINFO_V2_07)
-#define have_isa_3_00  (cpuinfo & CPUINFO_V3_0)
-#define have_isa_3_10  (cpuinfo & CPUINFO_V3_1)
-#define have_altivec   (cpuinfo & CPUINFO_ALTIVEC)
-#define have_vsx       (cpuinfo & CPUINFO_VSX)
-
-/* optional instructions automatically implemented */
-#define TCG_TARGET_HAS_ext8u_i32        0 /* andi */
-#define TCG_TARGET_HAS_ext16u_i32       0
-
-/* optional instructions */
-#define TCG_TARGET_HAS_div_i32          1
-#define TCG_TARGET_HAS_rem_i32          have_isa_3_00
-#define TCG_TARGET_HAS_rot_i32          1
-#define TCG_TARGET_HAS_ext8s_i32        1
-#define TCG_TARGET_HAS_ext16s_i32       1
-#define TCG_TARGET_HAS_bswap16_i32      1
-#define TCG_TARGET_HAS_bswap32_i32      1
-#define TCG_TARGET_HAS_not_i32          1
-#define TCG_TARGET_HAS_andc_i32         1
-#define TCG_TARGET_HAS_orc_i32          1
-#define TCG_TARGET_HAS_eqv_i32          1
-#define TCG_TARGET_HAS_nand_i32         1
-#define TCG_TARGET_HAS_nor_i32          1
-#define TCG_TARGET_HAS_clz_i32          1
-#define TCG_TARGET_HAS_ctz_i32          have_isa_3_00
-#define TCG_TARGET_HAS_ctpop_i32        have_isa_2_06
-#define TCG_TARGET_HAS_deposit_i32      1
-#define TCG_TARGET_HAS_extract_i32      1
-#define TCG_TARGET_HAS_sextract_i32     0
-#define TCG_TARGET_HAS_extract2_i32     0
-#define TCG_TARGET_HAS_negsetcond_i32   1
-#define TCG_TARGET_HAS_mulu2_i32        0
-#define TCG_TARGET_HAS_muls2_i32        0
-#define TCG_TARGET_HAS_muluh_i32        1
-#define TCG_TARGET_HAS_mulsh_i32        1
-#define TCG_TARGET_HAS_qemu_st8_i32     0
-
-#if TCG_TARGET_REG_BITS == 64
-#define TCG_TARGET_HAS_add2_i32         0
-#define TCG_TARGET_HAS_sub2_i32         0
-#define TCG_TARGET_HAS_extr_i64_i32     0
-#define TCG_TARGET_HAS_div_i64          1
-#define TCG_TARGET_HAS_rem_i64          have_isa_3_00
-#define TCG_TARGET_HAS_rot_i64          1
-#define TCG_TARGET_HAS_ext8s_i64        1
-#define TCG_TARGET_HAS_ext16s_i64       1
-#define TCG_TARGET_HAS_ext32s_i64       1
-#define TCG_TARGET_HAS_ext8u_i64        0
-#define TCG_TARGET_HAS_ext16u_i64       0
-#define TCG_TARGET_HAS_ext32u_i64       0
-#define TCG_TARGET_HAS_bswap16_i64      1
-#define TCG_TARGET_HAS_bswap32_i64      1
-#define TCG_TARGET_HAS_bswap64_i64      1
-#define TCG_TARGET_HAS_not_i64          1
-#define TCG_TARGET_HAS_andc_i64         1
-#define TCG_TARGET_HAS_orc_i64          1
-#define TCG_TARGET_HAS_eqv_i64          1
-#define TCG_TARGET_HAS_nand_i64         1
-#define TCG_TARGET_HAS_nor_i64          1
-#define TCG_TARGET_HAS_clz_i64          1
-#define TCG_TARGET_HAS_ctz_i64          have_isa_3_00
-#define TCG_TARGET_HAS_ctpop_i64        have_isa_2_06
-#define TCG_TARGET_HAS_deposit_i64      1
-#define TCG_TARGET_HAS_extract_i64      1
-#define TCG_TARGET_HAS_sextract_i64     0
-#define TCG_TARGET_HAS_extract2_i64     0
-#define TCG_TARGET_HAS_negsetcond_i64   1
-#define TCG_TARGET_HAS_add2_i64         1
-#define TCG_TARGET_HAS_sub2_i64         1
-#define TCG_TARGET_HAS_mulu2_i64        0
-#define TCG_TARGET_HAS_muls2_i64        0
-#define TCG_TARGET_HAS_muluh_i64        1
-#define TCG_TARGET_HAS_mulsh_i64        1
-#endif
-
-#define TCG_TARGET_HAS_qemu_ldst_i128   \
-    (TCG_TARGET_REG_BITS == 64 && have_isa_2_07)
-
-#define TCG_TARGET_HAS_tst              1
-
-/*
- * While technically Altivec could support V64, it has no 64-bit store
- * instruction and substituting two 32-bit stores makes the generated
- * code quite large.
- */
-#define TCG_TARGET_HAS_v64              have_vsx
-#define TCG_TARGET_HAS_v128             have_altivec
-#define TCG_TARGET_HAS_v256             0
-
-#define TCG_TARGET_HAS_andc_vec         1
-#define TCG_TARGET_HAS_orc_vec          have_isa_2_07
-#define TCG_TARGET_HAS_nand_vec         have_isa_2_07
-#define TCG_TARGET_HAS_nor_vec          1
-#define TCG_TARGET_HAS_eqv_vec          have_isa_2_07
-#define TCG_TARGET_HAS_not_vec          1
-#define TCG_TARGET_HAS_neg_vec          have_isa_3_00
-#define TCG_TARGET_HAS_abs_vec          0
-#define TCG_TARGET_HAS_roti_vec         0
-#define TCG_TARGET_HAS_rots_vec         0
-#define TCG_TARGET_HAS_rotv_vec         1
-#define TCG_TARGET_HAS_shi_vec          0
-#define TCG_TARGET_HAS_shs_vec          0
-#define TCG_TARGET_HAS_shv_vec          1
-#define TCG_TARGET_HAS_mul_vec          1
-#define TCG_TARGET_HAS_sat_vec          1
-#define TCG_TARGET_HAS_minmax_vec       1
-#define TCG_TARGET_HAS_bitsel_vec       have_vsx
-#define TCG_TARGET_HAS_cmpsel_vec       1
-#define TCG_TARGET_HAS_tst_vec          0
+#include "tcg-target-has.h"
 
 #define TCG_TARGET_DEFAULT_MO (0)
 
-- 
2.43.0

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Signed-off-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Message-ID: <20250108215156.8731-10-philmd@linaro.org>
---
 tcg/riscv/tcg-target-has.h | 112 +++++++++++++++++++++++++++++++++++++
 tcg/riscv/tcg-target.h     | 102 +--------------------------------
 2 files changed, 113 insertions(+), 101 deletions(-)
 create mode 100644 tcg/riscv/tcg-target-has.h

diff --git a/tcg/riscv/tcg-target-has.h b/tcg/riscv/tcg-target-has.h
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/tcg/riscv/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@
+/* SPDX-License-Identifier: MIT */
+/*
+ * Define target-specific opcode support
+ * Copyright (c) 2018 SiFive, Inc
+ */
+
+#ifndef TCG_TARGET_HAS_H
+#define TCG_TARGET_HAS_H
+
+#include "host/cpuinfo.h"
+
+/* optional instructions */
+#define TCG_TARGET_HAS_negsetcond_i32   1
+#define TCG_TARGET_HAS_div_i32          1
+#define TCG_TARGET_HAS_rem_i32          1
+#define TCG_TARGET_HAS_div2_i32         0
+#define TCG_TARGET_HAS_rot_i32          (cpuinfo & CPUINFO_ZBB)
+#define TCG_TARGET_HAS_deposit_i32      0
+#define TCG_TARGET_HAS_extract_i32      0
+#define TCG_TARGET_HAS_sextract_i32     0
+#define TCG_TARGET_HAS_extract2_i32     0
+#define TCG_TARGET_HAS_add2_i32         1
+#define TCG_TARGET_HAS_sub2_i32         1
+#define TCG_TARGET_HAS_mulu2_i32        0
+#define TCG_TARGET_HAS_muls2_i32        0
+#define TCG_TARGET_HAS_muluh_i32        0
+#define TCG_TARGET_HAS_mulsh_i32        0
+#define TCG_TARGET_HAS_ext8s_i32        1
+#define TCG_TARGET_HAS_ext16s_i32       1
+#define TCG_TARGET_HAS_ext8u_i32        1
+#define TCG_TARGET_HAS_ext16u_i32       1
+#define TCG_TARGET_HAS_bswap16_i32      (cpuinfo & CPUINFO_ZBB)
+#define TCG_TARGET_HAS_bswap32_i32      (cpuinfo & CPUINFO_ZBB)
+#define TCG_TARGET_HAS_not_i32          1
+#define TCG_TARGET_HAS_andc_i32         (cpuinfo & CPUINFO_ZBB)
+#define TCG_TARGET_HAS_orc_i32          (cpuinfo & CPUINFO_ZBB)
+#define TCG_TARGET_HAS_eqv_i32          (cpuinfo & CPUINFO_ZBB)
+#define TCG_TARGET_HAS_nand_i32         0
+#define TCG_TARGET_HAS_nor_i32          0
+#define TCG_TARGET_HAS_clz_i32          (cpuinfo & CPUINFO_ZBB)
+#define TCG_TARGET_HAS_ctz_i32          (cpuinfo & CPUINFO_ZBB)
+#define TCG_TARGET_HAS_ctpop_i32        (cpuinfo & CPUINFO_ZBB)
+#define TCG_TARGET_HAS_brcond2          1
+#define TCG_TARGET_HAS_setcond2         1
+#define TCG_TARGET_HAS_qemu_st8_i32     0
+
+#define TCG_TARGET_HAS_negsetcond_i64   1
+#define TCG_TARGET_HAS_div_i64          1
+#define TCG_TARGET_HAS_rem_i64          1
+#define TCG_TARGET_HAS_div2_i64         0
+#define TCG_TARGET_HAS_rot_i64          (cpuinfo & CPUINFO_ZBB)
+#define TCG_TARGET_HAS_deposit_i64      0
+#define TCG_TARGET_HAS_extract_i64      0
+#define TCG_TARGET_HAS_sextract_i64     0
+#define TCG_TARGET_HAS_extract2_i64     0
+#define TCG_TARGET_HAS_extr_i64_i32     1
+#define TCG_TARGET_HAS_ext8s_i64        1
+#define TCG_TARGET_HAS_ext16s_i64       1
+#define TCG_TARGET_HAS_ext32s_i64       1
+#define TCG_TARGET_HAS_ext8u_i64        1
+#define TCG_TARGET_HAS_ext16u_i64       1
+#define TCG_TARGET_HAS_ext32u_i64       1
+#define TCG_TARGET_HAS_bswap16_i64      (cpuinfo & CPUINFO_ZBB)
+#define TCG_TARGET_HAS_bswap32_i64      (cpuinfo & CPUINFO_ZBB)
+#define TCG_TARGET_HAS_bswap64_i64      (cpuinfo & CPUINFO_ZBB)
+#define TCG_TARGET_HAS_not_i64          1
+#define TCG_TARGET_HAS_andc_i64         (cpuinfo & CPUINFO_ZBB)
+#define TCG_TARGET_HAS_orc_i64          (cpuinfo & CPUINFO_ZBB)
+#define TCG_TARGET_HAS_eqv_i64          (cpuinfo & CPUINFO_ZBB)
+#define TCG_TARGET_HAS_nand_i64         0
+#define TCG_TARGET_HAS_nor_i64          0
+#define TCG_TARGET_HAS_clz_i64          (cpuinfo & CPUINFO_ZBB)
+#define TCG_TARGET_HAS_ctz_i64          (cpuinfo & CPUINFO_ZBB)
+#define TCG_TARGET_HAS_ctpop_i64        (cpuinfo & CPUINFO_ZBB)
+#define TCG_TARGET_HAS_add2_i64         1
+#define TCG_TARGET_HAS_sub2_i64         1
+#define TCG_TARGET_HAS_mulu2_i64        0
+#define TCG_TARGET_HAS_muls2_i64        0
+#define TCG_TARGET_HAS_muluh_i64        1
+#define TCG_TARGET_HAS_mulsh_i64        1
+
+#define TCG_TARGET_HAS_qemu_ldst_i128   0
+
+#define TCG_TARGET_HAS_tst              0
+
+/* vector instructions */
+#define TCG_TARGET_HAS_v64              (cpuinfo & CPUINFO_ZVE64X)
+#define TCG_TARGET_HAS_v128             (cpuinfo & CPUINFO_ZVE64X)
+#define TCG_TARGET_HAS_v256             (cpuinfo & CPUINFO_ZVE64X)
+#define TCG_TARGET_HAS_andc_vec         0
+#define TCG_TARGET_HAS_orc_vec          0
+#define TCG_TARGET_HAS_nand_vec         0
+#define TCG_TARGET_HAS_nor_vec          0
+#define TCG_TARGET_HAS_eqv_vec          0
+#define TCG_TARGET_HAS_not_vec          1
+#define TCG_TARGET_HAS_neg_vec          1
+#define TCG_TARGET_HAS_abs_vec          0
+#define TCG_TARGET_HAS_roti_vec         1
+#define TCG_TARGET_HAS_rots_vec         1
+#define TCG_TARGET_HAS_rotv_vec         1
+#define TCG_TARGET_HAS_shi_vec          1
+#define TCG_TARGET_HAS_shs_vec          1
+#define TCG_TARGET_HAS_shv_vec          1
+#define TCG_TARGET_HAS_mul_vec          1
+#define TCG_TARGET_HAS_sat_vec          1
+#define TCG_TARGET_HAS_minmax_vec       1
+#define TCG_TARGET_HAS_bitsel_vec       0
+#define TCG_TARGET_HAS_cmpsel_vec       1
+
+#define TCG_TARGET_HAS_tst_vec          0
+
+#endif
diff --git a/tcg/riscv/tcg-target.h b/tcg/riscv/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/riscv/tcg-target.h
+++ b/tcg/riscv/tcg-target.h
@@ -XXX,XX +XXX,XX @@
 #ifndef RISCV_TCG_TARGET_H
 #define RISCV_TCG_TARGET_H
 
-#include "host/cpuinfo.h"
-
 #define TCG_TARGET_INSN_UNIT_SIZE 4
 #define TCG_TARGET_NB_REGS 64
 #define MAX_CODE_GEN_BUFFER_SIZE  ((size_t)-1)
@@ -XXX,XX +XXX,XX @@ typedef enum {
     TCG_REG_TMP2       = TCG_REG_T4,
 } TCGReg;
 
-/* optional instructions */
-#define TCG_TARGET_HAS_negsetcond_i32   1
-#define TCG_TARGET_HAS_div_i32          1
-#define TCG_TARGET_HAS_rem_i32          1
-#define TCG_TARGET_HAS_div2_i32         0
-#define TCG_TARGET_HAS_rot_i32          (cpuinfo & CPUINFO_ZBB)
-#define TCG_TARGET_HAS_deposit_i32      0
-#define TCG_TARGET_HAS_extract_i32      0
-#define TCG_TARGET_HAS_sextract_i32     0
-#define TCG_TARGET_HAS_extract2_i32     0
-#define TCG_TARGET_HAS_add2_i32         1
-#define TCG_TARGET_HAS_sub2_i32         1
-#define TCG_TARGET_HAS_mulu2_i32        0
-#define TCG_TARGET_HAS_muls2_i32        0
-#define TCG_TARGET_HAS_muluh_i32        0
-#define TCG_TARGET_HAS_mulsh_i32        0
-#define TCG_TARGET_HAS_ext8s_i32        1
-#define TCG_TARGET_HAS_ext16s_i32       1
-#define TCG_TARGET_HAS_ext8u_i32        1
-#define TCG_TARGET_HAS_ext16u_i32       1
-#define TCG_TARGET_HAS_bswap16_i32      (cpuinfo & CPUINFO_ZBB)
-#define TCG_TARGET_HAS_bswap32_i32      (cpuinfo & CPUINFO_ZBB)
-#define TCG_TARGET_HAS_not_i32          1
-#define TCG_TARGET_HAS_andc_i32         (cpuinfo & CPUINFO_ZBB)
-#define TCG_TARGET_HAS_orc_i32          (cpuinfo & CPUINFO_ZBB)
-#define TCG_TARGET_HAS_eqv_i32          (cpuinfo & CPUINFO_ZBB)
-#define TCG_TARGET_HAS_nand_i32         0
-#define TCG_TARGET_HAS_nor_i32          0
-#define TCG_TARGET_HAS_clz_i32          (cpuinfo & CPUINFO_ZBB)
-#define TCG_TARGET_HAS_ctz_i32          (cpuinfo & CPUINFO_ZBB)
-#define TCG_TARGET_HAS_ctpop_i32        (cpuinfo & CPUINFO_ZBB)
-#define TCG_TARGET_HAS_brcond2          1
-#define TCG_TARGET_HAS_setcond2         1
-#define TCG_TARGET_HAS_qemu_st8_i32     0
-
-#define TCG_TARGET_HAS_negsetcond_i64   1
-#define TCG_TARGET_HAS_div_i64          1
-#define TCG_TARGET_HAS_rem_i64          1
-#define TCG_TARGET_HAS_div2_i64         0
-#define TCG_TARGET_HAS_rot_i64          (cpuinfo & CPUINFO_ZBB)
-#define TCG_TARGET_HAS_deposit_i64      0
-#define TCG_TARGET_HAS_extract_i64      0
-#define TCG_TARGET_HAS_sextract_i64     0
-#define TCG_TARGET_HAS_extract2_i64     0
-#define TCG_TARGET_HAS_extr_i64_i32     1
-#define TCG_TARGET_HAS_ext8s_i64        1
-#define TCG_TARGET_HAS_ext16s_i64       1
-#define TCG_TARGET_HAS_ext32s_i64       1
-#define TCG_TARGET_HAS_ext8u_i64        1
-#define TCG_TARGET_HAS_ext16u_i64       1
-#define TCG_TARGET_HAS_ext32u_i64       1
-#define TCG_TARGET_HAS_bswap16_i64      (cpuinfo & CPUINFO_ZBB)
-#define TCG_TARGET_HAS_bswap32_i64      (cpuinfo & CPUINFO_ZBB)
-#define TCG_TARGET_HAS_bswap64_i64      (cpuinfo & CPUINFO_ZBB)
-#define TCG_TARGET_HAS_not_i64          1
-#define TCG_TARGET_HAS_andc_i64         (cpuinfo & CPUINFO_ZBB)
-#define TCG_TARGET_HAS_orc_i64          (cpuinfo & CPUINFO_ZBB)
-#define TCG_TARGET_HAS_eqv_i64          (cpuinfo & CPUINFO_ZBB)
-#define TCG_TARGET_HAS_nand_i64         0
-#define TCG_TARGET_HAS_nor_i64          0
-#define TCG_TARGET_HAS_clz_i64          (cpuinfo & CPUINFO_ZBB)
-#define TCG_TARGET_HAS_ctz_i64          (cpuinfo & CPUINFO_ZBB)
-#define TCG_TARGET_HAS_ctpop_i64        (cpuinfo & CPUINFO_ZBB)
-#define TCG_TARGET_HAS_add2_i64         1
-#define TCG_TARGET_HAS_sub2_i64         1
-#define TCG_TARGET_HAS_mulu2_i64        0
-#define TCG_TARGET_HAS_muls2_i64        0
-#define TCG_TARGET_HAS_muluh_i64        1
-#define TCG_TARGET_HAS_mulsh_i64        1
-
-#define TCG_TARGET_HAS_qemu_ldst_i128   0
-
-#define TCG_TARGET_HAS_tst              0
-
-/* vector instructions */
-#define TCG_TARGET_HAS_v64              (cpuinfo & CPUINFO_ZVE64X)
-#define TCG_TARGET_HAS_v128             (cpuinfo & CPUINFO_ZVE64X)
-#define TCG_TARGET_HAS_v256             (cpuinfo & CPUINFO_ZVE64X)
-#define TCG_TARGET_HAS_andc_vec         0
-#define TCG_TARGET_HAS_orc_vec          0
-#define TCG_TARGET_HAS_nand_vec         0
-#define TCG_TARGET_HAS_nor_vec          0
-#define TCG_TARGET_HAS_eqv_vec          0
-#define TCG_TARGET_HAS_not_vec          1
-#define TCG_TARGET_HAS_neg_vec          1
-#define TCG_TARGET_HAS_abs_vec          0
-#define TCG_TARGET_HAS_roti_vec         1
-#define TCG_TARGET_HAS_rots_vec         1
-#define TCG_TARGET_HAS_rotv_vec         1
-#define TCG_TARGET_HAS_shi_vec          1
-#define TCG_TARGET_HAS_shs_vec          1
-#define TCG_TARGET_HAS_shv_vec          1
-#define TCG_TARGET_HAS_mul_vec          1
-#define TCG_TARGET_HAS_sat_vec          1
-#define TCG_TARGET_HAS_minmax_vec       1
-#define TCG_TARGET_HAS_bitsel_vec       0
-#define TCG_TARGET_HAS_cmpsel_vec       1
-
-#define TCG_TARGET_HAS_tst_vec          0
+#include "tcg-target-has.h"
 
 #define TCG_TARGET_DEFAULT_MO (0)
 
-- 
2.43.0

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Signed-off-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Message-ID: <20250108215156.8731-11-philmd@linaro.org>
---
 tcg/s390x/tcg-target-has.h | 124 +++++++++++++++++++++++++++++++++++++
 tcg/s390x/tcg-target.h     | 114 +---------------------------------
 2 files changed, 125 insertions(+), 113 deletions(-)
 create mode 100644 tcg/s390x/tcg-target-has.h

diff --git a/tcg/s390x/tcg-target-has.h b/tcg/s390x/tcg-target-has.h
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/tcg/s390x/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@
+/* SPDX-License-Identifier: MIT */
+/*
+ * Define target-specific opcode support
+ * Copyright (c) 2009 Ulrich Hecht <uli@suse.de>
+ */
+
+#ifndef TCG_TARGET_HAS_H
+#define TCG_TARGET_HAS_H
+
+/* Facilities required for proper operation; checked at startup. */
+
+#define FACILITY_ZARCH_ACTIVE         2
+#define FACILITY_LONG_DISP            18
+#define FACILITY_EXT_IMM              21
+#define FACILITY_GEN_INST_EXT         34
+#define FACILITY_45                   45
+
+/* Facilities that are checked at runtime. */
+
+#define FACILITY_LOAD_ON_COND2        53
+#define FACILITY_MISC_INSN_EXT2       58
+#define FACILITY_MISC_INSN_EXT3       61
+#define FACILITY_VECTOR               129
+#define FACILITY_VECTOR_ENH1          135
+
+extern uint64_t s390_facilities[3];
+
+#define HAVE_FACILITY(X) \
+    ((s390_facilities[FACILITY_##X / 64] >> (63 - FACILITY_##X % 64)) & 1)
+
+/* optional instructions */
+#define TCG_TARGET_HAS_div2_i32       1
+#define TCG_TARGET_HAS_rot_i32        1
+#define TCG_TARGET_HAS_ext8s_i32      1
+#define TCG_TARGET_HAS_ext16s_i32     1
+#define TCG_TARGET_HAS_ext8u_i32      1
+#define TCG_TARGET_HAS_ext16u_i32     1
+#define TCG_TARGET_HAS_bswap16_i32    1
+#define TCG_TARGET_HAS_bswap32_i32    1
+#define TCG_TARGET_HAS_not_i32        HAVE_FACILITY(MISC_INSN_EXT3)
+#define TCG_TARGET_HAS_andc_i32       HAVE_FACILITY(MISC_INSN_EXT3)
+#define TCG_TARGET_HAS_orc_i32        HAVE_FACILITY(MISC_INSN_EXT3)
+#define TCG_TARGET_HAS_eqv_i32        HAVE_FACILITY(MISC_INSN_EXT3)
+#define TCG_TARGET_HAS_nand_i32       HAVE_FACILITY(MISC_INSN_EXT3)
+#define TCG_TARGET_HAS_nor_i32        HAVE_FACILITY(MISC_INSN_EXT3)
+#define TCG_TARGET_HAS_clz_i32        0
+#define TCG_TARGET_HAS_ctz_i32        0
+#define TCG_TARGET_HAS_ctpop_i32      1
+#define TCG_TARGET_HAS_deposit_i32    1
+#define TCG_TARGET_HAS_extract_i32    1
+#define TCG_TARGET_HAS_sextract_i32   0
+#define TCG_TARGET_HAS_extract2_i32   0
+#define TCG_TARGET_HAS_negsetcond_i32 1
+#define TCG_TARGET_HAS_add2_i32       1
+#define TCG_TARGET_HAS_sub2_i32       1
+#define TCG_TARGET_HAS_mulu2_i32      0
+#define TCG_TARGET_HAS_muls2_i32      0
+#define TCG_TARGET_HAS_muluh_i32      0
+#define TCG_TARGET_HAS_mulsh_i32      0
+#define TCG_TARGET_HAS_extr_i64_i32   0
+#define TCG_TARGET_HAS_qemu_st8_i32   0
+
+#define TCG_TARGET_HAS_div2_i64       1
+#define TCG_TARGET_HAS_rot_i64        1
+#define TCG_TARGET_HAS_ext8s_i64      1
+#define TCG_TARGET_HAS_ext16s_i64     1
+#define TCG_TARGET_HAS_ext32s_i64     1
+#define TCG_TARGET_HAS_ext8u_i64      1
+#define TCG_TARGET_HAS_ext16u_i64     1
+#define TCG_TARGET_HAS_ext32u_i64     1
+#define TCG_TARGET_HAS_bswap16_i64    1
+#define TCG_TARGET_HAS_bswap32_i64    1
+#define TCG_TARGET_HAS_bswap64_i64    1
+#define TCG_TARGET_HAS_not_i64        HAVE_FACILITY(MISC_INSN_EXT3)
+#define TCG_TARGET_HAS_andc_i64       HAVE_FACILITY(MISC_INSN_EXT3)
+#define TCG_TARGET_HAS_orc_i64        HAVE_FACILITY(MISC_INSN_EXT3)
+#define TCG_TARGET_HAS_eqv_i64        HAVE_FACILITY(MISC_INSN_EXT3)
+#define TCG_TARGET_HAS_nand_i64       HAVE_FACILITY(MISC_INSN_EXT3)
+#define TCG_TARGET_HAS_nor_i64        HAVE_FACILITY(MISC_INSN_EXT3)
+#define TCG_TARGET_HAS_clz_i64        1
+#define TCG_TARGET_HAS_ctz_i64        0
+#define TCG_TARGET_HAS_ctpop_i64      1
+#define TCG_TARGET_HAS_deposit_i64    1
+#define TCG_TARGET_HAS_extract_i64    1
+#define TCG_TARGET_HAS_sextract_i64   0
+#define TCG_TARGET_HAS_extract2_i64   0
+#define TCG_TARGET_HAS_negsetcond_i64 1
+#define TCG_TARGET_HAS_add2_i64       1
+#define TCG_TARGET_HAS_sub2_i64       1
+#define TCG_TARGET_HAS_mulu2_i64      1
+#define TCG_TARGET_HAS_muls2_i64      HAVE_FACILITY(MISC_INSN_EXT2)
+#define TCG_TARGET_HAS_muluh_i64      0
+#define TCG_TARGET_HAS_mulsh_i64      0
+
+#define TCG_TARGET_HAS_qemu_ldst_i128 1
+
+#define TCG_TARGET_HAS_tst            1
+
+#define TCG_TARGET_HAS_v64            HAVE_FACILITY(VECTOR)
+#define TCG_TARGET_HAS_v128           HAVE_FACILITY(VECTOR)
+#define TCG_TARGET_HAS_v256           0
+
+#define TCG_TARGET_HAS_andc_vec       1
+#define TCG_TARGET_HAS_orc_vec        HAVE_FACILITY(VECTOR_ENH1)
+#define TCG_TARGET_HAS_nand_vec       HAVE_FACILITY(VECTOR_ENH1)
+#define TCG_TARGET_HAS_nor_vec        1
+#define TCG_TARGET_HAS_eqv_vec        HAVE_FACILITY(VECTOR_ENH1)
+#define TCG_TARGET_HAS_not_vec        1
+#define TCG_TARGET_HAS_neg_vec        1
+#define TCG_TARGET_HAS_abs_vec        1
+#define TCG_TARGET_HAS_roti_vec       1
+#define TCG_TARGET_HAS_rots_vec       1
+#define TCG_TARGET_HAS_rotv_vec       1
+#define TCG_TARGET_HAS_shi_vec        1
+#define TCG_TARGET_HAS_shs_vec        1
+#define TCG_TARGET_HAS_shv_vec        1
+#define TCG_TARGET_HAS_mul_vec        1
+#define TCG_TARGET_HAS_sat_vec        0
+#define TCG_TARGET_HAS_minmax_vec     1
+#define TCG_TARGET_HAS_bitsel_vec     1
+#define TCG_TARGET_HAS_cmpsel_vec     1
+#define TCG_TARGET_HAS_tst_vec        0
+
+#endif
diff --git a/tcg/s390x/tcg-target.h b/tcg/s390x/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/s390x/tcg-target.h
+++ b/tcg/s390x/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum TCGReg {
 
 #define TCG_TARGET_NB_REGS 64
 
-/* Facilities required for proper operation; checked at startup. */
-
-#define FACILITY_ZARCH_ACTIVE         2
-#define FACILITY_LONG_DISP            18
-#define FACILITY_EXT_IMM              21
-#define FACILITY_GEN_INST_EXT         34
-#define FACILITY_45                   45
-
-/* Facilities that are checked at runtime. */
-
-#define FACILITY_LOAD_ON_COND2        53
-#define FACILITY_MISC_INSN_EXT2       58
-#define FACILITY_MISC_INSN_EXT3       61
-#define FACILITY_VECTOR               129
-#define FACILITY_VECTOR_ENH1          135
-
-extern uint64_t s390_facilities[3];
-
-#define HAVE_FACILITY(X) \
-    ((s390_facilities[FACILITY_##X / 64] >> (63 - FACILITY_##X % 64)) & 1)
-
-/* optional instructions */
-#define TCG_TARGET_HAS_div2_i32       1
-#define TCG_TARGET_HAS_rot_i32        1
-#define TCG_TARGET_HAS_ext8s_i32      1
-#define TCG_TARGET_HAS_ext16s_i32     1
-#define TCG_TARGET_HAS_ext8u_i32      1
-#define TCG_TARGET_HAS_ext16u_i32     1
-#define TCG_TARGET_HAS_bswap16_i32    1
-#define TCG_TARGET_HAS_bswap32_i32    1
-#define TCG_TARGET_HAS_not_i32        HAVE_FACILITY(MISC_INSN_EXT3)
-#define TCG_TARGET_HAS_andc_i32       HAVE_FACILITY(MISC_INSN_EXT3)
-#define TCG_TARGET_HAS_orc_i32        HAVE_FACILITY(MISC_INSN_EXT3)
-#define TCG_TARGET_HAS_eqv_i32        HAVE_FACILITY(MISC_INSN_EXT3)
-#define TCG_TARGET_HAS_nand_i32       HAVE_FACILITY(MISC_INSN_EXT3)
-#define TCG_TARGET_HAS_nor_i32        HAVE_FACILITY(MISC_INSN_EXT3)
-#define TCG_TARGET_HAS_clz_i32        0
-#define TCG_TARGET_HAS_ctz_i32        0
-#define TCG_TARGET_HAS_ctpop_i32      1
-#define TCG_TARGET_HAS_deposit_i32    1
-#define TCG_TARGET_HAS_extract_i32    1
-#define TCG_TARGET_HAS_sextract_i32   0
-#define TCG_TARGET_HAS_extract2_i32   0
-#define TCG_TARGET_HAS_negsetcond_i32 1
-#define TCG_TARGET_HAS_add2_i32       1
-#define TCG_TARGET_HAS_sub2_i32       1
-#define TCG_TARGET_HAS_mulu2_i32      0
-#define TCG_TARGET_HAS_muls2_i32      0
-#define TCG_TARGET_HAS_muluh_i32      0
-#define TCG_TARGET_HAS_mulsh_i32      0
-#define TCG_TARGET_HAS_extr_i64_i32   0
-#define TCG_TARGET_HAS_qemu_st8_i32   0
-
-#define TCG_TARGET_HAS_div2_i64       1
-#define TCG_TARGET_HAS_rot_i64        1
-#define TCG_TARGET_HAS_ext8s_i64      1
-#define TCG_TARGET_HAS_ext16s_i64     1
-#define TCG_TARGET_HAS_ext32s_i64     1
-#define TCG_TARGET_HAS_ext8u_i64      1
-#define TCG_TARGET_HAS_ext16u_i64     1
-#define TCG_TARGET_HAS_ext32u_i64     1
-#define TCG_TARGET_HAS_bswap16_i64    1
-#define TCG_TARGET_HAS_bswap32_i64    1
-#define TCG_TARGET_HAS_bswap64_i64    1
-#define TCG_TARGET_HAS_not_i64        HAVE_FACILITY(MISC_INSN_EXT3)
-#define TCG_TARGET_HAS_andc_i64       HAVE_FACILITY(MISC_INSN_EXT3)
-#define TCG_TARGET_HAS_orc_i64        HAVE_FACILITY(MISC_INSN_EXT3)
-#define TCG_TARGET_HAS_eqv_i64        HAVE_FACILITY(MISC_INSN_EXT3)
-#define TCG_TARGET_HAS_nand_i64       HAVE_FACILITY(MISC_INSN_EXT3)
-#define TCG_TARGET_HAS_nor_i64        HAVE_FACILITY(MISC_INSN_EXT3)
-#define TCG_TARGET_HAS_clz_i64        1
-#define TCG_TARGET_HAS_ctz_i64        0
-#define TCG_TARGET_HAS_ctpop_i64      1
-#define TCG_TARGET_HAS_deposit_i64    1
-#define TCG_TARGET_HAS_extract_i64    1
-#define TCG_TARGET_HAS_sextract_i64   0
-#define TCG_TARGET_HAS_extract2_i64   0
-#define TCG_TARGET_HAS_negsetcond_i64 1
-#define TCG_TARGET_HAS_add2_i64       1
-#define TCG_TARGET_HAS_sub2_i64       1
-#define TCG_TARGET_HAS_mulu2_i64      1
-#define TCG_TARGET_HAS_muls2_i64      HAVE_FACILITY(MISC_INSN_EXT2)
-#define TCG_TARGET_HAS_muluh_i64      0
-#define TCG_TARGET_HAS_mulsh_i64      0
-
-#define TCG_TARGET_HAS_qemu_ldst_i128 1
-
-#define TCG_TARGET_HAS_tst            1
-
-#define TCG_TARGET_HAS_v64            HAVE_FACILITY(VECTOR)
-#define TCG_TARGET_HAS_v128           HAVE_FACILITY(VECTOR)
-#define TCG_TARGET_HAS_v256           0
-
-#define TCG_TARGET_HAS_andc_vec       1
-#define TCG_TARGET_HAS_orc_vec        HAVE_FACILITY(VECTOR_ENH1)
-#define TCG_TARGET_HAS_nand_vec       HAVE_FACILITY(VECTOR_ENH1)
-#define TCG_TARGET_HAS_nor_vec        1
-#define TCG_TARGET_HAS_eqv_vec        HAVE_FACILITY(VECTOR_ENH1)
-#define TCG_TARGET_HAS_not_vec        1
-#define TCG_TARGET_HAS_neg_vec        1
-#define TCG_TARGET_HAS_abs_vec        1
-#define TCG_TARGET_HAS_roti_vec       1
-#define TCG_TARGET_HAS_rots_vec       1
-#define TCG_TARGET_HAS_rotv_vec       1
-#define TCG_TARGET_HAS_shi_vec        1
-#define TCG_TARGET_HAS_shs_vec        1
-#define TCG_TARGET_HAS_shv_vec        1
-#define TCG_TARGET_HAS_mul_vec        1
-#define TCG_TARGET_HAS_sat_vec        0
-#define TCG_TARGET_HAS_minmax_vec     1
-#define TCG_TARGET_HAS_bitsel_vec     1
-#define TCG_TARGET_HAS_cmpsel_vec     1
-#define TCG_TARGET_HAS_tst_vec        0
+#include "tcg-target-has.h"
 
 #define TCG_TARGET_DEFAULT_MO (TCG_MO_ALL & ~TCG_MO_ST_LD)
 
-- 
2.43.0

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Signed-off-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Message-ID: <20250108215156.8731-12-philmd@linaro.org>
---
 tcg/sparc64/tcg-target-has.h | 86 ++++++++++++++++++++++++++++++++++++
 tcg/sparc64/tcg-target.h     | 78 +-------------------------------
 2 files changed, 88 insertions(+), 76 deletions(-)
 create mode 100644 tcg/sparc64/tcg-target-has.h

diff --git a/tcg/sparc64/tcg-target-has.h b/tcg/sparc64/tcg-target-has.h
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/tcg/sparc64/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@
+/* SPDX-License-Identifier: MIT */
+/*
+ * Define target-specific opcode support
+ * Copyright (c) 2008 Fabrice Bellard
+ */
+
+#ifndef TCG_TARGET_HAS_H
+#define TCG_TARGET_HAS_H
+
+#if defined(__VIS__) && __VIS__ >= 0x300
+#define use_vis3_instructions  1
+#else
+extern bool use_vis3_instructions;
+#endif
+
+/* optional instructions */
+#define TCG_TARGET_HAS_div_i32		1
+#define TCG_TARGET_HAS_rem_i32		0
+#define TCG_TARGET_HAS_rot_i32          0
+#define TCG_TARGET_HAS_ext8s_i32        0
+#define TCG_TARGET_HAS_ext16s_i32       0
+#define TCG_TARGET_HAS_ext8u_i32        0
+#define TCG_TARGET_HAS_ext16u_i32       0
+#define TCG_TARGET_HAS_bswap16_i32      0
+#define TCG_TARGET_HAS_bswap32_i32      0
+#define TCG_TARGET_HAS_not_i32          1
+#define TCG_TARGET_HAS_andc_i32         1
+#define TCG_TARGET_HAS_orc_i32          1
+#define TCG_TARGET_HAS_eqv_i32          0
+#define TCG_TARGET_HAS_nand_i32         0
+#define TCG_TARGET_HAS_nor_i32          0
+#define TCG_TARGET_HAS_clz_i32          0
+#define TCG_TARGET_HAS_ctz_i32          0
+#define TCG_TARGET_HAS_ctpop_i32        0
+#define TCG_TARGET_HAS_deposit_i32      0
+#define TCG_TARGET_HAS_extract_i32      0
+#define TCG_TARGET_HAS_sextract_i32     0
+#define TCG_TARGET_HAS_extract2_i32     0
+#define TCG_TARGET_HAS_negsetcond_i32   1
+#define TCG_TARGET_HAS_add2_i32         1
+#define TCG_TARGET_HAS_sub2_i32         1
+#define TCG_TARGET_HAS_mulu2_i32        1
+#define TCG_TARGET_HAS_muls2_i32        1
+#define TCG_TARGET_HAS_muluh_i32        0
+#define TCG_TARGET_HAS_mulsh_i32        0
+#define TCG_TARGET_HAS_qemu_st8_i32     0
+
+#define TCG_TARGET_HAS_extr_i64_i32     0
+#define TCG_TARGET_HAS_div_i64          1
+#define TCG_TARGET_HAS_rem_i64          0
+#define TCG_TARGET_HAS_rot_i64          0
+#define TCG_TARGET_HAS_ext8s_i64        0
+#define TCG_TARGET_HAS_ext16s_i64       0
+#define TCG_TARGET_HAS_ext32s_i64       1
+#define TCG_TARGET_HAS_ext8u_i64        0
+#define TCG_TARGET_HAS_ext16u_i64       0
+#define TCG_TARGET_HAS_ext32u_i64       1
+#define TCG_TARGET_HAS_bswap16_i64      0
+#define TCG_TARGET_HAS_bswap32_i64      0
+#define TCG_TARGET_HAS_bswap64_i64      0
+#define TCG_TARGET_HAS_not_i64          1
+#define TCG_TARGET_HAS_andc_i64         1
+#define TCG_TARGET_HAS_orc_i64          1
+#define TCG_TARGET_HAS_eqv_i64          0
+#define TCG_TARGET_HAS_nand_i64         0
+#define TCG_TARGET_HAS_nor_i64          0
+#define TCG_TARGET_HAS_clz_i64          0
+#define TCG_TARGET_HAS_ctz_i64          0
+#define TCG_TARGET_HAS_ctpop_i64        0
+#define TCG_TARGET_HAS_deposit_i64      0
+#define TCG_TARGET_HAS_extract_i64      0
+#define TCG_TARGET_HAS_sextract_i64     0
+#define TCG_TARGET_HAS_extract2_i64     0
+#define TCG_TARGET_HAS_negsetcond_i64   1
+#define TCG_TARGET_HAS_add2_i64         1
+#define TCG_TARGET_HAS_sub2_i64         1
+#define TCG_TARGET_HAS_mulu2_i64        0
+#define TCG_TARGET_HAS_muls2_i64        0
+#define TCG_TARGET_HAS_muluh_i64        use_vis3_instructions
+#define TCG_TARGET_HAS_mulsh_i64        0
+
+#define TCG_TARGET_HAS_qemu_ldst_i128   0
+
+#define TCG_TARGET_HAS_tst              1
+
+#endif
diff --git a/tcg/sparc64/tcg-target.h b/tcg/sparc64/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/sparc64/tcg-target.h
+++ b/tcg/sparc64/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
     TCG_REG_I7,
 } TCGReg;
 
-#if defined(__VIS__) && __VIS__ >= 0x300
-#define use_vis3_instructions  1
-#else
-extern bool use_vis3_instructions;
-#endif
-
-/* optional instructions */
-#define TCG_TARGET_HAS_div_i32		1
-#define TCG_TARGET_HAS_rem_i32		0
-#define TCG_TARGET_HAS_rot_i32          0
-#define TCG_TARGET_HAS_ext8s_i32        0
-#define TCG_TARGET_HAS_ext16s_i32       0
-#define TCG_TARGET_HAS_ext8u_i32        0
-#define TCG_TARGET_HAS_ext16u_i32       0
-#define TCG_TARGET_HAS_bswap16_i32      0
-#define TCG_TARGET_HAS_bswap32_i32      0
-#define TCG_TARGET_HAS_not_i32          1
-#define TCG_TARGET_HAS_andc_i32         1
-#define TCG_TARGET_HAS_orc_i32          1
-#define TCG_TARGET_HAS_eqv_i32          0
-#define TCG_TARGET_HAS_nand_i32         0
-#define TCG_TARGET_HAS_nor_i32          0
-#define TCG_TARGET_HAS_clz_i32          0
-#define TCG_TARGET_HAS_ctz_i32          0
-#define TCG_TARGET_HAS_ctpop_i32        0
-#define TCG_TARGET_HAS_deposit_i32      0
-#define TCG_TARGET_HAS_extract_i32      0
-#define TCG_TARGET_HAS_sextract_i32     0
-#define TCG_TARGET_HAS_extract2_i32     0
-#define TCG_TARGET_HAS_negsetcond_i32   1
-#define TCG_TARGET_HAS_add2_i32         1
-#define TCG_TARGET_HAS_sub2_i32         1
-#define TCG_TARGET_HAS_mulu2_i32        1
-#define TCG_TARGET_HAS_muls2_i32        1
-#define TCG_TARGET_HAS_muluh_i32        0
-#define TCG_TARGET_HAS_mulsh_i32        0
-#define TCG_TARGET_HAS_qemu_st8_i32     0
-
-#define TCG_TARGET_HAS_extr_i64_i32     0
-#define TCG_TARGET_HAS_div_i64          1
-#define TCG_TARGET_HAS_rem_i64          0
-#define TCG_TARGET_HAS_rot_i64          0
-#define TCG_TARGET_HAS_ext8s_i64        0
-#define TCG_TARGET_HAS_ext16s_i64       0
-#define TCG_TARGET_HAS_ext32s_i64       1
-#define TCG_TARGET_HAS_ext8u_i64        0
-#define TCG_TARGET_HAS_ext16u_i64       0
-#define TCG_TARGET_HAS_ext32u_i64       1
-#define TCG_TARGET_HAS_bswap16_i64      0
-#define TCG_TARGET_HAS_bswap32_i64      0
-#define TCG_TARGET_HAS_bswap64_i64      0
-#define TCG_TARGET_HAS_not_i64          1
-#define TCG_TARGET_HAS_andc_i64         1
-#define TCG_TARGET_HAS_orc_i64          1
-#define TCG_TARGET_HAS_eqv_i64          0
-#define TCG_TARGET_HAS_nand_i64         0
-#define TCG_TARGET_HAS_nor_i64          0
-#define TCG_TARGET_HAS_clz_i64          0
-#define TCG_TARGET_HAS_ctz_i64          0
-#define TCG_TARGET_HAS_ctpop_i64        0
-#define TCG_TARGET_HAS_deposit_i64      0
-#define TCG_TARGET_HAS_extract_i64      0
-#define TCG_TARGET_HAS_sextract_i64     0
-#define TCG_TARGET_HAS_extract2_i64     0
-#define TCG_TARGET_HAS_negsetcond_i64   1
-#define TCG_TARGET_HAS_add2_i64         1
-#define TCG_TARGET_HAS_sub2_i64         1
-#define TCG_TARGET_HAS_mulu2_i64        0
-#define TCG_TARGET_HAS_muls2_i64        0
-#define TCG_TARGET_HAS_muluh_i64        use_vis3_instructions
-#define TCG_TARGET_HAS_mulsh_i64        0
-
-#define TCG_TARGET_HAS_qemu_ldst_i128   0
-
-#define TCG_TARGET_HAS_tst              1
-
 #define TCG_AREG0 TCG_REG_I0
 
+#include "tcg-target-has.h"
+
 #define TCG_TARGET_DEFAULT_MO (0)
 
 #endif
-- 
2.43.0

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Signed-off-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Message-ID: <20250108215156.8731-13-philmd@linaro.org>
---
 tcg/tci/tcg-target-has.h | 83 ++++++++++++++++++++++++++++++++++++++++
 tcg/tci/tcg-target.h     | 75 +-----------------------------------
 2 files changed, 84 insertions(+), 74 deletions(-)
 create mode 100644 tcg/tci/tcg-target-has.h

diff --git a/tcg/tci/tcg-target-has.h b/tcg/tci/tcg-target-has.h
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/tcg/tci/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@
+/* SPDX-License-Identifier: MIT */
+/*
+ * Define target-specific opcode support
+ * Copyright (c) 2009, 2011 Stefan Weil
+ */
+
+#ifndef TCG_TARGET_HAS_H
+#define TCG_TARGET_HAS_H
+
+#define TCG_TARGET_HAS_bswap16_i32      1
+#define TCG_TARGET_HAS_bswap32_i32      1
+#define TCG_TARGET_HAS_div_i32          1
+#define TCG_TARGET_HAS_rem_i32          1
+#define TCG_TARGET_HAS_ext8s_i32        1
+#define TCG_TARGET_HAS_ext16s_i32       1
+#define TCG_TARGET_HAS_ext8u_i32        1
+#define TCG_TARGET_HAS_ext16u_i32       1
+#define TCG_TARGET_HAS_andc_i32         1
+#define TCG_TARGET_HAS_deposit_i32      1
+#define TCG_TARGET_HAS_extract_i32      1
+#define TCG_TARGET_HAS_sextract_i32     1
+#define TCG_TARGET_HAS_extract2_i32     0
+#define TCG_TARGET_HAS_eqv_i32          1
+#define TCG_TARGET_HAS_nand_i32         1
+#define TCG_TARGET_HAS_nor_i32          1
+#define TCG_TARGET_HAS_clz_i32          1
+#define TCG_TARGET_HAS_ctz_i32          1
+#define TCG_TARGET_HAS_ctpop_i32        1
+#define TCG_TARGET_HAS_not_i32          1
+#define TCG_TARGET_HAS_orc_i32          1
+#define TCG_TARGET_HAS_rot_i32          1
+#define TCG_TARGET_HAS_negsetcond_i32   0
+#define TCG_TARGET_HAS_muls2_i32        1
+#define TCG_TARGET_HAS_muluh_i32        0
+#define TCG_TARGET_HAS_mulsh_i32        0
+#define TCG_TARGET_HAS_qemu_st8_i32     0
+
+#if TCG_TARGET_REG_BITS == 64
+#define TCG_TARGET_HAS_extr_i64_i32     0
+#define TCG_TARGET_HAS_bswap16_i64      1
+#define TCG_TARGET_HAS_bswap32_i64      1
+#define TCG_TARGET_HAS_bswap64_i64      1
+#define TCG_TARGET_HAS_deposit_i64      1
+#define TCG_TARGET_HAS_extract_i64      1
+#define TCG_TARGET_HAS_sextract_i64     1
+#define TCG_TARGET_HAS_extract2_i64     0
+#define TCG_TARGET_HAS_div_i64          1
+#define TCG_TARGET_HAS_rem_i64          1
+#define TCG_TARGET_HAS_ext8s_i64        1
+#define TCG_TARGET_HAS_ext16s_i64       1
+#define TCG_TARGET_HAS_ext32s_i64       1
+#define TCG_TARGET_HAS_ext8u_i64        1
+#define TCG_TARGET_HAS_ext16u_i64       1
+#define TCG_TARGET_HAS_ext32u_i64       1
+#define TCG_TARGET_HAS_andc_i64         1
+#define TCG_TARGET_HAS_eqv_i64          1
+#define TCG_TARGET_HAS_nand_i64         1
+#define TCG_TARGET_HAS_nor_i64          1
+#define TCG_TARGET_HAS_clz_i64          1
+#define TCG_TARGET_HAS_ctz_i64          1
+#define TCG_TARGET_HAS_ctpop_i64        1
+#define TCG_TARGET_HAS_not_i64          1
+#define TCG_TARGET_HAS_orc_i64          1
+#define TCG_TARGET_HAS_rot_i64          1
+#define TCG_TARGET_HAS_negsetcond_i64   0
+#define TCG_TARGET_HAS_muls2_i64        1
+#define TCG_TARGET_HAS_add2_i32         1
+#define TCG_TARGET_HAS_sub2_i32         1
+#define TCG_TARGET_HAS_mulu2_i32        1
+#define TCG_TARGET_HAS_add2_i64         1
+#define TCG_TARGET_HAS_sub2_i64         1
+#define TCG_TARGET_HAS_mulu2_i64        1
+#define TCG_TARGET_HAS_muluh_i64        0
+#define TCG_TARGET_HAS_mulsh_i64        0
+#else
+#define TCG_TARGET_HAS_mulu2_i32        1
+#endif /* TCG_TARGET_REG_BITS == 64 */
+
+#define TCG_TARGET_HAS_qemu_ldst_i128   0
+
+#define TCG_TARGET_HAS_tst              1
+
+#endif
diff --git a/tcg/tci/tcg-target.h b/tcg/tci/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tci/tcg-target.h
+++ b/tcg/tci/tcg-target.h
@@ -XXX,XX +XXX,XX @@
 #define TCG_TARGET_INSN_UNIT_SIZE 4
 #define MAX_CODE_GEN_BUFFER_SIZE  ((size_t)-1)
 
-/* Optional instructions. */
-
-#define TCG_TARGET_HAS_bswap16_i32      1
-#define TCG_TARGET_HAS_bswap32_i32      1
-#define TCG_TARGET_HAS_div_i32          1
-#define TCG_TARGET_HAS_rem_i32          1
-#define TCG_TARGET_HAS_ext8s_i32        1
-#define TCG_TARGET_HAS_ext16s_i32       1
-#define TCG_TARGET_HAS_ext8u_i32        1
-#define TCG_TARGET_HAS_ext16u_i32       1
-#define TCG_TARGET_HAS_andc_i32         1
-#define TCG_TARGET_HAS_deposit_i32      1
-#define TCG_TARGET_HAS_extract_i32      1
-#define TCG_TARGET_HAS_sextract_i32     1
-#define TCG_TARGET_HAS_extract2_i32     0
-#define TCG_TARGET_HAS_eqv_i32          1
-#define TCG_TARGET_HAS_nand_i32         1
-#define TCG_TARGET_HAS_nor_i32          1
-#define TCG_TARGET_HAS_clz_i32          1
-#define TCG_TARGET_HAS_ctz_i32          1
-#define TCG_TARGET_HAS_ctpop_i32        1
-#define TCG_TARGET_HAS_not_i32          1
-#define TCG_TARGET_HAS_orc_i32          1
-#define TCG_TARGET_HAS_rot_i32          1
-#define TCG_TARGET_HAS_negsetcond_i32   0
-#define TCG_TARGET_HAS_muls2_i32        1
-#define TCG_TARGET_HAS_muluh_i32        0
-#define TCG_TARGET_HAS_mulsh_i32        0
-#define TCG_TARGET_HAS_qemu_st8_i32     0
-
-#if TCG_TARGET_REG_BITS == 64
-#define TCG_TARGET_HAS_extr_i64_i32     0
-#define TCG_TARGET_HAS_bswap16_i64      1
-#define TCG_TARGET_HAS_bswap32_i64      1
-#define TCG_TARGET_HAS_bswap64_i64      1
-#define TCG_TARGET_HAS_deposit_i64      1
-#define TCG_TARGET_HAS_extract_i64      1
-#define TCG_TARGET_HAS_sextract_i64     1
-#define TCG_TARGET_HAS_extract2_i64     0
-#define TCG_TARGET_HAS_div_i64          1
-#define TCG_TARGET_HAS_rem_i64          1
-#define TCG_TARGET_HAS_ext8s_i64        1
-#define TCG_TARGET_HAS_ext16s_i64       1
-#define TCG_TARGET_HAS_ext32s_i64       1
-#define TCG_TARGET_HAS_ext8u_i64        1
-#define TCG_TARGET_HAS_ext16u_i64       1
-#define TCG_TARGET_HAS_ext32u_i64       1
-#define TCG_TARGET_HAS_andc_i64         1
-#define TCG_TARGET_HAS_eqv_i64          1
-#define TCG_TARGET_HAS_nand_i64         1
-#define TCG_TARGET_HAS_nor_i64          1
-#define TCG_TARGET_HAS_clz_i64          1
-#define TCG_TARGET_HAS_ctz_i64          1
-#define TCG_TARGET_HAS_ctpop_i64        1
-#define TCG_TARGET_HAS_not_i64          1
-#define TCG_TARGET_HAS_orc_i64          1
-#define TCG_TARGET_HAS_rot_i64          1
-#define TCG_TARGET_HAS_negsetcond_i64   0
-#define TCG_TARGET_HAS_muls2_i64        1
-#define TCG_TARGET_HAS_add2_i32         1
-#define TCG_TARGET_HAS_sub2_i32         1
-#define TCG_TARGET_HAS_mulu2_i32        1
-#define TCG_TARGET_HAS_add2_i64         1
-#define TCG_TARGET_HAS_sub2_i64         1
-#define TCG_TARGET_HAS_mulu2_i64        1
-#define TCG_TARGET_HAS_muluh_i64        0
-#define TCG_TARGET_HAS_mulsh_i64        0
-#else
-#define TCG_TARGET_HAS_mulu2_i32        1
-#endif /* TCG_TARGET_REG_BITS == 64 */
-
-#define TCG_TARGET_HAS_qemu_ldst_i128   0
-
-#define TCG_TARGET_HAS_tst              1
+#include "tcg-target-has.h"
 
 /* Number of registers available. */
 #define TCG_TARGET_NB_REGS 16
-- 
2.43.0

Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Signed-off-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Message-ID: <20250108215156.8731-14-philmd@linaro.org>
---
 tcg/aarch64/tcg-target.h     | 2 --
 tcg/arm/tcg-target.h         | 2 --
 tcg/i386/tcg-target.h        | 2 --
 tcg/loongarch64/tcg-target.h | 2 --
 tcg/mips/tcg-target.h        | 2 --
 tcg/ppc/tcg-target.h         | 2 --
 tcg/riscv/tcg-target.h       | 2 --
 tcg/s390x/tcg-target.h       | 2 --
 tcg/sparc64/tcg-target.h     | 2 --
 tcg/tcg-has.h                | 2 ++
 tcg/tci/tcg-target.h         | 2 --
 11 files changed, 2 insertions(+), 20 deletions(-)

TCG_TARGET_HAS_* definitions don't need to be exposed
by "tcg/tcg.h". Only include 'tcg-has.h' when necessary.

diff --git a/include/tcg/tcg.h b/include/tcg/tcg.h
index XXXXXXX..XXXXXXX 100644
--- a/include/tcg/tcg.h
+++ b/include/tcg/tcg.h
@@ -XXX,XX +XXX,XX @@ typedef uint64_t TCGRegSet;
 #error unsupported
 #endif
 
-#include "tcg/tcg-has.h"
-
 typedef enum TCGOpcode {
 #define DEF(name, oargs, iargs, cargs, flags) INDEX_op_ ## name,
 #include "tcg/tcg-opc.h"
diff --git a/tcg/optimize.c b/tcg/optimize.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/optimize.c
+++ b/tcg/optimize.c
@@ -XXX,XX +XXX,XX @@
 #include "qemu/interval-tree.h"
 #include "tcg/tcg-op-common.h"
 #include "tcg-internal.h"
+#include "tcg-has.h"
 
 #define CASE_OP_32_64(x)                        \
         glue(glue(case INDEX_op_, x), _i32):    \
diff --git a/tcg/tcg-common.c b/tcg/tcg-common.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg-common.c
+++ b/tcg/tcg-common.c
@@ -XXX,XX +XXX,XX @@
 
 #include "qemu/osdep.h"
 #include "tcg/tcg.h"
+#include "tcg-has.h"
 
 TCGOpDef tcg_op_defs[] = {
 #define DEF(s, oargs, iargs, cargs, flags) \
diff --git a/tcg/tcg-op-gvec.c b/tcg/tcg-op-gvec.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg-op-gvec.c
+++ b/tcg/tcg-op-gvec.c
@@ -XXX,XX +XXX,XX @@
 #include "tcg/tcg-op-common.h"
 #include "tcg/tcg-op-gvec-common.h"
 #include "tcg/tcg-gvec-desc.h"
+#include "tcg-has.h"
 
 #define MAX_UNROLL  4
 
diff --git a/tcg/tcg-op-ldst.c b/tcg/tcg-op-ldst.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg-op-ldst.c
+++ b/tcg/tcg-op-ldst.c
@@ -XXX,XX +XXX,XX @@
 #include "exec/translation-block.h"
 #include "exec/plugin-gen.h"
 #include "tcg-internal.h"
-
+#include "tcg-has.h"
 
 static void check_max_alignment(unsigned a_bits)
 {
diff --git a/tcg/tcg-op-vec.c b/tcg/tcg-op-vec.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg-op-vec.c
+++ b/tcg/tcg-op-vec.c
@@ -XXX,XX +XXX,XX @@
 #include "tcg/tcg-op-common.h"
 #include "tcg/tcg-mo.h"
 #include "tcg-internal.h"
+#include "tcg-has.h"
 
 /*
  * Vector optional opcode tracking.
diff --git a/tcg/tcg-op.c b/tcg/tcg-op.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg-op.c
+++ b/tcg/tcg-op.c
@@ -XXX,XX +XXX,XX @@
 #include "exec/translation-block.h"
 #include "exec/plugin-gen.h"
 #include "tcg-internal.h"
-
+#include "tcg-has.h"
 
 /*
  * Encourage the compiler to tail-call to a function, rather than inlining.
diff --git a/tcg/tcg.c b/tcg/tcg.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg.c
+++ b/tcg/tcg.c
@@ -XXX,XX +XXX,XX @@
 #include "tcg/tcg-temp-internal.h"
 #include "tcg-internal.h"
 #include "tcg/perf.h"
+#include "tcg-has.h"
 #ifdef CONFIG_USER_ONLY
 #include "user/guest-base.h"
 #endif
diff --git a/tcg/tci.c b/tcg/tci.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tci.c
+++ b/tcg/tci.c
@@ -XXX,XX +XXX,XX @@
 #include "tcg/helper-info.h"
 #include "tcg/tcg-ldst.h"
 #include "disas/dis-asm.h"
+#include "tcg-has.h"
 #include <ffi.h>
 
 
-- 
2.43.0

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 accel/tcg/internal-target.h     |  1 +
 tcg/aarch64/tcg-target-mo.h     | 12 ++++++++++++
 tcg/aarch64/tcg-target.h        |  2 --
 tcg/arm/tcg-target-mo.h         | 13 +++++++++++++
 tcg/arm/tcg-target.h            |  2 --
 tcg/i386/tcg-target-mo.h        | 19 +++++++++++++++++++
 tcg/i386/tcg-target.h           | 11 -----------
 tcg/loongarch64/tcg-target-mo.h | 12 ++++++++++++
 tcg/loongarch64/tcg-target.h    |  2 --
 tcg/mips/tcg-target-mo.h        | 13 +++++++++++++
 tcg/mips/tcg-target.h           |  2 --
 tcg/ppc/tcg-target-mo.h         | 12 ++++++++++++
 tcg/ppc/tcg-target.h            |  2 --
 tcg/riscv/tcg-target-mo.h       | 12 ++++++++++++
 tcg/riscv/tcg-target.h          |  2 --
 tcg/s390x/tcg-target-mo.h       | 12 ++++++++++++
 tcg/s390x/tcg-target.h          |  2 --
 tcg/sparc64/tcg-target-mo.h     | 12 ++++++++++++
 tcg/sparc64/tcg-target.h        |  2 --
 tcg/tci/tcg-target-mo.h         | 17 +++++++++++++++++
 tcg/tci/tcg-target.h            |  5 -----
 tcg/tcg-op-ldst.c               |  1 +
 22 files changed, 136 insertions(+), 32 deletions(-)
 create mode 100644 tcg/aarch64/tcg-target-mo.h
 create mode 100644 tcg/arm/tcg-target-mo.h
 create mode 100644 tcg/i386/tcg-target-mo.h
 create mode 100644 tcg/loongarch64/tcg-target-mo.h
 create mode 100644 tcg/mips/tcg-target-mo.h
 create mode 100644 tcg/ppc/tcg-target-mo.h
 create mode 100644 tcg/riscv/tcg-target-mo.h
 create mode 100644 tcg/s390x/tcg-target-mo.h
 create mode 100644 tcg/sparc64/tcg-target-mo.h
 create mode 100644 tcg/tci/tcg-target-mo.h

diff --git a/accel/tcg/internal-target.h b/accel/tcg/internal-target.h
index XXXXXXX..XXXXXXX 100644
--- a/accel/tcg/internal-target.h
+++ b/accel/tcg/internal-target.h
@@ -XXX,XX +XXX,XX @@
 #include "exec/exec-all.h"
 #include "exec/translation-block.h"
 #include "tb-internal.h"
+#include "tcg-target-mo.h"
 
 /*
  * Access to the various translations structures need to be serialised
diff --git a/tcg/aarch64/tcg-target-mo.h b/tcg/aarch64/tcg-target-mo.h
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/tcg/aarch64/tcg-target-mo.h
@@ -XXX,XX +XXX,XX @@
+/* SPDX-License-Identifier: GPL-2.0-or-later */
+/*
+ * Define target-specific memory model
+ * Copyright (c) 2013 Huawei Technologies Duesseldorf GmbH
+ */
+
+#ifndef TCG_TARGET_MO_H
+#define TCG_TARGET_MO_H
+
+#define TCG_TARGET_DEFAULT_MO  0
+
+#endif
diff --git a/tcg/aarch64/tcg-target.h b/tcg/aarch64/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/aarch64/tcg-target.h
+++ b/tcg/aarch64/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
 
 #define TCG_TARGET_NB_REGS 64
 
-#define TCG_TARGET_DEFAULT_MO (0)
-
 #endif /* AARCH64_TCG_TARGET_H */
diff --git a/tcg/arm/tcg-target-mo.h b/tcg/arm/tcg-target-mo.h
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/tcg/arm/tcg-target-mo.h
@@ -XXX,XX +XXX,XX @@
+/* SPDX-License-Identifier: MIT */
+/*
+ * Define target-specific memory model
+ * Copyright (c) 2008 Fabrice Bellard
+ * Copyright (c) 2008 Andrzej Zaborowski
+ */
+
+#ifndef TCG_TARGET_MO_H
+#define TCG_TARGET_MO_H
+
+#define TCG_TARGET_DEFAULT_MO  0
+
+#endif
diff --git a/tcg/arm/tcg-target.h b/tcg/arm/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/arm/tcg-target.h
+++ b/tcg/arm/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
 
 #define TCG_TARGET_NB_REGS 32
 
-#define TCG_TARGET_DEFAULT_MO (0)
-
 #endif
diff --git a/tcg/i386/tcg-target-mo.h b/tcg/i386/tcg-target-mo.h
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/tcg/i386/tcg-target-mo.h
@@ -XXX,XX +XXX,XX @@
+/* SPDX-License-Identifier: MIT */
+/*
+ * Define target-specific memory model
+ * Copyright (c) 2008 Fabrice Bellard
+ */
+
+#ifndef TCG_TARGET_MO_H
+#define TCG_TARGET_MO_H
+
+/*
+ * This defines the natural memory order supported by this architecture
+ * before guarantees made by various barrier instructions.
+ *
+ * The x86 has a pretty strong memory ordering which only really
+ * allows for some stores to be re-ordered after loads.
+ */
+#define TCG_TARGET_DEFAULT_MO (TCG_MO_ALL & ~TCG_MO_ST_LD)
+
+#endif
diff --git a/tcg/i386/tcg-target.h b/tcg/i386/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/i386/tcg-target.h
+++ b/tcg/i386/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
     TCG_REG_CALL_STACK = TCG_REG_ESP
 } TCGReg;
 
-/* This defines the natural memory order supported by this
- * architecture before guarantees made by various barrier
- * instructions.
- *
- * The x86 has a pretty strong memory ordering which only really
- * allows for some stores to be re-ordered after loads.
- */
-#include "tcg/tcg-mo.h"
-
-#define TCG_TARGET_DEFAULT_MO (TCG_MO_ALL & ~TCG_MO_ST_LD)
-
 #endif
diff --git a/tcg/loongarch64/tcg-target-mo.h b/tcg/loongarch64/tcg-target-mo.h
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/tcg/loongarch64/tcg-target-mo.h
@@ -XXX,XX +XXX,XX @@
+/* SPDX-License-Identifier: MIT */
+/*
+ * Define target-specific memory model
+ * Copyright (c) 2021 WANG Xuerui <git@xen0n.name>
+ */
+
+#ifndef TCG_TARGET_MO_H
+#define TCG_TARGET_MO_H
+
+#define TCG_TARGET_DEFAULT_MO  0
+
+#endif
diff --git a/tcg/loongarch64/tcg-target.h b/tcg/loongarch64/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/loongarch64/tcg-target.h
+++ b/tcg/loongarch64/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
     TCG_VEC_TMP0 = TCG_REG_V23,
 } TCGReg;
 
-#define TCG_TARGET_DEFAULT_MO (0)
-
 #endif /* LOONGARCH_TCG_TARGET_H */
diff --git a/tcg/mips/tcg-target-mo.h b/tcg/mips/tcg-target-mo.h
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/tcg/mips/tcg-target-mo.h
@@ -XXX,XX +XXX,XX @@
+/* SPDX-License-Identifier: MIT */
+/*
+ * Define target-specific memory model
+ * Copyright (c) 2008-2009 Arnaud Patard <arnaud.patard@rtp-net.org>
+ * Copyright (c) 2009 Aurelien Jarno <aurelien@aurel32.net>
+ */
+
+#ifndef TCG_TARGET_MO_H
+#define TCG_TARGET_MO_H
+
+#define TCG_TARGET_DEFAULT_MO  0
+
+#endif
diff --git a/tcg/mips/tcg-target.h b/tcg/mips/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/mips/tcg-target.h
+++ b/tcg/mips/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
     TCG_AREG0 = TCG_REG_S8,
 } TCGReg;
 
-#define TCG_TARGET_DEFAULT_MO           0
-
 #endif
diff --git a/tcg/ppc/tcg-target-mo.h b/tcg/ppc/tcg-target-mo.h
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/tcg/ppc/tcg-target-mo.h
@@ -XXX,XX +XXX,XX @@
+/* SPDX-License-Identifier: MIT */
+/*
+ * Define target-specific memory model
+ * Copyright (c) 2008 Fabrice Bellard
+ */
+
+#ifndef TCG_TARGET_MO_H
+#define TCG_TARGET_MO_H
+
+#define TCG_TARGET_DEFAULT_MO  0
+
+#endif
diff --git a/tcg/ppc/tcg-target.h b/tcg/ppc/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/ppc/tcg-target.h
+++ b/tcg/ppc/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
     TCG_AREG0 = TCG_REG_R27
 } TCGReg;
 
-#define TCG_TARGET_DEFAULT_MO (0)
-
 #endif
diff --git a/tcg/riscv/tcg-target-mo.h b/tcg/riscv/tcg-target-mo.h
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/tcg/riscv/tcg-target-mo.h
@@ -XXX,XX +XXX,XX @@
+/* SPDX-License-Identifier: MIT */
+/*
+ * Define target-specific memory model
+ * Copyright (c) 2018 SiFive, Inc
+ */
+
+#ifndef TCG_TARGET_MO_H
+#define TCG_TARGET_MO_H
+
+#define TCG_TARGET_DEFAULT_MO  0
+
+#endif
diff --git a/tcg/riscv/tcg-target.h b/tcg/riscv/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/riscv/tcg-target.h
+++ b/tcg/riscv/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
     TCG_REG_TMP2       = TCG_REG_T4,
 } TCGReg;
 
-#define TCG_TARGET_DEFAULT_MO (0)
-
 #endif
diff --git a/tcg/s390x/tcg-target-mo.h b/tcg/s390x/tcg-target-mo.h
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/tcg/s390x/tcg-target-mo.h
@@ -XXX,XX +XXX,XX @@
+/* SPDX-License-Identifier: MIT */
+/*
+ * Define target-specific memory model
+ * Copyright (c) 2009 Ulrich Hecht <uli@suse.de>
+ */
+
+#ifndef TCG_TARGET_MO_H
+#define TCG_TARGET_MO_H
+
+#define TCG_TARGET_DEFAULT_MO (TCG_MO_ALL & ~TCG_MO_ST_LD)
+
+#endif
diff --git a/tcg/s390x/tcg-target.h b/tcg/s390x/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/s390x/tcg-target.h
+++ b/tcg/s390x/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum TCGReg {
 
 #define TCG_TARGET_NB_REGS 64
 
-#define TCG_TARGET_DEFAULT_MO (TCG_MO_ALL & ~TCG_MO_ST_LD)
-
 #endif
diff --git a/tcg/sparc64/tcg-target-mo.h b/tcg/sparc64/tcg-target-mo.h
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/tcg/sparc64/tcg-target-mo.h
@@ -XXX,XX +XXX,XX @@
+/* SPDX-License-Identifier: MIT */
+/*
+ * Define target-specific memory model
+ * Copyright (c) 2008 Fabrice Bellard
+ */
+
+#ifndef TCG_TARGET_MO_H
+#define TCG_TARGET_MO_H
+
+#define TCG_TARGET_DEFAULT_MO  0
+
+#endif
diff --git a/tcg/sparc64/tcg-target.h b/tcg/sparc64/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/sparc64/tcg-target.h
+++ b/tcg/sparc64/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
 
 #define TCG_AREG0 TCG_REG_I0
 
-#define TCG_TARGET_DEFAULT_MO (0)
-
 #endif
diff --git a/tcg/tci/tcg-target-mo.h b/tcg/tci/tcg-target-mo.h
new file mode 100644
index XXXXXXX..XXXXXXX
--- /dev/null
+++ b/tcg/tci/tcg-target-mo.h
@@ -XXX,XX +XXX,XX @@
+/* SPDX-License-Identifier: MIT */
+/*
+ * Define target-specific memory model
+ * Copyright (c) 2009, 2011 Stefan Weil
+ */
+
+#ifndef TCG_TARGET_MO_H
+#define TCG_TARGET_MO_H
+
+/*
+ * We could notice __i386__ or __s390x__ and reduce the barriers depending
+ * on the host.  But if you want performance, you use the normal backend.
+ * We prefer consistency across hosts on this.
+ */
+#define TCG_TARGET_DEFAULT_MO  0
+
+#endif
diff --git a/tcg/tci/tcg-target.h b/tcg/tci/tcg-target.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tci/tcg-target.h
+++ b/tcg/tci/tcg-target.h
@@ -XXX,XX +XXX,XX @@ typedef enum {
 #define HAVE_TCG_QEMU_TB_EXEC
 #define TCG_TARGET_NEED_POOL_LABELS
 
-/* We could notice __i386__ or __s390x__ and reduce the barriers depending
-   on the host.  But if you want performance, you use the normal backend.
-   We prefer consistency across hosts on this.  */
-#define TCG_TARGET_DEFAULT_MO  (0)
-
 #endif /* TCG_TARGET_H */
diff --git a/tcg/tcg-op-ldst.c b/tcg/tcg-op-ldst.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg-op-ldst.c
+++ b/tcg/tcg-op-ldst.c
@@ -XXX,XX +XXX,XX @@
 #include "exec/plugin-gen.h"
 #include "tcg-internal.h"
 #include "tcg-has.h"
+#include "tcg-target-mo.h"
 
 static void check_max_alignment(unsigned a_bits)
 {
-- 
2.43.0

Return C_NotImplemented instead of asserting for opcodes
not implemented by the backend.  For now, the assertion
moves to process_op_defs.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 tcg/tcg.c                        | 10 ++++++----
 tcg/aarch64/tcg-target.c.inc     |  2 +-
 tcg/arm/tcg-target.c.inc         |  2 +-
 tcg/i386/tcg-target.c.inc        |  2 +-
 tcg/loongarch64/tcg-target.c.inc |  2 +-
 tcg/mips/tcg-target.c.inc        |  2 +-
 tcg/ppc/tcg-target.c.inc         |  2 +-
 tcg/riscv/tcg-target.c.inc       |  2 +-
 tcg/s390x/tcg-target.c.inc       |  2 +-
 tcg/sparc64/tcg-target.c.inc     |  2 +-
 tcg/tci/tcg-target.c.inc         |  2 +-
 11 files changed, 16 insertions(+), 14 deletions(-)

diff --git a/tcg/tcg.c b/tcg/tcg.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg.c
+++ b/tcg/tcg.c
@@ -XXX,XX +XXX,XX @@ static int tcg_out_pool_finalize(TCGContext *s)
 #define C_N1_O1_I4(O1, O2, I1, I2, I3, I4) C_PFX6(c_n1_o1_i4_, O1, O2, I1, I2, I3, I4),
 
 typedef enum {
+    C_NotImplemented = -1,
 #include "tcg-target-con-set.h"
 } TCGConstraintSetIndex;
 
@@ -XXX,XX +XXX,XX @@ static void process_op_defs(TCGContext *s)
         const TCGTargetOpDef *tdefs;
         bool saw_alias_pair = false;
         int i, o, i2, o2, nb_args;
+        TCGConstraintSetIndex con_set;
 
         if (def->flags & TCG_OPF_NOT_PRESENT) {
             continue;
@@ -XXX,XX +XXX,XX @@ static void process_op_defs(TCGContext *s)
 
         /*
          * Macro magic should make it impossible, but double-check that
-         * the array index is in range.  Since the signness of an enum
-         * is implementation defined, force the result to unsigned.
+         * the array index is in range.  At the same time, double-check
+         * that the opcode is implemented, i.e. not C_NotImplemented.
          */
-        unsigned con_set = tcg_target_op_def(op);
-        tcg_debug_assert(con_set < ARRAY_SIZE(constraint_sets));
+        con_set = tcg_target_op_def(op);
+        tcg_debug_assert(con_set >= 0 && con_set < ARRAY_SIZE(constraint_sets));
         tdefs = &constraint_sets[con_set];
 
         for (i = 0; i < nb_args; i++) {
diff --git a/tcg/aarch64/tcg-target.c.inc b/tcg/aarch64/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/aarch64/tcg-target.c.inc
+++ b/tcg/aarch64/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
         return C_O1_I2(w, 0, w);
 
     default:
-        g_assert_not_reached();
+        return C_NotImplemented;
     }
 }
 
diff --git a/tcg/arm/tcg-target.c.inc b/tcg/arm/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/arm/tcg-target.c.inc
+++ b/tcg/arm/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
     case INDEX_op_bitsel_vec:
         return C_O1_I3(w, w, w, w);
     default:
-        g_assert_not_reached();
+        return C_NotImplemented;
     }
 }
 
diff --git a/tcg/i386/tcg-target.c.inc b/tcg/i386/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/i386/tcg-target.c.inc
+++ b/tcg/i386/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
         return C_O1_I4(x, x, x, xO, x);
 
     default:
-        g_assert_not_reached();
+        return C_NotImplemented;
     }
 }
 
diff --git a/tcg/loongarch64/tcg-target.c.inc b/tcg/loongarch64/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/loongarch64/tcg-target.c.inc
+++ b/tcg/loongarch64/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
         return C_O1_I3(w, w, w, w);
 
     default:
-        g_assert_not_reached();
+        return C_NotImplemented;
     }
 }
 
diff --git a/tcg/mips/tcg-target.c.inc b/tcg/mips/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/mips/tcg-target.c.inc
+++ b/tcg/mips/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
                 : C_O0_I4(rZ, rZ, r, r));
 
     default:
-        g_assert_not_reached();
+        return C_NotImplemented;
     }
 }
 
diff --git a/tcg/ppc/tcg-target.c.inc b/tcg/ppc/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/ppc/tcg-target.c.inc
+++ b/tcg/ppc/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
         return C_O1_I4(v, v, v, vZM, v);
 
     default:
-        g_assert_not_reached();
+        return C_NotImplemented;
     }
 }
 
diff --git a/tcg/riscv/tcg-target.c.inc b/tcg/riscv/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/riscv/tcg-target.c.inc
+++ b/tcg/riscv/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
     case INDEX_op_cmpsel_vec:
         return C_O1_I4(v, v, vL, vK, vK);
     default:
-        g_assert_not_reached();
+        return C_NotImplemented;
     }
 }
 
diff --git a/tcg/s390x/tcg-target.c.inc b/tcg/s390x/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/s390x/tcg-target.c.inc
+++ b/tcg/s390x/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
                 : C_O1_I4(v, v, v, vZ, v));
 
     default:
-        g_assert_not_reached();
+        return C_NotImplemented;
     }
 }
 
diff --git a/tcg/sparc64/tcg-target.c.inc b/tcg/sparc64/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/sparc64/tcg-target.c.inc
+++ b/tcg/sparc64/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
         return C_O1_I2(r, r, r);
 
     default:
-        g_assert_not_reached();
+        return C_NotImplemented;
     }
 }
 
diff --git a/tcg/tci/tcg-target.c.inc b/tcg/tci/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tci/tcg-target.c.inc
+++ b/tcg/tci/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
         return TCG_TARGET_REG_BITS == 64 ? C_O0_I2(r, r) : C_O0_I4(r, r, r, r);
 
     default:
-        g_assert_not_reached();
+        return C_NotImplemented;
     }
 }
 
-- 
2.43.0

Test each vector type, not just lumping them all together.
Add tests for I32 (always true) and I64 (64-bit hosts).

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 tcg/tcg.c | 66 ++++++++++++++++++++++++++++++++++++-------------------
 1 file changed, 43 insertions(+), 23 deletions(-)

diff --git a/tcg/tcg.c b/tcg/tcg.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg.c
+++ b/tcg/tcg.c
@@ -XXX,XX +XXX,XX @@ TCGTemp *tcgv_i32_temp(TCGv_i32 v)
  */
 bool tcg_op_supported(TCGOpcode op, TCGType type, unsigned flags)
 {
-    const bool have_vec
-        = TCG_TARGET_HAS_v64 | TCG_TARGET_HAS_v128 | TCG_TARGET_HAS_v256;
+    bool has_type;
+
+    switch (type) {
+    case TCG_TYPE_I32:
+        has_type = true;
+        break;
+    case TCG_TYPE_I64:
+        has_type = TCG_TARGET_REG_BITS == 64;
+        break;
+    case TCG_TYPE_V64:
+        has_type = TCG_TARGET_HAS_v64;
+        break;
+    case TCG_TYPE_V128:
+        has_type = TCG_TARGET_HAS_v128;
+        break;
+    case TCG_TYPE_V256:
+        has_type = TCG_TARGET_HAS_v256;
+        break;
+    default:
+        has_type = false;
+        break;
+    }
 
     switch (op) {
     case INDEX_op_discard:
@@ -XXX,XX +XXX,XX @@ bool tcg_op_supported(TCGOpcode op, TCGType type, unsigned flags)
     case INDEX_op_or_vec:
     case INDEX_op_xor_vec:
     case INDEX_op_cmp_vec:
-        return have_vec;
+        return has_type;
     case INDEX_op_dup2_vec:
-        return have_vec && TCG_TARGET_REG_BITS == 32;
+        return has_type && TCG_TARGET_REG_BITS == 32;
     case INDEX_op_not_vec:
-        return have_vec && TCG_TARGET_HAS_not_vec;
+        return has_type && TCG_TARGET_HAS_not_vec;
     case INDEX_op_neg_vec:
-        return have_vec && TCG_TARGET_HAS_neg_vec;
+        return has_type && TCG_TARGET_HAS_neg_vec;
     case INDEX_op_abs_vec:
-        return have_vec && TCG_TARGET_HAS_abs_vec;
+        return has_type && TCG_TARGET_HAS_abs_vec;
     case INDEX_op_andc_vec:
-        return have_vec && TCG_TARGET_HAS_andc_vec;
+        return has_type && TCG_TARGET_HAS_andc_vec;
     case INDEX_op_orc_vec:
-        return have_vec && TCG_TARGET_HAS_orc_vec;
+        return has_type && TCG_TARGET_HAS_orc_vec;
     case INDEX_op_nand_vec:
-        return have_vec && TCG_TARGET_HAS_nand_vec;
+        return has_type && TCG_TARGET_HAS_nand_vec;
     case INDEX_op_nor_vec:
-        return have_vec && TCG_TARGET_HAS_nor_vec;
+        return has_type && TCG_TARGET_HAS_nor_vec;
     case INDEX_op_eqv_vec:
-        return have_vec && TCG_TARGET_HAS_eqv_vec;
+        return has_type && TCG_TARGET_HAS_eqv_vec;
     case INDEX_op_mul_vec:
-        return have_vec && TCG_TARGET_HAS_mul_vec;
+        return has_type && TCG_TARGET_HAS_mul_vec;
     case INDEX_op_shli_vec:
     case INDEX_op_shri_vec:
     case INDEX_op_sari_vec:
-        return have_vec && TCG_TARGET_HAS_shi_vec;
+        return has_type && TCG_TARGET_HAS_shi_vec;
     case INDEX_op_shls_vec:
     case INDEX_op_shrs_vec:
     case INDEX_op_sars_vec:
-        return have_vec && TCG_TARGET_HAS_shs_vec;
+        return has_type && TCG_TARGET_HAS_shs_vec;
     case INDEX_op_shlv_vec:
     case INDEX_op_shrv_vec:
     case INDEX_op_sarv_vec:
-        return have_vec && TCG_TARGET_HAS_shv_vec;
+        return has_type && TCG_TARGET_HAS_shv_vec;
     case INDEX_op_rotli_vec:
-        return have_vec && TCG_TARGET_HAS_roti_vec;
+        return has_type && TCG_TARGET_HAS_roti_vec;
     case INDEX_op_rotls_vec:
-        return have_vec && TCG_TARGET_HAS_rots_vec;
+        return has_type && TCG_TARGET_HAS_rots_vec;
     case INDEX_op_rotlv_vec:
     case INDEX_op_rotrv_vec:
-        return have_vec && TCG_TARGET_HAS_rotv_vec;
+        return has_type && TCG_TARGET_HAS_rotv_vec;
     case INDEX_op_ssadd_vec:
     case INDEX_op_usadd_vec:
     case INDEX_op_sssub_vec:
     case INDEX_op_ussub_vec:
-        return have_vec && TCG_TARGET_HAS_sat_vec;
+        return has_type && TCG_TARGET_HAS_sat_vec;
     case INDEX_op_smin_vec:
     case INDEX_op_umin_vec:
     case INDEX_op_smax_vec:
     case INDEX_op_umax_vec:
-        return have_vec && TCG_TARGET_HAS_minmax_vec;
+        return has_type && TCG_TARGET_HAS_minmax_vec;
     case INDEX_op_bitsel_vec:
-        return have_vec && TCG_TARGET_HAS_bitsel_vec;
+        return has_type && TCG_TARGET_HAS_bitsel_vec;
     case INDEX_op_cmpsel_vec:
-        return have_vec && TCG_TARGET_HAS_cmpsel_vec;
+        return has_type && TCG_TARGET_HAS_cmpsel_vec;
 
     default:
         tcg_debug_assert(op > INDEX_op_last_generic && op < NB_OPS);
-- 
2.43.0

Process each TCGConstraintSetIndex first.  Allocate TCGArgConstraint
arrays based on those.  Only afterward process the TCGOpcodes and
share those TCGArgConstraint arrays.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 include/tcg/tcg.h |   7 +-
 tcg/tcg.c         | 272 +++++++++++++++++++++++-----------------------
 2 files changed, 136 insertions(+), 143 deletions(-)

diff --git a/include/tcg/tcg.h b/include/tcg/tcg.h
index XXXXXXX..XXXXXXX 100644
--- a/include/tcg/tcg.h
+++ b/include/tcg/tcg.h
@@ -XXX,XX +XXX,XX @@ typedef struct TCGOpDef {
     const char *name;
     uint8_t nb_oargs, nb_iargs, nb_cargs, nb_args;
     uint8_t flags;
-    TCGArgConstraint *args_ct;
+    const TCGArgConstraint *args_ct;
 } TCGOpDef;
 
 extern TCGOpDef tcg_op_defs[];
 extern const size_t tcg_op_defs_max;
 
-typedef struct TCGTargetOpDef {
-    TCGOpcode op;
-    const char *args_ct_str[TCG_MAX_OP_ARGS];
-} TCGTargetOpDef;
-
 /*
  * tcg_op_supported:
  * Query if @op, for @type and @flags, is supported by the host
diff --git a/tcg/tcg.c b/tcg/tcg.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg.c
+++ b/tcg/tcg.c
@@ -XXX,XX +XXX,XX @@ static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode);
 
 /* Put all of the constraint sets into an array, indexed by the enum. */
 
-#define C_O0_I1(I1)                     { .args_ct_str = { #I1 } },
-#define C_O0_I2(I1, I2)                 { .args_ct_str = { #I1, #I2 } },
-#define C_O0_I3(I1, I2, I3)             { .args_ct_str = { #I1, #I2, #I3 } },
-#define C_O0_I4(I1, I2, I3, I4)         { .args_ct_str = { #I1, #I2, #I3, #I4 } },
+typedef struct TCGConstraintSet {
+    uint8_t nb_oargs, nb_iargs;
+    const char *args_ct_str[TCG_MAX_OP_ARGS];
+} TCGConstraintSet;
 
-#define C_O1_I1(O1, I1)                 { .args_ct_str = { #O1, #I1 } },
-#define C_O1_I2(O1, I1, I2)             { .args_ct_str = { #O1, #I1, #I2 } },
-#define C_O1_I3(O1, I1, I2, I3)         { .args_ct_str = { #O1, #I1, #I2, #I3 } },
-#define C_O1_I4(O1, I1, I2, I3, I4)     { .args_ct_str = { #O1, #I1, #I2, #I3, #I4 } },
+#define C_O0_I1(I1)                     { 0, 1, { #I1 } },
+#define C_O0_I2(I1, I2)                 { 0, 2, { #I1, #I2 } },
+#define C_O0_I3(I1, I2, I3)             { 0, 3, { #I1, #I2, #I3 } },
+#define C_O0_I4(I1, I2, I3, I4)         { 0, 4, { #I1, #I2, #I3, #I4 } },
 
-#define C_N1_I2(O1, I1, I2)             { .args_ct_str = { "&" #O1, #I1, #I2 } },
-#define C_N1O1_I1(O1, O2, I1)           { .args_ct_str = { "&" #O1, #O2, #I1 } },
-#define C_N2_I1(O1, O2, I1)             { .args_ct_str = { "&" #O1, "&" #O2, #I1 } },
+#define C_O1_I1(O1, I1)                 { 1, 1, { #O1, #I1 } },
+#define C_O1_I2(O1, I1, I2)             { 1, 2, { #O1, #I1, #I2 } },
+#define C_O1_I3(O1, I1, I2, I3)         { 1, 3, { #O1, #I1, #I2, #I3 } },
+#define C_O1_I4(O1, I1, I2, I3, I4)     { 1, 4, { #O1, #I1, #I2, #I3, #I4 } },
 
-#define C_O2_I1(O1, O2, I1)             { .args_ct_str = { #O1, #O2, #I1 } },
-#define C_O2_I2(O1, O2, I1, I2)         { .args_ct_str = { #O1, #O2, #I1, #I2 } },
-#define C_O2_I3(O1, O2, I1, I2, I3)     { .args_ct_str = { #O1, #O2, #I1, #I2, #I3 } },
-#define C_O2_I4(O1, O2, I1, I2, I3, I4) { .args_ct_str = { #O1, #O2, #I1, #I2, #I3, #I4 } },
-#define C_N1_O1_I4(O1, O2, I1, I2, I3, I4) { .args_ct_str = { "&" #O1, #O2, #I1, #I2, #I3, #I4 } },
+#define C_N1_I2(O1, I1, I2)             { 1, 2, { "&" #O1, #I1, #I2 } },
+#define C_N1O1_I1(O1, O2, I1)           { 2, 1, { "&" #O1, #O2, #I1 } },
+#define C_N2_I1(O1, O2, I1)             { 2, 1, { "&" #O1, "&" #O2, #I1 } },
 
-static const TCGTargetOpDef constraint_sets[] = {
+#define C_O2_I1(O1, O2, I1)             { 2, 1, { #O1, #O2, #I1 } },
+#define C_O2_I2(O1, O2, I1, I2)         { 2, 2, { #O1, #O2, #I1, #I2 } },
+#define C_O2_I3(O1, O2, I1, I2, I3)     { 2, 3, { #O1, #O2, #I1, #I2, #I3 } },
+#define C_O2_I4(O1, O2, I1, I2, I3, I4) { 2, 4, { #O1, #O2, #I1, #I2, #I3, #I4 } },
+#define C_N1_O1_I4(O1, O2, I1, I2, I3, I4) { 2, 4, { "&" #O1, #O2, #I1, #I2, #I3, #I4 } },
+
+static const TCGConstraintSet constraint_sets[] = {
 #include "tcg-target-con-set.h"
 };
 
-
 #undef C_O0_I1
 #undef C_O0_I2
 #undef C_O0_I3
@@ -XXX,XX +XXX,XX @@ static TCGTemp *tcg_global_reg_new_internal(TCGContext *s, TCGType type,
 static void tcg_context_init(unsigned max_cpus)
 {
     TCGContext *s = &tcg_init_ctx;
-    int op, total_args, n, i;
-    TCGOpDef *def;
-    TCGArgConstraint *args_ct;
+    int n, i;
     TCGTemp *ts;
 
     memset(s, 0, sizeof(*s));
     s->nb_globals = 0;
 
-    /* Count total number of arguments and allocate the corresponding
-       space */
-    total_args = 0;
-    for(op = 0; op < NB_OPS; op++) {
-        def = &tcg_op_defs[op];
-        n = def->nb_iargs + def->nb_oargs;
-        total_args += n;
-    }
-
-    args_ct = g_new0(TCGArgConstraint, total_args);
-
-    for(op = 0; op < NB_OPS; op++) {
-        def = &tcg_op_defs[op];
-        def->args_ct = args_ct;
-        n = def->nb_iargs + def->nb_oargs;
-        args_ct += n;
-    }
-
     init_call_layout(&info_helper_ld32_mmu);
     init_call_layout(&info_helper_ld64_mmu);
     init_call_layout(&info_helper_ld128_mmu);
@@ -XXX,XX +XXX,XX @@ void tcg_dump_ops(TCGContext *s, FILE *f, bool have_prefs)
 }
 
 /* we give more priority to constraints with less registers */
-static int get_constraint_priority(const TCGOpDef *def, int k)
+static int get_constraint_priority(const TCGArgConstraint *arg_ct, int k)
 {
-    const TCGArgConstraint *arg_ct = &def->args_ct[k];
-    int n = ctpop64(arg_ct->regs);
+    int n;
+
+    arg_ct += k;
+    n = ctpop64(arg_ct->regs);
 
     /*
      * Sort constraints of a single register first, which includes output
@@ -XXX,XX +XXX,XX @@ static int get_constraint_priority(const TCGOpDef *def, int k)
 }
 
 /* sort from highest priority to lowest */
-static void sort_constraints(TCGOpDef *def, int start, int n)
+static void sort_constraints(TCGArgConstraint *a, int start, int n)
 {
     int i, j;
-    TCGArgConstraint *a = def->args_ct;
 
     for (i = 0; i < n; i++) {
         a[start + i].sort_index = start + i;
@@ -XXX,XX +XXX,XX @@ static void sort_constraints(TCGOpDef *def, int start, int n)
     }
     for (i = 0; i < n - 1; i++) {
         for (j = i + 1; j < n; j++) {
-            int p1 = get_constraint_priority(def, a[start + i].sort_index);
-            int p2 = get_constraint_priority(def, a[start + j].sort_index);
+            int p1 = get_constraint_priority(a, a[start + i].sort_index);
+            int p2 = get_constraint_priority(a, a[start + j].sort_index);
             if (p1 < p2) {
                 int tmp = a[start + i].sort_index;
                 a[start + i].sort_index = a[start + j].sort_index;
@@ -XXX,XX +XXX,XX @@ static void sort_constraints(TCGOpDef *def, int start, int n)
     }
 }
 
+static const TCGArgConstraint empty_cts[TCG_MAX_OP_ARGS];
+static TCGArgConstraint all_cts[ARRAY_SIZE(constraint_sets)][TCG_MAX_OP_ARGS];
+
 static void process_op_defs(TCGContext *s)
 {
-    TCGOpcode op;
-
-    for (op = 0; op < NB_OPS; op++) {
-        TCGOpDef *def = &tcg_op_defs[op];
-        const TCGTargetOpDef *tdefs;
+    for (size_t c = 0; c < ARRAY_SIZE(constraint_sets); ++c) {
+        const TCGConstraintSet *tdefs = &constraint_sets[c];
+        TCGArgConstraint *args_ct = all_cts[c];
+        int nb_oargs = tdefs->nb_oargs;
+        int nb_iargs = tdefs->nb_iargs;
+        int nb_args = nb_oargs + nb_iargs;
         bool saw_alias_pair = false;
-        int i, o, i2, o2, nb_args;
-        TCGConstraintSetIndex con_set;
 
-        if (def->flags & TCG_OPF_NOT_PRESENT) {
-            continue;
-        }
-
-        nb_args = def->nb_iargs + def->nb_oargs;
-        if (nb_args == 0) {
-            continue;
-        }
-
-        /*
-         * Macro magic should make it impossible, but double-check that
-         * the array index is in range.  At the same time, double-check
-         * that the opcode is implemented, i.e. not C_NotImplemented.
-         */
-        con_set = tcg_target_op_def(op);
-        tcg_debug_assert(con_set >= 0 && con_set < ARRAY_SIZE(constraint_sets));
-        tdefs = &constraint_sets[con_set];
-
-        for (i = 0; i < nb_args; i++) {
+        for (int i = 0; i < nb_args; i++) {
             const char *ct_str = tdefs->args_ct_str[i];
-            bool input_p = i >= def->nb_oargs;
-
-            /* Incomplete TCGTargetOpDef entry. */
-            tcg_debug_assert(ct_str != NULL);
+            bool input_p = i >= nb_oargs;
+            int o;
 
             switch (*ct_str) {
             case '0' ... '9':
                 o = *ct_str - '0';
                 tcg_debug_assert(input_p);
-                tcg_debug_assert(o < def->nb_oargs);
-                tcg_debug_assert(def->args_ct[o].regs != 0);
-                tcg_debug_assert(!def->args_ct[o].oalias);
-                def->args_ct[i] = def->args_ct[o];
+                tcg_debug_assert(o < nb_oargs);
+                tcg_debug_assert(args_ct[o].regs != 0);
+                tcg_debug_assert(!args_ct[o].oalias);
+                args_ct[i] = args_ct[o];
                 /* The output sets oalias.  */
-                def->args_ct[o].oalias = 1;
-                def->args_ct[o].alias_index = i;
+                args_ct[o].oalias = 1;
+                args_ct[o].alias_index = i;
                 /* The input sets ialias. */
-                def->args_ct[i].ialias = 1;
-                def->args_ct[i].alias_index = o;
-                if (def->args_ct[i].pair) {
+                args_ct[i].ialias = 1;
+                args_ct[i].alias_index = o;
+                if (args_ct[i].pair) {
                     saw_alias_pair = true;
                 }
                 tcg_debug_assert(ct_str[1] == '\0');
@@ -XXX,XX +XXX,XX @@ static void process_op_defs(TCGContext *s)
 
             case '&':
                 tcg_debug_assert(!input_p);
-                def->args_ct[i].newreg = true;
+                args_ct[i].newreg = true;
                 ct_str++;
                 break;
 
             case 'p': /* plus */
                 /* Allocate to the register after the previous. */
-                tcg_debug_assert(i > (input_p ? def->nb_oargs : 0));
+                tcg_debug_assert(i > (input_p ? nb_oargs : 0));
                 o = i - 1;
-                tcg_debug_assert(!def->args_ct[o].pair);
-                tcg_debug_assert(!def->args_ct[o].ct);
-                def->args_ct[i] = (TCGArgConstraint){
+                tcg_debug_assert(!args_ct[o].pair);
+                tcg_debug_assert(!args_ct[o].ct);
+                args_ct[i] = (TCGArgConstraint){
                     .pair = 2,
                     .pair_index = o,
-                    .regs = def->args_ct[o].regs << 1,
-                    .newreg = def->args_ct[o].newreg,
+                    .regs = args_ct[o].regs << 1,
+                    .newreg = args_ct[o].newreg,
                 };
-                def->args_ct[o].pair = 1;
-                def->args_ct[o].pair_index = i;
+                args_ct[o].pair = 1;
+                args_ct[o].pair_index = i;
                 tcg_debug_assert(ct_str[1] == '\0');
                 continue;
 
             case 'm': /* minus */
                 /* Allocate to the register before the previous. */
-                tcg_debug_assert(i > (input_p ? def->nb_oargs : 0));
+                tcg_debug_assert(i > (input_p ? nb_oargs : 0));
                 o = i - 1;
-                tcg_debug_assert(!def->args_ct[o].pair);
-                tcg_debug_assert(!def->args_ct[o].ct);
-                def->args_ct[i] = (TCGArgConstraint){
+                tcg_debug_assert(!args_ct[o].pair);
+                tcg_debug_assert(!args_ct[o].ct);
+                args_ct[i] = (TCGArgConstraint){
                     .pair = 1,
                     .pair_index = o,
-                    .regs = def->args_ct[o].regs >> 1,
-                    .newreg = def->args_ct[o].newreg,
+                    .regs = args_ct[o].regs >> 1,
+                    .newreg = args_ct[o].newreg,
                 };
-                def->args_ct[o].pair = 2;
-                def->args_ct[o].pair_index = i;
+                args_ct[o].pair = 2;
+                args_ct[o].pair_index = i;
                 tcg_debug_assert(ct_str[1] == '\0');
                 continue;
             }
@@ -XXX,XX +XXX,XX @@ static void process_op_defs(TCGContext *s)
             do {
                 switch (*ct_str) {
                 case 'i':
-                    def->args_ct[i].ct |= TCG_CT_CONST;
+                    args_ct[i].ct |= TCG_CT_CONST;
                     break;
 
                 /* Include all of the target-specific constraints. */
 
 #undef CONST
 #define CONST(CASE, MASK) \
-    case CASE: def->args_ct[i].ct |= MASK; break;
+    case CASE: args_ct[i].ct |= MASK; break;
 #define REGS(CASE, MASK) \
-    case CASE: def->args_ct[i].regs |= MASK; break;
+    case CASE: args_ct[i].regs |= MASK; break;
 
 #include "tcg-target-con-str.h"
 
@@ -XXX,XX +XXX,XX @@ static void process_op_defs(TCGContext *s)
                 case '&':
                 case 'p':
                 case 'm':
-                    /* Typo in TCGTargetOpDef constraint. */
+                    /* Typo in TCGConstraintSet constraint. */
                     g_assert_not_reached();
                 }
             } while (*++ct_str != '\0');
         }
 
-        /* TCGTargetOpDef entry with too much information? */
-        tcg_debug_assert(i == TCG_MAX_OP_ARGS || tdefs->args_ct_str[i] == NULL);
-
         /*
          * Fix up output pairs that are aliased with inputs.
          * When we created the alias, we copied pair from the output.
@@ -XXX,XX +XXX,XX @@ static void process_op_defs(TCGContext *s)
          * first output to pair=3, and the pair_index'es to match.
          */
         if (saw_alias_pair) {
-            for (i = def->nb_oargs; i < nb_args; i++) {
+            for (int i = nb_oargs; i < nb_args; i++) {
+                int o, o2, i2;
+
                 /*
                  * Since [0-9pm] must be alone in the constraint string,
                  * the only way they can both be set is if the pair comes
                  * from the output alias.
                  */
-                if (!def->args_ct[i].ialias) {
+                if (!args_ct[i].ialias) {
                     continue;
                 }
-                switch (def->args_ct[i].pair) {
+                switch (args_ct[i].pair) {
                 case 0:
                     break;
                 case 1:
-                    o = def->args_ct[i].alias_index;
-                    o2 = def->args_ct[o].pair_index;
-                    tcg_debug_assert(def->args_ct[o].pair == 1);
-                    tcg_debug_assert(def->args_ct[o2].pair == 2);
-                    if (def->args_ct[o2].oalias) {
+                    o = args_ct[i].alias_index;
+                    o2 = args_ct[o].pair_index;
+                    tcg_debug_assert(args_ct[o].pair == 1);
+                    tcg_debug_assert(args_ct[o2].pair == 2);
+                    if (args_ct[o2].oalias) {
                         /* Case 1a */
-                        i2 = def->args_ct[o2].alias_index;
-                        tcg_debug_assert(def->args_ct[i2].pair == 2);
-                        def->args_ct[i2].pair_index = i;
-                        def->args_ct[i].pair_index = i2;
+                        i2 = args_ct[o2].alias_index;
+                        tcg_debug_assert(args_ct[i2].pair == 2);
+                        args_ct[i2].pair_index = i;
+                        args_ct[i].pair_index = i2;
                     } else {
                         /* Case 1b */
-                        def->args_ct[i].pair_index = i;
+                        args_ct[i].pair_index = i;
                     }
                     break;
                 case 2:
-                    o = def->args_ct[i].alias_index;
-                    o2 = def->args_ct[o].pair_index;
-                    tcg_debug_assert(def->args_ct[o].pair == 2);
-                    tcg_debug_assert(def->args_ct[o2].pair == 1);
-                    if (def->args_ct[o2].oalias) {
+                    o = args_ct[i].alias_index;
+                    o2 = args_ct[o].pair_index;
+                    tcg_debug_assert(args_ct[o].pair == 2);
+                    tcg_debug_assert(args_ct[o2].pair == 1);
+                    if (args_ct[o2].oalias) {
                         /* Case 1a */
-                        i2 = def->args_ct[o2].alias_index;
-                        tcg_debug_assert(def->args_ct[i2].pair == 1);
-                        def->args_ct[i2].pair_index = i;
-                        def->args_ct[i].pair_index = i2;
+                        i2 = args_ct[o2].alias_index;
+                        tcg_debug_assert(args_ct[i2].pair == 1);
+                        args_ct[i2].pair_index = i;
+                        args_ct[i].pair_index = i2;
                     } else {
                         /* Case 2 */
-                        def->args_ct[i].pair = 3;
-                        def->args_ct[o2].pair = 3;
-                        def->args_ct[i].pair_index = o2;
-                        def->args_ct[o2].pair_index = i;
+                        args_ct[i].pair = 3;
+                        args_ct[o2].pair = 3;
+                        args_ct[i].pair_index = o2;
+                        args_ct[o2].pair_index = i;
                     }
                     break;
                 default:
@@ -XXX,XX +XXX,XX @@ static void process_op_defs(TCGContext *s)
         }
 
         /* sort the constraints (XXX: this is just an heuristic) */
-        sort_constraints(def, 0, def->nb_oargs);
-        sort_constraints(def, def->nb_oargs, def->nb_iargs);
+        sort_constraints(args_ct, 0, nb_oargs);
+        sort_constraints(args_ct, nb_oargs, nb_iargs);
+    }
+
+    for (TCGOpcode op = 0; op < NB_OPS; op++) {
+        TCGOpDef *def = &tcg_op_defs[op];
+        const TCGConstraintSet *tdefs;
+        TCGConstraintSetIndex con_set;
+        int nb_args;
+
+        nb_args = def->nb_iargs + def->nb_oargs;
+        if (nb_args == 0) {
+            continue;
+        }
+
+        if (def->flags & TCG_OPF_NOT_PRESENT) {
+            def->args_ct = empty_cts;
+            continue;
+        }
+
+        /*
+         * Macro magic should make it impossible, but double-check that
+         * the array index is in range.  At the same time, double-check
+         * that the opcode is implemented, i.e. not C_NotImplemented.
+         */
+        con_set = tcg_target_op_def(op);
+        tcg_debug_assert(con_set >= 0 && con_set < ARRAY_SIZE(constraint_sets));
+
+        /* The constraint arguments must match TCGOpcode arguments. */
+        tdefs = &constraint_sets[con_set];
+        tcg_debug_assert(tdefs->nb_oargs == def->nb_oargs);
+        tcg_debug_assert(tdefs->nb_iargs == def->nb_iargs);
+
+        def->args_ct = all_cts[con_set];
     }
 }
 
-- 
2.43.0

Introduce a new function, opcode_args_ct, to look up the argument
set for an opcode.  We lose the ability to assert the correctness
of the map from TCGOpcode to constraint sets at startup, but we can
still validate at runtime upon lookup.

Rename process_op_defs to process_constraint_sets, as it now does
nothing to TCGOpDef.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 include/tcg/tcg.h |  1 -
 tcg/tcg-common.c  |  2 +-
 tcg/tcg.c         | 82 ++++++++++++++++++++++-------------------------
 3 files changed, 40 insertions(+), 45 deletions(-)

Now that we're no longer assigning to TCGOpDef.args_ct,
we can make the array constant.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 include/tcg/tcg.h | 2 +-
 tcg/tcg-common.c  | 2 +-
 tcg/tcg.c         | 2 +-
 3 files changed, 3 insertions(+), 3 deletions(-)

diff --git a/include/tcg/tcg.h b/include/tcg/tcg.h
index XXXXXXX..XXXXXXX 100644
--- a/include/tcg/tcg.h
+++ b/include/tcg/tcg.h
@@ -XXX,XX +XXX,XX @@ typedef struct TCGOpDef {
     uint8_t flags;
 } TCGOpDef;
 
-extern TCGOpDef tcg_op_defs[];
+extern const TCGOpDef tcg_op_defs[];
 extern const size_t tcg_op_defs_max;
 
 /*
diff --git a/tcg/tcg-common.c b/tcg/tcg-common.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg-common.c
+++ b/tcg/tcg-common.c
@@ -XXX,XX +XXX,XX @@
 #include "tcg/tcg.h"
 #include "tcg-has.h"
 
-TCGOpDef tcg_op_defs[] = {
+const TCGOpDef tcg_op_defs[] = {
 #define DEF(s, oargs, iargs, cargs, flags) \
          { #s, oargs, iargs, cargs, iargs + oargs + cargs, flags },
 #include "tcg/tcg-opc.h"
diff --git a/tcg/tcg.c b/tcg/tcg.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg.c
+++ b/tcg/tcg.c
@@ -XXX,XX +XXX,XX @@ static void process_constraint_sets(void)
 
 static const TCGArgConstraint *opcode_args_ct(const TCGOp *op)
 {
-    TCGOpDef *def = &tcg_op_defs[op->opc];
+    const TCGOpDef *def = &tcg_op_defs[op->opc];
     TCGConstraintSetIndex con_set;
 
     if (def->nb_iargs + def->nb_oargs == 0) {
-- 
2.43.0

The br, mb, goto_tb and exit_tb opcodes do not have
register operands, only constants, flags, or labels.
Remove the special case in opcode_args_ct by including
TCG_OPF_NOT_PRESENT in the flags for these opcodes.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 include/tcg/tcg-opc.h | 8 ++++----
 tcg/tcg.c             | 3 ---
 2 files changed, 4 insertions(+), 7 deletions(-)

diff --git a/include/tcg/tcg-opc.h b/include/tcg/tcg-opc.h
index XXXXXXX..XXXXXXX 100644
--- a/include/tcg/tcg-opc.h
+++ b/include/tcg/tcg-opc.h
@@ -XXX,XX +XXX,XX @@ DEF(set_label, 0, 0, 1, TCG_OPF_BB_END | TCG_OPF_NOT_PRESENT)
 /* variable number of parameters */
 DEF(call, 0, 0, 3, TCG_OPF_CALL_CLOBBER | TCG_OPF_NOT_PRESENT)
 
-DEF(br, 0, 0, 1, TCG_OPF_BB_END)
+DEF(br, 0, 0, 1, TCG_OPF_BB_END | TCG_OPF_NOT_PRESENT)
 
 #define IMPL(X) (__builtin_constant_p(X) && (X) <= 0 ? TCG_OPF_NOT_PRESENT : 0)
 #if TCG_TARGET_REG_BITS == 32
@@ -XXX,XX +XXX,XX @@ DEF(br, 0, 0, 1, TCG_OPF_BB_END)
 # define IMPL64  TCG_OPF_64BIT
 #endif
 
-DEF(mb, 0, 0, 1, 0)
+DEF(mb, 0, 0, 1, TCG_OPF_NOT_PRESENT)
 
 DEF(mov_i32, 1, 1, 0, TCG_OPF_NOT_PRESENT)
 DEF(setcond_i32, 1, 2, 1, 0)
@@ -XXX,XX +XXX,XX @@ DEF(mulsh_i64, 1, 2, 0, IMPL64 | IMPL(TCG_TARGET_HAS_mulsh_i64))
 /* There are tcg_ctx->insn_start_words here, not just one. */
 DEF(insn_start, 0, 0, DATA64_ARGS, TCG_OPF_NOT_PRESENT)
 
-DEF(exit_tb, 0, 0, 1, TCG_OPF_BB_EXIT | TCG_OPF_BB_END)
-DEF(goto_tb, 0, 0, 1, TCG_OPF_BB_EXIT | TCG_OPF_BB_END)
+DEF(exit_tb, 0, 0, 1, TCG_OPF_BB_EXIT | TCG_OPF_BB_END | TCG_OPF_NOT_PRESENT)
+DEF(goto_tb, 0, 0, 1, TCG_OPF_BB_EXIT | TCG_OPF_BB_END | TCG_OPF_NOT_PRESENT)
 DEF(goto_ptr, 0, 1, 0, TCG_OPF_BB_EXIT | TCG_OPF_BB_END)
 
 DEF(plugin_cb, 0, 0, 1, TCG_OPF_NOT_PRESENT)
diff --git a/tcg/tcg.c b/tcg/tcg.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg.c
+++ b/tcg/tcg.c
@@ -XXX,XX +XXX,XX @@ static const TCGArgConstraint *opcode_args_ct(const TCGOp *op)
     assert(tcg_op_supported(op->opc, TCGOP_TYPE(op), TCGOP_FLAGS(op)));
 #endif
 
-    if (def->nb_iargs + def->nb_oargs == 0) {
-        return NULL;
-    }
     if (def->flags & TCG_OPF_NOT_PRESENT) {
         return empty_cts;
     }
-- 
2.43.0

Allow the backend to make constraint choices based on more parameters.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 tcg/tcg.c                        | 4 ++--
 tcg/aarch64/tcg-target.c.inc     | 3 ++-
 tcg/arm/tcg-target.c.inc         | 3 ++-
 tcg/i386/tcg-target.c.inc        | 3 ++-
 tcg/loongarch64/tcg-target.c.inc | 3 ++-
 tcg/mips/tcg-target.c.inc        | 3 ++-
 tcg/ppc/tcg-target.c.inc         | 3 ++-
 tcg/riscv/tcg-target.c.inc       | 3 ++-
 tcg/s390x/tcg-target.c.inc       | 3 ++-
 tcg/sparc64/tcg-target.c.inc     | 3 ++-
 tcg/tci/tcg-target.c.inc         | 3 ++-
 11 files changed, 22 insertions(+), 12 deletions(-)

diff --git a/tcg/tcg.c b/tcg/tcg.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg.c
+++ b/tcg/tcg.c
@@ -XXX,XX +XXX,XX @@ typedef enum {
 #include "tcg-target-con-set.h"
 } TCGConstraintSetIndex;
 
-static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode);
+static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode, TCGType, unsigned);
 
 #undef C_O0_I1
 #undef C_O0_I2
@@ -XXX,XX +XXX,XX @@ static const TCGArgConstraint *opcode_args_ct(const TCGOp *op)
         return empty_cts;
     }
 
-    con_set = tcg_target_op_def(op->opc);
+    con_set = tcg_target_op_def(op->opc, TCGOP_TYPE(op), TCGOP_FLAGS(op));
     tcg_debug_assert(con_set >= 0 && con_set < ARRAY_SIZE(constraint_sets));
 
     /* The constraint arguments must match TCGOpcode arguments. */
diff --git a/tcg/aarch64/tcg-target.c.inc b/tcg/aarch64/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/aarch64/tcg-target.c.inc
+++ b/tcg/aarch64/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ void tcg_expand_vec_op(TCGOpcode opc, TCGType type, unsigned vece,
     }
 }
 
-static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
+static TCGConstraintSetIndex
+tcg_target_op_def(TCGOpcode op, TCGType type, unsigned flags)
 {
     switch (op) {
     case INDEX_op_goto_ptr:
diff --git a/tcg/arm/tcg-target.c.inc b/tcg/arm/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/arm/tcg-target.c.inc
+++ b/tcg/arm/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static void tcg_out_op(TCGContext *s, TCGOpcode opc,
     }
 }
 
-static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
+static TCGConstraintSetIndex
+tcg_target_op_def(TCGOpcode op, TCGType type, unsigned flags)
 {
     switch (op) {
     case INDEX_op_goto_ptr:
diff --git a/tcg/i386/tcg-target.c.inc b/tcg/i386/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/i386/tcg-target.c.inc
+++ b/tcg/i386/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static void tcg_out_vec_op(TCGContext *s, TCGOpcode opc,
     }
 }
 
-static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
+static TCGConstraintSetIndex
+tcg_target_op_def(TCGOpcode op, TCGType type, unsigned flags)
 {
     switch (op) {
     case INDEX_op_goto_ptr:
diff --git a/tcg/loongarch64/tcg-target.c.inc b/tcg/loongarch64/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/loongarch64/tcg-target.c.inc
+++ b/tcg/loongarch64/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ void tcg_expand_vec_op(TCGOpcode opc, TCGType type, unsigned vece,
     g_assert_not_reached();
 }
 
-static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
+static TCGConstraintSetIndex
+tcg_target_op_def(TCGOpcode op, TCGType type, unsigned flags)
 {
     switch (op) {
     case INDEX_op_goto_ptr:
diff --git a/tcg/mips/tcg-target.c.inc b/tcg/mips/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/mips/tcg-target.c.inc
+++ b/tcg/mips/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static void tcg_out_op(TCGContext *s, TCGOpcode opc,
     }
 }
 
-static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
+static TCGConstraintSetIndex
+tcg_target_op_def(TCGOpcode op, TCGType type, unsigned flags)
 {
     switch (op) {
     case INDEX_op_goto_ptr:
diff --git a/tcg/ppc/tcg-target.c.inc b/tcg/ppc/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/ppc/tcg-target.c.inc
+++ b/tcg/ppc/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ void tcg_expand_vec_op(TCGOpcode opc, TCGType type, unsigned vece,
     va_end(va);
 }
 
-static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
+static TCGConstraintSetIndex
+tcg_target_op_def(TCGOpcode op, TCGType type, unsigned flags)
 {
     switch (op) {
     case INDEX_op_goto_ptr:
diff --git a/tcg/riscv/tcg-target.c.inc b/tcg/riscv/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/riscv/tcg-target.c.inc
+++ b/tcg/riscv/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ int tcg_can_emit_vec_op(TCGOpcode opc, TCGType type, unsigned vece)
     }
 }
 
-static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
+static TCGConstraintSetIndex
+tcg_target_op_def(TCGOpcode op, TCGType type, unsigned flags)
 {
     switch (op) {
     case INDEX_op_goto_ptr:
diff --git a/tcg/s390x/tcg-target.c.inc b/tcg/s390x/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/s390x/tcg-target.c.inc
+++ b/tcg/s390x/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ void tcg_expand_vec_op(TCGOpcode opc, TCGType type, unsigned vece,
     va_end(va);
 }
 
-static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
+static TCGConstraintSetIndex
+tcg_target_op_def(TCGOpcode op, TCGType type, unsigned flags)
 {
     switch (op) {
     case INDEX_op_goto_ptr:
diff --git a/tcg/sparc64/tcg-target.c.inc b/tcg/sparc64/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/sparc64/tcg-target.c.inc
+++ b/tcg/sparc64/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static void tcg_out_op(TCGContext *s, TCGOpcode opc,
     }
 }
 
-static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
+static TCGConstraintSetIndex
+tcg_target_op_def(TCGOpcode op, TCGType type, unsigned flags)
 {
     switch (op) {
     case INDEX_op_goto_ptr:
diff --git a/tcg/tci/tcg-target.c.inc b/tcg/tci/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tci/tcg-target.c.inc
+++ b/tcg/tci/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@
 #endif
 #define TCG_TARGET_CALL_RET_I128        TCG_CALL_RET_NORMAL
 
-static TCGConstraintSetIndex tcg_target_op_def(TCGOpcode op)
+static TCGConstraintSetIndex
+tcg_target_op_def(TCGOpcode op, TCGType type, unsigned flags)
 {
     switch (op) {
     case INDEX_op_goto_ptr:
-- 
2.43.0

Pass TCGOp.type to the output function.
For aarch64 and tci, use this instead of testing TCG_OPF_64BIT.
For s390x, use this instead of testing INDEX_op_deposit_i64.
For i386, use this to initialize rexw.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 tcg/tcg.c                        |  4 ++--
 tcg/aarch64/tcg-target.c.inc     |  6 +-----
 tcg/arm/tcg-target.c.inc         |  2 +-
 tcg/i386/tcg-target.c.inc        | 10 +++++-----
 tcg/loongarch64/tcg-target.c.inc |  2 +-
 tcg/mips/tcg-target.c.inc        |  2 +-
 tcg/ppc/tcg-target.c.inc         |  2 +-
 tcg/riscv/tcg-target.c.inc       |  2 +-
 tcg/s390x/tcg-target.c.inc       |  7 +++----
 tcg/sparc64/tcg-target.c.inc     |  2 +-
 tcg/tci/tcg-target.c.inc         |  4 ++--
 11 files changed, 19 insertions(+), 24 deletions(-)

diff --git a/tcg/tcg.c b/tcg/tcg.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg.c
+++ b/tcg/tcg.c
@@ -XXX,XX +XXX,XX @@ static void tcg_out_addi_ptr(TCGContext *s, TCGReg, TCGReg, tcg_target_long);
 static bool tcg_out_xchg(TCGContext *s, TCGType type, TCGReg r1, TCGReg r2);
 static void tcg_out_exit_tb(TCGContext *s, uintptr_t arg);
 static void tcg_out_goto_tb(TCGContext *s, int which);
-static void tcg_out_op(TCGContext *s, TCGOpcode opc,
+static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
                        const TCGArg args[TCG_MAX_OP_ARGS],
                        const int const_args[TCG_MAX_OP_ARGS]);
 #if TCG_TARGET_MAYBE_vec
@@ -XXX,XX +XXX,XX @@ static void tcg_reg_alloc_op(TCGContext *s, const TCGOp *op)
             tcg_out_vec_op(s, op->opc, TCGOP_TYPE(op) - TCG_TYPE_V64,
                            TCGOP_VECE(op), new_args, const_args);
         } else {
-            tcg_out_op(s, op->opc, new_args, const_args);
+            tcg_out_op(s, op->opc, TCGOP_TYPE(op), new_args, const_args);
         }
         break;
     }
diff --git a/tcg/aarch64/tcg-target.c.inc b/tcg/aarch64/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/aarch64/tcg-target.c.inc
+++ b/tcg/aarch64/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ void tb_target_set_jmp_target(const TranslationBlock *tb, int n,
     flush_idcache_range(jmp_rx, jmp_rw, 4);
 }
 
-static void tcg_out_op(TCGContext *s, TCGOpcode opc,
+static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType ext,
                        const TCGArg args[TCG_MAX_OP_ARGS],
                        const int const_args[TCG_MAX_OP_ARGS])
 {
-    /* 99% of the time, we can signal the use of extension registers
-       by looking to see if the opcode handles 64-bit data.  */
-    TCGType ext = (tcg_op_defs[opc].flags & TCG_OPF_64BIT) != 0;
-
     /* Hoist the loads of the most common arguments.  */
     TCGArg a0 = args[0];
     TCGArg a1 = args[1];
diff --git a/tcg/arm/tcg-target.c.inc b/tcg/arm/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/arm/tcg-target.c.inc
+++ b/tcg/arm/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ void tb_target_set_jmp_target(const TranslationBlock *tb, int n,
     flush_idcache_range(jmp_rx, jmp_rw, 4);
 }
 
-static void tcg_out_op(TCGContext *s, TCGOpcode opc,
+static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
                        const TCGArg args[TCG_MAX_OP_ARGS],
                        const int const_args[TCG_MAX_OP_ARGS])
 {
diff --git a/tcg/i386/tcg-target.c.inc b/tcg/i386/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/i386/tcg-target.c.inc
+++ b/tcg/i386/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ void tb_target_set_jmp_target(const TranslationBlock *tb, int n,
     /* no need to flush icache explicitly */
 }
 
-static inline void tcg_out_op(TCGContext *s, TCGOpcode opc,
-                              const TCGArg args[TCG_MAX_OP_ARGS],
-                              const int const_args[TCG_MAX_OP_ARGS])
+static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
+                       const TCGArg args[TCG_MAX_OP_ARGS],
+                       const int const_args[TCG_MAX_OP_ARGS])
 {
     TCGArg a0, a1, a2;
-    int c, const_a2, vexop, rexw = 0;
+    int c, const_a2, vexop, rexw;
 
 #if TCG_TARGET_REG_BITS == 64
 # define OP_32_64(x) \
         case glue(glue(INDEX_op_, x), _i64): \
-            rexw = P_REXW; /* FALLTHRU */    \
         case glue(glue(INDEX_op_, x), _i32)
 #else
 # define OP_32_64(x) \
@@ -XXX,XX +XXX,XX @@ static inline void tcg_out_op(TCGContext *s, TCGOpcode opc,
     a1 = args[1];
     a2 = args[2];
     const_a2 = const_args[2];
+    rexw = type == TCG_TYPE_I32 ? 0 : P_REXW;
 
     switch (opc) {
     case INDEX_op_goto_ptr:
diff --git a/tcg/loongarch64/tcg-target.c.inc b/tcg/loongarch64/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/loongarch64/tcg-target.c.inc
+++ b/tcg/loongarch64/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ void tb_target_set_jmp_target(const TranslationBlock *tb, int n,
     flush_idcache_range(jmp_rx, jmp_rw, 4);
 }
 
-static void tcg_out_op(TCGContext *s, TCGOpcode opc,
+static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
                        const TCGArg args[TCG_MAX_OP_ARGS],
                        const int const_args[TCG_MAX_OP_ARGS])
 {
diff --git a/tcg/mips/tcg-target.c.inc b/tcg/mips/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/mips/tcg-target.c.inc
+++ b/tcg/mips/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ void tb_target_set_jmp_target(const TranslationBlock *tb, int n,
     /* Always indirect, nothing to do */
 }
 
-static void tcg_out_op(TCGContext *s, TCGOpcode opc,
+static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
                        const TCGArg args[TCG_MAX_OP_ARGS],
                        const int const_args[TCG_MAX_OP_ARGS])
 {
diff --git a/tcg/ppc/tcg-target.c.inc b/tcg/ppc/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/ppc/tcg-target.c.inc
+++ b/tcg/ppc/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ void tb_target_set_jmp_target(const TranslationBlock *tb, int n,
     flush_idcache_range(jmp_rx, jmp_rw, 4);
 }
 
-static void tcg_out_op(TCGContext *s, TCGOpcode opc,
+static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
                        const TCGArg args[TCG_MAX_OP_ARGS],
                        const int const_args[TCG_MAX_OP_ARGS])
 {
diff --git a/tcg/riscv/tcg-target.c.inc b/tcg/riscv/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/riscv/tcg-target.c.inc
+++ b/tcg/riscv/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ void tb_target_set_jmp_target(const TranslationBlock *tb, int n,
     flush_idcache_range(jmp_rx, jmp_rw, 4);
 }
 
-static void tcg_out_op(TCGContext *s, TCGOpcode opc,
+static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
                        const TCGArg args[TCG_MAX_OP_ARGS],
                        const int const_args[TCG_MAX_OP_ARGS])
 {
diff --git a/tcg/s390x/tcg-target.c.inc b/tcg/s390x/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/s390x/tcg-target.c.inc
+++ b/tcg/s390x/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ void tb_target_set_jmp_target(const TranslationBlock *tb, int n,
         case glue(glue(INDEX_op_,x),_i32): \
         case glue(glue(INDEX_op_,x),_i64)
 
-static inline void tcg_out_op(TCGContext *s, TCGOpcode opc,
-                              const TCGArg args[TCG_MAX_OP_ARGS],
-                              const int const_args[TCG_MAX_OP_ARGS])
+static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
+                       const TCGArg args[TCG_MAX_OP_ARGS],
+                       const int const_args[TCG_MAX_OP_ARGS])
 {
     S390Opcode op, op2;
     TCGArg a0, a1, a2;
@@ -XXX,XX +XXX,XX @@ static inline void tcg_out_op(TCGContext *s, TCGOpcode opc,
             /* Since we can't support "0Z" as a constraint, we allow a1 in
                any register.  Fix things up as if a matching constraint.  */
             if (a0 != a1) {
-                TCGType type = (opc == INDEX_op_deposit_i64);
                 if (a0 == a2) {
                     tcg_out_mov(s, type, TCG_TMP0, a2);
                     a2 = TCG_TMP0;
diff --git a/tcg/sparc64/tcg-target.c.inc b/tcg/sparc64/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/sparc64/tcg-target.c.inc
+++ b/tcg/sparc64/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ void tb_target_set_jmp_target(const TranslationBlock *tb, int n,
 {
 }
 
-static void tcg_out_op(TCGContext *s, TCGOpcode opc,
+static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
                        const TCGArg args[TCG_MAX_OP_ARGS],
                        const int const_args[TCG_MAX_OP_ARGS])
 {
diff --git a/tcg/tci/tcg-target.c.inc b/tcg/tci/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tci/tcg-target.c.inc
+++ b/tcg/tci/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ void tb_target_set_jmp_target(const TranslationBlock *tb, int n,
     /* Always indirect, nothing to do */
 }
 
-static void tcg_out_op(TCGContext *s, TCGOpcode opc,
+static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
                        const TCGArg args[TCG_MAX_OP_ARGS],
                        const int const_args[TCG_MAX_OP_ARGS])
 {
@@ -XXX,XX +XXX,XX @@ static void tcg_out_op(TCGContext *s, TCGOpcode opc,
     CASE_32_64(sextract) /* Optional (TCG_TARGET_HAS_sextract_*). */
         {
             TCGArg pos = args[2], len = args[3];
-            TCGArg max = tcg_op_defs[opc].flags & TCG_OPF_64BIT ? 64 : 32;
+            TCGArg max = type == TCG_TYPE_I32 ? 32 : 64;
 
             tcg_debug_assert(pos < max);
             tcg_debug_assert(pos + len <= max);
-- 
2.43.0

This flag is no longer used.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 include/tcg/tcg-opc.h | 22 +++++++++++-----------
 include/tcg/tcg.h     |  2 --
 2 files changed, 11 insertions(+), 13 deletions(-)

diff --git a/include/tcg/tcg-opc.h b/include/tcg/tcg-opc.h
index XXXXXXX..XXXXXXX 100644
--- a/include/tcg/tcg-opc.h
+++ b/include/tcg/tcg-opc.h
@@ -XXX,XX +XXX,XX @@ DEF(br, 0, 0, 1, TCG_OPF_BB_END | TCG_OPF_NOT_PRESENT)
 
 #define IMPL(X) (__builtin_constant_p(X) && (X) <= 0 ? TCG_OPF_NOT_PRESENT : 0)
 #if TCG_TARGET_REG_BITS == 32
-# define IMPL64  TCG_OPF_64BIT | TCG_OPF_NOT_PRESENT
+# define IMPL64  TCG_OPF_NOT_PRESENT
 #else
-# define IMPL64  TCG_OPF_64BIT
+# define IMPL64  0
 #endif
 
 DEF(mb, 0, 0, 1, TCG_OPF_NOT_PRESENT)
@@ -XXX,XX +XXX,XX @@ DEF(clz_i32, 1, 2, 0, IMPL(TCG_TARGET_HAS_clz_i32))
 DEF(ctz_i32, 1, 2, 0, IMPL(TCG_TARGET_HAS_ctz_i32))
 DEF(ctpop_i32, 1, 1, 0, IMPL(TCG_TARGET_HAS_ctpop_i32))
 
-DEF(mov_i64, 1, 1, 0, TCG_OPF_64BIT | TCG_OPF_NOT_PRESENT)
+DEF(mov_i64, 1, 1, 0, TCG_OPF_NOT_PRESENT)
 DEF(setcond_i64, 1, 2, 1, IMPL64)
 DEF(negsetcond_i64, 1, 2, 1, IMPL64 | IMPL(TCG_TARGET_HAS_negsetcond_i64))
 DEF(movcond_i64, 1, 4, 1, IMPL64)
@@ -XXX,XX +XXX,XX @@ DEF(qemu_ld_a32_i32, 1, 1, 1,
 DEF(qemu_st_a32_i32, 0, 1 + 1, 1,
     TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS)
 DEF(qemu_ld_a32_i64, DATA64_ARGS, 1, 1,
-    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS | TCG_OPF_64BIT)
+    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS)
 DEF(qemu_st_a32_i64, 0, DATA64_ARGS + 1, 1,
-    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS | TCG_OPF_64BIT)
+    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS)
 
 DEF(qemu_ld_a64_i32, 1, DATA64_ARGS, 1,
     TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS)
 DEF(qemu_st_a64_i32, 0, 1 + DATA64_ARGS, 1,
     TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS)
 DEF(qemu_ld_a64_i64, DATA64_ARGS, DATA64_ARGS, 1,
-    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS | TCG_OPF_64BIT)
+    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS)
 DEF(qemu_st_a64_i64, 0, DATA64_ARGS + DATA64_ARGS, 1,
-    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS | TCG_OPF_64BIT)
+    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS)
 
 /* Only used by i386 to cope with stupid register constraints. */
 DEF(qemu_st8_a32_i32, 0, 1 + 1, 1,
@@ -XXX,XX +XXX,XX @@ DEF(qemu_st8_a64_i32, 0, 1 + DATA64_ARGS, 1,
 
 /* Only for 64-bit hosts at the moment. */
 DEF(qemu_ld_a32_i128, 2, 1, 1,
-    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS | TCG_OPF_64BIT |
+    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS |
     IMPL(TCG_TARGET_HAS_qemu_ldst_i128))
 DEF(qemu_ld_a64_i128, 2, 1, 1,
-    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS | TCG_OPF_64BIT |
+    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS |
     IMPL(TCG_TARGET_HAS_qemu_ldst_i128))
 DEF(qemu_st_a32_i128, 0, 3, 1,
-    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS | TCG_OPF_64BIT |
+    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS |
     IMPL(TCG_TARGET_HAS_qemu_ldst_i128))
 DEF(qemu_st_a64_i128, 0, 3, 1,
-    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS | TCG_OPF_64BIT |
+    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS |
     IMPL(TCG_TARGET_HAS_qemu_ldst_i128))
 
 /* Host vector support.  */
diff --git a/include/tcg/tcg.h b/include/tcg/tcg.h
index XXXXXXX..XXXXXXX 100644
--- a/include/tcg/tcg.h
+++ b/include/tcg/tcg.h
@@ -XXX,XX +XXX,XX @@ enum {
     /* Instruction has side effects: it cannot be removed if its outputs
        are not used, and might trigger exceptions.  */
     TCG_OPF_SIDE_EFFECTS = 0x08,
-    /* Instruction operands are 64-bits (otherwise 32-bits).  */
-    TCG_OPF_64BIT        = 0x10,
     /* Instruction is optional and not implemented by the host, or insn
        is generic and should not be implemented by the host.  */
     TCG_OPF_NOT_PRESENT  = 0x20,
-- 
2.43.0

Now that we use a functional interface to query whether the opcode
is supported, we can drop the TCG_OPF_NOT_PRESENT bit mapping from
TCG_TARGET_HAS_foo in tcg-opc.h

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 include/tcg/tcg-opc.h | 306 +++++++++++++++++++-----------------------
 1 file changed, 141 insertions(+), 165 deletions(-)

diff --git a/include/tcg/tcg-opc.h b/include/tcg/tcg-opc.h
index XXXXXXX..XXXXXXX 100644
--- a/include/tcg/tcg-opc.h
+++ b/include/tcg/tcg-opc.h
@@ -XXX,XX +XXX,XX @@ DEF(call, 0, 0, 3, TCG_OPF_CALL_CLOBBER | TCG_OPF_NOT_PRESENT)
 
 DEF(br, 0, 0, 1, TCG_OPF_BB_END | TCG_OPF_NOT_PRESENT)
 
-#define IMPL(X) (__builtin_constant_p(X) && (X) <= 0 ? TCG_OPF_NOT_PRESENT : 0)
-#if TCG_TARGET_REG_BITS == 32
-# define IMPL64  TCG_OPF_NOT_PRESENT
-#else
-# define IMPL64  0
-#endif
-
 DEF(mb, 0, 0, 1, TCG_OPF_NOT_PRESENT)
 
 DEF(mov_i32, 1, 1, 0, TCG_OPF_NOT_PRESENT)
 DEF(setcond_i32, 1, 2, 1, 0)
-DEF(negsetcond_i32, 1, 2, 1, IMPL(TCG_TARGET_HAS_negsetcond_i32))
+DEF(negsetcond_i32, 1, 2, 1, 0)
 DEF(movcond_i32, 1, 4, 1, 0)
 /* load/store */
 DEF(ld8u_i32, 1, 1, 1, 0)
@@ -XXX,XX +XXX,XX @@ DEF(st_i32, 0, 2, 1, 0)
 DEF(add_i32, 1, 2, 0, 0)
 DEF(sub_i32, 1, 2, 0, 0)
 DEF(mul_i32, 1, 2, 0, 0)
-DEF(div_i32, 1, 2, 0, IMPL(TCG_TARGET_HAS_div_i32))
-DEF(divu_i32, 1, 2, 0, IMPL(TCG_TARGET_HAS_div_i32))
-DEF(rem_i32, 1, 2, 0, IMPL(TCG_TARGET_HAS_rem_i32))
-DEF(remu_i32, 1, 2, 0, IMPL(TCG_TARGET_HAS_rem_i32))
-DEF(div2_i32, 2, 3, 0, IMPL(TCG_TARGET_HAS_div2_i32))
-DEF(divu2_i32, 2, 3, 0, IMPL(TCG_TARGET_HAS_div2_i32))
+DEF(div_i32, 1, 2, 0, 0)
+DEF(divu_i32, 1, 2, 0, 0)
+DEF(rem_i32, 1, 2, 0, 0)
+DEF(remu_i32, 1, 2, 0, 0)
+DEF(div2_i32, 2, 3, 0, 0)
+DEF(divu2_i32, 2, 3, 0, 0)
 DEF(and_i32, 1, 2, 0, 0)
 DEF(or_i32, 1, 2, 0, 0)
 DEF(xor_i32, 1, 2, 0, 0)
@@ -XXX,XX +XXX,XX @@ DEF(xor_i32, 1, 2, 0, 0)
 DEF(shl_i32, 1, 2, 0, 0)
 DEF(shr_i32, 1, 2, 0, 0)
 DEF(sar_i32, 1, 2, 0, 0)
-DEF(rotl_i32, 1, 2, 0, IMPL(TCG_TARGET_HAS_rot_i32))
-DEF(rotr_i32, 1, 2, 0, IMPL(TCG_TARGET_HAS_rot_i32))
-DEF(deposit_i32, 1, 2, 2, IMPL(TCG_TARGET_HAS_deposit_i32))
-DEF(extract_i32, 1, 1, 2, IMPL(TCG_TARGET_HAS_extract_i32))
-DEF(sextract_i32, 1, 1, 2, IMPL(TCG_TARGET_HAS_sextract_i32))
-DEF(extract2_i32, 1, 2, 1, IMPL(TCG_TARGET_HAS_extract2_i32))
+DEF(rotl_i32, 1, 2, 0, 0)
+DEF(rotr_i32, 1, 2, 0, 0)
+DEF(deposit_i32, 1, 2, 2, 0)
+DEF(extract_i32, 1, 1, 2, 0)
+DEF(sextract_i32, 1, 1, 2, 0)
+DEF(extract2_i32, 1, 2, 1, 0)
 
 DEF(brcond_i32, 0, 2, 2, TCG_OPF_BB_END | TCG_OPF_COND_BRANCH)
 
-DEF(add2_i32, 2, 4, 0, IMPL(TCG_TARGET_HAS_add2_i32))
-DEF(sub2_i32, 2, 4, 0, IMPL(TCG_TARGET_HAS_sub2_i32))
-DEF(mulu2_i32, 2, 2, 0, IMPL(TCG_TARGET_HAS_mulu2_i32))
-DEF(muls2_i32, 2, 2, 0, IMPL(TCG_TARGET_HAS_muls2_i32))
-DEF(muluh_i32, 1, 2, 0, IMPL(TCG_TARGET_HAS_muluh_i32))
-DEF(mulsh_i32, 1, 2, 0, IMPL(TCG_TARGET_HAS_mulsh_i32))
-DEF(brcond2_i32, 0, 4, 2,
-    TCG_OPF_BB_END | TCG_OPF_COND_BRANCH | IMPL(TCG_TARGET_REG_BITS == 32))
-DEF(setcond2_i32, 1, 4, 1, IMPL(TCG_TARGET_REG_BITS == 32))
+DEF(add2_i32, 2, 4, 0, 0)
+DEF(sub2_i32, 2, 4, 0, 0)
+DEF(mulu2_i32, 2, 2, 0, 0)
+DEF(muls2_i32, 2, 2, 0, 0)
+DEF(muluh_i32, 1, 2, 0, 0)
+DEF(mulsh_i32, 1, 2, 0, 0)
+DEF(brcond2_i32, 0, 4, 2, TCG_OPF_BB_END | TCG_OPF_COND_BRANCH)
+DEF(setcond2_i32, 1, 4, 1, 0)
 
-DEF(ext8s_i32, 1, 1, 0, IMPL(TCG_TARGET_HAS_ext8s_i32))
-DEF(ext16s_i32, 1, 1, 0, IMPL(TCG_TARGET_HAS_ext16s_i32))
-DEF(ext8u_i32, 1, 1, 0, IMPL(TCG_TARGET_HAS_ext8u_i32))
-DEF(ext16u_i32, 1, 1, 0, IMPL(TCG_TARGET_HAS_ext16u_i32))
-DEF(bswap16_i32, 1, 1, 1, IMPL(TCG_TARGET_HAS_bswap16_i32))
-DEF(bswap32_i32, 1, 1, 1, IMPL(TCG_TARGET_HAS_bswap32_i32))
-DEF(not_i32, 1, 1, 0, IMPL(TCG_TARGET_HAS_not_i32))
+DEF(ext8s_i32, 1, 1, 0, 0)
+DEF(ext16s_i32, 1, 1, 0, 0)
+DEF(ext8u_i32, 1, 1, 0, 0)
+DEF(ext16u_i32, 1, 1, 0, 0)
+DEF(bswap16_i32, 1, 1, 1, 0)
+DEF(bswap32_i32, 1, 1, 1, 0)
+DEF(not_i32, 1, 1, 0, 0)
 DEF(neg_i32, 1, 1, 0, 0)
-DEF(andc_i32, 1, 2, 0, IMPL(TCG_TARGET_HAS_andc_i32))
-DEF(orc_i32, 1, 2, 0, IMPL(TCG_TARGET_HAS_orc_i32))
-DEF(eqv_i32, 1, 2, 0, IMPL(TCG_TARGET_HAS_eqv_i32))
-DEF(nand_i32, 1, 2, 0, IMPL(TCG_TARGET_HAS_nand_i32))
-DEF(nor_i32, 1, 2, 0, IMPL(TCG_TARGET_HAS_nor_i32))
-DEF(clz_i32, 1, 2, 0, IMPL(TCG_TARGET_HAS_clz_i32))
-DEF(ctz_i32, 1, 2, 0, IMPL(TCG_TARGET_HAS_ctz_i32))
-DEF(ctpop_i32, 1, 1, 0, IMPL(TCG_TARGET_HAS_ctpop_i32))
+DEF(andc_i32, 1, 2, 0, 0)
+DEF(orc_i32, 1, 2, 0, 0)
+DEF(eqv_i32, 1, 2, 0, 0)
+DEF(nand_i32, 1, 2, 0, 0)
+DEF(nor_i32, 1, 2, 0, 0)
+DEF(clz_i32, 1, 2, 0, 0)
+DEF(ctz_i32, 1, 2, 0, 0)
+DEF(ctpop_i32, 1, 1, 0, 0)
 
 DEF(mov_i64, 1, 1, 0, TCG_OPF_NOT_PRESENT)
-DEF(setcond_i64, 1, 2, 1, IMPL64)
-DEF(negsetcond_i64, 1, 2, 1, IMPL64 | IMPL(TCG_TARGET_HAS_negsetcond_i64))
-DEF(movcond_i64, 1, 4, 1, IMPL64)
+DEF(setcond_i64, 1, 2, 1, 0)
+DEF(negsetcond_i64, 1, 2, 1, 0)
+DEF(movcond_i64, 1, 4, 1, 0)
 /* load/store */
-DEF(ld8u_i64, 1, 1, 1, IMPL64)
-DEF(ld8s_i64, 1, 1, 1, IMPL64)
-DEF(ld16u_i64, 1, 1, 1, IMPL64)
-DEF(ld16s_i64, 1, 1, 1, IMPL64)
-DEF(ld32u_i64, 1, 1, 1, IMPL64)
-DEF(ld32s_i64, 1, 1, 1, IMPL64)
-DEF(ld_i64, 1, 1, 1, IMPL64)
-DEF(st8_i64, 0, 2, 1, IMPL64)
-DEF(st16_i64, 0, 2, 1, IMPL64)
-DEF(st32_i64, 0, 2, 1, IMPL64)
-DEF(st_i64, 0, 2, 1, IMPL64)
+DEF(ld8u_i64, 1, 1, 1, 0)
+DEF(ld8s_i64, 1, 1, 1, 0)
+DEF(ld16u_i64, 1, 1, 1, 0)
+DEF(ld16s_i64, 1, 1, 1, 0)
+DEF(ld32u_i64, 1, 1, 1, 0)
+DEF(ld32s_i64, 1, 1, 1, 0)
+DEF(ld_i64, 1, 1, 1, 0)
+DEF(st8_i64, 0, 2, 1, 0)
+DEF(st16_i64, 0, 2, 1, 0)
+DEF(st32_i64, 0, 2, 1, 0)
+DEF(st_i64, 0, 2, 1, 0)
 /* arith */
-DEF(add_i64, 1, 2, 0, IMPL64)
-DEF(sub_i64, 1, 2, 0, IMPL64)
-DEF(mul_i64, 1, 2, 0, IMPL64)
-DEF(div_i64, 1, 2, 0, IMPL64 | IMPL(TCG_TARGET_HAS_div_i64))
-DEF(divu_i64, 1, 2, 0, IMPL64 | IMPL(TCG_TARGET_HAS_div_i64))
-DEF(rem_i64, 1, 2, 0, IMPL64 | IMPL(TCG_TARGET_HAS_rem_i64))
-DEF(remu_i64, 1, 2, 0, IMPL64 | IMPL(TCG_TARGET_HAS_rem_i64))
-DEF(div2_i64, 2, 3, 0, IMPL64 | IMPL(TCG_TARGET_HAS_div2_i64))
-DEF(divu2_i64, 2, 3, 0, IMPL64 | IMPL(TCG_TARGET_HAS_div2_i64))
-DEF(and_i64, 1, 2, 0, IMPL64)
-DEF(or_i64, 1, 2, 0, IMPL64)
-DEF(xor_i64, 1, 2, 0, IMPL64)
+DEF(add_i64, 1, 2, 0, 0)
+DEF(sub_i64, 1, 2, 0, 0)
+DEF(mul_i64, 1, 2, 0, 0)
+DEF(div_i64, 1, 2, 0, 0)
+DEF(divu_i64, 1, 2, 0, 0)
+DEF(rem_i64, 1, 2, 0, 0)
+DEF(remu_i64, 1, 2, 0, 0)
+DEF(div2_i64, 2, 3, 0, 0)
+DEF(divu2_i64, 2, 3, 0, 0)
+DEF(and_i64, 1, 2, 0, 0)
+DEF(or_i64, 1, 2, 0, 0)
+DEF(xor_i64, 1, 2, 0, 0)
 /* shifts/rotates */
-DEF(shl_i64, 1, 2, 0, IMPL64)
-DEF(shr_i64, 1, 2, 0, IMPL64)
-DEF(sar_i64, 1, 2, 0, IMPL64)
-DEF(rotl_i64, 1, 2, 0, IMPL64 | IMPL(TCG_TARGET_HAS_rot_i64))
-DEF(rotr_i64, 1, 2, 0, IMPL64 | IMPL(TCG_TARGET_HAS_rot_i64))
-DEF(deposit_i64, 1, 2, 2, IMPL64 | IMPL(TCG_TARGET_HAS_deposit_i64))
-DEF(extract_i64, 1, 1, 2, IMPL64 | IMPL(TCG_TARGET_HAS_extract_i64))
-DEF(sextract_i64, 1, 1, 2, IMPL64 | IMPL(TCG_TARGET_HAS_sextract_i64))
-DEF(extract2_i64, 1, 2, 1, IMPL64 | IMPL(TCG_TARGET_HAS_extract2_i64))
+DEF(shl_i64, 1, 2, 0, 0)
+DEF(shr_i64, 1, 2, 0, 0)
+DEF(sar_i64, 1, 2, 0, 0)
+DEF(rotl_i64, 1, 2, 0, 0)
+DEF(rotr_i64, 1, 2, 0, 0)
+DEF(deposit_i64, 1, 2, 2, 0)
+DEF(extract_i64, 1, 1, 2, 0)
+DEF(sextract_i64, 1, 1, 2, 0)
+DEF(extract2_i64, 1, 2, 1, 0)
 
 /* size changing ops */
-DEF(ext_i32_i64, 1, 1, 0, IMPL64)
-DEF(extu_i32_i64, 1, 1, 0, IMPL64)
-DEF(extrl_i64_i32, 1, 1, 0,
-    IMPL(TCG_TARGET_HAS_extr_i64_i32)
-    | (TCG_TARGET_REG_BITS == 32 ? TCG_OPF_NOT_PRESENT : 0))
-DEF(extrh_i64_i32, 1, 1, 0,
-    IMPL(TCG_TARGET_HAS_extr_i64_i32)
-    | (TCG_TARGET_REG_BITS == 32 ? TCG_OPF_NOT_PRESENT : 0))
+DEF(ext_i32_i64, 1, 1, 0, 0)
+DEF(extu_i32_i64, 1, 1, 0, 0)
+DEF(extrl_i64_i32, 1, 1, 0, 0)
+DEF(extrh_i64_i32, 1, 1, 0, 0)
 
-DEF(brcond_i64, 0, 2, 2, TCG_OPF_BB_END | TCG_OPF_COND_BRANCH | IMPL64)
-DEF(ext8s_i64, 1, 1, 0, IMPL64 | IMPL(TCG_TARGET_HAS_ext8s_i64))
-DEF(ext16s_i64, 1, 1, 0, IMPL64 | IMPL(TCG_TARGET_HAS_ext16s_i64))
-DEF(ext32s_i64, 1, 1, 0, IMPL64 | IMPL(TCG_TARGET_HAS_ext32s_i64))
-DEF(ext8u_i64, 1, 1, 0, IMPL64 | IMPL(TCG_TARGET_HAS_ext8u_i64))
-DEF(ext16u_i64, 1, 1, 0, IMPL64 | IMPL(TCG_TARGET_HAS_ext16u_i64))
-DEF(ext32u_i64, 1, 1, 0, IMPL64 | IMPL(TCG_TARGET_HAS_ext32u_i64))
-DEF(bswap16_i64, 1, 1, 1, IMPL64 | IMPL(TCG_TARGET_HAS_bswap16_i64))
-DEF(bswap32_i64, 1, 1, 1, IMPL64 | IMPL(TCG_TARGET_HAS_bswap32_i64))
-DEF(bswap64_i64, 1, 1, 1, IMPL64 | IMPL(TCG_TARGET_HAS_bswap64_i64))
-DEF(not_i64, 1, 1, 0, IMPL64 | IMPL(TCG_TARGET_HAS_not_i64))
-DEF(neg_i64, 1, 1, 0, IMPL64)
-DEF(andc_i64, 1, 2, 0, IMPL64 | IMPL(TCG_TARGET_HAS_andc_i64))
-DEF(orc_i64, 1, 2, 0, IMPL64 | IMPL(TCG_TARGET_HAS_orc_i64))
-DEF(eqv_i64, 1, 2, 0, IMPL64 | IMPL(TCG_TARGET_HAS_eqv_i64))
-DEF(nand_i64, 1, 2, 0, IMPL64 | IMPL(TCG_TARGET_HAS_nand_i64))
-DEF(nor_i64, 1, 2, 0, IMPL64 | IMPL(TCG_TARGET_HAS_nor_i64))
-DEF(clz_i64, 1, 2, 0, IMPL64 | IMPL(TCG_TARGET_HAS_clz_i64))
-DEF(ctz_i64, 1, 2, 0, IMPL64 | IMPL(TCG_TARGET_HAS_ctz_i64))
-DEF(ctpop_i64, 1, 1, 0, IMPL64 | IMPL(TCG_TARGET_HAS_ctpop_i64))
+DEF(brcond_i64, 0, 2, 2, TCG_OPF_BB_END | TCG_OPF_COND_BRANCH)
+DEF(ext8s_i64, 1, 1, 0, 0)
+DEF(ext16s_i64, 1, 1, 0, 0)
+DEF(ext32s_i64, 1, 1, 0, 0)
+DEF(ext8u_i64, 1, 1, 0, 0)
+DEF(ext16u_i64, 1, 1, 0, 0)
+DEF(ext32u_i64, 1, 1, 0, 0)
+DEF(bswap16_i64, 1, 1, 1, 0)
+DEF(bswap32_i64, 1, 1, 1, 0)
+DEF(bswap64_i64, 1, 1, 1, 0)
+DEF(not_i64, 1, 1, 0, 0)
+DEF(neg_i64, 1, 1, 0, 0)
+DEF(andc_i64, 1, 2, 0, 0)
+DEF(orc_i64, 1, 2, 0, 0)
+DEF(eqv_i64, 1, 2, 0, 0)
+DEF(nand_i64, 1, 2, 0, 0)
+DEF(nor_i64, 1, 2, 0, 0)
+DEF(clz_i64, 1, 2, 0, 0)
+DEF(ctz_i64, 1, 2, 0, 0)
+DEF(ctpop_i64, 1, 1, 0, 0)
 
-DEF(add2_i64, 2, 4, 0, IMPL64 | IMPL(TCG_TARGET_HAS_add2_i64))
-DEF(sub2_i64, 2, 4, 0, IMPL64 | IMPL(TCG_TARGET_HAS_sub2_i64))
-DEF(mulu2_i64, 2, 2, 0, IMPL64 | IMPL(TCG_TARGET_HAS_mulu2_i64))
-DEF(muls2_i64, 2, 2, 0, IMPL64 | IMPL(TCG_TARGET_HAS_muls2_i64))
-DEF(muluh_i64, 1, 2, 0, IMPL64 | IMPL(TCG_TARGET_HAS_muluh_i64))
-DEF(mulsh_i64, 1, 2, 0, IMPL64 | IMPL(TCG_TARGET_HAS_mulsh_i64))
+DEF(add2_i64, 2, 4, 0, 0)
+DEF(sub2_i64, 2, 4, 0, 0)
+DEF(mulu2_i64, 2, 2, 0, 0)
+DEF(muls2_i64, 2, 2, 0, 0)
+DEF(muluh_i64, 1, 2, 0, 0)
+DEF(mulsh_i64, 1, 2, 0, 0)
 
 #define DATA64_ARGS  (TCG_TARGET_REG_BITS == 64 ? 1 : 2)
 
@@ -XXX,XX +XXX,XX @@ DEF(qemu_st_a64_i64, 0, DATA64_ARGS + DATA64_ARGS, 1,
 
 /* Only used by i386 to cope with stupid register constraints. */
 DEF(qemu_st8_a32_i32, 0, 1 + 1, 1,
-    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS |
-    IMPL(TCG_TARGET_HAS_qemu_st8_i32))
+    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS)
 DEF(qemu_st8_a64_i32, 0, 1 + DATA64_ARGS, 1,
-    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS |
-    IMPL(TCG_TARGET_HAS_qemu_st8_i32))
+    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS)
 
 /* Only for 64-bit hosts at the moment. */
-DEF(qemu_ld_a32_i128, 2, 1, 1,
-    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS |
-    IMPL(TCG_TARGET_HAS_qemu_ldst_i128))
-DEF(qemu_ld_a64_i128, 2, 1, 1,
-    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS |
-    IMPL(TCG_TARGET_HAS_qemu_ldst_i128))
-DEF(qemu_st_a32_i128, 0, 3, 1,
-    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS |
-    IMPL(TCG_TARGET_HAS_qemu_ldst_i128))
-DEF(qemu_st_a64_i128, 0, 3, 1,
-    TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS |
-    IMPL(TCG_TARGET_HAS_qemu_ldst_i128))
+DEF(qemu_ld_a32_i128, 2, 1, 1, TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS)
+DEF(qemu_ld_a64_i128, 2, 1, 1, TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS)
+DEF(qemu_st_a32_i128, 0, 3, 1, TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS)
+DEF(qemu_st_a64_i128, 0, 3, 1, TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS)
 
 /* Host vector support.  */
 
-#define IMPLVEC  TCG_OPF_VECTOR | IMPL(TCG_TARGET_MAYBE_vec)
+#define IMPLVEC  TCG_OPF_VECTOR
 
 DEF(mov_vec, 1, 1, 0, TCG_OPF_VECTOR | TCG_OPF_NOT_PRESENT)
 
 DEF(dup_vec, 1, 1, 0, IMPLVEC)
-DEF(dup2_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_REG_BITS == 32))
+DEF(dup2_vec, 1, 2, 0, IMPLVEC)
 
 DEF(ld_vec, 1, 1, 1, IMPLVEC)
 DEF(st_vec, 0, 2, 1, IMPLVEC)
@@ -XXX,XX +XXX,XX @@ DEF(dupm_vec, 1, 1, 1, IMPLVEC)
 
 DEF(add_vec, 1, 2, 0, IMPLVEC)
 DEF(sub_vec, 1, 2, 0, IMPLVEC)
-DEF(mul_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_mul_vec))
-DEF(neg_vec, 1, 1, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_neg_vec))
-DEF(abs_vec, 1, 1, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_abs_vec))
-DEF(ssadd_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_sat_vec))
-DEF(usadd_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_sat_vec))
-DEF(sssub_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_sat_vec))
-DEF(ussub_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_sat_vec))
-DEF(smin_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_minmax_vec))
-DEF(umin_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_minmax_vec))
-DEF(smax_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_minmax_vec))
-DEF(umax_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_minmax_vec))
+DEF(mul_vec, 1, 2, 0, IMPLVEC)
+DEF(neg_vec, 1, 1, 0, IMPLVEC)
+DEF(abs_vec, 1, 1, 0, IMPLVEC)
+DEF(ssadd_vec, 1, 2, 0, IMPLVEC)
+DEF(usadd_vec, 1, 2, 0, IMPLVEC)
+DEF(sssub_vec, 1, 2, 0, IMPLVEC)
+DEF(ussub_vec, 1, 2, 0, IMPLVEC)
+DEF(smin_vec, 1, 2, 0, IMPLVEC)
+DEF(umin_vec, 1, 2, 0, IMPLVEC)
+DEF(smax_vec, 1, 2, 0, IMPLVEC)
+DEF(umax_vec, 1, 2, 0, IMPLVEC)
 
 DEF(and_vec, 1, 2, 0, IMPLVEC)
 DEF(or_vec, 1, 2, 0, IMPLVEC)
 DEF(xor_vec, 1, 2, 0, IMPLVEC)
-DEF(andc_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_andc_vec))
-DEF(orc_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_orc_vec))
-DEF(nand_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_nand_vec))
-DEF(nor_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_nor_vec))
-DEF(eqv_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_eqv_vec))
-DEF(not_vec, 1, 1, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_not_vec))
+DEF(andc_vec, 1, 2, 0, IMPLVEC)
+DEF(orc_vec, 1, 2, 0, IMPLVEC)
+DEF(nand_vec, 1, 2, 0, IMPLVEC)
+DEF(nor_vec, 1, 2, 0, IMPLVEC)
+DEF(eqv_vec, 1, 2, 0, IMPLVEC)
+DEF(not_vec, 1, 1, 0, IMPLVEC)
 
-DEF(shli_vec, 1, 1, 1, IMPLVEC | IMPL(TCG_TARGET_HAS_shi_vec))
-DEF(shri_vec, 1, 1, 1, IMPLVEC | IMPL(TCG_TARGET_HAS_shi_vec))
-DEF(sari_vec, 1, 1, 1, IMPLVEC | IMPL(TCG_TARGET_HAS_shi_vec))
-DEF(rotli_vec, 1, 1, 1, IMPLVEC | IMPL(TCG_TARGET_HAS_roti_vec))
+DEF(shli_vec, 1, 1, 1, IMPLVEC)
+DEF(shri_vec, 1, 1, 1, IMPLVEC)
+DEF(sari_vec, 1, 1, 1, IMPLVEC)
+DEF(rotli_vec, 1, 1, 1, IMPLVEC)
 
-DEF(shls_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_shs_vec))
-DEF(shrs_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_shs_vec))
-DEF(sars_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_shs_vec))
-DEF(rotls_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_rots_vec))
+DEF(shls_vec, 1, 2, 0, IMPLVEC)
+DEF(shrs_vec, 1, 2, 0, IMPLVEC)
+DEF(sars_vec, 1, 2, 0, IMPLVEC)
+DEF(rotls_vec, 1, 2, 0, IMPLVEC)
 
-DEF(shlv_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_shv_vec))
-DEF(shrv_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_shv_vec))
-DEF(sarv_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_shv_vec))
-DEF(rotlv_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_rotv_vec))
-DEF(rotrv_vec, 1, 2, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_rotv_vec))
+DEF(shlv_vec, 1, 2, 0, IMPLVEC)
+DEF(shrv_vec, 1, 2, 0, IMPLVEC)
+DEF(sarv_vec, 1, 2, 0, IMPLVEC)
+DEF(rotlv_vec, 1, 2, 0, IMPLVEC)
+DEF(rotrv_vec, 1, 2, 0, IMPLVEC)
 
 DEF(cmp_vec, 1, 2, 1, IMPLVEC)
 
-DEF(bitsel_vec, 1, 3, 0, IMPLVEC | IMPL(TCG_TARGET_HAS_bitsel_vec))
-DEF(cmpsel_vec, 1, 4, 1, IMPLVEC | IMPL(TCG_TARGET_HAS_cmpsel_vec))
+DEF(bitsel_vec, 1, 3, 0, IMPLVEC)
+DEF(cmpsel_vec, 1, 4, 1, IMPLVEC)
 
 DEF(last_generic, 0, 0, 0, TCG_OPF_NOT_PRESENT)
 
 #include "tcg-target-opc.h.inc"
 
 #undef DATA64_ARGS
-#undef IMPL
-#undef IMPL64
 #undef IMPLVEC
 #undef DEF
-- 
2.43.0

This is now a direct replacement.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 include/tcg/tcg-opc.h            | 89 +++++++++++++++-----------------
 tcg/aarch64/tcg-target-opc.h.inc |  4 +-
 tcg/arm/tcg-target-opc.h.inc     |  6 +--
 tcg/i386/tcg-target-opc.h.inc    | 22 ++++----
 tcg/ppc/tcg-target-opc.h.inc     | 12 ++---
 tcg/s390x/tcg-target-opc.h.inc   |  6 +--
 6 files changed, 68 insertions(+), 71 deletions(-)

diff --git a/include/tcg/tcg-opc.h b/include/tcg/tcg-opc.h
index XXXXXXX..XXXXXXX 100644
--- a/include/tcg/tcg-opc.h
+++ b/include/tcg/tcg-opc.h
@@ -XXX,XX +XXX,XX @@ DEF(qemu_st_a64_i128, 0, 3, 1, TCG_OPF_CALL_CLOBBER | TCG_OPF_SIDE_EFFECTS)
 
 /* Host vector support.  */
 
-#define IMPLVEC  TCG_OPF_VECTOR
-
 DEF(mov_vec, 1, 1, 0, TCG_OPF_VECTOR | TCG_OPF_NOT_PRESENT)
 
-DEF(dup_vec, 1, 1, 0, IMPLVEC)
-DEF(dup2_vec, 1, 2, 0, IMPLVEC)
+DEF(dup_vec, 1, 1, 0, TCG_OPF_VECTOR)
+DEF(dup2_vec, 1, 2, 0, TCG_OPF_VECTOR)
 
-DEF(ld_vec, 1, 1, 1, IMPLVEC)
-DEF(st_vec, 0, 2, 1, IMPLVEC)
-DEF(dupm_vec, 1, 1, 1, IMPLVEC)
+DEF(ld_vec, 1, 1, 1, TCG_OPF_VECTOR)
+DEF(st_vec, 0, 2, 1, TCG_OPF_VECTOR)
+DEF(dupm_vec, 1, 1, 1, TCG_OPF_VECTOR)
 
-DEF(add_vec, 1, 2, 0, IMPLVEC)
-DEF(sub_vec, 1, 2, 0, IMPLVEC)
-DEF(mul_vec, 1, 2, 0, IMPLVEC)
-DEF(neg_vec, 1, 1, 0, IMPLVEC)
-DEF(abs_vec, 1, 1, 0, IMPLVEC)
-DEF(ssadd_vec, 1, 2, 0, IMPLVEC)
-DEF(usadd_vec, 1, 2, 0, IMPLVEC)
-DEF(sssub_vec, 1, 2, 0, IMPLVEC)
-DEF(ussub_vec, 1, 2, 0, IMPLVEC)
-DEF(smin_vec, 1, 2, 0, IMPLVEC)
-DEF(umin_vec, 1, 2, 0, IMPLVEC)
-DEF(smax_vec, 1, 2, 0, IMPLVEC)
-DEF(umax_vec, 1, 2, 0, IMPLVEC)
+DEF(add_vec, 1, 2, 0, TCG_OPF_VECTOR)
+DEF(sub_vec, 1, 2, 0, TCG_OPF_VECTOR)
+DEF(mul_vec, 1, 2, 0, TCG_OPF_VECTOR)
+DEF(neg_vec, 1, 1, 0, TCG_OPF_VECTOR)
+DEF(abs_vec, 1, 1, 0, TCG_OPF_VECTOR)
+DEF(ssadd_vec, 1, 2, 0, TCG_OPF_VECTOR)
+DEF(usadd_vec, 1, 2, 0, TCG_OPF_VECTOR)
+DEF(sssub_vec, 1, 2, 0, TCG_OPF_VECTOR)
+DEF(ussub_vec, 1, 2, 0, TCG_OPF_VECTOR)
+DEF(smin_vec, 1, 2, 0, TCG_OPF_VECTOR)
+DEF(umin_vec, 1, 2, 0, TCG_OPF_VECTOR)
+DEF(smax_vec, 1, 2, 0, TCG_OPF_VECTOR)
+DEF(umax_vec, 1, 2, 0, TCG_OPF_VECTOR)
 
-DEF(and_vec, 1, 2, 0, IMPLVEC)
-DEF(or_vec, 1, 2, 0, IMPLVEC)
-DEF(xor_vec, 1, 2, 0, IMPLVEC)
-DEF(andc_vec, 1, 2, 0, IMPLVEC)
-DEF(orc_vec, 1, 2, 0, IMPLVEC)
-DEF(nand_vec, 1, 2, 0, IMPLVEC)
-DEF(nor_vec, 1, 2, 0, IMPLVEC)
-DEF(eqv_vec, 1, 2, 0, IMPLVEC)
-DEF(not_vec, 1, 1, 0, IMPLVEC)
+DEF(and_vec, 1, 2, 0, TCG_OPF_VECTOR)
+DEF(or_vec, 1, 2, 0, TCG_OPF_VECTOR)
+DEF(xor_vec, 1, 2, 0, TCG_OPF_VECTOR)
+DEF(andc_vec, 1, 2, 0, TCG_OPF_VECTOR)
+DEF(orc_vec, 1, 2, 0, TCG_OPF_VECTOR)
+DEF(nand_vec, 1, 2, 0, TCG_OPF_VECTOR)
+DEF(nor_vec, 1, 2, 0, TCG_OPF_VECTOR)
+DEF(eqv_vec, 1, 2, 0, TCG_OPF_VECTOR)
+DEF(not_vec, 1, 1, 0, TCG_OPF_VECTOR)
 
-DEF(shli_vec, 1, 1, 1, IMPLVEC)
-DEF(shri_vec, 1, 1, 1, IMPLVEC)
-DEF(sari_vec, 1, 1, 1, IMPLVEC)
-DEF(rotli_vec, 1, 1, 1, IMPLVEC)
+DEF(shli_vec, 1, 1, 1, TCG_OPF_VECTOR)
+DEF(shri_vec, 1, 1, 1, TCG_OPF_VECTOR)
+DEF(sari_vec, 1, 1, 1, TCG_OPF_VECTOR)
+DEF(rotli_vec, 1, 1, 1, TCG_OPF_VECTOR)
 
-DEF(shls_vec, 1, 2, 0, IMPLVEC)
-DEF(shrs_vec, 1, 2, 0, IMPLVEC)
-DEF(sars_vec, 1, 2, 0, IMPLVEC)
-DEF(rotls_vec, 1, 2, 0, IMPLVEC)
+DEF(shls_vec, 1, 2, 0, TCG_OPF_VECTOR)
+DEF(shrs_vec, 1, 2, 0, TCG_OPF_VECTOR)
+DEF(sars_vec, 1, 2, 0, TCG_OPF_VECTOR)
+DEF(rotls_vec, 1, 2, 0, TCG_OPF_VECTOR)
 
-DEF(shlv_vec, 1, 2, 0, IMPLVEC)
-DEF(shrv_vec, 1, 2, 0, IMPLVEC)
-DEF(sarv_vec, 1, 2, 0, IMPLVEC)
-DEF(rotlv_vec, 1, 2, 0, IMPLVEC)
-DEF(rotrv_vec, 1, 2, 0, IMPLVEC)
+DEF(shlv_vec, 1, 2, 0, TCG_OPF_VECTOR)
+DEF(shrv_vec, 1, 2, 0, TCG_OPF_VECTOR)
+DEF(sarv_vec, 1, 2, 0, TCG_OPF_VECTOR)
+DEF(rotlv_vec, 1, 2, 0, TCG_OPF_VECTOR)
+DEF(rotrv_vec, 1, 2, 0, TCG_OPF_VECTOR)
 
-DEF(cmp_vec, 1, 2, 1, IMPLVEC)
+DEF(cmp_vec, 1, 2, 1, TCG_OPF_VECTOR)
 
-DEF(bitsel_vec, 1, 3, 0, IMPLVEC)
-DEF(cmpsel_vec, 1, 4, 1, IMPLVEC)
+DEF(bitsel_vec, 1, 3, 0, TCG_OPF_VECTOR)
+DEF(cmpsel_vec, 1, 4, 1, TCG_OPF_VECTOR)
 
 DEF(last_generic, 0, 0, 0, TCG_OPF_NOT_PRESENT)
 
 #include "tcg-target-opc.h.inc"
 
 #undef DATA64_ARGS
-#undef IMPLVEC
 #undef DEF
diff --git a/tcg/aarch64/tcg-target-opc.h.inc b/tcg/aarch64/tcg-target-opc.h.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/aarch64/tcg-target-opc.h.inc
+++ b/tcg/aarch64/tcg-target-opc.h.inc
@@ -XXX,XX +XXX,XX @@
  * consider these to be UNSPEC with names.
  */
 
-DEF(aa64_sshl_vec, 1, 2, 0, IMPLVEC)
-DEF(aa64_sli_vec, 1, 2, 1, IMPLVEC)
+DEF(aa64_sshl_vec, 1, 2, 0, TCG_OPF_VECTOR)
+DEF(aa64_sli_vec, 1, 2, 1, TCG_OPF_VECTOR)
diff --git a/tcg/arm/tcg-target-opc.h.inc b/tcg/arm/tcg-target-opc.h.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/arm/tcg-target-opc.h.inc
+++ b/tcg/arm/tcg-target-opc.h.inc
@@ -XXX,XX +XXX,XX @@
  * consider these to be UNSPEC with names.
  */
 
-DEF(arm_sli_vec, 1, 2, 1, IMPLVEC)
-DEF(arm_sshl_vec, 1, 2, 0, IMPLVEC)
-DEF(arm_ushl_vec, 1, 2, 0, IMPLVEC)
+DEF(arm_sli_vec, 1, 2, 1, TCG_OPF_VECTOR)
+DEF(arm_sshl_vec, 1, 2, 0, TCG_OPF_VECTOR)
+DEF(arm_ushl_vec, 1, 2, 0, TCG_OPF_VECTOR)
diff --git a/tcg/i386/tcg-target-opc.h.inc b/tcg/i386/tcg-target-opc.h.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/i386/tcg-target-opc.h.inc
+++ b/tcg/i386/tcg-target-opc.h.inc
@@ -XXX,XX +XXX,XX @@
  * consider these to be UNSPEC with names.
  */
 
-DEF(x86_shufps_vec, 1, 2, 1, IMPLVEC)
-DEF(x86_blend_vec, 1, 2, 1, IMPLVEC)
-DEF(x86_packss_vec, 1, 2, 0, IMPLVEC)
-DEF(x86_packus_vec, 1, 2, 0, IMPLVEC)
-DEF(x86_psrldq_vec, 1, 1, 1, IMPLVEC)
-DEF(x86_vperm2i128_vec, 1, 2, 1, IMPLVEC)
-DEF(x86_punpckl_vec, 1, 2, 0, IMPLVEC)
-DEF(x86_punpckh_vec, 1, 2, 0, IMPLVEC)
-DEF(x86_vpshldi_vec, 1, 2, 1, IMPLVEC)
-DEF(x86_vpshldv_vec, 1, 3, 0, IMPLVEC)
-DEF(x86_vpshrdv_vec, 1, 3, 0, IMPLVEC)
+DEF(x86_shufps_vec, 1, 2, 1, TCG_OPF_VECTOR)
+DEF(x86_blend_vec, 1, 2, 1, TCG_OPF_VECTOR)
+DEF(x86_packss_vec, 1, 2, 0, TCG_OPF_VECTOR)
+DEF(x86_packus_vec, 1, 2, 0, TCG_OPF_VECTOR)
+DEF(x86_psrldq_vec, 1, 1, 1, TCG_OPF_VECTOR)
+DEF(x86_vperm2i128_vec, 1, 2, 1, TCG_OPF_VECTOR)
+DEF(x86_punpckl_vec, 1, 2, 0, TCG_OPF_VECTOR)
+DEF(x86_punpckh_vec, 1, 2, 0, TCG_OPF_VECTOR)
+DEF(x86_vpshldi_vec, 1, 2, 1, TCG_OPF_VECTOR)
+DEF(x86_vpshldv_vec, 1, 3, 0, TCG_OPF_VECTOR)
+DEF(x86_vpshrdv_vec, 1, 3, 0, TCG_OPF_VECTOR)
diff --git a/tcg/ppc/tcg-target-opc.h.inc b/tcg/ppc/tcg-target-opc.h.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/ppc/tcg-target-opc.h.inc
+++ b/tcg/ppc/tcg-target-opc.h.inc
@@ -XXX,XX +XXX,XX @@
  * consider these to be UNSPEC with names.
  */
 
-DEF(ppc_mrgh_vec, 1, 2, 0, IMPLVEC)
-DEF(ppc_mrgl_vec, 1, 2, 0, IMPLVEC)
-DEF(ppc_msum_vec, 1, 3, 0, IMPLVEC)
-DEF(ppc_muleu_vec, 1, 2, 0, IMPLVEC)
-DEF(ppc_mulou_vec, 1, 2, 0, IMPLVEC)
-DEF(ppc_pkum_vec, 1, 2, 0, IMPLVEC)
+DEF(ppc_mrgh_vec, 1, 2, 0, TCG_OPF_VECTOR)
+DEF(ppc_mrgl_vec, 1, 2, 0, TCG_OPF_VECTOR)
+DEF(ppc_msum_vec, 1, 3, 0, TCG_OPF_VECTOR)
+DEF(ppc_muleu_vec, 1, 2, 0, TCG_OPF_VECTOR)
+DEF(ppc_mulou_vec, 1, 2, 0, TCG_OPF_VECTOR)
+DEF(ppc_pkum_vec, 1, 2, 0, TCG_OPF_VECTOR)
diff --git a/tcg/s390x/tcg-target-opc.h.inc b/tcg/s390x/tcg-target-opc.h.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/s390x/tcg-target-opc.h.inc
+++ b/tcg/s390x/tcg-target-opc.h.inc
@@ -XXX,XX +XXX,XX @@
  * emitted by tcg_expand_vec_op.  For those familiar with GCC internals,
  * consider these to be UNSPEC with names.
  */
-DEF(s390_vuph_vec, 1, 1, 0, IMPLVEC)
-DEF(s390_vupl_vec, 1, 1, 0, IMPLVEC)
-DEF(s390_vpks_vec, 1, 2, 0, IMPLVEC)
+DEF(s390_vuph_vec, 1, 1, 0, TCG_OPF_VECTOR)
+DEF(s390_vupl_vec, 1, 1, 0, TCG_OPF_VECTOR)
+DEF(s390_vpks_vec, 1, 2, 0, TCG_OPF_VECTOR)
-- 
2.43.0

We always provide bswap subroutines, whether they are optimized
using mips32r2 when available or not.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 tcg/mips/tcg-target-has.h | 8 ++++----
 1 file changed, 4 insertions(+), 4 deletions(-)

diff --git a/tcg/mips/tcg-target-has.h b/tcg/mips/tcg-target-has.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/mips/tcg-target-has.h
+++ b/tcg/mips/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@ extern bool use_mips32r2_instructions;
 #define TCG_TARGET_HAS_muls2_i32        (!use_mips32r6_instructions)
 #define TCG_TARGET_HAS_muluh_i32        1
 #define TCG_TARGET_HAS_mulsh_i32        1
+#define TCG_TARGET_HAS_bswap16_i32      1
 #define TCG_TARGET_HAS_bswap32_i32      1
 #define TCG_TARGET_HAS_negsetcond_i32   0
 
@@ -XXX,XX +XXX,XX @@ extern bool use_mips32r2_instructions;
 #endif
 
 /* optional instructions detected at runtime */
-#define TCG_TARGET_HAS_bswap16_i32      use_mips32r2_instructions
 #define TCG_TARGET_HAS_deposit_i32      use_mips32r2_instructions
 #define TCG_TARGET_HAS_extract_i32      use_mips32r2_instructions
 #define TCG_TARGET_HAS_sextract_i32     0
@@ -XXX,XX +XXX,XX @@ extern bool use_mips32r2_instructions;
 #define TCG_TARGET_HAS_qemu_st8_i32     0
 
 #if TCG_TARGET_REG_BITS == 64
-#define TCG_TARGET_HAS_bswap16_i64      use_mips32r2_instructions
-#define TCG_TARGET_HAS_bswap32_i64      use_mips32r2_instructions
-#define TCG_TARGET_HAS_bswap64_i64      use_mips32r2_instructions
+#define TCG_TARGET_HAS_bswap16_i64      1
+#define TCG_TARGET_HAS_bswap32_i64      1
+#define TCG_TARGET_HAS_bswap64_i64      1
 #define TCG_TARGET_HAS_deposit_i64      use_mips32r2_instructions
 #define TCG_TARGET_HAS_extract_i64      use_mips32r2_instructions
 #define TCG_TARGET_HAS_sextract_i64     0
-- 
2.43.0

When we generalize {s}extract_i32, we'll lose the
specific register constraints on ext8u and ext8s.
It's just as easy to emit a couple of insns instead.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 tcg/i386/tcg-target.c.inc | 23 +++++++++++++++++++----
 1 file changed, 19 insertions(+), 4 deletions(-)

diff --git a/tcg/i386/tcg-target.c.inc b/tcg/i386/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/i386/tcg-target.c.inc
+++ b/tcg/i386/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static inline void tcg_out_rolw_8(TCGContext *s, int reg)
 
 static void tcg_out_ext8u(TCGContext *s, TCGReg dest, TCGReg src)
 {
-    /* movzbl */
-    tcg_debug_assert(src < 4 || TCG_TARGET_REG_BITS == 64);
+    if (TCG_TARGET_REG_BITS == 32 && src >= 4) {
+        tcg_out_mov(s, TCG_TYPE_I32, dest, src);
+        if (dest >= 4) {
+            tcg_out_modrm(s, OPC_ARITH_EvIz, ARITH_AND, dest);
+            tcg_out32(s, 0xff);
+            return;
+        }
+        src = dest;
+    }
     tcg_out_modrm(s, OPC_MOVZBL + P_REXB_RM, dest, src);
 }
 
 static void tcg_out_ext8s(TCGContext *s, TCGType type, TCGReg dest, TCGReg src)
 {
     int rexw = type == TCG_TYPE_I32 ? 0 : P_REXW;
-    /* movsbl */
-    tcg_debug_assert(src < 4 || TCG_TARGET_REG_BITS == 64);
+
+    if (TCG_TARGET_REG_BITS == 32 && src >= 4) {
+        tcg_out_mov(s, TCG_TYPE_I32, dest, src);
+        if (dest >= 4) {
+            tcg_out_shifti(s, SHIFT_SHL, dest, 24);
+            tcg_out_shifti(s, SHIFT_SAR, dest, 24);
+            return;
+        }
+        src = dest;
+    }
     tcg_out_modrm(s, OPC_MOVSBL + P_REXB_RM + rexw, dest, src);
 }
 
-- 
2.43.0

Accept byte and word extensions with the extract opcodes.
This is preparatory to removing the specialized extracts.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 tcg/i386/tcg-target-has.h | 49 +++++++++++++++++++++++++++----
 tcg/tcg-has.h             | 12 +++++---
 tcg/optimize.c            |  8 +++--
 tcg/tcg-op.c              | 12 +++-----
 tcg/i386/tcg-target.c.inc | 62 +++++++++++++++++++++++++++++----------
 5 files changed, 107 insertions(+), 36 deletions(-)

diff --git a/tcg/i386/tcg-target-has.h b/tcg/i386/tcg-target-has.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/i386/tcg-target-has.h
+++ b/tcg/i386/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@
 #define TCG_TARGET_HAS_ctpop_i64        have_popcnt
 #define TCG_TARGET_HAS_deposit_i64      1
 #define TCG_TARGET_HAS_extract_i64      1
-#define TCG_TARGET_HAS_sextract_i64     0
+#define TCG_TARGET_HAS_sextract_i64     1
 #define TCG_TARGET_HAS_extract2_i64     1
 #define TCG_TARGET_HAS_negsetcond_i64   1
 #define TCG_TARGET_HAS_add2_i64         1
@@ -XXX,XX +XXX,XX @@
      (TCG_TARGET_REG_BITS == 32 && (ofs) == 8 && (len) == 8))
 #define TCG_TARGET_deposit_i64_valid    TCG_TARGET_deposit_i32_valid
 
-/* Check for the possibility of high-byte extraction and, for 64-bit,
-   zero-extending 32-bit right-shift.  */
-#define TCG_TARGET_extract_i32_valid(ofs, len) ((ofs) == 8 && (len) == 8)
-#define TCG_TARGET_extract_i64_valid(ofs, len) \
-    (((ofs) == 8 && (len) == 8) || ((ofs) + (len)) == 32)
+/*
+ * Check for the possibility of low byte/word extraction, high-byte extraction
+ * and zero-extending 32-bit right-shift.
+ *
+ * We cannot sign-extend from high byte to 64-bits without using the
+ * REX prefix that explicitly excludes access to the high-byte registers.
+ */
+static inline bool
+tcg_target_sextract_valid(TCGType type, unsigned ofs, unsigned len)
+{
+    switch (ofs) {
+    case 0:
+        switch (len) {
+        case 8:
+        case 16:
+            return true;
+        case 32:
+            return type == TCG_TYPE_I64;
+        }
+        return false;
+    case 8:
+        return len == 8 && type == TCG_TYPE_I32;
+    }
+    return false;
+}
+#define TCG_TARGET_sextract_valid  tcg_target_sextract_valid
+
+static inline bool
+tcg_target_extract_valid(TCGType type, unsigned ofs, unsigned len)
+{
+    if (type == TCG_TYPE_I64 && ofs + len == 32) {
+        return true;
+    }
+    switch (ofs) {
+    case 0:
+        return len == 8 || len == 16;
+    case 8:
+        return len == 8;
+    }
+    return false;
+}
+#define TCG_TARGET_extract_valid  tcg_target_extract_valid
 
 #endif
diff --git a/tcg/tcg-has.h b/tcg/tcg-has.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg-has.h
+++ b/tcg/tcg-has.h
@@ -XXX,XX +XXX,XX @@
 #ifndef TCG_TARGET_deposit_i64_valid
 #define TCG_TARGET_deposit_i64_valid(ofs, len) 1
 #endif
-#ifndef TCG_TARGET_extract_i32_valid
-#define TCG_TARGET_extract_i32_valid(ofs, len) 1
+#ifndef TCG_TARGET_extract_valid
+#define TCG_TARGET_extract_valid(type, ofs, len) \
+    ((type) == TCG_TYPE_I32 ? TCG_TARGET_HAS_extract_i32 \
+     : TCG_TARGET_HAS_extract_i64)
 #endif
-#ifndef TCG_TARGET_extract_i64_valid
-#define TCG_TARGET_extract_i64_valid(ofs, len) 1
+#ifndef TCG_TARGET_sextract_valid
+#define TCG_TARGET_sextract_valid(type, ofs, len) \
+    ((type) == TCG_TYPE_I32 ? TCG_TARGET_HAS_sextract_i32 \
+     : TCG_TARGET_HAS_sextract_i64)
 #endif
 
 /* Only one of DIV or DIV2 should be defined.  */
diff --git a/tcg/optimize.c b/tcg/optimize.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/optimize.c
+++ b/tcg/optimize.c
@@ -XXX,XX +XXX,XX @@ static void fold_setcond_tst_pow2(OptContext *ctx, TCGOp *op, bool neg)
         xor_opc = INDEX_op_xor_i32;
         shr_opc = INDEX_op_shr_i32;
         neg_opc = INDEX_op_neg_i32;
-        if (TCG_TARGET_extract_i32_valid(sh, 1)) {
+        if (TCG_TARGET_extract_valid(TCG_TYPE_I32, sh, 1)) {
             uext_opc = TCG_TARGET_HAS_extract_i32 ? INDEX_op_extract_i32 : 0;
+        }
+        if (TCG_TARGET_sextract_valid(TCG_TYPE_I32, sh, 1)) {
             sext_opc = TCG_TARGET_HAS_sextract_i32 ? INDEX_op_sextract_i32 : 0;
         }
         break;
@@ -XXX,XX +XXX,XX @@ static void fold_setcond_tst_pow2(OptContext *ctx, TCGOp *op, bool neg)
         xor_opc = INDEX_op_xor_i64;
         shr_opc = INDEX_op_shr_i64;
         neg_opc = INDEX_op_neg_i64;
-        if (TCG_TARGET_extract_i64_valid(sh, 1)) {
+        if (TCG_TARGET_extract_valid(TCG_TYPE_I64, sh, 1)) {
             uext_opc = TCG_TARGET_HAS_extract_i64 ? INDEX_op_extract_i64 : 0;
+        }
+        if (TCG_TARGET_sextract_valid(TCG_TYPE_I64, sh, 1)) {
             sext_opc = TCG_TARGET_HAS_sextract_i64 ? INDEX_op_sextract_i64 : 0;
         }
         break;
diff --git a/tcg/tcg-op.c b/tcg/tcg-op.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg-op.c
+++ b/tcg/tcg-op.c
@@ -XXX,XX +XXX,XX @@ void tcg_gen_extract_i32(TCGv_i32 ret, TCGv_i32 arg,
         return;
     }
 
-    if (TCG_TARGET_HAS_extract_i32
-        && TCG_TARGET_extract_i32_valid(ofs, len)) {
+    if (TCG_TARGET_extract_valid(TCG_TYPE_I32, ofs, len)) {
         tcg_gen_op4ii_i32(INDEX_op_extract_i32, ret, arg, ofs, len);
         return;
     }
@@ -XXX,XX +XXX,XX @@ void tcg_gen_sextract_i32(TCGv_i32 ret, TCGv_i32 arg,
         }
     }
 
-    if (TCG_TARGET_HAS_sextract_i32
-        && TCG_TARGET_extract_i32_valid(ofs, len)) {
+    if (TCG_TARGET_sextract_valid(TCG_TYPE_I32, ofs, len)) {
         tcg_gen_op4ii_i32(INDEX_op_sextract_i32, ret, arg, ofs, len);
         return;
     }
@@ -XXX,XX +XXX,XX @@ void tcg_gen_extract_i64(TCGv_i64 ret, TCGv_i64 arg,
         goto do_shift_and;
     }
 
-    if (TCG_TARGET_HAS_extract_i64
-        && TCG_TARGET_extract_i64_valid(ofs, len)) {
+    if (TCG_TARGET_extract_valid(TCG_TYPE_I64, ofs, len)) {
         tcg_gen_op4ii_i64(INDEX_op_extract_i64, ret, arg, ofs, len);
         return;
     }
@@ -XXX,XX +XXX,XX @@ void tcg_gen_sextract_i64(TCGv_i64 ret, TCGv_i64 arg,
         return;
     }
 
-    if (TCG_TARGET_HAS_sextract_i64
-        && TCG_TARGET_extract_i64_valid(ofs, len)) {
+    if (TCG_TARGET_sextract_valid(TCG_TYPE_I64, ofs, len)) {
         tcg_gen_op4ii_i64(INDEX_op_sextract_i64, ret, arg, ofs, len);
         return;
     }
diff --git a/tcg/i386/tcg-target.c.inc b/tcg/i386/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/i386/tcg-target.c.inc
+++ b/tcg/i386/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
 
     case INDEX_op_extract_i64:
         if (a2 + args[3] == 32) {
+            if (a2 == 0) {
+                tcg_out_ext32u(s, a0, a1);
+                break;
+            }
             /* This is a 32-bit zero-extending right shift.  */
             tcg_out_mov(s, TCG_TYPE_I32, a0, a1);
             tcg_out_shifti(s, SHIFT_SHR, a0, a2);
@@ -XXX,XX +XXX,XX @@ static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
         }
         /* FALLTHRU */
     case INDEX_op_extract_i32:
-        /* On the off-chance that we can use the high-byte registers.
-           Otherwise we emit the same ext16 + shift pattern that we
-           would have gotten from the normal tcg-op.c expansion.  */
-        tcg_debug_assert(a2 == 8 && args[3] == 8);
-        if (a1 < 4 && a0 < 8) {
-            tcg_out_modrm(s, OPC_MOVZBL, a0, a1 + 4);
-        } else {
+        if (a2 == 0 && args[3] == 8) {
+            tcg_out_ext8u(s, a0, a1);
+        } else if (a2 == 0 && args[3] == 16) {
             tcg_out_ext16u(s, a0, a1);
-            tcg_out_shifti(s, SHIFT_SHR, a0, 8);
+        } else if (a2 == 8 && args[3] == 8) {
+            /*
+             * On the off-chance that we can use the high-byte registers.
+             * Otherwise we emit the same ext16 + shift pattern that we
+             * would have gotten from the normal tcg-op.c expansion.
+             */
+            if (a1 < 4 && a0 < 8) {
+                tcg_out_modrm(s, OPC_MOVZBL, a0, a1 + 4);
+            } else {
+                tcg_out_ext16u(s, a0, a1);
+                tcg_out_shifti(s, SHIFT_SHR, a0, 8);
+            }
+        } else {
+            g_assert_not_reached();
+        }
+        break;
+
+    case INDEX_op_sextract_i64:
+        if (a2 == 0 && args[3] == 8) {
+            tcg_out_ext8s(s, TCG_TYPE_I64, a0, a1);
+        } else if (a2 == 0 && args[3] == 16) {
+            tcg_out_ext16s(s, TCG_TYPE_I64, a0, a1);
+        } else if (a2 == 0 && args[3] == 32) {
+            tcg_out_ext32s(s, a0, a1);
+        } else {
+            g_assert_not_reached();
         }
         break;
 
     case INDEX_op_sextract_i32:
-        /* We don't implement sextract_i64, as we cannot sign-extend to
-           64-bits without using the REX prefix that explicitly excludes
-           access to the high-byte registers.  */
-        tcg_debug_assert(a2 == 8 && args[3] == 8);
-        if (a1 < 4 && a0 < 8) {
-            tcg_out_modrm(s, OPC_MOVSBL, a0, a1 + 4);
-        } else {
+        if (a2 == 0 && args[3] == 8) {
+            tcg_out_ext8s(s, TCG_TYPE_I32, a0, a1);
+        } else if (a2 == 0 && args[3] == 16) {
             tcg_out_ext16s(s, TCG_TYPE_I32, a0, a1);
-            tcg_out_shifti(s, SHIFT_SAR, a0, 8);
+        } else if (a2 == 8 && args[3] == 8) {
+            if (a1 < 4 && a0 < 8) {
+                tcg_out_modrm(s, OPC_MOVSBL, a0, a1 + 4);
+            } else {
+                tcg_out_ext16s(s, TCG_TYPE_I32, a0, a1);
+                tcg_out_shifti(s, SHIFT_SAR, a0, 8);
+            }
+        } else {
+            g_assert_not_reached();
         }
         break;
 
@@ -XXX,XX +XXX,XX @@ tcg_target_op_def(TCGOpcode op, TCGType type, unsigned flags)
     case INDEX_op_extract_i32:
     case INDEX_op_extract_i64:
     case INDEX_op_sextract_i32:
+    case INDEX_op_sextract_i64:
     case INDEX_op_ctpop_i32:
     case INDEX_op_ctpop_i64:
         return C_O1_I1(r, r);
-- 
2.43.0

We're about to change canonicalization of masks as extract
instead of and.  Retain the andi expansion here.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 tcg/aarch64/tcg-target.c.inc | 7 ++++++-
 1 file changed, 6 insertions(+), 1 deletion(-)

diff --git a/tcg/aarch64/tcg-target.c.inc b/tcg/aarch64/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/aarch64/tcg-target.c.inc
+++ b/tcg/aarch64/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType ext,
 
     case INDEX_op_extract_i64:
     case INDEX_op_extract_i32:
-        tcg_out_ubfm(s, ext, a0, a1, a2, a2 + args[3] - 1);
+        if (a2 == 0) {
+            uint64_t mask = MAKE_64BIT_MASK(0, args[3]);
+            tcg_out_logicali(s, I3404_ANDI, ext, a0, a1, mask);
+        } else {
+            tcg_out_ubfm(s, ext, a0, a1, a2, a2 + args[3] - 1);
+        }
         break;
 
     case INDEX_op_sextract_i64:
-- 
2.43.0

The armv6 uxt and sxt opcodes have a 2-bit rotate field
which supports extractions from ofs = {0,8,16,24}.
Special case ofs = 0, len <= 8 as AND.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 tcg/arm/tcg-target-has.h | 21 ++++++++++++++--
 tcg/arm/tcg-target.c.inc | 54 +++++++++++++++++++++++++++++++++++-----
 2 files changed, 67 insertions(+), 8 deletions(-)

diff --git a/tcg/arm/tcg-target-has.h b/tcg/arm/tcg-target-has.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/arm/tcg-target-has.h
+++ b/tcg/arm/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@ extern bool use_neon_instructions;
 #define TCG_TARGET_HAS_ctz_i32          use_armv7_instructions
 #define TCG_TARGET_HAS_ctpop_i32        0
 #define TCG_TARGET_HAS_deposit_i32      use_armv7_instructions
-#define TCG_TARGET_HAS_extract_i32      use_armv7_instructions
-#define TCG_TARGET_HAS_sextract_i32     use_armv7_instructions
+#define TCG_TARGET_HAS_extract_i32      1
+#define TCG_TARGET_HAS_sextract_i32     1
 #define TCG_TARGET_HAS_extract2_i32     1
 #define TCG_TARGET_HAS_negsetcond_i32   1
 #define TCG_TARGET_HAS_mulu2_i32        1
@@ -XXX,XX +XXX,XX @@ extern bool use_neon_instructions;
 #define TCG_TARGET_HAS_cmpsel_vec       0
 #define TCG_TARGET_HAS_tst_vec          1
 
+static inline bool
+tcg_target_extract_valid(TCGType type, unsigned ofs, unsigned len)
+{
+    if (use_armv7_instructions) {
+        return true;  /* SBFX or UBFX */
+    }
+    switch (len) {
+    case 8:   /* SXTB or UXTB */
+    case 16:  /* SXTH or UXTH */
+        return (ofs % 8) == 0;
+    }
+    return false;
+}
+
+#define TCG_TARGET_extract_valid   tcg_target_extract_valid
+#define TCG_TARGET_sextract_valid  tcg_target_extract_valid
+
 #endif
diff --git a/tcg/arm/tcg-target.c.inc b/tcg/arm/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/arm/tcg-target.c.inc
+++ b/tcg/arm/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static void tcg_out_deposit(TCGContext *s, ARMCond cond, TCGReg rd,
 static void tcg_out_extract(TCGContext *s, ARMCond cond, TCGReg rd,
                             TCGReg rn, int ofs, int len)
 {
-    /* ubfx */
-    tcg_out32(s, 0x07e00050 | (cond << 28) | (rd << 12) | rn
-              | (ofs << 7) | ((len - 1) << 16));
+    /* According to gcc, AND can be faster. */
+    if (ofs == 0 && len <= 8) {
+        tcg_out_dat_imm(s, cond, ARITH_AND, rd, rn,
+                        encode_imm_nofail((1 << len) - 1));
+        return;
+    }
+
+    if (use_armv7_instructions) {
+        /* ubfx */
+        tcg_out32(s, 0x07e00050 | (cond << 28) | (rd << 12) | rn
+                  | (ofs << 7) | ((len - 1) << 16));
+        return;
+    }
+
+    assert(ofs % 8 == 0);
+    switch (len) {
+    case 8:
+        /* uxtb */
+        tcg_out32(s, 0x06ef0070 | (cond << 28) | (rd << 12) | (ofs << 7) | rn);
+        break;
+    case 16:
+        /* uxth */
+        tcg_out32(s, 0x06ff0070 | (cond << 28) | (rd << 12) | (ofs << 7) | rn);
+        break;
+    default:
+        g_assert_not_reached();
+    }
 }
 
 static void tcg_out_sextract(TCGContext *s, ARMCond cond, TCGReg rd,
                              TCGReg rn, int ofs, int len)
 {
-    /* sbfx */
-    tcg_out32(s, 0x07a00050 | (cond << 28) | (rd << 12) | rn
-              | (ofs << 7) | ((len - 1) << 16));
+    if (use_armv7_instructions) {
+        /* sbfx */
+        tcg_out32(s, 0x07a00050 | (cond << 28) | (rd << 12) | rn
+                  | (ofs << 7) | ((len - 1) << 16));
+        return;
+    }
+
+    assert(ofs % 8 == 0);
+    switch (len) {
+    case 8:
+        /* sxtb */
+        tcg_out32(s, 0x06af0070 | (cond << 28) | (rd << 12) | (ofs << 7) | rn);
+        break;
+    case 16:
+        /* sxth */
+        tcg_out32(s, 0x06bf0070 | (cond << 28) | (rd << 12) | (ofs << 7) | rn);
+        break;
+    default:
+        g_assert_not_reached();
+    }
 }
 
+
 static void tcg_out_ld32u(TCGContext *s, ARMCond cond,
                           TCGReg rd, TCGReg rn, int32_t offset)
 {
-- 
2.43.0

Accept byte and word extensions with the extract opcodes.
This is preparatory to removing the specialized extracts.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 tcg/loongarch64/tcg-target-has.h | 15 ++++++++++++--
 tcg/loongarch64/tcg-target.c.inc | 34 ++++++++++++++++++++++++++++++--
 2 files changed, 45 insertions(+), 4 deletions(-)

diff --git a/tcg/loongarch64/tcg-target-has.h b/tcg/loongarch64/tcg-target-has.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/loongarch64/tcg-target-has.h
+++ b/tcg/loongarch64/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@
 #define TCG_TARGET_HAS_rot_i32          1
 #define TCG_TARGET_HAS_deposit_i32      1
 #define TCG_TARGET_HAS_extract_i32      1
-#define TCG_TARGET_HAS_sextract_i32     0
+#define TCG_TARGET_HAS_sextract_i32     1
 #define TCG_TARGET_HAS_extract2_i32     0
 #define TCG_TARGET_HAS_add2_i32         0
 #define TCG_TARGET_HAS_sub2_i32         0
@@ -XXX,XX +XXX,XX @@
 #define TCG_TARGET_HAS_rot_i64          1
 #define TCG_TARGET_HAS_deposit_i64      1
 #define TCG_TARGET_HAS_extract_i64      1
-#define TCG_TARGET_HAS_sextract_i64     0
+#define TCG_TARGET_HAS_sextract_i64     1
 #define TCG_TARGET_HAS_extract2_i64     0
 #define TCG_TARGET_HAS_extr_i64_i32     1
 #define TCG_TARGET_HAS_ext8s_i64        1
@@ -XXX,XX +XXX,XX @@
 #define TCG_TARGET_HAS_cmpsel_vec       0
 #define TCG_TARGET_HAS_tst_vec          0
 
+#define TCG_TARGET_extract_valid(type, ofs, len)   1
+
+static inline bool
+tcg_target_sextract_valid(TCGType type, unsigned ofs, unsigned len)
+{
+    if (type == TCG_TYPE_I64 && ofs + len == 32) {
+        return true;
+    }
+    return ofs == 0 && (len == 8 || len == 16);
+}
+#define TCG_TARGET_sextract_valid  tcg_target_sextract_valid
 
 #endif
diff --git a/tcg/loongarch64/tcg-target.c.inc b/tcg/loongarch64/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/loongarch64/tcg-target.c.inc
+++ b/tcg/loongarch64/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
         break;
 
     case INDEX_op_extract_i32:
-        tcg_out_opc_bstrpick_w(s, a0, a1, a2, a2 + args[3] - 1);
+        if (a2 == 0 && args[3] <= 12) {
+            tcg_out_opc_andi(s, a0, a1, (1 << args[3]) - 1);
+        } else {
+            tcg_out_opc_bstrpick_w(s, a0, a1, a2, a2 + args[3] - 1);
+        }
         break;
     case INDEX_op_extract_i64:
-        tcg_out_opc_bstrpick_d(s, a0, a1, a2, a2 + args[3] - 1);
+        if (a2 == 0 && args[3] <= 12) {
+            tcg_out_opc_andi(s, a0, a1, (1 << args[3]) - 1);
+        } else {
+            tcg_out_opc_bstrpick_d(s, a0, a1, a2, a2 + args[3] - 1);
+        }
+        break;
+
+    case INDEX_op_sextract_i64:
+        if (a2 + args[3] == 32) {
+            if (a2 == 0) {
+                tcg_out_ext32s(s, a0, a1);
+            } else {
+                tcg_out_opc_srai_w(s, a0, a1, a2);
+            }
+            break;
+        }
+        /* FALLTHRU */
+    case INDEX_op_sextract_i32:
+        if (a2 == 0 && args[3] == 8) {
+            tcg_out_ext8s(s, TCG_TYPE_REG, a0, a1);
+        } else if (a2 == 0 && args[3] == 16) {
+            tcg_out_ext16s(s, TCG_TYPE_REG, a0, a1);
+        } else {
+            g_assert_not_reached();
+        }
         break;
 
     case INDEX_op_deposit_i32:
@@ -XXX,XX +XXX,XX @@ tcg_target_op_def(TCGOpcode op, TCGType type, unsigned flags)
     case INDEX_op_not_i64:
     case INDEX_op_extract_i32:
     case INDEX_op_extract_i64:
+    case INDEX_op_sextract_i32:
+    case INDEX_op_sextract_i64:
     case INDEX_op_bswap16_i32:
     case INDEX_op_bswap16_i64:
     case INDEX_op_bswap32_i32:
-- 
2.43.0

Accept AND, ext32u, ext32s extensions with the extract opcodes.
This is preparatory to removing the specialized extracts.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 tcg/mips/tcg-target-has.h | 26 ++++++++++++++++++++++----
 tcg/mips/tcg-target.c.inc | 33 ++++++++++++++++++++++++++++++---
 2 files changed, 52 insertions(+), 7 deletions(-)

diff --git a/tcg/mips/tcg-target-has.h b/tcg/mips/tcg-target-has.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/mips/tcg-target-has.h
+++ b/tcg/mips/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@ extern bool use_mips32r2_instructions;
 
 /* optional instructions detected at runtime */
 #define TCG_TARGET_HAS_deposit_i32      use_mips32r2_instructions
-#define TCG_TARGET_HAS_extract_i32      use_mips32r2_instructions
-#define TCG_TARGET_HAS_sextract_i32     0
+#define TCG_TARGET_HAS_extract_i32      1
+#define TCG_TARGET_HAS_sextract_i32     1
 #define TCG_TARGET_HAS_extract2_i32     0
 #define TCG_TARGET_HAS_ext8s_i32        use_mips32r2_instructions
 #define TCG_TARGET_HAS_ext16s_i32       use_mips32r2_instructions
@@ -XXX,XX +XXX,XX @@ extern bool use_mips32r2_instructions;
 #define TCG_TARGET_HAS_bswap32_i64      1
 #define TCG_TARGET_HAS_bswap64_i64      1
 #define TCG_TARGET_HAS_deposit_i64      use_mips32r2_instructions
-#define TCG_TARGET_HAS_extract_i64      use_mips32r2_instructions
-#define TCG_TARGET_HAS_sextract_i64     0
+#define TCG_TARGET_HAS_extract_i64      1
+#define TCG_TARGET_HAS_sextract_i64     1
 #define TCG_TARGET_HAS_extract2_i64     0
 #define TCG_TARGET_HAS_ext8s_i64        use_mips32r2_instructions
 #define TCG_TARGET_HAS_ext16s_i64       use_mips32r2_instructions
@@ -XXX,XX +XXX,XX @@ extern bool use_mips32r2_instructions;
 #define TCG_TARGET_HAS_qemu_ldst_i128   0
 #define TCG_TARGET_HAS_tst              0
 
+#define TCG_TARGET_extract_valid(type, ofs, len)  use_mips32r2_instructions
+
+static inline bool
+tcg_target_sextract_valid(TCGType type, unsigned ofs, unsigned len)
+{
+    if (ofs == 0) {
+        switch (len) {
+        case 8:
+        case 16:
+            return use_mips32r2_instructions;
+        case 32:
+            return type == TCG_TYPE_I64;
+        }
+    }
+    return false;
+}
+#define TCG_TARGET_sextract_valid  tcg_target_sextract_valid
+
 #endif
diff --git a/tcg/mips/tcg-target.c.inc b/tcg/mips/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/mips/tcg-target.c.inc
+++ b/tcg/mips/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
         tcg_out_opc_bf64(s, OPC_DINS, OPC_DINSM, OPC_DINSU, a0, a2,
                          args[3] + args[4] - 1, args[3]);
         break;
+
     case INDEX_op_extract_i32:
-        tcg_out_opc_bf(s, OPC_EXT, a0, a1, args[3] - 1, a2);
+        if (a2 == 0 && args[3] <= 16) {
+            tcg_out_opc_imm(s, OPC_ANDI, a0, a1, (1 << args[3]) - 1);
+        } else {
+            tcg_out_opc_bf(s, OPC_EXT, a0, a1, args[3] - 1, a2);
+        }
         break;
     case INDEX_op_extract_i64:
-        tcg_out_opc_bf64(s, OPC_DEXT, OPC_DEXTM, OPC_DEXTU, a0, a1,
-                         args[3] - 1, a2);
+        if (a2 == 0 && args[3] <= 16) {
+            tcg_out_opc_imm(s, OPC_ANDI, a0, a1, (1 << args[3]) - 1);
+        } else {
+            tcg_out_opc_bf64(s, OPC_DEXT, OPC_DEXTM, OPC_DEXTU,
+                             a0, a1, args[3] - 1, a2);
+        }
+        break;
+
+    case INDEX_op_sextract_i64:
+        if (a2 == 0 && args[3] == 32) {
+            tcg_out_ext32s(s, a0, a1);
+            break;
+        }
+        /* FALLTHRU */
+    case INDEX_op_sextract_i32:
+        if (a2 == 0 && args[3] == 8) {
+            tcg_out_ext8s(s, TCG_TYPE_REG, a0, a1);
+        } else if (a2 == 0 && args[3] == 16) {
+            tcg_out_ext16s(s, TCG_TYPE_REG, a0, a1);
+        } else {
+            g_assert_not_reached();
+        }
         break;
 
     case INDEX_op_brcond_i32:
@@ -XXX,XX +XXX,XX @@ tcg_target_op_def(TCGOpcode op, TCGType type, unsigned flags)
     case INDEX_op_ext8s_i32:
     case INDEX_op_ext16s_i32:
     case INDEX_op_extract_i32:
+    case INDEX_op_sextract_i32:
     case INDEX_op_ld8u_i64:
     case INDEX_op_ld8s_i64:
     case INDEX_op_ld16u_i64:
@@ -XXX,XX +XXX,XX @@ tcg_target_op_def(TCGOpcode op, TCGType type, unsigned flags)
     case INDEX_op_extrl_i64_i32:
     case INDEX_op_extrh_i64_i32:
     case INDEX_op_extract_i64:
+    case INDEX_op_sextract_i64:
         return C_O1_I1(r, r);
 
     case INDEX_op_st8_i32:
-- 
2.43.0

Accept byte and word extensions with the extract opcodes.
This is preparatory to removing the specialized extracts.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 tcg/ppc/tcg-target-has.h | 16 ++++++++++++++--
 tcg/ppc/tcg-target.c.inc | 30 ++++++++++++++++++++++++++++++
 2 files changed, 44 insertions(+), 2 deletions(-)

diff --git a/tcg/ppc/tcg-target-has.h b/tcg/ppc/tcg-target-has.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/ppc/tcg-target-has.h
+++ b/tcg/ppc/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@
 #define TCG_TARGET_HAS_ctpop_i32        have_isa_2_06
 #define TCG_TARGET_HAS_deposit_i32      1
 #define TCG_TARGET_HAS_extract_i32      1
-#define TCG_TARGET_HAS_sextract_i32     0
+#define TCG_TARGET_HAS_sextract_i32     1
 #define TCG_TARGET_HAS_extract2_i32     0
 #define TCG_TARGET_HAS_negsetcond_i32   1
 #define TCG_TARGET_HAS_mulu2_i32        0
@@ -XXX,XX +XXX,XX @@
 #define TCG_TARGET_HAS_ctpop_i64        have_isa_2_06
 #define TCG_TARGET_HAS_deposit_i64      1
 #define TCG_TARGET_HAS_extract_i64      1
-#define TCG_TARGET_HAS_sextract_i64     0
+#define TCG_TARGET_HAS_sextract_i64     1
 #define TCG_TARGET_HAS_extract2_i64     0
 #define TCG_TARGET_HAS_negsetcond_i64   1
 #define TCG_TARGET_HAS_add2_i64         1
@@ -XXX,XX +XXX,XX @@
 #define TCG_TARGET_HAS_cmpsel_vec       1
 #define TCG_TARGET_HAS_tst_vec          0
 
+#define TCG_TARGET_extract_valid(type, ofs, len)   1
+
+static inline bool
+tcg_target_sextract_valid(TCGType type, unsigned ofs, unsigned len)
+{
+    if (type == TCG_TYPE_I64 && ofs + len == 32) {
+        return true;
+    }
+    return ofs == 0 && (len == 8 || len == 16);
+}
+#define TCG_TARGET_sextract_valid  tcg_target_sextract_valid
+
 #endif
diff --git a/tcg/ppc/tcg-target.c.inc b/tcg/ppc/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/ppc/tcg-target.c.inc
+++ b/tcg/ppc/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
         break;
 
     case INDEX_op_extract_i32:
+        if (args[2] == 0 && args[3] <= 16) {
+            tcg_out32(s, ANDI | SAI(args[1], args[0], (1 << args[3]) - 1));
+            break;
+        }
         tcg_out_rlw(s, RLWINM, args[0], args[1],
                     32 - args[2], 32 - args[3], 31);
         break;
     case INDEX_op_extract_i64:
+        if (args[2] == 0 && args[3] <= 16) {
+            tcg_out32(s, ANDI | SAI(args[1], args[0], (1 << args[3]) - 1));
+            break;
+        }
         tcg_out_rld(s, RLDICL, args[0], args[1], 64 - args[2], 64 - args[3]);
         break;
 
+    case INDEX_op_sextract_i64:
+        if (args[2] + args[3] == 32) {
+            if (args[2] == 0) {
+                tcg_out_ext32s(s, args[0], args[1]);
+            } else {
+                tcg_out_sari32(s, args[0], args[1], args[2]);
+            }
+            break;
+        }
+        /* FALLTHRU */
+    case INDEX_op_sextract_i32:
+        if (args[2] == 0 && args[3] == 8) {
+            tcg_out_ext8s(s, TCG_TYPE_I32, args[0], args[1]);
+        } else if (args[2] == 0 && args[3] == 16) {
+            tcg_out_ext16s(s, TCG_TYPE_I32, args[0], args[1]);
+        } else {
+            g_assert_not_reached();
+        }
+        break;
+
     case INDEX_op_movcond_i32:
         tcg_out_movcond(s, TCG_TYPE_I32, args[5], args[0], args[1], args[2],
                         args[3], args[4], const_args[2]);
@@ -XXX,XX +XXX,XX @@ tcg_target_op_def(TCGOpcode op, TCGType type, unsigned flags)
     case INDEX_op_bswap16_i32:
     case INDEX_op_bswap32_i32:
     case INDEX_op_extract_i32:
+    case INDEX_op_sextract_i32:
     case INDEX_op_ld8u_i64:
     case INDEX_op_ld8s_i64:
     case INDEX_op_ld16u_i64:
@@ -XXX,XX +XXX,XX @@ tcg_target_op_def(TCGOpcode op, TCGType type, unsigned flags)
     case INDEX_op_bswap32_i64:
     case INDEX_op_bswap64_i64:
     case INDEX_op_extract_i64:
+    case INDEX_op_sextract_i64:
         return C_O1_I1(r, r);
 
     case INDEX_op_st8_i32:
-- 
2.43.0

Accept byte and word extensions with the extract opcodes.
This is preparatory to removing the specialized extracts.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 tcg/riscv/tcg-target-has.h | 39 ++++++++++++++++++++++++++++++++++----
 tcg/riscv/tcg-target.c.inc | 34 +++++++++++++++++++++++++++++++++
 2 files changed, 69 insertions(+), 4 deletions(-)

diff --git a/tcg/riscv/tcg-target-has.h b/tcg/riscv/tcg-target-has.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/riscv/tcg-target-has.h
+++ b/tcg/riscv/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@
 #define TCG_TARGET_HAS_div2_i32         0
 #define TCG_TARGET_HAS_rot_i32          (cpuinfo & CPUINFO_ZBB)
 #define TCG_TARGET_HAS_deposit_i32      0
-#define TCG_TARGET_HAS_extract_i32      0
-#define TCG_TARGET_HAS_sextract_i32     0
+#define TCG_TARGET_HAS_extract_i32      1
+#define TCG_TARGET_HAS_sextract_i32     1
 #define TCG_TARGET_HAS_extract2_i32     0
 #define TCG_TARGET_HAS_add2_i32         1
 #define TCG_TARGET_HAS_sub2_i32         1
@@ -XXX,XX +XXX,XX @@
 #define TCG_TARGET_HAS_div2_i64         0
 #define TCG_TARGET_HAS_rot_i64          (cpuinfo & CPUINFO_ZBB)
 #define TCG_TARGET_HAS_deposit_i64      0
-#define TCG_TARGET_HAS_extract_i64      0
-#define TCG_TARGET_HAS_sextract_i64     0
+#define TCG_TARGET_HAS_extract_i64      1
+#define TCG_TARGET_HAS_sextract_i64     1
 #define TCG_TARGET_HAS_extract2_i64     0
 #define TCG_TARGET_HAS_extr_i64_i32     1
 #define TCG_TARGET_HAS_ext8s_i64        1
@@ -XXX,XX +XXX,XX @@
 
 #define TCG_TARGET_HAS_tst_vec          0
 
+static inline bool
+tcg_target_extract_valid(TCGType type, unsigned ofs, unsigned len)
+{
+    if (ofs == 0) {
+        switch (len) {
+        case 16:
+            return cpuinfo & CPUINFO_ZBB;
+        case 32:
+            return (cpuinfo & CPUINFO_ZBA) && type == TCG_TYPE_I64;
+        }
+    }
+    return false;
+}
+#define TCG_TARGET_extract_valid  tcg_target_extract_valid
+
+static inline bool
+tcg_target_sextract_valid(TCGType type, unsigned ofs, unsigned len)
+{
+    if (ofs == 0) {
+        switch (len) {
+        case 8:
+        case 16:
+            return cpuinfo & CPUINFO_ZBB;
+        case 32:
+            return type == TCG_TYPE_I64;
+        }
+    }
+    return false;
+}
+#define TCG_TARGET_sextract_valid  tcg_target_sextract_valid
+
 #endif
diff --git a/tcg/riscv/tcg-target.c.inc b/tcg/riscv/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/riscv/tcg-target.c.inc
+++ b/tcg/riscv/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
         tcg_out_mb(s, a0);
         break;
 
+    case INDEX_op_extract_i64:
+        if (a2 == 0 && args[3] == 32) {
+            tcg_out_ext32u(s, a0, a1);
+            break;
+        }
+        /* FALLTHRU */
+    case INDEX_op_extract_i32:
+        if (a2 == 0 && args[3] == 16) {
+            tcg_out_ext16u(s, a0, a1);
+        } else {
+            g_assert_not_reached();
+        }
+        break;
+
+    case INDEX_op_sextract_i64:
+        if (a2 == 0 && args[3] == 32) {
+            tcg_out_ext32s(s, a0, a1);
+            break;
+        }
+        /* FALLTHRU */
+    case INDEX_op_sextract_i32:
+        if (a2 == 0 && args[3] == 8) {
+            tcg_out_ext8s(s, TCG_TYPE_REG, a0, a1);
+        } else if (a2 == 0 && args[3] == 16) {
+            tcg_out_ext16s(s, TCG_TYPE_REG, a0, a1);
+        } else {
+            g_assert_not_reached();
+        }
+        break;
+
     case INDEX_op_mov_i32:  /* Always emitted via tcg_out_mov.  */
     case INDEX_op_mov_i64:
     case INDEX_op_call:     /* Always emitted via tcg_out_call.  */
@@ -XXX,XX +XXX,XX @@ tcg_target_op_def(TCGOpcode op, TCGType type, unsigned flags)
     case INDEX_op_extrl_i64_i32:
     case INDEX_op_extrh_i64_i32:
     case INDEX_op_ext_i32_i64:
+    case INDEX_op_extract_i32:
+    case INDEX_op_extract_i64:
+    case INDEX_op_sextract_i32:
+    case INDEX_op_sextract_i64:
     case INDEX_op_bswap16_i32:
     case INDEX_op_bswap32_i32:
     case INDEX_op_bswap16_i64:
-- 
2.43.0

Extracts which abut bit 32 may use 32-bit shifts.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 tcg/riscv/tcg-target-has.h | 24 +++++++-----------------
 tcg/riscv/tcg-target.c.inc | 16 ++++++++++++----
 2 files changed, 19 insertions(+), 21 deletions(-)

diff --git a/tcg/riscv/tcg-target-has.h b/tcg/riscv/tcg-target-has.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/riscv/tcg-target-has.h
+++ b/tcg/riscv/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@
 static inline bool
 tcg_target_extract_valid(TCGType type, unsigned ofs, unsigned len)
 {
-    if (ofs == 0) {
-        switch (len) {
-        case 16:
-            return cpuinfo & CPUINFO_ZBB;
-        case 32:
-            return (cpuinfo & CPUINFO_ZBA) && type == TCG_TYPE_I64;
-        }
+    if (type == TCG_TYPE_I64 && ofs + len == 32) {
+        /* ofs > 0 uses SRLIW; ofs == 0 uses add.uw. */
+        return ofs || (cpuinfo & CPUINFO_ZBA);
     }
-    return false;
+    return (cpuinfo & CPUINFO_ZBB) && ofs == 0 && len == 16;
 }
 #define TCG_TARGET_extract_valid  tcg_target_extract_valid
 
 static inline bool
 tcg_target_sextract_valid(TCGType type, unsigned ofs, unsigned len)
 {
-    if (ofs == 0) {
-        switch (len) {
-        case 8:
-        case 16:
-            return cpuinfo & CPUINFO_ZBB;
-        case 32:
-            return type == TCG_TYPE_I64;
-        }
+    if (type == TCG_TYPE_I64 && ofs + len == 32) {
+        return true;
     }
-    return false;
+    return (cpuinfo & CPUINFO_ZBB) && ofs == 0 && (len == 8 || len == 16);
 }
 #define TCG_TARGET_sextract_valid  tcg_target_sextract_valid
 
diff --git a/tcg/riscv/tcg-target.c.inc b/tcg/riscv/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/riscv/tcg-target.c.inc
+++ b/tcg/riscv/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
         break;
 
     case INDEX_op_extract_i64:
-        if (a2 == 0 && args[3] == 32) {
-            tcg_out_ext32u(s, a0, a1);
+        if (a2 + args[3] == 32) {
+            if (a2 == 0) {
+                tcg_out_ext32u(s, a0, a1);
+            } else {
+                tcg_out_opc_imm(s, OPC_SRLIW, a0, a1, a2);
+            }
             break;
         }
         /* FALLTHRU */
@@ -XXX,XX +XXX,XX @@ static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
         break;
 
     case INDEX_op_sextract_i64:
-        if (a2 == 0 && args[3] == 32) {
-            tcg_out_ext32s(s, a0, a1);
+        if (a2 + args[3] == 32) {
+            if (a2 == 0) {
+                tcg_out_ext32s(s, a0, a1);
+            } else {
+                tcg_out_opc_imm(s, OPC_SRAIW, a0, a1, a2);
+            }
             break;
         }
         /* FALLTHRU */
-- 
2.43.0

Accept byte and word extensions with the extract opcodes.
This is preparatory to removing the specialized extracts.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 tcg/s390x/tcg-target-has.h | 22 ++++++++++++++++++++--
 tcg/s390x/tcg-target.c.inc | 37 +++++++++++++++++++++++++++++++++++++
 2 files changed, 57 insertions(+), 2 deletions(-)

diff --git a/tcg/s390x/tcg-target-has.h b/tcg/s390x/tcg-target-has.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/s390x/tcg-target-has.h
+++ b/tcg/s390x/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@ extern uint64_t s390_facilities[3];
 #define TCG_TARGET_HAS_ctpop_i32      1
 #define TCG_TARGET_HAS_deposit_i32    1
 #define TCG_TARGET_HAS_extract_i32    1
-#define TCG_TARGET_HAS_sextract_i32   0
+#define TCG_TARGET_HAS_sextract_i32   1
 #define TCG_TARGET_HAS_extract2_i32   0
 #define TCG_TARGET_HAS_negsetcond_i32 1
 #define TCG_TARGET_HAS_add2_i32       1
@@ -XXX,XX +XXX,XX @@ extern uint64_t s390_facilities[3];
 #define TCG_TARGET_HAS_ctpop_i64      1
 #define TCG_TARGET_HAS_deposit_i64    1
 #define TCG_TARGET_HAS_extract_i64    1
-#define TCG_TARGET_HAS_sextract_i64   0
+#define TCG_TARGET_HAS_sextract_i64   1
 #define TCG_TARGET_HAS_extract2_i64   0
 #define TCG_TARGET_HAS_negsetcond_i64 1
 #define TCG_TARGET_HAS_add2_i64       1
@@ -XXX,XX +XXX,XX @@ extern uint64_t s390_facilities[3];
 #define TCG_TARGET_HAS_cmpsel_vec     1
 #define TCG_TARGET_HAS_tst_vec        0
 
+#define TCG_TARGET_extract_valid(type, ofs, len)   1
+
+static inline bool
+tcg_target_sextract_valid(TCGType type, unsigned ofs, unsigned len)
+{
+    if (ofs == 0) {
+        switch (len) {
+        case 8:
+        case 16:
+            return true;
+        case 32:
+            return type == TCG_TYPE_I64;
+        }
+    }
+    return false;
+}
+#define TCG_TARGET_sextract_valid  tcg_target_sextract_valid
+
 #endif
diff --git a/tcg/s390x/tcg-target.c.inc b/tcg/s390x/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/s390x/tcg-target.c.inc
+++ b/tcg/s390x/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static void tgen_deposit(TCGContext *s, TCGReg dest, TCGReg src,
 static void tgen_extract(TCGContext *s, TCGReg dest, TCGReg src,
                          int ofs, int len)
 {
+    if (ofs == 0) {
+        switch (len) {
+        case 8:
+            tcg_out_ext8u(s, dest, src);
+            return;
+        case 16:
+            tcg_out_ext16u(s, dest, src);
+            return;
+        case 32:
+            tcg_out_ext32u(s, dest, src);
+            return;
+        }
+    }
     tcg_out_risbg(s, dest, src, 64 - len, 63, 64 - ofs, 1);
 }
 
+static void tgen_sextract(TCGContext *s, TCGReg dest, TCGReg src,
+                          int ofs, int len)
+{
+    if (ofs == 0) {
+        switch (len) {
+        case 8:
+            tcg_out_ext8s(s, TCG_TYPE_REG, dest, src);
+            return;
+        case 16:
+            tcg_out_ext16s(s, TCG_TYPE_REG, dest, src);
+            return;
+        case 32:
+            tcg_out_ext32s(s, dest, src);
+            return;
+        }
+    }
+    g_assert_not_reached();
+}
+
 static void tgen_gotoi(TCGContext *s, int cc, const tcg_insn_unit *dest)
 {
     ptrdiff_t off = tcg_pcrel_diff(s, dest) >> 1;
@@ -XXX,XX +XXX,XX @@ static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
     OP_32_64(extract):
         tgen_extract(s, args[0], args[1], args[2], args[3]);
         break;
+    OP_32_64(sextract):
+        tgen_sextract(s, args[0], args[1], args[2], args[3]);
+        break;
 
     case INDEX_op_clz_i64:
         tgen_clz(s, args[0], args[1], args[2], const_args[2]);
@@ -XXX,XX +XXX,XX @@ tcg_target_op_def(TCGOpcode op, TCGType type, unsigned flags)
     case INDEX_op_extu_i32_i64:
     case INDEX_op_extract_i32:
     case INDEX_op_extract_i64:
+    case INDEX_op_sextract_i32:
+    case INDEX_op_sextract_i64:
     case INDEX_op_ctpop_i32:
     case INDEX_op_ctpop_i64:
         return C_O1_I1(r, r);
-- 
2.43.0

Extracts which abut bit 32 may use 32-bit shifts.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 tcg/sparc64/tcg-target-has.h | 13 +++++++++----
 tcg/sparc64/tcg-target.c.inc | 11 +++++++++++
 2 files changed, 20 insertions(+), 4 deletions(-)

diff --git a/tcg/sparc64/tcg-target-has.h b/tcg/sparc64/tcg-target-has.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/sparc64/tcg-target-has.h
+++ b/tcg/sparc64/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@ extern bool use_vis3_instructions;
 #define TCG_TARGET_HAS_ctz_i32          0
 #define TCG_TARGET_HAS_ctpop_i32        0
 #define TCG_TARGET_HAS_deposit_i32      0
-#define TCG_TARGET_HAS_extract_i32      0
-#define TCG_TARGET_HAS_sextract_i32     0
+#define TCG_TARGET_HAS_extract_i32      1
+#define TCG_TARGET_HAS_sextract_i32     1
 #define TCG_TARGET_HAS_extract2_i32     0
 #define TCG_TARGET_HAS_negsetcond_i32   1
 #define TCG_TARGET_HAS_add2_i32         1
@@ -XXX,XX +XXX,XX @@ extern bool use_vis3_instructions;
 #define TCG_TARGET_HAS_ctz_i64          0
 #define TCG_TARGET_HAS_ctpop_i64        0
 #define TCG_TARGET_HAS_deposit_i64      0
-#define TCG_TARGET_HAS_extract_i64      0
-#define TCG_TARGET_HAS_sextract_i64     0
+#define TCG_TARGET_HAS_extract_i64      1
+#define TCG_TARGET_HAS_sextract_i64     1
 #define TCG_TARGET_HAS_extract2_i64     0
 #define TCG_TARGET_HAS_negsetcond_i64   1
 #define TCG_TARGET_HAS_add2_i64         1
@@ -XXX,XX +XXX,XX @@ extern bool use_vis3_instructions;
 
 #define TCG_TARGET_HAS_tst              1
 
+#define TCG_TARGET_extract_valid(type, ofs, len) \
+    ((type) == TCG_TYPE_I64 && (ofs) + (len) == 32)
+
+#define TCG_TARGET_sextract_valid  TCG_TARGET_extract_valid
+
 #endif
diff --git a/tcg/sparc64/tcg-target.c.inc b/tcg/sparc64/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/sparc64/tcg-target.c.inc
+++ b/tcg/sparc64/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
         tcg_out_mb(s, a0);
         break;
 
+    case INDEX_op_extract_i64:
+        tcg_debug_assert(a2 + args[3] == 32);
+        tcg_out_arithi(s, a0, a1, a2, SHIFT_SRL);
+        break;
+    case INDEX_op_sextract_i64:
+        tcg_debug_assert(a2 + args[3] == 32);
+        tcg_out_arithi(s, a0, a1, a2, SHIFT_SRA);
+        break;
+
     case INDEX_op_mov_i32:  /* Always emitted via tcg_out_mov.  */
     case INDEX_op_mov_i64:
     case INDEX_op_call:     /* Always emitted via tcg_out_call.  */
@@ -XXX,XX +XXX,XX @@ tcg_target_op_def(TCGOpcode op, TCGType type, unsigned flags)
     case INDEX_op_ext32u_i64:
     case INDEX_op_ext_i32_i64:
     case INDEX_op_extu_i32_i64:
+    case INDEX_op_extract_i64:
+    case INDEX_op_sextract_i64:
     case INDEX_op_qemu_ld_a32_i32:
     case INDEX_op_qemu_ld_a64_i32:
     case INDEX_op_qemu_ld_a32_i64:
-- 
2.43.0

We already have these assertions during opcode creation.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 tcg/tci/tcg-target.c.inc | 20 ++------------------
 1 file changed, 2 insertions(+), 18 deletions(-)

diff --git a/tcg/tci/tcg-target.c.inc b/tcg/tci/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tci/tcg-target.c.inc
+++ b/tcg/tci/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
         break;
 
     CASE_32_64(deposit)  /* Optional (TCG_TARGET_HAS_deposit_*). */
-        {
-            TCGArg pos = args[3], len = args[4];
-            TCGArg max = opc == INDEX_op_deposit_i32 ? 32 : 64;
-
-            tcg_debug_assert(pos < max);
-            tcg_debug_assert(pos + len <= max);
-
-            tcg_out_op_rrrbb(s, opc, args[0], args[1], args[2], pos, len);
-        }
+        tcg_out_op_rrrbb(s, opc, args[0], args[1], args[2], args[3], args[4]);
         break;
 
     CASE_32_64(extract)  /* Optional (TCG_TARGET_HAS_extract_*). */
     CASE_32_64(sextract) /* Optional (TCG_TARGET_HAS_sextract_*). */
-        {
-            TCGArg pos = args[2], len = args[3];
-            TCGArg max = type == TCG_TYPE_I32 ? 32 : 64;
-
-            tcg_debug_assert(pos < max);
-            tcg_debug_assert(pos + len <= max);
-
-            tcg_out_op_rrbb(s, opc, args[0], args[1], pos, len);
-        }
+        tcg_out_op_rrbb(s, opc, args[0], args[1], args[2], args[3]);
         break;
 
     CASE_32_64(brcond)
-- 
2.43.0

Make extract and sextract "unconditional" in the sense
that the opcodes are always present.  Rely instead on
TCG_TARGET_HAS_{s}extract_valid, now always defined.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 tcg/aarch64/tcg-target-has.h     |  4 ----
 tcg/arm/tcg-target-has.h         |  2 --
 tcg/i386/tcg-target-has.h        |  4 ----
 tcg/loongarch64/tcg-target-has.h |  4 ----
 tcg/mips/tcg-target-has.h        |  4 ----
 tcg/ppc/tcg-target-has.h         |  4 ----
 tcg/riscv/tcg-target-has.h       |  4 ----
 tcg/s390x/tcg-target-has.h       |  4 ----
 tcg/sparc64/tcg-target-has.h     |  4 ----
 tcg/tcg-has.h                    | 12 ------------
 tcg/tci/tcg-target-has.h         |  4 ----
 tcg/optimize.c                   |  8 ++++----
 tcg/tcg.c                        | 12 ++++--------
 tcg/tci.c                        |  8 --------
 14 files changed, 8 insertions(+), 70 deletions(-)

diff --git a/tcg/aarch64/tcg-target-has.h b/tcg/aarch64/tcg-target-has.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/aarch64/tcg-target-has.h
+++ b/tcg/aarch64/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@
 #define TCG_TARGET_HAS_ctz_i32          1
 #define TCG_TARGET_HAS_ctpop_i32        0
 #define TCG_TARGET_HAS_deposit_i32      1
-#define TCG_TARGET_HAS_extract_i32      1
-#define TCG_TARGET_HAS_sextract_i32     1
 #define TCG_TARGET_HAS_extract2_i32     1
 #define TCG_TARGET_HAS_negsetcond_i32   1
 #define TCG_TARGET_HAS_add2_i32         1
@@ -XXX,XX +XXX,XX @@
 #define TCG_TARGET_HAS_ctz_i64          1
 #define TCG_TARGET_HAS_ctpop_i64        0
 #define TCG_TARGET_HAS_deposit_i64      1
-#define TCG_TARGET_HAS_extract_i64      1
-#define TCG_TARGET_HAS_sextract_i64     1
 #define TCG_TARGET_HAS_extract2_i64     1
 #define TCG_TARGET_HAS_negsetcond_i64   1
 #define TCG_TARGET_HAS_add2_i64         1
diff --git a/tcg/arm/tcg-target-has.h b/tcg/arm/tcg-target-has.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/arm/tcg-target-has.h
+++ b/tcg/arm/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@ extern bool use_neon_instructions;
 #define TCG_TARGET_HAS_ctz_i32          use_armv7_instructions
 #define TCG_TARGET_HAS_ctpop_i32        0
 #define TCG_TARGET_HAS_deposit_i32      use_armv7_instructions
-#define TCG_TARGET_HAS_extract_i32      1
-#define TCG_TARGET_HAS_sextract_i32     1
 #define TCG_TARGET_HAS_extract2_i32     1
 #define TCG_TARGET_HAS_negsetcond_i32   1
 #define TCG_TARGET_HAS_mulu2_i32        1
diff --git a/tcg/i386/tcg-target-has.h b/tcg/i386/tcg-target-has.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/i386/tcg-target-has.h
+++ b/tcg/i386/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@
 #define TCG_TARGET_HAS_ctz_i32          1
 #define TCG_TARGET_HAS_ctpop_i32        have_popcnt
 #define TCG_TARGET_HAS_deposit_i32      1
-#define TCG_TARGET_HAS_extract_i32      1
-#define TCG_TARGET_HAS_sextract_i32     1
 #define TCG_TARGET_HAS_extract2_i32     1
 #define TCG_TARGET_HAS_negsetcond_i32   1
 #define TCG_TARGET_HAS_add2_i32         1
@@ -XXX,XX +XXX,XX @@
 #define TCG_TARGET_HAS_ctz_i64          1
 #define TCG_TARGET_HAS_ctpop_i64        have_popcnt
 #define TCG_TARGET_HAS_deposit_i64      1
-#define TCG_TARGET_HAS_extract_i64      1
-#define TCG_TARGET_HAS_sextract_i64     1
 #define TCG_TARGET_HAS_extract2_i64     1
 #define TCG_TARGET_HAS_negsetcond_i64   1
 #define TCG_TARGET_HAS_add2_i64         1
diff --git a/tcg/loongarch64/tcg-target-has.h b/tcg/loongarch64/tcg-target-has.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/loongarch64/tcg-target-has.h
+++ b/tcg/loongarch64/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@
 #define TCG_TARGET_HAS_div2_i32         0
 #define TCG_TARGET_HAS_rot_i32          1
 #define TCG_TARGET_HAS_deposit_i32      1
-#define TCG_TARGET_HAS_extract_i32      1
-#define TCG_TARGET_HAS_sextract_i32     1
 #define TCG_TARGET_HAS_extract2_i32     0
 #define TCG_TARGET_HAS_add2_i32         0
 #define TCG_TARGET_HAS_sub2_i32         0
@@ -XXX,XX +XXX,XX @@
 #define TCG_TARGET_HAS_div2_i64         0
 #define TCG_TARGET_HAS_rot_i64          1
 #define TCG_TARGET_HAS_deposit_i64      1
-#define TCG_TARGET_HAS_extract_i64      1
-#define TCG_TARGET_HAS_sextract_i64     1
 #define TCG_TARGET_HAS_extract2_i64     0
 #define TCG_TARGET_HAS_extr_i64_i32     1
 #define TCG_TARGET_HAS_ext8s_i64        1
diff --git a/tcg/mips/tcg-target-has.h b/tcg/mips/tcg-target-has.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/mips/tcg-target-has.h
+++ b/tcg/mips/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@ extern bool use_mips32r2_instructions;
 
 /* optional instructions detected at runtime */
 #define TCG_TARGET_HAS_deposit_i32      use_mips32r2_instructions
-#define TCG_TARGET_HAS_extract_i32      1
-#define TCG_TARGET_HAS_sextract_i32     1
 #define TCG_TARGET_HAS_extract2_i32     0
 #define TCG_TARGET_HAS_ext8s_i32        use_mips32r2_instructions
 #define TCG_TARGET_HAS_ext16s_i32       use_mips32r2_instructions
@@ -XXX,XX +XXX,XX @@ extern bool use_mips32r2_instructions;
 #define TCG_TARGET_HAS_bswap32_i64      1
 #define TCG_TARGET_HAS_bswap64_i64      1
 #define TCG_TARGET_HAS_deposit_i64      use_mips32r2_instructions
-#define TCG_TARGET_HAS_extract_i64      1
-#define TCG_TARGET_HAS_sextract_i64     1
 #define TCG_TARGET_HAS_extract2_i64     0
 #define TCG_TARGET_HAS_ext8s_i64        use_mips32r2_instructions
 #define TCG_TARGET_HAS_ext16s_i64       use_mips32r2_instructions
diff --git a/tcg/ppc/tcg-target-has.h b/tcg/ppc/tcg-target-has.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/ppc/tcg-target-has.h
+++ b/tcg/ppc/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@
 #define TCG_TARGET_HAS_ctz_i32          have_isa_3_00
 #define TCG_TARGET_HAS_ctpop_i32        have_isa_2_06
 #define TCG_TARGET_HAS_deposit_i32      1
-#define TCG_TARGET_HAS_extract_i32      1
-#define TCG_TARGET_HAS_sextract_i32     1
 #define TCG_TARGET_HAS_extract2_i32     0
 #define TCG_TARGET_HAS_negsetcond_i32   1
 #define TCG_TARGET_HAS_mulu2_i32        0
@@ -XXX,XX +XXX,XX @@
 #define TCG_TARGET_HAS_ctz_i64          have_isa_3_00
 #define TCG_TARGET_HAS_ctpop_i64        have_isa_2_06
 #define TCG_TARGET_HAS_deposit_i64      1
-#define TCG_TARGET_HAS_extract_i64      1
-#define TCG_TARGET_HAS_sextract_i64     1
 #define TCG_TARGET_HAS_extract2_i64     0
 #define TCG_TARGET_HAS_negsetcond_i64   1
 #define TCG_TARGET_HAS_add2_i64         1
diff --git a/tcg/riscv/tcg-target-has.h b/tcg/riscv/tcg-target-has.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/riscv/tcg-target-has.h
+++ b/tcg/riscv/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@
 #define TCG_TARGET_HAS_div2_i32         0
 #define TCG_TARGET_HAS_rot_i32          (cpuinfo & CPUINFO_ZBB)
 #define TCG_TARGET_HAS_deposit_i32      0
-#define TCG_TARGET_HAS_extract_i32      1
-#define TCG_TARGET_HAS_sextract_i32     1
 #define TCG_TARGET_HAS_extract2_i32     0
 #define TCG_TARGET_HAS_add2_i32         1
 #define TCG_TARGET_HAS_sub2_i32         1
@@ -XXX,XX +XXX,XX @@
 #define TCG_TARGET_HAS_div2_i64         0
 #define TCG_TARGET_HAS_rot_i64          (cpuinfo & CPUINFO_ZBB)
 #define TCG_TARGET_HAS_deposit_i64      0
-#define TCG_TARGET_HAS_extract_i64      1
-#define TCG_TARGET_HAS_sextract_i64     1
 #define TCG_TARGET_HAS_extract2_i64     0
 #define TCG_TARGET_HAS_extr_i64_i32     1
 #define TCG_TARGET_HAS_ext8s_i64        1
diff --git a/tcg/s390x/tcg-target-has.h b/tcg/s390x/tcg-target-has.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/s390x/tcg-target-has.h
+++ b/tcg/s390x/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@ extern uint64_t s390_facilities[3];
 #define TCG_TARGET_HAS_ctz_i32        0
 #define TCG_TARGET_HAS_ctpop_i32      1
 #define TCG_TARGET_HAS_deposit_i32    1
-#define TCG_TARGET_HAS_extract_i32    1
-#define TCG_TARGET_HAS_sextract_i32   1
 #define TCG_TARGET_HAS_extract2_i32   0
 #define TCG_TARGET_HAS_negsetcond_i32 1
 #define TCG_TARGET_HAS_add2_i32       1
@@ -XXX,XX +XXX,XX @@ extern uint64_t s390_facilities[3];
 #define TCG_TARGET_HAS_ctz_i64        0
 #define TCG_TARGET_HAS_ctpop_i64      1
 #define TCG_TARGET_HAS_deposit_i64    1
-#define TCG_TARGET_HAS_extract_i64    1
-#define TCG_TARGET_HAS_sextract_i64   1
 #define TCG_TARGET_HAS_extract2_i64   0
 #define TCG_TARGET_HAS_negsetcond_i64 1
 #define TCG_TARGET_HAS_add2_i64       1
diff --git a/tcg/sparc64/tcg-target-has.h b/tcg/sparc64/tcg-target-has.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/sparc64/tcg-target-has.h
+++ b/tcg/sparc64/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@ extern bool use_vis3_instructions;
 #define TCG_TARGET_HAS_ctz_i32          0
 #define TCG_TARGET_HAS_ctpop_i32        0
 #define TCG_TARGET_HAS_deposit_i32      0
-#define TCG_TARGET_HAS_extract_i32      1
-#define TCG_TARGET_HAS_sextract_i32     1
 #define TCG_TARGET_HAS_extract2_i32     0
 #define TCG_TARGET_HAS_negsetcond_i32   1
 #define TCG_TARGET_HAS_add2_i32         1
@@ -XXX,XX +XXX,XX @@ extern bool use_vis3_instructions;
 #define TCG_TARGET_HAS_ctz_i64          0
 #define TCG_TARGET_HAS_ctpop_i64        0
 #define TCG_TARGET_HAS_deposit_i64      0
-#define TCG_TARGET_HAS_extract_i64      1
-#define TCG_TARGET_HAS_sextract_i64     1
 #define TCG_TARGET_HAS_extract2_i64     0
 #define TCG_TARGET_HAS_negsetcond_i64   1
 #define TCG_TARGET_HAS_add2_i64         1
diff --git a/tcg/tcg-has.h b/tcg/tcg-has.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg-has.h
+++ b/tcg/tcg-has.h
@@ -XXX,XX +XXX,XX @@
 #define TCG_TARGET_HAS_ctz_i64          0
 #define TCG_TARGET_HAS_ctpop_i64        0
 #define TCG_TARGET_HAS_deposit_i64      0
-#define TCG_TARGET_HAS_extract_i64      0
-#define TCG_TARGET_HAS_sextract_i64     0
 #define TCG_TARGET_HAS_extract2_i64     0
 #define TCG_TARGET_HAS_negsetcond_i64   0
 #define TCG_TARGET_HAS_add2_i64         0
@@ -XXX,XX +XXX,XX @@
 #ifndef TCG_TARGET_deposit_i64_valid
 #define TCG_TARGET_deposit_i64_valid(ofs, len) 1
 #endif
-#ifndef TCG_TARGET_extract_valid
-#define TCG_TARGET_extract_valid(type, ofs, len) \
-    ((type) == TCG_TYPE_I32 ? TCG_TARGET_HAS_extract_i32 \
-     : TCG_TARGET_HAS_extract_i64)
-#endif
-#ifndef TCG_TARGET_sextract_valid
-#define TCG_TARGET_sextract_valid(type, ofs, len) \
-    ((type) == TCG_TYPE_I32 ? TCG_TARGET_HAS_sextract_i32 \
-     : TCG_TARGET_HAS_sextract_i64)
-#endif
 
 /* Only one of DIV or DIV2 should be defined.  */
 #if defined(TCG_TARGET_HAS_div_i32)
diff --git a/tcg/tci/tcg-target-has.h b/tcg/tci/tcg-target-has.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tci/tcg-target-has.h
+++ b/tcg/tci/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@
 #define TCG_TARGET_HAS_ext16u_i32       1
 #define TCG_TARGET_HAS_andc_i32         1
 #define TCG_TARGET_HAS_deposit_i32      1
-#define TCG_TARGET_HAS_extract_i32      1
-#define TCG_TARGET_HAS_sextract_i32     1
 #define TCG_TARGET_HAS_extract2_i32     0
 #define TCG_TARGET_HAS_eqv_i32          1
 #define TCG_TARGET_HAS_nand_i32         1
@@ -XXX,XX +XXX,XX @@
 #define TCG_TARGET_HAS_bswap32_i64      1
 #define TCG_TARGET_HAS_bswap64_i64      1
 #define TCG_TARGET_HAS_deposit_i64      1
-#define TCG_TARGET_HAS_extract_i64      1
-#define TCG_TARGET_HAS_sextract_i64     1
 #define TCG_TARGET_HAS_extract2_i64     0
 #define TCG_TARGET_HAS_div_i64          1
 #define TCG_TARGET_HAS_rem_i64          1
diff --git a/tcg/optimize.c b/tcg/optimize.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/optimize.c
+++ b/tcg/optimize.c
@@ -XXX,XX +XXX,XX @@ static void fold_setcond_tst_pow2(OptContext *ctx, TCGOp *op, bool neg)
         shr_opc = INDEX_op_shr_i32;
         neg_opc = INDEX_op_neg_i32;
         if (TCG_TARGET_extract_valid(TCG_TYPE_I32, sh, 1)) {
-            uext_opc = TCG_TARGET_HAS_extract_i32 ? INDEX_op_extract_i32 : 0;
+            uext_opc = INDEX_op_extract_i32;
         }
         if (TCG_TARGET_sextract_valid(TCG_TYPE_I32, sh, 1)) {
-            sext_opc = TCG_TARGET_HAS_sextract_i32 ? INDEX_op_sextract_i32 : 0;
+            sext_opc = INDEX_op_sextract_i32;
         }
         break;
     case TCG_TYPE_I64:
@@ -XXX,XX +XXX,XX @@ static void fold_setcond_tst_pow2(OptContext *ctx, TCGOp *op, bool neg)
         shr_opc = INDEX_op_shr_i64;
         neg_opc = INDEX_op_neg_i64;
         if (TCG_TARGET_extract_valid(TCG_TYPE_I64, sh, 1)) {
-            uext_opc = TCG_TARGET_HAS_extract_i64 ? INDEX_op_extract_i64 : 0;
+            uext_opc = INDEX_op_extract_i64;
         }
         if (TCG_TARGET_sextract_valid(TCG_TYPE_I64, sh, 1)) {
-            sext_opc = TCG_TARGET_HAS_sextract_i64 ? INDEX_op_sextract_i64 : 0;
+            sext_opc = INDEX_op_sextract_i64;
         }
         break;
     default:
diff --git a/tcg/tcg.c b/tcg/tcg.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg.c
+++ b/tcg/tcg.c
@@ -XXX,XX +XXX,XX @@ bool tcg_op_supported(TCGOpcode op, TCGType type, unsigned flags)
     case INDEX_op_shl_i32:
     case INDEX_op_shr_i32:
     case INDEX_op_sar_i32:
+    case INDEX_op_extract_i32:
+    case INDEX_op_sextract_i32:
         return true;
 
     case INDEX_op_negsetcond_i32:
@@ -XXX,XX +XXX,XX @@ bool tcg_op_supported(TCGOpcode op, TCGType type, unsigned flags)
         return TCG_TARGET_HAS_rot_i32;
     case INDEX_op_deposit_i32:
         return TCG_TARGET_HAS_deposit_i32;
-    case INDEX_op_extract_i32:
-        return TCG_TARGET_HAS_extract_i32;
-    case INDEX_op_sextract_i32:
-        return TCG_TARGET_HAS_sextract_i32;
     case INDEX_op_extract2_i32:
         return TCG_TARGET_HAS_extract2_i32;
     case INDEX_op_add2_i32:
@@ -XXX,XX +XXX,XX @@ bool tcg_op_supported(TCGOpcode op, TCGType type, unsigned flags)
     case INDEX_op_sar_i64:
     case INDEX_op_ext_i32_i64:
     case INDEX_op_extu_i32_i64:
+    case INDEX_op_extract_i64:
+    case INDEX_op_sextract_i64:
         return TCG_TARGET_REG_BITS == 64;
 
     case INDEX_op_negsetcond_i64:
@@ -XXX,XX +XXX,XX @@ bool tcg_op_supported(TCGOpcode op, TCGType type, unsigned flags)
         return TCG_TARGET_HAS_rot_i64;
     case INDEX_op_deposit_i64:
         return TCG_TARGET_HAS_deposit_i64;
-    case INDEX_op_extract_i64:
-        return TCG_TARGET_HAS_extract_i64;
-    case INDEX_op_sextract_i64:
-        return TCG_TARGET_HAS_sextract_i64;
     case INDEX_op_extract2_i64:
         return TCG_TARGET_HAS_extract2_i64;
     case INDEX_op_extrl_i64_i32:
diff --git a/tcg/tci.c b/tcg/tci.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tci.c
+++ b/tcg/tci.c
@@ -XXX,XX +XXX,XX @@ uintptr_t QEMU_DISABLE_CFI tcg_qemu_tb_exec(CPUArchState *env,
             regs[r0] = deposit32(regs[r1], pos, len, regs[r2]);
             break;
 #endif
-#if TCG_TARGET_HAS_extract_i32
         case INDEX_op_extract_i32:
             tci_args_rrbb(insn, &r0, &r1, &pos, &len);
             regs[r0] = extract32(regs[r1], pos, len);
             break;
-#endif
-#if TCG_TARGET_HAS_sextract_i32
         case INDEX_op_sextract_i32:
             tci_args_rrbb(insn, &r0, &r1, &pos, &len);
             regs[r0] = sextract32(regs[r1], pos, len);
             break;
-#endif
         case INDEX_op_brcond_i32:
             tci_args_rl(insn, tb_ptr, &r0, &ptr);
             if ((uint32_t)regs[r0]) {
@@ -XXX,XX +XXX,XX @@ uintptr_t QEMU_DISABLE_CFI tcg_qemu_tb_exec(CPUArchState *env,
             regs[r0] = deposit64(regs[r1], pos, len, regs[r2]);
             break;
 #endif
-#if TCG_TARGET_HAS_extract_i64
         case INDEX_op_extract_i64:
             tci_args_rrbb(insn, &r0, &r1, &pos, &len);
             regs[r0] = extract64(regs[r1], pos, len);
             break;
-#endif
-#if TCG_TARGET_HAS_sextract_i64
         case INDEX_op_sextract_i64:
             tci_args_rrbb(insn, &r0, &r1, &pos, &len);
             regs[r0] = sextract64(regs[r1], pos, len);
             break;
-#endif
         case INDEX_op_brcond_i64:
             tci_args_rl(insn, tb_ptr, &r0, &ptr);
             if (regs[r0]) {
-- 
2.43.0

Make deposit "unconditional" in the sense that the opcode is
always present.  Rely instead on TCG_TARGET_deposit_valid,
now always defined.

Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
---
 tcg/aarch64/tcg-target-has.h     |  3 +--
 tcg/arm/tcg-target-has.h         |  2 +-
 tcg/i386/tcg-target-has.h        |  5 +----
 tcg/loongarch64/tcg-target-has.h |  3 +--
 tcg/mips/tcg-target-has.h        |  3 +--
 tcg/ppc/tcg-target-has.h         |  3 +--
 tcg/riscv/tcg-target-has.h       |  4 ++--
 tcg/s390x/tcg-target-has.h       |  3 +--
 tcg/sparc64/tcg-target-has.h     |  4 ++--
 tcg/tcg-has.h                    |  8 --------
 tcg/tci/tcg-target-has.h         |  3 +--
 tcg/tcg-op.c                     | 22 +++++++++++-----------
 tcg/tcg.c                        | 31 +++++++++++--------------------
 tcg/tci.c                        |  4 ----
 tcg/tci/tcg-target.c.inc         |  2 +-
 15 files changed, 35 insertions(+), 65 deletions(-)

diff --git a/tcg/aarch64/tcg-target-has.h b/tcg/aarch64/tcg-target-has.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/aarch64/tcg-target-has.h
+++ b/tcg/aarch64/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@
 #define TCG_TARGET_HAS_clz_i32          1
 #define TCG_TARGET_HAS_ctz_i32          1
 #define TCG_TARGET_HAS_ctpop_i32        0
-#define TCG_TARGET_HAS_deposit_i32      1
 #define TCG_TARGET_HAS_extract2_i32     1
 #define TCG_TARGET_HAS_negsetcond_i32   1
 #define TCG_TARGET_HAS_add2_i32         1
@@ -XXX,XX +XXX,XX @@
 #define TCG_TARGET_HAS_clz_i64          1
 #define TCG_TARGET_HAS_ctz_i64          1
 #define TCG_TARGET_HAS_ctpop_i64        0
-#define TCG_TARGET_HAS_deposit_i64      1
 #define TCG_TARGET_HAS_extract2_i64     1
 #define TCG_TARGET_HAS_negsetcond_i64   1
 #define TCG_TARGET_HAS_add2_i64         1
@@ -XXX,XX +XXX,XX @@
 
 #define TCG_TARGET_extract_valid(type, ofs, len)   1
 #define TCG_TARGET_sextract_valid(type, ofs, len)  1
+#define TCG_TARGET_deposit_valid(type, ofs, len)   1
 
 #endif
diff --git a/tcg/arm/tcg-target-has.h b/tcg/arm/tcg-target-has.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/arm/tcg-target-has.h
+++ b/tcg/arm/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@ extern bool use_neon_instructions;
 #define TCG_TARGET_HAS_clz_i32          1
 #define TCG_TARGET_HAS_ctz_i32          use_armv7_instructions
 #define TCG_TARGET_HAS_ctpop_i32        0
-#define TCG_TARGET_HAS_deposit_i32      use_armv7_instructions
 #define TCG_TARGET_HAS_extract2_i32     1
 #define TCG_TARGET_HAS_negsetcond_i32   1
 #define TCG_TARGET_HAS_mulu2_i32        1
@@ -XXX,XX +XXX,XX @@ tcg_target_extract_valid(TCGType type, unsigned ofs, unsigned len)
 
 #define TCG_TARGET_extract_valid   tcg_target_extract_valid
 #define TCG_TARGET_sextract_valid  tcg_target_extract_valid
+#define TCG_TARGET_deposit_valid(type, ofs, len)  use_armv7_instructions
 
 #endif
diff --git a/tcg/i386/tcg-target-has.h b/tcg/i386/tcg-target-has.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/i386/tcg-target-has.h
+++ b/tcg/i386/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@
 #define TCG_TARGET_HAS_clz_i32          1
 #define TCG_TARGET_HAS_ctz_i32          1
 #define TCG_TARGET_HAS_ctpop_i32        have_popcnt
-#define TCG_TARGET_HAS_deposit_i32      1
 #define TCG_TARGET_HAS_extract2_i32     1
 #define TCG_TARGET_HAS_negsetcond_i32   1
 #define TCG_TARGET_HAS_add2_i32         1
@@ -XXX,XX +XXX,XX @@
 #define TCG_TARGET_HAS_clz_i64          1
 #define TCG_TARGET_HAS_ctz_i64          1
 #define TCG_TARGET_HAS_ctpop_i64        have_popcnt
-#define TCG_TARGET_HAS_deposit_i64      1
 #define TCG_TARGET_HAS_extract2_i64     1
 #define TCG_TARGET_HAS_negsetcond_i64   1
 #define TCG_TARGET_HAS_add2_i64         1
@@ -XXX,XX +XXX,XX @@
 #define TCG_TARGET_HAS_cmpsel_vec       1
 #define TCG_TARGET_HAS_tst_vec          have_avx512bw
 
-#define TCG_TARGET_deposit_i32_valid(ofs, len) \
+#define TCG_TARGET_deposit_valid(type, ofs, len) \
     (((ofs) == 0 && ((len) == 8 || (len) == 16)) || \
      (TCG_TARGET_REG_BITS == 32 && (ofs) == 8 && (len) == 8))
-#define TCG_TARGET_deposit_i64_valid    TCG_TARGET_deposit_i32_valid
 
 /*
  * Check for the possibility of low byte/word extraction, high-byte extraction
diff --git a/tcg/loongarch64/tcg-target-has.h b/tcg/loongarch64/tcg-target-has.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/loongarch64/tcg-target-has.h
+++ b/tcg/loongarch64/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@
 #define TCG_TARGET_HAS_rem_i32          1
 #define TCG_TARGET_HAS_div2_i32         0
 #define TCG_TARGET_HAS_rot_i32          1
-#define TCG_TARGET_HAS_deposit_i32      1
 #define TCG_TARGET_HAS_extract2_i32     0
 #define TCG_TARGET_HAS_add2_i32         0
 #define TCG_TARGET_HAS_sub2_i32         0
@@ -XXX,XX +XXX,XX @@
 #define TCG_TARGET_HAS_rem_i64          1
 #define TCG_TARGET_HAS_div2_i64         0
 #define TCG_TARGET_HAS_rot_i64          1
-#define TCG_TARGET_HAS_deposit_i64      1
 #define TCG_TARGET_HAS_extract2_i64     0
 #define TCG_TARGET_HAS_extr_i64_i32     1
 #define TCG_TARGET_HAS_ext8s_i64        1
@@ -XXX,XX +XXX,XX @@
 #define TCG_TARGET_HAS_tst_vec          0
 
 #define TCG_TARGET_extract_valid(type, ofs, len)   1
+#define TCG_TARGET_deposit_valid(type, ofs, len)   1
 
 static inline bool
 tcg_target_sextract_valid(TCGType type, unsigned ofs, unsigned len)
diff --git a/tcg/mips/tcg-target-has.h b/tcg/mips/tcg-target-has.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/mips/tcg-target-has.h
+++ b/tcg/mips/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@ extern bool use_mips32r2_instructions;
 #endif
 
 /* optional instructions detected at runtime */
-#define TCG_TARGET_HAS_deposit_i32      use_mips32r2_instructions
 #define TCG_TARGET_HAS_extract2_i32     0
 #define TCG_TARGET_HAS_ext8s_i32        use_mips32r2_instructions
 #define TCG_TARGET_HAS_ext16s_i32       use_mips32r2_instructions
@@ -XXX,XX +XXX,XX @@ extern bool use_mips32r2_instructions;
 #define TCG_TARGET_HAS_bswap16_i64      1
 #define TCG_TARGET_HAS_bswap32_i64      1
 #define TCG_TARGET_HAS_bswap64_i64      1
-#define TCG_TARGET_HAS_deposit_i64      use_mips32r2_instructions
 #define TCG_TARGET_HAS_extract2_i64     0
 #define TCG_TARGET_HAS_ext8s_i64        use_mips32r2_instructions
 #define TCG_TARGET_HAS_ext16s_i64       use_mips32r2_instructions
@@ -XXX,XX +XXX,XX @@ extern bool use_mips32r2_instructions;
 #define TCG_TARGET_HAS_tst              0
 
 #define TCG_TARGET_extract_valid(type, ofs, len)  use_mips32r2_instructions
+#define TCG_TARGET_deposit_valid(type, ofs, len)  use_mips32r2_instructions
 
 static inline bool
 tcg_target_sextract_valid(TCGType type, unsigned ofs, unsigned len)
diff --git a/tcg/ppc/tcg-target-has.h b/tcg/ppc/tcg-target-has.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/ppc/tcg-target-has.h
+++ b/tcg/ppc/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@
 #define TCG_TARGET_HAS_clz_i32          1
 #define TCG_TARGET_HAS_ctz_i32          have_isa_3_00
 #define TCG_TARGET_HAS_ctpop_i32        have_isa_2_06
-#define TCG_TARGET_HAS_deposit_i32      1
 #define TCG_TARGET_HAS_extract2_i32     0
 #define TCG_TARGET_HAS_negsetcond_i32   1
 #define TCG_TARGET_HAS_mulu2_i32        0
@@ -XXX,XX +XXX,XX @@
 #define TCG_TARGET_HAS_clz_i64          1
 #define TCG_TARGET_HAS_ctz_i64          have_isa_3_00
 #define TCG_TARGET_HAS_ctpop_i64        have_isa_2_06
-#define TCG_TARGET_HAS_deposit_i64      1
 #define TCG_TARGET_HAS_extract2_i64     0
 #define TCG_TARGET_HAS_negsetcond_i64   1
 #define TCG_TARGET_HAS_add2_i64         1
@@ -XXX,XX +XXX,XX @@
 #define TCG_TARGET_HAS_tst_vec          0
 
 #define TCG_TARGET_extract_valid(type, ofs, len)   1
+#define TCG_TARGET_deposit_valid(type, ofs, len)   1
 
 static inline bool
 tcg_target_sextract_valid(TCGType type, unsigned ofs, unsigned len)
diff --git a/tcg/riscv/tcg-target-has.h b/tcg/riscv/tcg-target-has.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/riscv/tcg-target-has.h
+++ b/tcg/riscv/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@
 #define TCG_TARGET_HAS_rem_i32          1
 #define TCG_TARGET_HAS_div2_i32         0
 #define TCG_TARGET_HAS_rot_i32          (cpuinfo & CPUINFO_ZBB)
-#define TCG_TARGET_HAS_deposit_i32      0
 #define TCG_TARGET_HAS_extract2_i32     0
 #define TCG_TARGET_HAS_add2_i32         1
 #define TCG_TARGET_HAS_sub2_i32         1
@@ -XXX,XX +XXX,XX @@
 #define TCG_TARGET_HAS_rem_i64          1
 #define TCG_TARGET_HAS_div2_i64         0
 #define TCG_TARGET_HAS_rot_i64          (cpuinfo & CPUINFO_ZBB)
-#define TCG_TARGET_HAS_deposit_i64      0
 #define TCG_TARGET_HAS_extract2_i64     0
 #define TCG_TARGET_HAS_extr_i64_i32     1
 #define TCG_TARGET_HAS_ext8s_i64        1
@@ -XXX,XX +XXX,XX @@ tcg_target_sextract_valid(TCGType type, unsigned ofs, unsigned len)
 }
 #define TCG_TARGET_sextract_valid  tcg_target_sextract_valid
 
+#define TCG_TARGET_deposit_valid(type, ofs, len)  0
+
 #endif
diff --git a/tcg/s390x/tcg-target-has.h b/tcg/s390x/tcg-target-has.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/s390x/tcg-target-has.h
+++ b/tcg/s390x/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@ extern uint64_t s390_facilities[3];
 #define TCG_TARGET_HAS_clz_i32        0
 #define TCG_TARGET_HAS_ctz_i32        0
 #define TCG_TARGET_HAS_ctpop_i32      1
-#define TCG_TARGET_HAS_deposit_i32    1
 #define TCG_TARGET_HAS_extract2_i32   0
 #define TCG_TARGET_HAS_negsetcond_i32 1
 #define TCG_TARGET_HAS_add2_i32       1
@@ -XXX,XX +XXX,XX @@ extern uint64_t s390_facilities[3];
 #define TCG_TARGET_HAS_clz_i64        1
 #define TCG_TARGET_HAS_ctz_i64        0
 #define TCG_TARGET_HAS_ctpop_i64      1
-#define TCG_TARGET_HAS_deposit_i64    1
 #define TCG_TARGET_HAS_extract2_i64   0
 #define TCG_TARGET_HAS_negsetcond_i64 1
 #define TCG_TARGET_HAS_add2_i64       1
@@ -XXX,XX +XXX,XX @@ extern uint64_t s390_facilities[3];
 #define TCG_TARGET_HAS_tst_vec        0
 
 #define TCG_TARGET_extract_valid(type, ofs, len)   1
+#define TCG_TARGET_deposit_valid(type, ofs, len)   1
 
 static inline bool
 tcg_target_sextract_valid(TCGType type, unsigned ofs, unsigned len)
diff --git a/tcg/sparc64/tcg-target-has.h b/tcg/sparc64/tcg-target-has.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/sparc64/tcg-target-has.h
+++ b/tcg/sparc64/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@ extern bool use_vis3_instructions;
 #define TCG_TARGET_HAS_clz_i32          0
 #define TCG_TARGET_HAS_ctz_i32          0
 #define TCG_TARGET_HAS_ctpop_i32        0
-#define TCG_TARGET_HAS_deposit_i32      0
 #define TCG_TARGET_HAS_extract2_i32     0
 #define TCG_TARGET_HAS_negsetcond_i32   1
 #define TCG_TARGET_HAS_add2_i32         1
@@ -XXX,XX +XXX,XX @@ extern bool use_vis3_instructions;
 #define TCG_TARGET_HAS_clz_i64          0
 #define TCG_TARGET_HAS_ctz_i64          0
 #define TCG_TARGET_HAS_ctpop_i64        0
-#define TCG_TARGET_HAS_deposit_i64      0
 #define TCG_TARGET_HAS_extract2_i64     0
 #define TCG_TARGET_HAS_negsetcond_i64   1
 #define TCG_TARGET_HAS_add2_i64         1
@@ -XXX,XX +XXX,XX @@ extern bool use_vis3_instructions;
 
 #define TCG_TARGET_sextract_valid  TCG_TARGET_extract_valid
 
+#define TCG_TARGET_deposit_valid(type, ofs, len) 0
+
 #endif
diff --git a/tcg/tcg-has.h b/tcg/tcg-has.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg-has.h
+++ b/tcg/tcg-has.h
@@ -XXX,XX +XXX,XX @@
 #define TCG_TARGET_HAS_clz_i64          0
 #define TCG_TARGET_HAS_ctz_i64          0
 #define TCG_TARGET_HAS_ctpop_i64        0
-#define TCG_TARGET_HAS_deposit_i64      0
 #define TCG_TARGET_HAS_extract2_i64     0
 #define TCG_TARGET_HAS_negsetcond_i64   0
 #define TCG_TARGET_HAS_add2_i64         0
@@ -XXX,XX +XXX,XX @@
 #define TCG_TARGET_HAS_sub2_i32         1
 #endif
 
-#ifndef TCG_TARGET_deposit_i32_valid
-#define TCG_TARGET_deposit_i32_valid(ofs, len) 1
-#endif
-#ifndef TCG_TARGET_deposit_i64_valid
-#define TCG_TARGET_deposit_i64_valid(ofs, len) 1
-#endif
-
 /* Only one of DIV or DIV2 should be defined.  */
 #if defined(TCG_TARGET_HAS_div_i32)
 #define TCG_TARGET_HAS_div2_i32         0
diff --git a/tcg/tci/tcg-target-has.h b/tcg/tci/tcg-target-has.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tci/tcg-target-has.h
+++ b/tcg/tci/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@
 #define TCG_TARGET_HAS_ext8u_i32        1
 #define TCG_TARGET_HAS_ext16u_i32       1
 #define TCG_TARGET_HAS_andc_i32         1
-#define TCG_TARGET_HAS_deposit_i32      1
 #define TCG_TARGET_HAS_extract2_i32     0
 #define TCG_TARGET_HAS_eqv_i32          1
 #define TCG_TARGET_HAS_nand_i32         1
@@ -XXX,XX +XXX,XX @@
 #define TCG_TARGET_HAS_bswap16_i64      1
 #define TCG_TARGET_HAS_bswap32_i64      1
 #define TCG_TARGET_HAS_bswap64_i64      1
-#define TCG_TARGET_HAS_deposit_i64      1
 #define TCG_TARGET_HAS_extract2_i64     0
 #define TCG_TARGET_HAS_div_i64          1
 #define TCG_TARGET_HAS_rem_i64          1
@@ -XXX,XX +XXX,XX @@
 
 #define TCG_TARGET_extract_valid(type, ofs, len)   1
 #define TCG_TARGET_sextract_valid(type, ofs, len)  1
+#define TCG_TARGET_deposit_valid(type, ofs, len)   1
 
 #endif
diff --git a/tcg/tcg-op.c b/tcg/tcg-op.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg-op.c
+++ b/tcg/tcg-op.c
@@ -XXX,XX +XXX,XX @@ void tcg_gen_deposit_i32(TCGv_i32 ret, TCGv_i32 arg1, TCGv_i32 arg2,
         tcg_gen_mov_i32(ret, arg2);
         return;
     }
-    if (TCG_TARGET_HAS_deposit_i32 && TCG_TARGET_deposit_i32_valid(ofs, len)) {
+    if (TCG_TARGET_deposit_valid(TCG_TYPE_I32, ofs, len)) {
         tcg_gen_op5ii_i32(INDEX_op_deposit_i32, ret, arg1, arg2, ofs, len);
         return;
     }
@@ -XXX,XX +XXX,XX @@ void tcg_gen_deposit_z_i32(TCGv_i32 ret, TCGv_i32 arg,
         tcg_gen_shli_i32(ret, arg, ofs);
     } else if (ofs == 0) {
         tcg_gen_andi_i32(ret, arg, (1u << len) - 1);
-    } else if (TCG_TARGET_HAS_deposit_i32
-               && TCG_TARGET_deposit_i32_valid(ofs, len)) {
+    } else if (TCG_TARGET_deposit_valid(TCG_TYPE_I32, ofs, len)) {
         TCGv_i32 zero = tcg_constant_i32(0);
         tcg_gen_op5ii_i32(INDEX_op_deposit_i32, ret, zero, arg, ofs, len);
     } else {
@@ -XXX,XX +XXX,XX @@ void tcg_gen_deposit_i64(TCGv_i64 ret, TCGv_i64 arg1, TCGv_i64 arg2,
         tcg_gen_mov_i64(ret, arg2);
         return;
     }
-    if (TCG_TARGET_HAS_deposit_i64 && TCG_TARGET_deposit_i64_valid(ofs, len)) {
-        tcg_gen_op5ii_i64(INDEX_op_deposit_i64, ret, arg1, arg2, ofs, len);
-        return;
-    }
 
-    if (TCG_TARGET_REG_BITS == 32) {
+    if (TCG_TARGET_REG_BITS == 64) {
+        if (TCG_TARGET_deposit_valid(TCG_TYPE_I64, ofs, len)) {
+            tcg_gen_op5ii_i64(INDEX_op_deposit_i64, ret, arg1, arg2, ofs, len);
+            return;
+        }
+    } else {
         if (ofs >= 32) {
             tcg_gen_deposit_i32(TCGV_HIGH(ret), TCGV_HIGH(arg1),
                                 TCGV_LOW(arg2), ofs - 32, len);
@@ -XXX,XX +XXX,XX @@ void tcg_gen_deposit_z_i64(TCGv_i64 ret, TCGv_i64 arg,
         tcg_gen_shli_i64(ret, arg, ofs);
     } else if (ofs == 0) {
         tcg_gen_andi_i64(ret, arg, (1ull << len) - 1);
-    } else if (TCG_TARGET_HAS_deposit_i64
-               && TCG_TARGET_deposit_i64_valid(ofs, len)) {
+    } else if (TCG_TARGET_REG_BITS == 64 &&
+               TCG_TARGET_deposit_valid(TCG_TYPE_I64, ofs, len)) {
         TCGv_i64 zero = tcg_constant_i64(0);
         tcg_gen_op5ii_i64(INDEX_op_deposit_i64, ret, zero, arg, ofs, len);
     } else {
@@ -XXX,XX +XXX,XX @@ void tcg_gen_concat_i32_i64(TCGv_i64 dest, TCGv_i32 low, TCGv_i32 high)
     tcg_gen_extu_i32_i64(dest, low);
     /* If deposit is available, use it.  Otherwise use the extra
        knowledge that we have of the zero-extensions above.  */
-    if (TCG_TARGET_HAS_deposit_i64 && TCG_TARGET_deposit_i64_valid(32, 32)) {
+    if (TCG_TARGET_deposit_valid(TCG_TYPE_I64, 32, 32)) {
         tcg_gen_deposit_i64(dest, dest, tmp, 32, 32);
     } else {
         tcg_gen_shli_i64(tmp, tmp, 32);
diff --git a/tcg/tcg.c b/tcg/tcg.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tcg.c
+++ b/tcg/tcg.c
@@ -XXX,XX +XXX,XX @@ bool tcg_op_supported(TCGOpcode op, TCGType type, unsigned flags)
     case INDEX_op_sar_i32:
     case INDEX_op_extract_i32:
     case INDEX_op_sextract_i32:
+    case INDEX_op_deposit_i32:
         return true;
 
     case INDEX_op_negsetcond_i32:
@@ -XXX,XX +XXX,XX @@ bool tcg_op_supported(TCGOpcode op, TCGType type, unsigned flags)
     case INDEX_op_rotl_i32:
     case INDEX_op_rotr_i32:
         return TCG_TARGET_HAS_rot_i32;
-    case INDEX_op_deposit_i32:
-        return TCG_TARGET_HAS_deposit_i32;
     case INDEX_op_extract2_i32:
         return TCG_TARGET_HAS_extract2_i32;
     case INDEX_op_add2_i32:
@@ -XXX,XX +XXX,XX @@ bool tcg_op_supported(TCGOpcode op, TCGType type, unsigned flags)
     case INDEX_op_extu_i32_i64:
     case INDEX_op_extract_i64:
     case INDEX_op_sextract_i64:
+    case INDEX_op_deposit_i64:
         return TCG_TARGET_REG_BITS == 64;
 
     case INDEX_op_negsetcond_i64:
@@ -XXX,XX +XXX,XX @@ bool tcg_op_supported(TCGOpcode op, TCGType type, unsigned flags)
     case INDEX_op_rotl_i64:
     case INDEX_op_rotr_i64:
         return TCG_TARGET_HAS_rot_i64;
-    case INDEX_op_deposit_i64:
-        return TCG_TARGET_HAS_deposit_i64;
     case INDEX_op_extract2_i64:
         return TCG_TARGET_HAS_extract2_i64;
     case INDEX_op_extrl_i64_i32:
@@ -XXX,XX +XXX,XX @@ bool tcg_op_supported(TCGOpcode op, TCGType type, unsigned flags)
 
 bool tcg_op_deposit_valid(TCGType type, unsigned ofs, unsigned len)
 {
+    unsigned width;
+
+    tcg_debug_assert(type == TCG_TYPE_I32 || type == TCG_TYPE_I64);
+    width = (type == TCG_TYPE_I32 ? 32 : 64);
+
+    tcg_debug_assert(ofs < width);
     tcg_debug_assert(len > 0);
-    switch (type) {
-    case TCG_TYPE_I32:
-        tcg_debug_assert(ofs < 32);
-        tcg_debug_assert(len <= 32);
-        tcg_debug_assert(ofs + len <= 32);
-        return TCG_TARGET_HAS_deposit_i32 &&
-               TCG_TARGET_deposit_i32_valid(ofs, len);
-    case TCG_TYPE_I64:
-        tcg_debug_assert(ofs < 64);
-        tcg_debug_assert(len <= 64);
-        tcg_debug_assert(ofs + len <= 64);
-        return TCG_TARGET_HAS_deposit_i64 &&
-               TCG_TARGET_deposit_i64_valid(ofs, len);
-    default:
-        g_assert_not_reached();
-    }
+    tcg_debug_assert(len <= width - ofs);
+
+    return TCG_TARGET_deposit_valid(type, ofs, len);
 }
 
 static TCGOp *tcg_op_alloc(TCGOpcode opc, unsigned nargs);
diff --git a/tcg/tci.c b/tcg/tci.c
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tci.c
+++ b/tcg/tci.c
@@ -XXX,XX +XXX,XX @@ uintptr_t QEMU_DISABLE_CFI tcg_qemu_tb_exec(CPUArchState *env,
             regs[r0] = ror32(regs[r1], regs[r2] & 31);
             break;
 #endif
-#if TCG_TARGET_HAS_deposit_i32
         case INDEX_op_deposit_i32:
             tci_args_rrrbb(insn, &r0, &r1, &r2, &pos, &len);
             regs[r0] = deposit32(regs[r1], pos, len, regs[r2]);
             break;
-#endif
         case INDEX_op_extract_i32:
             tci_args_rrbb(insn, &r0, &r1, &pos, &len);
             regs[r0] = extract32(regs[r1], pos, len);
@@ -XXX,XX +XXX,XX @@ uintptr_t QEMU_DISABLE_CFI tcg_qemu_tb_exec(CPUArchState *env,
             regs[r0] = ror64(regs[r1], regs[r2] & 63);
             break;
 #endif
-#if TCG_TARGET_HAS_deposit_i64
         case INDEX_op_deposit_i64:
             tci_args_rrrbb(insn, &r0, &r1, &r2, &pos, &len);
             regs[r0] = deposit64(regs[r1], pos, len, regs[r2]);
             break;
-#endif
         case INDEX_op_extract_i64:
             tci_args_rrbb(insn, &r0, &r1, &pos, &len);
             regs[r0] = extract64(regs[r1], pos, len);
diff --git a/tcg/tci/tcg-target.c.inc b/tcg/tci/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/tci/tcg-target.c.inc
+++ b/tcg/tci/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
         tcg_out_op_rrr(s, opc, args[0], args[1], args[2]);
         break;
 
-    CASE_32_64(deposit)  /* Optional (TCG_TARGET_HAS_deposit_*). */
+    CASE_32_64(deposit)
         tcg_out_op_rrrbb(s, opc, args[0], args[1], args[2], args[3], args[4]);
         break;
 
-- 
2.43.0

Acked-by: Alistair Francis <alistair.francis@wdc.com>
Reviewed-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-ID: <20250102181601.1421059-2-richard.henderson@linaro.org>
---
 host/include/riscv/host/cpuinfo.h |  5 +++--
 util/cpuinfo-riscv.c              | 18 ++++++++++++++++--
 2 files changed, 19 insertions(+), 4 deletions(-)

diff --git a/host/include/riscv/host/cpuinfo.h b/host/include/riscv/host/cpuinfo.h
index XXXXXXX..XXXXXXX 100644
--- a/host/include/riscv/host/cpuinfo.h
+++ b/host/include/riscv/host/cpuinfo.h
@@ -XXX,XX +XXX,XX @@
 #define CPUINFO_ALWAYS          (1u << 0)  /* so cpuinfo is nonzero */
 #define CPUINFO_ZBA             (1u << 1)
 #define CPUINFO_ZBB             (1u << 2)
-#define CPUINFO_ZICOND          (1u << 3)
-#define CPUINFO_ZVE64X          (1u << 4)
+#define CPUINFO_ZBS             (1u << 3)
+#define CPUINFO_ZICOND          (1u << 4)
+#define CPUINFO_ZVE64X          (1u << 5)
 
 /* Initialized with a constructor. */
 extern unsigned cpuinfo;
diff --git a/util/cpuinfo-riscv.c b/util/cpuinfo-riscv.c
index XXXXXXX..XXXXXXX 100644
--- a/util/cpuinfo-riscv.c
+++ b/util/cpuinfo-riscv.c
@@ -XXX,XX +XXX,XX @@ static void sigill_handler(int signo, siginfo_t *si, void *data)
 /* Called both as constructor and (possibly) via other constructors. */
 unsigned __attribute__((constructor)) cpuinfo_init(void)
 {
-    unsigned left = CPUINFO_ZBA | CPUINFO_ZBB | CPUINFO_ZICOND | CPUINFO_ZVE64X;
+    unsigned left = CPUINFO_ZBA | CPUINFO_ZBB | CPUINFO_ZBS
+                  | CPUINFO_ZICOND | CPUINFO_ZVE64X;
     unsigned info = cpuinfo;
 
     if (info) {
@@ -XXX,XX +XXX,XX @@ unsigned __attribute__((constructor)) cpuinfo_init(void)
 #if defined(__riscv_arch_test) && defined(__riscv_zbb)
     info |= CPUINFO_ZBB;
 #endif
+#if defined(__riscv_arch_test) && defined(__riscv_zbs)
+    info |= CPUINFO_ZBS;
+#endif
 #if defined(__riscv_arch_test) && defined(__riscv_zicond)
     info |= CPUINFO_ZICOND;
 #endif
@@ -XXX,XX +XXX,XX @@ unsigned __attribute__((constructor)) cpuinfo_init(void)
             && pair.key >= 0) {
             info |= pair.value & RISCV_HWPROBE_EXT_ZBA ? CPUINFO_ZBA : 0;
             info |= pair.value & RISCV_HWPROBE_EXT_ZBB ? CPUINFO_ZBB : 0;
-            left &= ~(CPUINFO_ZBA | CPUINFO_ZBB);
+            info |= pair.value & RISCV_HWPROBE_EXT_ZBS ? CPUINFO_ZBS : 0;
+            left &= ~(CPUINFO_ZBA | CPUINFO_ZBB | CPUINFO_ZBS);
 #ifdef RISCV_HWPROBE_EXT_ZICOND
             info |= pair.value & RISCV_HWPROBE_EXT_ZICOND ? CPUINFO_ZICOND : 0;
             left &= ~CPUINFO_ZICOND;
@@ -XXX,XX +XXX,XX @@ unsigned __attribute__((constructor)) cpuinfo_init(void)
             left &= ~CPUINFO_ZBB;
         }
 
+        if (left & CPUINFO_ZBS) {
+            /* Probe for Zbs: bext zero,zero,zero. */
+            got_sigill = 0;
+            asm volatile(".insn r 0x33, 5, 0x24, zero, zero, zero"
+                         : : : "memory");
+            info |= got_sigill ? 0 : CPUINFO_ZBS;
+            left &= ~CPUINFO_ZBS;
+        }
+
         if (left & CPUINFO_ZICOND) {
             /* Probe for Zicond: czero.eqz zero,zero,zero. */
             got_sigill = 0;
-- 
2.43.0

Acked-by: Alistair Francis <alistair.francis@wdc.com>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-ID: <20250102181601.1421059-3-richard.henderson@linaro.org>
---
 tcg/riscv/tcg-target-has.h |  8 +++++++-
 tcg/riscv/tcg-target.c.inc | 11 +++++++++--
 2 files changed, 16 insertions(+), 3 deletions(-)

diff --git a/tcg/riscv/tcg-target-has.h b/tcg/riscv/tcg-target-has.h
index XXXXXXX..XXXXXXX 100644
--- a/tcg/riscv/tcg-target-has.h
+++ b/tcg/riscv/tcg-target-has.h
@@ -XXX,XX +XXX,XX @@ tcg_target_extract_valid(TCGType type, unsigned ofs, unsigned len)
         /* ofs > 0 uses SRLIW; ofs == 0 uses add.uw. */
         return ofs || (cpuinfo & CPUINFO_ZBA);
     }
-    return (cpuinfo & CPUINFO_ZBB) && ofs == 0 && len == 16;
+    switch (len) {
+    case 1:
+        return (cpuinfo & CPUINFO_ZBS) && ofs != 0;
+    case 16:
+        return (cpuinfo & CPUINFO_ZBB) && ofs == 0;
+    }
+    return false;
 }
 #define TCG_TARGET_extract_valid  tcg_target_extract_valid
 
diff --git a/tcg/riscv/tcg-target.c.inc b/tcg/riscv/tcg-target.c.inc
index XXXXXXX..XXXXXXX 100644
--- a/tcg/riscv/tcg-target.c.inc
+++ b/tcg/riscv/tcg-target.c.inc
@@ -XXX,XX +XXX,XX @@ typedef enum {
     OPC_ANDI = 0x7013,
     OPC_AUIPC = 0x17,
     OPC_BEQ = 0x63,
+    OPC_BEXTI = 0x48005013,
     OPC_BGE = 0x5063,
     OPC_BGEU = 0x7063,
     OPC_BLT = 0x4063,
@@ -XXX,XX +XXX,XX @@ static void tcg_out_op(TCGContext *s, TCGOpcode opc, TCGType type,
         }
         /* FALLTHRU */
     case INDEX_op_extract_i32:
-        if (a2 == 0 && args[3] == 16) {
+        switch (args[3]) {
+        case 1:
+            tcg_out_opc_imm(s, OPC_BEXTI, a0, a1, a2);
+            break;
+        case 16:
+            tcg_debug_assert(a2 == 0);
             tcg_out_ext16u(s, a0, a1);
-        } else {
+            break;
+        default:
             g_assert_not_reached();
         }
         break;
-- 
2.43.0

From: Helge Deller <deller@kernel.org>

Add some missing fields which may be parsed by userspace applications.

Signed-off-by: Helge Deller <deller@gmx.de>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-ID: <Z39B1wzNNpndmOxZ@p100>
---
 linux-user/sparc/target_proc.h | 20 +++++++++++++++++++-
 1 file changed, 19 insertions(+), 1 deletion(-)

diff --git a/linux-user/sparc/target_proc.h b/linux-user/sparc/target_proc.h
index XXXXXXX..XXXXXXX 100644
--- a/linux-user/sparc/target_proc.h
+++ b/linux-user/sparc/target_proc.h
@@ -XXX,XX +XXX,XX @@
 
 static int open_cpuinfo(CPUArchState *cpu_env, int fd)
 {
-    dprintf(fd, "type\t\t: sun4u\n");
+    int i, num_cpus;
+    const char *cpu_type;
+
+    num_cpus = sysconf(_SC_NPROCESSORS_ONLN);
+    if (cpu_env->def.features & CPU_FEATURE_HYPV) {
+        cpu_type = "sun4v";
+    } else {
+        cpu_type = "sun4u";
+    }
+
+    dprintf(fd, "cpu\t\t: %s (QEMU)\n", cpu_env->def.name);
+    dprintf(fd, "type\t\t: %s\n", cpu_type);
+    dprintf(fd, "ncpus probed\t: %d\n", num_cpus);
+    dprintf(fd, "ncpus active\t: %d\n", num_cpus);
+    dprintf(fd, "State:\n");
+    for (i = 0; i < num_cpus; i++) {
+        dprintf(fd, "CPU%d:\t\t: online\n", i);
+    }
+
     return 0;
 }
 #define HAVE_ARCH_PROC_CPUINFO
-- 
2.43.0

From: Ilya Leoshkevich <iii@linux.ibm.com>

These similarly named functions serve different purposes; add
docstrings to highlight them.

Suggested-by: Alex Bennée <alex.bennee@linaro.org>
Signed-off-by: Ilya Leoshkevich <iii@linux.ibm.com>
Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-ID: <20250116213214.5695-1-iii@linux.ibm.com>
---
 include/tcg/tcg.h    | 41 +++++++++++++++++++++++++++++++++++++++++
 accel/tcg/cpu-exec.c | 15 ++++++++++++++-
 2 files changed, 55 insertions(+), 1 deletion(-)

diff --git a/include/tcg/tcg.h b/include/tcg/tcg.h
index XXXXXXX..XXXXXXX 100644
--- a/include/tcg/tcg.h
+++ b/include/tcg/tcg.h
@@ -XXX,XX +XXX,XX @@ void tcg_region_reset_all(void);
 size_t tcg_code_size(void);
 size_t tcg_code_capacity(void);
 
+/**
+ * tcg_tb_insert:
+ * @tb: translation block to insert
+ *
+ * Insert @tb into the region trees.
+ */
 void tcg_tb_insert(TranslationBlock *tb);
+
+/**
+ * tcg_tb_remove:
+ * @tb: translation block to remove
+ *
+ * Remove @tb from the region trees.
+ */
 void tcg_tb_remove(TranslationBlock *tb);
+
+/**
+ * tcg_tb_lookup:
+ * @tc_ptr: host PC to look up
+ *
+ * Look up a translation block inside the region trees by @tc_ptr. This is
+ * useful for exception handling, but must not be used for the purposes of
+ * executing the returned translation block. See struct tb_tc for more
+ * information.
+ *
+ * Returns: a translation block previously inserted into the region trees,
+ * such that @tc_ptr points anywhere inside the code generated for it, or
+ * NULL.
+ */
 TranslationBlock *tcg_tb_lookup(uintptr_t tc_ptr);
+
+/**
+ * tcg_tb_foreach:
+ * @func: callback
+ * @user_data: opaque value to pass to @callback
+ *
+ * Call @func for each translation block inserted into the region trees.
+ */
 void tcg_tb_foreach(GTraverseFunc func, gpointer user_data);
+
+/**
+ * tcg_nb_tbs:
+ *
+ * Returns: the number of translation blocks inserted into the region trees.
+ */
 size_t tcg_nb_tbs(void);
 
 /* user-mode: Called with mmap_lock held.  */
diff --git a/accel/tcg/cpu-exec.c b/accel/tcg/cpu-exec.c
index XXXXXXX..XXXXXXX 100644
--- a/accel/tcg/cpu-exec.c
+++ b/accel/tcg/cpu-exec.c
@@ -XXX,XX +XXX,XX @@ static TranslationBlock *tb_htable_lookup(CPUState *cpu, vaddr pc,
     return qht_lookup_custom(&tb_ctx.htable, &desc, h, tb_lookup_cmp);
 }
 
-/* Might cause an exception, so have a longjmp destination ready */
+/**
+ * tb_lookup:
+ * @cpu: CPU that will execute the returned translation block
+ * @pc: guest PC
+ * @cs_base: arch-specific value associated with translation block
+ * @flags: arch-specific translation block flags
+ * @cflags: CF_* flags
+ *
+ * Look up a translation block inside the QHT using @pc, @cs_base, @flags and
+ * @cflags. Uses @cpu's tb_jmp_cache. Might cause an exception, so have a
+ * longjmp destination ready.
+ *
+ * Returns: an existing translation block or NULL.
+ */
 static inline TranslationBlock *tb_lookup(CPUState *cpu, vaddr pc,
                                           uint64_t cs_base, uint32_t flags,
                                           uint32_t cflags)
-- 
2.43.0

From: Ilya Leoshkevich <iii@linux.ibm.com>

Currently one-insn TBs created from I/O memory are not added to
region_trees. Therefore, when they generate exceptions, they are not
handled by cpu_restore_state_from_tb().

For x86 this is not a problem, because x86_restore_state_to_opc() only
restores pc and cc, which already have the correct values if the first
TB instruction causes an exception. However, on several other
architectures, restore_state_to_opc() is not stricly limited to state
restoration and affects some exception-related registers, where guests
can notice incorrect values, for example:

- arm's exception.syndrome;
- hppa's unwind_breg;
- riscv's excp_uw2;
- s390x's int_pgm_ilen.

Fix by always calling tcg_tb_insert(). This may increase the size of
region_trees, but tcg_region_reset_all() clears it once code_gen_buffer
fills up, so it will not grow uncontrollably.

Do not call tb_link_page(), which would add such TBs to the QHT, to
prevent tb_lookup() from finding them. These TBs are single-use, since
subsequent reads from I/O memory may return different values; they are
not removed from code_gen_buffer only in order to keep things simple.

Co-developed-by: Nina Schoetterl-Glausch <nsg@linux.ibm.com>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Signed-off-by: Ilya Leoshkevich <iii@linux.ibm.com>
Reviewed-by: Alex Bennée <alex.bennee@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-ID: <20250116213214.5695-2-iii@linux.ibm.com>
---
 accel/tcg/translate-all.c | 29 +++++++++++++++++++----------
 1 file changed, 19 insertions(+), 10 deletions(-)

diff --git a/accel/tcg/translate-all.c b/accel/tcg/translate-all.c
index XXXXXXX..XXXXXXX 100644
--- a/accel/tcg/translate-all.c
+++ b/accel/tcg/translate-all.c
@@ -XXX,XX +XXX,XX @@ TranslationBlock *tb_gen_code(CPUState *cpu,
         tb_reset_jump(tb, 1);
     }
 
-    /*
-     * If the TB is not associated with a physical RAM page then it must be
-     * a temporary one-insn TB, and we have nothing left to do. Return early
-     * before attempting to link to other TBs or add to the lookup table.
-     */
-    if (tb_page_addr0(tb) == -1) {
-        assert_no_pages_locked();
-        return tb;
-    }
-
     /*
      * Insert TB into the corresponding region tree before publishing it
      * through QHT. Otherwise rewinding happened in the TB might fail to
@@ -XXX,XX +XXX,XX @@ TranslationBlock *tb_gen_code(CPUState *cpu,
      */
     tcg_tb_insert(tb);
 
+    /*
+     * If the TB is not associated with a physical RAM page then it must be
+     * a temporary one-insn TB.
+     *
+     * Such TBs must be added to region trees in order to make sure that
+     * restore_state_to_opc() - which on some architectures is not limited to
+     * rewinding, but also affects exception handling! - is called when such a
+     * TB causes an exception.
+     *
+     * At the same time, temporary one-insn TBs must be executed at most once,
+     * because subsequent reads from, e.g., I/O memory may return different
+     * values. So return early before attempting to link to other TBs or add
+     * to the QHT.
+     */
+    if (tb_page_addr0(tb) == -1) {
+        assert_no_pages_locked();
+        return tb;
+    }
+
     /*
      * No explicit memory barrier is required -- tb_link_page() makes the
      * TB visible in a consistent state.
-- 
2.43.0

From: Philippe Mathieu-Daudé <philmd@linaro.org>

These helpers don't alter float_status. Make it const.

Signed-off-by: Philippe Mathieu-Daudé <philmd@linaro.org>
Reviewed-by: Richard Henderson <richard.henderson@linaro.org>
Signed-off-by: Richard Henderson <richard.henderson@linaro.org>
Message-ID: <20250116214359.67295-1-philmd@linaro.org>
---
 include/fpu/softfloat-helpers.h | 25 ++++++++++++++-----------
 1 file changed, 14 insertions(+), 11 deletions(-)

diff --git a/include/fpu/softfloat-helpers.h b/include/fpu/softfloat-helpers.h
index XXXXXXX..XXXXXXX 100644
--- a/include/fpu/softfloat-helpers.h
+++ b/include/fpu/softfloat-helpers.h
@@ -XXX,XX +XXX,XX @@ static inline void set_no_signaling_nans(bool val, float_status *status)
     status->no_signaling_nans = val;
 }
 
-static inline bool get_float_detect_tininess(float_status *status)
+static inline bool get_float_detect_tininess(const float_status *status)
 {
     return status->tininess_before_rounding;
 }
 
-static inline FloatRoundMode get_float_rounding_mode(float_status *status)
+static inline FloatRoundMode get_float_rounding_mode(const float_status *status)
 {
     return status->float_rounding_mode;
 }
 
-static inline int get_float_exception_flags(float_status *status)
+static inline int get_float_exception_flags(const float_status *status)
 {
     return status->float_exception_flags;
 }
 
 static inline FloatX80RoundPrec
-get_floatx80_rounding_precision(float_status *status)
+get_floatx80_rounding_precision(const float_status *status)
 {
     return status->floatx80_rounding_precision;
 }
 
-static inline Float2NaNPropRule get_float_2nan_prop_rule(float_status *status)
+static inline Float2NaNPropRule
+get_float_2nan_prop_rule(const float_status *status)
 {
     return status->float_2nan_prop_rule;
 }
 
-static inline Float3NaNPropRule get_float_3nan_prop_rule(float_status *status)
+static inline Float3NaNPropRule
+get_float_3nan_prop_rule(const float_status *status)
 {
     return status->float_3nan_prop_rule;
 }
 
-static inline FloatInfZeroNaNRule get_float_infzeronan_rule(float_status *status)
+static inline FloatInfZeroNaNRule
+get_float_infzeronan_rule(const float_status *status)
 {
     return status->float_infzeronan_rule;
 }
 
-static inline uint8_t get_float_default_nan_pattern(float_status *status)
+static inline uint8_t get_float_default_nan_pattern(const float_status *status)
 {
     return status->default_nan_pattern;
 }
 
-static inline bool get_flush_to_zero(float_status *status)
+static inline bool get_flush_to_zero(const float_status *status)
 {
     return status->flush_to_zero;
 }
 
-static inline bool get_flush_inputs_to_zero(float_status *status)
+static inline bool get_flush_inputs_to_zero(const float_status *status)
 {
     return status->flush_inputs_to_zero;
 }
 
-static inline bool get_default_nan_mode(float_status *status)
+static inline bool get_default_nan_mode(const float_status *status)
 {
     return status->default_nan_mode;
 }
-- 
2.43.0