From nobody Fri Apr  4 21:32:29 2025
Delivered-To: importer@patchew.org
Authentication-Results: mx.zohomail.com;
	dkim=fail;
	spf=pass (zohomail.com: domain of gnu.org designates 209.51.188.17 as
 permitted sender)
  smtp.mailfrom=qemu-devel-bounces+importer=patchew.org@nongnu.org;
	dmarc=fail(p=none dis=none)  header.from=anarch128.org
Return-Path: <qemu-devel-bounces+importer=patchew.org@nongnu.org>
Received: from lists.gnu.org (lists.gnu.org [209.51.188.17]) by
 mx.zohomail.com
	with SMTPS id 1739122155873262.5813199752147;
 Sun, 9 Feb 2025 09:29:15 -0800 (PST)
Received: from localhost ([::1] helo=lists1p.gnu.org)
	by lists.gnu.org with esmtp (Exim 4.90_1)
	(envelope-from <qemu-devel-bounces@nongnu.org>)
	id 1thB6f-0004Yi-9J; Sun, 09 Feb 2025 12:28:34 -0500
Received: from eggs.gnu.org ([2001:470:142:3::10])
 by lists.gnu.org with esmtps (TLS1.2:ECDHE_RSA_AES_256_GCM_SHA384:256)
 (Exim 4.90_1) (envelope-from <michael@anarch128.org>)
 id 1thB6E-0004WB-H5
 for qemu-devel@nongnu.org; Sun, 09 Feb 2025 12:28:06 -0500
Received: from anarch128.org ([2001:4801:7825:104:be76:4eff:fe10:52ae])
 by eggs.gnu.org with esmtps (TLS1.2:ECDHE_RSA_AES_256_GCM_SHA384:256)
 (Exim 4.90_1) (envelope-from <michael@anarch128.org>)
 id 1thB68-0006HH-OL
 for qemu-devel@nongnu.org; Sun, 09 Feb 2025 12:28:06 -0500
Received: from localhost.localdomain (default-rdns.vocus.co.nz
 [202.150.110.104] (may be forged)) (authenticated bits=0)
 by anarch128.org (8.15.2/8.15.2/Debian-22+deb11u3) with ESMTPSA id
 519HRdEo3380282
 (version=TLSv1.3 cipher=TLS_AES_256_GCM_SHA384 bits=256 verify=NO);
 Sun, 9 Feb 2025 17:27:45 GMT
Authentication-Results: anarch128.org; auth=pass;
 dkim=pass (2048-bit rsa key sha256) header.d=anarch128.org
 header.i=@anarch128.org header.b=WdsbP7FW header.a=rsa-sha256
 header.s=100003;
 x-return-mx=pass header.domain=anarch128.org policy.is_org=yes (MX Records
 found: mail.anarch128.org);
 x-return-mx=pass smtp.domain=anarch128.org policy.is_org=yes (MX Records
 found: mail.anarch128.org)
DKIM-Signature: v=1; a=rsa-sha256; c=simple/simple; d=anarch128.org;
 s=100003; t=1739122068;
 bh=3g4XuKlwn9MTjDsIvlxVRCeAKfOq1JLsz8BQ5SKR/7k=;
 h=From:To:Cc:Subject:Date:In-Reply-To:References:From;
 b=WdsbP7FW2Tnl5QnRAFPgHqhAClzhdfe6fqRBy9SMI87onTsm0P9r7JXVuwih4M/U6
 Vfki4uwDDtW2aSplu0JMXKeyaduWsaPvKfGon0F+0xhXX6YWRmGjDTj2KFd12iSdaU
 zN/lai82b+Ukx3IelIP+30aKnZ6NxG5bLVh8rvVaYB0vwtLQ0uOeQaPWchj0XujrvF
 gY0JYv1tdr1MxC5h9w3LYLfIb4QOVyEl6I39gDLa5pV0QdWPO4ihzBnpqrvSlHfEa+
 qdrVdWXoYn3AxxyAp1oLDW9BeH9YkpAdDqlz0HVcnNuDsV1YDt7c/FfNQIfiM9r7AK
 X4KPlZYqIHxIQ==
From: Michael Clark <michael@anarch128.org>
To: qemu-devel@nongnu.org, Richard Henderson <richard.henderson@linaro.org>,
 Eduardo Habkost <eduardo@habkost.net>,
 Paolo Bonzini <pbonzini@redhat.com>, Zhao Liu <zhao1.liu@intel.com>
Cc: Michael Clark <michael@anarch128.org>
Subject: [PATCH v2 1/4] x86-disas: add x86-mini instruction set metadata
Date: Mon, 10 Feb 2025 06:26:53 +1300
Message-ID: <20250209172656.1466556-2-michael@anarch128.org>
X-Mailer: git-send-email 2.43.0
In-Reply-To: <20250209172656.1466556-1-michael@anarch128.org>
References: <20250209172656.1466556-1-michael@anarch128.org>
MIME-Version: 1.0
Content-Transfer-Encoding: quoted-printable
Received-SPF: pass (zohomail.com: domain of gnu.org designates 209.51.188.17
 as permitted sender) client-ip=209.51.188.17;
 envelope-from=qemu-devel-bounces+importer=patchew.org@nongnu.org;
 helo=lists.gnu.org;
Received-SPF: pass client-ip=2001:4801:7825:104:be76:4eff:fe10:52ae;
 envelope-from=michael@anarch128.org; helo=anarch128.org
X-Spam_score_int: -16
X-Spam_score: -1.7
X-Spam_bar: -
X-Spam_report: (-1.7 / 5.0 requ) BAYES_00=-1.9, DKIM_INVALID=0.1,
 DKIM_SIGNED=0.1, SPF_HELO_PASS=-0.001, SPF_PASS=-0.001,
 WEIRD_QUOTING=0.001 autolearn=no autolearn_force=no
X-Spam_action: no action
X-BeenThere: qemu-devel@nongnu.org
X-Mailman-Version: 2.1.29
Precedence: list
List-Id: <qemu-devel.nongnu.org>
List-Unsubscribe: <https://lists.nongnu.org/mailman/options/qemu-devel>,
 <mailto:qemu-devel-request@nongnu.org?subject=unsubscribe>
List-Archive: <https://lists.nongnu.org/archive/html/qemu-devel>
List-Post: <mailto:qemu-devel@nongnu.org>
List-Help: <mailto:qemu-devel-request@nongnu.org?subject=help>
List-Subscribe: <https://lists.nongnu.org/mailman/listinfo/qemu-devel>,
 <mailto:qemu-devel-request@nongnu.org?subject=subscribe>
Errors-To: qemu-devel-bounces+importer=patchew.org@nongnu.org
Sender: qemu-devel-bounces+importer=patchew.org@nongnu.org
X-ZohoMail-DKIM: fail (Header signature does not verify)
X-ZM-MESSAGEID: 1739122158087019000
Content-Type: text/plain; charset="utf-8"

this metadata is based on x86-csv with numerous inaccuracies
fixed plus conversion of legacy instructions to a new LEX format.
this metadata has been fuzz-tested against the LLVM disassembler
for x86-64 with 64-bit ISA coverage in the order of ~99.9%.

Signed-off-by: Michael Clark <michael@anarch128.org>
---
 disas/x86-data/x86_adx.csv                |   5 +
 disas/x86-data/x86_aes.csv                |  13 +
 disas/x86-data/x86_aeskle.csv             |   3 +
 disas/x86-data/x86_aesklewide.csv         |   3 +
 disas/x86-data/x86_avx.csv                | 375 +++++++++
 disas/x86-data/x86_avx2.csv               | 171 ++++
 disas/x86-data/x86_avx5124fmaps.csv       |   5 +
 disas/x86-data/x86_avx5124vnniw.csv       |   3 +
 disas/x86-data/x86_avx512b.csv            |   3 +
 disas/x86-data/x86_avx512bf16.csv         |  10 +
 disas/x86-data/x86_avx512bitalg.csv       |  10 +
 disas/x86-data/x86_avx512bw.csv           | 291 +++++++
 disas/x86-data/x86_avx512cd.csv           |  19 +
 disas/x86-data/x86_avx512d.csv            |   2 +
 disas/x86-data/x86_avx512dq.csv           | 143 ++++
 disas/x86-data/x86_avx512er.csv           |  11 +
 disas/x86-data/x86_avx512f.csv            | 901 ++++++++++++++++++++++
 disas/x86-data/x86_avx512fp16.csv         | 237 ++++++
 disas/x86-data/x86_avx512ifma.csv         |   7 +
 disas/x86-data/x86_avx512pf.csv           |  17 +
 disas/x86-data/x86_avx512vbmi.csv         |  13 +
 disas/x86-data/x86_avx512vbmi2.csv        |  61 ++
 disas/x86-data/x86_avx512vl.csv           |   2 +
 disas/x86-data/x86_avx512vnni.csv         |  13 +
 disas/x86-data/x86_avx512vp2intersect.csv |   7 +
 disas/x86-data/x86_avx512vpopcntdq.csv    |   7 +
 disas/x86-data/x86_avxneconvert.csv       |  15 +
 disas/x86-data/x86_avxvnni.csv            |   9 +
 disas/x86-data/x86_avxvnniint8.csv        |  13 +
 disas/x86-data/x86_base.csv               | 549 +++++++++++++
 disas/x86-data/x86_bmi1.csv               |  13 +
 disas/x86-data/x86_bmi2.csv               |  17 +
 disas/x86-data/x86_cet.csv                |  15 +
 disas/x86-data/x86_cldemote.csv           |   2 +
 disas/x86-data/x86_clwb.csv               |   2 +
 disas/x86-data/x86_enqcmd.csv             |   3 +
 disas/x86-data/x86_f16c.csv               |   5 +
 disas/x86-data/x86_fma.csv                |  97 +++
 disas/x86-data/x86_fsgsbase.csv           |   9 +
 disas/x86-data/x86_gfni.csv               |  19 +
 disas/x86-data/x86_hreset.csv             |   2 +
 disas/x86-data/x86_invpcid.csv            |   2 +
 disas/x86-data/x86_lzcnt.csv              |   3 +
 disas/x86-data/x86_mmx.csv                |  60 ++
 disas/x86-data/x86_movdir64b.csv          |   2 +
 disas/x86-data/x86_movdiri.csv            |   3 +
 disas/x86-data/x86_mpx.csv                |   9 +
 disas/x86-data/x86_msrlist.csv            |   4 +
 disas/x86-data/x86_ospke.csv              |   3 +
 disas/x86-data/x86_pclmulqdq.csv          |   3 +
 disas/x86-data/x86_pconfig.csv            |   2 +
 disas/x86-data/x86_prefetchw.csv          |   7 +
 disas/x86-data/x86_raoint.csv             |   9 +
 disas/x86-data/x86_rdpid.csv              |   2 +
 disas/x86-data/x86_rdrand.csv             |   2 +
 disas/x86-data/x86_rdseed.csv             |   2 +
 disas/x86-data/x86_rtm.csv                |   5 +
 disas/x86-data/x86_serialize.csv          |   2 +
 disas/x86-data/x86_sha.csv                |   8 +
 disas/x86-data/x86_smap.csv               |   3 +
 disas/x86-data/x86_sse.csv                |  58 ++
 disas/x86-data/x86_sse2.csv               | 148 ++++
 disas/x86-data/x86_sse3.csv               |  11 +
 disas/x86-data/x86_sse4_1.csv             |  48 ++
 disas/x86-data/x86_sse4_2.csv             |   7 +
 disas/x86-data/x86_sse4_3.csv             |   2 +
 disas/x86-data/x86_ssse3.csv              |  33 +
 disas/x86-data/x86_uintr.csv              |   6 +
 disas/x86-data/x86_vaes.csv               |  17 +
 disas/x86-data/x86_vmx.csv                |  14 +
 disas/x86-data/x86_waitpkg.csv            |   4 +
 disas/x86-data/x86_wbnoinvd.csv           |   2 +
 disas/x86-data/x86_x87.csv                | 145 ++++
 disas/x86-data/x86_xsaveopt.csv           |   3 +
 74 files changed, 3731 insertions(+)
 create mode 100644 disas/x86-data/x86_adx.csv
 create mode 100644 disas/x86-data/x86_aes.csv
 create mode 100644 disas/x86-data/x86_aeskle.csv
 create mode 100644 disas/x86-data/x86_aesklewide.csv
 create mode 100644 disas/x86-data/x86_avx.csv
 create mode 100644 disas/x86-data/x86_avx2.csv
 create mode 100644 disas/x86-data/x86_avx5124fmaps.csv
 create mode 100644 disas/x86-data/x86_avx5124vnniw.csv
 create mode 100644 disas/x86-data/x86_avx512b.csv
 create mode 100644 disas/x86-data/x86_avx512bf16.csv
 create mode 100644 disas/x86-data/x86_avx512bitalg.csv
 create mode 100644 disas/x86-data/x86_avx512bw.csv
 create mode 100644 disas/x86-data/x86_avx512cd.csv
 create mode 100644 disas/x86-data/x86_avx512d.csv
 create mode 100644 disas/x86-data/x86_avx512dq.csv
 create mode 100644 disas/x86-data/x86_avx512er.csv
 create mode 100644 disas/x86-data/x86_avx512f.csv
 create mode 100644 disas/x86-data/x86_avx512fp16.csv
 create mode 100644 disas/x86-data/x86_avx512ifma.csv
 create mode 100644 disas/x86-data/x86_avx512pf.csv
 create mode 100644 disas/x86-data/x86_avx512vbmi.csv
 create mode 100644 disas/x86-data/x86_avx512vbmi2.csv
 create mode 100644 disas/x86-data/x86_avx512vl.csv
 create mode 100644 disas/x86-data/x86_avx512vnni.csv
 create mode 100644 disas/x86-data/x86_avx512vp2intersect.csv
 create mode 100644 disas/x86-data/x86_avx512vpopcntdq.csv
 create mode 100644 disas/x86-data/x86_avxneconvert.csv
 create mode 100644 disas/x86-data/x86_avxvnni.csv
 create mode 100644 disas/x86-data/x86_avxvnniint8.csv
 create mode 100644 disas/x86-data/x86_base.csv
 create mode 100644 disas/x86-data/x86_bmi1.csv
 create mode 100644 disas/x86-data/x86_bmi2.csv
 create mode 100644 disas/x86-data/x86_cet.csv
 create mode 100644 disas/x86-data/x86_cldemote.csv
 create mode 100644 disas/x86-data/x86_clwb.csv
 create mode 100644 disas/x86-data/x86_enqcmd.csv
 create mode 100644 disas/x86-data/x86_f16c.csv
 create mode 100644 disas/x86-data/x86_fma.csv
 create mode 100644 disas/x86-data/x86_fsgsbase.csv
 create mode 100644 disas/x86-data/x86_gfni.csv
 create mode 100644 disas/x86-data/x86_hreset.csv
 create mode 100644 disas/x86-data/x86_invpcid.csv
 create mode 100644 disas/x86-data/x86_lzcnt.csv
 create mode 100644 disas/x86-data/x86_mmx.csv
 create mode 100644 disas/x86-data/x86_movdir64b.csv
 create mode 100644 disas/x86-data/x86_movdiri.csv
 create mode 100644 disas/x86-data/x86_mpx.csv
 create mode 100644 disas/x86-data/x86_msrlist.csv
 create mode 100644 disas/x86-data/x86_ospke.csv
 create mode 100644 disas/x86-data/x86_pclmulqdq.csv
 create mode 100644 disas/x86-data/x86_pconfig.csv
 create mode 100644 disas/x86-data/x86_prefetchw.csv
 create mode 100644 disas/x86-data/x86_raoint.csv
 create mode 100644 disas/x86-data/x86_rdpid.csv
 create mode 100644 disas/x86-data/x86_rdrand.csv
 create mode 100644 disas/x86-data/x86_rdseed.csv
 create mode 100644 disas/x86-data/x86_rtm.csv
 create mode 100644 disas/x86-data/x86_serialize.csv
 create mode 100644 disas/x86-data/x86_sha.csv
 create mode 100644 disas/x86-data/x86_smap.csv
 create mode 100644 disas/x86-data/x86_sse.csv
 create mode 100644 disas/x86-data/x86_sse2.csv
 create mode 100644 disas/x86-data/x86_sse3.csv
 create mode 100644 disas/x86-data/x86_sse4_1.csv
 create mode 100644 disas/x86-data/x86_sse4_2.csv
 create mode 100644 disas/x86-data/x86_sse4_3.csv
 create mode 100644 disas/x86-data/x86_ssse3.csv
 create mode 100644 disas/x86-data/x86_uintr.csv
 create mode 100644 disas/x86-data/x86_vaes.csv
 create mode 100644 disas/x86-data/x86_vmx.csv
 create mode 100644 disas/x86-data/x86_waitpkg.csv
 create mode 100644 disas/x86-data/x86_wbnoinvd.csv
 create mode 100644 disas/x86-data/x86_x87.csv
 create mode 100644 disas/x86-data/x86_xsaveopt.csv

diff --git a/disas/x86-data/x86_adx.csv b/disas/x86-data/x86_adx.csv
new file mode 100644
index 000000000000..c09d68445804
--- /dev/null
+++ b/disas/x86-data/x86_adx.csv
@@ -0,0 +1,5 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"ADCX rw, rw/mw","LEX.66.0F38.W0 F6 /r","Valid","Valid","Invalid","ADX","M=
odRM:reg (r, w)","ModRM:r/m (r)","","","","Unsigned addition of r with CF, =
r/m to r, writes CF."
+"ADCX rw, rw/mw","LEX.66.0F38.W1 F6 /r","Valid","Invalid","Invalid","ADX",=
"ModRM:reg (r, w)","ModRM:r/m (r)","","","","Unsigned addition of r with CF=
, r/m to r, writes CF."
+"ADOX rw, rw/mw","LEX.F3.0F38.W0 F6 /r","Valid","Valid","Invalid","ADX","M=
odRM:reg (r, w)","ModRM:r/m (r)","","","","Unsigned addition of r with OF, =
r/m to r, writes OF."
+"ADOX rw, rw/mw","LEX.F3.0F38.W1 F6 /r","Valid","Invalid","Invalid","ADX",=
"ModRM:reg (r, w)","ModRM:r/m (r)","","","","Unsigned addition of r with OF=
, r/m to r, writes OF."
diff --git a/disas/x86-data/x86_aes.csv b/disas/x86-data/x86_aes.csv
new file mode 100644
index 000000000000..b61b8f6e87f2
--- /dev/null
+++ b/disas/x86-data/x86_aes.csv
@@ -0,0 +1,13 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"AESDEC xmm1, xmm2/m128","LEX.66.0F38.W0 DE /r","Valid","Valid","Invalid",=
"AES","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Perform one round of an =
AES decryption flow, using the Equivalent Inverse Cipher, operating on a 12=
8-bit data (state) from xmm1 with a 128-bit round key from xmm2/m128."
+"AESDECLAST xmm1, xmm2/m128","LEX.66.0F38.W0 DF /r","Valid","Valid","Inval=
id","AES","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Perform the last rou=
nd of an AES decryption flow, using the Equivalent Inverse Cipher, operatin=
g on a 128-bit data (state) from xmm1 with a 128-bit round key from xmm2/m1=
28."
+"AESENC xmm1, xmm2/m128","LEX.66.0F38.W0 DC /r","Valid","Valid","Invalid",=
"AES","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Perform one round of an =
AES encryption flow, operating on a 128-bit data (state) from xmm1 with a 1=
28-bit round key from xmm2/m128."
+"AESENCLAST xmm1, xmm2/m128","LEX.66.0F38.W0 DD /r","Valid","Valid","Inval=
id","AES","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Perform the last rou=
nd of an AES encryption flow, operating on a 128-bit data (state) from xmm1=
 with a 128-bit round key from xmm2/m128."
+"AESIMC xmm1, xmm2/m128","LEX.66.0F38.W0 DB /r","Valid","Valid","Invalid",=
"AES","ModRM:reg (w)","ModRM:r/m (r)","","","","Perform the InvMixColumn tr=
ansformation on a 128-bit round key from xmm2/m128 and store the result in =
xmm1."
+"AESKEYGENASSIST xmm1, xmm2/m128, ib","LEX.66.0F3A.W0 DF /r ib","Valid","V=
alid","Invalid","AES","ModRM:reg (w)","ModRM:r/m (r)","ib","","","Assist in=
 AES round key generation using an 8 bits Round Constant (RCON) specified i=
n the immediate byte, operating on 128 bits of data specified in xmm2/m128 =
and stores the result in xmm1."
+"VAESDEC xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.WIG DE /r","Valid","Valid=
","Invalid","AES AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","",=
"Perform one round of an AES decryption flow, using the Equivalent Inverse =
Cipher, operating on a 128-bit data (state) from xmm2 with a 128-bit round =
key from xmm3/m128; store the result in xmm1."
+"VAESDECLAST xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.WIG DF /r","Valid","V=
alid","Invalid","AES AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)",""=
,"","Perform the last round of an AES decryption flow, using the Equivalent=
 Inverse Cipher, operating on a 128-bit data (state) from xmm2 with a 128-b=
it round key from xmm3/m128; store the result in xmm1."
+"VAESENC xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.WIG DC /r","Valid","Valid=
","Invalid","AES AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","",=
"Perform one round of an AES encryption flow, operating on a 128-bit data (=
state) from xmm2 with a 128-bit round key from the xmm3/m128; store the res=
ult in xmm1."
+"VAESENCLAST xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.WIG DD /r","Valid","V=
alid","Invalid","AES AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)",""=
,"","Perform the last round of an AES encryption flow, operating on a 128-b=
it data (state) from xmm2 with a 128 bit round key from xmm3/m128; store th=
e result in xmm1."
+"VAESIMC xmm1, xmm2/m128","VEX.128.66.0F38.WIG DB /r","Valid","Valid","Inv=
alid","AES AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Perform the InvMi=
xColumn transformation on a 128-bit round key from xmm2/m128 and store the =
result in xmm1."
+"VAESKEYGENASSIST xmm1, xmm2/m128, ib","VEX.128.66.0F3A.WIG DF /r ib","Val=
id","Valid","Invalid","AES AVX","ModRM:reg (w)","ModRM:r/m (r)","ib","","",=
"Assist in AES round key generation using 8 bits Round Constant (RCON) spec=
ified in the immediate byte, operating on 128 bits of data specified in xmm=
2/m128 and stores the result in xmm1."
diff --git a/disas/x86-data/x86_aeskle.csv b/disas/x86-data/x86_aeskle.csv
new file mode 100644
index 000000000000..b933d236bccd
--- /dev/null
+++ b/disas/x86-data/x86_aeskle.csv
@@ -0,0 +1,3 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"AESDEC128KL xmm, m","LEX.F3.0F38.W0 DD /r","Valid","Valid","Invalid","AES=
KLE","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Decrypt xmm using 128-bit=
 AES key indicated by handle at m384 and store result in xmm."
+"AESDEC256KL xmm, m","LEX.F3.0F38.W0 DF /r","Valid","Valid","Invalid","AES=
KLE","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Decrypt xmm using 256-bit=
 AES key indicated by handle at m512 and store result in xmm."
diff --git a/disas/x86-data/x86_aesklewide.csv b/disas/x86-data/x86_aesklew=
ide.csv
new file mode 100644
index 000000000000..a4a27867fbcf
--- /dev/null
+++ b/disas/x86-data/x86_aesklewide.csv
@@ -0,0 +1,3 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"AESDECWIDE128KL m","LEX.F3.0F38.W0 D8 /1","Valid","Valid","Invalid","AESK=
LEWIDE","ModRM:r/m (r)","Implicit XMM0-7 (r, w)","","","","Decrypt XMM0-7 u=
sing 128-bit AES key indicated by handle at m384 and store each resultant b=
lock back to its corresponding register."
+"AESDECWIDE256KL m","LEX.F3.0F38.W0 D8 /3","Valid","Valid","Invalid","AESK=
LEWIDE","ModRM:r/m (r)","Implicit XMM0-7 (r, w)","","","","Decrypt XMM0-7 u=
sing 256-bit AES key indicated by handle at m512 and store each resultant b=
lock back to its corresponding register."
diff --git a/disas/x86-data/x86_avx.csv b/disas/x86-data/x86_avx.csv
new file mode 100644
index 000000000000..8f82d93d34e7
--- /dev/null
+++ b/disas/x86-data/x86_avx.csv
@@ -0,0 +1,375 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"VADDPD xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG 58 /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Add pa=
cked double-precision floating-point values from xmm3/mem to xmm2 and store=
 result in xmm1."
+"VADDPD ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG 58 /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Add pa=
cked double-precision floating-point values from ymm3/mem to ymm2 and store=
 result in ymm1."
+"VADDPS xmm1, xmm2, xmm3/m128","VEX.128.0F.WIG 58 /r","Valid","Valid","Inv=
alid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Add packe=
d single-precision floating-point values from xmm3/m128 to xmm2 and store r=
esult in xmm1."
+"VADDPS ymm1, ymm2, ymm3/m256","VEX.256.0F.WIG 58 /r","Valid","Valid","Inv=
alid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Add packe=
d single-precision floating-point values from ymm3/m256 to ymm2 and store r=
esult in ymm1."
+"VADDSD xmm1, xmm2, xmm3/m64","VEX.LIG.F2.0F.WIG 58 /r","Valid","Valid","I=
nvalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Add the=
 low double-precision floating-point value from xmm3/mem to xmm2 and store =
the result in xmm1."
+"VADDSS xmm1, xmm2, xmm3/m32","VEX.LIG.F3.0F.WIG 58 /r","Valid","Valid","I=
nvalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Add the=
 low single-precision floating-point value from xmm3/mem to xmm2 and store =
the result in xmm1."
+"VADDSUBPD xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG D0 /r","Valid","Valid=
","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Add=
/subtract packed double-precision floating-point values from xmm3/mem to xm=
m2 and stores result in xmm1."
+"VADDSUBPD ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG D0 /r","Valid","Valid=
","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Add=
 / subtract packed double-precision floating-point values from ymm3/mem to =
ymm2 and stores result in ymm1."
+"VADDSUBPS xmm1, xmm2, xmm3/m128","VEX.128.F2.0F.WIG D0 /r","Valid","Valid=
","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Add=
/subtract single-precision floating-point values from xmm3/mem to xmm2 and =
stores result in xmm1."
+"VADDSUBPS ymm1, ymm2, ymm3/m256","VEX.256.F2.0F.WIG D0 /r","Valid","Valid=
","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Add=
 / subtract single-precision floating-point values from ymm3/mem to ymm2 an=
d stores result in ymm1."
+"VANDNPD xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG 55 /r","Valid","Valid",=
"Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Retur=
n the bitwise logical AND NOT of packed double-precision floating-point val=
ues in xmm2 and xmm3/mem."
+"VANDNPD ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG 55 /r","Valid","Valid",=
"Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Retur=
n the bitwise logical AND NOT of packed double-precision floating-point val=
ues in ymm2 and ymm3/mem."
+"VANDNPS xmm1, xmm2, xmm3/m128","VEX.128.0F.WIG 55 /r","Valid","Valid","In=
valid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Return t=
he bitwise logical AND NOT of packed single-precision floating-point values=
 in xmm2 and xmm3/mem."
+"VANDNPS ymm1, ymm2, ymm3/m256","VEX.256.0F.WIG 55 /r","Valid","Valid","In=
valid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Return t=
he bitwise logical AND NOT of packed single-precision floating-point values=
 in ymm2 and ymm3/mem."
+"VANDPD xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG 54 /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Return=
 the bitwise logical AND of packed double-precision floating-point values i=
n xmm2 and xmm3/mem."
+"VANDPD ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG 54 /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Return=
 the bitwise logical AND of packed double-precision floating-point values i=
n ymm2 and ymm3/mem."
+"VANDPS xmm1, xmm2, xmm3/m128","VEX.128.0F.WIG 54 /r","Valid","Valid","Inv=
alid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Return th=
e bitwise logical AND of packed single-precision floating-point values in x=
mm2 and xmm3/mem."
+"VANDPS ymm1, ymm2, ymm3/m256","VEX.256.0F.WIG 54 /r","Valid","Valid","Inv=
alid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Return th=
e bitwise logical AND of packed single-precision floating-point values in y=
mm2 and ymm3/mem."
+"VBLENDPD xmm1, xmm2, xmm3/m128, ib","VEX.128.66.0F3A.WIG 0D /r ib","Valid=
","Valid","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","i=
b[3:0]","","Select packed double-precision floating-point Values from xmm2 =
and xmm3/m128 from mask in ib and store the values in xmm1."
+"VBLENDPD ymm1, ymm2, ymm3/m256, ib","VEX.256.66.0F3A.WIG 0D /r ib","Valid=
","Valid","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","i=
b[3:0]","","Select packed double-precision floating-point Values from ymm2 =
and ymm3/m256 from mask in ib and store the values in ymm1."
+"VBLENDPS xmm1, xmm2, xmm3/m128, ib","VEX.128.66.0F3A.WIG 0C /r ib","Valid=
","Valid","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","i=
b","","Select packed single-precision floating-point values from xmm2 and x=
mm3/m128 from mask in ib and store the values in xmm1."
+"VBLENDPS ymm1, ymm2, ymm3/m256, ib","VEX.256.66.0F3A.WIG 0C /r ib","Valid=
","Valid","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","i=
b","","Select packed single-precision floating-point values from ymm2 and y=
mm3/m256 from mask in ib and store the values in ymm1."
+"VBLENDVPD xmm1, xmm2, xmm3/m128, xmm4","VEX.128.66.0F3A.W0 4B /r /is4","V=
alid","Valid","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)=
","ib[7:4]","","Conditionally copy double-precision floating-point values f=
rom xmm2 or xmm3/m128 to xmm1, based on mask bits in the mask operand, xmm4=
."
+"VBLENDVPD ymm1, ymm2, ymm3/m256, ymm4","VEX.256.66.0F3A.W0 4B /r /is4","V=
alid","Valid","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)=
","ib[7:4]","","Conditionally copy double-precision floating-point values f=
rom ymm2 or ymm3/m256 to ymm1, based on mask bits in the mask operand, ymm4=
."
+"VBLENDVPS xmm1, xmm2, xmm3/m128, xmm4","VEX.128.66.0F3A.W0 4A /r /is4","V=
alid","Valid","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)=
","ib[7:4]","","Conditionally copy single-precision floating-point values f=
rom xmm2 or xmm3/m128 to xmm1, based on mask bits in the specified mask ope=
rand, xmm4."
+"VBLENDVPS ymm1, ymm2, ymm3/m256, ymm4","VEX.256.66.0F3A.W0 4A /r /is4","V=
alid","Valid","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)=
","ib[7:4]","","Conditionally copy single-precision floating-point values f=
rom ymm2 or ymm3/m256 to ymm1, based on mask bits in the specified mask reg=
ister, ymm4."
+"VBROADCASTF128 ymm1, m128","VEX.256.66.0F38.W0 1A /r","Valid","Valid","In=
valid","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Broadcast 128 bits o=
f floating-point data in mem to low and high 128-bits in ymm1."
+"VBROADCASTSD ymm1, m64","VEX.256.66.0F38.W0 19 /r","Valid","Valid","Inval=
id","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Broadcast double-precis=
ion floating-point element in mem to four locations in ymm1."
+"VBROADCASTSS ymm1, m32","VEX.256.66.0F38.W0 18 /r","Valid","Valid","Inval=
id","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Broadcast single-precis=
ion floating-point element in mem to eight locations in ymm1."
+"VCMPPD xmm1, xmm2, xmm3/m128, ib","VEX.128.66.0F.WIG C2 /r ib","Valid","V=
alid","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","ib","=
","Compare packed double-precision floating-point values in xmm3/m128 and x=
mm2 using bits 4:0 of ib as a comparison predicate."
+"VCMPPD ymm1, ymm2, ymm3/m256, ib","VEX.256.66.0F.WIG C2 /r ib","Valid","V=
alid","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","ib","=
","Compare packed double-precision floating-point values in ymm3/m256 and y=
mm2 using bits 4:0 of ib as a comparison predicate."
+"VCMPPS xmm1, xmm2, xmm3/m128, ib","VEX.128.0F.WIG C2 /r ib","Valid","Vali=
d","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","ib","","=
Compare packed single-precision floating-point values in xmm3/m128 and xmm2=
 using bits 4:0 of ib as a comparison predicate."
+"VCMPPS ymm1, ymm2, ymm3/m256, ib","VEX.256.0F.WIG C2 /r ib","Valid","Vali=
d","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","ib","","=
Compare packed single-precision floating-point values in ymm3/m256 and ymm2=
 using bits 4:0 of ib as a comparison predicate."
+"VCMPSD xmm1, xmm2, xmm3/m64, ib","VEX.LIG.F2.0F.WIG C2 /r ib","Valid","Va=
lid","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","ib",""=
,"Compare low double-precision floating-point value in xmm3/m64 and xmm2 us=
ing bits 4:0 of ib as comparison predicate."
+"VCMPSS xmm1, xmm2, xmm3/m32, ib","VEX.LIG.F3.0F.WIG C2 /r ib","Valid","Va=
lid","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","ib",""=
,"Compare low single-precision floating-point value in xmm3/m32 and xmm2 us=
ing bits 4:0 of ib as comparison predicate."
+"VCOMISD xmm1, xmm2/m64","VEX.LIG.66.0F.WIG 2F /r","Valid","Valid","Invali=
d","AVX","ModRM:reg (r)","ModRM:r/m (r)","","","","Compare low double-preci=
sion floating-point values in xmm1 and xmm2/mem64 and set the EFLAGS flags =
accordingly."
+"VCOMISS xmm1, xmm2/m32","VEX.LIG.0F.WIG 2F /r","Valid","Valid","Invalid",=
"AVX","ModRM:reg (r)","ModRM:r/m (r)","","","","Compare low single-precisio=
n floating-point values in xmm1 and xmm2/mem32 and set the EFLAGS flags acc=
ordingly."
+"VCVTDQ2PD xmm1, xmm2/m64","VEX.128.F3.0F.WIG E6 /r","Valid","Valid","Inva=
lid","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert two packed sig=
ned doubleword integers from xmm2/mem to two packed double-precision floati=
ng-point values in xmm1."
+"VCVTDQ2PD ymm1, xmm2/m128","VEX.256.F3.0F.WIG E6 /r","Valid","Valid","Inv=
alid","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert four packed s=
igned doubleword integers from xmm2/mem to four packed double-precision flo=
ating-point values in ymm1."
+"VCVTDQ2PS xmm1, xmm2/m128","VEX.128.0F.WIG 5B /r","Valid","Valid","Invali=
d","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert four packed sign=
ed doubleword integers from xmm2/mem to four packed single-precision floati=
ng-point values in xmm1."
+"VCVTDQ2PS ymm1, ymm2/m256","VEX.256.0F.WIG 5B /r","Valid","Valid","Invali=
d","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert eight packed sig=
ned doubleword integers from ymm2/mem to eight packed single-precision floa=
ting-point values in ymm1."
+"VCVTPD2DQ xmm1, xmm2/m128","VEX.128.F2.0F.WIG E6 /r","Valid","Valid","Inv=
alid","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert two packed do=
uble-precision floating-point values in xmm2/mem to two signed doubleword i=
ntegers in xmm1."
+"VCVTPD2DQ xmm1, ymm2/m256","VEX.256.F2.0F.WIG E6 /r","Valid","Valid","Inv=
alid","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert four packed d=
ouble-precision floating-point values in ymm2/mem to four signed doubleword=
 integers in xmm1."
+"VCVTPD2PS xmm1, xmm2/m128","VEX.128.66.0F.WIG 5A /r","Valid","Valid","Inv=
alid","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert two packed do=
uble-precision floating-point values in xmm2/mem to two single-precision fl=
oating-point values in xmm1."
+"VCVTPD2PS xmm1, ymm2/m256","VEX.256.66.0F.WIG 5A /r","Valid","Valid","Inv=
alid","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert four packed d=
ouble-precision floating-point values in ymm2/mem to four single-precision =
floating-point values in xmm1."
+"VCVTPS2DQ xmm1, xmm2/m128","VEX.128.66.0F.WIG 5B /r","Valid","Valid","Inv=
alid","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert four packed s=
ingle-precision floating-point values from xmm2/mem to four packed signed d=
oubleword values in xmm1."
+"VCVTPS2DQ ymm1, ymm2/m256","VEX.256.66.0F.WIG 5B /r","Valid","Valid","Inv=
alid","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert eight packed =
single-precision floating-point values from ymm2/mem to eight packed signed=
 doubleword values in ymm1."
+"VCVTPS2PD xmm1, xmm2/m64","VEX.128.0F.WIG 5A /r","Valid","Valid","Invalid=
","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert two packed single=
-precision floating-point values in xmm2/m64 to two packed double-precision=
 floating-point values in xmm1."
+"VCVTPS2PD ymm1, xmm2/m128","VEX.256.0F.WIG 5A /r","Valid","Valid","Invali=
d","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert four packed sing=
le-precision floating-point values in xmm2/m128 to four packed double-preci=
sion floating-point values in ymm1."
+"VCVTSD2SI rw, xmm1/m64","VEX.LIG.F2.0F.W0 2D /r","Valid","Valid","Invalid=
","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert one double-precis=
ion floating-point value from xmm1/m64 to one signed doubleword integer r."
+"VCVTSD2SI rw, xmm1/m64","VEX.LIG.F2.0F.W1 2D /r","Valid","Invalid","Inval=
id","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert one double-prec=
ision floating-point value from xmm1/m64 to one signed quadword integer sig=
nextended into r."
+"VCVTSD2SS xmm1, xmm2, xmm3/m64","VEX.LIG.F2.0F.WIG 5A /r","Valid","Valid"=
,"Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Conv=
ert one double-precision floating-point value in xmm3/m64 to one single-pre=
cision floating-point value and merge with high bits in xmm2."
+"VCVTSI2SD xmm1, xmm2, rw/mw","VEX.LIG.F2.0F.W0 2A /r","Valid","Valid","In=
valid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Convert =
one signed doubleword integer from r/m to one double-precision floating-poi=
nt value in xmm1."
+"VCVTSI2SD xmm1, xmm2, rw/mw","VEX.LIG.F2.0F.W1 2A /r","Valid","Invalid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Conver=
t one signed quadword integer from r/m to one double-precision floating-poi=
nt value in xmm1."
+"VCVTSI2SS xmm1, xmm2, rw/mw","VEX.LIG.F3.0F.W0 2A /r","Valid","Valid","In=
valid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Convert =
one signed doubleword integer from r/m to one single-precision floating-poi=
nt value in xmm1."
+"VCVTSI2SS xmm1, xmm2, rw/mw","VEX.LIG.F3.0F.W1 2A /r","Valid","Invalid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Conver=
t one signed quadword integer from r/m to one single-precision floating-poi=
nt value in xmm1."
+"VCVTSS2SD xmm1, xmm2, xmm3/m32","VEX.LIG.F3.0F.WIG 5A /r","Valid","Valid"=
,"Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Conv=
ert one single-precision floating-point value in xmm3/m32 to one double-pre=
cision floating-point value and merge with high bits of xmm2."
+"VCVTSS2SI rw, xmm1/m32","VEX.LIG.F3.0F.W0 2D /r","Valid","Valid","Invalid=
","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert one single-precis=
ion floating-point value from xmm1/m32 to one signed doubleword integer in =
r."
+"VCVTSS2SI rw, xmm1/m32","VEX.LIG.F3.0F.W1 2D /r","Valid","Invalid","Inval=
id","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert one single-prec=
ision floating-point value from xmm1/m32 to one signed quadword integer in =
r."
+"VCVTTPD2DQ xmm1, xmm2/m128","VEX.128.66.0F.WIG E6 /r","Valid","Valid","In=
valid","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert two packed d=
ouble-precision floating-point values in xmm2/mem to two signed doubleword =
integers in xmm1 using truncation."
+"VCVTTPD2DQ xmm1, ymm2/m256","VEX.256.66.0F.WIG E6 /r","Valid","Valid","In=
valid","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert four packed =
double-precision floating-point values in ymm2/mem to four signed doublewor=
d integers in xmm1 using truncation."
+"VCVTTPS2DQ xmm1, xmm2/m128","VEX.128.F3.0F.WIG 5B /r","Valid","Valid","In=
valid","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert four packed =
single-precision floating-point values from xmm2/mem to four packed signed =
doubleword values in xmm1 using truncation."
+"VCVTTPS2DQ ymm1, ymm2/m256","VEX.256.F3.0F.WIG 5B /r","Valid","Valid","In=
valid","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert eight packed=
 single-precision floating-point values from ymm2/mem to eight packed signe=
d doubleword values in ymm1 using truncation."
+"VCVTTSD2SI rw, xmm1/m64","VEX.LIG.F2.0F.W0 2C /r","Valid","Valid","Invali=
d","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert one double-preci=
sion floating-point value from xmm1/m64 to one signed doubleword integer in=
 r using truncation."
+"VCVTTSD2SI rw, xmm1/m64","VEX.LIG.F2.0F.W1 2C /r","Valid","Invalid","Inva=
lid","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple1 Fixed","Convert on=
e double-precision floating-point value from xmm1/m64 to one signed quadwor=
d integer in r using truncation."
+"VCVTTSS2SI rw, xmm1/m32","VEX.LIG.F3.0F.W0 2C /r","Valid","Valid","Invali=
d","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert one single-preci=
sion floating-point value from xmm1/m32 to one signed doubleword integer in=
 r using truncation."
+"VCVTTSS2SI rw, xmm1/m32","VEX.LIG.F3.0F.W1 2C /r","Valid","Invalid","Inva=
lid","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert one single-pre=
cision floating-point value from xmm1/m32 to one signed quadword integer in=
 r using truncation."
+"VDIVPD xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG 5E /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Divide=
 packed double-precision floating-point values in xmm2 by packed double-pre=
cision floating-point values in xmm3/mem."
+"VDIVPD ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG 5E /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Divide=
 packed double-precision floating-point values in ymm2 by packed double-pre=
cision floating-point values in ymm3/mem."
+"VDIVPS xmm1, xmm2, xmm3/m128","VEX.128.0F.WIG 5E /r","Valid","Valid","Inv=
alid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Divide pa=
cked single-precision floating-point values in xmm2 by packed single-precis=
ion floating-point values in xmm3/mem."
+"VDIVPS ymm1, ymm2, ymm3/m256","VEX.256.0F.WIG 5E /r","Valid","Valid","Inv=
alid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Divide pa=
cked single-precision floating-point values in ymm2 by packed single-precis=
ion floating-point values in ymm3/mem."
+"VDIVSD xmm1, xmm2, xmm3/m64","VEX.LIG.F2.0F.WIG 5E /r","Valid","Valid","I=
nvalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Divide =
low double-precision floating-point value in xmm2 by low double-precision f=
loating-point value in xmm3/m64."
+"VDIVSS xmm1, xmm2, xmm3/m32","VEX.LIG.F3.0F.WIG 5E /r","Valid","Valid","I=
nvalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Divide =
low single-precision floating-point value in xmm2 by low single-precision f=
loating-point value in xmm3/m32."
+"VDPPD xmm1, xmm2, xmm3/m128, ib","VEX.128.66.0F3A.WIG 41 /r ib","Valid","=
Valid","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","ib",=
"","Selectively multiply packed DP floating-point values from xmm2 with pac=
ked DP floating-point values from xmm3, add and selectively store the packe=
d DP floating-point values to xmm1."
+"VDPPS xmm1, xmm2, xmm3/m128, ib","VEX.128.66.0F3A.WIG 40 /r ib","Valid","=
Valid","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","ib",=
"","Multiply packed SP floating point values from xmm1 with packed SP float=
ing point values from xmm2/mem selectively add and store to xmm1."
+"VDPPS ymm1, ymm2, ymm3/m256, ib","VEX.256.66.0F3A.WIG 40 /r ib","Valid","=
Valid","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","ib",=
"","Multiply packed single-precision floating-point values from ymm2 with p=
acked SP floating point values from ymm3/mem, selectively add pairs of elem=
ents and store to ymm1."
+"VEXTRACTF128 xmm1/m128, ymm2, ib","VEX.256.66.0F3A.W0 19 /r ib","Valid","=
Valid","Invalid","AVX","ModRM:r/m (w)","ModRM:reg (r)","ib","","","Extract =
128 bits of packed floating-point values from ymm2 and store results in xmm=
1/m128."
+"VEXTRACTPS r32/m32, xmm1, ib","VEX.128.66.0F3A.WIG 17 /r ib","Valid","Val=
id","Invalid","AVX","ModRM:r/m (w)","ModRM:reg (r)","ib","","","Extract one=
 single-precision floating-point value from xmm1 at the offset specified by=
 ib and store the result in reg or m32. Zero extend the results in 64-bit r=
egister if applicable."
+"VHADDPD xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG 7C /r","Valid","Valid",=
"Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Horiz=
ontal add packed double-precision floating-point values from xmm2 and xmm3/=
mem."
+"VHADDPD ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG 7C /r","Valid","Valid",=
"Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Horiz=
ontal add packed double-precision floating-point values from ymm2 and ymm3/=
mem."
+"VHADDPS xmm1, xmm2, xmm3/m128","VEX.128.F2.0F.WIG 7C /r","Valid","Valid",=
"Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Horiz=
ontal add packed single-precision floating-point values from xmm2 and xmm3/=
mem."
+"VHADDPS ymm1, ymm2, ymm3/m256","VEX.256.F2.0F.WIG 7C /r","Valid","Valid",=
"Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Horiz=
ontal add packed single-precision floating-point values from ymm2 and ymm3/=
mem."
+"VHSUBPD xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG 7D /r","Valid","Valid",=
"Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Horiz=
ontal subtract packed double-precision floating-point values from xmm2 and =
xmm3/mem."
+"VHSUBPD ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG 7D /r","Valid","Valid",=
"Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Horiz=
ontal subtract packed double-precision floating-point values from ymm2 and =
ymm3/mem."
+"VHSUBPS xmm1, xmm2, xmm3/m128","VEX.128.F2.0F.WIG 7D /r","Valid","Valid",=
"Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Horiz=
ontal subtract packed single-precision floating-point values from xmm2 and =
xmm3/mem."
+"VHSUBPS ymm1, ymm2, ymm3/m256","VEX.256.F2.0F.WIG 7D /r","Valid","Valid",=
"Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Horiz=
ontal subtract packed single-precision floating-point values from ymm2 and =
ymm3/mem."
+"VINSERTF128 ymm1, ymm2, xmm3/m128, ib","VEX.256.66.0F3A.W0 18 /r ib","Val=
id","Valid","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)",=
"ib","","Insert 128 bits of packed floating-point values from xmm3/m128 and=
 the remaining values from ymm2 into ymm1."
+"VINSERTPS xmm1, xmm2, xmm3/m32, ib","VEX.128.66.0F3A.WIG 21 /r ib","Valid=
","Valid","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","i=
b","","Insert a single-precision floating-point value selected by ib from x=
mm3/m32 and merge with values in xmm2 at the specified destination element =
specified by ib and write out the result and zero out destination elements =
in xmm1 as indicated in ib."
+"VLDDQU xmm1, m128","VEX.128.F2.0F.WIG F0 /r","Valid","Valid","Invalid","A=
VX","ModRM:reg (w)","ModRM:r/m (r)","","","","Load unaligned packed integer=
 values from mem to xmm1."
+"VLDDQU ymm1, m256","VEX.256.F2.0F.WIG F0 /r","Valid","Valid","Invalid","A=
VX","ModRM:reg (w)","ModRM:r/m (r)","","","","Load unaligned packed integer=
 values from mem to ymm1."
+"VLDMXCSR m32","VEX.LZ.0F.WIG AE /2","Valid","Valid","Invalid","AVX","ModR=
M:r/m (r, ModRM:[7:6] must not be 11b)","","","","","Load MXCSR register fr=
om m32."
+"VMASKMOVDQU xmm1, xmm2","VEX.128.66.0F.WIG F7 /r","Valid","Valid","Invali=
d","AVX","ModRM:reg (r)","ModRM:r/m (r)","RDI (r)","","","Selectively write=
 bytes from xmm1 to memory location using the byte mask in xmm2. The defaul=
t memory location is specified by DS:DI/EDI/RDI."
+"VMASKMOVPD xmm1, xmm2, m128","VEX.128.66.0F38.W0 2D /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Condit=
ionally load packed double-precision values from m128 using mask in xmm2 an=
d store in xmm1."
+"VMASKMOVPD ymm1, ymm2, m256","VEX.256.66.0F38.W0 2D /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Condit=
ionally load packed double-precision values from m256 using mask in ymm2 an=
d store in ymm1."
+"VMASKMOVPD m128, xmm1, xmm2","VEX.128.66.0F38.W0 2F /r","Valid","Valid","=
Invalid","AVX","ModRM:r/m (w)","VEX.vvvv (r)","ModRM:reg (r)","","","Condit=
ionally store packed double-precision values from xmm2 using mask in xmm1."
+"VMASKMOVPD m256, ymm1, ymm2","VEX.256.66.0F38.W0 2F /r","Valid","Valid","=
Invalid","AVX","ModRM:r/m (w)","VEX.vvvv (r)","ModRM:reg (r)","","","Condit=
ionally store packed double-precision values from ymm2 using mask in ymm1."
+"VMASKMOVPS xmm1, xmm2, m128","VEX.128.66.0F38.W0 2C /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Condit=
ionally load packed single-precision values from m128 using mask in xmm2 an=
d store in xmm1."
+"VMASKMOVPS ymm1, ymm2, m256","VEX.256.66.0F38.W0 2C /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Condit=
ionally load packed single-precision values from m256 using mask in ymm2 an=
d store in ymm1."
+"VMASKMOVPS m128, xmm1, xmm2","VEX.128.66.0F38.W0 2E /r","Valid","Valid","=
Invalid","AVX","ModRM:r/m (w)","VEX.vvvv (r)","ModRM:reg (r)","","","Condit=
ionally store packed single-precision values from xmm2 using mask in xmm1."
+"VMASKMOVPS m256, ymm1, ymm2","VEX.256.66.0F38.W0 2E /r","Valid","Valid","=
Invalid","AVX","ModRM:r/m (w)","VEX.vvvv (r)","ModRM:reg (r)","","","Condit=
ionally store packed single-precision values from ymm2 using mask in ymm1."
+"VMAXPD xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG 5F /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Return=
 the maximum double-precision floating-point values between xmm2 and xmm3/m=
128."
+"VMAXPD ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG 5F /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Return=
 the maximum packed double-precision floating-point values between ymm2 and=
 ymm3/m256."
+"VMAXPS xmm1, xmm2, xmm3/m128","VEX.128.0F.WIG 5F /r","Valid","Valid","Inv=
alid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Return th=
e maximum single-precision floating-point values between xmm2 and xmm3/mem."
+"VMAXPS ymm1, ymm2, ymm3/m256","VEX.256.0F.WIG 5F /r","Valid","Valid","Inv=
alid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Return th=
e maximum single-precision floating-point values between ymm2 and ymm3/mem."
+"VMAXSD xmm1, xmm2, xmm3/m64","VEX.LIG.F2.0F.WIG 5F /r","Valid","Valid","I=
nvalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Return =
the maximum scalar double-precision floating-point value between xmm3/m64 a=
nd xmm2."
+"VMAXSS xmm1, xmm2, xmm3/m32","VEX.LIG.F3.0F.WIG 5F /r","Valid","Valid","I=
nvalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Return =
the maximum scalar single-precision floating-point value between xmm3/m32 a=
nd xmm2."
+"VMINPD xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG 5D /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Return=
 the minimum double-precision floating-point values between xmm2 and xmm3/m=
em."
+"VMINPD ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG 5D /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Return=
 the minimum packed double-precision floating-point values between ymm2 and=
 ymm3/mem."
+"VMINPS xmm1, xmm2, xmm3/m128","VEX.128.0F.WIG 5D /r","Valid","Valid","Inv=
alid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Return th=
e minimum single-precision floating-point values between xmm2 and xmm3/mem."
+"VMINPS ymm1, ymm2, ymm3/m256","VEX.256.0F.WIG 5D /r","Valid","Valid","Inv=
alid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Return th=
e minimum single double-precision floating-point values between ymm2 and ym=
m3/mem."
+"VMINSD xmm1, xmm2, xmm3/m64","VEX.LIG.F2.0F.WIG 5D /r","Valid","Valid","I=
nvalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Return =
the minimum scalar double-precision floating-point value between xmm3/m64 a=
nd xmm2."
+"VMINSS xmm1, xmm2, xmm3/m32","VEX.LIG.F3.0F.WIG 5D /r","Valid","Valid","I=
nvalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Return =
the minimum scalar single-precision floating-point value between xmm3/m32 a=
nd xmm2."
+"VMOVAPD xmm1, xmm2/m128","VEX.128.66.0F.WIG 28 /r","Valid","Valid","Inval=
id","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Move aligned packed dou=
ble-precision floating-point values from xmm2/mem to xmm1."
+"VMOVAPD ymm1, ymm2/m256","VEX.256.66.0F.WIG 28 /r","Valid","Valid","Inval=
id","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Move aligned packed dou=
ble-precision floating-point values from ymm2/mem to ymm1."
+"VMOVAPD xmm2/m128, xmm1","VEX.128.66.0F.WIG 29 /r","Valid","Valid","Inval=
id","AVX","ModRM:r/m (w)","ModRM:reg (r)","","","","Move aligned packed dou=
ble-precision floating-point values from xmm1 to xmm2/mem."
+"VMOVAPD ymm2/m256, ymm1","VEX.256.66.0F.WIG 29 /r","Valid","Valid","Inval=
id","AVX","ModRM:r/m (w)","ModRM:reg (r)","","","","Move aligned packed dou=
ble-precision floating-point values from ymm1 to ymm2/mem."
+"VMOVAPS xmm1, xmm2/m128","VEX.128.0F.WIG 28 /r","Valid","Valid","Invalid"=
,"AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Move aligned packed single=
-precision floating-point values from xmm2/mem to xmm1."
+"VMOVAPS ymm1, ymm2/m256","VEX.256.0F.WIG 28 /r","Valid","Valid","Invalid"=
,"AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Move aligned packed single=
-precision floating-point values from ymm2/mem to ymm1."
+"VMOVAPS xmm2/m128, xmm1","VEX.128.0F.WIG 29 /r","Valid","Valid","Invalid"=
,"AVX","ModRM:r/m (w)","ModRM:reg (r)","","","","Move aligned packed single=
-precision floating-point values from xmm1 to xmm2/mem."
+"VMOVAPS ymm2/m256, ymm1","VEX.256.0F.WIG 29 /r","Valid","Valid","Invalid"=
,"AVX","ModRM:r/m (w)","ModRM:reg (r)","","","","Move aligned packed single=
-precision floating-point values from ymm1 to ymm2/mem."
+"VMOVD xmm1, rw/mw","VEX.128.66.0F.W0 6E /r","Valid","Valid","Invalid","AV=
X","ModRM:reg (w)","ModRM:r/m (r)","","","","Move doubleword from r/m to xm=
m1."
+"VMOVD rw/mw, xmm1","VEX.128.66.0F.W0 7E /r","Valid","Valid","Invalid","AV=
X","ModRM:r/m (w)","ModRM:reg (r)","","","","Move doubleword from xmm1 regi=
ster to r/m."
+"VMOVDDUP xmm1, xmm2/m64","VEX.128.F2.0F.WIG 12 /r","Valid","Valid","Inval=
id","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Move double-precision f=
loating-point value from xmm2/m64 and duplicate into xmm1."
+"VMOVDDUP ymm1, ymm2/m256","VEX.256.F2.0F.WIG 12 /r","Valid","Valid","Inva=
lid","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Move even index double=
-precision floating-point values from ymm2/mem and duplicate each element i=
nto ymm1."
+"VMOVDQA xmm1, xmm2/m128","VEX.128.66.0F.WIG 6F /r","Valid","Valid","Inval=
id","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Move aligned packed int=
eger values from xmm2/mem to xmm1."
+"VMOVDQA ymm1, ymm2/m256","VEX.256.66.0F.WIG 6F /r","Valid","Valid","Inval=
id","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Move aligned packed int=
eger values from ymm2/mem to ymm1."
+"VMOVDQA xmm2/m128, xmm1","VEX.128.66.0F.WIG 7F /r","Valid","Valid","Inval=
id","AVX","ModRM:r/m (w)","ModRM:reg (r)","","","","Move aligned packed int=
eger values from xmm1 to xmm2/mem."
+"VMOVDQA ymm2/m256, ymm1","VEX.256.66.0F.WIG 7F /r","Valid","Valid","Inval=
id","AVX","ModRM:r/m (w)","ModRM:reg (r)","","","","Move aligned packed int=
eger values from ymm1 to ymm2/mem."
+"VMOVDQU xmm1, xmm2/m128","VEX.128.F3.0F.WIG 6F /r","Valid","Valid","Inval=
id","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Move unaligned packed i=
nteger values from xmm2/m128 to xmm1."
+"VMOVDQU ymm1, ymm2/m256","VEX.256.F3.0F.WIG 6F /r","Valid","Valid","Inval=
id","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Move unaligned packed i=
nteger values from ymm2/m256 to ymm1."
+"VMOVDQU xmm2/m128, xmm1","VEX.128.F3.0F.WIG 7F /r","Valid","Valid","Inval=
id","AVX","ModRM:r/m (r)","ModRM:reg (w)","","","","Move unaligned packed i=
nteger values from xmm1 to xmm2/m128."
+"VMOVDQU ymm2/m256, ymm1","VEX.256.F3.0F.WIG 7F /r","Valid","Valid","Inval=
id","AVX","ModRM:r/m (r)","ModRM:reg (w)","","","","Move unaligned packed i=
nteger values from ymm1 to ymm2/m256."
+"VMOVHPD xmm2, xmm1, m64","VEX.128.66.0F.WIG 16 /r","Valid","Valid","Inval=
id","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Merge doubl=
e-precision floating-point value from m64 and the low quadword of xmm1."
+"VMOVHPD m64, xmm1","VEX.128.66.0F.WIG 17 /r","Valid","Valid","Invalid","A=
VX","ModRM:r/m (w)","ModRM:reg (r)","","","","Move double-precision floatin=
g-point value from high quadword of xmm1 to m64."
+"VMOVHPS xmm2, xmm1, m64","VEX.128.0F.WIG 16 /r","Valid","Valid","Invalid"=
,"AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Merge two pack=
ed single-precision floating-point values from m64 and the low quadword of =
xmm1."
+"VMOVHPS m64, xmm1","VEX.128.0F.WIG 17 /r","Valid","Valid","Invalid","AVX"=
,"ModRM:r/m (w)","ModRM:reg (r)","","","","Move two packed single-precision=
 floating-point values from high quadword of xmm1 to m64."
+"VMOVLPD xmm2, xmm1, m64","VEX.128.66.0F.WIG 12 /r","Valid","Valid","Inval=
id","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Merge doubl=
e-precision floating-point value from m64 and the high quadword of xmm1."
+"VMOVLPD m64, xmm1","VEX.128.66.0F.WIG 13 /r","Valid","Valid","Invalid","A=
VX","ModRM:r/m (w)","ModRM:reg (r)","","","","Move double-precision floatin=
g-point value from low quadword of xmm1 to m64."
+"VMOVLPS xmm2, xmm1, m64","VEX.128.0F.WIG 12 /r","Valid","Valid","Invalid"=
,"AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Merge two pack=
ed single-precision floating-point values from m64 and the high quadword of=
 xmm1."
+"VMOVLPS m64, xmm1","VEX.128.0F.WIG 13 /r","Valid","Valid","Invalid","AVX"=
,"ModRM:r/m (w)","ModRM:reg (r)","","","","Move two packed single-precision=
 floating-point values from low quadword of xmm1 to m64."
+"VMOVMSKPD rw, xmm2","VEX.128.66.0F.WIG 50 /r","Valid","Valid","Invalid","=
AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Extract 2-bit sign mask from=
 xmm2 and store in reg. The upper bits of r are zeroed."
+"VMOVMSKPD rw, ymm2","VEX.256.66.0F.WIG 50 /r","Valid","Valid","Invalid","=
AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Extract 4-bit sign mask from=
 ymm2 and store in reg. The upper bits of r are zeroed."
+"VMOVMSKPS rw, xmm2","VEX.128.0F.WIG 50 /r","Valid","Valid","Invalid","AVX=
","ModRM:reg (w)","ModRM:r/m (r)","","","","Extract 4-bit sign mask from xm=
m2 and store in reg. The upper bits of r are zeroed."
+"VMOVMSKPS rw, ymm2","VEX.256.0F.WIG 50 /r","Valid","Valid","Invalid","AVX=
","ModRM:reg (w)","ModRM:r/m (r)","","","","Extract 8-bit sign mask from ym=
m2 and store in reg. The upper bits of r are zeroed."
+"VMOVNTDQ m128, xmm1","VEX.128.66.0F.WIG E7 /r","Valid","Valid","Invalid",=
"AVX","ModRM:r/m (w)","ModRM:reg (r)","","","","Move packed integer values =
in xmm1 to m128 using non-temporal hint."
+"VMOVNTDQ m256, ymm1","VEX.256.66.0F.WIG E7 /r","Valid","Valid","Invalid",=
"AVX","ModRM:r/m (w)","ModRM:reg (r)","","","","Move packed integer values =
in ymm1 to m256 using non-temporal hint."
+"VMOVNTDQA xmm1, m128","VEX.128.66.0F38.WIG 2A /r","Valid","Valid","Invali=
d","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Move double quadword fro=
m m128 to xmm using non-temporal hint if WC memory type."
+"VMOVNTPD m128, xmm1","VEX.128.66.0F.WIG 2B /r","Valid","Valid","Invalid",=
"AVX","ModRM:r/m (w)","ModRM:reg (r)","","","","Move packed double-precisio=
n values in xmm1 to m128 using non-temporal hint."
+"VMOVNTPD m256, ymm1","VEX.256.66.0F.WIG 2B /r","Valid","Valid","Invalid",=
"AVX","ModRM:r/m (w)","ModRM:reg (r)","","","","Move packed double-precisio=
n values in ymm1 to m256 using non-temporal hint."
+"VMOVNTPS m128, xmm1","VEX.128.0F.WIG 2B /r","Valid","Valid","Invalid","AV=
X","ModRM:r/m (w)","ModRM:reg (r)","","","","Move packed single-precision v=
alues xmm1 to mem using non-temporal hint."
+"VMOVNTPS m256, ymm1","VEX.256.0F.WIG 2B /r","Valid","Valid","Invalid","AV=
X","ModRM:r/m (w)","ModRM:reg (r)","","","","Move packed single-precision v=
alues ymm1 to mem using non-temporal hint."
+"VMOVQ xmm1, rw/mw","VEX.128.66.0F.W1 6E /r","Valid","Invalid","Invalid","=
AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Move quadword from r/m to xm=
m1."
+"VMOVQ rw/mw, xmm1","VEX.128.66.0F.W1 7E /r","Valid","Invalid","Invalid","=
AVX","ModRM:r/m (w)","ModRM:reg (r)","","","","Move quadword from xmm1 regi=
ster to r/m."
+"VMOVQ xmm1, xmm2/m64","VEX.128.F3.0F.WIG 7E /r","Valid","Valid","Invalid"=
,"AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Move quadword from xmm2 to=
 xmm1."
+"VMOVQ xmm1/m64, xmm2","VEX.128.66.0F.WIG D6 /r","Valid","Valid","Invalid"=
,"AVX","ModRM:r/m (w)","ModRM:reg (r)","","","","Move quadword from xmm2 re=
gister to xmm1/m64."
+"VMOVSD xmm1, m64","VEX.LIG.F2.0F.WIG 10 /r","Valid","Valid","Invalid","AV=
X","ModRM:reg (w)","ModRM:r/m (r)","","","","Load scalar double-precision f=
loating-point value from m64 to xmm1 register."
+"VMOVSD xmm1, xmm2, xmm3","VEX.LIG.F2.0F.WIG 10 /r","Valid","Valid","Inval=
id","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Merge scala=
r double-precision floating-point value from xmm2 and xmm3 to xmm1 register=
."
+"VMOVSD m64, xmm1","VEX.LIG.F2.0F.WIG 11 /r","Valid","Valid","Invalid","AV=
X","ModRM:r/m (w)","ModRM:reg (r)","","","","Store scalar double-precision =
floating-point value from xmm1 register to m64."
+"VMOVSD xmm1, xmm2, xmm3","VEX.LIG.F2.0F.WIG 11 /r","Valid","Valid","Inval=
id","AVX","ModRM:r/m (w)","VEX.vvvv (r)","ModRM:reg (r)","","","Merge scala=
r double-precision floating-point value from xmm2 and xmm3 registers to xmm=
1."
+"VMOVSHDUP xmm1, xmm2/m128","VEX.128.F3.0F.WIG 16 /r","Valid","Valid","Inv=
alid","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Move odd index single=
-precision floating-point values from xmm2/mem and duplicate each element i=
nto xmm1."
+"VMOVSHDUP ymm1, ymm2/m256","VEX.256.F3.0F.WIG 16 /r","Valid","Valid","Inv=
alid","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Move odd index single=
-precision floating-point values from ymm2/mem and duplicate each element i=
nto ymm1."
+"VMOVSLDUP xmm1, xmm2/m128","VEX.128.F3.0F.WIG 12 /r","Valid","Valid","Inv=
alid","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Move even index singl=
e-precision floating-point values from xmm2/mem and duplicate each element =
into xmm1."
+"VMOVSLDUP ymm1, ymm2/m256","VEX.256.F3.0F.WIG 12 /r","Valid","Valid","Inv=
alid","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Move even index singl=
e-precision floating-point values from ymm2/mem and duplicate each element =
into ymm1."
+"VMOVSS xmm1, m32","VEX.LIG.F3.0F.WIG 10 /r","Valid","Valid","Invalid","AV=
X","ModRM:reg (w)","ModRM:r/m (r)","","","","Load scalar single-precision f=
loating-point value from m32 to xmm1 register."
+"VMOVSS xmm1, xmm2, xmm3","VEX.LIG.F3.0F.WIG 10 /r","Valid","Valid","Inval=
id","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Merge scala=
r single-precision floating-point value from xmm2 and xmm3 to xmm1 register"
+"VMOVSS m32, xmm1","VEX.LIG.F3.0F.WIG 11 /r","Valid","Valid","Invalid","AV=
X","ModRM:r/m (w)","ModRM:reg (r)","","","","Move scalar single-precision f=
loating-point value from xmm1 register to m32."
+"VMOVSS xmm1, xmm2, xmm3","VEX.LIG.F3.0F.WIG 11 /r","Valid","Valid","Inval=
id","AVX","ModRM:r/m (w)","VEX.vvvv (r)","ModRM:reg (r)","","","Move scalar=
 single-precision floating-point value from xmm2 and xmm3 to xmm1 register."
+"VMOVUPD xmm1, xmm2/m128","VEX.128.66.0F.WIG 10 /r","Valid","Valid","Inval=
id","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Move unaligned packed d=
ouble-precision floating-point from xmm2/mem to xmm1."
+"VMOVUPD ymm1, ymm2/m256","VEX.256.66.0F.WIG 10 /r","Valid","Valid","Inval=
id","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Move unaligned packed d=
ouble-precision floating-point from ymm2/mem to ymm1."
+"VMOVUPD xmm2/m128, xmm1","VEX.128.66.0F.WIG 11 /r","Valid","Valid","Inval=
id","AVX","ModRM:r/m (w)","ModRM:reg (r)","","","","Move unaligned packed d=
ouble-precision floating-point from xmm1 to xmm2/mem."
+"VMOVUPD ymm2/m256, ymm1","VEX.256.66.0F.WIG 11 /r","Valid","Valid","Inval=
id","AVX","ModRM:r/m (w)","ModRM:reg (r)","","","","Move unaligned packed d=
ouble-precision floating-point from ymm1 to ymm2/mem."
+"VMOVUPS xmm1, xmm2/m128","VEX.128.0F.WIG 10 /r","Valid","Valid","Invalid"=
,"AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Move unaligned packed sing=
le-precision floating-point from xmm2/mem to xmm1."
+"VMOVUPS ymm1, ymm2/m256","VEX.256.0F.WIG 10 /r","Valid","Valid","Invalid"=
,"AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Move unaligned packed sing=
le-precision floating-point from ymm2/mem to ymm1."
+"VMOVUPS xmm2/m128, xmm1","VEX.128.0F.WIG 11 /r","Valid","Valid","Invalid"=
,"AVX","ModRM:r/m (w)","ModRM:reg (r)","","","","Move unaligned packed sing=
le-precision floating-point from xmm1 to xmm2/mem."
+"VMOVUPS ymm2/m256, ymm1","VEX.256.0F.WIG 11 /r","Valid","Valid","Invalid"=
,"AVX","ModRM:r/m (w)","ModRM:reg (r)","","","","Move unaligned packed sing=
le-precision floating-point from ymm1 to ymm2/mem."
+"VMPSADBW xmm1, xmm2, xmm3/m128, ib","VEX.128.66.0F3A.WIG 42 /r ib","Valid=
","Valid","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","i=
b","","Sums absolute 8-bit integer difference of adjacent groups of 4 byte =
integers in xmm2 and xmm3/m128 and writes the results in xmm1. Starting off=
sets within xmm2 and xmm3/m128 are determined by ib."
+"VMULPD xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG 59 /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Multip=
ly packed double-precision floating-point values in xmm3/m128 with xmm2 and=
 store result in xmm1."
+"VMULPD ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG 59 /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Multip=
ly packed double-precision floating-point values in ymm3/m256 with ymm2 and=
 store result in ymm1."
+"VMULPS xmm1, xmm2, xmm3/m128","VEX.128.0F.WIG 59 /r","Valid","Valid","Inv=
alid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Multiply =
packed single-precision floating-point values in xmm3/m128 with xmm2 and st=
ore result in xmm1."
+"VMULPS ymm1, ymm2, ymm3/m256","VEX.256.0F.WIG 59 /r","Valid","Valid","Inv=
alid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Multiply =
packed single-precision floating-point values in ymm3/m256 with ymm2 and st=
ore result in ymm1."
+"VMULSD xmm1, xmm2, xmm3/m64","VEX.LIG.F2.0F.WIG 59 /r","Valid","Valid","I=
nvalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Multipl=
y the low double-precision floating-point value in xmm3/m64 by low double-p=
recision floating-point value in xmm2."
+"VMULSS xmm1, xmm2, xmm3/m32","VEX.LIG.F3.0F.WIG 59 /r","Valid","Valid","I=
nvalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Multipl=
y the low single-precision floating-point value in xmm3/m32 by the low sing=
le-precision floating-point value in xmm2."
+"VORPD xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG 56 /r","Valid","Valid","I=
nvalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Return =
the bitwise logical OR of packed double-precision floating-point values in =
xmm2 and xmm3/mem."
+"VORPD ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG 56 /r","Valid","Valid","I=
nvalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Return =
the bitwise logical OR of packed double-precision floating-point values in =
ymm2 and ymm3/mem."
+"VORPS xmm1, xmm2, xmm3/m128","VEX.128.0F.WIG 56 /r","Valid","Valid","Inva=
lid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Return the=
 bitwise logical OR of packed single-precision floating-point values in xmm=
2 and xmm3/mem."
+"VORPS ymm1, ymm2, ymm3/m256","VEX.256.0F.WIG 56 /r","Valid","Valid","Inva=
lid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Return the=
 bitwise logical OR of packed single-precision floating-point values in ymm=
2 and ymm3/mem."
+"VPABSB xmm1, xmm2/m128","VEX.128.66.0F38.WIG 1C /r","Valid","Valid","Inva=
lid","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Compute the absolute v=
alue of bytes in xmm2/m128 and store UNSIGNED result in xmm1."
+"VPABSD xmm1, xmm2/m128","VEX.128.66.0F38.WIG 1E /r","Valid","Valid","Inva=
lid","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Compute the absolute v=
alue of 32-bit integers in xmm2/m128 and store UNSIGNED result in xmm1."
+"VPABSW xmm1, xmm2/m128","VEX.128.66.0F38.WIG 1D /r","Valid","Valid","Inva=
lid","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Compute the absolute v=
alue of 16-bit integers in xmm2/m128 and store UNSIGNED result in xmm1."
+"VPACKSSDW xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG 6B /r","Valid","Valid=
","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Con=
verts 4 packed signed doubleword integers from xmm2 and from xmm3/m128 into=
 8 packed signed word integers in xmm1 using signed saturation."
+"VPACKSSWB xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG 63 /r","Valid","Valid=
","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Con=
verts 8 packed signed word integers from xmm2 and from xmm3/m128 into 16 pa=
cked signed byte integers in xmm1 using signed saturation."
+"VPACKUSDW xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.WIG 2B /r","Valid","Val=
id","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","C=
onvert 4 packed signed doubleword integers from xmm2 and 4 packed signed do=
ubleword integers from xmm3/m128 into 8 packed unsigned word integers in xm=
m1 using unsigned saturation."
+"VPACKUSWB xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG 67 /r","Valid","Valid=
","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Con=
verts 8 signed word integers from xmm2 and 8 signed word integers from xmm3=
/m128 into 16 unsigned byte integers in xmm1 using unsigned saturation."
+"VPADDB xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG FC /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Add pa=
cked byte integers from xmm2, and xmm3/m128 and store in xmm1."
+"VPADDD xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG FE /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Add pa=
cked doubleword integers from xmm2, xmm3/m128 and store in xmm1."
+"VPADDQ xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG D4 /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Add pa=
cked quadword integers from xmm2, xmm3/m128 and store in xmm1."
+"VPADDSB xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG EC /r","Valid","Valid",=
"Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Add p=
acked signed byte integers from xmm3/m128 and xmm2 saturate the results."
+"VPADDSW xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG ED /r","Valid","Valid",=
"Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Add p=
acked signed word integers from xmm3/m128 and xmm2 and saturate the results=
."
+"VPADDUSB xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG DC /r","Valid","Valid"=
,"Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Add =
packed unsigned byte integers from xmm3/m128 to xmm2 and saturate the resul=
ts."
+"VPADDUSW xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG DD /r","Valid","Valid"=
,"Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Add =
packed unsigned word integers from xmm3/m128 to xmm2 and saturate the resul=
ts."
+"VPADDW xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG FD /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Add pa=
cked word integers from xmm2, xmm3/m128 and store in xmm1."
+"VPALIGNR xmm1, xmm2, xmm3/m128, ib","VEX.128.66.0F3A.WIG 0F /r ib","Valid=
","Valid","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","i=
b","","Concatenate xmm2 and xmm3/m128, extract byte aligned result shifted =
to the right by constant value in ib and result is stored in xmm1."
+"VPAND xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG DB /r","Valid","Valid","I=
nvalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Bitwise=
 AND of xmm3/m128 and xmm."
+"VPANDN xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG DF /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Bitwis=
e AND NOT of xmm3/m128 and xmm2."
+"VPAVGB xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG E0 /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Averag=
e packed unsigned byte integers from xmm3/m128 and xmm2 with rounding."
+"VPAVGW xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG E3 /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Averag=
e packed unsigned word integers from xmm3/m128 and xmm2 with rounding."
+"VPBLENDVB xmm1, xmm2, xmm3/m128, xmm4","VEX.128.66.0F3A.W0 4C /r /is4","V=
alid","Valid","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)=
","ib[7:4]","","Select byte values from xmm2 and xmm3/m128 using mask bits =
in the specified mask register, xmm4, and store the values into xmm1."
+"VPBLENDW xmm1, xmm2, xmm3/m128, ib","VEX.128.66.0F3A.WIG 0E /r ib","Valid=
","Valid","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","i=
b","","Select words from xmm2 and xmm3/m128 from mask specified in ib and s=
tore the values into xmm1."
+"VPCMPEQB xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG 74 /r","Valid","Valid"=
,"Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Comp=
are packed bytes in xmm3/m128 and xmm2 for equality."
+"VPCMPEQD xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG 76 /r","Valid","Valid"=
,"Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Comp=
are packed doublewords in xmm3/m128 and xmm2 for equality."
+"VPCMPEQQ xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.WIG 29 /r","Valid","Vali=
d","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Co=
mpare packed quadwords in xmm3/m128 and xmm2 for equality."
+"VPCMPEQW xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG 75 /r","Valid","Valid"=
,"Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Comp=
are packed words in xmm3/m128 and xmm2 for equality."
+"VPCMPESTRI xmm1, xmm2/m128, ib","VEX.128.66.0F3A.WIG 61 /r ib","Valid","V=
alid","Invalid","AVX","ModRM:reg (r)","ModRM:r/m (r)","ib","","","Perform a=
 packed comparison of string data with explicit lengths, generating an inde=
x, and storing the result in ECX."
+"VPCMPESTRM xmm1, xmm2/m128, ib","VEX.128.66.0F3A.WIG 60 /r ib","Valid","V=
alid","Invalid","AVX","ModRM:reg (r)","ModRM:r/m (r)","ib","","","Perform a=
 packed comparison of string data with explicit lengths, generating a mask,=
 and storing the result in XMM0."
+"VPCMPGTB xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG 64 /r","Valid","Valid"=
,"Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Comp=
are packed signed byte integers in xmm2 and xmm3/m128 for greater than."
+"VPCMPGTD xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG 66 /r","Valid","Valid"=
,"Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Comp=
are packed signed doubleword integers in xmm2 and xmm3/m128 for greater tha=
n."
+"VPCMPGTQ xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.WIG 37 /r","Valid","Vali=
d","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Co=
mpare packed signed qwords in xmm2 and xmm3/m128 for greater than."
+"VPCMPGTW xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG 65 /r","Valid","Valid"=
,"Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Comp=
are packed signed word integers in xmm2 and xmm3/m128 for greater than."
+"VPCMPISTRI xmm1, xmm2/m128, ib","VEX.128.66.0F3A.WIG 63 /r ib","Valid","V=
alid","Invalid","AVX","ModRM:reg (r)","ModRM:r/m (r)","ib","","","Perform a=
 packed comparison of string data with implicit lengths, generating an inde=
x, and storing the result in ECX."
+"VPCMPISTRM xmm1, xmm2/m128, ib","VEX.128.66.0F3A.WIG 62 /r ib","Valid","V=
alid","Invalid","AVX","ModRM:reg (r)","ModRM:r/m (r)","ib","","","Perform a=
 packed comparison of string data with implicit lengths, generating a Mask,=
 and storing the result in XMM0."
+"VPERM2F128 ymm1, ymm2, ymm3/m256, ib","VEX.256.66.0F3A.W0 06 /r ib","Vali=
d","Valid","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","=
ib","","Permute 128-bit floating-point fields in ymm2 and ymm3/mem using co=
ntrols from ib and store result in ymm1."
+"VPERMILPD xmm1, xmm2/m128, ib","VEX.128.66.0F3A.W0 05 /r ib","Valid","Val=
id","Invalid","AVX","ModRM:reg (w)","ModRM:r/m (r)","ib","","","Permute dou=
ble-precision floating-point values in xmm2/m128 using controls from ib."
+"VPERMILPD ymm1, ymm2/m256, ib","VEX.256.66.0F3A.W0 05 /r ib","Valid","Val=
id","Invalid","AVX","ModRM:reg (w)","ModRM:r/m (r)","ib","","","Permute dou=
ble-precision floating-point values in ymm2/m256 using controls from ib."
+"VPERMILPD xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W0 0D /r","Valid","Vali=
d","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Pe=
rmute double-precision floating-point values in xmm2 using controls from xm=
m3/m128 and store result in xmm1."
+"VPERMILPD ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W0 0D /r","Valid","Vali=
d","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Pe=
rmute double-precision floating-point values in ymm2 using controls from ym=
m3/m256 and store result in ymm1."
+"VPERMILPS xmm1, xmm2/m128, ib","VEX.128.66.0F3A.W0 04 /r ib","Valid","Val=
id","Invalid","AVX","ModRM:reg (w)","ModRM:r/m (r)","ib","","","Permute sin=
gle-precision floating-point values in xmm2/m128 using controls from ib and=
 store result in xmm1."
+"VPERMILPS ymm1, ymm2/m256, ib","VEX.256.66.0F3A.W0 04 /r ib","Valid","Val=
id","Invalid","AVX","ModRM:reg (w)","ModRM:r/m (r)","ib","","","Permute sin=
gle-precision floating-point values in ymm2/m256 using controls from ib and=
 store result in ymm1."
+"VPERMILPS xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W0 0C /r","Valid","Vali=
d","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Pe=
rmute single-precision floating-point values in xmm2 using controls from xm=
m3/m128 and store result in xmm1."
+"VPERMILPS ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W0 0C /r","Valid","Vali=
d","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Pe=
rmute single-precision floating-point values in ymm2 using controls from ym=
m3/m256 and store result in ymm1."
+"VPEXTRB r32/m8, xmm2, ib","VEX.128.66.0F3A.W0 14 /r ib","Valid","Valid","=
Invalid","AVX","ModRM:r/m (w)","ModRM:reg (r)","ib","","","Extract a byte i=
nteger value from xmm2 at the source byte offset specified by ib into reg o=
r m8. The upper bits of r are zeroed."
+"VPEXTRD r32/m32, xmm2, ib","VEX.128.66.0F3A.W0 16 /r ib","Valid","Valid",=
"Invalid","AVX","ModRM:r/m (w)","ModRM:reg (r)","ib","","","Extract a dword=
 integer value from xmm2 at the source dword offset specified by ib into r/=
m."
+"VPEXTRQ r64/m64, xmm2, ib","VEX.128.66.0F3A.W1 16 /r ib","Valid","Valid",=
"Invalid","AVX","ModRM:r/m (w)","ModRM:reg (r)","ib","","","Extract a qword=
 integer value from xmm2 at the source dword offset specified by ib into r/=
m."
+"VPEXTRW r32/m16, xmm2, ib","VEX.128.66.0F3A.W0 15 /r ib","Valid","Valid",=
"Invalid","AVX","ModRM:r/m (w)","ModRM:reg (r)","ib","","","Extract a word =
integer value from xmm2 at the source word offset specified by ib into reg =
or m16. The upper bits of r are zeroed."
+"VPEXTRW r32, xmm1, ib","VEX.128.66.0F.W0 C5 /r ib","Valid","Valid","Inval=
id","AVX","ModRM:reg (w)","ModRM:r/m (r)","ib","","","Extract the word spec=
ified by ib from xmm1 and move it to reg, bits 15:0. Zero-extend the result=
. The upper bits of r are zeroed."
+"VPHADDD xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.WIG 02 /r","Valid","Valid=
","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Add=
 32-bit integers horizontally, pack to xmm1."
+"VPHADDSW xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.WIG 03 /r","Valid","Vali=
d","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Ad=
d 16-bit signed integers horizontally, pack saturated integers to xmm1."
+"VPHADDW xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.WIG 01 /r","Valid","Valid=
","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Add=
 16-bit integers horizontally, pack to xmm1."
+"VPHMINPOSUW xmm1, xmm2/m128","VEX.128.66.0F38.WIG 41 /r","Valid","Valid",=
"Invalid","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Find the minimum =
unsigned word in xmm2/m128 and place its value in the low word of xmm1 and =
its index in the second-lowest word of xmm1."
+"VPHSUBD xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.WIG 06 /r","Valid","Valid=
","Invalid","AVX","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","","=
Subtract 32-bit signed integers horizontally, pack to xmm1."
+"VPHSUBSW xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.WIG 07 /r","Valid","Vali=
d","Invalid","AVX","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","",=
"Subtract 16-bit signed integer horizontally, pack saturated integers to xm=
m1."
+"VPHSUBW xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.WIG 05 /r","Valid","Valid=
","Invalid","AVX","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","","=
Subtract 16-bit signed integers horizontally, pack to xmm1."
+"VPINSRB xmm1, xmm2, r32/m8, ib","VEX.128.66.0F3A.W0 20 /r ib","Valid","Va=
lid","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","ib",""=
,"Merge a byte integer value from r/m8 and rest from xmm2 into xmm1 at the =
byte offset in ib."
+"VPINSRD xmm1, xmm2, r32/m32, ib","VEX.128.66.0F3A.W0 22 /r ib","Valid","V=
alid","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","ib","=
","Insert a dword integer value from r/m32 and rest from xmm2 into xmm1 at =
the dword offset in ib."
+"VPINSRQ xmm1, xmm2, r64/m64, ib","VEX.128.66.0F3A.W1 22 /r ib","Valid","I=
nvalid","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","ib"=
,"","Insert a qword integer value from r/m64 and rest from xmm2 into xmm1 a=
t the qword offset in ib."
+"VPINSRW xmm1, xmm2, r32/m16, ib","VEX.128.66.0F.W0 C4 /r ib","Valid","Val=
id","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","ib","",=
"Insert a word integer value from r/m and rest from xmm2 into xmm1 at the w=
ord offset in ib."
+"VPMADDUBSW xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.WIG 04 /r","Valid","Va=
lid","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","=
Multiply signed and unsigned bytes, add horizontal pair of signed words, pa=
ck saturated signed-words to xmm1."
+"VPMADDWD xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG F5 /r","Valid","Valid"=
,"Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Mult=
iply the packed word integers in xmm2 by the packed word integers in xmm3/m=
128, add adjacent doubleword results, and store in xmm1."
+"VPMAXSB xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.WIG 3C /r","Valid","Valid=
","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Com=
pare packed signed byte integers in xmm2 and xmm3/m128 and store packed max=
imum values in xmm1."
+"VPMAXSD xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.WIG 3D /r","Valid","Valid=
","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Com=
pare packed signed dword integers in xmm2 and xmm3/m128 and store packed ma=
ximum values in xmm1."
+"VPMAXSW xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG EE /r","Valid","Valid",=
"Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Compa=
re packed signed word integers in xmm3/m128 and xmm2 and store packed maxim=
um values in xmm1."
+"VPMAXUB xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG DE /r","Valid","Valid",=
"Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Compa=
re packed unsigned byte integers in xmm2 and xmm3/m128 and store packed max=
imum values in xmm1."
+"VPMAXUD xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.WIG 3F /r","Valid","Valid=
","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Com=
pare packed unsigned dword integers in xmm2 and xmm3/m128 and store packed =
maximum values in xmm1."
+"VPMAXUW xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.WIG 3E /r","Valid","Valid=
","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Com=
pare packed unsigned word integers in xmm3/m128 and xmm2 and store maximum =
packed values in xmm1."
+"VPMINSB xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.WIG 38 /r","Valid","Valid=
","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Com=
pare packed signed byte integers in xmm2 and xmm3/m128 and store packed min=
imum values in xmm1."
+"VPMINSD xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.WIG 39 /r","Valid","Valid=
","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Com=
pare packed signed dword integers in xmm2 and xmm3/m128 and store packed mi=
nimum values in xmm1."
+"VPMINSW xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG EA /r","Valid","Valid",=
"Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Compa=
re packed signed word integers in xmm3/m128 and xmm2 and return packed mini=
mum values in xmm1."
+"VPMINUB xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG DA /r","Valid","Valid",=
"Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Compa=
re packed unsigned byte integers in xmm2 and xmm3/m128 and store packed min=
imum values in xmm1."
+"VPMINUD xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.WIG 3B /r","Valid","Valid=
","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Com=
pare packed unsigned dword integers in xmm2 and xmm3/m128 and store packed =
minimum values in xmm1."
+"VPMINUW xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.WIG 3A /r","Valid","Valid=
","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Com=
pare packed unsigned word integers in xmm3/m128 and xmm2 and return packed =
minimum values in xmm1."
+"VPMOVMSKB r32, xmm1","VEX.128.66.0F.WIG D7 /r","Valid","Valid","Invalid",=
"AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Move a byte mask of xmm1 to=
 reg. The upper bits of r are zeroed."
+"VPMOVSXBD xmm1, xmm2/m32","VEX.128.66.0F38.WIG 21 /r","Valid","Valid","In=
valid","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Sign extend 4 packed=
 8-bit integers in the low 4 bytes of xmm2/m32 to 4 packed 32-bit integers =
in xmm1."
+"VPMOVSXBQ xmm1, xmm2/m16","VEX.128.66.0F38.WIG 22 /r","Valid","Valid","In=
valid","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Sign extend 2 packed=
 8-bit integers in the low 2 bytes of xmm2/m16 to 2 packed 64-bit integers =
in xmm1."
+"VPMOVSXBW xmm1, xmm2/m64","VEX.128.66.0F38.WIG 20 /r","Valid","Valid","In=
valid","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Sign extend 8 packed=
 8-bit integers in the low 8 bytes of xmm2/m64 to 8 packed 16-bit integers =
in xmm1."
+"VPMOVSXDQ xmm1, xmm2/m64","VEX.128.66.0F38.WIG 25 /r","Valid","Valid","In=
valid","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Sign extend 2 packed=
 32-bit integers in the low 8 bytes of xmm2/m64 to 2 packed 64-bit integers=
 in xmm1."
+"VPMOVSXWD xmm1, xmm2/m64","VEX.128.66.0F38.WIG 23 /r","Valid","Valid","In=
valid","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Sign extend 4 packed=
 16-bit integers in the low 8 bytes of xmm2/m64 to 4 packed 32-bit integers=
 in xmm1."
+"VPMOVSXWQ xmm1, xmm2/m32","VEX.128.66.0F38.WIG 24 /r","Valid","Valid","In=
valid","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Sign extend 2 packed=
 16-bit integers in the low 4 bytes of xmm2/m32 to 2 packed 64-bit integers=
 in xmm1."
+"VPMOVZXBD xmm1, xmm2/m32","VEX.128.66.0F38.WIG 31 /r","Valid","Valid","In=
valid","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Zero extend 4 packed=
 8-bit integers in the low 4 bytes of xmm2/m32 to 4 packed 32-bit integers =
in xmm1."
+"VPMOVZXBQ xmm1, xmm2/m16","VEX.128.66.0F38.WIG 32 /r","Valid","Valid","In=
valid","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Zero extend 2 packed=
 8-bit integers in the low 2 bytes of xmm2/m16 to 2 packed 64-bit integers =
in xmm1."
+"VPMOVZXBW xmm1, xmm2/m64","VEX.128.66.0F38.WIG 30 /r","Valid","Valid","In=
valid","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Zero extend 8 packed=
 8-bit integers in the low 8 bytes of xmm2/m64 to 8 packed 16-bit integers =
in xmm1."
+"VPMOVZXDQ xmm1, xmm2/m64","VEX.128.66.0F38.WIG 35 /r","Valid","Valid","In=
valid","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Zero extend 2 packed=
 32-bit integers in the low 8 bytes of xmm2/m64 to 2 packed 64-bit integers=
 in xmm1."
+"VPMOVZXWD xmm1, xmm2/m64","VEX.128.66.0F38.WIG 33 /r","Valid","Valid","In=
valid","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Zero extend 4 packed=
 16-bit integers in the low 8 bytes of xmm2/m64 to 4 packed 32-bit integers=
 in xmm1."
+"VPMOVZXWQ xmm1, xmm2/m32","VEX.128.66.0F38.WIG 34 /r","Valid","Valid","In=
valid","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Zero extend 2 packed=
 16-bit integers in the low 4 bytes of xmm2/m32 to 2 packed 64-bit integers=
 in xmm1."
+"VPMULDQ xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.WIG 28 /r","Valid","Valid=
","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Mul=
tiply packed signed doubleword integers in xmm2 by packed signed doubleword=
 integers in xmm3/m128, and store the quadword results in xmm1."
+"VPMULHRSW xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.WIG 0B /r","Valid","Val=
id","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","M=
ultiply 16-bit signed words, scale and round signed doublewords, pack high =
16 bits to xmm1."
+"VPMULHUW xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG E4 /r","Valid","Valid"=
,"Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Mult=
iply the packed unsigned word integers in xmm2 and xmm3/m128, and store the=
 high 16 bits of the results in xmm1."
+"VPMULHW xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG E5 /r","Valid","Valid",=
"Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Multi=
ply the packed signed word integers in xmm2 and xmm3/m128, and store the hi=
gh 16 bits of the results in xmm1."
+"VPMULLD xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.WIG 40 /r","Valid","Valid=
","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Mul=
tiply the packed dword signed integers in xmm2 and xmm3/m128 and store the =
low 32 bits of each product in xmm1."
+"VPMULLW xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG D5 /r","Valid","Valid",=
"Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Multi=
ply the packed dword signed integers in xmm2 and xmm3/m128 and store the lo=
w 32 bits of each product in xmm1."
+"VPMULUDQ xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG F4 /r","Valid","Valid"=
,"Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Mult=
iply packed unsigned doubleword integers in xmm2 by packed unsigned doublew=
ord integers in xmm3/m128, and store the quadword results in xmm1."
+"VPOR xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG EB /r","Valid","Valid","In=
valid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Bitwise =
OR of xmm2/m128 and xmm3."
+"VPSADBW xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG F6 /r","Valid","Valid",=
"Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Compu=
tes the absolute differences of the packed unsigned byte integers from xmm3=
/m128 and xmm2; the 8 low differences and 8 high differences are then summe=
d separately to produce two unsigned word integer results."
+"VPSHUFB xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.WIG 00 /r","Valid","Valid=
","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Shu=
ffle bytes in xmm2 according to contents of xmm3/m128."
+"VPSHUFD xmm1, xmm2/m128, ib","VEX.128.66.0F.WIG 70 /r ib","Valid","Valid"=
,"Invalid","AVX","ModRM:reg (w)","ModRM:r/m (r)","ib","","","Shuffle the do=
ublewords in xmm2/m128 based on the encoding in ib and store the result in =
xmm1."
+"VPSHUFHW xmm1, xmm2/m128, ib","VEX.128.F3.0F.WIG 70 /r ib","Valid","Valid=
","Invalid","AVX","ModRM:reg (w)","ModRM:r/m (r)","ib","","","Shuffle the h=
igh words in xmm2/m128 based on the encoding in ib and store the result in =
xmm1."
+"VPSHUFLW xmm1, xmm2/m128, ib","VEX.128.F2.0F.WIG 70 /r ib","Valid","Valid=
","Invalid","AVX","ModRM:reg (w)","ModRM:r/m (r)","ib","","","Shuffle the l=
ow words in xmm2/m128 based on the encoding in ib and store the result in x=
mm1."
+"VPSIGNB xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.WIG 08 /r","Valid","Valid=
","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Neg=
ate/zero/preserve packed byte integers in xmm2 depending on the correspondi=
ng sign in xmm3/m128."
+"VPSIGND xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.WIG 0A /r","Valid","Valid=
","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Neg=
ate/zero/preserve packed doubleword integers in xmm2 depending on the corre=
sponding sign in xmm3/m128."
+"VPSIGNW xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.WIG 09 /r","Valid","Valid=
","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Neg=
ate/zero/preserve packed word integers in xmm2 depending on the correspondi=
ng sign in xmm3/m128."
+"VPSLLD xmm1, xmm2, ib","VEX.128.66.0F.WIG 72 /6 ib","Valid","Valid","Inva=
lid","AVX","VEX.vvvv (w)","ModRM:r/m (r)","ib","","","Shift doublewords in =
xmm2 left by ib while shifting in 0s."
+"VPSLLD xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG F2 /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Shift =
doublewords in xmm2 left by amount specified in xmm3/m128 while shifting in=
 0s."
+"VPSLLDQ xmm1, xmm2, ib","VEX.128.66.0F.WIG 73 /7 ib","Valid","Valid","Inv=
alid","AVX","VEX.vvvv (w)","ModRM:r/m (r)","ib","","","Shift xmm2 left by i=
b bytes while shifting in 0s and store result in xmm1."
+"VPSLLQ xmm1, xmm2, ib","VEX.128.66.0F.WIG 73 /6 ib","Valid","Valid","Inva=
lid","AVX","VEX.vvvv (w)","ModRM:r/m (r)","ib","","","Shift quadwords in xm=
m2 left by ib while shifting in 0s."
+"VPSLLQ xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG F3 /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Shift =
quadwords in xmm2 left by amount specified in xmm3/m128 while shifting in 0=
s."
+"VPSLLW xmm1, xmm2, ib","VEX.128.66.0F.WIG 71 /6 ib","Valid","Valid","Inva=
lid","AVX","VEX.vvvv (w)","ModRM:r/m (r)","ib","","","Shift words in xmm2 l=
eft by ib while shifting in 0s."
+"VPSLLW xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG F1 /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Shift =
words in xmm2 left by amount specified in xmm3/m128 while shifting in 0s."
+"VPSRAD xmm1, xmm2, ib","VEX.128.66.0F.WIG 72 /4 ib","Valid","Valid","Inva=
lid","AVX","VEX.vvvv (w)","ModRM:r/m (r)","ib","","","Shift doublewords in =
xmm2 right by ib while shifting in sign bits."
+"VPSRAD xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG E2 /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Shift =
doublewords in xmm2 right by amount specified in xmm3/m128 while shifting i=
n sign bits."
+"VPSRAW xmm1, xmm2, ib","VEX.128.66.0F.WIG 71 /4 ib","Valid","Valid","Inva=
lid","AVX","VEX.vvvv (w)","ModRM:r/m (r)","ib","","","Shift words in xmm2 r=
ight by ib while shifting in sign bits."
+"VPSRAW xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG E1 /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Shift =
words in xmm2 right by amount specified in xmm3/m128 while shifting in sign=
 bits."
+"VPSRLD xmm1, xmm2, ib","VEX.128.66.0F.WIG 72 /2 ib","Valid","Valid","Inva=
lid","AVX","VEX.vvvv (w)","ModRM:r/m (r)","ib","","","Shift doublewords in =
xmm2 right by ib while shifting in 0s."
+"VPSRLD xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG D2 /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Shift =
doublewords in xmm2 right by amount specified in xmm3/m128 while shifting i=
n 0s."
+"VPSRLDQ xmm1, xmm2, ib","VEX.128.66.0F.WIG 73 /3 ib","Valid","Valid","Inv=
alid","AVX","VEX.vvvv (w)","ModRM:r/m (r)","ib","","","Shift xmm2 right by =
ib bytes while shifting in 0s."
+"VPSRLQ xmm1, xmm2, ib","VEX.128.66.0F.WIG 73 /2 ib","Valid","Valid","Inva=
lid","AVX","VEX.vvvv (w)","ModRM:r/m (r)","ib","","","Shift quadwords in xm=
m2 right by ib while shifting in 0s."
+"VPSRLQ xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG D3 /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Shift =
quadwords in xmm2 right by amount specified in xmm3/m128 while shifting in =
0s."
+"VPSRLW xmm1, xmm2, ib","VEX.128.66.0F.WIG 71 /2 ib","Valid","Valid","Inva=
lid","AVX","VEX.vvvv (w)","ModRM:r/m (r)","ib","","","Shift words in xmm2 r=
ight by ib while shifting in 0s."
+"VPSRLW xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG D1 /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Shift =
words in xmm2 right by amount specified in xmm3/m128 while shifting in 0s."
+"VPSUBB xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG F8 /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Subtra=
ct packed byte integers in xmm3/m128 from xmm2."
+"VPSUBD xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG FA /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Subtra=
ct packed doubleword integers in xmm3/m128 from xmm2."
+"VPSUBQ xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG FB /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Subtra=
ct packed quadword integers in xmm3/m128 from xmm2."
+"VPSUBSB xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG E8 /r","Valid","Valid",=
"Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Subtr=
act packed signed byte integers in xmm3/m128 from packed signed byte intege=
rs in xmm2 and saturate results."
+"VPSUBSW xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG E9 /r","Valid","Valid",=
"Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Subtr=
act packed signed word integers in xmm3/m128 from packed signed word intege=
rs in xmm2 and saturate results."
+"VPSUBUSB xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG D8 /r","Valid","Valid"=
,"Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Subt=
ract packed unsigned byte integers in xmm3/m128 from packed unsigned byte i=
ntegers in xmm2 and saturate result."
+"VPSUBUSW xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG D9 /r","Valid","Valid"=
,"Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Subt=
ract packed unsigned word integers in xmm3/m128 from packed unsigned word i=
ntegers in xmm2 and saturate result."
+"VPSUBW xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG F9 /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Subtra=
ct packed word integers in xmm3/m128 from xmm2."
+"VPTEST xmm1, xmm2/m128","VEX.128.66.0F38.WIG 17 /r","Valid","Valid","Inva=
lid","AVX","ModRM:reg (r)","ModRM:r/m (r)","","","","Set ZF and CF dependin=
g on bitwise AND and ANDN of sources."
+"VPTEST ymm1, ymm2/m256","VEX.256.66.0F38.WIG 17 /r","Valid","Valid","Inva=
lid","AVX","ModRM:reg (r)","ModRM:r/m (r)","","","","Set ZF and CF dependin=
g on bitwise AND and ANDN of sources."
+"VPUNPCKHBW xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG 68 /r","Valid","Vali=
d","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","In=
terleave high-order bytes from xmm2 and xmm3/m128 into xmm1."
+"VPUNPCKHDQ xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG 6A /r","Valid","Vali=
d","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","In=
terleave high-order doublewords from xmm2 and xmm3/m128 into xmm1."
+"VPUNPCKHQDQ xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG 6D /r","Valid","Val=
id","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","I=
nterleave high-order quadword from xmm2 and xmm3/m128 into xmm1 register."
+"VPUNPCKHWD xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG 69 /r","Valid","Vali=
d","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","In=
terleave high-order words from xmm2 and xmm3/m128 into xmm1."
+"VPUNPCKLBW xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG 60 /r","Valid","Vali=
d","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","In=
terleave low-order bytes from xmm2 and xmm3/m128 into xmm1."
+"VPUNPCKLDQ xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG 62 /r","Valid","Vali=
d","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","In=
terleave low-order doublewords from xmm2 and xmm3/m128 into xmm1."
+"VPUNPCKLQDQ xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG 6C /r","Valid","Val=
id","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","I=
nterleave low-order quadword from xmm2 and xmm3/m128 into xmm1 register."
+"VPUNPCKLWD xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG 61 /r","Valid","Vali=
d","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","In=
terleave low-order words from xmm2 and xmm3/m128 into xmm1."
+"VPXOR xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG EF /r","Valid","Valid","I=
nvalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Bitwise=
 XOR of xmm3/m128 and xmm2."
+"VRCPPS xmm1, xmm2/m128","VEX.128.0F.WIG 53 /r","Valid","Valid","Invalid",=
"AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Computes the approximate re=
ciprocals of packed single-precision values in xmm2/mem and stores the resu=
lts in xmm1."
+"VRCPPS ymm1, ymm2/m256","VEX.256.0F.WIG 53 /r","Valid","Valid","Invalid",=
"AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Computes the approximate re=
ciprocals of packed single-precision values in ymm2/mem and stores the resu=
lts in ymm1."
+"VRCPSS xmm1, xmm2, xmm3/m32","VEX.LIG.F3.0F.WIG 53 /r","Valid","Valid","I=
nvalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Compute=
s the approximate reciprocal of the scalar single-precision floating-point =
value in xmm3/m32 and stores the result in xmm1. Also, upper single precisi=
on floating-point values (bits[127:32]) from xmm2 are copied to xmm1[127:32=
]."
+"VROUNDPD xmm1, xmm2/m128, ib","VEX.128.66.0F3A.WIG 09 /r ib","Valid","Val=
id","Invalid","AVX","ModRM:reg (w)","ModRM:r/m (r)","ib","","","Round packe=
d double-precision floating-point values in xmm2/m128 and place the result =
in xmm1. The rounding mode is determined by ib."
+"VROUNDPD ymm1, ymm2/m256, ib","VEX.256.66.0F3A.WIG 09 /r ib","Valid","Val=
id","Invalid","AVX","ModRM:reg (w)","ModRM:r/m (r)","ib","","","Round packe=
d double-precision floating-point values in ymm2/m256 and place the result =
in ymm1. The rounding mode is determined by ib."
+"VROUNDPS xmm1, xmm2/m128, ib","VEX.128.66.0F3A.WIG 08 /r ib","Valid","Val=
id","Invalid","AVX","ModRM:reg (w)","ModRM:r/m (r)","ib","","","Round packe=
d single-precision floating-point values in xmm2/m128 and place the result =
in xmm1. The rounding mode is determined by ib."
+"VROUNDPS ymm1, ymm2/m256, ib","VEX.256.66.0F3A.WIG 08 /r ib","Valid","Val=
id","Invalid","AVX","ModRM:reg (w)","ModRM:r/m (r)","ib","","","Round packe=
d single-precision floating-point values in ymm2/m256 and place the result =
in ymm1. The rounding mode is determined by ib."
+"VROUNDSD xmm1, xmm2, xmm3/m64, ib","VEX.LIG.66.0F3A.WIG 0B /r ib","Valid"=
,"Valid","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","ib=
","","Round the low packed double precision floating-point value in xmm3/m6=
4 and place the result in xmm1. The rounding mode is determined by ib. Uppe=
r packed double precision floating-point value (bits[127:64]) from xmm2 is =
copied to xmm1[127:64]."
+"VROUNDSS xmm1, xmm2, xmm3/m32, ib","VEX.LIG.66.0F3A.WIG 0A /r ib","Valid"=
,"Valid","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","ib=
","","Round the low packed single precision floating-point value in xmm3/m3=
2 and place the result in xmm1. The rounding mode is determined by ib. Also=
, upper packed single precision floating-point values (bits[127:32]) from x=
mm2 are copied to xmm1[127:32]."
+"VRSQRTPS xmm1, xmm2/m128","VEX.128.0F.WIG 52 /r","Valid","Valid","Invalid=
","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Computes the approximate =
reciprocals of the square roots of packed single-precision values in xmm2/m=
em and stores the results in xmm1."
+"VRSQRTPS ymm1, ymm2/m256","VEX.256.0F.WIG 52 /r","Valid","Valid","Invalid=
","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Computes the approximate =
reciprocals of the square roots of packed single-precision values in ymm2/m=
em and stores the results in ymm1."
+"VRSQRTSS xmm1, xmm2, xmm3/m32","VEX.LIG.F3.0F.WIG 52 /r","Valid","Valid",=
"Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Compu=
tes the approximate reciprocal of the square root of the low single precisi=
on floating-point value in xmm3/m32 and stores the results in xmm1. Also, u=
pper single precision floating-point values (bits[127:32]) from xmm2 are co=
pied to xmm1[127:32]."
+"VSHUFPD xmm1, xmm2, xmm3/m128, ib","VEX.128.66.0F.WIG C6 /r ib","Valid","=
Valid","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","ib",=
"","Shuffle two pairs of double-precision floating-point values from xmm2 a=
nd xmm3/m128 using ib to select from each pair, interleaved result is store=
d in xmm1."
+"VSHUFPD ymm1, ymm2, ymm3/m256, ib","VEX.256.66.0F.WIG C6 /r ib","Valid","=
Valid","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","ib",=
"","Shuffle four pairs of double-precision floating-point values from ymm2 =
and ymm3/m256 using ib to select from each pair, interleaved result is stor=
ed in xmm1."
+"VSHUFPS xmm1, xmm2, xmm3/m128, ib","VEX.128.0F.WIG C6 /r ib","Valid","Val=
id","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","ib","",=
"Select from quadruplet of single-precision floating-point values in xmm1 a=
nd xmm2/m128 using ib, interleaved result pairs are stored in xmm1."
+"VSHUFPS ymm1, ymm2, ymm3/m256, ib","VEX.256.0F.WIG C6 /r ib","Valid","Val=
id","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","ib","",=
"Select from quadruplet of single-precision floating-point values in ymm2 a=
nd ymm3/m256 using ib, interleaved result pairs are stored in ymm1."
+"VSQRTPD xmm1, xmm2/m128","VEX.128.66.0F.WIG 51 /r","Valid","Valid","Inval=
id","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Computes Square Roots o=
f the packed double-precision floating-point values in xmm2/m128 and stores=
 the result in xmm1."
+"VSQRTPD ymm1, ymm2/m256","VEX.256.66.0F.WIG 51 /r","Valid","Valid","Inval=
id","AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Computes Square Roots o=
f the packed double-precision floating-point values in ymm2/m256 and stores=
 the result in ymm1."
+"VSQRTPS xmm1, xmm2/m128","VEX.128.0F.WIG 51 /r","Valid","Valid","Invalid"=
,"AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Computes Square Roots of t=
he packed single-precision floating-point values in xmm2/m128 and stores th=
e result in xmm1."
+"VSQRTPS ymm1, ymm2/m256","VEX.256.0F.WIG 51 /r","Valid","Valid","Invalid"=
,"AVX","ModRM:reg (w)","ModRM:r/m (r)","","","","Computes Square Roots of t=
he packed single-precision floating-point values in ymm2/m256 and stores th=
e result in ymm1."
+"VSQRTSD xmm1, xmm2, xmm3/m64","VEX.LIG.F2.0F.WIG 51 /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Comput=
es square root of the low double-precision floating-point value in xmm3/m64=
 and stores the results in xmm1. Also, upper double-precision floating-poin=
t value (bits[127:64]) from xmm2 is copied to xmm1[127:64]."
+"VSQRTSS xmm1, xmm2, xmm3/m32","VEX.LIG.F3.0F.WIG 51 /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Comput=
es square root of the low single-precision floating-point value in xmm3/m32=
 and stores the results in xmm1. Also, upper single-precision floating-poin=
t values (bits[127:32]) from xmm2 are copied to xmm1[127:32]."
+"VSTMXCSR m32","VEX.LZ.0F.WIG AE /3","Valid","Valid","Invalid","AVX","ModR=
M:r/m (w, ModRM:[7:6] must not be 11b)","","","","","Store contents of MXCS=
R register to m32."
+"VSUBPD xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG 5C /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Subtra=
ct packed double-precision floating-point values in xmm3/mem from xmm2 and =
store result in xmm1."
+"VSUBPD ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG 5C /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Subtra=
ct packed double-precision floating-point values in ymm3/mem from ymm2 and =
store result in ymm1."
+"VSUBPS xmm1, xmm2, xmm3/m128","VEX.128.0F.WIG 5C /r","Valid","Valid","Inv=
alid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Subtract =
packed single-precision floating-point values in xmm3/mem from xmm2 and sto=
res result in xmm1."
+"VSUBPS ymm1, ymm2, ymm3/m256","VEX.256.0F.WIG 5C /r","Valid","Valid","Inv=
alid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Subtract =
packed single-precision floating-point values in ymm3/mem from ymm2 and sto=
res result in ymm1."
+"VSUBSD xmm1, xmm2, xmm3/m64","VEX.LIG.F2.0F.WIG 5C /r","Valid","Valid","I=
nvalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Subtrac=
t the low double-precision floating-point value in xmm3/m64 from xmm2 and s=
tore the result in xmm1."
+"VSUBSS xmm1, xmm2, xmm3/m32","VEX.LIG.F3.0F.WIG 5C /r","Valid","Valid","I=
nvalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Subtrac=
t the low single-precision floating-point value in xmm3/m32 from xmm2 and s=
tore the result in xmm1."
+"VTESTPD xmm1, xmm2/m128","VEX.128.66.0F38.W0 0F /r","Valid","Valid","Inva=
lid","AVX","ModRM:reg (r)","ModRM:r/m (r)","","","","Set ZF and CF dependin=
g on sign bit AND and ANDN of packed double-precision floating-point source=
s."
+"VTESTPD ymm1, ymm2/m256","VEX.256.66.0F38.W0 0F /r","Valid","Valid","Inva=
lid","AVX","ModRM:reg (r)","ModRM:r/m (r)","","","","Set ZF and CF dependin=
g on sign bit AND and ANDN of packed double-precision floating-point source=
s."
+"VTESTPS xmm1, xmm2/m128","VEX.128.66.0F38.W0 0E /r","Valid","Valid","Inva=
lid","AVX","ModRM:reg (r)","ModRM:r/m (r)","","","","Set ZF and CF dependin=
g on sign bit AND and ANDN of packed single-precision floating-point source=
s."
+"VTESTPS ymm1, ymm2/m256","VEX.256.66.0F38.W0 0E /r","Valid","Valid","Inva=
lid","AVX","ModRM:reg (r)","ModRM:r/m (r)","","","","Set ZF and CF dependin=
g on sign bit AND and ANDN of packed single-precision floating-point source=
s."
+"VUCOMISD xmm1, xmm2/m64","VEX.LIG.66.0F.WIG 2E /r","Valid","Valid","Inval=
id","AVX","ModRM:reg (r)","ModRM:r/m (r)","","","","Compare low double-prec=
ision floating-point values in xmm1 and xmm2/mem64 and set the EFLAGS flags=
 accordingly."
+"VUCOMISS xmm1, xmm2/m32","VEX.LIG.0F.WIG 2E /r","Valid","Valid","Invalid"=
,"AVX","ModRM:reg (r)","ModRM:r/m (r)","","","","Compare low single-precisi=
on floating-point values in xmm1 and xmm2/mem32 and set the EFLAGS flags ac=
cordingly."
+"VUNPCKHPD xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG 15 /r","Valid","Valid=
","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Unp=
acks and Interleaves double-precision floating-point values from high quadw=
ords of xmm2 and xmm3/m128."
+"VUNPCKHPD ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG 15 /r","Valid","Valid=
","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Unp=
acks and Interleaves double-precision floating-point values from high quadw=
ords of ymm2 and ymm3/m256."
+"VUNPCKHPS xmm1, xmm2, xmm3/m128","VEX.128.0F.WIG 15 /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Unpack=
s and Interleaves single-precision floating-point values from high quadword=
s of xmm2 and xmm3/m128."
+"VUNPCKHPS ymm1, ymm2, ymm3/m256","VEX.256.0F.WIG 15 /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Unpack=
s and Interleaves single-precision floating-point values from high quadword=
s of ymm2 and ymm3/m256."
+"VUNPCKLPD xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG 14 /r","Valid","Valid=
","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Unp=
acks and Interleaves double-precision floating-point values from low quadwo=
rds of xmm2 and xmm3/m128."
+"VUNPCKLPD ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG 14 /r","Valid","Valid=
","Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Unp=
acks and Interleaves double-precision floating-point values from low quadwo=
rds of ymm2 and ymm3/m256."
+"VUNPCKLPS xmm1, xmm2, xmm3/m128","VEX.128.0F.WIG 14 /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Unpack=
s and Interleaves single-precision floating-point values from low quadwords=
 of xmm2 and xmm3/m128."
+"VUNPCKLPS ymm1, ymm2, ymm3/m256","VEX.256.0F.WIG 14 /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Unpack=
s and Interleaves single-precision floating-point values from low quadwords=
 of ymm2 and ymm3/m256."
+"VXORPD xmm1, xmm2, xmm3/m128","VEX.128.66.0F.WIG 57 /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Return=
 the bitwise logical XOR of packed double-precision floating-point values i=
n xmm2 and xmm3/mem."
+"VXORPD ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG 57 /r","Valid","Valid","=
Invalid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Return=
 the bitwise logical XOR of packed double-precision floating-point values i=
n ymm2 and ymm3/mem."
+"VXORPS xmm1, xmm2, xmm3/m128","VEX.128.0F.WIG 57 /r","Valid","Valid","Inv=
alid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Return th=
e bitwise logical XOR of packed single-precision floating-point values in x=
mm2 and xmm3/mem."
+"VXORPS ymm1, ymm2, ymm3/m256","VEX.256.0F.WIG 57 /r","Valid","Valid","Inv=
alid","AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Return th=
e bitwise logical XOR of packed single-precision floating-point values in y=
mm2 and ymm3/mem."
+"VZEROALL","VEX.256.0F.WIG 77","Valid","Valid","Invalid","AVX","","","",""=
,"","Zero all YMM registers."
+"VZEROUPPER","VEX.128.0F.WIG 77","Valid","Valid","Invalid","AVX","","","",=
"","","Zero upper 128 bits of all YMM registers."
diff --git a/disas/x86-data/x86_avx2.csv b/disas/x86-data/x86_avx2.csv
new file mode 100644
index 000000000000..f512ccb3e20d
--- /dev/null
+++ b/disas/x86-data/x86_avx2.csv
@@ -0,0 +1,171 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"VBROADCASTI128 ymm1, m128","VEX.256.66.0F38.W0 5A /r","Valid","Valid","In=
valid","AVX2","ModRM:reg (w)","ModRM:r/m (r)","","","","Broadcast 128 bits =
of integer data in mem to low and high 128-bits in ymm1."
+"VBROADCASTSD ymm1, xmm2","VEX.256.66.0F38.W0 19 /r","Valid","Valid","Inva=
lid","AVX2","ModRM:reg (w)","ModRM:r/m (r)","","","","Broadcast low double-=
precision floating-point element in the source operand to four locations in=
 ymm1."
+"VBROADCASTSS xmm1, xmm2","VEX.128.66.0F38.W0 18 /r","Valid","Valid","Inva=
lid","AVX2","ModRM:reg (w)","ModRM:r/m (r)","","","","Broadcast the low sin=
gle-precision floating-point element in the source operand to four location=
s in xmm1."
+"VEXTRACTI128 xmm1/m128, ymm2, ib","VEX.256.66.0F3A.W0 39 /r ib","Valid","=
Valid","Invalid","AVX2","ModRM:r/m (w)","ModRM:reg (r)","ib","","","Extract=
 128 bits of integer data from ymm2 and store results in xmm1/m128."
+"VGATHERDPD xmm1, vm32x/f64x2, xmm2","VEX.128.66.0F38.W1 92 /r","Valid","V=
alid","Invalid","AVX2","ModRM:reg (r, w)","BaseReg (r): VSIB:base, VectorRe=
g (r): VSIB:index","VEX.vvvv (r, w)","","","Using dword indices specified i=
n vm32x, gather double-pre-cision FP values from memory conditioned on mask=
 speci-fied by xmm2. Conditionally gathered elements are merged into xmm1."
+"VGATHERDPD ymm1, vm32x/f64x4, ymm2","VEX.256.66.0F38.W1 92 /r","Valid","V=
alid","Invalid","AVX2","ModRM:reg (r, w)","BaseReg (r): VSIB:base, VectorRe=
g (r): VSIB:index","VEX.vvvv (r, w)","","","Using dword indices specified i=
n vm32x, gather double-pre-cision FP values from memory conditioned on mask=
 speci-fied by ymm2. Conditionally gathered elements are merged into ymm1."
+"VGATHERDPS xmm1, vm32x/f32x4, xmm2","VEX.128.66.0F38.W0 92 /r","Valid","V=
alid","Invalid","AVX2","ModRM:reg (r, w)","BaseReg (r): VSIB:base, VectorRe=
g (r): VSIB:index","VEX.vvvv (r, w)","","","Using dword indices specified i=
n vm32x, gather single-preci-sion FP values from memory conditioned on mask=
 specified by xmm2. Conditionally gathered elements are merged into xmm1."
+"VGATHERDPS ymm1, vm32y/f32x8, ymm2","VEX.256.66.0F38.W0 92 /r","Valid","V=
alid","Invalid","AVX2","ModRM:reg (r, w)","BaseReg (r): VSIB:base, VectorRe=
g (r): VSIB:index","VEX.vvvv (r, w)","","","Using dword indices specified i=
n vm32y, gather single-preci-sion FP values from memory conditioned on mask=
 specified by ymm2. Conditionally gathered elements are merged into ymm1."
+"VGATHERQPD xmm1, vm64x/f64x2, xmm2","VEX.128.66.0F38.W1 93 /r","Valid","V=
alid","Invalid","AVX2","ModRM:reg (r, w)","BaseReg (r): VSIB:base, VectorRe=
g (r): VSIB:index","VEX.vvvv (r, w)","","","Using qword indices specified i=
n vm64x, gather double-pre-cision FP values from memory conditioned on mask=
 speci-fied by xmm2. Conditionally gathered elements are merged into xmm1."
+"VGATHERQPD ymm1, vm64y/f64x4, ymm2","VEX.256.66.0F38.W1 93 /r","Valid","V=
alid","Invalid","AVX2","ModRM:reg (r, w)","BaseReg (r): VSIB:base, VectorRe=
g (r): VSIB:index","VEX.vvvv (r, w)","","","Using qword indices specified i=
n vm64y, gather double-pre-cision FP values from memory conditioned on mask=
 speci-fied by ymm2. Conditionally gathered elements are merged into ymm1."
+"VGATHERQPS xmm1, vm64x/f32x2, xmm2","VEX.128.66.0F38.W0 93 /r","Valid","V=
alid","Invalid","AVX2","ModRM:reg (r, w)","BaseReg (r): VSIB:base, VectorRe=
g (r): VSIB:index","VEX.vvvv (r, w)","","","Using qword indices specified i=
n vm64x, gather single-preci-sion FP values from memory conditioned on mask=
 specified by xmm2. Conditionally gathered elements are merged into xmm1."
+"VGATHERQPS xmm1, vm64y/f32x4, xmm2","VEX.256.66.0F38.W0 93 /r","Valid","V=
alid","Invalid","AVX2","ModRM:reg (r, w)","BaseReg (r): VSIB:base, VectorRe=
g (r): VSIB:index","VEX.vvvv (r, w)","","","Using qword indices specified i=
n vm64y, gather single-preci-sion FP values from memory conditioned on mask=
 specified by xmm2. Conditionally gathered elements are merged into xmm1."
+"VINSERTI128 ymm1, ymm2, xmm3/m128, ib","VEX.256.66.0F3A.W0 38 /r ib","Val=
id","Valid","Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)"=
,"ib","","Insert 128 bits of integer data from xmm3/m128 and the remaining =
values from ymm2 into ymm1."
+"VMOVNTDQA ymm1, m256","VEX.256.66.0F38.WIG 2A /r","Valid","Valid","Invali=
d","AVX2","ModRM:reg (w)","ModRM:r/m (r)","","","","Move 256-bit data from =
m256 to ymm using non-temporal hint if WC memory type."
+"VMPSADBW ymm1, ymm2, ymm3/m256, ib","VEX.256.66.0F3A.WIG 42 /r ib","Valid=
","Valid","Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","=
ib","","Sums absolute 8-bit integer difference of adjacent groups of 4 byte=
 integers in xmm2 and ymm3/m128 and writes the results in ymm1. Starting of=
fsets within ymm2 and xmm3/m128 are determined by ib."
+"VPABSB ymm1, ymm2/m256","VEX.256.66.0F38.WIG 1C /r","Valid","Valid","Inva=
lid","AVX2","ModRM:reg (w)","ModRM:r/m (r)","","","","Compute the absolute =
value of bytes in ymm2/m256 and store UNSIGNED result in ymm1."
+"VPABSD ymm1, ymm2/m256","VEX.256.66.0F38.WIG 1E /r","Valid","Valid","Inva=
lid","AVX2","ModRM:reg (w)","ModRM:r/m (r)","","","","Compute the absolute =
value of 32-bit integers in ymm2/m256 and store UNSIGNED result in ymm1."
+"VPABSW ymm1, ymm2/m256","VEX.256.66.0F38.WIG 1D /r","Valid","Valid","Inva=
lid","AVX2","ModRM:reg (w)","ModRM:r/m (r)","","","","Compute the absolute =
value of 16-bit integers in ymm2/m256 and store UNSIGNED result in ymm1."
+"VPACKSSDW ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG 6B /r","Valid","Valid=
","Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Co=
nverts 8 packed signed doubleword integers from ymm2 and from ymm3/m256 int=
o 16 packed signed word integers in ymm1using signed saturation."
+"VPACKSSWB ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG 63 /r","Valid","Valid=
","Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Co=
nverts 16 packed signed word integers from ymm2 and from ymm3/m256 into 32 =
packed signed byte integers in ymm1 using signed saturation."
+"VPACKUSDW ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.WIG 2B /r","Valid","Val=
id","Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","=
Convert 8 packed signed doubleword integers from ymm2 and 8 packed signed d=
oubleword integers from ymm3/m256 into 16 packed unsigned word integers in =
ymm1 using unsigned saturation."
+"VPACKUSWB ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG 67 /r","Valid","Valid=
","Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Co=
nverts 16 signed word integers from ymm2 and 16signed word integers from ym=
m3/m256 into 32 unsigned byte integers in ymm1 using unsigned saturation."
+"VPADDB ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG FC /r","Valid","Valid","=
Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Add p=
acked byte integers from ymm2, and ymm3/m256 and store in ymm1."
+"VPADDD ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG FE /r","Valid","Valid","=
Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Add p=
acked doubleword integers from ymm2, ymm3/m256 and store in ymm1."
+"VPADDQ ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG D4 /r","Valid","Valid","=
Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Add p=
acked quadword integers from ymm2, ymm3/m256 and store in ymm1."
+"VPADDSB ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG EC /r","Valid","Valid",=
"Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Add =
packed signed byte integers from ymm2, and ymm3/m256 and store the saturate=
d results in ymm1."
+"VPADDSW ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG ED /r","Valid","Valid",=
"Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Add =
packed signed word integers from ymm2, and ymm3/m256 and store the saturate=
d results in ymm1."
+"VPADDUSB ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG DC /r","Valid","Valid"=
,"Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Add=
 packed unsigned byte integers from ymm2,and ymm3/m256 and store the satura=
ted results in ymm1."
+"VPADDUSW ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG DD /r","Valid","Valid"=
,"Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Add=
 packed unsigned word integers from ymm2,and ymm3/m256 and store the satura=
ted results in ymm1."
+"VPADDW ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG FD /r","Valid","Valid","=
Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Add p=
acked word integers from ymm2, ymm3/m256 and store in ymm1."
+"VPALIGNR ymm1, ymm2, ymm3/m256, ib","VEX.256.66.0F3A.WIG 0F /r ib","Valid=
","Valid","Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","=
ib","","Concatenate pairs of 16 bytes in ymm2 and ymm3/m256 into 32-byte in=
termediate result, extract byte-aligned, 16-byte result shifted to the righ=
t by constant values in ib from each intermediate result, and two 16-byte r=
esults are stored in ymm1."
+"VPAND ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG DB /r","Valid","Valid","I=
nvalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Bitwis=
e AND of ymm2, and ymm3/m256 and store result in ymm1."
+"VPANDN ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG DF /r","Valid","Valid","=
Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Bitwi=
se AND NOT of ymm2, and ymm3/m256 and store result in ymm1."
+"VPAVGB ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG E0 /r","Valid","Valid","=
Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Avera=
ge packed unsigned byte integers from ymm2, and ymm3/m256 with rounding and=
 store to ymm1."
+"VPAVGW ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG E3 /r","Valid","Valid","=
Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Avera=
ge packed unsigned word integers from ymm2, ymm3/m256 with rounding to ymm1=
."
+"VPBLENDD xmm1, xmm2, xmm3/m128, ib","VEX.128.66.0F3A.W0 02 /r ib","Valid"=
,"Valid","Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","i=
b","","Select dwords from xmm2 and xmm3/m128 from mask specified in ib and =
store the values into xmm1."
+"VPBLENDD ymm1, ymm2, ymm3/m256, ib","VEX.256.66.0F3A.W0 02 /r ib","Valid"=
,"Valid","Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","i=
b","","Select dwords from ymm2 and ymm3/m256 from mask specified in ib and =
store the values into ymm1."
+"VPBLENDVB ymm1, ymm2, ymm3/m256, ymm4","VEX.256.66.0F3A.W0 4C /r /is4","V=
alid","Valid","Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r=
)","ib[7:4]","","Select byte values from ymm2 and ymm3/m256 from mask speci=
fied in the high bit of each byte in ymm4 and store the values into ymm1."
+"VPBLENDW ymm1, ymm2, ymm3/m256, ib","VEX.256.66.0F3A.WIG 0E /r ib","Valid=
","Valid","Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","=
ib","","Select words from ymm2 and ymm3/m256 from mask specified in ib and =
store the values into ymm1."
+"VPBROADCASTB xmm1, xmm2/m8","VEX.128.66.0F38.W0 78 /r","Valid","Valid","I=
nvalid","AVX2","ModRM:reg (w)","ModRM:r/m (r)","","","","Broadcast a byte i=
nteger in the source operand to sixteen locations in xmm1."
+"VPBROADCASTB ymm1, xmm2/m8","VEX.256.66.0F38.W0 78 /r","Valid","Valid","I=
nvalid","AVX2","ModRM:reg (w)","ModRM:r/m (r)","","","","Broadcast a byte i=
nteger in the source operand to thirty-two locations in ymm1."
+"VPBROADCASTD xmm1, xmm2/m32","VEX.128.66.0F38.W0 58 /r","Valid","Valid","=
Invalid","AVX2","ModRM:reg (w)","ModRM:r/m (r)","","","","Broadcast a dword=
 integer in the source operand to four locations in xmm1."
+"VPBROADCASTD ymm1, xmm2/m32","VEX.256.66.0F38.W0 58 /r","Valid","Valid","=
Invalid","AVX2","ModRM:reg (w)","ModRM:r/m (r)","","","","Broadcast a dword=
 integer in the source operand to eight locations in ymm1."
+"VPBROADCASTQ xmm1, xmm2/m64","VEX.128.66.0F38.W0 59 /r","Valid","Valid","=
Invalid","AVX2","ModRM:reg (w)","ModRM:r/m (r)","","","","Broadcast a qword=
 element in source operand to two locations in xmm1."
+"VPBROADCASTQ ymm1, xmm2/m64","VEX.256.66.0F38.W0 59 /r","Valid","Valid","=
Invalid","AVX2","ModRM:reg (w)","ModRM:r/m (r)","","","","Broadcast a qword=
 element in source operand to four locations in ymm1."
+"VPBROADCASTW xmm1, xmm2/m16","VEX.128.66.0F38.W0 79 /r","Valid","Valid","=
Invalid","AVX2","ModRM:reg (w)","ModRM:r/m (r)","","","","Broadcast a word =
integer in the source operand to eight locations in xmm1."
+"VPBROADCASTW ymm1, xmm2/m16","VEX.256.66.0F38.W0 79 /r","Valid","Valid","=
Invalid","AVX2","ModRM:reg (w)","ModRM:r/m (r)","","","","Broadcast a word =
integer in the source operand to sixteen locations in ymm1."
+"VPCMPEQB ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG 74 /r","Valid","Valid"=
,"Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Com=
pare packed bytes in ymm3/m256 and ymm2 for equality."
+"VPCMPEQD ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG 76 /r","Valid","Valid"=
,"Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Com=
pare packed doublewords in ymm3/m256 and ymm2 for equality."
+"VPCMPEQQ ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.WIG 29 /r","Valid","Vali=
d","Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","C=
ompare packed quadwords in ymm3/m256 and ymm2 for equality."
+"VPCMPEQW ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG 75 /r","Valid","Valid"=
,"Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Com=
pare packed words in ymm3/m256 and ymm2 for equality."
+"VPCMPGTB ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG 64 /r","Valid","Valid"=
,"Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Com=
pare packed signed byte integers in ymm2 and ymm3/m256 for greater than."
+"VPCMPGTD ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG 66 /r","Valid","Valid"=
,"Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Com=
pare packed signed doubleword integers in ymm2 and ymm3/m256 for greater th=
an."
+"VPCMPGTQ ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.WIG 37 /r","Valid","Vali=
d","Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","C=
ompare packed signed qwords in ymm2 and ymm3/m256 for greater than."
+"VPCMPGTW ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG 65 /r","Valid","Valid"=
,"Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Com=
pare packed signed word integers in ymm2 and ymm3/m256 for greater than."
+"VPERM2I128 ymm1, ymm2, ymm3/m256, ib","VEX.256.66.0F3A.W0 46 /r ib","Vali=
d","Valid","Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)",=
"ib","","Permute 128-bit integer data in ymm2 and ymm3/mem using controls f=
rom ib and store result in ymm1."
+"VPERMD ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W0 36 /r","Valid","Valid",=
"Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Perm=
ute doublewords in ymm3/m256 using indices in ymm2 and store the result in =
ymm1."
+"VPERMPD ymm1, ymm2/m256, ib","VEX.256.66.0F3A.W1 01 /r ib","Valid","Valid=
","Invalid","AVX2","ModRM:reg (w)","ModRM:r/m (r)","ib","","","Permute doub=
le-precision floating-point elements in ymm2/m256 using indices in ib and s=
tore the result in ymm1."
+"VPERMPS ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W0 16 /r","Valid","Valid"=
,"Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Per=
mute single-precision floating-point elements in ymm3/m256 using indices in=
 ymm2 and store the result in ymm1."
+"VPERMQ ymm1, ymm2/m256, ib","VEX.256.66.0F3A.W1 00 /r ib","Valid","Valid"=
,"Invalid","AVX2","ModRM:reg (w)","ModRM:r/m (r)","ib","","","Permute qword=
s in ymm2/m256 using indices in ib and store the result in ymm1."
+"VPGATHERDD xmm1, vm32x/i32x4, xmm2","VEX.128.66.0F38.W0 90 /r","Valid","V=
alid","Invalid","AVX2","ModRM:reg (r, w)","BaseReg (r): VSIB:base, VectorRe=
g (r): VSIB:index","VEX.vvvv (r, w)","","","Using dword indices specified i=
n vm32x, gather dword val-ues from memory conditioned on mask specified by =
xmm2. Conditionally gathered elements are merged into xmm1."
+"VPGATHERDD ymm1, vm32y/i32x8, ymm2","VEX.256.66.0F38.W0 90 /r","Valid","V=
alid","Invalid","AVX2","ModRM:reg (r, w)","BaseReg (r): VSIB:base, VectorRe=
g (r): VSIB:index","VEX.vvvv (r, w)","","","Using dword indices specified i=
n vm32y, gather dword val-ues from memory conditioned on mask specified by =
ymm2. Conditionally gathered elements are merged into ymm1."
+"VPGATHERDQ xmm1, vm32x/i64x2, xmm2","VEX.128.66.0F38.W1 90 /r","Valid","V=
alid","Invalid","AVX2","ModRM:reg (r, w)","BaseReg (r): VSIB:base, VectorRe=
g (r): VSIB:index","VEX.vvvv (r, w)","","","Using dword indices specified i=
n vm32x, gather qword val-ues from memory conditioned on mask specified by =
xmm2. Conditionally gathered elements are merged into xmm1."
+"VPGATHERDQ ymm1, vm32x/i64x4, ymm2","VEX.256.66.0F38.W1 90 /r","Valid","V=
alid","Invalid","AVX2","ModRM:reg (r, w)","BaseReg (r): VSIB:base, VectorRe=
g (r): VSIB:index","VEX.vvvv (r, w)","","","Using dword indices specified i=
n vm32x, gather qword val-ues from memory conditioned on mask specified by =
ymm2. Conditionally gathered elements are merged into ymm1."
+"VPGATHERQD xmm1, vm64x/i32x2, xmm2","VEX.128.66.0F38.W0 91 /r","Valid","V=
alid","Invalid","AVX2","ModRM:reg (r, w)","BaseReg (r): VSIB:base, VectorRe=
g (r): VSIB:index","VEX.vvvv (r, w)","","","Using qword indices specified i=
n vm64x, gather dword val-ues from memory conditioned on mask specified by =
xmm2. Conditionally gathered elements are merged into xmm1."
+"VPGATHERQD xmm1, vm64y/i32x4, xmm2","VEX.256.66.0F38.W0 91 /r","Valid","V=
alid","Invalid","AVX2","ModRM:reg (r, w)","BaseReg (r): VSIB:base, VectorRe=
g (r): VSIB:index","VEX.vvvv (r, w)","","","Using qword indices specified i=
n vm64y, gather dword val-ues from memory conditioned on mask specified by =
xmm2. Conditionally gathered elements are merged into xmm1."
+"VPGATHERQQ xmm1, vm64x/i64x2, xmm2","VEX.128.66.0F38.W1 91 /r","Valid","V=
alid","Invalid","AVX2","ModRM:reg (r, w)","BaseReg (r): VSIB:base, VectorRe=
g (r): VSIB:index","VEX.vvvv (r, w)","","","Using qword indices specified i=
n vm64x, gather qword val-ues from memory conditioned on mask specified by =
xmm2. Conditionally gathered elements are merged into xmm1."
+"VPGATHERQQ ymm1, vm64y/i64x4, ymm2","VEX.256.66.0F38.W1 91 /r","Valid","V=
alid","Invalid","AVX2","ModRM:reg (r, w)","BaseReg (r): VSIB:base, VectorRe=
g (r): VSIB:index","VEX.vvvv (r, w)","","","Using qword indices specified i=
n vm64y, gather qword val-ues from memory conditioned on mask specified by =
ymm2. Conditionally gathered elements are merged into ymm1."
+"VPHADDD ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.WIG 02 /r","Valid","Valid=
","Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Ad=
d 32-bit signed integers horizontally, pack to ymm1."
+"VPHADDSW ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.WIG 03 /r","Valid","Vali=
d","Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","A=
dd 16-bit signed integers horizontally, pack saturated integers to ymm1."
+"VPHADDW ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.WIG 01 /r","Valid","Valid=
","Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Ad=
d 16-bit signed integers horizontally, pack to ymm1."
+"VPHSUBD ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.WIG 06 /r","Valid","Valid=
","Invalid","AVX2","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","",=
"Subtract 32-bit signed integers horizontally, pack to ymm1."
+"VPHSUBSW ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.WIG 07 /r","Valid","Vali=
d","Invalid","AVX2","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","",""=
,"Subtract 16-bit signed integer horizontally, pack saturated integers to y=
mm1."
+"VPHSUBW ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.WIG 05 /r","Valid","Valid=
","Invalid","AVX2","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","",=
"Subtract 16-bit signed integers horizontally, pack to ymm1."
+"VPMADDUBSW ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.WIG 04 /r","Valid","Va=
lid","Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","",=
"Multiply signed and unsigned bytes, add horizontal pair of signed words, p=
ack saturated signed-words to ymm1."
+"VPMADDWD ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG F5 /r","Valid","Valid"=
,"Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Mul=
tiply the packed word integers in ymm2 by the packed word integers in ymm3/=
m256, add adjacent doubleword results, and store in ymm1."
+"VPMASKMOVD xmm1, xmm2, m128","VEX.128.66.0F38.W0 8C /r","Valid","Valid","=
Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Condi=
tionally load dword values from m128 using mask in xmm2 and store in xmm1."
+"VPMASKMOVD ymm1, ymm2, m256","VEX.256.66.0F38.W0 8C /r","Valid","Valid","=
Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Condi=
tionally load dword values from m256 using mask in ymm2 and store in ymm1."
+"VPMASKMOVD m128, xmm1, xmm2","VEX.128.66.0F38.W0 8E /r","Valid","Valid","=
Invalid","AVX2","ModRM:r/m (w)","VEX.vvvv (r)","ModRM:reg (r)","","","Condi=
tionally store dword values from xmm2 using mask in xmm1."
+"VPMASKMOVD m256, ymm1, ymm2","VEX.256.66.0F38.W0 8E /r","Valid","Valid","=
Invalid","AVX2","ModRM:r/m (w)","VEX.vvvv (r)","ModRM:reg (r)","","","Condi=
tionally store dword values from ymm2 using mask in ymm1."
+"VPMASKMOVQ xmm1, xmm2, m128","VEX.128.66.0F38.W1 8C /r","Valid","Valid","=
Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Condi=
tionally load qword values from m128 using mask in xmm2 and store in xmm1."
+"VPMASKMOVQ ymm1, ymm2, m256","VEX.256.66.0F38.W1 8C /r","Valid","Valid","=
Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Condi=
tionally load qword values from m256 using mask in ymm2 and store in ymm1."
+"VPMASKMOVQ m128, xmm1, xmm2","VEX.128.66.0F38.W1 8E /r","Valid","Valid","=
Invalid","AVX2","ModRM:r/m (w)","VEX.vvvv (r)","ModRM:reg (r)","","","Condi=
tionally store qword values from xmm2 using mask in xmm1."
+"VPMASKMOVQ m256, ymm1, ymm2","VEX.256.66.0F38.W1 8E /r","Valid","Valid","=
Invalid","AVX2","ModRM:r/m (w)","VEX.vvvv (r)","ModRM:reg (r)","","","Condi=
tionally store qword values from ymm2 using mask in ymm1."
+"VPMAXSB ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.WIG 3C /r","Valid","Valid=
","Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Co=
mpare packed signed byte integers in ymm2 and ymm3/m256 and store packed ma=
ximum values in ymm1."
+"VPMAXSD ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.WIG 3D /r","Valid","Valid=
","Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Co=
mpare packed signed dword integers in ymm2 and ymm3/m256 and store packed m=
aximum values in ymm1."
+"VPMAXSW ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG EE /r","Valid","Valid",=
"Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Comp=
are packed signed word integers in ymm3/m256 and ymm2 and store packed maxi=
mum values in ymm1."
+"VPMAXUB ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG DE /r","Valid","Valid",=
"Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Comp=
are packed unsigned byte integers in ymm2 and ymm3/m256 and store packed ma=
ximum values in ymm1."
+"VPMAXUD ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.WIG 3F /r","Valid","Valid=
","Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Co=
mpare packed unsigned dword integers in ymm2 and ymm3/m256 and store packed=
 maximum values in ymm1."
+"VPMAXUW ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.WIG 3E /r","Valid","Valid=
","Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Co=
mpare packed unsigned word integers in ymm3/m256 and ymm2 and store maximum=
 packed values in ymm1."
+"VPMINSB ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.WIG 38 /r","Valid","Valid=
","Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Co=
mpare packed signed byte integers in ymm2 and ymm3/m256 and store packed mi=
nimum values in ymm1."
+"VPMINSD ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.WIG 39 /r","Valid","Valid=
","Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Co=
mpare packed signed dword integers in ymm2 and ymm3/m128 and store packed m=
inimum values in ymm1."
+"VPMINSW ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG EA /r","Valid","Valid",=
"Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Comp=
are packed signed word integers in ymm3/m256 and ymm2 and return packed min=
imum values in ymm1."
+"VPMINUB ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG DA /r","Valid","Valid",=
"Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Comp=
are packed unsigned byte integers in ymm2 and ymm3/m256 and store packed mi=
nimum values in ymm1."
+"VPMINUD ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.WIG 3B /r","Valid","Valid=
","Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Co=
mpare packed unsigned dword integers in ymm2 and ymm3/m256 and store packed=
 minimum values in ymm1."
+"VPMINUW ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.WIG 3A /r","Valid","Valid=
","Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Co=
mpare packed unsigned word integers in ymm3/m256 and ymm2 and return packed=
 minimum values in ymm1."
+"VPMOVMSKB r32, ymm1","VEX.256.66.0F.WIG D7 /r","Valid","Valid","Invalid",=
"AVX2","ModRM:reg (w)","ModRM:r/m (r)","","","","Move a 32-bit mask of ymm1=
 to reg. The upper bits of r are zeroed."
+"VPMOVSXBD ymm1, xmm2/m64","VEX.256.66.0F38.WIG 21 /r","Valid","Valid","In=
valid","AVX2","ModRM:reg (w)","ModRM:r/m (r)","","","","Sign extend 8 packe=
d 8-bit integers in the low 8 bytes of xmm2/m64 to 8 packed 32-bit integers=
 in ymm1."
+"VPMOVSXBQ ymm1, xmm2/m32","VEX.256.66.0F38.WIG 22 /r","Valid","Valid","In=
valid","AVX2","ModRM:reg (w)","ModRM:r/m (r)","","","","Sign extend 4 packe=
d 8-bit integers in the low 4 bytes of xmm2/m32 to 4 packed 64-bit integers=
 in ymm1."
+"VPMOVSXBW ymm1, xmm2/m128","VEX.256.66.0F38.WIG 20 /r","Valid","Valid","I=
nvalid","AVX2","ModRM:reg (w)","ModRM:r/m (r)","","","","Sign extend 16 pac=
ked 8-bit integers in xmm2/m128 to 16 packed 16-bit integers in ymm1."
+"VPMOVSXDQ ymm1, xmm2/m128","VEX.256.66.0F38.WIG 25 /r","Valid","Valid","I=
nvalid","AVX2","ModRM:reg (w)","ModRM:r/m (r)","","","","Sign extend 4 pack=
ed 32-bit integers in the low 16 bytes of xmm2/m128 to 4 packed 64-bit inte=
gers in ymm1."
+"VPMOVSXWD ymm1, xmm2/m128","VEX.256.66.0F38.WIG 23 /r","Valid","Valid","I=
nvalid","AVX2","ModRM:reg (w)","ModRM:r/m (r)","","","","Sign extend 8 pack=
ed 16-bit integers in the low 16 bytes of xmm2/m128 to 8 packed 32-bit inte=
gers in ymm1."
+"VPMOVSXWQ ymm1, xmm2/m64","VEX.256.66.0F38.WIG 24 /r","Valid","Valid","In=
valid","AVX2","ModRM:reg (w)","ModRM:r/m (r)","","","","Sign extend 4 packe=
d 16-bit integers in the low 8 bytes of xmm2/m64 to 4 packed 64-bit integer=
s in ymm1."
+"VPMOVZXBD ymm1, xmm2/m64","VEX.256.66.0F38.WIG 31 /r","Valid","Valid","In=
valid","AVX2","ModRM:reg (w)","ModRM:r/m (r)","","","","Zero extend 8 packe=
d 8-bit integers in the low 8 bytes of xmm2/m64 to 8 packed 32-bit integers=
 in ymm1."
+"VPMOVZXBQ ymm1, xmm2/m32","VEX.256.66.0F38.WIG 32 /r","Valid","Valid","In=
valid","AVX2","ModRM:reg (w)","ModRM:r/m (r)","","","","Zero extend 4 packe=
d 8-bit integers in the low 4 bytes of xmm2/m32 to 4 packed 64-bit integers=
 in ymm1."
+"VPMOVZXBW ymm1, xmm2/m128","VEX.256.66.0F38.WIG 30 /r","Valid","Valid","I=
nvalid","AVX2","ModRM:reg (w)","ModRM:r/m (r)","","","","Zero extend 16 pac=
ked 8-bit integers in xmm2/m128 to 16 packed 16-bit integers in ymm1."
+"VPMOVZXDQ ymm1, xmm2/m128","VEX.256.66.0F38.WIG 35 /r","Valid","Valid","I=
nvalid","AVX2","ModRM:reg (w)","ModRM:r/m (r)","","","","Zero extend 4 pack=
ed 32-bit integers in xmm2/m128 to 4 packed 64-bit integers in ymm1."
+"VPMOVZXWD ymm1, xmm2/m128","VEX.256.66.0F38.WIG 33 /r","Valid","Valid","I=
nvalid","AVX2","ModRM:reg (w)","ModRM:r/m (r)","","","","Zero extend 8 pack=
ed 16-bit integers xmm2/m128 to 8 packed 32-bit integers in ymm1."
+"VPMOVZXWQ ymm1, xmm2/m64","VEX.256.66.0F38.WIG 34 /r","Valid","Valid","In=
valid","AVX2","ModRM:reg (w)","ModRM:r/m (r)","","","","Zero extend 4 packe=
d 16-bit integers in the low 8 bytes of xmm2/m64 to 4 packed 64-bit integer=
s in xmm1."
+"VPMULDQ ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.WIG 28 /r","Valid","Valid=
","Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Mu=
ltiply packed signed doubleword integers in ymm2 by packed signed doublewor=
d integers in ymm3/m256, and store the quadword results in ymm1."
+"VPMULHRSW ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.WIG 0B /r","Valid","Val=
id","Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","=
Multiply 16-bit signed words, scale and round signed doublewords, pack high=
 16 bits to ymm1."
+"VPMULHUW ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG E4 /r","Valid","Valid"=
,"Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Mul=
tiply the packed unsigned word integers in ymm2 and ymm3/m256, and store th=
e high 16 bits of the results in ymm1."
+"VPMULHW ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG E5 /r","Valid","Valid",=
"Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Mult=
iply the packed signed word integers in ymm2 and ymm3/m256, and store the h=
igh 16 bits of the results in ymm1."
+"VPMULLD ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.WIG 40 /r","Valid","Valid=
","Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Mu=
ltiply the packed dword signed integers in ymm2 and ymm3/m256 and store the=
 low 32 bits of each product in ymm1."
+"VPMULLW ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG D5 /r","Valid","Valid",=
"Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Mult=
iply the packed signed word integers in ymm2 and ymm3/m256, and store the l=
ow 16 bits of the results in ymm1."
+"VPMULUDQ ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG F4 /r","Valid","Valid"=
,"Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Mul=
tiply packed unsigned doubleword integers in ymm2 by packed unsigned double=
word integers in ymm3/m256, and store the quadword results in ymm1."
+"VPOR ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG EB /r","Valid","Valid","In=
valid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Bitwise=
 OR of ymm2/m256 and ymm3."
+"VPSADBW ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG F6 /r","Valid","Valid",=
"Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Comp=
utes the absolute differences of the packed unsigned byte integers from ymm=
3/m256 and ymm2; then each consecutive 8 differences are summed separately =
to produce four unsigned word integer results."
+"VPSHUFB ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.WIG 00 /r","Valid","Valid=
","Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Sh=
uffle bytes in ymm2 according to contents of ymm3/m256."
+"VPSHUFD ymm1, ymm2/m256, ib","VEX.256.66.0F.WIG 70 /r ib","Valid","Valid"=
,"Invalid","AVX2","ModRM:reg (w)","ModRM:r/m (r)","ib","","","Shuffle the d=
oublewords in ymm2/m256 based on the encoding in ib and store the result in=
 ymm1."
+"VPSHUFHW ymm1, ymm2/m256, ib","VEX.256.F3.0F.WIG 70 /r ib","Valid","Valid=
","Invalid","AVX2","ModRM:reg (w)","ModRM:r/m (r)","ib","","","Shuffle the =
high words in ymm2/m256 based on the encoding in ib and store the result in=
 ymm1."
+"VPSHUFLW ymm1, ymm2/m256, ib","VEX.256.F2.0F.WIG 70 /r ib","Valid","Valid=
","Invalid","AVX2","ModRM:reg (w)","ModRM:r/m (r)","ib","","","Shuffle the =
low words in ymm2/m256 based on the encoding in ib and store the result in =
ymm1."
+"VPSIGNB ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.WIG 08 /r","Valid","Valid=
","Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Ne=
gate packed byte integers in ymm2 if the corresponding sign in ymm3/m256 is=
 less than zero."
+"VPSIGND ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.WIG 0A /r","Valid","Valid=
","Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Ne=
gate packed doubleword integers in ymm2 if the corresponding sign in ymm3/m=
256 is less than zero."
+"VPSIGNW ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.WIG 09 /r","Valid","Valid=
","Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Ne=
gate packed 16-bit integers in ymm2 if the corresponding sign in ymm3/m256 =
is less than zero."
+"VPSLLD ymm1, ymm2, ib","VEX.256.66.0F.WIG 72 /6 ib","Valid","Valid","Inva=
lid","AVX2","VEX.vvvv (w)","ModRM:r/m (r)","ib","","","Shift doublewords in=
 ymm2 left by ib while shifting in 0s."
+"VPSLLD ymm1, ymm2, xmm3/m128","VEX.256.66.0F.WIG F2 /r","Valid","Valid","=
Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Shift=
 doublewords in ymm2 left by amount specified in xmm3/m128 while shifting i=
n 0s."
+"VPSLLDQ ymm1, ymm2, ib","VEX.256.66.0F.WIG 73 /7 ib","Valid","Valid","Inv=
alid","AVX2","VEX.vvvv (w)","ModRM:r/m (r)","ib","","","Shift ymm2 left by =
ib bytes while shifting in 0s and store result in ymm1."
+"VPSLLQ ymm1, ymm2, ib","VEX.256.66.0F.WIG 73 /6 ib","Valid","Valid","Inva=
lid","AVX2","VEX.vvvv (w)","ModRM:r/m (r)","ib","","","Shift quadwords in y=
mm2 left by ib while shifting in 0s."
+"VPSLLQ ymm1, ymm2, xmm3/m128","VEX.256.66.0F.WIG F3 /r","Valid","Valid","=
Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Shift=
 quadwords in ymm2 left by amount specified in xmm3/m128 while shifting in =
0s."
+"VPSLLVD xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W0 47 /r","Valid","Valid"=
,"Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Shi=
ft doublewords in xmm2 left by amount specified in the corresponding elemen=
t of xmm3/m128 while shifting in 0s."
+"VPSLLVD ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W0 47 /r","Valid","Valid"=
,"Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Shi=
ft doublewords in ymm2 left by amount specified in the corresponding elemen=
t of ymm3/m256 while shifting in 0s."
+"VPSLLVQ xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W1 47 /r","Valid","Valid"=
,"Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Shi=
ft quadwords in xmm2 left by amount specified in the corresponding element =
of xmm3/m128 while shifting in 0s."
+"VPSLLVQ ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W1 47 /r","Valid","Valid"=
,"Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Shi=
ft quadwords in ymm2 left by amount specified in the corresponding element =
of ymm3/m256 while shifting in 0s."
+"VPSLLW ymm1, ymm2, ib","VEX.256.66.0F.WIG 71 /6 ib","Valid","Valid","Inva=
lid","AVX2","VEX.vvvv (w)","ModRM:r/m (r)","ib","","","Shift words in ymm2 =
left by ib while shifting in 0s."
+"VPSLLW ymm1, ymm2, xmm3/m128","VEX.256.66.0F.WIG F1 /r","Valid","Valid","=
Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Shift=
 words in ymm2 left by amount specified in xmm3/m128 while shifting in 0s."
+"VPSRAD ymm1, ymm2, ib","VEX.256.66.0F.WIG 72 /4 ib","Valid","Valid","Inva=
lid","AVX2","VEX.vvvv (w)","ModRM:r/m (r)","ib","","","Shift doublewords in=
 ymm2 right by ib while shifting in sign bits."
+"VPSRAD ymm1, ymm2, xmm3/m128","VEX.256.66.0F.WIG E2 /r","Valid","Valid","=
Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Shift=
 doublewords in ymm2 right by amount specified in xmm3/m128 while shifting =
in sign bits."
+"VPSRAVD xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W0 46 /r","Valid","Valid"=
,"Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Shi=
ft doublewords in xmm2 right by amount specified in the corresponding eleme=
nt of xmm3/m128 while shifting in sign bits."
+"VPSRAVD ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W0 46 /r","Valid","Valid"=
,"Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Shi=
ft doublewords in ymm2 right by amount specified in the corresponding eleme=
nt of ymm3/m256 while shifting in sign bits."
+"VPSRAW ymm1, ymm2, ib","VEX.256.66.0F.WIG 71 /4 ib","Valid","Valid","Inva=
lid","AVX2","VEX.vvvv (w)","ModRM:r/m (r)","ib","","","Shift words in ymm2 =
right by ib while shifting in sign bits."
+"VPSRAW ymm1, ymm2, xmm3/m128","VEX.256.66.0F.WIG E1 /r","Valid","Valid","=
Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Shift=
 words in ymm2 right by amount specified in xmm3/m128 while shifting in sig=
n bits."
+"VPSRLD ymm1, ymm2, ib","VEX.256.66.0F.WIG 72 /2 ib","Valid","Valid","Inva=
lid","AVX2","VEX.vvvv (w)","ModRM:r/m (r)","ib","","","Shift doublewords in=
 ymm2 right by ib while shifting in 0s."
+"VPSRLD ymm1, ymm2, xmm3/m128","VEX.256.66.0F.WIG D2 /r","Valid","Valid","=
Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Shift=
 doublewords in ymm2 right by amount specified in xmm3/m128 while shifting =
in 0s."
+"VPSRLDQ ymm1, ymm2, ib","VEX.256.66.0F.WIG 73 /3 ib","Valid","Valid","Inv=
alid","AVX2","VEX.vvvv (w)","ModRM:r/m (r)","ib","","","Shift ymm1 right by=
 ib bytes while shifting in 0s."
+"VPSRLQ ymm1, ymm2, ib","VEX.256.66.0F.WIG 73 /2 ib","Valid","Valid","Inva=
lid","AVX2","VEX.vvvv (w)","ModRM:r/m (r)","ib","","","Shift quadwords in y=
mm2 right by ib while shifting in 0s."
+"VPSRLQ ymm1, ymm2, xmm3/m128","VEX.256.66.0F.WIG D3 /r","Valid","Valid","=
Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Shift=
 quadwords in ymm2 right by amount specified in xmm3/m128 while shifting in=
 0s."
+"VPSRLVD xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W0 45 /r","Valid","Valid"=
,"Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Shi=
ft doublewords in xmm2 right by amount specified in the corresponding eleme=
nt of xmm3/m128 while shifting in 0s."
+"VPSRLVD ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W0 45 /r","Valid","Valid"=
,"Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Shi=
ft doublewords in ymm2 right by amount specified in the corresponding eleme=
nt of ymm3/m256 while shifting in 0s."
+"VPSRLVQ xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W1 45 /r","Valid","Valid"=
,"Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Shi=
ft quadwords in xmm2 right by amount specified in the corresponding element=
 of xmm3/m128 while shifting in 0s."
+"VPSRLVQ ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W1 45 /r","Valid","Valid"=
,"Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Shi=
ft quadwords in ymm2 right by amount specified in the corresponding element=
 of ymm3/m256 while shifting in 0s."
+"VPSRLW ymm1, ymm2, ib","VEX.256.66.0F.WIG 71 /2 ib","Valid","Valid","Inva=
lid","AVX2","VEX.vvvv (w)","ModRM:r/m (r)","ib","","","Shift words in ymm2 =
right by ib while shifting in 0s."
+"VPSRLW ymm1, ymm2, xmm3/m128","VEX.256.66.0F.WIG D1 /r","Valid","Valid","=
Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Shift=
 words in ymm2 right by amount specified in xmm3/m128 while shifting in 0s."
+"VPSUBB ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG F8 /r","Valid","Valid","=
Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Subtr=
act packed byte integers in ymm3/m256 from ymm2."
+"VPSUBD ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG FA /r","Valid","Valid","=
Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Subtr=
act packed doubleword integers in ymm3/m256 from ymm2."
+"VPSUBQ ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG FB /r","Valid","Valid","=
Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Subtr=
act packed quadword integers in ymm3/m256 from ymm2."
+"VPSUBSB ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG E8 /r","Valid","Valid",=
"Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Subt=
ract packed signed byte integers in ymm3/m256 from packed signed byte integ=
ers in ymm2 and saturate results."
+"VPSUBSW ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG E9 /r","Valid","Valid",=
"Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Subt=
ract packed signed word integers in ymm3/m256 from packed signed word integ=
ers in ymm2 and saturate results."
+"VPSUBUSB ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG D8 /r","Valid","Valid"=
,"Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Sub=
tract packed unsigned byte integers in ymm3/m256 from packed unsigned byte =
integers in ymm2 and saturate result."
+"VPSUBUSW ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG D9 /r","Valid","Valid"=
,"Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Sub=
tract packed unsigned word integers in ymm3/m256 from packed unsigned word =
integers in ymm2 and saturate result."
+"VPSUBW ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG F9 /r","Valid","Valid","=
Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Subtr=
act packed word integers in ymm3/m256 from ymm2."
+"VPUNPCKHBW ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG 68 /r","Valid","Vali=
d","Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","I=
nterleave high-order bytes from ymm2 and ymm3/m256 into ymm1 register."
+"VPUNPCKHDQ ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG 6A /r","Valid","Vali=
d","Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","I=
nterleave high-order doublewords from ymm2 and ymm3/m256 into ymm1 register=
."
+"VPUNPCKHQDQ ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG 6D /r","Valid","Val=
id","Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","=
Interleave high-order quadword from ymm2 and ymm3/m256 into ymm1 register."
+"VPUNPCKHWD ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG 69 /r","Valid","Vali=
d","Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","I=
nterleave high-order words from ymm2 and ymm3/m256 into ymm1 register."
+"VPUNPCKLBW ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG 60 /r","Valid","Vali=
d","Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","I=
nterleave low-order bytes from ymm2 and ymm3/m256 into ymm1 register."
+"VPUNPCKLDQ ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG 62 /r","Valid","Vali=
d","Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","I=
nterleave low-order doublewords from ymm2 and ymm3/m256 into ymm1 register."
+"VPUNPCKLQDQ ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG 6C /r","Valid","Val=
id","Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","=
Interleave low-order quadword from ymm2 and ymm3/m256 into ymm1 register."
+"VPUNPCKLWD ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG 61 /r","Valid","Vali=
d","Invalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","I=
nterleave low-order words from ymm2 and ymm3/m256 into ymm1 register."
+"VPXOR ymm1, ymm2, ymm3/m256","VEX.256.66.0F.WIG EF /r","Valid","Valid","I=
nvalid","AVX2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Bitwis=
e XOR of ymm3/m256 and ymm2."
diff --git a/disas/x86-data/x86_avx5124fmaps.csv b/disas/x86-data/x86_avx51=
24fmaps.csv
new file mode 100644
index 000000000000..2eda2075c1f9
--- /dev/null
+++ b/disas/x86-data/x86_avx5124fmaps.csv
@@ -0,0 +1,5 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"V4FMADDPS zmm{k}{z},zmm{rs4},m128","EVEX.512.f2.0F38.W0 9a /r","Valid","V=
alid","Invalid","AVX5124FMAPS","ModRM:reg (r, w)","EVEX.vvvv (r)","ModRM:r/=
m (r)","","Tuple1_4X","Multiply packed single-precision floating-point valu=
es from source register block indicated by zmm2 by values from m128 and acc=
umulate the result in zmm1."
+"V4FMADDSS xmm{k}{z},xmm{rs4},m128","EVEX.LIG.f2.0F38.W0 9b /r","Valid","V=
alid","Invalid","AVX5124FMAPS","ModRM:reg (r, w)","EVEX.vvvv (r)","ModRM:r/=
m (r)","","Tuple1_4X","Multiply scalar single-precision floating-point valu=
es from source register block indicated by xmm2 by values from m128 and acc=
umulate the result in xmm1."
+"V4FNMADDPS zmm{k}{z},zmm{rs4},m128","EVEX.512.f2.0F38.W0 aa /r","Valid","=
Valid","Invalid","AVX5124FMAPS","ModRM:reg (r, w)","EVEX.vvvv (r)","ModRM:r=
/m (r)","","Tuple1_4X","Multiply and negate packed single-precision floatin=
g-point values from source register block indicated by zmm2 by values from =
m128 and accumulate the result in zmm1."
+"V4FNMADDSS xmm{k}{z},xmm{rs4},m128","EVEX.LIG.f2.0F38.W0 ab /r","Valid","=
Valid","Invalid","AVX5124FMAPS","ModRM:reg (r, w)","EVEX.vvvv (r)","ModRM:r=
/m (r)","","Tuple1_4X","Multiply and negate scalar single-precision floatin=
g-point values from source register block indicated by xmm2 by values from =
m128 and accumulate the result in xmm1."
diff --git a/disas/x86-data/x86_avx5124vnniw.csv b/disas/x86-data/x86_avx51=
24vnniw.csv
new file mode 100644
index 000000000000..f215738e1091
--- /dev/null
+++ b/disas/x86-data/x86_avx5124vnniw.csv
@@ -0,0 +1,3 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"VP4DPWSSD zmm{k}{z},zmm{rs4},m128","EVEX.512.f2.0F38.W0 52 /r","Valid","V=
alid","Invalid","AVX5124VNNIW","ModRM:reg (r, w)","EVEX.vvvv (r)","ModRM:r/=
m (r)","","Tuple1_4X","Multiply signed words from source register block ind=
icated by zmm2 by signed words from m128 and accumulate resulting signed dw=
ords in zmm1."
+"VP4DPWSSDS zmm{k}{z},zmm{rs4},m128","EVEX.512.f2.0F38.W0 53 /r","Valid","=
Valid","Invalid","AVX5124VNNIW","ModRM:reg (r, w)","EVEX.vvvv (r)","ModRM:r=
/m (r)","","Tuple1_4X","Multiply signed words from source register block in=
dicated by zmm2 by signed words from m128 and accumulate the resulting dwor=
d results with signed saturation in zmm1."
diff --git a/disas/x86-data/x86_avx512b.csv b/disas/x86-data/x86_avx512b.csv
new file mode 100644
index 000000000000..7e95f90fe46f
--- /dev/null
+++ b/disas/x86-data/x86_avx512b.csv
@@ -0,0 +1,3 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"VPEXTRW r32/m16, xmm2, ib","EVEX.128.66.0F3A.WIG 15 /r ib","Valid","Valid=
","Invalid","AVX512B","ModRM:r/m (w)","ModRM:reg (r)","ib","","Tuple1 Scala=
r","Extract a word integer value from xmm2 at the source word offset specif=
ied by ib into reg or m16. The upper bits of r are zeroed."
+"VPEXTRW r32, xmm1, ib","EVEX.128.66.0F.WIG C5 /r ib","Valid","Valid","Inv=
alid","AVX512B","ModRM:reg (w)","ModRM:r/m (r)","ib","","","Extract the wor=
d specified by ib from xmm1 and move it to reg, bits 15:0. Zero-extend the =
result. The upper bits of r are zeroed."
diff --git a/disas/x86-data/x86_avx512bf16.csv b/disas/x86-data/x86_avx512b=
f16.csv
new file mode 100644
index 000000000000..91ad8dfb7703
--- /dev/null
+++ b/disas/x86-data/x86_avx512bf16.csv
@@ -0,0 +1,10 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"VCVTNE2PS2BF16 xmm{k}{z},xmm,xmm/m128/m32bcst","EVEX.128.f2.0F38.W0 72 /r=
","Valid","Valid","Invalid","AVX512VL AVX512BF16","ModRM:reg (w)","EVEX.vvv=
v (r)","ModRM:r/m (r)","","Full","Convert packed single data from xmm2 and =
xmm3/m128/m32bcst to packed BF16 data in xmm1 with writemask k1."
+"VCVTNE2PS2BF16 ymm{k}{z},ymm,ymm/m256/m32bcst","EVEX.256.f2.0F38.W0 72 /r=
","Valid","Valid","Invalid","AVX512VL AVX512BF16","ModRM:reg (w)","EVEX.vvv=
v (r)","ModRM:r/m (r)","","Full","Convert packed single data from ymm2 and =
ymm3/m256/m32bcst to packed BF16 data in ymm1 with writemask k1."
+"VCVTNE2PS2BF16 zmm{k}{z},zmm,zmm/m512/m32bcst","EVEX.512.f2.0F38.W0 72 /r=
","Valid","Valid","Invalid","AVX512BF16","ModRM:reg (w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","","Full","Convert packed single data from zmm2 and zmm3/m512=
/m32bcst to packed BF16 data in zmm1 with writemask k1."
+"VCVTNEPS2BF16 xmm{k}{z},xmm/m128/m32bcst","EVEX.128.f3.0F38.W0 72 /r","Va=
lid","Valid","Invalid","AVX512VL AVX512BF16","ModRM:reg (w)","ModRM:r/m (r)=
","","","Full","Convert packed single data from xmm2/m128 to packed BF16 da=
ta in xmm1 with writemask k1."
+"VCVTNEPS2BF16 xmm{k}{z},ymm/m256/m32bcst","EVEX.256.f3.0F38.W0 72 /r","Va=
lid","Valid","Invalid","AVX512VL AVX512BF16","ModRM:reg (w)","ModRM:r/m (r)=
","","","Full","Convert packed single data from ymm2/m256 to packed BF16 da=
ta in xmm1 with writemask k1."
+"VCVTNEPS2BF16 ymm{k}{z},zmm/m512/m32bcst","EVEX.512.f3.0F38.W0 72 /r","Va=
lid","Valid","Invalid","AVX512BF16","ModRM:reg (w)","ModRM:r/m (r)","","","=
Full","Convert packed single data from zmm2/m512 to packed BF16 data in ymm=
1 with writemask k1."
+"VDPBF16PS xmm{k}{z},xmm,xmm/m128/m32bcst","EVEX.128.f3.0F38.W0 52 /r","Va=
lid","Valid","Invalid","AVX512VL AVX512BF16","ModRM:reg (w)","EVEX.vvvv (r)=
","ModRM:r/m (r)","","Full","Multiply BF16 pairs from xmm2 and xmm3/m128, a=
nd accumulate the resulting packed single precision results in xmm1 with wr=
itemask k1."
+"VDPBF16PS ymm{k}{z},ymm,ymm/m256/m32bcst","EVEX.256.f3.0F38.W0 52 /r","Va=
lid","Valid","Invalid","AVX512VL AVX512BF16","ModRM:reg (w)","EVEX.vvvv (r)=
","ModRM:r/m (r)","","Full","Multiply BF16 pairs from ymm2 and ymm3/m256, a=
nd accumulate the resulting packed single precision results in ymm1 with wr=
itemask k1."
+"VDPBF16PS zmm{k}{z},zmm,zmm/m512/m32bcst","EVEX.512.f3.0F38.W0 52 /r","Va=
lid","Valid","Invalid","AVX512BF16","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:=
r/m (r)","","Full","Multiply BF16 pairs from zmm2 and zmm3/m512, and accumu=
late the resulting packed single precision results in zmm1 with writemask k=
1."
diff --git a/disas/x86-data/x86_avx512bitalg.csv b/disas/x86-data/x86_avx51=
2bitalg.csv
new file mode 100644
index 000000000000..cf92160caacb
--- /dev/null
+++ b/disas/x86-data/x86_avx512bitalg.csv
@@ -0,0 +1,10 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"VPOPCNTB xmm{k}{z},xmm/m128","EVEX.128.66.0F38.W0 54 /r","Valid","Valid",=
"Invalid","AVX512VL AVX512BITALG","ModRM:reg (w)","ModRM:r/m (r)","","","Fu=
ll Mem","Counts the number of bits set to one in xmm2/m128 and puts the res=
ult in xmm1 with writemask k1."
+"VPOPCNTB ymm{k}{z},ymm/m256","EVEX.256.66.0F38.W0 54 /r","Valid","Valid",=
"Invalid","AVX512VL AVX512BITALG","ModRM:reg (w)","ModRM:r/m (r)","","","Fu=
ll Mem","Counts the number of bits set to one in ymm2/m256 and puts the res=
ult in ymm1 with writemask k1."
+"VPOPCNTB zmm{k}{z},zmm/m512","EVEX.512.66.0F38.W0 54 /r","Valid","Valid",=
"Invalid","AVX512BITALG","ModRM:reg (w)","ModRM:r/m (r)","","","Full Mem","=
Counts the number of bits set to one in zmm2/m512 and puts the result in zm=
m1 with writemask k1."
+"VPOPCNTW xmm{k}{z},xmm/m128","EVEX.128.66.0F38.W1 54 /r","Valid","Valid",=
"Invalid","AVX512VL AVX512BITALG","ModRM:reg (w)","ModRM:r/m (r)","","","Fu=
ll Mem","Counts the number of bits set to one in xmm2/m128 and puts the res=
ult in xmm1 with writemask k1."
+"VPOPCNTW ymm{k}{z},ymm/m256","EVEX.256.66.0F38.W1 54 /r","Valid","Valid",=
"Invalid","AVX512VL AVX512BITALG","ModRM:reg (w)","ModRM:r/m (r)","","","Fu=
ll Mem","Counts the number of bits set to one in ymm2/m256 and puts the res=
ult in ymm1 with writemask k1."
+"VPOPCNTW zmm{k}{z},zmm/m512","EVEX.512.66.0F38.W1 54 /r","Valid","Valid",=
"Invalid","AVX512BITALG","ModRM:reg (w)","ModRM:r/m (r)","","","Full Mem","=
Counts the number of bits set to one in zmm2/m512 and puts the result in zm=
m1 with writemask k1."
+"VPSHUFBITQMB k{k},xmm,xmm/m128","EVEX.128.66.0F38.W0 8f /r","Valid","Vali=
d","Invalid","AVX512VL AVX512BITALG","ModRM:reg (w)","EVEX.vvvv (r)","ModRM=
:r/m (r)","","Full Mem","Extract values in xmm2 using control bits of xmm3/=
m128 with writemask k2 and leave the result in mask register k1."
+"VPSHUFBITQMB k{k},ymm,ymm/m256","EVEX.256.66.0F38.W0 8f /r","Valid","Vali=
d","Invalid","AVX512VL AVX512BITALG","ModRM:reg (w)","EVEX.vvvv (r)","ModRM=
:r/m (r)","","Full Mem","Extract values in ymm2 using control bits of ymm3/=
m256 with writemask k2 and leave the result in mask register k1."
+"VPSHUFBITQMB k{k},zmm,zmm/m512","EVEX.512.66.0F38.W0 8f /r","Valid","Vali=
d","Invalid","AVX512BITALG","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)"=
,"","Full Mem","Extract values in zmm2 using control bits of zmm3/m512 with=
 writemask k2 and leave the result in mask register k1."
diff --git a/disas/x86-data/x86_avx512bw.csv b/disas/x86-data/x86_avx512bw.=
csv
new file mode 100644
index 000000000000..e59af0d29b1e
--- /dev/null
+++ b/disas/x86-data/x86_avx512bw.csv
@@ -0,0 +1,291 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"KADDD k1, k2, k3","VEX.L1.66.0F.W1 4A /r","Valid","Valid","Invalid","AVX5=
12BW","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r, ModRM:[7:6] must be 11b=
)","","","Add 32 bits masks in k2 and k3 and place result in k1."
+"KADDQ k1, k2, k3","VEX.L1.0F.W1 4A /r","Valid","Valid","Invalid","AVX512B=
W","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r, ModRM:[7:6] must be 11b)",=
"","","Add 64 bits masks in k2 and k3 and place result in k1."
+"KANDD k1, k2, k3","VEX.L1.66.0F.W1 41 /r","Valid","Valid","Invalid","AVX5=
12BW","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r, ModRM:[7:6] must be 11b=
)","","","Bitwise AND 32 bits masks k2 and k3 and place result in k1."
+"KANDND k1, k2, k3","VEX.L1.66.0F.W1 42 /r","Valid","Valid","Invalid","AVX=
512BW","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r, ModRM:[7:6] must be 11=
b)","","","Bitwise AND NOT 32 bits masks k2 and k3 and place result in k1."
+"KANDNQ k1, k2, k3","VEX.L1.0F.W1 42 /r","Valid","Valid","Invalid","AVX512=
BW","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r, ModRM:[7:6] must be 11b)"=
,"","","Bitwise AND NOT 64 bits masks k2 and k3 and place result in k1."
+"KANDQ k1, k2, k3","VEX.L1.0F.W1 41 /r","Valid","Valid","Invalid","AVX512B=
W","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r, ModRM:[7:6] must be 11b)",=
"","","Bitwise AND 64 bits masks k2 and k3 and place result in k1."
+"KMOVD k1, k2/m32","VEX.L0.66.0F.W1 90 /r","Valid","Valid","Invalid","AVX5=
12BW","ModRM:reg (w)","ModRM:r/m (r)","","","","Move 32 bits mask from k2/m=
32 and store the result in k1."
+"KMOVD m32, k1","VEX.L0.66.0F.W1 91 /r","Valid","Valid","Invalid","AVX512B=
W","ModRM:r/m (w, ModRM:[7:6] must not be 11b)","ModRM:reg (r)","","","","M=
ove 32 bits mask from k1 and store the result in m32."
+"KMOVD k1, rw","VEX.L0.F2.0F.W0 92 /r","Valid","Valid","Invalid","AVX512BW=
","ModRM:reg (w)","ModRM:r/m (r, ModRM:[7:6] must be 11b)","","","","Move 3=
2 bits mask from r to k1."
+"KMOVD rw, k1","VEX.L0.F2.0F.W0 93 /r","Valid","Valid","Invalid","AVX512BW=
","ModRM:reg (w)","ModRM:r/m (r, ModRM:[7:6] must be 11b)","","","","Move 3=
2 bits mask from k1 to r."
+"KMOVQ k1, k2/m64","VEX.L0.0F.W1 90 /r","Valid","Valid","Invalid","AVX512B=
W","ModRM:reg (w)","ModRM:r/m (r)","","","","Move 64 bits mask from k2/m64 =
and store the result in k1."
+"KMOVQ m64, k1","VEX.L0.0F.W1 91 /r","Valid","Valid","Invalid","AVX512BW",=
"ModRM:r/m (w, ModRM:[7:6] must not be 11b)","ModRM:reg (r)","","","","Move=
 64 bits mask from k1 and store the result in m64."
+"KMOVQ k1, rw","VEX.L0.F2.0F.W1 92 /r","Valid","Invalid","Invalid","AVX512=
BW","ModRM:reg (w)","ModRM:r/m (r, ModRM:[7:6] must be 11b)","","","","Move=
 64 bits mask from r to k1."
+"KMOVQ rw, k1","VEX.L0.F2.0F.W1 93 /r","Valid","Invalid","Invalid","AVX512=
BW","ModRM:reg (w)","ModRM:r/m (r, ModRM:[7:6] must be 11b)","","","","Move=
 64 bits mask from k1 to r."
+"KNOTD k1, k2","VEX.L0.66.0F.W1 44 /r","Valid","Valid","Invalid","AVX512BW=
","ModRM:reg (w)","ModRM:r/m (r, ModRM:[7:6] must be 11b)","","","","Bitwis=
e NOT of 32 bits mask k2."
+"KNOTQ k1, k2","VEX.L0.0F.W1 44 /r","Valid","Valid","Invalid","AVX512BW","=
ModRM:reg (w)","ModRM:r/m (r, ModRM:[7:6] must be 11b)","","","","Bitwise N=
OT of 64 bits mask k2."
+"KORD k1, k2, k3","VEX.L1.66.0F.W1 45 /r","Valid","Valid","Invalid","AVX51=
2BW","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r, ModRM:[7:6] must be 11b)=
","","","Bitwise OR 32 bits masks k2 and k3 and place result in k1."
+"KORQ k1, k2, k3","VEX.L1.0F.W1 45 /r","Valid","Valid","Invalid","AVX512BW=
","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r, ModRM:[7:6] must be 11b)","=
","","Bitwise OR 64 bits masks k2 and k3 and place result in k1."
+"KORTESTD k1, k2","VEX.L0.66.0F.W1 98 /r","Valid","Valid","Invalid","AVX51=
2BW","ModRM:reg (w)","ModRM:r/m (r, ModRM:[7:6] must be 11b)","","","","Bit=
wise OR 32 bits masks k1 and k2 and update ZF and CF accordingly."
+"KORTESTQ k1, k2","VEX.L0.0F.W1 98 /r","Valid","Valid","Invalid","AVX512BW=
","ModRM:reg (w)","ModRM:r/m (r, ModRM:[7:6] must be 11b)","","","","Bitwis=
e OR 64 bits masks k1 and k2 and update ZF and CF accordingly."
+"KSHIFTLD k1, k2, ib","VEX.L0.66.0F3A.W0 33 /r ib","Valid","Valid","Invali=
d","AVX512BW","ModRM:reg (w)","ModRM:r/m (r, ModRM:[7:6] must be 11b)","ib"=
,"","","Shift left 32 bits in k2 by immediate and write result in k1."
+"KSHIFTLQ k1, k2, ib","VEX.L0.66.0F3A.W1 33 /r ib","Valid","Valid","Invali=
d","AVX512BW","ModRM:reg (w)","ModRM:r/m (r, ModRM:[7:6] must be 11b)","ib"=
,"","","Shift left 64 bits in k2 by immediate and write result in k1."
+"KSHIFTRD k1, k2, ib","VEX.L0.66.0F3A.W0 31 /r ib","Valid","Valid","Invali=
d","AVX512BW","ModRM:reg (w)","ModRM:r/m (r, ModRM:[7:6] must be 11b)","ib"=
,"","","Shift right 32 bits in k2 by immediate and write result in k1."
+"KSHIFTRQ k1, k2, ib","VEX.L0.66.0F3A.W1 31 /r ib","Valid","Valid","Invali=
d","AVX512BW","ModRM:reg (w)","ModRM:r/m (r, ModRM:[7:6] must be 11b)","ib"=
,"","","Shift right 64 bits in k2 by immediate and write result in k1."
+"KTESTD k1, k2","VEX.L0.66.0F.W1 99 /r","Valid","Valid","Invalid","AVX512B=
W","ModRM:reg (r)","ModRM:r/m (r, ModRM:[7:6] must be 11b)","","","","Set Z=
F and CF depending on sign bit AND and ANDN of 32 bits mask register source=
s."
+"KTESTQ k1, k2","VEX.L0.0F.W1 99 /r","Valid","Valid","Invalid","AVX512BW",=
"ModRM:reg (r)","ModRM:r/m (r, ModRM:[7:6] must be 11b)","","","","Set ZF a=
nd CF depending on sign bit AND and ANDN of 64 bits mask register sources."
+"KUNPCKDQ k1, k2, k3","VEX.L1.0F.W1 4B /r","Valid","Valid","Invalid","AVX5=
12BW","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r, ModRM:[7:6] must be 11b=
)","","","Unpack and interleave 32 bits masks in k2 and k3 and write quadwo=
rd result in k1."
+"KUNPCKWD k1, k2, k3","VEX.L1.0F.W0 4B /r","Valid","Valid","Invalid","AVX5=
12BW","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r, ModRM:[7:6] must be 11b=
)","","","Unpack and interleave 16 bits in k2 and k3 and write double-word =
result in k1."
+"KXNORD k1, k2, k3","VEX.L1.66.0F.W1 46 /r","Valid","Valid","Invalid","AVX=
512BW","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r, ModRM:[7:6] must be 11=
b)","","","Bitwise XNOR 32 bits masks k2 and k3 and place result in k1."
+"KXNORQ k1, k2, k3","VEX.L1.0F.W1 46 /r","Valid","Valid","Invalid","AVX512=
BW","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r, ModRM:[7:6] must be 11b)"=
,"","","Bitwise XNOR 64 bits masks k2 and k3 and place result in k1."
+"KXORD k1, k2, k3","VEX.L1.66.0F.W1 47 /r","Valid","Valid","Invalid","AVX5=
12BW","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r, ModRM:[7:6] must be 11b=
)","","","Bitwise XOR 32 bits masks k2 and k3 and place result in k1."
+"KXORQ k1, k2, k3","VEX.L1.0F.W1 47 /r","Valid","Valid","Invalid","AVX512B=
W","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r, ModRM:[7:6] must be 11b)",=
"","","Bitwise XOR 64 bits masks k2 and k3 and place result in k1."
+"VDBPSADBW xmm1 {k1}{z}, xmm2, xmm3/m128, ib","EVEX.128.66.0F3A.W0 42 /r i=
b","Valid","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv=
 (r)","ModRM:r/m (r)","ib","","Compute packed SAD word results of unsigned =
bytes in dword block from xmm2 with unsigned bytes of dword blocks transfor=
med from xmm3/m128 using the shuffle controls in ib. Results are written to=
 xmm1 under the writemask k1."
+"VDBPSADBW ymm1 {k1}{z}, ymm2, ymm3/m256, ib","EVEX.256.66.0F3A.W0 42 /r i=
b","Valid","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv=
 (r)","ModRM:r/m (r)","ib","","Compute packed SAD word results of unsigned =
bytes in dword block from ymm2 with unsigned bytes of dword blocks transfor=
med from ymm3/m256 using the shuffle controls in ib. Results are written to=
 ymm1 under the writemask k1."
+"VDBPSADBW zmm1 {k1}{z}, zmm2, zmm3/m512, ib","EVEX.512.66.0F3A.W0 42 /r i=
b","Valid","Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","ib","","Compute packed SAD word results of unsigned bytes in =
dword block from zmm2 with unsigned bytes of dword blocks transformed from =
zmm3/m512 using the shuffle controls in ib. Results are written to zmm1 und=
er the writemask k1."
+"VMOVDQU16 xmm1 {k1}{z}, xmm2/m128","EVEX.128.F2.0F.W1 6F /r","Valid","Val=
id","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","","Fu=
ll Vector Mem","Move unaligned packed word integer values from xmm2/m128 to=
 xmm1 using writemask k1."
+"VMOVDQU16 ymm1 {k1}{z}, ymm2/m256","EVEX.256.F2.0F.W1 6F /r","Valid","Val=
id","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","","Fu=
ll Vector Mem","Move unaligned packed word integer values from ymm2/m256 to=
 ymm1 using writemask k1."
+"VMOVDQU16 zmm1 {k1}{z}, zmm2/m512","EVEX.512.F2.0F.W1 6F /r","Valid","Val=
id","Invalid","AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","","Full Vector=
 Mem","Move unaligned packed word integer values from zmm2/m512 to zmm1 usi=
ng writemask k1."
+"VMOVDQU16 xmm2/m128 {k1}{z}, xmm1","EVEX.128.F2.0F.W1 7F /r","Valid","Val=
id","Invalid","AVX512VL AVX512BW","ModRM:r/m (w)","ModRM:reg (r)","","","Fu=
ll Vector Mem","Move unaligned packed word integer values from xmm1 to xmm2=
/m128 using writemask k1."
+"VMOVDQU16 ymm2/m256 {k1}{z}, ymm1","EVEX.256.F2.0F.W1 7F /r","Valid","Val=
id","Invalid","AVX512VL AVX512BW","ModRM:r/m (w)","ModRM:reg (r)","","","Fu=
ll Vector Mem","Move unaligned packed word integer values from ymm1 to ymm2=
/m256 using writemask k1."
+"VMOVDQU16 zmm2/m512 {k1}{z}, zmm1","EVEX.512.F2.0F.W1 7F /r","Valid","Val=
id","Invalid","AVX512BW","ModRM:r/m (w)","ModRM:reg (r)","","","Full Vector=
 Mem","Move unaligned packed word integer values from zmm1 to zmm2/m512 usi=
ng writemask k1."
+"VMOVDQU8 xmm1 {k1}{z}, xmm2/m128","EVEX.128.F2.0F.W0 6F /r","Valid","Vali=
d","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","","Ful=
l Vector Mem","Move unaligned packed byte integer values from xmm2/m128 to =
xmm1 using writemask k1."
+"VMOVDQU8 ymm1 {k1}{z}, ymm2/m256","EVEX.256.F2.0F.W0 6F /r","Valid","Vali=
d","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","","Ful=
l Vector Mem","Move unaligned packed byte integer values from ymm2/m256 to =
ymm1 using writemask k1."
+"VMOVDQU8 zmm1 {k1}{z}, zmm2/m512","EVEX.512.F2.0F.W0 6F /r","Valid","Vali=
d","Invalid","AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","","Full Vector =
Mem","Move unaligned packed byte integer values from zmm2/m512 to zmm1 usin=
g writemask k1."
+"VMOVDQU8 xmm2/m128 {k1}{z}, xmm1","EVEX.128.F2.0F.W0 7F /r","Valid","Vali=
d","Invalid","AVX512VL AVX512BW","ModRM:r/m (w)","ModRM:reg (r)","","","Ful=
l Vector Mem","Move unaligned packed byte integer values from xmm1 to xmm2/=
m128 using writemask k1."
+"VMOVDQU8 ymm2/m256 {k1}{z}, ymm1","EVEX.256.F2.0F.W0 7F /r","Valid","Vali=
d","Invalid","AVX512VL AVX512BW","ModRM:r/m (w)","ModRM:reg (r)","","","Ful=
l Vector Mem","Move unaligned packed byte integer values from ymm1 to ymm2/=
m256 using writemask k1."
+"VMOVDQU8 zmm2/m512 {k1}{z}, zmm1","EVEX.512.F2.0F.W0 7F /r","Valid","Vali=
d","Invalid","AVX512BW","ModRM:r/m (w)","ModRM:reg (r)","","","Full Vector =
Mem","Move unaligned packed byte integer values from zmm1 to zmm2/m512 usin=
g writemask k1."
+"VPABSB xmm1 {k1}{z}, xmm2/m128","EVEX.128.66.0F38.WIG 1C /r","Valid","Val=
id","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","","Fu=
ll Vector Mem","Compute the absolute value of bytes in xmm2/m128 and store =
UNSIGNED result in xmm1 using writemask k1."
+"VPABSB ymm1 {k1}{z}, ymm2/m256","EVEX.256.66.0F38.WIG 1C /r","Valid","Val=
id","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","","Fu=
ll Vector Mem","Compute the absolute value of bytes in ymm2/m256 and store =
UNSIGNED result in ymm1 using writemask k1."
+"VPABSB zmm1 {k1}{z}, zmm2/m512","EVEX.512.66.0F38.WIG 1C /r","Valid","Val=
id","Invalid","AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","","Full Vector=
 Mem","Compute the absolute value of bytes in zmm2/m512 and store UNSIGNED =
result in zmm1 using writemask k1."
+"VPABSW xmm1 {k1}{z}, xmm2/m128","EVEX.128.66.0F38.WIG 1D /r","Valid","Val=
id","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","","Fu=
ll Vector Mem","Compute the absolute value of 16-bit integers in xmm2/m128 =
and store UNSIGNED result in xmm1 using writemask k1."
+"VPABSW ymm1 {k1}{z}, ymm2/m256","EVEX.256.66.0F38.WIG 1D /r","Valid","Val=
id","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","","Fu=
ll Vector Mem","Compute the absolute value of 16-bit integers in xmm2/m256 =
and store UNSIGNED result in xmm1 using writemask k1."
+"VPABSW zmm1 {k1}{z}, zmm2/m512","EVEX.512.66.0F38.WIG 1D /r","Valid","Val=
id","Invalid","AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","","Full Vector=
 Mem","Compute the absolute value of 16-bit integers in xmm2/m512 and store=
 UNSIGNED result in xmm1 using writemask k1."
+"VPACKSSDW xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F.W0 6B /r=
","Valid","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv =
(r)","ModRM:r/m (r)","","Full Vector","Converts packed signed doubleword in=
tegers from xmm2 and from xmm3/m128/m32bcst into packed signed word integer=
s in xmm1 using signed saturation under writemask k1."
+"VPACKSSWB xmm1 {k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F.WIG 63 /r","Vali=
d","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","","Full Vector Mem","Converts packed signed word integers fr=
om xmm2 and from xmm3/m128 into packed signed byte integers in xmm1 using s=
igned saturation under writemask k1."
+"VPACKSSWB ymm1 {k1}{z}, ymm2, ymm3/m256","EVEX.256.66.0F.WIG 63 /r","Vali=
d","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","","Full Vector Mem","Converts packed signed word integers fr=
om ymm2 and from ymm3/m256 into packed signed byte integers in ymm1 using s=
igned saturation under writemask k1."
+"VPACKSSWB zmm1 {k1}{z}, zmm2, zmm3/m512","EVEX.512.66.0F.WIG 63 /r","Vali=
d","Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m =
(r)","","Full Vector Mem","Converts packed signed word integers from zmm2 a=
nd from zmm3/m512 into packed signed byte integers in zmm1 using signed sat=
uration under writemask k1."
+"VPACKUSDW xmm1{k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F38.W0 2B /=
r","Valid","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Convert packed signed doubleword in=
tegers from xmm2 and packed signed doubleword integers from xmm3/m128/m32bc=
st into packed unsigned word integers in xmm1 using unsigned saturation und=
er writemask k1."
+"VPACKUSDW ymm1{k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F38.W0 2B /=
r","Valid","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Convert packed signed doubleword in=
tegers from ymm2 and packed signed doubleword integers from ymm3/m256/m32bc=
st into packed unsigned word integers in ymm1 using unsigned saturation und=
er writemask k1."
+"VPACKUSDW zmm1{k1}{z}, zmm2, zmm3/m512/m32bcst","EVEX.512.66.0F38.W0 2B /=
r","Valid","Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Full Vector","Convert packed signed doubleword integers fr=
om zmm2 and packed signed doubleword integers from zmm3/m512/m32bcst into p=
acked unsigned word integers in zmm1 using unsigned saturation under writem=
ask k1."
+"VPACKUSWB xmm1{k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F.WIG 67 /r","Valid=
","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Full Vector Mem","Converts signed word integers from xmm2 =
and signed word integers from xmm3/m128 into unsigned byte integers in xmm1=
 using unsigned saturation under writemask k1."
+"VPACKUSWB ymm1{k1}{z}, ymm2, ymm3/m256","EVEX.256.66.0F.WIG 67 /r","Valid=
","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Full Vector Mem","Converts signed word integers from ymm2 =
and signed word integers from ymm3/m256 into unsigned byte integers in ymm1=
 using unsigned saturation under writemask k1."
+"VPACKUSWB zmm1{k1}{z}, zmm2, zmm3/m512","EVEX.512.66.0F.WIG 67 /r","Valid=
","Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (=
r)","","Full Vector Mem","Converts signed word integers from zmm2 and signe=
d word integers from zmm3/m512 into unsigned byte integers in zmm1 using un=
signed saturation under writemask k1."
+"VPADDB xmm1 {k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F.WIG FC /r","Valid",=
"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector Mem","Add packed byte integers from xmm2, and xm=
m3/m128 and store in xmm1 using writemask k1."
+"VPADDB zmm1 {k1}{z}, zmm2, zmm3/m512","EVEX.512.66.0F.WIG FC /r","Valid",=
"Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)=
","","Full Vector Mem","Add packed byte integers from zmm2, and zmm3/m512 a=
nd store in xmm1 using writemask k1."
+"VPADDB ymm1 {k1}{z}, ymm2, ymm3/m256","EVEX.256.66.0F.WIG FC /r","Valid",=
"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector Mem","Add packed byte integers from ymm2, and ym=
m3/m256 and store in ymm1 using writemask k1."
+"VPADDSB xmm1 {k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F.WIG EC /r","Valid"=
,"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","Mod=
RM:r/m (r)","","Full Vector Mem","Add packed signed byte integers from xmm2=
, and xmm3/m128 and store the saturated results in xmm1 under writemask k1."
+"VPADDSB ymm1 {k1}{z}, ymm2, ymm3/m256","EVEX.256.66.0F.WIG EC /r","Valid"=
,"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","Mod=
RM:r/m (r)","","Full Vector Mem","Add packed signed byte integers from ymm2=
, and ymm3/m256 and store the saturated results in ymm1 under writemask k1."
+"VPADDSB zmm1 {k1}{z}, zmm2, zmm3/m512","EVEX.512.66.0F.WIG EC /r","Valid"=
,"Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r=
)","","Full Vector Mem","Add packed signed byte integers from zmm2, and zmm=
3/m512 and store the saturated results in zmm1 under writemask k1."
+"VPADDSW xmm1 {k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F.WIG ED /r","Valid"=
,"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","Mod=
RM:r/m (r)","","Full Vector Mem","Add packed signed word integers from xmm2=
, and xmm3/m128 and store the saturated results in xmm1 under writemask k1."
+"VPADDSW ymm1 {k1}{z}, ymm2, ymm3/m256","EVEX.256.66.0F.WIG ED /r","Valid"=
,"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","Mod=
RM:r/m (r)","","Full Vector Mem","Add packed signed word integers from ymm2=
, and ymm3/m256 and store the saturated results in ymm1 under writemask k1."
+"VPADDSW zmm1 {k1}{z}, zmm2, zmm3/m512","EVEX.512.66.0F.WIG ED /r","Valid"=
,"Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r=
)","","Full Vector Mem","Add packed signed word integers from zmm2, and zmm=
3/m512 and store the saturated results in zmm1 under writemask k1."
+"VPADDUSB xmm1 {k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F.WIG DC /r","Valid=
","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Full Vector Mem","Add packed unsigned byte integers from x=
mm2,and xmm3/m128 and store the saturated results in xmm1 under writemask k=
1."
+"VPADDUSB ymm1 {k1}{z}, ymm2, ymm3/m256","EVEX.256.66.0F.WIG DC /r","Valid=
","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Full Vector Mem","Add packed unsigned byte integers from y=
mm2,and ymm3/m256 and store the saturated results in ymm1 under writemask k=
1."
+"VPADDUSB zmm1 {k1}{z}, zmm2, zmm3/m512","EVEX.512.66.0F.WIG DC /r","Valid=
","Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (=
r)","","Full Vector Mem","Add packed unsigned byte integers from zmm2,and z=
mm3/m512 and store the saturated results in zmm1 under writemask k1."
+"VPADDUSW xmm1 {k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F.WIG DD /r","Valid=
","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Full Vector Mem","Add packed unsigned word integers from x=
mm2,and xmm3/m128 and store the saturated results in xmm1 under writemask k=
1."
+"VPADDUSW ymm1 {k1}{z}, ymm2, ymm3/m256","EVEX.256.66.0F.WIG DD /r","Valid=
","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Full Vector Mem","Add packed unsigned word integers from y=
mm2,and ymm3/m256 and store the saturated results in ymm1 under writemask k=
1."
+"VPADDUSW zmm1 {k1}{z}, zmm2, zmm3/m512","EVEX.512.66.0F.WIG DD /r","Valid=
","Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (=
r)","","Full Vector Mem","Add packed unsigned word integers from zmm2,and z=
mm3/m512 and store the saturated results in zmm1 under writemask k1."
+"VPADDW xmm1 {k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F.WIG FD /r","Valid",=
"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector Mem","Add packed word integers from xmm2, and xm=
m3/m128 and store in xmm1 using writemask k1."
+"VPADDW ymm1 {k1}{z}, ymm2, ymm3/m256","EVEX.256.66.0F.WIG FD /r","Valid",=
"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector Mem","Add packed word integers from ymm2, and ym=
m3/m256 and store in ymm1 using writemask k1."
+"VPADDW zmm1 {k1}{z}, zmm2, zmm3/m512","EVEX.512.66.0F.WIG FD /r","Valid",=
"Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)=
","","Full Vector Mem","Add packed word integers from zmm2, and zmm3/m512 a=
nd store in xmm1 using writemask k1."
+"VPALIGNR xmm1 {k1}{z}, xmm2, xmm3/m128, ib","EVEX.128.66.0F3A.WIG 0F /r i=
b","Valid","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv=
 (r)","ModRM:r/m (r)","ib","","Concatenate xmm2 and xmm3/m128 into a 32-byt=
e intermediate result, extract byte aligned result shifted to the right by =
constant value in ib and result is stored in xmm1."
+"VPALIGNR ymm1 {k1}{z}, ymm2, ymm3/m256, ib","EVEX.256.66.0F3A.WIG 0F /r i=
b","Valid","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv=
 (r)","ModRM:r/m (r)","ib","","Concatenate pairs of 16 bytes in ymm2 and ym=
m3/m256 into 32-byte intermediate result, extract byte-aligned, 16-byte res=
ult shifted to the right by constant values in ib from each intermediate re=
sult, and two 16-byte results are stored in ymm1."
+"VPALIGNR zmm1 {k1}{z}, zmm2, zmm3/m512, ib","EVEX.512.66.0F3A.WIG 0F /r i=
b","Valid","Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","ib","","Concatenate pairs of 16 bytes in zmm2 and zmm3/m512 i=
nto 32-byte intermediate result, extract byte-aligned, 16-byte result shift=
ed to the right by constant values in ib from each intermediate result, and=
 four 16-byte results are stored in zmm1."
+"VPAVGB xmm1 {k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F.WIG E0 /r","Valid",=
"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector Mem","Average packed unsigned byte integers from=
 xmm2, and xmm3/m128 with rounding and store to xmm1 under writemask k1."
+"VPAVGB ymm1 {k1}{z}, ymm2, ymm3/m256","EVEX.256.66.0F.WIG E0 /r","Valid",=
"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector Mem","Average packed unsigned byte integers from=
 ymm2, and ymm3/m256 with rounding and store to ymm1 under writemask k1."
+"VPAVGB zmm1 {k1}{z}, zmm2, zmm3/m512","EVEX.512.66.0F.WIG E0 /r","Valid",=
"Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)=
","","Full Vector Mem","Average packed unsigned byte integers from zmm2, an=
d zmm3/m512 with rounding and store to zmm1 under writemask k1."
+"VPAVGW xmm1 {k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F.WIG E3 /r","Valid",=
"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector Mem","Average packed unsigned word integers from=
 xmm2, xmm3/m128 with rounding to xmm1 under writemask k1."
+"VPAVGW ymm1 {k1}{z}, ymm2, ymm3/m256","EVEX.256.66.0F.WIG E3 /r","Valid",=
"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector Mem","Average packed unsigned word integers from=
 ymm2, ymm3/m256 with rounding to ymm1 under writemask k1."
+"VPAVGW zmm1 {k1}{z}, zmm2, zmm3/m512","EVEX.512.66.0F.WIG E3 /r","Valid",=
"Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)=
","","Full Vector Mem","Average packed unsigned word integers from zmm2, zm=
m3/m512 with rounding to zmm1 under writemask k1."
+"VPBLENDMB xmm1 {k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F38.W0 66 /r","Val=
id","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","=
ModRM:r/m (r)","","Full Vector Mem","Blend byte integer vector xmm2 and byt=
e vector xmm3/m128 and store the result in xmm1, under control mask."
+"VPBLENDMB ymm1 {k1}{z}, ymm2, ymm3/m256","EVEX.256.66.0F38.W0 66 /r","Val=
id","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","=
ModRM:r/m (r)","","Full Vector Mem","Blend byte integer vector ymm2 and byt=
e vector ymm3/m256 and store the result in ymm1, under control mask."
+"VPBLENDMB zmm1 {k1}{z}, zmm2, zmm3/m512","EVEX.512.66.0F38.W0 66 /r","Val=
id","Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m=
 (r)","","Full Vector Mem","Blend byte integer vector zmm2 and byte vector =
zmm3/m512 and store the result in zmm1, under control mask."
+"VPBLENDMW xmm1 {k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F38.W1 66 /r","Val=
id","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","=
ModRM:r/m (r)","","Full Vector Mem","Blend word integer vector xmm2 and wor=
d vector xmm3/m128 and store the result in xmm1, under control mask."
+"VPBLENDMW ymm1 {k1}{z}, ymm2, ymm3/m256","EVEX.256.66.0F38.W1 66 /r","Val=
id","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","=
ModRM:r/m (r)","","Full Vector Mem","Blend word integer vector ymm2 and wor=
d vector ymm3/m256 and store the result in ymm1, under control mask."
+"VPBLENDMW zmm1 {k1}{z}, zmm2, zmm3/m512","EVEX.512.66.0F38.W1 66 /r","Val=
id","Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m=
 (r)","","Full Vector Mem","Blend word integer vector zmm2 and word vector =
zmm3/m512 and store the result in zmm1, under control mask."
+"VPBROADCASTB xmm1{k1}{z}, xmm2/m8","EVEX.128.66.0F38.W0 78 /r","Valid","V=
alid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","","=
Tuple1 Scalar","Broadcast a byte integer in the source operand to locations=
 in xmm1 subject to writemask k1."
+"VPBROADCASTB ymm1{k1}{z}, xmm2/m8","EVEX.256.66.0F38.W0 78 /r","Valid","V=
alid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","","=
Tuple1 Scalar","Broadcast a byte integer in the source operand to locations=
 in ymm1 subject to writemask k1."
+"VPBROADCASTB zmm1{k1}{z}, xmm2/m8","EVEX.512.66.0F38.W0 78 /r","Valid","V=
alid","Invalid","AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple1 Sc=
alar","Broadcast a byte integer in the source operand to 64 locations in zm=
m1 subject to writemask k1."
+"VPBROADCASTB xmm1 {k1}{z}, r32","EVEX.128.66.0F38.W0 7A /r","Valid","Vali=
d","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","","Tup=
le1 Scalar","Broadcast an 8-bit value from a GPR to all bytes in the 128-bi=
t destination subject to writemask k1."
+"VPBROADCASTB ymm1 {k1}{z}, r32","EVEX.256.66.0F38.W0 7A /r","Valid","Vali=
d","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","","Tup=
le1 Scalar","Broadcast an 8-bit value from a GPR to all bytes in the 256-bi=
t destination subject to writemask k1."
+"VPBROADCASTB zmm1 {k1}{z}, r32","EVEX.512.66.0F38.W0 7A /r","Valid","Vali=
d","Invalid","AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple1 Scala=
r","Broadcast an 8-bit value from a GPR to all bytes in the 512-bit destina=
tion subject to writemask k1."
+"VPBROADCASTW xmm1{k1}{z}, xmm2/m16","EVEX.128.66.0F38.W0 79 /r","Valid","=
Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","",=
"Tuple1 Scalar","Broadcast a word integer in the source operand to location=
s in xmm1 subject to writemask k1."
+"VPBROADCASTW ymm1{k1}{z}, xmm2/m16","EVEX.256.66.0F38.W0 79 /r","Valid","=
Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","",=
"Tuple1 Scalar","Broadcast a word integer in the source operand to location=
s in ymm1 subject to writemask k1."
+"VPBROADCASTW zmm1{k1}{z}, xmm2/m16","EVEX.512.66.0F38.W0 79 /r","Valid","=
Valid","Invalid","AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple1 S=
calar","Broadcast a word integer in the source operand to 32 locations in z=
mm1 subject to writemask k1."
+"VPBROADCASTW xmm1 {k1}{z}, r32","EVEX.128.66.0F38.W0 7B /r","Valid","Vali=
d","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","","Tup=
le1 Scalar","Broadcast a 16-bit value from a GPR to all words in the 128-bi=
t destination subject to writemask k1."
+"VPBROADCASTW ymm1 {k1}{z}, r32","EVEX.256.66.0F38.W0 7B /r","Valid","Vali=
d","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","","Tup=
le1 Scalar","Broadcast a 16-bit value from a GPR to all words in the 256-bi=
t destination subject to writemask k1."
+"VPBROADCASTW zmm1 {k1}{z}, r32","EVEX.512.66.0F38.W0 7B /r","Valid","Vali=
d","Invalid","AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple1 Scala=
r","Broadcast a 16-bit value from a GPR to all words in the 512-bit destina=
tion subject to writemask k1."
+"VPCMPB k1 {k2}, xmm2, xmm3/m128, ib","EVEX.128.66.0F3A.W0 3F /r ib","Vali=
d","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","ib","Full Vector Mem","Compare packed signed byte values in =
xmm3/m128 and xmm2 using bits 2:0 of ib as a comparison predicate with writ=
emask k2 and leave the result in mask register k1."
+"VPCMPB k1 {k2}, ymm2, ymm3/m256, ib","EVEX.256.66.0F3A.W0 3F /r ib","Vali=
d","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","ib","Full Vector Mem","Compare packed signed byte values in =
ymm3/m256 and ymm2 using bits 2:0 of ib as a comparison predicate with writ=
emask k2 and leave the result in mask register k1."
+"VPCMPB k1 {k2}, zmm2, zmm3/m512, ib","EVEX.512.66.0F3A.W0 3F /r ib","Vali=
d","Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m =
(r)","ib","Full Vector Mem","Compare packed signed byte values in zmm3/m512=
 and zmm2 using bits 2:0 of ib as a comparison predicate with writemask k2 =
and leave the result in mask register k1."
+"VPCMPEQB k1 {k2}, xmm2, xmm3/m128","EVEX.128.66.0F.WIG 74 /r","Valid","Va=
lid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r=
/m (r)","","Full Vector Mem","Compare packed bytes in xmm3/m128 and xmm2 fo=
r equality and set vector mask k1 to reflect the zero/nonzero status of eac=
h element of the result, under writemask."
+"VPCMPEQB k1 {k2}, ymm2, ymm3/m256","EVEX.256.66.0F.WIG 74 /r","Valid","Va=
lid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r=
/m (r)","","Full Vector Mem","Compare packed bytes in ymm3/m256 and ymm2 fo=
r equality and set vector mask k1 to reflect the zero/nonzero status of eac=
h element of the result, under writemask."
+"VPCMPEQB k1 {k2}, zmm2, zmm3/m512","EVEX.512.66.0F.WIG 74 /r","Valid","Va=
lid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)","=
","Full Vector Mem","Compare packed bytes in zmm3/m512 and zmm2 for equalit=
y and set vector mask k1 to reflect the zero/nonzero status of each element=
 of the result, under writemask."
+"VPCMPEQW k1 {k2}, xmm2, xmm3/m128","EVEX.128.66.0F.WIG 75 /r","Valid","Va=
lid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r=
/m (r)","","Full Vector Mem","Compare packed words in xmm3/m128 and xmm2 fo=
r equality and set vector mask k1 to reflect the zero/nonzero status of eac=
h element of the result, under writemask."
+"VPCMPEQW k1 {k2}, ymm2, ymm3/m256","EVEX.256.66.0F.WIG 75 /r","Valid","Va=
lid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r=
/m (r)","","Full Vector Mem","Compare packed words in ymm3/m256 and ymm2 fo=
r equality and set vector mask k1 to reflect the zero/nonzero status of eac=
h element of the result, under writemask."
+"VPCMPEQW k1 {k2}, zmm2, zmm3/m512","EVEX.512.66.0F.WIG 75 /r","Valid","Va=
lid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)","=
","Full Vector Mem","Compare packed words in zmm3/m512 and zmm2 for equalit=
y and set vector mask k1 to reflect the zero/nonzero status of each element=
 of the result, under writemask."
+"VPCMPGTB k1 {k2}, xmm2, xmm3/m128","EVEX.128.66.0F.WIG 64 /r","Valid","Va=
lid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r=
/m (r)","","Full Vector Mem","Compare packed signed byte integers in xmm2 a=
nd xmm3/m128 for greater than,and set vector mask k1 to reflect the zero/no=
nzero status of each element of the result,under writemask."
+"VPCMPGTB k1 {k2}, ymm2, ymm3/m256","EVEX.256.66.0F.WIG 64 /r","Valid","Va=
lid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r=
/m (r)","","Full Vector Mem","Compare packed signed byte integers in ymm2 a=
nd ymm3/m256 for greater than,and set vector mask k1 to reflect the zero/no=
nzero status of each element of the result,under writemask."
+"VPCMPGTB k1 {k2}, zmm2, zmm3/m512","EVEX.512.66.0F.WIG 64 /r","Valid","Va=
lid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)","=
","Full Vector Mem","Compare packed signed byte integers in zmm2 and zmm3/m=
512 for greater than,and set vector mask k1 to reflect the zero/nonzero sta=
tus of each element of the result,under writemask."
+"VPCMPGTW k1 {k2}, xmm2, xmm3/m128","EVEX.128.66.0F.WIG 65 /r","Valid","Va=
lid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r=
/m (r)","","Full Vector Mem","Compare packed signed word integers in xmm2 a=
nd xmm3/m128 for greater than,and set vector mask k1 to reflect the zero/no=
nzero status of each element of the result,under writemask."
+"VPCMPGTW k1 {k2}, ymm2, ymm3/m256","EVEX.256.66.0F.WIG 65 /r","Valid","Va=
lid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r=
/m (r)","","Full Vector Mem","Compare packed signed word integers in ymm2 a=
nd ymm3/m256 for greater than,and set vector mask k1 to reflect the zero/no=
nzero status of each element of the result,under writemask."
+"VPCMPGTW k1 {k2}, zmm2, zmm3/m512","EVEX.512.66.0F.WIG 65 /r","Valid","Va=
lid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)","=
","Full Vector Mem","Compare packed signed word integers in zmm2 and zmm3/m=
512 for greater than,and set vector mask k1 to reflect the zero/nonzero sta=
tus of each element of the result,under writemask."
+"VPCMPUB k1 {k2}, xmm2, xmm3/m128, ib","EVEX.128.66.0F3A.W0 3E /r ib","Val=
id","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","=
ModRM:r/m (r)","ib","Full Vector Mem","Compare packed unsigned byte values =
in xmm3/m128 and xmm2 using bits 2:0 of ib as a comparison predicate with w=
ritemask k2 and leave the result in mask register k1."
+"VPCMPUB k1 {k2}, ymm2, ymm3/m256, ib","EVEX.256.66.0F3A.W0 3E /r ib","Val=
id","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","=
ModRM:r/m (r)","ib","Full Vector Mem","Compare packed unsigned byte values =
in ymm3/m256 and ymm2 using bits 2:0 of ib as a comparison predicate with w=
ritemask k2 and leave the result in mask register k1."
+"VPCMPUB k1 {k2}, zmm2, zmm3/m512, ib","EVEX.512.66.0F3A.W0 3E /r ib","Val=
id","Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m=
 (r)","ib","Full Vector Mem","Compare packed unsigned byte values in zmm3/m=
512 and zmm2 using bits 2:0 of ib as a comparison predicate with writemask =
k2 and leave the result in mask register k1."
+"VPCMPUW k1 {k2}, xmm2, xmm3/m128, ib","EVEX.128.66.0F3A.W1 3E /r ib","Val=
id","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","=
ModRM:r/m (r)","ib","Full Vector Mem","Compare packed unsigned word integer=
s in xmm3/m128 and xmm2 using bits 2:0 of ib as a comparison predicate with=
 writemask k2 and leave the result in mask register k1."
+"VPCMPUW k1 {k2}, ymm2, ymm3/m256, ib","EVEX.256.66.0F3A.W1 3E /r ib","Val=
id","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","=
ModRM:r/m (r)","ib","Full Vector Mem","Compare packed unsigned word integer=
s in ymm3/m256 and ymm2 using bits 2:0 of ib as a comparison predicate with=
 writemask k2 and leave the result in mask register k1."
+"VPCMPUW k1 {k2}, zmm2, zmm3/m512, ib","EVEX.512.66.0F3A.W1 3E /r ib","Val=
id","Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m=
 (r)","ib","Full Vector Mem","Compare packed unsigned word integers in zmm3=
/m512 and zmm2 using bits 2:0 of ib as a comparison predicate with writemas=
k k2 and leave the result in mask register k1."
+"VPCMPW k1 {k2}, xmm2, xmm3/m128, ib","EVEX.128.66.0F3A.W1 3F /r ib","Vali=
d","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","ib","Full Vector Mem","Compare packed signed word integers i=
n xmm3/m128 and xmm2 using bits 2:0 of ib as a comparison predicate with wr=
itemask k2 and leave the result in mask register k1."
+"VPCMPW k1 {k2}, ymm2, ymm3/m256, ib","EVEX.256.66.0F3A.W1 3F /r ib","Vali=
d","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","ib","Full Vector Mem","Compare packed signed word integers i=
n ymm3/m256 and ymm2 using bits 2:0 of ib as a comparison predicate with wr=
itemask k2 and leave the result in mask register k1."
+"VPCMPW k1 {k2}, zmm2, zmm3/m512, ib","EVEX.512.66.0F3A.W1 3F /r ib","Vali=
d","Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m =
(r)","ib","Full Vector Mem","Compare packed signed word integers in zmm3/m5=
12 and zmm2 using bits 2:0 of ib as a comparison predicate with writemask k=
2 and leave the result in mask register k1."
+"VPERMI2W xmm1 {k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F38.W1 75 /r","Vali=
d","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (r, w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector Mem","Permute word integers from two table=
s in xmm3/m128 and xmm2 using indexes in xmm1 and store the result in xmm1 =
using writemask k1."
+"VPERMI2W ymm1 {k1}{z}, ymm2, ymm3/m256","EVEX.256.66.0F38.W1 75 /r","Vali=
d","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (r, w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector Mem","Permute word integers from two table=
s in ymm3/m256 and ymm2 using indexes in ymm1 and store the result in ymm1 =
using writemask k1."
+"VPERMI2W zmm1 {k1}{z}, zmm2, zmm3/m512","EVEX.512.66.0F38.W1 75 /r","Vali=
d","Valid","Invalid","AVX512BW","ModRM:reg (r, w)","EVEX.vvvv (r)","ModRM:r=
/m (r)","","Full Vector Mem","Permute word integers from two tables in zmm3=
/m512 and zmm2 using indexes in zmm1 and store the result in zmm1 using wri=
temask k1."
+"VPERMT2W xmm1 {k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F38.W1 7D /r","Vali=
d","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (r, w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Mem","Permute word integers from two tables in xm=
m3/m128 and xmm1 using indexes in xmm2 and store the result in xmm1 using w=
ritemask k1."
+"VPERMT2W ymm1 {k1}{z}, ymm2, ymm3/m256","EVEX.256.66.0F38.W1 7D /r","Vali=
d","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (r, w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Mem","Permute word integers from two tables in ym=
m3/m256 and ymm1 using indexes in ymm2 and store the result in ymm1 using w=
ritemask k1."
+"VPERMT2W zmm1 {k1}{z}, zmm2, zmm3/m512","EVEX.512.66.0F38.W1 7D /r","Vali=
d","Valid","Invalid","AVX512BW","ModRM:reg (r, w)","EVEX.vvvv (r)","ModRM:r=
/m (r)","","Full Mem","Permute word integers from two tables in zmm3/m512 a=
nd zmm1 using indexes in zmm2 and store the result in zmm1 using writemask =
k1."
+"VPERMW xmm1 {k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F38.W1 8D /r","Valid"=
,"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","VEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector Mem","Permute word integers in xmm3/m128 using i=
ndexes in xmm2 and store the result in xmm1 using writemask k1."
+"VPERMW ymm1 {k1}{z}, ymm2, ymm3/m256","EVEX.256.66.0F38.W1 8D /r","Valid"=
,"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","VEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector Mem","Permute word integers in ymm3/m256 using i=
ndexes in ymm2 and store the result in ymm1 using writemask k1."
+"VPERMW zmm1 {k1}{z}, zmm2, zmm3/m512","EVEX.512.66.0F38.W1 8D /r","Valid"=
,"Valid","Invalid","AVX512BW","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)=
","","Full Vector Mem","Permute word integers in zmm3/m512 using indexes in=
 zmm2 and store the result in zmm1 using writemask k1."
+"VPEXTRB r32/m8, xmm2, ib","EVEX.128.66.0F3A.WIG 14 /r ib","Valid","Valid"=
,"Invalid","AVX512BW","ModRM:r/m (w)","ModRM:reg (r)","ib","","Tuple1 Scala=
r","Extract a byte integer value from xmm2 at the source byte offset specif=
ied by ib into reg or m8. The upper bits of r are zeroed."
+"VPINSRB xmm1, xmm2, r32/m8, ib","EVEX.128.66.0F3A.WIG 20 /r ib","Valid","=
Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)"=
,"ib","Tuple1 Scalar","Merge a byte integer value from r/m8 and rest from x=
mm2 into xmm1 at the byte offset in ib."
+"VPINSRW xmm1, xmm2, r32/m16, ib","EVEX.128.66.0F.WIG C4 /r ib","Valid","V=
alid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)",=
"ib","Tuple1 Scalar","Insert a word integer value from r/m and rest from xm=
m2 into xmm1 at the word offset in ib."
+"VPMADDUBSW xmm1{k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F38.WIG 04 /r","Va=
lid","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)",=
"ModRM:r/m (r)","","Full Vector Mem","Multiply signed and unsigned bytes, a=
dd horizontal pair of signed words, pack saturated signed-words to xmm1 und=
er writemask k1."
+"VPMADDUBSW ymm1{k1}{z}, ymm2, ymm3/m256","EVEX.256.66.0F38.WIG 04 /r","Va=
lid","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)",=
"ModRM:r/m (r)","","Full Vector Mem","Multiply signed and unsigned bytes, a=
dd horizontal pair of signed words, pack saturated signed-words to ymm1 und=
er writemask k1."
+"VPMADDUBSW zmm1{k1}{z}, zmm2, zmm3/m512","EVEX.512.66.0F38.WIG 04 /r","Va=
lid","Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/=
m (r)","","Full Vector Mem","Multiply signed and unsigned bytes, add horizo=
ntal pair of signed words, pack saturated signed-words to zmm1 under writem=
ask k1."
+"VPMADDWD xmm1{k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F.WIG F5 /r","Valid"=
,"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","Mod=
RM:r/m (r)","","Full Vector Mem","Multiply the packed word integers in xmm2=
 by the packed word integers in xmm3/m128, add adjacent doubleword results,=
 and store in xmm1 under writemask k1."
+"VPMADDWD ymm1{k1}{z}, ymm2, ymm3/m256","EVEX.256.66.0F.WIG F5 /r","Valid"=
,"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","Mod=
RM:r/m (r)","","Full Vector Mem","Multiply the packed word integers in ymm2=
 by the packed word integers in ymm3/m256, add adjacent doubleword results,=
 and store in ymm1 under writemask k1."
+"VPMADDWD zmm1{k1}{z}, zmm2, zmm3/m512","EVEX.512.66.0F.WIG F5 /r","Valid"=
,"Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r=
)","","Full Vector Mem","Multiply the packed word integers in zmm2 by the p=
acked word integers in zmm3/m512, add adjacent doubleword results, and stor=
e in zmm1 under writemask k1."
+"VPMAXSB xmm1{k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F38.WIG 3C /r","Valid=
","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Full Vector Mem","Compare packed signed byte integers in x=
mm2 and xmm3/m128 and store packed maximum values in xmm1 under writemask k=
1."
+"VPMAXSB ymm1{k1}{z}, ymm2, ymm3/m256","EVEX.256.66.0F38.WIG 3C /r","Valid=
","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Full Vector Mem","Compare packed signed byte integers in y=
mm2 and ymm3/m256 and store packed maximum values in ymm1 under writemask k=
1."
+"VPMAXSB zmm1{k1}{z}, zmm2, zmm3/m512","EVEX.512.66.0F38.WIG 3C /r","Valid=
","Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (=
r)","","Full Vector Mem","Compare packed signed byte integers in zmm2 and z=
mm3/m512 and store packed maximum values in zmm1 under writemask k1."
+"VPMAXSW xmm1{k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F.WIG EE /r","Valid",=
"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector Mem","Compare packed signed word integers in xmm=
2 and xmm3/m128 and store packed maximum values in xmm1 under writemask k1."
+"VPMAXSW ymm1{k1}{z}, ymm2, ymm3/m256","EVEX.256.66.0F.WIG EE /r","Valid",=
"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector Mem","Compare packed signed word integers in ymm=
2 and ymm3/m256 and store packed maximum values in ymm1 under writemask k1."
+"VPMAXSW zmm1{k1}{z}, zmm2, zmm3/m512","EVEX.512.66.0F.WIG EE /r","Valid",=
"Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)=
","","Full Vector Mem","Compare packed signed word integers in zmm2 and zmm=
3/m512 and store packed maximum values in zmm1 under writemask k1."
+"VPMAXUB xmm1{k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F.WIG DE /r","Valid",=
"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector Mem","Compare packed unsigned byte integers in x=
mm2 and xmm3/m128 and store packed maximum values in xmm1 under writemask k=
1."
+"VPMAXUB ymm1{k1}{z}, ymm2, ymm3/m256","EVEX.256.66.0F.WIG DE /r","Valid",=
"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector Mem","Compare packed unsigned byte integers in y=
mm2 and ymm3/m256 and store packed maximum values in ymm1 under writemask k=
1."
+"VPMAXUB zmm1{k1}{z}, zmm2, zmm3/m512","EVEX.512.66.0F.WIG DE /r","Valid",=
"Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)=
","","Full Vector Mem","Compare packed unsigned byte integers in zmm2 and z=
mm3/m512 and store packed maximum values in zmm1 under writemask k1."
+"VPMAXUW xmm1{k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F38.WIG 3E /r","Valid=
","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Full Vector Mem","Compare packed unsigned word integers in=
 xmm2 and xmm3/m128 and store packed maximum values in xmm1 under writemask=
 k1."
+"VPMAXUW ymm1{k1}{z}, ymm2, ymm3/m256","EVEX.256.66.0F38.WIG 3E /r","Valid=
","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Full Vector Mem","Compare packed unsigned word integers in=
 ymm2 and ymm3/m256 and store packed maximum values in ymm1 under writemask=
 k1."
+"VPMAXUW zmm1{k1}{z}, zmm2, zmm3/m512","EVEX.512.66.0F38.WIG 3E /r","Valid=
","Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (=
r)","","Full Vector Mem","Compare packed unsigned word integers in zmm2 and=
 zmm3/m512 and store packed maximum values in zmm1 under writemask k1."
+"VPMINSB xmm1{k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F38.WIG 38 /r","Valid=
","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Full Vector Mem","Compare packed signed byte integers in x=
mm2 and xmm3/m128 and store packed minimum values in xmm1 under writemask k=
1."
+"VPMINSB ymm1{k1}{z}, ymm2, ymm3/m256","EVEX.256.66.0F38.WIG 38 /r","Valid=
","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Full Vector Mem","Compare packed signed byte integers in y=
mm2 and ymm3/m256 and store packed minimum values in ymm1 under writemask k=
1."
+"VPMINSB zmm1{k1}{z}, zmm2, zmm3/m512","EVEX.512.66.0F38.WIG 38 /r","Valid=
","Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (=
r)","","Full Vector Mem","Compare packed signed byte integers in zmm2 and z=
mm3/m512 and store packed minimum values in zmm1 under writemask k1."
+"VPMINSW xmm1{k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F.WIG EA /r","Valid",=
"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector Mem","Compare packed signed word integers in xmm=
2 and xmm3/m128 and store packed minimum values in xmm1 under writemask k1."
+"VPMINSW ymm1{k1}{z}, ymm2, ymm3/m256","EVEX.256.66.0F.WIG EA /r","Valid",=
"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector Mem","Compare packed signed word integers in ymm=
2 and ymm3/m256 and store packed minimum values in ymm1 under writemask k1."
+"VPMINSW zmm1{k1}{z}, zmm2, zmm3/m512","EVEX.512.66.0F.WIG EA /r","Valid",=
"Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)=
","","Full Vector Mem","Compare packed signed word integers in zmm2 and zmm=
3/m512 and store packed minimum values in zmm1 under writemask k1."
+"VPMINUB xmm1{k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F.WIG DA /r","Valid",=
"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector Mem","Compare packed unsigned byte integers in x=
mm2 and xmm3/m128 and store packed minimum values in xmm1 under writemask k=
1."
+"VPMINUB ymm1{k1}{z}, ymm2, ymm3/m256","EVEX.256.66.0F.WIG DA /r","Valid",=
"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector Mem","Compare packed unsigned byte integers in y=
mm2 and ymm3/m256 and store packed minimum values in ymm1 under writemask k=
1."
+"VPMINUB zmm1{k1}{z}, zmm2, zmm3/m512","EVEX.512.66.0F.WIG DA /r","Valid",=
"Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)=
","","Full Vector Mem","Compare packed unsigned byte integers in zmm2 and z=
mm3/m512 and store packed minimum values in zmm1 under writemask k1."
+"VPMINUW xmm1{k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F38.WIG 3A /r","Valid=
","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Full Vector Mem","Compare packed unsigned word integers in=
 xmm3/m128 and xmm2 and return packed minimum values in xmm1 under writemas=
k k1."
+"VPMINUW ymm1{k1}{z}, ymm2, ymm3/m256","EVEX.256.66.0F38.WIG 3A /r","Valid=
","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Full Vector Mem","Compare packed unsigned word integers in=
 ymm3/m256 and ymm2 and return packed minimum values in ymm1 under writemas=
k k1."
+"VPMINUW zmm1{k1}{z}, zmm2, zmm3/m512","EVEX.512.66.0F38.WIG 3A /r","Valid=
","Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (=
r)","","Full Vector Mem","Compare packed unsigned word integers in zmm3/m51=
2 and zmm2 and return packed minimum values in zmm1 under writemask k1."
+"VPMOVB2M k1, xmm1","EVEX.128.F3.0F38.W0 29 /r","Valid","Valid","Invalid",=
"AVX512VL AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","","","Sets each bit=
 in k1 to 1 or 0 based on the value of the most significant bit of the corr=
esponding byte in XMM1."
+"VPMOVB2M k1, ymm1","EVEX.256.F3.0F38.W0 29 /r","Valid","Valid","Invalid",=
"AVX512VL AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","","","Sets each bit=
 in k1 to 1 or 0 based on the value of the most significant bit of the corr=
esponding byte in YMM1."
+"VPMOVB2M k1, zmm1","EVEX.512.F3.0F38.W0 29 /r","Valid","Valid","Invalid",=
"AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","","","Sets each bit in k1 to=
 1 or 0 based on the value of the most significant bit of the corresponding=
 byte in ZMM1."
+"VPMOVM2B xmm1, k1","EVEX.128.F3.0F38.W0 28 /r","Valid","Valid","Invalid",=
"AVX512VL AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","","","Sets each byt=
e in XMM1 to all 1's or all 0's based on the value of the corresponding bit=
 in k1."
+"VPMOVM2B ymm1, k1","EVEX.256.F3.0F38.W0 28 /r","Valid","Valid","Invalid",=
"AVX512VL AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","","","Sets each byt=
e in YMM1 to all 1's or all 0's based on the value of the corresponding bit=
 in k1."
+"VPMOVM2B zmm1, k1","EVEX.512.F3.0F38.W0 28 /r","Valid","Valid","Invalid",=
"AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","","","Sets each byte in ZMM1=
 to all 1's or all 0's based on the value of the corresponding bit in k1."
+"VPMOVM2W xmm1, k1","EVEX.128.F3.0F38.W1 28 /r","Valid","Valid","Invalid",=
"AVX512VL AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","","","Sets each wor=
d in XMM1 to all 1's or all 0's based on the value of the corresponding bit=
 in k1."
+"VPMOVM2W ymm1, k1","EVEX.256.F3.0F38.W1 28 /r","Valid","Valid","Invalid",=
"AVX512VL AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","","","Sets each wor=
d in YMM1 to all 1's or all 0's based on the value of the corresponding bit=
 in k1."
+"VPMOVM2W zmm1, k1","EVEX.512.F3.0F38.W1 28 /r","Valid","Valid","Invalid",=
"AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","","","Sets each word in ZMM1=
 to all 1's or all 0's based on the value of the corresponding bit in k1."
+"VPMOVSWB xmm1/m128 {k1}{z}, ymm2","EVEX.256.F3.0F38.W0 20 /r","Valid","Va=
lid","Invalid","AVX512VL AVX512BW","ModRM:r/m (w)","ModRM:reg (r)","","","H=
alf Vector Mem","Converts 16 packed signed word integers from ymm2 into 16 =
packed signed bytes in xmm1/m128 using signed saturation under writemask k1=
."
+"VPMOVSWB xmm1/m64 {k1}{z}, xmm2","EVEX.128.F3.0F38.W0 20 /r","Valid","Val=
id","Invalid","AVX512VL AVX512BW","ModRM:r/m (w)","ModRM:reg (r)","","","Ha=
lf Vector Mem","Converts 8 packed signed word integers from xmm2 into 8 pac=
ked signed bytes in xmm1/m64 using signed saturation under writemask k1."
+"VPMOVSWB ymm1/m256 {k1}{z}, zmm2","EVEX.512.F3.0F38.W0 20 /r","Valid","Va=
lid","Invalid","AVX512BW","ModRM:r/m (w)","ModRM:reg (r)","","","Half Vecto=
r Mem","Converts 32 packed signed word integers from zmm2 into 32 packed si=
gned bytes in ymm1/m256 using signed saturation under writemask k1."
+"VPMOVSXBW xmm1{k1}{z}, xmm2/m64","EVEX.128.66.0F38.WIG 20 /r","Valid","Va=
lid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","","H=
alf Vector Mem","Sign extend 8 packed 8-bit integers in xmm2/m64 to 8 packe=
d 16-bit integers in zmm1."
+"VPMOVSXBW ymm1{k1}{z}, xmm2/m128","EVEX.256.66.0F38.WIG 20 /r","Valid","V=
alid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","","=
Half Vector Mem","Sign extend 16 packed 8-bit integers in xmm2/m128 to 16 p=
acked 16-bit integers in ymm1."
+"VPMOVSXBW zmm1{k1}{z}, ymm2/m256","EVEX.512.66.0F38.WIG 20 /r","Valid","V=
alid","Invalid","AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","","Half Vect=
or Mem","Sign extend 32 packed 8-bit integers in ymm2/m256 to 32 packed 16-=
bit integers in zmm1."
+"VPMOVUSWB xmm1/m128 {k1}{z}, ymm2","EVEX.256.F3.0F38.W0 10 /r","Valid","V=
alid","Invalid","AVX512VL AVX512BW","ModRM:r/m (w)","ModRM:reg (r)","","","=
Half Vector Mem","Converts 16 packed unsigned word integers from ymm2 into =
16 packed unsigned bytes in xmm1/m128 using unsigned saturation under write=
mask k1."
+"VPMOVUSWB xmm1/m64 {k1}{z}, xmm2","EVEX.128.F3.0F38.W0 10 /r","Valid","Va=
lid","Invalid","AVX512VL AVX512BW","ModRM:r/m (w)","ModRM:reg (r)","","","H=
alf Vector Mem","Converts 8 packed unsigned word integers from xmm2 into 8 =
packed unsigned bytes in 8mm1/m64 using unsigned saturation under writemask=
 k1."
+"VPMOVUSWB ymm1/m256 {k1}{z}, zmm2","EVEX.512.F3.0F38.W0 10 /r","Valid","V=
alid","Invalid","AVX512BW","ModRM:r/m (w)","ModRM:reg (r)","","","Half Vect=
or Mem","Converts 32 packed unsigned word integers from zmm2 into 32 packed=
 unsigned bytes in ymm1/m256 using unsigned saturation under writemask k1."
+"VPMOVW2M k1, xmm1","EVEX.128.F3.0F38.W1 29 /r","Valid","Valid","Invalid",=
"AVX512VL AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","","","Sets each bit=
 in k1 to 1 or 0 based on the value of the most significant bit of the corr=
esponding word in XMM1."
+"VPMOVW2M k1, ymm1","EVEX.256.F3.0F38.W1 29 /r","Valid","Valid","Invalid",=
"AVX512VL AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","","","Sets each bit=
 in k1 to 1 or 0 based on the value of the most significant bit of the corr=
esponding word in YMM1."
+"VPMOVW2M k1, zmm1","EVEX.512.F3.0F38.W1 29 /r","Valid","Valid","Invalid",=
"AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","","","Sets each bit in k1 to=
 1 or 0 based on the value of the most significant bit of the corresponding=
 word in ZMM1."
+"VPMOVWB xmm1/m128 {k1}{z}, ymm2","EVEX.256.F3.0F38.W0 30 /r","Valid","Val=
id","Invalid","AVX512VL AVX512BW","ModRM:r/m (w)","ModRM:reg (r)","","","Ha=
lf Vector Mem","Converts 16 packed word integers from ymm2 into 16 packed b=
ytes in xmm1/m128 with truncation under writemask k1."
+"VPMOVWB xmm1/m64 {k1}{z}, xmm2","EVEX.128.F3.0F38.W0 30 /r","Valid","Vali=
d","Invalid","AVX512VL AVX512BW","ModRM:r/m (w)","ModRM:reg (r)","","","Hal=
f Vector Mem","Converts 8 packed word integers from xmm2 into 8 packed byte=
s in xmm1/m64 with truncation under writemask k1."
+"VPMOVWB ymm1/m256 {k1}{z}, zmm2","EVEX.512.F3.0F38.W0 30 /r","Valid","Val=
id","Invalid","AVX512BW","ModRM:r/m (w)","ModRM:reg (r)","","","Half Vector=
 Mem","Converts 32 packed word integers from zmm2 into 32 packed bytes in y=
mm1/m256 with truncation under writemask k1."
+"VPMOVZXBW xmm1{k1}{z}, xmm2/m64","EVEX.128.66.0F38.WIG 30 /r","Valid","Va=
lid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","","H=
alf Vector Mem","Zero extend 8 packed 8-bit integers in the low 8 bytes of =
xmm2/m64 to 8 packed 16-bit integers in xmm1."
+"VPMOVZXBW ymm1{k1}{z}, xmm2/m128","EVEX.256.66.0F38.WIG 30 /r","Valid","V=
alid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","","=
Half Vector Mem","Zero extend 16 packed 8-bit integers in xmm2/m128 to 16 p=
acked 16-bit integers in ymm1."
+"VPMOVZXBW zmm1{k1}{z}, ymm2/m256","EVEX.512.66.0F38.WIG 30 /r","Valid","V=
alid","Invalid","AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","","","Half Vect=
or Mem","Zero extend 32 packed 8-bit integers in ymm2/m256 to 32 packed 16-=
bit integers in zmm1."
+"VPMULHRSW xmm1{k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F38.WIG 0B /r","Val=
id","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","=
ModRM:r/m (r)","","Full Vector Mem","Multiply 16-bit signed words, scale an=
d round signed doublewords, pack high 16 bits to xmm1 under writemask k1."
+"VPMULHRSW ymm1{k1}{z}, ymm2, ymm3/m256","EVEX.256.66.0F38.WIG 0B /r","Val=
id","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","=
ModRM:r/m (r)","","Full Vector Mem","Multiply 16-bit signed words, scale an=
d round signed doublewords, pack high 16 bits to ymm1 under writemask k1."
+"VPMULHRSW zmm1{k1}{z}, zmm2, zmm3/m512","EVEX.512.66.0F38.WIG 0B /r","Val=
id","Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m=
 (r)","","Full Vector Mem","Multiply 16-bit signed words, scale and round s=
igned doublewords, pack high 16 bits to zmm1 under writemask k1."
+"VPMULHUW xmm1{k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F.WIG E4 /r","Valid"=
,"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","Mod=
RM:r/m (r)","","Full Vector Mem","Multiply the packed unsigned word integer=
s in xmm2 and xmm3/m128, and store the high 16 bits of the results in xmm1 =
under writemask k1."
+"VPMULHUW ymm1{k1}{z}, ymm2, ymm3/m256","EVEX.256.66.0F.WIG E4 /r","Valid"=
,"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","Mod=
RM:r/m (r)","","Full Vector Mem","Multiply the packed unsigned word integer=
s in ymm2 and ymm3/m256, and store the high 16 bits of the results in ymm1 =
under writemask k1."
+"VPMULHUW zmm1{k1}{z}, zmm2, zmm3/m512","EVEX.512.66.0F.WIG E4 /r","Valid"=
,"Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r=
)","","Full Vector Mem","Multiply the packed unsigned word integers in zmm2=
 and zmm3/m512, and store the high 16 bits of the results in zmm1 under wri=
temask k1."
+"VPMULHW xmm1{k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F.WIG E5 /r","Valid",=
"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector Mem","Multiply the packed signed word integers i=
n xmm2 and xmm3/m128, and store the high 16 bits of the results in xmm1 und=
er writemask k1."
+"VPMULHW ymm1{k1}{z}, ymm2, ymm3/m256","EVEX.256.66.0F.WIG E5 /r","Valid",=
"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector Mem","Multiply the packed signed word integers i=
n ymm2 and ymm3/m256, and store the high 16 bits of the results in ymm1 und=
er writemask k1."
+"VPMULHW zmm1{k1}{z}, zmm2, zmm3/m512","EVEX.512.66.0F.WIG E5 /r","Valid",=
"Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)=
","","Full Vector Mem","Multiply the packed signed word integers in zmm2 an=
d zmm3/m512, and store the high 16 bits of the results in zmm1 under writem=
ask k1."
+"VPMULLW xmm1{k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F.WIG D5 /r","Valid",=
"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector Mem","Multiply the packed signed word integers i=
n xmm2 and xmm3/m128, and store the low 16 bits of the results in xmm1 unde=
r writemask k1."
+"VPMULLW ymm1{k1}{z}, ymm2, ymm3/m256","EVEX.256.66.0F.WIG D5 /r","Valid",=
"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector Mem","Multiply the packed signed word integers i=
n ymm2 and ymm3/m256, and store the low 16 bits of the results in ymm1 unde=
r writemask k1."
+"VPMULLW zmm1{k1}{z}, zmm2, zmm3/m512","EVEX.512.66.0F.WIG D5 /r","Valid",=
"Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)=
","","Full Vector Mem","Multiply the packed signed word integers in zmm2 an=
d zmm3/m512, and store the low 16 bits of the results in zmm1 under writema=
sk k1."
+"VPSADBW xmm1, xmm2, xmm3/m128","EVEX.128.66.0F.WIG F6 /r","Valid","Valid"=
,"Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (=
r)","","Full Vector Mem","Computes the absolute differences of the packed u=
nsigned byte integers from xmm3/m128 and xmm2; then each consecutive 8 diff=
erences are summed separately to produce four unsigned word integer results=
."
+"VPSADBW ymm1, ymm2, ymm3/m256","EVEX.256.66.0F.WIG F6 /r","Valid","Valid"=
,"Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (=
r)","","Full Vector Mem","Computes the absolute differences of the packed u=
nsigned byte integers from ymm3/m256 and ymm2; then each consecutive 8 diff=
erences are summed separately to produce four unsigned word integer results=
."
+"VPSADBW zmm1, zmm2, zmm3/m512","EVEX.512.66.0F.WIG F6 /r","Valid","Valid"=
,"Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)","","F=
ull Vector Mem","Computes the absolute differences of the packed unsigned b=
yte integers from zmm3/m512 and zmm2; then each consecutive 8 differences a=
re summed separately to produce four unsigned word integer results."
+"VPSHUFB xmm1 {k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F38.WIG 00 /r","Vali=
d","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","","Full Vector Mem","Shuffle bytes in xmm2 according to cont=
ents of xmm3/m128 under write mask k1."
+"VPSHUFB ymm1 {k1}{z}, ymm2, ymm3/m256","EVEX.256.66.0F38.WIG 00 /r","Vali=
d","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","","Full Vector Mem","Shuffle bytes in ymm2 according to cont=
ents of ymm3/m256 under write mask k1."
+"VPSHUFB zmm1 {k1}{z}, zmm2, zmm3/m512","EVEX.512.66.0F38.WIG 00 /r","Vali=
d","Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m =
(r)","","Full Vector Mem","Shuffle bytes in zmm2 according to contents of z=
mm3/m512 under write mask k1."
+"VPSHUFHW xmm1 {k1}{z}, xmm2/m128, ib","EVEX.128.F3.0F.WIG 70 /r ib","Vali=
d","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","i=
b","","Full Vector Mem","Shuffle the high words in xmm2/m128 based on the e=
ncoding in ib and store the result in xmm1 under write mask k1."
+"VPSHUFHW ymm1 {k1}{z}, ymm2/m256, ib","EVEX.256.F3.0F.WIG 70 /r ib","Vali=
d","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","i=
b","","Full Vector Mem","Shuffle the high words in ymm2/m256 based on the e=
ncoding in ib and store the result in ymm1 under write mask k1."
+"VPSHUFHW zmm1 {k1}{z}, zmm2/m512, ib","EVEX.512.F3.0F.WIG 70 /r ib","Vali=
d","Valid","Invalid","AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","ib","","Fu=
ll Vector Mem","Shuffle the high words in zmm2/m512 based on the encoding i=
n ib and store the result in zmm1 under write mask k1."
+"VPSHUFLW xmm1 {k1}{z}, xmm2/m128, ib","EVEX.128.F2.0F.WIG 70 /r ib","Vali=
d","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","i=
b","","Full Vector Mem","Shuffle the low words in xmm2/m128 based on the en=
coding in ib and store the result in xmm1 under write mask k1."
+"VPSHUFLW ymm1 {k1}{z}, ymm2/m256, ib","EVEX.256.F2.0F.WIG 70 /r ib","Vali=
d","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","i=
b","","Full Vector Mem","Shuffle the low words in ymm2/m256 based on the en=
coding in ib and store the result in ymm1 under write mask k1."
+"VPSHUFLW zmm1 {k1}{z}, zmm2/m512, ib","EVEX.512.F2.0F.WIG 70 /r ib","Vali=
d","Valid","Invalid","AVX512BW","ModRM:reg (w)","ModRM:r/m (r)","ib","","Fu=
ll Vector Mem","Shuffle the low words in zmm2/m512 based on the encoding in=
 ib and store the result in zmm1 under write mask k1."
+"VPSLLDQ xmm1, xmm2/m128, ib","EVEX.128.66.0F.WIG 73 /7 ib","Valid","Valid=
","Invalid","AVX512VL AVX512BW","EVEX.vvvv (w)","ModRM:r/m (r)","ib","","Fu=
ll Vector Mem","Shift xmm2/m128 left by ib bytes while shifting in 0s and s=
tore result in xmm1."
+"VPSLLDQ ymm1, ymm2/m256, ib","EVEX.256.66.0F.WIG 73 /7 ib","Valid","Valid=
","Invalid","AVX512VL AVX512BW","EVEX.vvvv (w)","ModRM:r/m (r)","ib","","Fu=
ll Vector Mem","Shift ymm2/m256 left by ib bytes while shifting in 0s and s=
tore result in ymm1."
+"VPSLLDQ zmm1, zmm2/m512, ib","EVEX.512.66.0F.WIG 73 /7 ib","Valid","Valid=
","Invalid","AVX512BW","EVEX.vvvv (w)","ModRM:r/m (r)","ib","","Full Vector=
 Mem","Shift zmm2/m512 left by ib bytes while shifting in 0s and store resu=
lt in zmm1."
+"VPSLLVW xmm1 {k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F38.W1 12 /r","Valid=
","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Full Vector Mem","Shift words in xmm2 left by amount speci=
fied in the corresponding element of xmm3/m128 while shifting in 0s using w=
ritemask k1."
+"VPSLLVW ymm1 {k1}{z}, ymm2, ymm3/m256","EVEX.256.66.0F38.W1 12 /r","Valid=
","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Full Vector Mem","Shift words in ymm2 left by amount speci=
fied in the corresponding element of ymm3/m256 while shifting in 0s using w=
ritemask k1."
+"VPSLLVW zmm1 {k1}{z}, zmm2, zmm3/m512","EVEX.512.66.0F38.W1 12 /r","Valid=
","Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (=
r)","","Full Vector Mem","Shift words in zmm2 left by amount specified in t=
he corresponding element of zmm3/m512 while shifting in 0s using writemask =
k1."
+"VPSLLW xmm1 {k1}{z}, xmm2/m128, ib","EVEX.128.66.0F.WIG 71 /6 ib","Valid"=
,"Valid","Invalid","AVX512VL AVX512BW","EVEX.vvvv (w)","ModRM:r/m (r)","ib"=
,"","Full Vector Mem","Shift words in xmm2/m128 left by ib while shifting i=
n 0s using writemask k1."
+"VPSLLW ymm1 {k1}{z}, ymm2/m256, ib","EVEX.256.66.0F.WIG 71 /6 ib","Valid"=
,"Valid","Invalid","AVX512VL AVX512BW","EVEX.vvvv (w)","ModRM:r/m (r)","ib"=
,"","Full Vector Mem","Shift words in ymm2/m256 left by ib while shifting i=
n 0s using writemask k1."
+"VPSLLW zmm1 {k1}{z}, zmm2/m512, ib","EVEX.512.66.0F.WIG 71 /6 ib","Valid"=
,"Valid","Invalid","AVX512BW","EVEX.vvvv (w)","ModRM:r/m (r)","ib","","Full=
 Vector Mem","Shift words in zmm2/m512 left by ib while shifting in 0 using=
 writemask k1."
+"VPSLLW xmm1 {k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F.WIG F1 /r","Valid",=
"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","VEX.vvvv (r)","ModRM=
:r/m (r)","","Mem128","Shift words in xmm2 left by amount specified in xmm3=
/m128 while shifting in 0s using writemask k1."
+"VPSLLW ymm1 {k1}{z}, ymm2, xmm3/m128","EVEX.256.66.0F.WIG F1 /r","Valid",=
"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","VEX.vvvv (r)","ModRM=
:r/m (r)","","Mem128","Shift words in ymm2 left by amount specified in xmm3=
/m128 while shifting in 0s using writemask k1."
+"VPSLLW zmm1 {k1}{z}, zmm2, xmm3/m128","EVEX.512.66.0F.WIG F1 /r","Valid",=
"Valid","Invalid","AVX512BW","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)"=
,"","Mem128","Shift words in zmm2 left by amount specified in xmm3/m128 whi=
le shifting in 0s using writemask k1."
+"VPSRAVW xmm1 {k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F38.W1 11 /r","Valid=
","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Full Vector Mem","Shift words in xmm2 right by amount spec=
ified in the corresponding element of xmm3/m128 while shifting in sign bits=
 using writemask k1."
+"VPSRAVW ymm1 {k1}{z}, ymm2, ymm3/m256","EVEX.256.66.0F38.W1 11 /r","Valid=
","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Full Vector Mem","Shift words in ymm2 right by amount spec=
ified in the corresponding element of ymm3/m256 while shifting in sign bits=
 using writemask k1."
+"VPSRAVW zmm1 {k1}{z}, zmm2, zmm3/m512","EVEX.512.66.0F38.W1 11 /r","Valid=
","Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (=
r)","","Full Vector Mem","Shift words in zmm2 right by amount specified in =
the corresponding element of zmm3/m512 while shifting in sign bits using wr=
itemask k1."
+"VPSRAW xmm1 {k1}{z}, xmm2/m128, ib","EVEX.128.66.0F.WIG 71 /4 ib","Valid"=
,"Valid","Invalid","AVX512VL AVX512BW","EVEX.vvvv (w)","ModRM:r/m (r)","ib"=
,"","Full Vector Mem","Shift words in xmm2/m128 right by ib while shifting =
in sign bits using writemask k1."
+"VPSRAW ymm1 {k1}{z}, ymm2/m256, ib","EVEX.256.66.0F.WIG 71 /4 ib","Valid"=
,"Valid","Invalid","AVX512VL AVX512BW","EVEX.vvvv (w)","ModRM:r/m (r)","ib"=
,"","Full Vector Mem","Shift words in ymm2/m256 right by ib while shifting =
in sign bits using writemask k1."
+"VPSRAW zmm1 {k1}{z}, zmm2/m512, ib","EVEX.512.66.0F.WIG 71 /4 ib","Valid"=
,"Valid","Invalid","AVX512BW","EVEX.vvvv (w)","ModRM:r/m (r)","ib","","Full=
 Vector Mem","Shift words in zmm2/m512 right by ib while shifting in sign b=
its using writemask k1."
+"VPSRAW xmm1 {k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F.WIG E1 /r","Valid",=
"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Mem128","Shift words in xmm2 right by amount specified in xm=
m3/m128 while shifting in sign bits using writemask k1."
+"VPSRAW ymm1 {k1}{z}, ymm2, xmm3/m128","EVEX.256.66.0F.WIG E1 /r","Valid",=
"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Mem128","Shift words in ymm2 right by amount specified in xm=
m3/m128 while shifting in sign bits using writemask k1."
+"VPSRAW zmm1 {k1}{z}, zmm2, xmm3/m128","EVEX.512.66.0F.WIG E1 /r","Valid",=
"Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)=
","","Mem128","Shift words in zmm2 right by amount specified in xmm3/m128 w=
hile shifting in sign bits using writemask k1."
+"VPSRLDQ xmm1, xmm2/m128, ib","EVEX.128.66.0F.WIG 73 /3 ib","Valid","Valid=
","Invalid","AVX512VL AVX512BW","EVEX.vvvv (w)","ModRM:r/m (r)","ib","","Fu=
ll Vector Mem","Shift xmm2/m128 right by ib bytes while shifting in 0s and =
store result in xmm1."
+"VPSRLDQ ymm1, ymm2/m256, ib","EVEX.256.66.0F.WIG 73 /3 ib","Valid","Valid=
","Invalid","AVX512VL AVX512BW","EVEX.vvvv (w)","ModRM:r/m (r)","ib","","Fu=
ll Vector Mem","Shift ymm2/m256 right by ib bytes while shifting in 0s and =
store result in ymm1."
+"VPSRLDQ zmm1, zmm2/m512, ib","EVEX.512.66.0F.WIG 73 /3 ib","Valid","Valid=
","Invalid","AVX512BW","EVEX.vvvv (w)","ModRM:r/m (r)","ib","","Full Vector=
 Mem","Shift zmm2/m512 right by ib bytes while shifting in 0s and store res=
ult in zmm1."
+"VPSRLVW xmm1 {k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F38.W1 10 /r","Valid=
","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Full Vector Mem","Shift words in xmm2 right by amount spec=
ified in the corresponding element of xmm3/m128 while shifting in 0s using =
writemask k1."
+"VPSRLVW ymm1 {k1}{z}, ymm2, ymm3/m256","EVEX.256.66.0F38.W1 10 /r","Valid=
","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Full Vector Mem","Shift words in ymm2 right by amount spec=
ified in the corresponding element of ymm3/m256 while shifting in 0s using =
writemask k1."
+"VPSRLVW zmm1 {k1}{z}, zmm2, zmm3/m512","EVEX.512.66.0F38.W1 10 /r","Valid=
","Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (=
r)","","Full Vector Mem","Shift words in zmm2 right by amount specified in =
the corresponding element of zmm3/m512 while shifting in 0s using writemask=
 k1."
+"VPSRLW xmm1 {k1}{z}, xmm2/m128, ib","EVEX.128.66.0F.WIG 71 /2 ib","Valid"=
,"Valid","Invalid","AVX512VL AVX512BW","EVEX.vvvv (w)","ModRM:r/m (r)","ib"=
,"","Full Vector Mem","Shift words in xmm2/m128 right by ib while shifting =
in 0s using writemask k1."
+"VPSRLW ymm1 {k1}{z}, ymm2/m256, ib","EVEX.256.66.0F.WIG 71 /2 ib","Valid"=
,"Valid","Invalid","AVX512VL AVX512BW","EVEX.vvvv (w)","ModRM:r/m (r)","ib"=
,"","Full Vector Mem","Shift words in ymm2/m256 right by ib while shifting =
in 0s using writemask k1."
+"VPSRLW zmm1 {k1}{z}, zmm2/m512, ib","EVEX.512.66.0F.WIG 71 /2 ib","Valid"=
,"Valid","Invalid","AVX512BW","EVEX.vvvv (w)","ModRM:r/m (r)","ib","","Full=
 Vector Mem","Shift words in zmm2/m512 right by ib while shifting in 0s usi=
ng writemask k1."
+"VPSRLW xmm1 {k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F.WIG D1 /r","Valid",=
"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","VEX.vvvv (r)","ModRM=
:r/m (r)","","Mem128","Shift words in xmm2 right by amount specified in xmm=
3/m128 while shifting in 0s using writemask k1."
+"VPSRLW ymm1 {k1}{z}, ymm2, xmm3/m128","EVEX.256.66.0F.WIG D1 /r","Valid",=
"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","VEX.vvvv (r)","ModRM=
:r/m (r)","","Mem128","Shift words in ymm2 right by amount specified in xmm=
3/m128 while shifting in 0s using writemask k1."
+"VPSRLW zmm1 {k1}{z}, zmm2, xmm3/m128","EVEX.512.66.0F.WIG D1 /r","Valid",=
"Valid","Invalid","AVX512BW","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)"=
,"","Mem128","Shift words in zmm2 right by amount specified in xmm3/m128 wh=
ile shifting in 0s using writemask k1."
+"VPSUBB xmm1 {k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F.WIG F8 /r","Valid",=
"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector Mem","Subtract packed byte integers in xmm3/m128=
 from xmm2 and store in xmm1 using writemask k1."
+"VPSUBB ymm1 {k1}{z}, ymm2, ymm3/m256","EVEX.256.66.0F.WIG F8 /r","Valid",=
"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector Mem","Subtract packed byte integers in ymm3/m256=
 from ymm2 and store in ymm1 using writemask k1."
+"VPSUBB zmm1 {k1}{z}, zmm2, zmm3/m512","EVEX.512.66.0F.WIG F8 /r","Valid",=
"Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)=
","","Full Vector Mem","Subtract packed byte integers in zmm3/m512 from zmm=
2 and store in zmm1 using writemask k1."
+"VPSUBSB xmm1 {k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F.WIG E8 /r","Valid"=
,"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","Mod=
RM:r/m (r)","","Full Vector Mem","Subtract packed signed byte integers in x=
mm3/m128 from packed signed byte integers in xmm2 and saturate results and =
store in xmm1 using writemask k1."
+"VPSUBSB ymm1 {k1}{z}, ymm2, ymm3/m256","EVEX.256.66.0F.WIG E8 /r","Valid"=
,"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","Mod=
RM:r/m (r)","","Full Vector Mem","Subtract packed signed byte integers in y=
mm3/m256 from packed signed byte integers in ymm2 and saturate results and =
store in ymm1 using writemask k1."
+"VPSUBSB zmm1 {k1}{z}, zmm2, zmm3/m512","EVEX.512.66.0F.WIG E8 /r","Valid"=
,"Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r=
)","","Full Vector Mem","Subtract packed signed byte integers in zmm3/m512 =
from packed signed byte integers in zmm2 and saturate results and store in =
zmm1 using writemask k1."
+"VPSUBSW xmm1 {k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F.WIG E9 /r","Valid"=
,"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","Mod=
RM:r/m (r)","","Full Vector Mem","Subtract packed signed word integers in x=
mm3/m128 from packed signed word integers in xmm2 and saturate results and =
store in xmm1 using writemask k1."
+"VPSUBSW ymm1 {k1}{z}, ymm2, ymm3/m256","EVEX.256.66.0F.WIG E9 /r","Valid"=
,"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","Mod=
RM:r/m (r)","","Full Vector Mem","Subtract packed signed word integers in y=
mm3/m256 from packed signed word integers in ymm2 and saturate results and =
store in ymm1 using writemask k1."
+"VPSUBUSB xmm1 {k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F.WIG D8 /r","Valid=
","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Full Vector Mem","Subtract packed unsigned byte integers i=
n xmm3/m128 from packed unsigned byte integers in xmm2, saturate results an=
d store in xmm1 using writemask k1."
+"VPSUBUSB ymm1 {k1}{z}, ymm2, ymm3/m256","EVEX.256.66.0F.WIG D8 /r","Valid=
","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Full Vector Mem","Subtract packed unsigned byte integers i=
n ymm3/m256 from packed unsigned byte integers in ymm2, saturate results an=
d store in ymm1 using writemask k1."
+"VPSUBUSB zmm1 {k1}{z}, zmm2, zmm3/m512","EVEX.512.66.0F.WIG D8 /r","Valid=
","Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (=
r)","","Full Vector Mem","Subtract packed unsigned byte integers in zmm3/m5=
12 from packed unsigned byte integers in zmm2, saturate results and store i=
n zmm1 using writemask k1."
+"VPSUBUSW xmm1 {k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F.WIG D9 /r","Valid=
","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Full Vector Mem","Subtract packed unsigned word integers i=
n xmm3/m128 from packed unsigned word integers in xmm2 and saturate results=
 and store in xmm1 using writemask k1."
+"VPSUBUSW ymm1 {k1}{z}, ymm2, ymm3/m256","EVEX.256.66.0F.WIG D9 /r","Valid=
","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Full Vector Mem","Subtract packed unsigned word integers i=
n ymm3/m256 from packed unsigned word integers in ymm2, saturate results an=
d store in ymm1 using writemask k1."
+"VPSUBW xmm1 {k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F.WIG F9 /r","Valid",=
"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector Mem","Subtract packed word integers in xmm3/m128=
 from xmm2 and store in xmm1 using writemask k1."
+"VPSUBW ymm1 {k1}{z}, ymm2, ymm3/m256","EVEX.256.66.0F.WIG F9 /r","Valid",=
"Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector Mem","Subtract packed word integers in ymm3/m256=
 from ymm2 and store in ymm1 using writemask k1."
+"VPSUBW zmm1 {k1}{z}, zmm2, zmm3/m512","EVEX.512.66.0F.WIG F9 /r","Valid",=
"Valid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)=
","","Full Vector Mem","Subtract packed word integers in zmm3/m512 from zmm=
2 and store in zmm1 using writemask k1."
+"VPTESTMB k2 {k1}, xmm2, xmm3/m128","EVEX.128.66.0F38.W0 26 /r","Valid","V=
alid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:=
r/m (r)","","Full Vector Mem","Bitwise AND of packed byte integers in xmm2 =
and xmm3/m128 and set mask k2 to reflect the zero/non-zero status of each e=
lement of the result, under writemask k1."
+"VPTESTMB k2 {k1}, ymm2, ymm3/m256","EVEX.256.66.0F38.W0 26 /r","Valid","V=
alid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:=
r/m (r)","","Full Vector Mem","Bitwise AND of packed byte integers in ymm2 =
and ymm3/m256 and set mask k2 to reflect the zero/non-zero status of each e=
lement of the result, under writemask k1."
+"VPTESTMB k2 {k1}, zmm2, zmm3/m512","EVEX.512.66.0F38.W0 26 /r","Valid","V=
alid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)",=
"","Full Vector Mem","Bitwise AND of packed byte integers in zmm2 and zmm3/=
m512 and set mask k2 to reflect the zero/non-zero status of each element of=
 the result, under writemask k1."
+"VPTESTMW k2 {k1}, xmm2, xmm3/m128","EVEX.128.66.0F38.W1 26 /r","Valid","V=
alid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:=
r/m (r)","","Full Vector Mem","Bitwise AND of packed word integers in xmm2 =
and xmm3/m128 and set mask k2 to reflect the zero/non-zero status of each e=
lement of the result, under writemask k1."
+"VPTESTMW k2 {k1}, ymm2, ymm3/m256","EVEX.256.66.0F38.W1 26 /r","Valid","V=
alid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:=
r/m (r)","","Full Vector Mem","Bitwise AND of packed word integers in ymm2 =
and ymm3/m256 and set mask k2 to reflect the zero/non-zero status of each e=
lement of the result, under writemask k1."
+"VPTESTMW k2 {k1}, zmm2, zmm3/m512","EVEX.512.66.0F38.W1 26 /r","Valid","V=
alid","Invalid","AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)",=
"","Full Vector Mem","Bitwise AND of packed word integers in zmm2 and zmm3/=
m512 and set mask k2 to reflect the zero/non-zero status of each element of=
 the result, under writemask k1."
+"VPTESTNMB k2 {k1}, xmm2, xmm3/m128","EVEX.128.F3.0F38.W0 26 /r","Valid","=
Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM=
:r/m (r)","","Full Vector Mem","Bitwise NAND of packed byte integers in xmm=
2 and xmm3/m128 and set mask k2 to reflect the zero/non-zero status of each=
 element of the result,under writemask k1."
+"VPTESTNMB k2 {k1}, ymm2, ymm3/m256","EVEX.256.F3.0F38.W0 26 /r","Valid","=
Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM=
:r/m (r)","","Full Vector Mem","Bitwise NAND of packed byte integers in ymm=
2 and ymm3/m256 and set mask k2 to reflect the zero/non-zero status of each=
 element of the result,under writemask k1."
+"VPTESTNMB k2 {k1}, zmm2, zmm3/m512","EVEX.512.F3.0F38.W0 26 /r","Valid","=
Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM=
:r/m (r)","","Full Vector Mem","Bitwise NAND of packed byte integers in zmm=
2 and zmm3/m512 and set mask k2 to reflect the zero/non-zero status of each=
 element of the result,under writemask k1."
+"VPTESTNMW k2 {k1}, xmm2, xmm3/m128","EVEX.128.F3.0F38.W1 26 /r","Valid","=
Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM=
:r/m (r)","","Full Vector Mem","Bitwise NAND of packed word integers in xmm=
2 and xmm3/m128 and set mask k2 to reflect the zero/non-zero status of each=
 element of the result,under writemask k1."
+"VPTESTNMW k2 {k1}, ymm2, ymm3/m256","EVEX.256.F3.0F38.W1 26 /r","Valid","=
Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM=
:r/m (r)","","Full Vector Mem","Bitwise NAND of packed word integers in ymm=
2 and ymm3/m256 and set mask k2 to reflect the zero/non-zero status of each=
 element of the result,under writemask k1."
+"VPTESTNMW k2 {k1}, zmm2, zmm3/m512","EVEX.512.F3.0F38.W1 26 /r","Valid","=
Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","ModRM=
:r/m (r)","","Full Vector Mem","Bitwise NAND of packed word integers in zmm=
2 and zmm3/m512 and set mask k2 to reflect the zero/non-zero status of each=
 element of the result,under writemask k1."
+"VPUNPCKHBW xmm1 {k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F.WIG 68 /r","Val=
id","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","=
ModRM:r/m (r)","","Full Vector Mem","Interleave high-order bytes from xmm2 =
and xmm3/m128 into xmm1 register using k1 write mask."
+"VPUNPCKHWD xmm1 {k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F.WIG 69 /r","Val=
id","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","=
ModRM:r/m (r)","","Full Vector Mem","Interleave high-order words from xmm2 =
and xmm3/m128 into xmm1 register using k1 write mask."
+"VPUNPCKLBW xmm1 {k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F.WIG 60 /r","Val=
id","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","=
ModRM:r/m (r)","","Full Vector Mem","Interleave low-order bytes from xmm2 a=
nd xmm3/m128 into xmm1 register subject to write mask k1."
+"VPUNPCKLWD xmm1 {k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F.WIG 61 /r","Val=
id","Valid","Invalid","AVX512VL AVX512BW","ModRM:reg (w)","EVEX.vvvv (r)","=
ModRM:r/m (r)","","Full Vector Mem","Interleave low-order words from xmm2 a=
nd xmm3/m128 into xmm1 register subject to write mask k1."
diff --git a/disas/x86-data/x86_avx512cd.csv b/disas/x86-data/x86_avx512cd.=
csv
new file mode 100644
index 000000000000..f1d6d7dedb69
--- /dev/null
+++ b/disas/x86-data/x86_avx512cd.csv
@@ -0,0 +1,19 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"VPBROADCASTMB2Q xmm1, k1","EVEX.128.F3.0F38.W1 2A /r","Valid","Valid","In=
valid","AVX512VL AVX512CD","ModRM:reg (w)","ModRM:r/m (r)","","","","Broadc=
ast low byte value in k1 to two locations in xmm1."
+"VPBROADCASTMB2Q ymm1, k1","EVEX.256.F3.0F38.W1 2A /r","Valid","Valid","In=
valid","AVX512VL AVX512CD","ModRM:reg (w)","ModRM:r/m (r)","","","","Broadc=
ast low byte value in k1 to four locations in ymm1."
+"VPBROADCASTMB2Q zmm1, k1","EVEX.512.F3.0F38.W1 2A /r","Valid","Valid","In=
valid","AVX512CD","ModRM:reg (w)","ModRM:r/m (r)","","","","Broadcast low b=
yte value in k1 to eight locations in zmm1."
+"VPBROADCASTMW2D xmm1, k1","EVEX.128.F3.0F38.W0 3A /r","Valid","Valid","In=
valid","AVX512VL AVX512CD","ModRM:reg (w)","ModRM:r/m (r)","","","","Broadc=
ast low word value in k1 to four locations in xmm1."
+"VPBROADCASTMW2D ymm1, k1","EVEX.256.F3.0F38.W0 3A /r","Valid","Valid","In=
valid","AVX512VL AVX512CD","ModRM:reg (w)","ModRM:r/m (r)","","","","Broadc=
ast low word value in k1 to eight locations in ymm1."
+"VPBROADCASTMW2D zmm1, k1","EVEX.512.F3.0F38.W0 3A /r","Valid","Valid","In=
valid","AVX512CD","ModRM:reg (w)","ModRM:r/m (r)","","","","Broadcast low w=
ord value in k1 to sixteen locations in zmm1."
+"VPCONFLICTD xmm1 {k1}{z}, xmm2/m128/m32bcst","EVEX.128.66.0F38.W0 C4 /r",=
"Valid","Valid","Invalid","AVX512VL AVX512CD","ModRM:reg (w)","ModRM:r/m (r=
)","","","Full Vector","Detect duplicate double-word values in xmm2/m128/m3=
2bcst using writemask k1."
+"VPCONFLICTD ymm1 {k1}{z}, ymm2/m256/m32bcst","EVEX.256.66.0F38.W0 C4 /r",=
"Valid","Valid","Invalid","AVX512VL AVX512CD","ModRM:reg (w)","ModRM:r/m (r=
)","","","Full Vector","Detect duplicate double-word values in ymm2/m256/m3=
2bcst using writemask k1."
+"VPCONFLICTD zmm1 {k1}{z}, zmm2/m512/m32bcst","EVEX.512.66.0F38.W0 C4 /r",=
"Valid","Valid","Invalid","AVX512CD","ModRM:reg (w)","ModRM:r/m (r)","","",=
"Full Vector","Detect duplicate double-word values in zmm2/m512/m32bcst usi=
ng writemask k1."
+"VPCONFLICTQ xmm1 {k1}{z}, xmm2/m128/m64bcst","EVEX.128.66.0F38.W1 C4 /r",=
"Valid","Valid","Invalid","AVX512VL AVX512CD","ModRM:reg (w)","ModRM:r/m (r=
)","","","Full Vector","Detect duplicate quad-word values in xmm2/m128/m64b=
cst using writemask k1."
+"VPCONFLICTQ ymm1 {k1}{z}, ymm2/m256/m64bcst","EVEX.256.66.0F38.W1 C4 /r",=
"Valid","Valid","Invalid","AVX512VL AVX512CD","ModRM:reg (w)","ModRM:r/m (r=
)","","","Full Vector","Detect duplicate quad-word values in ymm2/m256/m64b=
cst using writemask k1."
+"VPCONFLICTQ zmm1 {k1}{z}, zmm2/m512/m64bcst","EVEX.512.66.0F38.W1 C4 /r",=
"Valid","Valid","Invalid","AVX512CD","ModRM:reg (w)","ModRM:r/m (r)","","",=
"Full Vector","Detect duplicate quad-word values in zmm2/m512/m64bcst using=
 writemask k1."
+"VPLZCNTD xmm1 {k1}{z}, xmm2/m128/m32bcst","EVEX.128.66.0F38.W0 44 /r","Va=
lid","Valid","Invalid","AVX512VL AVX512CD","ModRM:reg (w)","ModRM:r/m (r)",=
"","","Full Vector","Count the number of leading zero bits in each dword el=
ement of xmm2/m128/m32bcst using writemask k1."
+"VPLZCNTD ymm1 {k1}{z}, ymm2/m256/m32bcst","EVEX.256.66.0F38.W0 44 /r","Va=
lid","Valid","Invalid","AVX512VL AVX512CD","ModRM:reg (w)","ModRM:r/m (r)",=
"","","Full Vector","Count the number of leading zero bits in each dword el=
ement of ymm2/m256/m32bcst using writemask k1."
+"VPLZCNTD zmm1 {k1}{z}, zmm2/m512/m32bcst","EVEX.512.66.0F38.W0 44 /r","Va=
lid","Valid","Invalid","AVX512CD","ModRM:reg (w)","ModRM:r/m (r)","","","Fu=
ll Vector","Count the number of leading zero bits in each dword element of =
zmm2/m512/m32bcst using writemask k1."
+"VPLZCNTQ xmm1 {k1}{z}, xmm2/m128/m64bcst","EVEX.128.66.0F38.W1 44 /r","Va=
lid","Valid","Invalid","AVX512VL AVX512CD","ModRM:reg (w)","ModRM:r/m (r)",=
"","","Full Vector","Count the number of leading zero bits in each qword el=
ement of xmm2/m128/m64bcst using writemask k1."
+"VPLZCNTQ ymm1 {k1}{z}, ymm2/m256/m64bcst","EVEX.256.66.0F38.W1 44 /r","Va=
lid","Valid","Invalid","AVX512VL AVX512CD","ModRM:reg (w)","ModRM:r/m (r)",=
"","","Full Vector","Count the number of leading zero bits in each qword el=
ement of ymm2/m256/m64bcst using writemask k1."
+"VPLZCNTQ zmm1 {k1}{z}, zmm2/m512/m64bcst","EVEX.512.66.0F38.W1 44 /r","Va=
lid","Valid","Invalid","AVX512CD","ModRM:reg (w)","ModRM:r/m (r)","","","Fu=
ll Vector","Count the number of leading zero bits in each qword element of =
zmm2/m512/m64bcst using writemask k1."
diff --git a/disas/x86-data/x86_avx512d.csv b/disas/x86-data/x86_avx512d.csv
new file mode 100644
index 000000000000..9af7418a542a
--- /dev/null
+++ b/disas/x86-data/x86_avx512d.csv
@@ -0,0 +1,2 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"VREDUCESD xmm1 {k1}{z}, xmm2, xmm3/m64{sae}, ib","EVEX.LIG.66.0F3A.W1 57 =
/r ib","Valid","Valid","Invalid","AVX512D","ModRM:reg (w)","EVEX.vvvv (r)",=
"ModRM:r/m (r)","ib","Tuple1 Scalar","Perform a reduction transformation on=
 a scalar double-precision floating point value in xmm3/m64 by subtracting =
a number of fraction bits specified by the ib field. Also, upper double pre=
cision floating-point value (bits[127:64]) from xmm2 are copied to xmm1[127=
:64]. Stores the result in xmm1 register."
diff --git a/disas/x86-data/x86_avx512dq.csv b/disas/x86-data/x86_avx512dq.=
csv
new file mode 100644
index 000000000000..ae401e958340
--- /dev/null
+++ b/disas/x86-data/x86_avx512dq.csv
@@ -0,0 +1,143 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"KADDB k1, k2, k3","VEX.L1.66.0F.W0 4A /r","Valid","Valid","Invalid","AVX5=
12DQ","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r, ModRM:[7:6] must be 11b=
)","","","Add 8 bits masks in k2 and k3 and place result in k1."
+"KADDW k1, k2, k3","VEX.L1.0F.W0 4A /r","Valid","Valid","Invalid","AVX512D=
Q","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r, ModRM:[7:6] must be 11b)",=
"","","Add 16 bits masks in k2 and k3 and place result in k1."
+"KANDB k1, k2, k3","VEX.L1.66.0F.W0 41 /r","Valid","Valid","Invalid","AVX5=
12DQ","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r, ModRM:[7:6] must be 11b=
)","","","Bitwise AND 8 bits masks k2 and k3 and place result in k1."
+"KANDNB k1, k2, k3","VEX.L1.66.0F.W0 42 /r","Valid","Valid","Invalid","AVX=
512DQ","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r, ModRM:[7:6] must be 11=
b)","","","Bitwise AND NOT 8 bits masks k1 and k2 and place result in k1."
+"KMOVB k1, k2/m8","VEX.L0.66.0F.W0 90 /r","Valid","Valid","Invalid","AVX51=
2DQ","ModRM:reg (w)","ModRM:r/m (r)","","","","Move 8 bits mask from k2/m8 =
and store the result in k1."
+"KMOVB m8, k1","VEX.L0.66.0F.W0 91 /r","Valid","Valid","Invalid","AVX512DQ=
","ModRM:r/m (w, ModRM:[7:6] must not be 11b)","ModRM:reg (r)","","","","Mo=
ve 8 bits mask from k1 and store the result in m8."
+"KMOVB k1, rw","VEX.L0.66.0F.W0 92 /r","Valid","Valid","Invalid","AVX512DQ=
","ModRM:reg (w)","ModRM:r/m (r, ModRM:[7:6] must be 11b)","","","","Move 8=
 bits mask from r to k1."
+"KMOVB rw, k1","VEX.L0.66.0F.W0 93 /r","Valid","Valid","Invalid","AVX512DQ=
","ModRM:reg (w)","ModRM:r/m (r, ModRM:[7:6] must be 11b)","","","","Move 8=
 bits mask from k1 to r."
+"KNOTB k1, k2","VEX.L0.66.0F.W0 44 /r","Valid","Valid","Invalid","AVX512DQ=
","ModRM:reg (w)","ModRM:r/m (r, ModRM:[7:6] must be 11b)","","","","Bitwis=
e NOT of 8 bits mask k2."
+"KORB k1, k2, k3","VEX.L1.66.0F.W0 45 /r","Valid","Valid","Invalid","AVX51=
2DQ","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r, ModRM:[7:6] must be 11b)=
","","","Bitwise OR 8 bits masks k2 and k3 and place result in k1."
+"KORTESTB k1, k2","VEX.L0.66.0F.W0 98 /r","Valid","Valid","Invalid","AVX51=
2DQ","ModRM:reg (w)","ModRM:r/m (r, ModRM:[7:6] must be 11b)","","","","Bit=
wise OR 8 bits masks k1 and k2 and update ZF and CF accordingly."
+"KSHIFTLB k1, k2, ib","VEX.L0.66.0F3A.W0 32 /r ib","Valid","Valid","Invali=
d","AVX512DQ","ModRM:reg (w)","ModRM:r/m (r, ModRM:[7:6] must be 11b)","ib"=
,"","","Shift left 8 bits in k2 by immediate and write result in k1."
+"KSHIFTRB k1, k2, ib","VEX.L0.66.0F3A.W0 30 /r ib","Valid","Valid","Invali=
d","AVX512DQ","ModRM:reg (w)","ModRM:r/m (r, ModRM:[7:6] must be 11b)","ib"=
,"","","Shift right 8 bits in k2 by immediate and write result in k1."
+"KTESTB k1, k2","VEX.L0.66.0F.W0 99 /r","Valid","Valid","Invalid","AVX512D=
Q","ModRM:reg (r)","ModRM:r/m (r, ModRM:[7:6] must be 11b)","","","","Set Z=
F and CF depending on sign bit AND and ANDN of 8 bits mask register sources=
."
+"KTESTW k1, k2","VEX.L0.0F.W0 99 /r","Valid","Valid","Invalid","AVX512DQ",=
"ModRM:reg (r)","ModRM:r/m (r, ModRM:[7:6] must be 11b)","","","","Set ZF a=
nd CF depending on sign bit AND and ANDN of 16 bits mask register sources."
+"KXNORB k1, k2, k3","VEX.L1.66.0F.W0 46 /r","Valid","Valid","Invalid","AVX=
512DQ","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r, ModRM:[7:6] must be 11=
b)","","","Bitwise XNOR 8 bits masks k2 and k3 and place result in k1."
+"KXORB k1, k2, k3","VEX.L1.66.0F.W0 47 /r","Valid","Valid","Invalid","AVX5=
12DQ","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r, ModRM:[7:6] must be 11b=
)","","","Bitwise XOR 8 bits masks k2 and k3 and place result in k1."
+"VANDNPD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F.W1 55 /r",=
"Valid","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","EVEX.vvvv (r=
)","ModRM:r/m (r)","","Full Vector","Return the bitwise logical AND NOT of =
packed double-precision floating-point values in xmm2 and xmm3/m128/m64bcst=
 subject to writemask k1."
+"VANDNPD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F.W1 55 /r",=
"Valid","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","EVEX.vvvv (r=
)","ModRM:r/m (r)","","Full Vector","Return the bitwise logical AND NOT of =
packed double-precision floating-point values in ymm2 and ymm3/m256/m64bcst=
 subject to writemask k1."
+"VANDNPD zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst","EVEX.512.66.0F.W1 55 /r",=
"Valid","Valid","Invalid","AVX512DQ","ModRM:reg (w)","EVEX.vvvv (r)","ModRM=
:r/m (r)","","Full Vector","Return the bitwise logical AND NOT of packed do=
uble-precision floating-point values in zmm2 and zmm3/m512/m64bcst subject =
to writemask k1."
+"VANDNPS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.0F.W0 55 /r","Va=
lid","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","EVEX.vvvv (r)",=
"ModRM:r/m (r)","","Full Vector","Return the bitwise logical AND of packed =
single-precision floating-point values in xmm2 and xmm3/m128/m32bcst subjec=
t to writemask k1."
+"VANDNPS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.0F.W0 55 /r","Va=
lid","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","EVEX.vvvv (r)",=
"ModRM:r/m (r)","","Full Vector","Return the bitwise logical AND of packed =
single-precision floating-point values in ymm2 and ymm3/m256/m32bcst subjec=
t to writemask k1."
+"VANDNPS zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst","EVEX.512.0F.W0 55 /r","Va=
lid","Valid","Invalid","AVX512DQ","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/=
m (r)","","Full Vector","Return the bitwise logical AND of packed single-pr=
ecision floating-point values in zmm2 and zmm3/m512/m32bcst subject to writ=
emask k1."
+"VANDPD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F.W1 54 /r","=
Valid","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","EVEX.vvvv (r)=
","ModRM:r/m (r)","","Full Vector","Return the bitwise logical AND of packe=
d double-precision floating-point values in xmm2 and xmm3/m128/m64bcst subj=
ect to writemask k1."
+"VANDPD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F.W1 54 /r","=
Valid","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","EVEX.vvvv (r)=
","ModRM:r/m (r)","","Full Vector","Return the bitwise logical AND of packe=
d double-precision floating-point values in ymm2 and ymm3/m256/m64bcst subj=
ect to writemask k1."
+"VANDPD zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst","EVEX.512.66.0F.W1 54 /r","=
Valid","Valid","Invalid","AVX512DQ","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:=
r/m (r)","","Full Vector","Return the bitwise logical AND of packed double-=
precision floating-point values in zmm2 and zmm3/m512/m64bcst subject to wr=
itemask k1."
+"VANDPS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.0F.W0 54 /r","Val=
id","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","EVEX.vvvv (r)","=
ModRM:r/m (r)","","Full Vector","Return the bitwise logical AND of packed s=
ingle-precision floating-point values in xmm2 and xmm3/m128/m32bcst subject=
 to writemask k1."
+"VANDPS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.0F.W0 54 /r","Val=
id","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","EVEX.vvvv (r)","=
ModRM:r/m (r)","","Full Vector","Return the bitwise logical AND of packed s=
ingle-precision floating-point values in ymm2 and ymm3/m256/m32bcst subject=
 to writemask k1."
+"VANDPS zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst","EVEX.512.0F.W0 54 /r","Val=
id","Valid","Invalid","AVX512DQ","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m=
 (r)","","Full Vector","Return the bitwise logical AND of packed single-pre=
cision floating-point values in zmm2 and zmm3/m512/m32bcst subject to write=
mask k1."
+"VBROADCASTF32X2 ymm1 {k1}{z}, xmm2/m64","EVEX.256.66.0F38.W0 19 /r","Vali=
d","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)",""=
,"","Tuple2","Broadcast two single-precision floating-point elements in xmm=
2/m64 to locations in ymm1 using writemask k1."
+"VBROADCASTF32X2 zmm1 {k1}{z}, xmm2/m64","EVEX.512.66.0F38.W0 19 /r","Vali=
d","Valid","Invalid","AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","","","Tupl=
e2","Broadcast two single-precision floating-point elements in xmm2/m64 to =
locations in zmm1 using writemask k1."
+"VBROADCASTF32X8 zmm1 {k1}{z}, m256","EVEX.512.66.0F38.W0 1B /r","Valid","=
Valid","Invalid","AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple8",=
"Broadcast 256 bits of 8 single precision floating-point data in mem to loc=
ations in zmm1 using writemask k1."
+"VBROADCASTF64X2 ymm1 {k1}{z}, m128","EVEX.256.66.0F38.W1 1A /r","Valid","=
Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","","",=
"Tuple2","Broadcast 128 bits of 2 double-precision floating-point data in m=
em to locations in ymm1 using writemask k1."
+"VBROADCASTF64X2 zmm1 {k1}{z}, m128","EVEX.512.66.0F38.W1 1A /r","Valid","=
Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","","",=
"Tuple2","Broadcast 128 bits of 2 double-precision floating-point data in m=
em to locations in zmm1 using writemask k1."
+"VBROADCASTI32X2 xmm1 {k1}{z}, xmm2/m64","EVEX.128.66.0F38.W0 59 /r","Vali=
d","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)",""=
,"","Tuple2","Broadcast two dword elements in source operand to locations i=
n xmm1 subject to writemask k1."
+"VBROADCASTI32X2 ymm1 {k1}{z}, xmm2/m64","EVEX.256.66.0F38.W0 59 /r","Vali=
d","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)",""=
,"","Tuple2","Broadcast two dword elements in source operand to locations i=
n ymm1 subject to writemask k1."
+"VBROADCASTI32X2 zmm1 {k1}{z}, xmm2/m64","EVEX.512.66.0F38.W0 59 /r","Vali=
d","Valid","Invalid","AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","","","Tupl=
e2","Broadcast two dword elements in source operand to locations in zmm1 su=
bject to writemask k1."
+"VBROADCASTI32X8 zmm1 {k1}{z}, m256","EVEX.512.66.0F38.W0 5B /r","Valid","=
Valid","Invalid","AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple8",=
"Broadcast 256 bits of 8 doubleword integer data in mem to locations in zmm=
1 using writemask k1."
+"VBROADCASTI64X2 ymm1 {k1}{z}, m128","EVEX.256.66.0F38.W1 5A /r","Valid","=
Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","","",=
"Tuple2","Broadcast 128 bits of 2 quadword integer data in mem to locations=
 in ymm1 using writemask k1."
+"VBROADCASTI64X2 zmm1 {k1}{z}, m128","EVEX.512.66.0F38.W1 5A /r","Valid","=
Valid","Invalid","AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple2",=
"Broadcast 128 bits of 2 quadword integer data in mem to locations in zmm1 =
using writemask k1."
+"VCVTPD2QQ xmm1 {k1}{z}, xmm2/m128/m64bcst","EVEX.128.66.0F.W1 7B /r","Val=
id","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","=
","","Full Vector","Convert two packed double-precision floating-point valu=
es from xmm2/m128/m64bcst to two packed quadword integers in xmm1 with writ=
emask k1."
+"VCVTPD2QQ ymm1 {k1}{z}, ymm2/m256/m64bcst","EVEX.256.66.0F.W1 7B /r","Val=
id","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","=
","","Full Vector","Convert four packed double-precision floating-point val=
ues from ymm2/m256/m64bcst to four packed quadword integers in ymm1 with wr=
itemask k1."
+"VCVTPD2QQ zmm1 {k1}{z}, zmm2/m512/m64bcst{er}","EVEX.512.66.0F.W1 7B /r",=
"Valid","Valid","Invalid","AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","","",=
"Full Vector","Convert eight packed double-precision floating-point values =
from zmm2/m512/m64bcst to eight packed quadword integers in zmm1 with write=
mask k1."
+"VCVTPD2UQQ xmm1 {k1}{z}, xmm2/m128/m64bcst","EVEX.128.66.0F.W1 79 /r","Va=
lid","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)",=
"","","Full Vector","Convert two packed double-precision floating-point val=
ues from xmm2/mem to two packed unsigned quadword integers in xmm1 with wri=
temask k1."
+"VCVTPD2UQQ ymm1 {k1}{z}, ymm2/m256/m64bcst","EVEX.256.66.0F.W1 79 /r","Va=
lid","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)",=
"","","Full Vector","Convert fourth packed double-precision floating-point =
values from ymm2/mem to four packed unsigned quadword integers in ymm1 with=
 writemask k1."
+"VCVTPD2UQQ zmm1 {k1}{z}, zmm2/m512/m64bcst{er}","EVEX.512.66.0F.W1 79 /r"=
,"Valid","Valid","Invalid","AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","",""=
,"Full Vector","Convert eight packed double-precision floating-point values=
 from zmm2/mem to eight packed unsigned quadword integers in zmm1 with writ=
emask k1."
+"VCVTPS2QQ xmm1 {k1}{z}, xmm2/m64/m32bcst","EVEX.128.66.0F.W0 7B /r","Vali=
d","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)",""=
,"","Half Vector","Convert two packed single precision floating-point value=
s from xmm2/m64/m32bcst to two packed signed quadword values in xmm1 subjec=
t to writemask k1."
+"VCVTPS2QQ ymm1 {k1}{z}, xmm2/m128/m32bcst","EVEX.256.66.0F.W0 7B /r","Val=
id","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","=
","","Half Vector","Convert four packed single precision floating-point val=
ues from xmm2/m128/m32bcst to four packed signed quadword values in ymm1 su=
bject to writemask k1."
+"VCVTPS2QQ zmm1 {k1}{z}, ymm2/m256/m32bcst{er}","EVEX.512.66.0F.W0 7B /r",=
"Valid","Valid","Invalid","AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","","",=
"Half Vector","Convert eight packed single precision floating-point values =
from ymm2/m256/m32bcst to eight packed signed quadword values in zmm1 subje=
ct to writemask k1."
+"VCVTPS2UQQ xmm1 {k1}{z}, xmm2/m64/m32bcst","EVEX.128.66.0F.W0 79 /r","Val=
id","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","=
","","Half Vector","Convert two packed single precision floating-point valu=
es from zmm2/m64/m32bcst to two packed unsigned quadword values in zmm1 sub=
ject to writemask k1."
+"VCVTPS2UQQ ymm1 {k1}{z}, xmm2/m128/m32bcst","EVEX.256.66.0F.W0 79 /r","Va=
lid","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)",=
"","","Half Vector","Convert four packed single precision floating-point va=
lues from xmm2/m128/m32bcst to four packed unsigned quadword values in ymm1=
 subject to writemask k1."
+"VCVTPS2UQQ zmm1 {k1}{z}, ymm2/m256/m32bcst{er}","EVEX.512.66.0F.W0 79 /r"=
,"Valid","Valid","Invalid","AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","",""=
,"Half Vector","Convert eight packed single precision floating-point values=
 from ymm2/m256/m32bcst to eight packed unsigned quadword values in zmm1 su=
bject to writemask k1."
+"VCVTQQ2PD xmm1 {k1}{z}, xmm2/m128/m64bcst","EVEX.128.F3.0F.W1 E6 /r","Val=
id","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","=
","","Full Vector","Convert two packed quadword integers from xmm2/m128/m64=
bcst to packed double-precision floating-point values in xmm1 with writemas=
k k1."
+"VCVTQQ2PD ymm1 {k1}{z}, ymm2/m256/m64bcst","EVEX.256.F3.0F.W1 E6 /r","Val=
id","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","=
","","Full Vector","Convert four packed quadword integers from ymm2/m256/m6=
4bcst to packed double-precision floating-point values in ymm1 with writema=
sk k1."
+"VCVTQQ2PD zmm1 {k1}{z}, zmm2/m512/m64bcst{er}","EVEX.512.F3.0F.W1 E6 /r",=
"Valid","Valid","Invalid","AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","","",=
"Full Vector","Convert eight packed quadword integers from zmm2/m512/m64bcs=
t to eight packed double-precision floating-point values in zmm1 with write=
mask k1."
+"VCVTQQ2PS xmm1 {k1}{z}, xmm2/m128/m64bcst","EVEX.128.0F.W1 5B /r","Valid"=
,"Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","","=
","Full Vector","Convert two packed quadword integers from xmm2/mem to pack=
ed single-precision floating-point values in xmm1 with writemask k1."
+"VCVTQQ2PS xmm1 {k1}{z}, ymm2/m256/m64bcst","EVEX.256.0F.W1 5B /r","Valid"=
,"Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","","=
","Full Vector","Convert four packed quadword integers from ymm2/mem to pac=
ked single-precision floating-point values in xmm1 with writemask k1."
+"VCVTQQ2PS ymm1 {k1}{z}, zmm2/m512/m64bcst{er}","EVEX.512.0F.W1 5B /r","Va=
lid","Valid","Invalid","AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","","","Fu=
ll Vector","Convert eight packed quadword integers from zmm2/mem to eight p=
acked single-precision floating-point values in ymm1 with writemask k1."
+"VCVTTPD2QQ xmm1 {k1}{z}, xmm2/m128/m64bcst","EVEX.128.66.0F.W1 7A /r","Va=
lid","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)",=
"","","Full Vector","Convert two packed double-precision floating-point val=
ues from zmm2/m128/m64bcst to two packed quadword integers in zmm1 using tr=
uncation with writemask k1."
+"VCVTTPD2QQ ymm1 {k1}{z}, ymm2/m256/m64bcst","EVEX.256.66.0F.W1 7A /r","Va=
lid","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)",=
"","","Full Vector","Convert four packed double-precision floating-point va=
lues from ymm2/m256/m64bcst to four packed quadword integers in ymm1 using =
truncation with writemask k1."
+"VCVTTPD2QQ zmm1 {k1}{z}, zmm2/m512/m64bcst{sae}","EVEX.512.66.0F.W1 7A /r=
","Valid","Valid","Invalid","AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","","=
","Full Vector","Convert eight packed double-precision floating-point value=
s from zmm2/m512 to eight packed quadword integers in zmm1 using truncation=
 with writemask k1."
+"VCVTTPD2UQQ xmm1 {k1}{z}, xmm2/m128/m64bcst","EVEX.128.66.0F.W1 78 /r","V=
alid","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)"=
,"","","Full Vector","Convert two packed double-precision floating-point va=
lues from xmm2/m128/m64bcst to two packed unsigned quadword integers in xmm=
1 using truncation with writemask k1."
+"VCVTTPD2UQQ ymm1 {k1}{z}, ymm2/m256/m64bcst","EVEX.256.66.0F.W1 78 /r","V=
alid","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)"=
,"","","Full Vector","Convert four packed double-precision floating-point v=
alues from ymm2/m256/m64bcst to four packed unsigned quadword integers in y=
mm1 using truncation with writemask k1."
+"VCVTTPD2UQQ zmm1 {k1}{z}, zmm2/m512/m64bcst{sae}","EVEX.512.66.0F.W1 78 /=
r","Valid","Valid","Invalid","AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","",=
"","Full Vector","Convert eight packed double-precision floating-point valu=
es from zmm2/mem to eight packed unsigned quadword integers in zmm1 using t=
runcation with writemask k1."
+"VCVTTPS2QQ xmm1 {k1}{z}, xmm2/m64/m32bcst","EVEX.128.66.0F.W0 7A /r","Val=
id","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","=
","","Half Vector","Convert two packed single precision floating-point valu=
es from xmm2/m64/m32bcst to two packed signed quadword values in xmm1 using=
 truncation subject to writemask k1."
+"VCVTTPS2QQ ymm1 {k1}{z}, xmm2/m128/m32bcst","EVEX.256.66.0F.W0 7A /r","Va=
lid","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)",=
"","","Half Vector","Convert four packed single precision floating-point va=
lues from xmm2/m128/m32bcst to four packed signed quadword values in ymm1 u=
sing truncation subject to writemask k1."
+"VCVTTPS2QQ zmm1 {k1}{z}, ymm2/m256/m32bcst{sae}","EVEX.512.66.0F.W0 7A /r=
","Valid","Valid","Invalid","AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","","=
","Half Vector","Convert eight packed single precision floating-point value=
s from ymm2/m256/m32bcst to eight packed signed quadword values in zmm1 usi=
ng truncation subject to writemask k1."
+"VCVTTPS2UQQ xmm1 {k1}{z}, xmm2/m64/m32bcst","EVEX.128.66.0F.W0 78 /r","Va=
lid","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)",=
"","","Half Vector","Convert two packed single precision floating-point val=
ues from xmm2/m64/m32bcst to two packed unsigned quadword values in xmm1 us=
ing truncation subject to writemask k1."
+"VCVTTPS2UQQ ymm1 {k1}{z}, xmm2/m128/m32bcst","EVEX.256.66.0F.W0 78 /r","V=
alid","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)"=
,"","","Half Vector","Convert four packed single precision floating-point v=
alues from xmm2/m128/m32bcst to four packed unsigned quadword values in ymm=
1 using truncation subject to writemask k1."
+"VCVTTPS2UQQ zmm1 {k1}{z}, ymm2/m256/m32bcst{sae}","EVEX.512.66.0F.W0 78 /=
r","Valid","Valid","Invalid","AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","",=
"","Half Vector","Convert eight packed single precision floating-point valu=
es from ymm2/m256/m32bcst to eight packed unsigned quadword values in zmm1 =
using truncation subject to writemask k1."
+"VCVTUQQ2PD xmm1 {k1}{z}, xmm2/m128/m64bcst","EVEX.128.F3.0F.W1 7A /r","Va=
lid","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)",=
"","","Full Vector","Convert two packed unsigned quadword integers from xmm=
2/m128/m64bcst to two packed double-precision floating-point values in xmm1=
 with writemask k1."
+"VCVTUQQ2PD ymm1 {k1}{z}, ymm2/m256/m64bcst","EVEX.256.F3.0F.W1 7A /r","Va=
lid","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)",=
"","","Full Vector","Convert four packed unsigned quadword integers from ym=
m2/m256/m64bcst to packed double-precision floating-point values in ymm1 wi=
th writemask k1."
+"VCVTUQQ2PD zmm1 {k1}{z}, zmm2/m512/m64bcst{er}","EVEX.512.F3.0F.W1 7A /r"=
,"Valid","Valid","Invalid","AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","",""=
,"Full Vector","Convert eight packed unsigned quadword integers from zmm2/m=
512/m64bcst to eight packed double-precision floating-point values in zmm1 =
with writemask k1."
+"VCVTUQQ2PS xmm1 {k1}{z}, xmm2/m128/m64bcst","EVEX.128.F2.0F.W1 7A /r","Va=
lid","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)",=
"","","Full Vector","Convert two packed unsigned quadword integers from xmm=
2/m128/m64bcst to packed single-precision floating-point values in zmm1 wit=
h writemask k1."
+"VCVTUQQ2PS xmm1 {k1}{z}, ymm2/m256/m64bcst","EVEX.256.F2.0F.W1 7A /r","Va=
lid","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)",=
"","","Full Vector","Convert four packed unsigned quadword integers from ym=
m2/m256/m64bcst to packed single-precision floating-point values in xmm1 wi=
th writemask k1."
+"VCVTUQQ2PS ymm1 {k1}{z}, zmm2/m512/m64bcst{er}","EVEX.512.F2.0F.W1 7A /r"=
,"Valid","Valid","Invalid","AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","",""=
,"Full Vector","Convert eight packed unsigned quadword integers from zmm2/m=
512/m64bcst to eight packed single-precision floating-point values in zmm1 =
with writemask k1."
+"VEXTRACTF32X8 ymm/m256{k}{z},zmm,ib","EVEX.512.66.0F3A.W0 1b /r ib","Vali=
d","Valid","Invalid","AVX512DQ","ModRM:r/m (w)","ModRM:reg (r)","ib","","Tu=
ple8","Extract 256 bits of packed single precision floating-point values fr=
om zmm2 and store results in ymm1/m256 subject to writemask k1."
+"VEXTRACTF64X2 xmm/m128{k}{z},ymm,ib","EVEX.256.66.0F3A.W1 19 /r ib","Vali=
d","Valid","Invalid","AVX512VL AVX512DQ","ModRM:r/m (w)","ModRM:reg (r)","i=
b","","Tuple2","Extract 128 bits of packed double precision floating-point =
values from ymm2 and store results in xmm1/m128 subject to writemask k1."
+"VEXTRACTF64X2 xmm/m128{k}{z},zmm,ib","EVEX.512.66.0F3A.W1 19 /r ib","Vali=
d","Valid","Invalid","AVX512DQ","ModRM:r/m (w)","ModRM:reg (r)","ib","","Tu=
ple2","Extract 128 bits of packed double precision floating-point values fr=
om zmm2 and store results in xmm1/m128 subject to writemask k1."
+"VEXTRACTI32X8 ymm/m256{k}{z},zmm,ib","EVEX.512.66.0F3A.W0 3b /r ib","Vali=
d","Valid","Invalid","AVX512DQ","ModRM:r/m (w)","ModRM:reg (r)","ib","","Tu=
ple8","Extract 256 bits of double-word integer values from zmm2 and store r=
esults in ymm1/m256 subject to writemask k1."
+"VEXTRACTI64X2 xmm/m128{k}{z},ymm,ib","EVEX.256.66.0F3A.W1 39 /r ib","Vali=
d","Valid","Invalid","AVX512VL AVX512DQ","ModRM:r/m (w)","ModRM:reg (r)","i=
b","","Tuple2","Extract 128 bits of quad-word integer values from ymm2 and =
store results in xmm1/m128 subject to writemask k1."
+"VEXTRACTI64X2 xmm/m128{k}{z},zmm,ib","EVEX.512.66.0F3A.W1 39 /r ib","Vali=
d","Valid","Invalid","AVX512DQ","ModRM:r/m (w)","ModRM:reg (r)","ib","","Tu=
ple2","Extract 128 bits of quad-word integer values from zmm2 and store res=
ults in xmm1/m128 subject to writemask k1."
+"VFPCLASSPD k2 {k1}, xmm2/m128/m64bcst, ib","EVEX.128.66.0F3A.W1 66 /r ib"=
,"Valid","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (=
r)","ib","","Full Vector","Tests the input for the following categories: Na=
N, +0, -0, +Infinity, -Infinity, denormal, finite negative. The immediate f=
ield provides a mask bit for each of these category tests. The masked test =
results are OR-ed together to form a mask result."
+"VFPCLASSPD k2 {k1}, ymm2/m256/m64bcst, ib","EVEX.256.66.0F3A.W1 66 /r ib"=
,"Valid","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (=
r)","ib","","Full Vector","Tests the input for the following categories: Na=
N, +0, -0, +Infinity, -Infinity, denormal, finite negative. The immediate f=
ield provides a mask bit for each of these category tests. The masked test =
results are OR-ed together to form a mask result."
+"VFPCLASSPD k2 {k1}, zmm2/m512/m64bcst, ib","EVEX.512.66.0F3A.W1 66 /r ib"=
,"Valid","Valid","Invalid","AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","ib",=
"","Full Vector","Tests the input for the following categories: NaN, +0, -0=
, +Infinity, -Infinity, denormal, finite negative. The immediate field prov=
ides a mask bit for each of these category tests. The masked test results a=
re OR-ed together to form a mask result."
+"VFPCLASSPS k2 {k1}, xmm2/m128/m32bcst, ib","EVEX.128.66.0F3A.W0 66 /r ib"=
,"Valid","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (=
r)","ib","","Full Vector","Tests the input for the following categories: Na=
N, +0, -0, +Infinity, -Infinity, denormal, finite negative. The immediate f=
ield provides a mask bit for each of these category tests. The masked test =
results are OR-ed together to form a mask result."
+"VFPCLASSPS k2 {k1}, ymm2/m256/m32bcst, ib","EVEX.256.66.0F3A.W0 66 /r ib"=
,"Valid","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (=
r)","ib","","Full Vector","Tests the input for the following categories: Na=
N, +0, -0, +Infinity, -Infinity, denormal, finite negative. The immediate f=
ield provides a mask bit for each of these category tests. The masked test =
results are OR-ed together to form a mask result."
+"VFPCLASSPS k2 {k1}, zmm2/m512/m32bcst, ib","EVEX.512.66.0F3A.W0 66 /r ib"=
,"Valid","Valid","Invalid","AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","ib",=
"","Full Vector","Tests the input for the following categories: NaN, +0, -0=
, +Infinity, -Infinity, denormal, finite negative. The immediate field prov=
ides a mask bit for each of these category tests. The masked test results a=
re OR-ed together to form a mask result."
+"VFPCLASSSD k2 {k1}, xmm2/m64, ib","EVEX.LIG.66.0F3A.W1 67 /r ib","Valid",=
"Valid","Invalid","AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","ib","","Tuple=
1 Scalar","Tests the input for the following categories: NaN, +0, -0, +Infi=
nity, -Infinity, denormal, finite negative. The immediate field provides a =
mask bit for each of these category tests. The masked test results are OR-e=
d together to form a mask result."
+"VFPCLASSSS k2 {k1}, xmm2/m32, ib","EVEX.LIG.66.0F3A.W0 67 /r ib","Valid",=
"Valid","Invalid","AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","ib","","Tuple=
1 Scalar","Tests the input for the following categories: NaN, +0, -0, +Infi=
nity, -Infinity, denormal, finite negative. The immediate field provides a =
mask bit for each of these category tests. The masked test results are OR-e=
d together to form a mask result."
+"VINSERTF32X8 zmm{k}{z},zmm,ymm/m256,ib","EVEX.512.66.0F3A.W0 1a /r ib","V=
alid","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","ib","Tuple8","nsert 128 bits of packed double precision f=
loating-point values from xmm3/m128 and the remaining values from ymm2 into=
 ymm1 under writemask k1."
+"VINSERTF64X2 ymm{k}{z},ymm,xmm/m128,ib","EVEX.256.66.0F3A.W1 18 /r ib","V=
alid","Valid","Invalid","AVX512DQ","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r=
/m (r)","ib","Tuple2","Insert 128 bits of packed double precision floating-=
point values from xmm3/m128 and the remaining values from zmm2 into zmm1 un=
der writemask k1."
+"VINSERTF64X2 zmm{k}{z},zmm,xmm/m128,ib","EVEX.512.66.0F3A.W1 18 /r ib","V=
alid","Valid","Invalid","AVX512DQ","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r=
/m (r)","ib","Tuple2","Insert 256 bits of packed single-precision floating-=
point values from ymm3/m256 and the remaining values from zmm2 into zmm1 un=
der writemask k1."
+"VINSERTI32X8 zmm{k}{z},zmm,ymm/m256,ib","EVEX.512.66.0F3A.W0 3a /r ib","V=
alid","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","ib","Tuple8","Insert 128 bits of packed quadword integer =
values from xmm3/m128 and the remaining values from ymm2 into ymm1 under wr=
itemask k1."
+"VINSERTI64X2 ymm{k}{z},ymm,xmm/m128,ib","EVEX.256.66.0F3A.W1 38 /r ib","V=
alid","Valid","Invalid","AVX512DQ","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r=
/m (r)","ib","Tuple2","Insert 128 bits of packed quadword integer values fr=
om xmm3/m128 and the remaining values from zmm2 into zmm1 under writemask k=
1."
+"VINSERTI64X2 zmm{k}{z},zmm,xmm/m128,ib","EVEX.512.66.0F3A.W1 38 /r ib","V=
alid","Valid","Invalid","AVX512DQ","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r=
/m (r)","ib","Tuple2","Insert 256 bits of packed doubleword integer values =
from ymm3/m256 and the remaining values from zmm2 into zmm1 under writemask=
 k1."
+"VORPD xmm1{k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F.W1 56 /r","Va=
lid","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","EVEX.vvvv (r)",=
"ModRM:r/m (r)","","Full Vector","Return the bitwise logical OR of packed d=
ouble-precision floating-point values in xmm2 and xmm3/m128/m64bcst subject=
 to writemask k1."
+"VORPD ymm1{k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F.W1 56 /r","Va=
lid","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","EVEX.vvvv (r)",=
"ModRM:r/m (r)","","Full Vector","Return the bitwise logical OR of packed d=
ouble-precision floating-point values in ymm2 and ymm3/m256/m64bcst subject=
 to writemask k1."
+"VORPD zmm1{k1}{z}, zmm2, zmm3/m512/m64bcst","EVEX.512.66.0F.W1 56 /r","Va=
lid","Valid","Invalid","AVX512DQ","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/=
m (r)","","Full Vector","Return the bitwise logical OR of packed double-pre=
cision floating-point values in zmm2 and zmm3/m512/m64bcst subject to write=
mask k1."
+"VORPS xmm1{k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.0F.W0 56 /r","Valid=
","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Full Vector","Return the bitwise logical OR of packed sing=
le-precision floating-point values in xmm2 and xmm3/m128/m32bcst subject to=
 writemask k1."
+"VORPS ymm1{k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.0F.W0 56 /r","Valid=
","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Full Vector","Return the bitwise logical OR of packed sing=
le-precision floating-point values in ymm2 and ymm3/m256/m32bcst subject to=
 writemask k1."
+"VORPS zmm1{k1}{z}, zmm2, zmm3/m512/m32bcst","EVEX.512.0F.W0 56 /r","Valid=
","Valid","Invalid","AVX512DQ","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (=
r)","","Full Vector","Return the bitwise logical OR of packed single-precis=
ion floating-point values in zmm2 and zmm3/m512/m32bcst subject to writemas=
k k1."
+"VPEXTRD r32/m32, xmm2, ib","EVEX.128.66.0F3A.W0 16 /r ib","Valid","Valid"=
,"Invalid","AVX512DQ","ModRM:r/m (w)","ModRM:reg (r)","ib","","Tuple1 Scala=
r","Extract a dword integer value from xmm2 at the source dword offset spec=
ified by ib into r/m."
+"VPEXTRQ r64/m64, xmm2, ib","EVEX.128.66.0F3A.W1 16 /r ib","Valid","Invali=
d","Invalid","AVX512DQ","ModRM:r/m (w)","ModRM:reg (r)","ib","","Tuple1 Sca=
lar","Extract a qword integer value from xmm2 at the source dword offset sp=
ecified by ib into r/m."
+"VPINSRD xmm1, xmm2, r32/m32, ib","EVEX.128.66.0F3A.W0 22 /r ib","Valid","=
Valid","Invalid","AVX512DQ","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)"=
,"ib","Tuple1 Scalar","Insert a dword integer value from r/m32 and rest fro=
m xmm2 into xmm1 at the dword offset in ib."
+"VPINSRQ xmm1, xmm2, r64/m64, ib","EVEX.128.66.0F3A.W1 22 /r ib","Valid","=
Invalid","Invalid","AVX512DQ","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r=
)","ib","Tuple1 Scalar","Insert a qword integer value from r/m64 and rest f=
rom xmm2 into xmm1 at the qword offset in ib."
+"VPMOVD2M k1, xmm1","EVEX.128.F3.0F38.W0 39 /r","Valid","Valid","Invalid",=
"AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","","","","Sets each bit=
 in k1 to 1 or 0 based on the value of the most significant bit of the corr=
esponding doubleword in XMM1."
+"VPMOVD2M k1, ymm1","EVEX.256.F3.0F38.W0 39 /r","Valid","Valid","Invalid",=
"AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","","","","Sets each bit=
 in k1 to 1 or 0 based on the value of the most significant bit of the corr=
esponding doubleword in YMM1."
+"VPMOVD2M k1, zmm1","EVEX.512.F3.0F38.W0 39 /r","Valid","Valid","Invalid",=
"AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","","","","Sets each bit in k1 to=
 1 or 0 based on the value of the most significant bit of the corresponding=
 doubleword in ZMM1."
+"VPMOVM2D xmm1, k1","EVEX.128.F3.0F38.W0 38 /r","Valid","Valid","Invalid",=
"AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","","","","Sets each dou=
bleword in XMM1 to all 1's or all 0's based on the value of the correspondi=
ng bit in k1."
+"VPMOVM2D ymm1, k1","EVEX.256.F3.0F38.W0 38 /r","Valid","Valid","Invalid",=
"AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","","","","Sets each dou=
bleword in YMM1 to all 1's or all 0's based on the value of the correspondi=
ng bit in k1."
+"VPMOVM2D zmm1, k1","EVEX.512.F3.0F38.W0 38 /r","Valid","Valid","Invalid",=
"AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","","","","Sets each doubleword i=
n ZMM1 to all 1's or all 0's based on the value of the corresponding bit in=
 k1."
+"VPMOVM2Q xmm1, k1","EVEX.128.F3.0F38.W1 38 /r","Valid","Valid","Invalid",=
"AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","","","","Sets each qua=
dword in XMM1 to all 1's or all 0's based on the value of the corresponding=
 bit in k1."
+"VPMOVM2Q ymm1, k1","EVEX.256.F3.0F38.W1 38 /r","Valid","Valid","Invalid",=
"AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","","","","Sets each qua=
dword in YMM1 to all 1's or all 0's based on the value of the corresponding=
 bit in k1."
+"VPMOVM2Q zmm1, k1","EVEX.512.F3.0F38.W1 38 /r","Valid","Valid","Invalid",=
"AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","","","","Sets each quadword in =
ZMM1 to all 1's or all 0's based on the value of the corresponding bit in k=
1."
+"VPMOVQ2M k1, xmm1","EVEX.128.F3.0F38.W1 39 /r","Valid","Valid","Invalid",=
"AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","","","","Sets each bit=
 in k1 to 1 or 0 based on the value of the most significant bit of the corr=
esponding quadword in XMM1."
+"VPMOVQ2M k1, ymm1","EVEX.256.F3.0F38.W1 39 /r","Valid","Valid","Invalid",=
"AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","","","","Sets each bit=
 in k1 to 1 or 0 based on the value of the most significant bit of the corr=
esponding quadword in YMM1."
+"VPMOVQ2M k1, zmm1","EVEX.512.F3.0F38.W1 39 /r","Valid","Valid","Invalid",=
"AVX512DQ","ModRM:reg (w)","ModRM:r/m (r)","","","","Sets each bit in k1 to=
 1 or 0 based on the value of the most significant bit of the corresponding=
 quadword in ZMM1."
+"VPMULLQ xmm1{k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F38.W1 40 /r"=
,"Valid","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","EVEX.vvvv (=
r)","ModRM:r/m (r)","","Full Vector","Multiply the packed qword signed inte=
gers in xmm2 and xmm3/m128/m64bcst and store the low 64 bits of each produc=
t in xmm1 under writemask k1."
+"VPMULLQ ymm1{k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W1 40 /r"=
,"Valid","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","EVEX.vvvv (=
r)","ModRM:r/m (r)","","Full Vector","Multiply the packed qword signed inte=
gers in ymm2 and ymm3/m256/m64bcst and store the low 64 bits of each produc=
t in ymm1 under writemask k1."
+"VPMULLQ zmm1{k1}{z}, zmm2, zmm3/m512/m64bcst","EVEX.512.66.0F38.W1 40 /r"=
,"Valid","Valid","Invalid","AVX512DQ","ModRM:reg (w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector","Multiply the packed qword signed integers in z=
mm2 and zmm3/m512/m64bcst and store the low 64 bits of each product in zmm1=
 under writemask k1."
+"VRANGEPD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst, ib","EVEX.128.66.0F3A.W1 =
50 /r ib","Valid","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","EV=
EX.vvvv (r)","ModRM:r/m (r)","ib","Full Vector","Calculate two RANGE operat=
ion output value from 2 pairs of double-precision floating-point values in =
xmm2 and xmm3/m128/m32bcst, store the results to xmm1 under the writemask k=
1. ib specifies the comparison and sign of the range operation."
+"VRANGEPD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst, ib","EVEX.256.66.0F3A.W1 =
50 /r ib","Valid","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","EV=
EX.vvvv (r)","ModRM:r/m (r)","ib","Full Vector","Calculate four RANGE opera=
tion output value from 4pairs of double-precision floating-point values in =
ymm2 and ymm3/m256/m32bcst, store the results to ymm1 under the writemask k=
1. ib specifies the comparison and sign of the range operation."
+"VRANGEPD zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst{sae}, ib","EVEX.512.66.0F3=
A.W1 50 /r ib","Valid","Valid","Invalid","AVX512DQ","ModRM:reg (w)","EVEX.v=
vvv (r)","ModRM:r/m (r)","ib","Full Vector","Calculate eight RANGE operatio=
n output value from 8 pairs of double-precision floating-point values in zm=
m2 and zmm3/m512/m32bcst, store the results to zmm1 under the writemask k1.=
 ib specifies the comparison and sign of the range operation."
+"VRANGEPS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst, ib","EVEX.128.66.0F3A.W0 =
50 /r ib","Valid","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","EV=
EX.vvvv (r)","ModRM:r/m (r)","ib","Full Vector","Calculate four RANGE opera=
tion output value from 4 pairs of single-precision floating-point values in=
 xmm2 and xmm3/m128/m32bcst, store the results to xmm1 under the writemask =
k1. ib specifies the comparison and sign of the range operation."
+"VRANGEPS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst, ib","EVEX.256.66.0F3A.W0 =
50 /r ib","Valid","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","EV=
EX.vvvv (r)","ModRM:r/m (r)","ib","Full Vector","Calculate eight RANGE oper=
ation output value from 8 pairs of single-precision floating-point values i=
n ymm2 and ymm3/m256/m32bcst, store the results to ymm1 under the writemask=
 k1. ib specifies the comparison and sign of the range operation."
+"VRANGEPS zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst{sae}, ib","EVEX.512.66.0F3=
A.W0 50 /r ib","Valid","Valid","Invalid","AVX512DQ","ModRM:reg (w)","EVEX.v=
vvv (r)","ModRM:r/m (r)","ib","Full Vector","Calculate 16 RANGE operation o=
utput value from 16 pairs of single-precision floating-point values in zmm2=
 and zmm3/m512/m32bcst, store the results to zmm1 under the writemask k1. i=
b specifies the comparison and sign of the range operation."
+"VRANGESD xmm1 {k1}{z}, xmm2, xmm3/m64{sae}, ib","EVEX.LIG.66.0F3A.W1 51 /=
r ib","Valid","Valid","Invalid","AVX512DQ","ModRM:reg (w)","EVEX.vvvv (r)",=
"ModRM:r/m (r)","ib","Tuple1 Scalar","Calculate a RANGE operation output va=
lue from 2 double-precision floating-point values in xmm2 and xmm3/m64, sto=
re the output to xmm1 under writemask. ib specifies the comparison and sign=
 of the range operation."
+"VRANGESS xmm1 {k1}{z}, xmm2, xmm3/m32{sae}, ib","EVEX.LIG.66.0F3A.W0 51 /=
r ib","Valid","Valid","Invalid","AVX512DQ","ModRM:reg (w)","EVEX.vvvv (r)",=
"ModRM:r/m (r)","ib","Tuple1 Scalar","Calculate a RANGE operation output va=
lue from 2 single-precision floating-point values in xmm2 and xmm3/m32, sto=
re the output to xmm1 under writemask. ib specifies the comparison and sign=
 of the range operation."
+"VREDUCEPD xmm1 {k1}{z}, xmm2/m128/m64bcst, ib","EVEX.128.66.0F3A.W1 56 /r=
 ib","Valid","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r=
/m (r)","ib","","Full Vector","Perform reduction transformation on packed d=
ouble-precision floating point values in xmm2/m128/m32bcst by subtracting a=
 number of fraction bits specified by the ib field. Stores the result in xm=
m1 register under writemask k1."
+"VREDUCEPD ymm1 {k1}{z}, ymm2/m256/m64bcst, ib","EVEX.256.66.0F3A.W1 56 /r=
 ib","Valid","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r=
/m (r)","ib","","Full Vector","Perform reduction transformation on packed d=
ouble-precision floating point values in ymm2/m256/m32bcst by subtracting a=
 number of fraction bits specified by the ib field. Stores the result in ym=
m1 register under writemask k1."
+"VREDUCEPD zmm1 {k1}{z}, zmm2/m512/m64bcst{sae}, ib","EVEX.512.66.0F3A.W1 =
56 /r ib","Valid","Valid","Invalid","AVX512DQ","ModRM:reg (w)","ModRM:r/m (=
r)","ib","","Full Vector","Perform reduction transformation on double-preci=
sion floating point values in zmm2/m512/m32bcst by subtracting a number of =
fraction bits specified by the ib field. Stores the result in zmm1 register=
 under writemask k1."
+"VREDUCEPS xmm1 {k1}{z}, xmm2/m128/m32bcst, ib","EVEX.128.66.0F3A.W0 56 /r=
 ib","Valid","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r=
/m (r)","ib","","Full Vector","Perform reduction transformation on packed s=
ingle-precision floating point values in xmm2/m128/m32bcst by subtracting a=
 number of fraction bits specified by the ib field. Stores the result in xm=
m1 register under writemask k1."
+"VREDUCEPS ymm1 {k1}{z}, ymm2/m256/m32bcst, ib","EVEX.256.66.0F3A.W0 56 /r=
 ib","Valid","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","ModRM:r=
/m (r)","ib","","Full Vector","Perform reduction transformation on packed s=
ingle-precision floating point values in ymm2/m256/m32bcst by subtracting a=
 number of fraction bits specified by the ib field. Stores the result in ym=
m1 register under writemask k1."
+"VREDUCEPS zmm1 {k1}{z}, zmm2/m512/m32bcst{sae}, ib","EVEX.512.66.0F3A.W0 =
56 /r ib","Valid","Valid","Invalid","AVX512DQ","ModRM:reg (w)","ModRM:r/m (=
r)","ib","","Full Vector","Perform reduction transformation on packed singl=
e-precision floating point values in zmm2/m512/m32bcst by subtracting a num=
ber of fraction bits specified by the ib field. Stores the result in zmm1 r=
egister under writemask k1."
+"VREDUCESS xmm1 {k1}{z}, xmm2, xmm3/m32{sae}, ib","EVEX.LIG.66.0F3A.W0 57 =
/r ib","Valid","Valid","Invalid","AVX512DQ","ModRM:reg (w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","ib","Tuple1 Scalar","Perform a reduction transformation o=
n a scalar single-precision floating point value in xmm3/m32 by subtracting=
 a number of fraction bits specified by the ib field. Also, upper single pr=
ecision floating-point values (bits[127:32]) from xmm2 are copied to xmm1[1=
27:32]. Stores the result in xmm1 register."
+"VXORPD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F.W1 57 /r","=
Valid","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","EVEX.vvvv (r)=
","ModRM:r/m (r)","","Full Vector","Return the bitwise logical XOR of packe=
d double-precision floating-point values in xmm2 and xmm3/m128/m64bcst subj=
ect to writemask k1."
+"VXORPD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F.W1 57 /r","=
Valid","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","EVEX.vvvv (r)=
","ModRM:r/m (r)","","Full Vector","Return the bitwise logical XOR of packe=
d double-precision floating-point values in ymm2 and ymm3/m256/m64bcst subj=
ect to writemask k1."
+"VXORPD zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst","EVEX.512.66.0F.W1 57 /r","=
Valid","Valid","Invalid","AVX512DQ","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:=
r/m (r)","","Full Vector","Return the bitwise logical XOR of packed double-=
precision floating-point values in zmm2 and zmm3/m512/m64bcst subject to wr=
itemask k1."
+"VXORPS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.0F.W0 57 /r","Val=
id","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","EVEX.vvvv (r)","=
ModRM:r/m (r)","","Full Vector","Return the bitwise logical XOR of packed s=
ingle-precision floating-point values in xmm2 and xmm3/m128/m32bcst subject=
 to writemask k1."
+"VXORPS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.0F.W0 57 /r","Val=
id","Valid","Invalid","AVX512VL AVX512DQ","ModRM:reg (w)","EVEX.vvvv (r)","=
ModRM:r/m (r)","","Full Vector","Return the bitwise logical XOR of packed s=
ingle-precision floating-point values in ymm2 and ymm3/m256/m32bcst subject=
 to writemask k1."
+"VXORPS zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst","EVEX.512.0F.W0 57 /r","Val=
id","Valid","Invalid","AVX512DQ","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m=
 (r)","","Full Vector","Return the bitwise logical XOR of packed single-pre=
cision floating-point values in zmm2 and zmm3/m512/m32bcst subject to write=
mask k1."
diff --git a/disas/x86-data/x86_avx512er.csv b/disas/x86-data/x86_avx512er.=
csv
new file mode 100644
index 000000000000..22441ea5c38b
--- /dev/null
+++ b/disas/x86-data/x86_avx512er.csv
@@ -0,0 +1,11 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"VEXP2PD zmm1 {k1}{z}, zmm2/m512/m64bcst {sae}","EVEX.512.66.0F38.W1 C8 /r=
","Valid","Valid","Invalid","AVX512ER","ModRM:reg (r, w)","ModRM:r/m (r)","=
","","Full Vector","Computes approximations to the exponential 2^x (with le=
ss than 2^-23 of maximum relative error) of the packed double-precision flo=
ating-point values from zmm2/m512/m64bcst and stores the floating-point res=
ult in zmm1with writemask k1."
+"VEXP2PS zmm1 {k1}{z}, zmm2/m512/m32bcst {sae}","EVEX.512.66.0F38.W0 C8 /r=
","Valid","Valid","Invalid","AVX512ER","ModRM:reg (r, w)","ModRM:r/m (r)","=
","","Full Vector","Computes approximations to the exponential 2^x (with le=
ss than 2^-23 of maximum relative error) of the packed single-precision flo=
ating-point values from zmm2/m512/m32bcst and stores the floating-point res=
ult in zmm1with writemask k1."
+"VRCP28PD zmm1 {k1}{z}, zmm2/m512/m64bcst {sae}","EVEX.512.66.0F38.W1 CA /=
r","Valid","Valid","Invalid","AVX512ER","ModRM:reg (w)","ModRM:r/m (r)","",=
"","Full Vector","Computes the approximate reciprocals ( < 2^-28 relative e=
rror) of the packed double-precision floating-point values in zmm2/m512/m64=
bcst and stores the results in zmm1. Under writemask."
+"VRCP28PS zmm1 {k1}{z}, zmm2/m512/m32bcst {sae}","EVEX.512.66.0F38.W0 CA /=
r","Valid","Valid","Invalid","AVX512ER","ModRM:reg (w)","ModRM:r/m (r)","",=
"","Full Vector","Computes the approximate reciprocals ( < 2^-28 relative e=
rror) of the packed single-precision floating-point values in zmm2/m512/m32=
bcst and stores the results in zmm1. Under writemask."
+"VRCP28SD xmm1 {k1}{z}, xmm2, xmm3/m64 {sae}","EVEX.LIG.66.0F38.W1 CB /r",=
"Valid","Valid","Invalid","AVX512ER","ModRM:reg (w)","EVEX.vvvv (r)","ModRM=
:r/m (r)","","Tuple1 Scalar","Computes the approximate reciprocal ( < 2^-28=
 relative error) of the scalar double-precision floating-point value in xmm=
3/m64 and stores the results in xmm1. Under writemask. Also, upper double-p=
recision floating-point value (bits[127:64]) from xmm2 is copied to xmm1[12=
7:64]."
+"VRCP28SS xmm1 {k1}{z}, xmm2, xmm3/m32 {sae}","EVEX.LIG.66.0F38.W0 CB /r",=
"Valid","Valid","Invalid","AVX512ER","ModRM:reg (w)","EVEX.vvvv (r)","ModRM=
:r/m (r)","","Tuple1 Scalar","Computes the approximate reciprocal ( < 2^-28=
 relative error) of the scalar single-precision floating-point value in xmm=
3/m32 and stores the results in xmm1. Under writemask. Also, upper 3 single=
-precision floating-point values (bits[127:32]) from xmm2 is copied to xmm1=
[127:32]."
+"VRSQRT28PD zmm1 {k1}{z}, zmm2/m512/m64bcst {sae}","EVEX.512.66.0F38.W1 CC=
 /r","Valid","Valid","Invalid","AVX512ER","ModRM:reg (w)","ModRM:r/m (r)","=
","","Full Vector","Computes approximations to the Reciprocal square root (=
<2^-28 relative error) of the packed double-precision floating-point values=
 from zmm2/m512/m64bcst and stores result in zmm1with writemask k1."
+"VRSQRT28PS zmm1 {k1}{z}, zmm2/m512/m32bcst {sae}","EVEX.512.66.0F38.W0 CC=
 /r","Valid","Valid","Invalid","AVX512ER","ModRM:reg (w)","ModRM:r/m (r)","=
","","Full Vector","Computes approximations to the Reciprocal square root (=
<2^-28 relative error) of the packed single-precision floating-point values=
 from zmm2/m512/m32bcst and stores result in zmm1with writemask k1."
+"VRSQRT28SD xmm1 {k1}{z}, xmm2, xmm3/m64 {sae}","EVEX.LIG.66.0F38.W1 CD /r=
","Valid","Valid","Invalid","AVX512ER","ModRM:reg (w)","EVEX.vvvv (r)","Mod=
RM:r/m (r)","","Tuple1 Scalar","Computes approximate reciprocal square root=
 (<2^-28 relative error) of the scalar double-precision floating-point valu=
e from xmm3/m64 and stores result in xmm1with writemask k1. Also, upper dou=
ble-precision floating-point value (bits[127:64]) from xmm2 is copied to xm=
m1[127:64]."
+"VRSQRT28SS xmm1 {k1}{z}, xmm2, xmm3/m32 {sae}","EVEX.LIG.66.0F38.W0 CD /r=
","Valid","Valid","Invalid","AVX512ER","ModRM:reg (w)","EVEX.vvvv (r)","Mod=
RM:r/m (r)","","Tuple1 Scalar","Computes approximate reciprocal square root=
 (<2^-28 relative error) of the scalar single-precision floating-point valu=
e from xmm3/m32 and stores result in xmm1with writemask k1. Also, upper 3 s=
ingle-precision floating-point value (bits[127:32]) from xmm2 is copied to =
xmm1[127:32]."
diff --git a/disas/x86-data/x86_avx512f.csv b/disas/x86-data/x86_avx512f.csv
new file mode 100644
index 000000000000..ccfbd4f13907
--- /dev/null
+++ b/disas/x86-data/x86_avx512f.csv
@@ -0,0 +1,901 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"KANDNW k1, k2, k3","VEX.L1.0F.W0 42 /r","Valid","Valid","Invalid","AVX512=
F","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r, ModRM:[7:6] must be 11b)",=
"","","Bfarmitwise AND NOT 16 bits masks k2 and k3 and place result in k1."
+"KANDW k1, k2, k3","VEX.L1.0F.W0 41 /r","Valid","Valid","Invalid","AVX512F=
","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r, ModRM:[7:6] must be 11b)","=
","","Bitwise AND 16 bits masks k2 and k3 and place result in k1."
+"KMOVW k1, k2/m16","VEX.L0.0F.W0 90 /r","Valid","Valid","Invalid","AVX512F=
","ModRM:reg (w)","ModRM:r/m (r)","","","","Move 16 bits mask from k2/m16 a=
nd store the result in k1."
+"KMOVW m16, k1","VEX.L0.0F.W0 91 /r","Valid","Valid","Invalid","AVX512F","=
ModRM:r/m (w, ModRM:[7:6] must not be 11b)","ModRM:reg (r)","","","","Move =
16 bits mask from k1 and store the result in m16."
+"KMOVW k1, rw","VEX.L0.0F.W0 92 /r","Valid","Valid","Invalid","AVX512F","M=
odRM:reg (w)","ModRM:r/m (r, ModRM:[7:6] must be 11b)","","","","Move 16 bi=
ts mask from r to k1."
+"KMOVW rw, k1","VEX.L0.0F.W0 93 /r","Valid","Valid","Invalid","AVX512F","M=
odRM:reg (w)","ModRM:r/m (r, ModRM:[7:6] must be 11b)","","","","Move 16 bi=
ts mask from k1 to r."
+"KNOTW k1, k2","VEX.L0.0F.W0 44 /r","Valid","Valid","Invalid","AVX512F","M=
odRM:reg (w)","ModRM:r/m (r, ModRM:[7:6] must be 11b)","","","","Bitwise NO=
T of 16 bits mask k2."
+"KORTESTW k1, k2","VEX.L0.0F.W0 98 /r","Valid","Valid","Invalid","AVX512F"=
,"ModRM:reg (w)","ModRM:r/m (r, ModRM:[7:6] must be 11b)","","","","Bitwise=
 OR 16 bits masks k1 and k2 and update ZF and CF accordingly."
+"KORW k1, k2, k3","VEX.L1.0F.W0 45 /r","Valid","Valid","Invalid","AVX512F"=
,"ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r, ModRM:[7:6] must be 11b)",""=
,"","Bitwise OR 16 bits masks k2 and k3 and place result in k1."
+"KSHIFTLW k1, k2, ib","VEX.L0.66.0F3A.W1 32 /r ib","Valid","Valid","Invali=
d","AVX512F","ModRM:reg (w)","ModRM:r/m (r, ModRM:[7:6] must be 11b)","ib",=
"","","Shift left 16 bits in k2 by immediate and write result in k1."
+"KSHIFTRW k1, k2, ib","VEX.L0.66.0F3A.W1 30 /r ib","Valid","Valid","Invali=
d","AVX512F","ModRM:reg (w)","ModRM:r/m (r, ModRM:[7:6] must be 11b)","ib",=
"","","Shift right 16 bits in k2 by immediate and write result in k1."
+"KUNPCKBW k1, k2, k3","VEX.L1.66.0F.W0 4B /r","Valid","Valid","Invalid","A=
VX512F","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r, ModRM:[7:6] must be 1=
1b)","","","Unpack and interleave 8 bits masks in k2 and k3 and write word =
result in k1."
+"KXNORW k1, k2, k3","VEX.L1.0F.W0 46 /r","Valid","Valid","Invalid","AVX512=
F","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r, ModRM:[7:6] must be 11b)",=
"","","Bitwise XNOR 16 bits masks k2 and k3 and place result in k1."
+"KXORW k1, k2, k3","VEX.L1.0F.W0 47 /r","Valid","Valid","Invalid","AVX512F=
","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r, ModRM:[7:6] must be 11b)","=
","","Bitwise XOR 16 bits masks k2 and k3 and place result in k1."
+"VADDPD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F.W1 58 /r","=
Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Add packed double-precision floating-poi=
nt values from xmm3/m128/m64bcst to xmm2 and store result in xmm1 with writ=
emask k1."
+"VADDPD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F.W1 58 /r","=
Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Add packed double-precision floating-poi=
nt values from ymm3/m256/m64bcst to ymm2 and store result in ymm1 with writ=
emask k1."
+"VADDPD zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst{er}","EVEX.512.66.0F.W1 58 /=
r","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","Mod=
RM:r/m (r)","","Full Vector","Add packed double-precision floating-point va=
lues from zmm3/m512/m64bcst to zmm2 and store result in zmm1 with writemask=
 k1."
+"VADDPS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.0F.W0 58 /r","Val=
id","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","","Full Vector","Add packed single-precision floating-point =
values from xmm3/m128/m32bcst to xmm2 and store result in xmm1 with writema=
sk k1."
+"VADDPS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.0F.W0 58 /r","Val=
id","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","","Full Vector","Add packed single-precision floating-point =
values from ymm3/m256/m32bcst to ymm2 and store result in ymm1 with writema=
sk k1."
+"VADDPS zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst {er}","EVEX.512.0F.W0 58 /r"=
,"Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM=
:r/m (r)","","Full Vector","Add packed single-precision floating-point valu=
es from zmm3/m512/m32bcst to zmm2 and store result in zmm1 with writemask k=
1."
+"VADDSD xmm1 {k1}{z}, xmm2, xmm3/m64{er}","EVEX.LIG.F2.0F.W1 58 /r","Valid=
","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r=
)","","Tuple1 Scalar","Add the low double-precision floating-point value fr=
om xmm3/m64 to xmm2 and store the result in xmm1 with writemask k1."
+"VADDSS xmm1{k1}{z}, xmm2, xmm3/m32{er}","EVEX.LIG.F3.0F.W0 58 /r","Valid"=
,"Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)=
","","Tuple1 Scalar","Add the low single-precision floating-point value fro=
m xmm3/m32 to xmm2 and store the result in xmm1with writemask k1."
+"VALIGND xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst, ib","EVEX.128.66.0F3A.W0 0=
3 /r ib","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX=
.vvvv (r)","ModRM:r/m (r)","ib","Full Vector","Shift right and merge vector=
s xmm2 and xmm3/m128/m32bcst with double-word granularity using ib as numbe=
r of elements to shift, and store the final result in xmm1, under writemask=
."
+"VALIGND ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst, ib","EVEX.256.66.0F3A.W0 0=
3 /r ib","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX=
.vvvv (r)","ModRM:r/m (r)","ib","Full Vector","Shift right and merge vector=
s ymm2 and ymm3/m256/m32bcst with double-word granularity using ib as numbe=
r of elements to shift, and store the final result in ymm1, under writemask=
."
+"VALIGND zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst, ib","EVEX.512.66.0F3A.W0 0=
3 /r ib","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)=
","ModRM:r/m (r)","ib","Full Vector","Shift right and merge vectors zmm2 an=
d zmm3/m512/m32bcst with double-word granularity using ib as number of elem=
ents to shift, and store the final result in zmm1, under writemask."
+"VALIGNQ xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst, ib","EVEX.128.66.0F3A.W1 0=
3 /r ib","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX=
.vvvv (r)","ModRM:r/m (r)","ib","Full Vector","Shift right and merge vector=
s xmm2 and xmm3/m128/m64bcst with quad-word granularity using ib as number =
of elements to shift, and store the final result in xmm1, under writemask."
+"VALIGNQ ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst, ib","EVEX.256.66.0F3A.W1 0=
3 /r ib","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX=
.vvvv (r)","ModRM:r/m (r)","ib","Full Vector","Shift right and merge vector=
s ymm2 and ymm3/m256/m64bcst with quad-word granularity using ib as number =
of elements to shift, and store the final result in ymm1, under writemask."
+"VALIGNQ zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst, ib","EVEX.512.66.0F3A.W1 0=
3 /r ib","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)=
","ModRM:r/m (r)","ib","Full Vector","Shift right and merge vectors zmm2 an=
d zmm3/m512/m64bcst with quad-word granularity using ib as number of elemen=
ts to shift, and store the final result in zmm1, under writemask."
+"VBLENDMPD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F38.W1 65 =
/r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Blend double-precision vector xmm2 =
and double-precision vector xmm3/m128/m64bcst and store the result in xmm1,=
 under control mask."
+"VBLENDMPD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W1 65 =
/r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Blend double-precision vector ymm2 =
and double-precision vector ymm3/m256/m64bcst and store the result in ymm1,=
 under control mask."
+"VBLENDMPD zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst","EVEX.512.66.0F38.W1 65 =
/r","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Full Vector","Blend double-precision vector zmm2 and doubl=
e-precision vector zmm3/m512/m64bcst and store the result in zmm1, under co=
ntrol mask."
+"VBLENDMPS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F38.W0 65 =
/r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Blend single-precision vector xmm2 =
and single-precision vector xmm3/m128/m32bcst and store the result in xmm1,=
 under control mask."
+"VBLENDMPS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F38.W0 65 =
/r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Blend single-precision vector ymm2 =
and single-precision vector ymm3/m256/m32bcst and store the result in ymm1,=
 under control mask."
+"VBLENDMPS zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst","EVEX.512.66.0F38.W0 65 =
/r","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Full Vector","Blend single-precision vector zmm2 and singl=
e-precision vector zmm3/m512/m32bcst using k1 as select control and store t=
he result in zmm1."
+"VBROADCASTF32X4 ymm1 {k1}{z}, m128","EVEX.256.66.0F38.W0 1A /r","Valid","=
Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","=
Tuple4","Broadcast 128 bits of 4 single-precision floating-point data in me=
m to locations in ymm1 using writemask k1."
+"VBROADCASTF32X4 zmm1 {k1}{z}, m128","EVEX.512.66.0F38.W0 1A /r","Valid","=
Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple4","=
Broadcast 128 bits of 4 single-precision floating-point data in mem to loca=
tions in zmm1 using writemask k1."
+"VBROADCASTF64X4 zmm1 {k1}{z}, m256","EVEX.512.66.0F38.W1 1B /r","Valid","=
Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple4","=
Broadcast 256 bits of 4 double precision floating-point data in mem to loca=
tions in zmm1 using writemask k1."
+"VBROADCASTI32X4 ymm1 {k1}{z}, m128","EVEX.256.66.0F38.W0 5A /r","Valid","=
Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","=
Tuple4","Broadcast 128 bits of 4 doubleword integer data in mem to location=
s in ymm1 using writemask k1."
+"VBROADCASTI32X4 zmm1 {k1}{z}, m128","EVEX.512.66.0F38.W0 5A /r","Valid","=
Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple4","=
Broadcast 128 bits of 4 doubleword integer data in mem to locations in zmm1=
 using writemask k1."
+"VBROADCASTI64X4 zmm1 {k1}{z}, m256","EVEX.512.66.0F38.W1 5B /r","Valid","=
Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple4","=
Broadcast 256 bits of 4 quadword integer data in mem to locations in zmm1 u=
sing writemask k1."
+"VBROADCASTSD ymm1 {k1}{z}, xmm2/m64","EVEX.256.66.0F38.W1 19 /r","Valid",=
"Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","",=
"Tuple1 Scalar","Broadcast low double-precision floating-point element in x=
mm2/m64 to four locations in ymm1 using writemask k1."
+"VBROADCASTSD zmm1 {k1}{z}, xmm2/m64","EVEX.512.66.0F38.W1 19 /r","Valid",=
"Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple1 S=
calar","Broadcast low double-precision floating-point element in xmm2/m64 t=
o eight locations in zmm1 using writemask k1."
+"VBROADCASTSS xmm1 {k1}{z}, xmm2/m32","EVEX.128.66.0F38.W0 18 /r","Valid",=
"Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","",=
"Tuple1 Scalar","Broadcast low single-precision floating-point element in x=
mm2/m32 to all locations in xmm1 using writemask k1."
+"VBROADCASTSS ymm1 {k1}{z}, xmm2/m32","EVEX.256.66.0F38.W0 18 /r","Valid",=
"Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","",=
"Tuple1 Scalar","Broadcast low single-precision floating-point element in x=
mm2/m32 to all locations in ymm1 using writemask k1."
+"VBROADCASTSS zmm1 {k1}{z}, xmm2/m32","EVEX.512.66.0F38.W0 18 /r","Valid",=
"Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple1 S=
calar","Broadcast low single-precision floating-point element in xmm2/m32 t=
o all locations in zmm1 using writemask k1."
+"VCMPPD k1 {k2}, xmm2, xmm3/m128/m64bcst, ib","EVEX.128.66.0F.W1 C2 /r ib"=
,"Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r=
)","ModRM:r/m (r)","ib","Full Vector","Compare packed double-precision floa=
ting-point values in xmm3/m128/m64bcst and xmm2 using bits 4:0 of ib as a c=
omparison predicate with writemask k2 and leave the result in mask register=
 k1."
+"VCMPPD k1 {k2}, ymm2, ymm3/m256/m64bcst, ib","EVEX.256.66.0F.W1 C2 /r ib"=
,"Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r=
)","ModRM:r/m (r)","ib","Full Vector","Compare packed double-precision floa=
ting-point values in ymm3/m256/m64bcst and ymm2 using bits 4:0 of ib as a c=
omparison predicate with writemask k2 and leave the result in mask register=
 k1."
+"VCMPPD k1 {k2}, zmm2, zmm3/m512/m64bcst{sae}, ib","EVEX.512.66.0F.W1 C2 /=
r ib","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","=
ModRM:r/m (r)","ib","Full Vector","Compare packed double-precision floating=
-point values in zmm3/m512/m64bcst and zmm2 using bits 4:0 of ib as a compa=
rison predicate with writemask k2 and leave the result in mask register k1."
+"VCMPPS k1 {k2}, xmm2, xmm3/m128/m32bcst, ib","EVEX.128.0F.W0 C2 /r ib","V=
alid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)",=
"ModRM:r/m (r)","ib","Full Vector","Compare packed single-precision floatin=
g-point values in xmm3/m128/m32bcst and xmm2 using bits 4:0 of ib as a comp=
arison predicate with writemask k2 and leave the result in mask register k1=
."
+"VCMPPS k1 {k2}, ymm2, ymm3/m256/m32bcst, ib","EVEX.256.0F.W0 C2 /r ib","V=
alid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)",=
"ModRM:r/m (r)","ib","Full Vector","Compare packed single-precision floatin=
g-point values in ymm3/m256/m32bcst and ymm2 using bits 4:0 of ib as a comp=
arison predicate with writemask k2 and leave the result in mask register k1=
."
+"VCMPPS k1 {k2}, zmm2, zmm3/m512/m32bcst{sae}, ib","EVEX.512.0F.W0 C2 /r i=
b","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","Mod=
RM:r/m (r)","ib","Full Vector","Compare packed single-precision floating-po=
int values in zmm3/m512/m32bcst and zmm2 using bits 4:0 of ib as a comparis=
on predicate with writemask k2 and leave the result in mask register k1."
+"VCMPSD k1 {k2}, xmm2, xmm3/m64{sae}, ib","EVEX.LIG.F2.0F.W1 C2 /r ib","Va=
lid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m=
 (r)","ib","Tuple1 Scalar","Compare low double-precision floating-point val=
ue in xmm3/m64 and xmm2 using bits 4:0 of ib as comparison predicate with w=
ritemask k2 and leave the result in mask register k1."
+"VCMPSS k1 {k2}, xmm2, xmm3/m32{sae}, ib","EVEX.LIG.F3.0F.W0 C2 /r ib","Va=
lid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m=
 (r)","ib","Tuple1 Scalar","Compare low single-precision floating-point val=
ue in xmm3/m32 and xmm2 using bits 4:0 of ib as comparison predicate with w=
ritemask k2 and leave the result in mask register k1."
+"VCOMISD xmm1, xmm2/m64{sae}","EVEX.LIG.66.0F.W1 2F /r","Valid","Valid","I=
nvalid","AVX512F","ModRM:reg (r)","ModRM:r/m (r)","","","Tuple1 Scalar","Co=
mpare low double-precision floating-point values in xmm1 and xmm2/mem64 and=
 set the EFLAGS flags accordingly."
+"VCOMISS xmm1, xmm2/m32{sae}","EVEX.LIG.0F.W0 2F /r","Valid","Valid","Inva=
lid","AVX512F","ModRM:reg (r)","ModRM:r/m (r)","","","Tuple1 Scalar","Compa=
re low single-precision floating-point values in xmm1 and xmm2/mem32 and se=
t the EFLAGS flags accordingly."
+"VCOMPRESSPD xmm1/m128/f64x2 {k1}{z}, xmm2","EVEX.128.66.0F38.W1 8A /r","V=
alid","Valid","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)",=
"","","Tuple1 Scalar","Compress packed double-precision floating-point valu=
es from xmm2 to xmm1/m128 using writemask k1."
+"VCOMPRESSPD ymm1/m256/f64x4 {k1}{z}, ymm2","EVEX.256.66.0F38.W1 8A /r","V=
alid","Valid","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)",=
"","","Tuple1 Scalar","Compress packed double-precision floating-point valu=
es from ymm2 to ymm1/m256 using writemask k1."
+"VCOMPRESSPD zmm1/m512/f64x8 {k1}{z}, zmm2","EVEX.512.66.0F38.W1 8A /r","V=
alid","Valid","Invalid","AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Tu=
ple1 Scalar","Compress packed double-precision floating-point values from z=
mm2 using control mask k1 to zmm1/m512."
+"VCOMPRESSPS xmm1/m128/f32x4 {k1}{z}, xmm2","EVEX.128.66.0F38.W0 8A /r","V=
alid","Valid","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)",=
"","","Tuple1 Scalar","Compress packed single-precision floating-point valu=
es from xmm2 to xmm1/m128 using writemask k1."
+"VCOMPRESSPS ymm1/m256/f32x8 {k1}{z}, ymm2","EVEX.256.66.0F38.W0 8A /r","V=
alid","Valid","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)",=
"","","Tuple1 Scalar","Compress packed single-precision floating-point valu=
es from ymm2 to ymm1/m256 using writemask k1."
+"VCOMPRESSPS zmm1/m512/f32x16 {k1}{z}, zmm2","EVEX.512.66.0F38.W0 8A /r","=
Valid","Valid","Invalid","AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","T=
uple1 Scalar","Compress packed single-precision floating-point values from =
zmm2 using control mask k1 to zmm1/m512."
+"VCVTDQ2PD xmm1 {k1}{z}, xmm2/m64/m32bcst","EVEX.128.F3.0F.W0 E6 /r","Vali=
d","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","",=
"","Half Vector","Convert 2 packed signed doubleword integers from xmm2/m12=
8/m32bcst to eight packed double-precision floating-point values in xmm1 wi=
th writemask k1."
+"VCVTDQ2PD ymm1 {k1}{z}, xmm2/m128/m32bcst","EVEX.256.F3.0F.W0 E6 /r","Val=
id","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)",""=
,"","Half Vector","Convert 4 packed signed doubleword integers from xmm2/m1=
28/m32bcst to 4 packed double-precision floating-point values in ymm1 with =
writemask k1."
+"VCVTDQ2PD zmm1 {k1}{z}, ymm2/m256/m32bcst","EVEX.512.F3.0F.W0 E6 /r","Val=
id","Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Half=
 Vector","Convert eight packed signed doubleword integers from ymm2/m256/m3=
2bcst to eight packed double-precision floating-point values in zmm1 with w=
ritemask k1."
+"VCVTDQ2PS xmm1 {k1}{z}, xmm2/m128/m32bcst","EVEX.128.0F.W0 5B /r","Valid"=
,"Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","",""=
,"Full Vector","Convert four packed signed doubleword integers from xmm2/m1=
28/m32bcst to four packed single-precision floating-point values in xmm1wit=
h writemask k1."
+"VCVTDQ2PS ymm1 {k1}{z}, ymm2/m256/m32bcst","EVEX.256.0F.W0 5B /r","Valid"=
,"Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","",""=
,"Full Vector","Convert eight packed signed doubleword integers from ymm2/m=
256/m32bcst to eight packed single-precision floating-point values in ymm1w=
ith writemask k1."
+"VCVTDQ2PS zmm1 {k1}{z}, zmm2/m512/m32bcst{er}","EVEX.512.0F.W0 5B /r","Va=
lid","Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Ful=
l Vector","Convert sixteen packed signed doubleword integers from zmm2/m512=
/m32bcst to sixteen packed single-precision floating-point values in zmm1wi=
th writemask k1."
+"VCVTPD2DQ xmm1 {k1}{z}, xmm2/m128/m64bcst","EVEX.128.F2.0F.W1 E6 /r","Val=
id","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)",""=
,"","Full Vector","Convert two packed double-precision floating-point value=
s in xmm2/m128/m64bcst to two signed doubleword integers in xmm1 subject to=
 writemask k1."
+"VCVTPD2DQ xmm1 {k1}{z}, ymm2/m256/m64bcst","EVEX.256.F2.0F.W1 E6 /r","Val=
id","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)",""=
,"","Full Vector","Convert four packed double-precision floating-point valu=
es in ymm2/m256/m64bcst to four signed doubleword integers in xmm1 subject =
to writemask k1."
+"VCVTPD2DQ ymm1 {k1}{z}, zmm2/m512/m64bcst{er}","EVEX.512.F2.0F.W1 E6 /r",=
"Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","=
Full Vector","Convert eight packed double-precision floating-point values i=
n zmm2/m512/m64bcst to eight signed doubleword integers in ymm1 subject to =
writemask k1."
+"VCVTPD2PS xmm1 {k1}{z}, xmm2/m128/m64bcst","EVEX.128.66.0F.W1 5A /r","Val=
id","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)",""=
,"","Full Vector","Convert two packed double-precision floating-point value=
s in xmm2/m128/m64bcst to two single-precision floating-point values in xmm=
1with writemask k1."
+"VCVTPD2PS xmm1 {k1}{z}, ymm2/m256/m64bcst","EVEX.256.66.0F.W1 5A /r","Val=
id","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)",""=
,"","Full Vector","Convert four packed double-precision floating-point valu=
es in ymm2/m256/m64bcst to four single-precision floating-point values in x=
mm1with writemask k1."
+"VCVTPD2PS ymm1 {k1}{z}, zmm2/m512/m64bcst{er}","EVEX.512.66.0F.W1 5A /r",=
"Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","=
Full Vector","Convert eight packed double-precision floating-point values i=
n zmm2/m512/m64bcst to eight single-precision floating-point values in ymm1=
with writemask k1."
+"VCVTPD2UDQ xmm1 {k1}{z}, xmm2/m128/m64bcst","EVEX.128.0F.W1 79 /r","Valid=
","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","=
","Full Vector","Convert two packed double-precision floating-point values =
in xmm2/m128/m64bcst to two unsigned doubleword integers in xmm1 subject to=
 writemask k1."
+"VCVTPD2UDQ xmm1 {k1}{z}, ymm2/m256/m64bcst","EVEX.256.0F.W1 79 /r","Valid=
","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","=
","Full Vector","Convert four packed double-precision floating-point values=
 in ymm2/m256/m64bcst to four unsigned doubleword integers in xmm1 subject =
to writemask k1."
+"VCVTPD2UDQ ymm1 {k1}{z}, zmm2/m512/m64bcst{er}","EVEX.512.0F.W1 79 /r","V=
alid","Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Fu=
ll Vector","Convert eight packed double-precision floating-point values in =
zmm2/m512/m64bcst to eight unsigned doubleword integers in ymm1 subject to =
writemask k1."
+"VCVTPH2PS xmm1 {k1}{z}, xmm2/m64","EVEX.128.66.0F38.W0 13 /r","Valid","Va=
lid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Ha=
lf Vector Mem","Convert four packed half precision (16-bit) floating-point =
values in xmm2/m64 to packed single-precision floating-point values in xmm1=
."
+"VCVTPH2PS ymm1 {k1}{z}, xmm2/m128","EVEX.256.66.0F38.W0 13 /r","Valid","V=
alid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","H=
alf Vector Mem","Convert eight packed half precision (16-bit) floating-poin=
t values in xmm2/m128 to packed single-precision floating-point values in y=
mm1."
+"VCVTPH2PS zmm1 {k1}{z}, ymm2/m256 {sae}","EVEX.512.66.0F38.W0 13 /r","Val=
id","Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Half=
 Vector Mem","Convert sixteen packed half precision (16-bit) floating-point=
 values in ymm2/m256 to packed single-precision floating-point values in zm=
m1."
+"VCVTPS2DQ xmm1 {k1}{z}, xmm2/m128/m32bcst","EVEX.128.66.0F.W0 5B /r","Val=
id","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)",""=
,"","Full Vector","Convert four packed single precision floating-point valu=
es from xmm2/m128/m32bcst to four packed signed doubleword values in xmm1 s=
ubject to writemask k1."
+"VCVTPS2DQ ymm1 {k1}{z}, ymm2/m256/m32bcst","EVEX.256.66.0F.W0 5B /r","Val=
id","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)",""=
,"","Full Vector","Convert eight packed single precision floating-point val=
ues from ymm2/m256/m32bcst to eight packed signed doubleword values in ymm1=
 subject to writemask k1."
+"VCVTPS2DQ zmm1 {k1}{z}, zmm2/m512/m32bcst{er}","EVEX.512.66.0F.W0 5B /r",=
"Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","=
Full Vector","Convert sixteen packed single-precision floating-point values=
 from zmm2/m512/m32bcst to sixteen packed signed doubleword values in zmm1 =
subject to writemask k1."
+"VCVTPS2PD xmm1 {k1}{z}, xmm2/m64/m32bcst","EVEX.128.0F.W0 5A /r","Valid",=
"Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","",=
"Half Vector","Convert two packed single-precision floating-point values in=
 xmm2/m64/m32bcst to packed double-precision floating-point values in xmm1 =
with writemask k1."
+"VCVTPS2PD zmm1 {k1}{z}, ymm2/m256/m32bcst{sae}","EVEX.512.0F.W0 5A /r","V=
alid","Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Ha=
lf Vector","Convert eight packed single-precision floating-point values in =
ymm2/m256/b32bcst to eight packed double-precision floating-point values in=
 zmm1 with writemask k1."
+"VCVTPS2PH xmm1/m128 {k1}{z}, ymm2, ib","EVEX.256.66.0F3A.W0 1D /r ib","Va=
lid","Valid","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","=
ib","","Half Vector Mem","Convert eight packed single-precision floating-po=
int values in ymm2 to packed half-precision (16-bit) floating-point values =
in xmm1/m128. ib provides rounding controls."
+"VCVTPS2PH xmm1/m64 {k1}{z}, xmm2, ib","EVEX.128.66.0F3A.W0 1D /r ib","Val=
id","Valid","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","i=
b","","Half Vector Mem","Convert four packed single-precision floating-poin=
t values in xmm2 to packed half-precision (16-bit) floating-point values in=
 xmm1/m64. ib provides rounding controls."
+"VCVTPS2PH ymm1/m256 {k1}{z}, zmm2{sae}, ib","EVEX.512.66.0F3A.W0 1D /r ib=
","Valid","Valid","Invalid","AVX512F","ModRM:r/m (w)","ModRM:reg (r)","ib",=
"","Half Vector Mem","Convert sixteen packed single-precision floating-poin=
t values in zmm2 to packed half-precision (16-bit) floating-point values in=
 ymm1/m256. ib provides rounding controls."
+"VCVTPS2UDQ xmm1 {k1}{z}, xmm2/m128/m32bcst","EVEX.128.0F.W0 79 /r","Valid=
","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","=
","Full Vector","Convert four packed single precision floating-point values=
 from xmm2/m128/m32bcst to four packed unsigned doubleword values in xmm1 s=
ubject to writemask k1."
+"VCVTPS2UDQ ymm1 {k1}{z}, ymm2/m256/m32bcst","EVEX.256.0F.W0 79 /r","Valid=
","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","=
","Full Vector","Convert eight packed single precision floating-point value=
s from ymm2/m256/m32bcst to eight packed unsigned doubleword values in ymm1=
 subject to writemask k1."
+"VCVTPS2UDQ zmm1 {k1}{z}, zmm2/m512/m32bcst{er}","EVEX.512.0F.W0 79 /r","V=
alid","Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Fu=
ll Vector","Convert sixteen packed single-precision floating-point values f=
rom zmm2/m512/m32bcst to sixteen packed unsigned doubleword values in zmm1 =
subject to writemask k1."
+"VCVTSD2SI rw, xmm1/m64{er}","EVEX.LIG.F2.0F.W0 2D /r","Valid","Valid","In=
valid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple1 Fixed","Conv=
ert one double-precision floating-point value from xmm1/m64 to one signed d=
oubleword integer r."
+"VCVTSD2SI rw, xmm1/m64{er}","EVEX.LIG.F2.0F.W1 2D /r","Valid","Invalid","=
Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple1 Fixed","Co=
nvert one double-precision floating-point value from xmm1/m64 to one signed=
 quadword integer signextended into r."
+"VCVTSD2SS xmm1 {k1}{z}, xmm2, xmm3/m64{er}","EVEX.LIG.F2.0F.W1 5A /r","Va=
lid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m=
 (r)","","Tuple1 Scalar","Convert one double-precision floating-point value=
 in xmm3/m64 to one single-precision floating-point value and merge with hi=
gh bits in xmm2 under writemask k1."
+"VCVTSD2USI rw, xmm1/m64{er}","EVEX.LIG.F2.0F.W0 79 /r","Valid","Valid","I=
nvalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple1 Fixed","Con=
vert one double-precision floating-point value from xmm1/m64 to one unsigne=
d doubleword integer r."
+"VCVTSD2USI rw, xmm1/m64{er}","EVEX.LIG.F2.0F.W1 79 /r","Valid","Invalid",=
"Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple1 Fixed","C=
onvert one double-precision floating-point value from xmm1/m64 to one unsig=
ned quadword integer zeroextended into r."
+"VCVTSI2SD xmm1, xmm2, rw/mw","EVEX.LIG.F2.0F.W0 2A /r","Valid","Valid","I=
nvalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)","","Tuple=
1 Scalar","Convert one signed doubleword integer from r/m to one double-pre=
cision floating-point value in xmm1."
+"VCVTSI2SD xmm1, xmm2, rw/mw{er}","EVEX.LIG.F2.0F.W1 2A /r","Valid","Inval=
id","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)","",=
"Tuple1 Scalar","Convert one signed quadword integer from r/m to one double=
-precision floating-point value in xmm1."
+"VCVTSI2SS xmm1, xmm2, rw/mw{er}","EVEX.LIG.F3.0F.W0 2A /r","Valid","Valid=
","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)","","T=
uple1 Scalar","Convert one signed doubleword integer from r/m to one single=
-precision floating-point value in xmm1."
+"VCVTSI2SS xmm1, xmm2, rw/mw{er}","EVEX.LIG.F3.0F.W1 2A /r","Valid","Inval=
id","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)","",=
"Tuple1 Scalar","Convert one signed quadword integer from r/m to one single=
-precision floating-point value in xmm1."
+"VCVTSS2SD xmm1{k1}{z}, xmm2, xmm3/m32{sae}","EVEX.LIG.F3.0F.W0 5A /r","Va=
lid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m=
 (r)","","Tuple1 Scalar","Convert one single-precision floating-point value=
 in xmm3/m32 to one double-precision floating-point value and merge with hi=
gh bits of xmm2 under writemask k1."
+"VCVTSS2SI rw, xmm1/m32{er}","EVEX.LIG.F3.0F.W0 2D /r","Valid","Valid","In=
valid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple1 Fixed","Conv=
ert one single-precision floating-point value from xmm1/m32 to one signed d=
oubleword integer in r."
+"VCVTSS2SI rw, xmm1/m32{er}","EVEX.LIG.F3.0F.W1 2D /r","Valid","Invalid","=
Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple1 Fixed","Co=
nvert one single-precision floating-point value from xmm1/m32 to one signed=
 quadword integer in r."
+"VCVTSS2USI rw, xmm1/m32{er}","EVEX.LIG.F3.0F.W0 79 /r","Valid","Valid","I=
nvalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple1 Fixed","Con=
vert one single-precision floating-point value from xmm1/m32 to one unsigne=
d doubleword integer in r."
+"VCVTSS2USI rw, xmm1/m32{er}","EVEX.LIG.F3.0F.W1 79 /r","Valid","Invalid",=
"Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple1 Fixed","C=
onvert one single-precision floating-point value from xmm1/m32 to one unsig=
ned quadword integer in r."
+"VCVTTPD2DQ xmm1{k1}{z}, xmm2/m128/m64bcst","EVEX.128.66.0F.W1 E6 /r","Val=
id","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)",""=
,"","Full Vector","Convert two packed double-precision floating-point value=
s in xmm2/m128/m64bcst to two signed doubleword integers in xmm1 using trun=
cation subject to writemask k1."
+"VCVTTPD2DQ xmm1{k1}{z}, ymm2/m256/m64bcst","EVEX.256.66.0F.W1 E6 /r","Val=
id","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)",""=
,"","Full Vector","Convert four packed double-precision floating-point valu=
es in ymm2/m256/m64bcst to four signed doubleword integers in xmm1 using tr=
uncation subject to writemask k1."
+"VCVTTPD2DQ ymm1{k1}{z}, zmm2/m512/m64bcst{sae}","EVEX.512.66.0F.W1 E6 /r"=
,"Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","",=
"Full Vector","Convert eight packed double-precision floating-point values =
in zmm2/m512/m64bcst to eight signed doubleword integers in ymm1 using trun=
cation subject to writemask k1."
+"VCVTTPD2UDQ xmm1 {k1}{z}, xmm2/m128/m64bcst","EVEX.128.0F.W1 78 /r","Vali=
d","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","",=
"","Full Vector","Convert two packed double-precision floating-point values=
 in xmm2/m128/m64bcst to two unsigned doubleword integers in xmm1 using tru=
ncation subject to writemask k1."
+"VCVTTPD2UDQ xmm1 {k1}{z}, ymm2/m256/m64bcst","EVEX.256.0F.W1 78 /r","Vali=
d","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","",=
"","Full Vector","Convert four packed double-precision floating-point value=
s in ymm2/m256/m64bcst to four unsigned doubleword integers in xmm1 using t=
runcation subject to writemask k1."
+"VCVTTPD2UDQ ymm1 {k1}{z}, zmm2/m512/m64bcst{sae}","EVEX.512.0F.W1 78 /r",=
"Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","=
Full Vector","Convert eight packed double-precision floating-point values i=
n zmm2/m512/m64bcst to eight unsigned doubleword integers in ymm1 using tru=
ncation subject to writemask k1."
+"VCVTTPS2DQ xmm1{k1}{z}, xmm2/m128/m32bcst","EVEX.128.F3.0F.W0 5B /r","Val=
id","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)",""=
,"","Full Vector","Convert four packed single precision floating-point valu=
es from xmm2/m128/m32bcst to four packed signed doubleword values in xmm1 u=
sing truncation subject to writemask k1."
+"VCVTTPS2DQ ymm1{k1}{z}, ymm2/m256/m32bcst","EVEX.256.F3.0F.W0 5B /r","Val=
id","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)",""=
,"","Full Vector","Convert eight packed single precision floating-point val=
ues from ymm2/m256/m32bcst to eight packed signed doubleword values in ymm1=
 using truncation subject to writemask k1."
+"VCVTTPS2DQ zmm1{k1}{z}, zmm2/m512/m32bcst {sae}","EVEX.512.F3.0F.W0 5B /r=
","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","",""=
,"Full Vector","Convert sixteen packed single-precision floating-point valu=
es from zmm2/m512/m32bcst to sixteen packed signed doubleword values in zmm=
1 using truncation subject to writemask k1."
+"VCVTTPS2UDQ xmm1 {k1}{z}, xmm2/m128/m32bcst","EVEX.128.0F.W0 78 /r","Vali=
d","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","",=
"","Full Vector","Convert four packed single precision floating-point value=
s from xmm2/m128/m32bcst to four packed unsigned doubleword values in xmm1 =
using truncation subject to writemask k1."
+"VCVTTPS2UDQ ymm1 {k1}{z}, ymm2/m256/m32bcst","EVEX.256.0F.W0 78 /r","Vali=
d","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","",=
"","Full Vector","Convert eight packed single precision floating-point valu=
es from ymm2/m256/m32bcst to eight packed unsigned doubleword values in ymm=
1 using truncation subject to writemask k1."
+"VCVTTPS2UDQ zmm1 {k1}{z}, zmm2/m512/m32bcst{sae}","EVEX.512.0F.W0 78 /r",=
"Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","=
Full Vector","Convert sixteen packed single-precision floating-point values=
 from zmm2/m512/m32bcst to sixteen packed unsigned doubleword values in zmm=
1 using truncation subject to writemask k1."
+"VCVTTSD2SI rw, xmm1/m64{sae}","EVEX.LIG.F2.0F.W0 2C /r","Valid","Valid","=
Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple1 Fixed","Co=
nvert one double-precision floating-point value from xmm1/m64 to one signed=
 doubleword integer in r using truncation."
+"VCVTTSD2SI rw, xmm1/m64{sae}","EVEX.LIG.F2.0F.W1 2C /r","Valid","Invalid"=
,"Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple1 Fixed","=
Convert one double-precision floating-point value from xmm1/m64 to one sign=
ed quadword integer in r using truncation."
+"VCVTTSD2USI rw, xmm1/m64{sae}","EVEX.LIG.F2.0F.W0 78 /r","Valid","Valid",=
"Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple1 Fixed","C=
onvert one double-precision floating-point value from xmm1/m64 to one unsig=
ned doubleword integer r using truncation."
+"VCVTTSD2USI rw, xmm1/m64{sae}","EVEX.LIG.F2.0F.W1 78 /r","Valid","Invalid=
","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple1 Fixed",=
"Convert one double-precision floating-point value from xmm1/m64 to one uns=
igned quadword integer zeroextended into r using truncation."
+"VCVTTSS2SI rw, xmm1/m32{sae}","EVEX.LIG.F3.0F.W0 2C /r","Valid","Valid","=
Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple1 Fixed","Co=
nvert one single-precision floating-point value from xmm1/m32 to one signed=
 doubleword integer in r using truncation."
+"VCVTTSS2SI rw, xmm1/m32{sae}","EVEX.LIG.F3.0F.W1 2C /r","Valid","Invalid"=
,"Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple1 Fixed","=
Convert one single-precision floating-point value from xmm1/m32 to one sign=
ed quadword integer in r using truncation."
+"VCVTTSS2USI rw, xmm1/m32{sae}","EVEX.LIG.F3.0F.W0 78 /r","Valid","Valid",=
"Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple1 Fixed","C=
onvert one single-precision floating-point value from xmm1/m32 to one unsig=
ned doubleword integer in r using truncation."
+"VCVTTSS2USI rw, xmm1/m32{sae}","EVEX.LIG.F3.0F.W1 78 /r","Valid","Invalid=
","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple1 Fixed",=
"Convert one single-precision floating-point value from xmm1/m32 to one uns=
igned quadword integer in r using truncation."
+"VCVTUDQ2PD xmm1 {k1}{z}, xmm2/m64/m32bcst","EVEX.128.F3.0F.W0 7A /r","Val=
id","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)",""=
,"","Half Vector","Convert two packed unsigned doubleword integers from ymm=
2/m64/m32bcst to packed double-precision floating-point values in zmm1 with=
 writemask k1."
+"VCVTUDQ2PD ymm1 {k1}{z}, xmm2/m128/m32bcst","EVEX.256.F3.0F.W0 7A /r","Va=
lid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","=
","","Half Vector","Convert four packed unsigned doubleword integers from x=
mm2/m128/m32bcst to packed double-precision floating-point values in zmm1 w=
ith writemask k1."
+"VCVTUDQ2PD zmm1 {k1}{z}, ymm2/m256/m32bcst","EVEX.512.F3.0F.W0 7A /r","Va=
lid","Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Hal=
f Vector","Convert eight packed unsigned doubleword integers from ymm2/m256=
/m32bcst to eight packed double-precision floating-point values in zmm1 wit=
h writemask k1."
+"VCVTUDQ2PS xmm1 {k1}{z}, xmm2/m128/m32bcst","EVEX.128.F2.0F.W0 7A /r","Va=
lid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","=
","","Full Vector","Convert four packed unsigned doubleword integers from x=
mm2/m128/m32bcst to packed single-precision floating-point values in xmm1 w=
ith writemask k1."
+"VCVTUDQ2PS ymm1 {k1}{z}, ymm2/m256/m32bcst","EVEX.256.F2.0F.W0 7A /r","Va=
lid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","=
","","Full Vector","Convert eight packed unsigned doubleword integers from =
ymm2/m256/m32bcst to packed single-precision floating-point values in zmm1 =
with writemask k1."
+"VCVTUDQ2PS zmm1 {k1}{z}, zmm2/m512/m32bcst{er}","EVEX.512.F2.0F.W0 7A /r"=
,"Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","",=
"Full Vector","Convert sixteen packed unsigned doubleword integers from zmm=
2/m512/m32bcst to sixteen packed single-precision floating-point values in =
zmm1 with writemask k1."
+"VCVTUSI2SD xmm1, xmm2, rw/mw","EVEX.LIG.F2.0F.W0 7B /r","Valid","Valid","=
Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)","","Tupl=
e1 Scalar","Convert one unsigned doubleword integer from r/m to one double-=
precision floating-point value in xmm1."
+"VCVTUSI2SD xmm1, xmm2, rw/mw{er}","EVEX.LIG.F2.0F.W1 7B /r","Valid","Inva=
lid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)",""=
,"Tuple1 Scalar","Convert one unsigned quadword integer from r/m to one dou=
ble-precision floating-point value in xmm1."
+"VCVTUSI2SS xmm1, xmm2, rw/mw{er}","EVEX.LIG.F3.0F.W0 7B /r","Valid","Vali=
d","Invalid","AVX512F","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","T=
uple1 Scalar","Convert one signed doubleword integer from r/m to one single=
-precision floating-point value in xmm1."
+"VCVTUSI2SS xmm1, xmm2, rw/mw{er}","EVEX.LIG.F3.0F.W1 7B /r","Valid","Inva=
lid","Invalid","AVX512F","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","",=
"Tuple1 Scalar","Convert one signed quadword integer from r/m to one single=
-precision floating-point value in xmm1."
+"VDIVPD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F.W1 5E /r","=
Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Divide packed double-precision floating-=
point values in xmm2 by packed double-precision floating-point values in xm=
m3/m128/m64bcst and write results to xmm1 subject to writemask k1."
+"VDIVPD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F.W1 5E /r","=
Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Divide packed double-precision floating-=
point values in ymm2 by packed double-precision floating-point values in ym=
m3/m256/m64bcst and write results to ymm1 subject to writemask k1."
+"VDIVPD zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst{er}","EVEX.512.66.0F.W1 5E /=
r","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","Mod=
RM:r/m (r)","","Full Vector","Divide packed double-precision floating-point=
 values in zmm2 by packed double-precision FP values in zmm3/m512/m64bcst a=
nd write results to zmm1 subject to writemask k1."
+"VDIVPS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.0F.W0 5E /r","Val=
id","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","","Full Vector","Divide packed single-precision floating-poi=
nt values in xmm2 by packed single-precision floating-point values in xmm3/=
m128/m32bcst and write results to xmm1 subject to writemask k1."
+"VDIVPS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.0F.W0 5E /r","Val=
id","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","","Full Vector","Divide packed single-precision floating-poi=
nt values in ymm2 by packed single-precision floating-point values in ymm3/=
m256/m32bcst and write results to ymm1 subject to writemask k1."
+"VDIVPS zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst{er}","EVEX.512.0F.W0 5E /r",=
"Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:=
r/m (r)","","Full Vector","Divide packed single-precision floating-point va=
lues in zmm2 by packed single-precision floating-point values in zmm3/m512/=
m32bcst and write results to zmm1 subject to writemask k1."
+"VDIVSD xmm1 {k1}{z}, xmm2, xmm3/m64{er}","EVEX.LIG.F2.0F.W1 5E /r","Valid=
","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r=
)","","Tuple1 Scalar","Divide low double-precision floating-point value in =
xmm2 by low double-precision floating-point value in xmm3/m64."
+"VDIVSS xmm1 {k1}{z}, xmm2, xmm3/m32{er}","EVEX.LIG.F3.0F.W0 5E /r","Valid=
","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r=
)","","Tuple1 Scalar","Divide low single-precision floating-point value in =
xmm2 by low single-precision floating-point value in xmm3/m32."
+"VEXPANDPD xmm1 {k1}{z}, xmm2/m128/f64x2","EVEX.128.66.0F38.W1 88 /r","Val=
id","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)",""=
,"","Tuple1 Scalar","Expand packed double-precision floating-point values f=
rom xmm2/m128 to xmm1 using writemask k1."
+"VEXPANDPD ymm1 {k1}{z}, ymm2/m256/f64x4","EVEX.256.66.0F38.W1 88 /r","Val=
id","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)",""=
,"","Tuple1 Scalar","Expand packed double-precision floating-point values f=
rom ymm2/m256 to ymm1 using writemask k1."
+"VEXPANDPD zmm1 {k1}{z}, zmm2/m512/f64x8","EVEX.512.66.0F38.W1 88 /r","Val=
id","Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Tupl=
e1 Scalar","Expand packed double-precision floating-point values from zmm2/=
m512 to zmm1 using writemask k1."
+"VEXPANDPS xmm1 {k1}{z}, xmm2/m128/f32x4","EVEX.128.66.0F38.W0 88 /r","Val=
id","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)",""=
,"","Tuple1 Scalar","Expand packed single-precision floating-point values f=
rom xmm2/m128 to xmm1 using writemask k1."
+"VEXPANDPS ymm1 {k1}{z}, ymm2/m256/f32x8","EVEX.256.66.0F38.W0 88 /r","Val=
id","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)",""=
,"","Tuple1 Scalar","Expand packed single-precision floating-point values f=
rom ymm2/m256 to ymm1 using writemask k1."
+"VEXPANDPS zmm1 {k1}{z}, zmm2/m512/f32x16","EVEX.512.66.0F38.W0 88 /r","Va=
lid","Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Tup=
le1 Scalar","Expand packed single-precision floating-point values from zmm2=
/m512 to zmm1 using writemask k1."
+"VEXTRACTF32X4 xmm/m128{k}{z},ymm,ib","EVEX.256.66.0F3A.W0 19 /r ib","Vali=
d","Valid","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","ib=
","","Tuple4","Extract 128 bits of packed single precision floating-point v=
alues from ymm2 and store results in xmm1/m128 subject to writemask k1."
+"VEXTRACTF32X4 xmm/m128{k}{z},zmm,ib","EVEX.512.66.0F3A.W0 19 /r ib","Vali=
d","Valid","Invalid","AVX512F","ModRM:r/m (w)","ModRM:reg (r)","ib","","Tup=
le4","Extract 128 bits of packed single precision floating-point values fro=
m zmm2 and store results in xmm1/m128 subject to writemask k1."
+"VEXTRACTF64X4 ymm/m256{k}{z},zmm,ib","EVEX.512.66.0F3A.W1 1b /r ib","Vali=
d","Valid","Invalid","AVX512F","ModRM:r/m (w)","ModRM:reg (r)","ib","","Tup=
le4","Extract 256 bits of packed double precision floating-point values fro=
m zmm2 and store results in ymm1/m256 subject to writemask k1."
+"VEXTRACTI32X4 xmm/m128{k}{z},ymm,ib","EVEX.256.66.0F3A.W0 39 /r ib","Vali=
d","Valid","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","ib=
","","Tuple4","Extract 128 bits of double-word integer values from ymm2 and=
 store results in xmm1/m128 subject to writemask k1."
+"VEXTRACTI32X4 xmm/m128{k}{z},zmm,ib","EVEX.512.66.0F3A.W0 39 /r ib","Vali=
d","Valid","Invalid","AVX512F","ModRM:r/m (w)","ModRM:reg (r)","ib","","Tup=
le4","Extract 128 bits of double-word integer values from zmm2 and store re=
sults in xmm1/m128 subject to writemask k1."
+"VEXTRACTI64X4 ymm/m256{k}{z},zmm,ib","EVEX.512.66.0F3A.W1 3b /r ib","Vali=
d","Valid","Invalid","AVX512F","ModRM:r/m (w)","ModRM:reg (r)","ib","","Tup=
le4","Extract 256 bits of quad-word integer values from zmm2 and store resu=
lts in ymm1/m256 subject to writemask k1."
+"VEXTRACTPS r32/m32, xmm1, ib","EVEX.128.66.0F3A.WIG 17 /r ib","Valid","Va=
lid","Invalid","AVX512F","ModRM:r/m (w)","ModRM:reg (r)","ib","","Tuple1 Sc=
alar","Extract one single-precision floating-point value from xmm1 at the o=
ffset specified by ib and store the result in reg or m32. Zero extend the r=
esults in 64-bit register if applicable."
+"VFIXUPIMMPD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst, ib","EVEX.128.66.0F3A.=
W1 54 /r ib","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)=
","EVEX.vvvv (r)","ModRM:r/m (r)","ib","Full Vector","Fix up special number=
s in float64 vector xmm1, float64 vector xmm2 and int64 vector xmm3/m128/m6=
4bcst and store the result in xmm1, under writemask."
+"VFIXUPIMMPD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst, ib","EVEX.256.66.0F3A.=
W1 54 /r ib","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)=
","EVEX.vvvv (r)","ModRM:r/m (r)","ib","Full Vector","Fix up special number=
s in float64 vector ymm1, float64 vector ymm2 and int64 vector ymm3/m256/m6=
4bcst and store the result in ymm1, under writemask."
+"VFIXUPIMMPD zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst{sae}, ib","EVEX.512.66.=
0F3A.W1 54 /r ib","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","E=
VEX.vvvv (r)","ModRM:r/m (r)","ib","Full Vector","Fix up elements of float6=
4 vector in zmm2 using int64 vector table in zmm3/m512/m64bcst, combine wit=
h preserved elements from zmm1, and store the result in zmm1."
+"VFIXUPIMMPS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst, ib","EVEX.128.66.0F3A.=
W0 54 /r ib","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)=
","EVEX.vvvv (r)","ModRM:r/m (r)","ib","Full Vector","Fix up special number=
s in float32 vector xmm1, float32 vector xmm2 and int32 vector xmm3/m128/m3=
2bcst and store the result in xmm1, under writemask."
+"VFIXUPIMMPS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst, ib","EVEX.256.66.0F3A.=
W0 54 /r ib","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)=
","EVEX.vvvv (r)","ModRM:r/m (r)","ib","Full Vector","Fix up special number=
s in float32 vector ymm1, float32 vector ymm2 and int32 vector ymm3/m256/m3=
2bcst and store the result in ymm1, under writemask."
+"VFIXUPIMMPS zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst{sae}, ib","EVEX.512.66.=
0F3A.W0 54 /r ib","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","E=
VEX.vvvv (r)","ModRM:r/m (r)","ib","Full Vector","Fix up elements of float3=
2 vector in zmm2 using int32 vector table in zmm3/m512/m32bcst, combine wit=
h preserved elements from zmm1, and store the result in zmm1."
+"VFIXUPIMMSD xmm1 {k1}{z}, xmm2, xmm3/m64{sae}, ib","EVEX.LIG.66.0F3A.W1 5=
5 /r ib","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv =
(r)","ModRM:r/m (r)","ib","Tuple1 Scalar","Fix up a float64 number in the l=
ow quadword element of xmm2 using scalar int32 table in xmm3/m64 and store =
the result in xmm1."
+"VFIXUPIMMSS xmm1 {k1}{z}, xmm2, xmm3/m32{sae}, ib","EVEX.LIG.66.0F3A.W0 5=
5 /r ib","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv =
(r)","ModRM:r/m (r)","ib","Tuple1 Scalar","Fix up a float32 number in the l=
ow doubleword element in xmm2 using scalar int32 table in xmm3/m32 and stor=
e the result in xmm1."
+"VFMADD132PD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F38.W1 9=
8 /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","VEX.=
vvvv (r)","ModRM:r/m (r)","","","Multiply packed double-precision floating-=
point values from xmm1 and xmm3/m128/m64bcst, add to xmm2 and put result in=
 xmm1."
+"VFMADD132PD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W1 9=
8 /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVEX=
.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-precisi=
on floating-point values from ymm1 and ymm3/m256/m64bcst, add to ymm2 and p=
ut result in ymm1."
+"VFMADD132PD zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst{er}","EVEX.512.66.0F38.=
W1 98 /r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-precision fl=
oating-point values from zmm1 and zmm3/m512/m64bcst, add to zmm2 and put re=
sult in zmm1."
+"VFMADD132PS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F38.W0 9=
8 /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVEX=
.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-precisi=
on floating-point values from xmm1 and xmm3/m128/m32bcst, add to xmm2 and p=
ut result in xmm1."
+"VFMADD132PS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F38.W0 9=
8 /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVEX=
.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-precisi=
on floating-point values from ymm1 and ymm3/m256/m32bcst, add to ymm2 and p=
ut result in ymm1."
+"VFMADD132PS zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst{er}","EVEX.512.66.0F38.=
W0 98 /r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-precision fl=
oating-point values from zmm1 and zmm3/m512/m32bcst, add to zmm2 and put re=
sult in zmm1."
+"VFMADD132SD xmm1 {k1}{z}, xmm2, xmm3/m64{er}","EVEX.LIG.66.0F38.W1 99 /r"=
,"Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Tuple1 Scalar","Multiply scalar double-precision floating-=
point value from xmm1 and xmm3/m64, add to xmm2 and put result in xmm1."
+"VFMADD132SS xmm1 {k1}{z}, xmm2, xmm3/m32{er}","EVEX.LIG.66.0F38.W0 99 /r"=
,"Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Tuple1 Scalar","Multiply scalar single-precision floating-=
point value from xmm1 and xmm3/m32, add to xmm2 and put result in xmm1."
+"VFMADD213PD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F38.W1 A=
8 /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVEX=
.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-precisi=
on floating-point values from xmm1 and xmm2, add to xmm3/m128/m64bcst and p=
ut result in xmm1."
+"VFMADD213PD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W1 A=
8 /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVEX=
.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-precisi=
on floating-point values from ymm1 and ymm2, add to ymm3/m256/m64bcst and p=
ut result in ymm1."
+"VFMADD213PD zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst{er}","EVEX.512.66.0F38.=
W1 A8 /r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-precision fl=
oating-point values from zmm1 and zmm2, add to zmm3/m512/m64bcst and put re=
sult in zmm1."
+"VFMADD213PS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F38.W0 A=
8 /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVEX=
.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-precisi=
on floating-point values from xmm1 and xmm2, add to xmm3/m128/m32bcst and p=
ut result in xmm1."
+"VFMADD213PS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F38.W0 A=
8 /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVEX=
.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-precisi=
on floating-point values from ymm1 and ymm2, add to ymm3/m256/m32bcst and p=
ut result in ymm1."
+"VFMADD213PS zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst{er}","EVEX.512.66.0F38.=
W0 A8 /r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-precision fl=
oating-point values from zmm1 and zmm2, add to zmm3/m512/m32bcst and put re=
sult in zmm1."
+"VFMADD213SD xmm1 {k1}{z}, xmm2, xmm3/m64{er}","EVEX.LIG.66.0F38.W1 A9 /r"=
,"Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Tuple1 Scalar","Multiply scalar double-precision floating-=
point value from xmm1 and xmm2, add to xmm3/m64 and put result in xmm1."
+"VFMADD213SS xmm1 {k1}{z}, xmm2, xmm3/m32{er}","EVEX.LIG.66.0F38.W0 A9 /r"=
,"Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Tuple1 Scalar","Multiply scalar single-precision floating-=
point value from xmm1 and xmm2, add to xmm3/m32 and put result in xmm1."
+"VFMADD231PD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F38.W1 B=
8 /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVEX=
.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-precisi=
on floating-point values from xmm2 and xmm3/m128/m64bcst, add to xmm1 and p=
ut result in xmm1."
+"VFMADD231PD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W1 B=
8 /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVEX=
.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-precisi=
on floating-point values from ymm2 and ymm3/m256/m64bcst, add to ymm1 and p=
ut result in ymm1."
+"VFMADD231PD zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst{er}","EVEX.512.66.0F38.=
W1 B8 /r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-precision fl=
oating-point values from zmm2 and zmm3/m512/m64bcst, add to zmm1 and put re=
sult in zmm1."
+"VFMADD231PS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F38.W0 B=
8 /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVEX=
.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-precisi=
on floating-point values from xmm2 and xmm3/m128/m32bcst, add to xmm1 and p=
ut result in xmm1."
+"VFMADD231PS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F38.W0 B=
8 /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVEX=
.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-precisi=
on floating-point values from ymm2 and ymm3/m256/m32bcst, add to ymm1 and p=
ut result in ymm1."
+"VFMADD231PS zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst{er}","EVEX.512.66.0F38.=
W0 B8 /r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-precision fl=
oating-point values from zmm2 and zmm3/m512/m32bcst, add to zmm1 and put re=
sult in zmm1."
+"VFMADD231SD xmm1 {k1}{z}, xmm2, xmm3/m64{er}","EVEX.LIG.66.0F38.W1 B9 /r"=
,"Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Tuple1 Scalar","Multiply scalar double-precision floating-=
point value from xmm2 and xmm3/m64, add to xmm1 and put result in xmm1."
+"VFMADD231SS xmm1 {k1}{z}, xmm2, xmm3/m32{er}","EVEX.LIG.66.0F38.W0 B9 /r"=
,"Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Tuple1 Scalar","Multiply scalar single-precision floating-=
point value from xmm2 and xmm3/m32, add to xmm1 and put result in xmm1."
+"VFMADDSUB132PD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F38.W=
1 96 /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","E=
VEX.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-prec=
ision floating-point values from xmm1 and xmm3/m128/m64bcst,add/subtract el=
ements in xmm2 and put result in xmm1 subject to writemask k1."
+"VFMADDSUB132PD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W=
1 96 /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","E=
VEX.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-prec=
ision floating-point values from ymm1 and ymm3/m256/m64bcst,add/subtract el=
ements in ymm2 and put result in ymm1 subject to writemask k1."
+"VFMADDSUB132PD zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst{er}","EVEX.512.66.0F=
38.W1 96 /r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.v=
vvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-precision=
 floating-point values from zmm1 and zmm3/m512/m64bcst,add/subtract element=
s in zmm2 and put result in zmm1 subject to writemask k1."
+"VFMADDSUB132PS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F38.W=
0 96 /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","E=
VEX.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-prec=
ision floating-point values from xmm1 and xmm3/m128/m32bcst, add/subtract e=
lements in zmm2 and put result in xmm1 subject to writemask k1."
+"VFMADDSUB132PS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F38.W=
0 96 /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","E=
VEX.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-prec=
ision floating-point values from ymm1 and ymm3/m256/m32bcst, add/subtract e=
lements in ymm2 and put result in ymm1 subject to writemask k1."
+"VFMADDSUB132PS zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst{er}","EVEX.512.66.0F=
38.W0 96 /r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.v=
vvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-precision=
 floating-point values from zmm1 and zmm3/m512/m32bcst, add/subtract elemen=
ts in zmm2 and put result in zmm1 subject to writemask k1."
+"VFMADDSUB213PD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F38.W=
1 A6 /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","E=
VEX.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-prec=
ision floating-point values from xmm1 and xmm2,add/subtract elements in xmm=
3/m128/m64bcst and put result in xmm1 subject to writemask k1."
+"VFMADDSUB213PD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W=
1 A6 /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","E=
VEX.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-prec=
ision floating-point values from ymm1 and ymm2,add/subtract elements in ymm=
3/m256/m64bcst and put result in ymm1 subject to writemask k1."
+"VFMADDSUB213PD zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst{er}","EVEX.512.66.0F=
38.W1 A6 /r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.v=
vvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-precision=
 floating-point values from zmm1and zmm2,add/subtract elements in zmm3/m512=
/m64bcst and put result in zmm1 subject to writemask k1."
+"VFMADDSUB213PS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F38.W=
0 A6 /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","E=
VEX.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-prec=
ision floating-point values from xmm1 and xmm2, add/subtract elements in xm=
m3/m128/m32bcst and put result in xmm1 subject to writemask k1."
+"VFMADDSUB213PS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F38.W=
0 A6 /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","E=
VEX.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-prec=
ision floating-point values from ymm1 and ymm2, add/subtract elements in ym=
m3/m256/m32bcst and put result in ymm1 subject to writemask k1."
+"VFMADDSUB213PS zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst{er}","EVEX.512.66.0F=
38.W0 A6 /r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.v=
vvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-precision=
 floating-point values from zmm1 and zmm2, add/subtract elements in zmm3/m5=
12/m32bcst and put result in zmm1 subject to writemask k1."
+"VFMADDSUB231PD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F38.W=
1 B6 /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","E=
VEX.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-prec=
ision floating-point values from xmm2 and xmm3/m128/m64bcst,add/subtract el=
ements in xmm1 and put result in xmm1 subject to writemask k1."
+"VFMADDSUB231PD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W=
1 B6 /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","E=
VEX.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-prec=
ision floating-point values from ymm2 and ymm3/m256/m64bcst,add/subtract el=
ements in ymm1 and put result in ymm1 subject to writemask k1."
+"VFMADDSUB231PD zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst{er}","EVEX.512.66.0F=
38.W1 B6 /r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.v=
vvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-precision=
 floating-point values from zmm2 and zmm3/m512/m64bcst,add/subtract element=
s in zmm1 and put result in zmm1 subject to writemask k1."
+"VFMADDSUB231PS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F38.W=
0 B6 /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","E=
VEX.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-prec=
ision floating-point values from xmm2 and xmm3/m128/m32bcst, add/subtract e=
lements in xmm1 and put result in xmm1 subject to writemask k1."
+"VFMADDSUB231PS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F38.W=
0 B6 /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","E=
VEX.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-prec=
ision floating-point values from ymm2 and ymm3/m256/m32bcst, add/subtract e=
lements in ymm1 and put result in ymm1 subject to writemask k1."
+"VFMADDSUB231PS zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst{er}","EVEX.512.66.0F=
38.W0 B6 /r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.v=
vvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-precision=
 floating-point values from zmm2 and zmm3/m512/m32bcst, add/subtract elemen=
ts in zmm1 and put result in zmm1 subject to writemask k1."
+"VFMSUB132PD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F38.W1 9=
A /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVEX=
.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-precisi=
on floating-point values from xmm1 and xmm3/m128/m64bcst, subtract xmm2 and=
 put result in xmm1 subject to writemask k1."
+"VFMSUB132PD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W1 9=
A /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVEX=
.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-precisi=
on floating-point values from ymm1 and ymm3/m256/m64bcst, subtract ymm2 and=
 put result in ymm1 subject to writemask k1."
+"VFMSUB132PD zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst{er}","EVEX.512.66.0F38.=
W1 9A /r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-precision fl=
oating-point values from zmm1 and zmm3/m512/m64bcst, subtract zmm2 and put =
result in zmm1 subject to writemask k1."
+"VFMSUB132PS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F38.W0 9=
A /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVEX=
.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-precisi=
on floating-point values from xmm1 and xmm3/m128/m32bcst, subtract xmm2 and=
 put result in xmm1."
+"VFMSUB132PS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F38.W0 9=
A /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVEX=
.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-precisi=
on floating-point values from ymm1 and ymm3/m256/m32bcst, subtract ymm2 and=
 put result in ymm1."
+"VFMSUB132PS zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst{er}","EVEX.512.66.0F38.=
W0 9A /r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-precision fl=
oating-point values from zmm1 and zmm3/m512/m32bcst, subtract zmm2 and put =
result in zmm1."
+"VFMSUB132SD xmm1 {k1}{z}, xmm2, xmm3/m64{er}","EVEX.LIG.66.0F38.W1 9B /r"=
,"Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Tuple1 Scalar","Multiply scalar double-precision floating-=
point value from xmm1 and xmm3/m64, subtract xmm2 and put result in xmm1."
+"VFMSUB132SS xmm1 {k1}{z}, xmm2, xmm3/m32{er}","EVEX.LIG.66.0F38.W0 9B /r"=
,"Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Tuple1 Scalar","Multiply scalar single-precision floating-=
point value from xmm1 and xmm3/m32, subtract xmm2 and put result in xmm1."
+"VFMSUB213PD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F38.W1 A=
A /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVEX=
.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-precisi=
on floating-point values from xmm1 and xmm2, subtract xmm3/m128/m64bcst and=
 put result in xmm1 subject to writemask k1."
+"VFMSUB213PD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W1 A=
A /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVEX=
.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-precisi=
on floating-point values from ymm1 and ymm2, subtract ymm3/m256/m64bcst and=
 put result in ymm1 subject to writemask k1."
+"VFMSUB213PD zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst{er}","EVEX.512.66.0F38.=
W1 AA /r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-precision fl=
oating-point values from zmm1 and zmm2, subtract zmm3/m512/m64bcst and put =
result in zmm1 subject to writemask k1."
+"VFMSUB213PS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F38.W0 A=
A /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVEX=
.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-precisi=
on floating-point values from xmm1 and xmm2, subtract xmm3/m128/m32bcst and=
 put result in xmm1."
+"VFMSUB213PS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F38.W0 A=
A /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVEX=
.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-precisi=
on floating-point values from ymm1 and ymm2, subtract ymm3/m256/m32bcst and=
 put result in ymm1."
+"VFMSUB213PS zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst{er}","EVEX.512.66.0F38.=
W0 AA /r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-precision fl=
oating-point values from zmm1 and zmm2, subtract zmm3/m512/m32bcst and put =
result in zmm1."
+"VFMSUB213SD xmm1 {k1}{z}, xmm2, xmm3/m64{er}","EVEX.LIG.66.0F38.W1 AB /r"=
,"Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Tuple1 Scalar","Multiply scalar double-precision floating-=
point value from xmm1 and xmm2, subtract xmm3/m64 and put result in xmm1."
+"VFMSUB213SS xmm1 {k1}{z}, xmm2, xmm3/m32{er}","EVEX.LIG.66.0F38.W0 AB /r"=
,"Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Tuple1 Scalar","Multiply scalar single-precision floating-=
point value from xmm1 and xmm2, subtract xmm3/m32 and put result in xmm1."
+"VFMSUB231PD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F38.W1 B=
A /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVEX=
.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-precisi=
on floating-point values from xmm2 and xmm3/m128/m64bcst, subtract xmm1 and=
 put result in xmm1 subject to writemask k1."
+"VFMSUB231PD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W1 B=
A /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVEX=
.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-precisi=
on floating-point values from ymm2 and ymm3/m256/m64bcst, subtract ymm1 and=
 put result in ymm1 subject to writemask k1."
+"VFMSUB231PD zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst{er}","EVEX.512.66.0F38.=
W1 BA /r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-precision fl=
oating-point values from zmm2 and zmm3/m512/m64bcst, subtract zmm1 and put =
result in zmm1 subject to writemask k1."
+"VFMSUB231PS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F38.W0 B=
A /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVEX=
.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-precisi=
on floating-point values from xmm2 and xmm3/m128/m32bcst, subtract xmm1 and=
 put result in xmm1."
+"VFMSUB231PS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F38.W0 B=
A /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVEX=
.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-precisi=
on floating-point values from ymm2 and ymm3/m256/m32bcst, subtract ymm1 and=
 put result in ymm1."
+"VFMSUB231PS zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst{er}","EVEX.512.66.0F38.=
W0 BA /r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-precision fl=
oating-point values from zmm2 and zmm3/m512/m32bcst, subtract zmm1 and put =
result in zmm1."
+"VFMSUB231SD xmm1 {k1}{z}, xmm2, xmm3/m64{er}","EVEX.LIG.66.0F38.W1 BB /r"=
,"Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Tuple1 Scalar","Multiply scalar double-precision floating-=
point value from xmm2 and xmm3/m64, subtract xmm1 and put result in xmm1."
+"VFMSUB231SS xmm1 {k1}{z}, xmm2, xmm3/m32{er}","EVEX.LIG.66.0F38.W0 BB /r"=
,"Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Tuple1 Scalar","Multiply scalar single-precision floating-=
point value from xmm2 and xmm3/m32, subtract xmm1 and put result in xmm1."
+"VFMSUBADD132PD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F38.W=
1 97 /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","E=
VEX.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-prec=
ision floating-point values from xmm1 and xmm3/m128/m64bcst,subtract/add el=
ements in xmm2 and put result in xmm1 subject to writemask k1."
+"VFMSUBADD132PD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W=
1 97 /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","E=
VEX.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-prec=
ision floating-point values from ymm1 and ymm3/m256/m64bcst,subtract/add el=
ements in ymm2 and put result in ymm1 subject to writemask k1."
+"VFMSUBADD132PD zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst{er}","EVEX.512.66.0F=
38.W1 97 /r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.v=
vvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-precision=
 floating-point values from zmm1 and zmm3/m512/m64bcst,subtract/add element=
s in zmm2 and put result in zmm1 subject to writemask k1."
+"VFMSUBADD132PS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F38.W=
0 97 /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","E=
VEX.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-prec=
ision floating-point values from xmm1 and xmm3/m128/m32bcst, subtract/add e=
lements in xmm2 and put result in xmm1 subject to writemask k1."
+"VFMSUBADD132PS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F38.W=
0 97 /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","E=
VEX.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-prec=
ision floating-point values from ymm1 and ymm3/m256/m32bcst, subtract/add e=
lements in ymm2 and put result in ymm1 subject to writemask k1."
+"VFMSUBADD132PS zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst{er}","EVEX.512.66.0F=
38.W0 97 /r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.v=
vvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-precision=
 floating-point values from zmm1 and zmm3/m512/m32bcst, subtract/add elemen=
ts in zmm2 and put result in zmm1 subject to writemask k1."
+"VFMSUBADD213PD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F38.W=
1 A7 /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","E=
VEX.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-prec=
ision floating-point values from xmm1 and xmm2,subtract/add elements in xmm=
3/m128/m64bcst and put result in xmm1 subject to writemask k1."
+"VFMSUBADD213PD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W=
1 A7 /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","E=
VEX.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-prec=
ision floating-point values from ymm1 and ymm2,subtract/add elements in ymm=
3/m256/m64bcst and put result in ymm1 subject to writemask k1."
+"VFMSUBADD213PD zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst{er}","EVEX.512.66.0F=
38.W1 A7 /r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.v=
vvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-precision=
 floating-point values from zmm1 and zmm2,subtract/add elements in zmm3/m51=
2/m64bcst and put result in zmm1 subject to writemask k1."
+"VFMSUBADD213PS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F38.W=
0 A7 /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","E=
VEX.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-prec=
ision floating-point values from xmm1 and xmm2, subtract/add elements in xm=
m3/m128/m32bcst and put result in xmm1 subject to writemask k1."
+"VFMSUBADD213PS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F38.W=
0 A7 /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","E=
VEX.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-prec=
ision floating-point values from ymm1 and ymm2, subtract/add elements in ym=
m3/m256/m32bcst and put result in ymm1 subject to writemask k1."
+"VFMSUBADD213PS zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst{er}","EVEX.512.66.0F=
38.W0 A7 /r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.v=
vvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-precision=
 floating-point values from zmm1 and zmm2, subtract/add elements in zmm3/m5=
12/m32bcst and put result in zmm1 subject to writemask k1."
+"VFMSUBADD231PD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F38.W=
1 B7 /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","E=
VEX.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-prec=
ision floating-point values from xmm2 and xmm3/m128/m64bcst,subtract/add el=
ements in xmm1 and put result in xmm1 subject to writemask k1."
+"VFMSUBADD231PD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W=
1 B7 /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","E=
VEX.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-prec=
ision floating-point values from ymm2 and ymm3/m256/m64bcst,subtract/add el=
ements in ymm1 and put result in ymm1 subject to writemask k1."
+"VFMSUBADD231PD zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst{er}","EVEX.512.66.0F=
38.W1 B7 /r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.v=
vvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-precision=
 floating-point values from zmm2 and zmm3/m512/m64bcst,subtract/add element=
s in zmm1 and put result in zmm1 subject to writemask k1."
+"VFMSUBADD231PS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F38.W=
0 B7 /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","E=
VEX.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-prec=
ision floating-point values from xmm2 and xmm3/m128/m32bcst, subtract/add e=
lements in xmm1 and put result in xmm1 subject to writemask k1."
+"VFMSUBADD231PS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F38.W=
0 B7 /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","E=
VEX.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-prec=
ision floating-point values from ymm2 and ymm3/m256/m32bcst, subtract/add e=
lements in ymm1 and put result in ymm1 subject to writemask k1."
+"VFMSUBADD231PS zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst{er}","EVEX.512.66.0F=
38.W0 B7 /r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.v=
vvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-precision=
 floating-point values from zmm2 and zmm3/m512/m32bcst, subtract/add elemen=
ts in zmm1 and put result in zmm1 subject to writemask k1."
+"VFNMADD132PD xmm0 {k1}{z}, xmm1, xmm2/m128/m64bcst","EVEX.128.66.0F38.W1 =
9C /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVE=
X.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-precis=
ion floating-point values from xmm1 and xmm3/m128/m64bcst, negate the multi=
plication result and add to xmm2 and put result in xmm1."
+"VFNMADD132PD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W1 =
9C /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVE=
X.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-precis=
ion floating-point values from ymm1 and ymm3/m256/m64bcst, negate the multi=
plication result and add to ymm2 and put result in ymm1."
+"VFNMADD132PD zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst{er}","EVEX.512.66.0F38=
.W1 9C /r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvv=
v (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-precision f=
loating-point values from zmm1 and zmm3/m512/m64bcst, negate the multiplica=
tion result and add to zmm2 and put result in zmm1."
+"VFNMADD132PS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F38.W0 =
9C /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVE=
X.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-precis=
ion floating-point values from xmm1 and xmm3/m128/m32bcst, negate the multi=
plication result and add to xmm2 and put result in xmm1."
+"VFNMADD132PS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F38.W0 =
9C /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVE=
X.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-precis=
ion floating-point values from ymm1 and ymm3/m256/m32bcst, negate the multi=
plication result and add to ymm2 and put result in ymm1."
+"VFNMADD132PS zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst{er}","EVEX.512.66.0F38=
.W0 9C /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)",=
"EVEX.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-pr=
ecision floating-point values from zmm1 and zmm3/m512/m32bcst, negate the m=
ultiplication result and add to zmm2 and put result in zmm1."
+"VFNMADD132SD xmm1 {k1}{z}, xmm2, xmm3/m64{er}","EVEX.LIG.66.0F38.W1 9D /r=
","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","","Tuple1 Scalar","Multiply scalar double-precision floating=
-point value from xmm1 and xmm3/m64, negate the multiplication result and a=
dd to xmm2 and put result in xmm1."
+"VFNMADD132SS xmm1 {k1}{z}, xmm2, xmm3/m32{er}","EVEX.LIG.66.0F38.W0 9D /r=
","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","","Tuple1 Scalar","Multiply scalar single-precision floating=
-point value from xmm1 and xmm3/m32, negate the multiplication result and a=
dd to xmm2 and put result in xmm1."
+"VFNMADD213PD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F38.W1 =
AC /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVE=
X.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-precis=
ion floating-point values from xmm1 and xmm2, negate the multiplication res=
ult and add to xmm3/m128/m64bcst and put result in xmm1."
+"VFNMADD213PD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W1 =
AC /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVE=
X.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-precis=
ion floating-point values from ymm1 and ymm2, negate the multiplication res=
ult and add to ymm3/m256/m64bcst and put result in ymm1."
+"VFNMADD213PD zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst{er}","EVEX.512.66.0F38=
.W1 AC /r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvv=
v (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-precision f=
loating-point values from zmm1 and zmm2, negate the multiplication result a=
nd add to zmm3/m512/m64bcst and put result in zmm1."
+"VFNMADD213PS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F38.W0 =
AC /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVE=
X.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-precis=
ion floating-point values from xmm1 and xmm2, negate the multiplication res=
ult and add to xmm3/m128/m32bcst and put result in xmm1."
+"VFNMADD213PS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F38.W0 =
AC /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVE=
X.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-precis=
ion floating-point values from ymm1 and ymm2, negate the multiplication res=
ult and add to ymm3/m256/m32bcst and put result in ymm1."
+"VFNMADD213PS zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst{er}","EVEX.512.66.0F38=
.W0 AC /r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvv=
v (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-precision f=
loating-point values from zmm1 and zmm2, negate the multiplication result a=
nd add to zmm3/m512/m32bcst and put result in zmm1."
+"VFNMADD213SD xmm1 {k1}{z}, xmm2, xmm3/m64{er}","EVEX.LIG.66.0F38.W1 AD /r=
","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","","Tuple1 Scalar","Multiply scalar double-precision floating=
-point value from xmm1 and xmm2, negate the multiplication result and add t=
o xmm3/m64 and put result in xmm1."
+"VFNMADD213SS xmm1 {k1}{z}, xmm2, xmm3/m32{er}","EVEX.LIG.66.0F38.W0 AD /r=
","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","","Tuple1 Scalar","Multiply scalar single-precision floating=
-point value from xmm1 and xmm2, negate the multiplication result and add t=
o xmm3/m32 and put result in xmm1."
+"VFNMADD231PD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F38.W1 =
BC /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVE=
X.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-precis=
ion floating-point values from xmm2 and xmm3/m128/m64bcst, negate the multi=
plication result and add to xmm1 and put result in xmm1."
+"VFNMADD231PD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W1 =
BC /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVE=
X.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-precis=
ion floating-point values from ymm2 and ymm3/m256/m64bcst, negate the multi=
plication result and add to ymm1 and put result in ymm1."
+"VFNMADD231PD zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst{er}","EVEX.512.66.0F38=
.W1 BC /r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvv=
v (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-precision f=
loating-point values from zmm2 and zmm3/m512/m64bcst, negate the multiplica=
tion result and add to zmm1 and put result in zmm1."
+"VFNMADD231PS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F38.W0 =
BC /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVE=
X.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-precis=
ion floating-point values from xmm2 and xmm3/m128/m32bcst, negate the multi=
plication result and add to xmm1 and put result in xmm1."
+"VFNMADD231PS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F38.W0 =
BC /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVE=
X.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-precis=
ion floating-point values from ymm2 and ymm3/m256/m32bcst, negate the multi=
plication result and add to ymm1 and put result in ymm1."
+"VFNMADD231PS zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst{er}","EVEX.512.66.0F38=
.W0 BC /r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvv=
v (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-precision f=
loating-point values from zmm2 and zmm3/m512/m32bcst, negate the multiplica=
tion result and add to zmm1 and put result in zmm1."
+"VFNMADD231SD xmm1 {k1}{z}, xmm2, xmm3/m64{er}","EVEX.LIG.66.0F38.W1 BD /r=
","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","","Tuple1 Scalar","Multiply scalar double-precision floating=
-point value from xmm2 and xmm3/m64, negate the multiplication result and a=
dd to xmm1 and put result in xmm1."
+"VFNMADD231SS xmm1 {k1}{z}, xmm2, xmm3/m32{er}","EVEX.LIG.66.0F38.W0 BD /r=
","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","","Tuple1 Scalar","Multiply scalar single-precision floating=
-point value from xmm2 and xmm3/m32, negate the multiplication result and a=
dd to xmm1 and put result in xmm1."
+"VFNMSUB132PD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F38.W1 =
9E /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVE=
X.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-precis=
ion floating-point values from xmm1 and xmm3/m128/m64bcst, negate the multi=
plication result and subtract xmm2 and put result in xmm1."
+"VFNMSUB132PD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W1 =
9E /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVE=
X.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-precis=
ion floating-point values from ymm1 and ymm3/m256/m64bcst, negate the multi=
plication result and subtract ymm2 and put result in ymm1."
+"VFNMSUB132PD zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst{er}","EVEX.512.66.0F38=
.W1 9E /r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvv=
v (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-precision f=
loating-point values from zmm1 and zmm3/m512/m64bcst, negate the multiplica=
tion result and subtract zmm2 and put result in zmm1."
+"VFNMSUB132PS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F38.W0 =
9E /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVE=
X.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-precis=
ion floating-point values from xmm1 and xmm3/m128/m32bcst, negate the multi=
plication result and subtract xmm2 and put result in xmm1."
+"VFNMSUB132PS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F38.W0 =
9E /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVE=
X.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-precis=
ion floating-point values from ymm1 and ymm3/m256/m32bcst, negate the multi=
plication result and subtract ymm2 and put result in ymm1."
+"VFNMSUB132PS zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst{er}","EVEX.512.66.0F38=
.W0 9E /r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvv=
v (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-precision f=
loating-point values from zmm1 and zmm3/m512/m32bcst, negate the multiplica=
tion result and subtract zmm2 and put result in zmm1."
+"VFNMSUB132SD xmm1 {k1}{z}, xmm2, xmm3/m64{er}","EVEX.LIG.66.0F38.W1 9F /r=
","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","","Tuple1 Scalar","Multiply scalar double-precision floating=
-point value from xmm1 and xmm3/m64, negate the multiplication result and s=
ubtract xmm2 and put result in xmm1."
+"VFNMSUB132SS xmm1 {k1}{z}, xmm2, xmm3/m32{er}","EVEX.LIG.66.0F38.W0 9F /r=
","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","","Tuple1 Scalar","Multiply scalar single-precision floating=
-point value from xmm1 and xmm3/m32, negate the multiplication result and s=
ubtract xmm2 and put result in xmm1."
+"VFNMSUB213PD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F38.W1 =
AE /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVE=
X.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-precis=
ion floating-point values from xmm1 and xmm2, negate the multiplication res=
ult and subtract xmm3/m128/m64bcst and put result in xmm1."
+"VFNMSUB213PD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W1 =
AE /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVE=
X.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-precis=
ion floating-point values from ymm1 and ymm2, negate the multiplication res=
ult and subtract ymm3/m256/m64bcst and put result in ymm1."
+"VFNMSUB213PD zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst{er}","EVEX.512.66.0F38=
.W1 AE /r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvv=
v (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-precision f=
loating-point values from zmm1 and zmm2, negate the multiplication result a=
nd subtract zmm3/m512/m64bcst and put result in zmm1."
+"VFNMSUB213PS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F38.W0 =
AE /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVE=
X.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-precis=
ion floating-point values from xmm1 and xmm2, negate the multiplication res=
ult and subtract xmm3/m128/m32bcst and put result in xmm1."
+"VFNMSUB213PS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F38.W0 =
AE /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVE=
X.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-precis=
ion floating-point values from ymm1 and ymm2, negate the multiplication res=
ult and subtract ymm3/m256/m32bcst and put result in ymm1."
+"VFNMSUB213PS zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst{er}","EVEX.512.66.0F38=
.W0 AE /r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvv=
v (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-precision f=
loating-point values from zmm1 and zmm2, negate the multiplication result a=
nd subtract zmm3/m512/m32bcst and put result in zmm1."
+"VFNMSUB213SD xmm1 {k1}{z}, xmm2, xmm3/m64{er}","EVEX.LIG.66.0F38.W1 AF /r=
","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","","Tuple1 Scalar","Multiply scalar double-precision floating=
-point value from xmm1 and xmm2, negate the multiplication result and subtr=
act xmm3/m64 and put result in xmm1."
+"VFNMSUB213SS xmm1 {k1}{z}, xmm2, xmm3/m32{er}","EVEX.LIG.66.0F38.W0 AF /r=
","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","","Tuple1 Scalar","Multiply scalar single-precision floating=
-point value from xmm1 and xmm2, negate the multiplication result and subtr=
act xmm3/m32 and put result in xmm1."
+"VFNMSUB231PD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F38.W1 =
BE /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVE=
X.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-precis=
ion floating-point values from xmm2 and xmm3/m128/m64bcst, negate the multi=
plication result and subtract xmm1 and put result in xmm1."
+"VFNMSUB231PD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W1 =
BE /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVE=
X.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-precis=
ion floating-point values from ymm2 and ymm3/m256/m64bcst, negate the multi=
plication result and subtract ymm1 and put result in ymm1."
+"VFNMSUB231PD zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst{er}","EVEX.512.66.0F38=
.W1 BE /r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvv=
v (r)","ModRM:r/m (r)","","Full Vector","Multiply packed double-precision f=
loating-point values from zmm2 and zmm3/m512/m64bcst, negate the multiplica=
tion result and subtract zmm1 and put result in zmm1."
+"VFNMSUB231PS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F38.W0 =
BE /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVE=
X.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-precis=
ion floating-point values from xmm2 and xmm3/m128/m32bcst, negate the multi=
plication result subtract add to xmm1 and put result in xmm1."
+"VFNMSUB231PS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F38.W0 =
BE /r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVE=
X.vvvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-precis=
ion floating-point values from ymm2 and ymm3/m256/m32bcst, negate the multi=
plication result subtract add to ymm1 and put result in ymm1."
+"VFNMSUB231PS zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst{er}","EVEX.512.66.0F38=
.W0 BE /r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvv=
v (r)","ModRM:r/m (r)","","Full Vector","Multiply packed single-precision f=
loating-point values from zmm2 and zmm3/m512/m32bcst, negate the multiplica=
tion result subtract add to zmm1 and put result in zmm1."
+"VFNMSUB231SD xmm1 {k1}{z}, xmm2, xmm3/m64{er}","EVEX.LIG.66.0F38.W1 BF /r=
","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","","Tuple1 Scalar","Multiply scalar double-precision floating=
-point value from xmm2 and xmm3/m64, negate the multiplication result and s=
ubtract xmm1 and put result in xmm1."
+"VFNMSUB231SS xmm1 {k1}{z}, xmm2, xmm3/m32{er}","EVEX.LIG.66.0F38.W0 BF /r=
","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","","Tuple1 Scalar","Multiply scalar single-precision floating=
-point value from xmm2 and xmm3/m32, negate the multiplication result and s=
ubtract xmm1 and put result in xmm1."
+"VGATHERDPD xmm1 {k1}, vm32x/f64x2","EVEX.128.66.0F38.W1 92 /r","Valid","V=
alid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","BaseReg (r): VSIB:base,=
 VectorReg (r): VSIB:index","","","Tuple1 Scalar","Using signed dword indic=
es, gather float64 vector into float64 vector xmm1 using k1 as completion m=
ask."
+"VGATHERDPD ymm1 {k1}, vm32x/f64x4","EVEX.256.66.0F38.W1 92 /r","Valid","V=
alid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","BaseReg (r): VSIB:base,=
 VectorReg (r): VSIB:index","","","Tuple1 Scalar","Using signed dword indic=
es, gather float64 vector into float64 vector ymm1 using k1 as completion m=
ask."
+"VGATHERDPD zmm1 {k1}, vm32y/f64x8","EVEX.512.66.0F38.W1 92 /r","Valid","V=
alid","Invalid","AVX512F","ModRM:reg (w)","BaseReg (r): VSIB:base, VectorRe=
g (r): VSIB:index","","","Tuple1 Scalar","Using signed dword indices, gathe=
r float64 vector into float64 vector zmm1 using k1 as completion mask."
+"VGATHERDPS xmm1 {k1}, vm32x/f32x4","EVEX.128.66.0F38.W0 92 /r","Valid","V=
alid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","BaseReg (r): VSIB:base,=
 VectorReg (r): VSIB:index","","","Tuple1 Scalar","Using signed dword indic=
es, gather single-precision floating-point values from memory using k1 as c=
ompletion mask."
+"VGATHERDPS ymm1 {k1}, vm32y/f32x8","EVEX.256.66.0F38.W0 92 /r","Valid","V=
alid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","BaseReg (r): VSIB:base,=
 VectorReg (r): VSIB:index","","","Tuple1 Scalar","Using signed dword indic=
es, gather single-precision floating-point values from memory using k1 as c=
ompletion mask."
+"VGATHERDPS zmm1 {k1}, vm32z/f32x16","EVEX.512.66.0F38.W0 92 /r","Valid","=
Valid","Invalid","AVX512F","ModRM:reg (w)","BaseReg (r): VSIB:base, VectorR=
eg (r): VSIB:index","","","Tuple1 Scalar","Using signed dword indices, gath=
er single-precision floating-point values from memory using k1 as completio=
n mask."
+"VGATHERQPD xmm1 {k1}, vm64x/f64x2","EVEX.128.66.0F38.W1 93 /r","Valid","V=
alid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","BaseReg (r): VSIB:base,=
 VectorReg (r): VSIB:index","","","Tuple1 Scalar","Using signed qword indic=
es, gather float64 vector into float64 vector xmm1 using k1 as completion m=
ask."
+"VGATHERQPD ymm1 {k1}, vm64y/f64x4","EVEX.256.66.0F38.W1 93 /r","Valid","V=
alid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","BaseReg (r): VSIB:base,=
 VectorReg (r): VSIB:index","","","Tuple1 Scalar","Using signed qword indic=
es, gather float64 vector into float64 vector ymm1 using k1 as completion m=
ask."
+"VGATHERQPD zmm1 {k1}, vm64z/f64x8","EVEX.512.66.0F38.W1 93 /r","Valid","V=
alid","Invalid","AVX512F","ModRM:reg (w)","BaseReg (r): VSIB:base, VectorRe=
g (r): VSIB:index","","","Tuple1 Scalar","Using signed qword indices, gathe=
r float64 vector into float64 vector zmm1 using k1 as completion mask."
+"VGATHERQPS xmm1 {k1}, vm64x/f32x2","EVEX.128.66.0F38.W0 93 /r","Valid","V=
alid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","BaseReg (r): VSIB:base,=
 VectorReg (r): VSIB:index","","","Tuple1 Scalar","Using signed qword indic=
es, gather single-precision floating-point values from memory using k1 as c=
ompletion mask."
+"VGATHERQPS xmm1 {k1}, vm64y/f32x4","EVEX.256.66.0F38.W0 93 /r","Valid","V=
alid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","BaseReg (r): VSIB:base,=
 VectorReg (r): VSIB:index","","","Tuple1 Scalar","Using signed qword indic=
es, gather single-precision floating-point values from memory using k1 as c=
ompletion mask."
+"VGATHERQPS ymm1 {k1}, vm64z/f32x8","EVEX.512.66.0F38.W0 93 /r","Valid","V=
alid","Invalid","AVX512F","ModRM:reg (w)","BaseReg (r): VSIB:base, VectorRe=
g (r): VSIB:index","","","Tuple1 Scalar","Using signed qword indices, gathe=
r single-precision floating-point values from memory using k1 as completion=
 mask."
+"VGETEXPPD xmm1 {k1}{z}, xmm2/m128/m64bcst","EVEX.128.66.0F38.W1 42 /r","V=
alid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)",=
"","","Full Vector","Convert the exponent of packed double-precision floati=
ng-point values in the source operand to DP FP results representing unbiase=
d integer exponents and stores the results in the destination register."
+"VGETEXPPD ymm1 {k1}{z}, ymm2/m256/m64bcst","EVEX.256.66.0F38.W1 42 /r","V=
alid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)",=
"","","Full Vector","Convert the exponent of packed double-precision floati=
ng-point values in the source operand to DP FP results representing unbiase=
d integer exponents and stores the results in the destination register."
+"VGETEXPPD zmm1 {k1}{z}, zmm2/m512/m64bcst{sae}","EVEX.512.66.0F38.W1 42 /=
r","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","=
","Full Vector","Convert the exponent of packed double-precision floating-p=
oint values in the source operand to DP FP results representing unbiased in=
teger exponents and stores the results in the destination under writemask k=
1."
+"VGETEXPPS xmm1 {k1}{z}, xmm2/m128/m32bcst","EVEX.128.66.0F38.W0 42 /r","V=
alid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)",=
"","","Full Vector","Convert the exponent of packed single-precision floati=
ng-point values in the source operand to SP FP results representing unbiase=
d integer exponents and stores the results in the destination register."
+"VGETEXPPS ymm1 {k1}{z}, ymm2/m256/m32bcst","EVEX.256.66.0F38.W0 42 /r","V=
alid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)",=
"","","Full Vector","Convert the exponent of packed single-precision floati=
ng-point values in the source operand to SP FP results representing unbiase=
d integer exponents and stores the results in the destination register."
+"VGETEXPPS zmm1 {k1}{z}, zmm2/m512/m32bcst{sae}","EVEX.512.66.0F38.W0 42 /=
r","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","=
","Full Vector","Convert the exponent of packed single-precision floating-p=
oint values in the source operand to SP FP results representing unbiased in=
teger exponents and stores the results in the destination register."
+"VGETEXPSD xmm1 {k1}{z}, xmm2, xmm3/m64{sae}","EVEX.LIG.66.0F38.W1 43 /r",=
"Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:=
r/m (r)","","Tuple1 Scalar","Convert the biased exponent (bits 62:52) of th=
e low double-precision floating-point value in xmm3/m64 to a DP FP value re=
presenting unbiased integer exponent. Stores the result to the low 64-bit o=
f xmm1 under the writemask k1 and merge with the other elements of xmm2."
+"VGETEXPSS xmm1 {k1}{z}, xmm2, xmm3/m32{sae}","EVEX.LIG.66.0F38.W0 43 /r",=
"Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:=
r/m (r)","","Tuple1 Scalar","Convert the biased exponent (bits 30:23) of th=
e low single-precision floating-point value in xmm3/m32 to a SP FP value re=
presenting unbiased integer exponent. Stores the result to xmm1 under the w=
ritemask k1 and merge with the other elements of xmm2."
+"VGETMANTPD xmm1 {k1}{z}, xmm2/m128/m64bcst, ib","EVEX.128.66.0F3A.W1 26 /=
r ib","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r=
/m (r)","ib","","Full Vector","Get Normalized Mantissa from float64 vector =
xmm2/m128/m64bcst and store the result in xmm1, using ib for sign control a=
nd mantissa interval normalization, under writemask."
+"VGETMANTPD ymm1 {k1}{z}, ymm2/m256/m64bcst, ib","EVEX.256.66.0F3A.W1 26 /=
r ib","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r=
/m (r)","ib","","Full Vector","Get Normalized Mantissa from float64 vector =
ymm2/m256/m64bcst and store the result in ymm1, using ib for sign control a=
nd mantissa interval normalization, under writemask."
+"VGETMANTPD zmm1 {k1}{z}, zmm2/m512/m64bcst{sae}, ib","EVEX.512.66.0F3A.W1=
 26 /r ib","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (=
r)","ib","","Full Vector","Get Normalized Mantissa from float64 vector zmm2=
/m512/m64bcst and store the result in zmm1, using ib for sign control and m=
antissa interval normalization, under writemask."
+"VGETMANTPS xmm1 {k1}{z}, xmm2/m128/m32bcst, ib","EVEX.128.66.0F3A.W0 26 /=
r ib","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r=
/m (r)","ib","","Full Vector","Get normalized mantissa from float32 vector =
xmm2/m128/m32bcst and store the result in xmm1, using ib for sign control a=
nd mantissa interval normalization, under writemask."
+"VGETMANTPS ymm1 {k1}{z}, ymm2/m256/m32bcst, ib","EVEX.256.66.0F3A.W0 26 /=
r ib","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r=
/m (r)","ib","","Full Vector","Get normalized mantissa from float32 vector =
ymm2/m256/m32bcst and store the result in ymm1, using ib for sign control a=
nd mantissa interval normalization, under writemask."
+"VGETMANTPS zmm1 {k1}{z}, zmm2/m512/m32bcst{sae}, ib","EVEX.512.66.0F3A.W0=
 26 /r ib","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (=
r)","ib","","Full Vector","Get normalized mantissa from float32 vector zmm2=
/m512/m32bcst and store the result in zmm1, using ib for sign control and m=
antissa interval normalization, under writemask."
+"VGETMANTSD xmm1 {k1}{z}, xmm2, xmm3/m64{sae}, ib","EVEX.LIG.66.0F3A.W1 27=
 /r ib","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","ib","Tuple1 Scalar","Extract the normalized mantissa of t=
he low float64 element in xmm3/m64 using ib for sign control and mantissa i=
nterval normalization. Store the mantissa to xmm1 under the writemask k1 an=
d merge with the other elements of xmm2."
+"VGETMANTSS xmm1 {k1}{z}, xmm2, xmm3/m32{sae}, ib","EVEX.LIG.66.0F3A.W0 27=
 /r ib","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","ib","Tuple1 Scalar","Extract the normalized mantissa from=
 the low float32 element of xmm3/m32 using ib for sign control and mantissa=
 interval normalization, store the mantissa to xmm1 under the writemask k1 =
and merge with the other elements of xmm2."
+"VINSERTF32X4 ymm{k}{z},ymm,xmm/m128,ib","EVEX.256.66.0F3A.W0 18 /r ib","V=
alid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)",=
"ModRM:r/m (r)","ib","Tuple4","Insert 128 bits of packed single-precision f=
loating-point values from xmm3/m128 and the remaining values from ymm2 into=
 ymm1 under writemask k1."
+"VINSERTF32X4 zmm{k}{z},zmm,xmm/m128,ib","EVEX.512.66.0F3A.W0 18 /r ib","V=
alid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/=
m (r)","ib","Tuple4","Insert 128 bits of packed single-precision floating-p=
oint values from xmm3/m128 and the remaining values from zmm2 into zmm1 und=
er writemask k1."
+"VINSERTF64X4 zmm{k}{z},zmm,ymm/m256,ib","EVEX.512.66.0F3A.W1 1a /r ib","V=
alid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/=
m (r)","ib","Tuple4","Insert 256 bits of packed double precision floating-p=
oint values from ymm3/m256 and the remaining values from zmm2 into zmm1 und=
er writemask k1."
+"VINSERTI32X4 ymm{k}{z},ymm,xmm/m128,ib","EVEX.256.66.0F3A.W0 38 /r ib","V=
alid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)",=
"ModRM:r/m (r)","ib","Tuple4","Insert 128 bits of packed doubleword integer=
 values from xmm3/m128 and the remaining values from ymm2 into ymm1 under w=
ritemask k1."
+"VINSERTI32X4 zmm{k}{z},zmm,xmm/m128,ib","EVEX.512.66.0F3A.W0 38 /r ib","V=
alid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/=
m (r)","ib","Tuple4","Insert 128 bits of packed doubleword integer values f=
rom xmm3/m128 and the remaining values from zmm2 into zmm1 under writemask =
k1."
+"VINSERTI64X4 zmm{k}{z},zmm,ymm/m256,ib","EVEX.512.66.0F3A.W1 3a /r ib","V=
alid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/=
m (r)","ib","Tuple4","Insert 256 bits of packed quadword integer values fro=
m ymm3/m256 and the remaining values from zmm2 into zmm1 under writemask k1=
."
+"VINSERTPS xmm1, xmm2, xmm3/m32, ib","EVEX.128.66.0F3A.W0 21 /r ib","Valid=
","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r=
)","ib","Tuple1 Scalar","Insert a single-precision floating-point value sel=
ected by ib from xmm3/m32 and merge with values in xmm2 at the specified de=
stination element specified by ib and write out the result and zero out des=
tination elements in xmm1 as indicated in ib."
+"VMAXPD xmm1{k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F.W1 5F /r","V=
alid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)",=
"ModRM:r/m (r)","","Full Vector","Return the maximum packed double-precisio=
n floating-point values between xmm2 and xmm3/m128/m64bcst and store result=
 in xmm1 subject to writemask k1."
+"VMAXPD ymm1{k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F.W1 5F /r","V=
alid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)",=
"ModRM:r/m (r)","","Full Vector","Return the maximum packed double-precisio=
n floating-point values between ymm2 and ymm3/m256/m64bcst and store result=
 in ymm1 subject to writemask k1."
+"VMAXPD zmm1{k1}{z}, zmm2, zmm3/m512/m64bcst{sae}","EVEX.512.66.0F.W1 5F /=
r","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","Mod=
RM:r/m (r)","","Full Vector","Return the maximum packed double-precision fl=
oating-point values between zmm2 and zmm3/m512/m64bcst and store result in =
zmm1 subject to writemask k1."
+"VMAXPS xmm1{k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.0F.W0 5F /r","Vali=
d","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Full Vector","Return the maximum packed single-precision f=
loating-point values between xmm2 and xmm3/m128/m32bcst and store result in=
 xmm1 subject to writemask k1."
+"VMAXPS ymm1{k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.0F.W0 5F /r","Vali=
d","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Full Vector","Return the maximum packed single-precision f=
loating-point values between ymm2 and ymm3/m256/m32bcst and store result in=
 ymm1 subject to writemask k1."
+"VMAXPS zmm1{k1}{z}, zmm2, zmm3/m512/m32bcst{sae}","EVEX.512.0F.W0 5F /r",=
"Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:=
r/m (r)","","Full Vector","Return the maximum packed single-precision float=
ing-point values between zmm2 and zmm3/m512/m32bcst and store result in zmm=
1 subject to writemask k1."
+"VMAXSD xmm1{k1}{z}, xmm2, xmm3/m64{sae}","EVEX.LIG.F2.0F.W1 5F /r","Valid=
","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r=
)","","Tuple1 Scalar","Return the maximum scalar double-precision floating-=
point value between xmm3/m64 and xmm2."
+"VMAXSS xmm1 {k1}{z}, xmm2, xmm3/m32{sae}","EVEX.LIG.F3.0F.W0 5F /r","Vali=
d","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (=
r)","","Tuple1 Scalar","Return the maximum scalar single-precision floating=
-point value between xmm3/m32 and xmm2."
+"VMINPD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F.W1 5D /r","=
Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Return the minimum packed double-precisi=
on floating-point values between xmm2 and xmm3/m128/m64bcst and store resul=
t in xmm1 subject to writemask k1."
+"VMINPD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F.W1 5D /r","=
Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Return the minimum packed double-precisi=
on floating-point values between ymm2 and ymm3/m256/m64bcst and store resul=
t in ymm1 subject to writemask k1."
+"VMINPD zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst{sae}","EVEX.512.66.0F.W1 5D =
/r","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Full Vector","Return the minimum packed double-precision f=
loating-point values between zmm2 and zmm3/m512/m64bcst and store result in=
 zmm1 subject to writemask k1."
+"VMINPS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.0F.W0 5D /r","Val=
id","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","","Full Vector","Return the minimum packed single-precision =
floating-point values between xmm2 and xmm3/m128/m32bcst and store result i=
n xmm1 subject to writemask k1."
+"VMINPS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.0F.W0 5D /r","Val=
id","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","","Full Vector","Return the minimum packed single-precision =
floating-point values between ymm2 and ymm3/m256/m32bcst and store result i=
n ymm1 subject to writemask k1."
+"VMINPS zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst{sae}","EVEX.512.0F.W0 5D /r"=
,"Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM=
:r/m (r)","","Full Vector","Return the minimum packed single-precision floa=
ting-point values between zmm2 and zmm3/m512/m32bcst and store result in zm=
m1 subject to writemask k1."
+"VMINSD xmm1 {k1}{z}, xmm2, xmm3/m64{sae}","EVEX.LIG.F2.0F.W1 5D /r","Vali=
d","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (=
r)","","Tuple1 Scalar","Return the minimum scalar double-precision floating=
-point value between xmm3/m64 and xmm2."
+"VMINSS xmm1 {k1}{z}, xmm2, xmm3/m32{sae}","EVEX.LIG.F3.0F.W0 5D /r","Vali=
d","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (=
r)","","Tuple1 Scalar","Return the minimum scalar single-precision floating=
-point value between xmm3/m32 and xmm2."
+"VMOVAPD xmm1 {k1}{z}, xmm2/m128","EVEX.128.66.0F.W1 28 /r","Valid","Valid=
","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Full =
Vector Mem","Move aligned packed double-precision floating-point values fro=
m xmm2/m128 to xmm1 using writemask k1."
+"VMOVAPD ymm1 {k1}{z}, ymm2/m256","EVEX.256.66.0F.W1 28 /r","Valid","Valid=
","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Full =
Vector Mem","Move aligned packed double-precision floating-point values fro=
m ymm2/m256 to ymm1 using writemask k1."
+"VMOVAPD zmm1 {k1}{z}, zmm2/m512","EVEX.512.66.0F.W1 28 /r","Valid","Valid=
","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Full Vector Me=
m","Move aligned packed double-precision floating-point values from zmm2/m5=
12 to zmm1 using writemask k1."
+"VMOVAPD xmm2/m128 {k1}{z}, xmm1","EVEX.128.66.0F.W1 29 /r","Valid","Valid=
","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Full =
Vector Mem","Move aligned packed double-precision floating-point values fro=
m xmm1 to xmm2/m128 using writemask k1."
+"VMOVAPD ymm2/m256 {k1}{z}, ymm1","EVEX.256.66.0F.W1 29 /r","Valid","Valid=
","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Full =
Vector Mem","Move aligned packed double-precision floating-point values fro=
m ymm1 to ymm2/m256 using writemask k1."
+"VMOVAPD zmm2/m512 {k1}{z}, zmm1","EVEX.512.66.0F.W1 29 /r","Valid","Valid=
","Invalid","AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Full Vector Me=
m","Move aligned packed double-precision floating-point values from zmm1 to=
 zmm2/m512 using writemask k1."
+"VMOVAPS xmm1 {k1}{z}, xmm2/m128","EVEX.128.0F.W0 28 /r","Valid","Valid","=
Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Full Vec=
tor Mem","Move aligned packed single-precision floating-point values from x=
mm2/m128 to xmm1 using writemask k1."
+"VMOVAPS ymm1 {k1}{z}, ymm2/m256","EVEX.256.0F.W0 28 /r","Valid","Valid","=
Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Full Vec=
tor Mem","Move aligned packed single-precision floating-point values from y=
mm2/m256 to ymm1 using writemask k1."
+"VMOVAPS zmm1 {k1}{z}, zmm2/m512","EVEX.512.0F.W0 28 /r","Valid","Valid","=
Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Full Vector Mem",=
"Move aligned packed single-precision floating-point values from zmm2/m512 =
to zmm1 using writemask k1."
+"VMOVAPS xmm2/m128 {k1}{z}, xmm1","EVEX.128.0F.W0 29 /r","Valid","Valid","=
Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Full Vec=
tor Mem","Move aligned packed single-precision floating-point values from x=
mm1 to xmm2/m128 using writemask k1."
+"VMOVAPS ymm2/m256 {k1}{z}, ymm1","EVEX.256.0F.W0 29 /r","Valid","Valid","=
Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Full Vec=
tor Mem","Move aligned packed single-precision floating-point values from y=
mm1 to ymm2/m256 using writemask k1."
+"VMOVAPS zmm2/m512 {k1}{z}, zmm1","EVEX.512.0F.W0 29 /r","Valid","Valid","=
Invalid","AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Full Vector Mem",=
"Move aligned packed single-precision floating-point values from zmm1 to zm=
m2/m512 using writemask k1."
+"VMOVD xmm1, rw/mw","EVEX.128.66.0F.W0 6E /r","Valid","Valid","Invalid","A=
VX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple1 Scalar","Move doublew=
ord from r/m to xmm1."
+"VMOVD rw/mw, xmm1","EVEX.128.66.0F.W0 7E /r","Valid","Valid","Invalid","A=
VX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Tuple1 Scalar","Move doublew=
ord from xmm1 register to r/m."
+"VMOVDDUP xmm1 {k1}{z}, xmm2/m64","EVEX.128.F2.0F.W1 12 /r","Valid","Valid=
","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","MOVDD=
UP","Move double-precision floating-point value from xmm2/m64 and duplicate=
 each element into xmm1 subject to writemask k1."
+"VMOVDDUP ymm1 {k1}{z}, ymm2/m256","EVEX.256.F2.0F.W1 12 /r","Valid","Vali=
d","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","MOVD=
DUP","Move even index double-precision floating-point values from ymm2/m256=
 and duplicate each element into ymm1 subject to writemask k1."
+"VMOVDDUP zmm1 {k1}{z}, zmm2/m512","EVEX.512.F2.0F.W1 12 /r","Valid","Vali=
d","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","MOVDDUP","Mov=
e even index double-precision floating-point values from zmm2/m512 and dupl=
icate each element into zmm1 subject to writemask k1."
+"VMOVDQA32 xmm1 {k1}{z}, xmm2/m128","EVEX.128.66.0F.W0 6F /r","Valid","Val=
id","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Ful=
l Vector Mem","Move aligned packed doubleword integer values from xmm2/m128=
 to xmm1 using writemask k1."
+"VMOVDQA32 ymm1 {k1}{z}, ymm2/m256","EVEX.256.66.0F.W0 6F /r","Valid","Val=
id","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Ful=
l Vector Mem","Move aligned packed doubleword integer values from ymm2/m256=
 to ymm1 using writemask k1."
+"VMOVDQA32 zmm1 {k1}{z}, zmm2/m512","EVEX.512.66.0F.W0 6F /r","Valid","Val=
id","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Full Vector =
Mem","Move aligned packed doubleword integer values from zmm2/m512 to zmm1 =
using writemask k1."
+"VMOVDQA32 xmm2/m128 {k1}{z}, xmm1","EVEX.128.66.0F.W0 7F /r","Valid","Val=
id","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Ful=
l Vector Mem","Move aligned packed doubleword integer values from xmm1 to x=
mm2/m128 using writemask k1."
+"VMOVDQA32 ymm2/m256 {k1}{z}, ymm1","EVEX.256.66.0F.W0 7F /r","Valid","Val=
id","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Ful=
l Vector Mem","Move aligned packed doubleword integer values from ymm1 to y=
mm2/m256 using writemask k1."
+"VMOVDQA32 zmm2/m512 {k1}{z}, zmm1","EVEX.512.66.0F.W0 7F /r","Valid","Val=
id","Invalid","AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Full Vector =
Mem","Move aligned packed doubleword integer values from zmm1 to zmm2/m512 =
using writemask k1."
+"VMOVDQA64 xmm1 {k1}{z}, xmm2/m128","EVEX.128.66.0F.W1 6F /r","Valid","Val=
id","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Ful=
l Vector Mem","Move aligned quadword integer values from xmm2/m128 to xmm1 =
using writemask k1."
+"VMOVDQA64 ymm1 {k1}{z}, ymm2/m256","EVEX.256.66.0F.W1 6F /r","Valid","Val=
id","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Ful=
l Vector Mem","Move aligned quadword integer values from ymm2/m256 to ymm1 =
using writemask k1."
+"VMOVDQA64 zmm1 {k1}{z}, zmm2/m512","EVEX.512.66.0F.W1 6F /r","Valid","Val=
id","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Full Vector =
Mem","Move aligned packed quadword integer values from zmm2/m512 to zmm1 us=
ing writemask k1."
+"VMOVDQA64 xmm2/m128 {k1}{z}, xmm1","EVEX.128.66.0F.W1 7F /r","Valid","Val=
id","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Ful=
l Vector Mem","Move aligned packed quadword integer values from xmm1 to xmm=
2/m128 using writemask k1."
+"VMOVDQA64 ymm2/m256 {k1}{z}, ymm1","EVEX.256.66.0F.W1 7F /r","Valid","Val=
id","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Ful=
l Vector Mem","Move aligned packed quadword integer values from ymm1 to ymm=
2/m256 using writemask k1."
+"VMOVDQA64 zmm2/m512 {k1}{z}, zmm1","EVEX.512.66.0F.W1 7F /r","Valid","Val=
id","Invalid","AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Full Vector =
Mem","Move aligned packed quadword integer values from zmm1 to zmm2/m512 us=
ing writemask k1."
+"VMOVDQU32 xmm1 {k1}{z}, xmm2/m128","EVEX.128.F3.0F.W0 6F /r","Valid","Val=
id","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Ful=
l Vector Mem","Move unaligned packed doubleword integer values from xmm2/m1=
28 to xmm1 using writemask k1."
+"VMOVDQU32 ymm1 {k1}{z}, ymm2/m256","EVEX.256.F3.0F.W0 6F /r","Valid","Val=
id","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Ful=
l Vector Mem","Move unaligned packed doubleword integer values from ymm2/m2=
56 to ymm1 using writemask k1."
+"VMOVDQU32 zmm1 {k1}{z}, zmm2/m512","EVEX.512.F3.0F.W0 6F /r","Valid","Val=
id","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Full Vector =
Mem","Move unaligned packed doubleword integer values from zmm2/m512 to zmm=
1 using writemask k1."
+"VMOVDQU32 xmm2/m128 {k1}{z}, xmm1","EVEX.128.F3.0F.W0 7F /r","Valid","Val=
id","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Ful=
l Vector Mem","Move unaligned packed doubleword integer values from xmm1 to=
 xmm2/m128 using writemask k1."
+"VMOVDQU32 ymm2/m256 {k1}{z}, ymm1","EVEX.256.F3.0F.W0 7F /r","Valid","Val=
id","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Ful=
l Vector Mem","Move unaligned packed doubleword integer values from ymm1 to=
 ymm2/m256 using writemask k1."
+"VMOVDQU32 zmm2/m512 {k1}{z}, zmm1","EVEX.512.F3.0F.W0 7F /r","Valid","Val=
id","Invalid","AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Full Vector =
Mem","Move unaligned packed doubleword integer values from zmm1 to zmm2/m51=
2 using writemask k1."
+"VMOVDQU64 xmm1 {k1}{z}, xmm2/m128","EVEX.128.F3.0F.W1 6F /r","Valid","Val=
id","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Ful=
l Vector Mem","Move unaligned packed quadword integer values from xmm2/m128=
 to xmm1 using writemask k1."
+"VMOVDQU64 ymm1 {k1}{z}, ymm2/m256","EVEX.256.F3.0F.W1 6F /r","Valid","Val=
id","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Ful=
l Vector Mem","Move unaligned packed quadword integer values from ymm2/m256=
 to ymm1 using writemask k1."
+"VMOVDQU64 zmm1 {k1}{z}, zmm2/m512","EVEX.512.F3.0F.W1 6F /r","Valid","Val=
id","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Full Vector =
Mem","Move unaligned packed quadword integer values from zmm2/m512 to zmm1 =
using writemask k1."
+"VMOVDQU64 xmm2/m128 {k1}{z}, xmm1","EVEX.128.F3.0F.W1 7F /r","Valid","Val=
id","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Ful=
l Vector Mem","Move unaligned packed quadword integer values from xmm1 to x=
mm2/m128 using writemask k1."
+"VMOVDQU64 ymm2/m256 {k1}{z}, ymm1","EVEX.256.F3.0F.W1 7F /r","Valid","Val=
id","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Ful=
l Vector Mem","Move unaligned packed quadword integer values from ymm1 to y=
mm2/m256 using writemask k1."
+"VMOVDQU64 zmm2/m512 {k1}{z}, zmm1","EVEX.512.F3.0F.W1 7F /r","Valid","Val=
id","Invalid","AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Full Vector =
Mem","Move unaligned packed quadword integer values from zmm1 to zmm2/m512 =
using writemask k1."
+"VMOVHPD xmm2, xmm1, m64","EVEX.128.66.0F.W1 16 /r","Valid","Valid","Inval=
id","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)","","Tuple1 Sc=
alar","Merge double-precision floating-point value from m64 and the low qua=
dword of xmm1."
+"VMOVHPD m64, xmm1","EVEX.128.66.0F.W1 17 /r","Valid","Valid","Invalid","A=
VX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Tuple1 Scalar","Move double-=
precision floating-point value from high quadword of xmm1 to m64."
+"VMOVHPS xmm2, xmm1, m64","EVEX.128.0F.W0 16 /r","Valid","Valid","Invalid"=
,"AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)","","Tuple2","Mer=
ge two packed single-precision floating-point values from m64 and the low q=
uadword of xmm1."
+"VMOVHPS m64, xmm1","EVEX.128.0F.W0 17 /r","Valid","Valid","Invalid","AVX5=
12F","ModRM:r/m (w)","ModRM:reg (r)","","","Tuple2","Move two packed single=
-precision floating-point values from high quadword of xmm1 to m64."
+"VMOVLPD xmm2, xmm1, m64","EVEX.128.66.0F.W1 12 /r","Valid","Valid","Inval=
id","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)","","Tuple1 Sc=
alar","Merge double-precision floating-point value from m64 and the high qu=
adword of xmm1."
+"VMOVLPD m64, xmm1","EVEX.128.66.0F.W1 13 /r","Valid","Valid","Invalid","A=
VX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Tuple1 Scalar","Move double =
-precision floating-point value from low quadword of xmm1 to m64."
+"VMOVLPS xmm2, xmm1, m64","EVEX.128.0F.W0 12 /r","Valid","Valid","Invalid"=
,"AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)","","Tuple2","Mer=
ge two packed single-precision floating-point values from m64 and the high =
quadword of xmm1."
+"VMOVLPS m64, xmm1","EVEX.128.0F.W0 13 /r","Valid","Valid","Invalid","AVX5=
12F","ModRM:r/m (w)","ModRM:reg (r)","","","Tuple2","Move two packed single=
-precision floating-point values from low quadword of xmm1 to m64."
+"VMOVNTDQ m128, xmm1","EVEX.128.66.0F.W0 E7 /r","Valid","Valid","Invalid",=
"AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Full Vector Mem",=
"Move packed integer values in xmm1 to m128 using non-temporal hint."
+"VMOVNTDQ m256, ymm1","EVEX.256.66.0F.W0 E7 /r","Valid","Valid","Invalid",=
"AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Full Vector Mem",=
"Move packed integer values in zmm1 to m256 using non-temporal hint."
+"VMOVNTDQ m512, zmm1","EVEX.512.66.0F.W0 E7 /r","Valid","Valid","Invalid",=
"AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Full Vector Mem","Move pac=
ked integer values in zmm1 to m512 using non-temporal hint."
+"VMOVNTDQA xmm1, m128","EVEX.128.66.0F38.W0 2A /r","Valid","Valid","Invali=
d","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Full Vector Me=
m","Move 128-bit data from m128 to xmm using non-temporal hint if WC memory=
 type."
+"VMOVNTDQA ymm1, m256","EVEX.256.66.0F38.W0 2A /r","Valid","Valid","Invali=
d","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Full Vector Me=
m","Move 256-bit data from m256 to ymm using non-temporal hint if WC memory=
 type."
+"VMOVNTDQA zmm1, m512","EVEX.512.66.0F38.W0 2A /r","Valid","Valid","Invali=
d","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Full Vector Mem","Move =
512-bit data from m512 to zmm using non-temporal hint if WC memory type."
+"VMOVNTPD m128, xmm1","EVEX.128.66.0F.W1 2B /r","Valid","Valid","Invalid",=
"AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Full Vector Mem",=
"Move packed double-precision values in xmm1 to m128 using non-temporal hin=
t."
+"VMOVNTPD m256, ymm1","EVEX.256.66.0F.W1 2B /r","Valid","Valid","Invalid",=
"AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Full Vector Mem",=
"Move packed double-precision values in ymm1 to m256 using non-temporal hin=
t."
+"VMOVNTPD m512, zmm1","EVEX.512.66.0F.W1 2B /r","Valid","Valid","Invalid",=
"AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Full Vector Mem","Move pac=
ked double-precision values in zmm1 to m512 using non-temporal hint."
+"VMOVNTPS m128, xmm1","EVEX.128.0F.W0 2B /r","Valid","Valid","Invalid","AV=
X512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Full Vector Mem","Mo=
ve packed single-precision values in xmm1 to m128 using non-temporal hint."
+"VMOVNTPS m256, ymm1","EVEX.256.0F.W0 2B /r","Valid","Valid","Invalid","AV=
X512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Full Vector Mem","Mo=
ve packed single-precision values in ymm1 to m256 using non-temporal hint."
+"VMOVNTPS m512, zmm1","EVEX.512.0F.W0 2B /r","Valid","Valid","Invalid","AV=
X512F","ModRM:r/m (w)","ModRM:reg (r)","","","Full Vector Mem","Move packed=
 single-precision values in zmm1 to m512 using non-temporal hint."
+"VMOVQ xmm1, rw/mw","EVEX.128.66.0F.W1 6E /r","Valid","Invalid","Invalid",=
"AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple1 Scalar","Move quadw=
ord from r/m to xmm1."
+"VMOVQ rw/mw, xmm1","EVEX.128.66.0F.W1 7E /r","Valid","Invalid","Invalid",=
"AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Tuple1 Scalar","Move quadw=
ord from xmm1 register to r/m."
+"VMOVQ xmm1, xmm2/m64","EVEX.128.F3.0F.W1 7E /r","Valid","Valid","Invalid"=
,"AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple1 Scalar","Move quad=
word from xmm2/m64 to xmm1."
+"VMOVQ xmm1/m64, xmm2","EVEX.128.66.0F.W1 D6 /r","Valid","Valid","Invalid"=
,"AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Tuple1 Scalar","Move quad=
word from xmm2 register to xmm1/m64."
+"VMOVSD xmm1 {k1}{z}, m64","EVEX.LIG.F2.0F.W1 10 /r","Valid","Valid","Inva=
lid","AVX512F","ModRM:reg (r, w)","ModRM:r/m (r)","","","Tuple1 Scalar","Lo=
ad scalar double-precision floating-point value from m64 to xmm1 register u=
nder writemask k1."
+"VMOVSD xmm1 {k1}{z}, xmm2, xmm3","EVEX.LIG.F2.0F.W1 10 /r","Valid","Valid=
","Invalid","AVX512F","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","",=
"Merge scalar double-precision floating-point value from xmm2 and xmm3 regi=
sters to xmm1 under writemask k1."
+"VMOVSD m64 {k1}, xmm1","EVEX.LIG.F2.0F.W1 11 /r","Valid","Valid","Invalid=
","AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Tuple1 Scalar","Store sc=
alar double-precision floating-point value from xmm1 register to m64 under =
writemask k1."
+"VMOVSD xmm1 {k1}{z}, xmm2, xmm3","EVEX.LIG.F2.0F.W1 11 /r","Valid","Valid=
","Invalid","AVX512F","ModRM:r/m (w)","EVEX.vvvv (r)","ModRM:reg (r)","",""=
,"Merge scalar double-precision floating-point value from xmm2 and xmm3 reg=
isters to xmm1 under writemask k1."
+"VMOVSHDUP xmm1 {k1}{z}, xmm2/m128","EVEX.128.F3.0F.W0 16 /r","Valid","Val=
id","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Ful=
l Vector Mem","Move odd index single-precision floating-point values from x=
mm2/m128 and duplicate each element into xmm1 under writemask."
+"VMOVSHDUP ymm1 {k1}{z}, ymm2/m256","EVEX.256.F3.0F.W0 16 /r","Valid","Val=
id","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Ful=
l Vector Mem","Move odd index single-precision floating-point values from y=
mm2/m256 and duplicate each element into ymm1 under writemask."
+"VMOVSHDUP zmm1 {k1}{z}, zmm2/m512","EVEX.512.F3.0F.W0 16 /r","Valid","Val=
id","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Full Vector =
Mem","Move odd index single-precision floating-point values from zmm2/m512 =
and duplicate each element into zmm1 under writemask."
+"VMOVSLDUP xmm1 {k1}{z}, xmm2/m128","EVEX.128.F3.0F.W0 12 /r","Valid","Val=
id","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Ful=
l Vector Mem","Move even index single-precision floating-point values from =
xmm2/m128 and duplicate each element into xmm1 under writemask."
+"VMOVSLDUP ymm1 {k1}{z}, ymm2/m256","EVEX.256.F3.0F.W0 12 /r","Valid","Val=
id","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Ful=
l Vector Mem","Move even index single-precision floating-point values from =
ymm2/m256 and duplicate each element into ymm1 under writemask."
+"VMOVSLDUP zmm1 {k1}{z}, zmm2/m512","EVEX.512.F3.0F.W0 12 /r","Valid","Val=
id","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Full Vector =
Mem","Move even index single-precision floating-point values from zmm2/m512=
 and duplicate each element into zmm1 under writemask."
+"VMOVSS xmm1 {k1}{z}, m32","EVEX.LIG.F3.0F.W0 10 /r","Valid","Valid","Inva=
lid","AVX512F","ModRM:reg (r, w)","ModRM:r/m (r)","","","Tuple1 Scalar","Mo=
ve scalar single-precision floating-point values from m32 to xmm1 under wri=
temask k1."
+"VMOVSS xmm1 {k1}{z}, xmm2, xmm3","EVEX.LIG.F3.0F.W0 10 /r","Valid","Valid=
","Invalid","AVX512F","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","",=
"Move scalar single-precision floating-point value from xmm2 and xmm3 to xm=
m1 register under writemask k1."
+"VMOVSS m32 {k1}, xmm1","EVEX.LIG.F3.0F.W0 11 /r","Valid","Valid","Invalid=
","AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Tuple1 Scalar","Move sca=
lar single-precision floating-point values from xmm1 to m32 under writemask=
 k1."
+"VMOVSS xmm1 {k1}{z}, xmm2, xmm3","EVEX.LIG.F3.0F.W0 11 /r","Valid","Valid=
","Invalid","AVX512F","ModRM:r/m (w)","EVEX.vvvv (r)","ModRM:reg (r)","",""=
,"Move scalar single-precision floating-point value from xmm2 and xmm3 to x=
mm1 register under writemask k1."
+"VMOVUPD xmm1 {k1}{z}, xmm2/m128","EVEX.128.66.0F.W1 10 /r","Valid","Valid=
","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Full =
Vector Mem","Move unaligned packed double-precision floating-point from xmm=
2/m128 to xmm1 using writemask k1."
+"VMOVUPD ymm1 {k1}{z}, ymm2/m256","EVEX.256.66.0F.W1 10 /r","Valid","Valid=
","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Full =
Vector Mem","Move unaligned packed double-precision floating-point from ymm=
2/m256 to ymm1 using writemask k1."
+"VMOVUPD zmm1 {k1}{z}, zmm2/m512","EVEX.512.66.0F.W1 10 /r","Valid","Valid=
","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Full Vector Me=
m","Move unaligned packed double-precision floating-point values from zmm2/=
m512 to zmm1 using writemask k1."
+"VMOVUPD xmm2/m128 {k1}{z}, xmm1","EVEX.128.66.0F.W1 11 /r","Valid","Valid=
","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Full =
Vector Mem","Move unaligned packed double-precision floating-point from xmm=
1 to xmm2/m128 using writemask k1."
+"VMOVUPD ymm2/m256 {k1}{z}, ymm1","EVEX.256.66.0F.W1 11 /r","Valid","Valid=
","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Full =
Vector Mem","Move unaligned packed double-precision floating-point from ymm=
1 to ymm2/m256 using writemask k1."
+"VMOVUPD zmm2/m512 {k1}{z}, zmm1","EVEX.512.66.0F.W1 11 /r","Valid","Valid=
","Invalid","AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Full Vector Me=
m","Move unaligned packed double-precision floating-point values from zmm1 =
to zmm2/m512 using writemask k1."
+"VMOVUPS xmm1 {k1}{z}, xmm2/m128","EVEX.128.0F.W0 10 /r","Valid","Valid","=
Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Full Vec=
tor Mem","Move unaligned packed single-precision floating-point values from=
 xmm2/m128 to xmm1 using writemask k1."
+"VMOVUPS ymm1 {k1}{z}, ymm2/m256","EVEX.256.0F.W0 10 /r","Valid","Valid","=
Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Full Vec=
tor Mem","Move unaligned packed single-precision floating-point values from=
 ymm2/m256 to ymm1 using writemask k1."
+"VMOVUPS zmm1 {k1}{z}, zmm2/m512","EVEX.512.0F.W0 10 /r","Valid","Valid","=
Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Full Vector Mem",=
"Move unaligned packed single-precision floating-point values from zmm2/m51=
2 to zmm1 using writemask k1."
+"VMOVUPS xmm2/m128 {k1}{z}, xmm1","EVEX.128.0F.W0 11 /r","Valid","Valid","=
Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Full Vec=
tor Mem","Move unaligned packed single-precision floating-point values from=
 xmm1 to xmm2/m128 using writemask k1."
+"VMOVUPS ymm2/m256 {k1}{z}, ymm1","EVEX.256.0F.W0 11 /r","Valid","Valid","=
Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Full Vec=
tor Mem","Move unaligned packed single-precision floating-point values from=
 ymm1 to ymm2/m256 using writemask k1."
+"VMOVUPS zmm2/m512 {k1}{z}, zmm1","EVEX.512.0F.W0 11 /r","Valid","Valid","=
Invalid","AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Full Vector Mem",=
"Move unaligned packed single-precision floating-point values from zmm1 to =
zmm2/m512 using writemask k1."
+"VMULPD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F.W1 59 /r","=
Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Multiply packed double-precision floatin=
g-point values from xmm3/m128/m64bcst to xmm2 and store result in xmm1."
+"VMULPD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F.W1 59 /r","=
Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Multiply packed double-precision floatin=
g-point values from ymm3/m256/m64bcst to ymm2 and store result in ymm1."
+"VMULPD zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst{er}","EVEX.512.66.0F.W1 59 /=
r","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","Mod=
RM:r/m (r)","","Full Vector","Multiply packed double-precision floating-poi=
nt values in zmm3/m512/m64bcst with zmm2 and store result in zmm1."
+"VMULPS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.0F.W0 59 /r","Val=
id","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","","Full Vector","Multiply packed single-precision floating-p=
oint values from xmm3/m128/m32bcst to xmm2 and store result in xmm1."
+"VMULPS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.0F.W0 59 /r","Val=
id","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","","Full Vector","Multiply packed single-precision floating-p=
oint values from ymm3/m256/m32bcst to ymm2 and store result in ymm1."
+"VMULPS zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst {er}","EVEX.512.0F.W0 59 /r"=
,"Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM=
:r/m (r)","","Full Vector","Multiply packed single-precision floating-point=
 values in zmm3/m512/m32bcst with zmm2 and store result in zmm1."
+"VMULSD xmm1 {k1}{z}, xmm2, xmm3/m64 {er}","EVEX.LIG.F2.0F.W1 59 /r","Vali=
d","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (=
r)","","Tuple1 Scalar","Multiply the low double-precision floating-point va=
lue in xmm3/m64 by low double-precision floating-point value in xmm2."
+"VMULSS xmm1 {k1}{z}, xmm2, xmm3/m32 {er}","EVEX.LIG.F3.0F.W0 59 /r","Vali=
d","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (=
r)","","Tuple1 Scalar","Multiply the low single-precision floating-point va=
lue in xmm3/m32 by the low single-precision floating-point value in xmm2."
+"VPABSD xmm1 {k1}{z}, xmm2/m128/m32bcst","EVEX.128.66.0F38.W0 1E /r","Vali=
d","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","",=
"","Full Vector Mem","Compute the absolute value of 32-bit integers in xmm2=
/m128 and store UNSIGNED result in xmm1 using writemask k1."
+"VPABSD ymm1 {k1}{z}, ymm2/m256/m32bcst","EVEX.256.66.0F38.W0 1E /r","Vali=
d","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","",=
"","Full Vector Mem","Compute the absolute value of 32-bit integers in xmm2=
/m256 and store UNSIGNED result in xmm1 using writemask k1."
+"VPABSD zmm1 {k1}{z}, zmm2/m512/m32bcst","EVEX.512.66.0F38.W0 1E /r","Vali=
d","Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Full =
Vector Mem","Compute the absolute value of 32-bit integers in xmm2/m512 and=
 store UNSIGNED result in xmm1 using writemask k1."
+"VPABSQ xmm1 {k1}{z}, xmm2/m128/m64bcst","EVEX.128.66.0F38.W1 1F /r","Vali=
d","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","",=
"","Full Vector Mem","Compute the absolute value of 64-bit integers in xmm2=
/m128 and store UNSIGNED result in xmm1 using writemask k1."
+"VPABSQ ymm1 {k1}{z}, ymm2/m256/m64bcst","EVEX.256.66.0F38.W1 1F /r","Vali=
d","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","",=
"","Full Vector Mem","Compute the absolute value of 64-bit integers in xmm2=
/m256 and store UNSIGNED result in xmm1 using writemask k1."
+"VPABSQ zmm1 {k1}{z}, zmm2/m512/m64bcst","EVEX.512.66.0F38.W1 1F /r","Vali=
d","Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Full =
Vector Mem","Compute the absolute value of 64-bit integers in xmm2/m512 and=
 store UNSIGNED result in xmm1 using writemask k1."
+"VPADDD xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F.W0 FE /r","=
Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Add packed doubleword integers from xmm2=
, and xmm3/m128/m32bcst and store in xmm1 using writemask k1."
+"VPADDD ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F.W0 FE /r","=
Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Add packed doubleword integers from ymm2=
, and ymm3/m256/m32bcst and store in ymm1 using writemask k1."
+"VPADDD zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst","EVEX.512.66.0F.W0 FE /r","=
Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r=
/m (r)","","Full Vector","Add packed doubleword integers from zmm2, and zmm=
3/m512/m32bcst and store in zmm1 using writemask k1."
+"VPADDQ xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F.W1 D4 /r","=
Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Add packed quadword integers from xmm2, =
and xmm3/m128/m64bcst and store in xmm1 using writemask k1."
+"VPADDQ ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F.W1 D4 /r","=
Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Add packed quadword integers from ymm2, =
and ymm3/m256/m64bcst and store in ymm1 using writemask k1."
+"VPADDQ zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst","EVEX.512.66.0F.W1 D4 /r","=
Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r=
/m (r)","","Full Vector","Add packed quadword integers from zmm2, and zmm3/=
m512/m64bcst and store in zmm1 using writemask k1."
+"VPANDD xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F.W0 DB /r","=
Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Bitwise AND of packed doubleword integer=
s in xmm2 and xmm3/m128/m32bcst and store result in xmm1 using writemask k1=
."
+"VPANDD ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F.W0 DB /r","=
Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Bitwise AND of packed doubleword integer=
s in ymm2 and ymm3/m256/m32bcst and store result in ymm1 using writemask k1=
."
+"VPANDD zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst","EVEX.512.66.0F.W0 DB /r","=
Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r=
/m (r)","","Full Vector","Bitwise AND of packed doubleword integers in zmm2=
 and zmm3/m512/m32bcst and store result in zmm1 using writemask k1."
+"VPANDND xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F.W0 DF /r",=
"Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)=
","ModRM:r/m (r)","","Full Vector","Bitwise AND NOT of packed doubleword in=
tegers in xmm2 and xmm3/m128/m32bcst and store result in xmm1 using writema=
sk k1."
+"VPANDND ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F.W0 DF /r",=
"Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)=
","ModRM:r/m (r)","","Full Vector","Bitwise AND NOT of packed doubleword in=
tegers in ymm2 and ymm3/m256/m32bcst and store result in ymm1 using writema=
sk k1."
+"VPANDND zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst","EVEX.512.66.0F.W0 DF /r",=
"Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:=
r/m (r)","","Full Vector","Bitwise AND NOT of packed doubleword integers in=
 zmm2 and zmm3/m512/m32bcst and store result in zmm1 using writemask k1."
+"VPANDNQ xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F.W1 DF /r",=
"Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)=
","ModRM:r/m (r)","","Full Vector","Bitwise AND NOT of packed quadword inte=
gers in xmm2 and xmm3/m128/m64bcst and store result in xmm1 using writemask=
 k1."
+"VPANDNQ ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F.W1 DF /r",=
"Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)=
","ModRM:r/m (r)","","Full Vector","Bitwise AND NOT of packed quadword inte=
gers in ymm2 and ymm3/m256/m64bcst and store result in ymm1 using writemask=
 k1."
+"VPANDNQ zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst","EVEX.512.66.0F.W1 DF /r",=
"Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:=
r/m (r)","","Full Vector","Bitwise AND NOT of packed quadword integers in z=
mm2 and zmm3/m512/m64bcst and store result in zmm1 using writemask k1."
+"VPANDQ xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F.W1 DB /r","=
Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Bitwise AND of packed quadword integers =
in xmm2 and xmm3/m128/m64bcst and store result in xmm1 using writemask k1."
+"VPANDQ ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F.W1 DB /r","=
Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Bitwise AND of packed quadword integers =
in ymm2 and ymm3/m256/m64bcst and store result in ymm1 using writemask k1."
+"VPANDQ zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst","EVEX.512.66.0F.W1 DB /r","=
Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r=
/m (r)","","Full Vector","Bitwise AND of packed quadword integers in zmm2 a=
nd zmm3/m512/m64bcst and store result in zmm1 using writemask k1."
+"VPBLENDMD xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F38.W0 64 =
/r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Blend doubleword integer vector xmm=
2 and doubleword vector xmm3/m128/m32bcst and store the result in xmm1, und=
er control mask."
+"VPBLENDMD ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F38.W0 64 =
/r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Blend doubleword integer vector ymm=
2 and doubleword vector ymm3/m256/m32bcst and store the result in ymm1, und=
er control mask."
+"VPBLENDMD zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst","EVEX.512.66.0F38.W0 64 =
/r","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Full Vector","Blend doubleword integer vector zmm2 and dou=
bleword vector zmm3/m512/m32bcst and store the result in zmm1, under contro=
l mask."
+"VPBLENDMQ xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F38.W1 64 =
/r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Blend quadword integer vector xmm2 =
and quadword vector xmm3/m128/m64bcst and store the result in xmm1, under c=
ontrol mask."
+"VPBLENDMQ ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W1 64 =
/r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Blend quadword integer vector ymm2 =
and quadword vector ymm3/m256/m64bcst and store the result in ymm1, under c=
ontrol mask."
+"VPBLENDMQ zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst","EVEX.512.66.0F38.W1 64 =
/r","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Full Vector","Blend quadword integer vector zmm2 and quadw=
ord vector zmm3/m512/m64bcst and store the result in zmm1, under control ma=
sk."
+"VPBROADCASTD xmm1 {k1}{z}, xmm2/m32","EVEX.128.66.0F38.W0 58 /r","Valid",=
"Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","",=
"Tuple1 Scalar","Broadcast a dword integer in the source operand to locatio=
ns in xmm1 subject to writemask k1."
+"VPBROADCASTD ymm1 {k1}{z}, xmm2/m32","EVEX.256.66.0F38.W0 58 /r","Valid",=
"Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","",=
"Tuple1 Scalar","Broadcast a dword integer in the source operand to locatio=
ns in ymm1 subject to writemask k1."
+"VPBROADCASTD zmm1 {k1}{z}, xmm2/m32","EVEX.512.66.0F38.W0 58 /r","Valid",=
"Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple1 S=
calar","Broadcast a dword integer in the source operand to locations in zmm=
1 subject to writemask k1."
+"VPBROADCASTD xmm1 {k1}{z}, rw","EVEX.128.66.0F38.W0 7C /r","Valid","Valid=
","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple=
1 Scalar","Broadcast a 32-bit value from a GPR to all double-words in the 1=
28-bit destination subject to writemask k1."
+"VPBROADCASTD ymm1 {k1}{z}, rw","EVEX.256.66.0F38.W0 7C /r","Valid","Valid=
","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple=
1 Scalar","Broadcast a 32-bit value from a GPR to all double-words in the 2=
56-bit destination subject to writemask k1."
+"VPBROADCASTD zmm1 {k1}{z}, rw","EVEX.512.66.0F38.W0 7C /r","Valid","Valid=
","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple1 Scalar"=
,"Broadcast a 32-bit value from a GPR to all double-words in the 512-bit de=
stination subject to writemask k1."
+"VPBROADCASTQ xmm1 {k1}{z}, xmm2/m64","EVEX.128.66.0F38.W1 59 /r","Valid",=
"Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","",=
"Tuple1 Scalar","Broadcast a qword element in source operand to locations i=
n xmm1 subject to writemask k1."
+"VPBROADCASTQ ymm1 {k1}{z}, xmm2/m64","EVEX.256.66.0F38.W1 59 /r","Valid",=
"Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","",=
"Tuple1 Scalar","Broadcast a qword element in source operand to locations i=
n ymm1 subject to writemask k1."
+"VPBROADCASTQ zmm1 {k1}{z}, xmm2/m64","EVEX.512.66.0F38.W1 59 /r","Valid",=
"Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple1 S=
calar","Broadcast a qword element in source operand to locations in zmm1 su=
bject to writemask k1."
+"VPBROADCASTQ xmm1 {k1}{z}, rw","EVEX.128.66.0F38.W1 7C /r","Valid","Inval=
id","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Tup=
le1 Scalar","Broadcast a 64-bit value from a GPR to all quad-words in the 1=
28-bit destination subject to writemask k1."
+"VPBROADCASTQ ymm1 {k1}{z}, rw","EVEX.256.66.0F38.W1 7C /r","Valid","Inval=
id","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Tup=
le1 Scalar","Broadcast a 64-bit value from a GPR to all quad-words in the 2=
56-bit destination subject to writemask k1."
+"VPBROADCASTQ zmm1 {k1}{z}, rw","EVEX.512.66.0F38.W1 7C /r","Valid","Inval=
id","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple1 Scala=
r","Broadcast a 64-bit value from a GPR to all quad-words in the 512-bit de=
stination subject to writemask k1."
+"VPCMPD k1 {k2}, xmm2, xmm3/m128/m32bcst, ib","EVEX.128.66.0F3A.W0 1F /r i=
b","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv =
(r)","ModRM:r/m (r)","ib","Full Vector","Compare packed signed doubleword i=
nteger values in xmm3/m128/m32bcst and xmm2 using bits 2:0 of ib as a compa=
rison predicate with writemask k2 and leave the result in mask register k1."
+"VPCMPD k1 {k2}, ymm2, ymm3/m256/m32bcst, ib","EVEX.256.66.0F3A.W0 1F /r i=
b","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv =
(r)","ModRM:r/m (r)","ib","Full Vector","Compare packed signed doubleword i=
nteger values in ymm3/m256/m32bcst and ymm2 using bits 2:0 of ib as a compa=
rison predicate with writemask k2 and leave the result in mask register k1."
+"VPCMPD k1 {k2}, zmm2, zmm3/m512/m32bcst, ib","EVEX.512.66.0F3A.W0 1F /r i=
b","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","Mod=
RM:r/m (r)","ib","Full Vector","Compare packed signed doubleword integer va=
lues in zmm2 and zmm3/m512/m32bcst using bits 2:0 of ib as a comparison pre=
dicate. The comparison results are written to the destination k1 under writ=
emask k2."
+"VPCMPEQD k1 {k2}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F.W0 76 /r","Val=
id","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","","Full Vector","Compare Equal between int32 vector xmm2 and=
 int32 vector xmm3/m128/m32bcst, and set vector mask k1 to reflect the zero=
/nonzero status of each element of the result, under writemask."
+"VPCMPEQD k1 {k2}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F.W0 76 /r","Val=
id","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","","Full Vector","Compare Equal between int32 vector ymm2 and=
 int32 vector ymm3/m256/m32bcst, and set vector mask k1 to reflect the zero=
/nonzero status of each element of the result, under writemask."
+"VPCMPEQD k1 {k2}, zmm2, zmm3/m512/m32bcst","EVEX.512.66.0F.W0 76 /r","Val=
id","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m =
(r)","","Full Vector","Compare Equal between int32 vectors in zmm2 and zmm3=
/m512/m32bcst, and set destination k1 according to the comparison results u=
nder writemask k2."
+"VPCMPEQQ k1 {k2}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F38.W1 29 /r","V=
alid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)",=
"ModRM:r/m (r)","","Full Vector","Compare Equal between int64 vector xmm2 a=
nd int64 vector xmm3/m128/m64bcst, and set vector mask k1 to reflect the ze=
ro/nonzero status of each element of the result, under writemask."
+"VPCMPEQQ k1 {k2}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W1 29 /r","V=
alid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)",=
"ModRM:r/m (r)","","Full Vector","Compare Equal between int64 vector ymm2 a=
nd int64 vector ymm3/m256/m64bcst, and set vector mask k1 to reflect the ze=
ro/nonzero status of each element of the result, under writemask."
+"VPCMPEQQ k1 {k2}, zmm2, zmm3/m512/m64bcst","EVEX.512.66.0F38.W1 29 /r","V=
alid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/=
m (r)","","Full Vector","Compare Equal between int64 vector zmm2 and int64 =
vector zmm3/m512/m64bcst, and set vector mask k1 to reflect the zero/nonzer=
o status of each element of the result, under writemask."
+"VPCMPGTD k1 {k2}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F.W0 66 /r","Val=
id","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","","Full Vector","Compare Greater between int32 vector xmm2 a=
nd int32 vector xmm3/m128/m32bcst,and set vector mask k1 to reflect the zer=
o/nonzero status of each element of the result,under writemask."
+"VPCMPGTD k1 {k2}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F.W0 66 /r","Val=
id","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","","Full Vector","Compare Greater between int32 vector ymm2 a=
nd int32 vector ymm3/m256/m32bcst,and set vector mask k1 to reflect the zer=
o/nonzero status of each element of the result,under writemask."
+"VPCMPGTD k1 {k2}, zmm2, zmm3/m512/m32bcst","EVEX.512.66.0F.W0 66 /r","Val=
id","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m =
(r)","","Full Vector","Compare Greater between int32 elements in zmm2 and z=
mm3/m512/m32bcst,and set destination k1 according to the comparison results=
 under writemask. k2."
+"VPCMPGTQ k1 {k2}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F38.W1 37 /r","V=
alid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)",=
"ModRM:r/m (r)","","Full Vector","Compare Greater between int64 vector xmm2=
 and int64 vector xmm3/m128/m64bcst, and set vector mask k1 to reflect the =
zero/nonzero status of each element of the result, under writemask."
+"VPCMPGTQ k1 {k2}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W1 37 /r","V=
alid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)",=
"ModRM:r/m (r)","","Full Vector","Compare Greater between int64 vector ymm2=
 and int64 vector ymm3/m256/m64bcst, and set vector mask k1 to reflect the =
zero/nonzero status of each element of the result, under writemask."
+"VPCMPGTQ k1 {k2}, zmm2, zmm3/m512/m64bcst","EVEX.512.66.0F38.W1 37 /r","V=
alid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/=
m (r)","","Full Vector","Compare Greater between int64 vector zmm2 and int6=
4 vector zmm3/m512/m64bcst, and set vector mask k1 to reflect the zero/nonz=
ero status of each element of the result, under writemask."
+"VPCMPQ k1 {k2}, xmm2, xmm3/m128/m64bcst, ib","EVEX.128.66.0F3A.W1 1F /r i=
b","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv =
(r)","ModRM:r/m (r)","ib","Full Vector","Compare packed signed quadword int=
eger values in xmm3/m128/m64bcst and xmm2 using bits 2:0 of ib as a compari=
son predicate with writemask k2 and leave the result in mask register k1."
+"VPCMPQ k1 {k2}, ymm2, ymm3/m256/m64bcst, ib","EVEX.256.66.0F3A.W1 1F /r i=
b","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv =
(r)","ModRM:r/m (r)","ib","Full Vector","Compare packed signed quadword int=
eger values in ymm3/m256/m64bcst and ymm2 using bits 2:0 of ib as a compari=
son predicate with writemask k2 and leave the result in mask register k1."
+"VPCMPQ k1 {k2}, zmm2, zmm3/m512/m64bcst, ib","EVEX.512.66.0F3A.W1 1F /r i=
b","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","Mod=
RM:r/m (r)","ib","Full Vector","Compare packed signed quadword integer valu=
es in zmm3/m512/m64bcst and zmm2 using bits 2:0 of ib as a comparison predi=
cate with writemask k2 and leave the result in mask register k1."
+"VPCMPUD k1 {k2}, xmm2, xmm3/m128/m32bcst, ib","EVEX.128.66.0F3A.W0 1E /r =
ib","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv=
 (r)","ModRM:r/m (r)","ib","Full Vector","Compare packed unsigned doublewor=
d integer values in xmm3/m128/m32bcst and xmm2 using bits 2:0 of ib as a co=
mparison predicate with writemask k2 and leave the result in mask register =
k1."
+"VPCMPUD k1 {k2}, ymm2, ymm3/m256/m32bcst, ib","EVEX.256.66.0F3A.W0 1E /r =
ib","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv=
 (r)","ModRM:r/m (r)","ib","Full Vector","Compare packed unsigned doublewor=
d integer values in ymm3/m256/m32bcst and ymm2 using bits 2:0 of ib as a co=
mparison predicate with writemask k2 and leave the result in mask register =
k1."
+"VPCMPUD k1 {k2}, zmm2, zmm3/m512/m32bcst, ib","EVEX.512.66.0F3A.W0 1E /r =
ib","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","ib","Full Vector","Compare packed unsigned doubleword integer=
 values in zmm2 and zmm3/m512/m32bcst using bits 2:0 of ib as a comparison =
predicate. The comparison results are written to the destination k1 under w=
ritemask k2."
+"VPCMPUQ k1 {k2}, xmm2, xmm3/m128/m64bcst, ib","EVEX.128.66.0F3A.W1 1E /r =
ib","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv=
 (r)","ModRM:r/m (r)","ib","Full Vector","Compare packed unsigned quadword =
integer values in xmm3/m128/m64bcst and xmm2 using bits 2:0 of ib as a comp=
arison predicate with writemask k2 and leave the result in mask register k1=
."
+"VPCMPUQ k1 {k2}, ymm2, ymm3/m256/m64bcst, ib","EVEX.256.66.0F3A.W1 1E /r =
ib","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv=
 (r)","ModRM:r/m (r)","ib","Full Vector","Compare packed unsigned quadword =
integer values in ymm3/m256/m64bcst and ymm2 using bits 2:0 of ib as a comp=
arison predicate with writemask k2 and leave the result in mask register k1=
."
+"VPCMPUQ k1 {k2}, zmm2, zmm3/m512/m64bcst, ib","EVEX.512.66.0F3A.W1 1E /r =
ib","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","ib","Full Vector","Compare packed unsigned quadword integer v=
alues in zmm3/m512/m64bcst and zmm2 using bits 2:0 of ib as a comparison pr=
edicate with writemask k2 and leave the result in mask register k1."
+"VPCOMPRESSD xmm1/m128/i32x4 {k1}{z}, xmm2","EVEX.128.66.0F38.W0 8B /r","V=
alid","Valid","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)",=
"","","Tuple1 Scalar","Compress packed doubleword integer values from xmm2 =
to xmm1/m128 using controlmask k1."
+"VPCOMPRESSD ymm1/m256/i32x8 {k1}{z}, ymm2","EVEX.256.66.0F38.W0 8B /r","V=
alid","Valid","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)",=
"","","Tuple1 Scalar","Compress packed doubleword integer values from ymm2 =
to ymm1/m256 using controlmask k1."
+"VPCOMPRESSD zmm1/m512/i32x16 {k1}{z}, zmm2","EVEX.512.66.0F38.W0 8B /r","=
Valid","Valid","Invalid","AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","T=
uple1 Scalar","Compress packed doubleword integer values from zmm2 to zmm1/=
m512 using controlmask k1."
+"VPCOMPRESSQ xmm1/m128/i64x2 {k1}{z}, xmm2","EVEX.128.66.0F38.W1 8B /r","V=
alid","Valid","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)",=
"","","Tuple1 Scalar","Compress packed quadword integer values from xmm2 to=
 xmm1/m128 using controlmask k1."
+"VPCOMPRESSQ ymm1/m256/i64x4 {k1}{z}, ymm2","EVEX.256.66.0F38.W1 8B /r","V=
alid","Valid","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)",=
"","","Tuple1 Scalar","Compress packed quadword integer values from ymm2 to=
 ymm1/m256 using controlmask k1."
+"VPCOMPRESSQ zmm1/m512/i64x8 {k1}{z}, zmm2","EVEX.512.66.0F38.W1 8B /r","V=
alid","Valid","Invalid","AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Tu=
ple1 Scalar","Compress packed quadword integer values from zmm2 to zmm1/m51=
2 using controlmask k1."
+"VPERMD ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F38.W0 36 /r"=
,"Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r=
)","ModRM:r/m (r)","","Full Vector","Permute doublewords in ymm3/m256/m32bc=
st using indexes in ymm2 and store the result in ymm1 using writemask k1."
+"VPERMD zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst","EVEX.512.66.0F38.W0 36 /r"=
,"Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM=
:r/m (r)","","Full Vector","Permute doublewords in zmm3/m512/m32bcst using =
indices in zmm2 and store the result in zmm1 using writemask k1."
+"VPERMI2D xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F38.W0 76 /=
r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVEX.vv=
vv (r)","ModRM:r/m (r)","","Full Vector","Permute double-words from two tab=
les in xmm3/m128/m32bcst and xmm2 using indexes in xmm1 and store the resul=
t in xmm1 using writemask k1."
+"VPERMI2D ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F38.W0 76 /=
r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVEX.vv=
vv (r)","ModRM:r/m (r)","","Full Vector","Permute double-words from two tab=
les in ymm3/m256/m32bcst and ymm2 using indexes in ymm1 and store the resul=
t in ymm1 using writemask k1."
+"VPERMI2D zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst","EVEX.512.66.0F38.W0 76 /=
r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv (r)","=
ModRM:r/m (r)","","Full Vector","Permute double-words from two tables in zm=
m3/m512/m32bcst and zmm2 using indices in zmm1 and store the result in zmm1=
 using writemask k1."
+"VPERMI2PD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F38.W1 77 =
/r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVEX.v=
vvv (r)","ModRM:r/m (r)","","Full Vector","Permute double-precision FP valu=
es from two tables in xmm3/m128/m64bcst and xmm2 using indexes in xmm1 and =
store the result in xmm1 using writemask k1."
+"VPERMI2PD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W1 77 =
/r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVEX.v=
vvv (r)","ModRM:r/m (r)","","Full Vector","Permute double-precision FP valu=
es from two tables in ymm3/m256/m64bcst and ymm2 using indexes in ymm1 and =
store the result in ymm1 using writemask k1."
+"VPERMI2PD zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst","EVEX.512.66.0F38.W1 77 =
/r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv (r)",=
"ModRM:r/m (r)","","Full Vector","Permute double-precision FP values from t=
wo tables in zmm3/m512/m64bcst and zmm2 using indices in zmm1 and store the=
 result in zmm1 using writemask k1."
+"VPERMI2PS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F38.W0 77 =
/r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVEX.v=
vvv (r)","ModRM:r/m (r)","","Full Vector","Permute single-precision FP valu=
es from two tables in xmm3/m128/m32bcst and xmm2 using indexes in xmm1 and =
store the result in xmm1 using writemask k1."
+"VPERMI2PS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F38.W0 77 =
/r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVEX.v=
vvv (r)","ModRM:r/m (r)","","Full Vector","Permute single-precision FP valu=
es from two tables in ymm3/m256/m32bcst and ymm2 using indexes in ymm1 and =
store the result in ymm1 using writemask k1."
+"VPERMI2PS zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst","EVEX.512.66.0F38.W0 77 =
/r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv (r)",=
"ModRM:r/m (r)","","Full Vector","Permute single-precision FP values from t=
wo tables in zmm3/m512/m32bcst and zmm2 using indices in zmm1 and store the=
 result in zmm1 using writemask k1."
+"VPERMI2Q xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F38.W1 76 /=
r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVEX.vv=
vv (r)","ModRM:r/m (r)","","Full Vector","Permute quad-words from two table=
s in xmm3/m128/m64bcst and xmm2 using indexes in xmm1 and store the result =
in xmm1 using writemask k1."
+"VPERMI2Q ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W1 76 /=
r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVEX.vv=
vv (r)","ModRM:r/m (r)","","Full Vector","Permute quad-words from two table=
s in ymm3/m256/m64bcst and ymm2 using indexes in ymm1 and store the result =
in ymm1 using writemask k1."
+"VPERMI2Q zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst","EVEX.512.66.0F38.W1 76 /=
r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv (r)","=
ModRM:r/m (r)","","Full Vector","Permute quad-words from two tables in zmm3=
/m512/m64bcst and zmm2 using indices in zmm1 and store the result in zmm1 u=
sing writemask k1."
+"VPERMILPD xmm1 {k1}{z}, xmm2/m128/m64bcst, ib","EVEX.128.66.0F3A.W1 05 /r=
 ib","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/=
m (r)","ib","","Full Vector","Permute double-precision floating-point value=
s in xmm2/m128/m64bcst using controls from ib and store the result in xmm1 =
using writemask k1."
+"VPERMILPD ymm1 {k1}{z}, ymm2/m256/m64bcst, ib","EVEX.256.66.0F3A.W1 05 /r=
 ib","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/=
m (r)","ib","","Full Vector","Permute double-precision floating-point value=
s in ymm2/m256/m64bcst using controls from ib and store the result in ymm1 =
using writemask k1."
+"VPERMILPD zmm1 {k1}{z}, zmm2/m512/m64bcst, ib","EVEX.512.66.0F3A.W1 05 /r=
 ib","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","i=
b","","Full Vector","Permute double-precision floating-point values in zmm2=
/m512/m64bcst using controls from ib and store the result in zmm1 using wri=
temask k1."
+"VPERMILPD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F38.W1 0D =
/r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Permute double-precision floating-p=
oint values in xmm2 using control from xmm3/m128/m64bcst and store the resu=
lt in xmm1 using writemask k1."
+"VPERMILPD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W1 0D =
/r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Permute double-precision floating-p=
oint values in ymm2 using control from ymm3/m256/m64bcst and store the resu=
lt in ymm1 using writemask k1."
+"VPERMILPD zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst","EVEX.512.66.0F38.W1 0D =
/r","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Full Vector","Permute double-precision floating-point valu=
es in zmm2 using control from zmm3/m512/m64bcst and store the result in zmm=
1 using writemask k1."
+"VPERMILPS xmm1 {k1}{z}, xmm2/m128/m32bcst, ib","EVEX.128.66.0F3A.W0 04 /r=
 ib","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/=
m (r)","ib","","Full Vector","Permute single-precision floating-point value=
s xmm2/m128/m32bcst using controls from ib and store the result in xmm1 usi=
ng writemask k1."
+"VPERMILPS ymm1 {k1}{z}, ymm2/m256/m32bcst, ib","EVEX.256.66.0F3A.W0 04 /r=
 ib","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/=
m (r)","ib","","Full Vector","Permute single-precision floating-point value=
s ymm2/m256/m32bcst using controls from ib and store the result in ymm1 usi=
ng writemask k1."
+"VPERMILPS zmm1 {k1}{z}, zmm2/m512/m32bcst, ib","EVEX.512.66.0F3A.W0 04 /r=
 ib","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","i=
b","","Full Vector","Permute single-precision floating-point values zmm2/m5=
12/m32bcst using controls from ib and store the result in zmm1 using writem=
ask k1."
+"VPERMILPS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F38.W0 0C =
/r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Permute single-precision floating-p=
oint values xmm2 using control from xmm3/m128/m32bcst and store the result =
in xmm1 using writemask k1."
+"VPERMILPS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F38.W0 0C =
/r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Permute single-precision floating-p=
oint values ymm2 using control from ymm3/m256/m32bcst and store the result =
in ymm1 using writemask k1."
+"VPERMILPS zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst","EVEX.512.66.0F38.W0 0C =
/r","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Full Vector","Permute single-precision floating-point valu=
es zmm2 using control from zmm3/m512/m32bcst and store the result in zmm1 u=
sing writemask k1."
+"VPERMPD ymm1 {k1}{z}, ymm2/m256/m64bcst, ib","EVEX.256.66.0F3A.W1 01 /r i=
b","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m =
(r)","ib","","Full Vector","Permute double-precision floating-point element=
s in ymm2/m256/m64bcst using indexes in ib and store the result in ymm1 sub=
ject to writemask k1."
+"VPERMPD zmm1 {k1}{z}, zmm2/m512/m64bcst, ib","EVEX.512.66.0F3A.W1 01 /r i=
b","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","ib"=
,"","Full Vector","Permute double-precision floating-point elements in zmm2=
/m512/m64bcst using indices in ib and store the result in zmm1 subject to w=
ritemask k1."
+"VPERMPD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W1 16 /r=
","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (=
r)","ModRM:r/m (r)","","Full Vector","Permute double-precision floating-poi=
nt elements in ymm3/m256/m64bcst using indexes in ymm2 and store the result=
 in ymm1 subject to writemask k1."
+"VPERMPD zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst","EVEX.512.66.0F38.W1 16 /r=
","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector","Permute double-precision floating-point elemen=
ts in zmm3/m512/m64bcst using indices in zmm2 and store the result in zmm1 =
subject to writemask k1."
+"VPERMPS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F38.W0 16 /r=
","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (=
r)","ModRM:r/m (r)","","Full Vector","Permute single-precision floating-poi=
nt elements in ymm3/m256/m32bcst using indexes in ymm2 and store the result=
 in ymm1 subject to write mask k1."
+"VPERMPS zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst","EVEX.512.66.0F38.W0 16 /r=
","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector","Permute single-precision floating-point values=
 in zmm3/m512/m32bcst using indices in zmm2 and store the result in zmm1 su=
bject to write mask k1."
+"VPERMQ ymm1 {k1}{z}, ymm2/m256/m64bcst, ib","EVEX.256.66.0F3A.W1 00 /r ib=
","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (=
r)","ib","","Full Vector","Permute qwords in ymm2/m256/m64bcst using indexe=
s in ib and store the result in ymm1."
+"VPERMQ zmm1 {k1}{z}, zmm2/m512/m64bcst, ib","EVEX.512.66.0F3A.W1 00 /r ib=
","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","ib",=
"","Full Vector","Permute qwords in zmm2/m512/m64bcst using indices in ib a=
nd store the result in zmm1."
+"VPERMQ ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W1 36 /r"=
,"Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r=
)","ModRM:r/m (r)","","Full Vector","Permute qwords in ymm3/m256/m64bcst us=
ing indexes in ymm2 and store the result in ymm1."
+"VPERMQ zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst","EVEX.512.66.0F38.W1 36 /r"=
,"Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM=
:r/m (r)","","Full Vector","Permute qwords in zmm3/m512/m64bcst using indic=
es in zmm2 and store the result in zmm1."
+"VPERMT2D xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F38.W0 7E /=
r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVEX.vv=
vv (r)","ModRM:r/m (r)","","Full","Permute double-words from two tables in =
xmm3/m128/m32bcst and xmm1 using indexes in xmm2 and store the result in xm=
m1 using writemask k1."
+"VPERMT2D ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F38.W0 7E /=
r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVEX.vv=
vv (r)","ModRM:r/m (r)","","Full","Permute double-words from two tables in =
ymm3/m256/m32bcst and ymm1 using indexes in ymm2 and store the result in ym=
m1 using writemask k1."
+"VPERMT2D zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst","EVEX.512.66.0F38.W0 7E /=
r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv (r)","=
ModRM:r/m (r)","","Full","Permute double-words from two tables in zmm3/m512=
/m32bcst and zmm1 using indices in zmm2 and store the result in zmm1 using =
writemask k1."
+"VPERMT2PD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F38.W1 7F =
/r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVEX.v=
vvv (r)","ModRM:r/m (r)","","Full","Permute double-precision FP values from=
 two tables in xmm3/m128/m64bcst and xmm1 using indexes in xmm2 and store t=
he result in xmm1 using writemask k1."
+"VPERMT2PD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W1 7F =
/r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVEX.v=
vvv (r)","ModRM:r/m (r)","","Full","Permute double-precision FP values from=
 two tables in ymm3/m256/m64bcst and ymm1 using indexes in ymm2 and store t=
he result in ymm1 using writemask k1."
+"VPERMT2PD zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst","EVEX.512.66.0F38.W1 7F =
/r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv (r)",=
"ModRM:r/m (r)","","Full","Permute double-precision FP values from two tabl=
es in zmm3/m512/m64bcst and zmm1 using indices in zmm2 and store the result=
 in zmm1 using writemask k1."
+"VPERMT2PS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F38.W0 7F =
/r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVEX.v=
vvv (r)","ModRM:r/m (r)","","Full","Permute single-precision FP values from=
 two tables in xmm3/m128/m32bcst and xmm1 using indexes in xmm2 and store t=
he result in xmm1 using writemask k1."
+"VPERMT2PS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F38.W0 7F =
/r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVEX.v=
vvv (r)","ModRM:r/m (r)","","Full","Permute single-precision FP values from=
 two tables in ymm3/m256/m32bcst and ymm1 using indexes in ymm2 and store t=
he result in ymm1 using writemask k1."
+"VPERMT2PS zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst","EVEX.512.66.0F38.W0 7F =
/r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv (r)",=
"ModRM:r/m (r)","","Full","Permute single-precision FP values from two tabl=
es in zmm3/m512/m32bcst and zmm1 using indices in zmm2 and store the result=
 in zmm1 using writemask k1."
+"VPERMT2Q xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F38.W1 7E /=
r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVEX.vv=
vv (r)","ModRM:r/m (r)","","Full","Permute quad-words from two tables in xm=
m3/m128/m64bcst and xmm1 using indexes in xmm2 and store the result in xmm1=
 using writemask k1."
+"VPERMT2Q ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W1 7E /=
r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)","EVEX.vv=
vv (r)","ModRM:r/m (r)","","Full","Permute quad-words from two tables in ym=
m3/m256/m64bcst and ymm1 using indexes in ymm2 and store the result in ymm1=
 using writemask k1."
+"VPERMT2Q zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst","EVEX.512.66.0F38.W1 7E /=
r","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vvvv (r)","=
ModRM:r/m (r)","","Full","Permute quad-words from two tables in zmm3/m512/m=
64bcst and zmm1 using indices in zmm2 and store the result in zmm1 using wr=
itemask k1."
+"VPEXPANDD xmm1 {k1}{z}, xmm2/m128/i32x4","EVEX.128.66.0F38.W0 89 /r","Val=
id","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)",""=
,"","Tuple1 Scalar","Expand packed double-word integer values from xmm2/m12=
8 to xmm1 using writemask k1."
+"VPEXPANDD ymm1 {k1}{z}, ymm2/m256/i32x8","EVEX.256.66.0F38.W0 89 /r","Val=
id","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)",""=
,"","Tuple1 Scalar","Expand packed double-word integer values from ymm2/m25=
6 to ymm1 using writemask k1."
+"VPEXPANDD zmm1 {k1}{z}, zmm2/m512/i32x16","EVEX.512.66.0F38.W0 89 /r","Va=
lid","Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Tup=
le1 Scalar","Expand packed double-word integer values from zmm2/m512 to zmm=
1 using writemask k1."
+"VPEXPANDQ xmm1 {k1}{z}, xmm2/m128/i64x2","EVEX.128.66.0F38.W1 89 /r","Val=
id","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)",""=
,"","Tuple1 Scalar","Expand packed quad-word integer values from xmm2/m128 =
to xmm1 using writemask k1."
+"VPEXPANDQ ymm1 {k1}{z}, ymm2/m256/i64x4","EVEX.256.66.0F38.W1 89 /r","Val=
id","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)",""=
,"","Tuple1 Scalar","Expand packed quad-word integer values from ymm2/m256 =
to ymm1 using writemask k1."
+"VPEXPANDQ zmm1 {k1}{z}, zmm2/m512/i64x8","EVEX.512.66.0F38.W1 89 /r","Val=
id","Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Tupl=
e1 Scalar","Expand packed quad-word integer values from zmm2/m512 to zmm1 u=
sing writemask k1."
+"VPGATHERDD xmm1 {k1}, vm32x/i32x4","EVEX.128.66.0F38.W0 90 /r","Valid","V=
alid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","BaseReg (r): VSIB:base,=
 VectorReg (r): VSIB:index","","","Tuple1 Scalar","Using signed dword indic=
es, gather dword values from memory using writemask k1 for merging-masking."
+"VPGATHERDD ymm1 {k1}, vm32y/i32x8","EVEX.256.66.0F38.W0 90 /r","Valid","V=
alid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","BaseReg (r): VSIB:base,=
 VectorReg (r): VSIB:index","","","Tuple1 Scalar","Using signed dword indic=
es, gather dword values from memory using writemask k1 for merging-masking."
+"VPGATHERDD zmm1 {k1}, vm32z/i32x16","EVEX.512.66.0F38.W0 90 /r","Valid","=
Valid","Invalid","AVX512F","ModRM:reg (w)","BaseReg (r): VSIB:base, VectorR=
eg (r): VSIB:index","","","Tuple1 Scalar","Using signed dword indices, gath=
er dword values from memory using writemask k1 for merging-masking."
+"VPGATHERDQ xmm1 {k1}, vm32x/i64x2","EVEX.128.66.0F38.W1 90 /r","Valid","V=
alid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","BaseReg (r): VSIB:base,=
 VectorReg (r): VSIB:index","","","Tuple1 Scalar","Using signed dword indic=
es, gather quadword values from memory using writemask k1 for merging-maski=
ng."
+"VPGATHERDQ ymm1 {k1}, vm32x/i64x4","EVEX.256.66.0F38.W1 90 /r","Valid","V=
alid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","BaseReg (r): VSIB:base,=
 VectorReg (r): VSIB:index","","","Tuple1 Scalar","Using signed dword indic=
es, gather quadword values from memory using writemask k1 for merging-maski=
ng."
+"VPGATHERDQ zmm1 {k1}, vm32y/i64x8","EVEX.512.66.0F38.W1 90 /r","Valid","V=
alid","Invalid","AVX512F","ModRM:reg (w)","BaseReg (r): VSIB:base, VectorRe=
g (r): VSIB:index","","","Tuple1 Scalar","Using signed dword indices, gathe=
r quadword values from memory using writemask k1 for merging-masking."
+"VPGATHERQD xmm1 {k1}, vm64x/i32x2","EVEX.128.66.0F38.W0 91 /r","Valid","V=
alid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","BaseReg (r): VSIB:base,=
 VectorReg (r): VSIB:index","","","Tuple1 Scalar","Using signed qword indic=
es, gather dword values from memory using writemask k1 for merging-masking."
+"VPGATHERQD xmm1 {k1}, vm64y/i32x4","EVEX.256.66.0F38.W0 91 /r","Valid","V=
alid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","BaseReg (r): VSIB:base,=
 VectorReg (r): VSIB:index","","","Tuple1 Scalar","Using signed qword indic=
es, gather dword values from memory using writemask k1 for merging-masking."
+"VPGATHERQD ymm1 {k1}, vm64z/i32x8","EVEX.512.66.0F38.W0 91 /r","Valid","V=
alid","Invalid","AVX512F","ModRM:reg (w)","BaseReg (r): VSIB:base, VectorRe=
g (r): VSIB:index","","","Tuple1 Scalar","Using signed qword indices, gathe=
r dword values from memory using writemask k1 for merging-masking."
+"VPGATHERQQ xmm1 {k1}, vm64x/i64x2","EVEX.128.66.0F38.W1 91 /r","Valid","V=
alid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","BaseReg (r): VSIB:base,=
 VectorReg (r): VSIB:index","","","Tuple1 Scalar","Using signed qword indic=
es, gather quadword values from memory using writemask k1 for merging-maski=
ng."
+"VPGATHERQQ ymm1 {k1}, vm64y/i64x4","EVEX.256.66.0F38.W1 91 /r","Valid","V=
alid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","BaseReg (r): VSIB:base,=
 VectorReg (r): VSIB:index","","","Tuple1 Scalar","Using signed qword indic=
es, gather quadword values from memory using writemask k1 for merging-maski=
ng."
+"VPGATHERQQ zmm1 {k1}, vm64z/i64x8","EVEX.512.66.0F38.W1 91 /r","Valid","V=
alid","Invalid","AVX512F","ModRM:reg (w)","BaseReg (r): VSIB:base, VectorRe=
g (r): VSIB:index","","","Tuple1 Scalar","Using signed qword indices, gathe=
r quadword values from memory using writemask k1 for merging-masking."
+"VPMAXSD xmm1{k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F38.W0 3D /r"=
,"Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r=
)","ModRM:r/m (r)","","Full Vector","Compare packed signed dword integers i=
n xmm2 and xmm3/m128/m32bcst and store packed maximum values in xmm1 using =
writemask k1."
+"VPMAXSD ymm1{k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F38.W0 3D /r"=
,"Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r=
)","ModRM:r/m (r)","","Full Vector","Compare packed signed dword integers i=
n xmm2 and xmm3/m256/m32bcst and store packed maximum values in xmm1 using =
writemask k1."
+"VPMAXSD zmm1{k1}{z}, zmm2, zmm3/m512/m32bcst","EVEX.512.66.0F38.W0 3D /r"=
,"Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM=
:r/m (r)","","Full Vector","Compare packed signed dword integers in xmm2 an=
d xmm3/m512/m32bcst and store packed maximum values in xmm1 using writemask=
 k1."
+"VPMAXSQ xmm1{k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F38.W1 3D /r"=
,"Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r=
)","ModRM:r/m (r)","","Full Vector","Compare packed signed qword integers i=
n xmm2 and xmm3/m128/m64bcst and store packed maximum values in xmm1 using =
writemask k1."
+"VPMAXSQ ymm1{k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W1 3D /r"=
,"Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r=
)","ModRM:r/m (r)","","Full Vector","Compare packed signed qword integers i=
n xmm2 and xmm3/m256/m64bcst and store packed maximum values in xmm1 using =
writemask k1."
+"VPMAXSQ zmm1{k1}{z}, zmm2, zmm3/m512/m64bcst","EVEX.512.66.0F38.W1 3D /r"=
,"Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM=
:r/m (r)","","Full Vector","Compare packed signed qword integers in xmm2 an=
d xmm3/m512/m64bcst and store packed maximum values in xmm1 using writemask=
 k1."
+"VPMAXUD xmm1{k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F38.W0 3F /r"=
,"Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r=
)","ModRM:r/m (r)","","Full Vector","Compare packed unsigned dword integers=
 in xmm2 and xmm3/m128/m32bcst and store packed maximum values in xmm1 unde=
r writemask k1."
+"VPMAXUD ymm1{k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F38.W0 3F /r"=
,"Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r=
)","ModRM:r/m (r)","","Full Vector","Compare packed unsigned dword integers=
 in ymm2 and ymm3/m256/m32bcst and store packed maximum values in ymm1 unde=
r writemask k1."
+"VPMAXUD zmm1{k1}{z}, zmm2, zmm3/m512/m32bcst","EVEX.512.66.0F38.W0 3F /r"=
,"Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM=
:r/m (r)","","Full Vector","Compare packed unsigned dword integers in zmm2 =
and zmm3/m512/m32bcst and store packed maximum values in zmm1 under writema=
sk k1."
+"VPMAXUQ xmm1{k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F38.W1 3F /r"=
,"Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r=
)","ModRM:r/m (r)","","Full Vector","Compare packed unsigned qword integers=
 in xmm2 and xmm3/m128/m64bcst and store packed maximum values in xmm1 unde=
r writemask k1."
+"VPMAXUQ ymm1{k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W1 3F /r"=
,"Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r=
)","ModRM:r/m (r)","","Full Vector","Compare packed unsigned qword integers=
 in ymm2 and ymm3/m256/m64bcst and store packed maximum values in ymm1 unde=
r writemask k1."
+"VPMAXUQ zmm1{k1}{z}, zmm2, zmm3/m512/m64bcst","EVEX.512.66.0F38.W1 3F /r"=
,"Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM=
:r/m (r)","","Full Vector","Compare packed unsigned qword integers in zmm2 =
and zmm3/m512/m64bcst and store packed maximum values in zmm1 under writema=
sk k1."
+"VPMINSD xmm1{k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F38.W0 39 /r"=
,"Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r=
)","ModRM:r/m (r)","","Full Vector","Compare packed signed dword integers i=
n xmm2 and xmm3/m128 and store packed minimum values in xmm1 under writemas=
k k1."
+"VPMINSD ymm1{k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F38.W0 39 /r"=
,"Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r=
)","ModRM:r/m (r)","","Full Vector","Compare packed signed dword integers i=
n ymm2 and ymm3/m256 and store packed minimum values in ymm1 under writemas=
k k1."
+"VPMINSD zmm1{k1}{z}, zmm2, zmm3/m512/m32bcst","EVEX.512.66.0F38.W0 39 /r"=
,"Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM=
:r/m (r)","","Full Vector","Compare packed signed dword integers in zmm2 an=
d zmm3/m512/m32bcst and store packed minimum values in zmm1 under writemask=
 k1."
+"VPMINSQ xmm1{k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F38.W1 39 /r"=
,"Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r=
)","ModRM:r/m (r)","","Full Vector","Compare packed signed qword integers i=
n xmm2 and xmm3/m128 and store packed minimum values in xmm1 under writemas=
k k1."
+"VPMINSQ ymm1{k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W1 39 /r"=
,"Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r=
)","ModRM:r/m (r)","","Full Vector","Compare packed signed qword integers i=
n ymm2 and ymm3/m256 and store packed minimum values in ymm1 under writemas=
k k1."
+"VPMINSQ zmm1{k1}{z}, zmm2, zmm3/m512/m64bcst","EVEX.512.66.0F38.W1 39 /r"=
,"Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM=
:r/m (r)","","Full Vector","Compare packed signed qword integers in zmm2 an=
d zmm3/m512/m64bcst and store packed minimum values in zmm1 under writemask=
 k1."
+"VPMINUD xmm1{k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F38.W0 3B /r"=
,"Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r=
)","ModRM:r/m (r)","","Full Vector","Compare packed unsigned dword integers=
 in xmm2 and xmm3/m128/m32bcst and store packed minimum values in xmm1 unde=
r writemask k1."
+"VPMINUD ymm1{k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F38.W0 3B /r"=
,"Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r=
)","ModRM:r/m (r)","","Full Vector","Compare packed unsigned dword integers=
 in ymm2 and ymm3/m256/m32bcst and store packed minimum values in ymm1 unde=
r writemask k1."
+"VPMINUD zmm1{k1}{z}, zmm2, zmm3/m512/m32bcst","EVEX.512.66.0F38.W0 3B /r"=
,"Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM=
:r/m (r)","","Full Vector","Compare packed unsigned dword integers in zmm2 =
and zmm3/m512/m32bcst and store packed minimum values in zmm1 under writema=
sk k1."
+"VPMINUQ xmm1{k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F38.W1 3B /r"=
,"Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r=
)","ModRM:r/m (r)","","Full Vector","Compare packed unsigned qword integers=
 in xmm2 and xmm3/m128/m64bcst and store packed minimum values in xmm1 unde=
r writemask k1."
+"VPMINUQ ymm1{k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W1 3B /r"=
,"Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r=
)","ModRM:r/m (r)","","Full Vector","Compare packed unsigned qword integers=
 in ymm2 and ymm3/m256/m64bcst and store packed minimum values in ymm1 unde=
r writemask k1."
+"VPMINUQ zmm1{k1}{z}, zmm2, zmm3/m512/m64bcst","EVEX.512.66.0F38.W1 3B /r"=
,"Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM=
:r/m (r)","","Full Vector","Compare packed unsigned qword integers in zmm2 =
and zmm3/m512/m64bcst and store packed minimum values in zmm1 under writema=
sk k1."
+"VPMOVDB xmm1/m128 {k1}{z}, zmm2","EVEX.512.F3.0F38.W0 31 /r","Valid","Val=
id","Invalid","AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Quarter Vect=
or Mem","Converts 16 packed double-word integers from zmm2 into 16 packed b=
yte integers in xmm1/m128 with truncation under writemask k1."
+"VPMOVDB xmm1/m32 {k1}{z}, xmm2","EVEX.128.F3.0F38.W0 31 /r","Valid","Vali=
d","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Quar=
ter Vector Mem","Converts 4 packed double-word integers from xmm2 into 4 pa=
cked byte integers in xmm1/m32 with truncation under writemask k1."
+"VPMOVDB xmm1/m64 {k1}{z}, ymm2","EVEX.256.F3.0F38.W0 31 /r","Valid","Vali=
d","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Quar=
ter Vector Mem","Converts 8 packed double-word integers from ymm2 into 8 pa=
cked byte integers in xmm1/m64 with truncation under writemask k1."
+"VPMOVDW xmm1/m128 {k1}{z}, ymm2","EVEX.256.F3.0F38.W0 33 /r","Valid","Val=
id","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Hal=
f Vector Mem","Converts 8 packed double-word integers from ymm2 into 8 pack=
ed word integers in xmm1/m128 with truncation under writemask k1."
+"VPMOVDW xmm1/m64 {k1}{z}, xmm2","EVEX.128.F3.0F38.W0 33 /r","Valid","Vali=
d","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Half=
 Vector Mem","Converts 4 packed double-word integers from xmm2 into 4 packe=
d word integers in xmm1/m64 with truncation under writemask k1."
+"VPMOVDW ymm1/m256 {k1}{z}, zmm2","EVEX.512.F3.0F38.W0 33 /r","Valid","Val=
id","Invalid","AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Half Vector =
Mem","Converts 16 packed double-word integers from zmm2 into 16 packed word=
 integers in ymm1/m256 with truncation under writemask k1."
+"VPMOVQB xmm1/m16 {k1}{z}, xmm2","EVEX.128.F3.0F38.W0 32 /r","Valid","Vali=
d","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Oct =
Vector Mem","Converts 2 packed quad-word integers from xmm2 into 2 packed b=
yte integers in xmm1/m16 with truncation under writemask k1."
+"VPMOVQB xmm1/m32 {k1}{z}, ymm2","EVEX.256.F3.0F38.W0 32 /r","Valid","Vali=
d","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Oct =
Vector Mem","Converts 4 packed quad-word integers from ymm2 into 4 packed b=
yte integers in xmm1/m32 with truncation under writemask k1."
+"VPMOVQB xmm1/m64 {k1}{z}, zmm2","EVEX.512.F3.0F38.W0 32 /r","Valid","Vali=
d","Invalid","AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Oct Vector Me=
m","Converts 8 packed quad-word integers from zmm2 into 8 packed byte integ=
ers in xmm1/m64 with truncation under writemask k1."
+"VPMOVQD xmm1/m64 {k1}{z}, xmm2","EVEX.128.F3.0F38.W0 35 /r","Valid","Vali=
d","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Half=
 Vector Mem","Converts 2 packed quad-word integers from xmm2 into 2 packed =
double-word integers in xmm1/m128 with truncation subject to writemask k1."
+"VPMOVQD xmm1/m128 {k1}{z}, ymm2","EVEX.256.F3.0F38.W0 35 /r","Valid","Val=
id","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Hal=
f Vector Mem","Converts 4 packed quad-word integers from ymm2 into 4 packed=
 double-word integers in xmm1/m128 with truncation subject to writemask k1."
+"VPMOVQD ymm1/m256 {k1}{z}, zmm2","EVEX.512.F3.0F38.W0 35 /r","Valid","Val=
id","Invalid","AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Half Vector =
Mem","Converts 8 packed quad-word integers from zmm2 into 8 packed double-w=
ord integers in ymm1/m256 with truncation subject to writemask k1."
+"VPMOVQW xmm1/m128 {k1}{z}, zmm2","EVEX.512.F3.0F38.W0 34 /r","Valid","Val=
id","Invalid","AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Quarter Vect=
or Mem","Converts 8 packed quad-word integers from zmm2 into 8 packed word =
integers in xmm1/m128 with truncation under writemask k1."
+"VPMOVQW xmm1/m32 {k1}{z}, xmm2","EVEX.128.F3.0F38.W0 34 /r","Valid","Vali=
d","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Quar=
ter Vector Mem","Converts 2 packed quad-word integers from xmm2 into 2 pack=
ed word integers in xmm1/m32 with truncation under writemask k1."
+"VPMOVQW xmm1/m64 {k1}{z}, ymm2","EVEX.256.F3.0F38.W0 34 /r","Valid","Vali=
d","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Quar=
ter Vector Mem","Converts 4 packed quad-word integers from ymm2 into 4 pack=
ed word integers in xmm1/m64 with truncation under writemask k1."
+"VPMOVSDB xmm1/m128 {k1}{z}, zmm2","EVEX.512.F3.0F38.W0 21 /r","Valid","Va=
lid","Invalid","AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Quarter Vec=
tor Mem","Converts 16 packed signed double-word integers from zmm2 into 16 =
packed signed byte integers in xmm1/m128 using signed saturation under writ=
emask k1."
+"VPMOVSDB xmm1/m32 {k1}{z}, xmm2","EVEX.128.F3.0F38.W0 21 /r","Valid","Val=
id","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Qua=
rter Vector Mem","Converts 4 packed signed double-word integers from xmm2 i=
nto 4 packed signed byte integers in xmm1/m32 using signed saturation under=
 writemask k1."
+"VPMOVSDB xmm1/m64 {k1}{z}, ymm2","EVEX.256.F3.0F38.W0 21 /r","Valid","Val=
id","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Qua=
rter Vector Mem","Converts 8 packed signed double-word integers from ymm2 i=
nto 8 packed signed byte integers in xmm1/m64 using signed saturation under=
 writemask k1."
+"VPMOVSDW xmm1/m128 {k1}{z}, ymm2","EVEX.256.F3.0F38.W0 23 /r","Valid","Va=
lid","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Ha=
lf Vector Mem","Converts 8 packed signed double-word integers from ymm2 int=
o 8 packed signed word integers in xmm1/m128 using signed saturation under =
writemask k1."
+"VPMOVSDW xmm1/m64 {k1}{z}, xmm2","EVEX.128.F3.0F38.W0 23 /r","Valid","Val=
id","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Hal=
f Vector Mem","Converts 4 packed signed double-word integers from xmm2 into=
 4 packed signed word integers in ymm1/m64 using signed saturation under wr=
itemask k1."
+"VPMOVSDW ymm1/m256 {k1}{z}, zmm2","EVEX.512.F3.0F38.W0 23 /r","Valid","Va=
lid","Invalid","AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Half Vector=
 Mem","Converts 16 packed signed double-word integers from zmm2 into 16 pac=
ked signed word integers in ymm1/m256 using signed saturation under writema=
sk k1."
+"VPMOVSQB xmm1/m16 {k1}{z}, xmm2","EVEX.128.F3.0F38.W0 22 /r","Valid","Val=
id","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Oct=
 Vector Mem","Converts 2 packed signed quad-word integers from xmm2 into 2 =
packed signed byte integers in xmm1/m16 using signed saturation under write=
mask k1."
+"VPMOVSQB xmm1/m32 {k1}{z}, ymm2","EVEX.256.F3.0F38.W0 22 /r","Valid","Val=
id","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Oct=
 Vector Mem","Converts 4 packed signed quad-word integers from ymm2 into 4 =
packed signed byte integers in xmm1/m32 using signed saturation under write=
mask k1."
+"VPMOVSQB xmm1/m64 {k1}{z}, zmm2","EVEX.512.F3.0F38.W0 22 /r","Valid","Val=
id","Invalid","AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Oct Vector M=
em","Converts 8 packed signed quad-word integers from zmm2 into 8 packed si=
gned byte integers in xmm1/m64 using signed saturation under writemask k1."
+"VPMOVSQD xmm1/m128 {k1}{z}, ymm2","EVEX.256.F3.0F38.W0 25 /r","Valid","Va=
lid","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Ha=
lf Vector Mem","Converts 4 packed signed quad-word integers from ymm2 into =
4 packed signed double-word integers in xmm1/m128 using signed saturation s=
ubject to writemask k1."
+"VPMOVSQD xmm1/m64 {k1}{z}, xmm2","EVEX.128.F3.0F38.W0 25 /r","Valid","Val=
id","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Hal=
f Vector Mem","Converts 2 packed signed quad-word integers from xmm2 into 2=
 packed signed double-word integers in xmm1/m64 using signed saturation sub=
ject to writemask k1."
+"VPMOVSQD ymm1/m256 {k1}{z}, zmm2","EVEX.512.F3.0F38.W0 25 /r","Valid","Va=
lid","Invalid","AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Half Vector=
 Mem","Converts 8 packed signed quad-word integers from zmm2 into 8 packed =
signed double-word integers in ymm1/m256 using signed saturation subject to=
 writemask k1."
+"VPMOVSQW xmm1/m128 {k1}{z}, zmm2","EVEX.512.F3.0F38.W0 24 /r","Valid","Va=
lid","Invalid","AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Quarter Vec=
tor Mem","Converts 8 packed signed quad-word integers from zmm2 into 8 pack=
ed signed word integers in xmm1/m128 using signed saturation under writemas=
k k1."
+"VPMOVSQW xmm1/m32 {k1}{z}, xmm2","EVEX.128.F3.0F38.W0 24 /r","Valid","Val=
id","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Qua=
rter Vector Mem","Converts 8 packed signed quad-word integers from zmm2 int=
o 8 packed signed word integers in xmm1/m32 using signed saturation under w=
ritemask k1."
+"VPMOVSQW xmm1/m64 {k1}{z}, ymm2","EVEX.256.F3.0F38.W0 24 /r","Valid","Val=
id","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Qua=
rter Vector Mem","Converts 4 packed signed quad-word integers from ymm2 int=
o 4 packed signed word integers in xmm1/m64 using signed saturation under w=
ritemask k1."
+"VPMOVSXBD xmm1{k1}{z}, xmm2/m32","EVEX.128.66.0F38.WIG 21 /r","Valid","Va=
lid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Qu=
arter Vector Mem","Sign extend 4 packed 8-bit integers in the low 4 bytes o=
f xmm2/m32 to 4 packed 32-bit integers in xmm1 subject to writemask k1."
+"VPMOVSXBD ymm1{k1}{z}, xmm2/m64","EVEX.256.66.0F38.WIG 21 /r","Valid","Va=
lid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Qu=
arter Vector Mem","Sign extend 8 packed 8-bit integers in the low 8 bytes o=
f xmm2/m64 to 8 packed 32-bit integers in ymm1 subject to writemask k1."
+"VPMOVSXBD zmm1{k1}{z}, xmm2/m128","EVEX.512.66.0F38.WIG 21 /r","Valid","V=
alid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Quarter Ve=
ctor Mem","Sign extend 16 packed 8-bit integers in the low 16 bytes of xmm2=
/m128 to 16 packed 32-bit integers in zmm1 subject to writemask k1."
+"VPMOVSXBQ xmm1{k1}{z}, xmm2/m16","EVEX.128.66.0F38.WIG 22 /r","Valid","Va=
lid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Oc=
t Vector Mem","Sign extend 2 packed 8-bit integers in the low 2 bytes of xm=
m2/m16 to 2 packed 64-bit integers in xmm1 subject to writemask k1."
+"VPMOVSXBQ ymm1{k1}{z}, xmm2/m32","EVEX.256.66.0F38.WIG 22 /r","Valid","Va=
lid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Oc=
t Vector Mem","Sign extend 4 packed 8-bit integers in the low 4 bytes of xm=
m2/m32 to 4 packed 64-bit integers in ymm1 subject to writemask k1."
+"VPMOVSXBQ zmm1{k1}{z}, xmm2/m64","EVEX.512.66.0F38.WIG 22 /r","Valid","Va=
lid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Oct Vector =
Mem","Sign extend 8 packed 8-bit integers in the low 8 bytes of xmm2/m64 to=
 8 packed 64-bit integers in zmm1 subject to writemask k1."
+"VPMOVSXDQ xmm1{k1}{z}, xmm2/m64","EVEX.128.66.0F38.W0 25 /r","Valid","Val=
id","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Hal=
f Vector Mem","Sign extend 2 packed 32-bit integers in the low 8 bytes of x=
mm2/m64 to 2 packed 64-bit integers in zmm1 using writemask k1."
+"VPMOVSXDQ ymm1{k1}{z}, xmm2/m128","EVEX.256.66.0F38.W0 25 /r","Valid","Va=
lid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Ha=
lf Vector Mem","Sign extend 4 packed 32-bit integers in the low 16 bytes of=
 xmm2/m128 to 4 packed 64-bit integers in zmm1 using writemask k1."
+"VPMOVSXDQ zmm1{k1}{z}, ymm2/m256","EVEX.512.66.0F38.W0 25 /r","Valid","Va=
lid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Half Vector=
 Mem","Sign extend 8 packed 32-bit integers in the low 32 bytes of ymm2/m25=
6 to 8 packed 64-bit integers in zmm1 using writemask k1."
+"VPMOVSXWD xmm1{k1}{z}, xmm2/m64","EVEX.128.66.0F38.WIG 23 /r","Valid","Va=
lid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Ha=
lf Vector Mem","Sign extend 4 packed 16-bit integers in the low 8 bytes of =
ymm2/mem to 4 packed 32-bit integers in xmm1 subject to writemask k1."
+"VPMOVSXWD ymm1{k1}{z}, xmm2/m128","EVEX.256.66.0F38.WIG 23 /r","Valid","V=
alid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","H=
alf Vector Mem","Sign extend 8 packed 16-bit integers in the low 16 bytes o=
f ymm2/m128 to 8 packed 32-bit integers in ymm1 subject to writemask k1."
+"VPMOVSXWD zmm1{k1}{z}, ymm2/m256","EVEX.512.66.0F38.WIG 23 /r","Valid","V=
alid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Half Vecto=
r Mem","Sign extend 16 packed 16-bit integers in the low 32 bytes of ymm2/m=
256 to 16 packed 32-bit integers in zmm1 subject to writemask k1."
+"VPMOVSXWQ xmm1{k1}{z}, xmm2/m32","EVEX.128.66.0F38.WIG 24 /r","Valid","Va=
lid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Qu=
arter Vector Mem","Sign extend 2 packed 16-bit integers in the low 4 bytes =
of xmm2/m32 to 2 packed 64-bit integers in xmm1 subject to writemask k1."
+"VPMOVSXWQ ymm1{k1}{z}, xmm2/m64","EVEX.256.66.0F38.WIG 24 /r","Valid","Va=
lid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Qu=
arter Vector Mem","Sign extend 4 packed 16-bit integers in the low 8 bytes =
of xmm2/m64 to 4 packed 64-bit integers in ymm1 subject to writemask k1."
+"VPMOVSXWQ zmm1{k1}{z}, xmm2/m128","EVEX.512.66.0F38.WIG 24 /r","Valid","V=
alid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Quarter Ve=
ctor Mem","Sign extend 8 packed 16-bit integers in the low 16 bytes of xmm2=
/m128 to 8 packed 64-bit integers in zmm1 subject to writemask k1."
+"VPMOVUSDB xmm1/m128 {k1}{z}, zmm2","EVEX.512.F3.0F38.W0 11 /r","Valid","V=
alid","Invalid","AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Quarter Ve=
ctor Mem","Converts 16 packed unsigned double-word integers from zmm2 into =
16 packed unsigned byte integers in xmm1/m128 using unsigned saturation und=
er writemask k1."
+"VPMOVUSDB xmm1/m32 {k1}{z}, xmm2","EVEX.128.F3.0F38.W0 11 /r","Valid","Va=
lid","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Qu=
arter Vector Mem","Converts 4 packed unsigned double-word integers from xmm=
2 into 4 packed unsigned byte integers in xmm1/m32 using unsigned saturatio=
n under writemask k1."
+"VPMOVUSDB xmm1/m64 {k1}{z}, ymm2","EVEX.256.F3.0F38.W0 11 /r","Valid","Va=
lid","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Qu=
arter Vector Mem","Converts 8 packed unsigned double-word integers from ymm=
2 into 8 packed unsigned byte integers in xmm1/m64 using unsigned saturatio=
n under writemask k1."
+"VPMOVUSDW xmm1/m128 {k1}{z}, ymm2","EVEX.256.F3.0F38.W0 13 /r","Valid","V=
alid","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","H=
alf Vector Mem","Converts 8 packed unsigned double-word integers from ymm2 =
into 8 packed unsigned word integers in xmm1/m128 using unsigned saturation=
 under writemask k1."
+"VPMOVUSDW xmm1/m64 {k1}{z}, xmm2","EVEX.128.F3.0F38.W0 13 /r","Valid","Va=
lid","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Ha=
lf Vector Mem","Converts 4 packed unsigned double-word integers from xmm2 i=
nto 4 packed unsigned word integers in xmm1/m64 using unsigned saturation u=
nder writemask k1."
+"VPMOVUSDW ymm1/m256 {k1}{z}, zmm2","EVEX.512.F3.0F38.W0 13 /r","Valid","V=
alid","Invalid","AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Half Vecto=
r Mem","Converts 16 packed unsigned double-word integers from zmm2 into 16 =
packed unsigned word integers in ymm1/m256 using unsigned saturation under =
writemask k1."
+"VPMOVUSQB xmm1/m16 {k1}{z}, xmm2","EVEX.128.F3.0F38.W0 12 /r","Valid","Va=
lid","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Oc=
t Vector Mem","Converts 2 packed unsigned quad-word integers from xmm2 into=
 2 packed unsigned byte integers in xmm1/m16 using unsigned saturation unde=
r writemask k1."
+"VPMOVUSQB xmm1/m32 {k1}{z}, ymm2","EVEX.256.F3.0F38.W0 12 /r","Valid","Va=
lid","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Oc=
t Vector Mem","Converts 4 packed unsigned quad-word integers from ymm2 into=
 4 packed unsigned byte integers in xmm1/m32 using unsigned saturation unde=
r writemask k1."
+"VPMOVUSQB xmm1/m64 {k1}{z}, zmm2","EVEX.512.F3.0F38.W0 12 /r","Valid","Va=
lid","Invalid","AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Oct Vector =
Mem","Converts 8 packed unsigned quad-word integers from zmm2 into 8 packed=
 unsigned byte integers in xmm1/m64 using unsigned saturation under writema=
sk k1."
+"VPMOVUSQD xmm1/m128 {k1}{z}, ymm2","EVEX.256.F3.0F38.W0 15 /r","Valid","V=
alid","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","H=
alf Vector Mem","Converts 4 packed unsigned quad-word integers from ymm2 in=
to 4 packed unsigned double-word integers in xmm1/m128 using unsigned satur=
ation subject to writemask k1."
+"VPMOVUSQD xmm1/m64 {k1}{z}, xmm2","EVEX.128.F3.0F38.W0 15 /r","Valid","Va=
lid","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Ha=
lf Vector Mem","Converts 2 packed unsigned quad-word integers from xmm2 int=
o 2 packed unsigned double-word integers in xmm1/m64 using unsigned saturat=
ion subject to writemask k1."
+"VPMOVUSQD ymm1/m256 {k1}{z}, zmm2","EVEX.512.F3.0F38.W0 15 /r","Valid","V=
alid","Invalid","AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Half Vecto=
r Mem","Converts 8 packed unsigned quad-word integers from zmm2 into 8 pack=
ed unsigned double-word integers in ymm1/m256 using unsigned saturation sub=
ject to writemask k1."
+"VPMOVUSQW xmm1/m128 {k1}{z}, zmm2","EVEX.512.F3.0F38.W0 14 /r","Valid","V=
alid","Invalid","AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Quarter Ve=
ctor Mem","Converts 8 packed unsigned quad-word integers from zmm2 into 8 p=
acked unsigned word integers in xmm1/m128 using unsigned saturation under w=
ritemask k1."
+"VPMOVUSQW xmm1/m32 {k1}{z}, xmm2","EVEX.128.F3.0F38.W0 14 /r","Valid","Va=
lid","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Qu=
arter Vector Mem","Converts 2 packed unsigned quad-word integers from xmm2 =
into 2 packed unsigned word integers in xmm1/m32 using unsigned saturation =
under writemask k1."
+"VPMOVUSQW xmm1/m64 {k1}{z}, ymm2","EVEX.256.F3.0F38.W0 14 /r","Valid","Va=
lid","Invalid","AVX512VL AVX512F","ModRM:r/m (w)","ModRM:reg (r)","","","Qu=
arter Vector Mem","Converts 4 packed unsigned quad-word integers from ymm2 =
into 4 packed unsigned word integers in xmm1/m64 using unsigned saturation =
under writemask k1."
+"VPMOVZXBD xmm1{k1}{z}, xmm2/m32","EVEX.128.66.0F38.WIG 31 /r","Valid","Va=
lid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Qu=
arter Vector Mem","Zero extend 4 packed 8-bit integers in the low 4 bytes o=
f xmm2/m32 to 4 packed 32-bit integers in xmm1 subject to writemask k1."
+"VPMOVZXBD ymm1{k1}{z}, xmm2/m64","EVEX.256.66.0F38.WIG 31 /r","Valid","Va=
lid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Qu=
arter Vector Mem","Zero extend 8 packed 8-bit integers in the low 8 bytes o=
f xmm2/m64 to 8 packed 32-bit integers in ymm1 subject to writemask k1."
+"VPMOVZXBD zmm1{k1}{z}, xmm2/m128","EVEX.512.66.0F38.WIG 31 /r","Valid","V=
alid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Quarter Ve=
ctor Mem","Zero extend 16 packed 8-bit integers in xmm2/m128 to 16 packed 3=
2-bit integers in zmm1 subject to writemask k1."
+"VPMOVZXBQ xmm1{k1}{z}, xmm2/m16","EVEX.128.66.0F38.WIG 32 /r","Valid","Va=
lid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Oc=
t Vector Mem","Zero extend 2 packed 8-bit integers in the low 2 bytes of xm=
m2/m16 to 2 packed 64-bit integers in xmm1 subject to writemask k1."
+"VPMOVZXBQ ymm1{k1}{z}, xmm2/m32","EVEX.256.66.0F38.WIG 32 /r","Valid","Va=
lid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Oc=
t Vector Mem","Zero extend 4 packed 8-bit integers in the low 4 bytes of xm=
m2/m32 to 4 packed 64-bit integers in ymm1 subject to writemask k1."
+"VPMOVZXBQ zmm1{k1}{z}, xmm2/m64","EVEX.512.66.0F38.WIG 32 /r","Valid","Va=
lid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Oct Vector =
Mem","Zero extend 8 packed 8-bit integers in the low 8 bytes of xmm2/m64 to=
 8 packed 64-bit integers in zmm1 subject to writemask k1."
+"VPMOVZXWD xmm1{k1}{z}, xmm2/m64","EVEX.128.66.0F38.WIG 33 /r","Valid","Va=
lid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Ha=
lf Vector Mem","Zero extend 4 packed 16-bit integers in the low 8 bytes of =
xmm2/m64 to 4 packed 32-bit integers in xmm1 subject to writemask k1."
+"VPMOVZXWD ymm1{k1}{z}, xmm2/m128","EVEX.256.66.0F38.WIG 33 /r","Valid","V=
alid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","H=
alf Vector Mem","Zero extend 8 packed 16-bit integers in xmm2/m128 to 8 pac=
ked 32-bit integers in zmm1 subject to writemask k1."
+"VPMOVZXWD zmm1{k1}{z}, ymm2/m256","EVEX.512.66.0F38.WIG 33 /r","Valid","V=
alid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Half Vecto=
r Mem","Zero extend 16 packed 16-bit integers in ymm2/m256 to 16 packed 32-=
bit integers in zmm1 subject to writemask k1."
+"VPMOVZXWQ xmm1{k1}{z}, xmm2/m32","EVEX.128.66.0F38.WIG 34 /r","Valid","Va=
lid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Qu=
arter Vector Mem","Zero extend 2 packed 16-bit integers in the low 4 bytes =
of xmm2/m32 to 2 packed 64-bit integers in xmm1 subject to writemask k1."
+"VPMOVZXWQ ymm1{k1}{z}, xmm2/m64","EVEX.256.66.0F38.WIG 34 /r","Valid","Va=
lid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Qu=
arter Vector Mem","Zero extend 4 packed 16-bit integers in the low 8 bytes =
of xmm2/m64 to 4 packed 64-bit integers in ymm1 subject to writemask k1."
+"VPMOVZXWQ zmm1{k1}{z}, xmm2/m128","EVEX.512.66.0F38.WIG 34 /r","Valid","V=
alid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Quarter Ve=
ctor Mem","Zero extend 8 packed 16-bit integers in xmm2/m128 to 8 packed 64=
-bit integers in zmm1 subject to writemask k1."
+"VPMULDQ xmm1{k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F38.W1 28 /r"=
,"Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r=
)","ModRM:r/m (r)","","Full Vector","Multiply packed signed doubleword inte=
gers in xmm2 by packed signed doubleword integers in xmm3/m128/m64bcst, and=
 store the quadword results in xmm1 using writemask k1."
+"VPMULDQ ymm1{k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W1 28 /r"=
,"Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r=
)","ModRM:r/m (r)","","Full Vector","Multiply packed signed doubleword inte=
gers in ymm2 by packed signed doubleword integers in ymm3/m256/m64bcst, and=
 store the quadword results in ymm1 using writemask k1."
+"VPMULDQ zmm1{k1}{z}, zmm2, zmm3/m512/m64bcst","EVEX.512.66.0F38.W1 28 /r"=
,"Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM=
:r/m (r)","","Full Vector","Multiply packed signed doubleword integers in z=
mm2 by packed signed doubleword integers in zmm3/m512/m64bcst, and store th=
e quadword results in zmm1 using writemask k1."
+"VPMULLD xmm1{k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F38.W0 40 /r"=
,"Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r=
)","ModRM:r/m (r)","","Full Vector","Multiply the packed dword signed integ=
ers in xmm2 and xmm3/m128/m32bcst and store the low 32 bits of each product=
 in xmm1 under writemask k1."
+"VPMULLD ymm1{k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F38.W0 40 /r"=
,"Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r=
)","ModRM:r/m (r)","","Full Vector","Multiply the packed dword signed integ=
ers in ymm2 and ymm3/m256/m32bcst and store the low 32 bits of each product=
 in ymm1 under writemask k1."
+"VPMULLD zmm1{k1}{z}, zmm2, zmm3/m512/m32bcst","EVEX.512.66.0F38.W0 40 /r"=
,"Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM=
:r/m (r)","","Full Vector","Multiply the packed dword signed integers in zm=
m2 and zmm3/m512/m32bcst and store the low 32 bits of each product in zmm1 =
under writemask k1."
+"VPMULUDQ xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F.W1 F4 /r"=
,"Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r=
)","ModRM:r/m (r)","","Full Vector","Multiply packed unsigned doubleword in=
tegers in xmm2 by packed unsigned doubleword integers in xmm3/m128/m64bcst,=
 and store the quadword results in xmm1 under writemask k1."
+"VPMULUDQ ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F.W1 F4 /r"=
,"Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r=
)","ModRM:r/m (r)","","Full Vector","Multiply packed unsigned doubleword in=
tegers in ymm2 by packed unsigned doubleword integers in ymm3/m256/m64bcst,=
 and store the quadword results in ymm1 under writemask k1."
+"VPMULUDQ zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst","EVEX.512.66.0F.W1 F4 /r"=
,"Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM=
:r/m (r)","","Full Vector","Multiply packed unsigned doubleword integers in=
 zmm2 by packed unsigned doubleword integers in zmm3/m512/m64bcst, and stor=
e the quadword results in zmm1 under writemask k1."
+"VPORD xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F.W0 EB /r","V=
alid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)",=
"ModRM:r/m (r)","","Full Vector","Bitwise OR of packed doubleword integers =
in xmm2 and xmm3/m128/m32bcst using writemask k1."
+"VPORD ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F.W0 EB /r","V=
alid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)",=
"ModRM:r/m (r)","","Full Vector","Bitwise OR of packed doubleword integers =
in ymm2 and ymm3/m256/m32bcst using writemask k1."
+"VPORD zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst","EVEX.512.66.0F.W0 EB /r","V=
alid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/=
m (r)","","Full Vector","Bitwise OR of packed doubleword integers in zmm2 a=
nd zmm3/m512/m32bcst using writemask k1."
+"VPORQ xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F.W1 EB /r","V=
alid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)",=
"ModRM:r/m (r)","","Full Vector","Bitwise OR of packed quadword integers in=
 xmm2 and xmm3/m128/m64bcst using writemask k1."
+"VPORQ ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F.W1 EB /r","V=
alid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)",=
"ModRM:r/m (r)","","Full Vector","Bitwise OR of packed quadword integers in=
 ymm2 and ymm3/m256/m64bcst using writemask k1."
+"VPORQ zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst","EVEX.512.66.0F.W1 EB /r","V=
alid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/=
m (r)","","Full Vector","Bitwise OR of packed quadword integers in zmm2 and=
 zmm3/m512/m64bcst using writemask k1."
+"VPROLD xmm1 {k1}{z}, xmm2/m128/m32bcst, ib","EVEX.128.66.0F.W0 72 /1 ib",=
"Valid","Valid","Invalid","AVX512VL AVX512F","VEX.vvvv (w)","ModRM:r/m (r)"=
,"ib","","Full Vector","Rotate doublewords in xmm2/m128/m32bcst left by ib.=
 Result written to xmm1 using writemask k1."
+"VPROLD ymm1 {k1}{z}, ymm2/m256/m32bcst, ib","EVEX.256.66.0F.W0 72 /1 ib",=
"Valid","Valid","Invalid","AVX512VL AVX512F","VEX.vvvv (w)","ModRM:r/m (r)"=
,"ib","","Full Vector","Rotate doublewords in ymm2/m256/m32bcst left by ib.=
 Result written to ymm1 using writemask k1."
+"VPROLD zmm1 {k1}{z}, zmm2/m512/m32bcst, ib","EVEX.512.66.0F.W0 72 /1 ib",=
"Valid","Valid","Invalid","AVX512F","VEX.vvvv (w)","ModRM:r/m (r)","ib","",=
"Full Vector","Rotate left of doublewords in zmm3/m512/m32bcst by ib. Resul=
t written to zmm1 using writemask k1."
+"VPROLQ xmm1 {k1}{z}, xmm2/m128/m64bcst, ib","EVEX.128.66.0F.W1 72 /1 ib",=
"Valid","Valid","Invalid","AVX512VL AVX512F","VEX.vvvv (w)","ModRM:r/m (r)"=
,"ib","","Full Vector","Rotate quadwords in xmm2/m128/m64bcst left by ib. R=
esult written to xmm1 using writemask k1."
+"VPROLQ ymm1 {k1}{z}, ymm2/m256/m64bcst, ib","EVEX.256.66.0F.W1 72 /1 ib",=
"Valid","Valid","Invalid","AVX512VL AVX512F","VEX.vvvv (w)","ModRM:r/m (r)"=
,"ib","","Full Vector","Rotate quadwords in ymm2/m256/m64bcst left by ib. R=
esult written to ymm1 using writemask k1."
+"VPROLQ zmm1 {k1}{z}, zmm2/m512/m64bcst, ib","EVEX.512.66.0F.W1 72 /1 ib",=
"Valid","Valid","Invalid","AVX512F","VEX.vvvv (w)","ModRM:r/m (r)","ib","",=
"Full Vector","Rotate quadwords in zmm2/m512/m64bcst left by ib. Result wri=
tten to zmm1 using writemask k1."
+"VPROLVD xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F38.W0 15 /r=
","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (=
r)","ModRM:r/m (r)","","Full Vector","Rotate doublewords in xmm2 left by co=
unt in the corresponding element of xmm3/m128/m32bcst. Result written to xm=
m1 under writemask k1."
+"VPROLVD ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F38.W0 15 /r=
","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (=
r)","ModRM:r/m (r)","","Full Vector","Rotate doublewords in ymm2 left by co=
unt in the corresponding element of ymm3/m256/m32bcst. Result written to ym=
m1 under writemask k1."
+"VPROLVD zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst","EVEX.512.66.0F38.W0 15 /r=
","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector","Rotate left of doublewords in zmm2 by count in=
 the corresponding element of zmm3/m512/m32bcst. Result written to zmm1 usi=
ng writemask k1."
+"VPROLVQ xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F38.W1 15 /r=
","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (=
r)","ModRM:r/m (r)","","Full Vector","Rotate quadwords in xmm2 left by coun=
t in the corresponding element of xmm3/m128/m64bcst. Result written to xmm1=
 under writemask k1."
+"VPROLVQ ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W1 15 /r=
","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (=
r)","ModRM:r/m (r)","","Full Vector","Rotate quadwords in ymm2 left by coun=
t in the corresponding element of ymm3/m256/m64bcst. Result written to ymm1=
 under writemask k1."
+"VPROLVQ zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst","EVEX.512.66.0F38.W1 15 /r=
","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector","Rotate quadwords in zmm2 left by count in the =
corresponding element of zmm3/m512/m64bcst. Result written to zmm1under wri=
temask k1."
+"VPRORD xmm1 {k1}{z}, xmm2/m128/m32bcst, ib","EVEX.128.66.0F.W0 72 /0 ib",=
"Valid","Valid","Invalid","AVX512VL AVX512F","VEX.vvvv (w)","ModRM:r/m (r)"=
,"ib","","Full Vector","Rotate doublewords in xmm2/m128/m32bcst right by ib=
, store result using writemask k1."
+"VPRORD ymm1 {k1}{z}, ymm2/m256/m32bcst, ib","EVEX.256.66.0F.W0 72 /0 ib",=
"Valid","Valid","Invalid","AVX512VL AVX512F","VEX.vvvv (w)","ModRM:r/m (r)"=
,"ib","","Full Vector","Rotate doublewords in ymm2/m256/m32bcst right by ib=
, store result using writemask k1."
+"VPRORD zmm1 {k1}{z}, zmm2/m512/m32bcst, ib","EVEX.512.66.0F.W0 72 /0 ib",=
"Valid","Valid","Invalid","AVX512F","VEX.vvvv (w)","ModRM:r/m (r)","ib","",=
"Full Vector","Rotate doublewords in zmm2/m512/m32bcst right by ib, store r=
esult using writemask k1."
+"VPRORQ xmm1 {k1}{z}, xmm2/m128/m64bcst, ib","EVEX.128.66.0F.W1 72 /0 ib",=
"Valid","Valid","Invalid","AVX512VL AVX512F","VEX.vvvv (w)","ModRM:r/m (r)"=
,"ib","","Full Vector","Rotate quadwords in xmm2/m128/m64bcst right by ib, =
store result using writemask k1."
+"VPRORQ ymm1 {k1}{z}, ymm2/m256/m64bcst, ib","EVEX.256.66.0F.W1 72 /0 ib",=
"Valid","Valid","Invalid","AVX512VL AVX512F","VEX.vvvv (w)","ModRM:r/m (r)"=
,"ib","","Full Vector","Rotate quadwords in ymm2/m256/m64bcst right by ib, =
store result using writemask k1."
+"VPRORQ zmm1 {k1}{z}, zmm2/m512/m64bcst, ib","EVEX.512.66.0F.W1 72 /0 ib",=
"Valid","Valid","Invalid","AVX512F","VEX.vvvv (w)","ModRM:r/m (r)","ib","",=
"Full Vector","Rotate quadwords in zmm2/m512/m64bcst right by ib, store res=
ult using writemask k1."
+"VPRORVD xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F38.W0 14 /r=
","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (=
r)","ModRM:r/m (r)","","Full Vector","Rotate doublewords in xmm2 right by c=
ount in the corresponding element of xmm3/m128/m32bcst, store result using =
writemask k1."
+"VPRORVD ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F38.W0 14 /r=
","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (=
r)","ModRM:r/m (r)","","Full Vector","Rotate doublewords in ymm2 right by c=
ount in the corresponding element of ymm3/m256/m32bcst, store using result =
writemask k1."
+"VPRORVD zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst","EVEX.512.66.0F38.W0 14 /r=
","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector","Rotate doublewords in zmm2 right by count in t=
he corresponding element of zmm3/m512/m32bcst, store result using writemask=
 k1."
+"VPRORVQ xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F38.W1 14 /r=
","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (=
r)","ModRM:r/m (r)","","Full Vector","Rotate quadwords in xmm2 right by cou=
nt in the corresponding element of xmm3/m128/m64bcst, store result using wr=
itemask k1."
+"VPRORVQ ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W1 14 /r=
","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (=
r)","ModRM:r/m (r)","","Full Vector","Rotate quadwords in ymm2 right by cou=
nt in the corresponding element of ymm3/m256/m64bcst, store result using wr=
itemask k1."
+"VPRORVQ zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst","EVEX.512.66.0F38.W1 14 /r=
","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector","Rotate quadwords in zmm2 right by count in the=
 corresponding element of zmm3/m512/m64bcst, store result using writemask k=
1."
+"VPSCATTERDD vm32x/i32x4 {k1}, xmm1","EVEX.128.66.0F38.W0 A0 /r","Valid","=
Valid","Invalid","AVX512VL AVX512F","BaseReg (r): VSIB:base, VectorReg (r):=
 VSIB:index","ModRM:reg (r)","","","","Using signed dword indices, scatter =
dword values to memory using writemask k1."
+"VPSCATTERDD vm32y/i32x8 {k1}, ymm1","EVEX.256.66.0F38.W0 A0 /r","Valid","=
Valid","Invalid","AVX512VL AVX512F","BaseReg (r): VSIB:base, VectorReg (r):=
 VSIB:index","ModRM:reg (r)","","","","Using signed dword indices, scatter =
dword values to memory using writemask k1."
+"VPSCATTERDD vm32z/i32x16 {k1}, zmm1","EVEX.512.66.0F38.W0 A0 /r","Valid",=
"Valid","Invalid","AVX512F","BaseReg (r): VSIB:base, VectorReg (r): VSIB:in=
dex","ModRM:reg (r)","","","","Using signed dword indices, scatter dword va=
lues to memory using writemask k1."
+"VPSCATTERDQ vm32x/i64x2 {k1}, xmm1","EVEX.128.66.0F38.W1 A0 /r","Valid","=
Valid","Invalid","AVX512VL AVX512F","BaseReg (r): VSIB:base, VectorReg (r):=
 VSIB:index","ModRM:reg (r)","","","","Using signed dword indices, scatter =
qword values to memory using writemask k1."
+"VPSCATTERDQ vm32x/i64x4 {k1}, ymm1","EVEX.256.66.0F38.W1 A0 /r","Valid","=
Valid","Invalid","AVX512VL AVX512F","BaseReg (r): VSIB:base, VectorReg (r):=
 VSIB:index","ModRM:reg (r)","","","","Using signed dword indices, scatter =
qword values to memory using writemask k1."
+"VPSCATTERDQ vm32y/i64x8 {k1}, zmm1","EVEX.512.66.0F38.W1 A0 /r","Valid","=
Valid","Invalid","AVX512F","BaseReg (r): VSIB:base, VectorReg (r): VSIB:ind=
ex","ModRM:reg (r)","","","","Using signed dword indices, scatter qword val=
ues to memory using writemask k1."
+"VPSCATTERQD vm64x/i32x2 {k1}, xmm1","EVEX.128.66.0F38.W0 A1 /r","Valid","=
Valid","Invalid","AVX512VL AVX512F","BaseReg (r): VSIB:base, VectorReg (r):=
 VSIB:index","ModRM:reg (r)","","","","Using signed qword indices, scatter =
dword values to memory using writemask k1."
+"VPSCATTERQD vm64y/i32x4 {k1}, xmm1","EVEX.256.66.0F38.W0 A1 /r","Valid","=
Valid","Invalid","AVX512VL AVX512F","BaseReg (r): VSIB:base, VectorReg (r):=
 VSIB:index","ModRM:reg (r)","","","","Using signed qword indices, scatter =
dword values to memory using writemask k1."
+"VPSCATTERQD vm64z/i32x8 {k1}, ymm1","EVEX.512.66.0F38.W0 A1 /r","Valid","=
Valid","Invalid","AVX512F","BaseReg (r): VSIB:base, VectorReg (r): VSIB:ind=
ex","ModRM:reg (r)","","","","Using signed qword indices, scatter dword val=
ues to memory using writemask k1."
+"VPSCATTERQQ vm64x/i64x2 {k1}, xmm1","EVEX.128.66.0F38.W1 A1 /r","Valid","=
Valid","Invalid","AVX512VL AVX512F","BaseReg (r): VSIB:base, VectorReg (r):=
 VSIB:index","ModRM:reg (r)","","","","Using signed qword indices, scatter =
qword values to memory using writemask k1."
+"VPSCATTERQQ vm64y/i64x4 {k1}, ymm1","EVEX.256.66.0F38.W1 A1 /r","Valid","=
Valid","Invalid","AVX512VL AVX512F","BaseReg (r): VSIB:base, VectorReg (r):=
 VSIB:index","ModRM:reg (r)","","","","Using signed qword indices, scatter =
qword values to memory using writemask k1."
+"VPSCATTERQQ vm64z/i64x8 {k1}, zmm1","EVEX.512.66.0F38.W1 A1 /r","Valid","=
Valid","Invalid","AVX512F","BaseReg (r): VSIB:base, VectorReg (r): VSIB:ind=
ex","ModRM:reg (r)","","","","Using signed qword indices, scatter qword val=
ues to memory using writemask k1."
+"VPSHUFD xmm1 {k1}{z}, xmm2/m128/m32bcst, ib","EVEX.128.66.0F.W0 70 /r ib"=
,"Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r=
)","ib","","Full Vector","Shuffle the doublewords in xmm2/m128/m32bcst base=
d on the encoding in ib and store the result in xmm1 using writemask k1."
+"VPSHUFD ymm1 {k1}{z}, ymm2/m256/m32bcst, ib","EVEX.256.66.0F.W0 70 /r ib"=
,"Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r=
)","ib","","Full Vector","Shuffle the doublewords in ymm2/m256/m32bcst base=
d on the encoding in ib and store the result in ymm1 using writemask k1."
+"VPSHUFD zmm1 {k1}{z}, zmm2/m512/m32bcst, ib","EVEX.512.66.0F.W0 70 /r ib"=
,"Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","ib","=
","Full Vector","Shuffle the doublewords in zmm2/m512/m32bcst based on the =
encoding in ib and store the result in zmm1 using writemask k1."
+"VPSLLD xmm1 {k1}{z}, xmm2/m128/m32bcst, ib","EVEX.128.66.0F.W0 72 /6 ib",=
"Valid","Valid","Invalid","AVX512VL AVX512F","EVEX.vvvv (w)","ModRM:r/m (r)=
","ib","","Full Vector","Shift doublewords in xmm2/m128/m32bcst left by ib =
while shifting in 0s using writemask k1."
+"VPSLLD ymm1 {k1}{z}, ymm2/m256/m32bcst, ib","EVEX.256.66.0F.W0 72 /6 ib",=
"Valid","Valid","Invalid","AVX512VL AVX512F","EVEX.vvvv (w)","ModRM:r/m (r)=
","ib","","Full Vector","Shift doublewords in ymm2/m256/m32bcst left by ib =
while shifting in 0s using writemask k1."
+"VPSLLD zmm1 {k1}{z}, zmm2/m512/m32bcst, ib","EVEX.512.66.0F.W0 72 /6 ib",=
"Valid","Valid","Invalid","AVX512F","EVEX.vvvv (w)","ModRM:r/m (r)","ib",""=
,"Full Vector","Shift doublewords in zmm2/m512/m32bcst left by ib while shi=
fting in 0s using writemask k1."
+"VPSLLD xmm1 {k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F.W0 F2 /r","Valid","=
Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r=
/m (r)","","Mem128","Shift doublewords in xmm2 left by amount specified in =
xmm3/m128 while shifting in 0s under writemask k1."
+"VPSLLD ymm1 {k1}{z}, ymm2, xmm3/m128","EVEX.256.66.0F.W0 F2 /r","Valid","=
Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r=
/m (r)","","Mem128","Shift doublewords in ymm2 left by amount specified in =
xmm3/m128 while shifting in 0s under writemask k1."
+"VPSLLD zmm1 {k1}{z}, zmm2, xmm3/m128","EVEX.512.66.0F.W0 F2 /r","Valid","=
Valid","Invalid","AVX512F","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","=
","Mem128","Shift doublewords in zmm2 left by amount specified in xmm3/m128=
 while shifting in 0s under writemask k1."
+"VPSLLQ xmm1 {k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F.W1 F3 /r","Valid","=
Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r=
/m (r)","","Mem128","Shift quadwords in xmm2 left by amount specified in xm=
m3/m128 while shifting in 0s using writemask k1."
+"VPSLLQ ymm1 {k1}{z}, ymm2, xmm3/m128","EVEX.256.66.0F.W1 F3 /r","Valid","=
Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r=
/m (r)","","Mem128","Shift quadwords in ymm2 left by amount specified in xm=
m3/m128 while shifting in 0s using writemask k1."
+"VPSLLQ zmm1 {k1}{z}, zmm2, xmm3/m128","EVEX.512.66.0F.W1 F3 /r","Valid","=
Valid","Invalid","AVX512F","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","=
","Mem128","Shift quadwords in zmm2 left by amount specified in xmm3/m128 w=
hile shifting in 0s using writemask k1."
+"VPSLLVD xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F38.W0 47 /r=
","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (=
r)","ModRM:r/m (r)","","Full Vector","Shift doublewords in xmm2 left by amo=
unt specified in the corresponding element of xmm3/m128/m32bcst while shift=
ing in 0s using writemask k1."
+"VPSLLVD ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F38.W0 47 /r=
","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (=
r)","ModRM:r/m (r)","","Full Vector","Shift doublewords in ymm2 left by amo=
unt specified in the corresponding element of ymm3/m256/m32bcst while shift=
ing in 0s using writemask k1."
+"VPSLLVD zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst","EVEX.512.66.0F38.W0 47 /r=
","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector","Shift doublewords in zmm2 left by amount speci=
fied in the corresponding element of zmm3/m512/m32bcst while shifting in 0s=
 using writemask k1."
+"VPSLLVQ xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F38.W1 47 /r=
","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (=
r)","ModRM:r/m (r)","","Full Vector","Shift quadwords in xmm2 left by amoun=
t specified in the corresponding element of xmm3/m128/m64bcst while shiftin=
g in 0s using writemask k1."
+"VPSLLVQ ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W1 47 /r=
","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (=
r)","ModRM:r/m (r)","","Full Vector","Shift quadwords in ymm2 left by amoun=
t specified in the corresponding element of ymm3/m256/m64bcst while shiftin=
g in 0s using writemask k1."
+"VPSLLVQ zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst","EVEX.512.66.0F38.W1 47 /r=
","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector","Shift quadwords in zmm2 left by amount specifi=
ed in the corresponding element of zmm3/m512/m64bcst while shifting in 0s u=
sing writemask k1."
+"VPSRAD xmm1 {k1}{z}, xmm2/m128/m32bcst, ib","EVEX.128.66.0F.W0 72 /4 ib",=
"Valid","Valid","Invalid","AVX512VL AVX512F","EVEX.vvvv (w)","ModRM:r/m (r)=
","ib","","Full Vector","Shift doublewords in xmm2/m128/m32bcst right by ib=
 while shifting in sign bits using writemask k1."
+"VPSRAD ymm1 {k1}{z}, ymm2/m256/m32bcst, ib","EVEX.256.66.0F.W0 72 /4 ib",=
"Valid","Valid","Invalid","AVX512VL AVX512F","EVEX.vvvv (w)","ModRM:r/m (r)=
","ib","","Full Vector","Shift doublewords in ymm2/m256/m32bcst right by ib=
 while shifting in sign bits using writemask k1."
+"VPSRAD zmm1 {k1}{z}, zmm2/m512/m32bcst, ib","EVEX.512.66.0F.W0 72 /4 ib",=
"Valid","Valid","Invalid","AVX512F","EVEX.vvvv (w)","ModRM:r/m (r)","ib",""=
,"Full Vector","Shift doublewords in zmm2/m512/m32bcst right by ib while sh=
ifting in sign bits using writemask k1."
+"VPSRAD xmm1 {k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F.W0 E2 /r","Valid","=
Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:=
r/m (r)","","Mem128","Shift doublewords in xmm2 right by amount specified i=
n xmm3/m128 while shifting in sign bits using writemask k1."
+"VPSRAD ymm1 {k1}{z}, ymm2, xmm3/m128","EVEX.256.66.0F.W0 E2 /r","Valid","=
Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:=
r/m (r)","","Mem128","Shift doublewords in ymm2 right by amount specified i=
n xmm3/m128 while shifting in sign bits using writemask k1."
+"VPSRAD zmm1 {k1}{z}, zmm2, xmm3/m128","EVEX.512.66.0F.W0 E2 /r","Valid","=
Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)",=
"","Mem128","Shift doublewords in zmm2 right by amount specified in xmm3/m1=
28 while shifting in sign bits using writemask k1."
+"VPSRAQ xmm1 {k1}{z}, xmm2/m128/m64bcst, ib","EVEX.128.66.0F.W1 72 /4 ib",=
"Valid","Valid","Invalid","AVX512VL AVX512F","EVEX.vvvv (w)","ModRM:r/m (r)=
","ib","","Full Vector","Shift quadwords in xmm2/m128/m64bcst right by ib w=
hile shifting in sign bits using writemask k1."
+"VPSRAQ ymm1 {k1}{z}, ymm2/m256/m64bcst, ib","EVEX.256.66.0F.W1 72 /4 ib",=
"Valid","Valid","Invalid","AVX512VL AVX512F","EVEX.vvvv (w)","ModRM:r/m (r)=
","ib","","Full Vector","Shift quadwords in ymm2/m256/m64bcst right by ib w=
hile shifting in sign bits using writemask k1."
+"VPSRAQ zmm1 {k1}{z}, zmm2/m512/m64bcst, ib","EVEX.512.66.0F.W1 72 /4 ib",=
"Valid","Valid","Invalid","AVX512F","EVEX.vvvv (w)","ModRM:r/m (r)","ib",""=
,"Full Vector","Shift quadwords in zmm2/m512/m64bcst right by ib while shif=
ting in sign bits using writemask k1."
+"VPSRAQ xmm1 {k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F.W1 E2 /r","Valid","=
Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:=
r/m (r)","","Mem128","Shift quadwords in xmm2 right by amount specified in =
xmm3/m128 while shifting in sign bits using writemask k1."
+"VPSRAQ ymm1 {k1}{z}, ymm2, xmm3/m128","EVEX.256.66.0F.W1 E2 /r","Valid","=
Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:=
r/m (r)","","Mem128","Shift quadwords in ymm2 right by amount specified in =
xmm3/m128 while shifting in sign bits using writemask k1."
+"VPSRAQ zmm1 {k1}{z}, zmm2, xmm3/m128","EVEX.512.66.0F.W1 E2 /r","Valid","=
Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)",=
"","Mem128","Shift quadwords in zmm2 right by amount specified in xmm3/m128=
 while shifting in sign bits using writemask k1."
+"VPSRAVD xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F38.W0 46 /r=
","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (=
r)","ModRM:r/m (r)","","Full Vector","Shift doublewords in xmm2 right by am=
ount specified in the corresponding element of xmm3/m128/m32bcst while shif=
ting in sign bits using writemask k1."
+"VPSRAVD ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F38.W0 46 /r=
","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (=
r)","ModRM:r/m (r)","","Full Vector","Shift doublewords in ymm2 right by am=
ount specified in the corresponding element of ymm3/m256/m32bcst while shif=
ting in sign bits using writemask k1."
+"VPSRAVD zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst","EVEX.512.66.0F38.W0 46 /r=
","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector","Shift doublewords in zmm2 right by amount spec=
ified in the corresponding element of zmm3/m512/m32bcst while shifting in s=
ign bits using writemask k1."
+"VPSRAVQ xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F38.W1 46 /r=
","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (=
r)","ModRM:r/m (r)","","Full Vector","Shift quadwords in xmm2 right by amou=
nt specified in the corresponding element of xmm3/m128/m64bcst while shifti=
ng in sign bits using writemask k1."
+"VPSRAVQ ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W1 46 /r=
","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (=
r)","ModRM:r/m (r)","","Full Vector","Shift quadwords in ymm2 right by amou=
nt specified in the corresponding element of ymm3/m256/m64bcst while shifti=
ng in sign bits using writemask k1."
+"VPSRAVQ zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst","EVEX.512.66.0F38.W1 46 /r=
","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector","Shift quadwords in zmm2 right by amount specif=
ied in the corresponding element of zmm3/m512/m64bcst while shifting in sig=
n bits using writemask k1."
+"VPSRLD xmm1 {k1}{z}, xmm2/m128/m32bcst, ib","EVEX.128.66.0F.W0 72 /2 ib",=
"Valid","Valid","Invalid","AVX512VL AVX512F","EVEX.vvvv (w)","ModRM:r/m (r)=
","ib","","Full Vector","Shift doublewords in xmm2/m128/m32bcst right by ib=
 while shifting in 0s using writemask k1."
+"VPSRLD ymm1 {k1}{z}, ymm2/m256/m32bcst, ib","EVEX.256.66.0F.W0 72 /2 ib",=
"Valid","Valid","Invalid","AVX512VL AVX512F","EVEX.vvvv (w)","ModRM:r/m (r)=
","ib","","Full Vector","Shift doublewords in ymm2/m256/m32bcst right by ib=
 while shifting in 0s using writemask k1."
+"VPSRLD zmm1 {k1}{z}, zmm2/m512/m32bcst, ib","EVEX.512.66.0F.W0 72 /2 ib",=
"Valid","Valid","Invalid","AVX512F","EVEX.vvvv (w)","ModRM:r/m (r)","ib",""=
,"Full Vector","Shift doublewords in zmm2/m512/m32bcst right by ib while sh=
ifting in 0s using writemask k1."
+"VPSRLD xmm1 {k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F.W0 D2 /r","Valid","=
Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r=
/m (r)","","Mem128","Shift doublewords in xmm2 right by amount specified in=
 xmm3/m128 while shifting in 0s using writemask k1."
+"VPSRLD ymm1 {k1}{z}, ymm2, xmm3/m128","EVEX.256.66.0F.W0 D2 /r","Valid","=
Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r=
/m (r)","","Mem128","Shift doublewords in ymm2 right by amount specified in=
 xmm3/m128 while shifting in 0s using writemask k1."
+"VPSRLD zmm1 {k1}{z}, zmm2, xmm3/m128","EVEX.512.66.0F.W0 D2 /r","Valid","=
Valid","Invalid","AVX512F","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","=
","Mem128","Shift doublewords in zmm2 right by amount specified in xmm3/m12=
8 while shifting in 0s using writemask k1."
+"VPSRLQ xmm1 {k1}{z}, xmm2, xmm3/m128","EVEX.128.66.0F.W1 D3 /r","Valid","=
Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r=
/m (r)","","Mem128","Shift quadwords in xmm2 right by amount specified in x=
mm3/m128 while shifting in 0s using writemask k1."
+"VPSRLQ ymm1 {k1}{z}, ymm2, xmm3/m128","EVEX.256.66.0F.W1 D3 /r","Valid","=
Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r=
/m (r)","","Mem128","Shift quadwords in ymm2 right by amount specified in x=
mm3/m128 while shifting in 0s using writemask k1."
+"VPSRLQ zmm1 {k1}{z}, zmm2, xmm3/m128","EVEX.512.66.0F.W1 D3 /r","Valid","=
Valid","Invalid","AVX512F","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","=
","Mem128","Shift quadwords in zmm2 right by amount specified in xmm3/m128 =
while shifting in 0s using writemask k1."
+"VPSRLVD xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F38.W0 45 /r=
","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (=
r)","ModRM:r/m (r)","","Full Vector","Shift doublewords in xmm2 right by am=
ount specified in the corresponding element of xmm3/m128/m32bcst while shif=
ting in 0s using writemask k1."
+"VPSRLVD ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F38.W0 45 /r=
","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (=
r)","ModRM:r/m (r)","","Full Vector","Shift doublewords in ymm2 right by am=
ount specified in the corresponding element of ymm3/m256/m32bcst while shif=
ting in 0s using writemask k1."
+"VPSRLVD zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst","EVEX.512.66.0F38.W0 45 /r=
","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector","Shift doublewords in zmm2 right by amount spec=
ified in the corresponding element of zmm3/m512/m32bcst while shifting in 0=
s using writemask k1."
+"VPSRLVQ xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F38.W1 45 /r=
","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (=
r)","ModRM:r/m (r)","","Full Vector","Shift quadwords in xmm2 right by amou=
nt specified in the corresponding element of xmm3/m128/m64bcst while shifti=
ng in 0s using writemask k1."
+"VPSRLVQ ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W1 45 /r=
","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (=
r)","ModRM:r/m (r)","","Full Vector","Shift quadwords in ymm2 right by amou=
nt specified in the corresponding element of ymm3/m256/m64bcst while shifti=
ng in 0s using writemask k1."
+"VPSRLVQ zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst","EVEX.512.66.0F38.W1 45 /r=
","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector","Shift quadwords in zmm2 right by amount specif=
ied in the corresponding element of zmm3/m512/m64bcst while shifting in 0s =
using writemask k1."
+"VPSUBQ xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F.W1 FB /r","=
Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Subtract packed quadword integers in xmm=
3/m128/m64bcst from xmm2 and store in xmm1 using writemask k1."
+"VPSUBQ ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F.W1 FB /r","=
Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Subtract packed quadword integers in ymm=
3/m256/m64bcst from ymm2 and store in ymm1 using writemask k1."
+"VPSUBQ zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst","EVEX.512.66.0F.W1 FB /r","=
Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r=
/m (r)","","Full Vector","Subtract packed quadword integers in zmm3/m512/m6=
4bcst from zmm2 and store in zmm1 using writemask k1."
+"VPTERNLOGD xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst, ib","EVEX.128.66.0F3A.W=
0 25 /r ib","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)"=
,"EVEX.vvvv (r)","ModRM:r/m (r)","ib","Full Vector","Bitwise ternary logic =
taking xmm1, xmm2 and xmm3/m128/m32bcst as source operands and writing the =
result to xmm1 under writemask k1 with dword granularity. The immediate val=
ue determines the specific binary function being implemented."
+"VPTERNLOGD ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst, ib","EVEX.256.66.0F3A.W=
0 25 /r ib","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)"=
,"EVEX.vvvv (r)","ModRM:r/m (r)","ib","Full Vector","Bitwise ternary logic =
taking ymm1, ymm2 and ymm3/m256/m32bcst as source operands and writing the =
result to ymm1 under writemask k1 with dword granularity. The immediate val=
ue determines the specific binary function being implemented."
+"VPTERNLOGD zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst, ib","EVEX.512.66.0F3A.W=
0 25 /r ib","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vv=
vv (r)","ModRM:r/m (r)","ib","Full Vector","Bitwise ternary logic taking zm=
m1, zmm2 and zmm3/m512/m32bcst as source operands and writing the result to=
 zmm1 under writemask k1 with dword granularity. The immediate value determ=
ines the specific binary function being implemented."
+"VPTERNLOGQ xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst, ib","EVEX.128.66.0F3A.W=
1 25 /r ib","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)"=
,"EVEX.vvvv (r)","ModRM:r/m (r)","ib","Full Vector","Bitwise ternary logic =
taking xmm1, xmm2 and xmm3/m128/m64bcst as source operands and writing the =
result to xmm1 under writemask k1 with qword granularity. The immediate val=
ue determines the specific binary function being implemented."
+"VPTERNLOGQ ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst, ib","EVEX.256.66.0F3A.W=
1 25 /r ib","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (r, w)"=
,"EVEX.vvvv (r)","ModRM:r/m (r)","ib","Full Vector","Bitwise ternary logic =
taking ymm1, ymm2 and ymm3/m256/m64bcst as source operands and writing the =
result to ymm1 under writemask k1 with qword granularity. The immediate val=
ue determines the specific binary function being implemented."
+"VPTERNLOGQ zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst, ib","EVEX.512.66.0F3A.W=
1 25 /r ib","Valid","Valid","Invalid","AVX512F","ModRM:reg (r, w)","EVEX.vv=
vv (r)","ModRM:r/m (r)","ib","Full Vector","Bitwise ternary logic taking zm=
m1, zmm2 and zmm3/m512/m64bcst as source operands and writing the result to=
 zmm1 under writemask k1 with qword granularity. The immediate value determ=
ines the specific binary function being implemented."
+"VPTESTMD k2 {k1}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F38.W0 27 /r","V=
alid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)",=
"ModRM:r/m (r)","","Full Vector","Bitwise AND of packed doubleword integers=
 in xmm2 and xmm3/m128/m32bcst and set mask k2 to reflect the zero/non-zero=
 status of each element of the result, under writemask k1."
+"VPTESTMD k2 {k1}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F38.W0 27 /r","V=
alid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)",=
"ModRM:r/m (r)","","Full Vector","Bitwise AND of packed doubleword integers=
 in ymm2 and ymm3/m256/m32bcst and set mask k2 to reflect the zero/non-zero=
 status of each element of the result, under writemask k1."
+"VPTESTMD k2 {k1}, zmm2, zmm3/m512/m32bcst","EVEX.512.66.0F38.W0 27 /r","V=
alid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/=
m (r)","","Full Vector","Bitwise AND of packed doubleword integers in zmm2 =
and zmm3/m512/m32bcst and set mask k2 to reflect the zero/non-zero status o=
f each element of the result, under writemask k1."
+"VPTESTMQ k2 {k1}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F38.W1 27 /r","V=
alid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)",=
"ModRM:r/m (r)","","Full Vector","Bitwise AND of packed quadword integers i=
n xmm2 and xmm3/m128/m64bcst and set mask k2 to reflect the zero/non-zero s=
tatus of each element of the result, under writemask k1."
+"VPTESTMQ k2 {k1}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W1 27 /r","V=
alid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)",=
"ModRM:r/m (r)","","Full Vector","Bitwise AND of packed quadword integers i=
n ymm2 and ymm3/m256/m64bcst and set mask k2 to reflect the zero/non-zero s=
tatus of each element of the result, under writemask k1."
+"VPTESTMQ k2 {k1}, zmm2, zmm3/m512/m64bcst","EVEX.512.66.0F38.W1 27 /r","V=
alid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/=
m (r)","","Full Vector","Bitwise AND of packed quadword integers in zmm2 an=
d zmm3/m512/m64bcst and set mask k2 to reflect the zero/non-zero status of =
each element of the result, under writemask k1."
+"VPTESTNMD k2 {k1}, xmm2, xmm3/m128/m32bcst","EVEX.128.F3.0F38.W0 27 /r","=
Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Bitwise NAND of packed doubleword intege=
rs in xmm2 and xmm3/m128/m32bcst and set mask k2 to reflect the zero/non-ze=
ro status of each element of the result,under writemask k1."
+"VPTESTNMD k2 {k1}, ymm2, ymm3/m256/m32bcst","EVEX.256.F3.0F38.W0 27 /r","=
Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Bitwise NAND of packed doubleword intege=
rs in ymm2 and ymm3/m256/m32bcst and set mask k2 to reflect the zero/non-ze=
ro status of each element of the result,under writemask k1."
+"VPTESTNMD k2 {k1}, zmm2, zmm3/m512/m32bcst","EVEX.512.F3.0F38.W0 27 /r","=
Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Bitwise NAND of packed doubleword intege=
rs in zmm2 and zmm3/m512/m32bcst and set mask k2 to reflect the zero/non-ze=
ro status of each element of the result,under writemask k1."
+"VPTESTNMQ k2 {k1}, xmm2, xmm3/m128/m64bcst","EVEX.128.F3.0F38.W1 27 /r","=
Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Bitwise NAND of packed quadword integers=
 in xmm2 and xmm3/m128/m64bcst and set mask k2 to reflect the zero/non-zero=
 status of each element of the result,under writemask k1."
+"VPTESTNMQ k2 {k1}, ymm2, ymm3/m256/m64bcst","EVEX.256.F3.0F38.W1 27 /r","=
Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Bitwise NAND of packed quadword integers=
 in ymm2 and ymm3/m256/m64bcst and set mask k2 to reflect the zero/non-zero=
 status of each element of the result,under writemask k1."
+"VPTESTNMQ k2 {k1}, zmm2, zmm3/m512/m64bcst","EVEX.512.F3.0F38.W1 27 /r","=
Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Bitwise NAND of packed quadword integers=
 in zmm2 and zmm3/m512/m64bcst and set mask k2 to reflect the zero/non-zero=
 status of each element of the result,under writemask k1."
+"VPUNPCKHDQ xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F.W0 6A /=
r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv =
(r)","ModRM:r/m (r)","","Full Vector","Interleave high-order doublewords fr=
om xmm2 and xmm3/m128/m32bcst into xmm1 register using k1 write mask."
+"VPUNPCKHQDQ xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F.W1 6D =
/r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Interleave high-order quadword from=
 xmm2 and xmm3/m128/m64bcst into xmm1 register using k1 write mask."
+"VPUNPCKLDQ xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F.W0 62 /=
r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv =
(r)","ModRM:r/m (r)","","Full Vector","Interleave low-order doublewords fro=
m xmm2 and xmm3/m128/m32bcst into xmm1 register subject to write mask k1."
+"VPUNPCKLQDQ xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F.W1 6C =
/r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Interleave low-order quadword from =
zmm2 and zmm3/m512/m64bcst into zmm1 register subject to write mask k1."
+"VPXORD xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F.W0 EF /r","=
Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Bitwise XOR of packed doubleword integer=
s in xmm2 and xmm3/m128 using writemask k1."
+"VPXORD ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F.W0 EF /r","=
Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Bitwise XOR of packed doubleword integer=
s in ymm2 and ymm3/m256 using writemask k1."
+"VPXORD zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst","EVEX.512.66.0F.W0 EF /r","=
Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r=
/m (r)","","Full Vector","Bitwise XOR of packed doubleword integers in zmm2=
 and zmm3/m512/m32bcst using writemask k1."
+"VPXORQ xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F.W1 EF /r","=
Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Bitwise XOR of packed quadword integers =
in xmm2 and xmm3/m128 using writemask k1."
+"VPXORQ ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F.W1 EF /r","=
Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Bitwise XOR of packed quadword integers =
in ymm2 and ymm3/m256 using writemask k1."
+"VPXORQ zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst","EVEX.512.66.0F.W1 EF /r","=
Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r=
/m (r)","","Full Vector","Bitwise XOR of packed quadword integers in zmm2 a=
nd zmm3/m512/m64bcst using writemask k1."
+"VRCP14PD xmm1 {k1}{z}, xmm2/m128/m64bcst","EVEX.128.66.0F38.W1 4C /r","Va=
lid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","=
","","Full Vector","Computes the approximate reciprocals of the packed doub=
le-precision floating-point values in xmm2/m128/m64bcst and stores the resu=
lts in xmm1. Under writemask."
+"VRCP14PD ymm1 {k1}{z}, ymm2/m256/m64bcst","EVEX.256.66.0F38.W1 4C /r","Va=
lid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","=
","","Full Vector","Computes the approximate reciprocals of the packed doub=
le-precision floating-point values in ymm2/m256/m64bcst and stores the resu=
lts in ymm1. Under writemask."
+"VRCP14PD zmm1 {k1}{z}, zmm2/m512/m64bcst","EVEX.512.66.0F38.W1 4C /r","Va=
lid","Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Ful=
l Vector","Computes the approximate reciprocals of the packed double-precis=
ion floating-point values in zmm2/m512/m64bcst and stores the results in zm=
m1. Under writemask."
+"VRCP14PS xmm1 {k1}{z}, xmm2/m128/m32bcst","EVEX.128.66.0F38.W0 4C /r","Va=
lid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","=
","","Full Vector","Computes the approximate reciprocals of the packed sing=
le-precision floating-point values in xmm2/m128/m32bcst and stores the resu=
lts in xmm1. Under writemask."
+"VRCP14PS ymm1 {k1}{z}, ymm2/m256/m32bcst","EVEX.256.66.0F38.W0 4C /r","Va=
lid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","=
","","Full Vector","Computes the approximate reciprocals of the packed sing=
le-precision floating-point values in ymm2/m256/m32bcst and stores the resu=
lts in ymm1. Under writemask."
+"VRCP14PS zmm1 {k1}{z}, zmm2/m512/m32bcst","EVEX.512.66.0F38.W0 4C /r","Va=
lid","Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Ful=
l Vector","Computes the approximate reciprocals of the packed single-precis=
ion floating-point values in zmm2/m512/m32bcst and stores the results in zm=
m1. Under writemask."
+"VRCP14SD xmm1 {k1}{z}, xmm2, xmm3/m64","EVEX.LIG.66.0F38.W1 4D /r","Valid=
","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r=
)","","Tuple1 Scalar","Computes the approximate reciprocal of the scalar do=
uble-precision floating-point value in xmm3/m64 and stores the result in xm=
m1 using writemask k1. Also, upper double-precision floating-point value (b=
its[127:64]) from xmm2 is copied to xmm1[127:64]."
+"VRCP14SS xmm1 {k1}{z}, xmm2, xmm3/m32","EVEX.LIG.66.0F38.W0 4D /r","Valid=
","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r=
)","","Tuple1 Scalar","Computes the approximate reciprocal of the scalar si=
ngle-precision floating-point value in xmm3/m32 and stores the results in x=
mm1 using writemask k1. Also, upper double-precision floating-point value (=
bits[127:32]) from xmm2 is copied to xmm1[127:32]."
+"VRNDSCALEPD xmm1 {k1}{z}, xmm2/m128/m64bcst, ib","EVEX.128.66.0F3A.W1 09 =
/r ib","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:=
r/m (r)","ib","","Full Vector","Rounds packed double-precision floating poi=
nt values in xmm2/m128/m64bcst to a number of fraction bits specified by th=
e ib field. Stores the result in xmm1 register. Under writemask."
+"VRNDSCALEPD ymm1 {k1}{z}, ymm2/m256/m64bcst, ib","EVEX.256.66.0F3A.W1 09 =
/r ib","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:=
r/m (r)","ib","","Full Vector","Rounds packed double-precision floating poi=
nt values in ymm2/m256/m64bcst to a number of fraction bits specified by th=
e ib field. Stores the result in ymm1 register. Under writemask."
+"VRNDSCALEPD zmm1 {k1}{z}, zmm2/m512/m64bcst{sae}, ib","EVEX.512.66.0F3A.W=
1 09 /r ib","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m =
(r)","ib","","Full Vector","Rounds packed double-precision floating-point v=
alues in zmm2/m512/m64bcst to a number of fraction bits specified by the ib=
 field. Stores the result in zmm1 register using writemask k1."
+"VRNDSCALEPS xmm1 {k1}{z}, xmm2/m128/m32bcst, ib","EVEX.128.66.0F3A.W0 08 =
/r ib","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:=
r/m (r)","ib","","Full Vector","Rounds packed single-precision floating poi=
nt values in xmm2/m128/m32bcst to a number of fraction bits specified by th=
e ib field. Stores the result in xmm1 register. Under writemask."
+"VRNDSCALEPS ymm1 {k1}{z}, ymm2/m256/m32bcst, ib","EVEX.256.66.0F3A.W0 08 =
/r ib","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:=
r/m (r)","ib","","Full Vector","Rounds packed single-precision floating poi=
nt values in ymm2/m256/m32bcst to a number of fraction bits specified by th=
e ib field. Stores the result in ymm1 register. Under writemask."
+"VRNDSCALEPS zmm1 {k1}{z}, zmm2/m512/m32bcst{sae}, ib","EVEX.512.66.0F3A.W=
0 08 /r ib","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m =
(r)","ib","","Full Vector","Rounds packed single-precision floating-point v=
alues in zmm2/m512/m32bcst to a number of fraction bits specified by the ib=
 field. Stores the result in zmm1 register using writemask."
+"VRNDSCALESD xmm1 {k1}{z}, xmm2, xmm3/m64{sae}, ib","EVEX.LIG.66.0F3A.W1 0=
B /r ib","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)=
","ModRM:r/m (r)","ib","Tuple1 Scalar","Rounds scalar double-precision floa=
ting-point value in xmm3/m64 to a number of fraction bits specified by the =
ib field. Stores the result in xmm1 register."
+"VRNDSCALESS xmm1 {k1}{z}, xmm2, xmm3/m32{sae}, ib","EVEX.LIG.66.0F3A.W0 0=
A /r ib","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)=
","ModRM:r/m (r)","ib","Tuple1 Scalar","Rounds scalar single-precision floa=
ting-point value in xmm3/m32 to a number of fraction bits specified by the =
ib field. Stores the result in xmm1 register under writemask."
+"VRSQRT14PD xmm1 {k1}{z}, xmm2/m128/m64bcst","EVEX.128.66.0F38.W1 4E /r","=
Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)"=
,"","","Full Vector","Computes the approximate reciprocal square roots of t=
he packed double-precision floating-point values in xmm2/m128/m64bcst and s=
tores the results in xmm1. Under writemask."
+"VRSQRT14PD ymm1 {k1}{z}, ymm2/m256/m64bcst","EVEX.256.66.0F38.W1 4E /r","=
Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)"=
,"","","Full Vector","Computes the approximate reciprocal square roots of t=
he packed double-precision floating-point values in ymm2/m256/m64bcst and s=
tores the results in ymm1. Under writemask."
+"VRSQRT14PD zmm1 {k1}{z}, zmm2/m512/m64bcst","EVEX.512.66.0F38.W1 4E /r","=
Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","F=
ull Vector","Computes the approximate reciprocal square roots of the packed=
 double-precision floating-point values in zmm2/m512/m64bcst and stores the=
 results in zmm1 under writemask."
+"VRSQRT14PS xmm1 {k1}{z}, xmm2/m128/m32bcst","EVEX.128.66.0F38.W0 4E /r","=
Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)"=
,"","","Full Vector","Computes the approximate reciprocal square roots of t=
he packed single-precision floating-point values in xmm2/m128/m32bcst and s=
tores the results in xmm1. Under writemask."
+"VRSQRT14PS ymm1 {k1}{z}, ymm2/m256/m32bcst","EVEX.256.66.0F38.W0 4E /r","=
Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)"=
,"","","Full Vector","Computes the approximate reciprocal square roots of t=
he packed single-precision floating-point values in ymm2/m256/m32bcst and s=
tores the results in ymm1. Under writemask."
+"VRSQRT14PS zmm1 {k1}{z}, zmm2/m512/m32bcst","EVEX.512.66.0F38.W0 4E /r","=
Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","F=
ull Vector","Computes the approximate reciprocal square roots of the packed=
 single-precision floating-point values in zmm2/m512/m32bcst and stores the=
 results in zmm1. Under writemask."
+"VRSQRT14SD xmm1 {k1}{z}, xmm2, xmm3/m64","EVEX.LIG.66.0F38.W1 4F /r","Val=
id","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m =
(r)","","Tuple1 Scalar","Computes the approximate reciprocal square root of=
 the scalar double-precision floating-point value in xmm3/m64 and stores th=
e result in the low quadword element of xmm1 using writemask k1. Bits[127:6=
4] of xmm2 is copied to xmm1[127:64]."
+"VRSQRT14SS xmm1 {k1}{z}, xmm2, xmm3/m32","EVEX.LIG.66.0F38.W0 4F /r","Val=
id","Valid","Invalid","AVX512F","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (=
r)","","Tuple1 Scalar","Computes the approximate reciprocal square root of =
the scalar single-precision floating-point value in xmm3/m32 and stores the=
 result in the low doubleword element of xmm1 using writemask k1. Bits[127:=
32] of xmm2 is copied to xmm1[127:32]."
+"VSCALEFPD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F38.W1 2C =
/r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Scale the packed double-precision f=
loating-point values in xmm2 using values from xmm3/m128/m64bcst. Under wri=
temask k1."
+"VSCALEFPD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F38.W1 2C =
/r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Scale the packed double-precision f=
loating-point values in ymm2 using values from ymm3/m256/m64bcst. Under wri=
temask k1."
+"VSCALEFPD zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst{er}","EVEX.512.66.0F38.W1=
 2C /r","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Scale the packed double-precision floati=
ng-point values in zmm2 using values from zmm3/m512/m64bcst. Under writemas=
k k1."
+"VSCALEFPS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.66.0F38.W0 2C =
/r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Scale the packed single-precision f=
loating-point values in xmm2 using values from xmm3/m128/m32bcst. Under wri=
temask k1."
+"VSCALEFPS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.66.0F38.W0 2C =
/r","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Scale the packed single-precision v=
alues in ymm2 using floating point values from ymm3/m256/m32bcst. Under wri=
temask k1."
+"VSCALEFPS zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst{er}","EVEX.512.66.0F38.W0=
 2C /r","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Scale the packed single-precision floati=
ng-point values in zmm2 using floating-point values from zmm3/m512/m32bcst.=
 Under writemask k1."
+"VSCALEFSD xmm1 {k1}{z}, xmm2, xmm3/m64{er}","EVEX.LIG.66.0F38.W1 2D /r","=
Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r=
/m (r)","","Tuple1 Scalar","Scale the scalar double-precision floating-poin=
t values in xmm2 using the value from xmm3/m64. Under writemask k1."
+"VSCALEFSS xmm1 {k1}{z}, xmm2, xmm3/m32{er}","EVEX.LIG.66.0F38.W0 2D /r","=
Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r=
/m (r)","","Tuple1 Scalar","Scale the scalar single-precision floating-poin=
t value in xmm2 using floating-point value from xmm3/m32. Under writemask k=
1."
+"VSCATTERDPD vm32x/f64x2 {k1}, xmm1","EVEX.128.66.0F38.W1 A2 /r","Valid","=
Valid","Invalid","AVX512VL AVX512F","BaseReg (r): VSIB:base, VectorReg (r):=
 VSIB:index","ModRM:reg (r)","","","","Using signed dword indices, scatter =
double-precision floating-point values to memory using writemask k1."
+"VSCATTERDPD vm32x/f64x4 {k1}, ymm1","EVEX.256.66.0F38.W1 A2 /r","Valid","=
Valid","Invalid","AVX512VL AVX512F","BaseReg (r): VSIB:base, VectorReg (r):=
 VSIB:index","ModRM:reg (r)","","","","Using signed dword indices, scatter =
double-precision floating-point values to memory using writemask k1."
+"VSCATTERDPD vm32y/f64x8 {k1}, zmm1","EVEX.512.66.0F38.W1 A2 /r","Valid","=
Valid","Invalid","AVX512F","BaseReg (r): VSIB:base, VectorReg (r): VSIB:ind=
ex","ModRM:reg (r)","","","","Using signed dword indices, scatter double-pr=
ecision floating-point values to memory using writemask k1."
+"VSCATTERDPS vm32x/f32x4 {k1}, xmm1","EVEX.128.66.0F38.W0 A2 /r","Valid","=
Valid","Invalid","AVX512VL AVX512F","BaseReg (r): VSIB:base, VectorReg (r):=
 VSIB:index","ModRM:reg (r)","","","","Using signed dword indices, scatter =
single-precision floating-point values to memory using writemask k1."
+"VSCATTERDPS vm32y/f32x8 {k1}, ymm1","EVEX.256.66.0F38.W0 A2 /r","Valid","=
Valid","Invalid","AVX512VL AVX512F","BaseReg (r): VSIB:base, VectorReg (r):=
 VSIB:index","ModRM:reg (r)","","","","Using signed dword indices, scatter =
single-precision floating-point values to memory using writemask k1."
+"VSCATTERDPS vm32z/f32x16 {k1}, zmm1","EVEX.512.66.0F38.W0 A2 /r","Valid",=
"Valid","Invalid","AVX512F","BaseReg (r): VSIB:base, VectorReg (r): VSIB:in=
dex","ModRM:reg (r)","","","","Using signed dword indices, scatter single-p=
recision floating-point values to memory using writemask k1."
+"VSCATTERQPD vm64x/f64x2 {k1}, xmm1","EVEX.128.66.0F38.W1 A3 /r","Valid","=
Valid","Invalid","AVX512VL AVX512F","BaseReg (r): VSIB:base, VectorReg (r):=
 VSIB:index","ModRM:reg (r)","","","","Using signed qword indices, scatter =
double-precision floating-point values to memory using writemask k1."
+"VSCATTERQPD vm64y/f64x4 {k1}, ymm1","EVEX.256.66.0F38.W1 A3 /r","Valid","=
Valid","Invalid","AVX512VL AVX512F","BaseReg (r): VSIB:base, VectorReg (r):=
 VSIB:index","ModRM:reg (r)","","","","Using signed qword indices, scatter =
double-precision floating-point values to memory using writemask k1."
+"VSCATTERQPD vm64z/f64x8 {k1}, zmm1","EVEX.512.66.0F38.W1 A3 /r","Valid","=
Valid","Invalid","AVX512F","BaseReg (r): VSIB:base, VectorReg (r): VSIB:ind=
ex","ModRM:reg (r)","","","","Using signed qword indices, scatter double-pr=
ecision floating-point values to memory using writemask k1."
+"VSCATTERQPS vm64x/f32x2 {k1}, xmm1","EVEX.128.66.0F38.W0 A3 /r","Valid","=
Valid","Invalid","AVX512VL AVX512F","BaseReg (r): VSIB:base, VectorReg (r):=
 VSIB:index","ModRM:reg (r)","","","","Using signed qword indices, scatter =
single-precision floating-point values to memory using writemask k1."
+"VSCATTERQPS vm64y/f32x4 {k1}, xmm1","EVEX.256.66.0F38.W0 A3 /r","Valid","=
Valid","Invalid","AVX512VL AVX512F","BaseReg (r): VSIB:base, VectorReg (r):=
 VSIB:index","ModRM:reg (r)","","","","Using signed qword indices, scatter =
single-precision floating-point values to memory using writemask k1."
+"VSCATTERQPS vm64z/f32x8 {k1}, ymm1","EVEX.512.66.0F38.W0 A3 /r","Valid","=
Valid","Invalid","AVX512F","BaseReg (r): VSIB:base, VectorReg (r): VSIB:ind=
ex","ModRM:reg (r)","","","","Using signed qword indices, scatter single-pr=
ecision floating-point values to memory using writemask k1."
+"VSHUFF32X4 ymm1{k1}{z}, ymm2, ymm3/m256/m32bcst, ib","EVEX.256.66.0F3A.W0=
 23 /r ib","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EV=
EX.vvvv (r)","ModRM:r/m (r)","ib","Full Vector","Shuffle 128-bit packed sin=
gle-precision floating-point values selected by imm8 from ymm2 and ymm3/m25=
6/m32bcst and place results in ymm1 subject to writemask k1."
+"VSHUFF32X4 zmm1{k1}{z}, zmm2, zmm3/m512/m32bcst, ib","EVEX.512.66.0F3A.W0=
 23 /r ib","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (=
r)","ModRM:r/m (r)","ib","Full Vector","Shuffle 128-bit packed single-preci=
sion floating-point values selected by ib from zmm2 and zmm3/m512/m32bcst a=
nd place results in zmm1 subject to writemask k1"
+"VSHUFF64X2 ymm1{k1}{z}, ymm2, ymm3/m256/m64bcst, ib","EVEX.256.66.0F3A.W1=
 23 /r ib","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EV=
EX.vvvv (r)","ModRM:r/m (r)","ib","Full Vector","Shuffle 128-bit packed dou=
ble precision floating-point values selected by imm8 from ymm2 and ymm3/m25=
6/m64bcst and place results in ymm1 subject to writemask k1."
+"VSHUFF64X2 zmm1{k1}{z}, zmm2, zmm3/m512/m64bcst, ib","EVEX.512.66.0F3A.W1=
 23 /r ib","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (=
r)","ModRM:r/m (r)","ib","Full Vector","Shuffle 128-bit packed double-preci=
sion floating-point values selected by ib from zmm2 and zmm3/m512/m64bcst a=
nd place results in zmm1 subject to writemask k1."
+"VSHUFI32X4 ymm1{k1}{z}, ymm2, ymm3/m256/m32bcst, ib","EVEX.256.66.0F3A.W0=
 43 /r ib","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EV=
EX.vvvv (r)","ModRM:r/m (r)","ib","Full Vector","Shuffle 128-bit packed dou=
ble-word values selected by imm8 from ymm2 and ymm3/m256/m32bcst and place =
results in ymm1 subject to writemask k1."
+"VSHUFI32X4 zmm1{k1}{z}, zmm2, zmm3/m512/m32bcst, ib","EVEX.512.66.0F3A.W0=
 43 /r ib","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (=
r)","ModRM:r/m (r)","ib","Full Vector","Shuffle 128-bit packed double-word =
values selected by ib from zmm2 and zmm3/m512/m32bcst and place results in =
zmm1 subject to writemask k1."
+"VSHUFI64X2 ymm1{k1}{z}, ymm2, ymm3/m256/m64bcst, ib","EVEX.256.66.0F3A.W1=
 43 /r ib","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EV=
EX.vvvv (r)","ModRM:r/m (r)","ib","Full Vector","Shuffle 128-bit packed qua=
d-word values selected by imm8 from ymm2 and ymm3/m256/m64bcst and place re=
sults in ymm1 subject to writemask k1."
+"VSHUFI64X2 zmm1{k1}{z}, zmm2, zmm3/m512/m64bcst, ib","EVEX.512.66.0F3A.W1=
 43 /r ib","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (=
r)","ModRM:r/m (r)","ib","Full Vector","Shuffle 128-bit packed quad-word va=
lues selected by ib from zmm2 and zmm3/m512/m64bcst and place results in zm=
m1 subject to writemask k1."
+"VSHUFPD xmm1{k1}{z}, xmm2, xmm3/m128/m64bcst, ib","EVEX.128.66.0F.W1 C6 /=
r ib","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vv=
vv (r)","ModRM:r/m (r)","ib","Full Vector","Shuffle two paris of double-pre=
cision floating-point values from xmm2 and xmm3/m128/m64bcst using ib to se=
lect from each pair. store interleaved results in xmm1 subject to writemask=
 k1."
+"VSHUFPD ymm1{k1}{z}, ymm2, ymm3/m256/m64bcst, ib","EVEX.256.66.0F.W1 C6 /=
r ib","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vv=
vv (r)","ModRM:r/m (r)","ib","Full Vector","Shuffle four paris of double-pr=
ecision floating-point values from ymm2 and ymm3/m256/m64bcst using ib to s=
elect from each pair. store interleaved results in ymm1 subject to writemas=
k k1."
+"VSHUFPD zmm1{k1}{z}, zmm2, zmm3/m512/m64bcst, ib","EVEX.512.66.0F.W1 C6 /=
r ib","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","=
ModRM:r/m (r)","ib","Full Vector","Shuffle eight paris of double-precision =
floating-point values from zmm2 and zmm3/m512/m64bcst using ib to select fr=
om each pair. store interleaved results in zmm1 subject to writemask k1."
+"VSHUFPS xmm1{k1}{z}, xmm2, xmm3/m128/m32bcst, ib","EVEX.128.0F.W0 C6 /r i=
b","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv =
(r)","ModRM:r/m (r)","ib","Full Vector","Select from quadruplet of single-p=
recision floating-point values in xmm1 and xmm2/m128 using ib, interleaved =
result pairs are stored in xmm1, subject to writemask k1."
+"VSHUFPS ymm1{k1}{z}, ymm2, ymm3/m256/m32bcst, ib","EVEX.256.0F.W0 C6 /r i=
b","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv =
(r)","ModRM:r/m (r)","ib","Full Vector","Select from quadruplet of single-p=
recision floating-point values in ymm2 and ymm3/m256 using ib, interleaved =
result pairs are stored in ymm1, subject to writemask k1."
+"VSHUFPS zmm1{k1}{z}, zmm2, zmm3/m512/m32bcst, ib","EVEX.512.0F.W0 C6 /r i=
b","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","Mod=
RM:r/m (r)","ib","Full Vector","Select from quadruplet of single-precision =
floating-point values in zmm2 and zmm3/m512 using ib, interleaved result pa=
irs are stored in zmm1, subject to writemask k1."
+"VSQRTPD xmm1 {k1}{z}, xmm2/m128/m64bcst","EVEX.128.66.0F.W1 51 /r","Valid=
","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","=
","Full Vector","Computes Square Roots of the packed double-precision float=
ing-point values in xmm2/m128/m64bcst and stores the result in xmm1 subject=
 to writemask k1."
+"VSQRTPD ymm1 {k1}{z}, ymm2/m256/m64bcst","EVEX.256.66.0F.W1 51 /r","Valid=
","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","=
","Full Vector","Computes Square Roots of the packed double-precision float=
ing-point values in ymm2/m256/m64bcst and stores the result in ymm1 subject=
 to writemask k1."
+"VSQRTPD zmm1 {k1}{z}, zmm2/m512/m64bcst{er}","EVEX.512.66.0F.W1 51 /r","V=
alid","Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Fu=
ll Vector","Computes Square Roots of the packed double-precision floating-p=
oint values in zmm2/m512/m64bcst and stores the result in zmm1 subject to w=
ritemask k1."
+"VSQRTPS xmm1 {k1}{z}, xmm2/m128/m32bcst","EVEX.128.0F.W0 51 /r","Valid","=
Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","=
Full Vector","Computes Square Roots of the packed single-precision floating=
-point values in xmm2/m128/m32bcst and stores the result in xmm1 subject to=
 writemask k1."
+"VSQRTPS ymm1 {k1}{z}, ymm2/m256/m32bcst","EVEX.256.0F.W0 51 /r","Valid","=
Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","=
Full Vector","Computes Square Roots of the packed single-precision floating=
-point values in ymm2/m256/m32bcst and stores the result in ymm1 subject to=
 writemask k1."
+"VSQRTPS zmm1 {k1}{z}, zmm2/m512/m32bcst{er}","EVEX.512.0F.W0 51 /r","Vali=
d","Valid","Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Full =
Vector","Computes Square Roots of the packed single-precision floating-poin=
t values in zmm2/m512/m32bcst and stores the result in zmm1 subject to writ=
emask k1."
+"VSQRTSD xmm1 {k1}{z}, xmm2, xmm3/m64{er}","EVEX.LIG.F2.0F.W1 51 /r","Vali=
d","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (=
r)","","Tuple1 Scalar","Computes square root of the low double-precision fl=
oating-point value in xmm3/m64 and stores the results in xmm1 under writema=
sk k1. Also, upper double-precision floating-point value (bits[127:64]) fro=
m xmm2 is copied to xmm1[127:64]."
+"VSQRTSS xmm1 {k1}{z}, xmm2, xmm3/m32{er}","EVEX.LIG.F3.0F.W0 51 /r","Vali=
d","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (=
r)","","Tuple1 Scalar","Computes square root of the low single-precision fl=
oating-point value in xmm3/m32 and stores the results in xmm1 under writema=
sk k1. Also, upper single-precision floating-point values (bits[127:32]) fr=
om xmm2 are copied to xmm1[127:32]."
+"VSUBPD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F.W1 5C /r","=
Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Subtract packed double-precision floatin=
g-point values from xmm3/m128/m64bcst to xmm2 and store result in xmm1 with=
 writemask k1."
+"VSUBPD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F.W1 5C /r","=
Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Subtract packed double-precision floatin=
g-point values from ymm3/m256/m64bcst to ymm2 and store result in ymm1 with=
 writemask k1."
+"VSUBPD zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst{er}","EVEX.512.66.0F.W1 5C /=
r","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","Mod=
RM:r/m (r)","","Full Vector","Subtract packed double-precision floating-poi=
nt values from zmm3/m512/m64bcst to zmm2 and store result in zmm1 with writ=
emask k1."
+"VSUBPS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.0F.W0 5C /r","Val=
id","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","","Full Vector","Subtract packed single-precision floating-p=
oint values from xmm3/m128/m32bcst to xmm2 and stores result in xmm1 with w=
ritemask k1."
+"VSUBPS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.0F.W0 5C /r","Val=
id","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","","Full Vector","Subtract packed single-precision floating-p=
oint values from ymm3/m256/m32bcst to ymm2 and stores result in ymm1 with w=
ritemask k1."
+"VSUBPS zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst{er}","EVEX.512.0F.W0 5C /r",=
"Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:=
r/m (r)","","Full Vector","Subtract packed single-precision floating-point =
values in zmm3/m512/m32bcst from zmm2 and stores result in zmm1 with writem=
ask k1."
+"VSUBSD xmm1 {k1}{z}, xmm2, xmm3/m64{er}","EVEX.LIG.F2.0F.W1 5C /r","Valid=
","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r=
)","","Tuple1 Scalar","Subtract the low double-precision floating-point val=
ue in xmm3/m64 from xmm2 and store the result in xmm1 under writemask k1."
+"VSUBSS xmm1 {k1}{z}, xmm2, xmm3/m32{er}","EVEX.LIG.F3.0F.W0 5C /r","Valid=
","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r=
)","","Tuple1 Scalar","Subtract the low single-precision floating-point val=
ue in xmm3/m32 from xmm2 and store the result in xmm1 under writemask k1."
+"VUCOMISD xmm1, xmm2/m64{sae}","EVEX.LIG.66.0F.W1 2E /r","Valid","Valid","=
Invalid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple1 Scalar","C=
ompare low double-precision floating-point values in xmm1 and xmm2/m64 and =
set the EFLAGS flags accordingly."
+"VUCOMISS xmm1, xmm2/m32{sae}","EVEX.LIG.0F.W0 2E /r","Valid","Valid","Inv=
alid","AVX512F","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple1 Scalar","Comp=
are low single-precision floating-point values in xmm1 and xmm2/mem32 and s=
et the EFLAGS flags accordingly."
+"VUNPCKHPD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F.W1 15 /r=
","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (=
r)","ModRM:r/m (r)","","Full Vector","Unpacks and Interleaves double precis=
ion floating-point values from high quadwords of xmm2 and xmm3/m128/m64bcst=
 subject to writemask k1."
+"VUNPCKHPD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F.W1 15 /r=
","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (=
r)","ModRM:r/m (r)","","Full Vector","Unpacks and Interleaves double precis=
ion floating-point values from high quadwords of ymm2 and ymm3/m256/m64bcst=
 subject to writemask k1."
+"VUNPCKHPD zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst","EVEX.512.66.0F.W1 15 /r=
","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector","Unpacks and Interleaves double-precision float=
ing-point values from high quadwords of zmm2 and zmm3/m512/m64bcst subject =
to writemask k1."
+"VUNPCKHPS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.0F.W0 15 /r","=
Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Unpacks and Interleaves single-precision=
 floating-point values from high quadwords of xmm2 and xmm3/m128/m32bcst an=
d write result to xmm1 subject to writemask k1."
+"VUNPCKHPS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.0F.W0 15 /r","=
Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Unpacks and Interleaves single-precision=
 floating-point values from high quadwords of ymm2 and ymm3/m256/m32bcst an=
d write result to ymm1 subject to writemask k1."
+"VUNPCKHPS zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst","EVEX.512.0F.W0 15 /r","=
Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r=
/m (r)","","Full Vector","Unpacks and Interleaves single-precision floating=
-point values from high quadwords of zmm2 and zmm3/m512/m32bcst and write r=
esult to zmm1 subject to writemask k1."
+"VUNPCKLPD xmm1 {k1}{z}, xmm2, xmm3/m128/m64bcst","EVEX.128.66.0F.W1 14 /r=
","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (=
r)","ModRM:r/m (r)","","Full Vector","Unpacks and Interleaves double precis=
ion floating-point values from low quadwords of xmm2 and xmm3/m128/m64bcst =
subject to write mask k1."
+"VUNPCKLPD ymm1 {k1}{z}, ymm2, ymm3/m256/m64bcst","EVEX.256.66.0F.W1 14 /r=
","Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (=
r)","ModRM:r/m (r)","","Full Vector","Unpacks and Interleaves double precis=
ion floating-point values from low quadwords of ymm2 and ymm3/m256/m64bcst =
subject to write mask k1."
+"VUNPCKLPD zmm1 {k1}{z}, zmm2, zmm3/m512/m64bcst","EVEX.512.66.0F.W1 14 /r=
","Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector","Unpacks and Interleaves double-precision float=
ing-point values from low quadwords of zmm2 and zmm3/m512/m64bcst subject t=
o write mask k1."
+"VUNPCKLPS xmm1 {k1}{z}, xmm2, xmm3/m128/m32bcst","EVEX.128.0F.W0 14 /r","=
Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Unpacks and Interleaves single-precision=
 floating-point values from low quadwords of xmm2 and xmm3/mem and write re=
sult to xmm1 subject to write mask k1."
+"VUNPCKLPS ymm1 {k1}{z}, ymm2, ymm3/m256/m32bcst","EVEX.256.0F.W0 14 /r","=
Valid","Valid","Invalid","AVX512VL AVX512F","ModRM:reg (w)","EVEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Unpacks and Interleaves single-precision=
 floating-point values from low quadwords of ymm2 and ymm3/mem and write re=
sult to ymm1 subject to write mask k1."
+"VUNPCKLPS zmm1 {k1}{z}, zmm2, zmm3/m512/m32bcst","EVEX.512.0F.W0 14 /r","=
Valid","Valid","Invalid","AVX512F","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r=
/m (r)","","Full Vector","Unpacks and Interleaves single-precision floating=
-point values from low quadwords of zmm2 and zmm3/m512/m32bcst and write re=
sult to zmm1 subject to write mask k1."
diff --git a/disas/x86-data/x86_avx512fp16.csv b/disas/x86-data/x86_avx512f=
p16.csv
new file mode 100644
index 000000000000..22e2aacf4861
--- /dev/null
+++ b/disas/x86-data/x86_avx512fp16.csv
@@ -0,0 +1,237 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"VADDPH xmm{k}{z},xmm,xmm/m128/m16bcst","EVEX.128.map5.W0 58 /r","Valid","=
Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector","Add packed FP16 value from xmm3/m128/m16bcst t=
o xmm2, and store result in xmm1 subject to writemask k1."
+"VADDPH ymm{k}{z},ymm,ymm/m256/m16bcst","EVEX.256.map5.W0 58 /r","Valid","=
Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector","Add packed FP16 value from ymm3/m256/m16bcst t=
o ymm2, and store result in ymm1 subject to writemask k1."
+"VADDPH zmm{k}{z},zmm,zmm/m512/m16bcst{er}","EVEX.512.map5.W0 58 /r","Vali=
d","Valid","Invalid","AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m=
 (r)","","Full Vector","Add packed FP16 value from zmm3/m512/m16bcst to zmm=
2, and store result in zmm1 subject to writemask k1."
+"VADDSH xmm{k}{z},xmm,xmm/m16{er}","EVEX.LIG.f3.map5.W0 58 /r","Valid","Va=
lid","Invalid","AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)",=
"","Scalar","Add the low FP16 value from xmm3/m16 to xmm2, and store the re=
sult in xmm1 subject to writemask k1. Bits 127:16 of xmm2 are copied to xmm=
1[127:16]."
+"VCMPPH k{k},xmm,xmm/m128/m16bcst,ib","EVEX.128.0F3A.W0 C2 /r ib","Valid",=
"Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","Mod=
RM:r/m (r)","ib","Full Vector","Compare packed FP16 values in xmm3/m128/m16=
bcst and xmm2 using bits 4:0 of imm8 as a comparison predicate subject to w=
ritemask k2, and store the result in mask register k1."
+"VCMPPH k{k},ymm,ymm/m256/m16bcst,ib","EVEX.256.0F3A.W0 C2 /r ib","Valid",=
"Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","Mod=
RM:r/m (r)","ib","Full Vector","Compare packed FP16 values in ymm3/m256/m16=
bcst and ymm2 using bits 4:0 of imm8 as a comparison predicate subject to w=
ritemask k2, and store the result in mask register k1."
+"VCMPPH k{k},zmm,zmm/m512/m16bcst{sae},ib","EVEX.512.0F3A.W0 C2 /r ib","Va=
lid","Valid","Invalid","AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r=
/m (r)","ib","Full Vector","Compare packed FP16 values in zmm3/m512/m16bcst=
 and zmm2 using bits 4:0 of imm8 as a comparison predicate subject to write=
mask k2, and store the result in mask register k1."
+"VCMPSH k{k},xmm,xmm/m16{sae},ib","EVEX.LIG.f3.0F3A.W0 C2 /r ib","Valid","=
Valid","Invalid","AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)=
","ib","Scalar","Compare low FP16 values in xmm3/m16 and xmm2 using bits 4:=
0 of imm8 as a comparison predicate subject to writemask k2, and store the =
result in mask register k1."
+"VCOMISH xmm,xmm/m16{sae}","EVEX.LIG.map5.W0 2F /r","Valid","Valid","Inval=
id","AVX512FP16","ModRM:reg (r)","ModRM:r/m (r)","","","Scalar","Compare lo=
w FP16 values in xmm1 and xmm2/m16, and set the EFLAGS flags accordingly."
+"VCVTDQ2PH xmm{k}{z},xmm/m128/m32bcst","EVEX.128.map5.W0 5B /r","Valid","V=
alid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","",""=
,"Full Vector","Convert four packed signed doubleword integers from xmm2/m1=
28/m32bcst to four packed FP16 values, and store the result in xmm1 subject=
 to writemask k1."
+"VCVTDQ2PH xmm{k}{z},ymm/m256/m32bcst","EVEX.256.map5.W0 5B /r","Valid","V=
alid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","",""=
,"Full Vector","Convert eight packed signed doubleword integers from ymm2/m=
256/m32bcst to eight packed FP16 values, and store the result in xmm1 subje=
ct to writemask k1."
+"VCVTDQ2PH ymm{k}{z},zmm/m512/m32bcst{er}","EVEX.512.map5.W0 5B /r","Valid=
","Valid","Invalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","","Ful=
l Vector","Convert sixteen packed signed doubleword integers from zmm2/m512=
/m32bcst to sixteen packed FP16 values, and store the result in ymm1 subjec=
t to writemask k1."
+"VCVTPD2PH xmm{k}{z},xmm/m128/m64bcst","EVEX.128.66.map5.W1 5A /r","Valid"=
,"Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)",""=
,"","Full Vector","Convert two packed double precision floating-point value=
s in xmm2/m128/m64bcst to two packed FP16 values, and store the result in x=
mm1 subject to writemask k1."
+"VCVTPD2PH xmm{k}{z},ymm/m256/m64bcst","EVEX.256.66.map5.W1 5A /r","Valid"=
,"Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)",""=
,"","Full Vector","Convert four packed double precision floating-point valu=
es in ymm2/m256/m64bcst to four packed FP16 values, and store the result in=
 xmm1 subject to writemask k1."
+"VCVTPD2PH xmm{k}{z},zmm/m512/m64bcst{er}","EVEX.512.66.map5.W1 5A /r","Va=
lid","Valid","Invalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","","=
Full Vector","Convert eight packed double precision floating-point values i=
n zmm2/m512/m64bcst to eight packed FP16 values, and store the result in ym=
m1 subject to writemask k1."
+"VCVTPH2DQ xmm{k}{z},xmm/m64/m16bcst","EVEX.128.66.map5.W0 5B /r","Valid",=
"Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","",=
"","Half Vector","Convert four packed FP16 values in xmm2/m64/m16bcst to fo=
ur signed doubleword integers, and store the result in xmm1 subject to writ=
emask k1."
+"VCVTPH2DQ ymm{k}{z},xmm/m128/m16bcst","EVEX.256.66.map5.W0 5B /r","Valid"=
,"Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)",""=
,"","Half Vector","Convert eight packed FP16 values in xmm2/m128/m16bcst to=
 eight signed doubleword integers, and store the result in ymm1 subject to =
writemask k1."
+"VCVTPH2DQ zmm{k}{z},ymm/m256/m16bcst{er}","EVEX.512.66.map5.W0 5B /r","Va=
lid","Valid","Invalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","","=
Half Vector","Convert sixteen packed FP16 values in ymm2/m256/m16bcst to si=
xteen signed doubleword integers, and store the result in zmm1 subject to w=
ritemask k1."
+"VCVTPH2PD xmm{k}{z},xmm/m32/m16bcst","EVEX.128.map5.W0 5A /r","Valid","Va=
lid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","",=
"Quarter Vector","Convert packed FP16 values in xmm2/m32/m16bcst to FP64 va=
lues, and store result in xmm1 subject to writemask k1."
+"VCVTPH2PD ymm{k}{z},xmm/m64/m16bcst","EVEX.256.map5.W0 5A /r","Valid","Va=
lid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","",=
"Quarter Vector","Convert packed FP16 values in xmm2/m64/m16bcst to FP64 va=
lues, and store result in ymm1 subject to writemask k1."
+"VCVTPH2PD zmm{k}{z},xmm/m128/m16bcst{sae}","EVEX.512.map5.W0 5A /r","Vali=
d","Valid","Invalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","","Qu=
arter Vector","Convert packed FP16 values in xmm2/m128/m16bcst to FP64 valu=
es, and store result in zmm1 subject to writemask k1."
+"VCVTPH2PSX xmm{k}{z},xmm/m64/m16bcst","EVEX.128.66.map6.W0 13 /r","Valid"=
,"Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)",""=
,"","Half Vector","Convert four packed FP16 values in xmm2/m64/m16bcst to f=
our packed single precision floating-point values, and store result in xmm1=
 subject to writemask k1."
+"VCVTPH2PSX ymm{k}{z},xmm/m128/m16bcst","EVEX.256.66.map6.W0 13 /r","Valid=
","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","=
","","Half Vector","Convert eight packed FP16 values in xmm2/m128/m16bcst t=
o eight packed single precision floating-point values, and store result in =
ymm1 subject to writemask k1."
+"VCVTPH2PSX zmm{k}{z},ymm/m256/m16bcst{sae}","EVEX.512.66.map6.W0 13 /r","=
Valid","Valid","Invalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","",""=
,"Half Vector","Convert sixteen packed FP16 values in ymm2/m256/m16bcst to =
sixteen packed single precision floating-point values, and store result in =
zmm1 subject to writemask k1."
+"VCVTPH2QQ xmm{k}{z},xmm/m32/m16bcst","EVEX.128.66.map5.W0 7b /r","Valid",=
"Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","",=
"","Quarter Vector","Convert two packed FP16 values in xmm2/m32/m16bcst to =
two signed quadword integers, and store the result in xmm1 subject to write=
mask k1."
+"VCVTPH2QQ ymm{k}{z},xmm/m64/m16bcst","EVEX.256.66.map5.W0 7b /r","Valid",=
"Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","",=
"","Quarter Vector","Convert four packed FP16 values in xmm2/m64/m16bcst to=
 four signed quadword integers, and store the result in ymm1 subject to wri=
temask k1."
+"VCVTPH2QQ zmm{k}{z},xmm/m128/m16bcst{er}","EVEX.512.66.map5.W0 7b /r","Va=
lid","Valid","Invalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","","=
Quarter Vector","Convert eight packed FP16 values in xmm2/m128/m16bcst to e=
ight signed quadword integers, and store the result in zmm1 subject to writ=
emask k1."
+"VCVTPH2UDQ xmm{k}{z},xmm/m64/m16bcst","EVEX.128.map5.W0 79 /r","Valid","V=
alid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","",""=
,"Half Vector","Convert four packed FP16 values in xmm2/m64/m16bcst to four=
 unsigned doubleword integers, and store the result in xmm1 subject to writ=
emask k1."
+"VCVTPH2UDQ ymm{k}{z},xmm/m128/m16bcst","EVEX.256.map5.W0 79 /r","Valid","=
Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","=
","Half Vector","Convert eight packed FP16 values in xmm2/m128/m16bcst to e=
ight unsigned doubleword integers, and store the result in ymm1 subject to =
writemask k1."
+"VCVTPH2UDQ zmm{k}{z},ymm/m256/m16bcst{er}","EVEX.512.map5.W0 79 /r","Vali=
d","Valid","Invalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","","Ha=
lf Vector","Convert sixteen packed FP16 values in ymm2/m256/m16bcst to sixt=
een unsigned doubleword integers, and store the result in zmm1 subject to w=
ritemask k1."
+"VCVTPH2UQQ xmm{k}{z},xmm/m32/m16bcst","EVEX.128.66.map5.W0 79 /r","Valid"=
,"Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)",""=
,"","Quarter Vector","Convert two packed FP16 values in xmm2/m32/m16bcst to=
 two unsigned quadword integers, and store the result in xmm1 subject to wr=
itemask k1."
+"VCVTPH2UQQ ymm{k}{z},xmm/m64/m16bcst","EVEX.256.66.map5.W0 79 /r","Valid"=
,"Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)",""=
,"","Quarter Vector","Convert four packed FP16 values in xmm2/m64/m16bcst t=
o four unsigned quadword integers, and store the result in ymm1 subject to =
writemask k1."
+"VCVTPH2UQQ zmm{k}{z},xmm/m128/m16bcst{er}","EVEX.512.66.map5.W0 79 /r","V=
alid","Valid","Invalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","",=
"Quarter Vector","Convert eight packed FP16 values in xmm2/m128/m16bcst to =
eight unsigned quadword integers, and store the result in zmm1 subject to w=
ritemask k1."
+"VCVTPH2UW xmm{k}{z},xmm/m128/m16bcst","EVEX.128.map5.W0 7d /r","Valid","V=
alid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","",""=
,"Full Vector","Convert packed FP16 values in xmm2/m128/m16bcst to unsigned=
 word integers, and store the result in xmm1."
+"VCVTPH2UW ymm{k}{z},ymm/m256/m16bcst","EVEX.256.map5.W0 7d /r","Valid","V=
alid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","",""=
,"Full Vector","Convert packed FP16 values in ymm2/m256/m16bcst to unsigned=
 word integers, and store the result in ymm1."
+"VCVTPH2UW zmm{k}{z},zmm/m512/m16bcst{er}","EVEX.512.map5.W0 7d /r","Valid=
","Valid","Invalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","","Ful=
l Vector","Convert packed FP16 values in zmm2/m512/m16bcst to unsigned word=
 integers, and store the result in zmm1."
+"VCVTPH2W xmm{k}{z},xmm/m128/m16bcst","EVEX.128.66.map5.W0 7d /r","Valid",=
"Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","",=
"","Full Vector","Convert packed FP16 values in xmm2/m128/m16bcst to signed=
 word integers, and store the result in xmm1."
+"VCVTPH2W ymm{k}{z},ymm/m256/m16bcst","EVEX.256.66.map5.W0 7d /r","Valid",=
"Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","",=
"","Full Vector","Convert packed FP16 values in ymm2/m256/m16bcst to signed=
 word integers, and store the result in ymm1."
+"VCVTPH2W zmm{k}{z},zmm/m512/m16bcst{er}","EVEX.512.66.map5.W0 7d /r","Val=
id","Valid","Invalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","","F=
ull Vector","Convert packed FP16 values in zmm2/m512/m16bcst to signed word=
 integers, and store the result in zmm1."
+"VCVTPS2PHX xmm{k}{z},xmm/m128/m32bcst","EVEX.128.66.map5.W0 1d /r","Valid=
","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","=
","","Full Vector","Convert four packed single precision floating-point val=
ues in xmm2/m128/m32bcst to packed FP16 values, and store the result in xmm=
1 subject to writemask k1."
+"VCVTPS2PHX xmm{k}{z},ymm/m256/m32bcst","EVEX.256.66.map5.W0 1d /r","Valid=
","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","=
","","Full Vector","Convert eight packed single precision floating-point va=
lues in ymm2/m256/m32bcst to packed FP16 values, and store the result in xm=
m1 subject to writemask k1."
+"VCVTPS2PHX ymm{k}{z},zmm/m512/m32bcst{er}","EVEX.512.66.map5.W0 1d /r","V=
alid","Valid","Invalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","",=
"Full Vector","Convert sixteen packed single precision floating-point value=
s in zmm2 /m512/m32bcst to packed FP16 values, and store the result in ymm1=
 subject to writemask k1."
+"VCVTQQ2PH xmm{k}{z},xmm/m128/m64bcst","EVEX.128.map5.W1 5b /r","Valid","V=
alid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","",""=
,"Full Vector","Convert two packed signed quadword integers in xmm2/m128/m6=
4bcst to packed FP16 values, and store the result in xmm1 subject to writem=
ask k1."
+"VCVTQQ2PH xmm{k}{z},ymm/m256/m64bcst","EVEX.256.map5.W1 5b /r","Valid","V=
alid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","",""=
,"Full Vector","Convert four packed signed quadword integers in ymm2/m256/m=
64bcst to packed FP16 values, and store the result in xmm1 subject to write=
mask k1."
+"VCVTQQ2PH xmm{k}{z},zmm/m512/m64bcst{er}","EVEX.512.map5.W1 5b /r","Valid=
","Valid","Invalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","","Ful=
l Vector","Convert eight packed signed quadword integers in zmm2/m512/m64bc=
st to packed FP16 values, and store the result in xmm1 subject to writemask=
 k1."
+"VCVTSD2SH xmm{k}{z},xmm,xmm/m64{er}","EVEX.LIG.f2.map5.W1 5a /r","Valid",=
"Valid","Invalid","AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r=
)","","Scalar","Convert the low FP64 value in xmm3/m64 to an FP16 value and=
 store the result in the low element of xmm1 subject to writemask k1. Bits =
127:16 of xmm2 are copied to xmm1[127:16]."
+"VCVTSH2SD xmm,xmm,xmm/m16{sae}","EVEX.LIG.f3.map5.W0 5a /r","Valid","Vali=
d","Invalid","AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)",""=
,"Scalar","Convert the low FP16 value in xmm3/m16 to an FP64 value and stor=
e the result in the low element of xmm1 subject to writemask k1. Bits 127:6=
4 of xmm2 are copied to xmm1[127:64]."
+"VCVTSH2SI r32,xmm/m16{er}","EVEX.LIG.f3.map5.W0 2d /r","Valid","Valid","I=
nvalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","","Scalar","Conver=
t the low FP16 element in xmm1/m16 to a signed integer and store the result=
 in r32."
+"VCVTSH2SI r64,xmm/m16{er}","EVEX.LIG.f3.map5.W1 2d /r","Valid","Valid","I=
nvalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","","Scalar","Conver=
t the low FP16 element in xmm1/m16 to a signed integer and store the result=
 in r64."
+"VCVTSH2SS xmm{k}{z},xmm,xmm/m16{sae}","EVEX.LIG.map6.W0 13 /r","Valid","V=
alid","Invalid","AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)"=
,"","Scalar","Convert the low FP16 element in xmm3/m16 to an FP32 value and=
 store in the low element of xmm1 subject to writemask k1. Bits 127:32 of x=
mm2 are copied to xmm1[127:32]."
+"VCVTSH2USI r32,xmm/m16{er}","EVEX.LIG.f3.map5.W0 79 /r","Valid","Valid","=
Invalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","","Scalar","Conve=
rt the low FP16 element in xmm1/m16 to an unsigned integer and store the re=
sult in r32."
+"VCVTSH2USI r64,xmm/m16{er}","EVEX.LIG.f3.map5.W1 79 /r","Valid","Valid","=
Invalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","","Scalar","Conve=
rt the low FP16 element in xmm1/m16 to an unsigned integer and store the re=
sult in r64."
+"VCVTSI2SH xmm,xmm,r32/m32{er}","EVEX.LIG.f3.map5.W0 2a /r","Valid","Valid=
","Invalid","AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","",=
"Scalar","Convert the signed doubleword integer in r32/m32 to an FP16 value=
 and store the result in xmm1. Bits 127:16 of xmm2 are copied to xmm1[127:1=
6]."
+"VCVTSI2SH xmm,xmm,r64/m64{er}","EVEX.LIG.f3.map5.W1 2a /r","Valid","Valid=
","Invalid","AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","",=
"Scalar","Convert the signed quadword integer in r64/m64 to an FP16 value a=
nd store the result in xmm1. Bits 127:16 of xmm2 are copied to xmm1[127:16]=
."
+"VCVTSS2SH xmm,xmm,xmm/m32{er}","EVEX.LIG.map5.W0 1d /r","Valid","Valid","=
Invalid","AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","Sc=
alar","Convert low FP32 value in xmm3/m32 to an FP16 value and store in the=
 low element of xmm1 subject to writemask k1. Bits 127:16 from xmm2 are cop=
ied to xmm1[127:16]."
+"VCVTTPH2DQ xmm{k}{z},xmm/m64/m16bcst","EVEX.128.f3.map5.W0 5b /r","Valid"=
,"Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)",""=
,"","Half Vector","Convert four packed FP16 values in xmm2/m64/m16bcst to f=
our signed doubleword integers, and store the result in xmm1 using truncati=
on subject to writemask k1."
+"VCVTTPH2DQ ymm{k}{z},xmm/m128/m16bcst","EVEX.256.f3.map5.W0 5b /r","Valid=
","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","=
","","Half Vector","Convert eight packed FP16 values in xmm2/m128/m16bcst t=
o eight signed doubleword integers, and store the result in ymm1 using trun=
cation subject to writemask k1."
+"VCVTTPH2DQ zmm{k}{z},ymm/m256/m16bcst{sae}","EVEX.512.f3.map5.W0 5b /r","=
Valid","Valid","Invalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","",""=
,"Half Vector","Convert sixteen packed FP16 values in ymm2/m256/m16bcst to =
sixteen signed doubleword integers, and store the result in zmm1 using trun=
cation subject to writemask k1."
+"VCVTTPH2QQ xmm{k}{z},xmm/m32/m16bcst","EVEX.128.66.map5.W0 7a /r","Valid"=
,"Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)",""=
,"","Quarter Vector","Convert two packed FP16 values in xmm2/m32/m16bcst to=
 two signed quadword integers, and store the result in xmm1 using truncatio=
n subject to writemask k1."
+"VCVTTPH2QQ ymm{k}{z},xmm/m64/m16bcst","EVEX.256.66.map5.W0 7a /r","Valid"=
,"Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)",""=
,"","Quarter Vector","Convert four packed FP16 values in xmm2/m64/m16bcst t=
o four signed quadword integers, and store the result in ymm1 using truncat=
ion subject to writemask k1."
+"VCVTTPH2QQ zmm{k}{z},xmm/m128/m16bcst{sae}","EVEX.512.66.map5.W0 7a /r","=
Valid","Valid","Invalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","",""=
,"Quarter Vector","Convert eight packed FP16 values in xmm2/m128/m16bcst to=
 eight signed quadword integers, and store the result in zmm1 using truncat=
ion subject to writemask k1."
+"VCVTTPH2UDQ xmm{k}{z},xmm/m64/m16bcst","EVEX.128.map5.W0 78 /r","Valid","=
Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","=
","Half Vector","Convert four packed FP16 values in xmm2/m64/m16bcst to fou=
r unsigned doubleword integers, and store the result in xmm1 using truncati=
on subject to writemask k1."
+"VCVTTPH2UDQ ymm{k}{z},xmm/m128/m16bcst","EVEX.256.map5.W0 78 /r","Valid",=
"Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","",=
"","Half Vector","Convert eight packed FP16 values in xmm2/m128/m16bcst to =
eight unsigned doubleword integers, and store the result in ymm1 using trun=
cation subject to writemask k1."
+"VCVTTPH2UDQ zmm{k}{z},ymm/m256/m16bcst{sae}","EVEX.512.map5.W0 78 /r","Va=
lid","Valid","Invalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","","=
Half Vector","Convert sixteen packed FP16 values in ymm2/m256/m16bcst to si=
xteen unsigned doubleword integers, and store the result in zmm1 using trun=
cation subject to writemask k1."
+"VCVTTPH2UQQ xmm{k}{z},xmm/m32/m16bcst","EVEX.128.66.map5.W0 78 /r","Valid=
","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","=
","","Quarter Vector","Convert two packed FP16 values in xmm2/m32/m16bcst t=
o two unsigned quadword integers, and store the result in xmm1 using trunca=
tion subject to writemask k1."
+"VCVTTPH2UQQ ymm{k}{z},xmm/m64/m16bcst","EVEX.256.66.map5.W0 78 /r","Valid=
","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","=
","","Quarter Vector","Convert four packed FP16 values in xmm2/m64/m16bcst =
to four unsigned quadword integers, and store the result in ymm1 using trun=
cation subject to writemask k1."
+"VCVTTPH2UQQ zmm{k}{z},xmm/m128/m16bcst{sae}","EVEX.512.66.map5.W0 78 /r",=
"Valid","Valid","Invalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","=
","Quarter Vector","Convert eight packed FP16 values in xmm2/m128/m16bcst t=
o eight unsigned quadword integers, and store the result in zmm1 using trun=
cation subject to writemask k1."
+"VCVTTPH2UW xmm{k}{z},xmm/m128/m16bcst","EVEX.128.map5.W0 7c /r","Valid","=
Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","=
","Full Vector","Convert eight packed FP16 values in xmm2/m128/m16bcst to e=
ight unsigned word integers, and store the result in xmm1 using truncation =
subject to writemask k1."
+"VCVTTPH2UW ymm{k}{z},ymm/m256/m16bcst","EVEX.256.map5.W0 7c /r","Valid","=
Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","=
","Full Vector","Convert sixteen packed FP16 values in ymm2/m256/m16bcst to=
 sixteen unsigned word integers, and store the result in ymm1 using truncat=
ion subject to writemask k1."
+"VCVTTPH2UW zmm{k}{z},zmm/m512/m16bcst{sae}","EVEX.512.map5.W0 7c /r","Val=
id","Valid","Invalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","","F=
ull Vector","Convert thirty-two packed FP16 values in zmm2/m512/m16bcst to =
thirty-two unsigned word integers, and store the result in zmm1 using trunc=
ation subject to writemask k1."
+"VCVTTPH2W xmm{k}{z},xmm/m128/m16bcst","EVEX.128.66.map5.W0 7c /r","Valid"=
,"Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)",""=
,"","Full Vector","Convert eight packed FP16 values in xmm2/m128/m16bcst to=
 eight signed word integers, and store the result in xmm1 using truncation =
subject to writemask k1."
+"VCVTTPH2W ymm{k}{z},ymm/m256/m16bcst","EVEX.256.66.map5.W0 7c /r","Valid"=
,"Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)",""=
,"","Full Vector","Convert sixteen packed FP16 values in ymm2/m256/m16bcst =
to sixteen signed word integers, and store the result in ymm1 using truncat=
ion subject to writemask k1."
+"VCVTTPH2W zmm{k}{z},zmm/m512/m16bcst{sae}","EVEX.512.66.map5.W0 7c /r","V=
alid","Valid","Invalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","",=
"Full Vector","Convert thirty-two packed FP16 values in zmm2/m512/m16bcst t=
o thirty-two signed word integers, and store the result in zmm1 using trunc=
ation subject to writemask k1."
+"VCVTTSH2SI r32,xmm/m16{sae}","EVEX.LIG.f3.map5.W0 2c /r","Valid","Valid",=
"Invalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","","Scalar","Conv=
ert FP16 value in the low element of xmm1/m16 to a signed integer and store=
 the result in r32 using truncation."
+"VCVTTSH2SI r64,xmm/m16{sae}","EVEX.LIG.f3.map5.W1 2c /r","Valid","Valid",=
"Invalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","","Scalar","Conv=
ert FP16 value in the low element of xmm1/m16 to a signed integer and store=
 the result in r64 using truncation."
+"VCVTTSH2USI r32,xmm/m16{sae}","EVEX.LIG.f3.map5.W0 78 /r","Valid","Valid"=
,"Invalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","","Scalar","Con=
vert FP16 value in the low element of xmm1/m16 to an unsigned integer and s=
tore the result in r32 using truncation."
+"VCVTTSH2USI r64,xmm/m16{sae}","EVEX.LIG.f3.map5.W1 78 /r","Valid","Valid"=
,"Invalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","","Scalar","Con=
vert FP16 value in the low element of xmm1/m16 to an unsigned integer and s=
tore the result in r64 using truncation."
+"VCVTUDQ2PH xmm{k}{z},xmm/m128/m32bcst","EVEX.128.f2.map5.W0 7a /r","Valid=
","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","=
","","Full Vector","Convert four packed unsigned doubleword integers from x=
mm2/m128/m32bcst to packed FP16 values, and store the result in xmm1 subjec=
t to writemask k1."
+"VCVTUDQ2PH xmm{k}{z},ymm/m256/m32bcst","EVEX.256.f2.map5.W0 7a /r","Valid=
","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","=
","","Full Vector","Convert eight packed unsigned doubleword integers from =
ymm2/m256/m32bcst to packed FP16 values, and store the result in xmm1 subje=
ct to writemask k1."
+"VCVTUDQ2PH ymm{k}{z},zmm/m512/m32bcst","EVEX.512.f2.map5.W0 7a /r","Valid=
","Valid","Invalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","","Ful=
l Vector","Convert sixteen packed unsigned doubleword integers from zmm2/m5=
12/m32bcst to packed FP16 values, and store the result in ymm1 subject to w=
ritemask k1."
+"VCVTUQQ2PH xmm{k}{z},xmm/m128/m64bcst","EVEX.128.f2.map5.W1 7a /r","Valid=
","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","=
","","Full Vector","Convert two packed unsigned doubleword integers from xm=
m2/m128/m64bcst to packed FP16 values, and store the result in xmm1 subject=
 to writemask k1."
+"VCVTUQQ2PH xmm{k}{z},ymm/m256/m64bcst","EVEX.256.f2.map5.W1 7a /r","Valid=
","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","=
","","Full Vector","Convert four packed unsigned doubleword integers from y=
mm2/m256/m64bcst to packed FP16 values, and store the result in xmm1 subjec=
t to writemask k1."
+"VCVTUQQ2PH xmm{k}{z},zmm/m512/m64bcst","EVEX.512.f2.map5.W1 7a /r","Valid=
","Valid","Invalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","","Ful=
l Vector","Convert eight packed unsigned doubleword integers from zmm2/m512=
/m64bcst to packed FP16 values, and store the result in xmm1 subject to wri=
temask k1."
+"VCVTUSI2SH xmm,xmm,r32/m32{er}","EVEX.LIG.f3.map5.W0 7b /r","Valid","Vali=
d","Invalid","AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)",""=
,"Scalar","Convert an unsigned doubleword integer from r32/m32 to an FP16 v=
alue, and store the result in xmm1. Bits 127:16 from xmm2 are copied to xmm=
1[127:16]."
+"VCVTUSI2SH xmm,xmm,r64/m64{er}","EVEX.LIG.f3.map5.W1 7b /r","Valid","Vali=
d","Invalid","AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)",""=
,"Scalar","Convert an unsigned quadword integer from r64/m64 to an FP16 val=
ue, and store the result in xmm1. Bits 127:16 from xmm2 are copied to xmm1[=
127:16]."
+"VCVTUW2PH xmm{k}{z},xmm/m128/m16bcst","EVEX.128.f2.map5.W0 7d /r","Valid"=
,"Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)",""=
,"","Full Vector","Convert eight packed unsigned word integers from xmm2/m1=
28/m16bcst to FP16 values, and store the result in xmm1 subject to writemas=
k k1."
+"VCVTUW2PH ymm{k}{z},ymm/m256/m16bcst","EVEX.256.f2.map5.W0 7d /r","Valid"=
,"Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)",""=
,"","Full Vector","Convert sixteen packed unsigned word integers from ymm2/=
m256/m16bcst to FP16 values, and store the result in ymm1 subject to writem=
ask k1."
+"VCVTUW2PH zmm{k}{z},zmm/m512/m16bcst{er}","EVEX.512.f2.map5.W0 7d /r","Va=
lid","Valid","Invalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","","=
Full Vector","Convert thirty-two packed unsigned word integers from zmm2/m5=
12/m16bcst to FP16 values, and store the result in zmm1 subject to writemas=
k k1."
+"VCVTW2PH xmm{k}{z},xmm/m128/m16bcst","EVEX.128.f3.map5.W0 7d /r","Valid",=
"Valid","Invalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","","Full =
Vector","Convert eight packed signed word integers from xmm2/m128/m16bcst t=
o FP16 values, and store the result in xmm1 subject to writemask k1."
+"VCVTW2PH ymm{k}{z},ymm/m256/m16bcst","EVEX.256.f3.map5.W0 7d /r","Valid",=
"Valid","Invalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","","Full =
Vector","Convert sixteen packed signed word integers from ymm2/m256/m16bcst=
 to FP16 values, and store the result in ymm1 subject to writemask k1."
+"VCVTW2PH zmm{k}{z},zmm/m512/m16bcst{er}","EVEX.512.f3.map5.W0 7d /r","Val=
id","Valid","Invalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","","F=
ull Vector","Convert thirty-two packed signed word integers from zmm2/m512/=
m16bcst to FP16 values, and store the result in zmm1 subject to writemask k=
1."
+"VDIVPH xmm{k}{z},xmm,xmm/m128/m16bcst","EVEX.128.map5.W0 5e /r","Valid","=
Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector","Divide packed FP16 values in xmm2 by packed FP=
16 values in xmm3/m128/m16bcst, and store the result in xmm1 subject to wri=
temask k1."
+"VDIVPH ymm{k}{z},ymm,ymm/m256/m16bcst","EVEX.256.map5.W0 5e /r","Valid","=
Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector","Divide packed FP16 values in ymm2 by packed FP=
16 values in ymm3/m256/m16bcst, and store the result in ymm1 subject to wri=
temask k1."
+"VDIVPH zmm{k}{z},zmm,zmm/m512/m16bcst{er}","EVEX.512.map5.W0 5e /r","Vali=
d","Valid","Invalid","AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m=
 (r)","","Full Vector","Divide packed FP16 values in zmm2 by packed FP16 va=
lues in zmm3/m512/m16bcst, and store the result in zmm1 subject to writemas=
k k1."
+"VDIVSH xmm{k}{z},xmm,xmm/m16{er}","EVEX.LIG.f3.map5.W0 5e /r","Valid","Va=
lid","Invalid","AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)",=
"","Scalar","Divide low FP16 value in xmm2 by low FP16 value in xmm3/m16, a=
nd store the result in xmm1 subject to writemask k1. Bits 127:16 of xmm2 ar=
e copied to xmm1[127:16]."
+"VFCMADDCPH xmm{k}{z},xmm,xmm/m128/m32bcst","EVEX.128.f2.map6.W0 56 /r","V=
alid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (r, w)","VEX.vvvv =
(r)","ModRM:r/m (r)","","Full Vector","Complex multiply a pair of FP16 valu=
es from xmm2 and xmm3/m128/m32bcst, add to xmm1 and store the result in xmm=
1 subject to writemask k1."
+"VFCMADDCPH ymm{k}{z},ymm,ymm/m256/m32bcst","EVEX.256.f2.map6.W0 56 /r","V=
alid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (r, w)","VEX.vvvv =
(r)","ModRM:r/m (r)","","Full Vector","Complex multiply a pair of FP16 valu=
es from ymm2 and ymm3/m256/m32bcst, add to ymm1 and store the result in ymm=
1 subject to writemask k1."
+"VFCMADDCPH zmm{k}{z},zmm,zmm/m512/m32bcst{er}","EVEX.512.f2.map6.W0 56 /r=
","Valid","Valid","Invalid","AVX512FP16","ModRM:reg (r, w)","VEX.vvvv (r)",=
"ModRM:r/m (r)","","Full Vector","Complex multiply a pair of FP16 values fr=
om zmm2 and zmm3/m512/m32bcst, add to zmm1 and store the result in zmm1 sub=
ject to writemask k1."
+"VFCMADDCSH xmm{k}{z},xmm,xmm/m32{er}","EVEX.LIG.f2.map6.W0 57 /r","Valid"=
,"Valid","Invalid","AVX512FP16","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/=
m (r)","","Scalar","Complex multiply a pair of FP16 values from xmm2 and xm=
m3/m32, add to xmm1 and store the result in xmm1 subject to writemask k1. B=
its 127:32 of xmm2 are copied to xmm1[127:32]."
+"VFCMULCPH xmm{k}{z},xmm,xmm/m128/m32bcst","EVEX.128.f2.map6.W0 d6 /r","Va=
lid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Complex multiply a pair of FP16 values f=
rom xmm2 and xmm3/m128/m32bcst, and store the result in xmm1 subject to wri=
temask k1."
+"VFCMULCPH ymm{k}{z},ymm,ymm/m256/m32bcst","EVEX.256.f2.map6.W0 d6 /r","Va=
lid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Complex multiply a pair of FP16 values f=
rom ymm2 and ymm3/m256/m32bcst, and store the result in ymm1 subject to wri=
temask k1."
+"VFCMULCPH zmm{k}{z},zmm,zmm/m512/m32bcst{er}","EVEX.512.f2.map6.W0 d6 /r"=
,"Valid","Valid","Invalid","AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","Mod=
RM:r/m (r)","","Full Vector","Complex multiply a pair of FP16 values from z=
mm2 and zmm3/m512/m32bcst, and store the result in zmm1 subject to writemas=
k k1."
+"VFCMULCSH xmm{k}{z},xmm,xmm/m32{er}","EVEX.LIG.f2.map6.W0 d7 /r","Valid",=
"Valid","Invalid","AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r=
)","","Scalar","Complex multiply a pair of FP16 values from xmm2 and xmm3/m=
32, and store the result in xmm1 subject to writemask k1. Bits 127:32 of xm=
m2 are copied to xmm1[127:32]."
+"VFMADD132PH xmm{k}{z},xmm,xmm/m128/m16bcst","EVEX.128.66.map6.W0 98 /r","=
Valid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (r, w)","VEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from xm=
m1 and xmm3/m128/m16bcst, add to xmm2, and store the result in xmm1."
+"VFMADD132PH ymm{k}{z},ymm,ymm/m256/m16bcst","EVEX.256.66.map6.W0 98 /r","=
Valid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (r, w)","VEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from ym=
m1 and ymm3/m256/m16bcst, add to ymm2, and store the result in ymm1."
+"VFMADD132PH zmm{k}{z},zmm,zmm/m512/m16bcst{er}","EVEX.512.66.map6.W0 98 /=
r","Valid","Valid","Invalid","AVX512FP16","ModRM:reg (r, w)","VEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from zmm1 an=
d zmm3/m512/m16bcst, add to zmm2, and store the result in zmm1."
+"VFMADD132SH xmm{k}{z},xmm,xmm/m16{er}","EVEX.LIG.66.map6.W0 99 /r","Valid=
","Valid","Invalid","AVX512FP16","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r=
/m (r)","","Scalar","Multiply FP16 values from xmm1 and xmm3/m16, add to xm=
m2, and store the result in xmm1."
+"VFMADD213PH xmm{k}{z},xmm,xmm/m128/m16bcst","EVEX.128.66.map6.W0 a8 /r","=
Valid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (r, w)","VEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from xm=
m1 and xmm2, add to xmm3/m128/m16bcst, and store the result in xmm1."
+"VFMADD213PH ymm{k}{z},ymm,ymm/m256/m16bcst","EVEX.256.66.map6.W0 a8 /r","=
Valid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (r, w)","VEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from ym=
m1 and ymm2, add to ymm3/m256/m16bcst, and store the result in ymm1."
+"VFMADD213PH zmm{k}{z},zmm,zmm/m512/m16bcst{er}","EVEX.512.66.map6.W0 a8 /=
r","Valid","Valid","Invalid","AVX512FP16","ModRM:reg (r, w)","VEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from zmm1 an=
d zmm2, add to zmm3/m512/m16bcst, and store the result in zmm1."
+"VFMADD213SH xmm{k}{z},xmm,xmm/m16{er}","EVEX.LIG.66.map6.W0 a9 /r","Valid=
","Valid","Invalid","AVX512FP16","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r=
/m (r)","","Scalar","Multiply FP16 values from xmm1 and xmm2, add to xmm3/m=
16, and store the result in xmm1."
+"VFMADD231PH xmm{k}{z},xmm,xmm/m128/m16bcst","EVEX.128.66.map6.W0 b8 /r","=
Valid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (r, w)","VEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from xm=
m2 and xmm3/m128/m16bcst, add to xmm1, and store the result in xmm1."
+"VFMADD231PH ymm{k}{z},ymm,ymm/m256/m16bcst","EVEX.256.66.map6.W0 b8 /r","=
Valid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (r, w)","VEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from ym=
m2 and ymm3/m256/m16bcst, add to ymm1, and store the result in ymm1."
+"VFMADD231PH zmm{k}{z},zmm,zmm/m512/m16bcst{er}","EVEX.512.66.map6.W0 b8 /=
r","Valid","Valid","Invalid","AVX512FP16","ModRM:reg (r, w)","VEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from zmm2 an=
d zmm3/m512/m16bcst, add to zmm1, and store the result in zmm1."
+"VFMADD231SH xmm{k}{z},xmm,xmm/m16{er}","EVEX.LIG.66.map6.W0 b9 /r","Valid=
","Valid","Invalid","AVX512FP16","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r=
/m (r)","","Scalar","Multiply FP16 values from xmm2 and xmm3/m16, add to xm=
m1, and store the result in xmm1."
+"VFMADDCPH xmm{k}{z},xmm,xmm/m128/m32bcst","EVEX.128.f3.map6.W0 56 /r","Va=
lid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (r, w)","VEX.vvvv (=
r)","ModRM:r/m (r)","","Full Vector","Complex multiply a pair of FP16 value=
s from xmm2 and the complex conjugate of xmm3/m128/m32bcst, add to xmm1 and=
 store the result in xmm1 subject to writemask k1."
+"VFMADDCPH ymm{k}{z},ymm,ymm/m256/m32bcst","EVEX.256.f3.map6.W0 56 /r","Va=
lid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (r, w)","VEX.vvvv (=
r)","ModRM:r/m (r)","","Full Vector","Complex multiply a pair of FP16 value=
s from ymm2 and the complex conjugate of ymm3/m256/m32bcst, add to ymm1 and=
 store the result in ymm1 subject to writemask k1."
+"VFMADDCPH zmm{k}{z},zmm,zmm/m512/m32bcst{er}","EVEX.512.f3.map6.W0 56 /r"=
,"Valid","Valid","Invalid","AVX512FP16","ModRM:reg (r, w)","VEX.vvvv (r)","=
ModRM:r/m (r)","","Full Vector","Complex multiply a pair of FP16 values fro=
m zmm2 and the complex conjugate of zmm3/m512/m32bcst, add to zmm1 and stor=
e the result in zmm1 subject to writemask k1."
+"VFMADDCSH xmm{k}{z},xmm,xmm/m32{er}","EVEX.LIG.f3.map6.W0 57 /r","Valid",=
"Valid","Invalid","AVX512FP16","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m=
 (r)","","Scalar","Complex multiply a pair of FP16 values from xmm2 and the=
 complex conjugate of xmm3/m32, add to xmm1 and store the result in xmm1 su=
bject to writemask k1. Bits 127:32 of xmm2 are copied to xmm1[127:32]."
+"VFMADDSUB132PH xmm{k}{z},xmm,xmm/m128/m16bcst","EVEX.128.66.map6.W0 96 /r=
","Valid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (r, w)","VEX.v=
vvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from=
 xmm1 and xmm3/m128/m16bcst, add/subtract elements in xmm2, and store the r=
esult in xmm1 subject to writemask k1."
+"VFMADDSUB132PH ymm{k}{z},ymm,ymm/m256/m16bcst","EVEX.256.66.map6.W0 96 /r=
","Valid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (r, w)","VEX.v=
vvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from=
 ymm1 and ymm3/m256/m16bcst, add/subtract elements in ymm2, and store the r=
esult in ymm1 subject to writemask k1."
+"VFMADDSUB132PH zmm{k}{z},zmm,zmm/m512/m16bcst{er}","EVEX.512.66.map6.W0 9=
6 /r","Valid","Valid","Invalid","AVX512FP16","ModRM:reg (r, w)","VEX.vvvv (=
r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from zmm1=
 and zmm3/m512/m16bcst, add/subtract elements in zmm2, and store the result=
 in zmm1 subject to writemask k1."
+"VFMADDSUB213PH xmm{k}{z},xmm,xmm/m128/m16bcst","EVEX.128.66.map6.W0 a6 /r=
","Valid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (r, w)","VEX.v=
vvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from=
 xmm1 and xmm2, add/subtract elements in xmm3/m128/m16bcst, and store the r=
esult in xmm1 subject to writemask k1."
+"VFMADDSUB213PH ymm{k}{z},ymm,ymm/m256/m16bcst","EVEX.256.66.map6.W0 a6 /r=
","Valid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (r, w)","VEX.v=
vvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from=
 ymm1 and ymm2, add/subtract elements in ymm3/m256/m16bcst, and store the r=
esult in ymm1 subject to writemask k1."
+"VFMADDSUB213PH zmm{k}{z},zmm,zmm/m512/m16bcst{er}","EVEX.512.66.map6.W0 a=
6 /r","Valid","Valid","Invalid","AVX512FP16","ModRM:reg (r, w)","VEX.vvvv (=
r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from zmm1=
 and zmm2, add/subtract elements in zmm3/m512/m16bcst, and store the result=
 in zmm1 subject to writemask k1."
+"VFMADDSUB231PH xmm{k}{z},xmm,xmm/m128/m16bcst","EVEX.128.66.map6.W0 b6 /r=
","Valid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (r, w)","VEX.v=
vvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from=
 xmm2 and xmm3/m128/m16bcst, add/subtract elements in xmm1, and store the r=
esult in xmm1 subject to writemask k1."
+"VFMADDSUB231PH ymm{k}{z},ymm,ymm/m256/m16bcst","EVEX.256.66.map6.W0 b6 /r=
","Valid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (r, w)","VEX.v=
vvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from=
 ymm2 and ymm3/m256/m16bcst, add/subtract elements in ymm1, and store the r=
esult in ymm1 subject to writemask k1."
+"VFMADDSUB231PH zmm{k}{z},zmm,zmm/m512/m16bcst{er}","EVEX.512.66.map6.W0 b=
6 /r","Valid","Valid","Invalid","AVX512FP16","ModRM:reg (r, w)","VEX.vvvv (=
r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from zmm2=
 and zmm3/m512/m16bcst, add/subtract elements in zmm1, and store the result=
 in zmm1 subject to writemask k1."
+"VFMSUB132PH xmm{k}{z},xmm,xmm/m128/m16bcst","EVEX.128.66.map6.W0 9a /r","=
Valid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (r, w)","VEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from xm=
m1 and xmm3/m128/m16bcst, subtract xmm2, and store the result in xmm1 subje=
ct to writemask k1."
+"VFMSUB132PH ymm{k}{z},ymm,ymm/m256/m16bcst","EVEX.256.66.map6.W0 9a /r","=
Valid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (r, w)","VEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from ym=
m1 and ymm3/m256/m16bcst, subtract ymm2, and store the result in ymm1 subje=
ct to writemask k1."
+"VFMSUB132PH zmm{k}{z},zmm,zmm/m512/m16bcst{er}","EVEX.512.66.map6.W0 9a /=
r","Valid","Valid","Invalid","AVX512FP16","ModRM:reg (r, w)","VEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from zmm1 an=
d zmm3/m512/m16bcst, subtract zmm2, and store the result in zmm1 subject to=
 writemask k1."
+"VFMSUB132SH xmm{k}{z},xmm,xmm/m16{er}","EVEX.LIG.66.map6.W0 9b /r","Valid=
","Valid","Invalid","AVX512FP16","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r=
/m (r)","","Scalar","Multiply FP16 values from xmm1 and xmm3/m16, subtract =
xmm2, and store the result in xmm1 subject to writemask k1."
+"VFMSUB213PH xmm{k}{z},xmm,xmm/m128/m16bcst","EVEX.128.66.map6.W0 aa /r","=
Valid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (r, w)","VEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from xm=
m1 and xmm2, subtract xmm3/m128/m16bcst, and store the result in xmm1 subje=
ct to writemask k1."
+"VFMSUB213PH ymm{k}{z},ymm,ymm/m256/m16bcst","EVEX.256.66.map6.W0 aa /r","=
Valid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (r, w)","VEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from ym=
m1 and ymm2, subtract ymm3/m256/m16bcst, and store the result in ymm1 subje=
ct to writemask k1."
+"VFMSUB213PH zmm{k}{z},zmm,zmm/m512/m16bcst{er}","EVEX.512.66.map6.W0 aa /=
r","Valid","Valid","Invalid","AVX512FP16","ModRM:reg (r, w)","VEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from zmm1 an=
d zmm2, subtract zmm3/m512/m16bcst, and store the result in zmm1 subject to=
 writemask k1."
+"VFMSUB213SH xmm{k}{z},xmm,xmm/m16{er}","EVEX.LIG.66.map6.W0 ab /r","Valid=
","Valid","Invalid","AVX512FP16","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r=
/m (r)","","Scalar","Multiply FP16 values from xmm1 and xmm2, subtract xmm3=
/m16, and store the result in xmm1 subject to writemask k1."
+"VFMSUB231PH xmm{k}{z},xmm,xmm/m128/m16bcst","EVEX.128.66.map6.W0 ba /r","=
Valid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (r, w)","VEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from xm=
m2 and xmm3/m128/m16bcst, subtract xmm1, and store the result in xmm1 subje=
ct to writemask k1."
+"VFMSUB231PH ymm{k}{z},ymm,ymm/m256/m16bcst","EVEX.256.66.map6.W0 ba /r","=
Valid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (r, w)","VEX.vvvv=
 (r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from ym=
m2 and ymm3/m256/m16bcst, subtract ymm1, and store the result in ymm1 subje=
ct to writemask k1."
+"VFMSUB231PH zmm{k}{z},zmm,zmm/m512/m16bcst{er}","EVEX.512.66.map6.W0 ba /=
r","Valid","Valid","Invalid","AVX512FP16","ModRM:reg (r, w)","VEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from zmm2 an=
d zmm3/m512/m16bcst, subtract zmm1, and store the result in zmm1 subject to=
 writemask k1."
+"VFMSUB231SH xmm{k}{z},xmm,xmm/m16{er}","EVEX.LIG.66.map6.W0 bb /r","Valid=
","Valid","Invalid","AVX512FP16","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r=
/m (r)","","Scalar","Multiply FP16 values from xmm2 and xmm3/m16, subtract =
xmm1, and store the result in xmm1 subject to writemask k1."
+"VFMSUBADD132PH xmm{k}{z},xmm,xmm/m128/m16bcst","EVEX.128.66.map6.W0 97 /r=
","Valid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (r, w)","VEX.v=
vvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from=
 xmm1 and xmm3/m128/m16bcst, subtract/add elements in xmm2, and store the r=
esult in xmm1 subject to writemask k1."
+"VFMSUBADD132PH ymm{k}{z},ymm,ymm/m256/m16bcst","EVEX.256.66.map6.W0 97 /r=
","Valid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (r, w)","VEX.v=
vvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from=
 ymm1 and ymm3/m256/m16bcst, subtract/add elements in ymm2, and store the r=
esult in ymm1 subject to writemask k1."
+"VFMSUBADD132PH zmm{k}{z},zmm,zmm/m512/m16bcst{er}","EVEX.512.66.map6.W0 9=
7 /r","Valid","Valid","Invalid","AVX512FP16","ModRM:reg (r, w)","VEX.vvvv (=
r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from zmm1=
 and zmm3/m512/m16bcst, subtract/add elements in zmm2, and store the result=
 in zmm1 subject to writemask k1."
+"VFMSUBADD213PH xmm{k}{z},xmm,xmm/m128/m16bcst","EVEX.128.66.map6.W0 a7 /r=
","Valid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (r, w)","VEX.v=
vvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from=
 xmm1 and xmm2, subtract/add elements in xmm3/m128/m16bcst, and store the r=
esult in xmm1 subject to writemask k1."
+"VFMSUBADD213PH ymm{k}{z},ymm,ymm/m256/m16bcst","EVEX.256.66.map6.W0 a7 /r=
","Valid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (r, w)","VEX.v=
vvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from=
 ymm1 and ymm2, subtract/add elements in ymm3/m256/m16bcst, and store the r=
esult in ymm1 subject to writemask k1."
+"VFMSUBADD213PH zmm{k}{z},zmm,zmm/m512/m16bcst{er}","EVEX.512.66.map6.W0 a=
7 /r","Valid","Valid","Invalid","AVX512FP16","ModRM:reg (r, w)","VEX.vvvv (=
r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from zmm1=
 and zmm2, subtract/add elements in zmm3/m512/m16bcst, and store the result=
 in zmm1 subject to writemask k1."
+"VFMSUBADD231PH xmm{k}{z},xmm,xmm/m128/m16bcst","EVEX.128.66.map6.W0 b7 /r=
","Valid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (r, w)","VEX.v=
vvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from=
 xmm2 and xmm3/m128/m16bcst, subtract/add elements in xmm1, and store the r=
esult in xmm1 subject to writemask k1."
+"VFMSUBADD231PH ymm{k}{z},ymm,ymm/m256/m16bcst","EVEX.256.66.map6.W0 b7 /r=
","Valid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (r, w)","VEX.v=
vvv (r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from=
 ymm2 and ymm3/m256/m16bcst, subtract/add elements in ymm1, and store the r=
esult in ymm1 subject to writemask k1."
+"VFMSUBADD231PH zmm{k}{z},zmm,zmm/m512/m16bcst{er}","EVEX.512.66.map6.W0 b=
7 /r","Valid","Valid","Invalid","AVX512FP16","ModRM:reg (r, w)","VEX.vvvv (=
r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from zmm2=
 and zmm3/m512/m16bcst, subtract/add elements in zmm1, and store the result=
 in zmm1 subject to writemask k1."
+"VFMULCPH xmm{k}{z},xmm,xmm/m128/m32bcst","EVEX.128.f3.map6.W0 d6 /r","Val=
id","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)",=
"ModRM:r/m (r)","","Full Vector","Complex multiply a pair of FP16 values fr=
om xmm2 and the complex conjugate of xmm3/ m128/m32bcst, and store the resu=
lt in xmm1 subject to writemask k1."
+"VFMULCPH ymm{k}{z},ymm,ymm/m256/m32bcst","EVEX.256.f3.map6.W0 d6 /r","Val=
id","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)",=
"ModRM:r/m (r)","","Full Vector","Complex multiply a pair of FP16 values fr=
om ymm2 and the complex conjugate of ymm3/m256/m32bcst, and store the resul=
t in ymm1 subject to writemask k1."
+"VFMULCPH zmm{k}{z},zmm,zmm/m512/m32bcst{er}","EVEX.512.f3.map6.W0 d6 /r",=
"Valid","Valid","Invalid","AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector","Complex multiply a pair of FP16 values from zm=
m2 and the complex conjugate of zmm3/m512/m32bcst, and store the result in =
zmm1 subject to writemask k1."
+"VFMULCSH xmm{k}{z},xmm,xmm/m32{er}","EVEX.LIG.f3.map6.W0 d7 /r","Valid","=
Valid","Invalid","AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)=
","","Scalar","Complex multiply a pair of FP16 values from xmm2 and the com=
plex conjugate of xmm3/m32, and store the result in xmm1 subject to writema=
sk k1. Bits 127:32 of xmm2 are copied to xmm1[127:32]."
+"VFNMADD132PH xmm{k}{z},xmm,xmm/m128/m16bcst","EVEX.128.66.map6.W0 9c /r",=
"Valid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (r, w)","VEX.vvv=
v (r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from x=
mm1 and xmm3/m128/m16bcst, and negate the value. Add this value to xmm2, an=
d store the result in xmm1."
+"VFNMADD132PH ymm{k}{z},ymm,ymm/m256/m16bcst","EVEX.256.66.map6.W0 9c /r",=
"Valid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (r, w)","VEX.vvv=
v (r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from y=
mm1 and ymm3/m256/m16bcst, and negate the value. Add this value to ymm2, an=
d store the result in ymm1."
+"VFNMADD132PH zmm{k}{z},zmm,zmm/m512/m16bcst{er}","EVEX.512.66.map6.W0 9c =
/r","Valid","Valid","Invalid","AVX512FP16","ModRM:reg (r, w)","VEX.vvvv (r)=
","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from zmm1 a=
nd zmm3/m512/m16bcst, and negate the value. Add this value to zmm2, and sto=
re the result in zmm1."
+"VFNMADD132SH xmm{k}{z},xmm,xmm/m16{er}","EVEX.LIG.66.map6.W0 9d /r","Vali=
d","Valid","Invalid","AVX512FP16","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:=
r/m (r)","","Scalar","Multiply FP16 values from xmm1 and xmm3/m16, and nega=
te the value. Add this value to xmm2, and store the result in xmm1."
+"VFNMADD213PH xmm{k}{z},xmm,xmm/m128/m16bcst","EVEX.128.66.map6.W0 ac /r",=
"Valid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (r, w)","VEX.vvv=
v (r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from x=
mm1 and xmm2, and negate the value. Add this value to xmm3/m128/m16bcst, an=
d store the result in xmm1."
+"VFNMADD213PH ymm{k}{z},ymm,ymm/m256/m16bcst","EVEX.256.66.map6.W0 ac /r",=
"Valid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (r, w)","VEX.vvv=
v (r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from y=
mm1 and ymm2, and negate the value. Add this value to ymm3/m256/m16bcst, an=
d store the result in ymm1."
+"VFNMADD213PH zmm{k}{z},zmm,zmm/m512/m16bcst{er}","EVEX.512.66.map6.W0 ac =
/r","Valid","Valid","Invalid","AVX512FP16","ModRM:reg (r, w)","VEX.vvvv (r)=
","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from zmm1 a=
nd zmm2, and negate the value. Add this value to zmm3/m512/m16bcst, and sto=
re the result in zmm1."
+"VFNMADD213SH xmm{k}{z},xmm,xmm/m16{er}","EVEX.LIG.66.map6.W0 ad /r","Vali=
d","Valid","Invalid","AVX512FP16","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:=
r/m (r)","","Scalar","Multiply FP16 values from xmm1 and xmm2, and negate t=
he value. Add this value to xmm3/m16, and store the result in xmm1."
+"VFNMADD231PH xmm{k}{z},xmm,xmm/m128/m16bcst","EVEX.128.66.map6.W0 bc /r",=
"Valid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (r, w)","VEX.vvv=
v (r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from x=
mm2 and xmm3/m128/m16bcst, and negate the value. Add this value to xmm1, an=
d store the result in xmm1."
+"VFNMADD231PH ymm{k}{z},ymm,ymm/m256/m16bcst","EVEX.256.66.map6.W0 bc /r",=
"Valid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (r, w)","VEX.vvv=
v (r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from y=
mm2 and ymm3/m256/m16bcst, and negate the value. Add this value to ymm1, an=
d store the result in ymm1."
+"VFNMADD231PH zmm{k}{z},zmm,zmm/m512/m16bcst{er}","EVEX.512.66.map6.W0 bc =
/r","Valid","Valid","Invalid","AVX512FP16","ModRM:reg (r, w)","VEX.vvvv (r)=
","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from zmm2 a=
nd zmm3/m512/m16bcst, and negate the value. Add this value to zmm1, and sto=
re the result in zmm1."
+"VFNMADD231SH xmm{k}{z},xmm,xmm/m16{er}","EVEX.LIG.66.map6.W0 bd /r","Vali=
d","Valid","Invalid","AVX512FP16","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:=
r/m (r)","","Scalar","Multiply FP16 values from xmm2 and xmm3/m16, and nega=
te the value. Add this value to xmm1, and store the result in xmm1."
+"VFNMSUB132PH xmm{k}{z},xmm,xmm/m128/m16bcst","EVEX.128.66.map6.W0 9e /r",=
"Valid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (r, w)","VEX.vvv=
v (r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from x=
mm1 and xmm3/m128/m16bcst, and negate the value. Subtract xmm2 from this va=
lue, and store the result in xmm1 subject to writemask k1."
+"VFNMSUB132PH ymm{k}{z},ymm,ymm/m256/m16bcst","EVEX.256.66.map6.W0 9e /r",=
"Valid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (r, w)","VEX.vvv=
v (r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from y=
mm1 and ymm3/m256/m16bcst, and negate the value. Subtract ymm2 from this va=
lue, and store the result in ymm1 subject to writemask k1."
+"VFNMSUB132PH zmm{k}{z},zmm,zmm/m512/m16bcst{er}","EVEX.512.66.map6.W0 9e =
/r","Valid","Valid","Invalid","AVX512FP16","ModRM:reg (r, w)","VEX.vvvv (r)=
","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from zmm1 a=
nd zmm3/m512/m16bcst, and negate the value. Subtract zmm2 from this value, =
and store the result in zmm1 subject to writemask k1."
+"VFNMSUB132SH xmm{k}{z},xmm,xmm/m16{er}","EVEX.LIG.66.map6.W0 9f /r","Vali=
d","Valid","Invalid","AVX512FP16","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:=
r/m (r)","","Scalar","Multiply FP16 values from xmm1 and xmm3/m16, and nega=
te the value. Subtract xmm2 from this value, and store the result in xmm1 s=
ubject to writemask k1."
+"VFNMSUB213PH xmm{k}{z},xmm,xmm/m128/m16bcst","EVEX.128.66.map6.W0 ae /r",=
"Valid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (r, w)","VEX.vvv=
v (r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from x=
mm1 and xmm2, and negate the value. Subtract xmm3/m128/m16bcst from this va=
lue, and store the result in xmm1 subject to writemask k1."
+"VFNMSUB213PH ymm{k}{z},ymm,ymm/m256/m16bcst","EVEX.256.66.map6.W0 ae /r",=
"Valid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (r, w)","VEX.vvv=
v (r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from y=
mm1 and ymm2, and negate the value. Subtract ymm3/m256/m16bcst from this va=
lue, and store the result in ymm1 subject to writemask k1."
+"VFNMSUB213PH zmm{k}{z},zmm,zmm/m512/m16bcst{er}","EVEX.512.66.map6.W0 ae =
/r","Valid","Valid","Invalid","AVX512FP16","ModRM:reg (r, w)","VEX.vvvv (r)=
","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from zmm1 a=
nd zmm2, and negate the value. Subtract zmm3/m512/m16bcst from this value, =
and store the result in zmm1 subject to writemask k1."
+"VFNMSUB213SH xmm{k}{z},xmm,xmm/m16{er}","EVEX.LIG.66.map6.W0 af /r","Vali=
d","Valid","Invalid","AVX512FP16","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:=
r/m (r)","","Scalar","Multiply FP16 values from xmm1 and xmm2, and negate t=
he value. Subtract xmm3/m16 from this value, and store the result in xmm1 s=
ubject to writemask k1."
+"VFNMSUB231PH xmm{k}{z},xmm,xmm/m128/m16bcst","EVEX.128.66.map6.W0 be /r",=
"Valid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (r, w)","VEX.vvv=
v (r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from x=
mm2 and xmm3/m128/m16bcst, and negate the value. Subtract xmm1 from this va=
lue, and store the result in xmm1 subject to writemask k1."
+"VFNMSUB231PH ymm{k}{z},ymm,ymm/m256/m16bcst","EVEX.256.66.map6.W0 be /r",=
"Valid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (r, w)","VEX.vvv=
v (r)","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from y=
mm2 and ymm3/m256/m16bcst, and negate the value. Subtract ymm1 from this va=
lue, and store the result in ymm1 subject to writemask k1."
+"VFNMSUB231PH zmm{k}{z},zmm,zmm/m512/m16bcst{er}","EVEX.512.66.map6.W0 be =
/r","Valid","Valid","Invalid","AVX512FP16","ModRM:reg (r, w)","VEX.vvvv (r)=
","ModRM:r/m (r)","","Full Vector","Multiply packed FP16 values from zmm2 a=
nd zmm3/m512/m16bcst, and negate the value. Subtract zmm1 from this value, =
and store the result in zmm1 subject to writemask k1."
+"VFNMSUB231SH xmm{k}{z},xmm,xmm/m16{er}","EVEX.LIG.66.map6.W0 bf /r","Vali=
d","Valid","Invalid","AVX512FP16","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:=
r/m (r)","","Scalar","Multiply FP16 values from xmm2 and xmm3/m16, and nega=
te the value. Subtract xmm1 from this value, and store the result in xmm1 s=
ubject to writemask k1."
+"VFPCLASSPH k{k},xmm/m128/m16bcst,ib","EVEX.128.0F3A.W0 66 /r ib","Valid",=
"Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","ib=
","","Full Vector","Test the input for the following categories: NaN, +0, -=
0, +Infinity, -Infinity, denormal, finite negative. The immediate field pro=
vides a mask bit for each of these category tests. The masked test results =
are OR-ed together to form a mask result."
+"VFPCLASSPH k{k},ymm/m256/m16bcst,ib","EVEX.256.0F3A.W0 66 /r ib","Valid",=
"Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","ib=
","","Full Vector","Test the input for the following categories: NaN, +0, -=
0, +Infinity, -Infinity, denormal, finite negative. The immediate field pro=
vides a mask bit for each of these category tests. The masked test results =
are OR-ed together to form a mask result."
+"VFPCLASSPH k{k},zmm/m512/m16bcst,ib","EVEX.512.0F3A.W0 66 /r ib","Valid",=
"Valid","Invalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","ib","","Ful=
l Vector","Test the input for the following categories: NaN, +0, -0, +Infin=
ity, -Infinity, denormal, finite negative. The immediate field provides a m=
ask bit for each of these category tests. The masked test results are OR-ed=
 together to form a mask result."
+"VFPCLASSSH k{k},xmm/m16,ib","EVEX.LIG.0F3A.W0 67 /r ib","Valid","Valid","=
Invalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","ib","","Scalar","Tes=
t the input for the following categories: NaN, +0, -0, +Infinity, -Infinity=
, denormal, finite negative. The immediate field provides a mask bit for ea=
ch of these category tests. The masked test results are OR-ed together to f=
orm a mask result."
+"VGETEXPPH xmm{k}{z},xmm/m128/m16bcst","EVEX.128.66.map6.W0 42 /r","Valid"=
,"Valid","Invalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","","Full=
 Vector","Convert the exponent of FP16 values in the source operand to FP16=
 results representing unbiased integer exponents and stores the results in =
the destination register subject to writemask k1."
+"VGETEXPPH ymm{k}{z},ymm/m256/m16bcst","EVEX.256.66.map6.W0 42 /r","Valid"=
,"Valid","Invalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","","Full=
 Vector","Convert the exponent of FP16 values in the source operand to FP16=
 results representing unbiased integer exponents and stores the results in =
the destination register subject to writemask k1."
+"VGETEXPPH zmm{k}{z},zmm/m512/m16bcst{sae}","EVEX.512.66.map6.W0 42 /r","V=
alid","Valid","Invalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","",=
"Full Vector","Convert the exponent of FP16 values in the source operand to=
 FP16 results representing unbiased integer exponents and stores the result=
s in the destination register subject to writemask k1."
+"VGETEXPSH xmm{k}{z},xmm,xmm/m16 {sae}","EVEX.128.66.map6.W0 43 /r","Valid=
","Valid","Invalid","AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m =
(r)","","Scalar","Convert the exponent of FP16 values in the low word of th=
e source operand to FP16 results representing unbiased integer exponents, a=
nd stores the results in the low word of the destination register subject t=
o writemask k1. Bits 127:16 of xmm2 are copied to xmm1[127:16]."
+"VGETMANTPH xmm{k}{z},xmm/m128/m16bcst,ib","EVEX.128.0F3A.W0 26 /r ib","Va=
lid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)=
","ib","","Full Vector","Get normalized mantissa from FP16 vector xmm2/m128=
/m16bcst and store the result in xmm1, using imm8 for sign control and mant=
issa interval normalization, subject to writemask k1."
+"VGETMANTPH ymm{k}{z},ymm/m256/m16bcst,ib","EVEX.256.0F3A.W0 26 /r ib","Va=
lid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)=
","ib","","Full Vector","Get normalized mantissa from FP16 vector ymm2/m256=
/m16bcst and store the result in ymm1, using imm8 for sign control and mant=
issa interval normalization, subject to writemask k1."
+"VGETMANTPH zmm{k}{z},zmm/m512/m16bcst{sae},ib","EVEX.512.0F3A.W0 26 /r ib=
","Valid","Valid","Invalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","i=
b","","Full Vector","Get normalized mantissa from FP16 vector zmm2/m512/m16=
bcst and store the result in zmm1, using imm8 for sign control and mantissa=
 interval normalization, subject to writemask k1."
+"VGETMANTSH xmm{k}{z},xmm,xmm/m16{sae},ib","EVEX.128.0F3A.W0 27 /r ib","Va=
lid","Valid","Invalid","AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r=
/m (r)","ib","Scalar","Extract the normalized mantissa of the low FP16 elem=
ent in xmm3/m16 using imm8 for sign control and mantissa interval normaliza=
tion. Store the mantissa to xmm1 subject to writemask k1 and merge with the=
 other elements of xmm2. Bits 127:16 of xmm2 are copied to xmm1[127:16]."
+"VMAXPH xmm{k}{z},xmm,xmm/m128/m16bcst","EVEX.128.map5.W0 5f /r","Valid","=
Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector","Return the maximum packed FP16 values between =
xmm2 and xmm3/m128/m16bcst and store the result in xmm1 subject to writemas=
k k1."
+"VMAXPH ymm{k}{z},ymm,ymm/m256/m16bcst","EVEX.256.map5.W0 5f /r","Valid","=
Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector","Return the maximum packed FP16 values between =
ymm2 and ymm3/m256/m16bcst and store the result in ymm1 subject to writemas=
k k1."
+"VMAXPH zmm{k}{z},zmm,zmm/m512/m16bcst{sae}","EVEX.512.map5.W0 5f /r","Val=
id","Valid","Invalid","AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/=
m (r)","","Full Vector","Return the maximum packed FP16 values between zmm2=
 and zmm3/m512/m16bcst and store the result in zmm1 subject to writemask k1=
."
+"VMAXSH xmm{k}{z},xmm,xmm/m16{sae}","EVEX.LIG.f3.map5.W0 5f /r","Valid","V=
alid","Invalid","AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)"=
,"","Scalar","Return the maximum low FP16 value between xmm3/m16 and xmm2 a=
nd store the result in xmm1 subject to writemask k1. Bits 127:16 of xmm2 ar=
e copied to xmm1[127:16]."
+"VMINPH xmm{k}{z},xmm,xmm/m128/m16bcst","EVEX.128.map5.W0 5d /r","Valid","=
Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector","Return the minimum packed FP16 values between =
xmm2 and xmm3/m128/m16bcst and store the result in xmm1 subject to writemas=
k k1."
+"VMINPH ymm{k}{z},ymm,ymm/m256/m16bcst","EVEX.256.map5.W0 5d /r","Valid","=
Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector","Return the minimum packed FP16 values between =
ymm2 and ymm3/m256/m16bcst and store the result in ymm1 subject to writemas=
k k1."
+"VMINPH zmm{k}{z},zmm,zmm/m512/m16bcst{sae}","EVEX.512.map5.W0 5d /r","Val=
id","Valid","Invalid","AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/=
m (r)","","Full Vector","Return the minimum packed FP16 values between zmm2=
 and zmm3/m512/m16bcst and store the result in zmm1 subject to writemask k1=
."
+"VMINSH xmm{k}{z},xmm,xmm/m16{sae}","EVEX.LIG.f3.map5.W0 5d /r","Valid","V=
alid","Invalid","AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)"=
,"","Scalar","Return the minimum low FP16 value between xmm3/m16 and xmm2. =
Stores the result in xmm1 subject to writemask k1. Bits 127:16 of xmm2 are =
copied to xmm1[127:16]."
+"VMOVSH xmm{k}{z},m16","EVEX.LIG.f3.map5.W0 10 /r","Valid","Valid","Invali=
d","AVX512FP16","ModRM:reg (r, w)","ModRM:r/m (r)","","","Scalar","Move FP1=
6 value from m16 to xmm1 subject to writemask k1."
+"VMOVSH xmm{k}{z},xmm,xmm","EVEX.LIG.f3.map5.W0 10 /r","Valid","Valid","In=
valid","AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","M=
ove low FP16 values from xmm3 to xmm1 subject to writemask k1. Bits 127:16 =
of xmm2 are copied to xmm1[127:16]."
+"VMOVSH m16{k},xmm","EVEX.LIG.f3.map5.W0 11 /r","Valid","Valid","Invalid",=
"AVX512FP16","ModRM:r/m (w)","ModRM:reg (r)","","","Scalar","Move low FP16 =
value from xmm1 to m16 subject to writemask k1."
+"VMOVSH xmm{k}{z},xmm,xmm","EVEX.LIG.f3.map5.W0 11 /r","Valid","Valid","In=
valid","AVX512FP16","ModRM:r/m (w)","VEX.vvvv (r)","ModRM:reg (r)","","","M=
ove low FP16 values from xmm3 to xmm1 subject to writemask k1. Bits 127:16 =
of xmm2 are copied to xmm1[127:16]."
+"VMOVW xmm,r32/m16","EVEX.128.66.map5.wig 6e /r","Valid","Valid","Invalid"=
,"AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","","Scalar","Copy word fro=
m reg/m16 to xmm1."
+"VMOVW r32/m16,xmm","EVEX.128.66.map5.wig 7e /r","Valid","Valid","Invalid"=
,"AVX512FP16","ModRM:r/m (w)","ModRM:reg (r)","","","Scalar","Copy word fro=
m xmm1 to reg/m16."
+"VMULPH xmm{k}{z},xmm,xmm/m128/m16bcst","EVEX.128.map5.W0 59 /r","Valid","=
Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector","Multiply packed FP16 values from xmm3/m128/ m1=
6bcst to xmm2 and store the result in xmm1 subject to writemask k1."
+"VMULPH ymm{k}{z},ymm,ymm/m256/m16bcst","EVEX.256.map5.W0 59 /r","Valid","=
Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector","Multiply packed FP16 values from ymm3/m256/ m1=
6bcst to ymm2 and store the result in ymm1 subject to writemask k1."
+"VMULPH zmm{k}{z},zmm,zmm/m512/m16bcst","EVEX.512.map5.W0 59 /r","Valid","=
Valid","Invalid","AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)=
","","Full Vector","Multiply packed FP16 values in zmm3/m512/m16bcst with z=
mm2 and store the result in zmm1 subject to writemask k1."
+"VMULSH xmm{k}{z},xmm,xmm/m16{er}","EVEX.LIG.f3.map5.W0 59 /r","Valid","Va=
lid","Invalid","AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)",=
"","Scalar","Multiply the low FP16 value in xmm3/m16 by low FP16 value in x=
mm2, and store the result in xmm1 subject to writemask k1. Bits 127:16 of x=
mm2 are copied to xmm1[127:16]."
+"VRCPPH xmm{k}{z},xmm/m128/m16bcst","EVEX.128.66.map6.W0 4c /r","Valid","V=
alid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","",""=
,"Full Vector","Compute the approximate reciprocals of packed FP16 values i=
n xmm2/m128/m16bcst and store the result in xmm1 subject to writemask k1."
+"VRCPPH ymm{k}{z},ymm/m256/m16bcst","EVEX.256.66.map6.W0 4c /r","Valid","V=
alid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","",""=
,"Full Vector","Compute the approximate reciprocals of packed FP16 values i=
n ymm2/m256/m16bcst and store the result in ymm1 subject to writemask k1."
+"VRCPPH zmm{k}{z},zmm/m512/m16bcst","EVEX.512.66.map6.W0 4c /r","Valid","V=
alid","Invalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","","Full Ve=
ctor","Compute the approximate reciprocals of packed FP16 values in zmm2/m5=
12/m16bcst and store the result in zmm1 subject to writemask k1."
+"VRCPSH xmm{k}{z},xmm,xmm/m16","EVEX.LIG.66.map6.W0 4d /r","Valid","Valid"=
,"Invalid","AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","=
Scalar","Compute the approximate reciprocal of the low FP16 value in xmm3/m=
16 and store the result in xmm1 subject to writemask k1. Bits 127:16 from x=
mm2 are copied to xmm1[127:16]."
+"VREDUCEPH xmm{k}{z},xmm/m128/m16bcst,ib","EVEX.128.0F3A.W0 56 /r ib","Val=
id","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)"=
,"ib","","Full Vector","Perform reduction transformation on packed FP16 val=
ues in xmm2/m128/m16bcst by subtracting a number of fraction bits specified=
 by the imm8 field. Store the result in xmm1 subject to writemask k1."
+"VREDUCEPH ymm{k}{z},ymm/m256/m16bcst,ib","EVEX.256.0F3A.W0 56 /r ib","Val=
id","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)"=
,"ib","","Full Vector","Perform reduction transformation on packed FP16 val=
ues in ymm2/m256/m16bcst by subtracting a number of fraction bits specified=
 by the imm8 field. Store the result in ymm1 subject to writemask k1."
+"VREDUCEPH zmm{k}{z},zmm/m512/m16bcst{sae},ib","EVEX.512.0F3A.W0 56 /r ib"=
,"Valid","Valid","Invalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","ib=
","","Full Vector","Perform reduction transformation on packed FP16 values =
in zmm2/m512/m16bcst by subtracting a number of fraction bits specified by =
the imm8 field. Store the result in zmm1 subject to writemask k1."
+"VREDUCESH xmm{k}{z},xmm,xmm/m16{sae},ib","EVEX.LIG.0F3A.W0 57 /r ib","Val=
id","Valid","Invalid","AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/=
m (r)","ib","Scalar","Perform a reduction transformation on the low binary =
encoded FP16 value in xmm3/m16 by subtracting a number of fraction bits spe=
cified by the imm8 field. Store the result in xmm1 subject to writemask k1.=
 Bits 127:16 from xmm2 are copied to xmm1[127:16]."
+"VRNDSCALEPH xmm{k}{z},xmm/m128/m16bcst,ib","EVEX.128.0F3A.W0 08 /r ib","V=
alid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r=
)","ib","","Full Vector","Round packed FP16 values in xmm2/m128/ m16bcst to=
 a number of fraction bits specified by the imm8 field. Store the result in=
 xmm1 subject to writemask k1."
+"VRNDSCALEPH ymm{k}{z},ymm/m256/m16bcst,ib","EVEX.256.0F3A.W0 08 /r ib","V=
alid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r=
)","ib","","Full Vector","Round packed FP16 values in ymm2/m256/m16bcst to =
a number of fraction bits specified by the imm8 field. Store the result in =
ymm1 subject to writemask k1."
+"VRNDSCALEPH zmm{k}{z},zmm/m512/m16bcst{sae},ib","EVEX.512.0F3A.W0 08 /r i=
b","Valid","Valid","Invalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","=
ib","","Full Vector","Round packed FP16 values in zmm2/m512/m16bcst to a nu=
mber of fraction bits specified by the imm8 field. Store the result in zmm1=
 subject to writemask k1."
+"VRNDSCALESH xmm{k}{z},xmm,xmm/m16{sae},ib","EVEX.LIG.0F3A.W0 0a /r ib","V=
alid","Valid","Invalid","AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModRM:=
r/m (r)","ib","Scalar","Round the low FP16 value in xmm3/m16 to a number of=
 fraction bits specified by the imm8 field. Store the result in xmm1 subjec=
t to writemask k1. Bits 127:16 from xmm2 are copied to xmm1[127:16]."
+"VRSQRTPH xmm{k}{z},xmm/m128/m16bcst","EVEX.128.66.map6.W0 4e /r","Valid",=
"Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","",=
"","Full Vector","Compute the approximate reciprocals of the square roots o=
f packed FP16 values in xmm2/m128/m16bcst and store the result in xmm1 subj=
ect to writemask k1."
+"VRSQRTPH ymm{k}{z},ymm/m256/m16bcst","EVEX.256.66.map6.W0 4e /r","Valid",=
"Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","",=
"","Full Vector","Compute the approximate reciprocals of the square roots o=
f packed FP16 values in ymm2/m256/m16bcst and store the result in ymm1 subj=
ect to writemask k1."
+"VRSQRTPH zmm{k}{z},zmm/m512/m16bcst","EVEX.512.66.map6.W0 4e /r","Valid",=
"Valid","Invalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","","Full =
Vector","Compute the approximate reciprocals of the square roots of packed =
FP16 values in zmm2/m512/m16bcst and store the result in zmm1 subject to wr=
itemask k1."
+"VRSQRTSH xmm{k}{z},xmm,xmm/m16","EVEX.LIG.66.map6.W0 4f /r","Valid","Vali=
d","Invalid","AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)",""=
,"Scalar","Compute the approximate reciprocal square root of the FP16 value=
 in xmm3/m16 and store the result in the low word element of xmm1 subject t=
o writemask k1. Bits 127:16 of xmm2 are copied to xmm1[127:16]."
+"VSCALEFPH xmm{k}{z},xmm,xmm/m128/m16bcst","EVEX.128.66.map6.W0 2c /r","Va=
lid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Scale the packed FP16 values in xmm2 usi=
ng values from xmm3/m128/m16bcst, and store the result in xmm1 subject to w=
ritemask k1."
+"VSCALEFPH ymm{k}{z},ymm,ymm/m256/m16bcst","EVEX.256.66.map6.W0 2c /r","Va=
lid","Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)"=
,"ModRM:r/m (r)","","Full Vector","Scale the packed FP16 values in ymm2 usi=
ng values from ymm3/m256/m16bcst, and store the result in ymm1 subject to w=
ritemask k1."
+"VSCALEFPH zmm{k}{z},zmm,zmm/m512/m16bcst{er}","EVEX.512.66.map6.W0 2c /r"=
,"Valid","Valid","Invalid","AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","Mod=
RM:r/m (r)","","Full Vector","Scale the packed FP16 values in zmm2 using va=
lues from zmm3/m512/m16bcst, and store the result in zmm1 subject to writem=
ask k1."
+"VSCALEFSH xmm{k}{z},xmm,xmm/m16{er}","EVEX.LIG.66.map6.W0 2d /r","Valid",=
"Valid","Invalid","AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r=
)","","Scalar","Scale the FP16 values in xmm2 using the value from xmm3/m16=
 and store the result in xmm1 subject to writemask k1. Bits 127:16 from xmm=
2 are copied to xmm1[127:16]."
+"VSQRTPH xmm{k}{z},xmm/m128/m16bcst","EVEX.128.map5.W0 51 /r","Valid","Val=
id","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","","=
Full Vector","Compute square roots of the packed FP16 values in xmm2/m128/m=
16bcst, and store the result in xmm1 subject to writemask k1."
+"VSQRTPH ymm{k}{z},ymm/m256/m16bcst","EVEX.256.map5.W0 51 /r","Valid","Val=
id","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","","=
Full Vector","Compute square roots of the packed FP16 values in ymm2/m256/m=
16bcst, and store the result in ymm1 subject to writemask k1."
+"VSQRTPH zmm{k}{z},zmm/m512/m16bcst{er}","EVEX.512.map5.W0 51 /r","Valid",=
"Valid","Invalid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","","Full =
Vector","Compute square roots of the packed FP16 values in zmm2/m512/m16bcs=
t, and store the result in zmm1 subject to writemask k1."
+"VSQRTSH xmm{k}{z},xmm,xmm/m16{er}","EVEX.LIG.f3.map5.W0 51 /r","Valid","V=
alid","Invalid","AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)"=
,"","Scalar","Compute square root of the low FP16 value in xmm3/m16 and sto=
re the result in xmm1 subject to writemask k1. Bits 127:16 from xmm2 are co=
pied to xmm1[127:16]."
+"VSUBPH xmm{k}{z},xmm,xmm/m128/m16bcst","EVEX.128.map5.W0 5c /r","Valid","=
Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector","Subtract packed FP16 values from xmm3/m128/m16=
bcst to xmm2, and store the result in xmm1 subject to writemask k1."
+"VSUBPH ymm{k}{z},ymm,ymm/m256/m16bcst","EVEX.256.map5.W0 5c /r","Valid","=
Valid","Invalid","AVX512VL AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModR=
M:r/m (r)","","Full Vector","Subtract packed FP16 values from ymm3/m256/m16=
bcst to ymm2, and store the result in ymm1 subject to writemask k1."
+"VSUBPH zmm{k}{z},zmm,zmm/m512/m16bcst{er}","EVEX.512.map5.W0 5c /r","Vali=
d","Valid","Invalid","AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m=
 (r)","","Full Vector","Subtract packed FP16 values from zmm3/m512/m16bcst =
to zmm2, and store the result in zmm1 subject to writemask k1."
+"VSUBSH xmm{k}{z},xmm,xmm/m16{er}","EVEX.LIG.f3.map5.W0 5c /r","Valid","Va=
lid","Invalid","AVX512FP16","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)",=
"","Scalar","Subtract the low FP16 value in xmm3/m16 from xmm2 and store th=
e result in xmm1 subject to writemask k1. Bits 127:16 from xmm2 are copied =
to xmm1[127:16]."
+"VUCOMISH xmm,xmm/m16{sae}","EVEX.LIG.map5.W0 2e /r","Valid","Valid","Inva=
lid","AVX512FP16","ModRM:reg (w)","ModRM:r/m (r)","","","Scalar","Compare l=
ow FP16 values in xmm1 and xmm2/m16 and set the EFLAGS flags accordingly."
diff --git a/disas/x86-data/x86_avx512ifma.csv b/disas/x86-data/x86_avx512i=
fma.csv
new file mode 100644
index 000000000000..5bda254f33f7
--- /dev/null
+++ b/disas/x86-data/x86_avx512ifma.csv
@@ -0,0 +1,7 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"VPMADD52HUQ xmm{k}{z},xmm,xmm/m128/m64bcst","EVEX.128.66.0F38.W1 b5 /r","=
Valid","Valid","Invalid","AVX512VL AVX512IFMA","ModRM:reg (r, w)","EVEX.vvv=
v (r)","ModRM:r/m (r)","","Full","Multiply unsigned 52-bit integers in xmm2=
 and xmm3/m128 and add the high 52 bits of the 104-bit product to the qword=
 unsigned integers in xmm1 using writemask k1."
+"VPMADD52HUQ ymm{k}{z},ymm,ymm/m256/m64bcst","EVEX.256.66.0F38.W1 b5 /r","=
Valid","Valid","Invalid","AVX512VL AVX512IFMA","ModRM:reg (r, w)","EVEX.vvv=
v (r)","ModRM:r/m (r)","","Full","Multiply unsigned 52-bit integers in ymm2=
 and ymm3/m256 and add the high 52 bits of the 104-bit product to the qword=
 unsigned integers in ymm1 using writemask k1."
+"VPMADD52HUQ zmm{k}{z},zmm,zmm/m512/m64bcst","EVEX.512.66.0F38.W1 b5 /r","=
Valid","Valid","Invalid","AVX512IFMA","ModRM:reg (r, w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","","Full","Multiply unsigned 52-bit integers in zmm2 and zmm3=
/m512 and add the high 52 bits of the 104-bit product to the qword unsigned=
 integers in zmm1 using writemask k1."
+"VPMADD52LUQ xmm{k}{z},xmm,xmm/m128/m64bcst","EVEX.128.66.0F38.W1 b4 /r","=
Valid","Valid","Invalid","AVX512VL AVX512IFMA","ModRM:reg (r, w)","EVEX.vvv=
v (r)","ModRM:r/m (r)","","Full","Multiply unsigned 52-bit integers in xmm2=
 and xmm3/m128 and add the low 52 bits of the 104-bit product to the qword =
unsigned integers in xmm1 using writemask k1."
+"VPMADD52LUQ ymm{k}{z},ymm,ymm/m256/m64bcst","EVEX.256.66.0F38.W1 b4 /r","=
Valid","Valid","Invalid","AVX512VL AVX512IFMA","ModRM:reg (r, w)","EVEX.vvv=
v (r)","ModRM:r/m (r)","","Full","Multiply unsigned 52-bit integers in ymm2=
 and ymm3/m256 and add the low 52 bits of the 104-bit product to the qword =
unsigned integers in ymm1 using writemask k1."
+"VPMADD52LUQ zmm{k}{z},zmm,zmm/m512/m64bcst","EVEX.512.66.0F38.W1 b4 /r","=
Valid","Valid","Invalid","AVX512IFMA","ModRM:reg (r, w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","","Full","Multiply unsigned 52-bit integers in zmm2 and zmm3=
/m512 and add the low 52 bits of the 104-bit product to the qword unsigned =
integers in zmm1 using writemask k1."
diff --git a/disas/x86-data/x86_avx512pf.csv b/disas/x86-data/x86_avx512pf.=
csv
new file mode 100644
index 000000000000..d7773d564b1a
--- /dev/null
+++ b/disas/x86-data/x86_avx512pf.csv
@@ -0,0 +1,17 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"VGATHERPF0DPD vm32y/f64x8 {k1}","EVEX.512.66.0F38.W1 C6 /1","Valid","Vali=
d","Invalid","AVX512PF","BaseReg (r): VSIB:base, VectorReg (r): VSIB:index"=
,"","","","Tuple1 Scalar","Using signed dword indices, prefetch sparse byte=
 memory locations containing double-precision data using opmask k1 and T0 h=
int."
+"VGATHERPF0DPS vm32z/f32x16 {k1}","EVEX.512.66.0F38.W0 C6 /1","Valid","Val=
id","Invalid","AVX512PF","BaseReg (r): VSIB:base, VectorReg (r): VSIB:index=
","","","","Tuple1 Scalar","Using signed dword indices, prefetch sparse byt=
e memory locations containing single-precision data using opmask k1 and T0 =
hint."
+"VGATHERPF0QPD vm64z/f64x8 {k1}","EVEX.512.66.0F38.W1 C7 /1","Valid","Vali=
d","Invalid","AVX512PF","BaseReg (r): VSIB:base, VectorReg (r): VSIB:index"=
,"","","","Tuple1 Scalar","Using signed qword indices, prefetch sparse byte=
 memory locations containing double-precision data using opmask k1 and T0 h=
int."
+"VGATHERPF0QPS vm64z/f32x8 {k1}","EVEX.512.66.0F38.W0 C7 /1","Valid","Vali=
d","Invalid","AVX512PF","BaseReg (r): VSIB:base, VectorReg (r): VSIB:index"=
,"","","","Tuple1 Scalar","Using signed qword indices, prefetch sparse byte=
 memory locations containing single-precision data using opmask k1 and T0 h=
int."
+"VGATHERPF1DPD vm32y/f64x8 {k1}","EVEX.512.66.0F38.W1 C6 /2","Valid","Vali=
d","Invalid","AVX512PF","BaseReg (r): VSIB:base, VectorReg (r): VSIB:index"=
,"","","","Tuple1 Scalar","Using signed dword indices, prefetch sparse byte=
 memory locations containing double-precision data using opmask k1 and T1 h=
int."
+"VGATHERPF1DPS vm32z/f32x16 {k1}","EVEX.512.66.0F38.W0 C6 /2","Valid","Val=
id","Invalid","AVX512PF","BaseReg (r): VSIB:base, VectorReg (r): VSIB:index=
","","","","Tuple1 Scalar","Using signed dword indices, prefetch sparse byt=
e memory locations containing single-precision data using opmask k1 and T1 =
hint."
+"VGATHERPF1QPD vm64z/f64x8 {k1}","EVEX.512.66.0F38.W1 C7 /2","Valid","Vali=
d","Invalid","AVX512PF","BaseReg (r): VSIB:base, VectorReg (r): VSIB:index"=
,"","","","Tuple1 Scalar","Using signed qword indices, prefetch sparse byte=
 memory locations containing double-precision data using opmask k1 and T1 h=
int."
+"VGATHERPF1QPS vm64z/f32x8 {k1}","EVEX.512.66.0F38.W0 C7 /2","Valid","Vali=
d","Invalid","AVX512PF","BaseReg (r): VSIB:base, VectorReg (r): VSIB:index"=
,"","","","Tuple1 Scalar","Using signed qword indices, prefetch sparse byte=
 memory locations containing single-precision data using opmask k1 and T1 h=
int."
+"VSCATTERPF0DPD vm32y/f64x8 {k1}","EVEX.512.66.0F38.W1 C6 /5","Valid","Val=
id","Invalid","AVX512PF","BaseReg (r): VSIB:base, VectorReg (r): VSIB:index=
","","","","Tuple1 Scalar","Using signed dword indices, prefetch sparse byt=
e memory locations containing double-precision data using writemask k1 and =
T0 hint with intent to write."
+"VSCATTERPF0DPS vm32z/f32x16 {k1}","EVEX.512.66.0F38.W0 C6 /5","Valid","Va=
lid","Invalid","AVX512PF","BaseReg (r): VSIB:base, VectorReg (r): VSIB:inde=
x","","","","Tuple1 Scalar","Using signed dword indices, prefetch sparse by=
te memory locations containing single-precision data using writemask k1 and=
 T0 hint with intent to write."
+"VSCATTERPF0QPD vm64z/f64x8 {k1}","EVEX.512.66.0F38.W1 C7 /5","Valid","Val=
id","Invalid","AVX512PF","BaseReg (r): VSIB:base, VectorReg (r): VSIB:index=
","","","","Tuple1 Scalar","Using signed qword indices, prefetch sparse byt=
e memory locations containing double-precision data using writemask k1 and =
T0 hint with intent to write."
+"VSCATTERPF0QPS vm64z/f32x8 {k1}","EVEX.512.66.0F38.W0 C7 /5","Valid","Val=
id","Invalid","AVX512PF","BaseReg (r): VSIB:base, VectorReg (r): VSIB:index=
","","","","Tuple1 Scalar","Using signed qword indices, prefetch sparse byt=
e memory locations containing single-precision data using writemask k1 and =
T0 hint with intent to write."
+"VSCATTERPF1DPD vm32y/f64x8 {k1}","EVEX.512.66.0F38.W1 C6 /6","Valid","Val=
id","Invalid","AVX512PF","BaseReg (r): VSIB:base, VectorReg (r): VSIB:index=
","","","","Tuple1 Scalar","Using signed dword indices, prefetch sparse byt=
e memory locations containing double-precision data using writemask k1 and =
T1 hint with intent to write."
+"VSCATTERPF1DPS vm32z/f32x16 {k1}","EVEX.512.66.0F38.W0 C6 /6","Valid","Va=
lid","Invalid","AVX512PF","BaseReg (r): VSIB:base, VectorReg (r): VSIB:inde=
x","","","","Tuple1 Scalar","Using signed dword indices, prefetch sparse by=
te memory locations containing single-precision data using writemask k1 and=
 T1 hint with intent to write."
+"VSCATTERPF1QPD vm64z/f64x8 {k1}","EVEX.512.66.0F38.W1 C7 /6","Valid","Val=
id","Invalid","AVX512PF","BaseReg (r): VSIB:base, VectorReg (r): VSIB:index=
","","","","Tuple1 Scalar","Using signed qword indices, prefetch sparse byt=
e memory locations containing double-precision data using writemask k1 and =
T1 hint with intent to write."
+"VSCATTERPF1QPS vm64z/f32x8 {k1}","EVEX.512.66.0F38.W0 C7 /6","Valid","Val=
id","Invalid","AVX512PF","BaseReg (r): VSIB:base, VectorReg (r): VSIB:index=
","","","","Tuple1 Scalar","Using signed qword indices, prefetch sparse byt=
e memory locations containing single-precision data using writemask k1 and =
T1 hint with intent to write."
diff --git a/disas/x86-data/x86_avx512vbmi.csv b/disas/x86-data/x86_avx512v=
bmi.csv
new file mode 100644
index 000000000000..b24820134cf7
--- /dev/null
+++ b/disas/x86-data/x86_avx512vbmi.csv
@@ -0,0 +1,13 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"VPERMB xmm{k}{z},xmm,xmm/m128","EVEX.128.66.0F38.W0 8d /r","Valid","Valid=
","Invalid","AVX512VL AVX512VBMI","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/=
m (r)","","Full Mem","Permute bytes in xmm3/m128 using byte indexes in xmm2=
 and store the result in xmm1 using writemask k1."
+"VPERMB ymm{k}{z},ymm,ymm/m256","EVEX.256.66.0F38.W0 8d /r","Valid","Valid=
","Invalid","AVX512VL AVX512VBMI","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/=
m (r)","","Full Mem","Permute bytes in ymm3/m256 using byte indexes in ymm2=
 and store the result in ymm1 using writemask k1."
+"VPERMB zmm{k}{z},zmm,zmm/m512","EVEX.512.66.0F38.W0 8d /r","Valid","Valid=
","Invalid","AVX512VBMI","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)",""=
,"Full Mem","Permute bytes in zmm3/m512 using byte indexes in zmm2 and stor=
e the result in zmm1 using writemask k1."
+"VPERMI2B xmm{k}{z},xmm,xmm/m128","EVEX.128.66.0F38.W0 75 /r","Valid","Val=
id","Invalid","AVX512VL AVX512VBMI","ModRM:reg (r, w)","EVEX.vvvv (r)","Mod=
RM:r/m (r)","","Full Mem","Permute bytes in xmm3/m128 and xmm2 using byte i=
ndexes in xmm1 and store the byte results in xmm1 using writemask k1."
+"VPERMI2B ymm{k}{z},ymm,ymm/m256","EVEX.256.66.0F38.W0 75 /r","Valid","Val=
id","Invalid","AVX512VL AVX512VBMI","ModRM:reg (r, w)","EVEX.vvvv (r)","Mod=
RM:r/m (r)","","Full Mem","Permute bytes in ymm3/m256 and ymm2 using byte i=
ndexes in ymm1 and store the byte results in ymm1 using writemask k1."
+"VPERMI2B zmm{k}{z},zmm,zmm/m512","EVEX.512.66.0F38.W0 75 /r","Valid","Val=
id","Invalid","AVX512VBMI","ModRM:reg (r, w)","EVEX.vvvv (r)","ModRM:r/m (r=
)","","Full Mem","Permute bytes in zmm3/m512 and zmm2 using byte indexes in=
 zmm1 and store the byte results in zmm1 using writemask k1."
+"VPERMT2B xmm{k}{z},xmm,xmm/m128","EVEX.128.66.0F38.W0 7d /r","Valid","Val=
id","Invalid","AVX512VL AVX512VBMI","ModRM:reg (r, w)","EVEX.vvvv (r)","Mod=
RM:r/m (r)","","Full Mem","Permute bytes in xmm3/m128 and xmm1 using byte i=
ndexes in xmm2 and store the byte results in xmm1 using writemask k1."
+"VPERMT2B ymm{k}{z},ymm,ymm/m256","EVEX.256.66.0F38.W0 7d /r","Valid","Val=
id","Invalid","AVX512VL AVX512VBMI","ModRM:reg (r, w)","EVEX.vvvv (r)","Mod=
RM:r/m (r)","","Full Mem","Permute bytes in ymm3/m256 and ymm1 using byte i=
ndexes in ymm2 and store the byte results in ymm1 using writemask k1."
+"VPERMT2B zmm{k}{z},zmm,zmm/m512","EVEX.512.66.0F38.W0 7d /r","Valid","Val=
id","Invalid","AVX512VBMI","ModRM:reg (r, w)","EVEX.vvvv (r)","ModRM:r/m (r=
)","","Full Mem","Permute bytes in zmm3/m512 and zmm1 using byte indexes in=
 zmm2 and store the byte results in zmm1 using writemask k1."
+"VPMULTISHIFTQB xmm{k}{z},xmm,xmm/m128/m64bcst","EVEX.128.66.0F38.W1 83 /r=
","Valid","Valid","Invalid","AVX512VL AVX512VBMI","ModRM:reg (w)","EVEX.vvv=
v (r)","ModRM:r/m (r)","","Full","Select unaligned bytes from qwords in xmm=
3/m128/m64bcst using control bytes in xmm2, write byte results to xmm1 unde=
r k1."
+"VPMULTISHIFTQB ymm{k}{z},ymm,ymm/m256/m64bcst","EVEX.256.66.0F38.W1 83 /r=
","Valid","Valid","Invalid","AVX512VL AVX512VBMI","ModRM:reg (w)","EVEX.vvv=
v (r)","ModRM:r/m (r)","","Full","Select unaligned bytes from qwords in ymm=
3/m256/m64bcst using control bytes in ymm2, write byte results to ymm1 unde=
r k1."
+"VPMULTISHIFTQB zmm{k}{z},zmm,zmm/m512/m64bcst","EVEX.512.66.0F38.W1 83 /r=
","Valid","Valid","Invalid","AVX512VBMI","ModRM:reg (w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","","Full","Select unaligned bytes from qwords in zmm3/m512/m6=
4bcst using control bytes in zmm2, write byte results to zmm1 under k1."
diff --git a/disas/x86-data/x86_avx512vbmi2.csv b/disas/x86-data/x86_avx512=
vbmi2.csv
new file mode 100644
index 000000000000..35f478e66c77
--- /dev/null
+++ b/disas/x86-data/x86_avx512vbmi2.csv
@@ -0,0 +1,61 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"VPCOMPRESSB m128/i8x16{k},xmm","EVEX.128.66.0F38.W0 63 /r","Valid","Valid=
","Invalid","AVX512VL AVX512VBMI2","ModRM:r/m (w)","ModRM:reg (r)","","","T=
uple1 Scalar","Compress up to 128 bits of packed byte values from xmm1 to m=
128 with writemask k1."
+"VPCOMPRESSB m256/i8x32{k},ymm","EVEX.256.66.0F38.W0 63 /r","Valid","Valid=
","Invalid","AVX512VL AVX512VBMI2","ModRM:r/m (w)","ModRM:reg (r)","","","T=
uple1 Scalar","Compress up to 256 bits of packed byte values from ymm1 to m=
256 with writemask k1."
+"VPCOMPRESSB m512/i8x64{k},zmm","EVEX.512.66.0F38.W0 63 /r","Valid","Valid=
","Invalid","AVX512VBMI2","ModRM:r/m (w)","ModRM:reg (r)","","","Tuple1 Sca=
lar","Compress up to 512 bits of packed byte values from zmm1 to m512 with =
writemask k1."
+"VPCOMPRESSB xmm/i8x16{k}{z},xmm","EVEX.128.66.0F38.W0 63 /r","Valid","Val=
id","Invalid","AVX512VL AVX512VBMI2","ModRM:r/m (w)","ModRM:reg (r)","","",=
"","Compress up to 128 bits of packed byte values from xmm2 to xmm1 with wr=
itemask k1."
+"VPCOMPRESSB ymm/i8x32{k}{z},ymm","EVEX.256.66.0F38.W0 63 /r","Valid","Val=
id","Invalid","AVX512VL AVX512VBMI2","ModRM:r/m (w)","ModRM:reg (r)","","",=
"","Compress up to 256 bits of packed byte values from ymm2 to ymm1 with wr=
itemask k1."
+"VPCOMPRESSB zmm/i8x64{k}{z},zmm","EVEX.512.66.0F38.W0 63 /r","Valid","Val=
id","Invalid","AVX512VBMI2","ModRM:r/m (w)","ModRM:reg (r)","","","","Compr=
ess up to 512 bits of packed byte values from zmm2 to zmm1 with writemask k=
1."
+"VPCOMPRESSW m128/i16x8{k},xmm","EVEX.128.66.0F38.W1 63 /r","Valid","Valid=
","Invalid","AVX512VL AVX512VBMI2","ModRM:r/m (w)","ModRM:reg (r)","","","T=
uple1 Scalar","Compress up to 128 bits of packed word values from xmm1 to m=
128 with writemask k1."
+"VPCOMPRESSW m256/i16x16{k},ymm","EVEX.256.66.0F38.W1 63 /r","Valid","Vali=
d","Invalid","AVX512VL AVX512VBMI2","ModRM:r/m (w)","ModRM:reg (r)","","","=
Tuple1 Scalar","Compress up to 256 bits of packed word values from ymm1 to =
m256 with writemask k1."
+"VPCOMPRESSW m512/i16x32{k},zmm","EVEX.512.66.0F38.W1 63 /r","Valid","Vali=
d","Invalid","AVX512VBMI2","ModRM:r/m (w)","ModRM:reg (r)","","","Tuple1 Sc=
alar","Compress up to 512 bits of packed word values from zmm1 to m512 with=
 writemask k1."
+"VPCOMPRESSW xmm/i16x8{k}{z},xmm","EVEX.128.66.0F38.W1 63 /r","Valid","Val=
id","Invalid","AVX512VL AVX512VBMI2","ModRM:r/m (w)","ModRM:reg (r)","","",=
"","Compress up to 128 bits of packed word values from xmm2 to xmm1 with wr=
itemask k1."
+"VPCOMPRESSW ymm/i16x16{k}{z},ymm","EVEX.256.66.0F38.W1 63 /r","Valid","Va=
lid","Invalid","AVX512VL AVX512VBMI2","ModRM:r/m (w)","ModRM:reg (r)","",""=
,"","Compress up to 256 bits of packed word values from ymm2 to ymm1 with w=
ritemask k1."
+"VPCOMPRESSW zmm/i16x32{k}{z},zmm","EVEX.512.66.0F38.W1 63 /r","Valid","Va=
lid","Invalid","AVX512VBMI2","ModRM:r/m (w)","ModRM:reg (r)","","","","Comp=
ress up to 512 bits of packed word values from zmm2 to zmm1 with writemask =
k1."
+"VPEXPANDB xmm{k}{z},m128/i8x16","EVEX.128.66.0F38.W0 62 /r","Valid","Vali=
d","Invalid","AVX512VL AVX512VBMI2","ModRM:reg (w)","ModRM:r/m (r)","","","=
Tuple1 Scalar","Expands up to 128 bits of packed byte values from m128 to x=
mm1 with writemask k1."
+"VPEXPANDB xmm{k}{z},xmm/i8x16","EVEX.128.66.0F38.W0 62 /r","Valid","Valid=
","Invalid","AVX512VL AVX512VBMI2","ModRM:reg (w)","ModRM:r/m (r)","","",""=
,"Expands up to 128 bits of packed byte values from xmm2 to xmm1 with write=
mask k1."
+"VPEXPANDB ymm{k}{z},m256/i8x32","EVEX.256.66.0F38.W0 62 /r","Valid","Vali=
d","Invalid","AVX512VL AVX512VBMI2","ModRM:reg (w)","ModRM:r/m (r)","","","=
Tuple1 Scalar","Expands up to 256 bits of packed byte values from m256 to y=
mm1 with writemask k1."
+"VPEXPANDB ymm{k}{z},ymm/i8x32","EVEX.256.66.0F38.W0 62 /r","Valid","Valid=
","Invalid","AVX512VL AVX512VBMI2","ModRM:reg (w)","ModRM:r/m (r)","","",""=
,"Expands up to 256 bits of packed byte values from ymm2 to ymm1 with write=
mask k1."
+"VPEXPANDB zmm{k}{z},m512/i8x64","EVEX.512.66.0F38.W0 62 /r","Valid","Vali=
d","Invalid","AVX512VBMI2","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple1 Sc=
alar","Expands up to 512 bits of packed byte values from m512 to zmm1 with =
writemask k1."
+"VPEXPANDB zmm{k}{z},zmm/i8x64","EVEX.512.66.0F38.W0 62 /r","Valid","Valid=
","Invalid","AVX512VBMI2","ModRM:reg (w)","ModRM:r/m (r)","","","","Expands=
 up to 512 bits of packed byte values from zmm2 to zmm1 with writemask k1."
+"VPEXPANDW xmm{k}{z},m128/i16x8","EVEX.128.66.0F38.W1 62 /r","Valid","Vali=
d","Invalid","AVX512VL AVX512VBMI2","ModRM:reg (w)","ModRM:r/m (r)","","","=
Tuple1 Scalar","Expands up to 128 bits of packed word values from m128 to x=
mm1 with writemask k1."
+"VPEXPANDW xmm{k}{z},xmm/i16x8","EVEX.128.66.0F38.W1 62 /r","Valid","Valid=
","Invalid","AVX512VL AVX512VBMI2","ModRM:reg (w)","ModRM:r/m (r)","","",""=
,"Expands up to 128 bits of packed word values from xmm2 to xmm1 with write=
mask k1."
+"VPEXPANDW ymm{k}{z},m256/i16x16","EVEX.256.66.0F38.W1 62 /r","Valid","Val=
id","Invalid","AVX512VL AVX512VBMI2","ModRM:reg (w)","ModRM:r/m (r)","","",=
"Tuple1 Scalar","Expands up to 256 bits of packed word values from m256 to =
ymm1 with writemask k1."
+"VPEXPANDW ymm{k}{z},ymm/i16x16","EVEX.256.66.0F38.W1 62 /r","Valid","Vali=
d","Invalid","AVX512VL AVX512VBMI2","ModRM:reg (w)","ModRM:r/m (r)","","","=
","Expands up to 256 bits of packed word values from ymm2 to ymm1 with writ=
emask k1."
+"VPEXPANDW zmm{k}{z},m512/i16x32","EVEX.512.66.0F38.W1 62 /r","Valid","Val=
id","Invalid","AVX512VBMI2","ModRM:reg (w)","ModRM:r/m (r)","","","Tuple1 S=
calar","Expands up to 512 bits of packed word values from m512 to zmm1 with=
 writemask k1."
+"VPEXPANDW zmm{k}{z},zmm/i16x32","EVEX.512.66.0F38.W1 62 /r","Valid","Vali=
d","Invalid","AVX512VBMI2","ModRM:reg (w)","ModRM:r/m (r)","","","","Expand=
s up to 512 bits of packed word values from zmm2 to zmm1 with writemask k1."
+"VPSHLDD xmm{k}{z},xmm,xmm/m128/m32bcst,ib","EVEX.128.66.0F3A.W0 71 /r ib"=
,"Valid","Valid","Invalid","AVX512VL AVX512VBMI2","ModRM:reg (w)","EVEX.vvv=
v (r)","ModRM:r/m (r)","ib","Full","Concatenate destination and source oper=
ands, extract result shifted to the left by constant value in imm8 into xmm=
1."
+"VPSHLDD ymm{k}{z},ymm,ymm/m256/m32bcst,ib","EVEX.256.66.0F3A.W0 71 /r ib"=
,"Valid","Valid","Invalid","AVX512VL AVX512VBMI2","ModRM:reg (w)","EVEX.vvv=
v (r)","ModRM:r/m (r)","ib","Full","Concatenate destination and source oper=
ands, extract result shifted to the left by constant value in imm8 into ymm=
1."
+"VPSHLDD zmm{k}{z},zmm,zmm/m512/m32bcst,ib","EVEX.512.66.0F3A.W0 71 /r ib"=
,"Valid","Valid","Invalid","AVX512VBMI2","ModRM:reg (w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","ib","Full","Concatenate destination and source operands, ext=
ract result shifted to the left by constant value in imm8 into zmm1."
+"VPSHLDQ xmm{k}{z},xmm,xmm/m128/m64bcst,ib","EVEX.128.66.0F3A.W1 71 /r ib"=
,"Valid","Valid","Invalid","AVX512VL AVX512VBMI2","ModRM:reg (w)","EVEX.vvv=
v (r)","ModRM:r/m (r)","ib","Full","Concatenate destination and source oper=
ands, extract result shifted to the left by constant value in imm8 into xmm=
1."
+"VPSHLDQ ymm{k}{z},ymm,ymm/m256/m64bcst,ib","EVEX.256.66.0F3A.W1 71 /r ib"=
,"Valid","Valid","Invalid","AVX512VL AVX512VBMI2","ModRM:reg (w)","EVEX.vvv=
v (r)","ModRM:r/m (r)","ib","Full","Concatenate destination and source oper=
ands, extract result shifted to the left by constant value in imm8 into ymm=
1."
+"VPSHLDQ zmm{k}{z},zmm,zmm/m512/m64bcst,ib","EVEX.512.66.0F3A.W1 71 /r ib"=
,"Valid","Valid","Invalid","AVX512VBMI2","ModRM:reg (w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","ib","Full","Concatenate destination and source operands, ext=
ract result shifted to the left by constant value in imm8 into zmm1."
+"VPSHLDVD xmm{k}{z},xmm,xmm/m128/m32bcst","EVEX.128.66.0F38.W0 71 /r","Val=
id","Valid","Invalid","AVX512VL AVX512VBMI2","ModRM:reg (r, w)","EVEX.vvvv =
(r)","ModRM:r/m (r)","","Full","Concatenate xmm1 and xmm2, extract result s=
hifted to the left by value in xmm3/m128 into xmm1."
+"VPSHLDVD ymm{k}{z},ymm,ymm/m256/m32bcst","EVEX.256.66.0F38.W0 71 /r","Val=
id","Valid","Invalid","AVX512VL AVX512VBMI2","ModRM:reg (r, w)","EVEX.vvvv =
(r)","ModRM:r/m (r)","","Full","Concatenate ymm1 and ymm2, extract result s=
hifted to the left by value in xmm3/m256 into ymm1."
+"VPSHLDVD zmm{k}{z},zmm,zmm/m512/m32bcst","EVEX.512.66.0F38.W0 71 /r","Val=
id","Valid","Invalid","AVX512VBMI2","ModRM:reg (r, w)","EVEX.vvvv (r)","Mod=
RM:r/m (r)","","Full","Concatenate zmm1 and zmm2, extract result shifted to=
 the left by value in zmm3/m512 into zmm1."
+"VPSHLDVQ xmm{k}{z},xmm,xmm/m128/m64bcst","EVEX.128.66.0F38.W1 71 /r","Val=
id","Valid","Invalid","AVX512VL AVX512VBMI2","ModRM:reg (r, w)","EVEX.vvvv =
(r)","ModRM:r/m (r)","","Full","Concatenate xmm1 and xmm2, extract result s=
hifted to the left by value in xmm3/m128 into xmm1."
+"VPSHLDVQ ymm{k}{z},ymm,ymm/m256/m64bcst","EVEX.256.66.0F38.W1 71 /r","Val=
id","Valid","Invalid","AVX512VL AVX512VBMI2","ModRM:reg (r, w)","EVEX.vvvv =
(r)","ModRM:r/m (r)","","Full","Concatenate ymm1 and ymm2, extract result s=
hifted to the left by value in xmm3/m256 into ymm1."
+"VPSHLDVQ zmm{k}{z},zmm,zmm/m512/m64bcst","EVEX.512.66.0F38.W1 71 /r","Val=
id","Valid","Invalid","AVX512VBMI2","ModRM:reg (r, w)","EVEX.vvvv (r)","Mod=
RM:r/m (r)","","Full","Concatenate zmm1 and zmm2, extract result shifted to=
 the left by value in zmm3/m512 into zmm1."
+"VPSHLDVW xmm{k}{z},xmm,xmm/m128","EVEX.128.66.0F38.W1 70 /r","Valid","Val=
id","Invalid","AVX512VL AVX512VBMI2","ModRM:reg (r, w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Full Mem","Concatenate xmm1 and xmm2, extract result shift=
ed to the left by value in xmm3/m128 into xmm1."
+"VPSHLDVW ymm{k}{z},ymm,ymm/m256","EVEX.256.66.0F38.W1 70 /r","Valid","Val=
id","Invalid","AVX512VL AVX512VBMI2","ModRM:reg (r, w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Full Mem","Concatenate ymm1 and ymm2, extract result shift=
ed to the left by value in xmm3/m256 into ymm1."
+"VPSHLDVW zmm{k}{z},zmm,zmm/m512","EVEX.512.66.0F38.W1 70 /r","Valid","Val=
id","Invalid","AVX512VBMI2","ModRM:reg (r, w)","EVEX.vvvv (r)","ModRM:r/m (=
r)","","Full Mem","Concatenate zmm1 and zmm2, extract result shifted to the=
 left by value in zmm3/m512 into zmm1."
+"VPSHLDW xmm{k}{z},xmm,xmm/m128,ib","EVEX.128.66.0F3A.W1 70 /r ib","Valid"=
,"Valid","Invalid","AVX512VL AVX512VBMI2","ModRM:reg (w)","EVEX.vvvv (r)","=
ModRM:r/m (r)","ib","Full Mem","Concatenate destination and source operands=
, extract result shifted to the left by constant value in imm8 into xmm1."
+"VPSHLDW ymm{k}{z},ymm,ymm/m256,ib","EVEX.256.66.0F3A.W1 70 /r ib","Valid"=
,"Valid","Invalid","AVX512VL AVX512VBMI2","ModRM:reg (w)","EVEX.vvvv (r)","=
ModRM:r/m (r)","ib","Full Mem","Concatenate destination and source operands=
, extract result shifted to the left by constant value in imm8 into ymm1."
+"VPSHLDW zmm{k}{z},zmm,zmm/m512,ib","EVEX.512.66.0F3A.W1 70 /r ib","Valid"=
,"Valid","Invalid","AVX512VBMI2","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m=
 (r)","ib","Full Mem","Concatenate destination and source operands, extract=
 result shifted to the left by constant value in imm8 into zmm1."
+"VPSHRDD xmm{k}{z},xmm,xmm/m128/m32bcst,ib","EVEX.128.66.0F3A.W0 73 /r ib"=
,"Valid","Valid","Invalid","AVX512VL AVX512VBMI2","ModRM:reg (w)","EVEX.vvv=
v (r)","ModRM:r/m (r)","ib","Full","Concatenate destination and source oper=
ands, extract result shifted to the right by constant value in imm8 into xm=
m1."
+"VPSHRDD ymm{k}{z},ymm,ymm/m256/m32bcst,ib","EVEX.256.66.0F3A.W0 73 /r ib"=
,"Valid","Valid","Invalid","AVX512VL AVX512VBMI2","ModRM:reg (w)","EVEX.vvv=
v (r)","ModRM:r/m (r)","ib","Full","Concatenate destination and source oper=
ands, extract result shifted to the right by constant value in imm8 into ym=
m1."
+"VPSHRDD zmm{k}{z},zmm,zmm/m512/m32bcst,ib","EVEX.512.66.0F3A.W0 73 /r ib"=
,"Valid","Valid","Invalid","AVX512VBMI2","ModRM:reg (w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","ib","Full","Concatenate destination and source operands, ext=
ract result shifted to the right by constant value in imm8 into zmm1."
+"VPSHRDQ xmm{k}{z},xmm,xmm/m128/m64bcst,ib","EVEX.128.66.0F3A.W1 73 /r ib"=
,"Valid","Valid","Invalid","AVX512VL AVX512VBMI2","ModRM:reg (w)","EVEX.vvv=
v (r)","ModRM:r/m (r)","ib","Full","Concatenate destination and source oper=
ands, extract result shifted to the right by constant value in imm8 into xm=
m1."
+"VPSHRDQ ymm{k}{z},ymm,ymm/m256/m64bcst,ib","EVEX.256.66.0F3A.W1 73 /r ib"=
,"Valid","Valid","Invalid","AVX512VL AVX512VBMI2","ModRM:reg (w)","EVEX.vvv=
v (r)","ModRM:r/m (r)","ib","Full","Concatenate destination and source oper=
ands, extract result shifted to the right by constant value in imm8 into ym=
m1."
+"VPSHRDQ zmm{k}{z},zmm,zmm/m512/m64bcst,ib","EVEX.512.66.0F3A.W1 73 /r ib"=
,"Valid","Valid","Invalid","AVX512VBMI2","ModRM:reg (w)","EVEX.vvvv (r)","M=
odRM:r/m (r)","ib","Full","Concatenate destination and source operands, ext=
ract result shifted to the right by constant value in imm8 into zmm1."
+"VPSHRDVD xmm{k}{z},xmm,xmm/m128/m32bcst","EVEX.128.66.0F38.W0 73 /r","Val=
id","Valid","Invalid","AVX512VL AVX512VBMI2","ModRM:reg (r, w)","EVEX.vvvv =
(r)","ModRM:r/m (r)","","Full","Concatenate xmm1 and xmm2, extract result s=
hifted to the right by value in xmm3/m128 into xmm1."
+"VPSHRDVD ymm{k}{z},ymm,ymm/m256/m32bcst","EVEX.256.66.0F38.W0 73 /r","Val=
id","Valid","Invalid","AVX512VL AVX512VBMI2","ModRM:reg (r, w)","EVEX.vvvv =
(r)","ModRM:r/m (r)","","Full","Concatenate ymm1 and ymm2, extract result s=
hifted to the right by value in xmm3/m256 into ymm1."
+"VPSHRDVD zmm{k}{z},zmm,zmm/m512/m32bcst","EVEX.512.66.0F38.W0 73 /r","Val=
id","Valid","Invalid","AVX512VBMI2","ModRM:reg (r, w)","EVEX.vvvv (r)","Mod=
RM:r/m (r)","","Full","Concatenate zmm1 and zmm2, extract result shifted to=
 the right by value in zmm3/m512 into zmm1."
+"VPSHRDVQ xmm{k}{z},xmm,xmm/m128/m64bcst","EVEX.128.66.0F38.W1 73 /r","Val=
id","Valid","Invalid","AVX512VL AVX512VBMI2","ModRM:reg (r, w)","EVEX.vvvv =
(r)","ModRM:r/m (r)","","Full","Concatenate xmm1 and xmm2, extract result s=
hifted to the right by value in xmm3/m128 into xmm1."
+"VPSHRDVQ ymm{k}{z},ymm,ymm/m256/m64bcst","EVEX.256.66.0F38.W1 73 /r","Val=
id","Valid","Invalid","AVX512VL AVX512VBMI2","ModRM:reg (r, w)","EVEX.vvvv =
(r)","ModRM:r/m (r)","","Full","Concatenate ymm1 and ymm2, extract result s=
hifted to the right by value in xmm3/m256 into ymm1."
+"VPSHRDVQ zmm{k}{z},zmm,zmm/m512/m64bcst","EVEX.512.66.0F38.W1 73 /r","Val=
id","Valid","Invalid","AVX512VBMI2","ModRM:reg (r, w)","EVEX.vvvv (r)","Mod=
RM:r/m (r)","","Full","Concatenate zmm1 and zmm2, extract result shifted to=
 the right by value in zmm3/m512 into zmm1."
+"VPSHRDVW xmm{k}{z},xmm,xmm/m128","EVEX.128.66.0F38.W1 72 /r","Valid","Val=
id","Invalid","AVX512VL AVX512VBMI2","ModRM:reg (r, w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Full Mem","Concatenate xmm1 and xmm2, extract result shift=
ed to the right by value in xmm3/m128 into xmm1."
+"VPSHRDVW ymm{k}{z},ymm,ymm/m256","EVEX.256.66.0F38.W1 72 /r","Valid","Val=
id","Invalid","AVX512VL AVX512VBMI2","ModRM:reg (r, w)","EVEX.vvvv (r)","Mo=
dRM:r/m (r)","","Full Mem","Concatenate ymm1 and ymm2, extract result shift=
ed to the right by value in xmm3/m256 into ymm1."
+"VPSHRDVW zmm{k}{z},zmm,zmm/m512","EVEX.512.66.0F38.W1 72 /r","Valid","Val=
id","Invalid","AVX512VBMI2","ModRM:reg (r, w)","EVEX.vvvv (r)","ModRM:r/m (=
r)","","Full Mem","Concatenate zmm1 and zmm2, extract result shifted to the=
 right by value in zmm3/m512 into zmm1."
+"VPSHRDW xmm{k}{z},xmm,xmm/m128,ib","EVEX.128.66.0F3A.W1 72 /r ib","Valid"=
,"Valid","Invalid","AVX512VL AVX512VBMI2","ModRM:reg (w)","EVEX.vvvv (r)","=
ModRM:r/m (r)","ib","Full Mem","Concatenate destination and source operands=
, extract result shifted to the right by constant value in imm8 into xmm1."
+"VPSHRDW ymm{k}{z},ymm,ymm/m256,ib","EVEX.256.66.0F3A.W1 72 /r ib","Valid"=
,"Valid","Invalid","AVX512VL AVX512VBMI2","ModRM:reg (w)","EVEX.vvvv (r)","=
ModRM:r/m (r)","ib","Full Mem","Concatenate destination and source operands=
, extract result shifted to the right by constant value in imm8 into ymm1."
+"VPSHRDW zmm{k}{z},zmm,zmm/m512,ib","EVEX.512.66.0F3A.W1 72 /r ib","Valid"=
,"Valid","Invalid","AVX512VBMI2","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m=
 (r)","ib","Full Mem","Concatenate destination and source operands, extract=
 result shifted to the right by constant value in imm8 into zmm1."
diff --git a/disas/x86-data/x86_avx512vl.csv b/disas/x86-data/x86_avx512vl.=
csv
new file mode 100644
index 000000000000..d8111406786a
--- /dev/null
+++ b/disas/x86-data/x86_avx512vl.csv
@@ -0,0 +1,2 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"VCVTPS2PD ymm1 {k1}{z}, xmm2/m128/m32bcst","EVEX.256.0F.W0 5A /r","Valid"=
,"Valid","Invalid","AVX512VL","ModRM:reg (w)","ModRM:r/m (r)","","","Half V=
ector","Convert four packed single-precision floating-point values in xmm2/=
m128/m32bcst to packed double-precision floating-point values in ymm1 with =
writemask k1."
diff --git a/disas/x86-data/x86_avx512vnni.csv b/disas/x86-data/x86_avx512v=
nni.csv
new file mode 100644
index 000000000000..2167968eabac
--- /dev/null
+++ b/disas/x86-data/x86_avx512vnni.csv
@@ -0,0 +1,13 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"VPDPBUSD xmm{k}{z},xmm,xmm/m128/m32bcst","EVEX.128.66.0F38.W0 50 /r","Val=
id","Valid","Invalid","AVX512VL AVX512VNNI","ModRM:reg (r, w)","EVEX.vvvv (=
r)","ModRM:r/m (r)","","Full","Multiply groups of 4 pairs of signed bytes i=
n xmm3/m128/m32bcst with corresponding unsigned bytes of xmm2, summing thos=
e products and adding them to doubleword result in xmm1 under writemask k1."
+"VPDPBUSD ymm{k}{z},ymm,ymm/m256/m32bcst","EVEX.256.66.0F38.W0 50 /r","Val=
id","Valid","Invalid","AVX512VL AVX512VNNI","ModRM:reg (r, w)","EVEX.vvvv (=
r)","ModRM:r/m (r)","","Full","Multiply groups of 4 pairs of signed bytes i=
n ymm3/m256/m32bcst with corresponding unsigned bytes of ymm2, summing thos=
e products and adding them to doubleword result in ymm1 under writemask k1."
+"VPDPBUSD zmm{k}{z},zmm,zmm/m512/m32bcst","EVEX.512.66.0F38.W0 50 /r","Val=
id","Valid","Invalid","AVX512VNNI","ModRM:reg (r, w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Full","Multiply groups of 4 pairs of signed bytes in zmm3/m5=
12/m32bcst with corresponding unsigned bytes of zmm2, summing those product=
s and adding them to doubleword result in zmm1 under writemask k1."
+"VPDPBUSDS xmm{k}{z},xmm,xmm/m128/m32bcst","EVEX.128.66.0F38.W0 51 /r","Va=
lid","Valid","Invalid","AVX512VL AVX512VNNI","ModRM:reg (r, w)","EVEX.vvvv =
(r)","ModRM:r/m (r)","","Full","Multiply groups of 4 pairs signed bytes in =
xmm3/m128/m32bcst with corresponding unsigned bytes of xmm2, summing those =
products and adding them to doubleword result, with signed saturation in xm=
m1, under writemask k1."
+"VPDPBUSDS ymm{k}{z},ymm,ymm/m256/m32bcst","EVEX.256.66.0F38.W0 51 /r","Va=
lid","Valid","Invalid","AVX512VL AVX512VNNI","ModRM:reg (r, w)","EVEX.vvvv =
(r)","ModRM:r/m (r)","","Full","Multiply groups of 4 pairs signed bytes in =
ymm3/m256/m32bcst with corresponding unsigned bytes of ymm2, summing those =
products and adding them to doubleword result, with signed saturation in ym=
m1, under writemask k1."
+"VPDPBUSDS zmm{k}{z},zmm,zmm/m512/m32bcst","EVEX.512.66.0F38.W0 51 /r","Va=
lid","Valid","Invalid","AVX512VNNI","ModRM:reg (r, w)","EVEX.vvvv (r)","Mod=
RM:r/m (r)","","Full","Multiply groups of 4 pairs signed bytes in zmm3/m512=
/m32bcst with corresponding unsigned bytes of zmm2, summing those products =
and adding them to doubleword result, with signed saturation in zmm1, under=
 writemask k1."
+"VPDPWSSD xmm{k}{z},xmm,xmm/m128/m32bcst","EVEX.128.66.0F38.W0 52 /r","Val=
id","Valid","Invalid","AVX512VL AVX512VNNI","ModRM:reg (r, w)","EVEX.vvvv (=
r)","ModRM:r/m (r)","","Full","Multiply groups of 2 pairs signed words in x=
mm3/m128/m32bcst with corresponding signed words of xmm2, summing those pro=
ducts and adding them to doubleword result in xmm1, under writemask k1."
+"VPDPWSSD ymm{k}{z},ymm,ymm/m256/m32bcst","EVEX.256.66.0F38.W0 52 /r","Val=
id","Valid","Invalid","AVX512VL AVX512VNNI","ModRM:reg (r, w)","EVEX.vvvv (=
r)","ModRM:r/m (r)","","Full","Multiply groups of 2 pairs signed words in y=
mm3/m256/m32bcst with corresponding signed words of ymm2, summing those pro=
ducts and adding them to doubleword result in ymm1, under writemask k1."
+"VPDPWSSD zmm{k}{z},zmm,zmm/m512/m32bcst","EVEX.512.66.0F38.W0 52 /r","Val=
id","Valid","Invalid","AVX512VNNI","ModRM:reg (r, w)","EVEX.vvvv (r)","ModR=
M:r/m (r)","","Full","Multiply groups of 2 pairs signed words in zmm3/m512/=
m32bcst with corresponding signed words of zmm2, summing those products and=
 adding them to doubleword result in zmm1, under writemask k1."
+"VPDPWSSDS xmm{k}{z},xmm,xmm/m128/m32bcst","EVEX.128.66.0F38.W0 53 /r","Va=
lid","Valid","Invalid","AVX512VL AVX512VNNI","ModRM:reg (r, w)","EVEX.vvvv =
(r)","ModRM:r/m (r)","","Full","Multiply groups of 2 pairs of signed words =
in xmm3/m128/m32bcst with corresponding signed words of xmm2, summing those=
 products and adding them to doubleword result in xmm1, with signed saturat=
ion, under writemask k1."
+"VPDPWSSDS ymm{k}{z},ymm,ymm/m256/m32bcst","EVEX.256.66.0F38.W0 53 /r","Va=
lid","Valid","Invalid","AVX512VL AVX512VNNI","ModRM:reg (r, w)","EVEX.vvvv =
(r)","ModRM:r/m (r)","","Full","Multiply groups of 2 pairs of signed words =
in ymm3/m256/m32bcst with corresponding signed words of ymm2, summing those=
 products and adding them to doubleword result in ymm1, with signed saturat=
ion, under writemask k1."
+"VPDPWSSDS zmm{k}{z},zmm,zmm/m512/m32bcst","EVEX.512.66.0F38.W0 53 /r","Va=
lid","Valid","Invalid","AVX512VNNI","ModRM:reg (r, w)","EVEX.vvvv (r)","Mod=
RM:r/m (r)","","Full","Multiply groups of 2 pairs of signed words in zmm3/m=
512/m32bcst with corresponding signed words of zmm2, summing those products=
 and adding them to doubleword result in zmm1, with signed saturation, unde=
r writemask k1."
diff --git a/disas/x86-data/x86_avx512vp2intersect.csv b/disas/x86-data/x86=
_avx512vp2intersect.csv
new file mode 100644
index 000000000000..8e40ae87acee
--- /dev/null
+++ b/disas/x86-data/x86_avx512vp2intersect.csv
@@ -0,0 +1,7 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"VP2INTERSECTD k{rs2},xmm,xmm/m128/m32bcst","EVEX.128.f2.0F38.W0 68 /r","V=
alid","Valid","Invalid","AVX512VL AVX512VP2INTERSECT","ModRM:reg (w)","EVEX=
.vvvv (r)","ModRM:r/m (r)","","Full","Store, in an even/odd pair of mask re=
gisters, the indicators of the locations of value matches between dwords in=
 xmm3/m128/m32bcst and xmm2."
+"VP2INTERSECTD k{rs2},ymm,ymm/m256/m32bcst","EVEX.256.f2.0F38.W0 68 /r","V=
alid","Valid","Invalid","AVX512VL AVX512VP2INTERSECT","ModRM:reg (w)","EVEX=
.vvvv (r)","ModRM:r/m (r)","","Full","Store, in an even/odd pair of mask re=
gisters, the indicators of the locations of value matches between dwords in=
 ymm3/m256/m32bcst and ymm2."
+"VP2INTERSECTD k{rs2},zmm,zmm/m512/m32bcst","EVEX.512.f2.0F38.W0 68 /r","V=
alid","Valid","Invalid","AVX512VP2INTERSECT","ModRM:reg (w)","EVEX.vvvv (r)=
","ModRM:r/m (r)","","Full","Store, in an even/odd pair of mask registers, =
the indicators of the locations of value matches between dwords in zmm3/m51=
2/m32bcst and zmm2."
+"VP2INTERSECTQ k{rs2},xmm,xmm/m128/m64bcst","EVEX.128.f2.0F38.W1 68 /r","V=
alid","Valid","Invalid","AVX512VL AVX512VP2INTERSECT","ModRM:reg (w)","EVEX=
.vvvv (r)","ModRM:r/m (r)","","Full","Store, in an even/odd pair of mask re=
gisters, the indicators of the locations of value matches between quadwords=
 in xmm3/m128/m64bcst and xmm2."
+"VP2INTERSECTQ k{rs2},ymm,ymm/m256/m64bcst","EVEX.256.f2.0F38.W1 68 /r","V=
alid","Valid","Invalid","AVX512VL AVX512VP2INTERSECT","ModRM:reg (w)","EVEX=
.vvvv (r)","ModRM:r/m (r)","","Full","Store, in an even/odd pair of mask re=
gisters, the indicators of the locations of value matches between quadwords=
 in ymm3/m256/m64bcst and ymm2."
+"VP2INTERSECTQ k{rs2},zmm,zmm/m512/m64bcst","EVEX.512.f2.0F38.W1 68 /r","V=
alid","Valid","Invalid","AVX512VP2INTERSECT","ModRM:reg (w)","EVEX.vvvv (r)=
","ModRM:r/m (r)","","Full","Store, in an even/odd pair of mask registers, =
the indicators of the locations of value matches between quadwords in zmm3/=
m512/m64bcst and zmm2."
diff --git a/disas/x86-data/x86_avx512vpopcntdq.csv b/disas/x86-data/x86_av=
x512vpopcntdq.csv
new file mode 100644
index 000000000000..8d5a6a92f06e
--- /dev/null
+++ b/disas/x86-data/x86_avx512vpopcntdq.csv
@@ -0,0 +1,7 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"VPOPCNTD xmm{k}{z},xmm/m128/m32bcst","EVEX.128.66.0F38.W0 55 /r","Valid",=
"Valid","Invalid","AVX512VL AVX512VPOPCNTDQ","ModRM:reg (w)","ModRM:r/m (r)=
","","","Full","Counts the number of bits set to one in xmm2/m128 and puts =
the result in xmm1 with writemask k1."
+"VPOPCNTD ymm{k}{z},ymm/m256/m32bcst","EVEX.256.66.0F38.W0 55 /r","Valid",=
"Valid","Invalid","AVX512VL AVX512VPOPCNTDQ","ModRM:reg (w)","ModRM:r/m (r)=
","","","Full","Counts the number of bits set to one in ymm2/m256 and puts =
the result in ymm1 with writemask k1."
+"VPOPCNTD zmm{k}{z},zmm/m512/m32bcst","EVEX.512.66.0F38.W0 55 /r","Valid",=
"Valid","Invalid","AVX512VPOPCNTDQ","ModRM:reg (w)","ModRM:r/m (r)","","","=
Full","Counts the number of bits set to one in zmm2/m512 and puts the resul=
t in zmm1 with writemask k1."
+"VPOPCNTQ xmm{k}{z},xmm/m128/m64bcst","EVEX.128.66.0F38.W1 55 /r","Valid",=
"Valid","Invalid","AVX512VL AVX512VPOPCNTDQ","ModRM:reg (w)","ModRM:r/m (r)=
","","","Full","Counts the number of bits set to one in xmm2/m128 and puts =
the result in xmm1 with writemask k1."
+"VPOPCNTQ ymm{k}{z},ymm/m256/m64bcst","EVEX.256.66.0F38.W1 55 /r","Valid",=
"Valid","Invalid","AVX512VL AVX512VPOPCNTDQ","ModRM:reg (w)","ModRM:r/m (r)=
","","","Full","Counts the number of bits set to one in ymm2/m256 and puts =
the result in ymm1 with writemask k1."
+"VPOPCNTQ zmm{k}{z},zmm/m512/m64bcst","EVEX.512.66.0F38.W1 55 /r","Valid",=
"Valid","Invalid","AVX512VPOPCNTDQ","ModRM:reg (w)","ModRM:r/m (r)","","","=
Full","Counts the number of bits set to one in zmm2/m512 and puts the resul=
t in zmm1 with writemask k1."
diff --git a/disas/x86-data/x86_avxneconvert.csv b/disas/x86-data/x86_avxne=
convert.csv
new file mode 100644
index 000000000000..03b1826b960a
--- /dev/null
+++ b/disas/x86-data/x86_avxneconvert.csv
@@ -0,0 +1,15 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"VBCSTNEBF162PS xmm,m16","VEX.128.f3.0F38.W0 b1 /r","Valid","Valid","Inval=
id","AVXNECONVERT","ModRM:reg (w)","ModRM:r/m (r)","","","","Load one BF16 =
floating-point element from m16, convert to FP32 and store result in xmm1."
+"VBCSTNEBF162PS ymm,m16","VEX.256.f3.0F38.W0 b1 /r","Valid","Valid","Inval=
id","AVXNECONVERT","ModRM:reg (w)","ModRM:r/m (r)","","","","Load one BF16 =
floating-point element from m16, convert to FP32 and store result in ymm1."
+"VBCSTNESH2PS xmm,m16","VEX.128.66.0F38.W0 b1 /r","Valid","Valid","Invalid=
","AVXNECONVERT","ModRM:reg (w)","ModRM:r/m (r)","","","","Load one FP16 el=
ement from m16, convert to FP32, and store result in xmm1."
+"VBCSTNESH2PS ymm,m16","VEX.256.66.0F38.W0 b1 /r","Valid","Valid","Invalid=
","AVXNECONVERT","ModRM:reg (w)","ModRM:r/m (r)","","","","Load one FP16 el=
ement from m16, convert to FP32, and store result in ymm1."
+"VCVTNEEBF162PS xmm,m128","VEX.128.f3.0F38.W0 b0 /r","Valid","Valid","Inva=
lid","AVXNECONVERT","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert even =
elements of packed BF16 values from m128 to FP32 values and store in xmm1."
+"VCVTNEEBF162PS ymm,m256","VEX.256.f3.0F38.W0 b0 /r","Valid","Valid","Inva=
lid","AVXNECONVERT","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert even =
elements of packed BF16 values from m256 to FP32 values and store in ymm1."
+"VCVTNEEPH2PS xmm,m128","VEX.128.66.0F38.W0 b0 /r","Valid","Valid","Invali=
d","AVXNECONVERT","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert even el=
ements of packed FP16 values from m128 to FP32 values and store in xmm1."
+"VCVTNEEPH2PS ymm,m256","VEX.256.66.0F38.W0 b0 /r","Valid","Valid","Invali=
d","AVXNECONVERT","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert even el=
ements of packed FP16 values from m256 to FP32 values and store in ymm1."
+"VCVTNEOBF162PS xmm,m128","VEX.128.f2.0F38.W0 b0 /r","Valid","Valid","Inva=
lid","AVXNECONVERT","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert odd e=
lements of packed BF16 values from m128 to FP32 values and store in xmm1."
+"VCVTNEOBF162PS ymm,m256","VEX.256.f2.0F38.W0 b0 /r","Valid","Valid","Inva=
lid","AVXNECONVERT","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert odd e=
lements of packed BF16 values from m256 to FP32 values and store in ymm1."
+"VCVTNEOPH2PS xmm,m128","VEX.128.0F38.W0 b0 /r","Valid","Valid","Invalid",=
"AVXNECONVERT","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert odd elemen=
ts of packed FP16 values from m128 to FP32 values and store in xmm1."
+"VCVTNEOPH2PS ymm,m256","VEX.256.0F38.W0 b0 /r","Valid","Valid","Invalid",=
"AVXNECONVERT","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert odd elemen=
ts of packed FP16 values from m256 to FP32 values and store in ymm1."
+"VCVTNEPS2BF16 xmm,xmm/m128","VEX.128.f3.0F38.W0 72 /r","Valid","Valid","I=
nvalid","AVXNECONVERT","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert pa=
cked single-precision floating-point values from xmm2/m128 to packed BF16 v=
alues and store in xmm1."
+"VCVTNEPS2BF16 xmm,ymm/m256","VEX.256.f3.0F38.W0 72 /r","Valid","Valid","I=
nvalid","AVXNECONVERT","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert pa=
cked single-precision floating-point values from ymm2/m256 to packed BF16 v=
alues and store in xmm1."
diff --git a/disas/x86-data/x86_avxvnni.csv b/disas/x86-data/x86_avxvnni.csv
new file mode 100644
index 000000000000..a675d1ee54f7
--- /dev/null
+++ b/disas/x86-data/x86_avxvnni.csv
@@ -0,0 +1,9 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"VPDPBUSD xmm,xmm,xmm/m128","VEX.128.66.0F38.W0 50 /r","Valid","Valid","In=
valid","AVXVNNI","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","","M=
ultiply groups of 4 pairs of signed bytes in xmm3/m128 with corresponding u=
nsigned bytes of xmm2, summing those products and adding them to doubleword=
 result in xmm1."
+"VPDPBUSD ymm,ymm,ymm/m256","VEX.256.66.0F38.W0 50 /r","Valid","Valid","In=
valid","AVXVNNI","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","","M=
ultiply groups of 4 pairs of signed bytes in ymm3/m256 with corresponding u=
nsigned bytes of ymm2, summing those products and adding them to doubleword=
 result in ymm1."
+"VPDPBUSDS xmm,xmm,xmm/m128","VEX.128.66.0F38.W0 51 /r","Valid","Valid","I=
nvalid","AVXVNNI","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","","=
Multiply groups of 4 pairs signed bytes in xmm3/m128 with corresponding uns=
igned bytes of xmm2, summing those products and adding them to doubleword r=
esult, with signed saturation in xmm1."
+"VPDPBUSDS ymm,ymm,ymm/m256","VEX.256.66.0F38.W0 51 /r","Valid","Valid","I=
nvalid","AVXVNNI","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","","=
Multiply groups of 4 pairs signed bytes in ymm3/m256 with corresponding uns=
igned bytes of ymm2, summing those products and adding them to doubleword r=
esult, with signed saturation in ymm1."
+"VPDPWSSD xmm,xmm,xmm/m128","VEX.128.66.0F38.W0 52 /r","Valid","Valid","In=
valid","AVXVNNI","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","","M=
ultiply groups of 2 pairs signed words in xmm3/m128 with corresponding sign=
ed words of xmm2, summing those products and adding them to doubleword resu=
lt in xmm1."
+"VPDPWSSD ymm,ymm,ymm/m256","VEX.256.66.0F38.W0 52 /r","Valid","Valid","In=
valid","AVXVNNI","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","","M=
ultiply groups of 2 pairs signed words in ymm3/m256 with corresponding sign=
ed words of ymm2, summing those products and adding them to doubleword resu=
lt in ymm1."
+"VPDPWSSDS xmm,xmm,xmm/m128","VEX.128.66.0F38.W0 53 /r","Valid","Valid","I=
nvalid","AVXVNNI","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","","=
Multiply groups of 2 pairs of signed words in xmm3/m128 with corresponding =
signed words of xmm2, summing those products and adding them to doubleword =
result in xmm1, with signed saturation."
+"VPDPWSSDS ymm,ymm,ymm/m256","VEX.256.66.0F38.W0 53 /r","Valid","Valid","I=
nvalid","AVXVNNI","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","","=
Multiply groups of 2 pairs of signed words in ymm3/m256 with corresponding =
signed words of ymm2, summing those products and adding them to doubleword =
result in ymm1, with signed saturation."
diff --git a/disas/x86-data/x86_avxvnniint8.csv b/disas/x86-data/x86_avxvnn=
iint8.csv
new file mode 100644
index 000000000000..f0428f43cb94
--- /dev/null
+++ b/disas/x86-data/x86_avxvnniint8.csv
@@ -0,0 +1,13 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"VPDPBSSD xmm,xmm,xmm/m128","VEX.128.f2.0F38.W0 50 /r","Valid","Valid","In=
valid","AVXVNNIINT8","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","=
","Multiply groups of 4 pairs of signed bytes in xmm3/m128 with correspondi=
ng signed bytes of xmm2, summing those products and adding them to the doub=
leword result in xmm1."
+"VPDPBSSD ymm,ymm,ymm/m256","VEX.256.f2.0F38.W0 50 /r","Valid","Valid","In=
valid","AVXVNNIINT8","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","=
","Multiply groups of 4 pairs of signed bytes in ymm3/m256 with correspondi=
ng signed bytes of ymm2, summing those products and adding them to the doub=
leword result in ymm1."
+"VPDPBSSDS xmm,xmm,xmm/m128","VEX.128.f2.0F38.W0 51 /r","Valid","Valid","I=
nvalid","AVXVNNIINT8","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","",=
"","Multiply groups of 4 pairs of signed bytes in xmm3/m128 with correspond=
ing signed bytes of xmm2, summing those products and adding them to the dou=
bleword result, with signed saturation in xmm1."
+"VPDPBSSDS ymm,ymm,ymm/m256","VEX.256.f2.0F38.W0 51 /r","Valid","Valid","I=
nvalid","AVXVNNIINT8","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","",=
"","Multiply groups of 4 pairs of signed bytes in ymm3/m256 with correspond=
ing signed bytes of ymm2, summing those products and adding them to the dou=
bleword result, with signed saturation in ymm1."
+"VPDPBSUD xmm,xmm,xmm/m128","VEX.128.f3.0F38.W0 50 /r","Valid","Valid","In=
valid","AVXVNNIINT8","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","=
","Multiply groups of 4 pairs of signed bytes in xmm3/m128 with correspondi=
ng unsigned bytes of xmm2, summing those products and adding them to double=
word result in xmm1."
+"VPDPBSUD ymm,ymm,ymm/m256","VEX.256.f3.0F38.W0 50 /r","Valid","Valid","In=
valid","AVXVNNIINT8","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","=
","Multiply groups of 4 pairs of signed bytes in ymm3/m256 with correspondi=
ng unsigned bytes of ymm2, summing those products and adding them to double=
word result in ymm1."
+"VPDPBSUDS xmm,xmm,xmm/m128","VEX.128.f3.0F38.W0 51 /r","Valid","Valid","I=
nvalid","AVXVNNIINT8","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","",=
"","Multiply groups of 4 pairs of signed bytes in xmm3/m128 with correspond=
ing unsigned bytes of xmm2, summing those products and adding them to doubl=
eword result, with signed saturation in xmm1."
+"VPDPBSUDS ymm,ymm,ymm/m256","VEX.256.f3.0F38.W0 51 /r","Valid","Valid","I=
nvalid","AVXVNNIINT8","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","",=
"","Multiply groups of 4 pairs of signed bytes in ymm3/m256 with correspond=
ing unsigned bytes of ymm2, summing those products and adding them to doubl=
eword result, with signed saturation in ymm1."
+"VPDPBUUD xmm,xmm,xmm/m128","VEX.128.0F38.W0 50 /r","Valid","Valid","Inval=
id","AVXVNNIINT8","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","","=
Multiply groups of 4 pairs of unsigned bytes in xmm3/m128 with correspondin=
g unsigned bytes of xmm2, summing those products and adding them to doublew=
ord result in xmm1."
+"VPDPBUUD ymm,ymm,ymm/m256","VEX.256.0F38.W0 50 /r","Valid","Valid","Inval=
id","AVXVNNIINT8","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","","=
Multiply groups of 4 pairs of unsigned bytes in ymm3/m256 with correspondin=
g unsigned bytes of ymm2, summing those products and adding them to doublew=
ord result in ymm1."
+"VPDPBUUDS xmm,xmm,xmm/m128","VEX.128.0F38.W0 51 /r","Valid","Valid","Inva=
lid","AVXVNNIINT8","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","",=
"Multiply groups of 4 pairs of unsigned bytes in xmm3/m128 with correspondi=
ng unsigned bytes of xmm2, summing those products and adding them to the do=
ubleword result, with unsigned saturation in xmm1."
+"VPDPBUUDS ymm,ymm,ymm/m256","VEX.256.0F38.W0 51 /r","Valid","Valid","Inva=
lid","AVXVNNIINT8","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","",=
"Multiply groups of 4 pairs of unsigned bytes in ymm3/m256 with correspondi=
ng unsigned bytes of ymm2, summing those products and adding them to the do=
ubleword result, with unsigned saturation in ymm1."
diff --git a/disas/x86-data/x86_base.csv b/disas/x86-data/x86_base.csv
new file mode 100644
index 000000000000..335d2079a3e8
--- /dev/null
+++ b/disas/x86-data/x86_base.csv
@@ -0,0 +1,549 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"AAA al","LEX.WN 37","Invalid","Valid","Valid","","RAX (r, w)","","","",""=
,"ASCII adjust AL after addition."
+"AAD ax, ib","LEX.WN D5 ib","Invalid","Valid","Valid","","RAX (r, w)","ib"=
,"","","","Adjust AX before division to number base ib."
+"AAM ax, ib","LEX.WN D4 ib","Invalid","Valid","Valid","","RAX (r, w)","ib"=
,"","","","Adjust AX after multiply to number base ib."
+"AAS al","LEX.WN 3F","Invalid","Valid","Valid","","RAX (r, w)","","","",""=
,"ASCII adjust AL after subtraction."
+"ADC r8/m8, r8","LEX.WB 10 /r lock","Valid","Valid","Valid","","ModRM:r/m =
(r, w)","ModRM:reg (r)","","","","Add with carry byte register to r8/m8."
+"ADC rw/mw, rw","LEX.WX 11 /r lock","Valid","Valid","Valid","","ModRM:r/m =
(r, w)","ModRM:reg (r)","","","","Add with carry r to r/m."
+"ADC r8, r8/m8","LEX.WB 12 /r","Valid","Valid","Valid","","ModRM:reg (r, w=
)","ModRM:r/m (r)","","","","Add with carry r8/m8 to byte register."
+"ADC rw, rw/mw","LEX.WX 13 /r","Valid","Valid","Valid","","ModRM:reg (r, w=
)","ModRM:r/m (r)","","","","Add with carry r/m to r."
+"ADC al, ib","LEX.WN 14 ib","Valid","Valid","Valid","","RAX (r, w)","ib","=
","","","Add with carry ib to AL."
+"ADC aw, iw","LEX.WX 15 iw","Valid","Valid","Valid","","RAX (r, w)","iw","=
","","","Add with carry iw to EAX."
+"ADC r8/m8, ib","LEX.WB 80 /2 ib lock","Valid","Valid","Valid","","ModRM:r=
/m (r, w)","ib","","","","Add with carry ib to r8/m8."
+"ADC rw/mw, iw","LEX.WX 81 /2 iw lock","Valid","Valid","Valid","","ModRM:r=
/m (r, w)","iw","","","","Add with CF iw to r/m."
+"ADC rw/mw, ib","LEX.WX 83 /2 ib lock","Valid","Valid","Valid","","ModRM:r=
/m (r, w)","ib","","","","Add with CF sign-extended ib into r/m."
+"ADD r8/m8, r8","LEX.WB 00 /r lock","Valid","Valid","Valid","","ModRM:r/m =
(r, w)","ModRM:reg (r)","","","","Add r8 to r8/m8."
+"ADD rw/mw, rw","LEX.WX 01 /r lock","Valid","Valid","Valid","","ModRM:r/m =
(r, w)","ModRM:reg (r)","","","","Add r to r/m."
+"ADD r8, r8/m8","LEX.WB 02 /r","Valid","Valid","Valid","","ModRM:reg (r, w=
)","ModRM:r/m (r)","","","","Add r8/m8 to r8."
+"ADD rw, rw/mw","LEX.WX 03 /r","Valid","Valid","Valid","","ModRM:reg (r, w=
)","ModRM:r/m (r)","","","","Add r/m to r."
+"ADD al, ib","LEX.WN 04 ib","Valid","Valid","Valid","","RAX (r, w)","ib","=
","","","Add ib to AL."
+"ADD aw, iw","LEX.WX 05 iw","Valid","Valid","Valid","","RAX (r, w)","iw","=
","","","Add sign-extended iw to AX/EAX/RAX."
+"ADD r8/m8, ib","LEX.WB 80 /0 ib lock","Valid","Valid","Valid","","ModRM:r=
/m (r, w)","ib","","","","Add ib to r8/m8."
+"ADD rw/mw, iw","LEX.WX 81 /0 iw lock","Valid","Valid","Valid","","ModRM:r=
/m (r, w)","iw","","","","Add sign-extended iw to r/m."
+"ADD rw/mw, ib","LEX.WX 83 /0 ib lock","Valid","Valid","Valid","","ModRM:r=
/m (r, w)","ib","","","","Add sign-extended ib to r/m."
+"AND r8/m8, r8","LEX.WB 20 /r lock","Valid","Valid","Valid","","ModRM:r/m =
(r, w)","ModRM:reg (r)","","","","r8/m8 AND r8."
+"AND rw/mw, rw","LEX.WX 21 /r lock","Valid","Valid","Valid","","ModRM:r/m =
(r, w)","ModRM:reg (r)","","","","r/m AND r16."
+"AND r8, r8/m8","LEX.WB 22 /r","Valid","Valid","Valid","","ModRM:reg (r, w=
)","ModRM:r/m (r)","","","","r8 AND r8/m8."
+"AND rw, rw/mw","LEX.WX 23 /r","Valid","Valid","Valid","","ModRM:reg (r, w=
)","ModRM:r/m (r)","","","","r AND r/m."
+"AND al, ib","LEX.WN 24 ib","Valid","Valid","Valid","","RAX (r, w)","ib","=
","","","AL AND ib."
+"AND aw, iw","LEX.WX 25 iw","Valid","Valid","Valid","","RAX (r, w)","iw","=
","","","AX/EAX/RAX AND sign-extend iw."
+"AND r8/m8, ib","LEX.WB 80 /4 ib lock","Valid","Valid","Valid","","ModRM:r=
/m (r, w)","ib","","","","r8/m8 AND ib."
+"AND rw/mw, iw","LEX.WX 81 /4 iw lock","Valid","Valid","Valid","","ModRM:r=
/m (r, w)","iw","","","","r/m AND sign-extend iw."
+"AND rw/mw, ib","LEX.WX 83 /4 ib lock","Valid","Valid","Valid","","ModRM:r=
/m (r, w)","ib","","","","r/m AND sign-extend ib."
+"ARPL r16/m16, r16","LEX.wn 63 /r","Invalid","Valid","Valid","","ModRM:r/m=
 (w)","ModRM:reg (r)","","","","Adjust RPL of r/m16 to not less than RPL of=
 r16."
+"BOUND r16, mem","LEX.WX 62 /r o16","Invalid","Valid","Valid","","ModRM:re=
g (r)","ModRM:r/m (r, ModRM:[7:6] must not be 11b)","","","","Check if r (a=
rray index) is within bounds specified by m32&32."
+"BOUND r32, mem","LEX.WX 62 /r o32","Invalid","Valid","Valid","","ModRM:re=
g (r)","ModRM:r/m (r, ModRM:[7:6] must not be 11b)","","","","Check if r (a=
rray index) is within bounds specified by m32&32."
+"BSF rw, rw/mw","LEX.0F.WX BC /r","Valid","Valid","Valid","","ModRM:reg (w=
)","ModRM:r/m (r)","","","","Bit scan forward on rw/mw."
+"BSR rw, rw/mw","LEX.0F.WX BD /r","Valid","Valid","Valid","","ModRM:reg (w=
)","ModRM:r/m (r)","","","","Bit scan reverse on rw/mw."
+"BSWAP r32","LEX.0F.W0 C8+r","Valid","Valid","Valid","","opcode +r (r, w)"=
,"","","","","Reverses the byte order of a 32-bit register."
+"BSWAP r64","LEX.0F.W1 C8+r","Valid","Invalid","Invalid","","opcode +r (r,=
 w)","","","","","Reverses the byte order of a 64-bit register."
+"BT rw/mw, rw","LEX.0F.WX A3 /r","Valid","Valid","Valid","","ModRM:r/m (r)=
","ModRM:reg (r)","","","","Store selected bit in CF flag."
+"BT rw/mw, ib","LEX.0F.WX BA /4 ib","Valid","Valid","Valid","","ModRM:r/m =
(r)","ib","","","","Store selected bit in CF flag."
+"BTC rw/mw, ib","LEX.0F.WX BA /7 ib lock","Valid","Valid","Valid","","ModR=
M:r/m (r, w)","ib","","","","Store selected bit in CF flag and complement."
+"BTC rw/mw, rw","LEX.0F.WX BB /r lock","Valid","Valid","Valid","","ModRM:r=
/m (r, w)","ModRM:reg (r)","","","","Store selected bit in CF flag and comp=
lement."
+"BTR rw/mw, rw","LEX.0F.WX B3 /r lock","Valid","Valid","Valid","","ModRM:r=
/m (r, w)","ModRM:reg (r)","","","","Store selected bit in CF flag and clea=
r."
+"BTR rw/mw, ib","LEX.0F.WX BA /6 ib lock","Valid","Valid","Valid","","ModR=
M:r/m (r, w)","ib","","","","Store selected bit in CF flag and clear."
+"BTS rw/mw, rw","LEX.0F.WX AB /r lock","Valid","Valid","Valid","","ModRM:r=
/m (r, w)","ModRM:reg (r)","","","","Store selected bit in CF flag and set."
+"BTS rw/mw, ib","LEX.0F.WX BA /5 ib lock","Valid","Valid","Valid","","ModR=
M:r/m (r, w)","ib","","","","Store selected bit in CF flag and set."
+"CALL relw","LEX.WX E8 iwd","Valid","Valid","Valid","","iwd","RSP (r, w, i=
)","","","","Call near, relative, displacement relative to next instruction=
. 32-bit displacement sign extended to 64-bits in 64-bit mode."
+"CALL rw/mw","LEX.WW FF /2","Valid","Valid","Valid","","ModRM:r/m (r)","RS=
P (r, w, i)","","","","Call near, absolute indirect, address given in rw/mw=
."
+"LCALL far16:16","LEX.WW 9A iwd i16 o16","Invalid","Valid","Valid","","imm=
","ime","RSP (r, w, i)","","","Call far, absolute, address given in operand=
."
+"LCALL far16:32","LEX.WW 9A iwd i16 o32","Invalid","Valid","Valid","","imm=
","ime","RSP (r, w, i)","","","Call far, absolute, address given in operand=
."
+"LCALL memfar16:16","LEX.WW FF /3 o16","Valid","Valid","Valid","","ModRM:r=
/m (r)","RSP (r, w, i)","","","","Call far, absolute indirect address given=
 in m16:16. In 32-bit mode: if selector points to a gate, then RIP =3D 32-b=
it zero extended displacement taken from gate; else RIP =3D zero extended 1=
6-bit offset from far pointer referenced in the instruction."
+"LCALL memfar16:32","LEX.WW FF /3 o32","Invalid","Valid","Valid","","ModRM=
:r/m (r)","RSP (r, w, i)","","","","In 64-bit mode: If selector points to a=
 gate, then RIP =3D 64-bit displacement taken from gate; else RIP =3D zero =
extended 32-bit offset from far pointer referenced in the instruction."
+"LCALL memfar16:64","LEX.WW FF /3 o64","Valid","Invalid","Invalid","","Mod=
RM:r/m (r)","RSP (r, w, i)","","","","In 64-bit mode: If selector points to=
 a gate, then RIP =3D 64-bit displacement taken from gate; else RIP =3D 64-=
bit offset from far pointer referenced in the instruction."
+"CBW","LEX.WX 98 o16","Valid","Valid","Valid","","RAX (r, w)","","","","",=
"AX :=3D sign-extend of AL."
+"CDQ","LEX.WX 99 o32","Valid","Valid","Valid","","RDX (w)","RAX (r, w)",""=
,"","","EDX:EAX :=3D sign-extend of EAX."
+"CDQE","LEX.WX 98 o64","Valid","Invalid","Invalid","","RAX (r, w)","","","=
","","RAX :=3D sign-extend of EAX."
+"CLC","LEX.WN F8","Valid","Valid","Valid","","","","","","","Clear CF flag=
."
+"CLD","LEX.WN FC","Valid","Valid","Valid","","","","","","","Clear DF flag=
."
+"CLFLUSH m8","LEX.0F.W0 AE /7","Valid","Valid","Valid","","ModRM:r/m (r)",=
"","","","","Flushes cache line containing m8."
+"CLFLUSHOPT m8","LEX.66.0F.W0 AE /7","Valid","Valid","Valid","","ModRM:r/m=
 (r)","","","","","Flushes cache line containing m8."
+"CLI","LEX.WN FA","Valid","Valid","Valid","","","","","","","Clear interru=
pt flag; interrupts disabled when interrupt flag cleared."
+"CLTS","LEX.0F.W0 06","Valid","Valid","Valid","","","","","","","Clears TS=
 flag in CR0."
+"CMC","LEX.WN F5","Valid","Valid","Valid","","","","","","","Complement CF=
 flag."
+"CMOVA rw, rw/mw","LEX.0F.WX 47 /r","Valid","Valid","Valid","","ModRM:reg =
(r, w)","ModRM:r/m (r)","","","","Move if above (CF=3D0 and ZF=3D0)."
+"CMOVAE rw, rw/mw","LEX.0F.WX 43 /r","Valid","Valid","Valid","","ModRM:reg=
 (r, w)","ModRM:r/m (r)","","","","Move if above or equal (CF=3D0)."
+"CMOVB rw, rw/mw","LEX.0F.WX 42 /r","Valid","Valid","Valid","","ModRM:reg =
(r, w)","ModRM:r/m (r)","","","","Move if below (CF=3D1)."
+"CMOVBE rw, rw/mw","LEX.0F.WX 46 /r","Valid","Valid","Valid","","ModRM:reg=
 (r, w)","ModRM:r/m (r)","","","","Move if below or equal (CF=3D1 or ZF=3D1=
)."
+"CMOVC rw, rw/mw","LEX.0F.WX 42 /r","Valid","Valid","Valid","","ModRM:reg =
(r, w)","ModRM:r/m (r)","","","","Move if carry (CF=3D1)."
+"CMOVE rw, rw/mw","LEX.0F.WX 44 /r","Valid","Valid","Valid","","ModRM:reg =
(r, w)","ModRM:r/m (r)","","","","Move if equal (ZF=3D1)."
+"CMOVG rw, rw/mw","LEX.0F.WX 4F /r","Valid","Valid","Valid","","ModRM:reg =
(r, w)","ModRM:r/m (r)","","","","Move if greater (ZF=3D0 and SF=3DOF)."
+"CMOVGE rw, rw/mw","LEX.0F.WX 4D /r","Valid","Valid","Valid","","ModRM:reg=
 (r, w)","ModRM:r/m (r)","","","","Move if greater or equal (SF=3DOF)."
+"CMOVL rw, rw/mw","LEX.0F.WX 4C /r","Valid","Valid","Valid","","ModRM:reg =
(r, w)","ModRM:r/m (r)","","","","Move if less (SF!=3DOF)."
+"CMOVLE rw, rw/mw","LEX.0F.WX 4E /r","Valid","Valid","Valid","","ModRM:reg=
 (r, w)","ModRM:r/m (r)","","","","Move if less or equal (ZF=3D1 or SF!=3DO=
F)."
+"CMOVNA rw, rw/mw","LEX.0F.WX 46 /r","Valid","Valid","Valid","","ModRM:reg=
 (r, w)","ModRM:r/m (r)","","","","Move if not above (CF=3D1 or ZF=3D1)."
+"CMOVNAE rw, rw/mw","LEX.0F.WX 42 /r","Valid","Valid","Valid","","ModRM:re=
g (r, w)","ModRM:r/m (r)","","","","Move if not above or equal (CF=3D1)."
+"CMOVNB rw, rw/mw","LEX.0F.WX 43 /r","Valid","Valid","Valid","","ModRM:reg=
 (r, w)","ModRM:r/m (r)","","","","Move if not below (CF=3D0)."
+"CMOVNBE rw, rw/mw","LEX.0F.WX 47 /r","Valid","Valid","Valid","","ModRM:re=
g (r, w)","ModRM:r/m (r)","","","","Move if not below or equal (CF=3D0 and =
ZF=3D0)."
+"CMOVNC rw, rw/mw","LEX.0F.WX 43 /r","Valid","Valid","Valid","","ModRM:reg=
 (r, w)","ModRM:r/m (r)","","","","Move if not carry (CF=3D0)."
+"CMOVNE rw, rw/mw","LEX.0F.WX 45 /r","Valid","Valid","Valid","","ModRM:reg=
 (r, w)","ModRM:r/m (r)","","","","Move if not equal (ZF=3D0)."
+"CMOVNG rw, rw/mw","LEX.0F.WX 4E /r","Valid","Valid","Valid","","ModRM:reg=
 (r, w)","ModRM:r/m (r)","","","","Move if not greater (ZF=3D1 or SF!=3DOF)=
."
+"CMOVNGE rw, rw/mw","LEX.0F.WX 4C /r","Valid","Valid","Valid","","ModRM:re=
g (r, w)","ModRM:r/m (r)","","","","Move if not greater or equal (SF!=3DOF)=
."
+"CMOVNL rw, rw/mw","LEX.0F.WX 4D /r","Valid","Valid","Valid","","ModRM:reg=
 (r, w)","ModRM:r/m (r)","","","","Move if not less (SF=3DOF)."
+"CMOVNLE rw, rw/mw","LEX.0F.WX 4F /r","Valid","Valid","Valid","","ModRM:re=
g (r, w)","ModRM:r/m (r)","","","","Move if not less or equal (ZF=3D0 and S=
F=3DOF)."
+"CMOVNO rw, rw/mw","LEX.0F.WX 41 /r","Valid","Valid","Valid","","ModRM:reg=
 (r, w)","ModRM:r/m (r)","","","","Move if not overflow (OF=3D0)."
+"CMOVNP rw, rw/mw","LEX.0F.WX 4B /r","Valid","Valid","Valid","","ModRM:reg=
 (r, w)","ModRM:r/m (r)","","","","Move if not parity (PF=3D0)."
+"CMOVNS rw, rw/mw","LEX.0F.WX 49 /r","Valid","Valid","Valid","","ModRM:reg=
 (r, w)","ModRM:r/m (r)","","","","Move if not sign (SF=3D0)."
+"CMOVNZ rw, rw/mw","LEX.0F.WX 45 /r","Valid","Valid","Valid","","ModRM:reg=
 (r, w)","ModRM:r/m (r)","","","","Move if not zero (ZF=3D0)."
+"CMOVO rw, rw/mw","LEX.0F.WX 40 /r","Valid","Valid","Valid","","ModRM:reg =
(r, w)","ModRM:r/m (r)","","","","Move if overflow (OF=3D1)."
+"CMOVP rw, rw/mw","LEX.0F.WX 4A /r","Valid","Valid","Valid","","ModRM:reg =
(r, w)","ModRM:r/m (r)","","","","Move if parity (PF=3D1)."
+"CMOVPE rw, rw/mw","LEX.0F.WX 4A /r","Valid","Valid","Valid","","ModRM:reg=
 (r, w)","ModRM:r/m (r)","","","","Move if parity even (PF=3D1)."
+"CMP r8/m8, r8","LEX.WB 38 /r","Valid","Valid","Valid","","ModRM:r/m (r)",=
"ModRM:reg (r)","","","","Compare r8 with r8/m8."
+"CMP rw/mw, rw","LEX.WX 39 /r","Valid","Valid","Valid","","ModRM:r/m (r)",=
"ModRM:reg (r)","","","","Compare rw with rw/mw."
+"CMP r8, r8/m8","LEX.WB 3A /r","Valid","Valid","Valid","","ModRM:reg (r)",=
"ModRM:r/m (r)","","","","Compare r8/m8 with r8."
+"CMP rw, rw/mw","LEX.WX 3B /r","Valid","Valid","Valid","","ModRM:reg (r)",=
"ModRM:r/m (r)","","","","Compare r/m with rw."
+"CMP al, ib","LEX.WN 3C ib","Valid","Valid","Valid","","RAX (r)","ib","","=
","","Compare ib with AL."
+"CMP aw, iw","LEX.WX 3D iw","Valid","Valid","Valid","","RAX (r)","iw","","=
","","Compare sign-extended iw with AX/EAX/RAX."
+"CMP r8/m8, ib","LEX.WB 80 /7 ib","Valid","Valid","Valid","","ModRM:r/m (r=
)","ib","","","","Compare ib with r8/m8."
+"CMP rw/mw, iw","LEX.WX 81 /7 iw","Valid","Valid","Valid","","ModRM:r/m (r=
)","iw","","","","Compare iw with rw/mw."
+"CMP rw/mw, ib","LEX.WX 83 /7 ib","Valid","Valid","Valid","","ModRM:r/m (r=
)","ib","","","","Compare ib with rw/mw."
+"CMPSB psi, pdi","LEX.WB A6 rep","Valid","Valid","Valid","","RDI (r)","RSI=
 (r)","","","","Compare byte at address DS:SI/ESI/RSI with byte at address =
ES:DI/EDI/RDI; The status flags are set accordingly."
+"CMPSD psi, pdi","LEX.WX A7 o32 rep","Valid","Valid","Valid","","RDI (r)",=
"RSI (r)","","","","Compare dword at address DS:SI/ESI/RSI with word at add=
ress ES:DI/EDI/RDI; The status flags are set accordingly."
+"CMPSQ psi, pdi","LEX.WX A7 o64 rep","Valid","Invalid","Invalid","","RDI (=
r)","RSI (r)","","","","Compares qword at address DS:RSI with quadword at a=
ddress ES:RDI and sets the status flags accordingly."
+"CMPSW psi, pdi","LEX.WX A7 o16 rep","Valid","Valid","Valid","","RDI (r)",=
"RSI (r)","","","","Compare word at address DS:SI/ESI/RSI with word at addr=
ess ES:DI/EDI/RDI; The status flags are set accordingly."
+"CMPXCHG r8/m8, r8","LEX.0F.WB B0 /r lock","Valid","Valid","Valid","","Mod=
RM:r/m (r, w)","ModRM:reg (r)","RAX (r, w)","","","Compare AL with r8/m8. I=
f equal, ZF is set and r8 is loaded into r8/m8. Else, clear ZF and load r8/=
m8 into AL."
+"CMPXCHG rw/mw, rw","LEX.0F.WX B1 /r lock","Valid","Valid","Valid","","Mod=
RM:r/m (r, w)","ModRM:reg (r)","RAX (r, w)","","","Compare AX/EAX/RAX with =
rw/mw. If equal, ZF is set and rw is loaded into rw/mw. Else, clear ZF and =
load r/m into EAX."
+"CMPXCHG16B m128","LEX.0F.W1 C7 /1 lock","Valid","Invalid","Invalid","","M=
odRM:r/m (r, w)","RDX (r, w)","RAX (r, w)","","","Compare RDX:RAX with m128=
. If equal, set ZF and load RCX:RBX into m128. Else, clear ZF and load m128=
 into RDX:RAX."
+"CMPXCHG8B m64","LEX.0F.W0 C7 /1 lock","Valid","Valid","Valid","","ModRM:r=
/m (r, w)","RDX (r, w)","RAX (r, w)","","","Compare EDX:EAX with m64. If eq=
ual, set ZF and load ECX:EBX into m64. Else, clear ZF and load m64 into EDX=
:EAX."
+"CPUID","LEX.0F.W0 A2","Valid","Valid","Valid","","","","","","","Returns =
processor identification and feature information to the EAX, EBX, ECX, and =
EDX registers, as determined by input entered in EAX (in some cases, ECX as=
 well)."
+"CQO","LEX.WX 99 o64","Valid","Invalid","Invalid","","RDX (w)","RAX (r, w)=
","","","","RDX:RAX:=3D sign-extend of RAX."
+"CRC32 rw, r8/m8","LEX.F2.0F38.WX F0 /r","Valid","Valid","Valid","","ModRM=
:reg (r, w)","ModRM:r/m (r)","","","","Accumulate CRC32 on r8/m8."
+"CRC32 rw, rw/mw","LEX.F2.0F38.WX F1 /r","Valid","Valid","Valid","","ModRM=
:reg (r, w)","ModRM:r/m (r)","","","","Accumulate CRC32 on r/m."
+"CVTPD2PI mm, xmm/m128","LEX.66.0F.W0 2D /r","Valid","Valid","Valid","","M=
odRM:reg (w)","ModRM:r/m (r)","","","","Convert two packed double-precision=
 floating-point values from xmm/m128 to two packed signed doubleword intege=
rs in mm."
+"CVTPI2PD xmm, mm/m64","LEX.66.0F.W0 2A /r","Valid","Valid","Valid","","Mo=
dRM:reg (w)","ModRM:r/m (r)","","","","Convert two packed signed doubleword=
 integers from mm/mem64 to two packed double-precision floating-point value=
s in xmm."
+"CVTPI2PS xmm, mm/m64","LEX.0F.W0 2A /r","Valid","Valid","Valid","","ModRM=
:reg (w)","ModRM:r/m (r)","","","","Convert two signed doubleword integers =
from mm/m64 to two single-precision floating-point values in xmm."
+"CVTPS2PI mm, xmm/m64","LEX.0F.W0 2D /r","Valid","Valid","Valid","","ModRM=
:reg (w)","ModRM:r/m (r)","","","","Convert two packed single-precision flo=
ating-point values from xmm/m64 to two packed signed doubleword integers in=
 mm."
+"CVTTPD2PI mm, xmm/m128","LEX.66.0F.W0 2C /r","Valid","Valid","Valid","","=
ModRM:reg (w)","ModRM:r/m (r)","","","","Convert two packer double-precisio=
n floating-point values from xmm/m128 to two packed signed doubleword integ=
ers in mm using truncation."
+"CVTTPS2PI mm, xmm/m64","LEX.0F.W0 2C /r","Valid","Valid","Valid","","ModR=
M:reg (w)","ModRM:r/m (r)","","","","Convert two single-precision floating-=
point values from xmm/m64 to two signed doubleword signed integers in mm us=
ing truncation."
+"CWD","LEX.WX 99 o16","Valid","Valid","Valid","","RDX (w)","RAX (r, w)",""=
,"","","DX:AX :=3D sign-extend of AX."
+"CWDE","LEX.WX 98 o32","Valid","Valid","Valid","","RAX (r, w)","","","",""=
,"EAX :=3D sign-extend of AX."
+"DAA al","LEX.WN 27","Invalid","Valid","Valid","","RAX (r, w)","","","",""=
,"Decimal adjust AL after addition."
+"DAS al","LEX.WN 2F","Invalid","Valid","Valid","","RAX (r, w)","","","",""=
,"Decimal adjust AL after subtraction."
+"DEC rw","LEX.WW 48+r","Invalid","Valid","Valid","","opcode +r (r, w)","",=
"","","","Decrement rw by 1."
+"DEC r8/m8","LEX.WB FE /1 lock","Valid","Valid","Valid","","ModRM:r/m (r, =
w)","","","","","Decrement r8/m8 by 1."
+"DEC rw/mw","LEX.WX FF /1 lock","Valid","Valid","Valid","","ModRM:r/m (r, =
w)","","","","","Decrement r/m by 1."
+"DIV r8/m8","LEX.WB F6 /6","Valid","Valid","Valid","","ModRM:r/m (r)","","=
","","","Unsigned divide AX by r8/m8, with result stored in AL :=3D Quotien=
t, AH :=3D Remainder."
+"DIV rw/mw","LEX.WX F7 /6","Valid","Valid","Valid","","ModRM:r/m (r)","","=
","","","Unsigned divide DX/EDX/RDX:AX/EAX/RAX by r/m, with result stored i=
n AX/EAX/RAX :=3D Quotient, DX/EDX/RDX :=3D Remainder."
+"EMMS","LEX.0F.W0 77","Valid","Valid","Valid","","","","","","","Set the x=
87 FPU tag word to empty."
+"ENTER i16, ib","LEX.WW C8 i16 ib","Valid","Valid","Valid","","imm","ime",=
"RSP (r, w, i)","RBP (r, w, i)","","Create a stack frame with nested pointe=
rs for a procedure."
+"FXRSTOR64 mem","LEX.0F.W1 AE /1","Valid","Invalid","Invalid","","ModRM:r/=
m (r, ModRM:[7:6] must not be 11b)","","","","","Restore the x87 FPU, MMX, =
XMM, and MXCSR register state from m512byte."
+"FXSAVE64 mem","LEX.0F.W1 AE /0","Valid","Invalid","Invalid","","ModRM:r/m=
 (w, ModRM:[7:6] must not be 11b)","","","","","Save the x87 FPU, MMX, XMM,=
 and MXCSR register state to m512byte."
+"HLT","LEX.WN F4","Valid","Valid","Valid","","","","","","","Halt"
+"IDIV r8/m8","LEX.WB F6 /7","Valid","Valid","Valid","","ModRM:r/m (r)","",=
"","","","Signed divide AX by r8/m8, with result stored in: AL :=3D Quotien=
t, AH :=3D Remainder."
+"IDIV rw/mw","LEX.WX F7 /7","Valid","Valid","Valid","","ModRM:r/m (r)","",=
"","","","Signed divide DX/EDX/RDX:AX/EAX/RAX by r/m, with result stored in=
 AX/EAX/RAX :=3D Quotient, DX/EDX/RDX :=3D Remainder."
+"IMUL rw, rw/mw, iw","LEX.WX 69 /r iw","Valid","Valid","Valid","","ModRM:r=
eg (w)","ModRM:r/m (r)","iw","","","register :=3D r/m * sign-extended immed=
iate."
+"IMUL rw, rw/mw, ib","LEX.WX 6B /r ib","Valid","Valid","Valid","","ModRM:r=
eg (w)","ModRM:r/m (r)","ib","","","register :=3D r/m * sign-extended immed=
iate."
+"IMUL rw, rw/mw","LEX.0F.W0 AF /r","Valid","Valid","Valid","","ModRM:reg (=
r, w)","ModRM:r/m (r)","","","","register :=3D register * r/m."
+"IMUL r8/m8","LEX.WB F6 /5","Valid","Valid","Valid","","ModRM:r/m (r)","",=
"","","","AX:=3D AL * r/m byte."
+"IMUL rw/mw","LEX.WX F7 /5","Valid","Valid","Valid","","ModRM:r/m (r)","",=
"","","","DX/EDX/RDX:AX/EAX/RAX :=3D AX/EAX/RAX * r/m."
+"IN al, ib","LEX.WB E4 ib","Valid","Valid","Valid","","RAX (w)","ib","",""=
,"","Input byte from ib I/O port address into AL."
+"IN aw, ib","LEX.WX E5 ib o32","Valid","Valid","Valid","","RAX (w)","ib","=
","","","Input word from ib I/O port address into EAX."
+"IN al, dx","LEX.WB EC","Valid","Valid","Valid","","RAX (w)","RDX (r)","",=
"","","Input byte from I/O port in DX into AL."
+"IN aw, dx","LEX.WX ED o32","Valid","Valid","Valid","","RAX (w)","RDX (r)"=
,"","","","Input word from I/O port in DX into EAX."
+"INC rw","LEX.WW 40+r","Invalid","Valid","Valid","","opcode +r (r, w)","",=
"","","","Increment word register by 1."
+"INC r8/m8","LEX.WB FE /0 lock","Valid","Valid","Valid","","ModRM:r/m (r, =
w)","","","","","Increment r/m byte by 1."
+"INC rw/mw","LEX.WX FF /0 lock","Valid","Valid","Valid","","ModRM:r/m (r, =
w)","","","","","Increment r/m doubleword by 1."
+"INSB pdi, dx","LEX.WB 6C rep","Valid","Valid","Valid","","RDI (r)","RDX (=
r)","","","","Input byte from I/O port in DX into memory location specified=
 in ES:(E)DI or RDI."
+"INSD pdi, dx","LEX.WX 6D o32 rep","Valid","Valid","Valid","","RDI (r)","R=
DX (r)","","","","Input doubleword from I/O port in DX into memory location=
 specified in ES:(E)DI or RDI."
+"INSW pdi, dx","LEX.WX 6D o16 rep","Valid","Valid","Valid","","RDI (r)","R=
DX (r)","","","","Input word from I/O port in DX into memory location speci=
fied in ES:(E)DI or RDI."
+"INT ib","LEX.WN CD ib","Valid","Valid","Valid","","ib","","","","","Gener=
ate software interrupt with vector specified by immediate byte."
+"INT1","LEX.WN F1","Valid","Valid","Valid","","","","","","","Generate deb=
ug trap."
+"INT3","LEX.WN CC","Valid","Valid","Valid","","","","","","","Interrupt 3,=
 trap to debugger."
+"INTO","LEX.WN CE","Invalid","Valid","Valid","","","","","","","Interrupt =
4, if overflow flag is 1."
+"INVD","LEX.0F.W0 08","Valid","Valid","Valid","","","","","","","Flush int=
ernal caches; initiate flushing of external caches."
+"INVLPG m8","LEX.0F.W0 01 /7","Valid","Valid","Valid","","ModRM:r/m (r, Mo=
dRM:[7:6] must not be 11b)","","","","","Invalidate TLB entries for page co=
ntaining m."
+"IRETD","LEX.WX CF o32","Valid","Valid","Valid","","","","","","","Interru=
pt return (32-bit operand size)."
+"IRETQ","LEX.WX CF o64","Valid","Invalid","Invalid","","","","","","","Int=
errupt return (64-bit operand size)."
+"IRETW","LEX.WX CF o16","Valid","Valid","Valid","","","","","","","Interru=
pt return (16-bit operand size)."
+"JA rel8","LEX.WN 77 ib","Valid","Valid","Valid","","ib","","","","","Jump=
 short if above (CF=3D0 and ZF=3D0)."
+"JA relw","LEX.0F.W0 87 iw","Valid","Valid","Valid","","iw","","","","","J=
ump near if above (CF=3D0 and ZF=3D0)."
+"JAE rel8","LEX.WN 73 ib","Valid","Valid","Valid","","ib","","","","","Jum=
p short if above or equal (CF=3D0)."
+"JAE relw","LEX.0F.W0 83 iw","Valid","Valid","Valid","","iw","","","","","=
Jump near if above or equal (CF=3D0)."
+"JB rel8","LEX.WN 72 ib","Valid","Valid","Valid","","ib","","","","","Jump=
 short if below (CF=3D1)."
+"JB relw","LEX.0F.W0 82 iw","Valid","Valid","Valid","","iw","","","","","J=
ump near if below (CF=3D1)."
+"JBE rel8","LEX.WN 76 ib","Valid","Valid","Valid","","ib","","","","","Jum=
p short if below or equal (CF=3D1 or ZF=3D1)."
+"JBE relw","LEX.0F.W0 86 iw","Valid","Valid","Valid","","iw","","","","","=
Jump near if below or equal (CF=3D1 or ZF=3D1)."
+"JC rel8","LEX.WN 72 ib","Valid","Valid","Valid","","ib","","","","","Jump=
 short if carry (CF=3D1)."
+"JC relw","LEX.0F.W0 82 iw","Valid","Valid","Valid","","iw","","","","","J=
ump near if carry (CF=3D1)."
+"JCXZ rel8","LEX.WN E3 ib a16","Invalid","Valid","Valid","","ib","","","",=
"","Jump short if CX register is 0."
+"JE rel8","LEX.WN 74 ib","Valid","Valid","Valid","","ib","","","","","Jump=
 short if equal (ZF=3D1)."
+"JE relw","LEX.0F.W0 84 iw","Valid","Valid","Valid","","iw","","","","","J=
ump near if equal (ZF=3D1)."
+"JECXZ rel8","LEX.WN E3 ib a32","Valid","Valid","Valid","","ib","","","","=
","Jump short if ECX register is 0."
+"JG rel8","LEX.WN 7F ib","Valid","Valid","Valid","","ib","","","","","Jump=
 short if greater (ZF=3D0 and SF=3DOF)."
+"JG relw","LEX.0F.W0 8F iw","Valid","Valid","Valid","","iw","","","","","J=
ump near if greater (ZF=3D0 and SF=3DOF)."
+"JGE rel8","LEX.WN 7D ib","Valid","Valid","Valid","","ib","","","","","Jum=
p short if greater or equal (SF=3DOF)."
+"JGE relw","LEX.0F.W0 8D iw","Valid","Valid","Valid","","iw","","","","","=
Jump near if greater or equal (SF=3DOF)."
+"JL rel8","LEX.WN 7C ib","Valid","Valid","Valid","","ib","","","","","Jump=
 short if less (SF!=3DOF)."
+"JL relw","LEX.0F.W0 8C iw","Valid","Valid","Valid","","iw","","","","","J=
ump near if less (SF!=3DOF)."
+"JLE rel8","LEX.WN 7E ib","Valid","Valid","Valid","","ib","","","","","Jum=
p short if less or equal (ZF=3D1 or SF!=3DOF)."
+"JLE relw","LEX.0F.W0 8E iw","Valid","Valid","Valid","","iw","","","","","=
Jump near if less or equal (ZF=3D1 or SF!=3DOF)."
+"JMP relw","LEX.WX E9 iwd","Valid","Valid","Valid","","iwd","","","","","J=
ump near, relative, RIP =3D RIP + 32-bit displacement sign extended to 64-b=
its"
+"JMP rel8","LEX.WN EB ib","Valid","Valid","Valid","","ib","","","","","Jum=
p short, RIP =3D RIP + 8-bit displacement sign extended to 64-bits"
+"JMP rw/mw","LEX.WW FF /4","Valid","Valid","Valid","","ModRM:r/m (r)","","=
","","","Jump near, absolute indirect, address given in r/m."
+"LJMP far16:16","LEX.WW EA iwd i16 o16","Invalid","Valid","Valid","","imm"=
,"ime","","","","Jump far, absolute, address given in operand"
+"LJMP far16:32","LEX.WW EA iwd i16 o32","Invalid","Valid","Valid","","imm"=
,"ime","","","","Jump far, absolute, address given in operand"
+"LJMP memfar16:16","LEX.WW FF /5 o16","Valid","Valid","Valid","","ModRM:r/=
m (r)","","","","","Jump far, absolute indirect, address given in m16:16"
+"LJMP memfar16:32","LEX.WW FF /5 o32","Invalid","Valid","Valid","","ModRM:=
r/m (r)","","","","","Jump far, absolute indirect, address given in m16:32."
+"LJMP memfar16:64","LEX.WW FF /5 o64","Valid","Invalid","Invalid","","ModR=
M:r/m (r)","","","","","Jump far, absolute indirect, address given in m16:6=
4."
+"JNA rel8","LEX.WN 76 ib","Valid","Valid","Valid","","ib","","","","","Jum=
p short if not above (CF=3D1 or ZF=3D1)."
+"JNA relw","LEX.0F.W0 86 iw","Valid","Valid","Valid","","iw","","","","","=
Jump near if not above (CF=3D1 or ZF=3D1)."
+"JNAE rel8","LEX.WN 72 ib","Valid","Valid","Valid","","ib","","","","","Ju=
mp short if not above or equal (CF=3D1)."
+"JNAE relw","LEX.0F.W0 82 iw","Valid","Valid","Valid","","iw","","","","",=
"Jump near if not above or equal (CF=3D1)."
+"JNB rel8","LEX.WN 73 ib","Valid","Valid","Valid","","ib","","","","","Jum=
p short if not below (CF=3D0)."
+"JNB relw","LEX.0F.W0 83 iw","Valid","Valid","Valid","","iw","","","","","=
Jump near if not below (CF=3D0)."
+"JNBE rel8","LEX.WN 77 ib","Valid","Valid","Valid","","ib","","","","","Ju=
mp short if not below or equal (CF=3D0 and ZF=3D0)."
+"JNBE relw","LEX.0F.W0 87 iw","Valid","Valid","Valid","","iw","","","","",=
"Jump near if not below or equal (CF=3D0 and ZF=3D0)."
+"JNC rel8","LEX.WN 73 ib","Valid","Valid","Valid","","ib","","","","","Jum=
p short if not carry (CF=3D0)."
+"JNC relw","LEX.0F.W0 83 iw","Valid","Valid","Valid","","iw","","","","","=
Jump near if not carry (CF=3D0)."
+"JNE rel8","LEX.WN 75 ib","Valid","Valid","Valid","","ib","","","","","Jum=
p short if not equal (ZF=3D0)."
+"JNE relw","LEX.0F.W0 85 iw","Valid","Valid","Valid","","iw","","","","","=
Jump near if not equal (ZF=3D0)."
+"JNG rel8","LEX.WN 7E ib","Valid","Valid","Valid","","ib","","","","","Jum=
p short if not greater (ZF=3D1 or SF!=3DOF)."
+"JNG relw","LEX.0F.W0 8E iw","Valid","Valid","Valid","","iw","","","","","=
Jump near if not greater (ZF=3D1 or SF!=3DOF)."
+"JNGE rel8","LEX.WN 7C ib","Valid","Valid","Valid","","ib","","","","","Ju=
mp short if not greater or equal (SF!=3DOF)."
+"JNGE relw","LEX.0F.W0 8C iw","Valid","Valid","Valid","","iw","","","","",=
"Jump near if not greater or equal (SF!=3DOF)."
+"JNL rel8","LEX.WN 7D ib","Valid","Valid","Valid","","ib","","","","","Jum=
p short if not less (SF=3DOF)."
+"JNL relw","LEX.0F.W0 8D iw","Valid","Valid","Valid","","iw","","","","","=
Jump near if not less (SF=3DOF)."
+"JNLE rel8","LEX.WN 7F ib","Valid","Valid","Valid","","ib","","","","","Ju=
mp short if not less or equal (ZF=3D0 and SF=3DOF)."
+"JNLE relw","LEX.0F.W0 8F iw","Valid","Valid","Valid","","iw","","","","",=
"Jump near if not less or equal (ZF=3D0 and SF=3DOF)."
+"JNO rel8","LEX.WN 71 ib","Valid","Valid","Valid","","ib","","","","","Jum=
p short if not overflow (OF=3D0)."
+"JNO relw","LEX.0F.W0 81 iw","Valid","Valid","Valid","","iw","","","","","=
Jump near if not overflow (OF=3D0)."
+"JNP rel8","LEX.WN 7B ib","Valid","Valid","Valid","","ib","","","","","Jum=
p short if not parity (PF=3D0)."
+"JNP relw","LEX.0F.W0 8B iw","Valid","Valid","Valid","","iw","","","","","=
Jump near if not parity (PF=3D0)."
+"JNS rel8","LEX.WN 79 ib","Valid","Valid","Valid","","ib","","","","","Jum=
p short if not sign (SF=3D0)."
+"JNS relw","LEX.0F.W0 89 iw","Valid","Valid","Valid","","iw","","","","","=
Jump near if not sign (SF=3D0)."
+"JNZ rel8","LEX.WN 75 ib","Valid","Valid","Valid","","ib","","","","","Jum=
p short if not zero (ZF=3D0)."
+"JNZ relw","LEX.0F.W0 85 iw","Valid","Valid","Valid","","iw","","","","","=
Jump near if not zero (ZF=3D0)."
+"JO rel8","LEX.WN 70 ib","Valid","Valid","Valid","","ib","","","","","Jump=
 short if overflow (OF=3D1)."
+"JO relw","LEX.0F.W0 80 iw","Valid","Valid","Valid","","iw","","","","","J=
ump near if overflow (OF=3D1)."
+"JP rel8","LEX.WN 7A ib","Valid","Valid","Valid","","ib","","","","","Jump=
 short if parity (PF=3D1)."
+"JP relw","LEX.0F.W0 8A iw","Valid","Valid","Valid","","iw","","","","","J=
ump near if parity (PF=3D1)."
+"JPE rel8","LEX.WN 7A ib","Valid","Valid","Valid","","ib","","","","","Jum=
p short if parity even (PF=3D1)."
+"JPE relw","LEX.0F.W0 8A iw","Valid","Valid","Valid","","iw","","","","","=
Jump near if parity even (PF=3D1)."
+"JPO rel8","LEX.WN 7B ib","Valid","Valid","Valid","","ib","","","","","Jum=
p short if parity odd (PF=3D0)."
+"JPO relw","LEX.0F.W0 8B iw","Valid","Valid","Valid","","iw","","","","","=
Jump near if parity odd (PF=3D0)."
+"JRCXZ rel8","LEX.WN E3 ib a64","Valid","Invalid","Invalid","","ib","","",=
"","","Jump short if RCX register is 0."
+"JS rel8","LEX.WN 78 ib","Valid","Valid","Valid","","ib","","","","","Jump=
 short if sign (SF=3D1)."
+"JZ rel8","LEX.WN 74 ib","Valid","Valid","Valid","","ib","","","","","Jump=
 short if zero (ZF =3D 1)."
+"JZ relw","LEX.0F.W0 84 iw","Valid","Valid","Valid","","iw","","","","","J=
ump near if 0 (ZF=3D1)."
+"LAHF ah","LEX.WN 9F","Invalid","Valid","Valid","","RAX (w)","","","","","=
Load: AH :=3D EFLAGS(SF:ZF:0:AF:0:PF:1:CF)."
+"LAR rw, r16/m16","LEX.0F.W0 02 /r","Valid","Valid","Valid","","ModRM:reg =
(w)","ModRM:r/m (r)","","","","reg :=3D access rights referenced by r/m"
+"LDS r16, memfar16:16","LEX.WX C5 /r o16","Invalid","Valid","Valid","","Mo=
dRM:reg (w)","ModRM:r/m (r)","","","","Load DS:r16 with far pointer from me=
mory."
+"LDS r32, memfar16:32","LEX.WX C5 /r o32","Invalid","Valid","Valid","","Mo=
dRM:reg (w)","ModRM:r/m (r)","","","","Load DS:r32 with far pointer from me=
mory."
+"LEA rw, m","LEX.WX 8D /r","Valid","Valid","Valid","","ModRM:reg (w)","Mod=
RM:r/m (r)","","","","Store effective address for m in register r."
+"LEAVE","LEX.WW C9","Valid","Valid","Valid","","RSP (r, w, i)","RBP (r, w,=
 i)","","","","Set SP/ESP/RSP to BP/EBP/RBP, then pop BP/EBP/RBP."
+"LES r16, memfar16:16","LEX.WX C4 /r o16","Invalid","Valid","Valid","","Mo=
dRM:reg (w)","ModRM:r/m (r)","","","","Load ES:r16 with far pointer from me=
mory."
+"LES r32, memfar16:32","LEX.WX C4 /r o32","Invalid","Valid","Valid","","Mo=
dRM:reg (w)","ModRM:r/m (r)","","","","Load ES:r32 with far pointer from me=
mory."
+"LFENCE","LEX.0F.W0 AE E8","Valid","Valid","Valid","","","","","","","Seri=
alizes load operations."
+"LFS r16, memfar16:16","LEX.0F.WX B4 /r o16","Valid","Valid","Valid","","M=
odRM:reg (w)","ModRM:r/m (r)","","","","Load FS:r16 with far pointer from m=
emory."
+"LFS r32, memfar16:32","LEX.0F.WX B4 /r o32","Valid","Valid","Valid","","M=
odRM:reg (w)","ModRM:r/m (r)","","","","Load FS:r32 with far pointer from m=
emory."
+"LFS r64, memfar16:64","LEX.0F.WX B4 /r o64","Valid","Invalid","Invalid","=
","ModRM:reg (w)","ModRM:r/m (r)","","","","Load FS:r64 with far pointer fr=
om memory."
+"LGDT m","LEX.0F.W0 01 /2","Valid","Valid","Valid","","ModRM:r/m (r, ModRM=
:[7:6] must not be 11b)","","","","","Load m into GDTR."
+"LGS r16, memfar16:16","LEX.0F.WX B5 /r o16","Valid","Valid","Valid","","M=
odRM:reg (w)","ModRM:r/m (r)","","","","Load GS:r16 with far pointer from m=
emory."
+"LGS r32, memfar16:32","LEX.0F.WX B5 /r o32","Valid","Valid","Valid","","M=
odRM:reg (w)","ModRM:r/m (r)","","","","Load GS:r32 with far pointer from m=
emory."
+"LGS r64, memfar16:64","LEX.0F.WX B5 /r o64","Valid","Invalid","Invalid","=
","ModRM:reg (w)","ModRM:r/m (r)","","","","Load GS:r64 with far pointer fr=
om memory."
+"LIDT m","LEX.0F.W0 01 /3","Valid","Valid","Valid","","ModRM:r/m (r, ModRM=
:[7:6] must not be 11b)","","","","","Load m into IDTR."
+"LLDT r32/m16","LEX.0F.W0 00 /2","Valid","Valid","Valid","","ModRM:r/m (r)=
","","","","","Load segment selector r/m into LDTR."
+"LLDT r64/m16","LEX.0F.W1 00 /2","Valid","Valid","Valid","","ModRM:r/m (r)=
","","","","","Load segment selector r/m into LDTR."
+"LMSW r32/m16","LEX.0F.W0 01 /6","Valid","Valid","Valid","","ModRM:r/m (r)=
","","","","","Loads r/m in machine status word of CR0."
+"LMSW r64/m16","LEX.0F.W1 01 /6","Valid","Valid","Valid","","ModRM:r/m (r)=
","","","","","Loads r/m in machine status word of CR0."
+"LODSB al, psi","LEX.WB AC rep","Valid","Valid","Valid","","RAX (w)","RSI =
(r)","","","","Load byte at address DS:SI/ESI/RSI into AL. "
+"LODSD aw, psi","LEX.WX AD o32 rep","Valid","Valid","Valid","","RAX (w)","=
RSI (r)","","","","Load dword at address DS:SI/ESI/RSI into EAX."
+"LODSQ aw, psi","LEX.WX AD o64 rep","Valid","Invalid","Invalid","","RAX (w=
)","RSI (r)","","","","Load qword at address DS:RSI into RAX."
+"LODSW aw, psi","LEX.WX AD o16 rep","Valid","Valid","Valid","","RAX (w)","=
RSI (r)","","","","Load word at address DS:SI/ESI/RSI into AX."
+"LOOP rel8","LEX.WN E2 ib","Valid","Valid","Valid","","ib","RCX (r, w)",""=
,"","","Decrement count; jump short if count !=3D0."
+"LOOPE rel8","LEX.WN E1 ib","Valid","Valid","Valid","","ib","RCX (r, w)","=
","","","Decrement count; jump short if count !=3D0 and ZF =3D 1."
+"LOOPNE rel8","LEX.WN E0 ib","Valid","Valid","Valid","","ib","RCX (r, w)",=
"","","","Decrement count; jump short if count !=3D0 and ZF =3D 0."
+"LOOPNZ rel8","LEX.WN E0 ib","Valid","Valid","Valid","","ib","RCX (r, w)",=
"","","","Decrement count; jump short if count !=3D0 and ZF =3D 0."
+"LOOPZ rel8","LEX.WN E1 ib","Valid","Valid","Valid","","ib","RCX (r, w)","=
","","","Decrement count; jump short if count !=3D0 and ZF =3D 0."
+"LSL r32, r16/m16","LEX.0F.W0 03 /r","Valid","Valid","Valid","","ModRM:reg=
 (w)","ModRM:r/m (r)","","","","Load: r :=3D segment limit, selector r/m."
+"LSL r64, r16/m16","LEX.0F.W1 03 /r","Valid","Invalid","Invalid","","ModRM=
:reg (w)","ModRM:r/m (r)","","","","Load: r :=3D segment limit, selector r/=
m"
+"LSS r16, memfar16:16","LEX.0F.WX B2 /r o16","Valid","Valid","Valid","","M=
odRM:reg (w)","ModRM:r/m (r)","","","","Load SS:r16 with far pointer from m=
emory."
+"LSS r32, memfar16:32","LEX.0F.WX B2 /r o32","Valid","Valid","Valid","","M=
odRM:reg (w)","ModRM:r/m (r)","","","","Load SS:r32 with far pointer from m=
emory."
+"LSS r64, memfar16:64","LEX.0F.WX B2 /r o64","Valid","Invalid","Invalid","=
","ModRM:reg (w)","ModRM:r/m (r)","","","","Load SS:r64 with far pointer fr=
om memory."
+"LTR r32/m16","LEX.0F.W0 00 /3","Valid","Valid","Valid","","ModRM:r/m (r)"=
,"","","","","Load r/m into task register."
+"LTR r64/m16","LEX.0F.W1 00 /3","Valid","Valid","Valid","","ModRM:r/m (r)"=
,"","","","","Load r/m into task register."
+"MASKMOVQ mm1, mm2","LEX.0F.W0 F7 /r","Valid","Valid","Valid","","ModRM:re=
g (r)","ModRM:r/m (r)","RDI (r)","","","Selectively write bytes from mm1 to=
 memory location using the byte mask in mm2. The default memory location is=
 specified by DS:DI/EDI/RDI."
+"MFENCE","LEX.0F.W0 AE F0","Valid","Valid","Valid","","","","","","","Seri=
alizes load and store operations."
+"MONITOR","LEX.0F.W0 01 C8","Valid","Valid","Valid","","RAX (r)","","","",=
"","Sets up a linear address range to be monitored by hardware and activate=
s the monitor. The address range should be a write- back memory caching typ=
e. The address is DS:AX/EAX/RAX."
+"MOV ra, CR0-CR15","LEX.0F.W0 20 /r","Valid","Valid","Valid","","ModRM:r/m=
 (w)","ModRM:reg (r)","","","","Move control register to r (only CR0-CR8 ar=
e supported)."
+"MOV ra, DR0-DR7","LEX.0F.W0 21 /r","Valid","Valid","Valid","","ModRM:r/m =
(w)","ModRM:reg (r)","","","","Move debug register to r."
+"MOV CR0-CR15, ra","LEX.0F.W0 22 /r","Valid","Valid","Valid","","ModRM:reg=
 (w)","ModRM:r/m (r)","","","","Move r to control register (only CR0-CR8 ar=
e supported)."
+"MOV DR0-DR7, ra","LEX.0F.W0 23 /r","Valid","Valid","Valid","","ModRM:reg =
(w)","ModRM:r/m (r)","","","","Move r to debug register."
+"MOV r8/m8, r8","LEX.WB 88 /r","Valid","Valid","Valid","","ModRM:r/m (w)",=
"ModRM:reg (r)","","","","Move r8 to r8/m8."
+"MOV rw/mw, rw","LEX.WX 89 /r","Valid","Valid","Valid","","ModRM:r/m (w)",=
"ModRM:reg (r)","","","","Move r to r/m."
+"MOV r8, r8/m8","LEX.WB 8A /r","Valid","Valid","Valid","","ModRM:reg (w)",=
"ModRM:r/m (r)","","","","Move r8/m8 to r8."
+"MOV rw, rw/mw","LEX.WX 8B /r","Valid","Valid","Valid","","ModRM:reg (w)",=
"ModRM:r/m (r)","","","","Move r/m to r."
+"MOV r32/m16, Sreg","LEX.WN 8C /r","Valid","Valid","Valid","","ModRM:r/m (=
w)","ModRM:reg (r)","","","","Move segment register to r/m."
+"MOV Sreg, r32/m16","LEX.WN 8E /r","Valid","Valid","Valid","","ModRM:reg (=
w)","ModRM:r/m (r)","","","","Move r/m to segment register."
+"MOVABS al, moffs","LEX.WB A0 iw","Invalid","Valid","Valid","","RAX (w)","=
iw","","","","Move byte at (seg:offset) to AL."
+"MOVABS al, moffs","LEX.WB A0 i64","Valid","Invalid","Invalid","","RAX (w)=
","i64","","","","Move byte at (offset) to AL."
+"MOVABS aw, moffs","LEX.WX A1 iw","Invalid","Valid","Valid","","RAX (w)","=
iw","","","","Move word at (seg:offset) to AX/EAX."
+"MOVABS aw, moffs","LEX.WX A1 i64","Valid","Invalid","Invalid","","RAX (w)=
","i64","","","","Move quadword at (offset) to RAX."
+"MOVABS moffs, al","LEX.WB A2 iw","Invalid","Valid","Valid","","iw","RAX (=
r)","","","","Move AL to byte at (seg:offset)."
+"MOVABS moffs, al","LEX.WB A2 i64","Valid","Invalid","Invalid","","i64","R=
AX (r)","","","","Move AL to byte at (offset)."
+"MOVABS moffs, aw","LEX.WX A3 iw","Invalid","Valid","Valid","","iw","RAX (=
r)","","","","Move AX/EAX to word at (seg:offset)."
+"MOVABS moffs, aw","LEX.WX A3 i64","Valid","Invalid","Invalid","","i64","R=
AX (r)","","","","Move RAX to (offset)."
+"MOV r8, ib","LEX.WB B0+r ib","Valid","Valid","Valid","","opcode +r (w)","=
ib","","","","Move ib to r8."
+"MOV rw, i16","LEX.WX B8+r i16 o16","Valid","Valid","Valid","","opcode +r =
(w)","iw","","","","Move iw to r."
+"MOV rw, i32","LEX.WX B8+r i32 o32","Valid","Valid","Valid","","opcode +r =
(w)","iw","","","","Move iw to r."
+"MOVABS rw, i64","LEX.WX B8+r i64 o64","Valid","Invalid","Invalid","","opc=
ode +r (w)","i64","","","","Move iq to r."
+"MOV r8/m8, ib","LEX.WB C6 /0 ib","Valid","Valid","Valid","","ModRM:r/m (w=
)","ib","","","","Move ib to r8/m8."
+"MOV rw/mw, iw","LEX.WX C7 /0 iw","Valid","Valid","Valid","","ModRM:r/m (w=
)","iw","","","","Move iw to r/m."
+"MOVBE rw, mw","LEX.0F38.W0 F0 /r","Valid","Valid","Valid","","ModRM:reg (=
w)","ModRM:r/m (r)","","","","Reverse byte order in m and move to r."
+"MOVBE rw, mw","LEX.0F38.W1 F0 /r","Valid","Invalid","Invalid","","ModRM:r=
eg (w)","ModRM:r/m (r)","","","","Reverse byte order in m and move to r."
+"MOVBE mw, rw","LEX.0F38.W0 F1 /r","Valid","Valid","Valid","","ModRM:r/m (=
w)","ModRM:reg (r)","","","","Reverse byte order in r and move to m."
+"MOVBE mw, rw","LEX.0F38.W1 F1 /r","Valid","Invalid","Invalid","","ModRM:r=
/m (w)","ModRM:reg (r)","","","","Reverse byte order in r and move to m."
+"MOVDQ2Q mm, xmm","LEX.F2.0F.W0 D6 /r","Valid","Valid","Valid","","ModRM:r=
eg (w)","ModRM:r/m (r)","","","","Move low quadword from xmm to mmx registe=
r."
+"MOVNTI mw, rw","LEX.0F.W0 C3 /r","Valid","Valid","Valid","","ModRM:r/m (w=
)","ModRM:reg (r)","","","","Move doubleword from r to m using non- tempora=
l hint."
+"MOVNTI mw, rw","LEX.0F.W1 C3 /r","Valid","Invalid","Invalid","","ModRM:r/=
m (w)","ModRM:reg (r)","","","","Move quadword from r to m using non- tempo=
ral hint."
+"MOVNTQ m64, mm","LEX.0F.W0 E7 /r","Valid","Valid","Valid","","ModRM:r/m (=
w)","ModRM:reg (r)","","","","Move quadword from mm to m64 using non- tempo=
ral hint."
+"MOVQ2DQ xmm, mm","LEX.F3.0F.W0 D6 /r","Valid","Valid","Valid","","ModRM:r=
eg (w)","ModRM:r/m (r)","","","","Move quadword from mmx to low quadword of=
 xmm."
+"MOVSB pdi, psi","LEX.WB A4 rep","Valid","Valid","Valid","","RDI (r)","RSI=
 (r)","","","","For legacy mode, Move byte from address DS:SI/ESI/RSI to ES=
:DI/EDI/RDI. For 64-bit mode move byte from address (R|E)SI to (R|E)DI."
+"MOVSD pdi, psi","LEX.WX A5 o32 rep","Valid","Valid","Valid","","RDI (r)",=
"RSI (r)","","","","For legacy mode, move dword from address DS:SI/ESI/RSI =
to ES:DI/EDI/RDI. For 64-bit mode move dword from address (R|E)SI to (R|E)D=
I."
+"MOVSQ pdi, psi","LEX.WX A5 o64 rep","Valid","Invalid","Invalid","","RDI (=
r)","RSI (r)","","","","Move qword from address RSI to RDI."
+"MOVSW pdi, psi","LEX.WX A5 o16 rep","Valid","Valid","Valid","","RDI (r)",=
"RSI (r)","","","","For legacy mode, move word from address DS:SI/ESI/RSI t=
o ES:DI/EDI/RDI. For 64-bit mode move word at address (R|E)SI to (R|E)DI."
+"MOVSX rw, r8/m8","LEX.0F.W0 BE /r","Valid","Valid","Valid","","ModRM:reg =
(w)","ModRM:r/m (r)","","","","Move byte to doubleword with sign-extension."
+"MOVSX rw, r8/m8","LEX.0F.W1 BE /r","Valid","Invalid","Invalid","","ModRM:=
reg (w)","ModRM:r/m (r)","","","","Move byte to quadword with sign-extensio=
n."
+"MOVSX r32, r16/m16","LEX.0F.W0 BF /r","Valid","Valid","Valid","","ModRM:r=
eg (w)","ModRM:r/m (r)","","","","Move word to doubleword, with sign-extens=
ion."
+"MOVSX r64, r16/m16","LEX.0F.W1 BF /r","Valid","Invalid","Invalid","","Mod=
RM:reg (w)","ModRM:r/m (r)","","","","Move word to quadword with sign-exten=
sion."
+"MOVSXD r64, r32/m32","LEX.W1 63 /r","Valid","Invalid","Invalid","","ModRM=
:reg (w)","ModRM:r/m (r)","","","","Move doubleword to quadword with sign-e=
xtension."
+"MOVZX rw, r8/m8","LEX.0F.W0 B6 /r","Valid","Valid","Valid","","ModRM:reg =
(w)","ModRM:r/m (r)","","","","Move byte to doubleword, zero-extension."
+"MOVZX rw, r8/m8","LEX.0F.W1 B6 /r","Valid","Invalid","Invalid","","ModRM:=
reg (w)","ModRM:r/m (r)","","","","Move byte to quadword, zero-extension."
+"MOVZX rw, r16/m16","LEX.0F.W0 B7 /r","Valid","Valid","Valid","","ModRM:re=
g (w)","ModRM:r/m (r)","","","","Move word to doubleword, zero-extension."
+"MOVZX rw, r16/m16","LEX.0F.W1 B7 /r","Valid","Invalid","Invalid","","ModR=
M:reg (w)","ModRM:r/m (r)","","","","Move word to quadword, zero-extension."
+"MUL r8/m8","LEX.WB F6 /4","Valid","Valid","Valid","","ModRM:r/m (r)","","=
","","","Unsigned multiply (AX :=3D AL * r8/m8)."
+"MUL rw/mw","LEX.WX F7 /4","Valid","Valid","Valid","","ModRM:r/m (r)","","=
","","","Unsigned multiply (DX/EDX/RDX:AX/EAX/RAX :=3D AX/EAX/RAX * r/m)."
+"MWAIT","LEX.0F.W0 01 C9","Valid","Valid","Valid","","RAX (r)","RCX (r)","=
","","","A hint that allow the processor to stop instruction execution and =
enter an implementation-dependent optimized state until occurrence of a cla=
ss of events."
+"NEG r8/m8","LEX.WB F6 /3 lock","Valid","Valid","Valid","","ModRM:r/m (r, =
w)","","","","","Two's complement negate r8/m8."
+"NEG rw/mw","LEX.WX F7 /3 lock","Valid","Valid","Valid","","ModRM:r/m (r, =
w)","","","","","Two's complement negate r/m."
+"NOP rw/mw","LEX.0F.W0 1F /0","Valid","Valid","Valid","","ModRM:r/m (r)","=
","","","","Multi-byte no-operation instruction."
+"NOP","LEX.WN 90 norexb","Valid","Valid","Valid","","","","","","","One by=
te no-operation instruction."
+"NOT r8/m8","LEX.WB F6 /2 lock","Valid","Valid","Valid","","ModRM:r/m (r, =
w)","","","","","Reverse each bit of r8/m8."
+"NOT rw/mw","LEX.WX F7 /2 lock","Valid","Valid","Valid","","ModRM:r/m (r, =
w)","","","","","Reverse each bit of r/m."
+"OR r8/m8, r8","LEX.WB 08 /r lock","Valid","Valid","Valid","","ModRM:r/m (=
r, w)","ModRM:reg (r)","","","","r8/m8 OR r8."
+"OR rw/mw, rw","LEX.WX 09 /r lock","Valid","Valid","Valid","","ModRM:r/m (=
r, w)","ModRM:reg (r)","","","","r/m OR r."
+"OR r8, r8/m8","LEX.WB 0A /r","Valid","Valid","Valid","","ModRM:reg (r, w)=
","ModRM:r/m (r)","","","","r8 OR r8/m8."
+"OR rw, rw/mw","LEX.WX 0B /r","Valid","Valid","Valid","","ModRM:reg (r, w)=
","ModRM:r/m (r)","","","","r OR r/m."
+"OR al, ib","LEX.WN 0C ib","Valid","Valid","Valid","","RAX (r, w)","ib",""=
,"","","AL OR ib."
+"OR aw, iw","LEX.WX 0D iw","Valid","Valid","Valid","","RAX (r, w)","iw",""=
,"","","EAX OR sign-extended iw."
+"OR r8/m8, ib","LEX.WB 80 /1 ib lock","Valid","Valid","Valid","","ModRM:r/=
m (r, w)","ib","","","","r8/m8 OR ib."
+"OR rw/mw, iw","LEX.WX 81 /1 iw lock","Valid","Valid","Valid","","ModRM:r/=
m (r, w)","iw","","","","r/m OR iw."
+"OR rw/mw, ib","LEX.WX 83 /1 ib lock","Valid","Valid","Valid","","ModRM:r/=
m (r, w)","ib","","","","r/m OR ib (sign-extended)."
+"OUT ib, al","LEX.WB E6 ib","Valid","Valid","Valid","","ib","RAX (r)","","=
","","Output byte in AL to I/O port address ib."
+"OUT ib, aw","LEX.WX E7 ib o32","Valid","Valid","Valid","","ib","RAX (r)",=
"","","","Output word in AX/EAX/RAX to I/O port address ib."
+"OUT dx, al","LEX.WB EE","Valid","Valid","Valid","","RDX (r)","RAX (r)",""=
,"","","Output byte in AL to I/O port address in DX."
+"OUT dx, aw","LEX.WX EF o32","Valid","Valid","Valid","","RDX (r)","RAX (r)=
","","","","Output word in AX/EAX/RAX to I/O port address in DX."
+"OUTSB dx, psi","LEX.WB 6E rep","Valid","Valid","Valid","","RDX (r)","RSI =
(r)","","","","Output byte from memory location specified in DS:(E)SI or RS=
I to I/O port specified in DX."
+"OUTSD dx, psi","LEX.WX 6F o32 rep","Valid","Valid","Valid","","RDX (r)","=
RSI (r)","","","","Output doubleword from memory location specified in DS:(=
E)SI or RSI to I/O port specified in DX."
+"OUTSW dx, psi","LEX.WX 6F o16 rep","Valid","Valid","Valid","","RDX (r)","=
RSI (r)","","","","Output word from memory location specified in DS:(E)SI o=
r RSI to I/O port specified in DX."
+"PAUSE","LEX.F3.WN 90 norexb","Valid","Valid","Valid","","","","","","","G=
ives hint to processor that improves performance of spin-wait loops."
+"POP ES","LEX.WN 07","Invalid","Valid","Valid","","SEG (w)","RSP (r, w, i)=
","","","","Pop top of stack into ES; increment stack pointer."
+"POP SS","LEX.WN 17","Invalid","Valid","Valid","","SEG (w)","RSP (r, w, i)=
","","","","Pop top of stack into SS; increment stack pointer."
+"POP DS","LEX.WN 1F","Invalid","Valid","Valid","","SEG (w)","RSP (r, w, i)=
","","","","Pop top of stack into DS; increment stack pointer."
+"POP rw","LEX.WW 58+r","Valid","Valid","Valid","","opcode +r (w)","RSP (r,=
 w, i)","","","","Pop top of stack into r16; increment stack pointer."
+"POP rw/mw","LEX.WW 8F /0","Valid","Valid","Valid","","ModRM:r/m (w)","RSP=
 (r, w, i)","","","","Pop top of stack into r/m; increment stack pointer."
+"POP FS","LEX.0F.W0 A1","Valid","Valid","Valid","","SEG (w)","RSP (r, w, i=
)","","","","Pop top of stack into FS; increment stack pointer."
+"POP GS","LEX.0F.W0 A9","Valid","Valid","Valid","","SEG (w)","RSP (r, w, i=
)","","","","Pop top of stack into GS; increment stack pointer."
+"POPA","LEX.WW 61","Invalid","Valid","Valid","","RSP (r, w, i)","","","","=
","Pop [E]DI, [E]SI, [E]BP, [E]BX, [E]DX, [E]CX, and [E]AX."
+"POPAD","LEX.WW 61 o32","Invalid","Valid","Valid","","RSP (r, w, i)","",""=
,"","","Pop EDI, ESI, EBP, EBX, EDX, ECX, and EAX."
+"POPAW","LEX.WW 61 o16","Invalid","Valid","Valid","","RSP (r, w, i)","",""=
,"","","Pop DI, SI, BP, BX, DX, CX, and AX."
+"POPCNT rw, rw/mw","LEX.F3.0F.W0 B8 /r","Valid","Valid","Valid","","ModRM:=
reg (w)","ModRM:r/m (r)","","","","POPCNT on r/m"
+"POPCNT rw, rw/mw","LEX.F3.0F.W1 B8 /r","Valid","Invalid","Invalid","","Mo=
dRM:reg (w)","ModRM:r/m (r)","","","","POPCNT on r/m"
+"POPFD","LEX.WW 9D o32","Invalid","Valid","Valid","","RFLAGS (w, i)","RSP =
(r, w, i)","","","","Pop word from stack into EFLAGS."
+"POPFQ","LEX.WW 9D o64","Valid","Invalid","Invalid","","RFLAGS (w, i)","RS=
P (r, w, i)","","","","Pop word from stack into RFLAGS."
+"POPFW","LEX.WW 9D o16","Valid","Valid","Valid","","RFLAGS (w, i)","RSP (r=
, w, i)","","","","Pop word from stack into FLAGS."
+"PSHUFW mm1, mm2/m64, ib","LEX.0F.W0 70 /r ib","Valid","Valid","Valid","",=
"ModRM:reg (w)","ModRM:r/m (r)","ib","","","Shuffle the words in mm2/m64 ba=
sed on the encoding in ib and store the result in mm1."
+"PTWRITE rw/mw","LEX.F3.0F.W0 AE /4","Valid","Valid","Invalid","","ModRM:r=
/m (r)","","","","","Reads the data from r/m to encode into a PTW packet if=
 dependencies are met (see details below)."
+"PTWRITE rw/mw","LEX.F3.0F.W1 AE /4","Valid","Invalid","Invalid","","ModRM=
:r/m (r)","","","","","Reads the data from r/m to encod into a PTW packet i=
f dependencies are met (see details below)."
+"PUSH ES","LEX.WN 06","Invalid","Valid","Valid","","SEG (r)","RSP (r, w, i=
)","","","","Push ES."
+"PUSH CS","LEX.WN 0E","Invalid","Valid","Valid","","SEG (r)","RSP (r, w, i=
)","","","","Push CS."
+"PUSH SS","LEX.WN 16","Invalid","Valid","Valid","","SEG (r)","RSP (r, w, i=
)","","","","Push SS."
+"PUSH DS","LEX.WN 1E","Invalid","Valid","Valid","","SEG (r)","RSP (r, w, i=
)","","","","Push DS."
+"PUSH rw","LEX.WW 50+r","Valid","Valid","Valid","","opcode +r (r)","RSP (r=
, w, i)","","","","Push r."
+"PUSH iw","LEX.WN 68 iw","Valid","Valid","Valid","","iw","RSP (r, w, i)","=
","","","Push iw."
+"PUSH ib","LEX.WN 6A ib","Valid","Valid","Valid","","ib","RSP (r, w, i)","=
","","","Push ib."
+"PUSH FS","LEX.0F.W0 A0","Valid","Valid","Valid","","SEG (r)","RSP (r, w, =
i)","","","","Push FS."
+"PUSH GS","LEX.0F.W0 A8","Valid","Valid","Valid","","SEG (r)","RSP (r, w, =
i)","","","","Push GS."
+"PUSH rw/mw","LEX.WW FF /6","Valid","Valid","Valid","","ModRM:r/m (r)","RS=
P (r, w, i)","","","","Push r/m."
+"PUSHA","LEX.WW 60","Invalid","Valid","Valid","","RSP (r, w, i)","","","",=
"","Push [E]AX, [E]CX, [E]DX, [E]BX, original [E]SP, [E]BP, [E]SI, and [E]D=
I."
+"PUSHAD","LEX.WW 60 o32","Invalid","Valid","Valid","","RSP (r, w, i)","","=
","","","Push [E]AX, [E]CX, [E]DX, [E]BX, original [E]SP, [E]BP, [E]SI, and=
 [E]DI."
+"PUSHAW","LEX.WW 60 o16","Invalid","Valid","Valid","","RSP (r, w, i)","","=
","","","Push [E]AX, [E]CX, [E]DX, [E]BX, original [E]SP, [E]BP, [E]SI, and=
 [E]DI."
+"PUSHFD","LEX.WW 9C o32","Invalid","Valid","Valid","","RFLAGS (r, i)","RSP=
 (r, w, i)","","","","Push EFLAGS word onto the stack."
+"PUSHFQ","LEX.WW 9C o64","Valid","Invalid","Invalid","","RFLAGS (r, i)","R=
SP (r, w, i)","","","","Push RFLAGS word onto the stack."
+"PUSHFW","LEX.WW 9C o16","Valid","Valid","Valid","","RFLAGS (r, i)","RSP (=
r, w, i)","","","","Push FLAGS word onto the stack."
+"RCL r8/m8, ib","LEX.WB C0 /2 ib","Valid","Valid","Valid","","ModRM:r/m (r=
, w)","ib","","","","Rotate 9 bits (CF, r8/m8) left ib times."
+"RCL rw/mw, ib","LEX.WX C1 /2 ib","Valid","Valid","Valid","","ModRM:r/m (r=
, w)","ib","","","","Rotate 33 bits (CF, r/m) left ib times."
+"RCL r8/m8","LEX.WB D0 /2","Valid","Valid","Valid","","ModRM:r/m (r, w)","=
1","","","","Rotate 9 bits (CF, r8/m8) left once."
+"RCL rw/mw","LEX.WX D1 /2","Valid","Valid","Valid","","ModRM:r/m (r, w)","=
1","","","","Rotate 33 bits (CF, r/m) left once."
+"RCL r8/m8, CL","LEX.WB D2 /2","Valid","Valid","Valid","","ModRM:r/m (r, w=
)","RCX (r)","","","","Rotate 9 bits (CF, r8/m8) left CL times."
+"RCL rw/mw, CL","LEX.WX D3 /2","Valid","Valid","Valid","","ModRM:r/m (r, w=
)","RCX (r)","","","","Rotate 33 bits (CF, r/m) left CL times."
+"RCR r8/m8, ib","LEX.WB C0 /3 ib","Valid","Valid","Valid","","ModRM:r/m (r=
, w)","ib","","","","Rotate 9 bits (CF, r8/m8) right ib times."
+"RCR rw/mw, ib","LEX.WX C1 /3 ib","Valid","Valid","Valid","","ModRM:r/m (r=
, w)","ib","","","","Rotate 33 bits (CF, r/m) right ib times."
+"RCR r8/m8","LEX.WB D0 /3","Valid","Valid","Valid","","ModRM:r/m (r, w)","=
1","","","","Rotate 9 bits (CF, r8/m8) right once."
+"RCR rw/mw","LEX.WX D1 /3","Valid","Valid","Valid","","ModRM:r/m (r, w)","=
1","","","","Rotate 33 bits (CF, r/m) right once. Uses a 6 bit count."
+"RCR r8/m8, CL","LEX.WB D2 /3","Valid","Valid","Valid","","ModRM:r/m (r, w=
)","RCX (r)","","","","Rotate 9 bits (CF, r8/m8) right CL times."
+"RCR rw/mw, CL","LEX.WX D3 /3","Valid","Valid","Valid","","ModRM:r/m (r, w=
)","RCX (r)","","","","Rotate 33 bits (CF, r/m) right CL times."
+"RDMSR","LEX.0F.W0 32","Valid","Valid","Valid","","","","","","","Read MSR=
 specified by ECX into EDX:EAX."
+"RDPMC","LEX.0F.W0 33","Valid","Valid","Valid","","","","","","","Read per=
formance-monitoring counter specified by ECX into EDX:EAX."
+"RDTSC","LEX.0F.W0 31","Valid","Valid","Valid","","","","","","","Read tim=
e-stamp counter into EDX:EAX."
+"RDTSCP","LEX.0F.W0 01 F9","Valid","Valid","Valid","","","","","","","Read=
 64-bit time-stamp counter and IA32_TSC_AUX value into EDX:EAX and ECX."
+"RET","LEX.WW C3","Valid","Valid","Valid","","RSP (r, w, i)","","","","","=
Near return to calling procedure."
+"RETF","LEX.WW CB","Valid","Valid","Valid","","RSP (r, w, i)","","","","",=
"Far return to calling procedure."
+"RETF i16","LEX.WW CA i16","Valid","Valid","Valid","","i16","RSP (r, w, i)=
","","","","Far return to calling procedure and pop iw bytes from stack."
+"RET i16","LEX.WW C2 i16","Valid","Valid","Valid","","i16","RSP (r, w, i)"=
,"","","","Near return to calling procedure and pop iw bytes from stack."
+"ROL r8/m8, ib","LEX.WB C0 /0 ib","Valid","Valid","Valid","","ModRM:r/m (r=
, w)","ib","","","","Rotate 8 bits r8/m8 left ib times."
+"ROL rw/mw, ib","LEX.WX C1 /0 ib","Valid","Valid","Valid","","ModRM:r/m (r=
, w)","ib","","","","Rotate 32 bits r/m left ib times."
+"ROL r8/m8","LEX.WB D0 /0","Valid","Valid","Valid","","ModRM:r/m (r, w)","=
1","","","","Rotate 8 bits r8/m8 left once."
+"ROL rw/mw","LEX.WX D1 /0","Valid","Valid","Valid","","ModRM:r/m (r, w)","=
1","","","","Rotate 32 bits r/m left once."
+"ROL r8/m8, CL","LEX.WB D2 /0","Valid","Valid","Valid","","ModRM:r/m (r, w=
)","RCX (r)","","","","Rotate 8 bits r8/m8 left CL times."
+"ROL rw/mw, CL","LEX.WX D3 /0","Valid","Valid","Valid","","ModRM:r/m (r, w=
)","RCX (r)","","","","Rotate 32 bits r/m left CL times."
+"ROR r8/m8, ib","LEX.WB C0 /1 ib","Valid","Valid","Valid","","ModRM:r/m (r=
, w)","ib","","","","Rotate 8 bits r8/m8 right ib times."
+"ROR rw/mw, ib","LEX.WX C1 /1 ib","Valid","Valid","Valid","","ModRM:r/m (r=
, w)","ib","","","","Rotate 32 bits r/m right ib times."
+"ROR r8/m8","LEX.WB D0 /1","Valid","Valid","Valid","","ModRM:r/m (r, w)","=
1","","","","Rotate 8 bits r8/m8 right once."
+"ROR rw/mw","LEX.WX D1 /1","Valid","Valid","Valid","","ModRM:r/m (r, w)","=
1","","","","Rotate 32 bits r/m right once."
+"ROR r8/m8, CL","LEX.WB D2 /1","Valid","Valid","Valid","","ModRM:r/m (r, w=
)","RCX (r)","","","","Rotate 8 bits r8/m8 right CL times."
+"ROR rw/mw, CL","LEX.WX D3 /1","Valid","Valid","Valid","","ModRM:r/m (r, w=
)","RCX (r)","","","","Rotate 32 bits r/m right CL times."
+"RSM","LEX.0F.W0 AA","Valid","Valid","Valid","","","","","","","Resume ope=
ration of interrupted program."
+"SAHF ah","LEX.WN 9E","Invalid","Valid","Valid","","RAX (r)","","","","","=
Loads SF, ZF, AF, PF, and CF from AH into EFLAGS register."
+"SAR r8/m8, ib","LEX.WB C0 /7 ib","Valid","Valid","Valid","","ModRM:r/m (r=
, w)","ib","","","","Signed divide r8/m8 by 2, ib time."
+"SAR rw/mw, ib","LEX.WX C1 /7 ib","Valid","Valid","Valid","","ModRM:r/m (r=
, w)","ib","","","","Signed divide r/m by 2, ib times."
+"SAR r8/m8","LEX.WB D0 /7","Valid","Valid","Valid","","ModRM:r/m (r, w)","=
1","","","","Signed divide r8/m8 by 2, once."
+"SAR rw/mw","LEX.WX D1 /7","Valid","Valid","Valid","","ModRM:r/m (r, w)","=
1","","","","Signed divide r/m by 2, once."
+"SAR r8/m8, CL","LEX.WB D2 /7","Valid","Valid","Valid","","ModRM:r/m (r, w=
)","RCX (r)","","","","Signed divide r8/m8 by 2, CL times."
+"SAR rw/mw, CL","LEX.WX D3 /7","Valid","Valid","Valid","","ModRM:r/m (r, w=
)","RCX (r)","","","","Signed divide r/m by 2, CL times."
+"SBB r8/m8, r8","LEX.WB 18 /r lock","Valid","Valid","Valid","","ModRM:r/m =
(w)","ModRM:reg (r)","","","","Subtract with borrow r8 from r8/m8."
+"SBB rw/mw, rw","LEX.WX 19 /r lock","Valid","Valid","Valid","","ModRM:r/m =
(w)","ModRM:reg (r)","","","","Subtract with borrow r from r/m."
+"SBB r8, r8/m8","LEX.WB 1A /r","Valid","Valid","Valid","","ModRM:reg (w)",=
"ModRM:r/m (r)","","","","Subtract with borrow r8/m8 from r8."
+"SBB rw, rw/mw","LEX.WX 1B /r","Valid","Valid","Valid","","ModRM:reg (w)",=
"ModRM:r/m (r)","","","","Subtract with borrow r/m from r."
+"SBB al, ib","LEX.WN 1C ib","Valid","Valid","Valid","","RAX (r, w)","ib","=
","","","Subtract with borrow ib from AL."
+"SBB aw, iw","LEX.WX 1D iw","Valid","Valid","Valid","","RAX (r, w)","iw","=
","","","Subtract with borrow iw from EAX."
+"SBB r8/m8, ib","LEX.WB 80 /3 ib lock","Valid","Valid","Valid","","ModRM:r=
/m (w)","ib","","","","Subtract with borrow ib from r8/m8."
+"SBB rw/mw, iw","LEX.WX 81 /3 iw lock","Valid","Valid","Valid","","ModRM:r=
/m (w)","iw","","","","Subtract with borrow iw from r/m."
+"SBB rw/mw, ib","LEX.WX 83 /3 ib lock","Valid","Valid","Valid","","ModRM:r=
/m (w)","ib","","","","Subtract with borrow sign-extended ib from r/m."
+"SCASB al, pdi","LEX.WB AE rep","Valid","Valid","Valid","","RAX (r)","RDI =
(r)","","","","Compare AL with byte at ES:DI/EDI/RDI then set status flags."
+"SCASD aw, pdi","LEX.WX AF o32 rep","Valid","Valid","Valid","","RAX (r)","=
RDI (r)","","","","Compare EAX with dword at ES:DI/EDI/RDI  then set status=
 flags."
+"SCASQ aw, pdi","LEX.WX AF o64 rep","Valid","Invalid","Invalid","","RAX (r=
)","RDI (r)","","","","Compare RAX with quadword at ES:RDI then set status =
flags."
+"SCASW aw, pdi","LEX.WX AF o16 rep","Valid","Valid","Valid","","RAX (r)","=
RDI (r)","","","","Compare AX with word at ES:DI/EDI/RDI then set status fl=
ags."
+"SETA r8/m8","LEX.0F.WB 97 /0","Valid","Valid","Valid","","ModRM:r/m (r)",=
"","","","","Set byte if above (CF=3D0 and ZF=3D0)."
+"SETAE r8/m8","LEX.0F.WB 93 /0","Valid","Valid","Valid","","ModRM:r/m (r)"=
,"","","","","Set byte if above or equal (CF=3D0)."
+"SETB r8/m8","LEX.0F.WB 92 /0","Valid","Valid","Valid","","ModRM:r/m (r)",=
"","","","","Set byte if below (CF=3D1)."
+"SETBE r8/m8","LEX.0F.WB 96 /0","Valid","Valid","Valid","","ModRM:r/m (r)"=
,"","","","","Set byte if below or equal (CF=3D1 or ZF=3D1)."
+"SETC r8/m8","LEX.0F.WB 92 /0","Valid","Valid","Valid","","ModRM:r/m (r)",=
"","","","","Set byte if carry (CF=3D1)."
+"SETE r8/m8","LEX.0F.WB 94 /0","Valid","Valid","Valid","","ModRM:r/m (r)",=
"","","","","Set byte if equal (ZF=3D1)."
+"SETG r8/m8","LEX.0F.WB 9F /0","Valid","Valid","Valid","","ModRM:r/m (r)",=
"","","","","Set byte if greater (ZF=3D0 and SF=3DOF)."
+"SETGE r8/m8","LEX.0F.WB 9D /0","Valid","Valid","Valid","","ModRM:r/m (r)"=
,"","","","","Set byte if greater or equal (SF=3DOF)."
+"SETL r8/m8","LEX.0F.WB 9C /0","Valid","Valid","Valid","","ModRM:r/m (r)",=
"","","","","Set byte if less (SF!=3DOF)."
+"SETLE r8/m8","LEX.0F.WB 9E /0","Valid","Valid","Valid","","ModRM:r/m (r)"=
,"","","","","Set byte if less or equal (ZF=3D1 or SF!=3DOF)."
+"SETNA r8/m8","LEX.0F.WB 96 /0","Valid","Valid","Valid","","ModRM:r/m (r)"=
,"","","","","Set byte if not above (CF=3D1 or ZF=3D1)."
+"SETNAE r8/m8","LEX.0F.WB 92 /0","Valid","Valid","Valid","","ModRM:r/m (r)=
","","","","","Set byte if not above or equal (CF=3D1)."
+"SETNB r8/m8","LEX.0F.WB 93 /0","Valid","Valid","Valid","","ModRM:r/m (r)"=
,"","","","","Set byte if not below (CF=3D0)."
+"SETNBE r8/m8","LEX.0F.WB 97 /0","Valid","Valid","Valid","","ModRM:r/m (r)=
","","","","","Set byte if not below or equal (CF=3D0 and ZF=3D0)."
+"SETNC r8/m8","LEX.0F.WB 93 /0","Valid","Valid","Valid","","ModRM:r/m (r)"=
,"","","","","Set byte if not carry (CF=3D0)."
+"SETNE r8/m8","LEX.0F.WB 95 /0","Valid","Valid","Valid","","ModRM:r/m (r)"=
,"","","","","Set byte if not equal (ZF=3D0)."
+"SETNG r8/m8","LEX.0F.WB 9E /0","Valid","Valid","Valid","","ModRM:r/m (r)"=
,"","","","","Set byte if not greater (ZF=3D1 or SF!=3DOF)"
+"SETNGE r8/m8","LEX.0F.WB 9C /0","Valid","Valid","Valid","","ModRM:r/m (r)=
","","","","","Set byte if not greater or equal (SF!=3DOF)."
+"SETNL r8/m8","LEX.0F.WB 9D /0","Valid","Valid","Valid","","ModRM:r/m (r)"=
,"","","","","Set byte if not less (SF=3DOF)."
+"SETNLE r8/m8","LEX.0F.WB 9F /0","Valid","Valid","Valid","","ModRM:r/m (r)=
","","","","","Set byte if not less or equal (ZF=3D0 and SF=3DOF)."
+"SETNO r8/m8","LEX.0F.WB 91 /0","Valid","Valid","Valid","","ModRM:r/m (r)"=
,"","","","","Set byte if not overflow (OF=3D0)."
+"SETNP r8/m8","LEX.0F.WB 9B /0","Valid","Valid","Valid","","ModRM:r/m (r)"=
,"","","","","Set byte if not parity (PF=3D0)."
+"SETNS r8/m8","LEX.0F.WB 99 /0","Valid","Valid","Valid","","ModRM:r/m (r)"=
,"","","","","Set byte if not sign (SF=3D0)."
+"SETNZ r8/m8","LEX.0F.WB 95 /0","Valid","Valid","Valid","","ModRM:r/m (r)"=
,"","","","","Set byte if not zero (ZF=3D0)."
+"SETO r8/m8","LEX.0F.WB 90 /0","Valid","Valid","Valid","","ModRM:r/m (r)",=
"","","","","Set byte if overflow (OF=3D1)."
+"SETP r8/m8","LEX.0F.WB 9A /0","Valid","Valid","Valid","","ModRM:r/m (r)",=
"","","","","Set byte if parity (PF=3D1)."
+"SETPE r8/m8","LEX.0F.WB 9A /0","Valid","Valid","Valid","","ModRM:r/m (r)"=
,"","","","","Set byte if parity even (PF=3D1)."
+"SETPO r8/m8","LEX.0F.WB 9B /0","Valid","Valid","Valid","","ModRM:r/m (r)"=
,"","","","","Set byte if parity odd (PF=3D0)."
+"SETS r8/m8","LEX.0F.WB 98 /0","Valid","Valid","Valid","","ModRM:r/m (r)",=
"","","","","Set byte if sign (SF=3D1)."
+"SETZ r8/m8","LEX.0F.WB 94 /0","Valid","Valid","Valid","","ModRM:r/m (r)",=
"","","","","Set byte if zero (ZF=3D1)."
+"SFENCE","LEX.0F.W0 AE F8","Valid","Valid","Valid","","","","","","","Seri=
alizes store operations."
+"SGDT m","LEX.0F.W0 01 /0","Valid","Valid","Valid","","ModRM:r/m (w, ModRM=
:[7:6] must not be 11b)","","","","","Store GDTR to m."
+"SHL r8/m8, ib","LEX.WB C0 /4 ib","Valid","Valid","Valid","","ModRM:r/m (r=
, w)","ib","","","","Multiply r8/m8 by 2, ib times."
+"SHL rw/mw, ib","LEX.WX C1 /4 ib","Valid","Valid","Valid","","ModRM:r/m (r=
, w)","ib","","","","Multiply r/m by 2, ib times."
+"SHL r8/m8","LEX.WB D0 /4","Valid","Valid","Valid","","ModRM:r/m (r, w)","=
1","","","","Multiply r8/m8 by 2, once."
+"SHL rw/mw","LEX.WX D1 /4","Valid","Valid","Valid","","ModRM:r/m (r, w)","=
1","","","","Multiply r/m by 2, once."
+"SHL r8/m8, CL","LEX.WB D2 /4","Valid","Valid","Valid","","ModRM:r/m (r, w=
)","RCX (r)","","","","Multiply r8/m8 by 2, CL times."
+"SHL rw/mw, CL","LEX.WX D3 /4","Valid","Valid","Valid","","ModRM:r/m (r, w=
)","RCX (r)","","","","Multiply r/m by 2, CL times."
+"SHLD rw/mw, rw, ib","LEX.0F.W0 A4 /r ib","Valid","Valid","Valid","","ModR=
M:r/m (r, w)","ModRM:reg (r)","ib","","","Shift r/m to left ib places while=
 shifting bits from r in from the right."
+"SHLD rw/mw, rw, ib","LEX.0F.W1 A4 /r ib","Valid","Invalid","Invalid","","=
ModRM:r/m (r, w)","ModRM:reg (r)","ib","","","Shift r/m to left ib places w=
hile shifting bits from r in from the right."
+"SHLD rw/mw, rw, CL","LEX.0F.W0 A5 /r","Valid","Valid","Valid","","ModRM:r=
/m (r, w)","ModRM:reg (r)","RCX (r)","","","Shift r/m to left CL places whi=
le shifting bits from r in from the right."
+"SHLD rw/mw, rw, CL","LEX.0F.W1 A5 /r","Valid","Invalid","Invalid","","Mod=
RM:r/m (r, w)","ModRM:reg (r)","RCX (r)","","","Shift r/m to left CL places=
 while shifting bits from r in from the right."
+"SHR r8/m8, ib","LEX.WB C0 /5 ib","Valid","Valid","Valid","","ModRM:r/m (r=
, w)","ib","","","","Unsigned divide r8/m8 by 2, ib times."
+"SHR rw/mw, ib","LEX.WX C1 /5 ib","Valid","Valid","Valid","","ModRM:r/m (r=
, w)","ib","","","","Unsigned divide r/m by 2, ib times."
+"SHR r8/m8","LEX.WB D0 /5","Valid","Valid","Valid","","ModRM:r/m (r, w)","=
1","","","","Unsigned divide r8/m8 by 2, once."
+"SHR rw/mw","LEX.WX D1 /5","Valid","Valid","Valid","","ModRM:r/m (r, w)","=
1","","","","Unsigned divide r/m by 2, once."
+"SHR r8/m8, CL","LEX.WB D2 /5","Valid","Valid","Valid","","ModRM:r/m (r, w=
)","RCX (r)","","","","Unsigned divide r8/m8 by 2, CL times."
+"SHR rw/mw, CL","LEX.WX D3 /5","Valid","Valid","Valid","","ModRM:r/m (r, w=
)","RCX (r)","","","","Unsigned divide r/m by 2, CL times."
+"SHRD rw/mw, rw, ib","LEX.0F.W0 AC /r ib","Valid","Valid","Valid","","ModR=
M:r/m (r, w)","ModRM:reg (r)","ib","","","Shift r/m to right ib places whil=
e shifting bits from r in from the left."
+"SHRD rw/mw, rw, ib","LEX.0F.W1 AC /r ib","Valid","Invalid","Invalid","","=
ModRM:r/m (r, w)","ModRM:reg (r)","ib","","","Shift r/m to right ib places =
while shifting bits from r in from the left."
+"SHRD rw/mw, rw, CL","LEX.0F.W0 AD /r","Valid","Valid","Valid","","ModRM:r=
/m (r, w)","ModRM:reg (r)","RCX (r)","","","Shift r/m to right CL places wh=
ile shifting bits from r in from the left."
+"SHRD rw/mw, rw, CL","LEX.0F.W1 AD /r","Valid","Invalid","Invalid","","Mod=
RM:r/m (r, w)","ModRM:reg (r)","RCX (r)","","","Shift r/m to right CL place=
s while shifting bits from r in from the left."
+"SIDT m","LEX.0F.W0 01 /1","Valid","Valid","Valid","","ModRM:r/m (w, ModRM=
:[7:6] must not be 11b)","","","","","Store IDTR to m."
+"SLDT r32/m16","LEX.0F.W0 00 /0","Valid","Valid","Valid","","ModRM:r/m (w)=
","","","","","Stores segment selector from LDTR in r/m."
+"SLDT r64/m16","LEX.0F.W1 00 /0","Valid","Invalid","Invalid","","ModRM:r/m=
 (w)","","","","","Stores segment selector from LDTR in r/m."
+"SMSW r32/m16","LEX.0F.W0 01 /4","Valid","Valid","Valid","","ModRM:r/m (w)=
","","","","","Store machine status word to r/m."
+"SMSW r64/m16","LEX.0F.W1 01 /4","Valid","Invalid","Invalid","","ModRM:r/m=
 (w)","","","","","Store machine status to r/m."
+"STC","LEX.WN F9","Valid","Valid","Valid","","","","","","","Set CF flag."
+"STD","LEX.WN FD","Valid","Valid","Valid","","","","","","","Set DF flag."
+"STI","LEX.WN FB","Valid","Valid","Valid","","","","","","","Set interrupt=
 flag; external, maskable interrupts enabled at the end of the next instruc=
tion."
+"STOSB pdi, al","LEX.WB AA rep","Valid","Valid","Valid","","RDI (r)","RAX =
(r)","","","","For legacy mode, store AL at address ES:DI/EDI/RDI."
+"STOSD pdi, aw","LEX.WX AB o32 rep","Valid","Valid","Valid","","RDI (r)","=
RAX (r)","","","","For legacy mode, store EAX at address ES:DI/EDI/RDI."
+"STOSQ pdi, aw","LEX.WX AB o64 rep","Valid","Invalid","Invalid","","RDI (r=
)","RAX (r)","","","","Store RAX at address ES:RDI."
+"STOSW pdi, aw","LEX.WX AB o16 rep","Valid","Valid","Valid","","RDI (r)","=
RAX (r)","","","","For legacy mode, store AX at address ES:DI/EDI/RDI."
+"STR r32/m16","LEX.0F.W0 00 /1","Valid","Valid","Valid","","ModRM:r/m (w)"=
,"","","","","Stores segment selector from TR in r/m."
+"STR r64/m16","LEX.0F.W1 00 /1","Valid","Valid","Valid","","ModRM:r/m (w)"=
,"","","","","Stores segment selector from TR in r/m."
+"SUB r8/m8, r8","LEX.WB 28 /r lock","Valid","Valid","Valid","","ModRM:r/m =
(r, w)","ModRM:reg (r)","","","","Subtract r8 from r8/m8."
+"SUB rw/mw, rw","LEX.WX 29 /r lock","Valid","Valid","Valid","","ModRM:r/m =
(r, w)","ModRM:reg (r)","","","","Subtract r from r/m."
+"SUB r8, r8/m8","LEX.WB 2A /r","Valid","Valid","Valid","","ModRM:reg (r, w=
)","ModRM:r/m (r)","","","","Subtract r8/m8 from r8."
+"SUB rw, rw/mw","LEX.WX 2B /r","Valid","Valid","Valid","","ModRM:reg (r, w=
)","ModRM:r/m (r)","","","","Subtract r/m from r."
+"SUB al, ib","LEX.WN 2C ib","Valid","Valid","Valid","","RAX (r, w)","ib","=
","","","Subtract ib from AL."
+"SUB aw, iw","LEX.WX 2D iw","Valid","Valid","Valid","","RAX (r, w)","iw","=
","","","Subtract sign-extend iw from AX/EAX/RAX."
+"SUB r8/m8, ib","LEX.WB 80 /5 ib lock","Valid","Valid","Valid","","ModRM:r=
/m (r, w)","ib","","","","Subtract ib from r8/m8."
+"SUB rw/mw, iw","LEX.WX 81 /5 iw lock","Valid","Valid","Valid","","ModRM:r=
/m (r, w)","iw","","","","Subtract iw from r/m."
+"SUB rw/mw, ib","LEX.WX 83 /5 ib lock","Valid","Valid","Valid","","ModRM:r=
/m (r, w)","ib","","","","Subtract sign-extended ib from r/m."
+"SWAPGS","LEX.0F.W0 01 F8","Valid","Invalid","Invalid","","","","","","","=
Exchanges the current GS base register value with the value contained in MS=
R address C0000102H."
+"SYSCALL","LEX.0F.W0 05","Valid","Invalid","Invalid","","","","","","","Fa=
st call to privilege level 0 system procedures."
+"SYSENTER","LEX.0F.W0 34","Valid","Valid","Valid","","","","","","","Fast =
call to privilege level 0 system procedures."
+"SYSEXIT","LEX.0F.W0 35","Valid","Valid","Valid","","","","","","","Fast r=
eturn to privilege level 3 user code."
+"SYSEXITQ","LEX.0F.W1 35","Valid","Invalid","Invalid","","","","","","","F=
ast return to 64-bit mode privilege level 3 user code."
+"SYSRET","LEX.0F.W0 07","Valid","Invalid","Invalid","","","","","","","Ret=
urn to compatibility mode from fast system call"
+"SYSRETQ","LEX.0F.W1 07","Valid","Invalid","Invalid","","","","","","","Re=
turn to 64-bit mode from fast system call"
+"TEST r8/m8, r8","LEX.WB 84 /r","Valid","Valid","Valid","","ModRM:r/m (r)"=
,"ModRM:reg (r)","","","","AND r8 with r8/m8; set SF, ZF, PF according to r=
esult."
+"TEST rw/mw, rw","LEX.WX 85 /r","Valid","Valid","Valid","","ModRM:r/m (r)"=
,"ModRM:reg (r)","","","","AND r with r/m; set SF, ZF, PF according to resu=
lt."
+"TEST al, ib","LEX.WN A8 ib","Valid","Valid","Valid","","RAX (r)","ib","",=
"","","AND ib with AL; set SF, ZF, PF according to result."
+"TEST aw, iw","LEX.WX A9 iw","Valid","Valid","Valid","","RAX (r)","iw","",=
"","","AND iw with EAX; set SF, ZF, PF according to result."
+"TEST r8/m8, ib","LEX.WB F6 /0 ib","Valid","Valid","Valid","","ModRM:r/m (=
r)","ib","","","","AND ib with r8/m8; set SF, ZF, PF according to result."
+"TEST rw/mw, iw","LEX.WX F7 /0 iw","Valid","Valid","Valid","","ModRM:r/m (=
r)","iw","","","","AND iw with r/m; set SF, ZF, PF according to result."
+"UD0 rw, rw/mw","LEX.0F.W0 FF /r","Valid","Valid","Valid","","ModRM:reg (r=
)","ModRM:r/m (r)","","","","Raise invalid opcode exception."
+"UD1 rw, rw/mw","LEX.0F.W0 B9 /r","Valid","Valid","Valid","","ModRM:reg (r=
)","ModRM:r/m (r)","","","","Raise invalid opcode exception."
+"UD2","LEX.0F.W0 0B","Valid","Valid","Valid","","","","","","","Raise inva=
lid opcode exception."
+"VERR r16/m16","LEX.0F.W0 00 /4","Valid","Valid","Valid","","ModRM:r/m (r)=
","","","","","Set ZF=3D1 if segment specified with r/m can be read."
+"VERW r16/m16","LEX.0F.W0 00 /5","Valid","Valid","Valid","","ModRM:r/m (r)=
","","","","","Set ZF=3D1 if segment specified with r/m can be written."
+"WBINVD","LEX.0F.W0 09","Valid","Valid","Valid","","","","","","","Write b=
ack and flush Internal caches; initiate writing-back and flushing of extern=
al caches."
+"WRMSR","LEX.0F.W0 30","Valid","Valid","Valid","","","","","","","Write th=
e value in EDX:EAX to MSR specified by ECX."
+"XADD r8/m8, r8","LEX.0F.W0 C0 /r lock","Valid","Valid","Valid","","ModRM:=
r/m (r, w)","ModRM:reg (r, w)","","","","Exchange r8 and r8/m8; load sum in=
to r8/m8."
+"XADD rw/mw, rw","LEX.0F.WX C1 /r lock","Valid","Valid","Valid","","ModRM:=
r/m (r, w)","ModRM:reg (r, w)","","","","Exchange r and r/m; load sum into =
r/m."
+"XCHG r8/m8, r8","LEX.WB 86 /r lock","Valid","Valid","Valid","","ModRM:r/m=
 (r, w)","ModRM:reg (r)","","","","Exchange r8 (byte register) with byte fr=
om r8/m8."
+"XCHG rw/mw, rw","LEX.WX 87 /r lock","Valid","Valid","Valid","","ModRM:r/m=
 (r, w)","ModRM:reg (r)","","","","Exchange r with doubleword from r/m."
+"XCHG rw, aw","LEX.WX 90+r","Valid","Valid","Valid","","opcode +r (r, w)",=
"RAX (r, w)","","","","Exchange AX/EAX/RAX with r."
+"XGETBV","LEX.0F.W0 01 D0","Valid","Valid","Valid","","","","","","","Read=
s an XCR specified by ECX into EDX:EAX."
+"XLATB","LEX.WN D7","Valid","Valid","Valid","","","RAX (r, w)","RBX (r)","=
","","Set AL to memory byte DS:[(E)BX + unsigned AL]."
+"XOR r8/m8, r8","LEX.WB 30 /r lock","Valid","Valid","Valid","","ModRM:r/m =
(r, w)","ModRM:reg (r)","","","","r8/m8 XOR r8."
+"XOR rw/mw, rw","LEX.WX 31 /r lock","Valid","Valid","Valid","","ModRM:r/m =
(r, w)","ModRM:reg (r)","","","","r/m XOR r."
+"XOR r8, r8/m8","LEX.WB 32 /r","Valid","Valid","Valid","","ModRM:reg (r, w=
)","ModRM:r/m (r)","","","","r8 XOR r8/m8."
+"XOR rw, rw/mw","LEX.WX 33 /r","Valid","Valid","Valid","","ModRM:reg (r, w=
)","ModRM:r/m (r)","","","","r XOR r/m."
+"XOR al, ib","LEX.WN 34 ib","Valid","Valid","Valid","","RAX (r, w)","ib","=
","","","AL XOR ib."
+"XOR aw, iw","LEX.WX 35 iw","Valid","Valid","Valid","","RAX (r, w)","iw","=
","","","AX/EAX/RAX XOR sign-extend iw."
+"XOR r8/m8, ib","LEX.WB 80 /6 ib lock","Valid","Valid","Valid","","ModRM:r=
/m (r, w)","ib","","","","r8/m8 XOR ib."
+"XOR rw/mw, iw","LEX.WX 81 /6 iw lock","Valid","Valid","Valid","","ModRM:r=
/m (r, w)","iw","","","","r/m XOR sign-extend iw."
+"XOR rw/mw, ib","LEX.WX 83 /6 ib lock","Valid","Valid","Valid","","ModRM:r=
/m (r, w)","ib","","","","r/m XOR sign-extend ib."
+"XRSTOR mem","LEX.0F.W0 AE /5","Valid","Valid","Valid","","ModRM:r/m (r)",=
"","","","","Restore state components specified by EDX:EAX from mem."
+"XRSTOR64 mem","LEX.0F.W1 AE /5","Valid","Invalid","Invalid","","ModRM:r/m=
 (r)","","","","","Restore state components specified by EDX:EAX from mem."
+"XRSTORS mem","LEX.0F.W0 C7 /3","Valid","Valid","Valid","","ModRM:r/m (r)"=
,"","","","","Restore state components specified by EDX:EAX from mem."
+"XRSTORS64 mem","LEX.0F.W1 C7 /3","Valid","Invalid","Invalid","","ModRM:r/=
m (r)","","","","","Restore state components specified by EDX:EAX from mem."
+"XSAVE mem","LEX.0F.W0 AE /4","Valid","Valid","Valid","","ModRM:r/m (w)","=
","","","","Save state components specified by EDX:EAX to mem."
+"XSAVE64 mem","LEX.0F.W1 AE /4","Valid","Invalid","Invalid","","ModRM:r/m =
(w)","","","","","Save state components specified by EDX:EAX to mem."
+"XSAVEC mem","LEX.0F.W0 C7 /4","Valid","Valid","Valid","","ModRM:r/m (w)",=
"","","","","Save state components specified by EDX:EAX to mem with compact=
ion."
+"XSAVEC64 mem","LEX.0F.W1 C7 /4","Valid","Invalid","Invalid","","ModRM:r/m=
 (w)","","","","","Save state components specified by EDX:EAX to mem with c=
ompaction."
+"XSAVES mem","LEX.0F.W0 C7 /5","Valid","Valid","Valid","","ModRM:r/m (w)",=
"","","","","Save state components specified by EDX:EAX to mem with compact=
ion, optimizing if possible."
+"XSAVES64 mem","LEX.0F.W1 C7 /5","Valid","Invalid","Invalid","","ModRM:r/m=
 (w)","","","","","Save state components specified by EDX:EAX to mem with c=
ompaction, optimizing if possible."
+"XSETBV","LEX.0F.W0 01 D1","Valid","Valid","Valid","","","","","","","Writ=
e the value in EDX:EAX to the XCR specified by ECX."
diff --git a/disas/x86-data/x86_bmi1.csv b/disas/x86-data/x86_bmi1.csv
new file mode 100644
index 000000000000..d7b2d292089a
--- /dev/null
+++ b/disas/x86-data/x86_bmi1.csv
@@ -0,0 +1,13 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"ANDN rw, rw, rw/mw","VEX.LZ.0F38.W0 F2 /r","Valid","Valid","Invalid","BMI=
1","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Bitwise AND of inv=
erted r with r/m, store result in r."
+"ANDN rw, rw, rw/mw","VEX.LZ.0F38.W1 F2 /r","Valid","Invalid","Invalid","B=
MI1","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Bitwise AND of i=
nverted r with r/m, store result in r."
+"BEXTR rw, rw/mw, rw","VEX.LZ.0F38.W0 F7 /r","Valid","Valid","Invalid","BM=
I1","ModRM:reg (w)","ModRM:r/m (r)","VEX.vvvv (r)","","","Contiguous bitwis=
e extract from r/m using r as control; store result in r."
+"BEXTR rw, rw/mw, rw","VEX.LZ.0F38.W1 F7 /r","Valid","Invalid","Invalid","=
BMI1","ModRM:reg (w)","ModRM:r/m (r)","VEX.vvvv (r)","","","Contiguous bitw=
ise extract from r/m using r as control; store result in r."
+"BLSI rw, rw/mw","VEX.LZ.0F38.W0 F3 /3","Valid","Valid","Invalid","BMI1","=
VEX.vvvv (w)","ModRM:r/m (r)","","","","Extract lowest set bit from r/m and=
 set that bit in r."
+"BLSI rw, rw/mw","VEX.LZ.0F38.W1 F3 /3","Valid","Invalid","Invalid","BMI1"=
,"VEX.vvvv (w)","ModRM:r/m (r)","","","","Extract lowest set bit from r/m, =
and set that bit in r."
+"BLSMSK rw, rw/mw","VEX.LZ.0F38.W0 F3 /2","Valid","Valid","Invalid","BMI1"=
,"VEX.vvvv (w)","ModRM:r/m (r)","","","","Set all lower bits in r to 1 star=
ting from bit 0 to lowest set bit in r/m."
+"BLSMSK rw, rw/mw","VEX.LZ.0F38.W1 F3 /2","Valid","Invalid","Invalid","BMI=
1","VEX.vvvv (w)","ModRM:r/m (r)","","","","Set all lower bits in r to 1 st=
arting from bit 0 to lowest set bit in r/m."
+"BLSR rw, rw/mw","VEX.LZ.0F38.W0 F3 /1","Valid","Valid","Invalid","BMI1","=
VEX.vvvv (w)","ModRM:r/m (r)","","","","Reset lowest set bit of r/m, keep a=
ll other bits of r/m and write result to r."
+"BLSR rw, rw/mw","VEX.LZ.0F38.W1 F3 /1","Valid","Invalid","Invalid","BMI1"=
,"VEX.vvvv (w)","ModRM:r/m (r)","","","","Reset lowest set bit of r/m, keep=
 all other bits of r/m and write result to r."
+"TZCNT rw, rw/mw","LEX.F3.0F.W0 BC /r","Valid","Valid","Invalid","BMI1","M=
odRM:reg (w)","ModRM:r/m (r)","","","","Count the number of trailing zero b=
its in r/m, return result in r."
+"TZCNT rw, rw/mw","LEX.F3.0F.W1 BC /r","Valid","Invalid","Invalid","BMI1",=
"ModRM:reg (w)","ModRM:r/m (r)","","","","Count the number of trailing zero=
 bits in r/m, return result in r."
diff --git a/disas/x86-data/x86_bmi2.csv b/disas/x86-data/x86_bmi2.csv
new file mode 100644
index 000000000000..70f5ac7065a7
--- /dev/null
+++ b/disas/x86-data/x86_bmi2.csv
@@ -0,0 +1,17 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"BZHI rw, rw/mw, rw","VEX.LZ.0F38.W0 F5 /r","Valid","Valid","Invalid","BMI=
2","ModRM:reg (w)","ModRM:r/m (r)","VEX.vvvv (r)","","","Zero bits in r/m s=
tarting with the position in r, write result to r."
+"BZHI rw, rw/mw, rw","VEX.LZ.0F38.W1 F5 /r","Valid","Invalid","Invalid","B=
MI2","ModRM:reg (w)","ModRM:r/m (r)","VEX.vvvv (r)","","","Zero bits in r/m=
 starting with the position in r, write result to r."
+"MULX rw, rw, rw/mw","VEX.LZ.F2.0F38.W0 F6 /r","Valid","Valid","Invalid","=
BMI2","ModRM:reg (w)","VEX.vvvv (w)","ModRM:r/m (r)","RDX (r)","","Unsigned=
 multiply of r/m with EDX without affecting arithmetic flags."
+"MULX rw, rw, rw/mw","VEX.LZ.F2.0F38.W1 F6 /r","Valid","Invalid","Invalid"=
,"BMI2","ModRM:reg (w)","VEX.vvvv (w)","ModRM:r/m (r)","RDX (r)","","Unsign=
ed multiply of r/m with RDX without affecting arithmetic flags."
+"PDEP rw, rw, rw/mw","VEX.LZ.F2.0F38.W0 F5 /r","Valid","Valid","Invalid","=
BMI2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Parallel deposi=
t of bits from r using mask in r/m, result is writ-ten to r."
+"PDEP rw, rw, rw/mw","VEX.LZ.F2.0F38.W1 F5 /r","Valid","Invalid","Invalid"=
,"BMI2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Parallel depo=
sit of bits from r using mask in r/m, result is writ-ten to r."
+"PEXT rw, rw, rw/mw","VEX.LZ.F3.0F38.W0 F5 /r","Valid","Valid","Invalid","=
BMI2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Parallel extrac=
t of bits from r using mask in r/m, result is writ-ten to r."
+"PEXT rw, rw, rw/mw","VEX.LZ.F3.0F38.W1 F5 /r","Valid","Invalid","Invalid"=
,"BMI2","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Parallel extr=
act of bits from r using mask in r/m, result is writ-ten to r."
+"RORX rw, rw/mw, ib","VEX.LZ.F2.0F3A.W0 F0 /r ib","Valid","Valid","Invalid=
","BMI2","ModRM:reg (w)","ModRM:r/m (r)","ib","","","Rotate 32-bit r/m righ=
t ib times without affecting arithmetic flags."
+"RORX rw, rw/mw, ib","VEX.LZ.F2.0F3A.W1 F0 /r ib","Valid","Invalid","Inval=
id","BMI2","ModRM:reg (w)","ModRM:r/m (r)","ib","","","Rotate 64-bit r/m ri=
ght ib times without affecting arithmetic flags."
+"SARX rw, rw/mw, rw","VEX.LZ.F3.0F38.W0 F7 /r","Valid","Valid","Invalid","=
BMI2","ModRM:reg (w)","ModRM:r/m (r)","VEX.vvvv (r)","","","Shift r/m arith=
metically right with count specified in the third operand."
+"SARX rw, rw/mw, rw","VEX.LZ.F3.0F38.W1 F7 /r","Valid","Invalid","Invalid"=
,"BMI2","ModRM:reg (w)","ModRM:r/m (r)","VEX.vvvv (r)","","","Shift r/m ari=
thmetically right with count specified in the third operand."
+"SHLX rw, rw/mw, rw","VEX.LZ.66.0F38.W0 F7 /r","Valid","Valid","Invalid","=
BMI2","ModRM:reg (w)","ModRM:r/m (r)","VEX.vvvv (r)","","","Shift r/m logic=
ally left with count specified in the third operand."
+"SHLX rw, rw/mw, rw","VEX.LZ.66.0F38.W1 F7 /r","Valid","Invalid","Invalid"=
,"BMI2","ModRM:reg (w)","ModRM:r/m (r)","VEX.vvvv (r)","","","Shift r/m log=
ically left with count specified in the third operand."
+"SHRX rw, rw/mw, rw","VEX.LZ.F2.0F38.W0 F7 /r","Valid","Valid","Invalid","=
BMI2","ModRM:reg (w)","ModRM:r/m (r)","VEX.vvvv (r)","","","Shift r/m logic=
ally right with count specified in the third operand."
+"SHRX rw, rw/mw, rw","VEX.LZ.F2.0F38.W1 F7 /r","Valid","Invalid","Invalid"=
,"BMI2","ModRM:reg (w)","ModRM:r/m (r)","VEX.vvvv (r)","","","Shift r/m log=
ically right with count specified in the third operand."
diff --git a/disas/x86-data/x86_cet.csv b/disas/x86-data/x86_cet.csv
new file mode 100644
index 000000000000..4365a253d1af
--- /dev/null
+++ b/disas/x86-data/x86_cet.csv
@@ -0,0 +1,15 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"CLRSSBSY mw","LEX.F3.0F.W0 ae /6","Valid","Valid","Invalid","CET","ModRM:=
r/m (r, w)","","","","","Clear busy flag in supervisor shadow stack token r=
eference by m64."
+"ENDBR32","LEX.F3.0F.W0 1e fb","Valid","Valid","Invalid","CET","","","",""=
,"","Terminate indirect branch in 32-bit and compatibility mode."
+"ENDBR64","LEX.F3.0F.W0 1e fa","Valid","Valid","Invalid","CET","","","",""=
,"","Terminate indirect branch in 64-bit mode."
+"INCSSPD rw","LEX.F3.0F.W0 ae /5","Valid","Valid","Invalid","CET","ModRM:r=
/m (r)","","","","","Increment SSP by 4 * r32[7:0]."
+"INCSSPQ rw","LEX.F3.0F.W1 ae /5","Valid","Valid","Invalid","CET","ModRM:r=
/m (r)","","","","","Increment SSP by 8 * r64[7:0]."
+"RDSSPD rw","LEX.F3.0F.W0 1e /1","Valid","Valid","Invalid","CET","ModRM:r/=
m (r)","","","","","Copy low 32 bits of shadow stack pointer (SSP) to r32."
+"RDSSPQ rw","LEX.F3.0F.W1 1e /1","Valid","Valid","Invalid","CET","ModRM:r/=
m (r)","","","","","Copies shadow stack pointer (SSP) to r64."
+"RSTORSSP mw","LEX.F3.0F.W0 01 /5","Valid","Valid","Invalid","CET","ModRM:=
r/m (r, w)","","","","","Restore SSP."
+"SAVEPREVSSP","LEX.F3.0F.W0 01 ea","Valid","Valid","Invalid","CET","ModRM:=
r/m (r)","","","","","Save a restore-shadow-stack token on previous shadow =
stack."
+"SETSSBSY","LEX.F3.0F.W0 01 e8","Valid","Valid","Invalid","CET","","","","=
","","Set busy flag in supervisor shadow stack token reference by IA32_PL0_=
SSP."
+"WRSSD mw,rw","LEX.0F38.W0 f6 /r","Valid","Valid","Invalid","CET","ModRM:r=
/m (w)","ModRM:reg (r)","","","","Write 4 bytes to shadow stack."
+"WRSSQ mw,rw","LEX.0F38.W1 f6 /r","Valid","Valid","Invalid","CET","ModRM:r=
/m (w)","ModRM:reg (r)","","","","Write 8 bytes to shadow stack."
+"WRUSSD mw,rw","LEX.66.0F38.W0 f5 /r","Valid","Valid","Invalid","CET","Mod=
RM:r/m (w)","ModRM:reg (r)","","","","Write 4 bytes to shadow stack."
+"WRUSSQ mw,rw","LEX.66.0F38.W1 f5 /r","Valid","Valid","Invalid","CET","Mod=
RM:r/m (w)","ModRM:reg (r)","","","","Write 8 bytes to shadow stack."
diff --git a/disas/x86-data/x86_cldemote.csv b/disas/x86-data/x86_cldemote.=
csv
new file mode 100644
index 000000000000..4752596a0570
--- /dev/null
+++ b/disas/x86-data/x86_cldemote.csv
@@ -0,0 +1,2 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"CLDEMOTE m8","LEX.0F.W0 1c /0","Valid","Valid","Invalid","CLDEMOTE","ModR=
M:r/m (w)","","","","","Hint to hardware to move the cache line containing =
m8 to a more distant level of the cache without writing back to memory."
diff --git a/disas/x86-data/x86_clwb.csv b/disas/x86-data/x86_clwb.csv
new file mode 100644
index 000000000000..f8028a9e24c3
--- /dev/null
+++ b/disas/x86-data/x86_clwb.csv
@@ -0,0 +1,2 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"CLWB m8","LEX.66.0F.W0 AE /6","Valid","Valid","Invalid","CLWB","ModRM:r/m=
 (r)","","","","","Writes back modified cache line containing m8, and may r=
etain the line in cache hierarchy in non-modified state."
diff --git a/disas/x86-data/x86_enqcmd.csv b/disas/x86-data/x86_enqcmd.csv
new file mode 100644
index 000000000000..8f7b59e830cb
--- /dev/null
+++ b/disas/x86-data/x86_enqcmd.csv
@@ -0,0 +1,3 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"ENQCMD r64,m512","LEX.F2.0F38.W0 f8 /r","Valid","Valid","Invalid","ENQCMD=
","ModRM:reg (w)","ModRM:r/m (r)","","","","Atomically enqueue 64-byte user=
 command from source memory operand to destination offset in ES segment spe=
cified in register operand as offset in ES segment."
+"ENQCMDS r64,m512","LEX.F3.0F38.W0 f8 /r","Valid","Valid","Invalid","ENQCM=
D","ModRM:reg (w)","ModRM:r/m (r)","","","","Atomically enqueue 64-byte com=
mand with PASID from source memory operand to destination offset in ES segm=
ent specified in register operand as offset in ES segment."
diff --git a/disas/x86-data/x86_f16c.csv b/disas/x86-data/x86_f16c.csv
new file mode 100644
index 000000000000..a20460332c24
--- /dev/null
+++ b/disas/x86-data/x86_f16c.csv
@@ -0,0 +1,5 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"VCVTPH2PS xmm1, xmm2/m64","VEX.128.66.0F38.W0 13 /r","Valid","Valid","Inv=
alid","F16C","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert four packed =
half precision (16-bit) floating-point values in xmm2/m64 to packed single-=
precision floating-point value in xmm1."
+"VCVTPH2PS ymm1, xmm2/m128","VEX.256.66.0F38.W0 13 /r","Valid","Valid","In=
valid","F16C","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert eight packe=
d half precision (16-bit) floating-point values in xmm2/m128 to packed sing=
le-precision floating-point value in ymm1."
+"VCVTPS2PH xmm1/m128, ymm2, ib","VEX.256.66.0F3A.W0 1D /r ib","Valid","Val=
id","Invalid","F16C","ModRM:r/m (w)","ModRM:reg (r)","ib","","","Convert ei=
ght packed single-precision floating-point values in ymm2 to packed half-pr=
ecision (16-bit) floating-point values in xmm1/m128. ib provides rounding c=
ontrols."
+"VCVTPS2PH xmm1/m64, xmm2, ib","VEX.128.66.0F3A.W0 1D /r ib","Valid","Vali=
d","Invalid","F16C","ModRM:r/m (w)","ModRM:reg (r)","ib","","","Convert fou=
r packed single-precision floating-point values in xmm2 to packed half-prec=
ision (16-bit) floating-point values in xmm1/m64. ib provides rounding cont=
rols."
diff --git a/disas/x86-data/x86_fma.csv b/disas/x86-data/x86_fma.csv
new file mode 100644
index 000000000000..05a689d4c33e
--- /dev/null
+++ b/disas/x86-data/x86_fma.csv
@@ -0,0 +1,97 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"VFMADD132PD xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W1 98 /r","Valid","Va=
lid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","=
","Multiply packed double-precision floating-point values from xmm1 and xmm=
3/mem, add to xmm2 and put result in xmm1."
+"VFMADD132PD ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W1 98 /r","Valid","Va=
lid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","=
","Multiply packed double-precision floating-point values from ymm1 and ymm=
3/mem, add to ymm2 and put result in ymm1."
+"VFMADD132PS xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W0 98 /r","Valid","Va=
lid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","=
","Multiply packed single-precision floating-point values from xmm1 and xmm=
3/mem, add to xmm2 and put result in xmm1."
+"VFMADD132PS ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W0 98 /r","Valid","Va=
lid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","=
","Multiply packed single-precision floating-point values from ymm1 and ymm=
3/mem, add to ymm2 and put result in ymm1."
+"VFMADD132SD xmm1, xmm2, xmm3/m64","VEX.LIG.66.0F38.W1 99 /r","Valid","Val=
id","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","",""=
,"Multiply scalar double-precision floating-point value from xmm1 and xmm3/=
m64, add to xmm2 and put result in xmm1."
+"VFMADD132SS xmm1, xmm2, xmm3/m32","VEX.LIG.66.0F38.W0 99 /r","Valid","Val=
id","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","",""=
,"Multiply scalar single-precision floating-point value from xmm1 and xmm3/=
m32, add to xmm2 and put result in xmm1."
+"VFMADD213PD xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W1 A8 /r","Valid","Va=
lid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","=
","Multiply packed double-precision floating-point values from xmm1 and xmm=
2, add to xmm3/mem and put result in xmm1."
+"VFMADD213PD ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W1 A8 /r","Valid","Va=
lid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","=
","Multiply packed double-precision floating-point values from ymm1 and ymm=
2, add to ymm3/mem and put result in ymm1."
+"VFMADD213PS xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W0 A8 /r","Valid","Va=
lid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","=
","Multiply packed single-precision floating-point values from xmm1 and xmm=
2, add to xmm3/mem and put result in xmm1."
+"VFMADD213PS ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W0 A8 /r","Valid","Va=
lid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","=
","Multiply packed single-precision floating-point values from ymm1 and ymm=
2, add to ymm3/mem and put result in ymm1."
+"VFMADD213SD xmm1, xmm2, xmm3/m64","VEX.LIG.66.0F38.W1 A9 /r","Valid","Val=
id","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","",""=
,"Multiply scalar double-precision floating-point value from xmm1 and xmm2,=
 add to xmm3/m64 and put result in xmm1."
+"VFMADD213SS xmm1, xmm2, xmm3/m32","VEX.LIG.66.0F38.W0 A9 /r","Valid","Val=
id","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","",""=
,"Multiply scalar single-precision floating-point value from xmm1 and xmm2,=
 add to xmm3/m32 and put result in xmm1."
+"VFMADD231PD xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W1 B8 /r","Valid","Va=
lid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","=
","Multiply packed double-precision floating-point values from xmm2 and xmm=
3/mem, add to xmm1 and put result in xmm1."
+"VFMADD231PD ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W1 B8 /r","Valid","Va=
lid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","=
","Multiply packed double-precision floating-point values from ymm2 and ymm=
3/mem, add to ymm1 and put result in ymm1."
+"VFMADD231PS xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W0 B8 /r","Valid","Va=
lid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","=
","Multiply packed single-precision floating-point values from xmm2 and xmm=
3/mem, add to xmm1 and put result in xmm1."
+"VFMADD231PS ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W0 B8 /r","Valid","Va=
lid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","=
","Multiply packed single-precision floating-point values from ymm2 and ymm=
3/mem, add to ymm1 and put result in ymm1."
+"VFMADD231SD xmm1, xmm2, xmm3/m64","VEX.LIG.66.0F38.W1 B9 /r","Valid","Val=
id","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","",""=
,"Multiply scalar double-precision floating-point value from xmm2 and xmm3/=
m64, add to xmm1 and put result in xmm1."
+"VFMADD231SS xmm1, xmm2, xmm3/m32","VEX.LIG.66.0F38.W0 B9 /r","Valid","Val=
id","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","",""=
,"Multiply scalar single-precision floating-point value from xmm2 and xmm3/=
m32, add to xmm1 and put result in xmm1."
+"VFMADDSUB132PD xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W1 96 /r","Valid",=
"Valid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","=
","","Multiply packed double-precision floating-point values from xmm1 and =
xmm3/mem,add/subtract elements in xmm2 and put result in xmm1."
+"VFMADDSUB132PD ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W1 96 /r","Valid",=
"Valid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","=
","","Multiply packed double-precision floating-point values from ymm1 and =
ymm3/mem,add/subtract elements in ymm2 and put result in ymm1."
+"VFMADDSUB132PS xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W0 96 /r","Valid",=
"Valid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","=
","","Multiply packed single-precision floating-point values from xmm1 and =
xmm3/mem, add/subtract elements in xmm2 and put result in xmm1."
+"VFMADDSUB132PS ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W0 96 /r","Valid",=
"Valid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","=
","","Multiply packed single-precision floating-point values from ymm1 and =
ymm3/mem, add/subtract elements in ymm2 and put result in ymm1."
+"VFMADDSUB213PD xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W1 A6 /r","Valid",=
"Valid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","=
","","Multiply packed double-precision floating-point values from xmm1 and =
xmm2,add/subtract elements in xmm3/mem and put result in xmm1."
+"VFMADDSUB213PD ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W1 A6 /r","Valid",=
"Valid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","=
","","Multiply packed double-precision floating-point values from ymm1 and =
ymm2,add/subtract elements in ymm3/mem and put result in ymm1."
+"VFMADDSUB213PS xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W0 A6 /r","Valid",=
"Valid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","=
","","Multiply packed single-precision floating-point values from xmm1 and =
xmm2, add/subtract elements in xmm3/mem and put result in xmm1."
+"VFMADDSUB213PS ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W0 A6 /r","Valid",=
"Valid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","=
","","Multiply packed single-precision floating-point values from ymm1 and =
ymm2, add/subtract elements in ymm3/mem and put result in ymm1."
+"VFMADDSUB231PD xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W1 B6 /r","Valid",=
"Valid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","=
","","Multiply packed double-precision floating-point values from xmm2 and =
xmm3/mem,add/subtract elements in xmm1 and put result in xmm1."
+"VFMADDSUB231PD ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W1 B6 /r","Valid",=
"Valid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","=
","","Multiply packed double-precision floating-point values from ymm2 and =
ymm3/mem,add/subtract elements in ymm1 and put result in ymm1."
+"VFMADDSUB231PS xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W0 B6 /r","Valid",=
"Valid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","=
","","Multiply packed single-precision floating-point values from xmm2 and =
xmm3/mem, add/subtract elements in xmm1 and put result in xmm1."
+"VFMADDSUB231PS ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W0 B6 /r","Valid",=
"Valid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","=
","","Multiply packed single-precision floating-point values from ymm2 and =
ymm3/mem, add/subtract elements in ymm1 and put result in ymm1."
+"VFMSUB132PD xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W1 9A /r","Valid","Va=
lid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","=
","Multiply packed double-precision floating-point values from xmm1 and xmm=
3/mem, subtract xmm2 and put result in xmm1."
+"VFMSUB132PD ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W1 9A /r","Valid","Va=
lid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","=
","Multiply packed double-precision floating-point values from ymm1 and ymm=
3/mem, subtract ymm2 and put result in ymm1."
+"VFMSUB132PS xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W0 9A /r","Valid","Va=
lid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","=
","Multiply packed single-precision floating-point values from xmm1 and xmm=
3/mem, subtract xmm2 and put result in xmm1."
+"VFMSUB132PS ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W0 9A /r","Valid","Va=
lid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","=
","Multiply packed single-precision floating-point values from ymm1 and ymm=
3/mem, subtract ymm2 and put result in ymm1."
+"VFMSUB132SD xmm1, xmm2, xmm3/m64","VEX.LIG.66.0F38.W1 9B /r","Valid","Val=
id","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","",""=
,"Multiply scalar double-precision floating-point value from xmm1 and xmm3/=
m64, subtract xmm2 and put result in xmm1."
+"VFMSUB132SS xmm1, xmm2, xmm3/m32","VEX.LIG.66.0F38.W0 9B /r","Valid","Val=
id","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","",""=
,"Multiply scalar single-precision floating-point value from xmm1 and xmm3/=
m32, subtract xmm2 and put result in xmm1."
+"VFMSUB213PD xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W1 AA /r","Valid","Va=
lid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","=
","Multiply packed double-precision floating-point values from xmm1 and xmm=
2, subtract xmm3/mem and put result in xmm1."
+"VFMSUB213PD ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W1 AA /r","Valid","Va=
lid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","=
","Multiply packed double-precision floating-point values from ymm1 and ymm=
2, subtract ymm3/mem and put result in ymm1."
+"VFMSUB213PS xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W0 AA /r","Valid","Va=
lid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","=
","Multiply packed single-precision floating-point values from xmm1 and xmm=
2, subtract xmm3/mem and put result in xmm1."
+"VFMSUB213PS ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W0 AA /r","Valid","Va=
lid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","=
","Multiply packed single-precision floating-point values from ymm1 and ymm=
2, subtract ymm3/mem and put result in ymm1."
+"VFMSUB213SD xmm1, xmm2, xmm3/m64","VEX.LIG.66.0F38.W1 AB /r","Valid","Val=
id","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","",""=
,"Multiply scalar double-precision floating-point value from xmm1 and xmm2,=
 subtract xmm3/m64 and put result in xmm1."
+"VFMSUB213SS xmm1, xmm2, xmm3/m32","VEX.LIG.66.0F38.W0 AB /r","Valid","Val=
id","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","",""=
,"Multiply scalar single-precision floating-point value from xmm1 and xmm2,=
 subtract xmm3/m32 and put result in xmm1."
+"VFMSUB231PD xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W1 BA /r","Valid","Va=
lid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","=
","Multiply packed double-precision floating-point values from xmm2 and xmm=
3/mem, subtract xmm1 and put result in xmm1."
+"VFMSUB231PD ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W1 BA /r","Valid","Va=
lid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","=
","Multiply packed double-precision floating-point values from ymm2 and ymm=
3/mem, subtract ymm1 and put result in ymm1.S"
+"VFMSUB231PS xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W0 BA /r","Valid","Va=
lid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","=
","Multiply packed single-precision floating-point values from xmm2 and xmm=
3/mem, subtract xmm1 and put result in xmm1."
+"VFMSUB231PS ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W0 BA /r","Valid","Va=
lid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","=
","Multiply packed single-precision floating-point values from ymm2 and ymm=
3/mem, subtract ymm1 and put result in ymm1."
+"VFMSUB231SD xmm1, xmm2, xmm3/m64","VEX.LIG.66.0F38.W1 BB /r","Valid","Val=
id","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","",""=
,"Multiply scalar double-precision floating-point value from xmm2 and xmm3/=
m64, subtract xmm1 and put result in xmm1."
+"VFMSUB231SS xmm1, xmm2, xmm3/m32","VEX.LIG.66.0F38.W0 BB /r","Valid","Val=
id","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","",""=
,"Multiply scalar single-precision floating-point value from xmm2 and xmm3/=
m32, subtract xmm1 and put result in xmm1."
+"VFMSUBADD132PD xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W1 97 /r","Valid",=
"Valid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","=
","","Multiply packed double-precision floating-point values from xmm1 and =
xmm3/mem,subtract/add elements in xmm2 and put result in xmm1."
+"VFMSUBADD132PD ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W1 97 /r","Valid",=
"Valid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","=
","","Multiply packed double-precision floating-point values from ymm1 and =
ymm3/mem,subtract/add elements in ymm2 and put result in ymm1."
+"VFMSUBADD132PS xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W0 97 /r","Valid",=
"Valid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","=
","","Multiply packed single-precision floating-point values from xmm1 and =
xmm3/mem, subtract/add elements in xmm2 and put result in xmm1."
+"VFMSUBADD132PS ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W0 97 /r","Valid",=
"Valid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","=
","","Multiply packed single-precision floating-point values from ymm1 and =
ymm3/mem, subtract/add elements in ymm2 and put result in ymm1."
+"VFMSUBADD213PD xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W1 A7 /r","Valid",=
"Valid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","=
","","Multiply packed double-precision floating-point values from xmm1 and =
xmm2,subtract/add elements in xmm3/mem and put result in xmm1."
+"VFMSUBADD213PD ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W1 A7 /r","Valid",=
"Valid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","=
","","Multiply packed double-precision floating-point values from ymm1 and =
ymm2,subtract/add elements in ymm3/mem and put result in ymm1."
+"VFMSUBADD213PS xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W0 A7 /r","Valid",=
"Valid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","=
","","Multiply packed single-precision floating-point values from xmm1 and =
xmm2, subtract/add elements in xmm3/mem and put result in xmm1."
+"VFMSUBADD213PS ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W0 A7 /r","Valid",=
"Valid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","=
","","Multiply packed single-precision floating-point values from ymm1 and =
ymm2, subtract/add elements in ymm3/mem and put result in ymm1."
+"VFMSUBADD231PD xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W1 B7 /r","Valid",=
"Valid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","=
","","Multiply packed double-precision floating-point values from xmm2 and =
xmm3/mem,subtract/add elements in xmm1 and put result in xmm1."
+"VFMSUBADD231PD ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W1 B7 /r","Valid",=
"Valid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","=
","","Multiply packed double-precision floating-point values from ymm2 and =
ymm3/mem,subtract/add elements in ymm1 and put result in ymm1."
+"VFMSUBADD231PS xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W0 B7 /r","Valid",=
"Valid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","=
","","Multiply packed single-precision floating-point values from xmm2 and =
xmm3/mem, subtract/add elements in xmm1 and put result in xmm1."
+"VFMSUBADD231PS ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W0 B7 /r","Valid",=
"Valid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","=
","","Multiply packed single-precision floating-point values from ymm2 and =
ymm3/mem, subtract/add elements in ymm1 and put result in ymm1."
+"VFNMADD132PD xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W1 9C /r","Valid","V=
alid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","",=
"","Multiply packed double-precision floating-point values from xmm1 and xm=
m3/mem, negate the multiplication result and add to xmm2 and put result in =
xmm1."
+"VFNMADD132PD ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W1 9C /r","Valid","V=
alid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","",=
"","Multiply packed double-precision floating-point values from ymm1 and ym=
m3/mem, negate the multiplication result and add to ymm2 and put result in =
ymm1."
+"VFNMADD132PS xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W0 9C /r","Valid","V=
alid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","",=
"","Multiply packed single-precision floating-point values from xmm1 and xm=
m3/mem, negate the multiplication result and add to xmm2 and put result in =
xmm1."
+"VFNMADD132PS ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W0 9C /r","Valid","V=
alid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","",=
"","Multiply packed single-precision floating-point values from ymm1 and ym=
m3/mem, negate the multiplication result and add to ymm2 and put result in =
ymm1."
+"VFNMADD132SD xmm1, xmm2, xmm3/m64","VEX.LIG.66.0F38.W1 9D /r","Valid","Va=
lid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","=
","Multiply scalar double-precision floating-point value from xmm1 and xmm3=
/mem, negate the multiplication result and add to xmm2 and put result in xm=
m1."
+"VFNMADD132SS xmm1, xmm2, xmm3/m32","VEX.LIG.66.0F38.W0 9D /r","Valid","Va=
lid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","=
","Multiply scalar single-precision floating-point value from xmm1 and xmm3=
/m32, negate the multiplication result and add to xmm2 and put result in xm=
m1."
+"VFNMADD213PD xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W1 AC /r","Valid","V=
alid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","",=
"","Multiply packed double-precision floating-point values from xmm1 and xm=
m2, negate the multiplication result and add to xmm3/mem and put result in =
xmm1."
+"VFNMADD213PD ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W1 AC /r","Valid","V=
alid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","",=
"","Multiply packed double-precision floating-point values from ymm1 and ym=
m2, negate the multiplication result and add to ymm3/mem and put result in =
ymm1."
+"VFNMADD213PS xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W0 AC /r","Valid","V=
alid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","",=
"","Multiply packed single-precision floating-point values from xmm1 and xm=
m2, negate the multiplication result and add to xmm3/mem and put result in =
xmm1."
+"VFNMADD213PS ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W0 AC /r","Valid","V=
alid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","",=
"","Multiply packed single-precision floating-point values from ymm1 and ym=
m2, negate the multiplication result and add to ymm3/mem and put result in =
ymm1."
+"VFNMADD213SD xmm1, xmm2, xmm3/m64","VEX.LIG.66.0F38.W1 AD /r","Valid","Va=
lid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","=
","Multiply scalar double-precision floating-point value from xmm1 and xmm2=
, negate the multiplication result and add to xmm3/mem and put result in xm=
m1."
+"VFNMADD213SS xmm1, xmm2, xmm3/m32","VEX.LIG.66.0F38.W0 AD /r","Valid","Va=
lid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","=
","Multiply scalar single-precision floating-point value from xmm1 and xmm2=
, negate the multiplication result and add to xmm3/m32 and put result in xm=
m1."
+"VFNMADD231PD xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W1 BC /r","Valid","V=
alid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","",=
"","Multiply packed double-precision floating-point values from xmm2 and xm=
m3/mem, negate the multiplication result and add to xmm1 and put result in =
xmm1."
+"VFNMADD231PD ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W1 BC /r","Valid","V=
alid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","",=
"","Multiply packed double-precision floating-point values from ymm2 and ym=
m3/mem, negate the multiplication result and add to ymm1 and put result in =
ymm1."
+"VFNMADD231PS xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W0 BC /r","Valid","V=
alid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","",=
"","Multiply packed single-precision floating-point values from xmm2 and xm=
m3/mem, negate the multiplication result and add to xmm1 and put result in =
xmm1."
+"VFNMADD231PS ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W0 BC /r","Valid","V=
alid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","",=
"","Multiply packed single-precision floating-point values from ymm2 and ym=
m3/mem, negate the multiplication result and add to ymm1 and put result in =
ymm1."
+"VFNMADD231SD xmm1, xmm2, xmm3/m64","VEX.LIG.66.0F38.W1 BD /r","Valid","Va=
lid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","=
","Multiply scalar double-precision floating-point value from xmm2 and xmm3=
/mem, negate the multiplication result and add to xmm1 and put result in xm=
m1."
+"VFNMADD231SS xmm1, xmm2, xmm3/m32","VEX.LIG.66.0F38.W0 BD /r","Valid","Va=
lid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","=
","Multiply scalar single-precision floating-point value from xmm2 and xmm3=
/m32, negate the multiplication result and add to xmm1 and put result in xm=
m1."
+"VFNMSUB132PD xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W1 9E /r","Valid","V=
alid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","",=
"","Multiply packed double-precision floating-point values from xmm1 and xm=
m3/mem, negate the multiplication result and subtract xmm2 and put result i=
n xmm1."
+"VFNMSUB132PD ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W1 9E /r","Valid","V=
alid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","",=
"","Multiply packed double-precision floating-point values from ymm1 and ym=
m3/mem, negate the multiplication result and subtract ymm2 and put result i=
n ymm1."
+"VFNMSUB132PS xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W0 9E /r","Valid","V=
alid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","",=
"","Multiply packed single-precision floating-point values from xmm1 and xm=
m3/mem, negate the multiplication result and subtract xmm2 and put result i=
n xmm1."
+"VFNMSUB132PS ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W0 9E /r","Valid","V=
alid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","",=
"","Multiply packed single-precision floating-point values from ymm1 and ym=
m3/mem, negate the multiplication result and subtract ymm2 and put result i=
n ymm1."
+"VFNMSUB132SD xmm1, xmm2, xmm3/m64","VEX.LIG.66.0F38.W1 9F /r","Valid","Va=
lid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","=
","Multiply scalar double-precision floating-point value from xmm1 and xmm3=
/mem, negate the multiplication result and subtract xmm2 and put result in =
xmm1."
+"VFNMSUB132SS xmm1, xmm2, xmm3/m32","VEX.LIG.66.0F38.W0 9F /r","Valid","Va=
lid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","=
","Multiply scalar single-precision floating-point value from xmm1 and xmm3=
/m32, negate the multiplication result and subtract xmm2 and put result in =
xmm1."
+"VFNMSUB213PD xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W1 AE /r","Valid","V=
alid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","",=
"","Multiply packed double-precision floating-point values from xmm1 and xm=
m2, negate the multiplication result and subtract xmm3/mem and put result i=
n xmm1."
+"VFNMSUB213PD ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W1 AE /r","Valid","V=
alid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","",=
"","Multiply packed double-precision floating-point values from ymm1 and ym=
m2, negate the multiplication result and subtract ymm3/mem and put result i=
n ymm1."
+"VFNMSUB213PS xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W0 AE /r","Valid","V=
alid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","",=
"","Multiply packed single-precision floating-point values from xmm1 and xm=
m2, negate the multiplication result and subtract xmm3/mem and put result i=
n xmm1."
+"VFNMSUB213PS ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W0 AE /r","Valid","V=
alid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","",=
"","Multiply packed single-precision floating-point values from ymm1 and ym=
m2, negate the multiplication result and subtract ymm3/mem and put result i=
n ymm1."
+"VFNMSUB213SD xmm1, xmm2, xmm3/m64","VEX.LIG.66.0F38.W1 AF /r","Valid","Va=
lid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","=
","Multiply scalar double-precision floating-point value from xmm1 and xmm2=
, negate the multiplication result and subtract xmm3/mem and put result in =
xmm1."
+"VFNMSUB213SS xmm1, xmm2, xmm3/m32","VEX.LIG.66.0F38.W0 AF /r","Valid","Va=
lid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","=
","Multiply scalar single-precision floating-point value from xmm1 and xmm2=
, negate the multiplication result and subtract xmm3/m32 and put result in =
xmm1."
+"VFNMSUB231PD xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W1 BE /r","Valid","V=
alid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","",=
"","Multiply packed double-precision floating-point values from xmm2 and xm=
m3/mem, negate the multiplication result and subtract xmm1 and put result i=
n xmm1."
+"VFNMSUB231PD ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W1 BE /r","Valid","V=
alid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","",=
"","Multiply packed double-precision floating-point values from ymm2 and ym=
m3/mem, negate the multiplication result and subtract ymm1 and put result i=
n ymm1."
+"VFNMSUB231PS xmm1, xmm2, xmm3/m128","VEX.128.66.0F38.W0 BE /r","Valid","V=
alid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","",=
"","Multiply packed single-precision floating-point values from xmm2 and xm=
m3/mem, negate the multiplication result and subtract xmm1 and put result i=
n xmm1."
+"VFNMSUB231PS ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.W0 BE /r","Valid","V=
alid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","",=
"","Multiply packed single-precision floating-point values from ymm2 and ym=
m3/mem, negate the multiplication result and subtract ymm1 and put result i=
n ymm1."
+"VFNMSUB231SD xmm1, xmm2, xmm3/m64","VEX.LIG.66.0F38.W1 BF /r","Valid","Va=
lid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","=
","Multiply scalar double-precision floating-point value from xmm2 and xmm3=
/mem, negate the multiplication result and subtract xmm1 and put result in =
xmm1."
+"VFNMSUB231SS xmm1, xmm2, xmm3/m32","VEX.LIG.66.0F38.W0 BF /r","Valid","Va=
lid","Invalid","FMA","ModRM:reg (r, w)","VEX.vvvv (r)","ModRM:r/m (r)","","=
","Multiply scalar single-precision floating-point value from xmm2 and xmm3=
/m32, negate the multiplication result and subtract xmm1 and put result in =
xmm1."
diff --git a/disas/x86-data/x86_fsgsbase.csv b/disas/x86-data/x86_fsgsbase.=
csv
new file mode 100644
index 000000000000..e1e56d96677d
--- /dev/null
+++ b/disas/x86-data/x86_fsgsbase.csv
@@ -0,0 +1,9 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"RDFSBASE rw","LEX.F3.0F.W0 AE /0","Valid","Invalid","Invalid","FSGSBASE",=
"ModRM:r/m (w)","","","","","Load the 32-bit destination register with the =
FS base address."
+"RDFSBASE rw","LEX.F3.0F.W1 AE /0","Valid","Invalid","Invalid","FSGSBASE",=
"ModRM:r/m (w)","","","","","Load the 64-bit destination register with the =
FS base address."
+"RDGSBASE rw","LEX.F3.0F.W0 AE /1","Valid","Invalid","Invalid","FSGSBASE",=
"ModRM:r/m (w)","","","","","Load the 32-bit destination register with the =
GS base address."
+"RDGSBASE rw","LEX.F3.0F.W1 AE /1","Valid","Invalid","Invalid","FSGSBASE",=
"ModRM:r/m (w)","","","","","Load the 64-bit destination register with the =
GS base address."
+"WRFSBASE rw","LEX.F3.0F.W0 AE /2","Valid","Invalid","Invalid","FSGSBASE",=
"ModRM:r/m (r)","","","","","Load the FS base address with the 32-bit value=
 in the source register."
+"WRFSBASE rw","LEX.F3.0F.W1 AE /2","Valid","Invalid","Invalid","FSGSBASE",=
"ModRM:r/m (r)","","","","","Load the FS base address with the 64-bit value=
 in the source register."
+"WRGSBASE rw","LEX.F3.0F.W0 AE /3","Valid","Invalid","Invalid","FSGSBASE",=
"ModRM:r/m (r)","","","","","Load the GS base address with the 32-bit value=
 in the source register."
+"WRGSBASE rw","LEX.F3.0F.W1 AE /3","Valid","Invalid","Invalid","FSGSBASE",=
"ModRM:r/m (r)","","","","","Load the GS base address with the 64-bit value=
 in the source register."
diff --git a/disas/x86-data/x86_gfni.csv b/disas/x86-data/x86_gfni.csv
new file mode 100644
index 000000000000..5516183c0461
--- /dev/null
+++ b/disas/x86-data/x86_gfni.csv
@@ -0,0 +1,19 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"GF2P8AFFINEINVQB xmm,xmm/m128,ib","LEX.66.0F3A.W0 cf /r ib","Valid","Vali=
d","Invalid","GFNI","ModRM:reg (r, w)","ModRM:r/m (r)","ib","","","Computes=
 inverse affine transformation in the finite field GF(2^8)."
+"GF2P8AFFINEQB xmm,xmm/m128,ib","LEX.66.0F3A.W0 ce /r ib","Valid","Valid",=
"Invalid","GFNI","ModRM:reg (r, w)","ModRM:r/m (r)","ib","","","Computes af=
fine transformation in the finite field GF(2^8)."
+"GF2P8MULB xmm,xmm/m128","LEX.66.0F38.W0 cf /r","Valid","Valid","Invalid",=
"GFNI","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Multiplies elements in =
the finite field GF(2^8)."
+"VGF2P8AFFINEINVQB xmm,xmm,xmm/m128,ib","VEX.128.66.0F3A.W1 cf /r ib","Val=
id","Valid","Invalid","AVX GFNI","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m =
(r)","ib","","Computes inverse affine transformation in the finite field GF=
(2^8)."
+"VGF2P8AFFINEINVQB xmm{k}{z},xmm,xmm/m128/m64bcst,ib","EVEX.128.66.0F3A.W1=
 cf /r ib","Valid","Valid","Invalid","AVX512VL GFNI","ModRM:reg (w)","EVEX.=
vvvv (r)","ModRM:r/m (r)","ib","Full","Computes inverse affine transformati=
on in the finite field GF(2^8)."
+"VGF2P8AFFINEINVQB ymm,ymm,ymm/m256,ib","VEX.256.66.0F3A.W1 cf /r ib","Val=
id","Valid","Invalid","AVX GFNI","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m =
(r)","ib","","Computes inverse affine transformation in the finite field GF=
(2^8)."
+"VGF2P8AFFINEINVQB ymm{k}{z},ymm,ymm/m256/m64bcst,ib","EVEX.256.66.0F3A.W1=
 cf /r ib","Valid","Valid","Invalid","AVX512VL GFNI","ModRM:reg (w)","EVEX.=
vvvv (r)","ModRM:r/m (r)","ib","Full","Computes inverse affine transformati=
on in the finite field GF(2^8)."
+"VGF2P8AFFINEINVQB zmm{k}{z},zmm,zmm/m512/m64bcst,ib","EVEX.512.66.0F3A.W1=
 cf /r ib","Valid","Valid","Invalid","AVX512F GFNI","ModRM:reg (w)","EVEX.v=
vvv (r)","ModRM:r/m (r)","ib","Full","Computes inverse affine transformatio=
n in the finite field GF(2^8)."
+"VGF2P8AFFINEQB xmm,xmm,xmm/m128,ib","VEX.128.66.0F3A.W1 ce /r ib","Valid"=
,"Valid","Invalid","AVX GFNI","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)=
","ib","","Computes affine transformation in the finite field GF(2^8)."
+"VGF2P8AFFINEQB xmm{k}{z},xmm,xmm/m128/m64bcst,ib","EVEX.128.66.0F3A.W1 ce=
 /r ib","Valid","Valid","Invalid","AVX512VL GFNI","ModRM:reg (w)","EVEX.vvv=
v (r)","ModRM:r/m (r)","ib","Full","Computes affine transformation in the f=
inite field GF(2^8)."
+"VGF2P8AFFINEQB ymm,ymm,ymm/m256,ib","VEX.256.66.0F3A.W1 ce /r ib","Valid"=
,"Valid","Invalid","AVX GFNI","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)=
","ib","","Computes affine transformation in the finite field GF(2^8)."
+"VGF2P8AFFINEQB ymm{k}{z},ymm,ymm/m256/m64bcst,ib","EVEX.256.66.0F3A.W1 ce=
 /r ib","Valid","Valid","Invalid","AVX512VL GFNI","ModRM:reg (w)","EVEX.vvv=
v (r)","ModRM:r/m (r)","ib","Full","Computes affine transformation in the f=
inite field GF(2^8)."
+"VGF2P8AFFINEQB zmm{k}{z},zmm,zmm/m512/m64bcst,ib","EVEX.512.66.0F3A.W1 ce=
 /r ib","Valid","Valid","Invalid","AVX512F GFNI","ModRM:reg (w)","EVEX.vvvv=
 (r)","ModRM:r/m (r)","ib","Full","Computes affine transformation in the fi=
nite field GF(2^8)."
+"VGF2P8MULB xmm,xmm,xmm/m128","VEX.128.66.0F38.W0 cf /r","Valid","Valid","=
Invalid","AVX GFNI","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","M=
ultiplies elements in the finite field GF(2^8)."
+"VGF2P8MULB xmm{k}{z},xmm,xmm/m128","EVEX.128.66.0F38.W0 cf /r","Valid","V=
alid","Invalid","AVX512VL GFNI","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m =
(r)","","Full","Multiplies elements in the finite field GF(2^8)."
+"VGF2P8MULB ymm,ymm,ymm/m256","VEX.256.66.0F38.W0 cf /r","Valid","Valid","=
Invalid","AVX GFNI","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","M=
ultiplies elements in the finite field GF(2^8)."
+"VGF2P8MULB ymm{k}{z},ymm,ymm/m256","EVEX.256.66.0F38.W0 cf /r","Valid","V=
alid","Invalid","AVX512VL GFNI","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m =
(r)","","Full","Multiplies elements in the finite field GF(2^8)."
+"VGF2P8MULB zmm{k}{z},zmm,zmm/m512","EVEX.512.66.0F38.W0 cf /r","Valid","V=
alid","Invalid","AVX512F GFNI","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (=
r)","","Full Mem","Multiplies elements in the finite field GF(2^8)."
diff --git a/disas/x86-data/x86_hreset.csv b/disas/x86-data/x86_hreset.csv
new file mode 100644
index 000000000000..5ee644846790
--- /dev/null
+++ b/disas/x86-data/x86_hreset.csv
@@ -0,0 +1,2 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"HRESET ib","LEX.F3.0F3A.W0 F0 C0 ib","Valid","Valid","Invalid","HRESET","=
ib","RAX (r)","","","","Processor history reset request. Controlled by the =
EAX implicit operand."
diff --git a/disas/x86-data/x86_invpcid.csv b/disas/x86-data/x86_invpcid.csv
new file mode 100644
index 000000000000..b09612909a21
--- /dev/null
+++ b/disas/x86-data/x86_invpcid.csv
@@ -0,0 +1,2 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"INVPCID r64, m128","LEX.66.0F38.W0 82 /r","Valid","Valid","Invalid","INVP=
CID","ModRM:reg (r)","ModRM:r/m (r, ModRM:[7:6] must not be 11b)","","","",=
"Invalidates entries in the TLBs and paging-structure caches based on inval=
idation type in r and descrip-tor in m128."
diff --git a/disas/x86-data/x86_lzcnt.csv b/disas/x86-data/x86_lzcnt.csv
new file mode 100644
index 000000000000..b9b2af7ed7c4
--- /dev/null
+++ b/disas/x86-data/x86_lzcnt.csv
@@ -0,0 +1,3 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"LZCNT rw, rw/mw","LEX.F3.0F.W0 BD /r","Valid","Valid","Valid","LZCNT","Mo=
dRM:reg (w)","ModRM:r/m (r)","","","","Count the number of leading zero bit=
s in r/m, return result in r."
+"LZCNT rw, rw/mw","LEX.F3.0F.W1 BD /r","Valid","Invalid","Invalid","LZCNT"=
,"ModRM:reg (w)","ModRM:r/m (r)","","","","Count the number of leading zero=
 bits in r/m, return result in r."
diff --git a/disas/x86-data/x86_mmx.csv b/disas/x86-data/x86_mmx.csv
new file mode 100644
index 000000000000..af9b2e9f7631
--- /dev/null
+++ b/disas/x86-data/x86_mmx.csv
@@ -0,0 +1,60 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"MOVD mm, rw/mw","LEX.0F.W0 6E /r","Valid","Valid","Invalid","MMX","ModRM:=
reg (w)","ModRM:r/m (r)","","","","Move doubleword from r/m to mm."
+"MOVD rw/mw, mm","LEX.0F.W0 7E /r","Valid","Valid","Invalid","MMX","ModRM:=
r/m (w)","ModRM:reg (r)","","","","Move doubleword from mm to r/m."
+"MOVQ mm, rw/mw","LEX.0F.W1 6E /r","Valid","Invalid","Invalid","MMX","ModR=
M:reg (w)","ModRM:r/m (r)","","","","Move quadword from r/m to mm."
+"MOVQ mm, mm/m64","LEX.0F.W0 6F /r","Valid","Valid","Invalid","MMX","ModRM=
:reg (w)","ModRM:r/m (r)","","","","Move quadword from mm/m64 to mm."
+"MOVQ rw/mw, mm","LEX.0F.W1 7E /r","Valid","Invalid","Invalid","MMX","ModR=
M:r/m (w)","ModRM:reg (r)","","","","Move quadword from mm to r/m."
+"MOVQ mm/m64, mm","LEX.0F.W0 7F /r","Valid","Valid","Invalid","MMX","ModRM=
:r/m (w)","ModRM:reg (r)","","","","Move quadword from mm to mm/m64."
+"PACKSSDW mm1, mm2/m64","LEX.0F.W0 6B /r","Valid","Valid","Invalid","MMX",=
"ModRM:reg (r, w)","ModRM:r/m (r)","","","","Converts 2 packed signed doubl=
eword integers from mm1 and from mm2/m64 into 4 packed signed word integers=
 in mm1 using signed saturation."
+"PACKSSWB mm1, mm2/m64","LEX.0F.W0 63 /r","Valid","Valid","Invalid","MMX",=
"ModRM:reg (r, w)","ModRM:r/m (r)","","","","Converts 4 packed signed word =
integers from mm1 and from mm2/m64 into 8 packed signed byte integers in mm=
1 using signed saturation."
+"PACKUSWB mm, mm/m64","LEX.0F.W0 67 /r","Valid","Valid","Invalid","MMX","M=
odRM:reg (r, w)","ModRM:r/m (r)","","","","Converts 4 signed word integers =
from mm and 4 signed word integers from mm/m64 into 8 unsigned byte integer=
s in mm using unsigned saturation."
+"PADDB mm, mm/m64","LEX.0F.W0 FC /r","Valid","Valid","Invalid","MMX","ModR=
M:reg (r, w)","ModRM:r/m (r)","","","","Add packed byte integers from mm/m6=
4 and mm."
+"PADDD mm, mm/m64","LEX.0F.W0 FE /r","Valid","Valid","Invalid","MMX","ModR=
M:reg (r, w)","ModRM:r/m (r)","","","","Add packed doubleword integers from=
 mm/m64 and mm."
+"PADDQ mm, mm/m64","LEX.0F.W0 D4 /r","Valid","Valid","Invalid","MMX","ModR=
M:reg (r, w)","ModRM:r/m (r)","","","","Add packed quadword integers from m=
m/m64 and mm."
+"PADDSB mm, mm/m64","LEX.0F.W0 EC /r","Valid","Valid","Invalid","MMX","Mod=
RM:reg (r, w)","ModRM:r/m (r)","","","","Add packed signed byte integers fr=
om mm/m64 and mm and saturate the results."
+"PADDSW mm, mm/m64","LEX.0F.W0 ED /r","Valid","Valid","Invalid","MMX","Mod=
RM:reg (r, w)","ModRM:r/m (r)","","","","Add packed signed word integers fr=
om mm/m64 and mm and saturate the results."
+"PADDUSB mm, mm/m64","LEX.0F.W0 DC /r","Valid","Valid","Invalid","MMX","Mo=
dRM:reg (r, w)","ModRM:r/m (r)","","","","Add packed unsigned byte integers=
 from mm/m64 and mm and saturate the results."
+"PADDUSW mm, mm/m64","LEX.0F.W0 DD /r","Valid","Valid","Invalid","MMX","Mo=
dRM:reg (r, w)","ModRM:r/m (r)","","","","Add packed unsigned word integers=
 from mm/m64 and mm and saturate the results."
+"PADDW mm, mm/m64","LEX.0F.W0 FD /r","Valid","Valid","Invalid","MMX","ModR=
M:reg (r, w)","ModRM:r/m (r)","","","","Add packed word integers from mm/m6=
4 and mm."
+"PAND mm, mm/m64","LEX.0F.W0 DB /r","Valid","Valid","Invalid","MMX","ModRM=
:reg (r, w)","ModRM:r/m (r)","","","","Bitwise AND mm/m64 and mm."
+"PANDN mm, mm/m64","LEX.0F.W0 DF /r","Valid","Valid","Invalid","MMX","ModR=
M:reg (r, w)","ModRM:r/m (r)","","","","Bitwise AND NOT of mm/m64 and mm."
+"PCMPEQB mm, mm/m64","LEX.0F.W0 74 /r","Valid","Valid","Invalid","MMX","Mo=
dRM:reg (r, w)","ModRM:r/m (r)","","","","Compare packed bytes in mm/m64 an=
d mm for equality."
+"PCMPEQD mm, mm/m64","LEX.0F.W0 76 /r","Valid","Valid","Invalid","MMX","Mo=
dRM:reg (r, w)","ModRM:r/m (r)","","","","Compare packed doublewords in mm/=
m64 and mm for equality."
+"PCMPEQW mm, mm/m64","LEX.0F.W0 75 /r","Valid","Valid","Invalid","MMX","Mo=
dRM:reg (r, w)","ModRM:r/m (r)","","","","Compare packed words in mm/m64 an=
d mm for equality."
+"PCMPGTB mm, mm/m64","LEX.0F.W0 64 /r","Valid","Valid","Invalid","MMX","Mo=
dRM:reg (r, w)","ModRM:r/m (r)","","","","Compare packed signed byte intege=
rs in mm and mm/m64 for greater than."
+"PCMPGTD mm, mm/m64","LEX.0F.W0 66 /r","Valid","Valid","Invalid","MMX","Mo=
dRM:reg (r, w)","ModRM:r/m (r)","","","","Compare packed signed doubleword =
integers in mm and mm/m64 for greater than."
+"PCMPGTW mm, mm/m64","LEX.0F.W0 65 /r","Valid","Valid","Invalid","MMX","Mo=
dRM:reg (r, w)","ModRM:r/m (r)","","","","Compare packed signed word intege=
rs in mm and mm/m64 for greater than."
+"PMADDWD mm, mm/m64","LEX.0F.W0 F5 /r","Valid","Valid","Invalid","MMX","Mo=
dRM:reg (r, w)","ModRM:r/m (r)","","","","Multiply the packed words in mm b=
y the packed words in mm/m64, add adjacent doubleword results, and store in=
 mm."
+"PMULHW mm, mm/m64","LEX.0F.W0 E5 /r","Valid","Valid","Invalid","MMX","Mod=
RM:reg (r, w)","ModRM:r/m (r)","","","","Multiply the packed signed word in=
tegers in mm1 register and mm2/m64, and store the high 16 bits of the resul=
ts in mm1."
+"PMULLW mm, mm/m64","LEX.0F.W0 D5 /r","Valid","Valid","Invalid","MMX","Mod=
RM:reg (r, w)","ModRM:r/m (r)","","","","Multiply the packed signed word in=
tegers in mm1 register and mm2/m64, and store the low 16 bits of the result=
s in mm1."
+"POR mm, mm/m64","LEX.0F.W0 EB /r","Valid","Valid","Invalid","MMX","ModRM:=
reg (r, w)","ModRM:r/m (r)","","","","Bitwise OR of mm/m64 and mm."
+"PSLLD mm, ib","LEX.0F.W0 72 /6 ib","Valid","Valid","Invalid","MMX","ModRM=
:r/m (r, w)","ib","","","","Shift doublewords in mm left by ib while shifti=
ng in 0s."
+"PSLLD mm, mm/m64","LEX.0F.W0 F2 /r","Valid","Valid","Invalid","MMX","ModR=
M:reg (r, w)","ModRM:r/m (r)","","","","Shift doublewords in mm left by mm/=
m64 while shifting in 0s."
+"PSLLQ mm, ib","LEX.0F.W0 73 /6 ib","Valid","Valid","Invalid","MMX","ModRM=
:r/m (r, w)","ib","","","","Shift quadword in mm left by ib while shifting =
in 0s."
+"PSLLQ mm, mm/m64","LEX.0F.W0 F3 /r","Valid","Valid","Invalid","MMX","ModR=
M:reg (r, w)","ModRM:r/m (r)","","","","Shift quadword in mm left by mm/m64=
 while shifting in 0s."
+"PSLLW mm1, ib","LEX.0F.W0 71 /6 ib","Valid","Valid","Invalid","MMX","ModR=
M:r/m (r, w)","ib","","","","Shift words in mm left by ib while shifting in=
 0s."
+"PSLLW mm, mm/m64","LEX.0F.W0 F1 /r","Valid","Valid","Invalid","MMX","ModR=
M:reg (r, w)","ModRM:r/m (r)","","","","Shift words in mm left mm/m64 while=
 shifting in 0s."
+"PSRAD mm, ib","LEX.0F.W0 72 /4 ib","Valid","Valid","Invalid","MMX","ModRM=
:r/m (r, w)","ib","","","","Shift doublewords in mm right by ib while shift=
ing in sign bits."
+"PSRAD mm, mm/m64","LEX.0F.W0 E2 /r","Valid","Valid","Invalid","MMX","ModR=
M:reg (r, w)","ModRM:r/m (r)","","","","Shift doublewords in mm right by mm=
/m64 while shifting in sign bits."
+"PSRAW mm, ib","LEX.0F.W0 71 /4 ib","Valid","Valid","Invalid","MMX","ModRM=
:r/m (r, w)","ib","","","","Shift words in mm right by ib while shifting in=
 sign bits"
+"PSRAW mm, mm/m64","LEX.0F.W0 E1 /r","Valid","Valid","Invalid","MMX","ModR=
M:reg (r, w)","ModRM:r/m (r)","","","","Shift words in mm right by mm/m64 w=
hile shifting in sign bits."
+"PSRLD mm, ib","LEX.0F.W0 72 /2 ib","Valid","Valid","Invalid","MMX","ModRM=
:r/m (r, w)","ib","","","","Shift doublewords in mm right by ib while shift=
ing in 0s."
+"PSRLD mm, mm/m64","LEX.0F.W0 D2 /r","Valid","Valid","Invalid","MMX","ModR=
M:reg (r, w)","ModRM:r/m (r)","","","","Shift doublewords in mm right by am=
ount specified in mm/m64 while shifting in 0s."
+"PSRLQ mm, ib","LEX.0F.W0 73 /2 ib","Valid","Valid","Invalid","MMX","ModRM=
:r/m (r, w)","ib","","","","Shift mm right by ib while shifting in 0s."
+"PSRLQ mm, mm/m64","LEX.0F.W0 D3 /r","Valid","Valid","Invalid","MMX","ModR=
M:reg (r, w)","ModRM:r/m (r)","","","","Shift mm right by amount specified =
in mm/m64 while shifting in 0s."
+"PSRLW mm, ib","LEX.0F.W0 71 /2 ib","Valid","Valid","Invalid","MMX","ModRM=
:r/m (r, w)","ib","","","","Shift words in mm right by ib while shifting in=
 0s."
+"PSRLW mm, mm/m64","LEX.0F.W0 D1 /r","Valid","Valid","Invalid","MMX","ModR=
M:reg (r, w)","ModRM:r/m (r)","","","","Shift words in mm right by amount s=
pecified in mm/m64 while shifting in 0s."
+"PSUBB mm, mm/m64","LEX.0F.W0 F8 /r","Valid","Valid","Invalid","MMX","ModR=
M:reg (r, w)","ModRM:r/m (r)","","","","Subtract packed byte integers in mm=
/m64 from packed byte integers in mm."
+"PSUBD mm, mm/m64","LEX.0F.W0 FA /r","Valid","Valid","Invalid","MMX","ModR=
M:reg (r, w)","ModRM:r/m (r)","","","","Subtract packed doubleword integers=
 in mm/m64 from packed doubleword integers in mm."
+"PSUBSB mm, mm/m64","LEX.0F.W0 E8 /r","Valid","Valid","Invalid","MMX","Mod=
RM:reg (r, w)","ModRM:r/m (r)","","","","Subtract signed packed bytes in mm=
/m64 from signed packed bytes in mm and saturate results."
+"PSUBSW mm, mm/m64","LEX.0F.W0 E9 /r","Valid","Valid","Invalid","MMX","Mod=
RM:reg (r, w)","ModRM:r/m (r)","","","","Subtract signed packed words in mm=
/m64 from signed packed words in mm and saturate results."
+"PSUBUSB mm, mm/m64","LEX.0F.W0 D8 /r","Valid","Valid","Invalid","MMX","Mo=
dRM:reg (r, w)","ModRM:r/m (r)","","","","Subtract unsigned packed bytes in=
 mm/m64 from unsigned packed bytes in mm and saturate result."
+"PSUBUSW mm, mm/m64","LEX.0F.W0 D9 /r","Valid","Valid","Invalid","MMX","Mo=
dRM:reg (r, w)","ModRM:r/m (r)","","","","Subtract unsigned packed words in=
 mm/m64 from unsigned packed words in mm and saturate result."
+"PSUBW mm, mm/m64","LEX.0F.W0 F9 /r","Valid","Valid","Invalid","MMX","ModR=
M:reg (r, w)","ModRM:r/m (r)","","","","Subtract packed word integers in mm=
/m64 from packed word integers in mm."
+"PUNPCKHBW mm, mm/m64","LEX.0F.W0 68 /r","Valid","Valid","Invalid","MMX","=
ModRM:reg (r, w)","ModRM:r/m (r)","","","","Unpack and interleave high-orde=
r bytes from mm and mm/m64 into mm."
+"PUNPCKHDQ mm, mm/m64","LEX.0F.W0 6A /r","Valid","Valid","Invalid","MMX","=
ModRM:reg (r, w)","ModRM:r/m (r)","","","","Unpack and interleave high-orde=
r doublewords from mm and mm/m64 into mm."
+"PUNPCKHWD mm, mm/m64","LEX.0F.W0 69 /r","Valid","Valid","Invalid","MMX","=
ModRM:reg (r, w)","ModRM:r/m (r)","","","","Unpack and interleave high-orde=
r words from mm and mm/m64 into mm."
+"PUNPCKLBW mm, mm/m32","LEX.0F.W0 60 /r","Valid","Valid","Invalid","MMX","=
ModRM:reg (r, w)","ModRM:r/m (r)","","","","Interleave low-order bytes from=
 mm and mm/m32 into mm."
+"PUNPCKLDQ mm, mm/m32","LEX.0F.W0 62 /r","Valid","Valid","Invalid","MMX","=
ModRM:reg (r, w)","ModRM:r/m (r)","","","","Interleave low-order doubleword=
s from mm and mm/m32 into mm."
+"PUNPCKLWD mm, mm/m32","LEX.0F.W0 61 /r","Valid","Valid","Invalid","MMX","=
ModRM:reg (r, w)","ModRM:r/m (r)","","","","Interleave low-order words from=
 mm and mm/m32 into mm."
+"PXOR mm, mm/m64","LEX.0F.W0 EF /r","Valid","Valid","Invalid","MMX","ModRM=
:reg (r, w)","ModRM:r/m (r)","","","","Bitwise XOR of mm/m64 and mm."
diff --git a/disas/x86-data/x86_movdir64b.csv b/disas/x86-data/x86_movdir64=
b.csv
new file mode 100644
index 000000000000..c177b1d6f98d
--- /dev/null
+++ b/disas/x86-data/x86_movdir64b.csv
@@ -0,0 +1,2 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"MOVDIR64B ra, m512","LEX.66.0F38.W0 F8 /r","Valid","Valid","Invalid","MOV=
DIR64B","ModRM:reg (w)","ModRM:r/m (r)","","","","Move 64-bytes as Direct S=
tore."
diff --git a/disas/x86-data/x86_movdiri.csv b/disas/x86-data/x86_movdiri.csv
new file mode 100644
index 000000000000..f6f6c4f7fc44
--- /dev/null
+++ b/disas/x86-data/x86_movdiri.csv
@@ -0,0 +1,3 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"MOVDIRI mw, rw","LEX.0F38.W0 F9 /r o32","Valid","Valid","Invalid","MOVDIR=
I","ModRM:r/m (w)","ModRM:reg (r)","","","","Move doubleword as Direct Stor=
e."
+"MOVDIRI mw, rw","LEX.0F38.W1 F9 /r o64","Valid","Valid","Invalid","MOVDIR=
I","ModRM:r/m (w)","ModRM:reg (r)","","","","Move quadword as Direct Store."
diff --git a/disas/x86-data/x86_mpx.csv b/disas/x86-data/x86_mpx.csv
new file mode 100644
index 000000000000..ebe7c6cebf10
--- /dev/null
+++ b/disas/x86-data/x86_mpx.csv
@@ -0,0 +1,9 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"BNDCL bnd, rw/mw","LEX.F3.0F.W0 1A /r","Valid","Valid","Invalid","MPX","M=
odRM:reg (w)","ModRM:r/m (r)","","","","Generate a #BR if the address in r/=
m is lower than the lower bound in bnd.LB."
+"BNDCN bnd, rw/mw","LEX.F2.0F.W0 1B /r","Valid","Valid","Invalid","MPX","M=
odRM:reg (w)","ModRM:r/m (r)","","","","Generate a #BR if the address in r/=
m is higher than the upper bound in bnd.UB (bnb.UB not in 1's complement fo=
rm)."
+"BNDCU bnd, rw/mw","LEX.F2.0F.W0 1A /r","Valid","Valid","Invalid","MPX","M=
odRM:reg (w)","ModRM:r/m (r)","","","","Generate a #BR if the address in r/=
m is higher than the upper bound in bnd.UB (bnb.UB in 1's complement form)."
+"BNDLDX bnd, mib","LEX.0F.W0 1A /r","Valid","Valid","Invalid","MPX","ModRM=
:reg (w)","SIB.base (r): Address of pointer SIB.index (r)","","","","Load t=
he bounds stored in a bound table entry (BTE) into bnd with address transla=
tion using the base of mib and conditional on the index of mib matching the=
 pointer value in the BTE."
+"BNDMK bnd, mem","LEX.F3.0F.W0 1B /r","Valid","Valid","Invalid","MPX","Mod=
RM:reg (w)","ModRM:r/m (r, ModRM:[7:6] must not be 11b)","","","","Make low=
er and upper bounds from m32 and store them in bnd."
+"BNDMOV bnd, bnd/mem","LEX.66.0F.W0 1A /r","Valid","Valid","Invalid","MPX"=
,"ModRM:reg (w)","ModRM:r/m (r)","","","","Move lower and upper bound from =
bnd2/m64 to bound register bnd1."
+"BNDMOV bnd/mem, bnd","LEX.66.0F.W0 1B /r","Valid","Valid","Invalid","MPX"=
,"ModRM:r/m (w)","ModRM:reg (r)","","","","Move lower and upper bound from =
bnd2 to bnd1/m64."
+"BNDSTX mib, bnd","LEX.0F.W0 1B /r","Valid","Valid","Invalid","MPX","SIB.b=
ase (r): Address of pointer SIB.index (r)","ModRM:reg (r)","","","","Store =
the bounds in bnd and the pointer value in the index register of mib to a b=
ound table entry (BTE) with address translation using the base of mib."
diff --git a/disas/x86-data/x86_msrlist.csv b/disas/x86-data/x86_msrlist.csv
new file mode 100644
index 000000000000..0c94ba6470a8
--- /dev/null
+++ b/disas/x86-data/x86_msrlist.csv
@@ -0,0 +1,4 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"RDMSRLIST","LEX.F2.0F.W0 01 C6","Valid","Valid","Invalid","MSRLIST","RDI =
(r)","RSI (r)","RCX (r)","","","Read the requested list of MSRs, and store =
the read values to memory."
+"WRMSRLIST","LEX.F3.0F.W0 01 C6","Valid","Valid","Invalid","MSRLIST","RDI =
(r)","RSI (r)","RCX (r)","","","Write requested list of MSRs with the value=
s specified in memory."
+"WRMSRNS","LEX.0F.W0 01 C6","Valid","Valid","Invalid","MSRLIST","RDX (r)",=
"RAX (r)","RCX (r)","","","Write the value in EDX:EAX to MSR specified by E=
CX."
diff --git a/disas/x86-data/x86_ospke.csv b/disas/x86-data/x86_ospke.csv
new file mode 100644
index 000000000000..99247830b63e
--- /dev/null
+++ b/disas/x86-data/x86_ospke.csv
@@ -0,0 +1,3 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"RDPKRU","LEX.0F.W0 01 EE","Valid","Valid","Valid","OSPKE","","","","","",=
"Reads PKRU into EAX."
+"WRPKRU","LEX.0F.W0 01 EF","Valid","Valid","Valid","OSPKE","","","","","",=
"Writes EAX into PKRU."
diff --git a/disas/x86-data/x86_pclmulqdq.csv b/disas/x86-data/x86_pclmulqd=
q.csv
new file mode 100644
index 000000000000..723d959fe9d4
--- /dev/null
+++ b/disas/x86-data/x86_pclmulqdq.csv
@@ -0,0 +1,3 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"PCLMULQDQ xmm1, xmm2/m128, ib","LEX.66.0F3A.W0 44 /r ib","Valid","Valid",=
"Invalid","PCLMULQDQ","ModRM:reg (r, w)","ModRM:r/m (r)","ib","","","Carry-=
less multiplication of one quadword of xmm1 by one quadword of xmm2/m128, s=
tores the 128-bit result in xmm1. The immediate is used to determine which =
quadwords of xmm1 and xmm2/m128 should be used."
+"VPCLMULQDQ xmm1, xmm2, xmm3/m128, ib","VEX.128.66.0F3A.WIG 44 /r ib","Val=
id","Valid","Invalid","PCLMULQDQ AVX","ModRM:reg (w)","VEX.vvvv (r)","ModRM=
:r/m (r)","ib","","Carry-less multiplication of one quadword of xmm2 by one=
 quadword of xmm3/m128, stores the 128-bit result in xmm1. The immediate is=
 used to determine which quadwords of xmm2 and xmm3/m128 should be used."
diff --git a/disas/x86-data/x86_pconfig.csv b/disas/x86-data/x86_pconfig.csv
new file mode 100644
index 000000000000..edc2fa9b7c0e
--- /dev/null
+++ b/disas/x86-data/x86_pconfig.csv
@@ -0,0 +1,2 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"PCONFIG","LEX.0F.W0 01 c5","Valid","Valid","Invalid","PCONFIG","","","","=
","","This instruction is used to execute functions for configuring platfor=
m features."
diff --git a/disas/x86-data/x86_prefetchw.csv b/disas/x86-data/x86_prefetch=
w.csv
new file mode 100644
index 000000000000..b4c6f4338b06
--- /dev/null
+++ b/disas/x86-data/x86_prefetchw.csv
@@ -0,0 +1,7 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"PREFETCHNTA m8","LEX.0F.W0 18 /0","Valid","Valid","Valid","PREFETCHW","Mo=
dRM:r/m (r)","","","","","Move data from m8 closer to the processor using N=
TA hint."
+"PREFETCHT0 m8","LEX.0F.W0 18 /1","Valid","Valid","Valid","PREFETCHW","Mod=
RM:r/m (r)","","","","","Move data from m8 closer to the processor using T0=
 hint."
+"PREFETCHT1 m8","LEX.0F.W0 18 /2","Valid","Valid","Valid","PREFETCHW","Mod=
RM:r/m (r)","","","","","Move data from m8 closer to the processor using T1=
 hint."
+"PREFETCHT2 m8","LEX.0F.W0 18 /3","Valid","Valid","Valid","PREFETCHW","Mod=
RM:r/m (r)","","","","","Move data from m8 closer to the processor using T2=
 hint."
+"PREFETCHW m8","LEX.0F.W0 0D /1","Valid","Valid","Invalid","PREFETCHW","Mo=
dRM:r/m (r)","","","","","Move data from m8 closer to the processor in anti=
cipation of a write."
+"PREFETCHWT1 m8","LEX.0F.W0 0D /2","Valid","Valid","Invalid","PREFETCHW","=
ModRM:r/m (r)","","","","","Move data from m8 closer to the processor using=
 T1 hint with intent to write."
diff --git a/disas/x86-data/x86_raoint.csv b/disas/x86-data/x86_raoint.csv
new file mode 100644
index 000000000000..7a6dea2fe716
--- /dev/null
+++ b/disas/x86-data/x86_raoint.csv
@@ -0,0 +1,9 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"AADD mw, rw","LEX.0F38.W0 fc /r","Valid","Valid","Invalid","RAOINT","ModR=
M:r/m (r, w, ModRM:[7:6] must not be 11b)","ModRM:reg (r)","","","","Atomic=
ally Add."
+"AADD mw, rw","LEX.0F38.W1 fc /r","Valid","Invalid","Invalid","RAOINT","Mo=
dRM:r/m (r, w, ModRM:[7:6] must not be 11b)","ModRM:reg (r)","","","","Atom=
ically Add."
+"AAND mw, rw","LEX.66.0F38.W0 fc /r","Valid","Valid","Invalid","RAOINT","M=
odRM:r/m (r, w, ModRM:[7:6] must not be 11b)","ModRM:reg (r)","","","","Ato=
mically AND."
+"AAND mw, rw","LEX.66.0F38.W1 fc /r","Valid","Invalid","Invalid","RAOINT",=
"ModRM:r/m (r, w, ModRM:[7:6] must not be 11b)","ModRM:reg (r)","","","","A=
tomically AND."
+"AOR mw, rw","LEX.F2.0F38.W0 fc /r","Valid","Valid","Invalid","RAOINT","Mo=
dRM:r/m (r, w, ModRM:[7:6] must not be 11b)","ModRM:reg (r)","","","","Atom=
ically OR."
+"AOR mw, rw","LEX.F2.0F38.W1 fc /r","Valid","Invalid","Invalid","RAOINT","=
ModRM:r/m (r, w, ModRM:[7:6] must not be 11b)","ModRM:reg (r)","","","","At=
omically OR."
+"AXOR mw, rw","LEX.F3.0F38.W0 fc /r","Valid","Valid","Invalid","RAOINT","M=
odRM:r/m (r, w, ModRM:[7:6] must not be 11b)","ModRM:reg (r)","","","","Ato=
mically XOR."
+"AXOR mw, rw","LEX.F3.0F38.W1 fc /r","Valid","Invalid","Invalid","RAOINT",=
"ModRM:r/m (r, w, ModRM:[7:6] must not be 11b)","ModRM:reg (r)","","","","A=
tomically XOR."
diff --git a/disas/x86-data/x86_rdpid.csv b/disas/x86-data/x86_rdpid.csv
new file mode 100644
index 000000000000..ecf7a2e7b052
--- /dev/null
+++ b/disas/x86-data/x86_rdpid.csv
@@ -0,0 +1,2 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"RDPID rw","LEX.F3.0F.W0 C7 /7","Valid","Valid","Invalid","RDPID","ModRM:r=
/m (w)","","","","","Read IA32_TSC_AUX into r."
diff --git a/disas/x86-data/x86_rdrand.csv b/disas/x86-data/x86_rdrand.csv
new file mode 100644
index 000000000000..d2ed1147d47b
--- /dev/null
+++ b/disas/x86-data/x86_rdrand.csv
@@ -0,0 +1,2 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"RDRAND rw","LEX.0F.WX C7 /6","Valid","Valid","Invalid","RDRAND","ModRM:r/=
m (w)","","","","","Read a 16/32/64-bit random number and store in the dest=
ination register."
diff --git a/disas/x86-data/x86_rdseed.csv b/disas/x86-data/x86_rdseed.csv
new file mode 100644
index 000000000000..d884a9d4d620
--- /dev/null
+++ b/disas/x86-data/x86_rdseed.csv
@@ -0,0 +1,2 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"RDSEED rw","LEX.0F.WX C7 /7","Valid","Valid","Invalid","RDSEED","ModRM:r/=
m (w)","","","","","Read a 16/32/64-bit NIST SP800-90B & C compliant random=
 value and store in the destination register."
diff --git a/disas/x86-data/x86_rtm.csv b/disas/x86-data/x86_rtm.csv
new file mode 100644
index 000000000000..a358aadba6ef
--- /dev/null
+++ b/disas/x86-data/x86_rtm.csv
@@ -0,0 +1,5 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"XABORT ib","LEX.WN C6 F8 ib","Valid","Valid","Invalid","RTM","ib","","","=
","","Causes an RTM abort if in RTM execution"
+"XBEGIN relw","LEX.WN C7 F8 iw","Valid","Valid","Invalid","RTM","iw","",""=
,"","","Specifies the start of an RTM region. Provides a 32-bit relative of=
fset to compute the address of the fallback instruction address at which ex=
ecution resumes following an RTM abort."
+"XEND","LEX.0F.W0 01 D5","Valid","Valid","Invalid","RTM","","","","","","S=
pecifies the end of an RTM code region."
+"XTEST","LEX.0F.W0 01 D6","Valid","Valid","Invalid","HLE RTM","","","","",=
"","Test if executing in a transactional region"
diff --git a/disas/x86-data/x86_serialize.csv b/disas/x86-data/x86_serializ=
e.csv
new file mode 100644
index 000000000000..5e5d1c2544a8
--- /dev/null
+++ b/disas/x86-data/x86_serialize.csv
@@ -0,0 +1,2 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"SERIALIZE","LEX.0F.W0 01 E8","Valid","Valid","Invalid","SERIALIZE","","",=
"","","","Serializes instruction execution."
diff --git a/disas/x86-data/x86_sha.csv b/disas/x86-data/x86_sha.csv
new file mode 100644
index 000000000000..de9f5331ce76
--- /dev/null
+++ b/disas/x86-data/x86_sha.csv
@@ -0,0 +1,8 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"SHA1MSG1 xmm1, xmm2/m128","LEX.0F38.W0 C9 /r","Valid","Valid","Invalid","=
SHA","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Performs an intermediate =
calculation for the next four SHA1 message dwords using previous message dw=
ords from xmm1 and xmm2/m128, storing the result in xmm1."
+"SHA1MSG2 xmm1, xmm2/m128","LEX.0F38.W0 CA /r","Valid","Valid","Invalid","=
SHA","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Performs the final calcul=
ation for the next four SHA1 message dwords using intermediate results from=
 xmm1 and the previous message dwords from xmm2/m128, storing the result in=
 xmm1."
+"SHA1NEXTE xmm1, xmm2/m128","LEX.0F38.W0 C8 /r","Valid","Valid","Invalid",=
"SHA","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Calculates SHA1 state va=
riable E after four rounds of operation from the current SHA1 state variabl=
e A in xmm1. The calculated value of the SHA1 state variable E is added to =
the scheduled dwords in xmm2/m128, and stored with some of the scheduled dw=
ords in xmm1."
+"SHA1RNDS4 xmm1, xmm2/m128, ib","LEX.0F3A.W0 CC /r ib","Valid","Valid","In=
valid","SHA","ModRM:reg (r, w)","ModRM:r/m (r)","ib","","","Performs four r=
ounds of SHA1 operation operating on SHA1 state (A,B,C,D) from xmm1, with a=
 pre-computed sum of the next 4 round message dwords and state variable E f=
rom xmm2/m128. The immediate byte controls logic functions and round consta=
nts."
+"SHA256MSG1 xmm1, xmm2/m128","LEX.0F38.W0 CC /r","Valid","Valid","Invalid"=
,"SHA","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Performs an intermediat=
e calculation for the next four SHA256 message dwords using previous messag=
e dwords from xmm1 and xmm2/m128, storing the result in xmm1."
+"SHA256MSG2 xmm1, xmm2/m128","LEX.0F38.W0 CD /r","Valid","Valid","Invalid"=
,"SHA","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Performs the final calc=
ulation for the next four SHA256 message dwords using previous message dwor=
ds from xmm1 and xmm2/m128, storing the result in xmm1."
+"SHA256RNDS2 xmm1, xmm2/m128, <XMM0>","LEX.0F38.W0 CB /r","Valid","Valid",=
"Invalid","SHA","ModRM:reg (r, w)","ModRM:r/m (r)","Implicit XMM0 (r)","","=
","Perform 2 rounds of SHA256 operation using an initial SHA256 state (C,D,=
G,H) from xmm1, an initial SHA256 state (A,B,E,F) from xmm2/m128, and a pre=
-computed sum of the next 2 round mes-sage dwords and the corresponding rou=
nd constants from the implicit operand XMM0, storing the updated SHA256 sta=
te (A,B,E,F) result in xmm1."
diff --git a/disas/x86-data/x86_smap.csv b/disas/x86-data/x86_smap.csv
new file mode 100644
index 000000000000..e4e9b06a420e
--- /dev/null
+++ b/disas/x86-data/x86_smap.csv
@@ -0,0 +1,3 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"CLAC","LEX.0F.W0 01 CA","Valid","Valid","Invalid","SMAP","","","","","","=
Clear the AC flag in the EFLAGS register."
+"STAC","LEX.0F.W0 01 CB","Valid","Valid","Invalid","SMAP","","","","","","=
Set the AC flag in the EFLAGS register."
diff --git a/disas/x86-data/x86_sse.csv b/disas/x86-data/x86_sse.csv
new file mode 100644
index 000000000000..2d9c84a4ab0b
--- /dev/null
+++ b/disas/x86-data/x86_sse.csv
@@ -0,0 +1,58 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"ADDPS xmm1, xmm2/m128","LEX.0F.W0 58 /r","Valid","Valid","Invalid","SSE",=
"ModRM:reg (r, w)","ModRM:r/m (r)","","","","Add packed single-precision fl=
oating-point values from xmm2/m128 to xmm1 and store result in xmm1."
+"ADDSS xmm1, xmm2/m32","LEX.F3.0F.W0 58 /r","Valid","Valid","Invalid","SSE=
","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Add the low single-precision=
 floating-point value from xmm2/mem to xmm1 and store the result in xmm1."
+"ANDNPS xmm1, xmm2/m128","LEX.0F.W0 55 /r","Valid","Valid","Invalid","SSE"=
,"ModRM:reg (r, w)","ModRM:r/m (r)","","","","Return the bitwise logical AN=
D NOT of packed single-precision floating-point values in xmm1 and xmm2/mem=
."
+"ANDPS xmm1, xmm2/m128","LEX.0F.W0 54 /r","Valid","Valid","Invalid","SSE",=
"ModRM:reg (r, w)","ModRM:r/m (r)","","","","Return the bitwise logical AND=
 of packed single-precision floating-point values in xmm1 and xmm2/mem."
+"CMPPS xmm1, xmm2/m128, ib","LEX.0F.W0 C2 /r ib","Valid","Valid","Invalid"=
,"SSE","ModRM:reg (r, w)","ModRM:r/m (r)","ib","","","Compare packed single=
-precision floating-point values in xmm2/m128 and xmm1 using bits 2:0 of ib=
 as a comparison predicate."
+"CMPSS xmm1, xmm2/m32, ib","LEX.F3.0F.W0 C2 /r ib","Valid","Valid","Invali=
d","SSE","ModRM:reg (r, w)","ModRM:r/m (r)","ib","","","Compare low single-=
precision floating-point value in xmm2/m32 and xmm1 using bits 2:0 of ib as=
 comparison predicate."
+"COMISS xmm1, xmm2/m32","LEX.0F.W0 2F /r","Valid","Valid","Invalid","SSE",=
"ModRM:reg (r)","ModRM:r/m (r)","","","","Compare low single-precision floa=
ting-point values in xmm1 and xmm2/mem32 and set the EFLAGS flags according=
ly."
+"DIVPS xmm1, xmm2/m128","LEX.0F.W0 5E /r","Valid","Valid","Invalid","SSE",=
"ModRM:reg (r, w)","ModRM:r/m (r)","","","","Divide packed single-precision=
 floating-point values in xmm1 by packed single-precision floating-point va=
lues in xmm2/mem."
+"DIVSS xmm1, xmm2/m32","LEX.F3.0F.W0 5E /r","Valid","Valid","Invalid","SSE=
","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Divide low single-precision =
floating-point value in xmm1 by low single-precision floating-point value i=
n xmm2/m32."
+"LDMXCSR m32","LEX.0F.W0 AE /2","Valid","Valid","Invalid","SSE","ModRM:r/m=
 (r, ModRM:[7:6] must not be 11b)","","","","","Load MXCSR register from m3=
2."
+"MAXPS xmm1, xmm2/m128","LEX.0F.W0 5F /r","Valid","Valid","Invalid","SSE",=
"ModRM:reg (r, w)","ModRM:r/m (r)","","","","Return the maximum single-prec=
ision floating-point values between xmm1 and xmm2/mem."
+"MAXSS xmm1, xmm2/m32","LEX.F3.0F.W0 5F /r","Valid","Valid","Invalid","SSE=
","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Return the maximum scalar si=
ngle-precision floating-point value between xmm2/m32 and xmm1."
+"MINPS xmm1, xmm2/m128","LEX.0F.W0 5D /r","Valid","Valid","Invalid","SSE",=
"ModRM:reg (r, w)","ModRM:r/m (r)","","","","Return the minimum single-prec=
ision floating-point values between xmm1 and xmm2/mem."
+"MINSS xmm1, xmm2/m32","LEX.F3.0F.W0 5D /r","Valid","Valid","Invalid","SSE=
","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Return the minimum scalar si=
ngle-precision floating-point value between xmm2/m32 and xmm1."
+"MOVAPS xmm1, xmm2/m128","LEX.0F.W0 28 /r","Valid","Valid","Invalid","SSE"=
,"ModRM:reg (w)","ModRM:r/m (r)","","","","Move aligned packed single-preci=
sion floating-point values from xmm2/mem to xmm1."
+"MOVAPS xmm2/m128, xmm1","LEX.0F.W0 29 /r","Valid","Valid","Invalid","SSE"=
,"ModRM:r/m (w)","ModRM:reg (r)","","","","Move aligned packed single-preci=
sion floating-point values from xmm1 to xmm2/mem."
+"MOVHLPS xmm1, xmm2","LEX.0F.W0 12 /r","Valid","Valid","Invalid","SSE","Mo=
dRM:reg (w)","ModRM:r/m (r)","","","","Move two packed single-precision flo=
ating-point values from high quadword of xmm2 to low quadword of xmm1."
+"MOVHPS xmm1, m64","LEX.0F.W0 16 /r","Valid","Valid","Invalid","SSE","ModR=
M:reg (r, w)","ModRM:r/m (r)","","","","Move two packed single-precision fl=
oating-point values from m64 to high quadword of xmm1."
+"MOVHPS m64, xmm1","LEX.0F.W0 17 /r","Valid","Valid","Invalid","SSE","ModR=
M:r/m (w)","ModRM:reg (r)","","","","Move two packed single-precision float=
ing-point values from high quadword of xmm1 to m64."
+"MOVLHPS xmm1, xmm2","LEX.0F.W0 16 /r","Valid","Valid","Invalid","SSE","Mo=
dRM:reg (w)","ModRM:r/m (r)","","","","Move two packed single-precision flo=
ating-point values from low quadword of xmm2 to high quadword of xmm1."
+"MOVLPS xmm1, m64","LEX.0F.W0 12 /r","Valid","Valid","Invalid","SSE","ModR=
M:reg (r, w)","ModRM:r/m (r)","","","","Move two packed single-precision fl=
oating-point values from m64 to low quadword of xmm1."
+"MOVLPS m64, xmm1","LEX.0F.W0 13 /r","Valid","Valid","Invalid","SSE","ModR=
M:r/m (w)","ModRM:reg (r)","","","","Move two packed single-precision float=
ing-point values from low quadword of xmm1 to m64."
+"MOVMSKPS rw, xmm","LEX.0F.W0 50 /r","Valid","Valid","Invalid","SSE","ModR=
M:reg (w)","ModRM:r/m (r)","","","","Extract 4-bit sign mask from xmm and s=
tore in reg. The upper bits of r are are zeroed."
+"MOVNTPS m128, xmm1","LEX.0F.W0 2B /r","Valid","Valid","Invalid","SSE","Mo=
dRM:r/m (w)","ModRM:reg (r)","","","","Move packed single-precision values =
xmm1 to mem using non-temporal hint."
+"MOVSS xmm1, m32","LEX.F3.0F.W0 10 /r","Valid","Valid","Invalid","SSE","Mo=
dRM:reg (r, w)","ModRM:r/m (r)","","","","Load scalar single-precision floa=
ting-point value from m32 to xmm1 register."
+"MOVSS xmm1, xmm2","LEX.F3.0F.W0 10 /r","Valid","Valid","Invalid","SSE","M=
odRM:reg (r, w)","ModRM:r/m (r)","","","","Merge scalar single-precision fl=
oating-point value from xmm2 to xmm1 register."
+"MOVSS xmm2/m32, xmm1","LEX.F3.0F.W0 11 /r","Valid","Valid","Invalid","SSE=
","ModRM:r/m (w)","ModRM:reg (r)","","","","Move scalar single-precision fl=
oating-point value from xmm1 register to xmm2/m32."
+"MOVUPS xmm1, xmm2/m128","LEX.0F.W0 10 /r","Valid","Valid","Invalid","SSE"=
,"ModRM:reg (w)","ModRM:r/m (r)","","","","Move unaligned packed single-pre=
cision floating-point from xmm2/mem to xmm1."
+"MOVUPS xmm2/m128, xmm1","LEX.0F.W0 11 /r","Valid","Valid","Invalid","SSE"=
,"ModRM:r/m (w)","ModRM:reg (r)","","","","Move unaligned packed single-pre=
cision floating-point from xmm1 to xmm2/mem."
+"MULPS xmm1, xmm2/m128","LEX.0F.W0 59 /r","Valid","Valid","Invalid","SSE",=
"ModRM:reg (r, w)","ModRM:r/m (r)","","","","Multiply packed single-precisi=
on floating-point values in xmm2/m128 with xmm1 and store result in xmm1."
+"MULSS xmm1, xmm2/m32","LEX.F3.0F.W0 59 /r","Valid","Valid","Invalid","SSE=
","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Multiply the low single-prec=
ision floating-point value in xmm2/m32 by the low single-precision floating=
-point value in xmm1."
+"ORPS xmm1, xmm2/m128","LEX.0F.W0 56 /r","Valid","Valid","Invalid","SSE","=
ModRM:reg (r, w)","ModRM:r/m (r)","","","","Return the bitwise logical OR o=
f packed single-precision floating-point values in xmm1 and xmm2/mem."
+"PAVGB mm1, mm2/m64","LEX.0F.W0 E0 /r","Valid","Valid","Invalid","SSE","Mo=
dRM:reg (r, w)","ModRM:r/m (r)","","","","Average packed unsigned byte inte=
gers from mm2/m64 and mm1 with rounding."
+"PAVGW mm1, mm2/m64","LEX.0F.W0 E3 /r","Valid","Valid","Invalid","SSE","Mo=
dRM:reg (r, w)","ModRM:r/m (r)","","","","Average packed unsigned word inte=
gers from mm2/m64 and mm1 with rounding."
+"PEXTRW r32, mm, ib","LEX.0F.W0 C5 /r ib","Valid","Valid","Invalid","SSE",=
"ModRM:reg (w)","ModRM:r/m (r)","ib","","","Extract the word specified by i=
b from mm and move it to reg, bits 15-0. The upper bits of r are zeroed."
+"PINSRW mm, r32/m16, ib","LEX.0F.W0 C4 /r ib","Valid","Valid","Invalid","S=
SE","ModRM:reg (w)","ModRM:r/m (r)","ib","","","Insert the low word from r3=
2 or from m16 into mm at the word position specified by ib."
+"PMAXSW mm1, mm2/m64","LEX.0F.W0 EE /r","Valid","Valid","Invalid","SSE","M=
odRM:reg (r, w)","ModRM:r/m (r)","","","","Compare signed word integers in =
mm2/m64 and mm1 and return maximum values."
+"PMAXUB mm1, mm2/m64","LEX.0F.W0 DE /r","Valid","Valid","Invalid","SSE","M=
odRM:reg (r, w)","ModRM:r/m (r)","","","","Compare unsigned byte integers i=
n mm2/m64 and mm1 and returns maximum values."
+"PMINSW mm1, mm2/m64","LEX.0F.W0 EA /r","Valid","Valid","Invalid","SSE","M=
odRM:reg (r, w)","ModRM:r/m (r)","","","","Compare signed word integers in =
mm2/m64 and mm1 and return minimum values."
+"PMINUB mm1, mm2/m64","LEX.0F.W0 DA /r","Valid","Valid","Invalid","SSE","M=
odRM:reg (r, w)","ModRM:r/m (r)","","","","Compare unsigned byte integers i=
n mm2/m64 and mm1 and returns minimum values."
+"PMOVMSKB r32, mm","LEX.0F.W0 D7 /r","Valid","Valid","Invalid","SSE","ModR=
M:reg (w)","ModRM:r/m (r)","","","","Move a byte mask of mm to reg. The upp=
er bits of r are zeroed"
+"PMULHUW mm1, mm2/m64","LEX.0F.W0 E4 /r","Valid","Valid","Invalid","SSE","=
ModRM:reg (r, w)","ModRM:r/m (r)","","","","Multiply the packed unsigned wo=
rd integers in mm1 register and mm2/m64, and store the high 16 bits of the =
results in mm1."
+"PSADBW mm1, mm2/m64","LEX.0F.W0 F6 /r","Valid","Valid","Invalid","SSE","M=
odRM:reg (r, w)","ModRM:r/m (r)","","","","Computes the absolute difference=
s of the packed unsigned byte integers from mm2 /m64 and mm1; differences a=
re then summed to produce an unsigned word integer result."
+"RCPPS xmm1, xmm2/m128","LEX.0F.W0 53 /r","Valid","Valid","Invalid","SSE",=
"ModRM:reg (w)","ModRM:r/m (r)","","","","Computes the approximate reciproc=
als of the packed single-precision floating-point values in xmm2/m128 and s=
tores the results in xmm1."
+"RCPSS xmm1, xmm2/m32","LEX.F3.0F.W0 53 /r","Valid","Valid","Invalid","SSE=
","ModRM:reg (w)","ModRM:r/m (r)","","","","Computes the approximate recipr=
ocal of the scalar single-precision floating-point value in xmm2/m32 and st=
ores the result in xmm1."
+"RSQRTPS xmm1, xmm2/m128","LEX.0F.W0 52 /r","Valid","Valid","Invalid","SSE=
","ModRM:reg (w)","ModRM:r/m (r)","","","","Computes the approximate recipr=
ocals of the square roots of the packed single-precision floating-point val=
ues in xmm2/m128 and stores the results in xmm1."
+"RSQRTSS xmm1, xmm2/m32","LEX.F3.0F.W0 52 /r","Valid","Valid","Invalid","S=
SE","ModRM:reg (w)","ModRM:r/m (r)","","","","Computes the approximate reci=
procal of the square root of the low single-precision floating-point value =
in xmm2/m32 and stores the results in xmm1."
+"SHUFPS xmm1, xmm3/m128, ib","LEX.0F.W0 C6 /r ib","Valid","Valid","Invalid=
","SSE","ModRM:reg (r, w)","ModRM:r/m (r)","ib","","","Select from quadrupl=
et of single-precision floating-point values in xmm1 and xmm2/m128 using ib=
, interleaved result pairs are stored in xmm1."
+"SQRTPS xmm1, xmm2/m128","LEX.0F.W0 51 /r","Valid","Valid","Invalid","SSE"=
,"ModRM:reg (w)","ModRM:r/m (r)","","","","Computes Square Roots of the pac=
ked single-precision floating-point values in xmm2/m128 and stores the resu=
lt in xmm1."
+"SQRTSS xmm1, xmm2/m32","LEX.F3.0F.W0 51 /r","Valid","Valid","Invalid","SS=
E","ModRM:reg (w)","ModRM:r/m (r)","","","","Computes square root of the lo=
w single-precision floating-point value in xmm2/m32 and stores the results =
in xmm1."
+"STMXCSR m32","LEX.0F.W0 AE /3","Valid","Valid","Invalid","SSE","ModRM:r/m=
 (w, ModRM:[7:6] must not be 11b)","","","","","Store contents of MXCSR reg=
ister to m32."
+"SUBPS xmm1, xmm2/m128","LEX.0F.W0 5C /r","Valid","Valid","Invalid","SSE",=
"ModRM:reg (r, w)","ModRM:r/m (r)","","","","Subtract packed single-precisi=
on floating-point values in xmm2/mem from xmm1 and store result in xmm1."
+"SUBSS xmm1, xmm2/m32","LEX.F3.0F.W0 5C /r","Valid","Valid","Invalid","SSE=
","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Subtract the low single-prec=
ision floating-point value in xmm2/m32 from xmm1 and store the result in xm=
m1."
+"UCOMISS xmm1, xmm2/m32","LEX.0F.W0 2E /r","Valid","Valid","Invalid","SSE"=
,"ModRM:reg (r)","ModRM:r/m (r)","","","","Compare low single-precision flo=
ating-point values in xmm1 and xmm2/mem32 and set the EFLAGS flags accordin=
gly."
+"UNPCKHPS xmm1, xmm2/m128","LEX.0F.W0 15 /r","Valid","Valid","Invalid","SS=
E","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Unpacks and Interleaves sin=
gle-precision floating-point values from high quadwords of xmm1 and xmm2/m1=
28."
+"UNPCKLPS xmm1, xmm2/m128","LEX.0F.W0 14 /r","Valid","Valid","Invalid","SS=
E","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Unpacks and Interleaves sin=
gle-precision floating-point values from low quadwords of xmm1 and xmm2/m12=
8."
+"XORPS xmm1, xmm2/m128","LEX.0F.W0 57 /r","Valid","Valid","Invalid","SSE",=
"ModRM:reg (r, w)","ModRM:r/m (r)","","","","Return the bitwise logical XOR=
 of packed single-precision floating-point values in xmm1 and xmm2/mem."
diff --git a/disas/x86-data/x86_sse2.csv b/disas/x86-data/x86_sse2.csv
new file mode 100644
index 000000000000..c43aa4e77c65
--- /dev/null
+++ b/disas/x86-data/x86_sse2.csv
@@ -0,0 +1,148 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"ADDPD xmm1, xmm2/m128","LEX.66.0F.W0 58 /r","Valid","Valid","Invalid","SS=
E2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Add packed double-precisio=
n floating-point values from xmm2/mem to xmm1 and store result in xmm1."
+"ADDSD xmm1, xmm2/m64","LEX.F2.0F.W0 58 /r","Valid","Valid","Invalid","SSE=
2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Add the low double-precisio=
n floating-point value from xmm2/mem to xmm1 and store the result in xmm1."
+"ANDNPD xmm1, xmm2/m128","LEX.66.0F.W0 55 /r","Valid","Valid","Invalid","S=
SE2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Return the bitwise logica=
l AND NOT of packed double-precision floating-point values in xmm1 and xmm2=
/mem."
+"ANDPD xmm1, xmm2/m128","LEX.66.0F.W0 54 /r","Valid","Valid","Invalid","SS=
E2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Return the bitwise logical=
 AND of packed double-precision floating-point values in xmm1 and xmm2/mem."
+"CMPPD xmm1, xmm2/m128, ib","LEX.66.0F.W0 C2 /r ib","Valid","Valid","Inval=
id","SSE2","ModRM:reg (r, w)","ModRM:r/m (r)","ib","","","Compare packed do=
uble-precision floating-point values in xmm2/m128 and xmm1 using bits 2:0 o=
f ib as a comparison predicate."
+"CMPSD xmm1, xmm2/m64, ib","LEX.F2.0F.W0 C2 /r ib","Valid","Valid","Invali=
d","SSE2","ModRM:reg (r, w)","ModRM:r/m (r)","ib","","","Compare low double=
-precision floating-point value in xmm2/m64 and xmm1 using bits 2:0 of ib a=
s comparison predicate."
+"COMISD xmm1, xmm2/m64","LEX.66.0F.W0 2F /r","Valid","Valid","Invalid","SS=
E2","ModRM:reg (r)","ModRM:r/m (r)","","","","Compare low double-precision =
floating-point values in xmm1 and xmm2/mem64 and set the EFLAGS flags accor=
dingly."
+"CVTDQ2PD xmm1, xmm2/m64","LEX.F3.0F.W0 E6 /r","Valid","Valid","Invalid","=
SSE2","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert two packed signed d=
oubleword integers from xmm2/mem to two packed double-precision floating-po=
int values in xmm1."
+"CVTDQ2PS xmm1, xmm2/m128","LEX.0F.W0 5B /r","Valid","Valid","Invalid","SS=
E2","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert four packed signed do=
ubleword integers from xmm2/mem to four packed single-precision floating-po=
int values in xmm1."
+"CVTPD2DQ xmm1, xmm2/m128","LEX.F2.0F.W0 E6 /r","Valid","Valid","Invalid",=
"SSE2","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert two packed double-=
precision floating-point values in xmm2/mem to two signed doubleword intege=
rs in xmm1."
+"CVTPD2PS xmm1, xmm2/m128","LEX.66.0F.W0 5A /r","Valid","Valid","Invalid",=
"SSE2","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert two packed double-=
precision floating-point values in xmm2/mem to two single-precision floatin=
g-point values in xmm1."
+"CVTPS2DQ xmm1, xmm2/m128","LEX.66.0F.W0 5B /r","Valid","Valid","Invalid",=
"SSE2","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert four packed single=
-precision floating-point values from xmm2/mem to four packed signed double=
word values in xmm1."
+"CVTPS2PD xmm1, xmm2/m64","LEX.0F.W0 5A /r","Valid","Valid","Invalid","SSE=
2","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert two packed single-prec=
ision floating-point values in xmm2/m64 to two packed double-precision floa=
ting-point values in xmm1."
+"CVTSD2SI rw, xmm1/m64","LEX.F2.0F.W0 2D /r","Valid","Valid","Invalid","SS=
E2","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert one double-precision =
floating-point value from xmm1/m64 to one signed doubleword integer r."
+"CVTSD2SI rw, xmm1/m64","LEX.F2.0F.W1 2D /r","Valid","Invalid","Invalid","=
SSE2","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert one double-precisio=
n floating-point value from xmm1/m64 to one signed quadword integer signext=
ended into r."
+"CVTSD2SS xmm1, xmm2/m64","LEX.F2.0F.W0 5A /r","Valid","Valid","Invalid","=
SSE2","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert one double-precisio=
n floating-point value in xmm2/m64 to one single-precision floating-point v=
alue in xmm1."
+"CVTSI2SD xmm1, rw/mw","LEX.F2.0F.W0 2A /r","Valid","Valid","Invalid","SSE=
2","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert one signed doubleword =
integer from r/m to one double-precision floating-point value in xmm1."
+"CVTSI2SD xmm1, rw/mw","LEX.F2.0F.W1 2A /r","Valid","Invalid","Invalid","S=
SE2","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert one signed quadword =
integer from r/m to one double-precision floating-point value in xmm1."
+"CVTSI2SS xmm1, rw/mw","LEX.F3.0F.W0 2A /r","Valid","Valid","Invalid","SSE=
2","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert one signed doubleword =
integer from r/m to one single-precision floating-point value in xmm1."
+"CVTSI2SS xmm1, rw/mw","LEX.F3.0F.W1 2A /r","Valid","Invalid","Invalid","S=
SE2","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert one signed quadword =
integer from r/m to one single-precision floating-point value in xmm1."
+"CVTSS2SD xmm1, xmm2/m32","LEX.F3.0F.W0 5A /r","Valid","Valid","Invalid","=
SSE2","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert one single-precisio=
n floating-point value in xmm2/m32 to one double-precision floating-point v=
alue in xmm1."
+"CVTSS2SI rw, xmm1/m32","LEX.F3.0F.W0 2D /r","Valid","Valid","Invalid","SS=
E2","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert one single-precision =
floating-point value from xmm1/m32 to one signed doubleword integer in r."
+"CVTSS2SI rw, xmm1/m32","LEX.F3.0F.W1 2D /r","Valid","Invalid","Invalid","=
SSE2","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert one single-precisio=
n floating-point value from xmm1/m32 to one signed quadword integer in r."
+"CVTTPD2DQ xmm1, xmm2/m128","LEX.66.0F.W0 E6 /r","Valid","Valid","Invalid"=
,"SSE2","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert two packed double=
-precision floating-point values in xmm2/mem to two signed doubleword integ=
ers in xmm1 using truncation."
+"CVTTPS2DQ xmm1, xmm2/m128","LEX.F3.0F.W0 5B /r","Valid","Valid","Invalid"=
,"SSE2","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert four packed singl=
e-precision floating-point values from xmm2/mem to four packed signed doubl=
eword values in xmm1 using truncation."
+"CVTTSD2SI rw, xmm1/m64","LEX.F2.0F.W0 2C /r","Valid","Valid","Invalid","S=
SE2","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert one double-precision=
 floating-point value from xmm1/m64 to one signed doubleword integer in r u=
sing truncation."
+"CVTTSD2SI rw, xmm1/m64","LEX.F2.0F.W1 2C /r","Valid","Invalid","Invalid",=
"SSE2","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert one double-precisi=
on floating-point value from xmm1/m64 to one signed quadword integer in r u=
sing truncation."
+"CVTTSS2SI rw, xmm1/m32","LEX.F3.0F.W0 2C /r","Valid","Valid","Invalid","S=
SE2","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert one single-precision=
 floating-point value from xmm1/m32 to one signed doubleword integer in r u=
sing truncation."
+"CVTTSS2SI rw, xmm1/m32","LEX.F3.0F.W1 2C /r","Valid","Invalid","Invalid",=
"SSE2","ModRM:reg (w)","ModRM:r/m (r)","","","","Convert one single-precisi=
on floating-point value from xmm1/m32 to one signed quadword integer in r u=
sing truncation."
+"DIVPD xmm1, xmm2/m128","LEX.66.0F.W0 5E /r","Valid","Valid","Invalid","SS=
E2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Divide packed double-preci=
sion floating-point values in xmm1 by packed double-precision floating-poin=
t values in xmm2/mem."
+"DIVSD xmm1, xmm2/m64","LEX.F2.0F.W0 5E /r","Valid","Valid","Invalid","SSE=
2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Divide low double-precision=
 floating-point value in xmm1 by low double-precision floating-point value =
in xmm2/m64."
+"MASKMOVDQU xmm1, xmm2","LEX.66.0F.W0 F7 /r","Valid","Valid","Invalid","SS=
E2","ModRM:reg (r)","ModRM:r/m (r)","RDI (r)","","","Selectively write byte=
s from xmm1 to memory location using the byte mask in xmm2. The default mem=
ory location is specified by DS:DI/EDI/RDI."
+"MAXPD xmm1, xmm2/m128","LEX.66.0F.W0 5F /r","Valid","Valid","Invalid","SS=
E2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Return the maximum double-=
precision floating-point values between xmm1 and xmm2/m128."
+"MAXSD xmm1, xmm2/m64","LEX.F2.0F.W0 5F /r","Valid","Valid","Invalid","SSE=
2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Return the maximum scalar d=
ouble-precision floating-point value between xmm2/m64 and xmm1."
+"MINPD xmm1, xmm2/m128","LEX.66.0F.W0 5D /r","Valid","Valid","Invalid","SS=
E2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Return the minimum double-=
precision floating-point values between xmm1 and xmm2/mem"
+"MINSD xmm1, xmm2/m64","LEX.F2.0F.W0 5D /r","Valid","Valid","Invalid","SSE=
2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Return the minimum scalar d=
ouble-precision floating-point value between xmm2/m64 and xmm1."
+"MOVAPD xmm1, xmm2/m128","LEX.66.0F.W0 28 /r","Valid","Valid","Invalid","S=
SE2","ModRM:reg (w)","ModRM:r/m (r)","","","","Move aligned packed double-p=
recision floating-point values from xmm2/mem to xmm1."
+"MOVAPD xmm2/m128, xmm1","LEX.66.0F.W0 29 /r","Valid","Valid","Invalid","S=
SE2","ModRM:r/m (w)","ModRM:reg (r)","","","","Move aligned packed double-p=
recision floating-point values from xmm1 to xmm2/mem."
+"MOVD xmm, rw/mw","LEX.66.0F.W0 6E /r","Valid","Valid","Invalid","SSE2","M=
odRM:reg (w)","ModRM:r/m (r)","","","","Move doubleword from r/m to xmm."
+"MOVD rw/mw, xmm","LEX.66.0F.W0 7E /r","Valid","Valid","Invalid","SSE2","M=
odRM:r/m (w)","ModRM:reg (r)","","","","Move doubleword from xmm register t=
o r/m."
+"MOVDQA xmm1, xmm2/m128","LEX.66.0F.W0 6F /r","Valid","Valid","Invalid","S=
SE2","ModRM:reg (w)","ModRM:r/m (r)","","","","Move aligned packed integer =
values from xmm2/mem to xmm1."
+"MOVDQA xmm2/m128, xmm1","LEX.66.0F.W0 7F /r","Valid","Valid","Invalid","S=
SE2","ModRM:r/m (w)","ModRM:reg (r)","","","","Move aligned packed integer =
values from xmm1 to xmm2/mem."
+"MOVDQU xmm1, xmm2/m128","LEX.F3.0F.W0 6F /r","Valid","Valid","Invalid","S=
SE2","ModRM:reg (w)","ModRM:r/m (r)","","","","Move unaligned packed intege=
r values from xmm2/m128 to xmm1."
+"MOVDQU xmm2/m128, xmm1","LEX.F3.0F.W0 7F /r","Valid","Valid","Invalid","S=
SE2","ModRM:r/m (r)","ModRM:reg (w)","","","","Move unaligned packed intege=
r values from xmm1 to xmm2/m128."
+"MOVHPD xmm1, m64","LEX.66.0F.W0 16 /r","Valid","Valid","Invalid","SSE2","=
ModRM:reg (r, w)","ModRM:r/m (r)","","","","Move double-precision floating-=
point value from m64 to high quadword of xmm1."
+"MOVHPD m64, xmm1","LEX.66.0F.W0 17 /r","Valid","Valid","Invalid","SSE2","=
ModRM:r/m (w)","ModRM:reg (r)","","","","Move double-precision floating-poi=
nt value from high quadword of xmm1 to m64."
+"MOVLPD xmm1, m64","LEX.66.0F.W0 12 /r","Valid","Valid","Invalid","SSE2","=
ModRM:reg (r, w)","ModRM:r/m (r)","","","","Move double-precision floating-=
point value from m64 to low quadword of xmm1."
+"MOVLPD m64, xmm1","LEX.66.0F.W0 13 /r","Valid","Valid","Invalid","SSE2","=
ModRM:r/m (w)","ModRM:reg (r)","","","","Move double-precision floating-poi=
nt value from low quadword of xmm1 to m64."
+"MOVMSKPD rw, xmm","LEX.66.0F.W0 50 /r","Valid","Valid","Invalid","SSE2","=
ModRM:reg (w)","ModRM:r/m (r)","","","","Extract 2-bit sign mask from xmm a=
nd store in reg. The upper bits of r are zeroed."
+"MOVNTDQ m128, xmm1","LEX.66.0F.W0 E7 /r","Valid","Valid","Invalid","SSE2"=
,"ModRM:r/m (w)","ModRM:reg (r)","","","","Move packed integer values in xm=
m1 to m128 using non-temporal hint."
+"MOVNTPD m128, xmm1","LEX.66.0F.W0 2B /r","Valid","Valid","Invalid","SSE2"=
,"ModRM:r/m (w)","ModRM:reg (r)","","","","Move packed double-precision val=
ues in xmm1 to m128 using non-temporal hint."
+"MOVQ xmm, rw/mw","LEX.66.0F.W1 6E /r","Valid","Invalid","Invalid","SSE2",=
"ModRM:reg (w)","ModRM:r/m (r)","","","","Move quadword from r/m to xmm."
+"MOVQ rw/mw, xmm","LEX.66.0F.W1 7E /r","Valid","Invalid","Invalid","SSE2",=
"ModRM:r/m (w)","ModRM:reg (r)","","","","Move quadword from xmm register t=
o r/m."
+"MOVQ xmm1, xmm2/m64","LEX.F3.0F.W0 7E /r","Valid","Valid","Invalid","SSE2=
","ModRM:reg (w)","ModRM:r/m (r)","","","","Move quadword from xmm2/mem64 t=
o xmm1."
+"MOVQ xmm2/m64, xmm1","LEX.66.0F.W0 D6 /r","Valid","Valid","Invalid","SSE2=
","ModRM:r/m (w)","ModRM:reg (r)","","","","Move quadword from xmm1 to xmm2=
/mem64."
+"MOVSD xmm1, m64","LEX.F2.0F.W0 10 /r","Valid","Valid","Invalid","SSE2","M=
odRM:reg (r, w)","ModRM:r/m (r)","","","","Load scalar double-precision flo=
ating-point value from m64 to xmm1 register."
+"MOVSD xmm1, xmm2","LEX.F2.0F.W0 10 /r","Valid","Valid","Invalid","SSE2","=
ModRM:reg (r, w)","ModRM:r/m (r)","","","","Move scalar double-precision fl=
oating-point value from xmm2 to xmm1 register."
+"MOVSD xmm1/m64, xmm2","LEX.F2.0F.W0 11 /r","Valid","Valid","Invalid","SSE=
2","ModRM:r/m (w)","ModRM:reg (r)","","","","Move scalar double-precision f=
loating-point value from xmm2 register to xmm1/m64."
+"MOVUPD xmm1, xmm2/m128","LEX.66.0F.W0 10 /r","Valid","Valid","Invalid","S=
SE2","ModRM:reg (w)","ModRM:r/m (r)","","","","Move unaligned packed double=
-precision floating-point from xmm2/mem to xmm1."
+"MOVUPD xmm2/m128, xmm1","LEX.66.0F.W0 11 /r","Valid","Valid","Invalid","S=
SE2","ModRM:r/m (w)","ModRM:reg (r)","","","","Move unaligned packed double=
-precision floating-point from xmm1 to xmm2/mem."
+"MULPD xmm1, xmm2/m128","LEX.66.0F.W0 59 /r","Valid","Valid","Invalid","SS=
E2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Multiply packed double-pre=
cision floating-point values in xmm2/m128 with xmm1 and store result in xmm=
1."
+"MULSD xmm1, xmm2/m64","LEX.F2.0F.W0 59 /r","Valid","Valid","Invalid","SSE=
2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Multiply the low double-pre=
cision floating-point value in xmm2/m64 by low double-precision floating-po=
int value in xmm1."
+"ORPD xmm1, xmm2/m128","LEX.66.0F.W0 56 /r","Valid","Valid","Invalid","SSE=
2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Return the bitwise logical =
OR of packed double-precision floating-point values in xmm1 and xmm2/mem."
+"PACKSSDW xmm1, xmm2/m128","LEX.66.0F.W0 6B /r","Valid","Valid","Invalid",=
"SSE2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Converts 4 packed signe=
d doubleword integers from xmm1 and from xxm2/m128 into 8 packed signed wor=
d integers in xxm1 using signed saturation."
+"PACKSSWB xmm1, xmm2/m128","LEX.66.0F.W0 63 /r","Valid","Valid","Invalid",=
"SSE2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Converts 8 packed signe=
d word integers from xmm1 and from xxm2/m128 into 16 packed signed byte int=
egers in xxm1 using signed saturation."
+"PACKUSWB xmm1, xmm2/m128","LEX.66.0F.W0 67 /r","Valid","Valid","Invalid",=
"SSE2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Converts 8 signed word =
integers from xmm1 and 8 signed word integers from xmm2/m128 into 16 unsign=
ed byte integers in xmm1 using unsigned saturation."
+"PADDB xmm1, xmm2/m128","LEX.66.0F.W0 FC /r","Valid","Valid","Invalid","SS=
E2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Add packed byte integers f=
rom xmm2/m128 and xmm1."
+"PADDD xmm1, xmm2/m128","LEX.66.0F.W0 FE /r","Valid","Valid","Invalid","SS=
E2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Add packed doubleword inte=
gers from xmm2/m128 and xmm1."
+"PADDQ xmm1, xmm2/m128","LEX.66.0F.W0 D4 /r","Valid","Valid","Invalid","SS=
E2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Add packed quadword intege=
rs from xmm2/m128 and xmm1."
+"PADDSB xmm1, xmm2/m128","LEX.66.0F.W0 EC /r","Valid","Valid","Invalid","S=
SE2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Add packed signed byte in=
tegers from xmm2/m128 and xmm1 saturate the results."
+"PADDSW xmm1, xmm2/m128","LEX.66.0F.W0 ED /r","Valid","Valid","Invalid","S=
SE2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Add packed signed word in=
tegers from xmm2/m128 and xmm1 and saturate the results."
+"PADDUSB xmm1, xmm2/m128","LEX.66.0F.W0 DC /r","Valid","Valid","Invalid","=
SSE2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Add packed unsigned byte=
 integers from xmm2/m128 and xmm1 saturate the results."
+"PADDUSW xmm1, xmm2/m128","LEX.66.0F.W0 DD /r","Valid","Valid","Invalid","=
SSE2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Add packed unsigned word=
 integers from xmm2/m128 to xmm1 and saturate the results."
+"PADDW xmm1, xmm2/m128","LEX.66.0F.W0 FD /r","Valid","Valid","Invalid","SS=
E2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Add packed word integers f=
rom xmm2/m128 and xmm1."
+"PAND xmm1, xmm2/m128","LEX.66.0F.W0 DB /r","Valid","Valid","Invalid","SSE=
2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Bitwise AND of xmm2/m128 an=
d xmm1."
+"PANDN xmm1, xmm2/m128","LEX.66.0F.W0 DF /r","Valid","Valid","Invalid","SS=
E2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Bitwise AND NOT of xmm2/m1=
28 and xmm1."
+"PAVGB xmm1, xmm2/m128","LEX.66.0F.W0 E0 /r","Valid","Valid","Invalid","SS=
E2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Average packed unsigned by=
te integers from xmm2/m128 and xmm1 with rounding."
+"PAVGW xmm1, xmm2/m128","LEX.66.0F.W0 E3 /r","Valid","Valid","Invalid","SS=
E2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Average packed unsigned wo=
rd integers from xmm2/m128 and xmm1 with rounding."
+"PCMPEQB xmm1, xmm2/m128","LEX.66.0F.W0 74 /r","Valid","Valid","Invalid","=
SSE2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Compare packed bytes in =
xmm2/m128 and xmm1 for equality."
+"PCMPEQD xmm1, xmm2/m128","LEX.66.0F.W0 76 /r","Valid","Valid","Invalid","=
SSE2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Compare packed doublewor=
ds in xmm2/m128 and xmm1 for equality."
+"PCMPEQW xmm1, xmm2/m128","LEX.66.0F.W0 75 /r","Valid","Valid","Invalid","=
SSE2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Compare packed words in =
xmm2/m128 and xmm1 for equality."
+"PCMPGTB xmm1, xmm2/m128","LEX.66.0F.W0 64 /r","Valid","Valid","Invalid","=
SSE2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Compare packed signed by=
te integers in xmm1 and xmm2/m128 for greater than."
+"PCMPGTD xmm1, xmm2/m128","LEX.66.0F.W0 66 /r","Valid","Valid","Invalid","=
SSE2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Compare packed signed do=
ubleword integers in xmm1 and xmm2/m128 for greater than."
+"PCMPGTW xmm1, xmm2/m128","LEX.66.0F.W0 65 /r","Valid","Valid","Invalid","=
SSE2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Compare packed signed wo=
rd integers in xmm1 and xmm2/m128 for greater than."
+"PEXTRW r32, xmm, ib","LEX.66.0F.W0 C5 /r ib","Valid","Valid","Invalid","S=
SE2","ModRM:reg (w)","ModRM:r/m (r)","ib","","","Extract the word specified=
 by ib from xmm and move it to reg, bits 15-0. The upper bits of r are zero=
ed."
+"PINSRW xmm, r32/m16, ib","LEX.66.0F.W0 C4 /r ib","Valid","Valid","Invalid=
","SSE2","ModRM:reg (w)","ModRM:r/m (r)","ib","","","Move the low word of r=
32 or from m16 into xmm at the word position specified by ib."
+"PMADDWD xmm1, xmm2/m128","LEX.66.0F.W0 F5 /r","Valid","Valid","Invalid","=
SSE2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Multiply the packed word=
 integers in xmm1 by the packed word integers in xmm2/m128, add adjacent do=
ubleword results, and store in xmm1."
+"PMAXSW xmm1, xmm2/m128","LEX.66.0F.W0 EE /r","Valid","Valid","Invalid","S=
SE2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Compare packed signed wor=
d integers in xmm2/m128 and xmm1 and stores maximum packed values in xmm1."
+"PMAXUB xmm1, xmm2/m128","LEX.66.0F.W0 DE /r","Valid","Valid","Invalid","S=
SE2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Compare packed unsigned b=
yte integers in xmm1 and xmm2/m128 and store packed maximum values in xmm1."
+"PMINSW xmm1, xmm2/m128","LEX.66.0F.W0 EA /r","Valid","Valid","Invalid","S=
SE2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Compare packed signed wor=
d integers in xmm2/m128 and xmm1 and store packed minimum values in xmm1."
+"PMINUB xmm1, xmm2/m128","LEX.66.0F.W0 DA /r","Valid","Valid","Invalid","S=
SE2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Compare packed unsigned b=
yte integers in xmm1 and xmm2/m128 and store packed minimum values in xmm1."
+"PMOVMSKB r32, xmm","LEX.66.0F.W0 D7 /r","Valid","Valid","Invalid","SSE2",=
"ModRM:reg (w)","ModRM:r/m (r)","","","","Move a byte mask of xmm to reg. T=
he upper bits of r are zeroed"
+"PMULHUW xmm1, xmm2/m128","LEX.66.0F.W0 E4 /r","Valid","Valid","Invalid","=
SSE2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Multiply the packed unsi=
gned word integers in xmm1 and xmm2/m128, and store the high 16 bits of the=
 results in xmm1."
+"PMULHW xmm1, xmm2/m128","LEX.66.0F.W0 E5 /r","Valid","Valid","Invalid","S=
SE2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Multiply the packed signe=
d word integers in xmm1 and xmm2/m128, and store the high 16 bits of the re=
sults in xmm1."
+"PMULLW xmm1, xmm2/m128","LEX.66.0F.W0 D5 /r","Valid","Valid","Invalid","S=
SE2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Multiply the packed signe=
d word integers in xmm1 and xmm2/m128, and store the low 16 bits of the res=
ults in xmm1."
+"PMULUDQ mm1, mm2/m64","LEX.0F.W0 F4 /r","Valid","Valid","Invalid","SSE2",=
"ModRM:reg (r, w)","ModRM:r/m (r)","","","","Multiply unsigned doubleword i=
nteger in mm1 by unsigned doubleword integer in mm2/m64, and store the quad=
word result in mm1."
+"PMULUDQ xmm1, xmm2/m128","LEX.66.0F.W0 F4 /r","Valid","Valid","Invalid","=
SSE2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Multiply packed unsigned=
 doubleword integers in xmm1 by packed unsigned doubleword integers in xmm2=
/m128, and store the quadword results in xmm1."
+"POR xmm1, xmm2/m128","LEX.66.0F.W0 EB /r","Valid","Valid","Invalid","SSE2=
","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Bitwise OR of xmm2/m128 and =
xmm1."
+"PSADBW xmm1, xmm2/m128","LEX.66.0F.W0 F6 /r","Valid","Valid","Invalid","S=
SE2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Computes the absolute dif=
ferences of the packed unsigned byte integers from xmm2/m128 and xmm1; the =
8 low differences and 8 high differences are then summed separately to prod=
uce two unsigned word integer results."
+"PSHUFD xmm1, xmm2/m128, ib","LEX.66.0F.W0 70 /r ib","Valid","Valid","Inva=
lid","SSE2","ModRM:reg (w)","ModRM:r/m (r)","ib","","","Shuffle the doublew=
ords in xmm2/m128 based on the encoding in ib and store the result in xmm1."
+"PSHUFHW xmm1, xmm2/m128, ib","LEX.F3.0F.W0 70 /r ib","Valid","Valid","Inv=
alid","SSE2","ModRM:reg (w)","ModRM:r/m (r)","ib","","","Shuffle the high w=
ords in xmm2/m128 based on the encoding in ib and store the result in xmm1."
+"PSHUFLW xmm1, xmm2/m128, ib","LEX.F2.0F.W0 70 /r ib","Valid","Valid","Inv=
alid","SSE2","ModRM:reg (w)","ModRM:r/m (r)","ib","","","Shuffle the low wo=
rds in xmm2/m128 based on the encoding in ib and store the result in xmm1."
+"PSLLD xmm1, ib","LEX.66.0F.W0 72 /6 ib","Valid","Valid","Invalid","SSE2",=
"ModRM:r/m (r, w)","ib","","","","Shift doublewords in xmm1 left by ib whil=
e shifting in 0s."
+"PSLLD xmm1, xmm2/m128","LEX.66.0F.W0 F2 /r","Valid","Valid","Invalid","SS=
E2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Shift doublewords in xmm1 =
left by xmm2/m128 while shifting in 0s."
+"PSLLDQ xmm1, ib","LEX.66.0F.W0 73 /7 ib","Valid","Valid","Invalid","SSE2"=
,"ModRM:r/m (r, w)","ib","","","","Shift xmm1 left by ib bytes while shifti=
ng in 0s."
+"PSLLQ xmm1, ib","LEX.66.0F.W0 73 /6 ib","Valid","Valid","Invalid","SSE2",=
"ModRM:r/m (r, w)","ib","","","","Shift quadwords in xmm1 left by ib while =
shifting in 0s."
+"PSLLQ xmm1, xmm2/m128","LEX.66.0F.W0 F3 /r","Valid","Valid","Invalid","SS=
E2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Shift quadwords in xmm1 le=
ft by xmm2/m128 while shifting in 0s."
+"PSLLW xmm1, ib","LEX.66.0F.W0 71 /6 ib","Valid","Valid","Invalid","SSE2",=
"ModRM:r/m (r, w)","ib","","","","Shift words in xmm1 left by ib while shif=
ting in 0s."
+"PSLLW xmm1, xmm2/m128","LEX.66.0F.W0 F1 /r","Valid","Valid","Invalid","SS=
E2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Shift words in xmm1 left b=
y xmm2/m128 while shifting in 0s."
+"PSRAD xmm1, ib","LEX.66.0F.W0 72 /4 ib","Valid","Valid","Invalid","SSE2",=
"ModRM:r/m (r, w)","ib","","","","Shift doublewords in xmm1 right by ib whi=
le shifting in sign bits."
+"PSRAD xmm1, xmm2/m128","LEX.66.0F.W0 E2 /r","Valid","Valid","Invalid","SS=
E2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Shift doubleword in xmm1 r=
ight by xmm2 /m128 while shifting in sign bits."
+"PSRAW xmm1, ib","LEX.66.0F.W0 71 /4 ib","Valid","Valid","Invalid","SSE2",=
"ModRM:r/m (r, w)","ib","","","","Shift words in xmm1 right by ib while shi=
fting in sign bits"
+"PSRAW xmm1, xmm2/m128","LEX.66.0F.W0 E1 /r","Valid","Valid","Invalid","SS=
E2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Shift words in xmm1 right =
by xmm2/m128 while shifting in sign bits."
+"PSRLD xmm1, ib","LEX.66.0F.W0 72 /2 ib","Valid","Valid","Invalid","SSE2",=
"ModRM:r/m (r, w)","ib","","","","Shift doublewords in xmm1 right by ib whi=
le shifting in 0s."
+"PSRLD xmm1, xmm2/m128","LEX.66.0F.W0 D2 /r","Valid","Valid","Invalid","SS=
E2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Shift doublewords in xmm1 =
right by amount specified in xmm2/m128 while shifting in 0s."
+"PSRLDQ xmm1, ib","LEX.66.0F.W0 73 /3 ib","Valid","Valid","Invalid","SSE2"=
,"ModRM:r/m (r, w)","ib","","","","Shift xmm1 right by ib while shifting in=
 0s."
+"PSRLQ xmm1, ib","LEX.66.0F.W0 73 /2 ib","Valid","Valid","Invalid","SSE2",=
"ModRM:r/m (r, w)","ib","","","","Shift quadwords in xmm1 right by ib while=
 shifting in 0s."
+"PSRLQ xmm1, xmm2/m128","LEX.66.0F.W0 D3 /r","Valid","Valid","Invalid","SS=
E2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Shift quadwords in xmm1 ri=
ght by amount specified in xmm2/m128 while shifting in 0s."
+"PSRLW xmm1, ib","LEX.66.0F.W0 71 /2 ib","Valid","Valid","Invalid","SSE2",=
"ModRM:r/m (r, w)","ib","","","","Shift words in xmm1 right by ib while shi=
fting in 0s."
+"PSRLW xmm1, xmm2/m128","LEX.66.0F.W0 D1 /r","Valid","Valid","Invalid","SS=
E2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Shift words in xmm1 right =
by amount specified in xmm2/m128 while shifting in 0s."
+"PSUBB xmm1, xmm2/m128","LEX.66.0F.W0 F8 /r","Valid","Valid","Invalid","SS=
E2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Subtract packed byte integ=
ers in xmm2/m128 from packed byte integers in xmm1."
+"PSUBD xmm1, xmm2/m128","LEX.66.0F.W0 FA /r","Valid","Valid","Invalid","SS=
E2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Subtract packed doubleword=
 integers in xmm2/mem128 from packed doubleword integers in xmm1."
+"PSUBQ mm1, mm2/m64","LEX.0F.W0 FB /r","Valid","Valid","Invalid","SSE2","M=
odRM:reg (r, w)","ModRM:r/m (r)","","","","Subtract quadword integer in mm1=
 from mm2 /m64."
+"PSUBQ xmm1, xmm2/m128","LEX.66.0F.W0 FB /r","Valid","Valid","Invalid","SS=
E2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Subtract packed quadword i=
ntegers in xmm1 from xmm2/m128."
+"PSUBSB xmm1, xmm2/m128","LEX.66.0F.W0 E8 /r","Valid","Valid","Invalid","S=
SE2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Subtract packed signed by=
te integers in xmm2/m128 from packed signed byte integers in xmm1 and satur=
ate results."
+"PSUBSW xmm1, xmm2/m128","LEX.66.0F.W0 E9 /r","Valid","Valid","Invalid","S=
SE2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Subtract packed signed wo=
rd integers in xmm2/m128 from packed signed word integers in xmm1 and satur=
ate results."
+"PSUBUSB xmm1, xmm2/m128","LEX.66.0F.W0 D8 /r","Valid","Valid","Invalid","=
SSE2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Subtract packed unsigned=
 byte integers in xmm2/m128 from packed unsigned byte integers in xmm1 and =
saturate result."
+"PSUBUSW xmm1, xmm2/m128","LEX.66.0F.W0 D9 /r","Valid","Valid","Invalid","=
SSE2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Subtract packed unsigned=
 word integers in xmm2/m128 from packed unsigned word integers in xmm1 and =
saturate result."
+"PSUBW xmm1, xmm2/m128","LEX.66.0F.W0 F9 /r","Valid","Valid","Invalid","SS=
E2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Subtract packed word integ=
ers in xmm2/m128 from packed word integers in xmm1."
+"PUNPCKHBW xmm1, xmm2/m128","LEX.66.0F.W0 68 /r","Valid","Valid","Invalid"=
,"SSE2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Unpack and interleave =
high-order bytes from xmm1 and xmm2/m128 into xmm1."
+"PUNPCKHDQ xmm1, xmm2/m128","LEX.66.0F.W0 6A /r","Valid","Valid","Invalid"=
,"SSE2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Unpack and interleave =
high-order doublewords from xmm1 and xmm2/m128 into xmm1."
+"PUNPCKHQDQ xmm1, xmm2/m128","LEX.66.0F.W0 6D /r","Valid","Valid","Invalid=
","SSE2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Unpack and interleave=
 high-order quadwords from xmm1 and xmm2/m128 into xmm1."
+"PUNPCKHWD xmm1, xmm2/m128","LEX.66.0F.W0 69 /r","Valid","Valid","Invalid"=
,"SSE2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Unpack and interleave =
high-order words from xmm1 and xmm2/m128 into xmm1."
+"PUNPCKLBW xmm1, xmm2/m128","LEX.66.0F.W0 60 /r","Valid","Valid","Invalid"=
,"SSE2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Interleave low-order b=
ytes from xmm1 and xmm2/m128 into xmm1."
+"PUNPCKLDQ xmm1, xmm2/m128","LEX.66.0F.W0 62 /r","Valid","Valid","Invalid"=
,"SSE2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Interleave low-order d=
oublewords from xmm1 and xmm2/m128 into xmm1."
+"PUNPCKLQDQ xmm1, xmm2/m128","LEX.66.0F.W0 6C /r","Valid","Valid","Invalid=
","SSE2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Interleave low-order =
quadword from xmm1 and xmm2/m128 into xmm1 register."
+"PUNPCKLWD xmm1, xmm2/m128","LEX.66.0F.W0 61 /r","Valid","Valid","Invalid"=
,"SSE2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Interleave low-order w=
ords from xmm1 and xmm2/m128 into xmm1."
+"PXOR xmm1, xmm2/m128","LEX.66.0F.W0 EF /r","Valid","Valid","Invalid","SSE=
2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Bitwise XOR of xmm2/m128 an=
d xmm1."
+"SHUFPD xmm1, xmm2/m128, ib","LEX.66.0F.W0 C6 /r ib","Valid","Valid","Inva=
lid","SSE2","ModRM:reg (r, w)","ModRM:r/m (r)","ib","","","Shuffle two pair=
s of double-precision floating-point values from xmm1 and xmm2/m128 using i=
b to select from each pair, interleaved result is stored in xmm1."
+"SQRTPD xmm1, xmm2/m128","LEX.66.0F.W0 51 /r","Valid","Valid","Invalid","S=
SE2","ModRM:reg (w)","ModRM:r/m (r)","","","","Computes Square Roots of the=
 packed double-precision floating-point values in xmm2/m128 and stores the =
result in xmm1."
+"SQRTSD xmm1, xmm2/m64","LEX.F2.0F.W0 51 /r","Valid","Valid","Invalid","SS=
E2","ModRM:reg (w)","ModRM:r/m (r)","","","","Computes square root of the l=
ow double-precision floating-point value in xmm2/m64 and stores the results=
 in xmm1."
+"SUBPD xmm1, xmm2/m128","LEX.66.0F.W0 5C /r","Valid","Valid","Invalid","SS=
E2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Subtract packed double-pre=
cision floating-point values in xmm2/mem from xmm1 and store result in xmm1=
."
+"SUBSD xmm1, xmm2/m64","LEX.F2.0F.W0 5C /r","Valid","Valid","Invalid","SSE=
2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Subtract the low double-pre=
cision floating-point value in xmm2/m64 from xmm1 and store the result in x=
mm1."
+"UCOMISD xmm1, xmm2/m64","LEX.66.0F.W0 2E /r","Valid","Valid","Invalid","S=
SE2","ModRM:reg (r)","ModRM:r/m (r)","","","","Compare low double-precision=
 floating-point values in xmm1 and xmm2/mem64 and set the EFLAGS flags acco=
rdingly."
+"UNPCKHPD xmm1, xmm2/m128","LEX.66.0F.W0 15 /r","Valid","Valid","Invalid",=
"SSE2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Unpacks and Interleaves=
 double-precision floating-point values from high quadwords of xmm1 and xmm=
2/m128."
+"UNPCKLPD xmm1, xmm2/m128","LEX.66.0F.W0 14 /r","Valid","Valid","Invalid",=
"SSE2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Unpacks and Interleaves=
 double-precision floating-point values from low quadwords of xmm1 and xmm2=
/m128."
+"XORPD xmm1, xmm2/m128","LEX.66.0F.W0 57 /r","Valid","Valid","Invalid","SS=
E2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Return the bitwise logical=
 XOR of packed double-precision floating-point values in xmm1 and xmm2/mem."
diff --git a/disas/x86-data/x86_sse3.csv b/disas/x86-data/x86_sse3.csv
new file mode 100644
index 000000000000..93bdb4ec0323
--- /dev/null
+++ b/disas/x86-data/x86_sse3.csv
@@ -0,0 +1,11 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"ADDSUBPD xmm1, xmm2/m128","LEX.66.0F.W0 D0 /r","Valid","Valid","Invalid",=
"SSE3","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Add/subtract double-pre=
cision floating-point values from xmm2/m128 to xmm1."
+"ADDSUBPS xmm1, xmm2/m128","LEX.F2.0F.W0 D0 /r","Valid","Valid","Invalid",=
"SSE3","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Add/subtract single-pre=
cision floating-point values from xmm2/m128 to xmm1."
+"HADDPD xmm1, xmm2/m128","LEX.66.0F.W0 7C /r","Valid","Valid","Invalid","S=
SE3","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Horizontal add packed dou=
ble-precision floating-point values from xmm2/m128 to xmm1."
+"HADDPS xmm1, xmm2/m128","LEX.F2.0F.W0 7C /r","Valid","Valid","Invalid","S=
SE3","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Horizontal add packed sin=
gle-precision floating-point values from xmm2/m128 to xmm1."
+"HSUBPD xmm1, xmm2/m128","LEX.66.0F.W0 7D /r","Valid","Valid","Invalid","S=
SE3","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Horizontal subtract packe=
d double-precision floating-point values from xmm2/m128 to xmm1."
+"HSUBPS xmm1, xmm2/m128","LEX.F2.0F.W0 7D /r","Valid","Valid","Invalid","S=
SE3","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Horizontal subtract packe=
d single-precision floating-point values from xmm2/m128 to xmm1."
+"LDDQU xmm1, m128","LEX.F2.0F.W0 F0 /r","Valid","Valid","Invalid","SSE3","=
ModRM:reg (w)","ModRM:r/m (r)","","","","Load unaligned data from mem and r=
eturn double quadword in xmm1."
+"MOVDDUP xmm1, xmm2/m64","LEX.F2.0F.W0 12 /r","Valid","Valid","Invalid","S=
SE3","ModRM:reg (w)","ModRM:r/m (r)","","","","Move double-precision floati=
ng-point value from xmm2/m64 and duplicate into xmm1."
+"MOVSHDUP xmm1, xmm2/m128","LEX.F3.0F.W0 16 /r","Valid","Valid","Invalid",=
"SSE3","ModRM:reg (w)","ModRM:r/m (r)","","","","Move odd index single-prec=
ision floating-point values from xmm2/mem and duplicate each element into x=
mm1."
+"MOVSLDUP xmm1, xmm2/m128","LEX.F3.0F.W0 12 /r","Valid","Valid","Invalid",=
"SSE3","ModRM:reg (w)","ModRM:r/m (r)","","","","Move even index single-pre=
cision floating-point values from xmm2/mem and duplicate each element into =
xmm1."
diff --git a/disas/x86-data/x86_sse4_1.csv b/disas/x86-data/x86_sse4_1.csv
new file mode 100644
index 000000000000..5f86b35f9713
--- /dev/null
+++ b/disas/x86-data/x86_sse4_1.csv
@@ -0,0 +1,48 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"BLENDPD xmm1, xmm2/m128, ib","LEX.66.0F3A.W0 0D /r ib","Valid","Valid","I=
nvalid","SSE4_1","ModRM:reg (r, w)","ModRM:r/m (r)","ib","","","Select pack=
ed DP-FP values from xmm1 and xmm2/m128 from mask specified in ib and store=
 the values into xmm1."
+"BLENDPS xmm1, xmm2/m128, ib","LEX.66.0F3A.W0 0C /r ib","Valid","Valid","I=
nvalid","SSE4_1","ModRM:reg (r, w)","ModRM:r/m (r)","ib","","","Select pack=
ed single precision floating-point values from xmm1 and xmm2/m128 from mask=
 specified in ib and store the values into xmm1."
+"BLENDVPD xmm1, xmm2/m128 , <XMM0>","LEX.66.0F38.W0 15 /r","Valid","Valid"=
,"Invalid","SSE4_1","ModRM:reg (r, w)","ModRM:r/m (r)","Implicit XMM0 (r)",=
"","","Select packed DP FP values from xmm1 and xmm2 from mask specified in=
 XMM0 and store the values in xmm1."
+"BLENDVPS xmm1, xmm2/m128, <XMM0>","LEX.66.0F38.W0 14 /r","Valid","Valid",=
"Invalid","SSE4_1","ModRM:reg (r, w)","ModRM:r/m (r)","Implicit XMM0 (r)","=
","","Select packed single precision floating-point values from xmm1 and xm=
m2/m128 from mask specified in XMM0 and store the values into xmm1."
+"DPPD xmm1, xmm2/m128, ib","LEX.66.0F3A.W0 41 /r ib","Valid","Valid","Inva=
lid","SSE4_1","ModRM:reg (r, w)","ModRM:r/m (r)","ib","","","Selectively mu=
ltiply packed DP floating-point values from xmm1 with packed DP floating-po=
int values from xmm2, add and selectively store the packed DP floating-poin=
t values to xmm1."
+"DPPS xmm1, xmm2/m128, ib","LEX.66.0F3A.W0 40 /r ib","Valid","Valid","Inva=
lid","SSE4_1","ModRM:reg (r, w)","ModRM:r/m (r)","ib","","","Selectively mu=
ltiply packed SP floating-point values from xmm1 with packed SP floating-po=
int values from xmm2, add and selectively store the packed SP floating-poin=
t values or zero values to xmm1."
+"EXTRACTPS rw/mw, xmm1, ib","LEX.66.0F3A.W0 17 /r ib","Valid","Valid","Inv=
alid","SSE4_1","ModRM:r/m (w)","ModRM:reg (r)","ib","","","Extract one sing=
le-precision floating-point value from xmm1 at the offset specified by ib a=
nd store the result in reg or m32. Zero extend the results in 64-bit regist=
er if applicable."
+"INSERTPS xmm1, xmm2/m32, ib","LEX.66.0F3A.W0 21 /r ib","Valid","Valid","I=
nvalid","SSE4_1","ModRM:reg (r, w)","ModRM:r/m (r)","ib","","","Insert a si=
ngle-precision floating-point value selected by ib from xmm2/m32 into xmm1 =
at the specified destination element specified by ib and zero out destinati=
on elements in xmm1 as indicated in ib."
+"MOVNTDQA xmm1, m128","LEX.66.0F38.W0 2A /r","Valid","Valid","Invalid","SS=
E4_1","ModRM:reg (w)","ModRM:r/m (r)","","","","Move double quadword from m=
128 to xmm1 using non-temporal hint if WC memory type."
+"MPSADBW xmm1, xmm2/m128, ib","LEX.66.0F3A.W0 42 /r ib","Valid","Valid","I=
nvalid","SSE4_1","ModRM:reg (r, w)","ModRM:r/m (r)","ib","","","Sums absolu=
te 8-bit integer difference of adjacent groups of 4 byte integers in xmm1 a=
nd xmm2/m128 and writes the results in xmm1. Starting offsets within xmm1 a=
nd xmm2/m128 are determined by ib."
+"PACKUSDW xmm1, xmm2/m128","LEX.66.0F38.W0 2B /r","Valid","Valid","Invalid=
","SSE4_1","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Convert 4 packed si=
gned doubleword integers from xmm1 and 4 packed signed doubleword integers =
from xmm2/m128 into 8 packed unsigned word integers in xmm1 using unsigned =
saturation."
+"PBLENDVB xmm1, xmm2/m128, <XMM0>","LEX.66.0F38.W0 10 /r","Valid","Valid",=
"Invalid","SSE4_1","ModRM:reg (r, w)","ModRM:r/m (r)","Implicit XMM0 (r)","=
","","Select byte values from xmm1 and xmm2/m128 from mask specified in the=
 high bit of each byte in XMM0 and store the values into xmm1."
+"PBLENDW xmm1, xmm2/m128, ib","LEX.66.0F3A.W0 0E /r ib","Valid","Valid","I=
nvalid","SSE4_1","ModRM:reg (r, w)","ModRM:r/m (r)","ib","","","Select word=
s from xmm1 and xmm2/m128 from mask specified in ib and store the values in=
to xmm1."
+"PCMPEQQ xmm1, xmm2/m128","LEX.66.0F38.W0 29 /r","Valid","Valid","Invalid"=
,"SSE4_1","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Compare packed qword=
s in xmm2/m128 and xmm1 for equality."
+"PEXTRB r32/m8, xmm2, ib","LEX.66.0F3A.W0 14 /r ib","Valid","Valid","Inval=
id","SSE4_1","ModRM:r/m (w)","ModRM:reg (r)","ib","","","Extract a byte int=
eger value from xmm2 at the source byte offset specified by ib into reg or =
m8. The upper bits of r are zeroed."
+"PEXTRW r32/m16, xmm, ib","LEX.66.0F3A.W0 15 /r ib","Valid","Valid","Inval=
id","SSE4_1","ModRM:r/m (w)","ModRM:reg (r)","ib","","","Extract the word s=
pecified by ib from xmm and copy it to lowest 16 bits of reg or m16. Zero-e=
xtend the result in the destination, r."
+"PHMINPOSUW xmm1, xmm2/m128","LEX.66.0F38.W0 41 /r","Valid","Valid","Inval=
id","SSE4_1","ModRM:reg (w)","ModRM:r/m (r)","","","","Find the minimum uns=
igned word in xmm2/m128 and place its value in the low word of xmm1 and its=
 index in the second-lowest word of xmm1."
+"PINSRB xmm1, r32/m8, ib","LEX.66.0F3A.W0 20 /r ib","Valid","Valid","Inval=
id","SSE4_1","ModRM:reg (w)","ModRM:r/m (r)","ib","","","Insert a byte inte=
ger value from r8/m8 into xmm1 at the destination element in xmm1 specified=
 by ib."
+"PINSRD xmm1, r32/m32, ib","LEX.66.0F3A.W0 22 /r ib","Valid","Valid","Inva=
lid","SSE4_1","ModRM:reg (w)","ModRM:r/m (r)","ib","","","Insert a dword in=
teger value from r/m32 into the xmm1 at the destination element specified b=
y ib."
+"PINSRQ xmm1, r64/m64, ib","LEX.66.0F3A.W1 22 /r ib","Valid","Invalid","In=
valid","SSE4_1","ModRM:reg (w)","ModRM:r/m (r)","ib","","","Insert a qword =
integer value from r/m64 into the xmm1 at the destination element specified=
 by ib."
+"PMAXSB xmm1, xmm2/m128","LEX.66.0F38.W0 3C /r","Valid","Valid","Invalid",=
"SSE4_1","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Compare packed signed=
 byte integers in xmm1 and xmm2/m128 and store packed maximum values in xmm=
1."
+"PMAXSD xmm1, xmm2/m128","LEX.66.0F38.W0 3D /r","Valid","Valid","Invalid",=
"SSE4_1","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Compare packed signed=
 dword integers in xmm1 and xmm2/m128 and store packed maximum values in xm=
m1."
+"PMAXUD xmm1, xmm2/m128","LEX.66.0F38.W0 3F /r","Valid","Valid","Invalid",=
"SSE4_1","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Compare packed unsign=
ed dword integers in xmm1 and xmm2/m128 and store packed maximum values in =
xmm1."
+"PMAXUW xmm1, xmm2/m128","LEX.66.0F38.W0 3E /r","Valid","Valid","Invalid",=
"SSE4_1","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Compare packed unsign=
ed word integers in xmm2/m128 and xmm1 and stores maximum packed values in =
xmm1."
+"PMINSB xmm1, xmm2/m128","LEX.66.0F38.W0 38 /r","Valid","Valid","Invalid",=
"SSE4_1","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Compare packed signed=
 byte integers in xmm1 and xmm2/m128 and store packed minimum values in xmm=
1."
+"PMINSD xmm1, xmm2/m128","LEX.66.0F38.W0 39 /r","Valid","Valid","Invalid",=
"SSE4_1","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Compare packed signed=
 dword integers in xmm1 and xmm2/m128 and store packed minimum values in xm=
m1."
+"PMINUD xmm1, xmm2/m128","LEX.66.0F38.W0 3B /r","Valid","Valid","Invalid",=
"SSE4_1","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Compare packed unsign=
ed dword integers in xmm1 and xmm2/m128 and store packed minimum values in =
xmm1."
+"PMINUW xmm1, xmm2/m128","LEX.66.0F38.W0 3A /r","Valid","Valid","Invalid",=
"SSE4_1","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Compare packed unsign=
ed word integers in xmm2/m128 and xmm1 and store packed minimum values in x=
mm1."
+"PMOVSXBD xmm1, xmm2/m32","LEX.66.0F38.W0 21 /r","Valid","Valid","Invalid"=
,"SSE4_1","ModRM:reg (w)","ModRM:r/m (r)","","","","Sign extend 4 packed 8-=
bit integers in the low 4 bytes of xmm2/m32 to 4 packed 32-bit integers in =
xmm1."
+"PMOVSXBQ xmm1, xmm2/m16","LEX.66.0F38.W0 22 /r","Valid","Valid","Invalid"=
,"SSE4_1","ModRM:reg (w)","ModRM:r/m (r)","","","","Sign extend 2 packed 8-=
bit integers in the low 2 bytes of xmm2/m16 to 2 packed 64-bit integers in =
xmm1."
+"PMOVSXBW xmm1, xmm2/m64","LEX.66.0F38.W0 20 /r","Valid","Valid","Invalid"=
,"SSE4_1","ModRM:reg (w)","ModRM:r/m (r)","","","","Sign extend 8 packed 8-=
bit integers in the low 8 bytes of xmm2/m64 to 8 packed 16-bit integers in =
xmm1."
+"PMOVSXDQ xmm1, xmm2/m64","LEX.66.0F38.W0 25 /r","Valid","Valid","Invalid"=
,"SSE4_1","ModRM:reg (w)","ModRM:r/m (r)","","","","Sign extend 2 packed 32=
-bit integers in the low 8 bytes of xmm2/m64 to 2 packed 64-bit integers in=
 xmm1."
+"PMOVSXWD xmm1, xmm2/m64","LEX.66.0F38.W0 23 /r","Valid","Valid","Invalid"=
,"SSE4_1","ModRM:reg (w)","ModRM:r/m (r)","","","","Sign extend 4 packed 16=
-bit integers in the low 8 bytes of xmm2/m64 to 4 packed 32-bit integers in=
 xmm1."
+"PMOVSXWQ xmm1, xmm2/m32","LEX.66.0F38.W0 24 /r","Valid","Valid","Invalid"=
,"SSE4_1","ModRM:reg (w)","ModRM:r/m (r)","","","","Sign extend 2 packed 16=
-bit integers in the low 4 bytes of xmm2/m32 to 2 packed 64-bit integers in=
 xmm1."
+"PMOVZXBD xmm1, xmm2/m32","LEX.66.0F38.W0 31 /r","Valid","Valid","Invalid"=
,"SSE4_1","ModRM:reg (w)","ModRM:r/m (r)","","","","Zero extend 4 packed 8-=
bit integers in the low 4 bytes of xmm2/m32 to 4 packed 32-bit integers in =
xmm1."
+"PMOVZXBQ xmm1, xmm2/m16","LEX.66.0F38.W0 32 /r","Valid","Valid","Invalid"=
,"SSE4_1","ModRM:reg (w)","ModRM:r/m (r)","","","","Zero extend 2 packed 8-=
bit integers in the low 2 bytes of xmm2/m16 to 2 packed 64-bit integers in =
xmm1."
+"PMOVZXBW xmm1, xmm2/m64","LEX.66.0F38.W0 30 /r","Valid","Valid","Invalid"=
,"SSE4_1","ModRM:reg (w)","ModRM:r/m (r)","","","","Zero extend 8 packed 8-=
bit integers in the low 8 bytes of xmm2/m64 to 8 packed 16-bit integers in =
xmm1."
+"PMOVZXDQ xmm1, xmm2/m64","LEX.66.0F38.W0 35 /r","Valid","Valid","Invalid"=
,"SSE4_1","ModRM:reg (w)","ModRM:r/m (r)","","","","Zero extend 2 packed 32=
-bit integers in the low 8 bytes of xmm2/m64 to 2 packed 64-bit integers in=
 xmm1."
+"PMOVZXWD xmm1, xmm2/m64","LEX.66.0F38.W0 33 /r","Valid","Valid","Invalid"=
,"SSE4_1","ModRM:reg (w)","ModRM:r/m (r)","","","","Zero extend 4 packed 16=
-bit integers in the low 8 bytes of xmm2/m64 to 4 packed 32-bit integers in=
 xmm1."
+"PMOVZXWQ xmm1, xmm2/m32","LEX.66.0F38.W0 34 /r","Valid","Valid","Invalid"=
,"SSE4_1","ModRM:reg (w)","ModRM:r/m (r)","","","","Zero extend 2 packed 16=
-bit integers in the low 4 bytes of xmm2/m32 to 2 packed 64-bit integers in=
 xmm1."
+"PMULDQ xmm1, xmm2/m128","LEX.66.0F38.W0 28 /r","Valid","Valid","Invalid",=
"SSE4_1","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Multiply packed signe=
d doubleword integers in xmm1 by packed signed doubleword integers in xmm2/=
m128, and store the quadword results in xmm1."
+"PMULLD xmm1, xmm2/m128","LEX.66.0F38.W0 40 /r","Valid","Valid","Invalid",=
"SSE4_1","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Multiply the packed d=
word signed integers in xmm1 and xmm2/m128 and store the low 32 bits of eac=
h product in xmm1."
+"PTEST xmm1, xmm2/m128","LEX.66.0F38.W0 17 /r","Valid","Valid","Invalid","=
SSE4_1","ModRM:reg (r)","ModRM:r/m (r)","","","","Set ZF if xmm2/m128 AND x=
mm1 result is all 0s. Set CF if xmm2/m128 AND NOT xmm1 result is all 0s."
+"ROUNDPD xmm1, xmm2/m128, ib","LEX.66.0F3A.W0 09 /r ib","Valid","Valid","I=
nvalid","SSE4_1","ModRM:reg (w)","ModRM:r/m (r)","ib","","","Round packed d=
ouble precision floating-point values in xmm2/m128 and place the result in =
xmm1. The rounding mode is determined by ib."
+"ROUNDPS xmm1, xmm2/m128, ib","LEX.66.0F3A.W0 08 /r ib","Valid","Valid","I=
nvalid","SSE4_1","ModRM:reg (w)","ModRM:r/m (r)","ib","","","Round packed s=
ingle precision floating-point values in xmm2/m128 and place the result in =
xmm1. The rounding mode is determined by ib."
+"ROUNDSD xmm1, xmm2/m64, ib","LEX.66.0F3A.W0 0B /r ib","Valid","Valid","In=
valid","SSE4_1","ModRM:reg (w)","ModRM:r/m (r)","ib","","","Round the low p=
acked double precision floating-point value in xmm2/m64 and place the resul=
t in xmm1. The rounding mode is determined by ib."
+"ROUNDSS xmm1, xmm2/m32, ib","LEX.66.0F3A.W0 0A /r ib","Valid","Valid","In=
valid","SSE4_1","ModRM:reg (w)","ModRM:r/m (r)","ib","","","Round the low p=
acked single precision floating-point value in xmm2/m32 and place the resul=
t in xmm1. The rounding mode is determined by ib."
diff --git a/disas/x86-data/x86_sse4_2.csv b/disas/x86-data/x86_sse4_2.csv
new file mode 100644
index 000000000000..660d5d8c612a
--- /dev/null
+++ b/disas/x86-data/x86_sse4_2.csv
@@ -0,0 +1,7 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"PCMPESTRI xmm1, xmm2/m128, ib","LEX.66.0F3A.W0 61 /r ib","Valid","Valid",=
"Invalid","SSE4_2","ModRM:reg (r)","ModRM:r/m (r)","ib","","","Perform a pa=
cked comparison of string data with explicit lengths, generating an index, =
and storing the result in ECX."
+"PCMPESTRM xmm1, xmm2/m128, ib","LEX.66.0F3A.W0 60 /r ib","Valid","Valid",=
"Invalid","SSE4_2","ModRM:reg (r)","ModRM:r/m (r)","ib","","","Perform a pa=
cked comparison of string data with explicit lengths, generating a mask, an=
d storing the result in XMM0."
+"PCMPGTQ xmm1, xmm2/m128","LEX.66.0F38.W0 37 /r","Valid","Valid","Invalid"=
,"SSE4_2","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Compare packed signe=
d qwords in xmm2/m128 and xmm1 for greater than."
+"PCMPISTRI xmm1, xmm2/m128, ib","LEX.66.0F3A.W0 63 /r ib","Valid","Valid",=
"Invalid","SSE4_2","ModRM:reg (r)","ModRM:r/m (r)","ib","","","Perform a pa=
cked comparison of string data with implicit lengths, generating an index, =
and storing the result in ECX."
+"PCMPISTRM xmm1, xmm2/m128, ib","LEX.66.0F3A.W0 62 /r ib","Valid","Valid",=
"Invalid","SSE4_2","ModRM:reg (r)","ModRM:r/m (r)","ib","","","Perform a pa=
cked comparison of string data with implicit lengths, generating a mask, an=
d storing the result in XMM0."
+"PEXTRD r32/m32, xmm2, ib","LEX.66.0F3A.W0 16 /r ib","Valid","Valid","Inva=
lid","SSE4_2","ModRM:r/m (w)","ModRM:reg (r)","ib","","","Extract a dword i=
nteger value from xmm2 at the source dword offset specified by ib into r/m3=
2."
diff --git a/disas/x86-data/x86_sse4_3.csv b/disas/x86-data/x86_sse4_3.csv
new file mode 100644
index 000000000000..f57757ff8f94
--- /dev/null
+++ b/disas/x86-data/x86_sse4_3.csv
@@ -0,0 +1,2 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"PEXTRQ r64/m64, xmm2, ib","LEX.66.0F3A.W1 16 /r ib","Valid","Invalid","In=
valid","SSE4_3","ModRM:r/m (w)","ModRM:reg (r)","ib","","","Extract a qword=
 integer value from xmm2 at the source qword offset specified by ib into r/=
m64."
diff --git a/disas/x86-data/x86_ssse3.csv b/disas/x86-data/x86_ssse3.csv
new file mode 100644
index 000000000000..379014eb5d1a
--- /dev/null
+++ b/disas/x86-data/x86_ssse3.csv
@@ -0,0 +1,33 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"PABSB mm1, mm2/m64","LEX.0F38.W0 1C /r","Valid","Valid","Invalid","SSSE3"=
,"ModRM:reg (w)","ModRM:r/m (r)","","","","Compute the absolute value of by=
tes in mm2/m64 and store UNSIGNED result in mm1."
+"PABSB xmm1, xmm2/m128","LEX.66.0F38.W0 1C /r","Valid","Valid","Invalid","=
SSSE3","ModRM:reg (w)","ModRM:r/m (r)","","","","Compute the absolute value=
 of bytes in xmm2/m128 and store UNSIGNED result in xmm1."
+"PABSD mm1, mm2/m64","LEX.0F38.W0 1E /r","Valid","Valid","Invalid","SSSE3"=
,"ModRM:reg (w)","ModRM:r/m (r)","","","","Compute the absolute value of 32=
-bit integers in mm2/m64 and store UNSIGNED result in mm1."
+"PABSD xmm1, xmm2/m128","LEX.66.0F38.W0 1E /r","Valid","Valid","Invalid","=
SSSE3","ModRM:reg (w)","ModRM:r/m (r)","","","","Compute the absolute value=
 of 32-bit integers in xmm2/m128 and store UNSIGNED result in xmm1."
+"PABSW mm1, mm2/m64","LEX.0F38.W0 1D /r","Valid","Valid","Invalid","SSSE3"=
,"ModRM:reg (w)","ModRM:r/m (r)","","","","Compute the absolute value of 16=
-bit integers in mm2/m64 and store UNSIGNED result in mm1."
+"PABSW xmm1, xmm2/m128","LEX.66.0F38.W0 1D /r","Valid","Valid","Invalid","=
SSSE3","ModRM:reg (w)","ModRM:r/m (r)","","","","Compute the absolute value=
 of 16-bit integers in xmm2/m128 and store UNSIGNED result in xmm1."
+"PALIGNR mm1, mm2/m64, ib","LEX.0F3A.W0 0F /r ib","Valid","Valid","Invalid=
","SSSE3","ModRM:reg (r, w)","ModRM:r/m (r)","ib","","","Concatenate destin=
ation and source operands, extract byte-aligned result shifted to the right=
 by constant value in ib into mm1."
+"PALIGNR xmm1, xmm2/m128, ib","LEX.66.0F3A.W0 0F /r ib","Valid","Valid","I=
nvalid","SSSE3","ModRM:reg (r, w)","ModRM:r/m (r)","ib","","","Concatenate =
destination and source operands, extract byte-aligned result shifted to the=
 right by constant value in ib into xmm1."
+"PHADDD mm1, mm2/m64","LEX.0F38.W0 02 /r","Valid","Valid","Invalid","SSSE3=
","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Add 32-bit integers horizont=
ally, pack to mm1."
+"PHADDD xmm1, xmm2/m128","LEX.66.0F38.W0 02 /r","Valid","Valid","Invalid",=
"SSSE3","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Add 32-bit integers ho=
rizontally, pack to xmm1."
+"PHADDSW mm1, mm2/m64","LEX.0F38.W0 03 /r","Valid","Valid","Invalid","SSSE=
3","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Add 16-bit signed integers =
horizontally, pack saturated integers to mm1."
+"PHADDSW xmm1, xmm2/m128","LEX.66.0F38.W0 03 /r","Valid","Valid","Invalid"=
,"SSSE3","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Add 16-bit signed int=
egers horizontally, pack saturated integers to xmm1."
+"PHADDW mm1, mm2/m64","LEX.0F38.W0 01 /r","Valid","Valid","Invalid","SSSE3=
","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Add 16-bit integers horizont=
ally, pack to mm1."
+"PHADDW xmm1, xmm2/m128","LEX.66.0F38.W0 01 /r","Valid","Valid","Invalid",=
"SSSE3","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Add 16-bit integers ho=
rizontally, pack to xmm1."
+"PHSUBD mm1, mm2/m64","LEX.0F38.W0 06 /r","Valid","Valid","Invalid","SSSE3=
","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Subtract 32-bit signed integ=
ers horizontally, pack to mm1."
+"PHSUBD xmm1, xmm2/m128","LEX.66.0F38.W0 06 /r","Valid","Valid","Invalid",=
"SSSE3","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Subtract 32-bit signed=
 integers horizontally, pack to xmm1."
+"PHSUBSW mm1, mm2/m64","LEX.0F38.W0 07 /r","Valid","Valid","Invalid","SSSE=
3","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Subtract 16-bit signed inte=
ger horizontally, pack saturated integers to mm1."
+"PHSUBSW xmm1, xmm2/m128","LEX.66.0F38.W0 07 /r","Valid","Valid","Invalid"=
,"SSSE3","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Subtract 16-bit signe=
d integer horizontally, pack saturated integers to xmm1."
+"PHSUBW mm1, mm2/m64","LEX.0F38.W0 05 /r","Valid","Valid","Invalid","SSSE3=
","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Subtract 16-bit signed integ=
ers horizontally, pack to mm1."
+"PHSUBW xmm1, xmm2/m128","LEX.66.0F38.W0 05 /r","Valid","Valid","Invalid",=
"SSSE3","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Subtract 16-bit signed=
 integers horizontally, pack to xmm1."
+"PMADDUBSW mm1, mm2/m64","LEX.0F38.W0 04 /r","Valid","Valid","Invalid","SS=
SE3","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Multiply signed and unsig=
ned bytes, add horizontal pair of signed words, pack saturated signed-words=
 to mm1."
+"PMADDUBSW xmm1, xmm2/m128","LEX.66.0F38.W0 04 /r","Valid","Valid","Invali=
d","SSSE3","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Multiply signed and=
 unsigned bytes, add horizontal pair of signed words, pack saturated signed=
-words to xmm1."
+"PMULHRSW mm1, mm2/m64","LEX.0F38.W0 0B /r","Valid","Valid","Invalid","SSS=
E3","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Multiply 16-bit signed wor=
ds, scale and round signed doublewords, pack high 16 bits to mm1."
+"PMULHRSW xmm1, xmm2/m128","LEX.66.0F38.W0 0B /r","Valid","Valid","Invalid=
","SSSE3","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Multiply 16-bit sign=
ed words, scale and round signed doublewords, pack high 16 bits to xmm1."
+"PSHUFB mm1, mm2/m64","LEX.0F38.W0 00 /r","Valid","Valid","Invalid","SSSE3=
","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Shuffle bytes in mm1 accordi=
ng to contents of mm2/m64."
+"PSHUFB xmm1, xmm2/m128","LEX.66.0F38.W0 00 /r","Valid","Valid","Invalid",=
"SSSE3","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Shuffle bytes in xmm1 =
according to contents of xmm2/m128."
+"PSIGNB mm1, mm2/m64","LEX.0F38.W0 08 /r","Valid","Valid","Invalid","SSSE3=
","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Negate/zero/preserve packed =
byte integers in mm1 depending on the corresponding sign in mm2/m64."
+"PSIGNB xmm1, xmm2/m128","LEX.66.0F38.W0 08 /r","Valid","Valid","Invalid",=
"SSSE3","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Negate/zero/preserve p=
acked byte integers in xmm1 depending on the corresponding sign in xmm2/m12=
8."
+"PSIGND mm1, mm2/m64","LEX.0F38.W0 0A /r","Valid","Valid","Invalid","SSSE3=
","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Negate/zero/preserve packed =
doubleword integers in mm1 depending on the corresponding sign in mm2/m128."
+"PSIGND xmm1, xmm2/m128","LEX.66.0F38.W0 0A /r","Valid","Valid","Invalid",=
"SSSE3","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Negate/zero/preserve p=
acked doubleword integers in xmm1 depending on the corresponding sign in xm=
m2/m128."
+"PSIGNW mm1, mm2/m64","LEX.0F38.W0 09 /r","Valid","Valid","Invalid","SSSE3=
","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Negate/zero/preserve packed =
word integers in mm1 depending on the corresponding sign in mm2/m128."
+"PSIGNW xmm1, xmm2/m128","LEX.66.0F38.W0 09 /r","Valid","Valid","Invalid",=
"SSSE3","ModRM:reg (r, w)","ModRM:r/m (r)","","","","Negate/zero/preserve p=
acked word integers in xmm1 depending on the corresponding sign in xmm2/m12=
8."
diff --git a/disas/x86-data/x86_uintr.csv b/disas/x86-data/x86_uintr.csv
new file mode 100644
index 000000000000..7de80b61637f
--- /dev/null
+++ b/disas/x86-data/x86_uintr.csv
@@ -0,0 +1,6 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"CLUI","LEX.F3.0F.W0 01 ee","Valid","Valid","Invalid","UINTR","","","","",=
"","Clear user interrupt flag; user interrupts blocked when user interrupt =
flag cleared."
+"SENDUIPI rw","LEX.F3.0F.W0 c7 /6","Valid","Valid","Invalid","UINTR","ModR=
M:r/m (r)","","","","","Send interprocessor user interrupt."
+"STUI","LEX.F3.0F.W0 01 ef","Valid","Valid","Invalid","UINTR","","","","",=
"","Set user interrupt flag."
+"TESTUI","LEX.F3.0F.W0 01 ed","Valid","Valid","Invalid","UINTR","","","","=
","","Copies the current value of UIF into EFLAGS.CF."
+"UIRET","LEX.F3.0F.W0 01 ec","Valid","Valid","Invalid","UINTR","","","",""=
,"","Return from handling a user interrupt."
diff --git a/disas/x86-data/x86_vaes.csv b/disas/x86-data/x86_vaes.csv
new file mode 100644
index 000000000000..e7dc7f512c31
--- /dev/null
+++ b/disas/x86-data/x86_vaes.csv
@@ -0,0 +1,17 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"VAESDEC xmm1, xmm2, xmm3/m128","EVEX.128.66.0F38.WIG DE /r","Valid","Vali=
d","Invalid","VAES AVX512VL","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)=
","","Full Mem","Perform one round of an AES decryption flow, using the Equ=
ivalent Inverse Cipher, using one 128-bit data (state) from xmm2 with one 1=
28-bit round key from xmm3/m128; store the result in xmm1."
+"VAESDEC ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.WIG DE /r","Valid","Valid=
","Invalid","VAES","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Pe=
rform one round of an AES decryption flow, using the Equivalent Inverse Cip=
her, using two 128-bit data (state) from ymm2 with two 128-bit round keys f=
rom ymm3/m256; store the result in ymm1."
+"VAESDEC ymm1, ymm2, ymm3/m256","EVEX.256.66.0F38.WIG DE /r","Valid","Vali=
d","Invalid","VAES AVX512VL","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)=
","","Full Mem","Perform one round of an AES decryption flow, using the Equ=
ivalent Inverse Cipher, using two 128-bit data (state) from ymm2 with two 1=
28-bit round keys from ymm3/m256; store the result in ymm1."
+"VAESDEC zmm1, zmm2, zmm3/m512","EVEX.512.66.0F38.WIG DE /r","Valid","Vali=
d","Invalid","VAES AVX512VL","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)=
","","Full Mem","Perform one round of an AES decryption flow, using the Equ=
ivalent Inverse Cipher, using four 128-bit data (state) from zmm2 with four=
 128-bit round keys from zmm3/m512; store the result in zmm1."
+"VAESDECLAST xmm1, xmm2, xmm3/m128","EVEX.128.66.0F38.WIG DF /r","Valid","=
Valid","Invalid","VAES AVX512VL","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m=
 (r)","","Full Mem","Perform the last round of an AES decryption flow, usin=
g the Equivalent Inverse Cipher, using one 128-bit data (state) from xmm2 w=
ith one 128-bit round key from xmm3/m128; store the result in xmm1."
+"VAESDECLAST ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.WIG DF /r","Valid","V=
alid","Invalid","VAES","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","",""=
,"Perform the last round of an AES decryption flow, using the Equivalent In=
verse Cipher, using two 128-bit data (state) from ymm2 with two 128-bit rou=
nd keys from ymm3/m256; store the result in ymm1."
+"VAESDECLAST ymm1, ymm2, ymm3/m256","EVEX.256.66.0F38.WIG DF /r","Valid","=
Valid","Invalid","VAES AVX512VL","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m=
 (r)","","Full Mem","Perform the last round of an AES decryption flow, usin=
g the Equivalent Inverse Cipher, using two 128-bit data (state) from ymm2 w=
ith two 128-bit round keys from ymm3/m256; store the result in ymm1."
+"VAESDECLAST zmm1, zmm2, zmm3/m512","EVEX.512.66.0F38.WIG DF /r","Valid","=
Valid","Invalid","VAES AVX512VL","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m=
 (r)","","Full Mem","Perform the last round of an AES decryption flow, usin=
g the Equivalent Inverse Cipher, using four128-bit data (state) from zmm2 w=
ith four 128-bit round keys from zmm3/m512; store the result in zmm1."
+"VAESENC xmm1, xmm2, xmm3/m128","EVEX.128.66.0F38.WIG DC /r","Valid","Vali=
d","Invalid","VAES AVX512VL","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)=
","","Full Mem","Perform one round of an AES encryption flow, using one 128=
-bit data (state) from xmm2 with one 128-bit round key from the xmm3/m128; =
store the result in xmm1."
+"VAESENC ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.WIG DC /r","Valid","Valid=
","Invalid","VAES","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","","","Pe=
rform one round of an AES encryption flow, using two 128-bit data (state) f=
rom ymm2 with two 128-bit round keys from the ymm3/m256; store the result i=
n ymm1."
+"VAESENC ymm1, ymm2, ymm3/m256","EVEX.256.66.0F38.WIG DC /r","Valid","Vali=
d","Invalid","VAES AVX512VL","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)=
","","Full Mem","Perform one round of an AES encryption flow, using two 128=
-bit data (state) from ymm2 with two 128-bit round keys from the ymm3/m256;=
 store the result in ymm1."
+"VAESENC zmm1, zmm2, zmm3/m512","EVEX.512.66.0F38.WIG DC /r","Valid","Vali=
d","Invalid","VAES AVX512VL","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m (r)=
","","Full Mem","Perform one round of an AES encryption flow, using four 12=
8-bit data (state) from zmm2 with four 128-bit round keys from the zmm3/m51=
2; store the result in zmm1."
+"VAESENCLAST xmm1, xmm2, xmm3/m128","EVEX.128.66.0F38.WIG DD /r","Valid","=
Valid","Invalid","VAES AVX512VL","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m=
 (r)","","Full Mem","Perform the last round of an AES encryption flow, usin=
g one 128-bit data (state) from xmm2 with one 128-bit round key from xmm3/m=
128; store the result in xmm1."
+"VAESENCLAST ymm1, ymm2, ymm3/m256","VEX.256.66.0F38.WIG DD /r","Valid","V=
alid","Invalid","VAES","ModRM:reg (w)","VEX.vvvv (r)","ModRM:r/m (r)","",""=
,"Perform the last round of an AES encryption flow, using two 128-bit data =
(state) from ymm2 with two 128-bit round keys from ymm3/m256; store the res=
ult in ymm1."
+"VAESENCLAST ymm1, ymm2, ymm3/m256","EVEX.256.66.0F38.WIG DD /r","Valid","=
Valid","Invalid","VAES AVX512VL","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m=
 (r)","","Full Mem","Perform the last round of an AES encryption flow, usin=
g two 128-bit data (state) from ymm2 with two 128-bit round keys from ymm3/=
m256; store the result in ymm1."
+"VAESENCLAST zmm1, zmm2, zmm3/m512","EVEX.512.66.0F38.WIG DD /r","Valid","=
Valid","Invalid","VAES AVX512VL","ModRM:reg (w)","EVEX.vvvv (r)","ModRM:r/m=
 (r)","","Full Mem","Perform the last round of an AES encryption flow, usin=
g four 128-bit data (state) from zmm2 with four 128-bit round keys from zmm=
3/m512; store the result in zmm1."
diff --git a/disas/x86-data/x86_vmx.csv b/disas/x86-data/x86_vmx.csv
new file mode 100644
index 000000000000..94f83d134f28
--- /dev/null
+++ b/disas/x86-data/x86_vmx.csv
@@ -0,0 +1,14 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"INVEPT r64,m128","LEX.66.0F38.W0 80 /r","Valid","Valid","Invalid","VMX","=
ModRM:reg (r)","ModRM:r/m (r)","","","","Invalidates EPT-derived entries in=
 the TLBs and paging-structure caches"
+"INVVPID r64,m128","LEX.66.0F38.W0 81 /r","Valid","Valid","Invalid","VMX",=
"ModRM:reg (r)","ModRM:r/m (r)","","","","Invalidates entries in the TLBs a=
nd paging-structure caches based on VPID"
+"VMCALL","LEX.0F.W0 01 c1","Valid","Valid","Invalid","VMX","","","","","",=
"Call to VM monitor by causing VM exit."
+"VMCLEAR m64","LEX.66.0F.W0 c7 /6","Valid","Valid","Invalid","VMX","ModRM:=
r/m (r)","","","","","Clear Virtual-Machine Control Structure"
+"VMFUNC","LEX.0F.W0 01 d4","Valid","Valid","Invalid","VMX","RAX (r)","",""=
,"","","Invoke VM function specified in EAX."
+"VMLAUNCH","LEX.0F.W0 01 c2","Valid","Valid","Invalid","VMX","","","","","=
","Launch Virtual Machine"
+"VMPTRLD m64","LEX.0F.W0 c7 /6","Valid","Valid","Invalid","VMX","ModRM:r/m=
 (r)","","","","","Load Pointer to Virtual-Machine Control Structure"
+"VMPTRST m64","LEX.0F.W0 c7 /7","Valid","Valid","Invalid","VMX","ModRM:r/m=
 (w)","","","","","Store Pointer to Virtual-Machine Control Structure"
+"VMREAD r64/m64,r64","LEX.0F.W0 78 /r","Valid","Valid","Invalid","VMX","Mo=
dRM:r/m (w)","ModRM:reg (r)","","","","Read Field from Virtual-Machine Cont=
rol Structure"
+"VMRESUME","LEX.0F.W0 01 c3","Valid","Valid","Invalid","VMX","","","","","=
","Resume Virtual Machine"
+"VMWRITE r64,r64/m64","LEX.0F.W0 79 /r","Valid","Valid","Invalid","VMX","M=
odRM:reg (r)","ModRM:r/m (r)","","","","Write Field to Virtual-Machine Cont=
rol Structure"
+"VMXOFF","LEX.0F.W0 01 c4","Valid","Valid","Invalid","VMX","","","","","",=
"Leave VMX Operation"
+"VMXON m64","LEX.F3.0F.W0 c7 /6","Valid","Valid","Invalid","VMX","ModRM:r/=
m (r)","","","","","Enter VMX Operation"
diff --git a/disas/x86-data/x86_waitpkg.csv b/disas/x86-data/x86_waitpkg.csv
new file mode 100644
index 000000000000..a695148fa0e7
--- /dev/null
+++ b/disas/x86-data/x86_waitpkg.csv
@@ -0,0 +1,4 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"TPAUSE rw","LEX.66.0F.W0 ae /6","Valid","Valid","Invalid","WAITPKG","ModR=
M:r/m (r)","RDX (r)","RAX (r)","","","Directs the processor to enter an imp=
lementation-dependent optimized state until the TSC reaches the value in ED=
X:EAX."
+"UMONITOR rw","LEX.F3.0F.W0 ae /6","Valid","Valid","Invalid","WAITPKG","Mo=
dRM:r/m (r)","","","","","Sets up a linear address range to be monitored by=
 hardware and activates the monitor. The address range should be a write-ba=
ck memory caching type. The address is contained in r16/r32/r64."
+"UMWAIT rw","LEX.F2.0F.W0 ae /6","Valid","Valid","Invalid","WAITPKG","ModR=
M:r/m (r)","RDX (r)","RAX (r)","","","A hint that allows the processor to s=
top instruction execution and enter an implementation-dependent optimized s=
tate until occurrence of a class of events."
diff --git a/disas/x86-data/x86_wbnoinvd.csv b/disas/x86-data/x86_wbnoinvd.=
csv
new file mode 100644
index 000000000000..06882ddd0910
--- /dev/null
+++ b/disas/x86-data/x86_wbnoinvd.csv
@@ -0,0 +1,2 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"WBNOINVD","LEX.F3.0F.W0 09","Valid","Valid","Invalid","WBNOINVD","","",""=
,"","","Write back and do not flush internal caches; initiate writing-back =
without flushing of external caches."
diff --git a/disas/x86-data/x86_x87.csv b/disas/x86-data/x86_x87.csv
new file mode 100644
index 000000000000..1ff1f6ec6bf6
--- /dev/null
+++ b/disas/x86-data/x86_x87.csv
@@ -0,0 +1,145 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"F2XM1","LEX.WN D9 F0","Valid","Valid","Valid","X87","","","","","","Repla=
ce ST(0) with (2 ^ (ST(0)-1))."
+"FABS","LEX.WN D9 E1","Valid","Valid","Valid","X87","","","","","","Replac=
e ST with its absolute value."
+"FADD ST(0), ST(i)","LEX.WN D8 C0+r","Valid","Valid","Valid","X87","ST0 (r=
, w)","opcode +r (r)","","","","Add ST(0) to ST(i) and store result in ST(0=
)."
+"FADD m32fp","LEX.WN D8 /0","Valid","Valid","Valid","X87","ModRM:r/m (r)",=
"","","","","Add m32fp to ST(0) and store result in ST(0)."
+"FADD ST(i), ST(0)","LEX.WN DC C0+r","Valid","Valid","Valid","X87","opcode=
 +r (r, w)","ST0 (r)","","","","Add ST(i) to ST(0) and store result in ST(i=
)."
+"FADD m64fp","LEX.WN DC /0","Valid","Valid","Valid","X87","ModRM:r/m (r)",=
"","","","","Add m64fp to ST(0) and store result in ST(0)."
+"FADDP ST(i), ST(0)","LEX.WN DE C0+r","Valid","Valid","Valid","X87","opcod=
e +r (r, w)","ST0 (r)","","","","Add ST(0) to ST(i), store result in ST(i),=
 and pop the register stack."
+"FBLD m80dec","LEX.WN DF /4","Valid","Valid","Valid","X87","ModRM:r/m (r)"=
,"","","","","Convert BCD value to floating-point and push onto the FPU sta=
ck."
+"FBSTP m80bcd","LEX.WN DF /6","Valid","Valid","Valid","X87","ModRM:r/m (w)=
","","","","","Store ST(0) in m80bcd and pop ST(0)."
+"FCHS","LEX.WN D9 E0","Valid","Valid","Valid","X87","","","","","","Comple=
ments sign of ST(0)."
+"FCLEX","LEX.9B.WN DB E2","Valid","Valid","Valid","X87","","","","","","Cl=
ear floating-point exception flags after checking for pending unmasked floa=
ting-point exceptions."
+"FCMOVB ST(0), ST(i)","LEX.WN DA C0+r","Valid","Valid","Valid","X87","ST0 =
(w)","opcode +r (r)","","","","Move if below (CF=3D1)."
+"FCMOVBE ST(0), ST(i)","LEX.WN DA D0+r","Valid","Valid","Valid","X87","ST0=
 (w)","opcode +r (r)","","","","Move if below or equal (CF=3D1 or ZF=3D1)."
+"FCMOVE ST(0), ST(i)","LEX.WN DA C8+r","Valid","Valid","Valid","X87","ST0 =
(w)","opcode +r (r)","","","","Move if equal (ZF=3D1)."
+"FCMOVNB ST(0), ST(i)","LEX.WN DB C0+r","Valid","Valid","Valid","X87","ST0=
 (w)","opcode +r (r)","","","","Move if not below (CF=3D0)."
+"FCMOVNBE ST(0), ST(i)","LEX.WN DB D0+r","Valid","Valid","Valid","X87","ST=
0 (w)","opcode +r (r)","","","","Move if not below or equal (CF=3D0 and ZF=
=3D0)."
+"FCMOVNE ST(0), ST(i)","LEX.WN DB C8+r","Valid","Valid","Valid","X87","ST0=
 (w)","opcode +r (r)","","","","Move if not equal (ZF=3D0)."
+"FCMOVNU ST(0), ST(i)","LEX.WN DB D8+r","Valid","Valid","Valid","X87","ST0=
 (w)","opcode +r (r)","","","","Move if not unordered (PF=3D0)."
+"FCMOVU ST(0), ST(i)","LEX.WN DA D8+r","Valid","Valid","Valid","X87","ST0 =
(w)","opcode +r (r)","","","","Move if unordered (PF=3D1)."
+"FCOM ST(i)","LEX.WN D8 D0+r","Valid","Valid","Valid","X87","opcode +r (r)=
","ST0 (r)","","","","Compare ST(0) with ST(i)."
+"FCOM m32fp","LEX.WN D8 /2","Valid","Valid","Valid","X87","ModRM:r/m (r)",=
"","","","","Compare ST(0) with m32fp."
+"FCOM m64fp","LEX.WN DC /2","Valid","Valid","Valid","X87","ModRM:r/m (r)",=
"","","","","Compare ST(0) with m64fp."
+"FCOMI ST(0), ST(i)","LEX.WN DB F0+r","Valid","Valid","Valid","X87","ST0 (=
r)","opcode +r (r)","","","","Compare ST(0) with ST(i) and set status flags=
 accordingly."
+"FCOMIP ST(0), ST(i)","LEX.WN DF F0+r","Valid","Valid","Valid","X87","ST0 =
(r)","opcode +r (r)","","","","Compare ST(0) with ST(i), set status flags a=
ccordingly, and pop register stack."
+"FCOMP ST(i)","LEX.WN D8 D8+r","Valid","Valid","Valid","X87","opcode +r (r=
)","ST0 (r)","","","","Compare ST(0) with ST(i) and pop register stack."
+"FCOMP m32fp","LEX.WN D8 /3","Valid","Valid","Valid","X87","ModRM:r/m (r)"=
,"","","","","Compare ST(0) with m32fp and pop register stack."
+"FCOMP m64fp","LEX.WN DC /3","Valid","Valid","Valid","X87","ModRM:r/m (r)"=
,"","","","","Compare ST(0) with m64fp and pop register stack."
+"FCOMPP","LEX.WN DE D9","Valid","Valid","Valid","X87","","","","","","Comp=
are ST(0) with ST(1) and pop register stack twice."
+"FCOS","LEX.WN D9 FF","Valid","Valid","Valid","X87","","","","","","Replac=
e ST(0) with its approximate cosine."
+"FDECSTP","LEX.WN D9 F6","Valid","Valid","Valid","X87","","","","","","Dec=
rement TOP field in FPU status word."
+"FDIV ST(0), ST(i)","LEX.WN D8 F0+r","Valid","Valid","Valid","X87","ST0 (r=
, w)","opcode +r (r)","","","","Divide ST(0) by ST(i) and store result in S=
T(0)."
+"FDIV m32fp","LEX.WN D8 /6","Valid","Valid","Valid","X87","ModRM:r/m (r)",=
"","","","","Divide ST(0) by m32fp and store result in ST(0)."
+"FDIV ST(i), ST(0)","LEX.WN DC F8+r","Valid","Valid","Valid","X87","opcode=
 +r (r, w)","ST0 (r)","","","","Divide ST(i) by ST(0) and store result in S=
T(i)."
+"FDIV m64fp","LEX.WN DC /6","Valid","Valid","Valid","X87","ModRM:r/m (r)",=
"","","","","Divide ST(0) by m64fp and store result in ST(0)."
+"FDIVP ST(i), ST(0)","LEX.WN DE F8+r","Valid","Valid","Valid","X87","opcod=
e +r (r, w)","ST0 (r)","","","","Divide ST(i) by ST(0), store result in ST(=
i), and pop the register stack."
+"FDIVR ST(0), ST(i)","LEX.WN D8 F8+r","Valid","Valid","Valid","X87","ST0 (=
r, w)","opcode +r (r)","","","","Divide ST(i) by ST(0) and store result in =
ST(0)."
+"FDIVR m32fp","LEX.WN D8 /7","Valid","Valid","Valid","X87","ModRM:r/m (r)"=
,"","","","","Divide m32fp by ST(0) and store result in ST(0)."
+"FDIVR ST(i), ST(0)","LEX.WN DC F0+r","Valid","Valid","Valid","X87","opcod=
e +r (r, w)","ST0 (r)","","","","Divide ST(0) by ST(i) and store result in =
ST(i)."
+"FDIVR m64fp","LEX.WN DC /7","Valid","Valid","Valid","X87","ModRM:r/m (r)"=
,"","","","","Divide m64fp by ST(0) and store result in ST(0)."
+"FDIVRP ST(i), ST(0)","LEX.WN DE F0+r","Valid","Valid","Valid","X87","opco=
de +r (r, w)","ST0 (r)","","","","Divide ST(0) by ST(i), store result in ST=
(i), and pop the register stack."
+"FFREE ST(i)","LEX.WN DD C0+r","Valid","Valid","Valid","X87","opcode +r (r=
, w)","","","","","Sets tag for ST(i) to empty."
+"FIADD m32int","LEX.WN DA /0","Valid","Valid","Valid","X87","ModRM:r/m (r)=
","","","","","Add m32int to ST(0) and store result in ST(0)."
+"FIADD m16int","LEX.WN DE /0","Valid","Valid","Valid","X87","ModRM:r/m (r)=
","","","","","Add m16int to ST(0) and store result in ST(0)."
+"FICOM m32int","LEX.WN DA /2","Valid","Valid","Valid","X87","ModRM:r/m (r)=
","","","","","Compare ST(0) with m32int."
+"FICOM m16int","LEX.WN DE /2","Valid","Valid","Valid","X87","ModRM:r/m (r)=
","","","","","Compare ST(0) with m16int."
+"FICOMP m32int","LEX.WN DA /3","Valid","Valid","Valid","X87","ModRM:r/m (r=
)","","","","","Compare ST(0) with m32int and pop stack register."
+"FICOMP m16int","LEX.WN DE /3","Valid","Valid","Valid","X87","ModRM:r/m (r=
)","","","","","Compare ST(0) with m16int and pop stack register."
+"FIDIV m32int","LEX.WN DA /6","Valid","Valid","Valid","X87","ModRM:r/m (r)=
","","","","","Divide ST(0) by m32int and store result in ST(0)."
+"FIDIV m16int","LEX.WN DE /6","Valid","Valid","Valid","X87","ModRM:r/m (r)=
","","","","","Divide ST(0) by m16int and store result in ST(0)."
+"FIDIVR m32int","LEX.WN DA /7","Valid","Valid","Valid","X87","ModRM:r/m (r=
)","","","","","Divide m32int by ST(0) and store result in ST(0)."
+"FIDIVR m16int","LEX.WN DE /7","Valid","Valid","Valid","X87","ModRM:r/m (r=
)","","","","","Divide m16int by ST(0) and store result in ST(0)."
+"FILD m32int","LEX.WN DB /0","Valid","Valid","Valid","X87","ModRM:r/m (r)"=
,"","","","","Push m32int onto the FPU register stack."
+"FILD m16int","LEX.WN DF /0","Valid","Valid","Valid","X87","ModRM:r/m (r)"=
,"","","","","Push m16int onto the FPU register stack."
+"FILD m64int","LEX.WN DF /5","Valid","Valid","Valid","X87","ModRM:r/m (r)"=
,"","","","","Push m64int onto the FPU register stack."
+"FIMUL m32int","LEX.WN DA /1","Valid","Valid","Valid","X87","ModRM:r/m (r)=
","","","","","Multiply ST(0) by m32int and store result in ST(0)."
+"FIMUL m16int","LEX.WN DE /1","Valid","Valid","Valid","X87","ModRM:r/m (r)=
","","","","","Multiply ST(0) by m16int and store result in ST(0)."
+"FINCSTP","LEX.WN D9 F7","Valid","Valid","Valid","X87","","","","","","Inc=
rement the TOP field in the FPU status register."
+"FINIT","LEX.9B.WN DB E3","Valid","Valid","Valid","X87","","","","","","In=
itialize FPU after checking for pending unmasked floating-point exceptions."
+"FIST m32int","LEX.WN DB /2","Valid","Valid","Valid","X87","ModRM:r/m (w)"=
,"","","","","Store ST(0) in m32int."
+"FIST m16int","LEX.WN DF /2","Valid","Valid","Valid","X87","ModRM:r/m (w)"=
,"","","","","Store ST(0) in m16int."
+"FISTP m32int","LEX.WN DB /3","Valid","Valid","Valid","X87","ModRM:r/m (w)=
","","","","","Store ST(0) in m32int and pop register stack."
+"FISTP m16int","LEX.WN DF /3","Valid","Valid","Valid","X87","ModRM:r/m (w)=
","","","","","Store ST(0) in m16int and pop register stack."
+"FISTP m64int","LEX.WN DF /7","Valid","Valid","Valid","X87","ModRM:r/m (w)=
","","","","","Store ST(0) in m64int and pop register stack."
+"FISTTP m32int","LEX.WN DB /1","Valid","Valid","Valid","X87","ModRM:r/m (w=
)","","","","","Store ST(0) in m32int with truncation."
+"FISTTP m64int","LEX.WN DD /1","Valid","Valid","Valid","X87","ModRM:r/m (w=
)","","","","","Store ST(0) in m64int with truncation."
+"FISTTP m16int","LEX.WN DF /1","Valid","Valid","Valid","X87","ModRM:r/m (w=
)","","","","","Store ST(0) in m16int with truncation."
+"FISUB m32int","LEX.WN DA /4","Valid","Valid","Valid","X87","ModRM:r/m (r)=
","","","","","Subtract m32int from ST(0) and store result in ST(0)."
+"FISUB m16int","LEX.WN DE /4","Valid","Valid","Valid","X87","ModRM:r/m (r)=
","","","","","Subtract m16int from ST(0) and store result in ST(0)."
+"FISUBR m32int","LEX.WN DA /5","Valid","Valid","Valid","X87","ModRM:r/m (r=
)","","","","","Subtract ST(0) from m32int and store result in ST(0)."
+"FISUBR m16int","LEX.WN DE /5","Valid","Valid","Valid","X87","ModRM:r/m (r=
)","","","","","Subtract ST(0) from m16int and store result in ST(0)."
+"FLD ST(i)","LEX.WN D9 C0+r","Valid","Valid","Valid","X87","opcode +r (r)"=
,"","","","","Push ST(i) onto the FPU register stack."
+"FLD m32fp","LEX.WN D9 /0","Valid","Valid","Valid","X87","ModRM:r/m (r)","=
","","","","Push m32fp onto the FPU register stack."
+"FLD m80fp","LEX.WN DB /5","Valid","Valid","Valid","X87","ModRM:r/m (r)","=
","","","","Push m80fp onto the FPU register stack."
+"FLD m64fp","LEX.WN DD /0","Valid","Valid","Valid","X87","ModRM:r/m (r)","=
","","","","Push m64fp onto the FPU register stack."
+"FLD1","LEX.WN D9 E8","Valid","Valid","Valid","X87","","","","","","Push +=
1.0 onto the FPU register stack."
+"FLDCW m16","LEX.WN D9 /5","Valid","Valid","Valid","X87","ModRM:r/m (r)","=
","","","","Load FPU control word from m2byte."
+"FLDENV mem","LEX.WN D9 /4","Valid","Valid","Valid","X87","ModRM:r/m (r)",=
"","","","","Load FPU environment from m14byte or m28byte."
+"FLDL2E","LEX.WN D9 EA","Valid","Valid","Valid","X87","","","","","","Push=
 log 2 e onto the FPU register stack."
+"FLDL2T","LEX.WN D9 E9","Valid","Valid","Valid","X87","","","","","","Push=
 log 2 10 onto the FPU register stack."
+"FLDLG2","LEX.WN D9 EC","Valid","Valid","Valid","X87","","","","","","Push=
 log 10 2 onto the FPU register stack."
+"FLDLN2","LEX.WN D9 ED","Valid","Valid","Valid","X87","","","","","","Push=
 log e 2 onto the FPU register stack."
+"FLDPI","LEX.WN D9 EB","Valid","Valid","Valid","X87","","","","","","Push =
Pi onto the FPU register stack."
+"FLDZ","LEX.WN D9 EE","Valid","Valid","Valid","X87","","","","","","Push +=
0.0 onto the FPU register stack."
+"FMUL ST(0), ST(i)","LEX.WN D8 C8+r","Valid","Valid","Valid","X87","ST0 (r=
, w)","opcode +r (r)","","","","Multiply ST(0) by ST(i) and store result in=
 ST(0)."
+"FMUL m32fp","LEX.WN D8 /1","Valid","Valid","Valid","X87","ModRM:r/m (r)",=
"","","","","Multiply ST(0) by m32fp and store result in ST(0)."
+"FMUL ST(i), ST(0)","LEX.WN DC C8+r","Valid","Valid","Valid","X87","opcode=
 +r (r, w)","ST0 (r)","","","","Multiply ST(i) by ST(0) and store result in=
 ST(i)."
+"FMUL m64fp","LEX.WN DC /1","Valid","Valid","Valid","X87","ModRM:r/m (r)",=
"","","","","Multiply ST(0) by m64fp and store result in ST(0)."
+"FMULP ST(i), ST(0)","LEX.WN DE C8+r","Valid","Valid","Valid","X87","opcod=
e +r (r, w)","ST0 (r)","","","","Multiply ST(i) by ST(0), store result in S=
T(i), and pop the register stack."
+"FNCLEX","LEX.WN DB E2","Valid","Valid","Valid","X87","","","","","","Clea=
r floating-point exception flags without checking for pending unmasked floa=
ting-point exceptions."
+"FNDISI","LEX.WN DB E1","Valid","Valid","Valid","X87","","","","","","Trea=
ted as Integer NOP."
+"FNENI","LEX.WN DB E0","Valid","Valid","Valid","X87","","","","","","Treat=
ed as Integer NOP."
+"FNINIT","LEX.WN DB E3","Valid","Valid","Valid","X87","","","","","","Init=
ialize FPU without checking for pending unmasked floating-point exceptions."
+"FNOP","LEX.WN D9 D0","Valid","Valid","Valid","X87","","","","","","No ope=
ration is performed."
+"FNSAVE mem","LEX.WN DD /6","Valid","Valid","Valid","X87","ModRM:r/m (w)",=
"","","","","Store FPU environment to m94byte or m108byte without checking =
for pending unmasked floating- point exceptions. Then re-initialize the FPU=
."
+"FNSETPM","LEX.WN DB E4","Valid","Valid","Valid","X87","","","","","","Tre=
ated as Integer NOP."
+"FNSTCW m16","LEX.WN D9 /7","Valid","Valid","Valid","X87","ModRM:r/m (w)",=
"","","","","Store FPU control word to m2byte without checking for pending =
unmasked floating-point exceptions."
+"FNSTENV mem","LEX.WN D9 /6","Valid","Valid","Valid","X87","ModRM:r/m (w)"=
,"","","","","Store FPU environment to m14byte or m28byte without checking =
for pending unmasked floating- point exceptions. Then mask all floating- po=
int exceptions."
+"FNSTSW m16","LEX.WN DD /7","Valid","Valid","Valid","X87","ModRM:r/m (w)",=
"","","","","Store FPU status word at m2byte without checking for pending u=
nmasked floating-point exceptions."
+"FNSTSW ax","LEX.WN DF E0","Valid","Valid","Valid","X87","RAX (w)","","","=
","","Store FPU status word in AX register without checking for pending unm=
asked floating-point exceptions."
+"FPATAN","LEX.WN D9 F3","Valid","Valid","Valid","X87","","","","","","Repl=
ace ST(1) with arctan(ST(1)/ST(0)) and pop the register stack."
+"FPREM","LEX.WN D9 F8","Valid","Valid","Valid","X87","","","","","","Repla=
ce ST(0) with the remainder obtained from dividing ST(0) by ST(1)."
+"FPREM1","LEX.WN D9 F5","Valid","Valid","Valid","X87","","","","","","Repl=
ace ST(0) with the IEEE remainder obtained from dividing ST(0) by ST(1)."
+"FPTAN","LEX.WN D9 F2","Valid","Valid","Valid","X87","","","","","","Repla=
ce ST(0) with its approximate tangent and push 1 onto the FPU stack."
+"FRNDINT","LEX.WN D9 FC","Valid","Valid","Valid","X87","","","","","","Rou=
nd ST(0) to an integer."
+"FRSTOR mem","LEX.WN DD /4","Valid","Valid","Valid","X87","ModRM:r/m (r)",=
"","","","","Load FPU state from m94byte or m108byte."
+"FSAVE mem","LEX.9B.WN DD /6","Valid","Valid","Valid","X87","ModRM:r/m (w)=
","","","","","Store FPU state to m94byte or m108byte after checking for pe=
nding unmasked floating-point exceptions. Then re-initialize the FPU."
+"FSCALE","LEX.WN D9 FD","Valid","Valid","Valid","X87","","","","","","Scal=
e ST(0) by ST(1)."
+"FSIN","LEX.WN D9 FE","Valid","Valid","Valid","X87","","","","","","Replac=
e ST(0) with the approximate of its sine."
+"FSINCOS","LEX.WN D9 FB","Valid","Valid","Valid","X87","","","","","","Com=
pute the sine and cosine of ST(0); replace ST(0) with the approximate sine,=
 and push the approximate cosine onto the register stack."
+"FSQRT","LEX.WN D9 FA","Valid","Valid","Valid","X87","","","","","","Compu=
tes square root of ST(0) and stores the result in ST(0)."
+"FST m32fp","LEX.WN D9 /2","Valid","Valid","Valid","X87","ModRM:r/m (w)","=
","","","","Copy ST(0) to m32fp."
+"FST ST(i)","LEX.WN DD D0+r","Valid","Valid","Valid","X87","opcode +r (w)"=
,"","","","","Copy ST(0) to ST(i)."
+"FST m64fp","LEX.WN DD /2","Valid","Valid","Valid","X87","ModRM:r/m (w)","=
","","","","Copy ST(0) to m64fp."
+"FSTCW m16","LEX.9B.WN D9 /7","Valid","Valid","Valid","X87","ModRM:r/m (w)=
","","","","","Store FPU control word to m2byte after checking for pending =
unmasked floating-point exceptions."
+"FSTENV mem","LEX.9B.WN D9 /6","Valid","Valid","Valid","X87","ModRM:r/m (w=
)","","","","","Store FPU environment to m14byte or m28byte after checking =
for pending unmasked floating-point exceptions. Then mask all floating-poin=
t exceptions."
+"FSTP m32fp","LEX.WN D9 /3","Valid","Valid","Valid","X87","ModRM:r/m (w)",=
"","","","","Copy ST(0) to m32fp and pop register stack."
+"FSTP m80fp","LEX.WN DB /7","Valid","Valid","Valid","X87","ModRM:r/m (w)",=
"","","","","Copy ST(0) to m80fp and pop register stack."
+"FSTP ST(i)","LEX.WN DD D8+r","Valid","Valid","Valid","X87","opcode +r (w)=
","ST0 (r)","","","","Copy ST(0) to ST(i) and pop register stack.F"
+"FSTP m64fp","LEX.WN DD /3","Valid","Valid","Valid","X87","ModRM:r/m (w)",=
"","","","","Copy ST(0) to m64fp and pop register stack."
+"FSTSW m16","LEX.9B.WN DD /7","Valid","Valid","Valid","X87","ModRM:r/m (w)=
","","","","","Store FPU status word at m2byte after checking for pending u=
nmasked floating-point exceptions."
+"FSTSW ax","LEX.9B.WN DF E0","Valid","Valid","Valid","X87","RAX (w)","",""=
,"","","Store FPU status word in AX register after checking for pending unm=
asked floating-point exceptions."
+"FSUB ST(0), ST(i)","LEX.WN D8 E0+r","Valid","Valid","Valid","X87","ST0 (r=
, w)","opcode +r (r)","","","","Subtract ST(i) from ST(0) and store result =
in ST(0)."
+"FSUB m32fp","LEX.WN D8 /4","Valid","Valid","Valid","X87","ModRM:r/m (r)",=
"","","","","Subtract m32fp from ST(0) and store result in ST(0)."
+"FSUB ST(i), ST(0)","LEX.WN DC E8+r","Valid","Valid","Valid","X87","opcode=
 +r (r, w)","ST0 (r)","","","","Subtract ST(0) from ST(i) and store result =
in ST(i)."
+"FSUB m64fp","LEX.WN DC /4","Valid","Valid","Valid","X87","ModRM:r/m (r)",=
"","","","","Subtract m64fp from ST(0) and store result in ST(0)."
+"FSUBP ST(i), ST(0)","LEX.WN DE E8+r","Valid","Valid","Valid","X87","opcod=
e +r (r, w)","ST0 (r)","","","","Subtract ST(0) from ST(i), store result in=
 ST(i), and pop register stack."
+"FSUBR ST(0), ST(i)","LEX.WN D8 E8+r","Valid","Valid","Valid","X87","ST0 (=
r, w)","opcode +r (r)","","","","Subtract ST(0) from ST(i) and store result=
 in ST(0)."
+"FSUBR m32fp","LEX.WN D8 /5","Valid","Valid","Valid","X87","ModRM:r/m (r)"=
,"","","","","Subtract ST(0) from m32fp and store result in ST(0)."
+"FSUBR ST(i), ST(0)","LEX.WN DC E0+r","Valid","Valid","Valid","X87","opcod=
e +r (r, w)","ST0 (r)","","","","Subtract ST(i) from ST(0) and store result=
 in ST(i)."
+"FSUBR m64fp","LEX.WN DC /5","Valid","Valid","Valid","X87","ModRM:r/m (r)"=
,"","","","","Subtract ST(0) from m64fp and store result in ST(0)."
+"FSUBRP ST(i), ST(0)","LEX.WN DE E0+r","Valid","Valid","Valid","X87","opco=
de +r (r, w)","ST0 (r)","","","","Subtract ST(i) from ST(0), store result i=
n ST(i), and pop register stack."
+"FTST","LEX.WN D9 E4","Valid","Valid","Valid","X87","","","","","","Compar=
e ST(0) with 0.0."
+"FUCOM ST(i)","LEX.WN DD E0+r","Valid","Valid","Valid","X87","opcode +r (r=
)","ST0 (r)","","","","Compare ST(0) with ST(i)."
+"FUCOMI ST(0), ST(i)","LEX.WN DB E8+r","Valid","Valid","Valid","X87","ST0 =
(r)","opcode +r (r)","","","","Compare ST(0) with ST(i), check for ordered =
values, and set status flags accordingly."
+"FUCOMIP ST(0), ST(i)","LEX.WN DF E8+r","Valid","Valid","Valid","X87","ST0=
 (r)","opcode +r (r)","","","","Compare ST(0) with ST(i), check for ordered=
 values, set status flags accordingly, and pop register stack."
+"FUCOMP ST(i)","LEX.WN DD E8+r","Valid","Valid","Valid","X87","opcode +r (=
r)","ST0 (r)","","","","Compare ST(0) with ST(i) and pop register stack."
+"FUCOMPP","LEX.WN DA E9","Valid","Valid","Valid","X87","","","","","","Com=
pare ST(0) with ST(1) and pop register stack twice."
+"FXAM","LEX.WN D9 E5","Valid","Valid","Valid","X87","","","","","","Classi=
fy value or number in ST(0)."
+"FXCH ST(i)","LEX.WN D9 C8+r","Valid","Valid","Valid","X87","opcode +r (r,=
 w)","ST0 (r, w)","","","","Exchange the contents of ST(0) and ST(i)."
+"FXRSTOR mem","LEX.0F.W0 AE /1","Valid","Valid","Valid","X87","ModRM:r/m (=
r, ModRM:[7:6] must not be 11b)","","","","","Restore the x87 FPU, MMX, XMM=
, and MXCSR register state from m512byte."
+"FXSAVE mem","LEX.0F.W0 AE /0","Valid","Valid","Valid","X87","ModRM:r/m (w=
, ModRM:[7:6] must not be 11b)","","","","","Save the x87 FPU, MMX, XMM, an=
d MXCSR register state to m512byte."
+"FXTRACT","LEX.WN D9 F4","Valid","Valid","Valid","X87","","","","","","Sep=
arate value in ST(0) into exponent and significand, store exponent in ST(0)=
, and push the significand onto the register stack."
+"FYL2X","LEX.WN D9 F1","Valid","Valid","Valid","X87","","","","","","Repla=
ce ST(1) with (ST(1) * log ST(0)) and pop the register stack."
+"FYL2XP1","LEX.WN D9 F9","Valid","Valid","Valid","X87","","","","","","Rep=
lace ST(1) with ST(1) * log (ST(0) + 1.0) and pop the register stack."
diff --git a/disas/x86-data/x86_xsaveopt.csv b/disas/x86-data/x86_xsaveopt.=
csv
new file mode 100644
index 000000000000..d64ba7f92f90
--- /dev/null
+++ b/disas/x86-data/x86_xsaveopt.csv
@@ -0,0 +1,3 @@
+"Instruction","Opcode","Valid 64-bit","Valid 32-bit","Valid 16-bit","Featu=
re Flags","Operand 1","Operand 2","Operand 3","Operand 4","Tuple Type","Des=
cription"
+"XSAVEOPT mem","LEX.0F.W0 AE /6","Valid","Valid","Invalid","XSAVEOPT","Mod=
RM:r/m (w)","","","","","Save state components specified by EDX:EAX to mem,=
 optimizing if possible."
+"XSAVEOPT64 mem","LEX.0F.W1 AE /6","Valid","Valid","Invalid","XSAVEOPT","M=
odRM:r/m (w)","","","","","Save state components specified by EDX:EAX to me=
m, optimizing if possible."
--=20
2.43.0
From nobody Fri Apr  4 21:32:29 2025
Delivered-To: importer@patchew.org
Authentication-Results: mx.zohomail.com;
	dkim=fail;
	spf=pass (zohomail.com: domain of gnu.org designates 209.51.188.17 as
 permitted sender)
  smtp.mailfrom=qemu-devel-bounces+importer=patchew.org@nongnu.org;
	dmarc=fail(p=none dis=none)  header.from=anarch128.org
Return-Path: <qemu-devel-bounces+importer=patchew.org@nongnu.org>
Received: from lists.gnu.org (lists.gnu.org [209.51.188.17]) by
 mx.zohomail.com
	with SMTPS id 1739122149781338.55981672106634;
 Sun, 9 Feb 2025 09:29:09 -0800 (PST)
Received: from localhost ([::1] helo=lists1p.gnu.org)
	by lists.gnu.org with esmtp (Exim 4.90_1)
	(envelope-from <qemu-devel-bounces@nongnu.org>)
	id 1thB6E-0004W7-Ip; Sun, 09 Feb 2025 12:28:06 -0500
Received: from eggs.gnu.org ([2001:470:142:3::10])
 by lists.gnu.org with esmtps (TLS1.2:ECDHE_RSA_AES_256_GCM_SHA384:256)
 (Exim 4.90_1) (envelope-from <michael@anarch128.org>)
 id 1thB6D-0004VW-Lc
 for qemu-devel@nongnu.org; Sun, 09 Feb 2025 12:28:05 -0500
Received: from anarch128.org ([2001:4801:7825:104:be76:4eff:fe10:52ae])
 by eggs.gnu.org with esmtps (TLS1.2:ECDHE_RSA_AES_256_GCM_SHA384:256)
 (Exim 4.90_1) (envelope-from <michael@anarch128.org>)
 id 1thB6A-0006Iq-Ao
 for qemu-devel@nongnu.org; Sun, 09 Feb 2025 12:28:04 -0500
Received: from localhost.localdomain (default-rdns.vocus.co.nz
 [202.150.110.104] (may be forged)) (authenticated bits=0)
 by anarch128.org (8.15.2/8.15.2/Debian-22+deb11u3) with ESMTPSA id
 519HRdEp3380282
 (version=TLSv1.3 cipher=TLS_AES_256_GCM_SHA384 bits=256 verify=NO);
 Sun, 9 Feb 2025 17:27:49 GMT
Authentication-Results: anarch128.org; auth=pass;
 dkim=pass (2048-bit rsa key sha256) header.d=anarch128.org
 header.i=@anarch128.org header.b=e3HcQepb header.a=rsa-sha256
 header.s=100003;
 x-return-mx=pass header.domain=anarch128.org policy.is_org=yes (MX Records
 found: mail.anarch128.org);
 x-return-mx=pass smtp.domain=anarch128.org policy.is_org=yes (MX Records
 found: mail.anarch128.org)
DKIM-Signature: v=1; a=rsa-sha256; c=simple/simple; d=anarch128.org;
 s=100003; t=1739122071;
 bh=v2r5+aLWIDg3nxqMxTLpFoUFEZ4FxZUh0mEzUQmI0hw=;
 h=From:To:Cc:Subject:Date:In-Reply-To:References:From;
 b=e3HcQepbtWyhFJ8jlFIzbiQZV0SQzKfWyrswls7GUSyWScBjkXQ25JgdjFZrAZMd9
 dAv9lTpa+adVCD7MKRyd3BxL+6Bdtt7WRevTyKFFKi1ycvcqpkHKlI9uNCraz+8UOm
 E/WaCExAlIcSHf89jTIdmpVrEego0/Kf9N5X+d74dbFkPgjqUgCIlV0Ou5qgGxyDhJ
 6mr5OL9pdEKaWy+3nRyEf3Bg8Ynq0Gxq1xLHIhyuNMR+KmuvJcPXOZYWz9bDCQgTYJ
 IcfENMIyuT1qG7z32fJIZTCijAyswhRQHk1CP88gg/DolKdSEf427juAvQe+9SIg9h
 /sMnnPKIxjMBA==
From: Michael Clark <michael@anarch128.org>
To: qemu-devel@nongnu.org, Richard Henderson <richard.henderson@linaro.org>,
 Eduardo Habkost <eduardo@habkost.net>,
 Paolo Bonzini <pbonzini@redhat.com>, Zhao Liu <zhao1.liu@intel.com>
Cc: Michael Clark <michael@anarch128.org>
Subject: [PATCH v2 2/4] x86-disas: add x86-mini metadata documentation
Date: Mon, 10 Feb 2025 06:26:54 +1300
Message-ID: <20250209172656.1466556-3-michael@anarch128.org>
X-Mailer: git-send-email 2.43.0
In-Reply-To: <20250209172656.1466556-1-michael@anarch128.org>
References: <20250209172656.1466556-1-michael@anarch128.org>
MIME-Version: 1.0
Content-Transfer-Encoding: quoted-printable
Received-SPF: pass (zohomail.com: domain of gnu.org designates 209.51.188.17
 as permitted sender) client-ip=209.51.188.17;
 envelope-from=qemu-devel-bounces+importer=patchew.org@nongnu.org;
 helo=lists.gnu.org;
Received-SPF: pass client-ip=2001:4801:7825:104:be76:4eff:fe10:52ae;
 envelope-from=michael@anarch128.org; helo=anarch128.org
X-Spam_score_int: -16
X-Spam_score: -1.7
X-Spam_bar: -
X-Spam_report: (-1.7 / 5.0 requ) BAYES_00=-1.9, DKIM_INVALID=0.1,
 DKIM_SIGNED=0.1, SPF_HELO_PASS=-0.001,
 SPF_PASS=-0.001 autolearn=no autolearn_force=no
X-Spam_action: no action
X-BeenThere: qemu-devel@nongnu.org
X-Mailman-Version: 2.1.29
Precedence: list
List-Id: <qemu-devel.nongnu.org>
List-Unsubscribe: <https://lists.nongnu.org/mailman/options/qemu-devel>,
 <mailto:qemu-devel-request@nongnu.org?subject=unsubscribe>
List-Archive: <https://lists.nongnu.org/archive/html/qemu-devel>
List-Post: <mailto:qemu-devel@nongnu.org>
List-Help: <mailto:qemu-devel-request@nongnu.org?subject=help>
List-Subscribe: <https://lists.nongnu.org/mailman/listinfo/qemu-devel>,
 <mailto:qemu-devel-request@nongnu.org?subject=subscribe>
Errors-To: qemu-devel-bounces+importer=patchew.org@nongnu.org
Sender: qemu-devel-bounces+importer=patchew.org@nongnu.org
X-ZohoMail-DKIM: fail (Header signature does not verify)
X-ZM-MESSAGEID: 1739122151341019000
Content-Type: text/plain; charset="utf-8"

add detailed information on the instruction opcode encoding
format for LEX/VEX/EVEX prefix, map and opcode encoding, the
operand encoding format, the field order encoding format and
notes on instruction synthesis for parameterized opcodes.

Signed-off-by: Michael Clark <michael@anarch128.org>
---
 docs/x86-metadata.txt | 303 ++++++++++++++++++++++++++++++++++++++++++
 1 file changed, 303 insertions(+)
 create mode 100644 docs/x86-metadata.txt

diff --git a/docs/x86-metadata.txt b/docs/x86-metadata.txt
new file mode 100644
index 000000000000..ce96cedfe100
--- /dev/null
+++ b/docs/x86-metadata.txt
@@ -0,0 +1,303 @@
+x86 Instruction Set Metadata
+=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=
=3D=3D=3D=3D
+
+Legacy x86 instructions have been parameterized in the instruction set
+metadata using a new LEX prefix for instruction encoding with abstract wid=
th
+suffix codes that synthesize multiple instruction widths using combinations
+of operand size prefixes and `REX.W` bits. This new LEX format makes legacy
+instruction encodings consistent with VEX and EVEX encodings as well as
+eliminating some redundancy in the metadata.
+
+There are a small number of special cases for legacy instructions which ne=
ed
+mode-dependent overrides for cases such as, a different opcode is used for
+different modes, or the instruction has a quirk where the operand size does
+not follow the default rules for instruction word and address sizes:
+
+- `.wx` is used to specify 64-bit instructions that default to 32-bit
+  operands in 64-bit mode.
+- `.ww` is used to specify 64-bit instructions that default to 64-bit
+  operands in 64-bit mode.
+- `.o16` is used to specify an instruction override specific to 16-bit mod=
e.
+- `.o32` is used to specify an instruction override specific to 32-bit mod=
e.
+- `.o64` is used to specify an instruction override specific to 64-bit mod=
e.
+
+CSV File Format
+=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D
+
+The instruction set metadata in the `disas/x86-data` directory has the
+following fields which map to instruction encoding tables in the Intel
+Architecture Software Developer's Manual:
+
+- _Instruction_: opcode and operands from Opcode/Instruction column.
+- _Opcode_: instruction encoding from Opcode/Instruction column.
+- _Valid 64-bit_: 64-bit valid field from 64/32 bit Mode Support column.
+- _Valid 32-bit_: 32-bit valid field from 64/32 bit Mode Support column.
+- _Valid 16-bit_: 16-bit valid field from Compat/Legacy Mode column.
+- _Feature Flags_: extension name from CPUID Feature Flag column.
+- _Operand 1_: Operand 1 column from Instruction Operand Encoding table.
+- _Operand 2_: Operand 2 column from Instruction Operand Encoding table.
+- _Operand 3_: Operand 3 column from Instruction Operand Encoding table.
+- _Operand 4_: Operand 4 column from Instruction Operand Encoding table.
+- _Tuple Type_: Tuple Type column from Instruction Operand Encoding table.
+
+The instruction set metadata in the `data` directory is derived from
+[x86-csv](https://github.com/GregoryComer/x86-csv), although it has had
+extensive modifications to fix transcription errors, to revise legacy
+instruction encodings to conform to the new LEX format, as well as add
+missing details such as missing operands or recently added AVX-512
+instruction encodings and various other instruction set extensions.
+
+Table Generation
+=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D
+
+The appendices outline the printable form of the mnemonics used in the
+generated tables to describe operands, instruction encodings and field ord=
er.
+The mnemonics are referenced in the instruction set metadata files which a=
re
+translated to enums and arrays by `scripts/x86-tablegen.py` which then map=
 to
+the enum type and set definitions in `disas/x86.h`:
+
+- _enum x86_opr_ - operand encoding enum type and set attributes.
+- _enum x86_enc_ - instruction encoding enum type and set attributes.
+- _enum x86_ord_ - operand to instruction encoding field map set attribute=
s.
+
+The enum values are combined together with _logical or_ combinations to
+form the primary metadata tables used by the encoder and decoder library:
+
+- _struct x86_opc_data_ - table type for instruction opcode encodings.
+- _struct x86_opr_data_ - table type for unique sets of instruction operan=
ds.
+- _struct x86_ord_data_ - table type for unique sets of instruction field =
orders.
+
+***Note***: There are some differences between the mnemonics used in the
+CSV metadata and the C enums. Exceptions are described in `operand_map` and
+`opcode_map` within `scripts/x86_tablegen.py`. The primary differences are
+in the names used in the operand columns to indicate operand field order,
+otherwise a type prefix is added, dots and brackets are omitted, and forwa=
rd
+slashes are translated to underscores.
+
+Appendices
+=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D
+
+This section describes the mnemonics used in the primary data structures:
+
+- _Appendix A - Operand Encoding_ - describes instruction operands.
+- _Appendix B - Operand Order_ - describes instruction field ordering.
+- _Appendix C - Instruction Encoding Prefixes_ - describes encoding prefix=
es.
+- _Appendix D - Instruction Encoding Suffixes_ - describes encoding suffix=
es.
+- _Appendix E - Instruction Synthesis Notes_ - notes on prefix synthesis.
+
+Appendix A - Operand Encoding
+=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=
=3D=3D=3D=3D=3D
+
+This table outlines the operand mnemonics used in instruction operands
+_(enum x86_opr)_.
+
+| operand            | description                                        =
   |
+|:-------------------|:---------------------------------------------------=
---|
+| `r`                | integer register                                   =
   |
+| `v`                | vector register                                    =
   |
+| `k`                | mask register                                      =
   |
+| `seg`              | segment register                                   =
   |
+| `creg`             | control register                                   =
   |
+| `dreg`             | debug register                                     =
   |
+| `bnd`              | bound register                                     =
   |
+| `mem`              | memory reference                                   =
   |
+| `rw`               | integer register word-sized (16/32/64 bit)         =
   |
+| `ra`               | integer register addr-sized (16/32/64 bit)         =
   |
+| `mw`               | memory reference word-sized (16/32/64 bit)         =
   |
+| `mm`               | vector register 64-bit                             =
   |
+| `xmm`              | vector register 128-bit                            =
   |
+| `ymm`              | vector register 256-bit                            =
   |
+| `zmm`              | vector register 512-bit                            =
   |
+| `r8`               | register 8-bit                                     =
   |
+| `r16`              | register 16-bit                                    =
   |
+| `r32`              | register 32-bit                                    =
   |
+| `r64`              | register 64-bit                                    =
   |
+| `m8`               | memory reference 8-bit byte                        =
   |
+| `m16`              | memory reference 16-bit word                       =
   |
+| `m32`              | memory reference 32-bit dword                      =
   |
+| `m64`              | memory reference 64-bit qword                      =
   |
+| `m128`             | memory reference 128-bit oword/xmmword             =
   |
+| `m256`             | memory reference 256-bit ymmword                   =
   |
+| `m512`             | memory reference 512-bit zmmword                   =
   |
+| `m80`              | memory reference 80-bit tword/tbyte                =
   |
+| `m384`             | memory reference 384-bit key locker handle         =
   |
+| `mib`              | memory reference bound                             =
   |
+| `m16bcst`          | memory reference 16-bit word broadcast             =
   |
+| `m32bcst`          | memory reference 32-bit word broadcast             =
   |
+| `m64bcst`          | memory reference 64-bit word broadcast             =
   |
+| `vm32`             | vector memory 32-bit                               =
   |
+| `vm64`             | vector memory 64-bit                               =
   |
+| `{er}`             | operand suffix - embedded rounding control         =
   |
+| `{k}`              | operand suffix - apply mask register               =
   |
+| `{sae}`            | operand suffix - suppress all execptions           =
   |
+| `{z}`              | operand suffix - zero instead of merge             =
   |
+| `{rs2}`            | operand suffix - register stride 2                 =
   |
+| `{rs4}`            | operand suffix - register stride 4                 =
   |
+| `r/m8`             | register unsized memory 8-bit                      =
   |
+| `r/m16`            | register unsized memory 16-bit                     =
   |
+| `r/m32`            | register unsized memory 32-bit                     =
   |
+| `r/m64`            | register unsized memory 64-bit                     =
   |
+| `k/m8`             | mask register memory 8-bit                         =
   |
+| `k/m16`            | mask register memory 16-bit                        =
   |
+| `k/m32`            | mask register memory 32-bit                        =
   |
+| `k/m64`            | mask register memory 64-bit                        =
   |
+| `bnd/m64`          | bound register memory 64-bit                       =
   |
+| `bnd/m128`         | bound register memory 128-bit                      =
   |
+| `rw/mw`            | register or memory 16/32/64-bit (word size)        =
   |
+| `r8/m8`            | 8-bit register 8-bit memory                        =
   |
+| `r?/m?`            | N-bit register N-bit memory                        =
   |
+| `mm/m?`            | 64-bit vector N-bit memory                         =
   |
+| `xmm/m?`           | 128-bit vector N-bit memory                        =
   |
+| `ymm/m?`           | 256-bit vector N-bit memory                        =
   |
+| `zmm/m?`           | 512-bit vector N-bit memory                        =
   |
+| `xmm/m?/m?bcst`    | 128-bit vector N-bit memory N-bit broadcast        =
   |
+| `ymm/m?/m?bcst`    | 256-bit vector N-bit memory N-bit broadcast        =
   |
+| `zmm/m?/m?bcst`    | 512-bit vector N-bit memory N-bit broadcast        =
   |
+| `vm32x`            | 32-bit vector memory in xmm                        =
   |
+| `vm32y`            | 32-bit vector memory in ymm                        =
   |
+| `vm32z`            | 32-bit vector memory in zmm                        =
   |
+| `vm64x`            | 64-bit vector memory in xmm                        =
   |
+| `vm64y`            | 64-bit vector memory in ymm                        =
   |
+| `vm64z`            | 64-bit vector memory in zmm                        =
   |
+| `st0`              | implicit register st0                              =
   |
+| `st1`              | implicit register st1                              =
   |
+| `es`               | implicit segment es                                =
   |
+| `cs`               | implicit segment cs                                =
   |
+| `ss`               | implicit segment ss                                =
   |
+| `ds`               | implicit segment ds                                =
   |
+| `fs`               | implicit segment fs                                =
   |
+| `gs`               | implicit segment gs                                =
   |
+| `aw`               | implicit register (ax/eax/rax)                     =
   |
+| `cw`               | implicit register (cx/ecx/rcx)                     =
   |
+| `dw`               | implicit register (dx/edx/rdx)                     =
   |
+| `bw`               | implicit register (bx/ebx/rbx)                     =
   |
+| `pa`               | implicit indirect register (ax/eax/rax)            =
   |
+| `pc`               | implicit indirect register (cx/ecx/rcx)            =
   |
+| `pd`               | implicit indirect register (dx/edx/rdx)            =
   |
+| `pb`               | implicit indirect register (bx/ebx/rbx)            =
   |
+| `psi`              | implicit indirect register (si/esi/rsi)            =
   |
+| `pdi`              | implicit indirect register (di/edi/rdi)            =
   |
+| `xmm0`             | implicit register xmm0                             =
   |
+| `xmm0_7`           | implicit registers xmm0-xmm7                       =
   |
+| `1`                | constant 1                                         =
   |
+| `ib`               | 8-bit immediate                                    =
   |
+| `iw`               | 16-bit or 32-bit immediate (mode + operand size)   =
   |
+| `iwd`              | 16-bit or 32-bit immediate (mode)                  =
   |
+| `id`               | 32-bit immediate                                   =
   |
+| `iq`               | 64-bit immediate                                   =
   |
+| `rel8`             | 8-bit displacement                                 =
   |
+| `relw`             | 6-bit or 32-bit displacement (mode + operand size) =
   |
+| `moffs`            | indirect memory offset                             =
   |
+| `far16/16`         | 16-bit seg 16-bit far displacement                 =
   |
+| `far16/32`         | 16-bit seg 32-bit far displacement                 =
   |
+| `memfar16/16`      | indirect 16-bit seg 16-bit far displacement        =
   |
+| `memfar16/32`      | indirect 16-bit seg 32-bit far displacement        =
   |
+| `memfar16/64`      | indirect 16-bit seg 64-bit far displacement        =
   |
+
+Appendix B - Operand Order
+=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=
=3D=3D
+
+This table outlines the mnemonics used to map operand field order
+_(enum x86_ord)_.
+
+| mnemonic | description                                                  =
   |
+|:---------|:-------------------------------------------------------------=
---|
+| `imm`    | ib, iw, i16, i32, i64                                        =
   |
+| `reg`    | modrm.reg                                                    =
   |
+| `mrm`    | modrm.r/m                                                    =
   |
+| `sib`    | modrm.r/m sib                                                =
   |
+| `is4`    | register from ib                                             =
   |
+| `ime`    | i8, i16 (special case for CALLF/JMPF/ENTER)                  =
   |
+| `vec`    | VEX.vvvv                                                     =
   |
+| `opr`    | opcode +r                                                    =
   |
+| `one`    | constant 1                                                   =
   |
+| `rax`    | constant al/ax/eax/rax                                       =
   |
+| `rcx`    | constant cl/cx/ecx/rcx                                       =
   |
+| `rdx`    | constant dl/dx/edx/rdx                                       =
   |
+| `rbx`    | constant bl/bx/ebx/rbx                                       =
   |
+| `rsp`    | constant sp/esp/rsp                                          =
   |
+| `rbp`    | constant bp/ebp/rbp                                          =
   |
+| `rsi`    | constant si/esi/rsi                                          =
   |
+| `rdi`    | constant di/edi/rdi                                          =
   |
+| `st0`    | constant st(0)                                               =
   |
+| `stx`    | constant st(i)                                               =
   |
+| `seg`    | constant segment                                             =
   |
+| `xmm0`   | constant xmm0                                                =
   |
+| `xmm0_7` | constant xmm0-xmm7                                           =
   |
+| `mxcsr`  | constant mxcsr                                               =
   |
+| `rflags` | constant rflags                                              =
   |
+
+Appendix C - Instruction Encoding Prefixes
+=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=
=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D
+
+This table outlines the mnemonic prefixes used in instruction encodings
+_(enum x86_enc)_.
+
+| mnemonic | description                                                  =
   |
+|:---------|:-------------------------------------------------------------=
---|
+| `lex`    | legacy instruction                                           =
   |
+| `vex`    | VEX encoded instruction                                      =
   |
+| `evex`   | EVEX encoded instruction                                     =
   |
+| `.lz`    | VEX encoding L=3D0 and L=3D1 is unassigned                   =
       |
+| `.l0`    | VEX encoding L=3D0                                           =
     |
+| `.l1`    | VEX encoding L=3D1                                           =
     |
+| `.lig`   | VEX/EVEX encoding ignores length L=3Dany                     =
     |
+| `.128`   | VEX/EVEX encoding uses 128-bit vector L=3D0                  =
     |
+| `.256`   | VEX/EVEX encoding uses 256-bit vector L=3D1                  =
     |
+| `.512`   | EVEX encoding uses 512-bit vector L=3D2                      =
     |
+| `.66`    | prefix byte 66 is used for opcode mapping                    =
   |
+| `.f2`    | prefix byte f2 is used for opcode mapping                    =
   |
+| `.f3`    | prefix byte f3 is used for opcode mapping                    =
   |
+| `.9b`    | prefix byte 9b is used for opcode mapping (x87 only)         =
   |
+| `.0f`    | map 0f is used in opcode                                     =
   |
+| `.0f38`  | map 0f38 is used in opcode                                   =
   |
+| `.0f3a`  | map 0f3a is used in opcode                                   =
   |
+| `.wn`    | no register extension, fixed operand size                    =
   |
+| `.wb`    | register extension, fixed operand size                       =
   |
+| `.wx`    | REX and/or operand size extension, optional 66 or REX.W0/W1  =
   |
+| `.ww`    | REX and/or operand size extension, optional 66 and REX.WIG   =
   |
+| `.w0`    | LEX/VEX/EVEX optional REX W0 with operand size used in opcode=
   |
+| `.w1`    | LEX/VEX/EVEX mandatory REX W1 with operand size used in opcod=
e  |
+| `.wig`   | VEX/EVEX encoding width ignored                              =
   |
+
+Appendix D - Instruction Encoding Suffixes
+=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=
=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D
+
+This table outlines the mnemonic suffixes used in instruction encodings
+_(enum x86_enc)_.
+
+| mnemonic | description                                                  =
   |
+|:---------|:-------------------------------------------------------------=
---|
+| `/r`     | ModRM byte                                                   =
   |
+| `/0../7` | ModRM byte with 'r' field used for functions 0 to 7          =
   |
+| `XX+r`   | opcode byte with 3-bit register added to the opcode          =
   |
+| `XX`     | opcode byte                                                  =
   |
+| `ib`     | 8-bit immediate                                              =
   |
+| `iw`     | 16-bit or 32-bit immediate (real mode XOR operand size)      =
   |
+| `i16`    | 16-bit immediate                                             =
   |
+| `i32`    | 32-bit immediate                                             =
   |
+| `i64`    | 64-bit immediate                                             =
   |
+| `o16`    | encoding uses prefix 66 in 32-bit and 64-bit modes           =
   |
+| `o32`    | encoding uses prefix 66 in 16-bit mode                       =
   |
+| `o64`    | encoding is used exclusively in 64-bit mode with REX.W=3D1   =
     |
+| `a16`    | encoding uses prefix 67 in 32-bit and 64-bit modes           =
   |
+| `a32`    | encoding uses prefix 67 in 16-bit mode                       =
   |
+| `a64`    | encoding is used exclusively in 64-bit mode                  =
   |
+| `lock`   | memory operand encodings can be used with the LOCK prefix    =
   |
+| `rep`    | string instructions that can be used with the REP prefix     =
   |
+
+Appendix E - Instruction Synthesis Notes
+=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=
=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D=3D
+
+The `.wx` and `.ww` mnemonics are used to synthesize prefix combinations:
+
+- `.wx` labels opcodes with _default 32-bit operand size in 64-bit mode_
+  to synthesize 16/32/64-bit versions using REX and operand size prefix,
+  or in 16/32-bit modes synthesizes 16/32-bit versions using only the
+  operand size prefix. REX is used for register extension on opcodes
+  with `rw` or `rw/mw` operands or fixed register operands like `aw`.
+- `.ww` labels opcodes with _default 64-bit operand size in 64-bit mode_
+  to synthesize 16/64-bit versions using only the operand size prefix,
+  or in 16/32-bit modes. synthesizes 16/32-bit versions using only the
+  operand size prefix. REX is used for register extension on opcodes
+  with `rw` or `rw/mw` operands or fixed register operands like `aw`.
--=20
2.43.0
From nobody Fri Apr  4 21:32:29 2025
Delivered-To: importer@patchew.org
Authentication-Results: mx.zohomail.com;
	dkim=fail;
	spf=pass (zohomail.com: domain of gnu.org designates 209.51.188.17 as
 permitted sender)
  smtp.mailfrom=qemu-devel-bounces+importer=patchew.org@nongnu.org;
	dmarc=fail(p=none dis=none)  header.from=anarch128.org
Return-Path: <qemu-devel-bounces+importer=patchew.org@nongnu.org>
Received: from lists.gnu.org (lists.gnu.org [209.51.188.17]) by
 mx.zohomail.com
	with SMTPS id 1739122131067305.6129282857663;
 Sun, 9 Feb 2025 09:28:51 -0800 (PST)
Received: from localhost ([::1] helo=lists1p.gnu.org)
	by lists.gnu.org with esmtp (Exim 4.90_1)
	(envelope-from <qemu-devel-bounces@nongnu.org>)
	id 1thB6D-0004Vo-OI; Sun, 09 Feb 2025 12:28:05 -0500
Received: from eggs.gnu.org ([2001:470:142:3::10])
 by lists.gnu.org with esmtps (TLS1.2:ECDHE_RSA_AES_256_GCM_SHA384:256)
 (Exim 4.90_1) (envelope-from <michael@anarch128.org>)
 id 1thB6C-0004VM-1D
 for qemu-devel@nongnu.org; Sun, 09 Feb 2025 12:28:04 -0500
Received: from anarch128.org ([2001:4801:7825:104:be76:4eff:fe10:52ae])
 by eggs.gnu.org with esmtps (TLS1.2:ECDHE_RSA_AES_256_GCM_SHA384:256)
 (Exim 4.90_1) (envelope-from <michael@anarch128.org>)
 id 1thB67-0006K0-HP
 for qemu-devel@nongnu.org; Sun, 09 Feb 2025 12:28:03 -0500
Received: from localhost.localdomain (default-rdns.vocus.co.nz
 [202.150.110.104] (may be forged)) (authenticated bits=0)
 by anarch128.org (8.15.2/8.15.2/Debian-22+deb11u3) with ESMTPSA id
 519HRdEq3380282
 (version=TLSv1.3 cipher=TLS_AES_256_GCM_SHA384 bits=256 verify=NO);
 Sun, 9 Feb 2025 17:27:51 GMT
Authentication-Results: anarch128.org; auth=pass;
 dkim=pass (2048-bit rsa key sha256) header.d=anarch128.org
 header.i=@anarch128.org header.b=Il23nKOa header.a=rsa-sha256
 header.s=100003;
 x-return-mx=pass header.domain=anarch128.org policy.is_org=yes (MX Records
 found: mail.anarch128.org);
 x-return-mx=pass smtp.domain=anarch128.org policy.is_org=yes (MX Records
 found: mail.anarch128.org)
DKIM-Signature: v=1; a=rsa-sha256; c=simple/simple; d=anarch128.org;
 s=100003; t=1739122074;
 bh=PEtAsmbyszmqdfXjdSl1GSic99FuRpUMJux4kROZ2A4=;
 h=From:To:Cc:Subject:Date:In-Reply-To:References:From;
 b=Il23nKOafKtAAd0aK2yjOFfV8nd43K/gX/IYqweUj4g6VDgeTOURI4+yKqDNkzgS7
 Wapa6dJz6fnuSy/y16/hPK++j5C9H9ozjS/E0Nv1DwMKOt4hTOKgMuuy7rCqRbwD8y
 Wzk/HaLf2cJ0tMxQ38uPivhwqOe3jE4r6I2Pd3wLWd66mUiDURG8FEqdz56htYifkh
 5ejkT9Fg/07kFXnvvA0AX1ZJhSJh/KSZtgpNdKUB3hg0/huelr1RFfoF+u4ZD+nZLE
 LBE/X4tSMzIWhYSx088JMh5y5bUg8KghtlSPQPRJBz1bulTYtuQCalIHkv6mbMO0uS
 AKYZdHVU9H7nA==
From: Michael Clark <michael@anarch128.org>
To: qemu-devel@nongnu.org, Richard Henderson <richard.henderson@linaro.org>,
 Eduardo Habkost <eduardo@habkost.net>,
 Paolo Bonzini <pbonzini@redhat.com>, Zhao Liu <zhao1.liu@intel.com>
Cc: Michael Clark <michael@anarch128.org>
Subject: [PATCH v2 3/4] x86-disas: add x86-mini metadata tablegen script
Date: Mon, 10 Feb 2025 06:26:55 +1300
Message-ID: <20250209172656.1466556-4-michael@anarch128.org>
X-Mailer: git-send-email 2.43.0
In-Reply-To: <20250209172656.1466556-1-michael@anarch128.org>
References: <20250209172656.1466556-1-michael@anarch128.org>
MIME-Version: 1.0
Content-Transfer-Encoding: quoted-printable
Received-SPF: pass (zohomail.com: domain of gnu.org designates 209.51.188.17
 as permitted sender) client-ip=209.51.188.17;
 envelope-from=qemu-devel-bounces+importer=patchew.org@nongnu.org;
 helo=lists.gnu.org;
Received-SPF: pass client-ip=2001:4801:7825:104:be76:4eff:fe10:52ae;
 envelope-from=michael@anarch128.org; helo=anarch128.org
X-Spam_score_int: -16
X-Spam_score: -1.7
X-Spam_bar: -
X-Spam_report: (-1.7 / 5.0 requ) BAYES_00=-1.9, DKIM_INVALID=0.1,
 DKIM_SIGNED=0.1, SPF_HELO_PASS=-0.001,
 SPF_PASS=-0.001 autolearn=no autolearn_force=no
X-Spam_action: no action
X-BeenThere: qemu-devel@nongnu.org
X-Mailman-Version: 2.1.29
Precedence: list
List-Id: <qemu-devel.nongnu.org>
List-Unsubscribe: <https://lists.nongnu.org/mailman/options/qemu-devel>,
 <mailto:qemu-devel-request@nongnu.org?subject=unsubscribe>
List-Archive: <https://lists.nongnu.org/archive/html/qemu-devel>
List-Post: <mailto:qemu-devel@nongnu.org>
List-Help: <mailto:qemu-devel-request@nongnu.org?subject=help>
List-Subscribe: <https://lists.nongnu.org/mailman/listinfo/qemu-devel>,
 <mailto:qemu-devel-request@nongnu.org?subject=subscribe>
Errors-To: qemu-devel-bounces+importer=patchew.org@nongnu.org
Sender: qemu-devel-bounces+importer=patchew.org@nongnu.org
X-ZohoMail-DKIM: fail (Header signature does not verify)
X-ZM-MESSAGEID: 1739122135687019000
Content-Type: text/plain; charset="utf-8"

the x86-mini metadata tablegen python script reads instruction
set metadata CSV files and translates them into tables used
by the disassembler. it generates the following tables:

- x86_opc_table that encodes prefix, map, and opcode
- x86_opr_table that encodes instruction operands
- x86_ord_table that encodes operand field order
- x86 register enum and string table
- x86 opcode enum and string table

Signed-off-by: Michael Clark <michael@anarch128.org>
---
 scripts/x86-tablegen.py | 693 ++++++++++++++++++++++++++++++++++++++++
 1 file changed, 693 insertions(+)
 create mode 100755 scripts/x86-tablegen.py

diff --git a/scripts/x86-tablegen.py b/scripts/x86-tablegen.py
new file mode 100755
index 000000000000..6d6a0916fb36
--- /dev/null
+++ b/scripts/x86-tablegen.py
@@ -0,0 +1,693 @@
+#!/usr/bin/env python3
+#
+# Copyright (c) 2024-2025 Michael Clark
+#
+# Permission is hereby granted, free of charge, to any person obtaining a
+# copy of this software and associated documentation files (the "Software"=
),
+# to deal in the Software without restriction, including without limitation
+# the rights to use, copy, modify, merge, publish, distribute, sublicense,
+# and/or sell copies of the Software, and to permit persons to whom the
+# Software is furnished to do so, subject to the following conditions:
+#
+# The above copyright notice and this permission notice shall be included
+# in all copies or substantial portions of the Software.
+#
+# THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS
+# OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILI=
TY,
+# FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL
+# THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR
+# OTHER LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE,
+# ARISING FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR
+# OTHER DEALINGS IN THE SOFTWARE.
+
+import re
+import sys
+import csv
+import glob
+import string
+import argparse
+
+gpr_bh =3D ["ah", "ch", "dh", "bh"]
+gpr_b =3D ["al", "cl", "dl", "bl", "spl", "bpl", "sil", "dil"]
+gpr_w =3D ["ax", "cx", "dx", "bx", "sp", "bp", "si", "di"]
+gpr_d =3D ["eax", "ecx", "edx", "ebx", "esp", "ebp", "esi", "edi"]
+gpr_q =3D ["rax", "rcx", "rdx", "rbx", "rsp", "rbp", "rsi", "rdi"]
+seg_r =3D ["es", "cs", "ss", "ds", "fs", "gs", "seg6", "seg7"]
+sys_r =3D ["rip", "rflags","fpcsr", "mxcsr"]
+sys_n =3D ["none"]
+
+cc_all =3D [ 'EQ', 'NEQ', 'GT', 'NLE', 'GE', 'NLT', 'LT', 'NGE', 'LE', 'NG=
T',
+                        'A',  'NBE', 'AE', 'NB',  'B',  'NAE', 'BE', 'NA' ]
+cc_signed =3D [ 'EQ', 'GE', 'GT', 'LE', 'LT', 'NEQ', 'NGT', 'NLE', 'NLT' ]
+cc_unsigned =3D [ 'EQ', 'AE', 'A',  'BE', 'B',  'NEQ', 'NA',  'NBE', 'NB' ]
+
+def gen_range(fmt,f,s,e):
+    t =3D []
+    for i in range(s,e):
+        t +=3D [[i, fmt % i, f]]
+    return t
+
+def gen_list(l,f,start):
+    t =3D []
+    for i, s in enumerate(l):
+        t +=3D [[i + start, s, f]]
+    return t
+
+def gen_sep():
+    return [[0, "", ""]]
+
+def reg_table():
+    t =3D []
+    t +=3D gen_list(gpr_bh, "reg_bl", 4)
+    t +=3D gen_sep()
+    t +=3D gen_list(gpr_b, "reg_b", 0)
+    t +=3D gen_range("r%db", "reg_b", 8, 32)
+    t +=3D gen_sep()
+    t +=3D gen_list(gpr_w, "reg_w", 0)
+    t +=3D gen_range("r%dw", "reg_w", 8, 32)
+    t +=3D gen_sep()
+    t +=3D gen_list(gpr_d, "reg_d", 0)
+    t +=3D gen_range("r%dd", "reg_d", 8, 32)
+    t +=3D gen_sep()
+    t +=3D gen_list(gpr_q, "reg_q", 0)
+    t +=3D gen_range("r%d", "reg_q", 8, 32)
+    t +=3D gen_sep()
+    t +=3D gen_range("mm%d", "reg_mmx", 0, 8)
+    t +=3D gen_sep()
+    t +=3D gen_range("xmm%d", "reg_xmm", 0, 32)
+    t +=3D gen_sep()
+    t +=3D gen_range("ymm%d", "reg_ymm", 0, 32)
+    t +=3D gen_sep()
+    t +=3D gen_range("zmm%d", "reg_zmm", 0, 32)
+    t +=3D gen_sep()
+    t +=3D gen_range("k%d", "reg_kmask", 0, 8)
+    t +=3D gen_sep()
+    t +=3D gen_range("st(%d)", "reg_fpu", 0, 8)
+    t +=3D gen_sep()
+    t +=3D gen_range("bnd%d", "reg_bnd", 0, 8)
+    t +=3D gen_sep()
+    t +=3D gen_range("dr%d", "reg_dreg", 0, 16)
+    t +=3D gen_sep()
+    t +=3D gen_range("cr%d", "reg_creg", 0, 16)
+    t +=3D gen_sep()
+    t +=3D gen_list(seg_r, "reg_sreg", 0)
+    t +=3D gen_sep()
+    t +=3D gen_list(sys_r, "reg_sys", 0)
+    t +=3D gen_sep()
+    t +=3D gen_list(sys_n, "reg_sys", 31)
+    return t
+
+operand_map =3D {
+    '1'                                                     : 'one/r',
+    'RAX (r)'                                               : 'rax/r',
+    'RAX (r, w)'                                            : 'rax/rw',
+    'RAX (w)'                                               : 'rax/w',
+    'RCX (r)'                                               : 'rcx/r',
+    'RCX (r, w)'                                            : 'rcx/rw',
+    'RCX (w)'                                               : 'rcx/w',
+    'RDX (r)'                                               : 'rdx/r',
+    'RDX (r, w)'                                            : 'rdx/rw',
+    'RDX (w)'                                               : 'rdx/w',
+    'RBX (r)'                                               : 'rbx/r',
+    'RBX (r, w)'                                            : 'rbx/rw',
+    'RBX (w)'                                               : 'rbx/w',
+    'RSI (r)'                                               : 'rsi/r',
+    'RSI (r, w)'                                            : 'rsi/rw',
+    'RSI (w)'                                               : 'rsi/w',
+    'RDI (r)'                                               : 'rdi/r',
+    'RDI (r, w)'                                            : 'rdi/rw',
+    'RDI (w)'                                               : 'rdi/w',
+    'ST0 (r)'                                               : 'st0/r',
+    'ST0 (r, w)'                                            : 'st0/rw',
+    'ST0 (w)'                                               : 'st0/w',
+    'STX (r)'                                               : 'stx/r',
+    'STX (r, w)'                                            : 'stx/rw',
+    'STX (w)'                                               : 'stx/w',
+    'SEG (r)'                                               : 'seg/r',
+    'SEG (r, w)'                                            : 'seg/rw',
+    'SEG (w)'                                               : 'seg/w',
+    'RSP (r, w, i)'                                         : 'rsp/rwi',
+    'RBP (r, w, i)'                                         : 'rbp/rwi',
+    'MXCSR (r, i)'                                          : 'mxcsr/ri',
+    'MXCSR (w, i)'                                          : 'mxcsr/wi',
+    'RFLAGS (r, i)'                                         : 'rflags/ri',
+    'RFLAGS (w, i)'                                         : 'rflags/wi',
+    'ModRM:reg (r)'                                         : 'reg/r',
+    'ModRM:reg (r, w)'                                      : 'reg/rw',
+    'ModRM:reg (w)'                                         : 'reg/w',
+    'ModRM:r/m (r)'                                         : 'mrm/r',
+    'ModRM:r/m (r, w)'                                      : 'mrm/rw',
+    'ModRM:r/m (w)'                                         : 'mrm/w',
+    'ModRM:r/m (r, ModRM:[7:6] must be 11b)'                : 'mrm/r',
+    'ModRM:r/m (r, ModRM:[7:6] must not be 11b)'            : 'mrm/r',
+    'ModRM:r/m (w, ModRM:[7:6] must not be 11b)'            : 'mrm/w',
+    'ModRM:r/m (r, w, ModRM:[7:6] must not be 11b)'         : 'mrm/rw',
+    'BaseReg (r): VSIB:base, VectorReg (r): VSIB:index'     : 'sib/r',
+    'SIB.base (r): Address of pointer SIB.index (r)'        : 'sib/r',
+    'EVEX.vvvv (r)'                                         : 'vec/r',
+    'EVEX.vvvv (w)'                                         : 'vec/w',
+    'VEX.vvvv (r)'                                          : 'vec/r',
+    'VEX.vvvv (r, w)'                                       : 'vec/rw',
+    'VEX.vvvv (w)'                                          : 'vec/w',
+    'ib'                                                    : 'imm',
+    'iw'                                                    : 'imm',
+    'iwd'                                                   : 'imm',
+    'i16'                                                   : 'imm',
+    'i32'                                                   : 'imm',
+    'i64'                                                   : 'imm',
+    'imm'                                                   : 'imm',
+    'ime'                                                   : 'ime',
+    'ib[3:0]'                                               : 'imm',
+    'ib[7:4]'                                               : 'is4/r',
+    'Implicit XMM0 (r)'                                     : 'xmm0/r',
+    'Implicit XMM0-7 (r, w)'                                : 'xmm0_7/rw',
+    'opcode +r (r)'                                         : 'opr/r',
+    'opcode +r (r, w)'                                      : 'opr/rw',
+    'opcode +r (w)'                                         : 'opr/w',
+    'NA'                                                    : None,
+    ''                                                      : None
+}
+
+opcode_map =3D {
+    '<xmm0>'  : 'reg_xmm0',
+    '<xmm0-7>': 'reg_xmm0_7',
+    '1'       : '1',
+    'm'       : 'mem',
+    'al'      : 'reg_al',
+    'cl'      : 'reg_cl',
+    'ah'      : 'reg_ah',
+    'aw'      : 'reg_aw',
+    'cw'      : 'reg_cw',
+    'dw'      : 'reg_dw',
+    'bw'      : 'reg_bw',
+    'ax'      : 'reg_ax',
+    'cx'      : 'reg_cx',
+    'dx'      : 'reg_dx',
+    'bx'      : 'reg_bx',
+    'eax'     : 'reg_eax',
+    'ecx'     : 'reg_ecx',
+    'edx'     : 'reg_edx',
+    'ebx'     : 'reg_ebx',
+    'rax'     : 'reg_rax',
+    'rcx'     : 'reg_rcx',
+    'rdx'     : 'reg_rdx',
+    'rbx'     : 'reg_rbx',
+    'si'      : 'reg_si',
+    'di'      : 'reg_di',
+    'pa'      : 'reg_pa',
+    'pc'      : 'reg_pc',
+    'pd'      : 'reg_pd',
+    'pb'      : 'reg_pb',
+    'psi'     : 'reg_psi',
+    'pdi'     : 'reg_pdi',
+    'cs'      : 'seg_cs',
+    'ds'      : 'seg_ds',
+    'ss'      : 'seg_ss',
+    'es'      : 'seg_es',
+    'fs'      : 'seg_fs',
+    'gs'      : 'seg_gs',
+    'sreg'    : 'seg',
+    'dr0-dr7' : 'dreg',
+    'cr0-cr15': 'creg',
+    'cr8'     : 'creg8',
+    'st(0)'   : 'reg_st0',
+    'st(1)'   : 'reg_st1',
+    'st(i)'   : 'st'
+}
+
+def x86_mode(row):
+    l =3D list()
+    if row['Valid 64-bit'] =3D=3D 'Valid':
+        l.append('64')
+    if row['Valid 32-bit'] =3D=3D 'Valid':
+        l.append('32')
+    if row['Valid 16-bit'] =3D=3D 'Valid':
+        l.append('16')
+    return "/".join(l)
+
+def x86_operand(opcode,row):
+    l =3D list()
+    opcode =3D opcode.split(' ')[0]
+    operand1 =3D operand_map[row['Operand 1']]
+    operand2 =3D operand_map[row['Operand 2']]
+    operand3 =3D operand_map[row['Operand 3']]
+    operand4 =3D operand_map[row['Operand 4']]
+    if operand1:
+        l +=3D [operand1]
+    if operand2:
+        l +=3D [operand2]
+    if operand3:
+        l +=3D [operand3]
+    if operand4:
+        l +=3D [operand4]
+    return ",".join(l)
+
+def cleanup_oprs(args):
+    args =3D list(map(lambda x : x.lstrip().rstrip(), args.split(",")))
+    args =3D list(map(lambda x : x.replace('&',':'), args))
+    args =3D list(map(lambda x : x.replace('{k1}','{k}'), args))
+    args =3D list(map(lambda x : x.lower(), args))
+    args =3D list(map(lambda x : opcode_map[x] if x in opcode_map else x, =
args))
+    for reg in ('r32', 'r64'):
+        for suffix in ('a', 'b'):
+            args =3D list(map(lambda x : x.replace(reg + suffix, reg), arg=
s))
+    args =3D list(map(lambda x : 'rw' if x =3D=3D 'r' else x, args))
+    args =3D list(map(lambda x : 'rw/mw' if x =3D=3D 'r/m' else x, args))
+    for reg in ('k', 'bnd', 'mm', 'xmm', 'ymm', 'zmm'):
+        for i in range(0,5):
+            args =3D list(map(lambda x : x.replace(reg + str(i), reg) \
+                if x.find(reg) =3D=3D 0 else x, args))
+    args =3D list(map(lambda x : x.replace(' ', ''), args))
+    return args
+
+def split_opcode(opcode):
+    space_idx =3D opcode.find(' ')
+    if space_idx =3D=3D -1:
+        return (opcode,list())
+    else:
+        return (opcode[:space_idx], cleanup_oprs(opcode[space_idx:]))
+
+def cleanup_opcode(opcode):
+    op, args =3D split_opcode(opcode)
+    if len(args) > 0:
+        return "%s %s " % (op, ",".join(args))
+    else:
+        return op
+
+def cleanup_encoding(enc):
+    enc =3D enc.lower()
+    enc =3D enc.replace('/is4', 'ib')
+    enc =3D enc.replace('0f 38', '0f38')
+    enc =3D enc.replace('0f 3a', '0f3a')
+    enc =3D enc.replace('  ', ' ')
+    return enc
+
+def translate_modes(modes):
+    modelist =3D []
+    if modes =3D=3D '':
+        return '0'
+    for m in modes.split('/'):
+        modelist +=3D ['x86_modes_%s' % m]
+    return "|".join(modelist)
+
+# add 9b, del rex rex.w
+def translate_encoding(enc):
+    prefixes =3D [ 'hex', 'lex', 'vex', 'evex' ]
+    r_suffixes =3D [ 'rep', 'lock', 'norexb' ]
+    s_suffixes =3D [ 'o16', 'o32', 'o64', 'a16', 'a32', 'a64' ]
+    pbytes =3D [ '66', '9b', 'f2', 'f3' ]
+    maps =3D { '0f', '0f38', '0f3a', 'map4', 'map5', 'map6' }
+    widths =3D { 'w0', 'w1', 'wig', 'wb', 'wn', 'ws', 'wx', 'ww' }
+    lengths =3D { 'lig', 'lz', 'l0', 'l1', '128', '256', '512' }
+    flags =3D { 'nds', 'ndd', 'dds' }
+    imm =3D { 'ib', 'iw', 'iwd', 'i16', 'i32', 'i64' }
+    mods =3D { '/r', '/0', '/1', '/2', '/3', '/4', '/5', '/6', '/7' }
+    pl =3D []
+    opc =3D ['0x00','0x00']
+    opm =3D ['0x00','0x00']
+    oplen =3D 0
+    has_imm, has_pfx, has_pbyte, has_map =3D False, False, False, False
+    comps =3D enc.split(" ")
+    for el in comps:
+        is_hex =3D all(c in string.hexdigits for c in el[0:2])
+        p =3D None
+        for sel in prefixes:
+            if el.find(sel) =3D=3D 0 and ( p =3D=3D None or len(sel) > len=
(p) ):
+                p =3D sel
+        if p:
+            pl +=3D ['x86_enc_t_%s' % p.replace('.', '_')]
+            el =3D el[len(p):]
+            vp, vm, vw, vl, vf =3D None, None, None, None, None
+            for sel in el.split('.'):
+                if sel =3D=3D '':
+                    pass
+                elif sel in pbytes:
+                    vp =3D 'x86_enc_p_%s' % sel
+                elif sel in maps:
+                    vm =3D 'x86_enc_m_%s' % sel
+                elif sel in widths:
+                    vw =3D 'x86_enc_w_%s' % sel
+                elif sel in lengths:
+                    vl =3D 'x86_enc_l_%s' % sel
+                elif sel in flags:
+                    vf =3D 'x86_enc_f_%s' % sel
+                else:
+                    raise Exception("unknown element '%s' for encoding"
+                        " '%s" % (sel, enc))
+            if vp:
+                pl +=3D [vp]
+            if vm:
+                pl +=3D [vm]
+            if vw:
+                pl +=3D [vw]
+            if vl:
+                pl +=3D [vl]
+            if vf:
+                pl +=3D [vf]
+            if p =3D=3D 'vex' or p =3D=3D 'evex' or p =3D=3D 'lex':
+                has_pfx =3D True
+        elif el in maps and len(comps) > 1 and not (has_map or has_pfx):
+            pl +=3D ['x86_enc_m_%s' % el]
+            has_map =3D True
+        elif el in r_suffixes:
+            pl +=3D ['x86_enc_r_%s' % el]
+        elif el in s_suffixes:
+            pl +=3D ['x86_enc_s_%s' % el]
+        elif el in imm:
+            if has_imm:
+                # additional immediate used by CALLF/JMPF/ENTER
+                if el in { 'ib', 'i16' }:
+                    pl +=3D ['x86_enc_j_%s' % el]
+                else:
+                    raise Exception("illegal immediate '%s' for encoding"
+                        " '%s" % (el, enc))
+            else:
+                pl +=3D ['x86_enc_i_%s' % el]
+                has_imm =3D True
+        elif el in mods:
+            if oplen =3D=3D 2:
+                raise Exception("opcode '%s' limit exceeded for encoding"
+                    " '%s" % (el, enc))
+            pl +=3D ['x86_enc_f_modrm_r' if el =3D=3D '/r' else 'x86_enc_f=
_modrm_n']
+            if el !=3D '/r':
+                opc[oplen] =3D '0x{:02x}'.format(int(el[1]) << 3)
+                opm[oplen] =3D '0x38'
+            oplen +=3D 1
+        elif len(el) =3D=3D 2 and is_hex:
+            if oplen =3D=3D 2:
+                raise Exception("opcode '%s' limit exceeded for encoding"
+                    " '%s" % (el, enc))
+            if oplen =3D=3D 1:
+                pl +=3D ['x86_enc_f_opcode']
+            opc[oplen] =3D '0x%s' % el[0:2]
+            opm[oplen] =3D '0xff'
+            oplen +=3D 1
+        elif len(el) =3D=3D 4 and is_hex and el[2:4] =3D=3D '+r':
+            if oplen =3D=3D 2:
+                raise Exception("opcode '%s' limit exceeded for encoding "
+                    "'%s" % (el, enc))
+            pl +=3D ['x86_enc_%s_opcode_r' % ('o' if oplen =3D=3D 0 else '=
f')]
+            opc[oplen] =3D '0x%s' % el[0:2]
+            opm[oplen] =3D '0xf8'
+            oplen +=3D 1
+        else:
+            raise Exception("unknown element '%s' for encoding "
+                "'%s" % (el, enc))
+    return "|".join(pl), opc, opm
+
+def translate_operands(operands):
+    oprlist =3D []
+    typpat =3D re.compile('([if])(\\d+)x(\\d+)')
+    for i,arg0 in enumerate(operands):
+        flags =3D arg0.split('{')
+        argcomps =3D []
+        for j,arg1 in enumerate(flags):
+            cp =3D arg1.find('}')
+            if cp =3D=3D -1:
+                arg1 =3D arg1.replace(':','_')
+                argp =3D []
+                for arg2 in arg1.split('/'):
+                    m =3D typpat.match(arg2)
+                    if m:
+                        argcomps +=3D ['x86_opr_' + arg2]
+                    else:
+                        argp +=3D [arg2]
+                argcomps +=3D ['x86_opr_' + '_'.join(argp)]
+            else:
+                arg1 =3D arg1.replace('}','')
+                argcomps +=3D ['x86_opr_flag_' + arg1]
+        oprlist +=3D ["|".join(argcomps)]
+    return oprlist
+
+def translate_order(order):
+    ol =3D []
+    if order:
+        for o in order.split(','):
+            o =3D o.replace(':','_')
+            ol.append("|".join(map(lambda x: 'x86_ord_' + x, o.split('/'))=
))
+    return ol
+
+def print_insn(x86_insn):
+    for row in x86_insn:
+        opcode, enc, modes, ext, order, tt, desc =3D row
+        opcode =3D opcode.replace('reg_','')
+        print("| %-53s | %-31s | %-23s | %-8s |" % \
+            (opcode, enc, order, modes))
+
+def opcode_list(x86_insn):
+    ops =3D set()
+    for row in x86_insn:
+        opcode, enc, modes, ext, order, tt, desc =3D row
+        op, opr =3D split_opcode(opcode)
+        ops.add(op)
+    return ['NIL'] + sorted(ops)
+
+def operand_list(x86_insn):
+    oprset =3D set()
+    for idx, row in enumerate(x86_insn):
+        opcode, enc, modes, ext, order, tt, desc =3D row
+        op, opr =3D split_opcode(opcode)
+        oprset.add(tuple(translate_operands(opr)))
+    return sorted(oprset)
+
+def order_list(x86_insn):
+    ordset =3D set()
+    for idx, row in enumerate(x86_insn):
+        opcode, enc, modes, ext, order, tt, desc =3D row
+        ordset.add(tuple(translate_order(order)))
+    return sorted(ordset)
+
+opcode_enums_template =3D """/* generated source */
+enum x86_reg\n{%s};
+enum x86_op\n{%s};"""
+
+opcode_table_template =3D """/* generated source */
+const size_t x86_opc_table_size =3D %d;
+const size_t x86_opr_table_size =3D %d;
+const size_t x86_ord_table_size =3D %d;
+const size_t x86_op_names_size =3D %d;
+const x86_opc_data x86_opc_table[] =3D\n{
+  { x86_op_NIL, 0, 0, 0, 0, { { 0, 0 } }, { { 0, 0 } } },%s};
+const x86_opr_data x86_opr_table[] =3D\n{%s};
+const x86_ord_data x86_ord_table[] =3D\n{%s};
+const char* x86_op_names[] =3D\n{%s};
+const char* x86_reg_names[512] =3D\n{%s};"""
+
+def print_opcode_enums(x86_reg, x86_insn):
+    regstr, opstr =3D '\n', '\n'
+    for i,s,f in x86_reg:
+        n =3D s.replace('(','').replace(')','')
+        regstr +=3D '\n' if len(s) =3D=3D 0 else \
+            '  %-10s =3D %s,\n' % ('x86_%s' % n, 'x86_%s | %d' % (f, i))
+    for op in opcode_list(x86_insn):
+        opstr +=3D '    x86_op_%s,\n' % op
+    print(opcode_enums_template % (regstr, opstr))
+
+def print_opcode_tables(x86_reg, x86_insn):
+    oplist =3D opcode_list(x86_insn)
+    oprlist =3D operand_list(x86_insn)
+    ordlist =3D order_list(x86_insn)
+    oprmap =3D {v: i for i, v in enumerate(oprlist)}
+    ordmap =3D {v: i for i, v in enumerate(ordlist)}
+    opcstr, oprstr, ordstr, opsstr, regstr =3D '\n', '\n', '\n', '\n', '\n'
+    for idx, row in enumerate(x86_insn):
+        opcode, enc, modes, ext, order, tt, desc =3D row
+        op, opr =3D split_opcode(opcode)
+        oprl =3D translate_operands(opr)
+        ordl =3D translate_order(order)
+        oprc =3D oprmap[tuple(oprl)]
+        ordc =3D ordmap[tuple(ordl)]
+        modes =3D translate_modes(modes)
+        enc, opc, opm =3D translate_encoding(enc)
+        opcstr +=3D '  { %s, %s, %d, %d, %s, { %s }, { %s } },\n' % \
+            ('x86_op_%s' % op, modes, oprc, ordc, enc,
+                '{ %s, %s }' % (opc[0], opc[1]),
+                '{ %s, %s }' % (opm[0], opm[1]))
+    for x in oprlist:
+        oprstr +=3D '  { { %s } },\n' % (", ".join(['0'] if not x else x))
+    for x in ordlist:
+        ordstr +=3D '  { { %s } },\n' % (", ".join(['0'] if not x else x))
+    for op in oplist:
+        opsstr +=3D '    "' + op.lower() + '",\n'
+    for i,s,f in x86_reg:
+        n =3D s.replace('(','').replace(')','')
+        regstr +=3D '\n' if len(s) =3D=3D 0 else \
+                  '    %-12s =3D \"%s\",\n' % ('[x86_%s]' % n, s)
+    print(opcode_table_template % (
+        len(x86_insn) + 1, len(oprlist), len(ordlist), len(oplist),
+        opcstr, oprstr, ordstr, opsstr, regstr)
+    )
+
+def read_data(files):
+    data =3D []
+    if not isinstance(files, list):
+        files =3D glob.glob(files)
+    for csvpath in files:
+        file =3D open(csvpath, encoding=3D'utf-8-sig', newline=3D'')
+        reader =3D csv.DictReader(file, delimiter=3D',', quotechar=3D'"')
+        for row in reader:
+            data +=3D [row]
+    data.sort(key=3Dlambda x: (
+            x['Instruction'].split(' ')[0],
+            x['Opcode'].split(' ')[1],
+            x['Instruction']))
+    insn =3D []
+    for row in data:
+        opcode =3D cleanup_opcode(row['Instruction'])
+        enc =3D cleanup_encoding(row['Opcode'])
+        modes =3D x86_mode(row)
+        ext =3D row['Feature Flags']
+        order =3D x86_operand(opcode,row)
+        tt =3D row['Tuple Type']
+        desc =3D row['Description']
+        insn +=3D [[opcode, enc, modes, ext, order, tt, desc]]
+    return insn
+
+def parse_table(rows):
+    rows =3D [row.strip() for row in rows]
+    data =3D []
+    obj =3D []
+    h1 =3D None
+    begun =3D False
+    for row in rows:
+        if row.startswith("#"):
+            space =3D row.index(' ')
+            hashes =3D row[:space]
+            heading =3D row[space+1:]
+            depth =3D hashes.count('#')
+            if not h1:
+                h1 =3D heading
+            obj.append(TableSection(heading, depth))
+        elif row.startswith("|"):
+            cells =3D row.split('|')
+            cells =3D [cell.strip() for cell in cells if cell.strip()]
+            if cells[0].startswith("-") or cells[0].startswith(":"):
+                begun =3D True
+                obj.append(TableHeader())
+            elif begun:
+                data.append(cells)
+                obj.append(TableData(cells))
+        else:
+            begun =3D False
+            obj.append(TableText(row))
+    return { 'title': h1, 'data': data, 'obj': obj }
+
+def read_file(file_path):
+    try:
+        with open(file_path, 'r') as file:
+            lines =3D file.readlines()
+            lines =3D [line.strip() for line in lines]
+        return lines
+    except FileNotFoundError:
+        print(f"File not found: {file_path}")
+        return []
+
+def make_map(x86_insn):
+    insn_map =3D dict()
+    for row in x86_insn:
+        opcode, enc, modes, ext, order, tt, desc =3D row
+        op, opr =3D split_opcode(opcode)
+        if op not in insn_map:
+            insn_map[op] =3D list()
+        insn_map[op].append(row)
+    return insn_map
+
+#
+# description table types
+#
+class TableText():
+    def __init__(self,text):
+        self.text =3D text
+class TableSection():
+    def __init__(self,heading,depth):
+        self.heading =3D heading
+        self.depth =3D depth
+class TableHeader():
+    def __init__(self):
+        return
+class TableData():
+    def __init__(self,cells):
+        self.cells =3D cells
+
+#
+# print descriptions with instructions
+#
+def table_text_insn(self,x86_desc):
+    return ""
+def table_section_insn(self,x86_desc):
+    return "%s %s\n\n" % ("#" * self.depth, self.heading)
+def table_header_insn(self,x86_desc):
+    return ""
+def table_data_insn(self,x86_desc):
+    insn_map =3D x86_desc['insn']
+    insn, desc =3D self.cells
+    text =3D ""
+    insn_list =3D []
+    o =3D insn.find("cc")
+    if insn.startswith("v"):
+        insn_list.append(insn[1:])
+        insn_list.append(insn.upper())
+    elif o >=3D 0:
+        for cc in cc_all:
+            new_insn =3D '%s%s%s' % (insn[0:o], cc, insn[o+2:])
+            insn_list.append(new_insn)
+    else:
+        insn_list.append(insn)
+    if len(insn_list) > 0:
+        text +=3D "\n"
+        text +=3D "| %-51s | %-29s | %-23s | %-8s |\n" % \
+            ("opcode", "encoding", "order", "modes")
+        text +=3D "|:%-51s-|:%-29s-|:%-23s-|:%-8s-|\n" % \
+            ("-"*51, "-"*29, "-"*23, "-"*8)
+        for insn_name in insn_list:
+            if insn_name in insn_map:
+                for row in insn_map[insn_name]:
+                    opcode, enc, modes, ext, order, tt, desc =3D row
+                    opcode =3D opcode.replace('reg_','')
+                    text +=3D "| %-51s | %-29s | %-23s | %-8s |\n" % \
+                        (opcode, enc, order, modes)
+        text +=3D "|:%-51s-|:%-29s-|:%-23s-|:%-8s-|\n" % \
+            ("-"*51, "-"*29, "-"*23, "-"*8)
+    text +=3D "\n\n"
+    return "%s %s\n%s" % ("[%s]" % insn, "# %s" % desc, text)
+
+table_insn =3D {
+    TableText: table_text_insn, TableSection: table_section_insn,
+    TableHeader: table_header_insn, TableData: table_data_insn,
+}
+
+def print_fancy_insn(x86_desc):
+    for obj in x86_desc['tab']['obj']:
+        print(table_insn[type(obj)](obj, x86_desc), end=3D"")
+
+parser =3D argparse.ArgumentParser(description=3D'x86 table generator')
+parser.add_argument('files',
+                    default=3D'data/*.csv', nargs=3D'*',
+                    help=3D'x86 csv metadata')
+parser.add_argument('--print-insn',
+                    default=3DFalse, action=3D'store_true',
+                    help=3D'print instructions')
+parser.add_argument('--print-fancy-insn',
+                    default=3DFalse, action=3D'store_true',
+                    help=3D'print fancy instructions')
+parser.add_argument('--print-opcode-enums',
+                    default=3DFalse, action=3D'store_true',
+                    help=3D'print register enum')
+parser.add_argument('--print-opcode-tables',
+                    default=3DFalse, action=3D'store_true',
+                    help=3D'print register strings')
+parser.add_argument('--output-file', type=3Dargparse.FileType('w'),
+                    help=3D"filename to write output to")
+args =3D parser.parse_args()
+
+x86_reg =3D reg_table()
+x86_insn =3D read_data(args.files)
+
+if args.output_file:
+    sys.stdout =3D args.output_file
+if args.print_insn:
+    print_insn(x86_insn)
+if args.print_opcode_enums:
+    print_opcode_enums(x86_reg, x86_insn)
+if args.print_opcode_tables:
+    print_opcode_tables(x86_reg, x86_insn)
--=20
2.43.0
From nobody Fri Apr  4 21:32:29 2025
Delivered-To: importer@patchew.org
Authentication-Results: mx.zohomail.com;
	dkim=fail;
	spf=pass (zohomail.com: domain of gnu.org designates 209.51.188.17 as
 permitted sender)
  smtp.mailfrom=qemu-devel-bounces+importer=patchew.org@nongnu.org;
	dmarc=fail(p=none dis=none)  header.from=anarch128.org
Return-Path: <qemu-devel-bounces+importer=patchew.org@nongnu.org>
Received: from lists.gnu.org (lists.gnu.org [209.51.188.17]) by
 mx.zohomail.com
	with SMTPS id 1739122165992103.25788236769256;
 Sun, 9 Feb 2025 09:29:25 -0800 (PST)
Received: from localhost ([::1] helo=lists1p.gnu.org)
	by lists.gnu.org with esmtp (Exim 4.90_1)
	(envelope-from <qemu-devel-bounces@nongnu.org>)
	id 1thB6l-0004bF-L0; Sun, 09 Feb 2025 12:28:39 -0500
Received: from eggs.gnu.org ([2001:470:142:3::10])
 by lists.gnu.org with esmtps (TLS1.2:ECDHE_RSA_AES_256_GCM_SHA384:256)
 (Exim 4.90_1) (envelope-from <michael@anarch128.org>)
 id 1thB6H-0004Wp-Qr
 for qemu-devel@nongnu.org; Sun, 09 Feb 2025 12:28:10 -0500
Received: from anarch128.org ([2001:4801:7825:104:be76:4eff:fe10:52ae])
 by eggs.gnu.org with esmtps (TLS1.2:ECDHE_RSA_AES_256_GCM_SHA384:256)
 (Exim 4.90_1) (envelope-from <michael@anarch128.org>)
 id 1thB6B-0006LV-9O
 for qemu-devel@nongnu.org; Sun, 09 Feb 2025 12:28:07 -0500
Received: from localhost.localdomain (default-rdns.vocus.co.nz
 [202.150.110.104] (may be forged)) (authenticated bits=0)
 by anarch128.org (8.15.2/8.15.2/Debian-22+deb11u3) with ESMTPSA id
 519HRdEr3380282
 (version=TLSv1.3 cipher=TLS_AES_256_GCM_SHA384 bits=256 verify=NO);
 Sun, 9 Feb 2025 17:27:54 GMT
Authentication-Results: anarch128.org; auth=pass;
 dkim=pass (2048-bit rsa key sha256) header.d=anarch128.org
 header.i=@anarch128.org header.b=Xm/4vYbY header.a=rsa-sha256
 header.s=100003;
 x-return-mx=pass header.domain=anarch128.org policy.is_org=yes (MX Records
 found: mail.anarch128.org);
 x-return-mx=pass smtp.domain=anarch128.org policy.is_org=yes (MX Records
 found: mail.anarch128.org)
DKIM-Signature: v=1; a=rsa-sha256; c=simple/simple; d=anarch128.org;
 s=100003; t=1739122079;
 bh=ynyGsY/hOsAFofCf+WN2352Doz/A4geySaubdzdYYuE=;
 h=From:To:Cc:Subject:Date:In-Reply-To:References:From;
 b=Xm/4vYbYEBRpX1ehyun0O7dIpwVrts/ZwoFCkxB0E7TPg4JCU34e/oVmRNyU/qvpG
 /9t9GimM6pUTZHgkyNoTCk2TtJS0ErPkN1ZjEVs7QWjKdyokmSh/eSkNmf19al3isy
 WL47WOnqO/C4x9HkFZrjPz4IiJxrQQuMiiPU2F3t+0xj3tfIsQKktUxnZebwL4879k
 BdgUKT8jgiyVFrP5pgjcop7mnGSqvrNDO9T3ub6wjIBnnf25Mq+rCv7KUpiB3qZiPH
 OrXQjZ82Rfyp/dTYIS66l3a25wzB9KkGRIYmLMp/0DuH5xwOiFGpgBBLgUDdgvqWvX
 KcVOS/O7+vGDA==
From: Michael Clark <michael@anarch128.org>
To: qemu-devel@nongnu.org, Richard Henderson <richard.henderson@linaro.org>,
 Eduardo Habkost <eduardo@habkost.net>,
 Paolo Bonzini <pbonzini@redhat.com>, Zhao Liu <zhao1.liu@intel.com>
Cc: Michael Clark <michael@anarch128.org>
Subject: [PATCH v2 4/4] x86-disas: add x86-mini disassembler implementation
Date: Mon, 10 Feb 2025 06:26:56 +1300
Message-ID: <20250209172656.1466556-5-michael@anarch128.org>
X-Mailer: git-send-email 2.43.0
In-Reply-To: <20250209172656.1466556-1-michael@anarch128.org>
References: <20250209172656.1466556-1-michael@anarch128.org>
MIME-Version: 1.0
Content-Transfer-Encoding: quoted-printable
Received-SPF: pass (zohomail.com: domain of gnu.org designates 209.51.188.17
 as permitted sender) client-ip=209.51.188.17;
 envelope-from=qemu-devel-bounces+importer=patchew.org@nongnu.org;
 helo=lists.gnu.org;
Received-SPF: pass client-ip=2001:4801:7825:104:be76:4eff:fe10:52ae;
 envelope-from=michael@anarch128.org; helo=anarch128.org
X-Spam_score_int: -16
X-Spam_score: -1.7
X-Spam_bar: -
X-Spam_report: (-1.7 / 5.0 requ) BAYES_00=-1.9, DKIM_INVALID=0.1,
 DKIM_SIGNED=0.1, SPF_HELO_PASS=-0.001,
 SPF_PASS=-0.001 autolearn=no autolearn_force=no
X-Spam_action: no action
X-BeenThere: qemu-devel@nongnu.org
X-Mailman-Version: 2.1.29
Precedence: list
List-Id: <qemu-devel.nongnu.org>
List-Unsubscribe: <https://lists.nongnu.org/mailman/options/qemu-devel>,
 <mailto:qemu-devel-request@nongnu.org?subject=unsubscribe>
List-Archive: <https://lists.nongnu.org/archive/html/qemu-devel>
List-Post: <mailto:qemu-devel@nongnu.org>
List-Help: <mailto:qemu-devel-request@nongnu.org?subject=help>
List-Subscribe: <https://lists.nongnu.org/mailman/listinfo/qemu-devel>,
 <mailto:qemu-devel-request@nongnu.org?subject=subscribe>
Errors-To: qemu-devel-bounces+importer=patchew.org@nongnu.org
Sender: qemu-devel-bounces+importer=patchew.org@nongnu.org
X-ZohoMail-DKIM: fail (Header signature does not verify)
X-ZM-MESSAGEID: 1739122168128019100
Content-Type: text/plain; charset="utf-8"

the x86-mini library is a lightweight x86 encoder, decoder, and
disassembler that uses extensions to the Intel instruction set
metadata to encode modern VEX/EVEX instructions and legacy
instructions with a parameterized LEX (legacy extension) format.

this patch adds the x86-tablegen.py script, the disassembler,
a print_insn_x86 implementation plus host and target cpu stubs.

Signed-off-by: Michael Clark <michael@anarch128.org>
---
 disas/disas-host.c      |    5 +
 disas/meson.build       |   97 ++
 disas/x86-core.c        | 3059 +++++++++++++++++++++++++++++++++++++++
 disas/x86-disas.c       |   94 ++
 disas/x86.h             | 1858 ++++++++++++++++++++++++
 include/disas/dis-asm.h |    1 +
 target/i386/cpu.c       |    7 +
 7 files changed, 5121 insertions(+)
 create mode 100644 disas/x86-core.c
 create mode 100644 disas/x86-disas.c
 create mode 100644 disas/x86.h

diff --git a/disas/disas-host.c b/disas/disas-host.c
index 8146fafe804c..e2d171464a87 100644
--- a/disas/disas-host.c
+++ b/disas/disas-host.c
@@ -6,6 +6,7 @@
 #include "qemu/osdep.h"
 #include "disas/disas.h"
 #include "disas/capstone.h"
+#include "disas/x86.h"
 #include "disas-internal.h"
=20
=20
@@ -50,12 +51,16 @@ static void initialize_debug_host(CPUDebug *s)
     s->info.cap_mode =3D CS_MODE_32;
     s->info.cap_insn_unit =3D 1;
     s->info.cap_insn_split =3D 8;
+    s->info.private_data =3D x86_ctx_create(x86_modes_32);
+    s->info.print_insn =3D print_insn_x86;
 #elif defined(__x86_64__)
     s->info.mach =3D bfd_mach_x86_64;
     s->info.cap_arch =3D CS_ARCH_X86;
     s->info.cap_mode =3D CS_MODE_64;
     s->info.cap_insn_unit =3D 1;
     s->info.cap_insn_split =3D 8;
+    s->info.private_data =3D x86_ctx_create(x86_modes_64);
+    s->info.print_insn =3D print_insn_x86;
 #elif defined(_ARCH_PPC)
     s->info.cap_arch =3D CS_ARCH_PPC;
 # ifdef _ARCH_PPC64
diff --git a/disas/meson.build b/disas/meson.build
index bbfa11978352..dca926a00987 100644
--- a/disas/meson.build
+++ b/disas/meson.build
@@ -9,6 +9,103 @@ common_ss.add(when: 'CONFIG_RISCV_DIS', if_true: files(
     'riscv-xthead.c',
     'riscv-xventana.c'
 ))
+x86_data =3D files(
+    'x86-data/x86_adx.csv',
+    'x86-data/x86_aes.csv',
+    'x86-data/x86_aeskle.csv',
+    'x86-data/x86_aesklewide.csv',
+    'x86-data/x86_avx2.csv',
+    'x86-data/x86_avx5124fmaps.csv',
+    'x86-data/x86_avx5124vnniw.csv',
+    'x86-data/x86_avx512b.csv',
+    'x86-data/x86_avx512bf16.csv',
+    'x86-data/x86_avx512bitalg.csv',
+    'x86-data/x86_avx512bw.csv',
+    'x86-data/x86_avx512cd.csv',
+    'x86-data/x86_avx512d.csv',
+    'x86-data/x86_avx512dq.csv',
+    'x86-data/x86_avx512er.csv',
+    'x86-data/x86_avx512f.csv',
+    'x86-data/x86_avx512fp16.csv',
+    'x86-data/x86_avx512ifma.csv',
+    'x86-data/x86_avx512pf.csv',
+    'x86-data/x86_avx512vbmi2.csv',
+    'x86-data/x86_avx512vbmi.csv',
+    'x86-data/x86_avx512vl.csv',
+    'x86-data/x86_avx512vnni.csv',
+    'x86-data/x86_avx512vp2intersect.csv',
+    'x86-data/x86_avx512vpopcntdq.csv',
+    'x86-data/x86_avx.csv',
+    'x86-data/x86_avxneconvert.csv',
+    'x86-data/x86_avxvnni.csv',
+    'x86-data/x86_avxvnniint8.csv',
+    'x86-data/x86_base.csv',
+    'x86-data/x86_bmi1.csv',
+    'x86-data/x86_bmi2.csv',
+    'x86-data/x86_cet.csv',
+    'x86-data/x86_cldemote.csv',
+    'x86-data/x86_clwb.csv',
+    'x86-data/x86_enqcmd.csv',
+    'x86-data/x86_f16c.csv',
+    'x86-data/x86_fma.csv',
+    'x86-data/x86_fsgsbase.csv',
+    'x86-data/x86_gfni.csv',
+    'x86-data/x86_hreset.csv',
+    'x86-data/x86_invpcid.csv',
+    'x86-data/x86_lzcnt.csv',
+    'x86-data/x86_mmx.csv',
+    'x86-data/x86_movdir64b.csv',
+    'x86-data/x86_movdiri.csv',
+    'x86-data/x86_mpx.csv',
+    'x86-data/x86_msrlist.csv',
+    'x86-data/x86_ospke.csv',
+    'x86-data/x86_pclmulqdq.csv',
+    'x86-data/x86_pconfig.csv',
+    'x86-data/x86_prefetchw.csv',
+    'x86-data/x86_raoint.csv',
+    'x86-data/x86_rdpid.csv',
+    'x86-data/x86_rdrand.csv',
+    'x86-data/x86_rdseed.csv',
+    'x86-data/x86_rtm.csv',
+    'x86-data/x86_serialize.csv',
+    'x86-data/x86_sha.csv',
+    'x86-data/x86_smap.csv',
+    'x86-data/x86_sse2.csv',
+    'x86-data/x86_sse3.csv',
+    'x86-data/x86_sse4_1.csv',
+    'x86-data/x86_sse4_2.csv',
+    'x86-data/x86_sse4_3.csv',
+    'x86-data/x86_sse.csv',
+    'x86-data/x86_ssse3.csv',
+    'x86-data/x86_uintr.csv',
+    'x86-data/x86_vaes.csv',
+    'x86-data/x86_vmx.csv',
+    'x86-data/x86_waitpkg.csv',
+    'x86-data/x86_wbnoinvd.csv',
+    'x86-data/x86_x87.csv',
+    'x86-data/x86_xsaveopt.csv'
+)
+x86_tablegen_py =3D find_program('../scripts/x86-tablegen.py')
+x86_gen_enums_inc =3D custom_target(
+    'x86-enums.inc',
+    output: 'x86-enums.inc',
+    depend_files: x86_data,
+    command: [x86_tablegen_py, '--print-opcode-enums',
+              '--output-file', '@OUTPUT@', x86_data]
+)
+x86_gen_tables_inc =3D custom_target(
+    'x86-tables.inc',
+    output: 'x86-tables.inc',
+    depend_files: x86_data,
+    command: [x86_tablegen_py, '--print-opcode-tables',
+              '--output-file', '@OUTPUT@', x86_data]
+)
+common_ss.add(when: 'CONFIG_I386_DIS', if_true: x86_gen_enums_inc)
+common_ss.add(when: 'CONFIG_I386_DIS', if_true: x86_gen_tables_inc)
+common_ss.add(when: 'CONFIG_I386_DIS', if_true: files(
+    'x86-core.c',
+    'x86-disas.c'
+))
 common_ss.add(when: 'CONFIG_SH4_DIS', if_true: files('sh4.c'))
 common_ss.add(when: 'CONFIG_SPARC_DIS', if_true: files('sparc.c'))
 common_ss.add(when: 'CONFIG_XTENSA_DIS', if_true: files('xtensa.c'))
diff --git a/disas/x86-core.c b/disas/x86-core.c
new file mode 100644
index 000000000000..71833d7ec557
--- /dev/null
+++ b/disas/x86-core.c
@@ -0,0 +1,3059 @@
+/*
+ * Copyright (c) 2024-2025 Michael Clark
+ *
+ * Permission is hereby granted, free of charge, to any person obtaining a
+ * copy of this software and associated documentation files (the "Software=
"),
+ * to deal in the Software without restriction, including without limitati=
on
+ * the rights to use, copy, modify, merge, publish, distribute, sublicense,
+ * and/or sell copies of the Software, and to permit persons to whom the
+ * Software is furnished to do so, subject to the following conditions:
+ *
+ * The above copyright notice and this permission notice shall be included
+ * in all copies or substantial portions of the Software.
+ *
+ * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS
+ * OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABIL=
ITY,
+ * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL
+ * THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR
+ * OTHER LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE,
+ * ARISING FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR
+ * OTHER DEALINGS IN THE SOFTWARE.
+ */
+
+#include <stdio.h>
+#include <stdlib.h>
+#include <stdarg.h>
+#include <string.h>
+#include <limits.h>
+
+#include "qemu/osdep.h"
+#include "qemu/host-utils.h"
+
+#include "disas/x86.h"
+#include "disas/x86-tables.inc"
+
+#define array_size(arr) (sizeof(arr) / sizeof(arr[0]))
+
+typedef struct x86_table_col x86_table_col;
+typedef struct x86_map_str x86_map_str;
+typedef struct x86_operands x86_operands;
+typedef struct x86_arg x86_arg;
+typedef struct x86_opc_prefix x86_opc_prefix;
+typedef struct x86_opr_formatter x86_opr_formatter;
+typedef struct x86_opr_formats x86_opr_formats;
+
+typedef size_t (*x86_opr_str_fn)(char *buf, size_t buflen, x86_codec *c,
+    x86_arg a);
+typedef size_t (*x86_opr_addr_fn)(char *buf, size_t buflen, x86_codec *c,
+    x86_arg a, size_t pc_offset, x86_fmt_symbol sym_cb);
+
+enum
+{
+    x86_state_top,
+    x86_state_segment,
+    x86_state_legacy,
+    x86_state_map_0f,
+    x86_state_lex_opcode,
+    x86_state_rex_opcode,
+    x86_state_vex_opcode,
+    x86_state_done,
+};
+
+struct x86_table_col
+{
+    int width;
+    char *data;
+};
+
+struct x86_map_str
+{
+    uint ord;
+    const char *str;
+};
+
+struct x86_opr_formatter
+{
+    x86_opr_str_fn fmt_const;
+    x86_opr_str_fn fmt_imm;
+    x86_opr_str_fn fmt_reg;
+    x86_opr_str_fn fmt_mrm;
+    x86_opr_str_fn fmt_vec;
+    x86_opr_str_fn fmt_opb;
+    x86_opr_str_fn fmt_is4;
+    x86_opr_str_fn fmt_ime;
+    x86_opr_addr_fn fmt_rel;
+};
+
+struct x86_opr_formats
+{
+    const char *ptr_rip;
+    const char *ptr_rip_disp;
+    const char *ptr_reg;
+    const char *ptr_reg_disp;
+    const char *ptr_reg_sreg;
+    const char *ptr_reg_sreg_disp;
+    const char *ptr_reg_reg;
+    const char *ptr_reg_reg_disp;
+    const char *ptr_sreg;
+    const char *ptr_disp;
+    const char *ptr_imm64;
+    const char *ptr_imm32;
+    const char *imm64;
+    const char *imm32;
+    const char *reg;
+};
+
+struct x86_operands
+{
+    ullong mod : 3;
+    ullong rm  : 3;
+    ullong r   : 5;
+    ullong x   : 5;
+    ullong b   : 5;
+    ullong s   : 2;
+    ullong v   : 5;
+    ullong k   : 5;
+    ullong l   : 2;
+    ullong w   : 1;
+    ullong brd : 1;
+    ullong osz : 1;
+};
+
+struct x86_arg
+{
+    uint enc;
+    uint opr;
+    uint ord;
+    x86_operands q;
+};
+
+struct x86_opc_prefix
+{
+    uint pfx;
+    uint pfx_w;
+    uint pfx_o;
+    uint modfun;
+    uint modreg;
+    uint modmem;
+};
+
+x86_opr_formatter x86_format_intel_hex;
+x86_opr_formatter x86_format_intel_dec;
+x86_opr_formats x86_opr_formats_intel_hex;
+x86_opr_formats x86_opr_formats_intel_dec;
+
+static uint debug;
+
+void x86_set_debug(uint d) { debug =3D d; }
+
+x86_map_str x86_mode_names[] =3D
+{
+    { x86_modes_64,             "64"               },
+    { x86_modes_32,             "32"               },
+    { x86_modes_16,             "16"               },
+};
+
+x86_map_str x86_map_names[] =3D
+{
+    { x86_map_map6,            "map6"              },
+    { x86_map_map5,            "map5"              },
+    { x86_map_map4,            "map4"              },
+    { x86_map_0f3a,            "0f3a"              },
+    { x86_map_0f38,            "0f38"              },
+    { x86_map_0f,              "0f"                },
+};
+
+x86_map_str x86_ord_names[] =3D
+{
+    { x86_ord_rflags,           "rflags"           },
+    { x86_ord_mxcsr,            "mxcsr"            },
+    { x86_ord_xmm0_7,           "xmm0_7"           },
+    { x86_ord_xmm0,             "xmm0"             },
+    { x86_ord_seg,              "seg"              },
+    { x86_ord_stx,              "stx"              },
+    { x86_ord_st0,              "st0"              },
+    { x86_ord_rdi,              "rdi"              },
+    { x86_ord_rsi,              "rsi"              },
+    { x86_ord_rbp,              "rbp"              },
+    { x86_ord_rsp,              "rsp"              },
+    { x86_ord_rbx,              "rbx"              },
+    { x86_ord_rdx,              "rdx"              },
+    { x86_ord_rcx,              "rcx"              },
+    { x86_ord_rax,              "rax"              },
+    { x86_ord_one,              "one"              },
+    { x86_ord_ime,              "ime"              },
+    { x86_ord_is4,              "is4"              },
+    { x86_ord_sib,              "sib"              },
+    { x86_ord_vec,              "vec"              },
+    { x86_ord_opr,              "opr"              },
+    { x86_ord_mrm,              "mrm"              },
+    { x86_ord_reg,              "reg"              },
+    { x86_ord_imm,              "imm"              },
+    { x86_ord_rwi,              "rwi"              },
+    { x86_ord_wi,               "wi"               },
+    { x86_ord_ri,               "ri"               },
+    { x86_ord_rw,               "rw"               },
+    { x86_ord_i,                "i"                },
+    { x86_ord_r,                "r"                },
+    { x86_ord_w,                "w"                },
+    { 0,                        NULL               },
+};
+
+x86_map_str x86_opr_names[] =3D
+{
+    { x86_opr_bnd_mem,          "bnd/mem"          },
+    { x86_opr_k_m64,            "k/m64"            },
+    { x86_opr_k_m32,            "k/m32"            },
+    { x86_opr_k_m16,            "k/m16"            },
+    { x86_opr_k_m8,             "k/m8"             },
+    { x86_opr_vm64z,            "vm64z"            },
+    { x86_opr_vm64y,            "vm64y"            },
+    { x86_opr_vm64x,            "vm64x"            },
+    { x86_opr_vm32z,            "vm32z"            },
+    { x86_opr_vm32y,            "vm32y"            },
+    { x86_opr_vm32x,            "vm32x"            },
+    { x86_opr_rw_mw,            "rw/mw"            },
+    { x86_opr_r64_m64,          "r64/m64"          },
+    { x86_opr_r64_m32,          "r64/m32"          },
+    { x86_opr_r64_m16,          "r64/m16"          },
+    { x86_opr_r64_m8,           "r64/m8"           },
+    { x86_opr_r32_m32,          "r32/m32"          },
+    { x86_opr_r32_m16,          "r32/m16"          },
+    { x86_opr_r32_m8,           "r32/m8"           },
+    { x86_opr_r16_m16,          "r16/m16"          },
+    { x86_opr_r16_m8,           "r16/m8"           },
+    { x86_opr_r8_m8,            "r8/m8"            },
+    { x86_opr_zmm_m512_m64bcst, "zmm/m512/m64bcst" },
+    { x86_opr_zmm_m512_m32bcst, "zmm/m512/m32bcst" },
+    { x86_opr_zmm_m512_m16bcst, "zmm/m512/m16bcst" },
+    { x86_opr_ymm_m256_m64bcst, "ymm/m256/m64bcst" },
+    { x86_opr_ymm_m256_m32bcst, "ymm/m256/m32bcst" },
+    { x86_opr_ymm_m256_m16bcst, "ymm/m256/m16bcst" },
+    { x86_opr_xmm_m128_m64bcst, "xmm/m128/m64bcst" },
+    { x86_opr_xmm_m128_m32bcst, "xmm/m128/m32bcst" },
+    { x86_opr_xmm_m128_m16bcst, "xmm/m128/m16bcst" },
+    { x86_opr_xmm_m64_m32bcst,  "xmm/m64/m32bcst"  },
+    { x86_opr_xmm_m64_m16bcst,  "xmm/m64/m16bcst"  },
+    { x86_opr_xmm_m32_m16bcst,  "xmm/m32/m16bcst"  },
+    { x86_opr_zmm_m512,         "zmm/m512"         },
+    { x86_opr_ymm_m256,         "ymm/m256"         },
+    { x86_opr_xmm_m128,         "xmm/m128"         },
+    { x86_opr_xmm_m64,          "xmm/m64"          },
+    { x86_opr_xmm_m32,          "xmm/m32"          },
+    { x86_opr_xmm_m16,          "xmm/m16"          },
+    { x86_opr_xmm_m8,           "xmm/m8"           },
+    { x86_opr_mm_m64,           "mm/m64"           },
+    { x86_opr_mm_m32,           "mm/m32"           },
+    { x86_opr_mp,               "mp"               },
+    { x86_opr_mw,               "mw"               },
+    { x86_opr_vm64,             "vm64"             },
+    { x86_opr_vm32,             "vm32"             },
+    { x86_opr_r_m64,            "r/m64"            },
+    { x86_opr_r_m32,            "r/m32"            },
+    { x86_opr_r_m16,            "r/m16"            },
+    { x86_opr_r_m8,             "r/m8"             },
+    { x86_opr_m64bcst,          "m64bcst"          },
+    { x86_opr_m32bcst,          "m32bcst"          },
+    { x86_opr_m16bcst,          "m16bcst"          },
+    { x86_opr_mib,              "mib"              },
+    { x86_opr_m384,             "m384"             },
+    { x86_opr_m80,              "m80"              },
+    { x86_opr_m512,             "m512"             },
+    { x86_opr_m256,             "m256"             },
+    { x86_opr_m128,             "m128"             },
+    { x86_opr_m64,              "m64"              },
+    { x86_opr_m32,              "m32"              },
+    { x86_opr_m16,              "m16"              },
+    { x86_opr_m8,               "m8"               },
+    { x86_opr_seg_gs,           "gs"               },
+    { x86_opr_seg_fs,           "fs"               },
+    { x86_opr_seg_ds,           "ds"               },
+    { x86_opr_seg_ss,           "ss"               },
+    { x86_opr_seg_cs,           "cs"               },
+    { x86_opr_seg_es,           "es"               },
+    { x86_opr_reg_xmm0_7,       "xmm0_7"           },
+    { x86_opr_reg_xmm0,         "xmm0"             },
+    { x86_opr_reg_pdi,          "pdi"              },
+    { x86_opr_reg_psi,          "psi"              },
+    { x86_opr_reg_pb,           "pb"               },
+    { x86_opr_reg_pd,           "pd"               },
+    { x86_opr_reg_pc,           "pc"               },
+    { x86_opr_reg_pa,           "pa"               },
+    { x86_opr_reg_bw,           "bw"               },
+    { x86_opr_reg_dw,           "dw"               },
+    { x86_opr_reg_cw,           "cw"               },
+    { x86_opr_reg_aw,           "aw"               },
+    { x86_opr_reg_rbx,          "rbx"              },
+    { x86_opr_reg_rdx,          "rdx"              },
+    { x86_opr_reg_rcx,          "rcx"              },
+    { x86_opr_reg_rax,          "rax"              },
+    { x86_opr_reg_ebx,          "ebx"              },
+    { x86_opr_reg_edx,          "edx"              },
+    { x86_opr_reg_ecx,          "ecx"              },
+    { x86_opr_reg_eax,          "eax"              },
+    { x86_opr_reg_bx,           "bx"               },
+    { x86_opr_reg_dx,           "dx"               },
+    { x86_opr_reg_cx,           "cx"               },
+    { x86_opr_reg_ax,           "ax"               },
+    { x86_opr_reg_cl,           "cl"               },
+    { x86_opr_reg_al,           "al"               },
+    { x86_opr_reg_st0,          "st0"              },
+    { x86_opr_reg_v0,           "v0"               },
+    { x86_opr_reg_ah,           "ah"               },
+    { x86_opr_reg_di,           "di"               },
+    { x86_opr_reg_si,           "si"               },
+    { x86_opr_reg_d,            "d"                },
+    { x86_opr_reg_c,            "c"                },
+    { x86_opr_reg_a,            "a"                },
+    { x86_opr_memfar16_64,      "memfar16:64"      },
+    { x86_opr_memfar16_32,      "memfar16:32"      },
+    { x86_opr_memfar16_16,      "memfar16:16"      },
+    { x86_opr_far16_32,         "far16:32"         },
+    { x86_opr_far16_16,         "far16:16"         },
+    { x86_opr_relw,             "relw"             },
+    { x86_opr_rel8,             "rel8"             },
+    { x86_opr_moffs,            "moffs"            },
+    { x86_opr_1,                "1"                },
+    { x86_opr_zmm,              "zmm"              },
+    { x86_opr_ymm,              "ymm"              },
+    { x86_opr_xmm,              "xmm"              },
+    { x86_opr_mm,               "mm"               },
+    { x86_opr_ra,               "ra"               },
+    { x86_opr_rw,               "rw"               },
+    { x86_opr_r64,              "r64"              },
+    { x86_opr_r32,              "r32"              },
+    { x86_opr_r16,              "r16"              },
+    { x86_opr_r8,               "r8"               },
+    { x86_opr_iw,               "iw"               },
+    { x86_opr_iwd,              "iwd"              },
+    { x86_opr_i64,              "i64"              },
+    { x86_opr_i32,              "i32"              },
+    { x86_opr_i16,              "i16"              },
+    { x86_opr_ib,               "ib"               },
+    { x86_opr_bnd,              "bnd"              },
+    { x86_opr_dreg,             "dreg"             },
+    { x86_opr_creg,             "creg"             },
+    { x86_opr_seg,              "seg"              },
+    { x86_opr_k,                "k"                },
+    { x86_opr_st,               "st"               },
+    { x86_opr_mmx,              "mmx"              },
+    { x86_opr_vec,              "vec"              },
+    { x86_opr_reg,              "reg"              },
+    { x86_opr_imm,              "imm"              },
+    { x86_opr_bcst,             "bcst"             },
+    { x86_opr_mem,              "mem"              },
+    { x86_opr_flag_er,          "{er}"             },
+    { x86_opr_flag_k,           "{k}"              },
+    { x86_opr_flag_sae,         "{sae}"            },
+    { x86_opr_flag_z,           "{z}"              },
+    { x86_opr_flag_rs2,         "{rs2}"            },
+    { x86_opr_flag_rs4,         "{rs4}"            },
+    { x86_opr_f64x8,            "/f64x8"           },
+    { x86_opr_f64x4,            "/f64x4"           },
+    { x86_opr_f64x2,            "/f64x2"           },
+    { x86_opr_f64x1,            "/f64x1"           },
+    { x86_opr_f32x16,           "/f32x16"          },
+    { x86_opr_f32x8,            "/f32x8"           },
+    { x86_opr_f32x4,            "/f32x4"           },
+    { x86_opr_f32x2,            "/f32x2"           },
+    { x86_opr_f32x1,            "/f32x1"           },
+    { x86_opr_f16x32,           "/f16x32"          },
+    { x86_opr_f16x16,           "/f16x16"          },
+    { x86_opr_f16x8,            "/f16x8"           },
+    { x86_opr_f16x4,            "/f16x4"           },
+    { x86_opr_f16x2,            "/f16x2"           },
+    { x86_opr_f16x1,            "/f16x1"           },
+    { x86_opr_f8x64,            "/f8x64"           },
+    { x86_opr_f8x32,            "/f8x32"           },
+    { x86_opr_f8x16,            "/f8x16"           },
+    { x86_opr_f8x8,             "/f8x8"            },
+    { x86_opr_f8x4,             "/f8x4"            },
+    { x86_opr_f8x2,             "/f8x2"            },
+    { x86_opr_f8x1,             "/f8x1"            },
+    { x86_opr_i512x1,           "/i512x1"          },
+    { x86_opr_i256x2,           "/i256x2"          },
+    { x86_opr_i256x1,           "/i256x1"          },
+    { x86_opr_i128x4,           "/i128x4"          },
+    { x86_opr_i128x2,           "/i128x2"          },
+    { x86_opr_i128x1,           "/i128x1"          },
+    { x86_opr_i64x8,            "/i64x8"           },
+    { x86_opr_i64x4,            "/i64x4"           },
+    { x86_opr_i64x2,            "/i64x2"           },
+    { x86_opr_i64x1,            "/i64x1"           },
+    { x86_opr_i32x16,           "/i32x16"          },
+    { x86_opr_i32x8,            "/i32x8"           },
+    { x86_opr_i32x4,            "/i32x4"           },
+    { x86_opr_i32x2,            "/i32x2"           },
+    { x86_opr_i32x1,            "/i32x1"           },
+    { x86_opr_i16x32,           "/i16x32"          },
+    { x86_opr_i16x16,           "/i16x16"          },
+    { x86_opr_i16x8,            "/i16x8"           },
+    { x86_opr_i16x4,            "/i16x4"           },
+    { x86_opr_i16x2,            "/i16x2"           },
+    { x86_opr_i16x1,            "/i16x1"           },
+    { x86_opr_i8x64,            "/i8x64"           },
+    { x86_opr_i8x32,            "/i8x32"           },
+    { x86_opr_i8x16,            "/i8x16"           },
+    { x86_opr_i8x8,             "/i8x8"            },
+    { x86_opr_i8x4,             "/i8x4"            },
+    { x86_opr_i8x2,             "/i8x2"            },
+    { x86_opr_i8x1,             "/i8x1"            },
+    { 0,                        NULL               },
+};
+
+x86_map_str x86_enc_names[] =3D
+{
+    { x86_enc_r_norexb,         " .norexb"         },
+    { x86_enc_r_lock,           " .lock"           },
+    { x86_enc_r_rep,            " .rep"            },
+    { x86_enc_s_a64,            " .a64"            },
+    { x86_enc_s_a32,            " .a32"            },
+    { x86_enc_s_a16,            " .a16"            },
+    { x86_enc_s_o64,            " .o64"            },
+    { x86_enc_s_o32,            " .o32"            },
+    { x86_enc_s_o16,            " .o16"            },
+    { x86_enc_j_i16,            " i16"             },
+    { x86_enc_j_ib,             " ib"              },
+    { x86_enc_i_i64,            " i64"             },
+    { x86_enc_i_i32,            " i32"             },
+    { x86_enc_i_i16,            " i16"             },
+    { x86_enc_i_iwd,            " iwd"             },
+    { x86_enc_i_iw,             " iw"              },
+    { x86_enc_i_ib,             " ib"              },
+    { x86_enc_f_opcode_r,       ""                 },
+    { x86_enc_f_opcode,         ""                 },
+    { x86_enc_f_modrm_n,        ""                 },
+    { x86_enc_f_modrm_r,        ""                 },
+    { x86_enc_o_opcode_r,       ""                 },
+    { x86_enc_t_evex,           ".evex"            },
+    { x86_enc_t_vex,            ".vex"             },
+    { x86_enc_t_lex,            ".lex"             },
+    { x86_enc_l_lig,            ".lig"             },
+    { x86_enc_l_512,            ".512"             },
+    { x86_enc_l_256,            ".256"             },
+    { x86_enc_l_128,            ".128"             },
+    { x86_enc_l_l1,             ".l1"              },
+    { x86_enc_l_l0,             ".l0"              },
+    { x86_enc_l_lz,             ".lz"              },
+    { x86_enc_p_rexw,           ".w"               },
+    { x86_enc_p_9b,             ".9b"              },
+    { x86_enc_p_f2,             ".f2"              },
+    { x86_enc_p_f3,             ".f3"              },
+    { x86_enc_p_66,             ".66"              },
+    { x86_enc_m_map6,           ".map6"            },
+    { x86_enc_m_map5,           ".map5"            },
+    { x86_enc_m_map4,           ".map4"            },
+    { x86_enc_m_0f3a,           ".0f3a"            },
+    { x86_enc_m_0f38,           ".0f38"            },
+    { x86_enc_m_0f,             ".0f"              },
+    { x86_enc_w_wig,            ".wig"             },
+    { x86_enc_w_ww,             ".ww"              },
+    { x86_enc_w_wx,             ".wx"              },
+    { x86_enc_w_wn,             ".wn"              },
+    { x86_enc_w_wb,             ".wb"              },
+    { x86_enc_w_w1,             ".w1"              },
+    { x86_enc_w_w0,             ".w0"              },
+    { 0,                        NULL               },
+};
+
+/*
+ *  string tables
+ */
+
+static size_t x86_name_map(x86_map_str *p, char * buf, size_t len, uint or=
d,
+    const char *sep)
+{
+    size_t count =3D 0;
+    int ret =3D 0;
+    for (;;) {
+        while (p->str !=3D NULL) {
+            if (p->ord && (p->ord & ord) =3D=3D p->ord) {
+                ord =3D ord & ~p->ord;
+                break;
+            }
+            p++;
+        }
+        if (p->str =3D=3D NULL) break;
+        if (buf =3D=3D NULL || len - count <=3D len) {
+            ret =3D snprintf(buf ? buf + count : NULL,
+                buf ? len - count : 0,
+                "%s%s", count =3D=3D 0 ? "" : sep, p->str);
+            if (ret > 0) count +=3D ret;
+        }
+    }
+    return count;
+}
+
+size_t x86_mode_name(char *buf, size_t len, uint mode, const char *sep)
+{
+    return x86_name_map(x86_mode_names, buf, len, mode, sep);
+}
+
+size_t x86_map_name(char *buf, size_t len, uint mode, const char *sep)
+{
+    return x86_name_map(x86_map_names, buf, len, mode, sep);
+}
+
+size_t x86_ord_name(char *buf, size_t len, uint ord, const char *sep)
+{
+    return x86_name_map(x86_ord_names, buf, len, ord, sep);
+}
+
+size_t x86_opr_name(char *buf, size_t len, uint opr)
+{
+    return x86_name_map(x86_opr_names, buf, len, opr, "");
+}
+
+size_t x86_enc_name(char *buf, size_t len, uint enc)
+{
+    return x86_name_map(x86_enc_names, buf, len, enc, "");
+}
+
+const char *x86_reg_name(uint reg)
+{
+    return (reg < 512) ? x86_reg_names[reg] : "invalid";
+}
+
+size_t x86_ord_mnem(char *buf, size_t len, const ushort *ord)
+{
+    const char codes[8] =3D " -irmvo ";
+    size_t count =3D 0;
+    for (size_t i =3D 0; i < array_size(x86_ord_table[0].ord) && ord[i]; i=
++) {
+        uint type =3D x86_ord_type_val(ord[i]);
+        if (buf && count < len) {
+            buf[count++] =3D codes[type];
+        }
+    }
+    buf[count] =3D '\0';
+    return count;
+}
+
+const char *x86_table_type_name(uint type)
+{
+    switch (type) {
+    case x86_table_none: return "none";
+    case x86_table_lex: return "lex";
+    case x86_table_vex: return "vex";
+    case x86_table_evex: return "evex";
+    default: return "";
+    }
+}
+
+const char *x86_table_map_name(uint map)
+{
+    switch (map) {
+    case x86_map_none: return "";
+    case x86_map_0f: return "0f";
+    case x86_map_0f38: return "0f38";
+    case x86_map_0f3a: return "0f3a";
+    case x86_map_map4: return "map4";
+    case x86_map_map5: return "map5";
+    case x86_map_map6: return "map6";
+    default: return "";
+    }
+}
+
+const char *x86_table_prefix_name(uint prefix)
+{
+    switch (prefix) {
+    case x86_pfx_66: return "66";
+    case x86_pfx_f3: return "f3";
+    case x86_pfx_f2: return "f2";
+    case x86_pfx_9b: return "9b";
+    case x86_pfx_66 | x86_pfx_rexw: return "66+w";
+    case x86_pfx_f3 | x86_pfx_rexw: return "f3+w";
+    case x86_pfx_f2 | x86_pfx_rexw: return "f2+w";
+    case x86_pfx_9b | x86_pfx_rexw: return "9b+w";
+    default: return "";
+    }
+}
+
+/*
+ * string formatting
+ */
+
+static const char dd[200] =3D {
+    0x30, 0x30, 0x30, 0x31, 0x30, 0x32, 0x30, 0x33, 0x30, 0x34,
+    0x30, 0x35, 0x30, 0x36, 0x30, 0x37, 0x30, 0x38, 0x30, 0x39,
+    0x31, 0x30, 0x31, 0x31, 0x31, 0x32, 0x31, 0x33, 0x31, 0x34,
+    0x31, 0x35, 0x31, 0x36, 0x31, 0x37, 0x31, 0x38, 0x31, 0x39,
+    0x32, 0x30, 0x32, 0x31, 0x32, 0x32, 0x32, 0x33, 0x32, 0x34,
+    0x32, 0x35, 0x32, 0x36, 0x32, 0x37, 0x32, 0x38, 0x32, 0x39,
+    0x33, 0x30, 0x33, 0x31, 0x33, 0x32, 0x33, 0x33, 0x33, 0x34,
+    0x33, 0x35, 0x33, 0x36, 0x33, 0x37, 0x33, 0x38, 0x33, 0x39,
+    0x34, 0x30, 0x34, 0x31, 0x34, 0x32, 0x34, 0x33, 0x34, 0x34,
+    0x34, 0x35, 0x34, 0x36, 0x34, 0x37, 0x34, 0x38, 0x34, 0x39,
+    0x35, 0x30, 0x35, 0x31, 0x35, 0x32, 0x35, 0x33, 0x35, 0x34,
+    0x35, 0x35, 0x35, 0x36, 0x35, 0x37, 0x35, 0x38, 0x35, 0x39,
+    0x36, 0x30, 0x36, 0x31, 0x36, 0x32, 0x36, 0x33, 0x36, 0x34,
+    0x36, 0x35, 0x36, 0x36, 0x36, 0x37, 0x36, 0x38, 0x36, 0x39,
+    0x37, 0x30, 0x37, 0x31, 0x37, 0x32, 0x37, 0x33, 0x37, 0x34,
+    0x37, 0x35, 0x37, 0x36, 0x37, 0x37, 0x37, 0x38, 0x37, 0x39,
+    0x38, 0x30, 0x38, 0x31, 0x38, 0x32, 0x38, 0x33, 0x38, 0x34,
+    0x38, 0x35, 0x38, 0x36, 0x38, 0x37, 0x38, 0x38, 0x38, 0x39,
+    0x39, 0x30, 0x39, 0x31, 0x39, 0x32, 0x39, 0x33, 0x39, 0x34,
+    0x39, 0x35, 0x39, 0x36, 0x39, 0x37, 0x39, 0x38, 0x39, 0x39
+};
+
+static inline size_t utoa_u32(uint n, char *s)
+{
+    const uchar utodb_u32[32] =3D {
+         9,  9,  9,  8,  8,  8,  7,  7,
+         7,  6,  6,  6,  6,  5,  5,  5,
+         4,  4,  4,  3,  3,  3,  3,  2,
+         2,  2,  1,  1,  1,  1,  1,  1,
+    };
+    const uint utodd_u32[10] =3D {
+        999999999u,  99999999u,
+          9999999u,    999999u,
+            99999u,      9999u,
+              999u,        99u,
+                9u,         0u,
+    };
+    uint x1, x2, a1, a2, a3, b1, b2;
+    uint dig =3D n =3D=3D 0 ? 1 : utodb_u32[clz32(n)];
+    dig +=3D n > utodd_u32[9 - dig];
+    x1 =3D n % 1000000; x2 =3D n / 1000000;
+    switch (dig) {
+    case 9:
+        b2 =3D x2 / 100 % 100;
+        *s++ =3D dd[b2 * 2 + 1];
+        goto l8;
+    case 7:
+        b1 =3D x2 % 100;
+        *s++ =3D dd[b1 * 2 + 1];
+        goto l6;
+    case 5:
+        a3 =3D x1 / 10000;
+        *s++ =3D dd[a3 * 2 + 1];
+        goto l4;
+    case 3:
+        a2 =3D x1 / 100 % 100;
+        *s++ =3D dd[a2 * 2 + 1];
+        goto l2;
+    case 1:
+        a1 =3D x1 % 100;
+        *s++ =3D dd[a1 * 2 + 1];
+        break;
+    case 10:
+        b2 =3D x2 / 100 % 100;
+        *s++ =3D dd[b2 * 2];
+        *s++ =3D dd[b2 * 2 + 1];
+        /* fallthrough */
+    case 8:  l8:
+        b1 =3D x2 % 100;
+        *s++ =3D dd[b1 * 2];
+        *s++ =3D dd[b1 * 2 + 1];
+        /* fallthrough */
+    case 6:  l6:
+        a3 =3D x1 / 10000;
+        *s++ =3D dd[a3 * 2];
+        *s++ =3D dd[a3 * 2 + 1];
+        /* fallthrough */
+    case 4:  l4:
+        a2 =3D x1 / 100 % 100;
+        *s++ =3D dd[a2 * 2];
+        *s++ =3D dd[a2 * 2 + 1];
+        /* fallthrough */
+    case 2:  l2:
+        a1 =3D x1 % 100;
+        *s++ =3D dd[a1 * 2];
+        *s++ =3D dd[a1 * 2 + 1];
+        break;
+    }
+    *s++ =3D '\0';
+    return dig;
+}
+
+static inline size_t utoa_u64(ullong n, char *s)
+{
+    const uchar utodb_u64[64] =3D {
+        19, 18, 18, 18, 18, 17, 17, 17,
+        16, 16, 16, 15, 15, 15, 15, 14,
+        14, 14, 13, 13, 13, 12, 12, 12,
+        12, 11, 11, 11, 10, 10, 10,  9,
+         9,  9,  9,  8,  8,  8,  7,  7,
+         7,  6,  6,  6,  6,  5,  5,  5,
+         4,  4,  4,  3,  3,  3,  3,  2,
+         2,  2,  1,  1,  1,  1,  1,  1,
+    };
+    const ullong utodd_u64[20] =3D {
+        9999999999999999999llu,  999999999999999999llu,
+          99999999999999999llu,    9999999999999999llu,
+            999999999999999llu,      99999999999999llu,
+              9999999999999llu,        999999999999llu,
+                99999999999llu,          9999999999llu,
+                  999999999llu,            99999999llu,
+                    9999999llu,              999999llu,
+                      99999llu,                9999llu,
+                        999llu,                  99llu,
+                          9llu,                   0llu,
+    };
+    ullong x1, x2;
+    uint y1, y2, z1, z2, a1, a2, a3, b1, b2, b3, c1, c2, c3, d1;
+    uint dig =3D n =3D=3D 0 ? 1 : utodb_u64[clz64(n)];
+    dig +=3D n > utodd_u64[19 - dig];
+    x1 =3D n  % 1000000000000ll; x2 =3D n  / 1000000000000ll;
+    y1 =3D x1 % 1000000ll;       y2 =3D x1 / 1000000ll;
+    z1 =3D x2 % 1000000ll;       z2 =3D x2 / 1000000ll;
+    switch (dig) {
+    case 19:
+        d1 =3D z2 % 100;
+        *s++ =3D dd[d1 * 2 + 1];
+        goto l18;
+    case 17:
+        c3 =3D z1 / 10000;
+        *s++ =3D dd[c3 * 2 + 1];
+        goto l16;
+    case 15:
+        c2 =3D z1 / 100 % 100;
+        *s++ =3D dd[c2 * 2 + 1];
+        goto l14;
+    case 13:
+        c1 =3D z1 % 100;
+        *s++ =3D dd[c1 * 2 + 1];
+        goto l12;
+    case 11:
+        b3 =3D y2 / 10000;
+        *s++ =3D dd[b3 * 2 + 1];
+        goto l10;
+    case 9:
+        b2 =3D y2 / 100 % 100;
+        *s++ =3D dd[b2 * 2 + 1];
+        goto l8;
+    case 7:
+        b1 =3D y2 % 100;
+        *s++ =3D dd[b1 * 2 + 1];
+        goto l6;
+    case 5:
+        a3 =3D y1 / 10000;
+        *s++ =3D dd[a3 * 2 + 1];
+        goto l4;
+    case 3:
+        a2 =3D y1 / 100 % 100;
+        *s++ =3D dd[a2 * 2 + 1];
+        goto l2;
+    case 1:
+        a1 =3D y1 % 100;
+        *s++ =3D dd[a1 * 2 + 1];
+        break;
+    case 20:
+        d1 =3D z2 % 100;
+        *s++ =3D dd[d1 * 2];
+        *s++ =3D dd[d1 * 2 + 1];
+        /* fallthrough */
+    case 18: l18:
+        c3 =3D z1 / 10000;
+        *s++ =3D dd[c3 * 2];
+        *s++ =3D dd[c3 * 2 + 1];
+        /* fallthrough */
+    case 16: l16:
+        c2 =3D z1 / 100 % 100;
+        *s++ =3D dd[c2 * 2];
+        *s++ =3D dd[c2 * 2 + 1];
+        /* fallthrough */
+    case 14: l14:
+        c1 =3D z1 % 100;
+        *s++ =3D dd[c1 * 2];
+        *s++ =3D dd[c1 * 2 + 1];
+        /* fallthrough */
+    case 12: l12:
+        b3 =3D y2 / 10000;
+        *s++ =3D dd[b3 * 2];
+        *s++ =3D dd[b3 * 2 + 1];
+        /* fallthrough */
+    case 10: l10:
+        b2 =3D y2 / 100 % 100;
+        *s++ =3D dd[b2 * 2];
+        *s++ =3D dd[b2 * 2 + 1];
+        /* fallthrough */
+    case 8:  l8:
+        b1 =3D y2 % 100;
+        *s++ =3D dd[b1 * 2];
+        *s++ =3D dd[b1 * 2 + 1];
+        /* fallthrough */
+    case 6:  l6:
+        a3 =3D y1 / 10000;
+        *s++ =3D dd[a3 * 2];
+        *s++ =3D dd[a3 * 2 + 1];
+        /* fallthrough */
+    case 4:  l4:
+        a2 =3D y1 / 100 % 100;
+        *s++ =3D dd[a2 * 2];
+        *s++ =3D dd[a2 * 2 + 1];
+        /* fallthrough */
+    case 2:  l2:
+        a1 =3D y1 % 100;
+        *s++ =3D dd[a1 * 2];
+        *s++ =3D dd[a1 * 2 + 1];
+        break;
+    }
+    *s++ =3D '\0';
+    return dig;
+}
+
+static const char *hexdigits =3D "0123456789abcdef";
+
+static size_t xvappend_char(char *restrict out, size_t o, size_t n, char c)
+{
+    if (out && o < n) {
+        out[o] =3D c;
+    }
+    return o + 1;
+}
+
+static size_t xvappend_hex_u32(char *restrict out, size_t o, size_t n,
+    uint val)
+{
+    size_t dig =3D (32 - clz32(val) + 3) / 4;
+    for (size_t i =3D dig - 1; i < dig; i--) {
+        o =3D xvappend_char(out, o, n, hexdigits[(val >> (i * 4)) & 0xf]);
+    }
+    return o;
+}
+
+static size_t xvappend_hex_u64(char *restrict out, size_t o, size_t n,
+    ullong val)
+{
+    size_t dig =3D (64 - clz64(val) + 3) / 4;
+    for (size_t i =3D dig - 1; i < dig; i--) {
+        o =3D xvappend_char(out, o, n, hexdigits[(val >> (i * 4)) & 0xf]);
+    }
+    return o;
+}
+
+static int xvsnprintf(char *restrict out, size_t n, const char* fmt,
+    va_list vl)
+{
+    int w =3D -1, s =3D 0, c;
+    size_t o =3D 0, l;
+    const char *v;
+    char t[21];
+    for ( ; *fmt; fmt++) {
+        if (w >=3D 0) {
+            switch (*fmt) {
+            case 'l':
+                w =3D w < 2 ? w + 1 : w;
+                break;
+            case 'd':
+                s =3D 1;
+                /* fallthrough */
+            case 'u':
+                if (w =3D=3D 0 || sizeof(long) =3D=3D 4) {
+                    int val =3D va_arg(vl, int);
+                    if (s && val < 0) {
+                        val =3D -val;
+                        o =3D xvappend_char(out, o, n, '-');
+                    }
+                    l =3D utoa_u32(val, t);
+                }
+                else if (w =3D=3D 2 || sizeof(long) =3D=3D 8) {
+                    llong val =3D va_arg(vl, llong);
+                    if (s && val < 0) {
+                        val =3D -val;
+                        o =3D xvappend_char(out, o, n, '-');
+                    }
+                    l =3D utoa_u64(val, t);
+                }
+                l =3D n - o < l ? n - o : l;
+                memcpy(out + o, t, l);
+                o +=3D l;
+                w =3D -1;
+                s =3D 0;
+                break;
+            case 'p':
+                o =3D xvappend_char(out, o, n, '0');
+                o =3D xvappend_char(out, o, n, 'x');
+                w =3D 2;
+                /* fallthrough */
+            case 'x':
+                if (w =3D=3D 0 || sizeof(long) =3D=3D 4) {
+                    int val =3D va_arg(vl, int);
+                    o =3D xvappend_hex_u32(out, o, n, val);
+                }
+                else if (w =3D=3D 2 || sizeof(long) =3D=3D 8) {
+                    llong val =3D va_arg(vl, llong);
+                    o =3D xvappend_hex_u64(out, o, n, val);
+                }
+                w =3D -1;
+                break;
+            case 's':
+                v =3D va_arg(vl, const char *);
+                l =3D strlen(v);
+                memcpy(out + o, v, n - o < l ? n - o : l);
+                o +=3D l;
+                w =3D -1;
+                break;
+            case 'c':
+                c =3D va_arg(vl, int);
+                o =3D xvappend_char(out, o, n, (char)c);
+                w =3D -1;
+                break;
+            }
+        }
+        else if (*fmt =3D=3D '%') {
+            w =3D 0;
+        }
+        else {
+            o =3D xvappend_char(out, o, n, *fmt);
+        }
+    }
+    if (out) {
+        out[o < n ? o : n ? n - 1 : 0] =3D 0;
+    }
+    return o;
+}
+
+static inline int xsnprintf(char *out, size_t n, const char *fmt, ...)
+{
+    va_list vl;
+    va_start(vl, fmt);
+    int res =3D xvsnprintf(out, n, fmt, vl);
+    va_end(vl);
+    return res;
+}
+
+/*
+ *  metadata filters
+ */
+
+int x86_enc_filter_rex(x86_rex prefix, uint enc)
+{
+    uint lex =3D  (enc & x86_enc_t_mask) =3D=3D x86_enc_t_lex;
+    uint ew0 =3D  (enc & x86_enc_w_mask) =3D=3D x86_enc_w_w0;
+    uint ew1 =3D  (enc & x86_enc_w_mask) =3D=3D x86_enc_w_w1;
+    uint ewn =3D  (enc & x86_enc_w_mask) =3D=3D x86_enc_w_wn;
+    uint ewb =3D  (enc & x86_enc_w_mask) =3D=3D x86_enc_w_wb;
+    uint eww =3D  (enc & x86_enc_w_mask) =3D=3D x86_enc_w_ww;
+    uint ewx =3D  (enc & x86_enc_w_mask) =3D=3D x86_enc_w_wx;
+    uint ewig =3D (enc & x86_enc_w_mask) =3D=3D x86_enc_w_wig;
+    uint norexb =3D (enc & x86_enc_r_norexb) !=3D 0;
+
+    uint w =3D (prefix.data[0] >> 3) & 1;
+
+    if (!lex) return -1;
+    if (norexb) return -1;
+
+    switch (w) {
+    case x86_vex_w0:
+        if (!(ew0 || ewig || ewn || ewb || eww || ewx)) return -1;
+        break;
+    case x86_vex_w1:
+        if (!(ew1 || ewig || ewn || ewb || eww || ewx)) return -1;
+        break;
+    }
+
+    return 0;
+}
+
+int x86_enc_filter_rex2(x86_rex2 prefix, uint enc)
+{
+    uint lex =3D  (enc & x86_enc_t_mask) =3D=3D x86_enc_t_lex;
+    uint ew0 =3D  (enc & x86_enc_w_mask) =3D=3D x86_enc_w_w0;
+    uint ew1 =3D  (enc & x86_enc_w_mask) =3D=3D x86_enc_w_w1;
+    uint ewig =3D (enc & x86_enc_w_mask) =3D=3D x86_enc_w_wig;
+    uint em =3D   (enc & x86_enc_m_mask) >> x86_enc_m_shift;
+
+    uint m =3D (prefix.data[0] >> 7) & 1;
+    uint w =3D (prefix.data[0] >> 3) & 1;
+
+    if (!lex || m !=3D em) return -1;
+
+    switch (w) {
+    case x86_vex_w0: if (!(ew0 || ewig)) return -1; break;
+    case x86_vex_w1: if (!(ew1 || ewig)) return -1; break;
+    default: return -1;
+    }
+
+    return 0;
+}
+
+int x86_enc_filter_vex2(x86_vex2 prefix, uint enc)
+{
+    uint vex =3D  (enc & x86_enc_t_mask) =3D=3D x86_enc_t_vex;
+    uint ew0 =3D  (enc & x86_enc_w_mask) =3D=3D x86_enc_w_w0;
+    uint ewig =3D (enc & x86_enc_w_mask) =3D=3D x86_enc_w_wig;
+    uint lz =3D   (enc & x86_enc_l_mask) =3D=3D x86_enc_l_lz;
+    uint l0 =3D   (enc & x86_enc_l_mask) =3D=3D x86_enc_l_l0;
+    uint l1 =3D   (enc & x86_enc_l_mask) =3D=3D x86_enc_l_l1;
+    uint l128 =3D (enc & x86_enc_l_mask) =3D=3D x86_enc_l_128;
+    uint l256 =3D (enc & x86_enc_l_mask) =3D=3D x86_enc_l_256;
+    uint lig =3D  (enc & x86_enc_l_mask) =3D=3D x86_enc_l_lig;
+    uint np =3D   (enc & x86_enc_p_mask) =3D=3D x86_enc_p_none;
+    uint p66 =3D  (enc & x86_enc_p_mask) =3D=3D x86_enc_p_66;
+    uint pf2 =3D  (enc & x86_enc_p_mask) =3D=3D x86_enc_p_f2;
+    uint pf3 =3D  (enc & x86_enc_p_mask) =3D=3D x86_enc_p_f3;
+    uint em =3D   (enc & x86_enc_m_mask) >> x86_enc_m_shift;
+
+    uint p =3D (prefix.data[0] >> 0) & 3;
+    uint l =3D (prefix.data[0] >> 2) & 1;
+
+    if (!vex || !(ew0 || ewig) || x86_map_0f !=3D em) return -1;
+
+    switch (l) {
+    case x86_vex_l0: if (!(lig || lz || l0 || l128)) return -1; break;
+    case x86_vex_l1: if (!(lig || l1 || l256)) return -1; break;
+    default: return -1;
+    }
+
+    switch (p) {
+    case x86_pfx_none: if (!np) return -1; break;
+    case x86_pfx_66: if (!p66) return -1; break;
+    case x86_pfx_f2: if (!pf2) return -1; break;
+    case x86_pfx_f3: if (!pf3) return -1; break;
+    default: return -1;
+    }
+
+    return 0;
+}
+
+int x86_enc_filter_vex3(x86_vex3 prefix, uint enc)
+{
+    uint vex =3D  (enc & x86_enc_t_mask) =3D=3D x86_enc_t_vex;
+    uint ew0 =3D  (enc & x86_enc_w_mask) =3D=3D x86_enc_w_w0;
+    uint ew1 =3D  (enc & x86_enc_w_mask) =3D=3D x86_enc_w_w1;
+    uint ewig =3D (enc & x86_enc_w_mask) =3D=3D x86_enc_w_wig;
+    uint lz =3D   (enc & x86_enc_l_mask) =3D=3D x86_enc_l_lz;
+    uint l0 =3D   (enc & x86_enc_l_mask) =3D=3D x86_enc_l_l0;
+    uint l1 =3D   (enc & x86_enc_l_mask) =3D=3D x86_enc_l_l1;
+    uint l128 =3D (enc & x86_enc_l_mask) =3D=3D x86_enc_l_128;
+    uint l256 =3D (enc & x86_enc_l_mask) =3D=3D x86_enc_l_256;
+    uint lig =3D  (enc & x86_enc_l_mask) =3D=3D x86_enc_l_lig;
+    uint np =3D   (enc & x86_enc_p_mask) =3D=3D x86_enc_p_none;
+    uint p66 =3D  (enc & x86_enc_p_mask) =3D=3D x86_enc_p_66;
+    uint pf2 =3D  (enc & x86_enc_p_mask) =3D=3D x86_enc_p_f2;
+    uint pf3 =3D  (enc & x86_enc_p_mask) =3D=3D x86_enc_p_f3;
+    uint em =3D   (enc & x86_enc_m_mask) >> x86_enc_m_shift;
+
+    uint m =3D (prefix.data[0] >> 0) & 31;
+    uint w =3D (prefix.data[1] >> 7) & 1;
+    uint p =3D (prefix.data[1] >> 0) & 3;
+    uint l =3D (prefix.data[1] >> 2) & 1;
+
+    if (!vex || m !=3D em) return -1;
+
+    switch (w) {
+    case x86_vex_w0: if (!(ew0 || ewig)) return -1; break;
+    case x86_vex_w1: if (!(ew1 || ewig)) return -1; break;
+    default: return -1;
+    }
+
+    switch (l) {
+    case x86_vex_l0: if (!(lig || lz || l0 || l128)) return -1; break;
+    case x86_vex_l1: if (!(lig || l1 || l256)) return -1; break;
+    default: return -1;
+    }
+
+    switch (p) {
+    case x86_pfx_none: if (!np) return -1; break;
+    case x86_pfx_66: if (!p66) return -1; break;
+    case x86_pfx_f2: if (!pf2) return -1; break;
+    case x86_pfx_f3: if (!pf3) return -1; break;
+    default: return -1;
+    }
+
+    return 0;
+}
+
+int x86_enc_filter_evex(x86_evex prefix, uint enc)
+{
+    uint evex =3D (enc & x86_enc_t_mask) =3D=3D x86_enc_t_evex;
+    uint ew0 =3D  (enc & x86_enc_w_mask) =3D=3D x86_enc_w_w0;
+    uint ew1 =3D  (enc & x86_enc_w_mask) =3D=3D x86_enc_w_w1;
+    uint ewig =3D (enc & x86_enc_w_mask) =3D=3D x86_enc_w_wig;
+    uint l128 =3D (enc & x86_enc_l_mask) =3D=3D x86_enc_l_128;
+    uint l256 =3D (enc & x86_enc_l_mask) =3D=3D x86_enc_l_256;
+    uint l512 =3D (enc & x86_enc_l_mask) =3D=3D x86_enc_l_512;
+    uint lig =3D  (enc & x86_enc_l_mask) =3D=3D x86_enc_l_lig;
+    uint np =3D   (enc & x86_enc_p_mask) =3D=3D x86_enc_p_none;
+    uint p66 =3D  (enc & x86_enc_p_mask) =3D=3D x86_enc_p_66;
+    uint pf2 =3D  (enc & x86_enc_p_mask) =3D=3D x86_enc_p_f2;
+    uint pf3 =3D  (enc & x86_enc_p_mask) =3D=3D x86_enc_p_f3;
+    uint em =3D   (enc & x86_enc_m_mask) >> x86_enc_m_shift;
+
+    uint m =3D (prefix.data[0] >> 0) & 7;
+    uint w =3D (prefix.data[1] >> 7) & 1;
+    uint p =3D (prefix.data[1] >> 0) & 3;
+    uint l =3D (prefix.data[2] >> 5) & 3;
+
+    if (!evex || m !=3D em) return -1;
+
+    switch (w) {
+    case x86_vex_w0: if (!(ew0 || ewig)) return -1; break;
+    case x86_vex_w1: if (!(ew1 || ewig)) return -1; break;
+    default: return -1;
+    }
+
+    switch (l) {
+    case x86_vex_l0: if (!(lig || l128)) return -1; break;
+    case x86_vex_l1: if (!(lig || l256)) return -1; break;
+    case x86_vex_l2: if (!(lig || l512)) return -1; break;
+    default: return -1;
+    }
+
+    switch (p) {
+    case x86_pfx_none: if (!np) return -1; break;
+    case x86_pfx_66: if (!p66) return -1; break;
+    case x86_pfx_f2: if (!pf2) return -1; break;
+    case x86_pfx_f3: if (!pf3) return -1; break;
+    default: return -1;
+    }
+
+    return 0;
+}
+
+/*
+ *  table sorting
+ */
+
+static int x86_opc_data_compare_opcode(const void *p1, const void *p2)
+{
+    const x86_opc_data *op1 =3D x86_opc_table + *(size_t *)p1;
+    const x86_opc_data *op2 =3D x86_opc_table + *(size_t *)p2;
+
+    /* split into prefix and suffix */
+    uint mask =3D x86_enc_t_mask | x86_enc_p_mask | x86_enc_m_mask;
+    uint op1pre =3D op1->enc & mask;
+    uint op2pre =3D op2->enc & mask;
+    uint op1suf =3D op1->enc & ~mask;
+    uint op2suf =3D op2->enc & ~mask;
+
+    if (op1pre < op2pre) return -1;
+    if (op1pre > op2pre) return 1;
+    if (op1->opc[0] < op2->opc[0]) return -1;
+    if (op1->opc[0] > op2->opc[0]) return 1;
+    if (op1->opc[1] < op2->opc[1]) return -1;
+    if (op1->opc[1] > op2->opc[1]) return 1;
+    if (op1suf < op2suf) return -1;
+    if (op1suf > op2suf) return 1;
+    return 0;
+}
+
+static int x86_opc_data_compare_alpha(const void *p1, const void *p2)
+{
+    const x86_opc_data *op1 =3D x86_opc_table + *(size_t *)p1;
+    const x86_opc_data *op2 =3D x86_opc_table + *(size_t *)p2;
+    int alpha =3D strcmp(x86_op_names[op1->op], x86_op_names[op2->op]);
+    if (alpha =3D=3D 0) return x86_opc_data_compare_opcode(p1, p2);
+    else return alpha;
+}
+
+static x86_table_idx x86_opc_table_index(size_t n)
+{
+    x86_table_idx tab =3D { n, g_malloc(sizeof(size_t) * n) };
+    for (size_t i =3D 0; i < tab.count; i++) tab.idx[i] =3D i;
+    return tab;
+}
+
+x86_table_idx x86_opc_table_identity(void)
+{
+    return x86_opc_table_index(x86_opc_table_size);
+}
+
+x86_table_idx x86_opc_table_sorted(x86_table_idx tab, uint sort)
+{
+    switch (sort) {
+    case x86_sort_none:
+        break;
+    case x86_sort_numeric:
+        qsort(tab.idx, tab.count, sizeof(size_t), x86_opc_data_compare_opc=
ode);
+        break;
+    case x86_sort_alpha:
+        qsort(tab.idx, tab.count, sizeof(size_t), x86_opc_data_compare_alp=
ha);
+        break;
+    }
+    return tab;
+}
+
+x86_table_idx x86_opc_table_filter(x86_table_idx tab, uint modes)
+{
+    size_t count =3D 0;
+    for (size_t i =3D 0; i < tab.count; i++) {
+        const x86_opc_data *d =3D x86_opc_table + tab.idx[i];
+        if (d->mode & modes) count++;
+    }
+    x86_table_idx newtab =3D { count, g_malloc(sizeof(size_t) * count) };
+    count =3D 0;
+    for (size_t i =3D 0; i < tab.count; i++) {
+        const x86_opc_data *d =3D x86_opc_table + tab.idx[i];
+        if (d->mode & modes) newtab.idx[count++] =3D i;
+    }
+    g_free(tab.idx);
+    return newtab;
+}
+
+static int x86_opc_data_compare_masked(const void *p1, const void *p2)
+{
+    x86_opc_data *om1 =3D (x86_opc_data *)p1;
+    x86_opc_data *om2 =3D (x86_opc_data *)p2;
+    uint enc1 =3D om1->enc, enc2 =3D om2->enc;
+    uint pre1 =3D enc1 & (x86_enc_t_mask | x86_enc_m_mask | x86_enc_prexw_=
mask);
+    uint pre2 =3D enc2 & (x86_enc_t_mask | x86_enc_m_mask | x86_enc_prexw_=
mask);
+    if (pre1 < pre2) return -1;
+    if (pre1 > pre2) return 1;
+    ushort mask_s =3D om1->opm_s & om2->opm_s;
+    if ((om1->opc_s & mask_s) < (om2->opc_s & mask_s)) return -1;
+    if ((om1->opc_s & mask_s) > (om2->opc_s & mask_s)) return 1;
+    /* suffix is unnecessary for matching opcodes because it contains form=
at*/
+    return 0;
+}
+
+static int x86_opc_data_compare_build(const void *p1, const void *p2)
+{
+    x86_opc_data *om1 =3D (x86_opc_data *)p1;
+    x86_opc_data *om2 =3D (x86_opc_data *)p2;
+    uint enc1 =3D om1->enc, enc2 =3D om2->enc;
+    uint pre1 =3D enc1 & (x86_enc_t_mask | x86_enc_m_mask | x86_enc_prexw_=
mask);
+    uint pre2 =3D enc2 & (x86_enc_t_mask | x86_enc_m_mask | x86_enc_prexw_=
mask);
+    if (pre1 < pre2) return -1;
+    if (pre1 > pre2) return 1;
+    for (size_t i =3D 0; i < 2; i++) {
+        if (om1->opc[i] < om2->opc[i]) return -1;
+        if (om1->opc[i] > om2->opc[i]) return 1;
+        /* most specific mask first for fixed modrm */
+        if (om1->opm[i] < om2->opm[i]) return 1;
+        if (om1->opm[i] > om2->opm[i]) return -1;
+    }
+    uint suf1 =3D enc1 & ~(x86_enc_t_mask | x86_enc_m_mask | x86_enc_prexw=
_mask);
+    uint suf2 =3D enc2 & ~(x86_enc_t_mask | x86_enc_m_mask | x86_enc_prexw=
_mask);
+    if (suf1 < suf2) return -1;
+    if (suf1 > suf2) return 1;
+    return 0;
+}
+
+/*
+ *  table construction
+ */
+
+static x86_opc_prefix x86_table_make_prefix(const x86_opc_data *d,
+    const x86_opr_data *o, const x86_ord_data *p)
+{
+    x86_opc_prefix tp;
+    memset(&tp, 0, sizeof(tp));
+
+    /* extract prefix and synthesize width prefixes */
+    switch (x86_enc_type(d->enc)) {
+    case x86_enc_t_lex:
+    case x86_enc_t_vex:
+    case x86_enc_t_evex:
+        switch (d->enc & x86_enc_w_mask) {
+        case x86_enc_w_wig:
+        case x86_enc_w_wn:
+        case x86_enc_w_wb:
+        case x86_enc_w_w0: break;
+        case x86_enc_w_w1: tp.pfx =3D x86_enc_p_rexw; break;
+        case x86_enc_w_wx: tp.pfx_w =3D x86_enc_p_rexw; /* fallthrough */
+        case x86_enc_w_ww: tp.pfx_o =3D x86_enc_p_66; break;
+        }
+        break;
+     }
+
+    /* find register or memory operand mapping to modrm.rm field
+     * so that we can add mod=3D0b11 or mod!=3D0b11 to modrm mask */
+    tp.modfun =3D x86_enc_func(d->enc) =3D=3D x86_enc_f_modrm_n;
+    for (size_t i =3D 0; i < array_size(o->opr) && o->opr[i]; i++) {
+        uint isreg =3D x86_opr_type_val(o->opr[i]) >=3D x86_opr_reg;
+        uint ismem =3D x86_opr_has_mem(o->opr[i]);
+        uint ismrm =3D x86_ord_type_val(p->ord[i]) =3D=3D x86_ord_mrm;
+        if (ismrm) {
+            if (isreg && !ismem) {
+                tp.modreg =3D 1; /* mod =3D=3D 0b11 */
+                break;
+            } else if (!isreg && ismem) {
+                tp.modmem =3D 1; /* mod !=3D 0b11 */
+                break;
+            }
+        }
+    }
+
+    /* explict second opcode byte has mod =3D=3D 0b11 */
+    if (d->opm[1] =3D=3D 0xff && (d->opc[1] & 0xc0) =3D=3D 0xc0 &&
+        !tp.modreg && !tp.modmem)
+    {
+        tp.modreg =3D 1;
+    }
+
+    return tp;
+}
+
+static void x86_build_prefix_clashes(x86_acc_idx *idx, x86_table_idx tab,
+    ullong *modfun, ullong *modmod)
+{
+    /*
+     * record modrm.reg /n or modrm.mod (reg or mem) usage
+     * so that opcodes with clashes can expand mod entries
+     */
+    for (size_t i =3D 0; i < tab.count; i++) {
+        const x86_opc_data *d =3D x86_opc_table + tab.idx[i];
+        const x86_opr_data *o =3D x86_opr_table + d->opr;
+        const x86_ord_data *p =3D x86_ord_table + d->ord;
+        x86_opc_prefix tp =3D x86_table_make_prefix(d, o, p);
+        uint type =3D x86_enc_type(d->enc) >> x86_enc_t_shift;
+        uint prefix =3D x86_enc_prefix(d->enc) >> x86_enc_p_shift;
+        uint map =3D x86_enc_map(d->enc) >> x86_enc_m_shift;
+        size_t tpm =3D x86_acc_page(type, prefix, map);
+        size_t x =3D (tpm << 8) | d->opc[0];
+        if (tp.modfun) {
+            x86_bitmap_set(modfun, x, 1);
+        }
+        if (tp.modreg || tp.modmem) {
+            x86_bitmap_set(modmod, x, 1);
+        }
+    }
+}
+
+static size_t x86_add_opc_data(x86_opc_data *op_map, size_t idx,
+    x86_opc_data rec, uint modreg, uint modmem, uint modcla)
+{
+    /*
+     * add entries to opcode map, expanding mod entries where
+     * for modreg or modmem constraints or clashes with mod.reg /n
+     */
+    if (op_map) {
+        if (modreg) {
+            /* add one entry with mod =3D=3D 0b11 - ModRM.rm is register */
+            rec.opm[1] |=3D 0xc0;
+            rec.opc[1] |=3D 0xc0;
+            op_map[idx] =3D rec;
+        } else if (modmem) {
+            /* add three entries with mod !=3D 0b11 - ModRM.rm is memory */
+            rec.opm[1] |=3D 0xc0;
+            rec.opc[1] =3D (rec.opc[1] & 0x3f) | 0x80;
+            op_map[idx] =3D rec;
+            rec.opc[1] =3D (rec.opc[1] & 0x3f) | 0x40;
+            op_map[idx + 1] =3D rec;
+            rec.opc[1] =3D (rec.opc[1] & 0x3f);
+            op_map[idx + 2] =3D rec;
+        } else if (modcla) {
+            /* add four entries mod (0b00..0b11) due to function clash */
+            rec.opm[1] |=3D 0xc0;
+            rec.opc[1] =3D (rec.opc[1] & 0x3f) | 0xc0;
+            op_map[idx] =3D rec;
+            rec.opc[1] =3D (rec.opc[1] & 0x3f) | 0x80;
+            op_map[idx + 1] =3D rec;
+            rec.opc[1] =3D (rec.opc[1] & 0x3f) | 0x40;
+            op_map[idx + 2] =3D rec;
+            rec.opc[1] =3D (rec.opc[1] & 0x3f);
+            op_map[idx + 3] =3D rec;
+        } else {
+            /* add entry unmodified */
+            op_map[idx] =3D rec;
+        }
+    }
+    return modreg ? 1 : modmem ? 3 : modcla ? 4 : 1;
+}
+
+static void x86_build_prefix_table(x86_acc_idx *idx,
+    x86_table_idx tab, x86_opc_data *op_map, size_t *count,
+    ullong *modfun, ullong *modmod)
+{
+    /*
+     * build the opcode map with synthesized prefixes and modrm expansion
+     */
+    size_t n =3D 1;
+    for (size_t i =3D 0; i < tab.count; i++) {
+        const x86_opc_data *d =3D x86_opc_table + tab.idx[i];
+        const x86_opr_data *o =3D x86_opr_table + d->opr;
+        const x86_ord_data *p =3D x86_ord_table + d->ord;
+
+        uint type =3D x86_enc_type(d->enc) >> x86_enc_t_shift;
+        uint prefix =3D x86_enc_prefix(d->enc) >> x86_enc_p_shift;
+        uint map =3D x86_enc_map(d->enc) >> x86_enc_m_shift;
+        size_t tpm =3D x86_acc_page(type, prefix, map);
+        size_t x =3D (tpm << 8) | d->opc[0];
+        uint modcla =3D x86_bitmap_get(modfun, x) && x86_bitmap_get(modmod=
, x);
+        x86_opc_prefix tp =3D x86_table_make_prefix(d, o, p);
+
+        x86_opc_data rec =3D *d;
+        rec.enc |=3D tp.pfx;
+        n +=3D x86_add_opc_data(op_map, n, rec,
+            tp.modreg, tp.modmem, modcla);
+        if (tp.pfx_w) {
+            rec =3D *d;
+            rec.enc |=3D tp.pfx | tp.pfx_w;
+            n +=3D x86_add_opc_data(op_map, n, rec,
+                tp.modreg, tp.modmem, modcla);
+        }
+        if (tp.pfx_o) {
+            rec =3D *d;
+            rec.enc |=3D tp.pfx | tp.pfx_o;
+            n +=3D x86_add_opc_data(op_map, n, rec,
+                tp.modreg, tp.modmem, modcla);
+        }
+    }
+
+    if (count) *count =3D n;
+}
+
+static size_t x86_build_accel_offsets(x86_acc_idx *idx)
+{
+    /*
+     * allocate offsets for type prefix map combinations
+     *
+     * offset zero means the slice is not allocated but page zero is
+     * preallocated as a special cased for type:LEX, prefix:0, map:0
+     */
+    size_t num_pages =3D 1;
+    for (size_t i =3D 1; i < idx->map_count; i++) {
+        const x86_opc_data *m =3D idx->map + i;
+        uint type =3D x86_enc_type(m->enc) >> x86_enc_t_shift;
+        uint prefix =3D x86_enc_prefix(m->enc) >> x86_enc_p_shift;
+        uint map =3D x86_enc_map(m->enc) >> x86_enc_m_shift;
+        size_t acc_page =3D x86_acc_page(type, prefix, map);
+        if (acc_page > 0 && idx->page_offsets[acc_page] =3D=3D 0) {
+            size_t page =3D num_pages++;
+            idx->page_offsets[acc_page] =3D page;
+        }
+    }
+    return num_pages << 8;
+}
+
+static void x86_build_accel_table(x86_acc_idx *idx, x86_acc_entry *acc)
+{
+    /*
+     * add entries to the acceleration table. the acceleration
+     * table contains ranges for all entries of a given opcode.
+     *
+     * (type, prefix, map, opcode) -> (index, count)
+     */
+    for (size_t i =3D 1; i < idx->map_count; i++) {
+        const x86_opc_data *m =3D idx->map + i;
+        uint type =3D x86_enc_type(m->enc) >> x86_enc_t_shift;
+        uint prefix =3D x86_enc_prefix(m->enc) >> x86_enc_p_shift;
+        uint map =3D x86_enc_map(m->enc) >> x86_enc_m_shift;
+        size_t acc_page =3D x86_acc_page(type, prefix, map);
+        size_t offset =3D x86_acc_offset(idx, acc_page);
+        uint opc =3D m->opc[0], opc_i =3D opc, opm =3D m->opm[0];
+        while ((opc_i & opm) =3D=3D opc) {
+            if (acc[offset + opc_i].idx =3D=3D 0) {
+                acc[offset + opc_i].idx =3D i;
+            }
+            acc[offset + opc_i].nent++;
+            opc_i++;
+        }
+    }
+}
+
+static x86_acc_idx *x86_table_build(uint modes)
+{
+    x86_acc_idx *idx =3D g_malloc0(sizeof(x86_acc_idx));
+    x86_table_idx tab =3D x86_opc_table_sorted(x86_opc_table_filter(
+        x86_opc_table_identity(), modes), x86_sort_numeric);
+    size_t bmap_size =3D /*t,p,m*/ 512 * /*opcode*/ 256 >> /*bits*/ 3;
+    ullong *modfun =3D g_malloc0(bmap_size);
+    ullong *modmod =3D g_malloc0(bmap_size);
+    x86_build_prefix_clashes(idx, tab, modfun, modmod);
+    x86_build_prefix_table(idx, tab, NULL, &idx->map_count, modfun, modmod=
);
+    idx->map =3D g_malloc0(idx->map_count * sizeof(x86_opc_data));
+    x86_build_prefix_table(idx, tab, idx->map, NULL, modfun, modmod);
+    qsort(idx->map, idx->map_count, sizeof(x86_opc_data),
+        x86_opc_data_compare_build);
+    idx->page_offsets =3D g_malloc0(/*t,p,m*/ 512);
+    idx->acc_count =3D x86_build_accel_offsets(idx);
+    idx->acc =3D g_malloc0(idx->acc_count * sizeof(x86_acc_entry));
+    x86_build_accel_table(idx, idx->acc);
+    g_free(tab.idx);
+    g_free(modfun);
+    g_free(modmod);
+    return idx;
+}
+
+/*
+ *  table lookup
+ */
+
+static x86_opc_data *x86_table_lookup_slow(x86_acc_idx *idx,
+    const x86_opc_data *m)
+{
+    size_t begin =3D 0, end =3D idx->map_count;
+    while (end !=3D 0) {
+        size_t half =3D (end >> 1), probe =3D begin + half;
+        if (x86_opc_data_compare_masked(m, idx->map + probe) > 0) {
+            begin =3D probe + 1;
+            end -=3D half + 1;
+        } else {
+            end =3D half;
+        }
+    }
+    return idx->map + begin;
+}
+
+x86_opc_data *x86_table_lookup(x86_acc_idx *idx, const x86_opc_data *m)
+{
+    uint type =3D x86_enc_type(m->enc) >> x86_enc_t_shift;
+    uint prefix =3D x86_enc_prefix(m->enc) >> x86_enc_p_shift;
+    uint map =3D x86_enc_map(m->enc) >> x86_enc_m_shift;
+    size_t acc_page =3D x86_acc_page(type, prefix, map);
+    size_t offset =3D x86_acc_offset(idx, acc_page) + m->opc[0];
+    x86_acc_entry *ent =3D x86_acc_lookup(idx, offset);
+    x86_acc_idx new_idx =3D { ent->nent, idx->map + ent->idx };
+    return x86_table_lookup_slow(&new_idx, m);
+}
+
+/*
+ * table printing utilities
+ */
+
+static x86_table_col x86_new_column(int width, char *data)
+{
+    x86_table_col col =3D { width, strdup(data) };
+    return col;
+}
+
+static void x86_print_row(size_t count, x86_table_col *cols)
+{
+    printf("|");
+    for (size_t i =3D 0; i < count; i++) {
+        printf(" %-*s |", cols[i].width, cols[i].data);
+        g_free(cols[i].data);
+    }
+    printf("\n");
+}
+
+static size_t x86_format_enc(char *buf, size_t buflen, const x86_opc_data =
*d)
+{
+    size_t len =3D 0;
+
+    uint s =3D x86_enc_suffix(d->enc);
+    uint i =3D x86_enc_imm(d->enc);
+    uint j =3D x86_enc_imm2(d->enc);
+    uint enc =3D x86_enc_leading(d->enc);
+
+    len +=3D x86_enc_name(buf + len, buflen - len, enc);
+
+    switch (x86_enc_opcode(enc)) {
+    case x86_enc_o_opcode_r:
+        len +=3D snprintf(buf + len, buflen - len, " %02hhx+r", d->opc[0]);
+        break;
+    default:
+        len +=3D snprintf(buf + len, buflen - len, " %02hhx", d->opc[0]);
+        break;
+    }
+
+    switch (x86_enc_func(enc)) {
+    case x86_enc_f_modrm_r:
+        len +=3D snprintf(buf + len, buflen - len, " /r");
+        break;
+    case x86_enc_f_modrm_n:
+        len +=3D snprintf(buf + len, buflen - len, " /%d", (d->opc[1] >> 3=
) & 7);
+        break;
+    case x86_enc_f_opcode_r:
+        len +=3D snprintf(buf + len, buflen - len, " %02hhx+r", d->opc[1]);
+        break;
+    case x86_enc_f_opcode:
+        len +=3D snprintf(buf + len, buflen - len, " %02hhx", d->opc[1]);
+        break;
+    }
+
+    if (i) {
+        len +=3D x86_enc_name(buf + len, buflen - len, i);
+    }
+    if (j) {
+        len +=3D x86_enc_name(buf + len, buflen - len, j);
+    }
+    if (s) {
+        len +=3D x86_enc_name(buf + len, buflen - len, s);
+    }
+
+    return len;
+}
+
+void x86_print_op(const x86_opc_data *d, uint compact, uint opcode)
+{
+    char buf[256];
+    x86_table_col cols[6];
+    size_t count =3D 0, buflen =3D sizeof(buf), len;
+
+    const x86_opr_data *o =3D x86_opr_table + d->opr;
+    const x86_ord_data *p =3D x86_ord_table + d->ord;
+
+    buf[(len =3D 0)] =3D '\0';
+    if (compact) {
+        len +=3D snprintf(buf + len, buflen - len, "%s", x86_op_names[d->o=
p]);
+        cols[count++] =3D x86_new_column(18, buf);
+    } else {
+        len +=3D snprintf(buf + len, buflen - len, "%s ", x86_op_names[d->=
op]);
+        for (size_t i =3D 0; i < array_size(o->opr) && o->opr[i]; i++) {
+            if (i !=3D 0) len +=3D snprintf(buf + len, buflen - len, ",");
+            len +=3D x86_opr_name(buf + len, buflen - len, o->opr[i]);
+        }
+        cols[count++] =3D x86_new_column(52, buf);
+    }
+
+    if (opcode) {
+        buf[(len =3D 0)] =3D '\0';
+        len +=3D snprintf(buf + len, buflen - len, "%02hhx %02hhx",
+            d->opc[0], d->opc[1]);
+        cols[count++] =3D x86_new_column(5, buf);
+        buf[(len =3D 0)] =3D '\0';
+        len +=3D snprintf(buf + len, buflen - len, "%02hhx %02hhx",
+            d->opm[0], d->opm[1]);
+        cols[count++] =3D x86_new_column(5, buf);
+    }
+
+    if (compact) {
+        buf[(len =3D 0)] =3D '\0';
+        len +=3D x86_ord_mnem(buf + len, buflen - len, p->ord);
+        cols[count++] =3D x86_new_column(4, buf);
+    }
+
+    buf[(len =3D 0)] =3D '\0';
+    len +=3D x86_format_enc(buf, buflen - len, d);
+    cols[count++] =3D x86_new_column(31, buf);
+
+    if (!compact) {
+        buf[(len =3D 0)] =3D '\0';
+        for (size_t i =3D 0; i < array_size(p->ord) && p->ord[i]; i++) {
+            if (i !=3D 0) len +=3D snprintf(buf + len, buflen - len, ",");
+            len +=3D x86_ord_name(buf + len, buflen - len, p->ord[i], "/");
+        }
+        cols[count++] =3D x86_new_column(23, buf);
+    }
+
+    buf[(len =3D 0)] =3D '\0';
+    len +=3D x86_mode_name(buf + len, buflen - len, d->mode, "/");
+    cols[count++] =3D x86_new_column(8, buf);
+
+    x86_print_row(count, cols);
+}
+
+/*
+ * encoding / decoding
+ */
+
+int x86_codec_write(x86_ctx *ctx, x86_buffer *buf, x86_codec c, size_t *le=
n)
+{
+    size_t nbytes =3D 0;
+
+    /* segment prefix */
+    switch (c.seg) {
+    case x86_seg_es: nbytes +=3D x86_out8(buf, x86_pb_es); break;
+    case x86_seg_cs: nbytes +=3D x86_out8(buf, x86_pb_cs); break;
+    case x86_seg_ss: nbytes +=3D x86_out8(buf, x86_pb_ss); break;
+    case x86_seg_ds: nbytes +=3D x86_out8(buf, x86_pb_ds); break;
+    case x86_seg_fs: nbytes +=3D x86_out8(buf, x86_pb_fs); break;
+    case x86_seg_gs: nbytes +=3D x86_out8(buf, x86_pb_gs); break;
+    }
+
+    /* other prefixes */
+    if (x86_codec_has_osize(&c)) {
+        nbytes +=3D x86_out8(buf, x86_pb_osize);
+    }
+    if (x86_codec_has_asize(&c)) {
+        nbytes +=3D x86_out8(buf, x86_pb_asize);
+    }
+    if (x86_codec_has_wait(&c)) {
+        nbytes +=3D x86_out8(buf, x86_pb_wait);
+    }
+    if (x86_codec_has_lock(&c)) {
+        nbytes +=3D x86_out8(buf, x86_pb_lock);
+    }
+    if (x86_codec_has_rep(&c)) {
+        nbytes +=3D x86_out8(buf, x86_pb_rep);
+    }
+    if (x86_codec_has_repne(&c)) {
+        nbytes +=3D x86_out8(buf, x86_pb_repne);
+    }
+
+    /* extended prefixes */
+    switch (x86_codec_field_ce(&c) >> x86_ce_shift) {
+        case x86_ce_rex >> x86_ce_shift:
+            nbytes +=3D x86_out8(buf, c.rex.data[0]);
+            break;
+        case x86_ce_rex2 >> x86_ce_shift:
+            nbytes +=3D x86_out8(buf, x86_pb_rex2);
+            nbytes +=3D x86_out8(buf, c.rex2.data[0]);
+            break;
+        case x86_ce_vex2 >> x86_ce_shift:
+            nbytes +=3D x86_out8(buf, x86_pb_vex2);
+            nbytes +=3D x86_out8(buf, c.vex2.data[0]);
+            break;
+        case x86_ce_vex3 >> x86_ce_shift:
+            nbytes +=3D x86_out8(buf, x86_pb_vex3);
+            nbytes +=3D x86_out8(buf, c.vex3.data[0]);
+            nbytes +=3D x86_out8(buf, c.vex3.data[1]);
+            break;
+        case x86_ce_evex >> x86_ce_shift:
+            nbytes +=3D x86_out8(buf, x86_pb_evex);
+            nbytes +=3D x86_out8(buf, c.evex.data[0]);
+            nbytes +=3D x86_out8(buf, c.evex.data[1]);
+            nbytes +=3D x86_out8(buf, c.evex.data[2]);
+            break;
+    }
+
+    /* map */
+    switch (x86_codec_field_cm(&c) >> x86_cm_shift) {
+    case x86_cm_none >> x86_cm_shift:
+        break;
+    case x86_cm_0f   >> x86_cm_shift:
+        nbytes +=3D x86_out8(buf, 0x0f);
+        break;
+    case x86_cm_0f38 >> x86_cm_shift:
+        nbytes +=3D x86_out16(buf, 0x380f);
+        break;
+    case x86_cm_0f3a >> x86_cm_shift:
+        nbytes +=3D x86_out16(buf, 0x3a0f);
+        break;
+    }
+
+    /* opcode */
+    for (size_t i =3D 0; i < c.opclen; i++) {
+        nbytes +=3D x86_out8(buf, c.opc[i]);
+    }
+
+    /* ModRM and SIB */
+    int b;
+    if (x86_codec_has_modrm(&c)) {
+        nbytes +=3D x86_out8(buf, c.modrm.data[0]);
+
+        uchar rm =3D x86_modrm_rm(c.modrm.data[0]);
+        uchar mod =3D x86_modrm_mod(c.modrm.data[0]);
+
+        switch (mod) {
+        case x86_mod_disp0:
+        case x86_mod_disp8:
+        case x86_mod_dispw:
+            /* there is no SIB in real mode */
+            if (!x86_codec_is16(&c) && rm =3D=3D x86_rm_sp_sib) {
+                nbytes +=3D x86_out8(buf, c.sib.data[0]);
+            }
+            break;
+        case x86_mod_reg: break;
+        }
+        switch (mod) {
+        case x86_mod_disp0:
+            /* special case for rm/b =3D=3D bp */
+            b =3D x86_sib_b(c.sib.data[0]);
+            if (rm =3D=3D x86_rm_bp_disp0 ||
+                (rm =3D=3D x86_rm_sp_sib && b =3D=3D x86_rm_bp_disp0))
+            {
+                if (x86_codec_is16(&c)) {
+                    nbytes +=3D x86_out16(buf, (u16)c.disp32);
+                } else {
+                    /* this is RIP-relative in amd64 mode */
+                    nbytes +=3D x86_out32(buf, (u32)c.disp32);
+                }
+            }
+            break;
+        case x86_mod_disp8:
+            nbytes +=3D x86_out8(buf, (u8)c.disp32);
+            break;
+        case x86_mod_dispw:
+            if (x86_codec_is16(&c)) {
+                nbytes +=3D x86_out16(buf, (u16)c.disp32); break;
+            } else {
+                nbytes +=3D x86_out32(buf, (u32)c.disp32); break;
+            }
+        case x86_mod_reg: break;
+        }
+    }
+
+    /* immediate */
+    switch (x86_codec_field_ci(&c) >> x86_ci_shift) {
+    case x86_ci_iw >> x86_ci_shift:
+        if (x86_codec_is16(&c) ^ x86_codec_has_osize(&c)) {
+            nbytes +=3D x86_out16(buf, (u16)c.imm32);
+        } else {
+            nbytes +=3D x86_out32(buf, (u32)c.imm32);
+        }
+        break;
+    case x86_ci_iwd >> x86_ci_shift:
+        if (x86_codec_is16(&c)) {
+            nbytes +=3D x86_out16(buf, (u16)c.imm32);
+        } else {
+            nbytes +=3D x86_out32(buf, (u32)c.imm32);
+        }
+        break;
+    case x86_ci_ib >> x86_ci_shift:
+        nbytes +=3D x86_out8(buf, (u8)c.imm32);
+        break;
+    case x86_ci_i16 >> x86_ci_shift:
+        nbytes +=3D x86_out16(buf, (u16)c.imm32);
+        break;
+    case x86_ci_i32 >> x86_ci_shift:
+        nbytes +=3D x86_out32(buf, (u32)c.imm32);
+        break;
+    case x86_ci_i64 >> x86_ci_shift:
+        nbytes +=3D x86_out64(buf, (u64)c.imm64);
+        break;
+    }
+
+    /* additional immediate used by CALLF/JMPF/ENTER */
+    switch (x86_codec_field_cj(&c) >> x86_cj_shift) {
+    case x86_cj_ib >> x86_cj_shift:
+        nbytes +=3D x86_out8(buf, (u8)c.imm2);
+        break;
+    case x86_cj_i16 >> x86_cj_shift:
+        nbytes +=3D x86_out16(buf, (u16)c.imm2);
+        break;
+    }
+
+    *len =3D nbytes;
+    return 0;
+}
+
+static int x86_filter_op(x86_codec *c, x86_opc_data *d, uint w)
+{
+    if (x86_codec_is16(c) && !x86_mode_has16(d->mode)) return -1;
+    if (x86_codec_is32(c) && !x86_mode_has32(d->mode)) return -1;
+    if (x86_codec_is64(c) && !x86_mode_has64(d->mode)) return -1;
+
+    switch (x86_codec_field_ce(c) >> x86_ce_shift) {
+    case x86_ce_rex >> x86_ce_shift:
+        if (x86_enc_filter_rex(c->rex, d->enc) < 0) return -1;
+        break;
+    case x86_ce_rex2 >> x86_ce_shift:
+        if (x86_enc_filter_rex2(c->rex2, d->enc) < 0) return -1;
+        break;
+    case x86_ce_vex2 >> x86_ce_shift:
+        if (x86_enc_filter_vex2(c->vex2, d->enc) < 0) return -1;
+        break;
+    case x86_ce_vex3 >> x86_ce_shift:
+        if (x86_enc_filter_vex3(c->vex3, d->enc) < 0) return -1;
+        break;
+    case x86_ce_evex >> x86_ce_shift:
+        if (x86_enc_filter_evex(c->evex, d->enc) < 0) return -1;
+        break;
+    }
+
+    if (x86_enc_has_a16(d->enc)) {
+        if (!x86_codec_is16(c) ||
+            !(x86_codec_is32(c) && x86_codec_has_asize(c))) return -1;
+    }
+    if (x86_enc_has_a32(d->enc)) {
+        if (!x86_codec_is32(c) ||
+            !(x86_codec_is64(c) && x86_codec_has_asize(c))) return -1;
+    }
+    if (x86_enc_has_a64(d->enc)) {
+        if (!x86_codec_is64(c) || x86_codec_has_asize(c)) return -1;
+    }
+
+    if (x86_enc_has_o16(d->enc)) {
+        switch (x86_enc_width(d->enc)) {
+        case x86_enc_w_ww:
+        case x86_enc_w_wx:
+            if (!(x86_codec_is16(c) ^ x86_codec_has_osize(c)) || w) return=
 -1;
+            break;
+        }
+    }
+    if (x86_enc_has_o32(d->enc)) {
+        switch (x86_enc_width(d->enc)) {
+        case x86_enc_w_ww:
+            /* .ww means no 32-bit operands in 64-bit mode */
+            if ((x86_codec_is16(c) ^ x86_codec_has_osize(c)) ||
+                 x86_codec_is64(c)) return -1;
+            break;
+        case x86_enc_w_wx:
+            if ((x86_codec_is16(c) ^ x86_codec_has_osize(c)) || w) return =
-1;
+            break;
+        }
+    }
+    if (x86_enc_has_o64(d->enc)) {
+        switch (x86_enc_width(d->enc)) {
+        case x86_enc_w_ww:
+            /* .ww means ignores W=3D1 in 64-bit mode */
+            if (!x86_codec_is64(c)) return -1;
+            break;
+        case x86_enc_w_wx:
+            if (!x86_codec_is64(c) || !w) return -1;
+            break;
+        }
+    }
+
+    return 0;
+}
+
+static size_t x86_parse_encoding(x86_buffer *buf, x86_codec *c,
+    x86_opc_data *d)
+{
+    size_t nbytes =3D 0;
+
+    /* parse SIB and displacement */
+    int b;
+    if (x86_codec_has_modrm(c)) {
+        uchar rm =3D x86_modrm_rm(c->modrm.data[0]);
+        uchar mod =3D x86_modrm_mod(c->modrm.data[0]);
+        switch (mod) {
+        case x86_mod_disp0:
+        case x86_mod_disp8:
+        case x86_mod_dispw:
+            /* there is no SIB in real mode */
+            if (!x86_codec_is16(c) && rm =3D=3D x86_rm_sp_sib) {
+                c->sib.data[0] =3D (u8)x86_in8(buf); nbytes +=3D 1;
+            }
+            break;
+        case x86_mod_reg:
+            break;
+        }
+        switch (mod) {
+        case x86_mod_disp0:
+            /* special case for rm/b =3D=3D bp */
+            b =3D x86_sib_b(c->sib.data[0]);
+            if (rm =3D=3D x86_rm_bp_disp0 ||
+                (rm =3D=3D x86_rm_sp_sib && b =3D=3D x86_rm_bp_disp0))
+            {
+                if (x86_codec_is16(c)) {
+                    c->disp32 =3D (i16)x86_in16(buf); nbytes +=3D 2;
+                } else {
+                    /* this is RIP-relative in amd64 mode */
+                    c->disp32 =3D (i32)x86_in32(buf); nbytes +=3D 4;
+                }
+            }
+            break;
+        case x86_mod_disp8:
+            c->disp32 =3D (i8)x86_in8(buf); nbytes +=3D 1;
+            break;
+        case x86_mod_dispw:
+            if (x86_codec_is16(c)) {
+                c->disp32 =3D (i16)x86_in16(buf); nbytes +=3D 2;
+            } else {
+                c->disp32 =3D (i32)x86_in32(buf); nbytes +=3D 4;
+            }
+        case x86_mod_reg:
+            break;
+        }
+    }
+
+    /* parse immediate */
+    switch (x86_enc_imm(d->enc) >> x86_enc_i_shift) {
+    case x86_enc_i_ib >> x86_enc_i_shift:
+        c->imm32 =3D (i8)x86_in8(buf); nbytes +=3D 1;
+        c->flags |=3D x86_ci_ib;
+        break;
+    case x86_enc_i_iw >> x86_enc_i_shift:
+        if (x86_codec_is16(c) ^ x86_codec_has_osize(c)) {
+            c->imm32 =3D (i16)x86_in16(buf); nbytes +=3D 2;
+        } else {
+            c->imm32 =3D (i32)x86_in32(buf); nbytes +=3D 4;
+        }
+        c->flags |=3D x86_ci_iw;
+        break;
+    case x86_enc_i_iwd >> x86_enc_i_shift:
+        if (x86_codec_is16(c)) {
+            c->imm32 =3D (i16)x86_in16(buf); nbytes +=3D 2;
+        } else {
+            c->imm32 =3D (i32)x86_in32(buf); nbytes +=3D 4;
+        }
+        c->flags |=3D x86_ci_iwd;
+        break;
+    case x86_enc_i_i16 >> x86_enc_i_shift:
+        c->imm32 =3D (i16)x86_in16(buf);  nbytes +=3D 2;
+        c->flags |=3D x86_ci_i16;
+        break;
+    case x86_enc_i_i32 >> x86_enc_i_shift:
+        c->imm32 =3D (i32)x86_in32(buf);  nbytes +=3D 4;
+        c->flags |=3D x86_ci_i32;
+        break;
+    case x86_enc_i_i64 >> x86_enc_i_shift:
+        c->imm64 =3D (i64)x86_in64(buf);  nbytes +=3D 8;
+        c->flags |=3D x86_ci_i64;
+        break;
+    }
+
+    /* additional immediate used by CALLF/JMPF/ENTER */
+    switch (x86_enc_imm2(d->enc) >> x86_enc_j_shift) {
+    case x86_enc_j_ib >> x86_enc_j_shift:
+        c->imm2 =3D (i8)x86_in8(buf); nbytes +=3D 1;
+        c->flags |=3D x86_cj_ib;
+        break;
+    case x86_enc_j_i16 >> x86_enc_j_shift:
+        c->imm2 =3D (i16)x86_in16(buf); nbytes +=3D 2;
+        c->flags |=3D x86_cj_i16;
+        break;
+    }
+
+    return nbytes;
+}
+
+enum {
+    x86_enc_tpm_mask  =3D x86_enc_t_mask | x86_enc_prexw_mask | x86_enc_m_=
mask
+};
+
+static x86_opc_data *x86_table_match(x86_ctx *ctx, x86_codec *c,
+    x86_opc_data k, int w)
+{
+    x86_opc_data *r =3D NULL;
+    /* key is type+prefix+map with substituted rexw=3Dw flag */
+    k.enc =3D ((k.enc & ~x86_enc_p_rexw) |
+             (-w    &  x86_enc_p_rexw)) & x86_enc_tpm_mask;
+    x86_debugf("table_lookup { type:%x prefix:%x map:%x "
+        "opc:[%02hhx %02hhx] opm:[%02hhx %02hhx] }",
+        (k.enc & x86_enc_t_mask) >> x86_enc_t_shift,
+        (k.enc & x86_enc_p_mask) >> x86_enc_p_shift,
+        (k.enc & x86_enc_m_mask) >> x86_enc_m_shift,
+        k.opc[0], k.opc[1], k.opm[0], k.opm[1]);
+    r =3D x86_table_lookup(ctx->idx, &k);
+    while (r < ctx->idx->map + ctx->idx->map_count) {
+        /* substitute suffix of record for precise match */
+        k.enc =3D ((k.enc & x86_enc_tpm_mask) |
+                  (r->enc & ~x86_enc_tpm_mask));
+        size_t oprec =3D (r - ctx->idx->map);
+        x86_debugf("checking opdata %zu", oprec);
+        if (debug) x86_print_op(r, 1, 1);
+        if (x86_opc_data_compare_masked(&k, r) !=3D 0) {
+            x86_debugf("** no matches");
+            r =3D NULL;
+            break;
+        }
+        if (x86_filter_op(c, r, w) =3D=3D 0) break;
+        r++;
+    }
+    return r;
+}
+
+int x86_codec_read(x86_ctx *ctx, x86_buffer *buf, x86_codec *c, size_t *le=
n)
+{
+    uint state =3D x86_state_top;
+    size_t nbytes =3D 0, limit =3D buf->end - buf->start;
+    uint t =3D 0, m =3D 0, w =3D 0, p =3D 0, l =3D 0, mode =3D ctx->mode;
+    x86_opc_data k =3D { 0 }, *r =3D NULL;
+    uchar b =3D 0, lastp =3D 0;
+
+    memset(c, 0, sizeof(x86_codec));
+    switch (mode) {
+    case x86_modes_32: c->flags |=3D x86_cf_ia32; break;
+    case x86_modes_64: c->flags |=3D x86_cf_amd64; break;
+    }
+
+    while (state !=3D x86_state_done) {
+        nbytes +=3D x86_buffer_read(buf, &b, 1);
+        switch (state) {
+        case x86_state_top:
+            switch (b) {
+            case 0x40: case 0x41: case 0x42: case 0x43:
+            case 0x44: case 0x45: case 0x46: case 0x47:
+            case 0x48: case 0x49: case 0x4a: case 0x4b:
+            case 0x4c: case 0x4d: case 0x4e: case 0x4f:
+                c->rex.data[0] =3D b;
+                c->flags |=3D x86_ce_rex;
+                w =3D (c->rex.data[0] >> 3) & 1;
+                t =3D x86_table_lex;
+                state =3D x86_state_rex_opcode;
+                break;
+            case x86_pb_26:
+            case x86_pb_2e:
+            case x86_pb_36:
+            case x86_pb_3e:
+            case x86_pb_64:
+            case x86_pb_65:
+                state =3D x86_state_segment;
+                goto segment_reparse;
+            case x86_pb_66:
+            case x86_pb_67:
+            case x86_pb_9b:
+            case x86_pb_f0:
+            case x86_pb_f2:
+            case x86_pb_f3:
+                state =3D x86_state_legacy;
+                goto legacy_reparse;
+            case x86_pb_62:
+                nbytes +=3D x86_buffer_read(buf, c->evex.data, 3);
+                c->flags |=3D x86_ce_evex;
+                m =3D (c->evex.data[0] >> 0) & 7;
+                w =3D (c->evex.data[1] >> 7) & 1;
+                p =3D (c->evex.data[1] >> 0) & 3;
+                l =3D (c->evex.data[2] >> 5) & 3;
+                t =3D x86_table_evex;
+                state =3D x86_state_vex_opcode;
+                break;
+            case x86_pb_c4:
+                nbytes +=3D x86_buffer_read(buf, c->vex3.data, 2);
+                c->flags |=3D x86_ce_vex3;
+                m =3D (c->vex3.data[0] >> 0) & 31;
+                w =3D (c->vex3.data[1] >> 7) & 1;
+                p =3D (c->vex3.data[1] >> 0) & 3;
+                l =3D (c->vex3.data[1] >> 2) & 1;
+                t =3D x86_table_vex;
+                state =3D x86_state_vex_opcode;
+                break;
+            case x86_pb_c5:
+                nbytes +=3D x86_buffer_read(buf, c->vex2.data, 1);
+                c->flags |=3D x86_ce_vex2;
+                m =3D x86_map_0f;
+                p =3D (c->vex2.data[0] >> 0) & 3;
+                l =3D (c->vex2.data[0] >> 2) & 1;
+                t =3D x86_table_vex;
+                state =3D x86_state_vex_opcode;
+                break;
+            case x86_pb_d5:
+                nbytes +=3D x86_buffer_read(buf, c->rex2.data, 1);
+                c->flags |=3D x86_ce_rex2;
+                m =3D (c->rex2.data[0] >> 7) & 1;
+                w =3D (c->rex2.data[0] >> 3) & 1;
+                t =3D x86_table_lex;
+                state =3D x86_state_lex_opcode;
+                break;
+            case 0x0f:
+                t =3D x86_table_lex;
+                state =3D x86_state_map_0f;
+                break;
+            default:
+                m =3D x86_map_none;
+                t =3D x86_table_lex;
+                state =3D x86_state_lex_opcode;
+                goto lex_reparse;
+            }
+            break;
+        case x86_state_segment: segment_reparse:
+            switch (b) {
+            case 0x40: case 0x41: case 0x42: case 0x43:
+            case 0x44: case 0x45: case 0x46: case 0x47:
+            case 0x48: case 0x49: case 0x4a: case 0x4b:
+            case 0x4c: case 0x4d: case 0x4e: case 0x4f:
+                c->rex.data[0] =3D b;
+                c->flags |=3D x86_ce_rex;
+                w =3D (c->rex.data[0] >> 3) & 1;
+                t =3D x86_table_lex;
+                state =3D x86_state_rex_opcode;
+                break;
+            case x86_pb_26:
+                c->seg =3D x86_seg_es; state =3D x86_state_legacy;
+                break;
+            case x86_pb_2e:
+                c->seg =3D x86_seg_cs; state =3D x86_state_legacy;
+                break;
+            case x86_pb_36:
+                c->seg =3D x86_seg_ss; state =3D x86_state_legacy;
+                break;
+            case x86_pb_3e:
+                c->seg =3D x86_seg_ds; state =3D x86_state_legacy;
+                break;
+            case x86_pb_64:
+                c->seg =3D x86_seg_fs; state =3D x86_state_legacy;
+                break;
+            case x86_pb_65:
+                c->seg =3D x86_seg_gs; state =3D x86_state_legacy;
+                break;
+            case x86_pb_66:
+            case x86_pb_67:
+            case x86_pb_9b:
+            case x86_pb_f0:
+            case x86_pb_f2:
+            case x86_pb_f3:
+                state =3D x86_state_legacy;
+                goto legacy_reparse;
+            case x86_pb_62:
+            case x86_pb_c4:
+            case x86_pb_c5:
+            case x86_pb_d5:
+                goto err;
+            case 0x0f:
+                t =3D x86_table_lex;
+                state =3D x86_state_map_0f;
+                break;
+            default:
+                m =3D x86_map_none;
+                t =3D x86_table_lex;
+                state =3D x86_state_lex_opcode;
+                goto lex_reparse;
+            }
+            break;
+        case x86_state_legacy: legacy_reparse:
+            switch (b) {
+            case 0x40: case 0x41: case 0x42: case 0x43:
+            case 0x44: case 0x45: case 0x46: case 0x47:
+            case 0x48: case 0x49: case 0x4a: case 0x4b:
+            case 0x4c: case 0x4d: case 0x4e: case 0x4f:
+                c->rex.data[0] =3D b;
+                c->flags |=3D x86_ce_rex;
+                w =3D (c->rex.data[0] >> 3) & 1;
+                t =3D x86_table_lex;
+                state =3D x86_state_rex_opcode;
+                break;
+            case x86_pb_26:
+            case x86_pb_2e:
+            case x86_pb_36:
+            case x86_pb_3e:
+            case x86_pb_64:
+            case x86_pb_65:
+            case x86_pb_62:
+            case x86_pb_c4:
+            case x86_pb_c5:
+            case x86_pb_d5:
+                goto err;
+            case x86_pb_66:
+                lastp =3D b;
+                c->flags |=3D x86_cp_osize;
+                break;
+            case x86_pb_67:
+                lastp =3D b;
+                c->flags |=3D x86_cp_asize;
+                break;
+            case x86_pb_9b:
+                lastp =3D b;
+                c->flags |=3D x86_cp_wait;
+                break;
+            case x86_pb_f0:
+                lastp =3D b;
+                c->flags |=3D x86_cp_lock;
+                break;
+            case x86_pb_f2:
+                lastp =3D b;
+                c->flags |=3D x86_cp_repne;
+                break;
+            case x86_pb_f3:
+                lastp =3D b;
+                c->flags |=3D x86_cp_rep;
+                break;
+            case 0x0f:
+                t =3D x86_table_lex;
+                state =3D x86_state_map_0f;
+                break;
+            default:
+                m =3D x86_map_none;
+                t =3D x86_table_lex;
+                state =3D x86_state_lex_opcode;
+                goto lex_reparse;
+            }
+            break;
+        case x86_state_rex_opcode:
+            switch (b) {
+            case 0x0f:
+                state =3D x86_state_map_0f;
+                break;
+            default:
+                state =3D x86_state_lex_opcode;
+                goto lex_reparse;
+            }
+            break;
+        case x86_state_map_0f:
+            switch (b) {
+            case 0x38:
+                c->flags |=3D x86_cm_0f38;
+                m =3D x86_map_0f38;
+                state =3D x86_state_lex_opcode;
+                break;
+            case 0x3a:
+                c->flags |=3D x86_cm_0f3a;
+                m =3D x86_map_0f3a;
+                state =3D x86_state_lex_opcode;
+                break;
+            default:
+                c->flags |=3D x86_cm_0f;
+                m =3D x86_map_0f;
+                state =3D x86_state_lex_opcode;
+                goto lex_reparse;
+            }
+            break;
+        case x86_state_lex_opcode: lex_reparse:
+            k.enc |=3D ((t << x86_enc_t_shift) & x86_enc_t_mask)
+                  |  ((m << x86_enc_m_shift) & x86_enc_m_mask);
+            switch (lastp) {
+            case 0x66: k.enc |=3D x86_enc_p_66; break;
+            case 0x9b: k.enc |=3D x86_enc_p_9b; break;
+            case 0xf2: k.enc |=3D x86_enc_p_f2; break;
+            case 0xf3: k.enc |=3D x86_enc_p_f3; break;
+            }
+            state =3D x86_state_done;
+            break;
+        case x86_state_vex_opcode:
+            k.enc |=3D ((t << x86_enc_t_shift) & x86_enc_t_mask)
+                  |  ((m << x86_enc_m_shift) & x86_enc_m_mask);
+            switch (p) {
+            case x86_pfx_66: k.enc |=3D x86_enc_p_66; break;
+            case x86_pfx_f2: k.enc |=3D x86_enc_p_f2; break;
+            case x86_pfx_f3: k.enc |=3D x86_enc_p_f3; break;
+            }
+            state =3D x86_state_done;
+            (void)l; /* l can be added to the index key */
+            break;
+        default:
+            abort();
+        }
+    };
+
+    /* populate opcode for table lookup */
+    k.mode =3D mode;
+    c->opc[0] =3D k.opc[0] =3D b;
+    nbytes +=3D x86_buffer_read(buf, &b, 1);
+    c->opc[1] =3D k.opc[1] =3D b;
+    k.opm[0] =3D k.opm[1] =3D 0xff;
+
+    /* if REX.W=3D1 first attempt to lookup W=3D1 record */
+    if (w) {
+        r =3D x86_table_match(ctx, c, k, 1);
+    }
+
+    /* if REX.W=3D0 or search failed lookup W=3D0/WIG record */
+    if (!w || (w && !r)) {
+        r =3D x86_table_match(ctx, c, k, 0);
+    }
+
+    /* now attempt lookup without using the prefix */
+    if (!r) {
+        k.enc &=3D ~x86_enc_p_mask;
+
+        /* if REX.W=3D1 first attempt to lookup W=3D1 record */
+        if (w) {
+            r =3D x86_table_match(ctx, c, k, 1);
+        }
+
+        /* if REX.W=3D0 or search failed lookup W=3D0/WIG record */
+        if (!w || (w && !r)) {
+            r =3D x86_table_match(ctx, c, k, 0);
+        }
+    }
+
+    /* parse encoding */
+    if (r) {
+
+        /* set opcode length and modrm flags */
+        switch (x86_enc_func(r->enc)) {
+        case x86_enc_f_modrm_r:
+        case x86_enc_f_modrm_n:
+            /* second byte is modrm */
+            c->flags |=3D x86_cf_modrm;
+            c->opclen =3D 1;
+            break;
+        case x86_enc_f_opcode:
+        case x86_enc_f_opcode_r:
+            /* two byte opcode */
+            c->opclen =3D 2;
+            break;
+        default:
+            /* no second opcode byte */
+            nbytes -=3D x86_buffer_unread(buf, 1);
+            c->opclen =3D 1;
+            break;
+        }
+
+        /* parse SIB, disp, imm from format */
+        nbytes +=3D x86_parse_encoding(buf, c, r);
+        if (nbytes <=3D limit) {
+            c->rec =3D (r - ctx->idx->map);
+            *len =3D nbytes;
+            return 0;
+        }
+    }
+
+err:
+    nbytes -=3D x86_buffer_unread(buf, nbytes);
+    *len =3D nbytes;
+    return -1;
+}
+
+static x86_operands x86_codec_operands(x86_ctx *ctx, x86_codec *c)
+{
+    x86_operands q;
+    memset(&q, 0, sizeof(q));
+
+    const x86_opc_data *d =3D ctx->idx->map + c->rec;
+
+    q.osz =3D x86_codec_has_osize(c);
+
+    if (x86_codec_has_modrm(c)) {
+        uchar rm =3D x86_modrm_rm(c->modrm.data[0]);
+        uchar reg =3D x86_modrm_reg(c->modrm.data[0]);
+        uchar mod =3D x86_modrm_mod(c->modrm.data[0]);
+
+        /*
+         * q.rm contains unextended value from ModRM.rm
+         * and is used to indicate SIB/disp encoding.
+         *
+         * if SIB present, copy SIB.b into q.b
+         * if SIB not present, copy ModRM.rm into q.b
+         *
+         * q.b contains extended ModRM.rm or SIB.b
+         */
+
+        q.mod =3D mod;
+        q.rm =3D rm;
+        q.r =3D reg;
+
+        switch (mod) {
+        case x86_mod_disp0:
+        case x86_mod_disp8:
+        case x86_mod_dispw:
+            if (!x86_codec_is16(c) && rm =3D=3D x86_rm_sp_sib) {
+                q.b =3D x86_sib_b(c->sib.data[0]);
+                q.x =3D x86_sib_x(c->sib.data[0]);
+                q.s =3D x86_sib_s(c->sib.data[0]);
+            } else {
+                q.b =3D q.rm;
+            }
+            break;
+        case x86_mod_reg:
+            q.b =3D q.rm;
+            break;
+        }
+    } else if (d->enc & x86_enc_o_opcode_r) {
+        q.b =3D c->opc[0] & 7;
+    } else if (d->enc & x86_enc_f_opcode_r) {
+        q.b =3D c->opc[1] & 7;
+    }
+
+    switch (x86_codec_field_ce(c) >> x86_ce_shift) {
+    case x86_ce_rex >> x86_ce_shift:
+        q.b |=3D  (c->rex.data[0] &    1) << 3; /* [0] -> b[3]*/
+        q.x |=3D  (c->rex.data[0] &    2) << 2; /* [1] -> x[3]*/
+        q.r |=3D  (c->rex.data[0] &    4) << 1; /* [2] -> r[3]*/
+        q.w  =3D  (c->rex.data[0] &    8) >> 3;
+        break;
+    case x86_ce_rex2 >> x86_ce_shift:
+        q.b |=3D  (c->rex2.data[0] &   1) << 3; /* [0] -> b[3]*/
+        q.x |=3D  (c->rex2.data[0] &   2) << 2; /* [1] -> x[3]*/
+        q.r |=3D  (c->rex2.data[0] &   4) << 1; /* [2] -> r[3]*/
+        q.w  =3D  (c->rex2.data[0] &   8) >> 3;
+        q.b |=3D  (c->rex2.data[0] &  16) >> 0; /* [4] -> b[4]*/
+        q.x |=3D  (c->rex2.data[0] &  32) >> 1; /* [5] -> x[4]*/
+        q.r |=3D  (c->rex2.data[0] &  64) >> 2; /* [6] -> r[4]*/
+        break;
+    case x86_ce_vex2 >> x86_ce_shift:
+        q.r |=3D (~c->vex2.data[0] & 128) >> 4; /* [7] -> r[3] */
+        q.l  =3D  (c->vex2.data[0] >>  2) & 1;
+        q.v  =3D (~c->vex2.data[0] >>  3) & 15;
+        q.osz =3D (c->vex2.data[0] & 3) =3D=3D x86_pfx_66;
+        break;
+    case x86_ce_vex3 >> x86_ce_shift:
+        q.b |=3D (~c->vex3.data[0] &  32) >> 2; /* [5] -> b[3]*/
+        q.x |=3D (~c->vex3.data[0] &  64) >> 3; /* [6] -> x[3]*/
+        q.r |=3D (~c->vex3.data[0] & 128) >> 4; /* [7] -> r[3]*/
+        q.l  =3D  (c->vex3.data[1] >>  2) & 1;
+        q.v  =3D (~c->vex3.data[1] >>  3) & 15;
+        q.w  =3D  (c->vex3.data[1] >>  7) & 1;
+        q.osz =3D (c->vex3.data[1] & 3) =3D=3D x86_pfx_66;
+        break;
+    case x86_ce_evex >> x86_ce_shift:
+        q.b |=3D (~c->evex.data[0] &  32) >> 2; /* [5] -> b[3]*/
+        q.x |=3D (~c->evex.data[0] &  64) >> 3; /* [6] -> x[3]*/
+        q.r |=3D (~c->evex.data[0] & 128) >> 4; /* [7] -> r[3]*/
+        q.b |=3D  (c->evex.data[0] &   8) << 1; /* [3] -> b[4]*/
+        q.x |=3D (~c->evex.data[1] &   4) << 2; /* [2] -> x[4]*/
+        q.r |=3D (~c->evex.data[0] &  16) >> 0; /* [4] -> r[4]*/
+        q.v  =3D (~c->evex.data[1] >>  3) & 15;
+        q.v |=3D (~c->evex.data[2] &   8) << 1; /* [3] -> v[4]*/
+        q.k  =3D  (c->evex.data[2] >>  0) & 7;
+        q.l  =3D  (c->evex.data[2] >>  5) & 3;
+        q.brd =3D (c->evex.data[2] >>  4) & 1;
+        q.osz =3D (c->evex.data[1] & 3) =3D=3D x86_pfx_66;
+        break;
+    }
+
+    return q;
+}
+
+/*
+ * disassembly
+ */
+
+static inline x86_arg x86_codec_meta(uint enc, uint opr, uint ord,
+    x86_operands q)
+{
+    x86_arg a =3D { enc, opr, ord, q };
+    return a;
+}
+
+static uint x86_codec_addr_size(x86_codec *c)
+{
+    /* todo - handle address size prefix */
+    if (x86_codec_is32(c)) return x86_opr_size_32;
+    if (x86_codec_is64(c)) return x86_opr_size_64;
+    return x86_opr_size_16;
+}
+
+static const char *x86_ptr_size_str(uint sz)
+{
+    switch (sz) {
+    case x86_opr_size_8: return "byte ptr ";
+    case x86_opr_size_16: return "word ptr ";
+    case x86_opr_size_32: return "dword ptr ";
+    case x86_opr_size_64: return "qword ptr ";
+    case x86_opr_size_80: return "tbyte ptr ";
+    case x86_opr_size_128: return "xmmword ptr ";
+    case x86_opr_size_256: return "ymmword ptr ";
+    case x86_opr_size_512: return "zmmword ptr ";
+    default: return "";
+    }
+}
+
+static uint x86_opr_reg_size(x86_codec *c, x86_arg a)
+{
+    uint oprty =3D x86_opr_type_val(a.opr);
+    uint oprsz =3D x86_opr_size_val(a.opr);
+    uint oprmem =3D x86_opr_mem_val(a.opr);
+
+    /* 'rw' or 'mw' deduce size from mode, operand size prefix and REX.W */
+    if ((oprty =3D=3D x86_opr_reg && oprsz =3D=3D x86_opr_size_w) ||
+        (oprmem =3D=3D x86_opr_mw) ||
+        (a.opr =3D=3D x86_opr_moffs || a.opr =3D=3D x86_opr_reg_psi ||
+         a.opr =3D=3D x86_opr_reg_pdi))
+    {
+        switch (x86_enc_width(a.enc)) {
+        case x86_enc_w_wb: return x86_opr_size_8;
+        case x86_enc_w_ww:
+            if (x86_codec_is16(c))
+                return a.q.osz ? x86_opr_size_32 : x86_opr_size_16;
+            if (x86_codec_is32(c))
+                return a.q.osz ? x86_opr_size_16 : x86_opr_size_32;
+            if (x86_codec_is64(c))
+                return a.q.osz ? x86_opr_size_16 : x86_opr_size_64;
+            break;
+        case x86_enc_w_wx:
+            if (x86_codec_is16(c))
+                return a.q.osz ? x86_opr_size_32 : x86_opr_size_16;
+            if (x86_codec_is32(c))
+                return a.q.osz ? x86_opr_size_16 : x86_opr_size_32;
+            if (x86_codec_is64(c))
+                return a.q.osz ? x86_opr_size_16 :
+                        a.q.w ? x86_opr_size_64 : x86_opr_size_32;
+            break;
+        case x86_enc_w_w0: return x86_opr_size_32;
+        case x86_enc_w_w1: return x86_opr_size_64;
+        default: break;
+        }
+    }
+
+    /* operand contains the register size */
+    if (oprsz !=3D 0 && oprsz !=3D x86_opr_size_w && oprsz !=3D x86_opr_si=
ze_a) {
+        return oprsz;
+    }
+
+    return 0;
+}
+
+static uint x86_opr_ptr_size(x86_codec *c, x86_arg a)
+{
+    uint memsz =3D x86_opr_mem_size(a.opr);
+    if (memsz =3D=3D x86_opr_size_w) {
+        memsz =3D x86_opr_reg_size(c, a);
+    }
+    return memsz;
+}
+
+static uint x86_sized_gpr(x86_codec *c, uint reg, uint opr)
+{
+    switch (x86_opr_size_val(opr)) {
+    case x86_opr_size_8:
+        /* legacy encoding selects ah/cd/dh/bh instead of spl/bpl/sil/dil =
*/
+        if ((x86_codec_field_ce(c)) =3D=3D x86_ce_none &&
+           ((reg & 31) >=3D 4 && (reg & 31) < 8)) return x86_reg_bl | (reg=
 & 31);
+        return x86_reg_b | (reg & 31);
+    case x86_opr_size_16: return x86_reg_w | (reg & 31);
+    case x86_opr_size_32: return x86_reg_d | (reg & 31);
+    case x86_opr_size_64: return x86_reg_q | (reg & 31);
+    default: return reg;
+    }
+}
+
+static uint x86_sized_vec(uint reg, uint opr)
+{
+    switch (x86_opr_size_val(opr)) {
+    case x86_opr_size_64:  return x86_reg_mmx | (reg & 7);
+    case x86_opr_size_128: return x86_reg_xmm | (reg & 31);
+    case x86_opr_size_256: return x86_reg_ymm | (reg & 31);
+    case x86_opr_size_512: return x86_reg_zmm | (reg & 31);
+    default: return reg;
+    }
+}
+
+static uint x86_regsz_bytes(uint regsz)
+{
+    switch (regsz) {
+    case x86_opr_size_8: return 1;
+    case x86_opr_size_16: return 2;
+    case x86_opr_size_32: return 4;
+    case x86_opr_size_64: return 8;
+    case x86_opr_size_128: return 16;
+    case x86_opr_size_256: return 32;
+    case x86_opr_size_512: return 64;
+    default: break;
+    }
+    return 1;
+}
+
+static size_t x86_opr_intel_reg_str_internal(char *buf, size_t buflen,
+    x86_codec *c, x86_arg a, uint reg)
+{
+    size_t len =3D 0;
+
+    switch (x86_opr_type_val(a.opr)) {
+    case x86_opr_reg: len =3D xsnprintf(buf, buflen, "%s",
+        x86_reg_name(x86_sized_gpr(c, reg,
+        x86_opr_reg_size(c, a)))); break;
+    case x86_opr_vec: len =3D xsnprintf(buf, buflen, "%s",
+        x86_reg_name(x86_sized_vec(reg, a.opr))); break;
+    case x86_opr_k: len =3D xsnprintf(buf, buflen, "%s",
+        x86_reg_name(x86_reg_kmask | (reg & 7))); break;
+    case x86_opr_mmx: len =3D xsnprintf(buf, buflen, "%s",
+        x86_reg_name(x86_reg_mmx | (reg & 7))); break;
+    case x86_opr_st: len =3D xsnprintf(buf, buflen, "%s",
+        x86_reg_name(x86_reg_fpu | (reg & 7))); break;
+    case x86_opr_bnd: len =3D xsnprintf(buf, buflen, "%s",
+        x86_reg_name(x86_reg_bnd | (reg & 7))); break;
+    case x86_opr_seg: len =3D xsnprintf(buf, buflen, "%s",
+        x86_reg_name(x86_reg_sreg | (reg & 7)));  break;
+    case x86_opr_creg: len =3D xsnprintf(buf, buflen, "%s",
+        x86_reg_name(x86_reg_creg | (reg & 15))); break;
+    case x86_opr_dreg: len =3D xsnprintf(buf, buflen, "%s",
+        x86_reg_name(x86_reg_dreg | (reg & 15))); break;
+    default: len =3D xsnprintf(buf, buflen, "%s", "unknown"); break;
+    }
+
+    if ((a.q.k & 7) > 0 && (a.opr & x86_opr_flag_k) !=3D 0) {
+        len +=3D xsnprintf(buf + len, buflen - len, " {%s}",
+                        x86_reg_name(x86_reg_kmask | (a.q.k & 7)));
+    }
+
+    return len;
+}
+
+static uint x86_opr_bcst_size(uint opr)
+{
+    switch (x86_opr_bcst_val(opr)) {
+    case x86_opr_m16bcst: return x86_opr_size_16;
+    case x86_opr_m32bcst: return x86_opr_size_32;
+    case x86_opr_m64bcst: return x86_opr_size_64;
+    }
+    return 0;
+}
+
+x86_opr_formats x86_opr_formats_intel_hex =3D
+{
+    .ptr_rip            =3D "%s[rip]",
+    .ptr_rip_disp       =3D "%s[rip %s 0x%x]",
+    .ptr_reg            =3D "%s[%s]",
+    .ptr_reg_disp       =3D "%s[%s %s 0x%x]",
+    .ptr_reg_sreg       =3D "%s[%s + %d*%s]",
+    .ptr_reg_sreg_disp  =3D "%s[%s + %d*%s %s 0x%x]",
+    .ptr_reg_reg        =3D "%s[%s + %s]",
+    .ptr_reg_reg_disp   =3D "%s[%s + %s %s 0x%x]",
+    .ptr_sreg           =3D "%s[%d*%s]",
+    .ptr_disp           =3D "%s[%s0x%x]",
+    .ptr_imm64          =3D "%s[%s0x%llx]",
+    .ptr_imm32          =3D "%s[%s0x%x]",
+    .imm64              =3D "%s0x%llx",
+    .imm32              =3D "%s0x%x",
+    .reg                =3D "%s",
+};
+
+x86_opr_formats x86_opr_formats_intel_dec =3D
+{
+    .ptr_rip            =3D "%s[rip]",
+    .ptr_rip_disp       =3D "%s[rip %s %u]",
+    .ptr_reg            =3D "%s[%s]",
+    .ptr_reg_disp       =3D "%s[%s %s %u]",
+    .ptr_reg_sreg       =3D "%s[%s + %d*%s]",
+    .ptr_reg_sreg_disp  =3D "%s[%s + %d*%s %s %u]",
+    .ptr_reg_reg        =3D "%s[%s + %s]",
+    .ptr_reg_reg_disp   =3D "%s[%s + %s %s %u]",
+    .ptr_sreg           =3D "%s[%d*%s]",
+    .ptr_disp           =3D "%s[%s%u]",
+    .ptr_imm64          =3D "%s[%s%llu]",
+    .ptr_imm32          =3D "%s[%s%u]",
+    .imm64              =3D "%s%llu",
+    .imm32              =3D "%s%u",
+    .reg                =3D "%s",
+};
+
+static size_t x86_opr_intel_mrm_str_internal(char *buf, size_t buflen,
+    x86_codec *c, x86_arg a, x86_opr_formats *fmt)
+{
+    uint regsz =3D x86_opr_reg_size(c, a);
+    uint ptrsz =3D x86_opr_ptr_size(c, a);
+    uint addrsz =3D x86_codec_addr_size(c);
+    uint bcstsz =3D x86_opr_bcst_size(a.opr);
+    uint oprmem =3D x86_opr_mem_val(a.opr);
+    uint vmsz =3D x86_opr_ew_size(a.opr);
+    size_t len =3D 0;
+
+    int is_disp =3D c->disp32 !=3D 0;
+    int is_scale =3D a.q.s !=3D 0;
+    int is_sib =3D a.q.rm =3D=3D x86_sp;
+    int is_vsib =3D oprmem =3D=3D x86_opr_vm32 || oprmem =3D=3D x86_opr_vm=
64;
+    int is_reg =3D a.q.mod =3D=3D x86_mod_reg;
+    int is_disp0 =3D a.q.mod =3D=3D x86_mod_disp0;
+    int is_disp8 =3D a.q.mod =3D=3D x86_mod_disp8;
+    int is_base_bp =3D (a.q.b & 7) =3D=3D x86_bp;
+    int is_base_sp =3D (a.q.b & 7) =3D=3D x86_sp;
+    int is_index_sp =3D a.q.x =3D=3D x86_sp;
+    int is_64bit =3D x86_codec_is64(c);
+    int is_evex =3D x86_codec_field_ce(c) =3D=3D x86_ce_evex;
+
+    int is_ptr_rip =3D is_base_bp && is_disp0 && !is_sib && is_64bit;
+    int is_ptr_rip_disp =3D is_ptr_rip && is_disp;
+    int is_ptr_disp =3D is_base_bp && is_disp0 && (!is_sib ||
+                      (is_sib && !is_vsib && is_index_sp && !is_scale));
+    int is_ptr_sreg =3D is_sib && is_base_bp && is_disp0;
+    int is_ptr_reg_sreg =3D is_sib && is_scale;
+    int is_ptr_reg_sreg_disp =3D is_ptr_reg_sreg && is_disp;
+    int is_ptr_reg_reg =3D is_sib && !(is_base_sp && is_index_sp && !is_vs=
ib);
+    int is_ptr_reg_reg_disp =3D is_ptr_reg_reg && is_disp;
+
+    int s =3D (1 << a.q.s);
+    uint d =3D c->disp32 < 0 ? -c->disp32 : c->disp32;
+
+    const char *so =3D c->disp32 < 0 ? "-" : "+";
+    const char *sn =3D c->disp32 < 0 ? "-" : "";
+    const char *p =3D is_vsib ? x86_ptr_size_str(vmsz) : x86_ptr_size_str(=
ptrsz);
+    const char *b =3D x86_reg_name(x86_sized_gpr(c, a.q.b, addrsz));
+    const char *x =3D is_vsib ? x86_reg_name(x86_sized_vec(a.q.x, regsz)) :
+        is_index_sp ? "riz" : x86_reg_name(x86_sized_gpr(c, a.q.x, addrsz)=
);
+
+    if (is_disp8 && is_evex) {
+        d *=3D x86_opr_et_val(a.opr) ?
+            x86_opr_ew_bytes(a.opr) : x86_regsz_bytes(ptrsz);
+    }
+
+    if (is_reg) {
+        len =3D x86_opr_intel_reg_str_internal(buf, buflen, c, a, a.q.b);
+    } else if (is_ptr_rip_disp) {
+        len =3D xsnprintf(buf, buflen, fmt->ptr_rip_disp, p, so, d);
+    } else if (is_ptr_rip) {
+        len =3D xsnprintf(buf, buflen, fmt->ptr_rip, p);
+    } else if (is_ptr_disp) {
+        len =3D xsnprintf(buf, buflen, fmt->ptr_disp, p, sn, d);
+    } else if (is_ptr_sreg) {
+        len =3D xsnprintf(buf, buflen, fmt->ptr_sreg, p, s, x);
+    } else if (is_ptr_reg_sreg_disp) {
+        len =3D xsnprintf(buf, buflen, fmt->ptr_reg_sreg_disp, p, b, s, x,=
 so, d);
+    } else if (is_ptr_reg_sreg) {
+        len =3D xsnprintf(buf, buflen, fmt->ptr_reg_sreg, p, b, s, x);
+    } else if (is_ptr_reg_reg_disp) {
+        len =3D xsnprintf(buf, buflen, fmt->ptr_reg_reg_disp, p, b, x, so,=
 d);
+    } else if (is_ptr_reg_reg) {
+        len =3D xsnprintf(buf, buflen, fmt->ptr_reg_reg, p, b, x);
+    } else if (is_disp) {
+        len =3D xsnprintf(buf, buflen, fmt->ptr_reg_disp, p, b, so, d);
+    } else {
+        len =3D xsnprintf(buf, buflen, fmt->ptr_reg, p, b);
+    }
+
+    if (!is_reg && (a.q.k & 7) > 0 && (a.opr & x86_opr_flag_k) !=3D 0) {
+        const char *k =3D x86_reg_name(x86_reg_kmask | (a.q.k & 7));
+        len +=3D xsnprintf(buf + len, buflen - len, " {%s}", k);
+    }
+
+    if (bcstsz && a.q.brd) {
+        int bcstsc =3D x86_regsz_bytes(ptrsz) / x86_regsz_bytes(bcstsz);
+        len +=3D xsnprintf(buf + len, buflen - len, "{1to%u}", bcstsc);
+    }
+
+    return len;
+}
+
+static size_t x86_opr_intel_mrm_dec_str(char *buf, size_t buflen,
+    x86_codec *c, x86_arg a)
+{
+    return x86_opr_intel_mrm_str_internal(buf, buflen, c, a,
+        &x86_opr_formats_intel_dec);
+}
+
+static size_t x86_opr_intel_mrm_hex_str(char *buf, size_t buflen,
+    x86_codec *c, x86_arg a)
+{
+    return x86_opr_intel_mrm_str_internal(buf, buflen, c, a,
+        &x86_opr_formats_intel_hex);
+}
+
+static size_t x86_opr_intel_reg_str(char *buf, size_t buflen,
+    x86_codec *c, x86_arg a)
+{
+    return x86_opr_intel_reg_str_internal(buf, buflen, c, a, a.q.r);
+}
+
+static size_t x86_opr_intel_vec_str(char *buf, size_t buflen,
+    x86_codec *c, x86_arg a)
+{
+    return x86_opr_intel_reg_str_internal(buf, buflen, c, a, a.q.v);
+}
+
+static size_t x86_opr_intel_opb_str(char *buf, size_t buflen,
+    x86_codec *c, x86_arg a)
+{
+    return x86_opr_intel_reg_str_internal(buf, buflen, c, a, a.q.b);
+}
+
+static size_t x86_opr_intel_is4_str(char *buf, size_t buflen,
+    x86_codec *c, x86_arg a)
+{
+    uint reg =3D (c->imm32 >> 4) & 15;
+    return x86_opr_intel_reg_str_internal(buf, buflen, c, a, reg);
+}
+
+static size_t x86_opr_intel_imm_str_internal(char *buf, size_t buflen,
+    x86_codec *c, x86_arg a, x86_opr_formats *fmt)
+{
+    if (a.opr =3D=3D x86_opr_moffs) {
+        uint regsz =3D x86_opr_reg_size(c, a);
+        if ((x86_codec_field_ci(c)) =3D=3D x86_ci_i64) {
+            llong imm =3D c->imm64;
+            return xsnprintf(buf, buflen, fmt->ptr_imm64,
+                x86_ptr_size_str(regsz),
+                imm < 0 ? "-" : "", imm < 0 ? -imm : imm);
+        } else {
+            int imm =3D c->imm32;
+            return xsnprintf(buf, buflen, fmt->ptr_imm32,
+                x86_ptr_size_str(regsz),
+                imm < 0 ? "-" : "", imm < 0 ? -imm : imm);
+        }
+    } else {
+        if ((x86_codec_field_ci(c)) =3D=3D x86_ci_i64) {
+            llong imm =3D c->imm64;
+            return xsnprintf(buf, buflen, fmt->imm64,
+                imm < 0 ? "-" : "", imm < 0 ? -imm : imm);
+        } else {
+            int imm =3D c->imm32;
+            return xsnprintf(buf, buflen, fmt->imm32,
+                imm < 0 ? "-" : "", imm < 0 ? -imm : imm);
+        }
+    }
+}
+
+static size_t x86_opr_intel_imm_hex_str(char *buf, size_t buflen,
+    x86_codec *c, x86_arg a)
+{
+    return x86_opr_intel_imm_str_internal(buf, buflen, c, a,
+        &x86_opr_formats_intel_hex);
+}
+
+static size_t x86_opr_intel_imm_dec_str(char *buf, size_t buflen,
+    x86_codec *c, x86_arg a)
+{
+    return x86_opr_intel_imm_str_internal(buf, buflen, c, a,
+        &x86_opr_formats_intel_dec);
+}
+
+static size_t x86_opr_intel_ime_hex_str(char *buf, size_t buflen,
+    x86_codec *c, x86_arg a)
+{
+    int imm =3D c->imm2;
+    return xsnprintf(buf, buflen, "%s0x%x",
+        imm < 0 ? "-" : "", imm < 0 ? -imm : imm);
+}
+
+static size_t x86_opr_intel_ime_dec_str(char *buf, size_t buflen,
+    x86_codec *c, x86_arg a)
+{
+    int imm =3D c->imm2;
+    return xsnprintf(buf, buflen, "%s%u",
+        imm < 0 ? "-" : "", imm < 0 ? -imm : imm);
+}
+
+static size_t x86_opr_intel_rel_hex_str(char *buf, size_t buflen,
+    x86_codec *c, x86_arg a, size_t pc_offset, x86_fmt_symbol sym_cb)
+{
+    size_t len =3D x86_opr_intel_imm_str_internal(buf, buflen, c, a,
+        &x86_opr_formats_intel_hex);
+    if (sym_cb) {
+        len +=3D sym_cb(buf + len, buflen - len, c, pc_offset);
+    }
+    return len;
+}
+
+static size_t x86_opr_intel_rel_dec_str(char *buf, size_t buflen,
+    x86_codec *c, x86_arg a, size_t pc_offset, x86_fmt_symbol sym_cb)
+{
+    size_t len =3D x86_opr_intel_imm_str_internal(buf, buflen, c, a,
+        &x86_opr_formats_intel_dec);
+    if (sym_cb) {
+        len +=3D sym_cb(buf + len, buflen - len, c, pc_offset);
+    }
+    return len;
+}
+
+static uint x86_opr_intel_const_reg(x86_codec *c,
+    x86_arg a)
+{
+    uint regsz =3D x86_opr_reg_size(c, a);
+    uint addrsz =3D x86_codec_addr_size(c);
+
+    switch (a.opr) {
+    case x86_opr_reg_al: return x86_al;
+    case x86_opr_reg_cl: return x86_cl;
+    case x86_opr_reg_ax: return x86_ax;
+    case x86_opr_reg_cx: return x86_cx;
+    case x86_opr_reg_dx: return x86_dx;
+    case x86_opr_reg_bx: return x86_bx;
+    case x86_opr_reg_eax: return x86_eax;
+    case x86_opr_reg_ecx: return x86_ecx;
+    case x86_opr_reg_edx: return x86_edx;
+    case x86_opr_reg_ebx: return x86_ebx;
+    case x86_opr_reg_rax: return x86_rax;
+    case x86_opr_reg_rcx: return x86_rcx;
+    case x86_opr_reg_rdx: return x86_rdx;
+    case x86_opr_reg_rbx: return x86_rbx;
+    case x86_opr_reg_aw: return x86_sized_gpr(c, x86_al, regsz);
+    case x86_opr_reg_cw: return x86_sized_gpr(c, x86_cl, regsz);
+    case x86_opr_reg_dw: return x86_sized_gpr(c, x86_dl, regsz);
+    case x86_opr_reg_bw: return x86_sized_gpr(c, x86_bl, regsz);
+    case x86_opr_reg_pa: return x86_sized_gpr(c, x86_al, addrsz);
+    case x86_opr_reg_pc: return x86_sized_gpr(c, x86_cl, addrsz);
+    case x86_opr_reg_pd: return x86_sized_gpr(c, x86_dl, addrsz);
+    case x86_opr_reg_pb: return x86_sized_gpr(c, x86_bl, addrsz);
+    default: break;
+    }
+    return -1;
+}
+
+static size_t x86_opr_intel_const_str(char *buf, size_t buflen, x86_codec =
*c,
+    x86_arg a)
+{
+    uint regsz =3D x86_opr_reg_size(c, a);
+    uint addrsz =3D x86_codec_addr_size(c);
+    int regname =3D x86_opr_intel_const_reg(c, a);
+
+    if (regname >=3D 0) {
+        return xsnprintf(buf, buflen, "%s", x86_reg_name(regname));
+    }
+
+    switch (a.opr) {
+    case x86_opr_1:
+        return xsnprintf(buf, buflen, "1");
+    case x86_opr_reg_xmm0:
+        return xsnprintf(buf, buflen, "%s", "xmm0");
+    case x86_opr_reg_xmm0_7:
+        return xsnprintf(buf, buflen, "%s", "xmm0_7");
+    case x86_opr_seg_fs:
+        return xsnprintf(buf, buflen, "fs");
+    case x86_opr_seg_gs:
+        return xsnprintf(buf, buflen, "gs");
+    case x86_opr_reg_st0:
+        return xsnprintf(buf, buflen, "st");
+    case x86_opr_reg_psi:
+        return xsnprintf(buf, buflen, "%s[%s]",
+            x86_ptr_size_str(regsz),
+            x86_reg_name(x86_sized_gpr(c, x86_sil, addrsz)));
+    case x86_opr_reg_pdi:
+        return xsnprintf(buf, buflen, "%s[%s]",
+            x86_ptr_size_str(regsz),
+            x86_reg_name(x86_sized_gpr(c, x86_dil, addrsz)));
+    default: return xsnprintf(buf, buflen, "%s", "unknown");
+    }
+}
+
+x86_opr_formatter x86_format_intel_hex =3D
+{
+    .fmt_const =3D &x86_opr_intel_const_str,
+    .fmt_imm =3D &x86_opr_intel_imm_hex_str,
+    .fmt_reg =3D &x86_opr_intel_reg_str,
+    .fmt_mrm =3D &x86_opr_intel_mrm_hex_str,
+    .fmt_vec =3D &x86_opr_intel_vec_str,
+    .fmt_opb =3D &x86_opr_intel_opb_str,
+    .fmt_is4 =3D &x86_opr_intel_is4_str,
+    .fmt_ime =3D &x86_opr_intel_ime_hex_str,
+    .fmt_rel =3D &x86_opr_intel_rel_hex_str
+};
+
+x86_opr_formatter x86_format_intel_dec =3D
+{
+    .fmt_const =3D &x86_opr_intel_const_str,
+    .fmt_imm =3D &x86_opr_intel_imm_dec_str,
+    .fmt_reg =3D &x86_opr_intel_reg_str,
+    .fmt_mrm =3D &x86_opr_intel_mrm_dec_str,
+    .fmt_vec =3D &x86_opr_intel_vec_str,
+    .fmt_opb =3D &x86_opr_intel_opb_str,
+    .fmt_is4 =3D &x86_opr_intel_is4_str,
+    .fmt_ime =3D &x86_opr_intel_ime_dec_str,
+    .fmt_rel =3D &x86_opr_intel_rel_dec_str
+};
+
+static size_t x86_format_operand(char *buf, size_t buflen, x86_codec *c,
+    x86_arg a, size_t pc_offset, x86_fmt_symbol sym_cb, x86_opr_formatter =
*fmt)
+{
+    switch (x86_ord_type_val(a.ord)) {
+    case x86_ord_const:
+        return fmt->fmt_const(buf, buflen, c, a);
+    case x86_ord_reg:
+        return fmt->fmt_reg(buf, buflen, c, a);
+    case x86_ord_mrm:
+        return fmt->fmt_mrm(buf, buflen, c, a);
+    case x86_ord_vec:
+        return fmt->fmt_vec(buf, buflen, c, a);
+    case x86_ord_opr:
+        return fmt->fmt_opb(buf, buflen, c, a);
+    case x86_ord_imm:
+        if (a.opr =3D=3D x86_opr_rel8 || a.opr =3D=3D x86_opr_relw) {
+            return fmt->fmt_rel(buf, buflen, c, a, pc_offset, sym_cb);
+        } else if ((a.ord & ~x86_ord_flag_mask) =3D=3D x86_ord_is4) {
+            return fmt->fmt_is4(buf, buflen, c, a);
+        } else if ((a.ord & ~x86_ord_flag_mask) =3D=3D x86_ord_ime) {
+            return fmt->fmt_ime(buf, buflen, c, a);
+        } else {
+            return fmt->fmt_imm(buf, buflen, c, a);
+        }
+    default: return 0;
+    }
+}
+
+static size_t x86_format_op_internal(char *buf, size_t buflen, x86_ctx *ct=
x,
+    x86_codec *c, size_t pc_offset, x86_fmt_symbol sym_cb)
+{
+    const x86_opc_data *d =3D ctx->idx->map + c->rec;
+    const x86_opr_data *o =3D x86_opr_table + d->opr;
+    const x86_ord_data *s =3D x86_ord_table + d->ord;
+
+    x86_operands q =3D x86_codec_operands(ctx, c);
+
+    size_t len =3D 0;
+    uint prefix =3D d->enc & x86_enc_p_mask;
+
+    if (x86_codec_has_lock(c)) {
+        len +=3D xsnprintf(buf + len, buflen - len, "lock ");
+    }
+    if (x86_codec_has_rep(c) && prefix !=3D x86_enc_p_f3) {
+        len +=3D xsnprintf(buf + len, buflen - len, "rep ");
+    }
+    if (x86_codec_has_repne(c) && prefix !=3D x86_enc_p_f2) {
+        len +=3D xsnprintf(buf + len, buflen - len, "repne ");
+    }
+    if (x86_codec_has_wait(c) && prefix !=3D x86_enc_p_9b) {
+        len +=3D xsnprintf(buf + len, buflen - len, "wait ");
+    }
+
+    len +=3D xsnprintf(buf + len, buflen - len, "%s", x86_op_names[d->op]);
+
+    for (size_t i =3D 0; i < array_size(o->opr) && o->opr[i]; i++) {
+        x86_arg a =3D x86_codec_meta(d->enc, o->opr[i], s->ord[i], q);
+        len +=3D xsnprintf(buf + len, buflen - len, i =3D=3D 0 ? "\t" : ",=
 ");
+        len +=3D x86_format_operand(buf + len, buflen - len, c, a,
+            pc_offset, sym_cb, &x86_format_intel_dec);
+    }
+
+    return len;
+}
+
+size_t x86_format_op(char *buf, size_t buflen, x86_ctx *ctx, x86_codec *c)
+{
+    return x86_format_op_internal(buf, buflen, ctx, c, 0, NULL);
+}
+
+size_t x86_format_op_symbol(char *buf, size_t buflen, x86_ctx *ctx,
+    x86_codec *c, size_t pc_offset, x86_fmt_symbol sym_cb)
+{
+    /* note: caller needs to add instruction length to pc_offset */
+    return x86_format_op_internal(buf, buflen, ctx, c, pc_offset, sym_cb);
+}
+
+size_t x86_format_hex(char *buf, size_t buflen, uchar *data, size_t datale=
n)
+{
+    size_t len =3D 0;
+    for (size_t i =3D 0; i < datalen && i < 11; i++) {
+        len +=3D xsnprintf(buf + len, buflen - len, i =3D=3D 0 ? "\t" : " =
");
+        len +=3D xsnprintf(buf + len, buflen - len, "%02hhx", data[i]);
+    }
+    size_t tabs =3D datalen < 10 ? (40 - datalen * 3) / 8 : 1;
+    for (size_t i =3D 0; i < tabs ; i++) {
+        len +=3D xsnprintf(buf + len, buflen - len, "\t");
+    }
+    return len;
+}
+
+/*
+ * context
+ */
+
+x86_ctx *x86_ctx_create(uint mode)
+{
+    x86_ctx *ctx =3D g_malloc(sizeof(x86_ctx));
+    ctx->mode =3D mode;
+    ctx->idx =3D x86_table_build(mode);
+    return ctx;
+}
+
+void x86_ctx_destroy(x86_ctx *ctx)
+{
+    g_free(ctx->idx->page_offsets);
+    g_free(ctx->idx->map);
+    g_free(ctx->idx->acc);
+    g_free(ctx);
+}
diff --git a/disas/x86-disas.c b/disas/x86-disas.c
new file mode 100644
index 000000000000..9ea21f26075b
--- /dev/null
+++ b/disas/x86-disas.c
@@ -0,0 +1,94 @@
+/*
+ * Copyright (c) 2024-2025 Michael Clark
+ *
+ * Permission is hereby granted, free of charge, to any person obtaining a
+ * copy of this software and associated documentation files (the "Software=
"),
+ * to deal in the Software without restriction, including without limitati=
on
+ * the rights to use, copy, modify, merge, publish, distribute, sublicense,
+ * and/or sell copies of the Software, and to permit persons to whom the
+ * Software is furnished to do so, subject to the following conditions:
+ *
+ * The above copyright notice and this permission notice shall be included
+ * in all copies or substantial portions of the Software.
+ *
+ * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS
+ * OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABIL=
ITY,
+ * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL
+ * THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR
+ * OTHER LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE,
+ * ARISING FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR
+ * OTHER DEALINGS IN THE SOFTWARE.
+ */
+
+#include "qemu/osdep.h"
+#include "disas/dis-asm.h"
+#include "disas/x86.h"
+
+static size_t format_hex(char *buf, size_t buflen, uchar *data, size_t nby=
tes)
+{
+    size_t len =3D 0;
+    size_t indent =3D 1;
+
+    const size_t hexcols =3D 10;
+
+    for (size_t i =3D 0; i < nbytes; i++) {
+        len +=3D snprintf(buf + len, buflen - len, " %02x" + (i =3D=3D 0),=
 data[i]);
+    }
+    if (hexcols - nbytes < hexcols) {
+        indent =3D (hexcols - nbytes) * 3 + 8 - (hexcols * 3) % 8;
+    }
+    for (size_t i =3D 0; i < indent && len < (buflen - 1); i++) {
+        buf[len++] =3D ' ';
+    }
+    buf[len] =3D '\0';
+
+    return len;
+}
+
+static size_t format_symbol(char *buf, size_t buflen, x86_codec *c,
+    size_t pc_offset)
+{
+    ullong addr =3D pc_offset + c->imm32;
+    return snprintf(buf, buflen, " # 0x%llx", addr);
+}
+
+int print_insn_x86(bfd_vma memaddr, struct disassemble_info *info)
+{
+    x86_buffer buf;
+    x86_codec codec;
+    x86_ctx *ctx;
+    bfd_byte *packet;
+    size_t nfetch, ndecode, len;
+    char str[128];
+    int ret;
+
+    static const size_t max_fetch_len =3D 16;
+
+    /* read instruction */
+    nfetch =3D info->buffer_vma + info->buffer_length - memaddr;
+    if (nfetch > max_fetch_len) {
+        nfetch =3D max_fetch_len;
+    }
+    packet =3D alloca(nfetch);
+    ret =3D (*info->read_memory_func)(memaddr, packet, nfetch, info);
+    if (ret !=3D 0) {
+        (*info->memory_error_func)(ret, memaddr, info);
+        return ret;
+    }
+
+    /* decode instruction */
+    ctx =3D (x86_ctx *)info->private_data;
+    x86_buffer_init_ex(&buf, packet, 0, nfetch);
+    ret =3D x86_codec_read(ctx, &buf, &codec, &ndecode);
+    if (ret !=3D 0) {
+        return -1;
+    }
+
+    /* format instruction */
+    len =3D format_hex(str, sizeof(str), packet, ndecode);
+    x86_format_op_symbol(str + len, sizeof(str) - len, ctx, &codec,
+        memaddr + ndecode, format_symbol);
+    (*info->fprintf_func)(info->stream, "%s", str);
+
+    return ndecode;
+}
diff --git a/disas/x86.h b/disas/x86.h
new file mode 100644
index 000000000000..87e87a0dcb92
--- /dev/null
+++ b/disas/x86.h
@@ -0,0 +1,1858 @@
+/*
+ * Copyright (c) 2024-2025 Michael Clark
+ *
+ * Permission is hereby granted, free of charge, to any person obtaining a
+ * copy of this software and associated documentation files (the "Software=
"),
+ * to deal in the Software without restriction, including without limitati=
on
+ * the rights to use, copy, modify, merge, publish, distribute, sublicense,
+ * and/or sell copies of the Software, and to permit persons to whom the
+ * Software is furnished to do so, subject to the following conditions:
+ *
+ * The above copyright notice and this permission notice shall be included
+ * in all copies or substantial portions of the Software.
+ *
+ * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS
+ * OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABIL=
ITY,
+ * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL
+ * THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR
+ * OTHER LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE,
+ * ARISING FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR
+ * OTHER DEALINGS IN THE SOFTWARE.
+ */
+
+#pragma once
+
+#include <stddef.h>
+#include <string.h>
+
+#include "qemu/bswap.h"
+
+/*
+ * types
+ */
+
+typedef unsigned char uchar;
+typedef unsigned short ushort;
+typedef unsigned int uint;
+typedef unsigned long ulong;
+typedef unsigned long long ullong;
+typedef long long llong;
+
+typedef char i8;
+typedef short i16;
+typedef int i32;
+typedef llong i64;
+
+typedef uchar u8;
+typedef ushort u16;
+typedef uint u32;
+typedef ullong u64;
+
+/*
+ * x86 forward declarations
+ */
+
+typedef struct x86_rex x86_rex;
+typedef struct x86_rex2 x86_rex2;
+typedef struct x86_vex2 x86_vex2;
+typedef struct x86_vex3 x86_vex3;
+typedef struct x86_evex x86_evex;
+typedef struct x86_modrm x86_modrm;
+typedef struct x86_sib x86_sib;
+
+typedef struct x86_mem x86_mem;
+typedef struct x86_codec x86_codec;
+typedef struct x86_modeb x86_modeb;
+typedef struct x86_opc_data x86_opc_data;
+typedef struct x86_opr_data x86_opr_data;
+typedef struct x86_ord_data x86_ord_data;
+typedef struct x86_table_idx x86_table_idx;
+typedef struct x86_acc_idx x86_acc_idx;
+typedef struct x86_acc_entry x86_acc_entry;
+typedef struct x86_buffer x86_buffer;
+typedef struct x86_ctx x86_ctx;
+
+/*
+ * simple debug macros
+ */
+
+#define VA_ARGS(...) , ##__VA_ARGS__
+#define x86_debug(fmt, ...) if (debug) \
+    printf(fmt "\n" VA_ARGS(__VA_ARGS__))
+#define x86_debugf(fmt, ...) if (debug) \
+    printf("%s: " fmt "\n", __func__ VA_ARGS(__VA_ARGS__))
+
+/*
+ * register groups
+ */
+
+enum
+{
+    x86_reg_w     =3D (0 << 5),
+    x86_reg_b     =3D (1 << 5),
+    x86_reg_d     =3D (2 << 5),
+    x86_reg_q     =3D (3 << 5),
+
+    x86_reg_mmx   =3D (4 << 5),
+    x86_reg_xmm   =3D (5 << 5),
+    x86_reg_ymm   =3D (6 << 5),
+    x86_reg_zmm   =3D (7 << 5),
+
+    x86_reg_kmask =3D (8 << 5),
+    x86_reg_bl    =3D (9 << 5),
+    x86_reg_fpu   =3D (10 << 5),
+    x86_reg_bnd   =3D (11 << 5),
+
+    x86_reg_dreg  =3D (12 << 5),
+    x86_reg_creg  =3D (13 << 5),
+    x86_reg_sreg  =3D (14 << 5),
+    x86_reg_sys   =3D (15 << 5),
+};
+
+/*
+ * prefix byte
+ */
+
+enum
+{
+    x86_pb_26    =3D 0x26,
+    x86_pb_2e    =3D 0x2e,
+    x86_pb_36    =3D 0x36,
+    x86_pb_3e    =3D 0x3e,
+    x86_pb_41    =3D 0x41,
+    x86_pb_42    =3D 0x42,
+    x86_pb_44    =3D 0x44,
+    x86_pb_48    =3D 0x48,
+    x86_pb_62    =3D 0x62,
+    x86_pb_64    =3D 0x64,
+    x86_pb_65    =3D 0x65,
+    x86_pb_66    =3D 0x66,
+    x86_pb_67    =3D 0x67,
+    x86_pb_9b    =3D 0x9b,
+    x86_pb_c4    =3D 0xc4,
+    x86_pb_c5    =3D 0xc5,
+    x86_pb_d5    =3D 0xd5,
+    x86_pb_f0    =3D 0xf0,
+    x86_pb_f2    =3D 0xf2,
+    x86_pb_f3    =3D 0xf3,
+
+    x86_pb_es    =3D x86_pb_26,
+    x86_pb_cs    =3D x86_pb_2e, /* branch not taken with Jcc */
+    x86_pb_ss    =3D x86_pb_36,
+    x86_pb_ds    =3D x86_pb_3e, /* branch taken with Jcc (CET notrack) */
+    x86_pb_rex_b =3D x86_pb_41,
+    x86_pb_rex_x =3D x86_pb_42,
+    x86_pb_rex_r =3D x86_pb_44,
+    x86_pb_rex_w =3D x86_pb_48,
+    x86_pb_evex  =3D x86_pb_62,
+    x86_pb_fs    =3D x86_pb_64,
+    x86_pb_gs    =3D x86_pb_65,
+    x86_pb_osize =3D x86_pb_66,
+    x86_pb_asize =3D x86_pb_67,
+    x86_pb_wait  =3D x86_pb_9b, /* x87 */
+    x86_pb_vex3  =3D x86_pb_c4,
+    x86_pb_vex2  =3D x86_pb_c5,
+    x86_pb_rex2  =3D x86_pb_d5,
+    x86_pb_lock  =3D x86_pb_f0,
+    x86_pb_repne =3D x86_pb_f2, /* REPNE/REPNZ and XACQUIRE */
+    x86_pb_rep   =3D x86_pb_f3, /* REP/REPE/REPZ and XRELEASE */
+};
+
+/*
+ * mod values
+ */
+
+enum
+{
+    x86_mod_disp0,
+    x86_mod_disp8,
+    x86_mod_dispw,
+    x86_mod_reg,
+};
+
+/*
+ * SIB scale
+ */
+
+enum
+{
+    x86_scale_1,
+    x86_scale_2,
+    x86_scale_4,
+    x86_scale_8,
+};
+
+/*
+ * segment
+ */
+
+enum
+{
+    x86_seg_none,
+    x86_seg_es,
+    x86_seg_cs,
+    x86_seg_ss,
+    x86_seg_ds,
+    x86_seg_fs,
+    x86_seg_gs
+};
+
+/*
+ * REX flags
+ */
+
+enum
+{
+    x86_rex_b =3D 0x01,
+    x86_rex_x =3D 0x02,
+    x86_rex_r =3D 0x04,
+    x86_rex_w =3D 0x08,
+};
+
+/*
+ * VEX prefix
+ */
+
+enum
+{
+    x86_pfx_none,
+    x86_pfx_66,
+    x86_pfx_f3,
+    x86_pfx_f2,
+    x86_pfx_9b,
+    x86_pfx_rexw =3D 8
+};
+
+/*
+ * VEX map
+ */
+
+enum
+{
+    x86_map_none,
+    x86_map_0f,
+    x86_map_0f38,
+    x86_map_0f3a,
+    x86_map_map4,
+    x86_map_map5,
+    x86_map_map6,
+};
+
+/*
+ * VEX length
+ */
+
+enum
+{
+    x86_vex_l0 =3D 0,
+    x86_vex_l1 =3D 1,
+    x86_vex_l2 =3D 2,
+    x86_vex_l3 =3D 3,
+    x86_vex_lz =3D x86_vex_l0,
+    x86_vex_lig =3D x86_vex_l3,
+    x86_vex_l128 =3D x86_vex_l0,
+    x86_vex_l256 =3D x86_vex_l1,
+    x86_vex_l512 =3D x86_vex_l2,
+};
+
+/*
+ * VEX width
+ */
+
+enum
+{
+    x86_vex_w0,
+    x86_vex_w1,
+};
+
+/*
+ * condition codes (x86)
+ */
+
+enum
+{
+    x86_cc_o     =3D 0,  /* overflow */
+    x86_cc_no    =3D 1,  /* no overflow */
+    x86_cc_b     =3D 2,  /* below */
+    x86_cc_c     =3D 2,  /* carry */
+    x86_cc_nae   =3D 2,  /* neither-above-nor-equal */
+    x86_cc_nb    =3D 3,  /* not-below */
+    x86_cc_nc    =3D 3,  /* not-carry */
+    x86_cc_ae    =3D 3,  /* above-or-equal */
+    x86_cc_e     =3D 4,  /* equal */
+    x86_cc_z     =3D 4,  /* zero */
+    x86_cc_ne    =3D 5,  /* not-equal */
+    x86_cc_nz    =3D 5,  /* not-zero */
+    x86_cc_be    =3D 6,  /* below-or-equal */
+    x86_cc_na    =3D 6,  /* not-above */
+    x86_cc_nbe   =3D 7,  /* neither-below-nor-equal */
+    x86_cc_a     =3D 7,  /* above */
+    x86_cc_s     =3D 8,  /* sign */
+    x86_cc_ns    =3D 9,  /* no-sign */
+    x86_cc_p     =3D 10, /* parity */
+    x86_cc_pe    =3D 10, /* parity-even */
+    x86_cc_np    =3D 11, /* no-parity */
+    x86_cc_po    =3D 11, /* parity-odd */
+    x86_cc_l     =3D 12, /* less */
+    x86_cc_nge   =3D 12, /* neither-greater-nor-equal */
+    x86_cc_nl    =3D 13, /* not-less */
+    x86_cc_ge    =3D 13, /* greater-or-equal */
+    x86_cc_le    =3D 14, /* less-or-equal */
+    x86_cc_ng    =3D 14, /* not-greater */
+    x86_cc_nle   =3D 15, /* neither-less-nor-equal- */
+    x86_cc_g     =3D 15, /* greater */
+};
+
+/*
+ * condition codes (agnostic)
+ */
+
+enum
+{
+    x86_o        =3D 0,  /* overflow (signed) */
+    x86_no       =3D 1,  /* not-overflow (signed) */
+    x86_c        =3D 2,  /* carry */
+    x86_nc       =3D 3,  /* not-carry */
+    x86_ltu      =3D 2,  /* less-than (unsigned) */
+    x86_geu      =3D 3,  /* greater-than-or-equal (unsigned) */
+    x86_eq       =3D 4,  /* equal */
+    x86_ne       =3D 5,  /* not-equal */
+    x86_leu      =3D 6,  /* less-than-or-equal (unsigned) */
+    x86_gtu      =3D 7,  /* greater-than (unsigned) */
+    x86_s        =3D 8,  /* sign */
+    x86_ns       =3D 9,  /* not-sign */
+    x86_lt       =3D 12, /* less-than (signed) */
+    x86_ge       =3D 13, /* greater-than-or-equal (signed) */
+    x86_le       =3D 14, /* less-than-or-equal (signed) */
+    x86_gt       =3D 15, /* greater-than (signed) */
+};
+
+/*
+ * compare packed operators
+ *
+ * oq =3D ordered queit, os =3D ordered signalling
+ * uq =3D unordered queit, us =3D unordered signalling
+ */
+
+enum
+{
+    x86_eq_oq    =3D 0x00,
+    x86_lt_os    =3D 0x01,
+    x86_le_os    =3D 0x02,
+    x86_unord_q  =3D 0x03,
+    x86_neq_uq   =3D 0x04,
+    x86_nlt_us   =3D 0x05,
+    x86_nle_us   =3D 0x06,
+    x86_ord_q    =3D 0x07,
+    x86_eq_uq    =3D 0x08,
+    x86_nge_us   =3D 0x09,
+    x86_ngt_us   =3D 0x0a,
+    x86_false_oq =3D 0x0b,
+    x86_neq_oq   =3D 0x0c,
+    x86_ge_os    =3D 0x0d,
+    x86_gt_os    =3D 0x0e,
+    x86_true_uq  =3D 0x0f,
+    x86_eq_os    =3D 0x10,
+    x86_lt_oq    =3D 0x11,
+    x86_le_oq    =3D 0x12,
+    x86_unord_s  =3D 0x13,
+    x86_neq_us   =3D 0x14,
+    x86_nlt_uq   =3D 0x15,
+    x86_nle_uq   =3D 0x16,
+    x86_ord_s    =3D 0x17,
+    x86_eq_us    =3D 0x18,
+    x86_nge_uq   =3D 0x19,
+    x86_ngt_uq   =3D 0x1a,
+    x86_false_os =3D 0x1b,
+    x86_neq_os   =3D 0x1c,
+    x86_ge_oq    =3D 0x1d,
+    x86_gt_oq    =3D 0x1e,
+    x86_true_us  =3D 0x1f,
+};
+
+/*
+ * prefix encoding structures
+ */
+
+/*
+ * ModRM struct
+ */
+
+struct x86_modrm
+{
+    union {
+        uchar data[1];
+        /* note: bitfield used for documentation purposes only */
+        struct {
+            /* [0:2] */ uchar rm:3;
+            /* [3:5] */ uchar reg:3;
+            /* [6:7] */ uchar mod:2;
+        };
+    };
+};
+
+/*
+ * ModRM values
+ */
+
+enum
+{
+    x86_rm_sp_sib       =3D 4,
+    x86_rm_bp_disp0     =3D 5,
+
+    x86_modrm_rm_mask   =3D 7,
+    x86_modrm_reg_shift =3D 3,
+    x86_modrm_reg_mask  =3D 7,
+    x86_modrm_mod_shift =3D 6,
+    x86_modrm_mod_mask  =3D 3,
+};
+
+/*
+ * ModRM accessors
+ */
+
+static inline uint x86_modrm_rm(uchar modrm) {
+    return modrm & x86_modrm_rm_mask;
+}
+static inline uint x86_modrm_reg(uchar modrm) {
+    return (modrm >> x86_modrm_reg_shift) & x86_modrm_reg_mask;
+}
+static inline uint x86_modrm_mod(uchar modrm) {
+    return (modrm >> x86_modrm_mod_shift) & x86_modrm_mod_mask;
+}
+
+/*
+ * SIB struct
+ */
+
+struct x86_sib
+{
+    union {
+        uchar data[1];
+        /* note: bitfield used for documentation purposes only */
+        struct {
+            /* [0:2] */ uchar b : 3; /* base[0:2] */
+            /* [3:5] */ uchar x : 3; /* index[0:2] */
+            /* [6:7] */ uchar s : 2; /* scale[0:2] */
+        };
+    };
+};
+
+/*
+ * SIB values
+ */
+
+enum {
+    x86_sib_b_mask =3D 7,
+    x86_sib_x_shift =3D 3,
+    x86_sib_x_mask =3D 7,
+    x86_sib_s_shift =3D 6,
+    x86_sib_s_mask =3D 3
+};
+
+/*
+ * SIB accessors
+ */
+
+static inline uint x86_sib_b(uchar sib) {
+    return sib & x86_sib_b_mask;
+}
+static inline uint x86_sib_x(uchar sib) {
+    return (sib >> x86_sib_x_shift) & x86_sib_x_mask;
+}
+static inline uint x86_sib_s(uchar sib) {
+    return (sib >> x86_sib_s_shift) & x86_sib_s_mask;
+}
+
+/*
+ * REX struct
+ */
+
+struct x86_rex
+{
+    union {
+        uchar data[1];
+        /* note: bitfield used for documentation purposes only */
+        struct {
+            /* [0] */ uchar b3 : 1; /* base[3] */
+            /* [1] */ uchar x3 : 1; /* index[3] */
+            /* [2] */ uchar r3 : 1; /* reg[3] */
+            /* [3] */ uchar w  : 1; /* width */
+        };
+    };
+};
+
+
+/*
+ * REX2 struct
+ */
+
+struct x86_rex2
+{
+    union {
+        uchar data[1];
+        /* note: bitfield used for documentation purposes only */
+        struct {
+            /* [0] */ uchar b3 : 1; /* base[3] */
+            /* [1] */ uchar x3 : 1; /* index[3] */
+            /* [2] */ uchar r3 : 1; /* reg[3] */
+            /* [3] */ uchar w  : 1; /* width */
+            /* [4] */ uchar b4 : 1; /* base[4] */
+            /* [5] */ uchar x4 : 1; /* index[4] */
+            /* [6] */ uchar r4 : 1; /* reg[4] */
+            /* [7] */ uchar m0 : 1; /* map prefix 0x0f */
+        };
+    };
+};
+
+
+/*
+ * VEX2 struct
+ */
+
+struct x86_vex2
+{
+    union {
+        uchar data[1];
+        /* note: bitfield used for documentation purposes only */
+        struct {
+            /* [0:1] */ uchar p   : 2; /* see x86_pfx */
+            /*   [2] */ uchar l   : 1; /* len 0=3D128 1=3D256 */
+            /* [3:6] */ uchar vn  : 4; /* ~vec[0:3] */
+            /*   [7] */ uchar r3n : 1; /* ~reg[3] */
+        };
+    };
+};
+
+/*
+ * VEX3 struct
+ */
+
+struct x86_vex3
+{
+    union {
+        uchar data[2];
+        /* note: bitfield used for documentation purposes only */
+        struct {
+            /* [0:4] */ uchar m   : 5; /* see x86_map */
+            /*   [5] */ uchar b3n : 1; /* ~base[3] */
+            /*   [6] */ uchar x3n : 1; /* ~index[3] */
+            /*   [7] */ uchar r3n : 1; /* ~reg[3] */
+
+            /* [0:1] */ uchar p   : 2; /* see x86_pfx */
+            /*   [2] */ uchar l   : 1; /* len 0=3D128 1=3D256 */
+            /* [3:6] */ uchar vn  : 4; /* ~vec[0:3] */
+            /*   [7] */ uchar w   : 1; /* width */
+        };
+    };
+};
+
+/*
+ * EVEX struct
+ */
+
+struct x86_evex
+{
+    union {
+        uchar data[3];
+        /* note: bitfield used for documentation purposes only */
+        struct {
+            /* [0:2] */ uchar m   : 3; /* see x86_map */
+            /*   [3] */ uchar b4  : 1; /* base[4] */
+            /*   [4] */ uchar r4n : 1; /* ~reg[4] */
+            /*   [5] */ uchar b3n : 1; /* ~base[3] */
+            /*   [6] */ uchar x3n : 1; /* ~index[3] */
+            /*   [7] */ uchar r3n : 1; /* ~reg[3] */
+
+            /* [0:1] */ uchar p   : 2; /* see x86_pfx */
+            /*   [2] */ uchar x4n : 1; /* ~index[4] */
+            /* [3:6] */ uchar vn  : 4; /* ~vec[0:3] */
+            /*   [7] */ uchar w   : 1; /* width */
+
+            /* [0:2] */ uchar a   : 3; /* kmask[0:2] or map4.NF[2] no-flag=
s */
+            /*   [3] */ uchar v4n : 1; /* ~vec[4] */
+            /*   [4] */ uchar br  : 1; /* broadcast or map4.ND[4] new-dest=
 */
+            /* [5:6] */ uchar l   : 2; /* len 00=3D128 01=3D256, 10=3D512 =
*/
+            /*   [7] */ uchar z   : 1; /* merge/zero */
+        };
+    };
+};
+
+/*
+ * opcode encoding
+ */
+
+enum
+{
+    x86_enc_w_shift          =3D 0,
+    x86_enc_m_shift          =3D x86_enc_w_shift + 3,
+    x86_enc_p_shift          =3D x86_enc_m_shift + 3,
+    x86_enc_l_shift          =3D x86_enc_p_shift + 4,
+    x86_enc_t_shift          =3D x86_enc_l_shift + 3,
+    x86_enc_o_shift          =3D x86_enc_t_shift + 2,
+    x86_enc_f_shift          =3D x86_enc_o_shift + 1,
+    x86_enc_i_shift          =3D x86_enc_f_shift + 3,
+    x86_enc_j_shift          =3D x86_enc_i_shift + 3,
+    x86_enc_r_shift          =3D x86_enc_j_shift + 2,
+    x86_enc_s_shift          =3D x86_enc_r_shift + 3,
+
+    x86_enc_w_w0             =3D (1 << x86_enc_w_shift),
+    x86_enc_w_w1             =3D (2 << x86_enc_w_shift),
+    x86_enc_w_wb             =3D (3 << x86_enc_w_shift),
+    x86_enc_w_wn             =3D (4 << x86_enc_w_shift),
+    x86_enc_w_wx             =3D (5 << x86_enc_w_shift),
+    x86_enc_w_ww             =3D (6 << x86_enc_w_shift),
+    x86_enc_w_wig            =3D (7 << x86_enc_w_shift),
+    x86_enc_w_mask           =3D (7 << x86_enc_w_shift),
+
+    x86_enc_m_none           =3D (0 << x86_enc_m_shift),
+    x86_enc_m_0f             =3D (1 << x86_enc_m_shift),
+    x86_enc_m_0f38           =3D (2 << x86_enc_m_shift),
+    x86_enc_m_0f3a           =3D (3 << x86_enc_m_shift),
+    x86_enc_m_map4           =3D (4 << x86_enc_m_shift),
+    x86_enc_m_map5           =3D (5 << x86_enc_m_shift),
+    x86_enc_m_map6           =3D (6 << x86_enc_m_shift),
+    x86_enc_m_mask           =3D (7 << x86_enc_m_shift),
+
+    x86_enc_p_none           =3D (0 << x86_enc_p_shift),
+    x86_enc_p_66             =3D (1 << x86_enc_p_shift),
+    x86_enc_p_f3             =3D (2 << x86_enc_p_shift),
+    x86_enc_p_f2             =3D (3 << x86_enc_p_shift),
+    x86_enc_p_9b             =3D (4 << x86_enc_p_shift),
+    x86_enc_p_rexw           =3D (8 << x86_enc_p_shift),
+    x86_enc_p_mask           =3D (7 << x86_enc_p_shift),
+    x86_enc_prexw_mask       =3D (15 << x86_enc_p_shift),
+
+    x86_enc_l_lz             =3D (1 << x86_enc_l_shift),
+    x86_enc_l_l0             =3D (2 << x86_enc_l_shift),
+    x86_enc_l_l1             =3D (3 << x86_enc_l_shift),
+    x86_enc_l_128            =3D (4 << x86_enc_l_shift),
+    x86_enc_l_256            =3D (5 << x86_enc_l_shift),
+    x86_enc_l_512            =3D (6 << x86_enc_l_shift),
+    x86_enc_l_lig            =3D (7 << x86_enc_l_shift),
+    x86_enc_l_mask           =3D (7 << x86_enc_l_shift),
+
+    x86_enc_t_none           =3D (0 << x86_enc_t_shift),
+    x86_enc_t_lex            =3D (1 << x86_enc_t_shift),
+    x86_enc_t_vex            =3D (2 << x86_enc_t_shift),
+    x86_enc_t_evex           =3D (3 << x86_enc_t_shift),
+    x86_enc_t_mask           =3D (3 << x86_enc_t_shift),
+
+    x86_enc_o_opcode_r       =3D (1 << x86_enc_o_shift), /* XX+r */
+    x86_enc_o_mask           =3D (1 << x86_enc_o_shift),
+
+    x86_enc_f_modrm_r        =3D (1 << x86_enc_f_shift), /* /r */
+    x86_enc_f_modrm_n        =3D (2 << x86_enc_f_shift), /* /N */
+    x86_enc_f_opcode         =3D (3 << x86_enc_f_shift), /* XX */
+    x86_enc_f_opcode_r       =3D (4 << x86_enc_f_shift), /* XX+r */
+    x86_enc_f_mask           =3D (7 << x86_enc_f_shift),
+
+    x86_enc_i_ib             =3D (1 << x86_enc_i_shift),
+    x86_enc_i_iw             =3D (2 << x86_enc_i_shift),
+    x86_enc_i_iwd            =3D (3 << x86_enc_i_shift),
+    x86_enc_i_i16            =3D (4 << x86_enc_i_shift),
+    x86_enc_i_i32            =3D (5 << x86_enc_i_shift),
+    x86_enc_i_i64            =3D (6 << x86_enc_i_shift),
+    x86_enc_i_mask           =3D (7 << x86_enc_i_shift),
+
+    x86_enc_j_ib             =3D (1 << x86_enc_j_shift),
+    x86_enc_j_i16            =3D (2 << x86_enc_j_shift),
+    x86_enc_j_mask           =3D (3 << x86_enc_j_shift),
+
+    x86_enc_r_rep            =3D (1 << x86_enc_r_shift),
+    x86_enc_r_lock           =3D (2 << x86_enc_r_shift),
+    x86_enc_r_norexb         =3D (4 << x86_enc_r_shift),
+    x86_enc_r_mask           =3D (7 << x86_enc_r_shift),
+
+    x86_enc_s_o16            =3D (1 << x86_enc_s_shift),
+    x86_enc_s_o32            =3D (2 << x86_enc_s_shift),
+    x86_enc_s_o64            =3D (3 << x86_enc_s_shift),
+    x86_enc_s_a16            =3D (4 << x86_enc_s_shift),
+    x86_enc_s_a32            =3D (5 << x86_enc_s_shift),
+    x86_enc_s_a64            =3D (6 << x86_enc_s_shift),
+    x86_enc_s_mask           =3D (7 << x86_enc_s_shift),
+
+    x86_enc_immediate_mask   =3D x86_enc_i_mask | x86_enc_j_mask,
+    x86_enc_suffix_mask      =3D x86_enc_r_mask | x86_enc_s_mask,
+    x86_enc_param_mask       =3D x86_enc_immediate_mask | x86_enc_suffix_m=
ask
+};
+
+/*
+ * opcode encoding accessors
+ */
+
+static inline uint x86_enc_width(uint enc) {
+    return enc & x86_enc_w_mask;
+}
+static inline uint x86_enc_prefix(uint enc) {
+    return enc & x86_enc_prexw_mask;
+}
+static inline uint x86_enc_length(uint enc) {
+    return enc & x86_enc_l_mask;
+}
+static inline uint x86_enc_opcode(uint enc) {
+    return enc & x86_enc_o_mask;
+}
+static inline uint x86_enc_func(uint enc) {
+    return enc & x86_enc_f_mask;
+}
+static inline uint x86_enc_map(uint enc) {
+    return enc & x86_enc_m_mask;
+}
+static inline uint x86_enc_imm(uint enc) {
+    return enc & x86_enc_i_mask;
+}
+static inline uint x86_enc_imm2(uint enc) {
+    return enc & x86_enc_j_mask;
+}
+static inline uint x86_enc_type(uint enc) {
+    return enc & x86_enc_t_mask;
+}
+static inline uint x86_enc_suffix(uint enc) {
+    return enc & x86_enc_suffix_mask;
+}
+static inline uint x86_enc_leading(uint enc) {
+    return enc & ~x86_enc_param_mask;
+}
+static inline uint x86_enc_has_rep(uint enc) {
+    return enc & x86_enc_r_rep;
+}
+static inline uint x86_enc_has_lock(uint enc) {
+    return enc & x86_enc_r_lock;
+}
+static inline uint x86_enc_has_norexb(uint enc) {
+    return enc & x86_enc_r_norexb;
+}
+static inline uint x86_enc_has_o16(uint enc) {
+    return (enc & x86_enc_s_mask) =3D=3D x86_enc_s_o16;
+}
+static inline uint x86_enc_has_o32(uint enc) {
+    return (enc & x86_enc_s_mask) =3D=3D x86_enc_s_o32;
+}
+static inline uint x86_enc_has_o64(uint enc) {
+    return (enc & x86_enc_s_mask) =3D=3D x86_enc_s_o64;
+}
+static inline uint x86_enc_has_a16(uint enc) {
+    return (enc & x86_enc_s_mask) =3D=3D x86_enc_s_a16;
+}
+static inline uint x86_enc_has_a32(uint enc) {
+    return (enc & x86_enc_s_mask) =3D=3D x86_enc_s_a32;
+}
+static inline uint x86_enc_has_a64(uint enc) {
+    return (enc & x86_enc_s_mask) =3D=3D x86_enc_s_a64;
+}
+
+/*
+ * operand encoding
+ */
+
+enum
+{
+    x86_opr_none,
+
+    /* operand field shifts */
+    x86_opr_ot               =3D 8,
+    x86_opr_os               =3D x86_opr_ot + 4,
+    x86_opr_ms               =3D x86_opr_os + 4,
+    x86_opr_av               =3D x86_opr_ms + 4,
+    x86_opr_et               =3D x86_opr_av + 4,
+    x86_opr_ew               =3D x86_opr_et + 2,
+    x86_opr_ec               =3D x86_opr_ew + 3,
+
+    x86_opr_ot_mask          =3D (15 << x86_opr_ot), /* operand type */
+    x86_opr_os_mask          =3D (15 << x86_opr_os), /* operand size */
+    x86_opr_ms_mask          =3D (15 << x86_opr_ms), /* memory size */
+    x86_opr_av_mask          =3D (15 << x86_opr_av), /* auxiliary value */
+    x86_opr_et_mask          =3D (3 << x86_opr_et), /* element type */
+    x86_opr_ew_mask          =3D (7 << x86_opr_ew), /* element width */
+    x86_opr_ec_mask          =3D (7 << x86_opr_ec), /* element count */
+
+    /* operand flags */
+    x86_opr_mem              =3D (1 << 0),
+    x86_opr_ind              =3D (1 << 1),
+    x86_opr_bcst             =3D (1 << 2),
+    x86_opr_flag_er          =3D (1 << 3),
+    x86_opr_flag_k           =3D (1 << 4),
+    x86_opr_flag_sae         =3D (1 << 5),
+    x86_opr_flag_z           =3D (1 << 6),
+    x86_opr_flag_rs          =3D (1 << 7),
+
+    /* operand type */
+    x86_opr_const            =3D (1 << x86_opr_ot), /* constant */
+    x86_opr_imm              =3D (2 << x86_opr_ot), /* immediate */
+    x86_opr_reg              =3D (3 << x86_opr_ot), /* register */
+    x86_opr_vec              =3D (4 << x86_opr_ot), /* vector */
+    x86_opr_mmx              =3D (5 << x86_opr_ot), /* mmx */
+    x86_opr_st               =3D (6 << x86_opr_ot), /* x87 */
+    x86_opr_k                =3D (7 << x86_opr_ot), /* mask */
+    x86_opr_seg              =3D (8 << x86_opr_ot), /* segment */
+    x86_opr_creg             =3D (9 << x86_opr_ot), /* control */
+    x86_opr_dreg             =3D (10 << x86_opr_ot), /* debug */
+    x86_opr_bnd              =3D (11 << x86_opr_ot), /* bound */
+    x86_opr_type_mask        =3D x86_opr_ot_mask,
+
+    /* operand sizes */
+    x86_opr_size_8           =3D (1 << x86_opr_os),
+    x86_opr_size_16          =3D (2 << x86_opr_os),
+    x86_opr_size_32          =3D (3 << x86_opr_os),
+    x86_opr_size_64          =3D (4 << x86_opr_os),
+    x86_opr_size_128         =3D (5 << x86_opr_os),
+    x86_opr_size_256         =3D (6 << x86_opr_os),
+    x86_opr_size_512         =3D (7 << x86_opr_os),
+    x86_opr_size_1024        =3D (8 << x86_opr_os),
+    x86_opr_size_80          =3D (9 << x86_opr_os),
+    x86_opr_size_wd          =3D (13 << x86_opr_os),
+    x86_opr_size_w           =3D (14 << x86_opr_os),
+    x86_opr_size_a           =3D (15 << x86_opr_os),
+    x86_opr_size_mask        =3D x86_opr_os_mask,
+
+    /* sized register */
+    x86_opr_r8               =3D x86_opr_reg | x86_opr_size_8,
+    x86_opr_r16              =3D x86_opr_reg | x86_opr_size_16,
+    x86_opr_r32              =3D x86_opr_reg | x86_opr_size_32,
+    x86_opr_r64              =3D x86_opr_reg | x86_opr_size_64,
+    x86_opr_rw               =3D x86_opr_reg | x86_opr_size_w,
+    x86_opr_ra               =3D x86_opr_reg | x86_opr_size_a,
+    x86_opr_mm               =3D x86_opr_vec | x86_opr_size_64,
+    x86_opr_xmm              =3D x86_opr_vec | x86_opr_size_128,
+    x86_opr_ymm              =3D x86_opr_vec | x86_opr_size_256,
+    x86_opr_zmm              =3D x86_opr_vec | x86_opr_size_512,
+
+    /* sized memory */
+    x86_opr_m8               =3D x86_opr_mem | (1 << x86_opr_ms), /* byte =
*/
+    x86_opr_m16              =3D x86_opr_mem | (2 << x86_opr_ms), /* word =
*/
+    x86_opr_m32              =3D x86_opr_mem | (3 << x86_opr_ms), /* dword=
 */
+    x86_opr_m64              =3D x86_opr_mem | (4 << x86_opr_ms), /* qword=
 */
+    x86_opr_m128             =3D x86_opr_mem | (5 << x86_opr_ms), /* oword=
/xmmword */
+    x86_opr_m256             =3D x86_opr_mem | (6 << x86_opr_ms), /* ymmwo=
rd */
+    x86_opr_m512             =3D x86_opr_mem | (7 << x86_opr_ms), /* zmmwo=
rd */
+    x86_opr_m1024            =3D x86_opr_mem | (8 << x86_opr_ms),
+    x86_opr_m80              =3D x86_opr_mem | (9 << x86_opr_ms), /* tword=
/tbyte */
+    x86_opr_m384             =3D x86_opr_mem | (10 << x86_opr_ms),
+    x86_opr_mib              =3D x86_opr_mem | (11 << x86_opr_ms), /* boun=
d */
+    x86_opr_vm32             =3D x86_opr_mem | (12 << x86_opr_ms), /* vecm=
em32 */
+    x86_opr_vm64             =3D x86_opr_mem | (13 << x86_opr_ms), /* vecm=
em64 */
+    x86_opr_mw               =3D x86_opr_mem | (14 << x86_opr_ms), /* 16/3=
2/64 */
+    x86_opr_mp               =3D x86_opr_mem | (15 << x86_opr_ms), /* poin=
ter */
+    x86_opr_mem_mask         =3D x86_opr_mem | (15 << x86_opr_ms),
+
+    /* unsized register / sized memory */
+    x86_opr_r_m8             =3D x86_opr_reg | x86_opr_m8,
+    x86_opr_r_m16            =3D x86_opr_reg | x86_opr_m16,
+    x86_opr_r_m32            =3D x86_opr_reg | x86_opr_m32,
+    x86_opr_r_m64            =3D x86_opr_reg | x86_opr_m64,
+
+    /* sized register / sized memory */
+    x86_opr_r8_m8            =3D x86_opr_r8  | x86_opr_m8,
+    x86_opr_r16_m8           =3D x86_opr_r16 | x86_opr_m8,
+    x86_opr_r16_m16          =3D x86_opr_r16 | x86_opr_m16,
+    x86_opr_r32_m8           =3D x86_opr_r32 | x86_opr_m8,
+    x86_opr_r32_m16          =3D x86_opr_r32 | x86_opr_m16,
+    x86_opr_r32_m32          =3D x86_opr_r32 | x86_opr_m32,
+    x86_opr_r64_m8           =3D x86_opr_r64 | x86_opr_m8,
+    x86_opr_r64_m16          =3D x86_opr_r64 | x86_opr_m16,
+    x86_opr_r64_m32          =3D x86_opr_r64 | x86_opr_m32,
+    x86_opr_r64_m64          =3D x86_opr_r64 | x86_opr_m64,
+    x86_opr_rw_mw            =3D x86_opr_rw  | x86_opr_mw,
+
+    /* sized vector / sized memory */
+    x86_opr_mm_m32           =3D x86_opr_mm  | x86_opr_m32,
+    x86_opr_mm_m64           =3D x86_opr_mm  | x86_opr_m64,
+    x86_opr_xmm_m8           =3D x86_opr_xmm | x86_opr_m8,
+    x86_opr_xmm_m16          =3D x86_opr_xmm | x86_opr_m16,
+    x86_opr_xmm_m32          =3D x86_opr_xmm | x86_opr_m32,
+    x86_opr_xmm_m64          =3D x86_opr_xmm | x86_opr_m64,
+    x86_opr_xmm_m128         =3D x86_opr_xmm | x86_opr_m128,
+    x86_opr_ymm_m256         =3D x86_opr_ymm | x86_opr_m256,
+    x86_opr_zmm_m512         =3D x86_opr_zmm | x86_opr_m512,
+
+    /* sized vector memory */
+    x86_opr_vm32x            =3D x86_opr_xmm | x86_opr_vm32,
+    x86_opr_vm32y            =3D x86_opr_ymm | x86_opr_vm32,
+    x86_opr_vm32z            =3D x86_opr_zmm | x86_opr_vm32,
+    x86_opr_vm64x            =3D x86_opr_xmm | x86_opr_vm64,
+    x86_opr_vm64y            =3D x86_opr_ymm | x86_opr_vm64,
+    x86_opr_vm64z            =3D x86_opr_zmm | x86_opr_vm64,
+
+    /* mask / sized memory */
+    x86_opr_k_m8             =3D x86_opr_k   | x86_opr_m8,
+    x86_opr_k_m16            =3D x86_opr_k   | x86_opr_m16,
+    x86_opr_k_m32            =3D x86_opr_k   | x86_opr_m32,
+    x86_opr_k_m64            =3D x86_opr_k   | x86_opr_m64,
+
+    /* bound / memory */
+    x86_opr_bnd_mem          =3D x86_opr_bnd | x86_opr_mem,
+
+    /* memory operand alias */
+    x86_opr_m16int           =3D x86_opr_m16,
+    x86_opr_m32fp            =3D x86_opr_m32,
+    x86_opr_m32int           =3D x86_opr_m32,
+    x86_opr_m64fp            =3D x86_opr_m64,
+    x86_opr_m64int           =3D x86_opr_m64,
+    x86_opr_m80bcd           =3D x86_opr_m80,
+    x86_opr_m80dec           =3D x86_opr_m80,
+    x86_opr_m80fp            =3D x86_opr_m80,
+
+    /* sized immediate */
+    x86_opr_ib               =3D x86_opr_imm | x86_opr_size_8,
+    x86_opr_i16              =3D x86_opr_imm | x86_opr_size_16,
+    x86_opr_i32              =3D x86_opr_imm | x86_opr_size_32,
+    x86_opr_i64              =3D x86_opr_imm | x86_opr_size_64,
+    x86_opr_iwd              =3D x86_opr_imm | x86_opr_size_wd,
+    x86_opr_iw               =3D x86_opr_imm | x86_opr_size_w,
+
+    /* memory offset */
+    x86_opr_moffs            =3D x86_opr_imm | x86_opr_mem | x86_opr_size_=
w,
+
+    /* constant */
+    x86_opr_1                =3D x86_opr_const | (1 << x86_opr_av),
+
+    /* registers sequential */
+    x86_opr_flag_rs2         =3D x86_opr_flag_rs | (1 << x86_opr_av),
+    x86_opr_flag_rs4         =3D x86_opr_flag_rs | (2 << x86_opr_av),
+
+    /* sized broadcast */
+    x86_opr_m16bcst          =3D x86_opr_bcst | (1 << x86_opr_av),
+    x86_opr_m32bcst          =3D x86_opr_bcst | (2 << x86_opr_av),
+    x86_opr_m64bcst          =3D x86_opr_bcst | (3 << x86_opr_av),
+    x86_opr_bcst_mask        =3D x86_opr_bcst | x86_opr_av_mask,
+
+    /* sized vector / sized memory / broadcast */
+    x86_opr_xmm_m32_m16bcst  =3D x86_opr_mm_m32   | x86_opr_m16bcst,
+    x86_opr_xmm_m64_m16bcst  =3D x86_opr_xmm_m64  | x86_opr_m16bcst,
+    x86_opr_xmm_m64_m32bcst  =3D x86_opr_xmm_m64  | x86_opr_m32bcst,
+    x86_opr_xmm_m128_m16bcst =3D x86_opr_xmm_m128 | x86_opr_m16bcst,
+    x86_opr_xmm_m128_m32bcst =3D x86_opr_xmm_m128 | x86_opr_m32bcst,
+    x86_opr_xmm_m128_m64bcst =3D x86_opr_xmm_m128 | x86_opr_m64bcst,
+    x86_opr_ymm_m256_m16bcst =3D x86_opr_ymm_m256 | x86_opr_m16bcst,
+    x86_opr_ymm_m256_m32bcst =3D x86_opr_ymm_m256 | x86_opr_m32bcst,
+    x86_opr_ymm_m256_m64bcst =3D x86_opr_ymm_m256 | x86_opr_m64bcst,
+    x86_opr_zmm_m512_m16bcst =3D x86_opr_zmm_m512 | x86_opr_m16bcst,
+    x86_opr_zmm_m512_m32bcst =3D x86_opr_zmm_m512 | x86_opr_m32bcst,
+    x86_opr_zmm_m512_m64bcst =3D x86_opr_zmm_m512 | x86_opr_m64bcst,
+
+    /* relative displacement */
+    x86_opr_rel8             =3D x86_opr_imm | x86_opr_ind | x86_opr_size_=
8,
+    x86_opr_relw             =3D x86_opr_imm | x86_opr_ind | x86_opr_size_=
w,
+
+    /* enter / far displacement */
+    x86_opr_far16_16         =3D x86_opr_imm | x86_opr_ind | (1 << x86_opr=
_av),
+    x86_opr_far16_32         =3D x86_opr_imm | x86_opr_ind | (2 << x86_opr=
_av),
+
+    /* far memory indirect */
+    x86_opr_memfar16_16      =3D x86_opr_mem | x86_opr_ind | (3 << x86_opr=
_av),
+    x86_opr_memfar16_32      =3D x86_opr_mem | x86_opr_ind | (4 << x86_opr=
_av),
+    x86_opr_memfar16_64      =3D x86_opr_mem | x86_opr_ind | (5 << x86_opr=
_av),
+
+    /* implicit register */
+    x86_opr_reg_a            =3D x86_opr_reg | x86_opr_ind | (1 << x86_opr=
_av),
+    x86_opr_reg_c            =3D x86_opr_reg | x86_opr_ind | (2 << x86_opr=
_av),
+    x86_opr_reg_d            =3D x86_opr_reg | x86_opr_ind | (3 << x86_opr=
_av),
+    x86_opr_reg_b            =3D x86_opr_reg | x86_opr_ind | (4 << x86_opr=
_av),
+    x86_opr_reg_si           =3D x86_opr_reg | x86_opr_ind | (5 << x86_opr=
_av),
+    x86_opr_reg_di           =3D x86_opr_reg | x86_opr_ind | (6 << x86_opr=
_av),
+    x86_opr_reg_ah           =3D x86_opr_reg | x86_opr_ind | (7 << x86_opr=
_av),
+    x86_opr_reg_v0           =3D x86_opr_vec | x86_opr_ind | (1 << x86_opr=
_av),
+    x86_opr_reg_st0          =3D x86_opr_st  | x86_opr_ind | (1 << x86_opr=
_av),
+    x86_opr_seg_es           =3D x86_opr_seg | x86_opr_ind | (1 << x86_opr=
_av),
+    x86_opr_seg_cs           =3D x86_opr_seg | x86_opr_ind | (2 << x86_opr=
_av),
+    x86_opr_seg_ss           =3D x86_opr_seg | x86_opr_ind | (3 << x86_opr=
_av),
+    x86_opr_seg_ds           =3D x86_opr_seg | x86_opr_ind | (4 << x86_opr=
_av),
+    x86_opr_seg_fs           =3D x86_opr_seg | x86_opr_ind | (5 << x86_opr=
_av),
+    x86_opr_seg_gs           =3D x86_opr_seg | x86_opr_ind | (6 << x86_opr=
_av),
+
+    /* sized implicit register */
+    x86_opr_reg_al           =3D x86_opr_reg_a | x86_opr_size_8,
+    x86_opr_reg_cl           =3D x86_opr_reg_c | x86_opr_size_8,
+    x86_opr_reg_ax           =3D x86_opr_reg_a | x86_opr_size_16,
+    x86_opr_reg_cx           =3D x86_opr_reg_c | x86_opr_size_16,
+    x86_opr_reg_dx           =3D x86_opr_reg_d | x86_opr_size_16,
+    x86_opr_reg_bx           =3D x86_opr_reg_b | x86_opr_size_16,
+    x86_opr_reg_eax          =3D x86_opr_reg_a | x86_opr_size_32,
+    x86_opr_reg_ecx          =3D x86_opr_reg_c | x86_opr_size_32,
+    x86_opr_reg_edx          =3D x86_opr_reg_d | x86_opr_size_32,
+    x86_opr_reg_ebx          =3D x86_opr_reg_b | x86_opr_size_32,
+    x86_opr_reg_rax          =3D x86_opr_reg_a | x86_opr_size_64,
+    x86_opr_reg_rcx          =3D x86_opr_reg_c | x86_opr_size_64,
+    x86_opr_reg_rdx          =3D x86_opr_reg_d | x86_opr_size_64,
+    x86_opr_reg_rbx          =3D x86_opr_reg_b | x86_opr_size_64,
+    x86_opr_reg_aw           =3D x86_opr_reg_a | x86_opr_size_w,
+    x86_opr_reg_cw           =3D x86_opr_reg_c | x86_opr_size_w,
+    x86_opr_reg_dw           =3D x86_opr_reg_d | x86_opr_size_w,
+    x86_opr_reg_bw           =3D x86_opr_reg_b | x86_opr_size_w,
+    x86_opr_reg_pa           =3D x86_opr_reg_a | x86_opr_size_a,
+    x86_opr_reg_pc           =3D x86_opr_reg_c | x86_opr_size_a,
+    x86_opr_reg_pd           =3D x86_opr_reg_d | x86_opr_size_a,
+    x86_opr_reg_pb           =3D x86_opr_reg_b | x86_opr_size_a,
+    x86_opr_reg_psi          =3D x86_opr_reg_si | x86_opr_size_a,
+    x86_opr_reg_pdi          =3D x86_opr_reg_di | x86_opr_size_a,
+    x86_opr_reg_xmm0         =3D x86_opr_reg_v0 | x86_opr_size_128,
+    x86_opr_reg_xmm0_7       =3D x86_opr_reg_v0 | x86_opr_size_1024,
+
+    /* element type */
+    x86_opr_et_none          =3D (0 << x86_opr_et),
+    x86_opr_et_i             =3D (1 << x86_opr_et),
+    x86_opr_et_f             =3D (2 << x86_opr_et),
+    x86_opr_et_bf            =3D (3 << x86_opr_et),
+
+    /* element width */
+    x86_opr_ew_8             =3D (1 << x86_opr_ew),
+    x86_opr_ew_16            =3D (2 << x86_opr_ew),
+    x86_opr_ew_32            =3D (3 << x86_opr_ew),
+    x86_opr_ew_64            =3D (4 << x86_opr_ew),
+    x86_opr_ew_128           =3D (5 << x86_opr_ew),
+    x86_opr_ew_256           =3D (6 << x86_opr_ew),
+    x86_opr_ew_512           =3D (7 << x86_opr_ew),
+
+    /* element count */
+    x86_opr_ec_x1            =3D (1 << x86_opr_ec),
+    x86_opr_ec_x2            =3D (2 << x86_opr_ec),
+    x86_opr_ec_x4            =3D (3 << x86_opr_ec),
+    x86_opr_ec_x8            =3D (4 << x86_opr_ec),
+    x86_opr_ec_x16           =3D (5 << x86_opr_ec),
+    x86_opr_ec_x32           =3D (6 << x86_opr_ec),
+    x86_opr_ec_x64           =3D (7 << x86_opr_ec),
+
+    /* tuple type */
+    x86_opr_i8x1             =3D x86_opr_et_i | x86_opr_ew_8 | x86_opr_ec_=
x1,
+    x86_opr_i8x2             =3D x86_opr_et_i | x86_opr_ew_8 | x86_opr_ec_=
x2,
+    x86_opr_i8x4             =3D x86_opr_et_i | x86_opr_ew_8 | x86_opr_ec_=
x4,
+    x86_opr_i8x8             =3D x86_opr_et_i | x86_opr_ew_8 | x86_opr_ec_=
x8,
+    x86_opr_i8x16            =3D x86_opr_et_i | x86_opr_ew_8 | x86_opr_ec_=
x16,
+    x86_opr_i8x32            =3D x86_opr_et_i | x86_opr_ew_8 | x86_opr_ec_=
x32,
+    x86_opr_i8x64            =3D x86_opr_et_i | x86_opr_ew_8 | x86_opr_ec_=
x64,
+    x86_opr_i16x1            =3D x86_opr_et_i | x86_opr_ew_16 | x86_opr_ec=
_x1,
+    x86_opr_i16x2            =3D x86_opr_et_i | x86_opr_ew_16 | x86_opr_ec=
_x2,
+    x86_opr_i16x4            =3D x86_opr_et_i | x86_opr_ew_16 | x86_opr_ec=
_x4,
+    x86_opr_i16x8            =3D x86_opr_et_i | x86_opr_ew_16 | x86_opr_ec=
_x8,
+    x86_opr_i16x16           =3D x86_opr_et_i | x86_opr_ew_16 | x86_opr_ec=
_x16,
+    x86_opr_i16x32           =3D x86_opr_et_i | x86_opr_ew_16 | x86_opr_ec=
_x32,
+    x86_opr_i32x1            =3D x86_opr_et_i | x86_opr_ew_32 | x86_opr_ec=
_x1,
+    x86_opr_i32x2            =3D x86_opr_et_i | x86_opr_ew_32 | x86_opr_ec=
_x2,
+    x86_opr_i32x4            =3D x86_opr_et_i | x86_opr_ew_32 | x86_opr_ec=
_x4,
+    x86_opr_i32x8            =3D x86_opr_et_i | x86_opr_ew_32 | x86_opr_ec=
_x8,
+    x86_opr_i32x16           =3D x86_opr_et_i | x86_opr_ew_32 | x86_opr_ec=
_x16,
+    x86_opr_i64x1            =3D x86_opr_et_i | x86_opr_ew_64 | x86_opr_ec=
_x1,
+    x86_opr_i64x2            =3D x86_opr_et_i | x86_opr_ew_64 | x86_opr_ec=
_x2,
+    x86_opr_i64x4            =3D x86_opr_et_i | x86_opr_ew_64 | x86_opr_ec=
_x4,
+    x86_opr_i64x8            =3D x86_opr_et_i | x86_opr_ew_64 | x86_opr_ec=
_x8,
+    x86_opr_i128x1           =3D x86_opr_et_i | x86_opr_ew_128 | x86_opr_e=
c_x1,
+    x86_opr_i128x2           =3D x86_opr_et_i | x86_opr_ew_128 | x86_opr_e=
c_x2,
+    x86_opr_i128x4           =3D x86_opr_et_i | x86_opr_ew_128 | x86_opr_e=
c_x4,
+    x86_opr_i256x1           =3D x86_opr_et_i | x86_opr_ew_256 | x86_opr_e=
c_x1,
+    x86_opr_i256x2           =3D x86_opr_et_i | x86_opr_ew_256 | x86_opr_e=
c_x2,
+    x86_opr_i512x1           =3D x86_opr_et_i | x86_opr_ew_512 | x86_opr_e=
c_x1,
+    x86_opr_f8x1             =3D x86_opr_et_f | x86_opr_ew_8 | x86_opr_ec_=
x1,
+    x86_opr_f8x2             =3D x86_opr_et_f | x86_opr_ew_8 | x86_opr_ec_=
x2,
+    x86_opr_f8x4             =3D x86_opr_et_f | x86_opr_ew_8 | x86_opr_ec_=
x4,
+    x86_opr_f8x8             =3D x86_opr_et_f | x86_opr_ew_8 | x86_opr_ec_=
x8,
+    x86_opr_f8x16            =3D x86_opr_et_f | x86_opr_ew_8 | x86_opr_ec_=
x16,
+    x86_opr_f8x32            =3D x86_opr_et_f | x86_opr_ew_8 | x86_opr_ec_=
x32,
+    x86_opr_f8x64            =3D x86_opr_et_f | x86_opr_ew_8 | x86_opr_ec_=
x64,
+    x86_opr_f16x1            =3D x86_opr_et_f | x86_opr_ew_16 | x86_opr_ec=
_x1,
+    x86_opr_f16x2            =3D x86_opr_et_f | x86_opr_ew_16 | x86_opr_ec=
_x2,
+    x86_opr_f16x4            =3D x86_opr_et_f | x86_opr_ew_16 | x86_opr_ec=
_x4,
+    x86_opr_f16x8            =3D x86_opr_et_f | x86_opr_ew_16 | x86_opr_ec=
_x8,
+    x86_opr_f16x16           =3D x86_opr_et_f | x86_opr_ew_16 | x86_opr_ec=
_x16,
+    x86_opr_f16x32           =3D x86_opr_et_f | x86_opr_ew_16 | x86_opr_ec=
_x32,
+    x86_opr_f32x1            =3D x86_opr_et_f | x86_opr_ew_32 | x86_opr_ec=
_x1,
+    x86_opr_f32x2            =3D x86_opr_et_f | x86_opr_ew_32 | x86_opr_ec=
_x2,
+    x86_opr_f32x4            =3D x86_opr_et_f | x86_opr_ew_32 | x86_opr_ec=
_x4,
+    x86_opr_f32x8            =3D x86_opr_et_f | x86_opr_ew_32 | x86_opr_ec=
_x8,
+    x86_opr_f32x16           =3D x86_opr_et_f | x86_opr_ew_32 | x86_opr_ec=
_x16,
+    x86_opr_f64x1            =3D x86_opr_et_f | x86_opr_ew_64 | x86_opr_ec=
_x1,
+    x86_opr_f64x2            =3D x86_opr_et_f | x86_opr_ew_64 | x86_opr_ec=
_x2,
+    x86_opr_f64x4            =3D x86_opr_et_f | x86_opr_ew_64 | x86_opr_ec=
_x4,
+    x86_opr_f64x8            =3D x86_opr_et_f | x86_opr_ew_64 | x86_opr_ec=
_x8,
+};
+
+/*
+ * operand encoding accessors
+ */
+
+static inline uint x86_opr_has_mem(uint opr) {
+    return (opr & x86_opr_mem) !=3D 0;
+}
+static inline uint x86_opr_type_val(uint opr) {
+    return opr & x86_opr_type_mask;
+}
+static inline uint x86_opr_size_val(uint opr) {
+    return opr & x86_opr_size_mask;
+}
+static inline uint x86_opr_mem_val(uint opr) {
+    return opr & x86_opr_mem_mask;
+}
+static inline uint x86_opr_bcst_val(uint opr) {
+    return opr & x86_opr_bcst_mask;
+}
+static inline uint x86_opr_et_val(uint opr) {
+    return opr & x86_opr_et_mask;
+}
+static inline uint x86_opr_ec_val(uint opr) {
+    return opr & x86_opr_ec_mask;
+}
+static inline uint x86_opr_ew_val(uint opr) {
+    return opr & x86_opr_ew_mask;
+}
+
+static inline uint x86_opr_mem_size(uint opr)
+{
+    switch (x86_opr_mem_val(opr)) {
+    case x86_opr_m8: return x86_opr_size_8;
+    case x86_opr_m16: return x86_opr_size_16;
+    case x86_opr_m32: return x86_opr_size_32;
+    case x86_opr_m64: return x86_opr_size_64;
+    case x86_opr_m80: return x86_opr_size_80;
+    case x86_opr_m128: return x86_opr_size_128;
+    case x86_opr_m256: return x86_opr_size_256;
+    case x86_opr_m512: return x86_opr_size_512;
+    case x86_opr_mw:
+    default: return x86_opr_size_w;
+    }
+}
+
+static inline uint x86_opr_ew_bytes(uint opr)
+{
+    switch (x86_opr_ew_val(opr)) {
+    case x86_opr_ew_8: return 1;
+    case x86_opr_ew_16: return 2;
+    case x86_opr_ew_32: return 4;
+    case x86_opr_ew_64: return 8;
+    case x86_opr_ew_128: return 16;
+    case x86_opr_ew_256: return 32;
+    case x86_opr_ew_512: return 64;
+    }
+    return 0;
+}
+
+static inline uint x86_opr_ew_size(uint opr)
+{
+    switch (x86_opr_ew_val(opr)) {
+    case x86_opr_ew_8: return x86_opr_size_8;
+    case x86_opr_ew_16: return x86_opr_size_16;
+    case x86_opr_ew_32: return x86_opr_size_32;
+    case x86_opr_ew_64: return x86_opr_size_64;
+    case x86_opr_ew_128: return x86_opr_size_128;
+    case x86_opr_ew_256: return x86_opr_size_256;
+    case x86_opr_ew_512: return x86_opr_size_512;
+    }
+    return 0;
+}
+
+static inline uint x86_opr_ec_mult(uint opr)
+{
+    switch (x86_opr_ec_val(opr)) {
+    case x86_opr_ec_x1: return 1;
+    case x86_opr_ec_x2: return 2;
+    case x86_opr_ec_x4: return 4;
+    case x86_opr_ec_x8: return 8;
+    case x86_opr_ec_x16: return 16;
+    case x86_opr_ec_x32: return 32;
+    case x86_opr_ec_x64: return 64;
+    }
+    return 0;
+}
+
+/*
+ * order encoding
+ */
+
+enum
+{
+    x86_ord_none,
+
+    x86_ord_s1               =3D 0,
+    x86_ord_s2               =3D x86_ord_s1 + 3,
+    x86_ord_s3               =3D x86_ord_s2 + 3,
+
+    x86_ord_const            =3D (1 << x86_ord_s1), /* - */
+    x86_ord_imm              =3D (2 << x86_ord_s1), /* I */
+    x86_ord_reg              =3D (3 << x86_ord_s1), /* R */
+    x86_ord_mrm              =3D (4 << x86_ord_s1), /* M */
+    x86_ord_vec              =3D (5 << x86_ord_s1), /* V */
+    x86_ord_opr              =3D (6 << x86_ord_s1), /* O */
+    x86_ord_type_mask        =3D (7 << x86_ord_s1),
+
+    x86_ord_r                =3D (1 << x86_ord_s2),
+    x86_ord_w                =3D (2 << x86_ord_s2),
+    x86_ord_rw               =3D (3 << x86_ord_s2),
+    x86_ord_i                =3D (4 << x86_ord_s2),
+    x86_ord_ri               =3D (5 << x86_ord_s2),
+    x86_ord_wi               =3D (6 << x86_ord_s2),
+    x86_ord_rwi              =3D (7 << x86_ord_s2),
+    x86_ord_flag_mask        =3D (7 << x86_ord_s2),
+
+    x86_ord_one              =3D x86_ord_const | (1 << x86_ord_s3),
+    x86_ord_rax              =3D x86_ord_const | (2 << x86_ord_s3),
+    x86_ord_rcx              =3D x86_ord_const | (3 << x86_ord_s3),
+    x86_ord_rdx              =3D x86_ord_const | (4 << x86_ord_s3),
+    x86_ord_rbx              =3D x86_ord_const | (5 << x86_ord_s3),
+    x86_ord_rsp              =3D x86_ord_const | (6 << x86_ord_s3),
+    x86_ord_rbp              =3D x86_ord_const | (7 << x86_ord_s3),
+    x86_ord_rsi              =3D x86_ord_const | (8 << x86_ord_s3),
+    x86_ord_rdi              =3D x86_ord_const | (9 << x86_ord_s3),
+    x86_ord_st0              =3D x86_ord_const | (10 << x86_ord_s3),
+    x86_ord_stx              =3D x86_ord_const | (11 << x86_ord_s3),
+    x86_ord_seg              =3D x86_ord_const | (12 << x86_ord_s3),
+    x86_ord_xmm0             =3D x86_ord_const | (13 << x86_ord_s3),
+    x86_ord_xmm0_7           =3D x86_ord_const | (14 << x86_ord_s3),
+    x86_ord_mxcsr            =3D x86_ord_const | (15 << x86_ord_s3),
+    x86_ord_rflags           =3D x86_ord_const | (16 << x86_ord_s3),
+
+    x86_ord_sib              =3D x86_ord_mrm | (1 << x86_ord_s3),
+
+    x86_ord_is4              =3D x86_ord_imm | (1 << x86_ord_s3),
+    x86_ord_ime              =3D x86_ord_imm | (2 << x86_ord_s3),
+};
+
+/*
+ * order encoding accessors
+ */
+
+static inline uint x86_ord_type_val(uint ord) {
+    return ord & x86_ord_type_mask;
+}
+
+/*
+ * codec flags
+ */
+
+enum
+{
+    x86_ce_shift   =3D 0,
+    x86_cm_shift   =3D 3,
+    x86_ci_shift   =3D 5,
+    x86_cj_shift   =3D 8,
+
+    /* [0:2] encoding */
+    x86_ce_none    =3D (0 << x86_ce_shift),
+    x86_ce_rex     =3D (1 << x86_ce_shift),
+    x86_ce_rex2    =3D (2 << x86_ce_shift),
+    x86_ce_vex2    =3D (3 << x86_ce_shift),
+    x86_ce_vex3    =3D (4 << x86_ce_shift),
+    x86_ce_evex    =3D (5 << x86_ce_shift),
+    x86_ce_mask    =3D (7 << x86_ce_shift),
+
+    /* [3:4] map */
+    x86_cm_none    =3D (0 << x86_cm_shift),
+    x86_cm_0f      =3D (1 << x86_cm_shift),
+    x86_cm_0f38    =3D (2 << x86_cm_shift),
+    x86_cm_0f3a    =3D (3 << x86_cm_shift),
+    x86_cm_mask    =3D (3 << x86_cm_shift),
+
+    /* [5:7] imm */
+    x86_ci_none    =3D (0 << x86_ci_shift),
+    x86_ci_ib      =3D (1 << x86_ci_shift),
+    x86_ci_iw      =3D (2 << x86_ci_shift),
+    x86_ci_iwd     =3D (3 << x86_ci_shift),
+    x86_ci_i16     =3D (4 << x86_ci_shift),
+    x86_ci_i32     =3D (5 << x86_ci_shift),
+    x86_ci_i64     =3D (6 << x86_ci_shift),
+    x86_ci_mask    =3D (7 << x86_ci_shift),
+
+    /* [8:9] imm2 */
+    x86_cj_ib      =3D (1 << x86_cj_shift),
+    x86_cj_i16     =3D (2 << x86_cj_shift),
+    x86_cj_mask    =3D (3 << x86_cj_shift),
+
+    /* [10:15] prefixes */
+    x86_cp_osize   =3D (1 << 10), /* 0x66 */
+    x86_cp_asize   =3D (1 << 11), /* 0x67 */
+    x86_cp_wait    =3D (1 << 12), /* 0x9B */
+    x86_cp_lock    =3D (1 << 13), /* 0xF0 */
+    x86_cp_repne   =3D (1 << 14), /* 0xF2 */
+    x86_cp_rep     =3D (1 << 15), /* 0xF3 */
+
+    /* [16:18] flags */
+    x86_cf_modrm   =3D (1 << 16),
+    x86_cf_ia32    =3D (1 << 17),
+    x86_cf_amd64   =3D (1 << 18),
+};
+
+/*
+ * codec struct
+ */
+
+struct x86_codec
+{
+    union {
+        x86_rex rex;
+        x86_rex2 rex2;
+        x86_vex2 vex2;
+        x86_vex3 vex3;
+        x86_evex evex;
+    };
+
+    union {
+        uchar opc[2];
+        struct {
+            uchar opc0;
+            x86_modrm modrm;
+        };
+    };
+
+    uchar opclen : 2;
+    uchar seg : 3;
+    uchar spare;
+    x86_sib sib;
+
+    uint flags;
+    ushort rec;
+    short imm2;
+
+    union {
+        struct {
+            int disp32;
+            int imm32;
+        };
+        struct {
+            ullong imm64;
+        };
+    };
+};
+
+/*
+ * codec accessors
+ */
+
+static inline int x86_codec_field_ce(x86_codec *c) {
+    return c->flags & x86_ce_mask;
+}
+static inline int x86_codec_field_cm(x86_codec *c) {
+    return c->flags & x86_cm_mask;
+}
+static inline int x86_codec_field_ci(x86_codec *c) {
+    return c->flags & x86_ci_mask;
+}
+static inline int x86_codec_field_cj(x86_codec *c) {
+    return c->flags & x86_cj_mask;
+}
+static inline int x86_codec_has_wait(x86_codec *c) {
+    return (c->flags & x86_cp_wait) !=3D 0;
+}
+static inline int x86_codec_has_lock(x86_codec *c) {
+    return (c->flags & x86_cp_lock) !=3D 0;
+}
+static inline int x86_codec_has_rep(x86_codec *c) {
+    return (c->flags & x86_cp_rep) !=3D 0;
+}
+static inline int x86_codec_has_repne(x86_codec *c) {
+    return (c->flags & x86_cp_repne) !=3D 0;
+}
+static inline int x86_codec_has_osize(x86_codec *c) {
+    return (c->flags & x86_cp_osize) !=3D 0;
+}
+static inline int x86_codec_has_asize(x86_codec *c) {
+    return (c->flags & x86_cp_asize) !=3D 0;
+}
+static inline int x86_codec_has_modrm(x86_codec *c) {
+    return (c->flags & x86_cf_modrm) !=3D 0;
+}
+static inline int x86_codec_is16(x86_codec *c) {
+    return (c->flags & (x86_cf_ia32 | x86_cf_amd64)) =3D=3D 0;
+}
+static inline int x86_codec_is32(x86_codec *c) {
+    return (c->flags & x86_cf_ia32) !=3D 0;
+}
+static inline int x86_codec_is64(x86_codec *c) {
+    return (c->flags & x86_cf_amd64) !=3D 0;
+}
+
+/*
+ * modes
+ */
+
+enum
+{
+    x86_modes_16 =3D (1 << 0),
+    x86_modes_32 =3D (1 << 1),
+    x86_modes_64 =3D (1 << 2),
+};
+
+/*
+ * modes accessors
+ */
+
+static inline int x86_mode_has16(uint mode) {
+    return (mode & x86_modes_16) !=3D 0;
+}
+static inline int x86_mode_has32(uint mode) {
+    return (mode & x86_modes_32) !=3D 0;
+}
+static inline int x86_mode_has64(uint mode) {
+    return (mode & x86_modes_64) !=3D 0;
+}
+
+/*
+ * memory operand
+ */
+
+struct x86_mem
+{
+    union {
+        uint code;
+        struct {
+            uint base : 9;
+            uint index : 9;
+            uint scale : 2;
+        };
+    };
+    int disp;
+};
+
+/*
+ * opcode metadata
+ *
+ * type, prefix, map, opcode, mask, plus operand and order records.
+ *
+ * opcode - opcode number from opcode enum for name lookup
+ * mode   - operating mode (16 | 32 | 64)
+ * opr    - operand list (r8/m8, rw/mw, xmm/m128, etc)
+ * ord    - operand order (register, immediate, regmem, etc)
+ * enc    - operand encoding (type, width, prefix, map, immediate, etc)
+ * opc    - opcode, ModRM function byte or second opcode byte.
+ * opm    - opcode mask (f8 for XX+r), ModRM function or second byte mask.
+ *
+ * prefix and map are provisioned as 6 bits each to align the bitfield.
+ * there are 3 types, 10 prefixes (5 * 2), and 7 maps (up to map6).
+ */
+
+struct x86_opc_data
+{
+    ushort op;
+    ushort mode;
+    ushort opr;
+    ushort ord;
+    uint enc;
+    union {
+        uchar opc[2];
+        ushort opc_s;
+    };
+    union {
+        uchar opm[2];
+        ushort opm_s;
+    };
+};
+
+struct x86_opr_data
+{
+    uint opr[4];
+};
+
+struct x86_ord_data
+{
+    ushort ord[4];
+};
+
+/*
+ * ModRM encoder
+ */
+
+static inline x86_modrm x86_enc_modrm(uint mod, uint reg, uint rm)
+{
+    x86_modrm modrm =3D {
+        .data =3D {
+            /* [0:2] */ (rm & 7u) |
+            /* [3:5] */ ((reg & 7u) << 3) |
+            /* [6:7] */ ((mod & 3u) << 6)
+        }
+    };
+    return modrm;
+}
+
+/*
+ * SIB encoder
+ */
+
+static inline x86_sib x86_enc_sib(uint s, uint x, uint b)
+{
+    x86_sib sib =3D {
+        .data =3D {
+            /* [0:2] */ (b & 7u) |
+            /* [3:5] */ ((x & 7u) << 3) |
+            /* [6:7] */ (((uint)s & 3u) << 6)
+        }
+    };
+    return sib;
+}
+
+/*
+ * REX encoder
+ */
+
+static inline x86_rex x86_enc_rex(uint w, uint r, uint x, uint b)
+{
+    x86_rex rex =3D {
+        .data =3D {
+            /*   [0] */ ((b & 8u) >> 3) |
+            /*   [1] */ ((x & 8u) >> 2) |
+            /*   [2] */ ((r & 8u) >> 1) |
+            /*   [3] */ ((w & 1u) << 3) |
+            /* [4:7] */ 0x40
+        }
+    };
+    return rex;
+}
+
+/*
+ * REX2 encoder
+ */
+
+static inline x86_rex2 x86_enc_rex2(uint m, uint w, uint r, uint x, uint b)
+{
+    x86_rex2 rex2 =3D {
+        .data =3D {
+            /*   [0] */ ((b &  8u) >> 3) |
+            /*   [1] */ ((x &  8u) >> 2) |
+            /*   [2] */ ((r &  8u) >> 1) |
+            /*   [3] */ ((w &  1u) << 3) |
+            /*   [4] */ ((b & 16u) << 0) |
+            /*   [5] */ ((x & 16u) << 1) |
+            /*   [6] */ ((r & 16u) << 2) |
+            /*   [7] */ ((m &  1u) << 7)
+        }
+    };
+    return rex2;
+}
+
+/*
+ * VEX2 encoder
+ */
+
+static inline x86_vex2 x86_enc_vex2(uint p, uint l, uint r, uint v)
+{
+    x86_vex2 vex2 =3D {
+        .data =3D {
+            /* [0:1] */ ((uint)p & 3u) |
+            /*   [2] */ ((l & 1u) << 2) |
+            /* [3:6] */ ((~v & 15u) << 3) |
+            /*   [7] */ ((~r & 8u) << 4)
+        }
+    };
+    return vex2;
+}
+
+/*
+ * VEX3 encoder
+ */
+
+static inline x86_vex3 x86_enc_vex3(uint m, uint p,
+    uint l, uint w, uint r, uint x, uint b, uint v)
+{
+    x86_vex3 vex3 =3D {
+        .data =3D {
+            /* [0:4] */ ((m &  31u) >> 0) |
+            /*   [5] */ ((~b &  8u) << 2) |
+            /*   [6] */ ((~x &  8u) << 3) |
+            /*   [7] */ ((~r &  8u) << 4),
+            /* [0:1] */ ((p &   3u) >> 0) |
+            /*   [2] */ ((l  &  1u) << 2) |
+            /* [3:6] */ ((~v & 15u) << 3) |
+            /*   [7] */ ((w  &  1u) << 7)
+        }
+    };
+    return vex3;
+}
+
+/*
+ * EVEX encoder
+ */
+
+static inline x86_evex x86_enc_evex(uint m, uint p,
+    uint l, uint w, uint r, uint x, uint b, uint v,
+    uint k, uint brd, uint z)
+{
+    x86_evex evex =3D {
+        .data =3D {
+            /* [0:2] */ ((m &   7u) >> 0) |
+            /*   [3] */ ((b &  16u) >> 1) |
+            /*   [4] */ ((~r & 16u) >> 0) |
+            /*   [5] */ ((~b &  8u) << 2) |
+            /*   [6] */ ((~x &  8u) << 3) |
+            /*   [7] */ ((~r &  8u) << 4),
+            /* [0:1] */ ((p &   3u) >> 0) |
+            /*   [2] */ ((~x & 16u) >> 2) |
+            /* [3:6] */ ((~v & 15u) << 3) |
+            /*   [7] */ ((w  &  1u) << 7),
+            /* [0:2] */ ((k &   7u) >> 0) |
+            /*   [3] */ ((~v & 16u) >> 1) |
+            /*   [4] */ ((brd & 1u) << 4) |
+            /* [5:6] */ ((l &   3u) << 5) |
+            /*   [7] */ ((z &   1u) << 7)
+        }
+    };
+    return evex;
+}
+
+/*
+ * table sort types
+ */
+
+enum
+{
+    x86_sort_none,
+    x86_sort_numeric,
+    x86_sort_alpha
+};
+
+/*
+ * table encoding prefix types
+ */
+
+enum
+{
+    x86_table_none,
+    x86_table_lex,
+    x86_table_vex,
+    x86_table_evex
+};
+
+/*
+ * table sort indices
+ */
+
+struct x86_table_idx
+{
+    size_t count;
+    size_t *idx;
+};
+
+/*
+ * opcode index decode tables
+ */
+
+struct x86_acc_idx
+{
+    size_t map_count;
+    x86_opc_data *map;
+    size_t acc_count;
+    x86_acc_entry *acc;
+    uchar *page_offsets;
+};
+
+/*
+ * opcode index acceleration entry
+ */
+
+struct x86_acc_entry
+{
+    uint idx : 24;
+    uint nent : 8;
+};
+
+/*
+ * opcode acceleration functions
+ */
+
+static inline uint x86_acc_page(uint type, uint prefix, uint map)
+{
+    return (type & 3) | ((prefix & 15) << 2) | ((map & 7) << 6);
+}
+
+static inline size_t x86_acc_offset(x86_acc_idx *idx, size_t acc_page)
+{
+    return (size_t)idx->page_offsets[acc_page] << 8;
+}
+
+static inline x86_acc_entry *x86_acc_lookup(x86_acc_idx *idx, size_t offse=
t)
+{
+    return idx->acc + offset;
+}
+
+/*
+ * bitmap utility functions
+ */
+
+static inline size_t x86_bitmap_idx(size_t i) { return i >> 6; }
+static inline size_t x86_bitmap_shift(size_t i) { return (i & 63); }
+
+static inline int x86_bitmap_get(ullong *bitmap, size_t i)
+{
+    return (int)((bitmap[x86_bitmap_idx(i)] >> x86_bitmap_shift(i)) & 1);
+}
+
+static inline void x86_bitmap_set(ullong *bitmap, size_t i, int value)
+{
+    bitmap[x86_bitmap_idx(i)] |=3D ((ullong)value << x86_bitmap_shift(i));
+}
+
+/*
+ * context for encoder, decoder, formatter and parser
+ */
+
+struct x86_ctx
+{
+    uint mode;
+    x86_acc_idx *idx;
+};
+
+/*
+ * buffer
+ *
+ * simplified buffer with read (start) and write (end) cursors
+ * capacity is user managed because it does no limit checking.
+ */
+
+struct x86_buffer
+{
+    uchar *data;
+    size_t start;
+    size_t end;
+};
+
+/*
+ * buffer functions
+ */
+
+static inline void x86_buffer_init(x86_buffer *b, uchar *data)
+{
+    b->start =3D 0;
+    b->end =3D 0;
+    b->data =3D data;
+}
+
+static inline void x86_buffer_init_ex(x86_buffer *b, uchar *data,
+    size_t start, size_t end)
+{
+    b->start =3D start;
+    b->end =3D end;
+    b->data =3D data;
+}
+
+static inline size_t x86_buffer_read(x86_buffer *b, uchar *buf, size_t len)
+{
+    memcpy(buf, b->data + b->start, len);
+    b->start +=3D len;
+    return len;
+}
+
+static inline size_t x86_buffer_unread(x86_buffer *b, size_t len)
+{
+    b->start -=3D len;
+    return len;
+}
+
+static inline size_t x86_buffer_write(x86_buffer *b, uchar *buf, size_t le=
n)
+{
+    memcpy(b->data + b->end, buf, len);
+    b->end +=3D len;
+    return len;
+}
+
+static inline size_t x86_buffer_unwrite(x86_buffer *b, size_t len)
+{
+    b->end -=3D len;
+    return len;
+}
+
+static inline size_t x86_out8(x86_buffer *buf, u8 v)
+{
+    return x86_buffer_write(buf, (void *)&v, sizeof(u8));
+}
+
+static inline size_t x86_out16(x86_buffer *buf, u16 v)
+{
+    u16 t =3D cpu_to_le16(v);
+    return x86_buffer_write(buf, (void *)&t, sizeof(u16));
+}
+
+static inline size_t x86_out32(x86_buffer *buf, u32 v)
+{
+    u32 t =3D cpu_to_le32(v);
+    return x86_buffer_write(buf, (void *)&t, sizeof(u32));
+}
+
+static inline size_t x86_out64(x86_buffer *buf, u64 v)
+{
+    u64 t =3D cpu_to_le64(v);
+    return x86_buffer_write(buf, (void *)&t, sizeof(u64));
+}
+
+static inline size_t x86_unput(x86_buffer *buf, size_t n)
+{
+    return x86_buffer_unwrite(buf, n);
+}
+
+static inline u8 x86_in8(x86_buffer *buf)
+{
+    u8 t =3D 0;
+    x86_buffer_read(buf, (void *)&t, sizeof(u8));
+    return t;
+}
+
+static inline u16 x86_in16(x86_buffer *buf)
+{
+    u16 t =3D 0;
+    x86_buffer_read(buf, (void *)&t, sizeof(u16));
+    return le16_to_cpu(t);
+}
+
+static inline u32 x86_in32(x86_buffer *buf)
+{
+    u32 t =3D 0;
+    x86_buffer_read(buf, (void *)&t, sizeof(u32));
+    return le32_to_cpu(t);
+}
+
+static inline u64 x86_in64(x86_buffer *buf)
+{
+    u64 t =3D 0;
+    x86_buffer_read(buf, (void *)&t, sizeof(u64));
+    return le64_to_cpu(t);
+}
+
+/*
+ * metadata tables
+ */
+
+extern const char *x86_reg_names[];
+extern const size_t x86_op_names_size;
+extern const char *x86_op_names[];
+extern const size_t x86_opc_table_size;
+extern const x86_opc_data x86_opc_table[];
+extern const size_t x86_opr_table_size;
+extern const x86_opr_data x86_opr_table[];
+extern const size_t x86_ord_table_size;
+extern const x86_ord_data x86_ord_table[];
+
+/*
+ * encoder, decoder, table lookup, disassembly
+ */
+
+void x86_set_debug(uint d);
+size_t x86_mode_name(char *buf, size_t len, uint mode, const char *sep);
+size_t x86_map_name(char *buf, size_t len, uint mode, const char *sep);
+size_t x86_ord_name(char *buf, size_t len, uint ord, const char *sep);
+size_t x86_ord_mnem(char *buf, size_t len, const ushort *ord);
+size_t x86_opr_name(char *buf, size_t len, uint opr);
+size_t x86_enc_name(char *buf, size_t len, uint enc);
+const char *x86_reg_name(uint reg);
+const char *x86_table_type_name(uint type);
+const char *x86_table_map_name(uint map);
+const char *x86_table_prefix_name(uint prefix);
+int x86_enc_filter_rex(x86_rex prefix, uint enc);
+int x86_enc_filter_rex2(x86_rex2 prefix, uint enc);
+int x86_enc_filter_vex2(x86_vex2 prefix, uint enc);
+int x86_enc_filter_vex3(x86_vex3 prefix, uint enc);
+int x86_enc_filter_evex(x86_evex prefix, uint enc);
+x86_table_idx x86_opc_table_identity(void);
+x86_table_idx x86_opc_table_sorted(x86_table_idx tab, uint sort);
+x86_table_idx x86_opc_table_filter(x86_table_idx tab, uint modes);
+x86_opc_data *x86_table_lookup(x86_acc_idx *idx, const x86_opc_data *m);
+void x86_print_op(const x86_opc_data *d, uint compact, uint opcode);
+size_t x86_format_op(char *buf, size_t len, x86_ctx *ctx, x86_codec *c);
+typedef size_t (*x86_fmt_symbol)(char *buf, size_t buflen, x86_codec *c,
+    size_t pc_offset);
+size_t x86_format_op_symbol(char *buf, size_t buflen, x86_ctx *ctx,
+    x86_codec *c, size_t pc_offset, x86_fmt_symbol sym_cb);
+size_t x86_format_hex(char *buf, size_t len, uchar *data, size_t datalen);
+x86_ctx *x86_ctx_create(uint mode);
+void x86_ctx_destroy(x86_ctx *ctx);
+int x86_codec_write(x86_ctx *ctx, x86_buffer *buf, x86_codec c, size_t *le=
n);
+int x86_codec_read(x86_ctx *ctx, x86_buffer *buf, x86_codec *c, size_t *le=
n);
+
+/*
+ * registers sand opcodes
+ */
+
+#include "disas/x86-enums.inc"
diff --git a/include/disas/dis-asm.h b/include/disas/dis-asm.h
index 3b50ecfb5409..fd8aa326948f 100644
--- a/include/disas/dis-asm.h
+++ b/include/disas/dis-asm.h
@@ -446,6 +446,7 @@ int print_insn_v850             (bfd_vma, disassemble_i=
nfo*);
 int print_insn_tic30            (bfd_vma, disassemble_info*);
 int print_insn_microblaze       (bfd_vma, disassemble_info*);
 int print_insn_ia64             (bfd_vma, disassemble_info*);
+int print_insn_x86              (bfd_vma, disassemble_info*);
 int print_insn_xtensa           (bfd_vma, disassemble_info*);
 int print_insn_riscv32          (bfd_vma, disassemble_info*);
 int print_insn_riscv64          (bfd_vma, disassemble_info*);
diff --git a/target/i386/cpu.c b/target/i386/cpu.c
index b5dd60d2812e..ff82174915cf 100644
--- a/target/i386/cpu.c
+++ b/target/i386/cpu.c
@@ -44,6 +44,7 @@
 #endif
=20
 #include "disas/capstone.h"
+#include "disas/x86.h"
 #include "cpu-internal.h"
=20
 static void x86_cpu_realizefn(DeviceState *dev, Error **errp);
@@ -8507,6 +8508,12 @@ static void x86_disas_set_info(CPUState *cs, disasse=
mble_info *info)
                       : CS_MODE_16);
     info->cap_insn_unit =3D 1;
     info->cap_insn_split =3D 8;
+
+    info->print_insn =3D print_insn_x86;
+    info->private_data =3D x86_ctx_create(
+        env->hflags & HF_CS64_MASK ? x86_modes_64
+        : env->hflags & HF_CS32_MASK ? x86_modes_32
+        : x86_modes_16);
 }
=20
 void x86_update_hflags(CPUX86State *env)
--=20
2.43.0