9ae3a8
From 5567938d29bf8a0ce451e59a8db009c12ab3444c Mon Sep 17 00:00:00 2001
9ae3a8
From: Eduardo Habkost <ehabkost@redhat.com>
9ae3a8
Date: Thu, 25 Jun 2015 19:31:29 +0200
9ae3a8
Subject: [PATCH 09/10] target-i386: add Intel AVX-512 support
9ae3a8
9ae3a8
Message-id: <1435260689-9556-9-git-send-email-ehabkost@redhat.com>
9ae3a8
Patchwork-id: 66506
9ae3a8
O-Subject: [RHEL-7.2 qemu-kvm PATCH 8/8] target-i386: add Intel AVX-512 support
9ae3a8
Bugzilla: 1233350
9ae3a8
RH-Acked-by: Igor Mammedov <imammedo@redhat.com>
9ae3a8
RH-Acked-by: Bandan Das <bsd@redhat.com>
9ae3a8
RH-Acked-by: Paolo Bonzini <pbonzini@redhat.com>
9ae3a8
9ae3a8
Add AVX512 feature bits, register definition and corresponding
9ae3a8
xsave/vmstate support.
9ae3a8
9ae3a8
Reviewed-by: Eduardo Habkost <ehabkost@redhat.com>
9ae3a8
Signed-off-by: Chao Peng <chao.p.peng@linux.intel.com>
9ae3a8
Signed-off-by: Paolo Bonzini <pbonzini@redhat.com>
9ae3a8
(cherry picked from commit 9aecd6f8aef653cea58932f06a2740299dbe5fd3)
9ae3a8
Signed-off-by: Eduardo Habkost <ehabkost@redhat.com>
9ae3a8
Signed-off-by: Miroslav Rezanina <mrezanin@redhat.com>
9ae3a8
9ae3a8
Conflicts:
9ae3a8
	target-i386/cpu.h
9ae3a8
	target-i386/machine.c
9ae3a8
---
9ae3a8
 target-i386/cpu.c     | 10 ++++--
9ae3a8
 target-i386/cpu.h     | 61 ++++++++++++++++++++++++++++++++++++
9ae3a8
 target-i386/kvm.c     | 19 +++++++++++
9ae3a8
 target-i386/machine.c | 87 +++++++++++++++++++++++++++++++++++++++++++++++++++
9ae3a8
 4 files changed, 175 insertions(+), 2 deletions(-)
9ae3a8
9ae3a8
diff --git a/target-i386/cpu.c b/target-i386/cpu.c
9ae3a8
index fe60c33..06efe17 100644
9ae3a8
--- a/target-i386/cpu.c
9ae3a8
+++ b/target-i386/cpu.c
9ae3a8
@@ -146,8 +146,8 @@ static const char *svm_feature_name[] = {
9ae3a8
 static const char *cpuid_7_0_ebx_feature_name[] = {
9ae3a8
     "fsgsbase", NULL, NULL, "bmi1", "hle", "avx2", NULL, "smep",
9ae3a8
     "bmi2", "erms", "invpcid", "rtm", NULL, NULL, "mpx", NULL,
9ae3a8
-    NULL, NULL, "rdseed", "adx", "smap", NULL, NULL, NULL,
9ae3a8
-    NULL, NULL, NULL, NULL, NULL, NULL, NULL, NULL,
9ae3a8
+    "avx512f", NULL, "rdseed", "adx", "smap", NULL, NULL, NULL,
9ae3a8
+    NULL, NULL, "avx512pf", "avx512er", "avx512cd", NULL, NULL, NULL,
9ae3a8
 };
9ae3a8
 
9ae3a8
 typedef struct FeatureWordInfo {
9ae3a8
@@ -228,6 +228,12 @@ static const ExtSaveArea ext_save_areas[] = {
9ae3a8
             .offset = 0x3c0, .size = 0x40  },
9ae3a8
     [4] = { .feature = FEAT_7_0_EBX, .bits = CPUID_7_0_EBX_MPX,
9ae3a8
             .offset = 0x400, .size = 0x40  },
9ae3a8
+    [5] = { .feature = FEAT_7_0_EBX, .bits = CPUID_7_0_EBX_AVX512F,
9ae3a8
+            .offset = 0x440, .size = 0x40 },
9ae3a8
+    [6] = { .feature = FEAT_7_0_EBX, .bits = CPUID_7_0_EBX_AVX512F,
9ae3a8
+            .offset = 0x480, .size = 0x200 },
9ae3a8
+    [7] = { .feature = FEAT_7_0_EBX, .bits = CPUID_7_0_EBX_AVX512F,
9ae3a8
+            .offset = 0x680, .size = 0x400 },
9ae3a8
 };
9ae3a8
 
9ae3a8
 const char *get_register_name_32(unsigned int reg)
9ae3a8
diff --git a/target-i386/cpu.h b/target-i386/cpu.h
9ae3a8
index fc1e42e..61e9b86 100644
9ae3a8
--- a/target-i386/cpu.h
9ae3a8
+++ b/target-i386/cpu.h
9ae3a8
@@ -390,6 +390,9 @@
9ae3a8
 #define XSTATE_YMM                      (1ULL << 2)
9ae3a8
 #define XSTATE_BNDREGS                  (1ULL << 3)
9ae3a8
 #define XSTATE_BNDCSR                   (1ULL << 4)
9ae3a8
+#define XSTATE_OPMASK                   (1ULL << 5)
9ae3a8
+#define XSTATE_ZMM_Hi256                (1ULL << 6)
9ae3a8
+#define XSTATE_Hi16_ZMM                 (1ULL << 7)
9ae3a8
 
9ae3a8
 
9ae3a8
 /* CPUID feature words */
9ae3a8
@@ -554,9 +557,13 @@ typedef uint32_t FeatureWordArray[FEATURE_WORDS];
9ae3a8
 #define CPUID_7_0_EBX_INVPCID  (1U << 10)
9ae3a8
 #define CPUID_7_0_EBX_RTM      (1U << 11)
9ae3a8
 #define CPUID_7_0_EBX_MPX      (1U << 14)
9ae3a8
+#define CPUID_7_0_EBX_AVX512F  (1U << 16) /* AVX-512 Foundation */
9ae3a8
 #define CPUID_7_0_EBX_RDSEED   (1U << 18)
9ae3a8
 #define CPUID_7_0_EBX_ADX      (1U << 19)
9ae3a8
 #define CPUID_7_0_EBX_SMAP     (1U << 20)
9ae3a8
+#define CPUID_7_0_EBX_AVX512PF (1U << 26) /* AVX-512 Prefetch */
9ae3a8
+#define CPUID_7_0_EBX_AVX512ER (1U << 27) /* AVX-512 Exponential and Reciprocal */
9ae3a8
+#define CPUID_7_0_EBX_AVX512CD (1U << 28) /* AVX-512 Conflict Detection */
9ae3a8
 
9ae3a8
 #define CPUID_VENDOR_SZ      12
9ae3a8
 
9ae3a8
@@ -697,6 +704,24 @@ typedef union {
9ae3a8
 } XMMReg;
9ae3a8
 
9ae3a8
 typedef union {
9ae3a8
+    uint8_t _b[32];
9ae3a8
+    uint16_t _w[16];
9ae3a8
+    uint32_t _l[8];
9ae3a8
+    uint64_t _q[4];
9ae3a8
+    float32 _s[8];
9ae3a8
+    float64 _d[4];
9ae3a8
+} YMMReg;
9ae3a8
+
9ae3a8
+typedef union {
9ae3a8
+    uint8_t _b[64];
9ae3a8
+    uint16_t _w[32];
9ae3a8
+    uint32_t _l[16];
9ae3a8
+    uint64_t _q[8];
9ae3a8
+    float32 _s[16];
9ae3a8
+    float64 _d[8];
9ae3a8
+} ZMMReg;
9ae3a8
+
9ae3a8
+typedef union {
9ae3a8
     uint8_t _b[8];
9ae3a8
     uint16_t _w[4];
9ae3a8
     uint32_t _l[2];
9ae3a8
@@ -715,6 +740,20 @@ typedef struct BNDCSReg {
9ae3a8
 } BNDCSReg;
9ae3a8
 
9ae3a8
 #ifdef HOST_WORDS_BIGENDIAN
9ae3a8
+#define ZMM_B(n) _b[63 - (n)]
9ae3a8
+#define ZMM_W(n) _w[31 - (n)]
9ae3a8
+#define ZMM_L(n) _l[15 - (n)]
9ae3a8
+#define ZMM_S(n) _s[15 - (n)]
9ae3a8
+#define ZMM_Q(n) _q[7 - (n)]
9ae3a8
+#define ZMM_D(n) _d[7 - (n)]
9ae3a8
+
9ae3a8
+#define YMM_B(n) _b[31 - (n)]
9ae3a8
+#define YMM_W(n) _w[15 - (n)]
9ae3a8
+#define YMM_L(n) _l[7 - (n)]
9ae3a8
+#define YMM_S(n) _s[7 - (n)]
9ae3a8
+#define YMM_Q(n) _q[3 - (n)]
9ae3a8
+#define YMM_D(n) _d[3 - (n)]
9ae3a8
+
9ae3a8
 #define XMM_B(n) _b[15 - (n)]
9ae3a8
 #define XMM_W(n) _w[7 - (n)]
9ae3a8
 #define XMM_L(n) _l[3 - (n)]
9ae3a8
@@ -727,6 +766,20 @@ typedef struct BNDCSReg {
9ae3a8
 #define MMX_L(n) _l[1 - (n)]
9ae3a8
 #define MMX_S(n) _s[1 - (n)]
9ae3a8
 #else
9ae3a8
+#define ZMM_B(n) _b[n]
9ae3a8
+#define ZMM_W(n) _w[n]
9ae3a8
+#define ZMM_L(n) _l[n]
9ae3a8
+#define ZMM_S(n) _s[n]
9ae3a8
+#define ZMM_Q(n) _q[n]
9ae3a8
+#define ZMM_D(n) _d[n]
9ae3a8
+
9ae3a8
+#define YMM_B(n) _b[n]
9ae3a8
+#define YMM_W(n) _w[n]
9ae3a8
+#define YMM_L(n) _l[n]
9ae3a8
+#define YMM_S(n) _s[n]
9ae3a8
+#define YMM_Q(n) _q[n]
9ae3a8
+#define YMM_D(n) _d[n]
9ae3a8
+
9ae3a8
 #define XMM_B(n) _b[n]
9ae3a8
 #define XMM_W(n) _w[n]
9ae3a8
 #define XMM_L(n) _l[n]
9ae3a8
@@ -765,6 +818,8 @@ typedef struct {
9ae3a8
 
9ae3a8
 #define NB_MMU_MODES 3
9ae3a8
 
9ae3a8
+#define NB_OPMASK_REGS 8
9ae3a8
+
9ae3a8
 typedef enum TPRAccess {
9ae3a8
     TPR_ACCESS_READ,
9ae3a8
     TPR_ACCESS_WRITE,
9ae3a8
@@ -826,6 +881,12 @@ typedef struct CPUX86State {
9ae3a8
 
9ae3a8
     XMMReg ymmh_regs[CPU_NB_REGS];
9ae3a8
 
9ae3a8
+    uint64_t opmask_regs[NB_OPMASK_REGS];
9ae3a8
+    YMMReg zmmh_regs[CPU_NB_REGS];
9ae3a8
+#ifdef TARGET_X86_64
9ae3a8
+    ZMMReg hi16_zmm_regs[CPU_NB_REGS];
9ae3a8
+#endif
9ae3a8
+
9ae3a8
     /* sysenter registers */
9ae3a8
     uint32_t sysenter_cs;
9ae3a8
     target_ulong sysenter_esp;
9ae3a8
diff --git a/target-i386/kvm.c b/target-i386/kvm.c
9ae3a8
index bbbbac0..c91bfb8 100644
9ae3a8
--- a/target-i386/kvm.c
9ae3a8
+++ b/target-i386/kvm.c
9ae3a8
@@ -995,6 +995,9 @@ static int kvm_put_fpu(X86CPU *cpu)
9ae3a8
 #define XSAVE_YMMH_SPACE  144
9ae3a8
 #define XSAVE_BNDREGS     240
9ae3a8
 #define XSAVE_BNDCSR      256
9ae3a8
+#define XSAVE_OPMASK      272
9ae3a8
+#define XSAVE_ZMM_Hi256   288
9ae3a8
+#define XSAVE_Hi16_ZMM    416
9ae3a8
 
9ae3a8
 static int kvm_put_xsave(X86CPU *cpu)
9ae3a8
 {
9ae3a8
@@ -1031,6 +1034,14 @@ static int kvm_put_xsave(X86CPU *cpu)
9ae3a8
             sizeof env->bnd_regs);
9ae3a8
     memcpy(&xsave->region[XSAVE_BNDCSR], &env->bndcs_regs,
9ae3a8
             sizeof(env->bndcs_regs));
9ae3a8
+    memcpy(&xsave->region[XSAVE_OPMASK], env->opmask_regs,
9ae3a8
+            sizeof env->opmask_regs);
9ae3a8
+    memcpy(&xsave->region[XSAVE_ZMM_Hi256], env->zmmh_regs,
9ae3a8
+            sizeof env->zmmh_regs);
9ae3a8
+#ifdef TARGET_X86_64
9ae3a8
+    memcpy(&xsave->region[XSAVE_Hi16_ZMM], env->hi16_zmm_regs,
9ae3a8
+            sizeof env->hi16_zmm_regs);
9ae3a8
+#endif
9ae3a8
     r = kvm_vcpu_ioctl(CPU(cpu), KVM_SET_XSAVE, xsave);
9ae3a8
     return r;
9ae3a8
 }
9ae3a8
@@ -1354,6 +1365,14 @@ static int kvm_get_xsave(X86CPU *cpu)
9ae3a8
             sizeof env->bnd_regs);
9ae3a8
     memcpy(&env->bndcs_regs, &xsave->region[XSAVE_BNDCSR],
9ae3a8
             sizeof(env->bndcs_regs));
9ae3a8
+    memcpy(env->opmask_regs, &xsave->region[XSAVE_OPMASK],
9ae3a8
+            sizeof env->opmask_regs);
9ae3a8
+    memcpy(env->zmmh_regs, &xsave->region[XSAVE_ZMM_Hi256],
9ae3a8
+            sizeof env->zmmh_regs);
9ae3a8
+#ifdef TARGET_X86_64
9ae3a8
+    memcpy(env->hi16_zmm_regs, &xsave->region[XSAVE_Hi16_ZMM],
9ae3a8
+            sizeof env->hi16_zmm_regs);
9ae3a8
+#endif
9ae3a8
     return 0;
9ae3a8
 }
9ae3a8
 
9ae3a8
diff --git a/target-i386/machine.c b/target-i386/machine.c
9ae3a8
index b6be606..2c97002 100644
9ae3a8
--- a/target-i386/machine.c
9ae3a8
+++ b/target-i386/machine.c
9ae3a8
@@ -63,6 +63,44 @@ static const VMStateDescription vmstate_ymmh_reg = {
9ae3a8
 #define VMSTATE_YMMH_REGS_VARS(_field, _state, _n, _v)                         \
9ae3a8
     VMSTATE_STRUCT_ARRAY(_field, _state, _n, _v, vmstate_ymmh_reg, XMMReg)
9ae3a8
 
9ae3a8
+static const VMStateDescription vmstate_zmmh_reg = {
9ae3a8
+    .name = "zmmh_reg",
9ae3a8
+    .version_id = 1,
9ae3a8
+    .minimum_version_id = 1,
9ae3a8
+    .fields = (VMStateField[]) {
9ae3a8
+        VMSTATE_UINT64(YMM_Q(0), YMMReg),
9ae3a8
+        VMSTATE_UINT64(YMM_Q(1), YMMReg),
9ae3a8
+        VMSTATE_UINT64(YMM_Q(2), YMMReg),
9ae3a8
+        VMSTATE_UINT64(YMM_Q(3), YMMReg),
9ae3a8
+        VMSTATE_END_OF_LIST()
9ae3a8
+    }
9ae3a8
+};
9ae3a8
+
9ae3a8
+#define VMSTATE_ZMMH_REGS_VARS(_field, _state, _n)                             \
9ae3a8
+    VMSTATE_STRUCT_ARRAY(_field, _state, _n, 0, vmstate_zmmh_reg, YMMReg)
9ae3a8
+
9ae3a8
+#ifdef TARGET_X86_64
9ae3a8
+static const VMStateDescription vmstate_hi16_zmm_reg = {
9ae3a8
+    .name = "hi16_zmm_reg",
9ae3a8
+    .version_id = 1,
9ae3a8
+    .minimum_version_id = 1,
9ae3a8
+    .fields = (VMStateField[]) {
9ae3a8
+        VMSTATE_UINT64(ZMM_Q(0), ZMMReg),
9ae3a8
+        VMSTATE_UINT64(ZMM_Q(1), ZMMReg),
9ae3a8
+        VMSTATE_UINT64(ZMM_Q(2), ZMMReg),
9ae3a8
+        VMSTATE_UINT64(ZMM_Q(3), ZMMReg),
9ae3a8
+        VMSTATE_UINT64(ZMM_Q(4), ZMMReg),
9ae3a8
+        VMSTATE_UINT64(ZMM_Q(5), ZMMReg),
9ae3a8
+        VMSTATE_UINT64(ZMM_Q(6), ZMMReg),
9ae3a8
+        VMSTATE_UINT64(ZMM_Q(7), ZMMReg),
9ae3a8
+        VMSTATE_END_OF_LIST()
9ae3a8
+    }
9ae3a8
+};
9ae3a8
+
9ae3a8
+#define VMSTATE_Hi16_ZMM_REGS_VARS(_field, _state, _n)                         \
9ae3a8
+    VMSTATE_STRUCT_ARRAY(_field, _state, _n, 0, vmstate_hi16_zmm_reg, ZMMReg)
9ae3a8
+#endif
9ae3a8
+
9ae3a8
 static const VMStateDescription vmstate_bnd_regs = {
9ae3a8
     .name = "bnd_regs",
9ae3a8
     .version_id = 1,
9ae3a8
@@ -620,6 +658,52 @@ static const VMStateDescription vmstate_mpx = {
9ae3a8
     }
9ae3a8
 };
9ae3a8
 
9ae3a8
+static bool avx512_needed(void *opaque)
9ae3a8
+{
9ae3a8
+    X86CPU *cpu = opaque;
9ae3a8
+    CPUX86State *env = &cpu->env;
9ae3a8
+    unsigned int i;
9ae3a8
+
9ae3a8
+    for (i = 0; i < NB_OPMASK_REGS; i++) {
9ae3a8
+        if (env->opmask_regs[i]) {
9ae3a8
+            return true;
9ae3a8
+        }
9ae3a8
+    }
9ae3a8
+
9ae3a8
+    for (i = 0; i < CPU_NB_REGS; i++) {
9ae3a8
+#define ENV_ZMMH(reg, field) (env->zmmh_regs[reg].YMM_Q(field))
9ae3a8
+        if (ENV_ZMMH(i, 0) || ENV_ZMMH(i, 1) ||
9ae3a8
+            ENV_ZMMH(i, 2) || ENV_ZMMH(i, 3)) {
9ae3a8
+            return true;
9ae3a8
+        }
9ae3a8
+#ifdef TARGET_X86_64
9ae3a8
+#define ENV_Hi16_ZMM(reg, field) (env->hi16_zmm_regs[reg].ZMM_Q(field))
9ae3a8
+        if (ENV_Hi16_ZMM(i, 0) || ENV_Hi16_ZMM(i, 1) ||
9ae3a8
+            ENV_Hi16_ZMM(i, 2) || ENV_Hi16_ZMM(i, 3) ||
9ae3a8
+            ENV_Hi16_ZMM(i, 4) || ENV_Hi16_ZMM(i, 5) ||
9ae3a8
+            ENV_Hi16_ZMM(i, 6) || ENV_Hi16_ZMM(i, 7)) {
9ae3a8
+            return true;
9ae3a8
+        }
9ae3a8
+#endif
9ae3a8
+    }
9ae3a8
+
9ae3a8
+    return false;
9ae3a8
+}
9ae3a8
+
9ae3a8
+static const VMStateDescription vmstate_avx512 = {
9ae3a8
+    .name = "cpu/avx512",
9ae3a8
+    .version_id = 1,
9ae3a8
+    .minimum_version_id = 1,
9ae3a8
+    .fields = (VMStateField[]) {
9ae3a8
+        VMSTATE_UINT64_ARRAY(env.opmask_regs, X86CPU, NB_OPMASK_REGS),
9ae3a8
+        VMSTATE_ZMMH_REGS_VARS(env.zmmh_regs, X86CPU, CPU_NB_REGS),
9ae3a8
+#ifdef TARGET_X86_64
9ae3a8
+        VMSTATE_Hi16_ZMM_REGS_VARS(env.hi16_zmm_regs, X86CPU, CPU_NB_REGS),
9ae3a8
+#endif
9ae3a8
+        VMSTATE_END_OF_LIST()
9ae3a8
+    }
9ae3a8
+};
9ae3a8
+
9ae3a8
 const VMStateDescription vmstate_x86_cpu = {
9ae3a8
     .name = "cpu",
9ae3a8
     .version_id = 12,
9ae3a8
@@ -763,6 +847,9 @@ const VMStateDescription vmstate_x86_cpu = {
9ae3a8
         } , {
9ae3a8
             .vmsd = &vmstate_mpx,
9ae3a8
             .needed = mpx_needed,
9ae3a8
+        }, {
9ae3a8
+            .vmsd = &vmstate_avx512,
9ae3a8
+            .needed = avx512_needed,
9ae3a8
         } , {
9ae3a8
             /* empty */
9ae3a8
         }
9ae3a8
-- 
9ae3a8
1.8.3.1
9ae3a8