9ae3a8
From f81cc30fefd469f19b2f4550d4453a8aaff3239a Mon Sep 17 00:00:00 2001
9ae3a8
From: Alex Williamson <alex.williamson@redhat.com>
9ae3a8
Date: Fri, 29 Sep 2017 21:44:49 +0200
9ae3a8
Subject: [PATCH 06/27] hw/vfio/pci: handle reset at VFIODevice
9ae3a8
9ae3a8
RH-Author: Alex Williamson <alex.williamson@redhat.com>
9ae3a8
Message-id: <20170929214449.16765.43500.stgit@gimli.home>
9ae3a8
Patchwork-id: 76764
9ae3a8
O-Subject: [RHEL-7.5 qemu-kvm PATCH 06/16] hw/vfio/pci: handle reset at VFIODevice
9ae3a8
Bugzilla: 1494181
9ae3a8
RH-Acked-by: Paolo Bonzini <pbonzini@redhat.com>
9ae3a8
RH-Acked-by: Auger Eric <eric.auger@redhat.com>
9ae3a8
RH-Acked-by: Miroslav Rezanina <mrezanin@redhat.com>
9ae3a8
9ae3a8
From: Eric Auger <eric.auger@linaro.org>
9ae3a8
9ae3a8
Upstream: b47d8efa9f430c332bf96ce6eede169eb48422ad
9ae3a8
9ae3a8
Since we can potentially have both PCI and platform devices in
9ae3a8
the same VFIO group, this latter now owns a list of VFIODevices.
9ae3a8
A unified reset handler, vfio_reset_handler, is registered, looping
9ae3a8
through this VFIODevice list. 2 specialized operations are introduced
9ae3a8
(vfio_compute_needs_reset and vfio_hot_reset_multi): they allow to
9ae3a8
implement type specific behavior. also reset_works and needs_reset
9ae3a8
VFIOPCIDevice fields are moved into VFIODevice.
9ae3a8
9ae3a8
Signed-off-by: Eric Auger <eric.auger@linaro.org>
9ae3a8
Signed-off-by: Alex Williamson <alex.williamson@redhat.com>
9ae3a8
Signed-off-by: Miroslav Rezanina <mrezanin@redhat.com>
9ae3a8
---
9ae3a8
 hw/misc/vfio.c | 95 +++++++++++++++++++++++++++++++++++++++-------------------
9ae3a8
 1 file changed, 64 insertions(+), 31 deletions(-)
9ae3a8
9ae3a8
diff --git a/hw/misc/vfio.c b/hw/misc/vfio.c
9ae3a8
index cc151e2..3e559ed 100644
9ae3a8
--- a/hw/misc/vfio.c
9ae3a8
+++ b/hw/misc/vfio.c
9ae3a8
@@ -178,13 +178,24 @@ typedef struct VFIOMSIXInfo {
9ae3a8
     void *mmap;
9ae3a8
 } VFIOMSIXInfo;
9ae3a8
 
9ae3a8
+typedef struct VFIODeviceOps VFIODeviceOps;
9ae3a8
+
9ae3a8
 typedef struct VFIODevice {
9ae3a8
+    QLIST_ENTRY(VFIODevice) next;
9ae3a8
     struct VFIOGroup *group;
9ae3a8
     char *name;
9ae3a8
     int fd;
9ae3a8
     int type;
9ae3a8
+    bool reset_works;
9ae3a8
+    bool needs_reset;
9ae3a8
+    VFIODeviceOps *ops;
9ae3a8
 } VFIODevice;
9ae3a8
 
9ae3a8
+struct VFIODeviceOps {
9ae3a8
+    void (*vfio_compute_needs_reset)(VFIODevice *vdev);
9ae3a8
+    int (*vfio_hot_reset_multi)(VFIODevice *vdev);
9ae3a8
+};
9ae3a8
+
9ae3a8
 typedef struct VFIOPCIDevice {
9ae3a8
     PCIDevice pdev;
9ae3a8
     VFIODevice vbasedev;
9ae3a8
@@ -203,7 +214,6 @@ typedef struct VFIOPCIDevice {
9ae3a8
     VFIOBAR bars[PCI_NUM_REGIONS - 1]; /* No ROM */
9ae3a8
     VFIOVGA vga; /* 0xa0000, 0x3b0, 0x3c0 */
9ae3a8
     PCIHostDeviceAddress host;
9ae3a8
-    QLIST_ENTRY(VFIOPCIDevice) next;
9ae3a8
     EventNotifier err_notifier;
9ae3a8
     EventNotifier req_notifier;
9ae3a8
     uint32_t features;
9ae3a8
@@ -213,13 +223,11 @@ typedef struct VFIOPCIDevice {
9ae3a8
 #define VFIO_FEATURE_ENABLE_REQ (1 << VFIO_FEATURE_ENABLE_REQ_BIT)
9ae3a8
     int32_t bootindex;
9ae3a8
     uint8_t pm_cap;
9ae3a8
-    bool reset_works;
9ae3a8
     bool has_vga;
9ae3a8
     bool pci_aer;
9ae3a8
     bool req_enabled;
9ae3a8
     bool has_flr;
9ae3a8
     bool has_pm_reset;
9ae3a8
-    bool needs_reset;
9ae3a8
     bool rom_read_failed;
9ae3a8
 } VFIOPCIDevice;
9ae3a8
 
9ae3a8
@@ -227,7 +235,7 @@ typedef struct VFIOGroup {
9ae3a8
     int fd;
9ae3a8
     int groupid;
9ae3a8
     VFIOContainer *container;
9ae3a8
-    QLIST_HEAD(, VFIOPCIDevice) device_list;
9ae3a8
+    QLIST_HEAD(, VFIODevice) device_list;
9ae3a8
     QLIST_ENTRY(VFIOGroup) next;
9ae3a8
     QLIST_ENTRY(VFIOGroup) container_next;
9ae3a8
 } VFIOGroup;
9ae3a8
@@ -3064,7 +3072,7 @@ static int vfio_pci_hot_reset(VFIOPCIDevice *vdev, bool single)
9ae3a8
             single ? "one" : "multi");
9ae3a8
 
9ae3a8
     vfio_pci_pre_reset(vdev);
9ae3a8
-    vdev->needs_reset = false;
9ae3a8
+    vdev->vbasedev.needs_reset = false;
9ae3a8
 
9ae3a8
     info = g_malloc0(sizeof(*info));
9ae3a8
     info->argsz = sizeof(*info);
9ae3a8
@@ -3100,6 +3108,7 @@ static int vfio_pci_hot_reset(VFIOPCIDevice *vdev, bool single)
9ae3a8
     for (i = 0; i < info->count; i++) {
9ae3a8
         PCIHostDeviceAddress host;
9ae3a8
         VFIOPCIDevice *tmp;
9ae3a8
+        VFIODevice *vbasedev_iter;
9ae3a8
 
9ae3a8
         host.domain = devices[i].segment;
9ae3a8
         host.bus = devices[i].bus;
9ae3a8
@@ -3131,7 +3140,11 @@ static int vfio_pci_hot_reset(VFIOPCIDevice *vdev, bool single)
9ae3a8
         }
9ae3a8
 
9ae3a8
         /* Prep dependent devices for reset and clear our marker. */
9ae3a8
-        QLIST_FOREACH(tmp, &group->device_list, next) {
9ae3a8
+        QLIST_FOREACH(vbasedev_iter, &group->device_list, next) {
9ae3a8
+            if (vbasedev_iter->type != VFIO_DEVICE_TYPE_PCI) {
9ae3a8
+                continue;
9ae3a8
+            }
9ae3a8
+            tmp = container_of(vbasedev_iter, VFIOPCIDevice, vbasedev);
9ae3a8
             if (vfio_pci_host_match(&host, &tmp->host)) {
9ae3a8
                 if (single) {
9ae3a8
                     DPRINTF("vfio: found another in-use device "
9ae3a8
@@ -3141,7 +3154,7 @@ static int vfio_pci_hot_reset(VFIOPCIDevice *vdev, bool single)
9ae3a8
                     goto out_single;
9ae3a8
                 }
9ae3a8
                 vfio_pci_pre_reset(tmp);
9ae3a8
-                tmp->needs_reset = false;
9ae3a8
+                tmp->vbasedev.needs_reset = false;
9ae3a8
                 multi = true;
9ae3a8
                 break;
9ae3a8
             }
9ae3a8
@@ -3192,6 +3205,7 @@ out:
9ae3a8
     for (i = 0; i < info->count; i++) {
9ae3a8
         PCIHostDeviceAddress host;
9ae3a8
         VFIOPCIDevice *tmp;
9ae3a8
+        VFIODevice *vbasedev_iter;
9ae3a8
 
9ae3a8
         host.domain = devices[i].segment;
9ae3a8
         host.bus = devices[i].bus;
9ae3a8
@@ -3212,7 +3226,11 @@ out:
9ae3a8
             break;
9ae3a8
         }
9ae3a8
 
9ae3a8
-        QLIST_FOREACH(tmp, &group->device_list, next) {
9ae3a8
+        QLIST_FOREACH(vbasedev_iter, &group->device_list, next) {
9ae3a8
+            if (vbasedev_iter->type != VFIO_DEVICE_TYPE_PCI) {
9ae3a8
+                continue;
9ae3a8
+            }
9ae3a8
+            tmp = container_of(vbasedev_iter, VFIOPCIDevice, vbasedev);
9ae3a8
             if (vfio_pci_host_match(&host, &tmp->host)) {
9ae3a8
                 vfio_pci_post_reset(tmp);
9ae3a8
                 break;
9ae3a8
@@ -3246,28 +3264,40 @@ static int vfio_pci_hot_reset_one(VFIOPCIDevice *vdev)
9ae3a8
     return vfio_pci_hot_reset(vdev, true);
9ae3a8
 }
9ae3a8
 
9ae3a8
-static int vfio_pci_hot_reset_multi(VFIOPCIDevice *vdev)
9ae3a8
+static int vfio_pci_hot_reset_multi(VFIODevice *vbasedev)
9ae3a8
 {
9ae3a8
+    VFIOPCIDevice *vdev = container_of(vbasedev, VFIOPCIDevice, vbasedev);
9ae3a8
     return vfio_pci_hot_reset(vdev, false);
9ae3a8
 }
9ae3a8
 
9ae3a8
-static void vfio_pci_reset_handler(void *opaque)
9ae3a8
+static void vfio_pci_compute_needs_reset(VFIODevice *vbasedev)
9ae3a8
+{
9ae3a8
+    VFIOPCIDevice *vdev = container_of(vbasedev, VFIOPCIDevice, vbasedev);
9ae3a8
+    if (!vbasedev->reset_works || (!vdev->has_flr && vdev->has_pm_reset)) {
9ae3a8
+        vbasedev->needs_reset = true;
9ae3a8
+    }
9ae3a8
+}
9ae3a8
+
9ae3a8
+static VFIODeviceOps vfio_pci_ops = {
9ae3a8
+    .vfio_compute_needs_reset = vfio_pci_compute_needs_reset,
9ae3a8
+    .vfio_hot_reset_multi = vfio_pci_hot_reset_multi,
9ae3a8
+};
9ae3a8
+
9ae3a8
+static void vfio_reset_handler(void *opaque)
9ae3a8
 {
9ae3a8
     VFIOGroup *group;
9ae3a8
-    VFIOPCIDevice *vdev;
9ae3a8
+    VFIODevice *vbasedev;
9ae3a8
 
9ae3a8
     QLIST_FOREACH(group, &group_list, next) {
9ae3a8
-        QLIST_FOREACH(vdev, &group->device_list, next) {
9ae3a8
-            if (!vdev->reset_works || (!vdev->has_flr && vdev->has_pm_reset)) {
9ae3a8
-                vdev->needs_reset = true;
9ae3a8
-            }
9ae3a8
+        QLIST_FOREACH(vbasedev, &group->device_list, next) {
9ae3a8
+            vbasedev->ops->vfio_compute_needs_reset(vbasedev);
9ae3a8
         }
9ae3a8
     }
9ae3a8
 
9ae3a8
     QLIST_FOREACH(group, &group_list, next) {
9ae3a8
-        QLIST_FOREACH(vdev, &group->device_list, next) {
9ae3a8
-            if (vdev->needs_reset) {
9ae3a8
-                vfio_pci_hot_reset_multi(vdev);
9ae3a8
+        QLIST_FOREACH(vbasedev, &group->device_list, next) {
9ae3a8
+            if (vbasedev->needs_reset) {
9ae3a8
+                vbasedev->ops->vfio_hot_reset_multi(vbasedev);
9ae3a8
             }
9ae3a8
         }
9ae3a8
     }
9ae3a8
@@ -3486,7 +3516,7 @@ static VFIOGroup *vfio_get_group(int groupid)
9ae3a8
     }
9ae3a8
 
9ae3a8
     if (QLIST_EMPTY(&group_list)) {
9ae3a8
-        qemu_register_reset(vfio_pci_reset_handler, NULL);
9ae3a8
+        qemu_register_reset(vfio_reset_handler, NULL);
9ae3a8
     }
9ae3a8
 
9ae3a8
     QLIST_INSERT_HEAD(&group_list, group, next);
9ae3a8
@@ -3510,7 +3540,7 @@ static void vfio_put_group(VFIOGroup *group)
9ae3a8
     g_free(group);
9ae3a8
 
9ae3a8
     if (QLIST_EMPTY(&group_list)) {
9ae3a8
-        qemu_unregister_reset(vfio_pci_reset_handler, NULL);
9ae3a8
+        qemu_unregister_reset(vfio_reset_handler, NULL);
9ae3a8
     }
9ae3a8
 }
9ae3a8
 
9ae3a8
@@ -3533,7 +3563,7 @@ static int vfio_get_device(VFIOGroup *group, const char *name,
9ae3a8
 
9ae3a8
     vdev->vbasedev.fd = ret;
9ae3a8
     vdev->vbasedev.group = group;
9ae3a8
-    QLIST_INSERT_HEAD(&group->device_list, vdev, next);
9ae3a8
+    QLIST_INSERT_HEAD(&group->device_list, &vdev->vbasedev, next);
9ae3a8
 
9ae3a8
     /* Sanity check device */
9ae3a8
     ret = ioctl(vdev->vbasedev.fd, VFIO_DEVICE_GET_INFO, &dev_info);
9ae3a8
@@ -3550,7 +3580,7 @@ static int vfio_get_device(VFIOGroup *group, const char *name,
9ae3a8
         goto error;
9ae3a8
     }
9ae3a8
 
9ae3a8
-    vdev->reset_works = !!(dev_info.flags & VFIO_DEVICE_FLAGS_RESET);
9ae3a8
+    vdev->vbasedev.reset_works = !!(dev_info.flags & VFIO_DEVICE_FLAGS_RESET);
9ae3a8
 
9ae3a8
     if (dev_info.num_regions < VFIO_PCI_CONFIG_REGION_INDEX + 1) {
9ae3a8
         error_report("vfio: unexpected number of io regions %u",
9ae3a8
@@ -3663,7 +3693,7 @@ static int vfio_get_device(VFIOGroup *group, const char *name,
9ae3a8
 
9ae3a8
 error:
9ae3a8
     if (ret) {
9ae3a8
-        QLIST_REMOVE(vdev, next);
9ae3a8
+        QLIST_REMOVE(&vdev->vbasedev, next);
9ae3a8
         vdev->vbasedev.group = NULL;
9ae3a8
         close(vdev->vbasedev.fd);
9ae3a8
     }
9ae3a8
@@ -3672,7 +3702,7 @@ error:
9ae3a8
 
9ae3a8
 static void vfio_put_device(VFIOPCIDevice *vdev)
9ae3a8
 {
9ae3a8
-    QLIST_REMOVE(vdev, next);
9ae3a8
+    QLIST_REMOVE(&vdev->vbasedev, next);
9ae3a8
     vdev->vbasedev.group = NULL;
9ae3a8
     DPRINTF("vfio_put_device: close vdev->vbasedev.fd\n");
9ae3a8
     close(vdev->vbasedev.fd);
9ae3a8
@@ -3881,7 +3911,8 @@ static void vfio_unregister_req_notifier(VFIOPCIDevice *vdev)
9ae3a8
 
9ae3a8
 static int vfio_initfn(PCIDevice *pdev)
9ae3a8
 {
9ae3a8
-    VFIOPCIDevice *pvdev, *vdev = DO_UPCAST(VFIOPCIDevice, pdev, pdev);
9ae3a8
+    VFIOPCIDevice *vdev = DO_UPCAST(VFIOPCIDevice, pdev, pdev);
9ae3a8
+    VFIODevice *vbasedev_iter;
9ae3a8
     VFIOGroup *group;
9ae3a8
     char path[PATH_MAX], iommu_group_path[PATH_MAX], *group_name;
9ae3a8
     ssize_t len;
9ae3a8
@@ -3890,7 +3921,7 @@ static int vfio_initfn(PCIDevice *pdev)
9ae3a8
     int ret, i = 0;
9ae3a8
 
9ae3a8
     QLIST_FOREACH(group, &group_list, next) {
9ae3a8
-        QLIST_FOREACH(pvdev, &group->device_list, next) {
9ae3a8
+        QLIST_FOREACH(vbasedev_iter, &group->device_list, next) {
9ae3a8
             i++;
9ae3a8
         }
9ae3a8
     }
9ae3a8
@@ -3911,6 +3942,8 @@ static int vfio_initfn(PCIDevice *pdev)
9ae3a8
         return -errno;
9ae3a8
     }
9ae3a8
 
9ae3a8
+    vdev->vbasedev.ops = &vfio_pci_ops;
9ae3a8
+
9ae3a8
     vdev->vbasedev.type = VFIO_DEVICE_TYPE_PCI;
9ae3a8
     vdev->vbasedev.name = g_strdup_printf("%04x:%02x:%02x.%01x",
9ae3a8
                                           vdev->host.domain, vdev->host.bus,
9ae3a8
@@ -3945,9 +3978,8 @@ static int vfio_initfn(PCIDevice *pdev)
9ae3a8
             vdev->host.domain, vdev->host.bus, vdev->host.slot,
9ae3a8
             vdev->host.function);
9ae3a8
 
9ae3a8
-    QLIST_FOREACH(pvdev, &group->device_list, next) {
9ae3a8
-        if (strcmp(pvdev->vbasedev.name, vdev->vbasedev.name) == 0) {
9ae3a8
-
9ae3a8
+    QLIST_FOREACH(vbasedev_iter, &group->device_list, next) {
9ae3a8
+        if (strcmp(vbasedev_iter->name, vdev->vbasedev.name) == 0) {
9ae3a8
             error_report("vfio: error: device %s is already attached", path);
9ae3a8
             vfio_put_group(group);
9ae3a8
             return -EBUSY;
9ae3a8
@@ -4078,7 +4110,8 @@ static void vfio_pci_reset(DeviceState *dev)
9ae3a8
 
9ae3a8
     vfio_pci_pre_reset(vdev);
9ae3a8
 
9ae3a8
-    if (vdev->reset_works && (vdev->has_flr || !vdev->has_pm_reset) &&
9ae3a8
+    if (vdev->vbasedev.reset_works &&
9ae3a8
+        (vdev->has_flr || !vdev->has_pm_reset) &&
9ae3a8
         !ioctl(vdev->vbasedev.fd, VFIO_DEVICE_RESET)) {
9ae3a8
         DPRINTF("%04x:%02x:%02x.%x FLR/VFIO_DEVICE_RESET\n", vdev->host.domain,
9ae3a8
             vdev->host.bus, vdev->host.slot, vdev->host.function);
9ae3a8
@@ -4091,7 +4124,7 @@ static void vfio_pci_reset(DeviceState *dev)
9ae3a8
     }
9ae3a8
 
9ae3a8
     /* If nothing else works and the device supports PM reset, use it */
9ae3a8
-    if (vdev->reset_works && vdev->has_pm_reset &&
9ae3a8
+    if (vdev->vbasedev.reset_works && vdev->has_pm_reset &&
9ae3a8
         !ioctl(vdev->vbasedev.fd, VFIO_DEVICE_RESET)) {
9ae3a8
         DPRINTF("%04x:%02x:%02x.%x PCI PM Reset\n", vdev->host.domain,
9ae3a8
             vdev->host.bus, vdev->host.slot, vdev->host.function);
9ae3a8
-- 
9ae3a8
1.8.3.1
9ae3a8