76daa3
From d4a8e35b84072816c79e23f5d0a69a2145217004 Mon Sep 17 00:00:00 2001
76daa3
From: "Danilo C. L. de Paula" <ddepaula@redhat.com>
76daa3
Date: Mon, 16 Jan 2017 11:52:49 +0100
76daa3
Subject: Revert "kvm_stat: Remove"
76daa3
76daa3
RH-Author: ddepaula <ddepaula@redhat.com>
76daa3
Message-id: <1479302806-10135-2-git-send-email-ddepaula@redhat.com>
76daa3
Patchwork-id: 72851
76daa3
O-Subject: [RHEV-7.4 qemu-kvm-rhev PATCH v3 1/3] Revert "kvm_stat: Remove"
76daa3
Bugzilla: 1389238
76daa3
RH-Acked-by: John Snow <jsnow@redhat.com>
76daa3
RH-Acked-by: David Hildenbrand <david@redhat.com>
76daa3
RH-Acked-by: Miroslav Rezanina <mrezanin@redhat.com>
76daa3
76daa3
kvm_stat script was removed in QEMU 2.7.0 as it become part of kernel
76daa3
tree. However kvm_stat is shipped in qemu-kvm-tools package in RHEL.
76daa3
76daa3
This reverts commit 60b412dd18362bd4ddc44ba7022aacb6af074b5d.
76daa3
76daa3
Signed-off-by: Danilo Cesar Lemes de Paula <ddepaula@redhat.com>
76daa3
Signed-off-by: Miroslav Rezanina <mrezanin@redhat.com>
76daa3
(cherry picked from commit 98e1a0c3ceec3c7a5e700cced47aef6043224169)
76daa3
76daa3
Merged patches (2.9.0):
76daa3
- 1e69b1b Include kvm_stat in qemu-kvm.spec
76daa3
- 7fcfc94 tools: kvm_stat: Powerpc related fixes
76daa3
- 7f89136 tools: kvm_stat: Introduce pid monitoring
76daa3
- c728a6b tools: kvm_stat: Add comments
76daa3
- 27fb856 Package man page of "kvm_stat" tool
76daa3
76daa3
(cherry picked from commit c660ef06c18219a99468f96701d9d02b9c16baa1)
76daa3
---
76daa3
 Makefile                      |    8 +
76daa3
 redhat/qemu-kvm.spec.template |    7 +-
76daa3
 scripts/kvm/kvm_stat          | 1127 +++++++++++++++++++++++++++++++++++++++++
76daa3
 scripts/kvm/kvm_stat.texi     |   55 ++
76daa3
 4 files changed, 1196 insertions(+), 1 deletion(-)
76daa3
 create mode 100755 scripts/kvm/kvm_stat
76daa3
 create mode 100644 scripts/kvm/kvm_stat.texi
76daa3
76daa3
diff --git a/Makefile b/Makefile
76daa3
index 098c635..ab42582 100644
76daa3
--- a/Makefile
76daa3
+++ b/Makefile
76daa3
@@ -209,6 +209,9 @@ ifdef BUILD_DOCS
76daa3
 DOCS=qemu-doc.html qemu-doc.txt qemu.1 qemu-img.1 qemu-nbd.8 qemu-ga.8
76daa3
 DOCS+=docs/qemu-qmp-ref.html docs/qemu-qmp-ref.txt docs/qemu-qmp-ref.7
76daa3
 DOCS+=docs/qemu-ga-ref.html docs/qemu-ga-ref.txt docs/qemu-ga-ref.7
76daa3
+ifdef CONFIG_LINUX
76daa3
+DOCS+=kvm_stat.1
76daa3
+endif
76daa3
 ifdef CONFIG_VIRTFS
76daa3
 DOCS+=fsdev/virtfs-proxy-helper.1
76daa3
 endif
76daa3
@@ -723,6 +726,11 @@ html: qemu-doc.html docs/qemu-qmp-ref.html docs/qemu-ga-ref.html
76daa3
 info: qemu-doc.info docs/qemu-qmp-ref.info docs/qemu-ga-ref.info
76daa3
 pdf: qemu-doc.pdf docs/qemu-qmp-ref.pdf docs/qemu-ga-ref.pdf
76daa3
 txt: qemu-doc.txt docs/qemu-qmp-ref.txt docs/qemu-ga-ref.txt
76daa3
+kvm_stat.1: scripts/kvm/kvm_stat.texi
76daa3
+	$(call quiet-command, \
76daa3
+	  perl -Ww -- $(SRC_PATH)/scripts/texi2pod.pl $< kvm_stat.pod && \
76daa3
+	  $(POD2MAN) --section=1 --center=" " --release=" " kvm_stat.pod > $@, \
76daa3
+	  "  GEN   $@")
76daa3
 
76daa3
 qemu-doc.html qemu-doc.info qemu-doc.pdf qemu-doc.txt: \
76daa3
 	qemu-img.texi qemu-nbd.texi qemu-options.texi qemu-option-trace.texi \
76daa3
diff --git a/scripts/kvm/kvm_stat b/scripts/kvm/kvm_stat
76daa3
new file mode 100755
76daa3
index 0000000..581278c
76daa3
--- /dev/null
76daa3
+++ b/scripts/kvm/kvm_stat
76daa3
@@ -0,0 +1,1127 @@
76daa3
+#!/usr/bin/python
76daa3
+#
76daa3
+# top-like utility for displaying kvm statistics
76daa3
+#
76daa3
+# Copyright 2006-2008 Qumranet Technologies
76daa3
+# Copyright 2008-2011 Red Hat, Inc.
76daa3
+#
76daa3
+# Authors:
76daa3
+#  Avi Kivity <avi@redhat.com>
76daa3
+#
76daa3
+# This work is licensed under the terms of the GNU GPL, version 2.  See
76daa3
+# the COPYING file in the top-level directory.
76daa3
+"""The kvm_stat module outputs statistics about running KVM VMs
76daa3
+
76daa3
+Three different ways of output formatting are available:
76daa3
+- as a top-like text ui
76daa3
+- in a key -> value format
76daa3
+- in an all keys, all values format
76daa3
+
76daa3
+The data is sampled from the KVM's debugfs entries and its perf events.
76daa3
+"""
76daa3
+
76daa3
+import curses
76daa3
+import sys
76daa3
+import os
76daa3
+import time
76daa3
+import optparse
76daa3
+import ctypes
76daa3
+import fcntl
76daa3
+import resource
76daa3
+import struct
76daa3
+import re
76daa3
+from collections import defaultdict
76daa3
+from time import sleep
76daa3
+
76daa3
+VMX_EXIT_REASONS = {
76daa3
+    'EXCEPTION_NMI':        0,
76daa3
+    'EXTERNAL_INTERRUPT':   1,
76daa3
+    'TRIPLE_FAULT':         2,
76daa3
+    'PENDING_INTERRUPT':    7,
76daa3
+    'NMI_WINDOW':           8,
76daa3
+    'TASK_SWITCH':          9,
76daa3
+    'CPUID':                10,
76daa3
+    'HLT':                  12,
76daa3
+    'INVLPG':               14,
76daa3
+    'RDPMC':                15,
76daa3
+    'RDTSC':                16,
76daa3
+    'VMCALL':               18,
76daa3
+    'VMCLEAR':              19,
76daa3
+    'VMLAUNCH':             20,
76daa3
+    'VMPTRLD':              21,
76daa3
+    'VMPTRST':              22,
76daa3
+    'VMREAD':               23,
76daa3
+    'VMRESUME':             24,
76daa3
+    'VMWRITE':              25,
76daa3
+    'VMOFF':                26,
76daa3
+    'VMON':                 27,
76daa3
+    'CR_ACCESS':            28,
76daa3
+    'DR_ACCESS':            29,
76daa3
+    'IO_INSTRUCTION':       30,
76daa3
+    'MSR_READ':             31,
76daa3
+    'MSR_WRITE':            32,
76daa3
+    'INVALID_STATE':        33,
76daa3
+    'MWAIT_INSTRUCTION':    36,
76daa3
+    'MONITOR_INSTRUCTION':  39,
76daa3
+    'PAUSE_INSTRUCTION':    40,
76daa3
+    'MCE_DURING_VMENTRY':   41,
76daa3
+    'TPR_BELOW_THRESHOLD':  43,
76daa3
+    'APIC_ACCESS':          44,
76daa3
+    'EPT_VIOLATION':        48,
76daa3
+    'EPT_MISCONFIG':        49,
76daa3
+    'WBINVD':               54,
76daa3
+    'XSETBV':               55,
76daa3
+    'APIC_WRITE':           56,
76daa3
+    'INVPCID':              58,
76daa3
+}
76daa3
+
76daa3
+SVM_EXIT_REASONS = {
76daa3
+    'READ_CR0':       0x000,
76daa3
+    'READ_CR3':       0x003,
76daa3
+    'READ_CR4':       0x004,
76daa3
+    'READ_CR8':       0x008,
76daa3
+    'WRITE_CR0':      0x010,
76daa3
+    'WRITE_CR3':      0x013,
76daa3
+    'WRITE_CR4':      0x014,
76daa3
+    'WRITE_CR8':      0x018,
76daa3
+    'READ_DR0':       0x020,
76daa3
+    'READ_DR1':       0x021,
76daa3
+    'READ_DR2':       0x022,
76daa3
+    'READ_DR3':       0x023,
76daa3
+    'READ_DR4':       0x024,
76daa3
+    'READ_DR5':       0x025,
76daa3
+    'READ_DR6':       0x026,
76daa3
+    'READ_DR7':       0x027,
76daa3
+    'WRITE_DR0':      0x030,
76daa3
+    'WRITE_DR1':      0x031,
76daa3
+    'WRITE_DR2':      0x032,
76daa3
+    'WRITE_DR3':      0x033,
76daa3
+    'WRITE_DR4':      0x034,
76daa3
+    'WRITE_DR5':      0x035,
76daa3
+    'WRITE_DR6':      0x036,
76daa3
+    'WRITE_DR7':      0x037,
76daa3
+    'EXCP_BASE':      0x040,
76daa3
+    'INTR':           0x060,
76daa3
+    'NMI':            0x061,
76daa3
+    'SMI':            0x062,
76daa3
+    'INIT':           0x063,
76daa3
+    'VINTR':          0x064,
76daa3
+    'CR0_SEL_WRITE':  0x065,
76daa3
+    'IDTR_READ':      0x066,
76daa3
+    'GDTR_READ':      0x067,
76daa3
+    'LDTR_READ':      0x068,
76daa3
+    'TR_READ':        0x069,
76daa3
+    'IDTR_WRITE':     0x06a,
76daa3
+    'GDTR_WRITE':     0x06b,
76daa3
+    'LDTR_WRITE':     0x06c,
76daa3
+    'TR_WRITE':       0x06d,
76daa3
+    'RDTSC':          0x06e,
76daa3
+    'RDPMC':          0x06f,
76daa3
+    'PUSHF':          0x070,
76daa3
+    'POPF':           0x071,
76daa3
+    'CPUID':          0x072,
76daa3
+    'RSM':            0x073,
76daa3
+    'IRET':           0x074,
76daa3
+    'SWINT':          0x075,
76daa3
+    'INVD':           0x076,
76daa3
+    'PAUSE':          0x077,
76daa3
+    'HLT':            0x078,
76daa3
+    'INVLPG':         0x079,
76daa3
+    'INVLPGA':        0x07a,
76daa3
+    'IOIO':           0x07b,
76daa3
+    'MSR':            0x07c,
76daa3
+    'TASK_SWITCH':    0x07d,
76daa3
+    'FERR_FREEZE':    0x07e,
76daa3
+    'SHUTDOWN':       0x07f,
76daa3
+    'VMRUN':          0x080,
76daa3
+    'VMMCALL':        0x081,
76daa3
+    'VMLOAD':         0x082,
76daa3
+    'VMSAVE':         0x083,
76daa3
+    'STGI':           0x084,
76daa3
+    'CLGI':           0x085,
76daa3
+    'SKINIT':         0x086,
76daa3
+    'RDTSCP':         0x087,
76daa3
+    'ICEBP':          0x088,
76daa3
+    'WBINVD':         0x089,
76daa3
+    'MONITOR':        0x08a,
76daa3
+    'MWAIT':          0x08b,
76daa3
+    'MWAIT_COND':     0x08c,
76daa3
+    'XSETBV':         0x08d,
76daa3
+    'NPF':            0x400,
76daa3
+}
76daa3
+
76daa3
+# EC definition of HSR (from arch/arm64/include/asm/kvm_arm.h)
76daa3
+AARCH64_EXIT_REASONS = {
76daa3
+    'UNKNOWN':      0x00,
76daa3
+    'WFI':          0x01,
76daa3
+    'CP15_32':      0x03,
76daa3
+    'CP15_64':      0x04,
76daa3
+    'CP14_MR':      0x05,
76daa3
+    'CP14_LS':      0x06,
76daa3
+    'FP_ASIMD':     0x07,
76daa3
+    'CP10_ID':      0x08,
76daa3
+    'CP14_64':      0x0C,
76daa3
+    'ILL_ISS':      0x0E,
76daa3
+    'SVC32':        0x11,
76daa3
+    'HVC32':        0x12,
76daa3
+    'SMC32':        0x13,
76daa3
+    'SVC64':        0x15,
76daa3
+    'HVC64':        0x16,
76daa3
+    'SMC64':        0x17,
76daa3
+    'SYS64':        0x18,
76daa3
+    'IABT':         0x20,
76daa3
+    'IABT_HYP':     0x21,
76daa3
+    'PC_ALIGN':     0x22,
76daa3
+    'DABT':         0x24,
76daa3
+    'DABT_HYP':     0x25,
76daa3
+    'SP_ALIGN':     0x26,
76daa3
+    'FP_EXC32':     0x28,
76daa3
+    'FP_EXC64':     0x2C,
76daa3
+    'SERROR':       0x2F,
76daa3
+    'BREAKPT':      0x30,
76daa3
+    'BREAKPT_HYP':  0x31,
76daa3
+    'SOFTSTP':      0x32,
76daa3
+    'SOFTSTP_HYP':  0x33,
76daa3
+    'WATCHPT':      0x34,
76daa3
+    'WATCHPT_HYP':  0x35,
76daa3
+    'BKPT32':       0x38,
76daa3
+    'VECTOR32':     0x3A,
76daa3
+    'BRK64':        0x3C,
76daa3
+}
76daa3
+
76daa3
+# From include/uapi/linux/kvm.h, KVM_EXIT_xxx
76daa3
+USERSPACE_EXIT_REASONS = {
76daa3
+    'UNKNOWN':          0,
76daa3
+    'EXCEPTION':        1,
76daa3
+    'IO':               2,
76daa3
+    'HYPERCALL':        3,
76daa3
+    'DEBUG':            4,
76daa3
+    'HLT':              5,
76daa3
+    'MMIO':             6,
76daa3
+    'IRQ_WINDOW_OPEN':  7,
76daa3
+    'SHUTDOWN':         8,
76daa3
+    'FAIL_ENTRY':       9,
76daa3
+    'INTR':             10,
76daa3
+    'SET_TPR':          11,
76daa3
+    'TPR_ACCESS':       12,
76daa3
+    'S390_SIEIC':       13,
76daa3
+    'S390_RESET':       14,
76daa3
+    'DCR':              15,
76daa3
+    'NMI':              16,
76daa3
+    'INTERNAL_ERROR':   17,
76daa3
+    'OSI':              18,
76daa3
+    'PAPR_HCALL':       19,
76daa3
+    'S390_UCONTROL':    20,
76daa3
+    'WATCHDOG':         21,
76daa3
+    'S390_TSCH':        22,
76daa3
+    'EPR':              23,
76daa3
+    'SYSTEM_EVENT':     24,
76daa3
+}
76daa3
+
76daa3
+IOCTL_NUMBERS = {
76daa3
+    'SET_FILTER':  0x40082406,
76daa3
+    'ENABLE':      0x00002400,
76daa3
+    'DISABLE':     0x00002401,
76daa3
+    'RESET':       0x00002403,
76daa3
+}
76daa3
+
76daa3
+class Arch(object):
76daa3
+    """Encapsulates global architecture specific data.
76daa3
+
76daa3
+    Contains the performance event open syscall and ioctl numbers, as
76daa3
+    well as the VM exit reasons for the architecture it runs on.
76daa3
+
76daa3
+    """
76daa3
+    @staticmethod
76daa3
+    def get_arch():
76daa3
+        machine = os.uname()[4]
76daa3
+
76daa3
+        if machine.startswith('ppc'):
76daa3
+            return ArchPPC()
76daa3
+        elif machine.startswith('aarch64'):
76daa3
+            return ArchA64()
76daa3
+        elif machine.startswith('s390'):
76daa3
+            return ArchS390()
76daa3
+        else:
76daa3
+            # X86_64
76daa3
+            for line in open('/proc/cpuinfo'):
76daa3
+                if not line.startswith('flags'):
76daa3
+                    continue
76daa3
+
76daa3
+                flags = line.split()
76daa3
+                if 'vmx' in flags:
76daa3
+                    return ArchX86(VMX_EXIT_REASONS)
76daa3
+                if 'svm' in flags:
76daa3
+                    return ArchX86(SVM_EXIT_REASONS)
76daa3
+                return
76daa3
+
76daa3
+class ArchX86(Arch):
76daa3
+    def __init__(self, exit_reasons):
76daa3
+        self.sc_perf_evt_open = 298
76daa3
+        self.ioctl_numbers = IOCTL_NUMBERS
76daa3
+        self.exit_reasons = exit_reasons
76daa3
+
76daa3
+class ArchPPC(Arch):
76daa3
+    def __init__(self):
76daa3
+        self.sc_perf_evt_open = 319
76daa3
+        self.ioctl_numbers = IOCTL_NUMBERS
76daa3
+        self.ioctl_numbers['ENABLE'] = 0x20002400
76daa3
+        self.ioctl_numbers['DISABLE'] = 0x20002401
76daa3
+        self.ioctl_numbers['RESET'] = 0x20002403
76daa3
+
76daa3
+        # PPC comes in 32 and 64 bit and some generated ioctl
76daa3
+        # numbers depend on the wordsize.
76daa3
+        char_ptr_size = ctypes.sizeof(ctypes.c_char_p)
76daa3
+        self.ioctl_numbers['SET_FILTER'] = 0x80002406 | char_ptr_size << 16
76daa3
+        self.exit_reasons = {}
76daa3
+
76daa3
+class ArchA64(Arch):
76daa3
+    def __init__(self):
76daa3
+        self.sc_perf_evt_open = 241
76daa3
+        self.ioctl_numbers = IOCTL_NUMBERS
76daa3
+        self.exit_reasons = AARCH64_EXIT_REASONS
76daa3
+
76daa3
+class ArchS390(Arch):
76daa3
+    def __init__(self):
76daa3
+        self.sc_perf_evt_open = 331
76daa3
+        self.ioctl_numbers = IOCTL_NUMBERS
76daa3
+        self.exit_reasons = None
76daa3
+
76daa3
+ARCH = Arch.get_arch()
76daa3
+
76daa3
+
76daa3
+def walkdir(path):
76daa3
+    """Returns os.walk() data for specified directory.
76daa3
+
76daa3
+    As it is only a wrapper it returns the same 3-tuple of (dirpath,
76daa3
+    dirnames, filenames).
76daa3
+    """
76daa3
+    return next(os.walk(path))
76daa3
+
76daa3
+
76daa3
+def parse_int_list(list_string):
76daa3
+    """Returns an int list from a string of comma separated integers and
76daa3
+    integer ranges."""
76daa3
+    integers = []
76daa3
+    members = list_string.split(',')
76daa3
+
76daa3
+    for member in members:
76daa3
+        if '-' not in member:
76daa3
+            integers.append(int(member))
76daa3
+        else:
76daa3
+            int_range = member.split('-')
76daa3
+            integers.extend(range(int(int_range[0]),
76daa3
+                                  int(int_range[1]) + 1))
76daa3
+
76daa3
+    return integers
76daa3
+
76daa3
+
76daa3
+def get_online_cpus():
76daa3
+    """Returns a list of cpu id integers."""
76daa3
+    with open('/sys/devices/system/cpu/online') as cpu_list:
76daa3
+        cpu_string = cpu_list.readline()
76daa3
+        return parse_int_list(cpu_string)
76daa3
+
76daa3
+
76daa3
+def get_filters():
76daa3
+    """Returns a dict of trace events, their filter ids and
76daa3
+    the values that can be filtered.
76daa3
+
76daa3
+    Trace events can be filtered for special values by setting a
76daa3
+    filter string via an ioctl. The string normally has the format
76daa3
+    identifier==value. For each filter a new event will be created, to
76daa3
+    be able to distinguish the events.
76daa3
+
76daa3
+    """
76daa3
+    filters = {}
76daa3
+    filters['kvm_userspace_exit'] = ('reason', USERSPACE_EXIT_REASONS)
76daa3
+    if ARCH.exit_reasons:
76daa3
+        filters['kvm_exit'] = ('exit_reason', ARCH.exit_reasons)
76daa3
+    return filters
76daa3
+
76daa3
+libc = ctypes.CDLL('libc.so.6', use_errno=True)
76daa3
+syscall = libc.syscall
76daa3
+
76daa3
+class perf_event_attr(ctypes.Structure):
76daa3
+    """Struct that holds the necessary data to set up a trace event.
76daa3
+
76daa3
+    For an extensive explanation see perf_event_open(2) and
76daa3
+    include/uapi/linux/perf_event.h, struct perf_event_attr
76daa3
+
76daa3
+    All fields that are not initialized in the constructor are 0.
76daa3
+
76daa3
+    """
76daa3
+    _fields_ = [('type', ctypes.c_uint32),
76daa3
+                ('size', ctypes.c_uint32),
76daa3
+                ('config', ctypes.c_uint64),
76daa3
+                ('sample_freq', ctypes.c_uint64),
76daa3
+                ('sample_type', ctypes.c_uint64),
76daa3
+                ('read_format', ctypes.c_uint64),
76daa3
+                ('flags', ctypes.c_uint64),
76daa3
+                ('wakeup_events', ctypes.c_uint32),
76daa3
+                ('bp_type', ctypes.c_uint32),
76daa3
+                ('bp_addr', ctypes.c_uint64),
76daa3
+                ('bp_len', ctypes.c_uint64),
76daa3
+                ]
76daa3
+
76daa3
+    def __init__(self):
76daa3
+        super(self.__class__, self).__init__()
76daa3
+        self.type = PERF_TYPE_TRACEPOINT
76daa3
+        self.size = ctypes.sizeof(self)
76daa3
+        self.read_format = PERF_FORMAT_GROUP
76daa3
+
76daa3
+def perf_event_open(attr, pid, cpu, group_fd, flags):
76daa3
+    """Wrapper for the sys_perf_evt_open() syscall.
76daa3
+
76daa3
+    Used to set up performance events, returns a file descriptor or -1
76daa3
+    on error.
76daa3
+
76daa3
+    Attributes are:
76daa3
+    - syscall number
76daa3
+    - struct perf_event_attr *
76daa3
+    - pid or -1 to monitor all pids
76daa3
+    - cpu number or -1 to monitor all cpus
76daa3
+    - The file descriptor of the group leader or -1 to create a group.
76daa3
+    - flags
76daa3
+
76daa3
+    """
76daa3
+    return syscall(ARCH.sc_perf_evt_open, ctypes.pointer(attr),
76daa3
+                   ctypes.c_int(pid), ctypes.c_int(cpu),
76daa3
+                   ctypes.c_int(group_fd), ctypes.c_long(flags))
76daa3
+
76daa3
+PERF_TYPE_TRACEPOINT = 2
76daa3
+PERF_FORMAT_GROUP = 1 << 3
76daa3
+
76daa3
+PATH_DEBUGFS_TRACING = '/sys/kernel/debug/tracing'
76daa3
+PATH_DEBUGFS_KVM = '/sys/kernel/debug/kvm'
76daa3
+
76daa3
+class Group(object):
76daa3
+    """Represents a perf event group."""
76daa3
+
76daa3
+    def __init__(self):
76daa3
+        self.events = []
76daa3
+
76daa3
+    def add_event(self, event):
76daa3
+        self.events.append(event)
76daa3
+
76daa3
+    def read(self):
76daa3
+        """Returns a dict with 'event name: value' for all events in the
76daa3
+        group.
76daa3
+
76daa3
+        Values are read by reading from the file descriptor of the
76daa3
+        event that is the group leader. See perf_event_open(2) for
76daa3
+        details.
76daa3
+
76daa3
+        Read format for the used event configuration is:
76daa3
+        struct read_format {
76daa3
+            u64 nr; /* The number of events */
76daa3
+            struct {
76daa3
+                u64 value; /* The value of the event */
76daa3
+            } values[nr];
76daa3
+        };
76daa3
+
76daa3
+        """
76daa3
+        length = 8 * (1 + len(self.events))
76daa3
+        read_format = 'xxxxxxxx' + 'Q' * len(self.events)
76daa3
+        return dict(zip([event.name for event in self.events],
76daa3
+                        struct.unpack(read_format,
76daa3
+                                      os.read(self.events[0].fd, length))))
76daa3
+
76daa3
+class Event(object):
76daa3
+    """Represents a performance event and manages its life cycle."""
76daa3
+    def __init__(self, name, group, trace_cpu, trace_pid, trace_point,
76daa3
+                 trace_filter, trace_set='kvm'):
76daa3
+        self.name = name
76daa3
+        self.fd = None
76daa3
+        self.setup_event(group, trace_cpu, trace_pid, trace_point,
76daa3
+                         trace_filter, trace_set)
76daa3
+
76daa3
+    def __del__(self):
76daa3
+        """Closes the event's file descriptor.
76daa3
+
76daa3
+        As no python file object was created for the file descriptor,
76daa3
+        python will not reference count the descriptor and will not
76daa3
+        close it itself automatically, so we do it.
76daa3
+
76daa3
+        """
76daa3
+        if self.fd:
76daa3
+            os.close(self.fd)
76daa3
+
76daa3
+    def setup_event_attribute(self, trace_set, trace_point):
76daa3
+        """Returns an initialized ctype perf_event_attr struct."""
76daa3
+
76daa3
+        id_path = os.path.join(PATH_DEBUGFS_TRACING, 'events', trace_set,
76daa3
+                               trace_point, 'id')
76daa3
+
76daa3
+        event_attr = perf_event_attr()
76daa3
+        event_attr.config = int(open(id_path).read())
76daa3
+        return event_attr
76daa3
+
76daa3
+    def setup_event(self, group, trace_cpu, trace_pid, trace_point,
76daa3
+                    trace_filter, trace_set):
76daa3
+        """Sets up the perf event in Linux.
76daa3
+
76daa3
+        Issues the syscall to register the event in the kernel and
76daa3
+        then sets the optional filter.
76daa3
+
76daa3
+        """
76daa3
+
76daa3
+        event_attr = self.setup_event_attribute(trace_set, trace_point)
76daa3
+
76daa3
+        # First event will be group leader.
76daa3
+        group_leader = -1
76daa3
+
76daa3
+        # All others have to pass the leader's descriptor instead.
76daa3
+        if group.events:
76daa3
+            group_leader = group.events[0].fd
76daa3
+
76daa3
+        fd = perf_event_open(event_attr, trace_pid,
76daa3
+                             trace_cpu, group_leader, 0)
76daa3
+        if fd == -1:
76daa3
+            err = ctypes.get_errno()
76daa3
+            raise OSError(err, os.strerror(err),
76daa3
+                          'while calling sys_perf_event_open().')
76daa3
+
76daa3
+        if trace_filter:
76daa3
+            fcntl.ioctl(fd, ARCH.ioctl_numbers['SET_FILTER'],
76daa3
+                        trace_filter)
76daa3
+
76daa3
+        self.fd = fd
76daa3
+
76daa3
+    def enable(self):
76daa3
+        """Enables the trace event in the kernel.
76daa3
+
76daa3
+        Enabling the group leader makes reading counters from it and the
76daa3
+        events under it possible.
76daa3
+
76daa3
+        """
76daa3
+        fcntl.ioctl(self.fd, ARCH.ioctl_numbers['ENABLE'], 0)
76daa3
+
76daa3
+    def disable(self):
76daa3
+        """Disables the trace event in the kernel.
76daa3
+
76daa3
+        Disabling the group leader makes reading all counters under it
76daa3
+        impossible.
76daa3
+
76daa3
+        """
76daa3
+        fcntl.ioctl(self.fd, ARCH.ioctl_numbers['DISABLE'], 0)
76daa3
+
76daa3
+    def reset(self):
76daa3
+        """Resets the count of the trace event in the kernel."""
76daa3
+        fcntl.ioctl(self.fd, ARCH.ioctl_numbers['RESET'], 0)
76daa3
+
76daa3
+class TracepointProvider(object):
76daa3
+    """Data provider for the stats class.
76daa3
+
76daa3
+    Manages the events/groups from which it acquires its data.
76daa3
+
76daa3
+    """
76daa3
+    def __init__(self):
76daa3
+        self.group_leaders = []
76daa3
+        self.filters = get_filters()
76daa3
+        self._fields = self.get_available_fields()
76daa3
+        self._pid = 0
76daa3
+
76daa3
+    def get_available_fields(self):
76daa3
+        """Returns a list of available event's of format 'event name(filter
76daa3
+        name)'.
76daa3
+
76daa3
+        All available events have directories under
76daa3
+        /sys/kernel/debug/tracing/events/ which export information
76daa3
+        about the specific event. Therefore, listing the dirs gives us
76daa3
+        a list of all available events.
76daa3
+
76daa3
+        Some events like the vm exit reasons can be filtered for
76daa3
+        specific values. To take account for that, the routine below
76daa3
+        creates special fields with the following format:
76daa3
+        event name(filter name)
76daa3
+
76daa3
+        """
76daa3
+        path = os.path.join(PATH_DEBUGFS_TRACING, 'events', 'kvm')
76daa3
+        fields = walkdir(path)[1]
76daa3
+        extra = []
76daa3
+        for field in fields:
76daa3
+            if field in self.filters:
76daa3
+                filter_name_, filter_dicts = self.filters[field]
76daa3
+                for name in filter_dicts:
76daa3
+                    extra.append(field + '(' + name + ')')
76daa3
+        fields += extra
76daa3
+        return fields
76daa3
+
76daa3
+    def setup_traces(self):
76daa3
+        """Creates all event and group objects needed to be able to retrieve
76daa3
+        data."""
76daa3
+        if self._pid > 0:
76daa3
+            # Fetch list of all threads of the monitored pid, as qemu
76daa3
+            # starts a thread for each vcpu.
76daa3
+            path = os.path.join('/proc', str(self._pid), 'task')
76daa3
+            groupids = walkdir(path)[1]
76daa3
+        else:
76daa3
+            groupids = get_online_cpus()
76daa3
+
76daa3
+        # The constant is needed as a buffer for python libs, std
76daa3
+        # streams and other files that the script opens.
76daa3
+        newlim = len(groupids) * len(self._fields) + 50
76daa3
+        try:
76daa3
+            softlim_, hardlim = resource.getrlimit(resource.RLIMIT_NOFILE)
76daa3
+
76daa3
+            if hardlim < newlim:
76daa3
+                # Now we need CAP_SYS_RESOURCE, to increase the hard limit.
76daa3
+                resource.setrlimit(resource.RLIMIT_NOFILE, (newlim, newlim))
76daa3
+            else:
76daa3
+                # Raising the soft limit is sufficient.
76daa3
+                resource.setrlimit(resource.RLIMIT_NOFILE, (newlim, hardlim))
76daa3
+
76daa3
+        except ValueError:
76daa3
+            sys.exit("NOFILE rlimit could not be raised to {0}".format(newlim))
76daa3
+
76daa3
+        for groupid in groupids:
76daa3
+            group = Group()
76daa3
+            for name in self._fields:
76daa3
+                tracepoint = name
76daa3
+                tracefilter = None
76daa3
+                match = re.match(r'(.*)\((.*)\)', name)
76daa3
+                if match:
76daa3
+                    tracepoint, sub = match.groups()
76daa3
+                    tracefilter = ('%s==%d\0' %
76daa3
+                                   (self.filters[tracepoint][0],
76daa3
+                                    self.filters[tracepoint][1][sub]))
76daa3
+
76daa3
+                # From perf_event_open(2):
76daa3
+                # pid > 0 and cpu == -1
76daa3
+                # This measures the specified process/thread on any CPU.
76daa3
+                #
76daa3
+                # pid == -1 and cpu >= 0
76daa3
+                # This measures all processes/threads on the specified CPU.
76daa3
+                trace_cpu = groupid if self._pid == 0 else -1
76daa3
+                trace_pid = int(groupid) if self._pid != 0 else -1
76daa3
+
76daa3
+                group.add_event(Event(name=name,
76daa3
+                                      group=group,
76daa3
+                                      trace_cpu=trace_cpu,
76daa3
+                                      trace_pid=trace_pid,
76daa3
+                                      trace_point=tracepoint,
76daa3
+                                      trace_filter=tracefilter))
76daa3
+
76daa3
+            self.group_leaders.append(group)
76daa3
+
76daa3
+    def available_fields(self):
76daa3
+        return self.get_available_fields()
76daa3
+
76daa3
+    @property
76daa3
+    def fields(self):
76daa3
+        return self._fields
76daa3
+
76daa3
+    @fields.setter
76daa3
+    def fields(self, fields):
76daa3
+        """Enables/disables the (un)wanted events"""
76daa3
+        self._fields = fields
76daa3
+        for group in self.group_leaders:
76daa3
+            for index, event in enumerate(group.events):
76daa3
+                if event.name in fields:
76daa3
+                    event.reset()
76daa3
+                    event.enable()
76daa3
+                else:
76daa3
+                    # Do not disable the group leader.
76daa3
+                    # It would disable all of its events.
76daa3
+                    if index != 0:
76daa3
+                        event.disable()
76daa3
+
76daa3
+    @property
76daa3
+    def pid(self):
76daa3
+        return self._pid
76daa3
+
76daa3
+    @pid.setter
76daa3
+    def pid(self, pid):
76daa3
+        """Changes the monitored pid by setting new traces."""
76daa3
+        self._pid = pid
76daa3
+        # The garbage collector will get rid of all Event/Group
76daa3
+        # objects and open files after removing the references.
76daa3
+        self.group_leaders = []
76daa3
+        self.setup_traces()
76daa3
+        self.fields = self._fields
76daa3
+
76daa3
+    def read(self):
76daa3
+        """Returns 'event name: current value' for all enabled events."""
76daa3
+        ret = defaultdict(int)
76daa3
+        for group in self.group_leaders:
76daa3
+            for name, val in group.read().iteritems():
76daa3
+                if name in self._fields:
76daa3
+                    ret[name] += val
76daa3
+        return ret
76daa3
+
76daa3
+class DebugfsProvider(object):
76daa3
+    """Provides data from the files that KVM creates in the kvm debugfs
76daa3
+    folder."""
76daa3
+    def __init__(self):
76daa3
+        self._fields = self.get_available_fields()
76daa3
+        self._pid = 0
76daa3
+        self.do_read = True
76daa3
+
76daa3
+    def get_available_fields(self):
76daa3
+        """"Returns a list of available fields.
76daa3
+
76daa3
+        The fields are all available KVM debugfs files
76daa3
+
76daa3
+        """
76daa3
+        return walkdir(PATH_DEBUGFS_KVM)[2]
76daa3
+
76daa3
+    @property
76daa3
+    def fields(self):
76daa3
+        return self._fields
76daa3
+
76daa3
+    @fields.setter
76daa3
+    def fields(self, fields):
76daa3
+        self._fields = fields
76daa3
+
76daa3
+    @property
76daa3
+    def pid(self):
76daa3
+        return self._pid
76daa3
+
76daa3
+    @pid.setter
76daa3
+    def pid(self, pid):
76daa3
+        if pid != 0:
76daa3
+            self._pid = pid
76daa3
+
76daa3
+            vms = walkdir(PATH_DEBUGFS_KVM)[1]
76daa3
+            if len(vms) == 0:
76daa3
+                self.do_read = False
76daa3
+
76daa3
+            self.paths = filter(lambda x: "{}-".format(pid) in x, vms)
76daa3
+
76daa3
+        else:
76daa3
+            self.paths = ['']
76daa3
+            self.do_read = True
76daa3
+
76daa3
+    def read(self):
76daa3
+        """Returns a dict with format:'file name / field -> current value'."""
76daa3
+        results = {}
76daa3
+
76daa3
+        # If no debugfs filtering support is available, then don't read.
76daa3
+        if not self.do_read:
76daa3
+            return results
76daa3
+
76daa3
+        for path in self.paths:
76daa3
+            for field in self._fields:
76daa3
+                results[field] = results.get(field, 0) \
76daa3
+                                 + self.read_field(field, path)
76daa3
+
76daa3
+        return results
76daa3
+
76daa3
+    def read_field(self, field, path):
76daa3
+        """Returns the value of a single field from a specific VM."""
76daa3
+        try:
76daa3
+            return int(open(os.path.join(PATH_DEBUGFS_KVM,
76daa3
+                                         path,
76daa3
+                                         field))
76daa3
+                       .read())
76daa3
+        except IOError:
76daa3
+            return 0
76daa3
+
76daa3
+class Stats(object):
76daa3
+    """Manages the data providers and the data they provide.
76daa3
+
76daa3
+    It is used to set filters on the provider's data and collect all
76daa3
+    provider data.
76daa3
+
76daa3
+    """
76daa3
+    def __init__(self, providers, pid, fields=None):
76daa3
+        self.providers = providers
76daa3
+        self._pid_filter = pid
76daa3
+        self._fields_filter = fields
76daa3
+        self.values = {}
76daa3
+        self.update_provider_pid()
76daa3
+        self.update_provider_filters()
76daa3
+
76daa3
+    def update_provider_filters(self):
76daa3
+        """Propagates fields filters to providers."""
76daa3
+        def wanted(key):
76daa3
+            if not self._fields_filter:
76daa3
+                return True
76daa3
+            return re.match(self._fields_filter, key) is not None
76daa3
+
76daa3
+        # As we reset the counters when updating the fields we can
76daa3
+        # also clear the cache of old values.
76daa3
+        self.values = {}
76daa3
+        for provider in self.providers:
76daa3
+            provider_fields = [key for key in provider.get_available_fields()
76daa3
+                               if wanted(key)]
76daa3
+            provider.fields = provider_fields
76daa3
+
76daa3
+    def update_provider_pid(self):
76daa3
+        """Propagates pid filters to providers."""
76daa3
+        for provider in self.providers:
76daa3
+            provider.pid = self._pid_filter
76daa3
+
76daa3
+    @property
76daa3
+    def fields_filter(self):
76daa3
+        return self._fields_filter
76daa3
+
76daa3
+    @fields_filter.setter
76daa3
+    def fields_filter(self, fields_filter):
76daa3
+        self._fields_filter = fields_filter
76daa3
+        self.update_provider_filters()
76daa3
+
76daa3
+    @property
76daa3
+    def pid_filter(self):
76daa3
+        return self._pid_filter
76daa3
+
76daa3
+    @pid_filter.setter
76daa3
+    def pid_filter(self, pid):
76daa3
+        self._pid_filter = pid
76daa3
+        self.values = {}
76daa3
+        self.update_provider_pid()
76daa3
+
76daa3
+    def get(self):
76daa3
+        """Returns a dict with field -> (value, delta to last value) of all
76daa3
+        provider data."""
76daa3
+        for provider in self.providers:
76daa3
+            new = provider.read()
76daa3
+            for key in provider.fields:
76daa3
+                oldval = self.values.get(key, (0, 0))
76daa3
+                newval = new.get(key, 0)
76daa3
+                newdelta = None
76daa3
+                if oldval is not None:
76daa3
+                    newdelta = newval - oldval[0]
76daa3
+                self.values[key] = (newval, newdelta)
76daa3
+        return self.values
76daa3
+
76daa3
+LABEL_WIDTH = 40
76daa3
+NUMBER_WIDTH = 10
76daa3
+
76daa3
+class Tui(object):
76daa3
+    """Instruments curses to draw a nice text ui."""
76daa3
+    def __init__(self, stats):
76daa3
+        self.stats = stats
76daa3
+        self.screen = None
76daa3
+        self.drilldown = False
76daa3
+        self.update_drilldown()
76daa3
+
76daa3
+    def __enter__(self):
76daa3
+        """Initialises curses for later use.  Based on curses.wrapper
76daa3
+           implementation from the Python standard library."""
76daa3
+        self.screen = curses.initscr()
76daa3
+        curses.noecho()
76daa3
+        curses.cbreak()
76daa3
+
76daa3
+        # The try/catch works around a minor bit of
76daa3
+        # over-conscientiousness in the curses module, the error
76daa3
+        # return from C start_color() is ignorable.
76daa3
+        try:
76daa3
+            curses.start_color()
76daa3
+        except:
76daa3
+            pass
76daa3
+
76daa3
+        curses.use_default_colors()
76daa3
+        return self
76daa3
+
76daa3
+    def __exit__(self, *exception):
76daa3
+        """Resets the terminal to its normal state.  Based on curses.wrappre
76daa3
+           implementation from the Python standard library."""
76daa3
+        if self.screen:
76daa3
+            self.screen.keypad(0)
76daa3
+            curses.echo()
76daa3
+            curses.nocbreak()
76daa3
+            curses.endwin()
76daa3
+
76daa3
+    def update_drilldown(self):
76daa3
+        """Sets or removes a filter that only allows fields without braces."""
76daa3
+        if not self.stats.fields_filter:
76daa3
+            self.stats.fields_filter = r'^[^\(]*$'
76daa3
+
76daa3
+        elif self.stats.fields_filter == r'^[^\(]*$':
76daa3
+            self.stats.fields_filter = None
76daa3
+
76daa3
+    def update_pid(self, pid):
76daa3
+        """Propagates pid selection to stats object."""
76daa3
+        self.stats.pid_filter = pid
76daa3
+
76daa3
+    def refresh(self, sleeptime):
76daa3
+        """Refreshes on-screen data."""
76daa3
+        self.screen.erase()
76daa3
+        if self.stats.pid_filter > 0:
76daa3
+            self.screen.addstr(0, 0, 'kvm statistics - pid {0}'
76daa3
+                               .format(self.stats.pid_filter),
76daa3
+                               curses.A_BOLD)
76daa3
+        else:
76daa3
+            self.screen.addstr(0, 0, 'kvm statistics - summary', curses.A_BOLD)
76daa3
+        self.screen.addstr(2, 1, 'Event')
76daa3
+        self.screen.addstr(2, 1 + LABEL_WIDTH + NUMBER_WIDTH -
76daa3
+                           len('Total'), 'Total')
76daa3
+        self.screen.addstr(2, 1 + LABEL_WIDTH + NUMBER_WIDTH + 8 -
76daa3
+                           len('Current'), 'Current')
76daa3
+        row = 3
76daa3
+        stats = self.stats.get()
76daa3
+        def sortkey(x):
76daa3
+            if stats[x][1]:
76daa3
+                return (-stats[x][1], -stats[x][0])
76daa3
+            else:
76daa3
+                return (0, -stats[x][0])
76daa3
+        for key in sorted(stats.keys(), key=sortkey):
76daa3
+
76daa3
+            if row >= self.screen.getmaxyx()[0]:
76daa3
+                break
76daa3
+            values = stats[key]
76daa3
+            if not values[0] and not values[1]:
76daa3
+                break
76daa3
+            col = 1
76daa3
+            self.screen.addstr(row, col, key)
76daa3
+            col += LABEL_WIDTH
76daa3
+            self.screen.addstr(row, col, '%10d' % (values[0],))
76daa3
+            col += NUMBER_WIDTH
76daa3
+            if values[1] is not None:
76daa3
+                self.screen.addstr(row, col, '%8d' % (values[1] / sleeptime,))
76daa3
+            row += 1
76daa3
+        self.screen.refresh()
76daa3
+
76daa3
+    def show_filter_selection(self):
76daa3
+        """Draws filter selection mask.
76daa3
+
76daa3
+        Asks for a valid regex and sets the fields filter accordingly.
76daa3
+
76daa3
+        """
76daa3
+        while True:
76daa3
+            self.screen.erase()
76daa3
+            self.screen.addstr(0, 0,
76daa3
+                               "Show statistics for events matching a regex.",
76daa3
+                               curses.A_BOLD)
76daa3
+            self.screen.addstr(2, 0,
76daa3
+                               "Current regex: {0}"
76daa3
+                               .format(self.stats.fields_filter))
76daa3
+            self.screen.addstr(3, 0, "New regex: ")
76daa3
+            curses.echo()
76daa3
+            regex = self.screen.getstr()
76daa3
+            curses.noecho()
76daa3
+            if len(regex) == 0:
76daa3
+                return
76daa3
+            try:
76daa3
+                re.compile(regex)
76daa3
+                self.stats.fields_filter = regex
76daa3
+                return
76daa3
+            except re.error:
76daa3
+                continue
76daa3
+
76daa3
+    def show_vm_selection(self):
76daa3
+        """Draws PID selection mask.
76daa3
+
76daa3
+        Asks for a pid until a valid pid or 0 has been entered.
76daa3
+
76daa3
+        """
76daa3
+        while True:
76daa3
+            self.screen.erase()
76daa3
+            self.screen.addstr(0, 0,
76daa3
+                               'Show statistics for specific pid.',
76daa3
+                               curses.A_BOLD)
76daa3
+            self.screen.addstr(1, 0,
76daa3
+                               'This might limit the shown data to the trace '
76daa3
+                               'statistics.')
76daa3
+
76daa3
+            curses.echo()
76daa3
+            self.screen.addstr(3, 0, "Pid [0 or pid]: ")
76daa3
+            pid = self.screen.getstr()
76daa3
+            curses.noecho()
76daa3
+
76daa3
+            try:
76daa3
+                pid = int(pid)
76daa3
+
76daa3
+                if pid == 0:
76daa3
+                    self.update_pid(pid)
76daa3
+                    break
76daa3
+                else:
76daa3
+                    if not os.path.isdir(os.path.join('/proc/', str(pid))):
76daa3
+                        continue
76daa3
+                    else:
76daa3
+                        self.update_pid(pid)
76daa3
+                        break
76daa3
+
76daa3
+            except ValueError:
76daa3
+                continue
76daa3
+
76daa3
+    def show_stats(self):
76daa3
+        """Refreshes the screen and processes user input."""
76daa3
+        sleeptime = 0.25
76daa3
+        while True:
76daa3
+            self.refresh(sleeptime)
76daa3
+            curses.halfdelay(int(sleeptime * 10))
76daa3
+            sleeptime = 3
76daa3
+            try:
76daa3
+                char = self.screen.getkey()
76daa3
+                if char == 'x':
76daa3
+                    self.drilldown = not self.drilldown
76daa3
+                    self.update_drilldown()
76daa3
+                if char == 'q':
76daa3
+                    break
76daa3
+                if char == 'f':
76daa3
+                    self.show_filter_selection()
76daa3
+                if char == 'p':
76daa3
+                    self.show_vm_selection()
76daa3
+            except KeyboardInterrupt:
76daa3
+                break
76daa3
+            except curses.error:
76daa3
+                continue
76daa3
+
76daa3
+def batch(stats):
76daa3
+    """Prints statistics in a key, value format."""
76daa3
+    s = stats.get()
76daa3
+    time.sleep(1)
76daa3
+    s = stats.get()
76daa3
+    for key in sorted(s.keys()):
76daa3
+        values = s[key]
76daa3
+        print '%-42s%10d%10d' % (key, values[0], values[1])
76daa3
+
76daa3
+def log(stats):
76daa3
+    """Prints statistics as reiterating key block, multiple value blocks."""
76daa3
+    keys = sorted(stats.get().iterkeys())
76daa3
+    def banner():
76daa3
+        for k in keys:
76daa3
+            print '%s' % k,
76daa3
+        print
76daa3
+    def statline():
76daa3
+        s = stats.get()
76daa3
+        for k in keys:
76daa3
+            print ' %9d' % s[k][1],
76daa3
+        print
76daa3
+    line = 0
76daa3
+    banner_repeat = 20
76daa3
+    while True:
76daa3
+        time.sleep(1)
76daa3
+        if line % banner_repeat == 0:
76daa3
+            banner()
76daa3
+        statline()
76daa3
+        line += 1
76daa3
+
76daa3
+def get_options():
76daa3
+    """Returns processed program arguments."""
76daa3
+    description_text = """
76daa3
+This script displays various statistics about VMs running under KVM.
76daa3
+The statistics are gathered from the KVM debugfs entries and / or the
76daa3
+currently available perf traces.
76daa3
+
76daa3
+The monitoring takes additional cpu cycles and might affect the VM's
76daa3
+performance.
76daa3
+
76daa3
+Requirements:
76daa3
+- Access to:
76daa3
+    /sys/kernel/debug/kvm
76daa3
+    /sys/kernel/debug/trace/events/*
76daa3
+    /proc/pid/task
76daa3
+- /proc/sys/kernel/perf_event_paranoid < 1 if user has no
76daa3
+  CAP_SYS_ADMIN and perf events are used.
76daa3
+- CAP_SYS_RESOURCE if the hard limit is not high enough to allow
76daa3
+  the large number of files that are possibly opened.
76daa3
+"""
76daa3
+
76daa3
+    class PlainHelpFormatter(optparse.IndentedHelpFormatter):
76daa3
+        def format_description(self, description):
76daa3
+            if description:
76daa3
+                return description + "\n"
76daa3
+            else:
76daa3
+                return ""
76daa3
+
76daa3
+    optparser = optparse.OptionParser(description=description_text,
76daa3
+                                      formatter=PlainHelpFormatter())
76daa3
+    optparser.add_option('-1', '--once', '--batch',
76daa3
+                         action='store_true',
76daa3
+                         default=False,
76daa3
+                         dest='once',
76daa3
+                         help='run in batch mode for one second',
76daa3
+                         )
76daa3
+    optparser.add_option('-l', '--log',
76daa3
+                         action='store_true',
76daa3
+                         default=False,
76daa3
+                         dest='log',
76daa3
+                         help='run in logging mode (like vmstat)',
76daa3
+                         )
76daa3
+    optparser.add_option('-t', '--tracepoints',
76daa3
+                         action='store_true',
76daa3
+                         default=False,
76daa3
+                         dest='tracepoints',
76daa3
+                         help='retrieve statistics from tracepoints',
76daa3
+                         )
76daa3
+    optparser.add_option('-d', '--debugfs',
76daa3
+                         action='store_true',
76daa3
+                         default=False,
76daa3
+                         dest='debugfs',
76daa3
+                         help='retrieve statistics from debugfs',
76daa3
+                         )
76daa3
+    optparser.add_option('-f', '--fields',
76daa3
+                         action='store',
76daa3
+                         default=None,
76daa3
+                         dest='fields',
76daa3
+                         help='fields to display (regex)',
76daa3
+                         )
76daa3
+    optparser.add_option('-p', '--pid',
76daa3
+                        action='store',
76daa3
+                        default=0,
76daa3
+                        type=int,
76daa3
+                        dest='pid',
76daa3
+                        help='restrict statistics to pid',
76daa3
+                        )
76daa3
+    (options, _) = optparser.parse_args(sys.argv)
76daa3
+    return options
76daa3
+
76daa3
+def get_providers(options):
76daa3
+    """Returns a list of data providers depending on the passed options."""
76daa3
+    providers = []
76daa3
+
76daa3
+    if options.tracepoints:
76daa3
+        providers.append(TracepointProvider())
76daa3
+    if options.debugfs:
76daa3
+        providers.append(DebugfsProvider())
76daa3
+    if len(providers) == 0:
76daa3
+        providers.append(TracepointProvider())
76daa3
+
76daa3
+    return providers
76daa3
+
76daa3
+def check_access(options):
76daa3
+    """Exits if the current user can't access all needed directories."""
76daa3
+    if not os.path.exists('/sys/kernel/debug'):
76daa3
+        sys.stderr.write('Please enable CONFIG_DEBUG_FS in your kernel.')
76daa3
+        sys.exit(1)
76daa3
+
76daa3
+    if not os.path.exists(PATH_DEBUGFS_KVM):
76daa3
+        sys.stderr.write("Please make sure, that debugfs is mounted and "
76daa3
+                         "readable by the current user:\n"
76daa3
+                         "('mount -t debugfs debugfs /sys/kernel/debug')\n"
76daa3
+                         "Also ensure, that the kvm modules are loaded.\n")
76daa3
+        sys.exit(1)
76daa3
+
76daa3
+    if not os.path.exists(PATH_DEBUGFS_TRACING) and (options.tracepoints
76daa3
+                                                     or not options.debugfs):
76daa3
+        sys.stderr.write("Please enable CONFIG_TRACING in your kernel "
76daa3
+                         "when using the option -t (default).\n"
76daa3
+                         "If it is enabled, make {0} readable by the "
76daa3
+                         "current user.\n"
76daa3
+                         .format(PATH_DEBUGFS_TRACING))
76daa3
+        if options.tracepoints:
76daa3
+            sys.exit(1)
76daa3
+
76daa3
+        sys.stderr.write("Falling back to debugfs statistics!\n")
76daa3
+        options.debugfs = True
76daa3
+        sleep(5)
76daa3
+
76daa3
+    return options
76daa3
+
76daa3
+def main():
76daa3
+    options = get_options()
76daa3
+    options = check_access(options)
76daa3
+
76daa3
+    if (options.pid > 0 and
76daa3
+        not os.path.isdir(os.path.join('/proc/',
76daa3
+                                       str(options.pid)))):
76daa3
+        sys.stderr.write('Did you use a (unsupported) tid instead of a pid?\n')
76daa3
+        sys.exit('Specified pid does not exist.')
76daa3
+
76daa3
+    providers = get_providers(options)
76daa3
+    stats = Stats(providers, options.pid, fields=options.fields)
76daa3
+
76daa3
+    if options.log:
76daa3
+        log(stats)
76daa3
+    elif not options.once:
76daa3
+        with Tui(stats) as tui:
76daa3
+            tui.show_stats()
76daa3
+    else:
76daa3
+        batch(stats)
76daa3
+
76daa3
+if __name__ == "__main__":
76daa3
+    main()
76daa3
diff --git a/scripts/kvm/kvm_stat.texi b/scripts/kvm/kvm_stat.texi
76daa3
new file mode 100644
76daa3
index 0000000..4faf1a6
76daa3
--- /dev/null
76daa3
+++ b/scripts/kvm/kvm_stat.texi
76daa3
@@ -0,0 +1,55 @@
76daa3
+@example
76daa3
+@c man begin SYNOPSIS
76daa3
+usage: kvm_stat [OPTION]...
76daa3
+@c man end
76daa3
+@end example
76daa3
+
76daa3
+@c man begin DESCRIPTION
76daa3
+
76daa3
+kvm_stat prints counts of KVM kernel module trace events.  These events signify
76daa3
+state transitions such as guest mode entry and exit.
76daa3
+
76daa3
+This tool is useful for observing guest behavior from the host perspective.
76daa3
+Often conclusions about performance or buggy behavior can be drawn from the
76daa3
+output.
76daa3
+
76daa3
+The set of KVM kernel module trace events may be specific to the kernel version
76daa3
+or architecture.  It is best to check the KVM kernel module source code for the
76daa3
+meaning of events.
76daa3
+
76daa3
+@c man end
76daa3
+
76daa3
+@c man begin OPTIONS
76daa3
+@table @option
76daa3
+@item -1, --once, --batch
76daa3
+  run in batch mode for one second
76daa3
+@item -l, --log
76daa3
+  run in logging mode (like vmstat)
76daa3
+@item -t, --tracepoints
76daa3
+  retrieve statistics from tracepoints
76daa3
+@item -d, --debugfs
76daa3
+  retrieve statistics from debugfs
76daa3
+@item -p, --pid=@var{pid}
76daa3
+  limit statistics to one virtual machine (pid)
76daa3
+@item -f, --fields=@var{fields}
76daa3
+  fields to display (regex)
76daa3
+@item -h, --help
76daa3
+  show help message
76daa3
+@end table
76daa3
+
76daa3
+@c man end
76daa3
+
76daa3
+@ignore
76daa3
+
76daa3
+@setfilename kvm_stat
76daa3
+@settitle Report KVM kernel module event counters.
76daa3
+
76daa3
+@c man begin AUTHOR
76daa3
+Stefan Hajnoczi <stefanha@redhat.com>
76daa3
+@c man end
76daa3
+
76daa3
+@c man begin SEEALSO
76daa3
+perf(1), trace-cmd(1)
76daa3
+@c man end
76daa3
+
76daa3
+@end ignore
76daa3
-- 
76daa3
1.8.3.1
76daa3