From nobody Wed Oct  8 12:40:45 2025
Received: from mx0a-0031df01.pphosted.com (mx0a-0031df01.pphosted.com
 [205.220.168.131])
	(using TLSv1.2 with cipher ECDHE-RSA-AES256-GCM-SHA384 (256/256 bits))
	(No client certificate requested)
	by smtp.subspace.kernel.org (Postfix) with ESMTPS id ABB54246795
	for <linux-kernel@vger.kernel.org>; Sun, 29 Jun 2025 14:08:15 +0000 (UTC)
Authentication-Results: smtp.subspace.kernel.org;
 arc=none smtp.client-ip=205.220.168.131
ARC-Seal: i=1; a=rsa-sha256; d=subspace.kernel.org; s=arc-20240116;
	t=1751206098; cv=none;
 b=WiOEZZh0cuAjCdHszAcyMUgj7K5VNJJDLivMUZiLN4qN75KsiP8E/f8GknahQWj8F2lQcvOM5zJe4unHX5OfN9Jh4dWleoaJwfjmQjtNVJT63eYYfqXwqdHbPovW9Zv3aYIe9oAey5v0hwt2bKRM7dtcJZiq2mOWru+jItDP+2E=
ARC-Message-Signature: i=1; a=rsa-sha256; d=subspace.kernel.org;
	s=arc-20240116; t=1751206098; c=relaxed/simple;
	bh=A/YMwPxI4drHsEBpMlSI4ZEIOUWk+enu87xKZM4vC9Y=;
	h=From:To:Cc:Subject:Date:Message-ID:In-Reply-To:References:
	 MIME-Version;
 b=RrH/87FdwJWOGkk595zAfu55po0hYlPVy5xksK7c1/+YIFoi9YsgXWQ4PIloNyMiQ+YYyk40+6Tbs5G/KRTQTi5Eiv2p9ea0t9lnbBY+TcgNzt1dgMH6BjYS9RV8Kirl2TAvHm70mMY+an3rJiu+OzPHIsQybn9oT2128HDI7T0=
ARC-Authentication-Results: i=1; smtp.subspace.kernel.org;
 dmarc=pass (p=reject dis=none) header.from=oss.qualcomm.com;
 spf=pass smtp.mailfrom=oss.qualcomm.com;
 dkim=pass (2048-bit key) header.d=qualcomm.com header.i=@qualcomm.com
 header.b=C26AHzPI; arc=none smtp.client-ip=205.220.168.131
Authentication-Results: smtp.subspace.kernel.org;
 dmarc=pass (p=reject dis=none) header.from=oss.qualcomm.com
Authentication-Results: smtp.subspace.kernel.org;
 spf=pass smtp.mailfrom=oss.qualcomm.com
Authentication-Results: smtp.subspace.kernel.org;
	dkim=pass (2048-bit key) header.d=qualcomm.com header.i=@qualcomm.com
 header.b="C26AHzPI"
Received: from pps.filterd (m0279867.ppops.net [127.0.0.1])
	by mx0a-0031df01.pphosted.com (8.18.1.2/8.18.1.2) with ESMTP id
 55TCVoR5022520
	for <linux-kernel@vger.kernel.org>; Sun, 29 Jun 2025 14:08:15 GMT
DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=qualcomm.com; h=
	cc:content-transfer-encoding:date:from:in-reply-to:message-id
	:mime-version:references:subject:to; s=qcppdkim1; bh=H0NxUUerXIP
	OxBBD23fcfhMmUbbhrv7qSetQ/SEeLRg=; b=C26AHzPIHEgxxSsd6oK68P57Jvd
	StXZpmJ6bz9mbDuYvJ2ge74a5WAM3cIuQNGKxvx9BpGasXBPzoHF99NQotpfLDyG
	HG55lCSslnDHAOTDiZ7u/TwZe/UvjbdToRUafDrpuy5Kw8Re6/VYhMWEaIOPhPtP
	+rrtPWAwtvC8vBduD4XfJgfkKrqtbpMdnG31CgybqmFSVp7OjT73Q21cCsbEO6xs
	ScoFFGD3rMtIWmdXz0wYBCyQB41kip7uREs7rvEnMoAhGj/fK/G/6GqHMQ9XHVWS
	I0Q8lhHT0SWLI4TUNGLIrpRrR++koy0JGOh1xEU/u8KeZcPQheBHZ+1OJMw==
Received: from mail-pf1-f200.google.com (mail-pf1-f200.google.com
 [209.85.210.200])
	by mx0a-0031df01.pphosted.com (PPS) with ESMTPS id 47j63k2e3f-1
	(version=TLSv1.2 cipher=ECDHE-RSA-AES128-GCM-SHA256 bits=128 verify=NOT)
	for <linux-kernel@vger.kernel.org>; Sun, 29 Jun 2025 14:08:14 +0000 (GMT)
Received: by mail-pf1-f200.google.com with SMTP id
 d2e1a72fcca58-748f3613e6aso496704b3a.0
        for <linux-kernel@vger.kernel.org>;
 Sun, 29 Jun 2025 07:08:14 -0700 (PDT)
X-Google-DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed;
        d=1e100.net; s=20230601; t=1751206094; x=1751810894;
        h=content-transfer-encoding:mime-version:references:in-reply-to
         :message-id:date:subject:cc:to:from:x-gm-message-state:from:to:cc
         :subject:date:message-id:reply-to;
        bh=H0NxUUerXIPOxBBD23fcfhMmUbbhrv7qSetQ/SEeLRg=;
        b=rce0/4et9ChxKYAFuWgnpQz2VXG1uR/qau3k52vkjwZx0ndA32PGZtR8QHUI48Pxi1
         RByWU6VdaEXwjWna4YQ1gdXgu2LBJEJkRjWTD9RNYBisD36CRotMLIxDyccJGlSt7UgQ
         rqu+uiX4YKE36cWJCXqhDK5r8usdGWJhdyNYV0taIU7hTqADb+Spn4nCpvuULAJIgp1N
         yuQWkmECr3v4upvkN6I+FrOgA/74S2aT0Wn8JYswgyWyrykEBQaZ/ASz7ShVUM9KzHIs
         ybyve9XyHDVHZ08kQ5WfmZ+gOGpoB5dVw4e5QSKhCICVdErqp9OTUbm09aFppQ3iuPUD
         U9qw==
X-Forwarded-Encrypted: i=1;
 AJvYcCXiozf1ZS1dhdZFKkPR1dWgCa6fr/U+hIBT9jN0OJdE+xvpq2DVAHDzjYIAl0ah+BqAQ1c3QHn0+aSijcQ=@vger.kernel.org
X-Gm-Message-State: AOJu0YxBG6wt4DhEZnObSIGJxQdYtBJMkXQmofiCyIGFkF0rWU7n9avQ
	J2eHSNDV4+25olXhiaLD851j8RJNb4rb9fLCMyln8PQ8M6a2JE49N3lBj5lfrwZU1fA/bntR+6t
	6cNnF1f6DLHW5SsFJFY6aJJf5o+PxvY583CQZRzht+CuspFUllFfb+CAJthSaRjNOBJs=
X-Gm-Gg: ASbGnctMm3tI28kgrLJ+/dn3j72Wl63i+ssraj8d2kAf8OeVba0FlSWuGhsjx21UVzY
	NoVNKyXVElpNQCjGTD2MD/UuaIHJdJT3scMuQzDiUVPvvF95eUlL9xUG8PyFlCS2xSSDo7C+C3m
	j55lGQ+b4STKQyjCagiKdHJOE+Ec6Ykxtc/gW/xiAAJSrEPgKh7aKrUwZG7autbYiGyNjUZe06I
	KZH1LvYrfcSXZVbETL1WN6N+UZ8hH/F1we76rY0FQSrjBfNW6EVYVAjm3heVMAY/gPm6SQirUR8
	i8AwbWBDHs0opMzbefgeNNmfPtR1pKY4
X-Received: by 2002:a05:6a00:2da9:b0:742:a02e:dd8d with SMTP id
 d2e1a72fcca58-74af6ff20d6mr14434356b3a.20.1751206093570;
        Sun, 29 Jun 2025 07:08:13 -0700 (PDT)
X-Google-Smtp-Source: 
 AGHT+IEXzpFYuUR58PK6R1U6IZlQOQQicOB5AVjWsgE/yTrdAFaNjonI9m+OqXm3iu/TIEe6mcsvng==
X-Received: by 2002:a05:6a00:2da9:b0:742:a02e:dd8d with SMTP id
 d2e1a72fcca58-74af6ff20d6mr14434311b3a.20.1751206092999;
        Sun, 29 Jun 2025 07:08:12 -0700 (PDT)
Received: from localhost ([2601:1c0:5000:d5c:5b3e:de60:4fda:e7b1])
        by smtp.gmail.com with ESMTPSA id
 d2e1a72fcca58-74af55c8437sm6535281b3a.115.2025.06.29.07.08.12
        (version=TLS1_3 cipher=TLS_AES_256_GCM_SHA384 bits=256/256);
        Sun, 29 Jun 2025 07:08:12 -0700 (PDT)
From: Rob Clark <robin.clark@oss.qualcomm.com>
To: dri-devel@lists.freedesktop.org
Cc: freedreno@lists.freedesktop.org, linux-arm-msm@vger.kernel.org,
        Connor Abbott <cwabbott0@gmail.com>,
        Antonino Maniscalco <antomani103@gmail.com>,
        Danilo Krummrich <dakr@redhat.com>,
 Rob Clark <robdclark@chromium.org>,
        Rob Clark <robin.clark@oss.qualcomm.com>, Sean Paul <sean@poorly.run>,
        Konrad Dybcio <konradybcio@kernel.org>,
        Dmitry Baryshkov <lumag@kernel.org>,
        Abhinav Kumar <abhinav.kumar@linux.dev>,
        Jessica Zhang <jessica.zhang@oss.qualcomm.com>,
        Marijn Suijten <marijn.suijten@somainline.org>,
        David Airlie <airlied@gmail.com>, Simona Vetter <simona@ffwll.ch>,
        linux-kernel@vger.kernel.org (open list)
Subject: [PATCH v8 36/42] drm/msm: Add VM logging for VM_BIND updates
Date: Sun, 29 Jun 2025 07:03:39 -0700
Message-ID: <20250629140537.30850-37-robin.clark@oss.qualcomm.com>
X-Mailer: git-send-email 2.50.0
In-Reply-To: <20250629140537.30850-1-robin.clark@oss.qualcomm.com>
References: <20250629140537.30850-1-robin.clark@oss.qualcomm.com>
Precedence: bulk
X-Mailing-List: linux-kernel@vger.kernel.org
List-Id: <linux-kernel.vger.kernel.org>
List-Subscribe: <mailto:linux-kernel+subscribe@vger.kernel.org>
List-Unsubscribe: <mailto:linux-kernel+unsubscribe@vger.kernel.org>
MIME-Version: 1.0
Content-Transfer-Encoding: quoted-printable
X-Authority-Analysis: v=2.4 cv=ZKfXmW7b c=1 sm=1 tr=0 ts=686148ce cx=c_pps
 a=mDZGXZTwRPZaeRUbqKGCBw==:117 a=xqWC_Br6kY4A:10 a=6IFa9wvqVegA:10
 a=cm27Pg_UAAAA:8 a=EUspDBNiAAAA:8 a=pGLkceISAAAA:8 a=Ivokvn2EMlC-zZWxPmsA:9
 a=zc0IvFSfCIW2DFIPzwfm:22
X-Proofpoint-Spam-Details-Enc: AW1haW4tMjUwNjI5MDExOSBTYWx0ZWRfX6hdB9H4mM9Qb
 vpN7QEmS5073RIWFYOp0XZAdGlxxdVMIpB82eM2EPKr1t8axxNM9TiifRkVqK5RMwpQCSQXZ2Uj
 UPXcnlZxxwQdpeeZyhJdaIQV1rctHH9WosO/Cdf3JWTflvTOdS21EdDHYrSiZfSO158kq1/FtfR
 f4MeC305puPCQvSV/GZZDm55YxxgZtusN3ni7OTEr1BIuOtetsdOe4k7w3WIgF3emp1cSfdrolY
 T1RQtiUOOxh/H0nmfzZE0DNK5PfeLWtGRyN0kOzS4gBrT1b1LixiXd23ATlR8gLLUMQOlJTcfMG
 ncc9gmX1TC9rY43sbALQMSCIpotfrp4x70IIfma9HCVtZZKmcxIZ7jc9KPVNF3secikd2DKJCLm
 +/m+VeQ+ZjhME2QmVcuyDfjj9P86rY3UuKUCF3K0YWCAgwtPCclI/2Ewg5ya87Zn0y/zl8ZU
X-Proofpoint-ORIG-GUID: key1Ys0ETDj3dXAVHgpaQtj-uHe4EBza
X-Proofpoint-GUID: key1Ys0ETDj3dXAVHgpaQtj-uHe4EBza
X-Proofpoint-Virus-Version: vendor=baseguard
 engine=ICAP:2.0.293,Aquarius:18.0.1099,Hydra:6.1.7,FMLib:17.12.80.40
 definitions=2025-06-27_05,2025-06-27_01,2025-03-28_01
X-Proofpoint-Spam-Details: rule=outbound_notspam policy=outbound score=0
 adultscore=0 mlxscore=0 mlxlogscore=999 spamscore=0 suspectscore=0
 bulkscore=0 priorityscore=1501 lowpriorityscore=0 phishscore=0
 impostorscore=0 malwarescore=0 clxscore=1015 classifier=spam authscore=0
 authtc=n/a authcc= route=outbound adjust=0 reason=mlx scancount=1
 engine=8.19.0-2505280000 definitions=main-2506290119
Content-Type: text/plain; charset="utf-8"

From: Rob Clark <robdclark@chromium.org>

When userspace opts in to VM_BIND, the submit no longer holds references
keeping the VMA alive.  This makes it difficult to distinguish between
UMD/KMD/app bugs.  So add a debug option for logging the most recent VM
updates and capturing these in GPU devcoredumps.

The submitqueue id is also captured, a value of zero means the operation
did not go via a submitqueue (ie. comes from msm_gem_vm_close() tearing
down the remaining mappings when the device file is closed.

Signed-off-by: Rob Clark <robdclark@chromium.org>
Signed-off-by: Rob Clark <robin.clark@oss.qualcomm.com>
Tested-by: Antonino Maniscalco <antomani103@gmail.com>
Reviewed-by: Antonino Maniscalco <antomani103@gmail.com>
---
 drivers/gpu/drm/msm/adreno/adreno_gpu.c |  11 +++
 drivers/gpu/drm/msm/msm_gem.h           |  24 +++++
 drivers/gpu/drm/msm/msm_gem_vma.c       | 124 ++++++++++++++++++++++--
 drivers/gpu/drm/msm/msm_gpu.c           |  52 +++++++++-
 drivers/gpu/drm/msm/msm_gpu.h           |   4 +
 5 files changed, 202 insertions(+), 13 deletions(-)

diff --git a/drivers/gpu/drm/msm/adreno/adreno_gpu.c b/drivers/gpu/drm/msm/=
adreno/adreno_gpu.c
index ff25e3dada04..53cbfa5a507b 100644
--- a/drivers/gpu/drm/msm/adreno/adreno_gpu.c
+++ b/drivers/gpu/drm/msm/adreno/adreno_gpu.c
@@ -833,6 +833,7 @@ void adreno_gpu_state_destroy(struct msm_gpu_state *sta=
te)
 	for (i =3D 0; state->bos && i < state->nr_bos; i++)
 		kvfree(state->bos[i].data);
=20
+	kfree(state->vm_logs);
 	kfree(state->bos);
 	kfree(state->comm);
 	kfree(state->cmd);
@@ -973,6 +974,16 @@ void adreno_show(struct msm_gpu *gpu, struct msm_gpu_s=
tate *state,
 			   info->ptes[0], info->ptes[1], info->ptes[2], info->ptes[3]);
 	}
=20
+	if (state->vm_logs) {
+		drm_puts(p, "vm-log:\n");
+		for (i =3D 0; i < state->nr_vm_logs; i++) {
+			struct msm_gem_vm_log_entry *e =3D &state->vm_logs[i];
+			drm_printf(p, "  - %s:%d: 0x%016llx-0x%016llx\n",
+				   e->op, e->queue_id, e->iova,
+				   e->iova + e->range);
+		}
+	}
+
 	drm_printf(p, "rbbm-status: 0x%08x\n", state->rbbm_status);
=20
 	drm_puts(p, "ringbuffer:\n");
diff --git a/drivers/gpu/drm/msm/msm_gem.h b/drivers/gpu/drm/msm/msm_gem.h
index ee464e315643..062d1b5477d6 100644
--- a/drivers/gpu/drm/msm/msm_gem.h
+++ b/drivers/gpu/drm/msm/msm_gem.h
@@ -24,6 +24,20 @@
 #define MSM_BO_STOLEN        0x10000000    /* try to use stolen/splash mem=
ory */
 #define MSM_BO_MAP_PRIV      0x20000000    /* use IOMMU_PRIV when mapping =
*/
=20
+/**
+ * struct msm_gem_vm_log_entry - An entry in the VM log
+ *
+ * For userspace managed VMs, a log of recent VM updates is tracked and
+ * captured in GPU devcore dumps, to aid debugging issues caused by (for
+ * example) incorrectly synchronized VM updates
+ */
+struct msm_gem_vm_log_entry {
+	const char *op;
+	uint64_t iova;
+	uint64_t range;
+	int queue_id;
+};
+
 /**
  * struct msm_gem_vm - VM object
  *
@@ -85,6 +99,15 @@ struct msm_gem_vm {
 	/** @last_fence: Fence for last pending work scheduled on the VM */
 	struct dma_fence *last_fence;
=20
+	/** @log: A log of recent VM updates */
+	struct msm_gem_vm_log_entry *log;
+
+	/** @log_shift: length of @log is (1 << @log_shift) */
+	uint32_t log_shift;
+
+	/** @log_idx: index of next @log entry to write */
+	uint32_t log_idx;
+
 	/** @faults: the number of GPU hangs associated with this address space */
 	int faults;
=20
@@ -115,6 +138,7 @@ msm_gem_vm_create(struct drm_device *drm, struct msm_mm=
u *mmu, const char *name,
 		  u64 va_start, u64 va_size, bool managed);
=20
 void msm_gem_vm_close(struct drm_gpuvm *gpuvm);
+void msm_gem_vm_unusable(struct drm_gpuvm *gpuvm);
=20
 struct msm_fence_context;
=20
diff --git a/drivers/gpu/drm/msm/msm_gem_vma.c b/drivers/gpu/drm/msm/msm_ge=
m_vma.c
index 5d4b7e3e9d2c..729027245986 100644
--- a/drivers/gpu/drm/msm/msm_gem_vma.c
+++ b/drivers/gpu/drm/msm/msm_gem_vma.c
@@ -17,6 +17,10 @@
=20
 #define vm_dbg(fmt, ...) pr_debug("%s:%d: "fmt"\n", __func__, __LINE__, ##=
__VA_ARGS__)
=20
+static uint vm_log_shift =3D 0;
+MODULE_PARM_DESC(vm_log_shift, "Length of VM op log");
+module_param_named(vm_log_shift, vm_log_shift, uint, 0600);
+
 /**
  * struct msm_vm_map_op - create new pgtable mapping
  */
@@ -31,6 +35,13 @@ struct msm_vm_map_op {
 	struct sg_table *sgt;
 	/** @prot: the mapping protection flags */
 	int prot;
+
+	/**
+	 * @queue_id: The id of the submitqueue the operation is performed
+	 * on, or zero for (in particular) UNMAP ops triggered outside of
+	 * a submitqueue (ie. process cleanup)
+	 */
+	int queue_id;
 };
=20
 /**
@@ -41,6 +52,13 @@ struct msm_vm_unmap_op {
 	uint64_t iova;
 	/** @range: size of region to unmap */
 	uint64_t range;
+
+	/**
+	 * @queue_id: The id of the submitqueue the operation is performed
+	 * on, or zero for (in particular) UNMAP ops triggered outside of
+	 * a submitqueue (ie. process cleanup)
+	 */
+	int queue_id;
 };
=20
 /**
@@ -144,16 +162,87 @@ msm_gem_vm_free(struct drm_gpuvm *gpuvm)
 		vm->mmu->funcs->destroy(vm->mmu);
 	dma_fence_put(vm->last_fence);
 	put_pid(vm->pid);
+	kfree(vm->log);
 	kfree(vm);
 }
=20
+/**
+ * msm_gem_vm_unusable() - Mark a VM as unusable
+ * @vm: the VM to mark unusable
+ */
+void
+msm_gem_vm_unusable(struct drm_gpuvm *gpuvm)
+{
+	struct msm_gem_vm *vm =3D to_msm_vm(gpuvm);
+	uint32_t vm_log_len =3D (1 << vm->log_shift);
+	uint32_t vm_log_mask =3D vm_log_len - 1;
+	uint32_t nr_vm_logs;
+	int first;
+
+	vm->unusable =3D true;
+
+	/* Bail if no log, or empty log: */
+	if (!vm->log || !vm->log[0].op)
+		return;
+
+	mutex_lock(&vm->mmu_lock);
+
+	/*
+	 * log_idx is the next entry to overwrite, meaning it is the oldest, or
+	 * first, entry (other than the special case handled below where the
+	 * log hasn't wrapped around yet)
+	 */
+	first =3D vm->log_idx;
+
+	if (!vm->log[first].op) {
+		/*
+		 * If the next log entry has not been written yet, then only
+		 * entries 0 to idx-1 are valid (ie. we haven't wrapped around
+		 * yet)
+		 */
+		nr_vm_logs =3D MAX(0, first - 1);
+		first =3D 0;
+	} else {
+		nr_vm_logs =3D vm_log_len;
+	}
+
+	pr_err("vm-log:\n");
+	for (int i =3D 0; i < nr_vm_logs; i++) {
+		int idx =3D (i + first) & vm_log_mask;
+		struct msm_gem_vm_log_entry *e =3D &vm->log[idx];
+		pr_err("  - %s:%d: 0x%016llx-0x%016llx\n",
+		       e->op, e->queue_id, e->iova,
+		       e->iova + e->range);
+	}
+
+	mutex_unlock(&vm->mmu_lock);
+}
+
 static void
-vm_unmap_op(struct msm_gem_vm *vm, const struct msm_vm_unmap_op *op)
+vm_log(struct msm_gem_vm *vm, const char *op, uint64_t iova, uint64_t rang=
e, int queue_id)
 {
+	int idx;
+
 	if (!vm->managed)
 		lockdep_assert_held(&vm->mmu_lock);
=20
-	vm_dbg("%p: %016llx %016llx", vm, op->iova, op->iova + op->range);
+	vm_dbg("%s:%p:%d: %016llx %016llx", op, vm, queue_id, iova, iova + range);
+
+	if (!vm->log)
+		return;
+
+	idx =3D vm->log_idx;
+	vm->log[idx].op =3D op;
+	vm->log[idx].iova =3D iova;
+	vm->log[idx].range =3D range;
+	vm->log[idx].queue_id =3D queue_id;
+	vm->log_idx =3D (vm->log_idx + 1) & ((1 << vm->log_shift) - 1);
+}
+
+static void
+vm_unmap_op(struct msm_gem_vm *vm, const struct msm_vm_unmap_op *op)
+{
+	vm_log(vm, "unmap", op->iova, op->range, op->queue_id);
=20
 	vm->mmu->funcs->unmap(vm->mmu, op->iova, op->range);
 }
@@ -161,10 +250,7 @@ vm_unmap_op(struct msm_gem_vm *vm, const struct msm_vm=
_unmap_op *op)
 static int
 vm_map_op(struct msm_gem_vm *vm, const struct msm_vm_map_op *op)
 {
-	if (!vm->managed)
-		lockdep_assert_held(&vm->mmu_lock);
-
-	vm_dbg("%p: %016llx %016llx", vm, op->iova, op->iova + op->range);
+	vm_log(vm, "map", op->iova, op->range, op->queue_id);
=20
 	return vm->mmu->funcs->map(vm->mmu, op->iova, op->sgt, op->offset,
 				   op->range, op->prot);
@@ -382,6 +468,7 @@ vma_from_op(struct op_arg *arg, struct drm_gpuva_op_map=
 *op)
 static int
 msm_gem_vm_sm_step_map(struct drm_gpuva_op *op, void *arg)
 {
+	struct msm_vm_bind_job *job =3D ((struct op_arg *)arg)->job;
 	struct drm_gem_object *obj =3D op->map.gem.obj;
 	struct drm_gpuva *vma;
 	struct sg_table *sgt;
@@ -412,6 +499,7 @@ msm_gem_vm_sm_step_map(struct drm_gpuva_op *op, void *a=
rg)
 			.range =3D vma->va.range,
 			.offset =3D vma->gem.offset,
 			.prot =3D prot,
+			.queue_id =3D job->queue->id,
 		},
 		.obj =3D vma->gem.obj,
 	});
@@ -445,6 +533,7 @@ msm_gem_vm_sm_step_remap(struct drm_gpuva_op *op, void =
*arg)
 			.unmap =3D {
 				.iova =3D unmap_start,
 				.range =3D unmap_range,
+				.queue_id =3D job->queue->id,
 			},
 			.obj =3D orig_vma->gem.obj,
 		});
@@ -506,6 +595,7 @@ msm_gem_vm_sm_step_remap(struct drm_gpuva_op *op, void =
*arg)
 static int
 msm_gem_vm_sm_step_unmap(struct drm_gpuva_op *op, void *arg)
 {
+	struct msm_vm_bind_job *job =3D ((struct op_arg *)arg)->job;
 	struct drm_gpuva *vma =3D op->unmap.va;
 	struct msm_gem_vma *msm_vma =3D to_msm_vma(vma);
=20
@@ -520,6 +610,7 @@ msm_gem_vm_sm_step_unmap(struct drm_gpuva_op *op, void =
*arg)
 		.unmap =3D {
 			.iova =3D vma->va.addr,
 			.range =3D vma->va.range,
+			.queue_id =3D job->queue->id,
 		},
 		.obj =3D vma->gem.obj,
 	});
@@ -584,7 +675,7 @@ msm_vma_job_run(struct drm_sched_job *_job)
 	 * now the VM is in an undefined state.  Game over!
 	 */
 	if (ret)
-		vm->unusable =3D true;
+		msm_gem_vm_unusable(job->vm);
=20
 	job_foreach_bo (obj, job) {
 		msm_gem_lock(obj);
@@ -695,6 +786,23 @@ msm_gem_vm_create(struct drm_device *drm, struct msm_m=
mu *mmu, const char *name,
=20
 	drm_mm_init(&vm->mm, va_start, va_size);
=20
+	/*
+	 * We don't really need vm log for kernel managed VMs, as the kernel
+	 * is responsible for ensuring that GEM objs are mapped if they are
+	 * used by a submit.  Furthermore we piggyback on mmu_lock to serialize
+	 * access to the log.
+	 *
+	 * Limit the max log_shift to 8 to prevent userspace from asking us
+	 * for an unreasonable log size.
+	 */
+	if (!managed)
+		vm->log_shift =3D MIN(vm_log_shift, 8);
+
+	if (vm->log_shift) {
+		vm->log =3D kmalloc_array(1 << vm->log_shift, sizeof(vm->log[0]),
+					GFP_KERNEL | __GFP_ZERO);
+	}
+
 	return &vm->base;
=20
 err_free_dummy:
@@ -1161,7 +1269,7 @@ vm_bind_job_prepare(struct msm_vm_bind_job *job)
 			 * state the vm is in.  So throw up our hands!
 			 */
 			if (i > 0)
-				vm->unusable =3D true;
+				msm_gem_vm_unusable(job->vm);
 			return ret;
 		}
 	}
diff --git a/drivers/gpu/drm/msm/msm_gpu.c b/drivers/gpu/drm/msm/msm_gpu.c
index ccd9ebfc5c7c..c317b25a8162 100644
--- a/drivers/gpu/drm/msm/msm_gpu.c
+++ b/drivers/gpu/drm/msm/msm_gpu.c
@@ -259,9 +259,6 @@ static void crashstate_get_bos(struct msm_gpu_state *st=
ate, struct msm_gem_submi
 {
 	extern bool rd_full;
=20
-	if (!submit)
-		return;
-
 	if (msm_context_is_vmbind(submit->queue->ctx)) {
 		struct drm_exec exec;
 		struct drm_gpuva *vma;
@@ -318,6 +315,48 @@ static void crashstate_get_bos(struct msm_gpu_state *s=
tate, struct msm_gem_submi
 	}
 }
=20
+static void crashstate_get_vm_logs(struct msm_gpu_state *state, struct msm=
_gem_vm *vm)
+{
+	uint32_t vm_log_len =3D (1 << vm->log_shift);
+	uint32_t vm_log_mask =3D vm_log_len - 1;
+	int first;
+
+	/* Bail if no log, or empty log: */
+	if (!vm->log || !vm->log[0].op)
+		return;
+
+	mutex_lock(&vm->mmu_lock);
+
+	/*
+	 * log_idx is the next entry to overwrite, meaning it is the oldest, or
+	 * first, entry (other than the special case handled below where the
+	 * log hasn't wrapped around yet)
+	 */
+	first =3D vm->log_idx;
+
+	if (!vm->log[first].op) {
+		/*
+		 * If the next log entry has not been written yet, then only
+		 * entries 0 to idx-1 are valid (ie. we haven't wrapped around
+		 * yet)
+		 */
+		state->nr_vm_logs =3D MAX(0, first - 1);
+		first =3D 0;
+	} else {
+		state->nr_vm_logs =3D vm_log_len;
+	}
+
+	state->vm_logs =3D kmalloc_array(
+		state->nr_vm_logs, sizeof(vm->log[0]), GFP_KERNEL);
+	for (int i =3D 0; i < state->nr_vm_logs; i++) {
+		int idx =3D (i + first) & vm_log_mask;
+
+		state->vm_logs[i] =3D vm->log[idx];
+	}
+
+	mutex_unlock(&vm->mmu_lock);
+}
+
 static void msm_gpu_crashstate_capture(struct msm_gpu *gpu,
 		struct msm_gem_submit *submit, struct msm_gpu_fault_info *fault_info,
 		char *comm, char *cmd)
@@ -351,7 +390,10 @@ static void msm_gpu_crashstate_capture(struct msm_gpu =
*gpu,
 		msm_iommu_pagetable_walk(mmu, info->iova, info->ptes);
 	}
=20
-	crashstate_get_bos(state, submit);
+	if (submit) {
+		crashstate_get_vm_logs(state, to_msm_vm(submit->vm));
+		crashstate_get_bos(state, submit);
+	}
=20
 	/* Set the active crash state to be dumped on failure */
 	gpu->crashstate =3D state;
@@ -452,7 +494,7 @@ static void recover_worker(struct kthread_work *work)
 		 * VM_BIND)
 		 */
 		if (!vm->managed)
-			vm->unusable =3D true;
+			msm_gem_vm_unusable(submit->vm);
 	}
=20
 	get_comm_cmdline(submit, &comm, &cmd);
diff --git a/drivers/gpu/drm/msm/msm_gpu.h b/drivers/gpu/drm/msm/msm_gpu.h
index 5705e8d4e6b9..b2a96544f92a 100644
--- a/drivers/gpu/drm/msm/msm_gpu.h
+++ b/drivers/gpu/drm/msm/msm_gpu.h
@@ -20,6 +20,7 @@
 #include "msm_gem.h"
=20
 struct msm_gem_submit;
+struct msm_gem_vm_log_entry;
 struct msm_gpu_perfcntr;
 struct msm_gpu_state;
 struct msm_context;
@@ -603,6 +604,9 @@ struct msm_gpu_state {
=20
 	struct msm_gpu_fault_info fault_info;
=20
+	int nr_vm_logs;
+	struct msm_gem_vm_log_entry *vm_logs;
+
 	int nr_bos;
 	struct msm_gpu_state_bo *bos;
 };
--=20
2.50.0