From nobody Sun Feb  8 10:53:10 2026
Return-Path: <linux-kernel-owner@vger.kernel.org>
X-Spam-Checker-Version: SpamAssassin 3.4.0 (2014-02-07) on
	aws-us-west-2-korg-lkml-1.web.codeaurora.org
Received: from vger.kernel.org (vger.kernel.org [23.128.96.18])
	by smtp.lore.kernel.org (Postfix) with ESMTP id C9724C71153
	for <linux-kernel@archiver.kernel.org>; Mon, 11 Sep 2023 02:17:03 +0000 (UTC)
Received: (majordomo@vger.kernel.org) by vger.kernel.org via listexpand
        id S232697AbjIKCRE (ORCPT <rfc822;linux-kernel@archiver.kernel.org>);
        Sun, 10 Sep 2023 22:17:04 -0400
Received: from lindbergh.monkeyblade.net ([23.128.96.19]:43848 "EHLO
        lindbergh.monkeyblade.net" rhost-flags-OK-OK-OK-OK) by vger.kernel.org
        with ESMTP id S232166AbjIKCRD (ORCPT
        <rfc822;linux-kernel@vger.kernel.org>);
        Sun, 10 Sep 2023 22:17:03 -0400
Received: from mail-oo1-xc32.google.com (mail-oo1-xc32.google.com
 [IPv6:2607:f8b0:4864:20::c32])
        by lindbergh.monkeyblade.net (Postfix) with ESMTPS id DB6B8CDE
        for <linux-kernel@vger.kernel.org>;
 Sun, 10 Sep 2023 19:16:55 -0700 (PDT)
Received: by mail-oo1-xc32.google.com with SMTP id
 006d021491bc7-573249e73f8so2683330eaf.1
        for <linux-kernel@vger.kernel.org>;
 Sun, 10 Sep 2023 19:16:55 -0700 (PDT)
DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed;
        d=chromium.org; s=google; t=1694398615; x=1695003415;
 darn=vger.kernel.org;
        h=content-transfer-encoding:mime-version:references:in-reply-to
         :message-id:date:subject:cc:to:from:from:to:cc:subject:date
         :message-id:reply-to;
        bh=V8kEeak7Jm/wBTYBnBaTDd+S+FNlil6EoRPZlJ8iQJM=;
        b=czsBP2bF1+ULo4hfWCwe7uRFaknlmfp6eCxjXjsIX/is1uRQXNZhS5yc3baUPPDuMn
         /ttFDIEMx1QaQJnP8t5MKvskHsGmGOMLND4qk7hEI36Gzy43JxYV4jHJLt9YdgUkkZAW
         P5jh7jf84btK5uCxajdA5atnxkCpRdRFIDdzQ=
X-Google-DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed;
        d=1e100.net; s=20230601; t=1694398615; x=1695003415;
        h=content-transfer-encoding:mime-version:references:in-reply-to
         :message-id:date:subject:cc:to:from:x-gm-message-state:from:to:cc
         :subject:date:message-id:reply-to;
        bh=V8kEeak7Jm/wBTYBnBaTDd+S+FNlil6EoRPZlJ8iQJM=;
        b=YpK/AECxzORAadjXeNBFhGcoR26YAdovHqhEof0DeechMq03QaER3ezWELFkLLUYHe
         aSbDXi0DULndM/BcH88J5hW8/MAT0hj5DufPPyEtHSrkRqJ7bV3RxlzMoOmxdmM9teQd
         Dgsts4KDJA4vzLO9JxyDWUtg3FXHCUP90TPg7GejOETZycVfjsEgoMDuAVloMpn03Zbu
         Jd/sD8Eo4IGGJQz9LAwlMxEsNeiaOuiXOSDQcamkqfIvAXdHlV/PK9htEicOjxYZLWI0
         keX5zTeM55XX6iOWZg6tr+jOt+zYLXdhCsl46LrZRXVlC1cV64/ANKwilaOg5e75Nmns
         Lc8g==
X-Gm-Message-State: AOJu0Yx/mo9vtEofjZq470Vu7hW/Iix3CtCQwg2G3xLX2RLLpJLRnLPd
        OGEh00BaDp/7StFEHzUdwA/Khg==
X-Google-Smtp-Source: 
 AGHT+IHSjmKzK+RW2/XQRbhCvpUc4myy0NraJFC7Uxkq2KP+XZBnUnerFsiB8UN8PsAr9btp9QobSg==
X-Received: by 2002:a05:6358:52c8:b0:134:c8ee:e451 with SMTP id
 z8-20020a05635852c800b00134c8eee451mr12154801rwz.13.1694398614766;
        Sun, 10 Sep 2023 19:16:54 -0700 (PDT)
Received: from localhost ([2401:fa00:8f:203:282a:59c8:cc3a:2d6])
        by smtp.gmail.com with UTF8SMTPSA id
 k11-20020aa790cb000000b0066ebaeb149dsm4477329pfk.88.2023.09.10.19.16.52
        (version=TLS1_3 cipher=TLS_AES_128_GCM_SHA256 bits=128/128);
        Sun, 10 Sep 2023 19:16:54 -0700 (PDT)
From: David Stevens <stevensd@chromium.org>
X-Google-Original-From: David Stevens <stevensd@google.com>
To: Sean Christopherson <seanjc@google.com>
Cc: Yu Zhang <yu.c.zhang@linux.intel.com>,
        Isaku Yamahata <isaku.yamahata@gmail.com>,
        Zhi Wang <zhi.wang.linux@gmail.com>, kvmarm@lists.linux.dev,
        linux-kernel@vger.kernel.org, kvm@vger.kernel.org,
        David Stevens <stevensd@chromium.org>
Subject: [PATCH v9 2/6] KVM: mmu: Introduce __kvm_follow_pfn function
Date: Mon, 11 Sep 2023 11:16:32 +0900
Message-ID: <20230911021637.1941096-3-stevensd@google.com>
X-Mailer: git-send-email 2.42.0.283.g2d96d420d3-goog
In-Reply-To: <20230911021637.1941096-1-stevensd@google.com>
References: <20230911021637.1941096-1-stevensd@google.com>
MIME-Version: 1.0
Content-Transfer-Encoding: quoted-printable
Precedence: bulk
List-ID: <linux-kernel.vger.kernel.org>
X-Mailing-List: linux-kernel@vger.kernel.org
Content-Type: text/plain; charset="utf-8"

From: David Stevens <stevensd@chromium.org>

Introduce __kvm_follow_pfn, which will replace __gfn_to_pfn_memslot.
__kvm_follow_pfn refactors the old API's arguments into a struct and,
where possible, combines the boolean arguments into a single flags
argument.

Signed-off-by: David Stevens <stevensd@chromium.org>
Reviewed-by: Maxim Levitsky <mlevitsk@redhat.com>
---
 include/linux/kvm_host.h |  16 ++++
 virt/kvm/kvm_main.c      | 171 ++++++++++++++++++++++-----------------
 virt/kvm/kvm_mm.h        |   3 +-
 virt/kvm/pfncache.c      |  10 ++-
 4 files changed, 123 insertions(+), 77 deletions(-)

diff --git a/include/linux/kvm_host.h b/include/linux/kvm_host.h
index fb6c6109fdca..c2e0ddf14dba 100644
--- a/include/linux/kvm_host.h
+++ b/include/linux/kvm_host.h
@@ -97,6 +97,7 @@
 #define KVM_PFN_ERR_HWPOISON	(KVM_PFN_ERR_MASK + 1)
 #define KVM_PFN_ERR_RO_FAULT	(KVM_PFN_ERR_MASK + 2)
 #define KVM_PFN_ERR_SIGPENDING	(KVM_PFN_ERR_MASK + 3)
+#define KVM_PFN_ERR_NEEDS_IO	(KVM_PFN_ERR_MASK + 4)
=20
 /*
  * error pfns indicate that the gfn is in slot but faild to
@@ -1177,6 +1178,21 @@ unsigned long gfn_to_hva_memslot_prot(struct kvm_mem=
ory_slot *slot, gfn_t gfn,
 void kvm_release_page_clean(struct page *page);
 void kvm_release_page_dirty(struct page *page);
=20
+struct kvm_follow_pfn {
+	const struct kvm_memory_slot *slot;
+	gfn_t gfn;
+	unsigned int flags;
+	bool atomic;
+	/* Try to create a writable mapping even for a read fault */
+	bool try_map_writable;
+
+	/* Outputs of __kvm_follow_pfn */
+	hva_t hva;
+	bool writable;
+};
+
+kvm_pfn_t __kvm_follow_pfn(struct kvm_follow_pfn *foll);
+
 kvm_pfn_t gfn_to_pfn(struct kvm *kvm, gfn_t gfn);
 kvm_pfn_t gfn_to_pfn_prot(struct kvm *kvm, gfn_t gfn, bool write_fault,
 		      bool *writable);
diff --git a/virt/kvm/kvm_main.c b/virt/kvm/kvm_main.c
index ee6090ecb1fe..9b33a59c6d65 100644
--- a/virt/kvm/kvm_main.c
+++ b/virt/kvm/kvm_main.c
@@ -2512,8 +2512,7 @@ static inline int check_user_page_hwpoison(unsigned l=
ong addr)
  * true indicates success, otherwise false is returned.  It's also the
  * only part that runs if we can in atomic context.
  */
-static bool hva_to_pfn_fast(unsigned long addr, bool write_fault,
-			    bool *writable, kvm_pfn_t *pfn)
+static bool hva_to_pfn_fast(struct kvm_follow_pfn *foll, kvm_pfn_t *pfn)
 {
 	struct page *page[1];
=20
@@ -2522,14 +2521,12 @@ static bool hva_to_pfn_fast(unsigned long addr, boo=
l write_fault,
 	 * or the caller allows to map a writable pfn for a read fault
 	 * request.
 	 */
-	if (!(write_fault || writable))
+	if (!((foll->flags & FOLL_WRITE) || foll->try_map_writable))
 		return false;
=20
-	if (get_user_page_fast_only(addr, FOLL_WRITE, page)) {
+	if (get_user_page_fast_only(foll->hva, FOLL_WRITE, page)) {
 		*pfn =3D page_to_pfn(page[0]);
-
-		if (writable)
-			*writable =3D true;
+		foll->writable =3D true;
 		return true;
 	}
=20
@@ -2540,35 +2537,26 @@ static bool hva_to_pfn_fast(unsigned long addr, boo=
l write_fault,
  * The slow path to get the pfn of the specified host virtual address,
  * 1 indicates success, -errno is returned if error is detected.
  */
-static int hva_to_pfn_slow(unsigned long addr, bool *async, bool write_fau=
lt,
-			   bool interruptible, bool *writable, kvm_pfn_t *pfn)
+static int hva_to_pfn_slow(struct kvm_follow_pfn *foll, kvm_pfn_t *pfn)
 {
-	unsigned int flags =3D FOLL_HWPOISON;
+	unsigned int flags =3D FOLL_HWPOISON | foll->flags;
 	struct page *page;
 	int npages;
=20
 	might_sleep();
=20
-	if (writable)
-		*writable =3D write_fault;
-
-	if (write_fault)
-		flags |=3D FOLL_WRITE;
-	if (async)
-		flags |=3D FOLL_NOWAIT;
-	if (interruptible)
-		flags |=3D FOLL_INTERRUPTIBLE;
-
-	npages =3D get_user_pages_unlocked(addr, 1, &page, flags);
+	npages =3D get_user_pages_unlocked(foll->hva, 1, &page, flags);
 	if (npages !=3D 1)
 		return npages;
=20
-	/* map read fault as writable if possible */
-	if (unlikely(!write_fault) && writable) {
+	if (foll->flags & FOLL_WRITE) {
+		foll->writable =3D true;
+	} else if (foll->try_map_writable) {
 		struct page *wpage;
=20
-		if (get_user_page_fast_only(addr, FOLL_WRITE, &wpage)) {
-			*writable =3D true;
+		/* map read fault as writable if possible */
+		if (get_user_page_fast_only(foll->hva, FOLL_WRITE, &wpage)) {
+			foll->writable =3D true;
 			put_page(page);
 			page =3D wpage;
 		}
@@ -2599,23 +2587,23 @@ static int kvm_try_get_pfn(kvm_pfn_t pfn)
 }
=20
 static int hva_to_pfn_remapped(struct vm_area_struct *vma,
-			       unsigned long addr, bool write_fault,
-			       bool *writable, kvm_pfn_t *p_pfn)
+			       struct kvm_follow_pfn *foll, kvm_pfn_t *p_pfn)
 {
 	kvm_pfn_t pfn;
 	pte_t *ptep;
 	pte_t pte;
 	spinlock_t *ptl;
+	bool write_fault =3D foll->flags & FOLL_WRITE;
 	int r;
=20
-	r =3D follow_pte(vma->vm_mm, addr, &ptep, &ptl);
+	r =3D follow_pte(vma->vm_mm, foll->hva, &ptep, &ptl);
 	if (r) {
 		/*
 		 * get_user_pages fails for VM_IO and VM_PFNMAP vmas and does
 		 * not call the fault handler, so do it here.
 		 */
 		bool unlocked =3D false;
-		r =3D fixup_user_fault(current->mm, addr,
+		r =3D fixup_user_fault(current->mm, foll->hva,
 				     (write_fault ? FAULT_FLAG_WRITE : 0),
 				     &unlocked);
 		if (unlocked)
@@ -2623,7 +2611,7 @@ static int hva_to_pfn_remapped(struct vm_area_struct =
*vma,
 		if (r)
 			return r;
=20
-		r =3D follow_pte(vma->vm_mm, addr, &ptep, &ptl);
+		r =3D follow_pte(vma->vm_mm, foll->hva, &ptep, &ptl);
 		if (r)
 			return r;
 	}
@@ -2635,8 +2623,7 @@ static int hva_to_pfn_remapped(struct vm_area_struct =
*vma,
 		goto out;
 	}
=20
-	if (writable)
-		*writable =3D pte_write(pte);
+	foll->writable =3D pte_write(pte);
 	pfn =3D pte_pfn(pte);
=20
 	/*
@@ -2681,24 +2668,22 @@ static int hva_to_pfn_remapped(struct vm_area_struc=
t *vma,
  * 2): @write_fault =3D false && @writable, @writable will tell the caller
  *     whether the mapping is writable.
  */
-kvm_pfn_t hva_to_pfn(unsigned long addr, bool atomic, bool interruptible,
-		     bool *async, bool write_fault, bool *writable)
+kvm_pfn_t hva_to_pfn(struct kvm_follow_pfn *foll)
 {
 	struct vm_area_struct *vma;
 	kvm_pfn_t pfn;
 	int npages, r;
=20
 	/* we can do it either atomically or asynchronously, not both */
-	BUG_ON(atomic && async);
+	BUG_ON(foll->atomic && (foll->flags & FOLL_NOWAIT));
=20
-	if (hva_to_pfn_fast(addr, write_fault, writable, &pfn))
+	if (hva_to_pfn_fast(foll, &pfn))
 		return pfn;
=20
-	if (atomic)
+	if (foll->atomic)
 		return KVM_PFN_ERR_FAULT;
=20
-	npages =3D hva_to_pfn_slow(addr, async, write_fault, interruptible,
-				 writable, &pfn);
+	npages =3D hva_to_pfn_slow(foll, &pfn);
 	if (npages =3D=3D 1)
 		return pfn;
 	if (npages =3D=3D -EINTR)
@@ -2706,83 +2691,123 @@ kvm_pfn_t hva_to_pfn(unsigned long addr, bool atom=
ic, bool interruptible,
=20
 	mmap_read_lock(current->mm);
 	if (npages =3D=3D -EHWPOISON ||
-	      (!async && check_user_page_hwpoison(addr))) {
+	    (!(foll->flags & FOLL_NOWAIT) && check_user_page_hwpoison(foll->hva))=
) {
 		pfn =3D KVM_PFN_ERR_HWPOISON;
 		goto exit;
 	}
=20
 retry:
-	vma =3D vma_lookup(current->mm, addr);
+	vma =3D vma_lookup(current->mm, foll->hva);
=20
 	if (vma =3D=3D NULL)
 		pfn =3D KVM_PFN_ERR_FAULT;
 	else if (vma->vm_flags & (VM_IO | VM_PFNMAP)) {
-		r =3D hva_to_pfn_remapped(vma, addr, write_fault, writable, &pfn);
+		r =3D hva_to_pfn_remapped(vma, foll, &pfn);
 		if (r =3D=3D -EAGAIN)
 			goto retry;
 		if (r < 0)
 			pfn =3D KVM_PFN_ERR_FAULT;
 	} else {
-		if (async && vma_is_valid(vma, write_fault))
-			*async =3D true;
-		pfn =3D KVM_PFN_ERR_FAULT;
+		if ((foll->flags & FOLL_NOWAIT) &&
+		    vma_is_valid(vma, foll->flags & FOLL_WRITE))
+			pfn =3D KVM_PFN_ERR_NEEDS_IO;
+		else
+			pfn =3D KVM_PFN_ERR_FAULT;
 	}
 exit:
 	mmap_read_unlock(current->mm);
 	return pfn;
 }
=20
-kvm_pfn_t __gfn_to_pfn_memslot(const struct kvm_memory_slot *slot, gfn_t g=
fn,
-			       bool atomic, bool interruptible, bool *async,
-			       bool write_fault, bool *writable, hva_t *hva)
+kvm_pfn_t __kvm_follow_pfn(struct kvm_follow_pfn *foll)
 {
-	unsigned long addr =3D __gfn_to_hva_many(slot, gfn, NULL, write_fault);
+	foll->writable =3D false;
+	foll->hva =3D __gfn_to_hva_many(foll->slot, foll->gfn, NULL,
+				      foll->flags & FOLL_WRITE);
=20
-	if (hva)
-		*hva =3D addr;
-
-	if (addr =3D=3D KVM_HVA_ERR_RO_BAD) {
-		if (writable)
-			*writable =3D false;
+	if (foll->hva =3D=3D KVM_HVA_ERR_RO_BAD)
 		return KVM_PFN_ERR_RO_FAULT;
-	}
=20
-	if (kvm_is_error_hva(addr)) {
-		if (writable)
-			*writable =3D false;
+	if (kvm_is_error_hva(foll->hva))
 		return KVM_PFN_NOSLOT;
-	}
=20
-	/* Do not map writable pfn in the readonly memslot. */
-	if (writable && memslot_is_readonly(slot)) {
-		*writable =3D false;
-		writable =3D NULL;
-	}
+	if (memslot_is_readonly(foll->slot))
+		foll->try_map_writable =3D false;
=20
-	return hva_to_pfn(addr, atomic, interruptible, async, write_fault,
-			  writable);
+	return hva_to_pfn(foll);
+}
+EXPORT_SYMBOL_GPL(__kvm_follow_pfn);
+
+kvm_pfn_t __gfn_to_pfn_memslot(const struct kvm_memory_slot *slot, gfn_t g=
fn,
+			       bool atomic, bool interruptible, bool *async,
+			       bool write_fault, bool *writable, hva_t *hva)
+{
+	kvm_pfn_t pfn;
+	struct kvm_follow_pfn foll =3D {
+		.slot =3D slot,
+		.gfn =3D gfn,
+		.flags =3D 0,
+		.atomic =3D atomic,
+		.try_map_writable =3D !!writable,
+	};
+
+	if (write_fault)
+		foll.flags |=3D FOLL_WRITE;
+	if (async)
+		foll.flags |=3D FOLL_NOWAIT;
+	if (interruptible)
+		foll.flags |=3D FOLL_INTERRUPTIBLE;
+
+	pfn =3D __kvm_follow_pfn(&foll);
+	if (pfn =3D=3D KVM_PFN_ERR_NEEDS_IO) {
+		*async =3D true;
+		pfn =3D KVM_PFN_ERR_FAULT;
+	}
+	if (hva)
+		*hva =3D foll.hva;
+	if (writable)
+		*writable =3D foll.writable;
+	return pfn;
 }
 EXPORT_SYMBOL_GPL(__gfn_to_pfn_memslot);
=20
 kvm_pfn_t gfn_to_pfn_prot(struct kvm *kvm, gfn_t gfn, bool write_fault,
 		      bool *writable)
 {
-	return __gfn_to_pfn_memslot(gfn_to_memslot(kvm, gfn), gfn, false, false,
-				    NULL, write_fault, writable, NULL);
+	kvm_pfn_t pfn;
+	struct kvm_follow_pfn foll =3D {
+		.slot =3D gfn_to_memslot(kvm, gfn),
+		.gfn =3D gfn,
+		.flags =3D write_fault ? FOLL_WRITE : 0,
+		.try_map_writable =3D !!writable,
+	};
+	pfn =3D __kvm_follow_pfn(&foll);
+	if (writable)
+		*writable =3D foll.writable;
+	return pfn;
 }
 EXPORT_SYMBOL_GPL(gfn_to_pfn_prot);
=20
 kvm_pfn_t gfn_to_pfn_memslot(const struct kvm_memory_slot *slot, gfn_t gfn)
 {
-	return __gfn_to_pfn_memslot(slot, gfn, false, false, NULL, true,
-				    NULL, NULL);
+	struct kvm_follow_pfn foll =3D {
+		.slot =3D slot,
+		.gfn =3D gfn,
+		.flags =3D FOLL_WRITE,
+	};
+	return __kvm_follow_pfn(&foll);
 }
 EXPORT_SYMBOL_GPL(gfn_to_pfn_memslot);
=20
 kvm_pfn_t gfn_to_pfn_memslot_atomic(const struct kvm_memory_slot *slot, gf=
n_t gfn)
 {
-	return __gfn_to_pfn_memslot(slot, gfn, true, false, NULL, true,
-				    NULL, NULL);
+	struct kvm_follow_pfn foll =3D {
+		.slot =3D slot,
+		.gfn =3D gfn,
+		.flags =3D FOLL_WRITE,
+		.atomic =3D true,
+	};
+	return __kvm_follow_pfn(&foll);
 }
 EXPORT_SYMBOL_GPL(gfn_to_pfn_memslot_atomic);
=20
diff --git a/virt/kvm/kvm_mm.h b/virt/kvm/kvm_mm.h
index 180f1a09e6ba..ed896aee5396 100644
--- a/virt/kvm/kvm_mm.h
+++ b/virt/kvm/kvm_mm.h
@@ -20,8 +20,7 @@
 #define KVM_MMU_UNLOCK(kvm)		spin_unlock(&(kvm)->mmu_lock)
 #endif /* KVM_HAVE_MMU_RWLOCK */
=20
-kvm_pfn_t hva_to_pfn(unsigned long addr, bool atomic, bool interruptible,
-		     bool *async, bool write_fault, bool *writable);
+kvm_pfn_t hva_to_pfn(struct kvm_follow_pfn *foll);
=20
 #ifdef CONFIG_HAVE_KVM_PFNCACHE
 void gfn_to_pfn_cache_invalidate_start(struct kvm *kvm,
diff --git a/virt/kvm/pfncache.c b/virt/kvm/pfncache.c
index 2d6aba677830..86cd40acad11 100644
--- a/virt/kvm/pfncache.c
+++ b/virt/kvm/pfncache.c
@@ -144,6 +144,12 @@ static kvm_pfn_t hva_to_pfn_retry(struct gfn_to_pfn_ca=
che *gpc)
 	kvm_pfn_t new_pfn =3D KVM_PFN_ERR_FAULT;
 	void *new_khva =3D NULL;
 	unsigned long mmu_seq;
+	struct kvm_follow_pfn foll =3D {
+		.slot =3D gpc->memslot,
+		.gfn =3D gpa_to_gfn(gpc->gpa),
+		.flags =3D FOLL_WRITE,
+		.hva =3D gpc->uhva,
+	};
=20
 	lockdep_assert_held(&gpc->refresh_lock);
=20
@@ -182,8 +188,8 @@ static kvm_pfn_t hva_to_pfn_retry(struct gfn_to_pfn_cac=
he *gpc)
 			cond_resched();
 		}
=20
-		/* We always request a writeable mapping */
-		new_pfn =3D hva_to_pfn(gpc->uhva, false, false, NULL, true, NULL);
+		/* We always request a writable mapping */
+		new_pfn =3D hva_to_pfn(&foll);
 		if (is_error_noslot_pfn(new_pfn))
 			goto out_error;
=20
--=20
2.42.0.283.g2d96d420d3-goog