久久精品国产精品国产精品污,男人扒开添女人下部免费视频,一级国产69式性姿势免费视频,夜鲁夜鲁很鲁在线视频 视频,欧美丰满少妇一区二区三区,国产偷国产偷亚洲高清人乐享,中文 在线 日韩 亚洲 欧美,熟妇人妻无乱码中文字幕真矢织江,一区二区三区人妻制服国产

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

TVM:使用Tensor Expression (TE)来处理算子

發(fā)布時間:2025/3/8 编程问答 23 豆豆
生活随笔 收集整理的這篇文章主要介紹了 TVM:使用Tensor Expression (TE)来处理算子 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

TVM:使用Tensor Expression (TE)來處理算子

在本教程中,我們將聚焦于在 TVM 中使用張量表達式(TE)來定義張量計算和實現(xiàn)循環(huán)優(yōu)化。TE用純函數(shù)語言描述張量計算(即每個表達式都沒有副作用)。當(dāng)在 TVM 的整體上下文中查看時,Relay 將計算描述為一組算子,并且其中每一個算子都可以表示為 TE 表達式,每個 TE 表達式獲取輸入張量并生成輸出張量。
本文是TVM中 TE 語言的入門教程。TVM 使用領(lǐng)域?qū)S?#xff08;domain specific)的張量表達式來高效地構(gòu)造內(nèi)核。我們以兩個使用 TE 語言的為例來演示基本工作流。第一個示例介紹了 TE 和帶有向量加法的 schedule。第二個示例通過逐步優(yōu)化矩陣與 TE 的乘法來擴展這些概念。這個矩陣乘法示例將作為未來涵蓋更高級的 TVM 特性的教程的對比基礎(chǔ)。

示例一:使用TE為CPU編寫和調(diào)度向量加法

初始化 tvm環(huán)境

我們的第一個例子是使用 Python 來為向量加法實現(xiàn)一個 TE,然后是一個針對 CPU 的 schedule,我們從初始化 tvm 環(huán)境開始:

import tvm import tvm.testing from tvm import te import numpy as np# 如果能夠指定目標(biāo) CPU,那么將會得到更好地性能 # 如果用的是llvm,可以通過 `llc --version` 來查看 CPU 類型 # 可以通過查看 /proc/cpuinfo 來查看你的處理器可能支持的其他擴展, # 比如,如果你的 CPU 有 AVX-512 指令集,那么你可以使用 `llvm -mcpu=skylake-avx512` 選項tgt = tvm.target.Target(target="llvm", host="llvm")

描述向量計算

我們首先描述向量加法計算。TVM 采用張量語義,每個中間結(jié)果表示為一個多維數(shù)組。我們需要描述規(guī)則來得到張量。我們首先定義一個符號變量 n 來表示形狀。然后我們定義兩個 placeholder 張量:A、B,它們的形狀是 (n,)。然后我們通過一個 compute 操作,得到結(jié)果張量 C。compute 定義了一種計算,其輸出符合指定的張量形狀,并在由 lambda 函數(shù)定義的張量中的每個位置執(zhí)行計算。注意,雖然 n 是一個變量,但它定義了A、B 和 C 張量之間的一致形狀。請注意,在這個階段沒有實際的計算發(fā)生,因為我們只是聲明應(yīng)該如何進行計算。

n = te.var("n") A = te.placeholder((n,), name="A") B = te.placeholder((n,), name="B") C = te.compute(A.shape, lambda i: A[i] + B[i], name="C")

注意:Lambda函數(shù)

te.compute方法的第二個參數(shù)是執(zhí)行計算的函數(shù)。在本例中,我們使用一個匿名函數(shù)(也稱為lambda函數(shù))來定義計算,在本例中是對 a 和 B 的第 i 個元素的加法。

為計算創(chuàng)建一個默認的Schedule

雖然上面幾行描述了計算規(guī)則,但我們可以用許多不同的方法計算 C 以適應(yīng)不同的設(shè)備。對于具有多個 axis 的張量,您可以選擇首先迭代哪個 axis ,另外計算可以跨不同的線程拆分。TVM要求用戶提供一個 schedule,來描述應(yīng)如何執(zhí)行計算。TE 中的 schedule 操作可以更改循環(huán)順序、跨不同線程拆分計算、將數(shù)據(jù)塊分組在一起,以及其他操作。schedule 背后的一個重要概念是,它們只描述如何執(zhí)行計算,因此相同 TE 的不同 schedule 一定會產(chǎn)生相同的結(jié)果。

在 TVM 中,我們可以創(chuàng)建一種樸素的 schedule ,按照行優(yōu)先的順序來計算 C。

for (int i = 0; i < n; ++i) {C[i] = A[i] + B[i]; } s = te.create_schedule(C.op)

編譯并驗證默認的 schedule

通過 TE 表達式和 schedule,我們可以為目標(biāo)語言和體系結(jié)構(gòu)生成可運行的代碼,在本例中是 LLVM 和 CPU 。我們向 TVM 提供 schedule、schedule 中的TE表達式列表、目標(biāo)和主機,以及我們正在生成的函數(shù)的名稱。輸出的結(jié)果是可以直接從 Python 調(diào)用 type-erased 函數(shù)。

在下一行中,我們使用 tvm.build 創(chuàng)建一個函數(shù)。build 函數(shù)接受 schedule、函數(shù)所需的簽名(包括輸入和輸出)以及我們要編譯到的目標(biāo)語言。

fadd = tvm.build(s, [A, B, C], tgt, name="myadd")

我們運行該函數(shù),并將輸出與 numpy 中的相同計算進行比較。編譯后的 TVM 函數(shù)提供了一個簡明的C API,可以被任何語言調(diào)用。我們首先創(chuàng)建一個設(shè)備(在本例中為CPU),這是一個 TVM 可以編譯 schedule 的設(shè)備。在本例中,設(shè)備是LLVM CPU target。然后,我們可以在設(shè)備中初始化張量并執(zhí)行自定義的加法操作。為了驗證計算的正確性,我們可以將c張量的輸出結(jié)果與 numpy 執(zhí)行的相同計算進行比較。

dev = tvm.device(tgt.kind.name, 0)n = 1024 a = tvm.nd.array(np.random.uniform(size=n).astype(A.dtype), dev) b = tvm.nd.array(np.random.uniform(size=n).astype(B.dtype), dev) c = tvm.nd.array(np.zeros(n, dtype=C.dtype), dev) fadd(a, b, c) tvm.testing.assert_allclose(c.numpy(), a.numpy() + b.numpy())

為了對比這個樸素版本的自定義向量加法與 numpy 的速度差異,創(chuàng)建一個輔助函數(shù)來運行 TVM 生成代碼的 profile。

import timeitnp_repeat = 100 np_running_time = timeit.timeit(setup="import numpy\n""n = 32768\n"'dtype = "float32"\n'"a = numpy.random.rand(n, 1).astype(dtype)\n""b = numpy.random.rand(n, 1).astype(dtype)\n",stmt="answer = a + b",number=np_repeat, ) print("Numpy running time: %f" % (np_running_time / np_repeat))def evaluate_addition(func, target, optimization, log):dev = tvm.device(target.kind.name, 0)n = 32768a = tvm.nd.array(np.random.uniform(size=n).astype(A.dtype), dev)b = tvm.nd.array(np.random.uniform(size=n).astype(B.dtype), dev)c = tvm.nd.array(np.zeros(n, dtype=C.dtype), dev)evaluator = func.time_evaluator(func.entry_name, dev, number=10)mean_time = evaluator(a, b, c).meanprint("%s: %f" % (optimization, mean_time))log.append((optimization, mean_time))log = [("numpy", np_running_time / np_repeat)] evaluate_addition(fadd, tgt, "naive", log=log)

此處輸出:

Numpy running time: 0.000008 naive: 0.000006

使用并行性(paralleism)來優(yōu)化 schedule

我們已經(jīng)說明了 TE 的基本原理,現(xiàn)在讓我們更深入地了解 schedule 的作用,以及它們?nèi)绾斡糜趦?yōu)化不同體系結(jié)構(gòu)的張量表達式。schedule 是應(yīng)用于表達式的一系列步驟,用于以多種不同方式對其進行轉(zhuǎn)換。當(dāng)一個 schedule 應(yīng)用于TE中的一個表達式時,輸入和輸出保持不變,但在編譯時,表達式的實現(xiàn)可能會改變。在默認 schedule 中,這個張量加法是串行運行的,但該操作其實是很容易在所有處理器線程之間并行。我們可以將我們的操作并行調(diào)度到計算中:

s[C].parallel(C.op.axis[0])

tvm.lower 命令將生成 TE 的中間表示(IR)以及相應(yīng)的 schedule 。通過在執(zhí)行不同的 schedule 操作時 lowing 表達式,我們可以看到 schedule 對計算順序的影響。我們使用標(biāo)志 simple_mode=True 返回可讀的 C 風(fēng)格語句。

print(tvm.lower(s, [A, B, C], simple_mode=True))

此處輸出:

primfn(A_1: handle, B_1: handle, C_1: handle) -> ()attr = {"from_legacy_te_schedule": True, "global_symbol": "main", "tir.noalias": True}buffers = {C: Buffer(C_2: Pointer(float32), float32, [n: int32], [stride: int32], type="auto"),A: Buffer(A_2: Pointer(float32), float32, [n], [stride_1: int32], type="auto"),B: Buffer(B_2: Pointer(float32), float32, [n], [stride_2: int32], type="auto")}buffer_map = {A_1: A, B_1: B, C_1: C} {for (i: int32, 0, n) "parallel" {C_2[(i*stride)] = ((float32*)A_2[(i*stride_1)] + (float32*)B_2[(i*stride_2)])} }

TVM現(xiàn)在可以在獨立的線程上運行這些塊。我們在執(zhí)行并行操作的情況下編譯并運行這個新的 schedule:

fadd_parallel = tvm.build(s, [A, B, C], tgt, name="myadd_parallel") fadd_parallel(a, b, c)tvm.testing.assert_allclose(c.numpy(), a.numpy() + b.numpy())evaluate_addition(fadd_parallel, tgt, "parallel", log=log)

此處輸出:

parallel: 0.000005

使用矢量化(vectorization)來優(yōu)化 schedule

現(xiàn)代 CPU 能夠?qū)Ω↑c數(shù)進行 SIMD 操作,我們可以對計算表達式使用另一個 schedule 來利用這一點。實現(xiàn)這一點需要多個步驟:首先,我們必須使用 split scheduling 原語將 schedule 拆分為內(nèi)部循環(huán)和外部循環(huán)。內(nèi)部循環(huán)可以使用向量化來使用使用向量化調(diào)度原語的 SIMD 指令,然后外部循環(huán)可以使用并行調(diào)度原語進行并行化。選擇分割因子作為CPU上的線程數(shù)。

注:SIMD,全稱 Single Instruction Multiple Data,單指令多數(shù)據(jù)流,能夠復(fù)制多個操作數(shù),并把它們打包在大型寄存器的一組指令集。

# 由于我們需要修改之前例子中的并行操作,因此這里要重建 schedule n = te.var("n") A = te.placeholder((n,), name="A") B = te.placeholder((n,), name="B") C = te.compute(A.shape, lambda i: A[i] + B[i], name="C")s = te.create_schedule(C.op)# factor 的選擇需要適合你的線程數(shù),這取決于架構(gòu), # 建議將此系數(shù)設(shè)置為等于可用CPU核心數(shù)。 factor = 4outer, inner = s[C].split(C.op.axis[0], factor=factor) s[C].parallel(outer) s[C].vectorize(inner)fadd_vector = tvm.build(s, [A, B, C], tgt, name="myadd_parallel")evaluate_addition(fadd_vector, tgt, "vector", log=log)print(tvm.lower(s, [A, B, C], simple_mode=True))

此處輸出:

vector: 0.000016 primfn(A_1: handle, B_1: handle, C_1: handle) -> ()attr = {"from_legacy_te_schedule": True, "global_symbol": "main", "tir.noalias": True}buffers = {A: Buffer(A_2: Pointer(float32), float32, [n: int32], [stride: int32], type="auto"),C: Buffer(C_2: Pointer(float32), float32, [n], [stride_1: int32], type="auto"),B: Buffer(B_2: Pointer(float32), float32, [n], [stride_2: int32], type="auto")}buffer_map = {A_1: A, B_1: B, C_1: C} {for (i.outer: int32, 0, floordiv((n + 3), 4)) "parallel" {for (i.inner.s: int32, 0, 4) {if @tir.likely((((i.outer*4) + i.inner.s) < n), dtype=bool) {C_2[(((i.outer*4) + i.inner.s)*stride_1)] = ((float32*)A_2[(((i.outer*4) + i.inner.s)*stride)] + (float32*)B_2[(((i.outer*4) + i.inner.s)*stride_2)])}}} }

對比不同的 schedule

下面我們來對比以下之前提到的不同 schedule:

baseline = log[0][1] print("%s\t%s\t%s" % ("Operator".rjust(20), "Timing".rjust(20), "Performance".rjust(20))) for result in log:print("%s\t%s\t%s"% (result[0].rjust(20), str(result[1]).rjust(20), str(result[1] / baseline).rjust(20)))

此處輸出:

Operator Timing Performancenumpy 7.98278022557497e-06 1.0naive 5.9189e-06 0.7414584684465222 parallel 4.9771999999999995e-06 0.6234920490550659vector 1.6127399999999997e-05 2.0202735819196875

注意:Code Specialization

代碼專門化

正如我們所看到的,A、B 和 C 的聲明都采用相同的形狀參數(shù) n。TVM將利用這一點,只向 kernel 傳遞一個 shape 參數(shù),我們在打印的設(shè)備代碼中找到它。這是專門化化的一種形式。

在 host 端,TVM 將自動生成檢查代碼,以檢查參數(shù)中的約束。因此,如果將具有不同形狀的數(shù)組傳遞到 fadd 中,將引發(fā)錯誤。

我們可以做更多的專門化。例如,我們可以在計算聲明中寫入n=tvm.runtime.convert(1024)而不是 n=te.var(“n”)。生成的函數(shù)將只獲取長度為1024的向量。

我們已經(jīng)定義、調(diào)度并編譯了一個向量加法運算符,然后可以在 TVM Runtime 執(zhí)行它。我們可以將算子保存為庫,稍后可以使用 TVM Runtime 加載該庫。

針對GPU的矩陣加法(可選)

在介紹保存與加載自定義算子庫的方法之前,我們先來看一下如何針對 GPU 做矩陣加法。

TVM能夠針對多種體系結(jié)構(gòu)。在本例,我們將針對GPU中矢量加法的編譯。

# 本段代碼默認不運行,如果想要運行的話,請將 ``run_cuda = True``run_cuda = False if run_cuda:# 這里的 target 需要根據(jù)自己的 GPU 類型修改:# NVIDIA:cuda# Radeon:rocm# OpenCL:opencltgt_gpu = tvm.target.Target(target="cuda", host="llvm")# 重建 schedulen = te.var("n")A = te.placeholder((n,), name="A")B = te.placeholder((n,), name="B")C = te.compute(A.shape, lambda i: A[i] + B[i], name="C")print(type(C))s = te.create_schedule(C.op)bx, tx = s[C].split(C.op.axis[0], factor=64)################################################################################# 最后,我們必須將迭代軸bx和tx綁定到GPU計算網(wǎng)格中的線程。# 樸素的 schedule 對GPU無效,這些是允許我們生成在GPU上運行的代碼的特定構(gòu)造。s[C].bind(bx, te.thread_axis("blockIdx.x"))s[C].bind(tx, te.thread_axis("threadIdx.x"))####################################################################### 編譯# -----------# 在指定完 schdule 之后,我們可以將其編譯成一個 TVM 函數(shù)。默認情況下,TVM編譯成一個 type-erased 函 # 數(shù),可以從python端直接調(diào)用該函數(shù)。# 在下一行中,我們使用 tvm.build 來創(chuàng)建一個函數(shù)。build 函數(shù)采用 schedule、函數(shù)所需的簽名(包括輸如和輸出)以及我們要編譯到的目標(biāo)語言。# 編譯 fadd 的結(jié)果是一個GPU設(shè)備函數(shù)(如果涉及GPU)以及一個調(diào)用 GPU 函數(shù)的 host wrapper。fadd是生成的主機包裝函數(shù),它在內(nèi)部包含對生成的設(shè)備函數(shù)的引用。fadd = tvm.build(s, [A, B, C], target=tgt_gpu, name="myadd")################################################################################# 編譯過的 TVM 函數(shù)會有一個簡潔的 C API,它可以被任意的語言調(diào)用## 我們提供一個 Python 的最小的數(shù)組 API 來幫助快速的測試和原型化# 該數(shù)組 API 是基于 `DLPack <https://github.com/dmlc/dlpack>`_ 標(biāo)準(zhǔn).## - 我們首先創(chuàng)建一個 GPU 設(shè)備# - 然后 tvm.nd.array 從 GPU 拷貝數(shù)據(jù)# - ``fadd`` 運行真正的計算# - ``numpy()`` 從 GPU 數(shù)組拷貝回 CPU (這樣我們就能驗證正確性了).## 請注意,將數(shù)據(jù)復(fù)制到 GPU 上的內(nèi)存和從中復(fù)制數(shù)據(jù)是必需的步驟。dev = tvm.device(tgt_gpu.kind.name, 0)n = 1024a = tvm.nd.array(np.random.uniform(size=n).astype(A.dtype), dev)b = tvm.nd.array(np.random.uniform(size=n).astype(B.dtype), dev)c = tvm.nd.array(np.zeros(n, dtype=C.dtype), dev)fadd(a, b, c)tvm.testing.assert_allclose(c.numpy(), a.numpy() + b.numpy())################################################################################# 檢查生成的 GPU 代碼# ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~# 我們可以檢查在 TVM 中生成的代碼,tvm.build 的結(jié)果是一個 TVM 模塊。fadd 是一個 host 模塊其中包含 # host wrapper 的 host module,它同樣包含一個CUDA(GPU)設(shè)備模塊## 下面的代碼取得設(shè)備模塊并打印內(nèi)容代碼if (tgt_gpu.kind.name == "cuda"or tgt_gpu.kind.name == "rocm"or tgt_gpu.kind.name.startswith("opencl")):dev_module = fadd.imported_modules[0]print("-----GPU code-----")print(dev_module.get_source())else:print(fadd.get_source())

保存和加載編譯過的模塊

保存編譯過的模塊

除了運行時編譯之外,我們還可以將編譯后的模塊保存到一個文件中,并在以后重新加載。下面的代碼執(zhí)行以下步驟:

  • 它將編譯后的主機模塊保存到一個對象文件中。
  • 然后將設(shè)備模塊保存到 ptx 文件中。
  • cc.create_shared 調(diào)用編譯器(gcc)來創(chuàng)建共享庫
from tvm.contrib import cc from tvm.contrib import utilstemp = utils.tempdir() fadd.save(temp.relpath("myadd.o")) if tgt.kind.name == "cuda":fadd.imported_modules[0].save(temp.relpath("myadd.ptx")) if tgt.kind.name == "rocm":fadd.imported_modules[0].save(temp.relpath("myadd.hsaco")) if tgt.kind.name.startswith("opencl"):fadd.imported_modules[0].save(temp.relpath("myadd.cl")) cc.create_shared(temp.relpath("myadd.so"), [temp.relpath("myadd.o")]) print(temp.listdir())

此處輸出:

['myadd.o', 'myadd.so']

注意:Module Storage Format

模塊存儲格式

CPU(Host)模塊直接保存為共享庫(.so)。設(shè)備代碼可以有多種自定義格式。在我們的示例中,設(shè)備代碼存儲在 ptx 中,元數(shù)據(jù)在 json 文件中。它們可以通過導(dǎo)入單獨加載和鏈接。

加載編譯過的模塊

我們可以從文件系統(tǒng)加載已編譯的模塊并運行代碼。以下代碼分別加載主機和設(shè)備模塊,并將它們鏈接在一起。我們可以驗證新加載的函數(shù)是否有效。

fadd1 = tvm.runtime.load_module(temp.relpath("myadd.so")) if tgt.kind.name == "cuda":fadd1_dev = tvm.runtime.load_module(temp.relpath("myadd.ptx"))fadd1.import_module(fadd1_dev)if tgt.kind.name == "rocm":fadd1_dev = tvm.runtime.load_module(temp.relpath("myadd.hsaco"))fadd1.import_module(fadd1_dev)if tgt.kind.name.startswith("opencl"):fadd1_dev = tvm.runtime.load_module(temp.relpath("myadd.cl"))fadd1.import_module(fadd1_dev)fadd1(a, b, c) tvm.testing.assert_allclose(c.numpy(), a.numpy() + b.numpy())

將所有東西打包在一個庫中

在上面的示例中,我們分別存儲設(shè)備和主機代碼。TVM 還支持將所有內(nèi)容導(dǎo)出為一個共享庫。在 hood 下,我們將設(shè)備模塊打包成二進制blob,并將它們與主機代碼鏈接在一起。目前我們支持Metal、OpenCL和CUDA模塊的包裝。

fadd.export_library(temp.relpath("myadd_pack.so")) fadd2 = tvm.runtime.load_module(temp.relpath("myadd_pack.so")) fadd2(a, b, c) tvm.testing.assert_allclose(c.numpy(), a.numpy() + b.numpy())

注意:Runtime API and Thread Safety

運行時API與線程安全

TVM 的編譯模塊并不依賴于 TVM 編譯器。它們只依賴于最小 Runtime Library。TVM Runtime Library 包裝設(shè)備驅(qū)動程序,并向編譯函數(shù)提供線程安全和設(shè)備無關(guān)調(diào)用。

這意味著我們可以從任何GPU上的任何線程調(diào)用已編譯的TVM函數(shù),前提是您已經(jīng)為該GPU編譯了代碼。

生成OpenCL代碼

TVM 為多種后端提供代碼生成功能。我們還可以生成在 CPU 后端上運行的 OpenCL 代碼或 LLVM 代碼。

下面的代碼可以生成OpenCL代碼,在OpenCL設(shè)備上創(chuàng)建數(shù)組,并驗證代碼的正確性。

if tgt.kind.name.startswith("opencl"):fadd_cl = tvm.build(s, [A, B, C], tgt, name="myadd")print("------opencl code------")print(fadd_cl.imported_modules[0].get_source())dev = tvm.cl(0)n = 1024a = tvm.nd.array(np.random.uniform(size=n).astype(A.dtype), dev)b = tvm.nd.array(np.random.uniform(size=n).astype(B.dtype), dev)c = tvm.nd.array(np.zeros(n, dtype=C.dtype), dev)fadd_cl(a, b, c)tvm.testing.assert_allclose(c.numpy(), a.numpy() + b.numpy())

注意:TE Scheduling Primitives

TE 調(diào)度原語

TVM 包括許多不同的調(diào)度原語:
split:按定義的因子將指定軸拆分為兩個軸。
tile:平鋪將按定義的因子沿兩個軸分割計算。
fuse:融合一次計算的兩個連續(xù)軸。
reorder:可以將計算軸重新排序為定義的順序。
bind:可以將計算綁定到特定線程,在GPU編程中很有用。
compute_at:默認情況下,TVM將在函數(shù)的最外層或根計算張量。compute_at指定應(yīng)在另一個運算符的第一個計算軸上計算一個張量。
compute_inline:當(dāng)標(biāo)記為inline時,計算將展開,然后插入到需要張量的地址中。
compute_root:將計算移動到函數(shù)的最外層或根。這意味著,在進入下一個階段之前,將對計算階段進行完全計算。

可以在Schedule primitives 文檔頁面中找到這些原語的完整描述。

示例二:用TE手動優(yōu)化矩陣乘

現(xiàn)在,我們將考慮第二個更高級一些的示例,演示如何用 18 行 Python 代碼 TVM 加速一個共同的矩陣乘法運算 18倍。

矩陣乘法是一種計算密集型運算。要獲得良好的CPU性能,有兩個重要的優(yōu)化:

  • 提高內(nèi)存訪問的緩存命中率。高緩存命中率可以加速復(fù)雜的數(shù)值計算和熱點內(nèi)存訪問。這要求我們將源內(nèi)存訪問模式轉(zhuǎn)換為適合緩存策略的模式。
  • SIMD(單指令多數(shù)據(jù)),也稱為矢量處理單元。在每個循環(huán)中,SIMD 都可以處理一小批數(shù)據(jù),而不是處理單個值。這要求我們以統(tǒng)一模式轉(zhuǎn)換循環(huán)體中的數(shù)據(jù)訪問模式,以便LLVM 后端可以將其 lower 到 SIMD。

本教程中使用的技術(shù)是這個倉庫中提到的技巧的一部分。其中一些已被 TVM 抽象自動使用,但由于 TVM 的一些約束,有一些無法自動使用。

準(zhǔn)備工作和性能baseline

我們首先采集 numpy 實現(xiàn)的矩陣乘的數(shù)據(jù):

import tvm import tvm.testing from tvm import te import numpy# 矩陣的尺寸: # (M, K) x (K, N) # 你可以自己試一些不同的尺寸,有時候 TVM 的優(yōu)化結(jié)果會好于含 MKL 的numpy M = 1024 K = 1024 N = 1024# tvm 中默認的數(shù)據(jù)類型 dtype = "float32"# 與之前一樣,這里可以根據(jù)自己的處理器及其是否支持某些指令集來改變 targettarget = tvm.target.Target(target="llvm", host="llvm") dev = tvm.device(target.kind.name, 0)# 隨機生成一些 tensor 用于測試 a = tvm.nd.array(numpy.random.rand(M, K).astype(dtype), dev) b = tvm.nd.array(numpy.random.rand(K, N).astype(dtype), dev)# 重復(fù)實驗,得到 numpy 的矩陣乘實現(xiàn)的 baseline np_repeat = 100 np_running_time = timeit.timeit(setup="import numpy\n""M = " + str(M) + "\n""K = " + str(K) + "\n""N = " + str(N) + "\n"'dtype = "float32"\n'"a = numpy.random.rand(M, K).astype(dtype)\n""b = numpy.random.rand(K, N).astype(dtype)\n",stmt="answer = numpy.dot(a, b)",number=np_repeat, ) print("Numpy running time: %f" % (np_running_time / np_repeat))answer = numpy.dot(a.numpy(), b.numpy())

此處輸出:

Numpy running time: 0.009308

現(xiàn)在,我們用 TVM TE 編寫一個基本矩陣乘法,并驗證它產(chǎn)生的結(jié)果與numpy實現(xiàn)相同。我們還編寫了一個函數(shù),它將幫助我們度量進度優(yōu)化的性能。

# 使用 TE 實現(xiàn)的 TVM 的矩陣乘 k = te.reduce_axis((0, K), "k") A = te.placeholder((M, K), name="A") B = te.placeholder((K, N), name="B") C = te.compute((M, N), lambda x, y: te.sum(A[x, k] * B[k, y], axis=k), name="C")# 默認 schedule s = te.create_schedule(C.op) func = tvm.build(s, [A, B, C], target=target, name="mmult")c = tvm.nd.array(numpy.zeros((M, N), dtype=dtype), dev) func(a, b, c) tvm.testing.assert_allclose(c.numpy(), answer, rtol=1e-5)def evaluate_operation(s, vars, target, name, optimization, log):func = tvm.build(s, [A, B, C], target=target, name="mmult")assert funcc = tvm.nd.array(numpy.zeros((M, N), dtype=dtype), dev)func(a, b, c)tvm.testing.assert_allclose(c.numpy(), answer, rtol=1e-5)evaluator = func.time_evaluator(func.entry_name, dev, number=10)mean_time = evaluator(a, b, c).meanprint("%s: %f" % (optimization, mean_time))log.append((optimization, mean_time))log = []evaluate_operation(s, [A, B, C], target=target, name="mmult", optimization="none", log=log)

此處輸出:

none: 3.109406

讓我們看一下使用 TVM lower 函數(shù)的算子和默認 schedule 的中間表示 IR。請注意,該實現(xiàn)本質(zhì)上是矩陣乘法的簡單實現(xiàn),在 A 和 B 矩陣的索引上使用三個嵌套循環(huán)。

print(tvm.lower(s, [A, B, C], simple_mode=True))

此處輸出:

primfn(A_1: handle, B_1: handle, C_1: handle) -> ()attr = {"from_legacy_te_schedule": True, "global_symbol": "main", "tir.noalias": True}buffers = {C: Buffer(C_2: Pointer(float32), float32, [1024, 1024], []),A: Buffer(A_2: Pointer(float32), float32, [1024, 1024], []),B: Buffer(B_2: Pointer(float32), float32, [1024, 1024], [])}buffer_map = {A_1: A, B_1: B, C_1: C} {for (x: int32, 0, 1024) {for (y: int32, 0, 1024) {C_2[((x*1024) + y)] = 0f32for (k: int32, 0, 1024) {C_2[((x*1024) + y)] = ((float32*)C_2[((x*1024) + y)] + ((float32*)A_2[((x*1024) + k)]*(float32*)B_2[((k*1024) + y)]))}}} }

優(yōu)化1:blocking阻塞

提高緩存命中率的一個重要技巧是阻塞,在這種情況下,我們可以構(gòu)造內(nèi)存訪問,使塊內(nèi)部是具有高內(nèi)存局部性的小鄰域。在本教程中,我們選擇塊因子 32。這會使得一個塊填充內(nèi)存的 32*32*sizeof(float)區(qū)域。這對應(yīng)于 4KB 的緩存大小,和一級緩存 32KB 的參考緩存大小。

我們首先為 C 操作創(chuàng)建一個默認的調(diào)度,然后使用指定的塊因子對其應(yīng)用一個 tile 調(diào)度原語,調(diào)度原語以向量 [x_-outer,y_-outer,x_-inner,y_-inner] 的形式返回從最外層到最內(nèi)層的循環(huán)順序。然后,我們得到操作輸出的縮減軸,并使用因子4對其執(zhí)行拆分操作。這個因素不會直接影響我們現(xiàn)在正在進行的阻塞優(yōu)化,但在以后應(yīng)用矢量化時會很有用。
現(xiàn)在操作已被阻塞,我們可以對計算進行重新排序,將簡化操作放入計算的最外層循環(huán)中,從而幫助確保被阻塞的數(shù)據(jù)仍保留在緩存中。這就完成了 schedule,我們可以構(gòu)建和測試與原始 schedule 相比的性能。

bn = 32# Blocking by loop tiling xo, yo, xi, yi = s[C].tile(C.op.axis[0], C.op.axis[1], bn, bn) (k,) = s[C].op.reduce_axis ko, ki = s[C].split(k, factor=4)# Hoist reduction domain outside the blocking loop s[C].reorder(xo, yo, ko, ki, xi, yi)evaluate_operation(s, [A, B, C], target=target, name="mmult", optimization="blocking", log=log)

此處輸出:

blocking: 0.291928

通過重新排序計算以利用緩存,我們可以看到計算性能的顯著提高。現(xiàn)在,打印內(nèi)部表示并將其與原始表示進行比較:

print(tvm.lower(s, [A, B, C], simple_mode=True))

此處輸出:

primfn(A_1: handle, B_1: handle, C_1: handle) -> ()attr = {"from_legacy_te_schedule": True, "global_symbol": "main", "tir.noalias": True}buffers = {A: Buffer(A_2: Pointer(float32), float32, [1024, 1024], []),C: Buffer(C_2: Pointer(float32), float32, [1024, 1024], []),B: Buffer(B_2: Pointer(float32), float32, [1024, 1024], [])}buffer_map = {A_1: A, B_1: B, C_1: C} {for (x.outer: int32, 0, 32) {for (y.outer: int32, 0, 32) {for (x.inner.init: int32, 0, 32) {for (y.inner.init: int32, 0, 32) {C_2[((((x.outer*32768) + (x.inner.init*1024)) + (y.outer*32)) + y.inner.init)] = 0f32}}for (k.outer: int32, 0, 256) {for (k.inner: int32, 0, 4) {for (x.inner: int32, 0, 32) {for (y.inner: int32, 0, 32) {C_2[((((x.outer*32768) + (x.inner*1024)) + (y.outer*32)) + y.inner)] = ((float32*)C_2[((((x.outer*32768) + (x.inner*1024)) + (y.outer*32)) + y.inner)] + ((float32*)A_2[((((x.outer*32768) + (x.inner*1024)) + (k.outer*4)) + k.inner)]*(float32*)B_2[((((k.outer*4096) + (k.inner*1024)) + (y.outer*32)) + y.inner)]))}}}}}} }

優(yōu)化2: vectorization矢量化

另一個重要的優(yōu)化技巧是矢量化。當(dāng)內(nèi)存訪問模式一致時,編譯器可以檢測到該模式并將連續(xù)內(nèi)存?zhèn)鬟f給 SIMD 向量處理器。在TVM中,我們可以利用這個硬件特性,使用矢量化接口來提示編譯器這個模式。

在本教程中,我們選擇對內(nèi)部循環(huán)行數(shù)據(jù)進行矢量化,因為它已經(jīng)是我們之前優(yōu)化中的緩存友好型數(shù)據(jù)。

# 應(yīng)用矢量化的優(yōu)化方式 s[C].vectorize(yi)evaluate_operation(s, [A, B, C], target=target, name="mmult", optimization="vectorization", log=log)# 矢量化之后生成的 IR print(tvm.lower(s, [A, B, C], simple_mode=True))

此處輸出:

vectorization: 0.331263 primfn(A_1: handle, B_1: handle, C_1: handle) -> ()attr = {"from_legacy_te_schedule": True, "global_symbol": "main", "tir.noalias": True}buffers = {C: Buffer(C_2: Pointer(float32), float32, [1024, 1024], []),A: Buffer(A_2: Pointer(float32), float32, [1024, 1024], []),B: Buffer(B_2: Pointer(float32), float32, [1024, 1024], [])}buffer_map = {A_1: A, B_1: B, C_1: C} {for (x.outer: int32, 0, 32) {for (y.outer: int32, 0, 32) {for (x.inner.init: int32, 0, 32) {C_2[ramp((((x.outer*32768) + (x.inner.init*1024)) + (y.outer*32)), 1, 32)] = broadcast(0f32, 32)}for (k.outer: int32, 0, 256) {for (k.inner: int32, 0, 4) {for (x.inner: int32, 0, 32) {C_2[ramp((((x.outer*32768) + (x.inner*1024)) + (y.outer*32)), 1, 32)] = ((float32x32*)C_2[ramp((((x.outer*32768) + (x.inner*1024)) + (y.outer*32)), 1, 32)] + (broadcast((float32*)A_2[((((x.outer*32768) + (x.inner*1024)) + (k.outer*4)) + k.inner)], 32)*(float32x32*)B_2[ramp((((k.outer*4096) + (k.inner*1024)) + (y.outer*32)), 1, 32)]))}}}}} }

優(yōu)化3:Loop Permutation循環(huán)置換

如果我們看一下上面的 IR,我們可以看到內(nèi)環(huán)行數(shù)據(jù)被矢量化,B 被轉(zhuǎn)換成 PackedB(這在內(nèi)環(huán)的(float32x32)B2部分中很明顯)。PackedB 的遍歷現(xiàn)在是順序的。因此,我們將研究 A 的訪問模式。在當(dāng)前 schdule中,A 是逐列訪問的,這對緩存不友好。如果我們改變嵌套循環(huán)順序 ki 和內(nèi)部軸 xi,對 A 的訪問模式將變得更加緩存友好。

s = te.create_schedule(C.op) xo, yo, xi, yi = s[C].tile(C.op.axis[0], C.op.axis[1], bn, bn) (k,) = s[C].op.reduce_axis ko, ki = s[C].split(k, factor=4)# re-ordering s[C].reorder(xo, yo, ko, xi, ki, yi) s[C].vectorize(yi)evaluate_operation(s, [A, B, C], target=target, name="mmult", optimization="loop permutation", log=log )# 再一次打印新生成的 IR print(tvm.lower(s, [A, B, C], simple_mode=True))

此處輸出:

loop permutation: 0.113750 primfn(A_1: handle, B_1: handle, C_1: handle) -> ()attr = {"from_legacy_te_schedule": True, "global_symbol": "main", "tir.noalias": True}buffers = {C: Buffer(C_2: Pointer(float32), float32, [1024, 1024], []),A: Buffer(A_2: Pointer(float32), float32, [1024, 1024], []),B: Buffer(B_2: Pointer(float32), float32, [1024, 1024], [])}buffer_map = {A_1: A, B_1: B, C_1: C} {for (x.outer: int32, 0, 32) {for (y.outer: int32, 0, 32) {for (x.inner.init: int32, 0, 32) {C_2[ramp((((x.outer*32768) + (x.inner.init*1024)) + (y.outer*32)), 1, 32)] = broadcast(0f32, 32)}for (k.outer: int32, 0, 256) {for (x.inner: int32, 0, 32) {for (k.inner: int32, 0, 4) {C_2[ramp((((x.outer*32768) + (x.inner*1024)) + (y.outer*32)), 1, 32)] = ((float32x32*)C_2[ramp((((x.outer*32768) + (x.inner*1024)) + (y.outer*32)), 1, 32)] + (broadcast((float32*)A_2[((((x.outer*32768) + (x.inner*1024)) + (k.outer*4)) + k.inner)], 32)*(float32x32*)B_2[ramp((((k.outer*4096) + (k.inner*1024)) + (y.outer*32)), 1, 32)]))}}}}} }

優(yōu)化4:Array Packing數(shù)組打包

另一個重要技巧是數(shù)組打包。此技巧是對陣列的存儲維度重新排序,以便在展平后將特定維度上的連續(xù)訪問模式轉(zhuǎn)換為序列模式。

如上圖所示,在阻塞計算后,我們可以觀察到 B 的陣列訪問模式(平坦后),它是規(guī)則的但不連續(xù)的。我們希望經(jīng)過一些轉(zhuǎn)換后,我們可以得到一個連續(xù)的訪問模式。通過將[16][16]數(shù)組重新排序為[16/4][16][4]數(shù)組,在從壓縮數(shù)組中獲取相應(yīng)值時,B 的訪問模式將是順序的。

為了實現(xiàn)這一點,我們必須從一個新的默認 schedule 開始,考慮到 B 的新 wrapper?;c時間對此進行討論是值得的:TE 是一種用于編寫優(yōu)化算子的功能強大的表達性語言,但它通常需要一些底層算法、數(shù)據(jù)結(jié)構(gòu),以及您正在編寫的硬件 target。在本教程的后面,我們將討論讓 TVM 承擔(dān)這一負擔(dān)的一些選擇。不管怎樣,讓我們繼續(xù)新的優(yōu)化 schedule。

# 我們要輕微地重寫算法 packedB = te.compute((N / bn, K, bn), lambda x, y, z: B[y, x * bn + z], name="packedB") C = te.compute((M, N),lambda x, y: te.sum(A[x, k] * packedB[y // bn, k, tvm.tir.indexmod(y, bn)], axis=k),name="C", )s = te.create_schedule(C.op)xo, yo, xi, yi = s[C].tile(C.op.axis[0], C.op.axis[1], bn, bn) (k,) = s[C].op.reduce_axis ko, ki = s[C].split(k, factor=4)s[C].reorder(xo, yo, ko, xi, ki, yi) s[C].vectorize(yi)x, y, z = s[packedB].op.axis s[packedB].vectorize(z) s[packedB].parallel(x)evaluate_operation(s, [A, B, C], target=target, name="mmult", optimization="array packing", log=log)# 這里是數(shù)組打包之后生成的 IR print(tvm.lower(s, [A, B, C], simple_mode=True))

此處輸出:

array packing: 0.224114 primfn(A_1: handle, B_1: handle, C_1: handle) -> ()attr = {"from_legacy_te_schedule": True, "global_symbol": "main", "tir.noalias": True}buffers = {C: Buffer(C_2: Pointer(float32), float32, [1024, 1024], []),A: Buffer(A_2: Pointer(float32), float32, [1024, 1024], []),B: Buffer(B_2: Pointer(float32), float32, [1024, 1024], [])}buffer_map = {A_1: A, B_1: B, C_1: C} {allocate(packedB: Pointer(global float32x32), float32x32, [32768]), storage_scope = global {for (x: int32, 0, 32) "parallel" {for (y: int32, 0, 1024) {packedB[ramp(((x*32768) + (y*32)), 1, 32)] = (float32x32*)B_2[ramp(((y*1024) + (x*32)), 1, 32)]}}for (x.outer: int32, 0, 32) {for (y.outer: int32, 0, 32) {for (x.inner.init: int32, 0, 32) {C_2[ramp((((x.outer*32768) + (x.inner.init*1024)) + (y.outer*32)), 1, 32)] = broadcast(0f32, 32)}for (k.outer: int32, 0, 256) {for (x.inner: int32, 0, 32) {for (k.inner: int32, 0, 4) {C_2[ramp((((x.outer*32768) + (x.inner*1024)) + (y.outer*32)), 1, 32)] = ((float32x32*)C_2[ramp((((x.outer*32768) + (x.inner*1024)) + (y.outer*32)), 1, 32)] + (broadcast((float32*)A_2[((((x.outer*32768) + (x.inner*1024)) + (k.outer*4)) + k.inner)], 32)*(float32x32*)packedB[ramp((((y.outer*32768) + (k.outer*128)) + (k.inner*32)), 1, 32)]))}}}}}} }

優(yōu)化5:Optimizing Block Writing Through Caching通過緩存優(yōu)化塊寫入

到目前為止,我們所有的優(yōu)化都集中在高效地訪問和計算來自 A 和 B 矩陣的數(shù)據(jù),以計算C矩陣。阻塞優(yōu)化后,操作員將結(jié)果逐塊寫入 C,并且訪問模式不是順序的。我們可以通過使用順序緩存數(shù)組來解決這個問題,使用cache_write、compute_at 和 unroll 的組合來保存塊結(jié)果,并在所有塊結(jié)果就緒時寫入到 C。

s = te.create_schedule(C.op)# Allocate write cache CC = s.cache_write(C, "global")xo, yo, xi, yi = s[C].tile(C.op.axis[0], C.op.axis[1], bn, bn)# Write cache is computed at yo s[CC].compute_at(s[C], yo)# New inner axes xc, yc = s[CC].op.axis(k,) = s[CC].op.reduce_axis ko, ki = s[CC].split(k, factor=4) s[CC].reorder(ko, xc, ki, yc) s[CC].unroll(ki) s[CC].vectorize(yc)x, y, z = s[packedB].op.axis s[packedB].vectorize(z) s[packedB].parallel(x)evaluate_operation(s, [A, B, C], target=target, name="mmult", optimization="block caching", log=log)# Here is the generated IR after write cache blocking. print(tvm.lower(s, [A, B, C], simple_mode=True))

此處輸出:

block caching: 0.224213 primfn(A_1: handle, B_1: handle, C_1: handle) -> ()attr = {"from_legacy_te_schedule": True, "global_symbol": "main", "tir.noalias": True}buffers = {C: Buffer(C_2: Pointer(float32), float32, [1024, 1024], []),A: Buffer(A_2: Pointer(float32), float32, [1024, 1024], []),B: Buffer(B_2: Pointer(float32), float32, [1024, 1024], [])}buffer_map = {A_1: A, B_1: B, C_1: C} {allocate(packedB: Pointer(global float32x32), float32x32, [32768]), storage_scope = global;allocate(C.global: Pointer(global float32), float32, [1024]), storage_scope = global {for (x: int32, 0, 32) "parallel" {for (y: int32, 0, 1024) {packedB[ramp(((x*32768) + (y*32)), 1, 32)] = (float32x32*)B_2[ramp(((y*1024) + (x*32)), 1, 32)]}}for (x.outer: int32, 0, 32) {for (y.outer: int32, 0, 32) {for (x.c.init: int32, 0, 32) {C.global[ramp((x.c.init*32), 1, 32)] = broadcast(0f32, 32)}for (k.outer: int32, 0, 256) {for (x.c: int32, 0, 32) {C.global[ramp((x.c*32), 1, 32)] = ((float32x32*)C.global[ramp((x.c*32), 1, 32)] + (broadcast((float32*)A_2[(((x.outer*32768) + (x.c*1024)) + (k.outer*4))], 32)*(float32x32*)packedB[ramp(((y.outer*32768) + (k.outer*128)), 1, 32)]))C.global[ramp((x.c*32), 1, 32)] = ((float32x32*)C.global[ramp((x.c*32), 1, 32)] + (broadcast((float32*)A_2[((((x.outer*32768) + (x.c*1024)) + (k.outer*4)) + 1)], 32)*(float32x32*)packedB[ramp((((y.outer*32768) + (k.outer*128)) + 32), 1, 32)]))C.global[ramp((x.c*32), 1, 32)] = ((float32x32*)C.global[ramp((x.c*32), 1, 32)] + (broadcast((float32*)A_2[((((x.outer*32768) + (x.c*1024)) + (k.outer*4)) + 2)], 32)*(float32x32*)packedB[ramp((((y.outer*32768) + (k.outer*128)) + 64), 1, 32)]))C.global[ramp((x.c*32), 1, 32)] = ((float32x32*)C.global[ramp((x.c*32), 1, 32)] + (broadcast((float32*)A_2[((((x.outer*32768) + (x.c*1024)) + (k.outer*4)) + 3)], 32)*(float32x32*)packedB[ramp((((y.outer*32768) + (k.outer*128)) + 96), 1, 32)]))}}for (x.inner: int32, 0, 32) {for (y.inner: int32, 0, 32) {C_2[((((x.outer*32768) + (x.inner*1024)) + (y.outer*32)) + y.inner)] = (float32*)C.global[((x.inner*32) + y.inner)]}}}}} }

優(yōu)化6:Parallelization并行化

# 并行 s[C].parallel(xo)x, y, z = s[packedB].op.axis s[packedB].vectorize(z) s[packedB].parallel(x)evaluate_operation(s, [A, B, C], target=target, name="mmult", optimization="parallelization", log=log )# 這里是并行化之后的 IR print(tvm.lower(s, [A, B, C], simple_mode=True))

此處輸出:

parallelization: 0.067949 primfn(A_1: handle, B_1: handle, C_1: handle) -> ()attr = {"from_legacy_te_schedule": True, "global_symbol": "main", "tir.noalias": True}buffers = {C: Buffer(C_2: Pointer(float32), float32, [1024, 1024], []),A: Buffer(A_2: Pointer(float32), float32, [1024, 1024], []),B: Buffer(B_2: Pointer(float32), float32, [1024, 1024], [])}buffer_map = {A_1: A, B_1: B, C_1: C} {allocate(packedB: Pointer(global float32x32), float32x32, [32768]), storage_scope = global {for (x: int32, 0, 32) "parallel" {for (y: int32, 0, 1024) {packedB[ramp(((x*32768) + (y*32)), 1, 32)] = (float32x32*)B_2[ramp(((y*1024) + (x*32)), 1, 32)]}}for (x.outer: int32, 0, 32) "parallel" {allocate(C.global: Pointer(global float32), float32, [1024]), storage_scope = global;for (y.outer: int32, 0, 32) {for (x.c.init: int32, 0, 32) {C.global[ramp((x.c.init*32), 1, 32)] = broadcast(0f32, 32)}for (k.outer: int32, 0, 256) {for (x.c: int32, 0, 32) {C.global[ramp((x.c*32), 1, 32)] = ((float32x32*)C.global[ramp((x.c*32), 1, 32)] + (broadcast((float32*)A_2[(((x.outer*32768) + (x.c*1024)) + (k.outer*4))], 32)*(float32x32*)packedB[ramp(((y.outer*32768) + (k.outer*128)), 1, 32)]))C.global[ramp((x.c*32), 1, 32)] = ((float32x32*)C.global[ramp((x.c*32), 1, 32)] + (broadcast((float32*)A_2[((((x.outer*32768) + (x.c*1024)) + (k.outer*4)) + 1)], 32)*(float32x32*)packedB[ramp((((y.outer*32768) + (k.outer*128)) + 32), 1, 32)]))C.global[ramp((x.c*32), 1, 32)] = ((float32x32*)C.global[ramp((x.c*32), 1, 32)] + (broadcast((float32*)A_2[((((x.outer*32768) + (x.c*1024)) + (k.outer*4)) + 2)], 32)*(float32x32*)packedB[ramp((((y.outer*32768) + (k.outer*128)) + 64), 1, 32)]))C.global[ramp((x.c*32), 1, 32)] = ((float32x32*)C.global[ramp((x.c*32), 1, 32)] + (broadcast((float32*)A_2[((((x.outer*32768) + (x.c*1024)) + (k.outer*4)) + 3)], 32)*(float32x32*)packedB[ramp((((y.outer*32768) + (k.outer*128)) + 96), 1, 32)]))}}for (x.inner: int32, 0, 32) {for (y.inner: int32, 0, 32) {C_2[((((x.outer*32768) + (x.inner*1024)) + (y.outer*32)) + y.inner)] = (float32*)C.global[((x.inner*32) + y.inner)]}}}}} }

矩陣乘例子的總結(jié)

在僅用 18 行代碼應(yīng)用上述簡單優(yōu)化之后,我們生成的代碼就可以得到與使用數(shù)學(xué)內(nèi)核庫(MKL)的 numpy 接近的性能。我們剛才一直都記錄了性能,因此在這里可以直接比較結(jié)果:

baseline = log[0][1] print("%s\t%s\t%s" % ("Operator".rjust(20), "Timing".rjust(20), "Performance".rjust(20))) for result in log:print("%s\t%s\t%s"% (result[0].rjust(20), str(result[1]).rjust(20), str(result[1] / baseline).rjust(20)))

此處輸出:

Operator Timing Performancenone 3.1094061458 1.0blocking 0.29192816779999997 0.09388550549895809vectorization 0.3312631714 0.10653583220302389 loop permutation 0.1137497149 0.036582456445468314array packing 0.2241142794 0.07207623221003798block caching 0.22421289339999997 0.07210794694763607parallelization 0.0679485881 0.021852593361526892

請注意,以上的輸出反映的是非獨占 Docker 容器上的運行時間,因此并不可靠。強烈建議您自己運行本教程,觀察 TVM 實現(xiàn)的性能增益,并仔細閱讀每個示例,以了解矩陣乘法運算的迭代改進。

總結(jié)

如前所述,如何使用 TE 和調(diào)度原語應(yīng)用優(yōu)化可能需要一些底層架構(gòu)和算法的知識。然而,TE 設(shè)計為更復(fù)雜的算法是為了可以搜索潛在的優(yōu)化。有了本 TE 簡介中的知識,我們現(xiàn)在可以開始探索 TVM 如何自動化進度優(yōu)化過程。

本教程提供了使用向量加法和矩陣乘法示例的TVM張量表達式(TE)工作流演練。一般的工作流程是:

  • 通過一系列操作描述您的計算。

  • 描述我們希望如何計算和使用調(diào)度原語。

  • 編譯到我們想要的目標(biāo)函數(shù)。

  • 保存要稍后加載的函數(shù)(可選)。

接下來的教程將擴展矩陣乘法示例,并展示如何使用可調(diào)參數(shù)構(gòu)建矩陣乘法和其他操作的通用模板,這些參數(shù)使得我們能夠自動優(yōu)化特定平臺的計算。

Ref:

https://tvm.apache.org/docs/tutorial/tensor_expr_get_started.html

總結(jié)

以上是生活随笔為你收集整理的TVM:使用Tensor Expression (TE)来处理算子的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。

欧美国产日产一区二区 | 国产两女互慰高潮视频在线观看 | 爆乳一区二区三区无码 | 男女性色大片免费网站 | 久久亚洲精品成人无码 | 久久久国产一区二区三区 | 日韩成人一区二区三区在线观看 | 少妇性荡欲午夜性开放视频剧场 | 色欲人妻aaaaaaa无码 | 成人免费视频一区二区 | 又大又硬又黄的免费视频 | 好爽又高潮了毛片免费下载 | 在线观看国产午夜福利片 | 夜夜高潮次次欢爽av女 | 99精品久久毛片a片 | 欧美猛少妇色xxxxx | 国产肉丝袜在线观看 | 久久亚洲精品中文字幕无男同 | √8天堂资源地址中文在线 | 成人无码视频免费播放 | 欧美精品在线观看 | 色婷婷综合中文久久一本 | 午夜精品一区二区三区在线观看 | 毛片内射-百度 | 国产性生大片免费观看性 | 在线精品亚洲一区二区 | 无码帝国www无码专区色综合 | 丰满少妇高潮惨叫视频 | 亚洲a无码综合a国产av中文 | 国产国产精品人在线视 | 亚洲区小说区激情区图片区 | 国产精品a成v人在线播放 | 精品国产一区二区三区av 性色 | 2019nv天堂香蕉在线观看 | 中文字幕乱码人妻二区三区 | 国产麻豆精品一区二区三区v视界 | 亚洲s色大片在线观看 | 久久国产精品萌白酱免费 | 青青青爽视频在线观看 | 日本精品久久久久中文字幕 | 在教室伦流澡到高潮hnp视频 | 波多野结衣 黑人 | 少妇无码av无码专区在线观看 | 国产成人精品视频ⅴa片软件竹菊 | 夜精品a片一区二区三区无码白浆 | 亚洲 日韩 欧美 成人 在线观看 | а√天堂www在线天堂小说 | 欧美激情一区二区三区成人 | 亚洲日韩av一区二区三区中文 | 亚洲日韩一区二区三区 | 亚洲国产精品无码一区二区三区 | 国产亚洲精品久久久久久久 | 久久国产精品_国产精品 | 夜夜影院未满十八勿进 | 成人一在线视频日韩国产 | 欧美日韩一区二区综合 | 亚洲精品一区二区三区四区五区 | 熟女体下毛毛黑森林 | 国产在线无码精品电影网 | 在线观看免费人成视频 | 熟妇人妻中文av无码 | 一二三四社区在线中文视频 | 蜜桃视频韩日免费播放 | 精品国精品国产自在久国产87 | 99精品无人区乱码1区2区3区 | 欧美三级不卡在线观看 | 日本爽爽爽爽爽爽在线观看免 | 国产婷婷色一区二区三区在线 | 永久黄网站色视频免费直播 | 国产成人人人97超碰超爽8 | 丰满诱人的人妻3 | 国产热a欧美热a在线视频 | 99久久人妻精品免费二区 | 国语自产偷拍精品视频偷 | 国产suv精品一区二区五 | 无码人妻丰满熟妇区毛片18 | 无码av中文字幕免费放 | 国产黄在线观看免费观看不卡 | 亚洲一区二区三区四区 | 欧美一区二区三区 | 久久久久人妻一区精品色欧美 | 激情亚洲一区国产精品 | www国产亚洲精品久久网站 | 图片区 小说区 区 亚洲五月 | 无码任你躁久久久久久久 | 欧美乱妇无乱码大黄a片 | 呦交小u女精品视频 | 欧美xxxxx精品 | 亚洲成av人影院在线观看 | 学生妹亚洲一区二区 | 色综合天天综合狠狠爱 | 97se亚洲精品一区 | 麻豆成人精品国产免费 | 亚洲日本va午夜在线电影 | 青草视频在线播放 | 国产无套粉嫩白浆在线 | 夜夜夜高潮夜夜爽夜夜爰爰 | 国内综合精品午夜久久资源 | 一本大道伊人av久久综合 | 欧美激情一区二区三区成人 | 午夜精品一区二区三区的区别 | 亚洲成a人片在线观看无码3d | 无码人妻丰满熟妇区五十路百度 | 亚洲男女内射在线播放 | 国产人妻精品午夜福利免费 | 国产人妻精品午夜福利免费 | 亚洲第一无码av无码专区 | а天堂中文在线官网 | 一区二区三区乱码在线 | 欧洲 | 免费视频欧美无人区码 | 成在人线av无码免费 | 无码帝国www无码专区色综合 | 日韩视频 中文字幕 视频一区 | 欧美熟妇另类久久久久久不卡 | 久久久中文久久久无码 | 国产真实乱对白精彩久久 | 日韩无码专区 | 亚洲熟妇色xxxxx亚洲 | 国产亚洲精品久久久久久 | 欧洲精品码一区二区三区免费看 | 日日碰狠狠丁香久燥 | 国产精品毛片一区二区 | 国产精品国产自线拍免费软件 | 国产成人午夜福利在线播放 | 狠狠色噜噜狠狠狠7777奇米 | 亚洲欧美日韩国产精品一区二区 | 亚洲精品国产品国语在线观看 | 东京一本一道一二三区 | 麻豆国产人妻欲求不满谁演的 | 97色伦图片97综合影院 | av人摸人人人澡人人超碰下载 | 亚洲色欲久久久综合网东京热 | 曰韩无码二三区中文字幕 | 天天拍夜夜添久久精品 | 国产明星裸体无码xxxx视频 | 人妻中文无码久热丝袜 | 国产精品多人p群无码 | 日本大乳高潮视频在线观看 | 欧美精品在线观看 | 精品久久久久久亚洲精品 | 国产在线无码精品电影网 | 激情内射亚州一区二区三区爱妻 | 波多野42部无码喷潮在线 | 日韩精品无码免费一区二区三区 | 国产又爽又黄又刺激的视频 | 丁香啪啪综合成人亚洲 | 亚洲国产精品无码一区二区三区 | 午夜性刺激在线视频免费 | 久久久久久久人妻无码中文字幕爆 | 青春草在线视频免费观看 | 日本高清一区免费中文视频 | 亚洲中文字幕久久无码 | 76少妇精品导航 | 国产疯狂伦交大片 | 伊人色综合久久天天小片 | 内射爽无广熟女亚洲 | 国产精品美女久久久 | 日韩精品久久久肉伦网站 | 青青青手机频在线观看 | 一本一道久久综合久久 | 少妇性l交大片欧洲热妇乱xxx | 又色又爽又黄的美女裸体网站 | 婷婷五月综合激情中文字幕 | 久精品国产欧美亚洲色aⅴ大片 | 国产美女极度色诱视频www | 色老头在线一区二区三区 | 色诱久久久久综合网ywww | 真人与拘做受免费视频一 | 久久久久成人片免费观看蜜芽 | 国产无遮挡又黄又爽免费视频 | 日韩少妇白浆无码系列 | 免费播放一区二区三区 | 天堂亚洲免费视频 | 玩弄人妻少妇500系列视频 | 初尝人妻少妇中文字幕 | 国产三级久久久精品麻豆三级 | 国产成人一区二区三区在线观看 | 中文字幕人妻无码一区二区三区 | av人摸人人人澡人人超碰下载 | 国产精品国产自线拍免费软件 | 免费人成网站视频在线观看 | 久久国语露脸国产精品电影 | 粉嫩少妇内射浓精videos | 精品偷拍一区二区三区在线看 | 人人澡人人透人人爽 | 无遮无挡爽爽免费视频 | 成人欧美一区二区三区 | 日韩人妻系列无码专区 | 夜先锋av资源网站 | 成熟女人特级毛片www免费 | 青青久在线视频免费观看 | 最新国产乱人伦偷精品免费网站 | 国产精品美女久久久久av爽李琼 | 四虎影视成人永久免费观看视频 | 蜜臀aⅴ国产精品久久久国产老师 | 欧美丰满老熟妇xxxxx性 | 最新国产乱人伦偷精品免费网站 | 麻豆精产国品 | 人妻少妇精品无码专区二区 | 久久久精品欧美一区二区免费 | 免费看男女做好爽好硬视频 | 欧美日韩久久久精品a片 | 欧美放荡的少妇 | 综合激情五月综合激情五月激情1 | 欧美人与禽zoz0性伦交 | 图片小说视频一区二区 | 国产疯狂伦交大片 | 97久久国产亚洲精品超碰热 | 久久午夜夜伦鲁鲁片无码免费 | 中文毛片无遮挡高清免费 | 亚洲人成网站在线播放942 | 好男人www社区 | 无码人妻精品一区二区三区不卡 | 国产精品久久久久无码av色戒 | 亚无码乱人伦一区二区 | 夜夜躁日日躁狠狠久久av | 中文字幕av无码一区二区三区电影 | 亚洲中文字幕无码中字 | 国产手机在线αⅴ片无码观看 | 成人精品天堂一区二区三区 | 中文亚洲成a人片在线观看 | 久久天天躁夜夜躁狠狠 | 亚洲成色www久久网站 | 国产精品美女久久久 | 成年美女黄网站色大免费全看 | 风流少妇按摩来高潮 | 天天摸天天透天天添 | 国产偷国产偷精品高清尤物 | 久久久久av无码免费网 | 一本久久a久久精品亚洲 | 精品偷拍一区二区三区在线看 | 在线播放免费人成毛片乱码 | 久久99精品久久久久久 | 欧美丰满熟妇xxxx | 精品久久8x国产免费观看 | 无码播放一区二区三区 | 99久久久无码国产aaa精品 | 学生妹亚洲一区二区 | 午夜熟女插插xx免费视频 | 亚洲成在人网站无码天堂 | 亚洲人成影院在线无码按摩店 | 成人精品视频一区二区 | 国产精品久久久一区二区三区 | v一区无码内射国产 | 亚洲高清偷拍一区二区三区 | 日韩视频 中文字幕 视频一区 | 成年美女黄网站色大免费全看 | 亚洲天堂2017无码中文 | 丰满肥臀大屁股熟妇激情视频 | 国产午夜福利100集发布 | 久久久久成人片免费观看蜜芽 | 亚洲国产精品一区二区美利坚 | 久久亚洲精品中文字幕无男同 | 日日躁夜夜躁狠狠躁 | 午夜理论片yy44880影院 | 国产精品毛多多水多 | 久久综合给久久狠狠97色 | 久在线观看福利视频 | 国产内射爽爽大片视频社区在线 | 亚洲一区二区三区无码久久 | 狠狠躁日日躁夜夜躁2020 | 中文字幕无码免费久久9一区9 | 亚洲国产欧美在线成人 | 中文字幕乱码亚洲无线三区 | 欧美激情综合亚洲一二区 | 大地资源网第二页免费观看 | 欧美老熟妇乱xxxxx | 久久久精品成人免费观看 | 午夜熟女插插xx免费视频 | www国产亚洲精品久久久日本 | 中文精品无码中文字幕无码专区 | 图片小说视频一区二区 | 任你躁国产自任一区二区三区 | 亚洲一区二区三区香蕉 | 国产精品成人av在线观看 | 最近的中文字幕在线看视频 | 久久久国产一区二区三区 | 夜夜高潮次次欢爽av女 | 无遮无挡爽爽免费视频 | 伊人久久大香线蕉亚洲 | 久久综合香蕉国产蜜臀av | 亚洲成av人综合在线观看 | 搡女人真爽免费视频大全 | 国产精品免费大片 | 未满小14洗澡无码视频网站 | 青青青手机频在线观看 | 最新国产麻豆aⅴ精品无码 | 少妇性l交大片 | 亚洲精品久久久久avwww潮水 | 蜜臀av无码人妻精品 | 久久精品中文闷骚内射 | 国产莉萝无码av在线播放 | 国产精品久久久久久亚洲毛片 | 国产一区二区三区精品视频 | 天堂а√在线地址中文在线 | 领导边摸边吃奶边做爽在线观看 | 午夜无码人妻av大片色欲 | 少女韩国电视剧在线观看完整 | 久久精品国产精品国产精品污 | 成熟女人特级毛片www免费 | 一本久道高清无码视频 | 日日天日日夜日日摸 | 精品久久久无码中文字幕 | 亚洲国产高清在线观看视频 | 荫蒂被男人添的好舒服爽免费视频 | 性欧美大战久久久久久久 | 一区二区三区高清视频一 | 国产超碰人人爽人人做人人添 | 狠狠cao日日穞夜夜穞av | 国产凸凹视频一区二区 | 人妻中文无码久热丝袜 | 无码帝国www无码专区色综合 | 国产人成高清在线视频99最全资源 | 国产婷婷色一区二区三区在线 | 青草青草久热国产精品 | 兔费看少妇性l交大片免费 | 人妻有码中文字幕在线 | 九九久久精品国产免费看小说 | 亚洲 a v无 码免 费 成 人 a v | 国产无套粉嫩白浆在线 | 少妇无码av无码专区在线观看 | 少妇性荡欲午夜性开放视频剧场 | 国产精品高潮呻吟av久久 | 国产女主播喷水视频在线观看 | 成人性做爰aaa片免费看不忠 | 99久久久无码国产aaa精品 | 荡女精品导航 | 亚洲理论电影在线观看 | 曰本女人与公拘交酡免费视频 | 少妇无套内谢久久久久 | 日本xxxx色视频在线观看免费 | 亚洲成av人片在线观看无码不卡 | 国产午夜手机精彩视频 | 99精品视频在线观看免费 | 理论片87福利理论电影 | 免费无码av一区二区 | 免费看男女做好爽好硬视频 | 少妇高潮喷潮久久久影院 | 樱花草在线播放免费中文 | 大地资源网第二页免费观看 | 中国大陆精品视频xxxx | 欧美性生交活xxxxxdddd | 亚洲国产精品一区二区美利坚 | 色综合久久网 | 国产亚洲精品久久久闺蜜 | 一本久道久久综合狠狠爱 | 欧美成人家庭影院 | 亚洲国产精品久久久天堂 | 欧美xxxxx精品 | 在线观看国产午夜福利片 | 无码国产乱人伦偷精品视频 | 中文字幕无线码 | 成人无码精品1区2区3区免费看 | 300部国产真实乱 | 人人妻人人澡人人爽人人精品 | 沈阳熟女露脸对白视频 | 久久久av男人的天堂 | 久久熟妇人妻午夜寂寞影院 | 牛和人交xxxx欧美 | 久久精品人人做人人综合 | 成在人线av无码免观看麻豆 | 亚洲日韩乱码中文无码蜜桃臀网站 | 久久无码中文字幕免费影院蜜桃 | 97无码免费人妻超级碰碰夜夜 | 亚洲欧洲日本综合aⅴ在线 | 日本欧美一区二区三区乱码 | 精品国产乱码久久久久乱码 | 亚洲第一无码av无码专区 | 国产精品久久久 | 亚洲成在人网站无码天堂 | 中文字幕人妻无码一区二区三区 | 日本一卡2卡3卡4卡无卡免费网站 国产一区二区三区影院 | 亚洲日韩av一区二区三区四区 | 成人性做爰aaa片免费看 | 亚洲一区二区三区含羞草 | 乱码av麻豆丝袜熟女系列 | 亚洲第一无码av无码专区 | 狂野欧美性猛交免费视频 | 久久综合给合久久狠狠狠97色 | 国产色精品久久人妻 | 亚洲日韩av一区二区三区四区 | 国产精品99久久精品爆乳 | 国产人妻久久精品二区三区老狼 | 国产成人精品必看 | 欧美 日韩 人妻 高清 中文 | 日本一区二区三区免费播放 | 国产色在线 | 国产 | 国产成人一区二区三区在线观看 | 亚洲一区二区三区播放 | 中文字幕无码人妻少妇免费 | 亚洲熟悉妇女xxx妇女av | 无码人妻精品一区二区三区不卡 | 久久天天躁狠狠躁夜夜免费观看 | √8天堂资源地址中文在线 | 国内少妇偷人精品视频 | 欧美人与善在线com | aⅴ在线视频男人的天堂 | 亚洲国产欧美国产综合一区 | 妺妺窝人体色www婷婷 | 亚洲人成人无码网www国产 | 无码国产色欲xxxxx视频 | 无码国产色欲xxxxx视频 | 曰本女人与公拘交酡免费视频 | 性欧美videos高清精品 | 免费网站看v片在线18禁无码 | 日日躁夜夜躁狠狠躁 | 少妇被黑人到高潮喷出白浆 | 麻豆精品国产精华精华液好用吗 | 亚洲精品国产a久久久久久 | av香港经典三级级 在线 | 青青青爽视频在线观看 | 国产乱人无码伦av在线a | 亚洲の无码国产の无码影院 | yw尤物av无码国产在线观看 | 国产乡下妇女做爰 | 久久99精品国产.久久久久 | 动漫av一区二区在线观看 | 亚洲毛片av日韩av无码 | 熟妇人妻无码xxx视频 | 亚洲第一无码av无码专区 | 亚洲熟妇色xxxxx亚洲 | 久久午夜无码鲁丝片 | 国产精品毛片一区二区 | 亚洲自偷自偷在线制服 | 亚洲综合精品香蕉久久网 | 亚洲欧美日韩成人高清在线一区 | 免费国产成人高清在线观看网站 | 日日干夜夜干 | 少妇性俱乐部纵欲狂欢电影 | 国产激情艳情在线看视频 | 国产色精品久久人妻 | 亚洲国产精品毛片av不卡在线 | 97se亚洲精品一区 | 伦伦影院午夜理论片 | 成人免费视频一区二区 | 亚洲精品一区二区三区四区五区 | 性欧美大战久久久久久久 | 日本饥渴人妻欲求不满 | 国产熟妇高潮叫床视频播放 | 亚洲国产综合无码一区 | 岛国片人妻三上悠亚 | 成人免费视频视频在线观看 免费 | 中国女人内谢69xxxxxa片 | 成人片黄网站色大片免费观看 | 成人免费视频视频在线观看 免费 | 日本精品人妻无码77777 天堂一区人妻无码 | 国产精品福利视频导航 | 国产精品自产拍在线观看 | 久久99久久99精品中文字幕 | 免费网站看v片在线18禁无码 | 99久久99久久免费精品蜜桃 | 亚洲一区二区三区在线观看网站 | 久久99精品久久久久久 | 99久久亚洲精品无码毛片 | 波多野结衣高清一区二区三区 | 成在人线av无码免费 | 日韩视频 中文字幕 视频一区 | 国产超级va在线观看视频 | 亚洲日韩av片在线观看 | 亚洲日韩av一区二区三区中文 | 国产农村乱对白刺激视频 | 久久亚洲精品成人无码 | 无码人妻久久一区二区三区不卡 | 特黄特色大片免费播放器图片 | 中文字幕无码乱人伦 | 少妇太爽了在线观看 | 精品国产国产综合精品 | 在线播放亚洲第一字幕 | 国产精品久久久久7777 | 亚洲精品成人福利网站 | 国产农村妇女高潮大叫 | 四十如虎的丰满熟妇啪啪 | 欧美亚洲日韩国产人成在线播放 | 亚洲中文字幕乱码av波多ji | 精品午夜福利在线观看 | 国产精品人人爽人人做我的可爱 | 久久zyz资源站无码中文动漫 | 色综合久久久无码网中文 | 3d动漫精品啪啪一区二区中 | 日韩视频 中文字幕 视频一区 | 亚洲小说图区综合在线 | 永久免费观看美女裸体的网站 | 最新国产麻豆aⅴ精品无码 | 色情久久久av熟女人妻网站 | 人妻无码久久精品人妻 | 欧美成人午夜精品久久久 | 无码午夜成人1000部免费视频 | 99麻豆久久久国产精品免费 | 无码人妻少妇伦在线电影 | 国产精品毛多多水多 | 亚洲成熟女人毛毛耸耸多 | 三上悠亚人妻中文字幕在线 | 亚洲欧美日韩国产精品一区二区 | 国产色视频一区二区三区 | 久久久无码中文字幕久... | 免费乱码人妻系列无码专区 | 欧美人与禽猛交狂配 | 97夜夜澡人人双人人人喊 | 强伦人妻一区二区三区视频18 | 日韩精品无码免费一区二区三区 | 一区二区传媒有限公司 | 欧美日韩人成综合在线播放 | 熟女少妇在线视频播放 | 一区二区三区高清视频一 | 国产激情无码一区二区 | 精品国产一区二区三区av 性色 | 国产精品久久国产三级国 | 久久国产精品_国产精品 | 欧美日韩视频无码一区二区三 | 精品午夜福利在线观看 | 日本精品少妇一区二区三区 | 国产97色在线 | 免 | 国产精品久久久久久亚洲毛片 | 婷婷丁香五月天综合东京热 | 色婷婷久久一区二区三区麻豆 | 国产日产欧产精品精品app | 国产av人人夜夜澡人人爽麻豆 | 野外少妇愉情中文字幕 | 日韩人妻无码中文字幕视频 | 久久人妻内射无码一区三区 | 亚洲第一网站男人都懂 | 久久99国产综合精品 | 在线天堂新版最新版在线8 | 国产av一区二区三区最新精品 | 黑人大群体交免费视频 | 亚洲七七久久桃花影院 | 国产成人无码一二三区视频 | 熟女少妇在线视频播放 | 久久午夜无码鲁丝片 | 丰满少妇女裸体bbw | 亚洲国产精品一区二区第一页 | 久久国产精品偷任你爽任你 | 亚洲中文字幕无码中字 | 欧美性猛交内射兽交老熟妇 | 伊人久久大香线焦av综合影院 | 亚洲精品久久久久avwww潮水 | 亚洲人交乣女bbw | 香蕉久久久久久av成人 | 亚洲 另类 在线 欧美 制服 | 国产精品久久久久无码av色戒 | 国产成人一区二区三区在线观看 | 国产在线aaa片一区二区99 | 极品尤物被啪到呻吟喷水 | 成熟妇人a片免费看网站 | 男女性色大片免费网站 | 天堂无码人妻精品一区二区三区 | 亚洲精品综合五月久久小说 | 久久久久久a亚洲欧洲av冫 | 国产成人无码区免费内射一片色欲 | 97夜夜澡人人双人人人喊 | 中文亚洲成a人片在线观看 | 亚洲熟妇自偷自拍另类 | 两性色午夜免费视频 | 狠狠色欧美亚洲狠狠色www | 亚洲理论电影在线观看 | 欧美激情综合亚洲一二区 | 国产真实伦对白全集 | 日本高清一区免费中文视频 | 精品偷拍一区二区三区在线看 | 激情国产av做激情国产爱 | 无码av岛国片在线播放 | 少妇性l交大片欧洲热妇乱xxx | 无码人妻少妇伦在线电影 | 一本大道久久东京热无码av | 国产成人综合美国十次 | 六月丁香婷婷色狠狠久久 | 国产又爽又猛又粗的视频a片 | 女人和拘做爰正片视频 | 欧美精品免费观看二区 | 亚洲午夜无码久久 | 久久久精品人妻久久影视 | 亚洲日韩av一区二区三区四区 | 未满成年国产在线观看 | 久久久久se色偷偷亚洲精品av | 99久久精品无码一区二区毛片 | 精品一区二区三区波多野结衣 | 欧美日韩亚洲国产精品 | 国产无av码在线观看 | 国产口爆吞精在线视频 | 狠狠亚洲超碰狼人久久 | 97资源共享在线视频 | 亚洲精品国产第一综合99久久 | 荫蒂被男人添的好舒服爽免费视频 | 亚洲精品中文字幕 | 麻豆人妻少妇精品无码专区 | 日本www一道久久久免费榴莲 | 永久免费观看美女裸体的网站 | 免费人成网站视频在线观看 | 一本色道久久综合狠狠躁 | 免费男性肉肉影院 | 无码人妻少妇伦在线电影 | 国产激情一区二区三区 | 丰满少妇高潮惨叫视频 | 无码av最新清无码专区吞精 | 亚洲一区av无码专区在线观看 | 日本熟妇人妻xxxxx人hd | 中文字幕中文有码在线 | 国产熟妇另类久久久久 | 熟女体下毛毛黑森林 | 国产偷自视频区视频 | 99精品国产综合久久久久五月天 | а天堂中文在线官网 | 亚洲精品中文字幕久久久久 | 奇米影视7777久久精品 | 精品无码成人片一区二区98 | 精品国产一区av天美传媒 | 色婷婷久久一区二区三区麻豆 | 高清国产亚洲精品自在久久 | 亚洲精品中文字幕乱码 | 日韩精品乱码av一区二区 | 99精品国产综合久久久久五月天 | 午夜福利一区二区三区在线观看 | 高潮毛片无遮挡高清免费 | 久久久久久国产精品无码下载 | 午夜无码人妻av大片色欲 | 久久午夜夜伦鲁鲁片无码免费 | 午夜性刺激在线视频免费 | 精品无人国产偷自产在线 | 国产极品美女高潮无套在线观看 | 日韩欧美中文字幕公布 | 免费无码一区二区三区蜜桃大 | 日日夜夜撸啊撸 | 色老头在线一区二区三区 | 无码午夜成人1000部免费视频 | 中文字幕无线码免费人妻 | 中文字幕无码视频专区 | 成人一在线视频日韩国产 | 亚拍精品一区二区三区探花 | 99久久婷婷国产综合精品青草免费 | 玩弄少妇高潮ⅹxxxyw | 久久国产精品二国产精品 | 色综合久久久久综合一本到桃花网 | 色五月丁香五月综合五月 | 国产在线一区二区三区四区五区 | 国产高清不卡无码视频 | 国产成人人人97超碰超爽8 | 大肉大捧一进一出好爽视频 | 久久精品视频在线看15 | 亚洲综合精品香蕉久久网 | 亚洲欧美日韩国产精品一区二区 | 国产精品久久久久久亚洲毛片 | 少妇一晚三次一区二区三区 | 国产精品va在线观看无码 | 婷婷五月综合激情中文字幕 | 成人aaa片一区国产精品 | 无码福利日韩神码福利片 | 成年美女黄网站色大免费全看 | 人妻少妇精品视频专区 | 无码人妻丰满熟妇区毛片18 | 亚洲中文字幕久久无码 | 无码一区二区三区在线观看 | 日韩欧美群交p片內射中文 | 国产又粗又硬又大爽黄老大爷视 | 国产精品理论片在线观看 | 久久久国产一区二区三区 | 国産精品久久久久久久 | 国产成人av免费观看 | 欧美日韩综合一区二区三区 | 3d动漫精品啪啪一区二区中 | 麻豆果冻传媒2021精品传媒一区下载 | 内射欧美老妇wbb | av无码电影一区二区三区 | 中国大陆精品视频xxxx | 精品国产成人一区二区三区 | 婷婷五月综合激情中文字幕 | 六月丁香婷婷色狠狠久久 | 日产精品99久久久久久 | 乌克兰少妇性做爰 | 国产人妻精品一区二区三区不卡 | 亚洲精品中文字幕久久久久 | 无码毛片视频一区二区本码 | 亚洲经典千人经典日产 | 国产肉丝袜在线观看 | 牲欲强的熟妇农村老妇女 | 国产成人无码av一区二区 | 亚洲精品一区二区三区大桥未久 | 少妇被黑人到高潮喷出白浆 | 国产特级毛片aaaaaa高潮流水 | 欧美自拍另类欧美综合图片区 | 人人妻人人澡人人爽欧美一区九九 | 日本一卡2卡3卡四卡精品网站 | 亚洲七七久久桃花影院 | 日韩亚洲欧美精品综合 | 欧美老妇交乱视频在线观看 | 亚洲国产精品毛片av不卡在线 | 成人免费视频在线观看 | 99久久久无码国产精品免费 | 国产成人综合美国十次 | 亚洲男人av香蕉爽爽爽爽 | 97人妻精品一区二区三区 | 人妻夜夜爽天天爽三区 | 亚洲爆乳大丰满无码专区 | 亚洲国产精品无码久久久久高潮 | 少妇性俱乐部纵欲狂欢电影 | 国产欧美精品一区二区三区 | 99久久亚洲精品无码毛片 | 日韩欧美群交p片內射中文 | 久久久久久久人妻无码中文字幕爆 | 成人综合网亚洲伊人 | 国产三级精品三级男人的天堂 | 国产午夜手机精彩视频 | 国产一区二区三区影院 | 欧美精品无码一区二区三区 | 天堂在线观看www | 欧美zoozzooz性欧美 | 欧洲美熟女乱又伦 | 粉嫩少妇内射浓精videos | 少妇被粗大的猛进出69影院 | 色狠狠av一区二区三区 | 成人亚洲精品久久久久 | 国语自产偷拍精品视频偷 | 亚洲精品成a人在线观看 | 美女极度色诱视频国产 | 国产亚洲欧美在线专区 | 久久久无码中文字幕久... | 色综合久久久久综合一本到桃花网 | 婷婷综合久久中文字幕蜜桃三电影 | 久久精品国产日本波多野结衣 | 性欧美牲交xxxxx视频 | 国产亚洲日韩欧美另类第八页 | 亚洲日韩中文字幕在线播放 | 全球成人中文在线 | 精品人妻人人做人人爽夜夜爽 | 欧美人与禽zoz0性伦交 | 国产舌乚八伦偷品w中 | 天堂а√在线地址中文在线 | 国产精品成人av在线观看 | 97久久国产亚洲精品超碰热 | 欧美人妻一区二区三区 | 一本色道久久综合亚洲精品不卡 | 国产精品久久久 | 精品乱子伦一区二区三区 | 玩弄少妇高潮ⅹxxxyw | 人妻夜夜爽天天爽三区 | 国产精品久久久一区二区三区 | 国产特级毛片aaaaaa高潮流水 | 九九热爱视频精品 | 欧美大屁股xxxxhd黑色 | 精品一区二区三区无码免费视频 | 久久视频在线观看精品 | 久久久精品欧美一区二区免费 | 人人妻人人澡人人爽欧美精品 | 国产免费无码一区二区视频 | 欧美人与物videos另类 | 少妇人妻大乳在线视频 | 中文字幕无码热在线视频 | 国产电影无码午夜在线播放 | 国产亚洲精品久久久久久久 | 亚洲 高清 成人 动漫 | 一本色道久久综合亚洲精品不卡 | 日韩亚洲欧美中文高清在线 | 国产无遮挡吃胸膜奶免费看 | 国产疯狂伦交大片 | 综合人妻久久一区二区精品 | 午夜性刺激在线视频免费 | av无码电影一区二区三区 | 亚洲精品综合一区二区三区在线 | 国产精品第一国产精品 | 婷婷综合久久中文字幕蜜桃三电影 | 日韩无套无码精品 | 国产成人无码午夜视频在线观看 | 精品无码一区二区三区的天堂 | 熟女少妇人妻中文字幕 | 国产婷婷色一区二区三区在线 | 老子影院午夜精品无码 | 在教室伦流澡到高潮hnp视频 | 国产精品高潮呻吟av久久4虎 | 久9re热视频这里只有精品 | 色婷婷av一区二区三区之红樱桃 | 亚洲a无码综合a国产av中文 | 呦交小u女精品视频 | 亚洲小说春色综合另类 | 欧美丰满熟妇xxxx性ppx人交 | 日本乱偷人妻中文字幕 | 久久精品一区二区三区四区 | 精品国产精品久久一区免费式 | 国产农村妇女aaaaa视频 撕开奶罩揉吮奶头视频 | 久久久亚洲欧洲日产国码αv | 亚洲国产av美女网站 | 无码国内精品人妻少妇 | 免费视频欧美无人区码 | 日本熟妇人妻xxxxx人hd | 国产精品美女久久久久av爽李琼 | 国产综合色产在线精品 | 久久久精品456亚洲影院 | 亚洲中文字幕久久无码 | 日韩精品无码一区二区中文字幕 | 日本欧美一区二区三区乱码 | 国产欧美亚洲精品a | 亚洲综合精品香蕉久久网 | 日日橹狠狠爱欧美视频 | 欧美人与禽zoz0性伦交 | 高潮毛片无遮挡高清免费视频 | 动漫av一区二区在线观看 | 国产熟妇另类久久久久 | 中文无码成人免费视频在线观看 | 国产在线一区二区三区四区五区 | 欧美35页视频在线观看 | 日本一卡二卡不卡视频查询 | 国产精品第一区揄拍无码 | 帮老师解开蕾丝奶罩吸乳网站 | 日韩精品乱码av一区二区 | 亚洲高清偷拍一区二区三区 | 在线а√天堂中文官网 | 国产人妻人伦精品1国产丝袜 | 久久久久久av无码免费看大片 | 久久婷婷五月综合色国产香蕉 | 久久亚洲国产成人精品性色 | 欧美野外疯狂做受xxxx高潮 | 国内丰满熟女出轨videos | 久久久久亚洲精品男人的天堂 | 少妇一晚三次一区二区三区 | 蜜桃视频插满18在线观看 | 久久亚洲精品中文字幕无男同 | 高潮毛片无遮挡高清免费 | 亚拍精品一区二区三区探花 | 久久亚洲精品成人无码 | av小次郎收藏 | 无码人妻丰满熟妇区毛片18 | aⅴ亚洲 日韩 色 图网站 播放 | 日本精品高清一区二区 | 欧美日韩精品 | 国产人妻大战黑人第1集 | 日韩欧美中文字幕在线三区 | 国产精品igao视频网 | 国内少妇偷人精品视频免费 | 国产精品久久久久久亚洲毛片 | 国内丰满熟女出轨videos | 精品国产乱码久久久久乱码 | 无码国内精品人妻少妇 | av人摸人人人澡人人超碰下载 | 日韩人妻无码中文字幕视频 | 久久无码专区国产精品s | 日本爽爽爽爽爽爽在线观看免 | 日本精品人妻无码免费大全 | 国产性猛交╳xxx乱大交 国产精品久久久久久无码 欧洲欧美人成视频在线 | 亚洲a无码综合a国产av中文 | 丰满妇女强制高潮18xxxx | 亚洲欧洲日本综合aⅴ在线 | 免费人成在线观看网站 | 亚洲春色在线视频 | 理论片87福利理论电影 | 国産精品久久久久久久 | 内射白嫩少妇超碰 | 牲交欧美兽交欧美 | 精品国产aⅴ无码一区二区 | 亚洲理论电影在线观看 | 久久99精品国产麻豆蜜芽 | 中文字幕乱码人妻二区三区 | 欧美一区二区三区视频在线观看 | 精品日本一区二区三区在线观看 | 2020最新国产自产精品 | 国产热a欧美热a在线视频 | 亚洲狠狠色丁香婷婷综合 | 成年美女黄网站色大免费视频 | 亚洲国产成人av在线观看 | a在线亚洲男人的天堂 | 亚洲国产一区二区三区在线观看 | 中文无码精品a∨在线观看不卡 | 国产又爽又猛又粗的视频a片 | 男女作爱免费网站 | 成人亚洲精品久久久久 | 国产成人无码一二三区视频 | 久久99久久99精品中文字幕 | 给我免费的视频在线观看 | 国产精品人妻一区二区三区四 | 国产精品无码永久免费888 | 女高中生第一次破苞av | 国产亚洲人成在线播放 | 搡女人真爽免费视频大全 | 最近的中文字幕在线看视频 | 日本大香伊一区二区三区 | 少妇高潮一区二区三区99 | 高潮毛片无遮挡高清免费视频 | 偷窥村妇洗澡毛毛多 | 亚洲精品久久久久中文第一幕 | 久久精品国产99久久6动漫 | 亚洲伊人久久精品影院 | 久久久www成人免费毛片 | 国产精品人人爽人人做我的可爱 | 久久久久国色av免费观看性色 | 99国产欧美久久久精品 | 国产av一区二区三区最新精品 | 色一情一乱一伦一视频免费看 | 国产精品久免费的黄网站 | 荫蒂被男人添的好舒服爽免费视频 | 成人综合网亚洲伊人 | 国产欧美亚洲精品a | 精品欧美一区二区三区久久久 | 欧美精品无码一区二区三区 | 精品一区二区不卡无码av | 久久久久成人片免费观看蜜芽 | 久久亚洲精品中文字幕无男同 | 亚洲精品久久久久中文第一幕 | 色偷偷人人澡人人爽人人模 | 久久久久免费看成人影片 | 永久免费观看美女裸体的网站 | 天干天干啦夜天干天2017 | 亚洲精品一区二区三区在线 | 乱人伦中文视频在线观看 | 亚洲の无码国产の无码步美 | 精品无码一区二区三区的天堂 | 荡女精品导航 | 成人免费视频在线观看 | 日本熟妇乱子伦xxxx | 亚洲欧美综合区丁香五月小说 | 玩弄人妻少妇500系列视频 | 中文字幕人成乱码熟女app | 正在播放东北夫妻内射 | 中文字幕人妻丝袜二区 | 99久久精品日本一区二区免费 | 国产真实乱对白精彩久久 | 99久久人妻精品免费二区 | 人妻熟女一区 | 欧美丰满熟妇xxxx | 欧美老人巨大xxxx做受 | 性色av无码免费一区二区三区 | 精品国产青草久久久久福利 | 久久精品无码一区二区三区 | 国产亚洲人成在线播放 | 少妇被黑人到高潮喷出白浆 | 亚洲国产精品无码一区二区三区 | 草草网站影院白丝内射 | 无码人妻黑人中文字幕 | 亚洲国产成人av在线观看 | 日韩精品无码免费一区二区三区 | 国产精品久久久久久久影院 | 熟妇人妻无码xxx视频 | 在线播放无码字幕亚洲 | 高清国产亚洲精品自在久久 | aa片在线观看视频在线播放 | 无码国内精品人妻少妇 | 国产三级精品三级男人的天堂 | 亚洲热妇无码av在线播放 | 色狠狠av一区二区三区 | 男女爱爱好爽视频免费看 | 精品国产麻豆免费人成网站 | 六月丁香婷婷色狠狠久久 | 人妻无码αv中文字幕久久琪琪布 | 我要看www免费看插插视频 | 精品国产麻豆免费人成网站 | 久久精品国产99精品亚洲 | 欧洲熟妇精品视频 | 中文毛片无遮挡高清免费 | 亚洲aⅴ无码成人网站国产app | 国产在线一区二区三区四区五区 | 国产真人无遮挡作爱免费视频 | 日本一区二区三区免费播放 | 色婷婷香蕉在线一区二区 | 一二三四在线观看免费视频 | 亚洲欧美日韩国产精品一区二区 | 色五月五月丁香亚洲综合网 | 7777奇米四色成人眼影 | 亚洲国产精品久久久天堂 | 黑人巨大精品欧美黑寡妇 | 天堂无码人妻精品一区二区三区 | 中文字幕无码人妻少妇免费 | 2019nv天堂香蕉在线观看 | 一本久久a久久精品亚洲 | 一个人看的www免费视频在线观看 | 俄罗斯老熟妇色xxxx | 性史性农村dvd毛片 | 清纯唯美经典一区二区 | 亚洲中文字幕乱码av波多ji | 四虎国产精品免费久久 | 西西人体www44rt大胆高清 | 丰满护士巨好爽好大乳 | 精品人妻人人做人人爽 | 亚拍精品一区二区三区探花 | 日韩精品无码一本二本三本色 | 欧美成人午夜精品久久久 | 国产精品-区区久久久狼 | aa片在线观看视频在线播放 | 国产一区二区三区日韩精品 | 18黄暴禁片在线观看 | 亚洲国产成人av在线观看 | 国产综合久久久久鬼色 | 精品国产一区二区三区四区 | 荡女精品导航 | 日本又色又爽又黄的a片18禁 | 乱人伦人妻中文字幕无码 | 精品国产av色一区二区深夜久久 | 四虎永久在线精品免费网址 | 蜜桃无码一区二区三区 | 色欲综合久久中文字幕网 | 国产日产欧产精品精品app | 色噜噜亚洲男人的天堂 | 综合人妻久久一区二区精品 | 色欲av亚洲一区无码少妇 | 亚洲精品国产精品乱码不卡 | 国产激情无码一区二区app | 日韩亚洲欧美中文高清在线 | 六十路熟妇乱子伦 | 爆乳一区二区三区无码 | 一本色道久久综合亚洲精品不卡 | 欧美日韩一区二区三区自拍 | 日韩精品无码免费一区二区三区 | 亚洲春色在线视频 | 乌克兰少妇性做爰 | 国产激情艳情在线看视频 | 国产麻豆精品精东影业av网站 | 国产区女主播在线观看 | 中文字幕久久久久人妻 | 久久视频在线观看精品 | 又大又紧又粉嫩18p少妇 | 亚欧洲精品在线视频免费观看 | 牲欲强的熟妇农村老妇女视频 | 亚洲另类伦春色综合小说 | 久久五月精品中文字幕 | 亚洲欧洲无卡二区视頻 | 欧美性生交活xxxxxdddd | 久久久av男人的天堂 | 久久久久99精品国产片 | 久久国产精品萌白酱免费 | 亚洲精品久久久久久一区二区 | 日日碰狠狠丁香久燥 | 日本欧美一区二区三区乱码 | 波多野结衣乳巨码无在线观看 | 国产精品高潮呻吟av久久4虎 | 人妻天天爽夜夜爽一区二区 | 日韩欧美群交p片內射中文 | 亚洲s码欧洲m码国产av | 久久久久久国产精品无码下载 | 久久人人爽人人爽人人片av高清 | 国产精品第一区揄拍无码 | 欧美大屁股xxxxhd黑色 | 亚洲人成网站免费播放 | 国产麻豆精品一区二区三区v视界 | 中文字幕亚洲情99在线 | 自拍偷自拍亚洲精品被多人伦好爽 | 久久zyz资源站无码中文动漫 | 中文字幕+乱码+中文字幕一区 | 亚洲天堂2017无码 | 亚洲精品一区二区三区在线观看 | 永久免费精品精品永久-夜色 | 一二三四在线观看免费视频 | 欧美激情内射喷水高潮 | 欧美放荡的少妇 | 成人无码影片精品久久久 | 一区二区三区乱码在线 | 欧洲 | 国产精品亚洲一区二区三区喷水 | 波多野结衣av一区二区全免费观看 | 色五月丁香五月综合五月 | 女人被男人爽到呻吟的视频 | 乱人伦人妻中文字幕无码 | 狠狠色噜噜狠狠狠狠7777米奇 | 无人区乱码一区二区三区 | 骚片av蜜桃精品一区 | 香蕉久久久久久av成人 | 人人爽人人澡人人高潮 | 香港三级日本三级妇三级 | 在线观看国产一区二区三区 | 久久综合网欧美色妞网 | 亚洲中文字幕久久无码 | 欧美三级a做爰在线观看 | 麻豆av传媒蜜桃天美传媒 | 亚洲成av人在线观看网址 | 亚洲熟女一区二区三区 | 日本大乳高潮视频在线观看 | 国产精品久久久久9999小说 | 国产精品无套呻吟在线 | 粗大的内捧猛烈进出视频 | 久久久婷婷五月亚洲97号色 | 少妇性l交大片欧洲热妇乱xxx | 青青久在线视频免费观看 | 国产精品免费大片 | 老太婆性杂交欧美肥老太 | 麻豆md0077饥渴少妇 | 亚洲色欲色欲欲www在线 | 国产精品99久久精品爆乳 | 亚洲精品午夜无码电影网 | a在线亚洲男人的天堂 | 国产午夜无码精品免费看 | 人妻aⅴ无码一区二区三区 | а√天堂www在线天堂小说 | 中文字幕无码日韩欧毛 | 娇妻被黑人粗大高潮白浆 | 无人区乱码一区二区三区 | 日本高清一区免费中文视频 | 网友自拍区视频精品 | 少妇高潮一区二区三区99 | 九九在线中文字幕无码 | 色狠狠av一区二区三区 | 97夜夜澡人人双人人人喊 | 久久99精品久久久久久动态图 | 成人无码视频在线观看网站 | 色窝窝无码一区二区三区色欲 | av小次郎收藏 | 蜜臀av无码人妻精品 | 亚洲自偷自拍另类第1页 | 亚洲春色在线视频 | 久久www免费人成人片 | 伊在人天堂亚洲香蕉精品区 | 久久久久久九九精品久 | 亚洲一区二区三区播放 | 日本精品少妇一区二区三区 | 高潮毛片无遮挡高清免费 | 亚洲爆乳无码专区 | 人人爽人人澡人人人妻 | 成熟人妻av无码专区 | 亚洲中文字幕无码中文字在线 | 日韩精品乱码av一区二区 | 国产精品亚洲а∨无码播放麻豆 | 欧美性猛交xxxx富婆 | 天天做天天爱天天爽综合网 | 国内少妇偷人精品视频免费 | 国产色精品久久人妻 | 性做久久久久久久免费看 | 麻豆国产丝袜白领秘书在线观看 | 蜜桃臀无码内射一区二区三区 | 久久精品一区二区三区四区 | 欧美黑人巨大xxxxx | 野狼第一精品社区 | 国产9 9在线 | 中文 | 300部国产真实乱 | 欧美 亚洲 国产 另类 | 亚洲国产精品一区二区第一页 | 成熟妇人a片免费看网站 | 亚洲aⅴ无码成人网站国产app | 欧美性猛交内射兽交老熟妇 | 一区二区三区高清视频一 | 日本一本二本三区免费 | 国产成人无码a区在线观看视频app | 精品日本一区二区三区在线观看 | 精品一二三区久久aaa片 | 午夜理论片yy44880影院 | 精品aⅴ一区二区三区 | 欧美丰满熟妇xxxx性ppx人交 | 久久久久成人精品免费播放动漫 | 成 人 网 站国产免费观看 | 无码av岛国片在线播放 | 国产精品久久久久久亚洲毛片 | 亚洲成av人片在线观看无码不卡 | 国产成人无码a区在线观看视频app | 亚洲区小说区激情区图片区 | 中文字幕人妻丝袜二区 | 麻豆国产97在线 | 欧洲 | 亚洲天堂2017无码中文 | 日本精品高清一区二区 | 天天躁日日躁狠狠躁免费麻豆 | 丝袜 中出 制服 人妻 美腿 | 国产激情一区二区三区 | 最新国产乱人伦偷精品免费网站 | 久久久久久九九精品久 | 国产精品丝袜黑色高跟鞋 | 成人无码视频在线观看网站 | 国产精品久久国产精品99 | 图片区 小说区 区 亚洲五月 | 人妻aⅴ无码一区二区三区 | 免费无码的av片在线观看 | 亚欧洲精品在线视频免费观看 | 丰满人妻一区二区三区免费视频 | 超碰97人人射妻 | 亚洲va欧美va天堂v国产综合 | 久久97精品久久久久久久不卡 | 国产精品人妻一区二区三区四 | 奇米综合四色77777久久 东京无码熟妇人妻av在线网址 | 国产亚洲精品久久久久久国模美 | 高清不卡一区二区三区 | 偷窥村妇洗澡毛毛多 | aⅴ亚洲 日韩 色 图网站 播放 | 中文字幕精品av一区二区五区 | 巨爆乳无码视频在线观看 | 无码国内精品人妻少妇 | 日韩av激情在线观看 | 国产美女极度色诱视频www | 亚洲国产一区二区三区在线观看 | 国产亚洲欧美日韩亚洲中文色 | 四十如虎的丰满熟妇啪啪 | 国产又爽又黄又刺激的视频 | 亚洲熟妇色xxxxx亚洲 | 人妻无码αv中文字幕久久琪琪布 | 中文字幕乱妇无码av在线 | 久久综合九色综合欧美狠狠 | 精品国偷自产在线视频 | 图片区 小说区 区 亚洲五月 | 无码人妻精品一区二区三区下载 | 性啪啪chinese东北女人 | 国产成人无码av一区二区 | 国产成人无码av片在线观看不卡 | 久久综合激激的五月天 | 欧美人与牲动交xxxx | 香港三级日本三级妇三级 | 欧美高清在线精品一区 | 日本护士xxxxhd少妇 | 波多野结衣av一区二区全免费观看 | 少妇愉情理伦片bd | 国产乱人偷精品人妻a片 | 中文字幕无码视频专区 | 成人性做爰aaa片免费看不忠 | 熟妇人妻无码xxx视频 | 欧美兽交xxxx×视频 | 亚洲aⅴ无码成人网站国产app | 97精品人妻一区二区三区香蕉 | 色婷婷综合中文久久一本 | 男女超爽视频免费播放 | 国产一区二区三区四区五区加勒比 | 精品欧洲av无码一区二区三区 | 青青草原综合久久大伊人精品 | 欧美成人高清在线播放 | yw尤物av无码国产在线观看 | 天天躁夜夜躁狠狠是什么心态 | 国产真实乱对白精彩久久 | 国产精品鲁鲁鲁 | 99久久婷婷国产综合精品青草免费 | 国产激情综合五月久久 | 久久国产精品偷任你爽任你 | 色偷偷av老熟女 久久精品人妻少妇一区二区三区 | 水蜜桃av无码 | 性欧美牲交xxxxx视频 | 日本肉体xxxx裸交 | 欧美freesex黑人又粗又大 | 麻豆人妻少妇精品无码专区 | 国产免费久久久久久无码 | 日韩成人一区二区三区在线观看 | 性欧美熟妇videofreesex | 欧美 日韩 亚洲 在线 | 精品无码成人片一区二区98 | 丰满人妻翻云覆雨呻吟视频 | 人人妻人人澡人人爽欧美一区九九 | 大地资源网第二页免费观看 | 久久精品人人做人人综合试看 | 少女韩国电视剧在线观看完整 | 鲁鲁鲁爽爽爽在线视频观看 | 色情久久久av熟女人妻网站 | 午夜无码人妻av大片色欲 | 午夜性刺激在线视频免费 | 精品国产一区二区三区av 性色 | 欧美日本免费一区二区三区 | 日韩欧美群交p片內射中文 | 亚洲伊人久久精品影院 | 欧美阿v高清资源不卡在线播放 | 日本大香伊一区二区三区 | 精品国产精品久久一区免费式 | 国产sm调教视频在线观看 | 久久国产精品_国产精品 | 亚洲熟女一区二区三区 | 日韩少妇内射免费播放 | 国产精品成人av在线观看 | 最近中文2019字幕第二页 | 久久久久99精品国产片 | a在线亚洲男人的天堂 | 97色伦图片97综合影院 | 三上悠亚人妻中文字幕在线 | 妺妺窝人体色www婷婷 | 久久精品女人天堂av免费观看 | 67194成是人免费无码 | 人妻与老人中文字幕 | 中国女人内谢69xxxx | 色窝窝无码一区二区三区色欲 | 亚洲大尺度无码无码专区 | www一区二区www免费 | 精品一区二区三区波多野结衣 | 国产精品人人爽人人做我的可爱 | 三上悠亚人妻中文字幕在线 | 亚洲国产精品毛片av不卡在线 | 自拍偷自拍亚洲精品被多人伦好爽 | 国产电影无码午夜在线播放 | ass日本丰满熟妇pics | 亚洲欧美精品aaaaaa片 | 日本丰满熟妇videos | 久久久久久九九精品久 | 精品国产一区av天美传媒 | 国产亚洲人成在线播放 | 欧洲欧美人成视频在线 | 久久国语露脸国产精品电影 | 国产精品久久久 | 久久这里只有精品视频9 | 熟妇激情内射com | 亚洲欧美色中文字幕在线 | 高中生自慰www网站 | 夜夜夜高潮夜夜爽夜夜爰爰 | 日本护士xxxxhd少妇 | 色情久久久av熟女人妻网站 | 性欧美牲交在线视频 | 老子影院午夜伦不卡 | 国产免费久久久久久无码 | 无码av中文字幕免费放 | 国产精品美女久久久久av爽李琼 | 人妻夜夜爽天天爽三区 | 欧美精品免费观看二区 | 亚洲日韩av片在线观看 | 99国产精品白浆在线观看免费 | 国产av一区二区精品久久凹凸 | 少妇性l交大片欧洲热妇乱xxx | 久久99热只有频精品8 | aⅴ在线视频男人的天堂 | 免费国产成人高清在线观看网站 | 久久成人a毛片免费观看网站 | 麻花豆传媒剧国产免费mv在线 | 又紧又大又爽精品一区二区 | 一本色道婷婷久久欧美 | 蜜桃视频插满18在线观看 | 免费中文字幕日韩欧美 | 国产人妻精品一区二区三区不卡 | 一本色道久久综合狠狠躁 | 久久精品中文字幕大胸 | 麻豆国产人妻欲求不满谁演的 | 国产亚洲精品久久久久久久 | 欧美freesex黑人又粗又大 | 国产精品无套呻吟在线 | 国产无套粉嫩白浆在线 | 精品日本一区二区三区在线观看 | 精品乱子伦一区二区三区 | 亚洲午夜久久久影院 | 国产偷抇久久精品a片69 | 亚拍精品一区二区三区探花 | 亚洲熟妇色xxxxx欧美老妇 | 久久综合给合久久狠狠狠97色 | 青青久在线视频免费观看 | 未满小14洗澡无码视频网站 | 亚洲熟妇色xxxxx欧美老妇 | 国内老熟妇对白xxxxhd | 久久精品人人做人人综合 | 中文字幕av无码一区二区三区电影 | 欧美人与牲动交xxxx | 狠狠色色综合网站 | 色五月五月丁香亚洲综合网 | 国产明星裸体无码xxxx视频 | 天堂一区人妻无码 | 国产9 9在线 | 中文 | 久久久亚洲欧洲日产国码αv | 亚洲一区二区三区国产精华液 | 天天摸天天透天天添 | 亚洲国产精华液网站w | 亚洲国产精华液网站w | 精品国产福利一区二区 | 日韩av无码中文无码电影 | 国产性猛交╳xxx乱大交 国产精品久久久久久无码 欧洲欧美人成视频在线 | 亚洲精品一区三区三区在线观看 | 日本精品人妻无码免费大全 | 熟女少妇在线视频播放 | 亚洲第一无码av无码专区 | 无码人妻精品一区二区三区下载 | 亚洲狠狠婷婷综合久久 | 国产精品久久国产三级国 | 久久人妻内射无码一区三区 | 99麻豆久久久国产精品免费 | 少妇高潮一区二区三区99 | 六月丁香婷婷色狠狠久久 | 国产乱人偷精品人妻a片 | 蜜臀aⅴ国产精品久久久国产老师 | 久久久精品国产sm最大网站 | 荡女精品导航 | 精品偷自拍另类在线观看 | 久久综合给合久久狠狠狠97色 | 欧美国产日产一区二区 | 免费国产成人高清在线观看网站 | 久久久久久亚洲精品a片成人 | 18无码粉嫩小泬无套在线观看 | 国产精品成人av在线观看 | 99久久99久久免费精品蜜桃 | 国产精品久久久午夜夜伦鲁鲁 | 丰满少妇弄高潮了www | 丰满少妇高潮惨叫视频 | 欧美激情内射喷水高潮 | 亚洲aⅴ无码成人网站国产app | 色一情一乱一伦一区二区三欧美 | 又粗又大又硬毛片免费看 | 日本大乳高潮视频在线观看 | 99久久人妻精品免费一区 | 内射巨臀欧美在线视频 | 婷婷丁香六月激情综合啪 | 九一九色国产 | 亚洲人成无码网www | 无码毛片视频一区二区本码 | 色婷婷香蕉在线一区二区 | 88国产精品欧美一区二区三区 | 天天躁日日躁狠狠躁免费麻豆 | 嫩b人妻精品一区二区三区 | 亚洲精品成人福利网站 | 久久久久久久人妻无码中文字幕爆 | 性生交大片免费看女人按摩摩 | 日本一区二区更新不卡 | 日本精品少妇一区二区三区 | 2020久久香蕉国产线看观看 | 日韩精品无码一本二本三本色 | 国产精品久久久久7777 | 日产国产精品亚洲系列 | 国产手机在线αⅴ片无码观看 | 高清无码午夜福利视频 | 久久综合香蕉国产蜜臀av | 亚洲爆乳精品无码一区二区三区 | 乌克兰少妇性做爰 | 国产成人精品视频ⅴa片软件竹菊 | 国产精品无码一区二区三区不卡 | 亚洲精品欧美二区三区中文字幕 | 国产人妻精品一区二区三区不卡 | 中文字幕无码av激情不卡 | 麻豆国产人妻欲求不满 | 中文字幕无码日韩专区 | 色老头在线一区二区三区 | 狠狠色噜噜狠狠狠7777奇米 | 东京热无码av男人的天堂 | 国产精品丝袜黑色高跟鞋 | 宝宝好涨水快流出来免费视频 | 日本精品人妻无码免费大全 | 中文字幕 人妻熟女 | 成人欧美一区二区三区 | 欧美成人免费全部网站 | 强辱丰满人妻hd中文字幕 | 日韩欧美中文字幕在线三区 | 亚洲精品成人av在线 | 国产亚洲精品久久久久久 | 亚洲综合久久一区二区 | 免费人成在线观看网站 | 亚洲一区二区三区国产精华液 | 亚洲精品鲁一鲁一区二区三区 | 日本一区二区三区免费高清 | 久久国产精品偷任你爽任你 | 亚洲精品一区二区三区在线观看 | 77777熟女视频在线观看 а天堂中文在线官网 | 人人妻人人藻人人爽欧美一区 | 亚洲春色在线视频 | yw尤物av无码国产在线观看 | 亚洲一区二区三区偷拍女厕 | 无码人妻少妇伦在线电影 | 丁香啪啪综合成人亚洲 | 亚洲色无码一区二区三区 | 国产偷自视频区视频 | 网友自拍区视频精品 | 国产精品嫩草久久久久 | 综合激情五月综合激情五月激情1 | 国产99久久精品一区二区 | 日日鲁鲁鲁夜夜爽爽狠狠 | 最新版天堂资源中文官网 | 国产后入清纯学生妹 | 亚洲自偷自偷在线制服 | 蜜桃无码一区二区三区 | 成人av无码一区二区三区 | 无码任你躁久久久久久久 | 爽爽影院免费观看 | 国产极品视觉盛宴 | 国产美女精品一区二区三区 | 久久久精品欧美一区二区免费 | 精品人妻人人做人人爽夜夜爽 | 少妇愉情理伦片bd | 无码人妻丰满熟妇区毛片18 | 欧美精品无码一区二区三区 | 波多野结衣aⅴ在线 | 成年美女黄网站色大免费视频 | 在线精品亚洲一区二区 | 人妻少妇被猛烈进入中文字幕 | 久久久久免费看成人影片 | 少妇无码av无码专区在线观看 | 久久精品人人做人人综合 | 亚洲精品中文字幕乱码 | 午夜精品久久久内射近拍高清 | 亚洲一区二区三区国产精华液 | 男人的天堂2018无码 | 人妻少妇精品视频专区 | 亚洲精品一区国产 | 亚洲日韩精品欧美一区二区 | 久久久国产精品无码免费专区 | 玩弄人妻少妇500系列视频 | 国产精品沙发午睡系列 | 2019nv天堂香蕉在线观看 | 亚洲欧美日韩综合久久久 | 国产人妻精品午夜福利免费 | 精品国偷自产在线视频 | 久久久久久亚洲精品a片成人 | 国产精品无码mv在线观看 | 亚洲精品一区国产 | 国产另类ts人妖一区二区 | 国产激情无码一区二区app | 久久精品人人做人人综合试看 | 性色av无码免费一区二区三区 | 国产亚洲人成在线播放 | 亚洲区欧美区综合区自拍区 | 在线观看国产一区二区三区 | 久久久久久久女国产乱让韩 | 98国产精品综合一区二区三区 | 俺去俺来也在线www色官网 | 中文字幕无码人妻少妇免费 | 国产午夜精品一区二区三区嫩草 | 精品久久综合1区2区3区激情 | 日韩精品无码一区二区中文字幕 | 99久久精品午夜一区二区 | 无遮挡啪啪摇乳动态图 | 人妻插b视频一区二区三区 | 377p欧洲日本亚洲大胆 | 日本一区二区三区免费播放 | 国产成人精品必看 | aⅴ亚洲 日韩 色 图网站 播放 | 欧美zoozzooz性欧美 | 午夜精品久久久久久久 | 国产9 9在线 | 中文 | 亚洲最大成人网站 | 国产亚洲欧美日韩亚洲中文色 | 国内精品久久久久久中文字幕 | 窝窝午夜理论片影院 | 在线看片无码永久免费视频 | 日韩精品无码一区二区中文字幕 | 精品久久久无码中文字幕 | www国产亚洲精品久久久日本 | 亚洲精品国产品国语在线观看 | 色妞www精品免费视频 | 一个人看的www免费视频在线观看 | 捆绑白丝粉色jk震动捧喷白浆 | 亚洲gv猛男gv无码男同 | 粗大的内捧猛烈进出视频 | 男女超爽视频免费播放 | 亚洲国产欧美国产综合一区 | 日日麻批免费40分钟无码 | 日欧一片内射va在线影院 | 色综合久久久无码中文字幕 | 国产人妻精品一区二区三区 | 日韩欧美群交p片內射中文 | 日欧一片内射va在线影院 | 亚洲中文字幕无码一久久区 | 亚洲色无码一区二区三区 | 国产乱子伦视频在线播放 | 成年美女黄网站色大免费视频 | 日本爽爽爽爽爽爽在线观看免 | 天天做天天爱天天爽综合网 | 中国大陆精品视频xxxx | 国产精品久久久 | 国产精品毛片一区二区 | 国内综合精品午夜久久资源 | 国产av一区二区精品久久凹凸 | 牲欲强的熟妇农村老妇女 | 色诱久久久久综合网ywww | 女高中生第一次破苞av | 亚洲色成人中文字幕网站 | 水蜜桃亚洲一二三四在线 | 色诱久久久久综合网ywww | 国产精品成人av在线观看 | 色 综合 欧美 亚洲 国产 | 久久久无码中文字幕久... | 国产无遮挡又黄又爽免费视频 | 亚洲经典千人经典日产 | 久久久久久国产精品无码下载 | 男人的天堂av网站 | 国产午夜视频在线观看 | a片免费视频在线观看 | 久久精品一区二区三区四区 | 国产精品久久精品三级 | 午夜丰满少妇性开放视频 | 亚洲热妇无码av在线播放 | 最近的中文字幕在线看视频 | 对白脏话肉麻粗话av | 亚洲日本一区二区三区在线 | 最近的中文字幕在线看视频 | 狂野欧美激情性xxxx | 装睡被陌生人摸出水好爽 | 老熟妇仑乱视频一区二区 | 兔费看少妇性l交大片免费 | 午夜精品久久久久久久 | 国产99久久精品一区二区 | 少妇太爽了在线观看 | 久久精品国产大片免费观看 | 99国产欧美久久久精品 | 女人被爽到呻吟gif动态图视看 | 内射后入在线观看一区 | 中文字幕久久久久人妻 | 国产深夜福利视频在线 | 无码人妻精品一区二区三区下载 | 中文字幕无码日韩欧毛 | 欧美国产日产一区二区 | 国产亚洲精品久久久久久久久动漫 | 中文字幕色婷婷在线视频 | 亚洲成色在线综合网站 | 国产情侣作爱视频免费观看 | 亚洲中文字幕在线观看 | 成人无码精品1区2区3区免费看 | 欧美乱妇无乱码大黄a片 | 丝袜足控一区二区三区 | 男女作爱免费网站 | av人摸人人人澡人人超碰下载 | 欧美 日韩 人妻 高清 中文 | 又湿又紧又大又爽a视频国产 | 久久久久成人片免费观看蜜芽 | 国产无遮挡又黄又爽免费视频 | 色婷婷av一区二区三区之红樱桃 | 少妇性荡欲午夜性开放视频剧场 | 色诱久久久久综合网ywww | 免费人成网站视频在线观看 | 熟妇人妻无码xxx视频 | 熟女少妇人妻中文字幕 | 成人免费无码大片a毛片 | 永久免费精品精品永久-夜色 | 午夜肉伦伦影院 | 中文字幕日产无线码一区 | 日本又色又爽又黄的a片18禁 | 午夜福利电影 | www成人国产高清内射 | 大地资源网第二页免费观看 | 欧美自拍另类欧美综合图片区 | 97精品国产97久久久久久免费 | 国产午夜手机精彩视频 | 亚洲色偷偷男人的天堂 | 人人澡人人透人人爽 | 蜜桃无码一区二区三区 | 最近的中文字幕在线看视频 | 中文字幕av无码一区二区三区电影 | 日韩欧美中文字幕在线三区 | 亚洲国产av精品一区二区蜜芽 | 亚洲国精产品一二二线 | 日韩精品无码一本二本三本色 | 成人免费视频在线观看 | 三级4级全黄60分钟 | 国产深夜福利视频在线 | 欧美性黑人极品hd | 久久精品一区二区三区四区 | 国产亚av手机在线观看 | 国产精品久久久久久亚洲影视内衣 | 精品久久久无码人妻字幂 | 中文字幕av无码一区二区三区电影 | 永久免费观看美女裸体的网站 | 成人欧美一区二区三区 | 国产97人人超碰caoprom | 大地资源网第二页免费观看 | 亚洲男人av香蕉爽爽爽爽 | 精品无人区无码乱码毛片国产 | 亚洲经典千人经典日产 | 国产莉萝无码av在线播放 | 久久久av男人的天堂 | 日日摸夜夜摸狠狠摸婷婷 | 精品亚洲韩国一区二区三区 | 高清不卡一区二区三区 | 日日碰狠狠丁香久燥 | 伊人色综合久久天天小片 | 国产精品二区一区二区aⅴ污介绍 | 东京热一精品无码av | 精品国产一区二区三区av 性色 | 久久精品国产一区二区三区肥胖 | 午夜精品久久久久久久 | 久久综合给久久狠狠97色 | 少妇性俱乐部纵欲狂欢电影 | 亚洲熟女一区二区三区 | 狠狠噜狠狠狠狠丁香五月 | 久久综合给久久狠狠97色 | 亚洲乱码国产乱码精品精 | 好爽又高潮了毛片免费下载 | 国产三级久久久精品麻豆三级 | 性欧美videos高清精品 | 伊人久久婷婷五月综合97色 | 99久久亚洲精品无码毛片 | 亚洲性无码av中文字幕 | 欧洲vodafone精品性 | 国产精品18久久久久久麻辣 | 扒开双腿疯狂进出爽爽爽视频 | 清纯唯美经典一区二区 | 成人无码视频免费播放 | 俺去俺来也www色官网 | 欧美精品一区二区精品久久 | 九九综合va免费看 | 日日干夜夜干 | 国产舌乚八伦偷品w中 | 国产熟女一区二区三区四区五区 | 欧美日韩一区二区综合 | 少妇被粗大的猛进出69影院 | 亚洲色大成网站www | 纯爱无遮挡h肉动漫在线播放 | 好爽又高潮了毛片免费下载 | 国内综合精品午夜久久资源 | 国产三级久久久精品麻豆三级 | 狠狠色欧美亚洲狠狠色www | 超碰97人人射妻 | 国产免费久久精品国产传媒 | 欧美日韩久久久精品a片 | 男女性色大片免费网站 | 色婷婷综合激情综在线播放 | 人人妻在人人 | 国产一区二区三区日韩精品 | 国产成人无码一二三区视频 | 亚洲日韩一区二区三区 | 熟妇人妻无码xxx视频 | 国产在线精品一区二区高清不卡 | 成人免费视频视频在线观看 免费 | 久久久中文字幕日本无吗 | 少妇性荡欲午夜性开放视频剧场 | 2020久久香蕉国产线看观看 | 少妇性荡欲午夜性开放视频剧场 | 国产乱人伦偷精品视频 | 午夜精品久久久久久久久 |