濮阳杆衣贸易有限公司

主頁 > 知識庫 > PyTorch 如何檢查模型梯度是否可導

PyTorch 如何檢查模型梯度是否可導

熱門標簽:ai電銷機器人的優(yōu)勢 商家地圖標注海報 打電話機器人營銷 騰訊地圖標注沒法顯示 地圖標注自己和別人標注區(qū)別 孝感營銷電話機器人效果怎么樣 聊城語音外呼系統(tǒng) 南陽打電話機器人 海外網(wǎng)吧地圖標注注冊

一、PyTorch 檢查模型梯度是否可導

當我們構(gòu)建復雜網(wǎng)絡模型或在模型中加入復雜操作時,可能會需要驗證該模型或操作是否可導,即模型是否能夠優(yōu)化,在PyTorch框架下,我們可以使用torch.autograd.gradcheck函數(shù)來實現(xiàn)這一功能。

首先看一下官方文檔中關(guān)于該函數(shù)的介紹:

可以看到官方文檔中介紹了該函數(shù)基于何種方法,以及其參數(shù)列表,下面給出幾個例子介紹其使用方法,注意:

Tensor需要是雙精度浮點型且設置requires_grad = True

第一個例子:檢查某一操作是否可導

from torch.autograd import gradcheck
import torch
import torch.nn as nn
 
inputs = torch.randn((10, 5), requires_grad=True, dtype=torch.double)
linear = nn.Linear(5, 3)
linear = linear.double()
test = gradcheck(lambda x: linear(x), inputs)
print("Are the gradients correct: ", test)

輸出為:

Are the gradients correct: True

第二個例子:檢查某一網(wǎng)絡模型是否可導

from torch.autograd import gradcheck
import torch
import torch.nn as nn 
# 定義神經(jīng)網(wǎng)絡模型
class Net(nn.Module):
 
    def __init__(self):
        super(Net, self).__init__()
        self.net = nn.Sequential(
            nn.Linear(15, 30),
            nn.ReLU(),
            nn.Linear(30, 15),
            nn.ReLU(),
            nn.Linear(15, 1),
            nn.Sigmoid()
        )
 
    def forward(self, x):
        y = self.net(x)
        return y
 
net = Net()
net = net.double()
inputs = torch.randn((10, 15), requires_grad=True, dtype=torch.double)
test = gradcheck(net, inputs)
print("Are the gradients correct: ", test)

輸出為:

Are the gradients correct: True

二、Pytorch求導

1.標量對矩陣求導

驗證:

>>>import torch
>>>a = torch.tensor([[1],[2],[3.],[4]])    # 4*1列向量
>>>X = torch.tensor([[1,2,3],[5,6,7],[8,9,10],[5,4,3.]],requires_grad=True)  #4*3矩陣,注意,值必須要是float類型
>>>b = torch.tensor([[2],[3],[4.]]) #3*1列向量
>>>f = a.view(1,-1).mm(X).mm(b)  # f = a^T.dot(X).dot(b)
>>>f.backward()
>>>X.grad   #df/dX = a.dot(b^T)
tensor([[ 2.,  3.,  4.],
    [ 4.,  6.,  8.],
    [ 6.,  9., 12.],
    [ 8., 12., 16.]])
>>>a.grad b.grad   # a和b的requires_grad都為默認(默認為False),所以求導時,沒有梯度
(None, None)
>>>a.mm(b.view(1,-1))  # a.dot(b^T)
    tensor([[ 2.,  3.,  4.],
    [ 4.,  6.,  8.],
    [ 6.,  9., 12.],
    [ 8., 12., 16.]])

2.矩陣對矩陣求導

驗證:

>>>A = torch.tensor([[1,2],[3,4.]])  #2*2矩陣
>>>X =  torch.tensor([[1,2,3],[4,5.,6]],requires_grad=True)  # 2*3矩陣
>>>F = A.mm(X)
>>>F
tensor([[ 9., 12., 15.],
    [19., 26., 33.]], grad_fn=MmBackward>)
>>>F.backgrad(torch.ones_like(F)) # 注意括號里要加上這句
>>>X.grad
tensor([[4., 4., 4.],
    [6., 6., 6.]])

注意:

requires_grad為True的數(shù)組必須是float類型

進行backgrad的必須是標量,如果是向量,必須在后面括號里加上torch.ones_like(X)

以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。

您可能感興趣的文章:
  • Pytorch通過保存為ONNX模型轉(zhuǎn)TensorRT5的實現(xiàn)
  • pytorch_pretrained_bert如何將tensorflow模型轉(zhuǎn)化為pytorch模型
  • pytorch模型的保存和加載、checkpoint操作
  • 解決Pytorch修改預訓練模型時遇到key不匹配的情況
  • pytorch 預訓練模型讀取修改相關(guān)參數(shù)的填坑問題
  • PyTorch模型轉(zhuǎn)TensorRT是怎么實現(xiàn)的?

標簽:六盤水 撫州 楊凌 迪慶 聊城 牡丹江 揚州 南寧

巨人網(wǎng)絡通訊聲明:本文標題《PyTorch 如何檢查模型梯度是否可導》,本文關(guān)鍵詞  PyTorch,如何,檢查,模型,梯度,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡,涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《PyTorch 如何檢查模型梯度是否可導》相關(guān)的同類信息!
  • 本頁收集關(guān)于PyTorch 如何檢查模型梯度是否可導的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    内黄县| 凌云县| 三亚市| 布尔津县| 昌图县| 永丰县| 电白县| 胶州市| 沙雅县| 墨玉县| 湖南省| 灌南县| 博爱县| 大同县| 永仁县| 乌兰县| 南乐县| 开远市| 井陉县| 偏关县| 双牌县| 皮山县| 新竹县| 延寿县| 陈巴尔虎旗| 墨脱县| 贞丰县| 宁陕县| 得荣县| 新蔡县| 宁津县| 勃利县| 宁晋县| 乐东| 辽阳县| 墨竹工卡县| 巫山县| 建德市| 莱阳市| 大余县| 江门市|