濮阳杆衣贸易有限公司

主頁 > 知識庫 > pytorch 中autograd.grad()函數(shù)的用法說明

pytorch 中autograd.grad()函數(shù)的用法說明

熱門標(biāo)簽:激戰(zhàn)2地圖標(biāo)注 廣告地圖標(biāo)注app 白銀外呼系統(tǒng) 海南400電話如何申請 陜西金融外呼系統(tǒng) 哈爾濱ai外呼系統(tǒng)定制 騰訊外呼線路 唐山智能外呼系統(tǒng)一般多少錢 公司電話機(jī)器人

我們在用神經(jīng)網(wǎng)絡(luò)求解PDE時(shí), 經(jīng)常要用到輸出值對輸入變量不是Weights和Biases)求導(dǎo); 在訓(xùn)練WGAN-GP 時(shí), 也會(huì)用到網(wǎng)絡(luò)對輸入變量的求導(dǎo)。

以上兩種需求, 均可以用pytorch 中的autograd.grad() 函數(shù)實(shí)現(xiàn)。

autograd.grad(outputs, inputs, grad_outputs=None, retain_graph=None, create_graph=False, only_inputs=True, allow_unused=False)

outputs: 求導(dǎo)的因變量(需要求導(dǎo)的函數(shù))

inputs: 求導(dǎo)的自變量

grad_outputs: 如果 outputs為標(biāo)量,則grad_outputs=None,也就是說,可以不用寫; 如果outputs 是向量,則此參數(shù)必須寫,不寫將會(huì)報(bào)如下錯(cuò)誤:

那么此參數(shù)究竟代表著什么呢?

先假設(shè) 為一維向量, 即可設(shè)自變量因變量分別為 , 其對應(yīng)的 Jacobi 矩陣為

grad_outputs 是一個(gè)shape 與 outputs 一致的向量, 即

在給定grad_outputs 之后,真正返回的梯度為

為方便下文敘述我們引入記號

其次假設(shè) ,第i個(gè)列向量對應(yīng)的Jacobi矩陣為

此時(shí)的grad_outputs 為(維度與outputs一致)

由第一種情況, 我們有

也就是說對輸出變量的列向量求導(dǎo),再經(jīng)過權(quán)重累加。

沿用第一種情況記號

, 其中每一個(gè) 均由第一種方法得出,

即對輸入變量列向量求導(dǎo),之后按照原先順序排列即可。

retain_graph: True 則保留計(jì)算圖, False則釋放計(jì)算圖

create_graph: 若要計(jì)算高階導(dǎo)數(shù),則必須選為True

allow_unused: 允許輸入變量不進(jìn)入計(jì)算

下面我們看一下具體的例子:

import torch
from torch import autograd
 
x = torch.rand(3, 4)
x.requires_grad_()

觀察 x 為

不妨設(shè) y 是 x 所有元素的和, 因?yàn)?y是標(biāo)量,故計(jì)算導(dǎo)數(shù)不需要設(shè)置grad_outputs

y = torch.sum(x)
grads = autograd.grad(outputs=y, inputs=x)[0]
print(grads)

結(jié)果為

若y是向量

y = x[:,0] +x[:,1]
# 設(shè)置輸出權(quán)重為1
grad = autograd.grad(outputs=y, inputs=x, grad_outputs=torch.ones_like(y))[0]
print(grad)
# 設(shè)置輸出權(quán)重為0
grad = autograd.grad(outputs=y, inputs=x, grad_outputs=torch.zeros_like(y))[0]
print(grad)

結(jié)果為

最后, 我們通過設(shè)置 create_graph=True 來計(jì)算二階導(dǎo)數(shù)

y = x ** 2
grad = autograd.grad(outputs=y, inputs=x, grad_outputs=torch.ones_like(y), create_graph=True)[0]
grad2 = autograd.grad(outputs=grad, inputs=x, grad_outputs=torch.ones_like(grad))[0]
print(grad2)

結(jié)果為

綜上,我們便搞清楚了它的求導(dǎo)機(jī)制。

補(bǔ)充:pytorch學(xué)習(xí)筆記:自動(dòng)微分機(jī)制(backward、torch.autograd.grad)

一、前言

神經(jīng)網(wǎng)絡(luò)通常依賴反向傳播求梯度來更新網(wǎng)絡(luò)參數(shù),求梯度過程通常是一件非常復(fù)雜而容易出錯(cuò)的事情。

而深度學(xué)習(xí)框架可以幫助我們自動(dòng)地完成這種求梯度運(yùn)算。

Pytorch一般通過反向傳播 backward方法 實(shí)現(xiàn)這種求梯度計(jì)算。該方法求得的梯度將存在對應(yīng)自變量張量的grad屬性下。

除此之外,也能夠調(diào)用torch.autograd.grad函數(shù)來實(shí)現(xiàn)求梯度計(jì)算。

這就是Pytorch的自動(dòng)微分機(jī)制。

二、利用backward方法求導(dǎo)數(shù)

backward方法通常在一個(gè)標(biāo)量張量上調(diào)用,該方法求得的梯度將存在對應(yīng)自變量張量的grad屬性下。如果調(diào)用的張量非標(biāo)量,則要傳入一個(gè)和它同形狀的gradient參數(shù)張量。相當(dāng)于用該gradient參數(shù)張量與調(diào)用張量作向量點(diǎn)乘,得到的標(biāo)量結(jié)果再反向傳播。

1, 標(biāo)量的反向傳播

import numpy as np 
import torch 
# f(x) = a*x**2 + b*x + c的導(dǎo)數(shù)
x = torch.tensor(0.0,requires_grad = True) # x需要被求導(dǎo)
a = torch.tensor(1.0)
b = torch.tensor(-2.0)
c = torch.tensor(1.0)
y = a*torch.pow(x,2) + b*x + c 
y.backward()
dy_dx = x.grad
print(dy_dx)

輸出:

tensor(-2.)

2, 非標(biāo)量的反向傳播

import numpy as np 
import torch 
# f(x) = a*x**2 + b*x + c
x = torch.tensor([[0.0,0.0],[1.0,2.0]],requires_grad = True) # x需要被求導(dǎo)
a = torch.tensor(1.0)
b = torch.tensor(-2.0)
c = torch.tensor(1.0)
y = a*torch.pow(x,2) + b*x + c 
gradient = torch.tensor([[1.0,1.0],[1.0,1.0]])
print("x:\n",x)
print("y:\n",y)
y.backward(gradient = gradient)
x_grad = x.grad
print("x_grad:\n",x_grad)

輸出:

x:

tensor([[0., 0.],

[1., 2.]], requires_grad=True)

y:

tensor([[1., 1.],

[0., 1.]], grad_fn=AddBackward0>)

x_grad:

tensor([[-2., -2.],

[ 0., 2.]])

3, 非標(biāo)量的反向傳播可以用標(biāo)量的反向傳播實(shí)現(xiàn)

import numpy as np 
import torch 
# f(x) = a*x**2 + b*x + c
x = torch.tensor([[0.0,0.0],[1.0,2.0]],requires_grad = True) # x需要被求導(dǎo)
a = torch.tensor(1.0)
b = torch.tensor(-2.0)
c = torch.tensor(1.0)
y = a*torch.pow(x,2) + b*x + c 
gradient = torch.tensor([[1.0,1.0],[1.0,1.0]])
z = torch.sum(y*gradient)
print("x:",x)
print("y:",y)
z.backward()
x_grad = x.grad
print("x_grad:\n",x_grad)

輸出:

x: tensor([[0., 0.],

[1., 2.]], requires_grad=True)

y: tensor([[1., 1.],

[0., 1.]], grad_fn=AddBackward0>)

x_grad:

tensor([[-2., -2.],

[ 0., 2.]])

三、利用autograd.grad方法求導(dǎo)數(shù)

import numpy as np 
import torch 
# f(x) = a*x**2 + b*x + c的導(dǎo)數(shù)
x = torch.tensor(0.0,requires_grad = True) # x需要被求導(dǎo)
a = torch.tensor(1.0)
b = torch.tensor(-2.0)
c = torch.tensor(1.0)
y = a*torch.pow(x,2) + b*x + c

# create_graph 設(shè)置為 True 將允許創(chuàng)建更高階的導(dǎo)數(shù) 
dy_dx = torch.autograd.grad(y,x,create_graph=True)[0]
print(dy_dx.data)
# 求二階導(dǎo)數(shù)
dy2_dx2 = torch.autograd.grad(dy_dx,x)[0] 
print(dy2_dx2.data)

輸出:

tensor(-2.)

tensor(2.)

import numpy as np 
import torch 
x1 = torch.tensor(1.0,requires_grad = True) # x需要被求導(dǎo)
x2 = torch.tensor(2.0,requires_grad = True)
y1 = x1*x2
y2 = x1+x2

# 允許同時(shí)對多個(gè)自變量求導(dǎo)數(shù)
(dy1_dx1,dy1_dx2) = torch.autograd.grad(outputs=y1,
                inputs = [x1,x2],retain_graph = True)
print(dy1_dx1,dy1_dx2)
# 如果有多個(gè)因變量,相當(dāng)于把多個(gè)因變量的梯度結(jié)果求和
(dy12_dx1,dy12_dx2) = torch.autograd.grad(outputs=[y1,y2],
            inputs = [x1,x2])
print(dy12_dx1,dy12_dx2)

輸出:

tensor(2.) tensor(1.)

tensor(3.) tensor(2.)

四、利用自動(dòng)微分和優(yōu)化器求最小值

import numpy as np 
import torch 
# f(x) = a*x**2 + b*x + c的最小值
x = torch.tensor(0.0,requires_grad = True) # x需要被求導(dǎo)
a = torch.tensor(1.0)
b = torch.tensor(-2.0)
c = torch.tensor(1.0)
optimizer = torch.optim.SGD(params=[x],lr = 0.01)

def f(x):
    result = a*torch.pow(x,2) + b*x + c 
    return(result)
for i in range(500):
    optimizer.zero_grad()
    y = f(x)
    y.backward()
    optimizer.step()   
    
print("y=",f(x).data,";","x=",x.data)

輸出:

y= tensor(0.) ; x= tensor(1.0000)

以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教。

您可能感興趣的文章:
  • pytorch-autograde-計(jì)算圖的特點(diǎn)說明
  • 淺談Pytorch中autograd的若干(踩坑)總結(jié)
  • PyTorch一小時(shí)掌握之a(chǎn)utograd機(jī)制篇

標(biāo)簽:惠州 益陽 鷹潭 四川 黑龍江 黔西 上海 常德

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《pytorch 中autograd.grad()函數(shù)的用法說明》,本文關(guān)鍵詞  pytorch,中,autograd.grad,函數(shù),;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《pytorch 中autograd.grad()函數(shù)的用法說明》相關(guān)的同類信息!
  • 本頁收集關(guān)于pytorch 中autograd.grad()函數(shù)的用法說明的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    南乐县| 华容县| 大港区| 老河口市| 景泰县| 青龙| 大悟县| 正定县| 郯城县| 林芝县| 阿克苏市| 平顺县| 通山县| 广东省| 钦州市| 惠州市| 固始县| 双城市| 澳门| 阳原县| 横峰县| 鸡西市| 道孚县| 大同县| 桂东县| 塘沽区| 全椒县| 宝应县| 抚顺市| 敦化市| 双桥区| 岱山县| 宁安市| 海宁市| 蓬安县| 南陵县| 瓦房店市| 来安县| 太谷县| 本溪市| 永平县|