濮阳杆衣贸易有限公司

主頁(yè) > 知識(shí)庫(kù) > pytorch中LN(LayerNorm)及Relu和其變相的輸出操作

pytorch中LN(LayerNorm)及Relu和其變相的輸出操作

熱門(mén)標(biāo)簽:開(kāi)封語(yǔ)音外呼系統(tǒng)代理商 電銷機(jī)器人的風(fēng)險(xiǎn) 天津電話機(jī)器人公司 地圖標(biāo)注線上如何操作 開(kāi)封自動(dòng)外呼系統(tǒng)怎么收費(fèi) 400電話辦理哪種 河北防封卡電銷卡 手機(jī)網(wǎng)頁(yè)嵌入地圖標(biāo)注位置 應(yīng)電話機(jī)器人打電話違法嗎

主要就是了解一下pytorch中的使用layernorm這種歸一化之后的數(shù)據(jù)變化,以及數(shù)據(jù)使用relu,prelu,leakyrelu之后的變化。

import torch
import torch.nn as nn
import torch.nn.functional as F
class model(nn.Module):
    def __init__(self):
        super(model, self).__init__()
        self.LN=nn.LayerNorm(10,eps=0,elementwise_affine=True)
        self.PRelu=nn.PReLU(init=0.25)
        self.Relu=nn.ReLU()
        self.LeakyReLU=nn.LeakyReLU(negative_slope=0.01,inplace=False)
    def forward(self,input ):
        out=self.LN(input)
        print("LN:",out)
        out1=self.PRelu(out)
        print("PRelu:",out1)
        out2=self.Relu(out)
        print("Relu:",out2)
        out3=self.LeakyReLU(out)
        print("LeakyRelu:",out3)
        return out
tensor=torch.tensor([-0.9,0.1,0,-0.1,0.9,-0.4,0.9,-0.5,0.8,0.1])
net=model()
print(tensor)
net(tensor)

輸出:

tensor([-0.9000,  0.1000,  0.0000, -0.1000,  0.9000, -0.4000,  0.9000, -0.5000,
         0.8000,  0.1000])
LN: tensor([-1.6906,  0.0171, -0.1537, -0.3245,  1.3833, -0.8368,  1.3833, -1.0076,
         1.2125,  0.0171], grad_fn=NativeLayerNormBackward>)
Relu: tensor([0.0000, 0.0171, 0.0000, 0.0000, 1.3833, 0.0000, 1.3833, 0.0000, 1.2125,
        0.0171], grad_fn=ReluBackward0>)
PRelu: tensor([-0.4227,  0.0171, -0.0384, -0.0811,  1.3833, -0.2092,  1.3833, -0.2519,
         1.2125,  0.0171], grad_fn=PreluBackward>)
LeakyRelu: tensor([-0.0169,  0.0171, -0.0015, -0.0032,  1.3833, -0.0084,  1.3833, -0.0101,
         1.2125,  0.0171], grad_fn=LeakyReluBackward0>)

從上面可以看出,這個(gè)LayerNorm的歸一化,并不是將數(shù)據(jù)限定在0-1之間,也沒(méi)有進(jìn)行一個(gè)類似于高斯分布一樣的分?jǐn)?shù),只是將其進(jìn)行了一個(gè)處理,對(duì)應(yīng)的數(shù)值得到了一些變化,相同數(shù)值的變化也是相同的。

Relu的則是單純將小于0的數(shù)變成了0,減少了梯度消失的可能性

PRelu是一定程度上的保留了負(fù)值,根據(jù)init給的值。

LeakyRelu也是一定程度上保留負(fù)值,不過(guò)比較小,應(yīng)該是根據(jù)negative_slope給的值。

補(bǔ)充:PyTorch學(xué)習(xí)之歸一化層(BatchNorm、LayerNorm、InstanceNorm、GroupNorm)

BN,LN,IN,GN從學(xué)術(shù)化上解釋差異:

BatchNorm:batch方向做歸一化,算NHW的均值,對(duì)小batchsize效果不好;BN主要缺點(diǎn)是對(duì)batchsize的大小比較敏感,由于每次計(jì)算均值和方差是在一個(gè)batch上,所以如果batchsize太小,則計(jì)算的均值、方差不足以代表整個(gè)數(shù)據(jù)分布

LayerNorm:channel方向做歸一化,算CHW的均值,主要對(duì)RNN作用明顯;

InstanceNorm:一個(gè)channel內(nèi)做歸一化,算H*W的均值,用在風(fēng)格化遷移;因?yàn)樵趫D像風(fēng)格化中,生成結(jié)果主要依賴于某個(gè)圖像實(shí)例,所以對(duì)整個(gè)batch歸一化不適合圖像風(fēng)格化中,因而對(duì)HW做歸一化??梢约铀倌P褪諗?,并且保持每個(gè)圖像實(shí)例之間的獨(dú)立。

GroupNorm:將channel方向分group,然后每個(gè)group內(nèi)做歸一化,算(C//G)HW的均值;這樣與batchsize無(wú)關(guān),不受其約束。

SwitchableNorm是將BN、LN、IN結(jié)合,賦予權(quán)重,讓網(wǎng)絡(luò)自己去學(xué)習(xí)歸一化層應(yīng)該使用什么方法。

1 BatchNorm

torch.nn.BatchNorm1d(num_features, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
torch.nn.BatchNorm2d(num_features, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
torch.nn.BatchNorm3d(num_features, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)

參數(shù):

num_features: 來(lái)自期望輸入的特征數(shù),該期望輸入的大小為'batch_size x num_features [x width]'

eps: 為保證數(shù)值穩(wěn)定性(分母不能趨近或取0),給分母加上的值。默認(rèn)為1e-5。

momentum: 動(dòng)態(tài)均值和動(dòng)態(tài)方差所使用的動(dòng)量。默認(rèn)為0.1。

affine: 布爾值,當(dāng)設(shè)為true,給該層添加可學(xué)習(xí)的仿射變換參數(shù)。

track_running_stats:布爾值,當(dāng)設(shè)為true,記錄訓(xùn)練過(guò)程中的均值和方差;

實(shí)現(xiàn)公式:

track_running_stats:布爾值,當(dāng)設(shè)為true,記錄訓(xùn)練過(guò)程中的均值和方差;

實(shí)現(xiàn)公式:

2 GroupNorm

torch.nn.GroupNorm(num_groups, num_channels, eps=1e-05, affine=True)

參數(shù):

num_groups:需要?jiǎng)澐譃榈膅roups

num_features:來(lái)自期望輸入的特征數(shù),該期望輸入的大小為'batch_size x num_features [x width]'

eps:為保證數(shù)值穩(wěn)定性(分母不能趨近或取0),給分母加上的值。默認(rèn)為1e-5。

momentum:動(dòng)態(tài)均值和動(dòng)態(tài)方差所使用的動(dòng)量。默認(rèn)為0.1。

affine:布爾值,當(dāng)設(shè)為true,給該層添加可學(xué)習(xí)的仿射變換參數(shù)。

實(shí)現(xiàn)公式:

3 InstanceNorm

torch.nn.InstanceNorm1d(num_features, eps=1e-05, momentum=0.1, affine=False, track_running_stats=False)
torch.nn.InstanceNorm2d(num_features, eps=1e-05, momentum=0.1, affine=False, track_running_stats=False)
torch.nn.InstanceNorm3d(num_features, eps=1e-05, momentum=0.1, affine=False, track_running_stats=False)

參數(shù):

num_features:來(lái)自期望輸入的特征數(shù),該期望輸入的大小為'batch_size x num_features [x width]'

eps:為保證數(shù)值穩(wěn)定性(分母不能趨近或取0),給分母加上的值。默認(rèn)為1e-5。

momentum:動(dòng)態(tài)均值和動(dòng)態(tài)方差所使用的動(dòng)量。默認(rèn)為0.1。

affine:布爾值,當(dāng)設(shè)為true,給該層添加可學(xué)習(xí)的仿射變換參數(shù)。

track_running_stats:布爾值,當(dāng)設(shè)為true,記錄訓(xùn)練過(guò)程中的均值和方差;

實(shí)現(xiàn)公式:

4 LayerNorm

torch.nn.LayerNorm(normalized_shape, eps=1e-05, elementwise_affine=True)

參數(shù):

normalized_shape: 輸入尺寸

[∗×normalized_shape[0]×normalized_shape[1]×…×normalized_shape[−1]]

eps: 為保證數(shù)值穩(wěn)定性(分母不能趨近或取0),給分母加上的值。默認(rèn)為1e-5。

elementwise_affine: 布爾值,當(dāng)設(shè)為true,給該層添加可學(xué)習(xí)的仿射變換參數(shù)。

實(shí)現(xiàn)公式:

5 LocalResponseNorm

torch.nn.LocalResponseNorm(size, alpha=0.0001, beta=0.75, k=1.0)

參數(shù):

size:用于歸一化的鄰居通道數(shù)

alpha:乘積因子,Default: 0.0001

beta :指數(shù),Default: 0.75

k:附加因子,Default: 1

實(shí)現(xiàn)公式:

以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。

您可能感興趣的文章:
  • pytorch方法測(cè)試——激活函數(shù)(ReLU)詳解
  • pytorch在fintune時(shí)將sequential中的層輸出方法,以vgg為例
  • pytorch 輸出中間層特征的實(shí)例
  • PyTorch之nn.ReLU與F.ReLU的區(qū)別介紹

標(biāo)簽:成都 駐馬店 六盤(pán)水 宿遷 江蘇 蘭州 常州 山東

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《pytorch中LN(LayerNorm)及Relu和其變相的輸出操作》,本文關(guān)鍵詞  pytorch,中,LayerNorm,及,Relu,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《pytorch中LN(LayerNorm)及Relu和其變相的輸出操作》相關(guān)的同類信息!
  • 本頁(yè)收集關(guān)于pytorch中LN(LayerNorm)及Relu和其變相的輸出操作的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    安丘市| 丰宁| 东乡县| 会泽县| 耒阳市| 福鼎市| 湛江市| 沾化县| 长岛县| 广东省| 饶阳县| 静乐县| 石渠县| 静宁县| 前郭尔| 武功县| 广宗县| 厦门市| 迁安市| 海阳市| 祁东县| 夏邑县| 丹凤县| 华安县| 三门县| 蓝山县| 卫辉市| 清徐县| 兴国县| 共和县| 台北县| 上犹县| 廊坊市| 通渭县| 武强县| 阿鲁科尔沁旗| 沿河| 绥宁县| 鹤壁市| 台安县| 嘉义县|