濮阳杆衣贸易有限公司

主頁 > 知識庫 > 解決Pytorch內(nèi)存溢出,Ubuntu進(jìn)程killed的問題

解決Pytorch內(nèi)存溢出,Ubuntu進(jìn)程killed的問題

熱門標(biāo)簽:天津電話機器人公司 地圖標(biāo)注線上如何操作 電銷機器人的風(fēng)險 400電話辦理哪種 手機網(wǎng)頁嵌入地圖標(biāo)注位置 河北防封卡電銷卡 開封自動外呼系統(tǒng)怎么收費 開封語音外呼系統(tǒng)代理商 應(yīng)電話機器人打電話違法嗎

pytorch顯存越來越多的一個原因

optimizer.zero_grad()
loss.backward()
optimizer.step()
train_loss += loss

參考了別人的代碼發(fā)現(xiàn)那句loss一般是這樣寫

loss_sum += loss.data[0]

這是因為輸出的loss的數(shù)據(jù)類型是Variable。而PyTorch的動態(tài)圖機制就是通過Variable來構(gòu)建圖。主要是使用Variable計算的時候,會記錄下新產(chǎn)生的Variable的運算符號,在反向傳播求導(dǎo)的時候進(jìn)行使用。如果這里直接將loss加起來,系統(tǒng)會認(rèn)為這里也是計算圖的一部分,也就是說網(wǎng)絡(luò)會一直延伸變大那么消耗的顯存也就越來越大。

用Tensor計算要寫成:

train_loss += loss.item()

correct_total += torch.eq(predict, label_batch).sum().item()
train_loss += loss.item()

當(dāng)需要將模型中變量提取出來參與計算時,需要使用** .item()**

補充:linux下運行pytorch程序顯示“killed”或者“已殺死”

這是由pytorch對于內(nèi)存不足的反應(yīng),確切說,是Linux內(nèi)核對pytorch程序占用太多內(nèi)存的反應(yīng)。Linux內(nèi)核一旦因為內(nèi)存資源不足而生氣的時候,會使用OOM killer將占用內(nèi)存最多的進(jìn)程殺掉。

這種情況下,pytorch的python程序根本就來不及顯示相關(guān)的內(nèi)存日志,直接在呼喊出killed這一個簡短有力的詞語后,就game over了。如果不提前掌握這個背景的話,你可真是會手足無措啊。

既然我們確定了是內(nèi)存不足導(dǎo)致的問題(dmesg也能明確的顯示出kernel把占了近10個GB的python進(jìn)程給kill了),

那我們的解決方案就有2個:

第一個是加大內(nèi)存,將我的x99平臺的內(nèi)存從16GB增加到64GB;這個方案先放棄了,因為內(nèi)存條漲價太猛,我買不起了;

第二個是增加swap分區(qū),當(dāng)然性能會降低,但不需要額外增加成本。所以Gemfield今天的選擇就是第二個方案。

1、先禁止掉swap功能

sudo swapoff /swapfile

這個命令執(zhí)行之后,如果你用free命令查看的話會發(fā)現(xiàn)swap分區(qū)的大小變?yōu)榱?。

2、增加 /swapfile的大小

sudo dd if=/dev/zero of=/swapfile bs=1M count=30720 oflag=append conv=notrunc

這個命令會在現(xiàn)有的/swapfile后面追加30GB,加上之前的2GB的swap分區(qū),現(xiàn)在共有32個GB的swap分區(qū)了。如果按照固態(tài)硬盤128GB有300多塊錢來算的話,這個命令花了七八十塊錢呢。

3、設(shè)置這個文件為swap分區(qū)的掛載點:

sudo mkswap /swapfile

4、再次啟用swap

sudo swapon /swapfile

以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。

您可能感興趣的文章:
  • linux或windows環(huán)境下pytorch的安裝與檢查驗證(解決runtimeerror問題)
  • 解決pytorch GPU 計算過程中出現(xiàn)內(nèi)存耗盡的問題
  • 解決pytorch 保存模型遇到的問題

標(biāo)簽:江蘇 山東 駐馬店 蘭州 宿遷 常州 成都 六盤水

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《解決Pytorch內(nèi)存溢出,Ubuntu進(jìn)程killed的問題》,本文關(guān)鍵詞  解決,Pytorch,內(nèi)存,溢出,Ubuntu,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《解決Pytorch內(nèi)存溢出,Ubuntu進(jìn)程killed的問題》相關(guān)的同類信息!
  • 本頁收集關(guān)于解決Pytorch內(nèi)存溢出,Ubuntu進(jìn)程killed的問題的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    石城县| 五华县| 广东省| 长垣县| 中方县| 罗田县| 陈巴尔虎旗| 东方市| 延长县| 河北区| 会东县| 尼木县| 察雅县| 尼玛县| 阿瓦提县| 莒南县| 咸丰县| 嫩江县| 田林县| 咸宁市| 涿州市| 裕民县| 安塞县| 石家庄市| 苗栗市| 扬州市| 新沂市| 西安市| 武胜县| 新安县| 高邮市| 汽车| 建阳市| 尤溪县| 合江县| 高雄县| 桂东县| 剑河县| 罗甸县| 商水县| 胶州市|