在鈦媒體在線課“鈦坦白”第43期,我們請(qǐng)來(lái)了三位鈦客,帶大家思考“人機(jī)大戰(zhàn)”后人工智能何去何從。本期鈦客之一、浪潮人工智能首席架構(gòu)師張清,是《MIC高性能計(jì)算編程指南》作者,開(kāi)源深度學(xué)習(xí)計(jì)算框架Caffe-MPI設(shè)計(jì)者之一。并先后主導(dǎo)完成語(yǔ)音、圖像、安適等深度學(xué)習(xí)GPU項(xiàng)目,并傳統(tǒng)HPC、視頻大數(shù)據(jù)等標(biāo)的目的多個(gè)CPU多核、GPU、MIC、FPGA計(jì)算項(xiàng)目。
本文節(jié)選自張清在鈦坦白的分享。如果您還不是鈦媒體Pro用戶,希望查看鈦坦白所有干貨,進(jìn)入鈦坦白九個(gè)專業(yè)群交流,并查看更豐富的專業(yè)數(shù)據(jù)和信息,可點(diǎn)擊:注冊(cè)。
以下按照張清在鈦坦白的分享實(shí)錄整理:
大家好,我是來(lái)自浪潮的張清,非常感謝鈦媒體的邀請(qǐng),也同樣感謝之前來(lái)自曙光和科大訊飛的兩位專家的精彩分享,我今天給大家分享的主題是面向人工智能的計(jì)算解決方案。
在分享之前我首先簡(jiǎn)單的介紹一下浪潮在人工智能方面的工作。浪潮是先進(jìn)的人工智能計(jì)算系統(tǒng)與解決方案提供商,擁有從人工智能計(jì)算產(chǎn)品研發(fā)、計(jì)算系統(tǒng)建設(shè)、軟件設(shè)計(jì)、系統(tǒng)運(yùn)維辦事能力,擁有完備的人工智能端到端解決方案、計(jì)算系統(tǒng)軟硬件產(chǎn)品和應(yīng)用辦事體系,在廣泛應(yīng)用人工智能技術(shù)的互聯(lián)網(wǎng)領(lǐng)域,浪潮計(jì)算設(shè)備產(chǎn)品在中國(guó)大型互聯(lián)網(wǎng)市場(chǎng)占用率超過(guò)80%,成為中國(guó)人工智能第一品牌計(jì)算設(shè)備提供商。
AI的發(fā)展趨勢(shì)

人類已經(jīng)經(jīng)過(guò)了三次科技革命——蒸汽時(shí)代、電氣時(shí)代和信息時(shí)代,每次科技革命的發(fā)生都為社會(huì)帶來(lái)巨大的厘革和進(jìn)步。AI時(shí)代已經(jīng)到來(lái),它可能成為第四次科技革命。下面我們來(lái)看一下AI市場(chǎng)、行業(yè)應(yīng)用、技術(shù)的發(fā)展趨勢(shì)。
AI市場(chǎng)的發(fā)展趨勢(shì)

A市場(chǎng)正在蓬勃發(fā)展,我們從近五年人工智能的投資金額發(fā)現(xiàn)從2012年到2016年,年均增長(zhǎng)率達(dá)到50%以上,截止到2016年,它的投資金額達(dá)到42.5億美元,AI近五年M&A和IPO的數(shù)量年均增長(zhǎng)率為49.85%,2016年已達(dá)到68項(xiàng),2020年AI整個(gè)的市場(chǎng)規(guī)模將達(dá)到480億美元。(數(shù)據(jù)來(lái)源:CB Insights)
AI行業(yè)應(yīng)用的發(fā)展趨勢(shì)

2011年,谷歌和微軟研究院的語(yǔ)音識(shí)別標(biāo)的目的研究專家先后采用深度神經(jīng)網(wǎng)絡(luò)技術(shù)將語(yǔ)音識(shí)另外錯(cuò)誤率降低20%~30%,這是長(zhǎng)期以來(lái)語(yǔ)音識(shí)別研究領(lǐng)域取得的重大突破。2012年,深度神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別應(yīng)用方面也獲得重大進(jìn)展,在ImageNet評(píng)測(cè)問(wèn)題中將本來(lái)的錯(cuò)誤率降低了9%,隨著AI在語(yǔ)音和圖像識(shí)另外巨大成功,互聯(lián)網(wǎng)行業(yè)越來(lái)越多的用戶開(kāi)始應(yīng)用AI。從2015年開(kāi)始,傳統(tǒng)行業(yè)越來(lái)越多的用戶也開(kāi)始應(yīng)用AI,好比金融企業(yè)、醫(yī)療企業(yè)、汽車廠商和安防企業(yè)等。本年,我們也看到很多傳統(tǒng)科學(xué)計(jì)算用戶開(kāi)始研究AI技術(shù),如氣象和石油勘探用戶,利用 AI技術(shù)來(lái)提高相關(guān)應(yīng)用的預(yù)測(cè)精度。
總的來(lái)說(shuō),AI行業(yè)應(yīng)用用戶已經(jīng)從目前最為火熱的互聯(lián)網(wǎng)行業(yè)用戶,逐步發(fā)展到傳統(tǒng)企業(yè)用戶和科學(xué)計(jì)算HPC用戶。
AI技術(shù)的發(fā)展趨勢(shì)

我們先看兩個(gè)例子,第一個(gè)是圖像識(shí)別方面的Imagenet角逐,2012年Imagenet角逐冠軍網(wǎng)絡(luò)模型是Alexnet,它只有8層,訓(xùn)練所需要的計(jì)算量是相對(duì)比較小的,每一張圖片只要1.4GFlop,所訓(xùn)練出來(lái)的模型的精度達(dá)到84%,也就是錯(cuò)誤率為16%。到了2015年,經(jīng)過(guò)三年的發(fā)展,Imagenet角逐的冠軍網(wǎng)絡(luò)模型是微軟設(shè)計(jì)的Resnet,其變得更加復(fù)雜,模型的層數(shù)達(dá)到152層,層數(shù)是Alexnet的19倍,每一張圖片所需要計(jì)算量大大提高,達(dá)到22GFlop,但錯(cuò)誤率下降為3.5%。
另一個(gè)例子更加驚人,是關(guān)于語(yǔ)音識(shí)別。百度設(shè)計(jì)的語(yǔ)音識(shí)別模型,2014年有2500萬(wàn)的參數(shù),訓(xùn)練的數(shù)據(jù)量是7000小時(shí)的語(yǔ)料,8%的錯(cuò)誤率。2015年的訓(xùn)練數(shù)據(jù)是此前的2倍,深度學(xué)習(xí)網(wǎng)絡(luò)是本來(lái)的4倍大,2倍的數(shù)據(jù)量,4倍的網(wǎng)絡(luò)復(fù)雜性,實(shí)現(xiàn)的錯(cuò)誤率是5%,但是需要付出什么樣的代價(jià)?就是計(jì)算量的增長(zhǎng)。
所以我們從這兩個(gè)例子可以看出,AI技術(shù)的發(fā)展趨勢(shì)是朝著大數(shù)據(jù)+大模型+大計(jì)算標(biāo)的目的發(fā)展,采用更大的模型和數(shù)據(jù)會(huì)使訓(xùn)練出來(lái)的模型的精度大幅提高,但這需要更大的計(jì)算資源作為支撐。
AI面臨的挑戰(zhàn)及計(jì)算解決方案
AI主要面臨三個(gè)方面的挑戰(zhàn):
一是需要獲取足夠多的標(biāo)注的數(shù)據(jù)用于模型的訓(xùn)練;
二是需要設(shè)計(jì)分布式深度神經(jīng)網(wǎng)絡(luò)模型及算法;
三是需要一個(gè)大的深度學(xué)習(xí)計(jì)算平臺(tái)以及平臺(tái)辦理軟件。

針對(duì)上面三個(gè)方面的挑戰(zhàn),我們從四個(gè)層次去設(shè)計(jì)整個(gè)AI計(jì)算解決方案:
第一層次是平臺(tái)層;從整個(gè)AI計(jì)算過(guò)程的差別特點(diǎn)需求,我們會(huì)設(shè)計(jì)數(shù)據(jù)預(yù)處理平臺(tái)、訓(xùn)練平臺(tái)、推理平臺(tái),采用差別的網(wǎng)絡(luò)和存儲(chǔ)。