選自然語言。如果你是選學(xué)科機器人小胖,那就選自然語言,如果你是工作,看你在什么地方,根據(jù)行業(yè)分布選,如果是想在北京,那就選自然語言,如果是在長三角,就選機器人視覺,在深圳就兩者都可以。
如果是工作的角度,選擇以后的發(fā)展方向,簡單的說一下計算機視覺和自然語言
1、計算機視覺目前已經(jīng)比較成熟,包括2D視覺,3D視覺,包括OCR等等都比較成熟。且玩家已經(jīng)固定了。
我們常規(guī)意義上講的計算機視覺也有不同層次的,例如應(yīng)用于工業(yè)的計算機2D,3D視覺。這類主要是配合自動化,傳感器做信息采集,以及比對,做檢測,或者監(jiān)控使用。比較典型的應(yīng)用例如早年的CCD檢測,就算這類工業(yè)計算機市場的應(yīng)用。這類工作也被稱為自動化工程師,包括現(xiàn)場調(diào)試以及方案編程。錢少,出差多,略有苦逼。但不是沒有前途的行業(yè)。只是略有辛苦,不少自動化行業(yè)的會進入這一領(lǐng)域。
這類企業(yè)比較典型的例如:基恩士,康耐視,大恒圖像,匯川技術(shù)等等。(很明顯,如果你想找這類工作,那多數(shù)集中在深圳,和長三角)
工業(yè)領(lǐng)域略微高深一些機器人視覺,主要應(yīng)用于機器人導(dǎo)航:SLAM。
通過視覺慣性算法,實現(xiàn)環(huán)境描繪,路徑規(guī)劃。傳說比較牛逼的tesla無人駕駛,就采用的是視覺慣性導(dǎo)航,目前國內(nèi)主推的無人駕駛導(dǎo)航,還是激光導(dǎo)航技術(shù)(性價比高,技術(shù)穩(wěn)定)。
第二個,計算機視覺,就是比較高大上的圖像智能領(lǐng)域。從場景應(yīng)用,上面可以有人臉識別技術(shù),動態(tài)人臉識別,OCR,細粒圖像技術(shù),以及在此基礎(chǔ)上涉及到的視頻技術(shù):視頻語義理解。
這類偏向于互聯(lián)網(wǎng)及消費端的應(yīng)用。
這類消費類的視覺,國內(nèi)比較典型的企業(yè):商湯科技,依圖科技,云從科技,曠視科技。當(dāng)然還包括大家都熟悉的Apple,google,百度這類互聯(lián)網(wǎng)企業(yè),主要應(yīng)用在計算機以及手機領(lǐng)域。
自然語言的按照整個發(fā)展和規(guī)劃,還是主要傾向于人工智能的基本入口。
整個自然語言的使用場景,基本上以消費市場為主。
所謂的自然語言,可能有不少人不太懂:就是分析、理解、生成人類語言, 及相關(guān)綜合應(yīng)用。
微信的文字語音轉(zhuǎn)文字,文字轉(zhuǎn)聲音,就屬于自然語言最初級的一種形式。
更為高級的是,能夠做語義分析,情感分析,意圖理解。
目前國內(nèi)比較多的輿情分析網(wǎng)站,就是采用的這種自然語言的分析模式。
自然語言的發(fā)展契機就在于,如果要實現(xiàn)人工智能更高的飛躍,就一定需要自然語言的支持,不然人機互動中,你問機器人,我想找點好吃的,他給你推薦一大堆快餐,顯然并不合適。
目前自然語言的應(yīng)用在消費領(lǐng)域,比較廣泛。
(1)語義理解
最近比較流向的一個網(wǎng)站,
就是非常典型的語義理解的搜索引擎。這類引擎也比較多。
(2)篇章理解
篇章理解,目前包括各類輿情監(jiān)控的軟件。例如百度輿情,融文都是這種篇章理解的應(yīng)用。從算法上面來說,就是分詞后,提取關(guān)鍵詞。(當(dāng)然我說的比較籠統(tǒng),用小學(xué)的教育,就是找中心思想)
(3)情感分析
情感分析,熟悉Python的朋友,應(yīng)該都知道,做語義分析中情感分析的重要性。
(4)自動協(xié)作
自動協(xié)作,其實就是未來服務(wù)機器人的范疇了。目前我們常見的siri,或者天貓精靈,都算是這類的入門吧。
(5)語言理解與交互
那個曾經(jīng)神乎其神的,科大訊飛的同聲翻譯機,就屬于這個范疇。
(6)翻譯軟件,百度,有道等等
這個就不細節(jié)介紹了機器人小胖,使用過的都懂。
那么我們看到如果在消費端口,這部分企業(yè)分布比較多。并且一般都是為自家服務(wù),例如OPPO,小米都脫離不了自然語言的開發(fā)。所以相對而言,如果你是一直在互聯(lián)網(wǎng)領(lǐng)域,那就選自然語言吧。尤其是如果你在北京。北京不缺人工智能,但缺少機器人實體企業(yè)。