一個人獨處時铸老,感覺有點孤單,怎么辦?微軟亞洲研究院推出的“微軟小冰”耍俱,或許可以像閨蜜一樣地跟你聊天解悶尽瑰。3.0版本的“小冰”除了具有“評顏值”“選搭配”等功能外,還基于深度學(xué)習技術(shù)具備強大的視覺識別能力馒脏。它在看到一張圖片后奠拢,可以基于情感給出人性化回復(fù),且秒回速度縮短到250毫秒歌淹。
不僅僅是“微軟小冰”和圍棋高手“阿爾法狗”瘟则,從互聯(lián)網(wǎng)搜索到語言翻譯,乃至識別患有自閉癥風險的基因……凡是需要從大量數(shù)據(jù)中預(yù)測未知信息的領(lǐng)域枝秤,都是深度學(xué)習可以一展拳腳的地方醋拧。那么,什么是深度學(xué)習技術(shù)?它將怎樣改變?nèi)祟惖纳?
萬張圖片中發(fā)現(xiàn)重復(fù)的貓
2011年宿百,谷歌一家實驗室的研究人員從視頻網(wǎng)站中趁仙,抽取了1000萬張靜態(tài)圖片,把它“喂”給谷歌大腦垦页,目標是從中尋找重復(fù)出現(xiàn)的圖案。3天后干奢,谷歌大腦在沒有人類幫助的情況下痊焊,從這些圖片中發(fā)現(xiàn)了“貓”。
這個谷歌大腦就是一個采用深度學(xué)習技術(shù)的大型神經(jīng)網(wǎng)絡(luò)模型忿峻,由1000臺電腦組成薄啥。這件事當時在科技界引起了轟動,被認為深度學(xué)習復(fù)興的里程碑逛尚。
所謂深度學(xué)習垄惧,就是用多層神經(jīng)元構(gòu)成的神經(jīng)網(wǎng)絡(luò),以達到機器學(xué)習的功能街赊。這些多層的電腦網(wǎng)絡(luò)像人類大腦一樣搜计,可以收集信息,并基于收集到的信息產(chǎn)生相應(yīng)的行為娘介。
傳統(tǒng)的機器學(xué)習方法一般只能挖掘簡單的線性關(guān)系杉藐,如1+1等于2枯橱。然而,大千世界并不是這種簡單關(guān)系所能描述的攒置,如收入與年齡粹岁、性別、職業(yè)尖坦、學(xué)歷的關(guān)系骂领。深度學(xué)習的出現(xiàn)改變了這種現(xiàn)狀,它的靈感來源于模仿人類大腦神經(jīng)網(wǎng)絡(luò)装屈。
科學(xué)家發(fā)現(xiàn)勤焕,人類大腦皮質(zhì)不是直接對視網(wǎng)膜傳遞過來的數(shù)據(jù)進行特征提取處理,而是讓接收到的刺激信號通過一個復(fù)雜的網(wǎng)絡(luò)模型進行篩選愕炸。這種層級結(jié)構(gòu)大大降低了視覺系統(tǒng)處理的數(shù)據(jù)量疮丛,并最終保留了有用的信息。
上世紀60年代辆它,生物學(xué)家在研究貓的腦皮層時誊薄,發(fā)現(xiàn)其獨特的網(wǎng)絡(luò)結(jié)構(gòu)能有效降低反饋神經(jīng)網(wǎng)絡(luò)的復(fù)雜性,繼而提出“卷積神經(jīng)網(wǎng)絡(luò)”锰茉。利用這種網(wǎng)絡(luò)結(jié)構(gòu)編寫的深度學(xué)習程序呢蔫,適應(yīng)性很強,成為人工智能的突破口飒筑。
語音識別改變?nèi)藱C交互
簡單地講片吊,深度學(xué)習技術(shù)是對人腦的一種模擬,因而可以完成很多人腦所具有的功能协屡。
最為人所熟知的是視覺功能俏脊。我們的相機可以像眼睛一樣看到這個世界,卻不能像大腦一樣看懂這個世界肤晓,深度學(xué)習恰恰補上了這個短板爷贫。有了深度學(xué)習,百度識圖可以準確識別照片中的物體類別补憾,并對照片進行自動歸類或搜索惯篇。有了深度學(xué)習,我們可以很方便地刷臉付款忱厨。有了深度學(xué)習辱囤,特制機器可以檢測一定空間內(nèi)所有人員、車輛的行蹤鲤瞪,并對可疑和危險事件及時報警牢介。
同時,深度學(xué)習技術(shù)在語音識別方面吻蟹,也有廣泛的應(yīng)用恐丧。在深度學(xué)習的幫助下瀑乡,計算機擁有越來越強大的語音識別能力,這可能改變目前仍以鍵盤為主的人機交互模式晚沙。
深度學(xué)習還和增強學(xué)習相結(jié)合橙挽,正深刻改變著機器人領(lǐng)域。所謂增強學(xué)習喝赎,指的是機器人通過與環(huán)境交互中得到的獎賞和懲罰冶驴,自主學(xué)習更優(yōu)的策略。前段時間引人關(guān)注的“阿爾法狗”就是增強學(xué)習的產(chǎn)物田炭,它通過跟棋手下棋或跟自己對弈的輸贏情況车管,摸索出更好的下棋策略肋森。
什么讓深度學(xué)習實現(xiàn)超越
不過膳帕,創(chuàng)造一個強大的神經(jīng)網(wǎng)絡(luò)需更多處理層宋列。而由于硬件限制,早期僅能制造2至3個神經(jīng)層瞬矩。那么茶鉴,是什么讓深度學(xué)習實現(xiàn)超越呢?
顯然,高性能計算能力的提升是一大助力景用。這些年GPU(圖形處理器)涵叮、超級計算機和云計算的迅猛發(fā)展,讓深度學(xué)習脫穎而出伞插。2011年谷歌大腦用了1000臺機器割粮、16000個CPU處理的深度學(xué)習模型大概有10億個神經(jīng)元。而現(xiàn)在媚污,我們已經(jīng)可以在幾個GPU上完成同樣的計算了舀瓢。
“深度學(xué)習還得到大數(shù)據(jù)的助力,就像火箭有了燃料登彪〖保”格靈深瞳計算機視覺工程師、清華大學(xué)自動化系博士潘爭介紹标狼,深度學(xué)習技術(shù)建立在大量實例基礎(chǔ)上,就像小孩收集現(xiàn)實世界的信息一樣诞茶。而且纠徘,“喂”的數(shù)據(jù)越多,它就越聰明哆幸,并且不會“消化不良”暴雕。因為大數(shù)據(jù)的不可或缺,所以目前深度學(xué)習做得最好的基本是擁有大量數(shù)據(jù)的IT巨頭凫体,如谷歌豫鞭、微軟抡悼、百度等。
現(xiàn)在鬓预,深度學(xué)習技術(shù)在語音識別篮烈、計算機視覺、語言翻譯等領(lǐng)域购岗,均戰(zhàn)勝傳統(tǒng)的機器學(xué)習方法汰聋,甚至在人臉驗證、圖像分類上還超過人類的識別能力喊积。專家預(yù)計烹困,再過些年,我們口袋里的手機也可以運行像人腦一樣復(fù)雜的神經(jīng)網(wǎng)絡(luò)乾吻。
不過髓梅,就目前的趨勢來看,深度學(xué)習技術(shù)仍然無法代替“坐在后臺監(jiān)控室的人”绎签。舉個例子枯饿,如果你和朋友在一家飯店里用餐后搶著結(jié)賬,這種推搡過程辜御,智能攝像頭尚難以判斷是在打架還是怎么了鸭你。可見擒权,邏輯判斷和情感選擇袱巨,是深度學(xué)習尚難以逾越的障礙。
◇案例◇
一眼就能識別壞人的系統(tǒng)
專注于計算機視覺及人工智能的科技公司格靈深瞳逊床,將基于深度學(xué)習技術(shù)研發(fā)的智能識別系統(tǒng)遥喘,運用到銀行安防監(jiān)控領(lǐng)域。
考慮到傳統(tǒng)光學(xué)鏡頭在識別圖像時會丟失“深度”維度蚪库,格靈深瞳專門為銀行安監(jiān)開發(fā)了一套三維傳感器纯殖。在它的背后,一套獎懲機制訓(xùn)練成的算法模型能夠主動識別異常人杜《裕“看見有人走近了一個有人的自動柜員機,而不是旁邊那個空著的皱蝙,此時要識別他的軌跡悉通、判斷其行為是否正常,就牽涉到深度學(xué)習矮层÷颂睿”格靈深瞳CEO何搏飛介紹,如果系統(tǒng)識別出異常晓言,它就會推送給后臺監(jiān)督者认扼。而為了教會機器判斷準確啸盏,背后需要提供幾十萬量級的圖片數(shù)據(jù)。
何搏飛指出骑祟,給這個智能識別系統(tǒng)一張側(cè)臉或者是沒有臉的全身照回懦,它也能以超過99%的精度迅速鎖定目標。前提是建一個6000到1.5萬的樣本庫曾我,“一旦樣本達到百萬級粉怕,可能精度要下降20%或更多∈愠玻”
聲明:本網(wǎng)站所收集的部分公開資料來源于互聯(lián)網(wǎng)贫贝,轉(zhuǎn)載的目的在于傳遞更多信息及用于網(wǎng)絡(luò)分享,并不代表本站贊同其觀點和對其真實性負責蛉谜,也不構(gòu)成任何其他建議稚晚。本站部分作品是由網(wǎng)友自主投稿和發(fā)布、編輯整理上傳型诚,對此類作品本站僅提供交流平臺客燕,不為其版權(quán)負責。如果您發(fā)現(xiàn)網(wǎng)站上所用視頻狰贯、圖片张鸟、文字如涉及作品版權(quán)問題,請第一時間告知吼闽,我們將根據(jù)您提供的證明材料確認版權(quán)并按國家標準支付稿酬或立即刪除內(nèi)容牌度,以保證您的權(quán)益!聯(lián)系電話:010-58612588 或 Email:editor@mmsonline.com.cn驱香。
- 暫無反饋
編輯推薦
- 2025新年特刊:打造新質(zhì)生產(chǎn)力捌秩,智啟未來新篇章
- 定義制造業(yè)未來的數(shù)控加工中心技術(shù)專題
- 航空航天及交通領(lǐng)域先進制造技術(shù)應(yīng)用專題
- 解碼消費電子產(chǎn)品生產(chǎn)的數(shù)字化之路技術(shù)專題
- 精密智能機床矫震,助力制造升級技術(shù)專題
- 汽車輕量化驅(qū)動下的零部件加工應(yīng)用專題
- 高性能銑刀實現(xiàn)高精加工生產(chǎn)技術(shù)專題
- 航空航天發(fā)動機解決方案專題
- 高效齒輪加工生產(chǎn)技術(shù)方案專題
- 金屬加工液的性能不止?jié)櫥夹g(shù)應(yīng)用專題