【環(huán)球科技報(bào)道】互聯(lián)網(wǎng)的下一幕是什么?在2016百度世界大會(huì)上,李彥宏給出了答案:人工智能。9月1日,在2016百度世界大會(huì)上,李彥宏表示,互聯(lián)網(wǎng)的增長遇到了瓶頸,過去粗放式的野蠻增長沒有了。而互聯(lián)網(wǎng)的下一幕,便是人工智能。
三年前,百度就講過“百度大腦”這個(gè)概念。那個(gè)時(shí)候的百度大腦已經(jīng)具備了大概兩三歲孩子的智力水平。而現(xiàn)在,百度大腦的語音識(shí)別現(xiàn)在已經(jīng)到了第二代,使用深度學(xué)習(xí)的技術(shù)進(jìn)行語音識(shí)別。百度語音識(shí)別的準(zhǔn)確率能夠達(dá)到97%,已經(jīng)超過了人對(duì)語音的識(shí)別能力。
以下為演講實(shí)錄:
李彥宏:當(dāng)中國的7億網(wǎng)民都用上智能手機(jī),互聯(lián)網(wǎng)的發(fā)展已經(jīng)不能靠人口紅利來驅(qū)動(dòng)了。當(dāng)前,中國進(jìn)入到經(jīng)濟(jì)的新常態(tài),國家也提倡互聯(lián)網(wǎng)+,實(shí)際上是希望我們用互聯(lián)網(wǎng)的效率來推動(dòng)行業(yè)的發(fā)展。整個(gè)中國的經(jīng)濟(jì)增長需要依靠互聯(lián)網(wǎng),但是互聯(lián)網(wǎng)的增長卻遇到了瓶頸,過去粗放式的野蠻增長沒有了。
互聯(lián)網(wǎng)的下一幕,就是人工智能。過去五六年,百度對(duì)人工智能的技術(shù)投入非常大。人工智能對(duì)百度意味著什么?就是“百度大腦”。三年前,百度就講過“百度大腦”這個(gè)概念。那個(gè)時(shí)候的百度大腦已經(jīng)具備了大概兩三歲孩子的智力水平。
李彥宏:今天的百度大腦相當(dāng)于多少歲的人腦呢?回答這個(gè)問題還蠻難的。百度大腦和人腦的正常發(fā)育過程很不一樣。百度大腦包括三個(gè)部分: 1, 計(jì)算方法。包括超大規(guī)模的神經(jīng)網(wǎng)絡(luò)、萬億級(jí)的參數(shù)、千億樣本和千億特征訓(xùn)練; 2, 計(jì)算能力。包括數(shù)十萬臺(tái)服務(wù)器構(gòu)成了“百度大腦”的實(shí)體,幾年前百度便開始自建中國最大的GPU集群; 3, 數(shù)據(jù)。全網(wǎng)的網(wǎng)頁數(shù)據(jù)、十多年來累積的搜索數(shù)據(jù),以及百億級(jí)的圖像、視頻、定位數(shù)據(jù)。
百度大腦的語音識(shí)別能力如何?
李彥宏:百度大腦的語音識(shí)別現(xiàn)在已經(jīng)到了第二代,使用深度學(xué)習(xí)的技術(shù)進(jìn)行語音識(shí)別。百度語音識(shí)別的準(zhǔn)確率能夠達(dá)到97%,已經(jīng)超過了人對(duì)語音的識(shí)別能力。
這樣的能力到底可以在什么地方幫助到我們?
例如,很多公司都有自己的電話銷售部門,這個(gè)行業(yè)人員流動(dòng)性很大,而銷售人員需要長時(shí)間培訓(xùn)才能上崗。即使是經(jīng)過培訓(xùn),甚至有一定經(jīng)驗(yàn)的銷售人員,每個(gè)人銷售效率也是參差不齊的。但是通過百度語音識(shí)別能力,一個(gè)新的銷售上崗的第一天,就可能掌握他所獲得的那些最優(yōu)秀的銷售的能力:
新銷售打電話給潛在客戶的時(shí)候,客戶每說一句話,客戶每問一個(gè)問題,百度大腦都實(shí)時(shí)地識(shí)別了它的問題,并且顯示在銷售的電腦的屏幕上,屏幕上不僅實(shí)時(shí)展示了客戶的問題,而且實(shí)時(shí)地把最優(yōu)秀的銷售是怎么回答這個(gè)客戶的問題也展示在這個(gè)屏幕上。這樣,新的銷售的工作就簡單多了,其實(shí)他基本上可以照著屏幕念,就能夠達(dá)到最優(yōu)秀的銷售的話術(shù)的水平。
語音識(shí)別還有很多應(yīng)用場(chǎng)景,大家可以根據(jù)自己的行業(yè)背景去想象。
百度大腦的能力主要有四個(gè)方面,它們最能夠突出表現(xiàn)當(dāng)今世界人工智能最熱、最核心、最強(qiáng)大的能力: 第一,語音的能力。包括語音識(shí)別能力和語音合成能力。 第二,圖像的能力。圖像能力指的是看到一個(gè)圖片,不僅能看得見,還能看得懂。按照技術(shù)界的說法,它應(yīng)該是計(jì)算機(jī)視覺。 第三,自然語言處理能力。自然語言處理能力比語音和圖像更難。語音和圖像技術(shù)更多還處在認(rèn)知的階段,而自然語言理解除了要有認(rèn)知能力之外,還需要邏輯推理能力、規(guī)劃能力等等,同時(shí)也需要依賴于更為強(qiáng)大的知識(shí)圖譜。 第四,用戶畫像。用戶畫像在傳統(tǒng)的AI中并不是主流。但是今天,我們每時(shí)每刻都可以收集很多很多和用戶行為相關(guān)的數(shù)據(jù),就可以對(duì)用戶做很好的畫像,而這里面使用的技術(shù)又基本上都是與人工智能相關(guān)的。
百度大腦的另一種語音能力——語音合成。
李彥宏:基于大數(shù)據(jù)與深度學(xué)習(xí)技術(shù)優(yōu)勢(shì),百度的新型情感語音合成系統(tǒng)能夠讓機(jī)器擺脫平鋪直敘的發(fā)聲,為用戶帶來更自然、更接近真人朗讀的聽覺體驗(yàn)。目前,百度每天響應(yīng)的語音合成的請(qǐng)求達(dá)到了2.5億次。在情感語音合成技術(shù)上線后,用語音聽小說的百度用戶從過去平均每天聽0.69小時(shí),增長到現(xiàn)在的2.21小時(shí)。語音合成的能力對(duì)用戶的App使用黏性的提升是非常顯著的。
今天的語音合成可以根據(jù)個(gè)人需求進(jìn)行定制,形成自然發(fā)聲的能力,模擬任何一個(gè)你喜歡的人的說話方式。李彥宏透露,百度地圖中有一個(gè)李彥宏導(dǎo)航語音包,其實(shí)就是根據(jù)他日常的語音合成的。
李彥宏現(xiàn)場(chǎng)展示了運(yùn)用情感語音合成技術(shù)還原張國榮聲音的視頻。以張國榮在影視、電臺(tái)等留存下來的原聲進(jìn)行建模,通過情感語音合成技術(shù)實(shí)現(xiàn)與粉絲的“隔空對(duì)話”。實(shí)際上,任何一個(gè)人只要用30分鐘按照要求錄制50句話,就可以用百度大腦的語音合成技術(shù)模擬出來這個(gè)人的聲音。人人都可以擁有自己的聲音模型。
人臉識(shí)別是如何實(shí)現(xiàn)的?從技術(shù)的角度講,它是通過對(duì)人臉特征的關(guān)鍵點(diǎn)的提取,找到了其中最不一樣的地方,構(gòu)成了一個(gè)面部的表情。當(dāng)一個(gè)人表情發(fā)生變化的時(shí)候,他的表情特征并不會(huì)發(fā)生改變。
除了人臉識(shí)別之外,百度在其他場(chǎng)景中也經(jīng)常會(huì)遇到圖像識(shí)別需求。
例如,百度的圖像智能識(shí)別技術(shù)就幫助百度地圖打破傳統(tǒng)數(shù)據(jù)采集模式,實(shí)現(xiàn)了外業(yè)單人全景圖像采集,使生產(chǎn)效率大幅提升。利用深度學(xué)習(xí)技術(shù),采集設(shè)備可自動(dòng)識(shí)別道路特征、提取建筑輪廓并繪制形狀、識(shí)別道路圖形標(biāo)牌、電子眼、警示牌。圖像智能識(shí)別技術(shù)能精準(zhǔn)識(shí)別店鋪名稱、門牌號(hào)、停車場(chǎng)標(biāo)識(shí),甚至營業(yè)時(shí)間。
當(dāng)前,百度地圖的全流程數(shù)據(jù)生產(chǎn)自動(dòng)化程度已超過80%,全景圖像的自動(dòng)化識(shí)別提取準(zhǔn)確率高達(dá)95%。百度地圖與圖像智能識(shí)別技術(shù)的結(jié)合,讓數(shù)據(jù)無限逼近現(xiàn)實(shí)世界。
過去一年,百度花了不少精力,來提升百度無人車在城市道路的運(yùn)行水平。 在演講中,李彥宏播放了一段無人車行駛過程的視頻。 百度無人車在行駛過程中,通過感知,可以探測(cè)到路面上車、路標(biāo)以及各種各樣的障礙物,每個(gè)物體有一個(gè)獨(dú)特的編號(hào),便于車對(duì)它進(jìn)行識(shí)別。這個(gè)車的識(shí)別是通過百度大腦來識(shí)別的。 自去年在國內(nèi)首次實(shí)現(xiàn)城市、環(huán)路及高速道路混合路況下的全自動(dòng)駕駛路測(cè)以來,百度無人車收獲了國內(nèi)國外大量的關(guān)注,其在交通場(chǎng)景物體識(shí)別、高精度地圖與定位等無人駕駛關(guān)鍵技術(shù)上的領(lǐng)先水平也得到了業(yè)界的廣泛認(rèn)可。 今年8月份KITTI評(píng)測(cè)的最新成績顯示,百度無人車在車輛檢測(cè)中排名第一,車輛跟蹤6項(xiàng)指標(biāo)中取得4項(xiàng)第一。
在2015年百度世界大會(huì),百度推出了 “度秘“,在今年世界大會(huì)談及度秘的進(jìn)步,李彥宏說:度秘和用戶進(jìn)行溝通的方式和傳統(tǒng)的搜索已經(jīng)很不一樣了?,F(xiàn)在人們與度秘的交互,有56%是通過語音或者圖像來完成的,語音和圖像的交互正逐步超越傳統(tǒng)文字的使用頻次,成為人們表達(dá)需求的主流方式。
與此同時(shí),度秘的自然語言理解的能力也在不斷提升。8月17日,全球首次人機(jī)同臺(tái)解說通過B站視頻直播,百度機(jī)器人度秘搭檔知名解說員楊毅,聯(lián)袂為廣大球迷獻(xiàn)上的里約奧運(yùn)男籃首場(chǎng)四分之一決賽解說。
今天百度世界上,楊毅也出現(xiàn)在了現(xiàn)場(chǎng)。楊毅說,度秘的表現(xiàn)出乎他的意料,度秘對(duì)比賽的知識(shí)儲(chǔ)備可能比他還多。楊毅認(rèn)為,度秘的語速已經(jīng)從之前的較慢開始變快了,更符合競(jìng)技體育解說的要求了。希望有一天,在家里看籃球的時(shí)候,身邊也有一個(gè)度秘機(jī)器人,成為籃球迷收看比賽的好朋友。
前段時(shí)間熱映的電影《魔獸》是如何利用百度用戶畫像來提升票房的?《魔獸》制作公司傳奇影業(yè)首席分析師Matt介紹,傳奇影業(yè)把影片目標(biāo)人群分了三類,一類是肯定會(huì)去看的,不需要做宣傳了,一類是肯定不去看的,他宣傳了也沒有用。主要著力點(diǎn)是怎樣把那些搖擺的、可被說服的人群轉(zhuǎn)化為真正去電影院看的人群。傳奇影業(yè)運(yùn)用百度的工具和數(shù)據(jù)進(jìn)行人群篩選。最終,百度用戶畫像能力為《魔獸》帶來了200%的票房提升,讓制作方驚喜不已。
百度錢包代言人、著名演員胡歌與李彥宏同臺(tái)為現(xiàn)場(chǎng)觀眾展示了一段“百度大腦”核心能力——用戶畫像能力。李彥宏告訴胡歌,通過大量的用戶行為數(shù)據(jù),百度大腦能夠描繪出他的粉絲群體的基本特點(diǎn),“胡歌粉絲群體的畫像我們從興趣和偏好的角度來看,其實(shí)在影視、音樂、公益、旅游、出行,我們看到這里面最大的一個(gè)特點(diǎn)還是旅游出行,而不是影視音樂,還是跟常人的思維不太一樣。”
李彥宏:百度大腦一天一天都在學(xué)習(xí),都在成長,她的能力也在不斷的進(jìn)步。所以我完全可以想像有一天,當(dāng)你決定要接一部戲的時(shí)候,你只要在合同上簽一下字,剩下的事情都交給百度大腦來干,他可以合成你的聲音,可以合成你的圖像,可以做你的動(dòng)作,所以以后演戲你只要說YES,剩下的事我們都辦了。 胡歌:科技在不斷的發(fā)展,但是演戲?qū)ξ襾碚f還是我畢生藝術(shù)上的追求。 李彥宏:(笑)你擔(dān)心失業(yè)嗎? 胡歌:我覺得百度大腦可以為我生活帶來很大便利,演戲這個(gè)事我自己來做吧,我相信她可以做好,但是我覺得還是自己來做。 李彥宏:以后百度大腦有新的能力通知你,這有可能是好消息,也有可能是壞消息。(全場(chǎng)笑聲) 胡歌:謝謝今天讓我感受到這么先進(jìn)的科技,我也希望百度大腦能夠越來越強(qiáng)大,越來越智能。
免責(zé)聲明:本網(wǎng)轉(zhuǎn)載自其它媒體的文章,目的在于弘揚(yáng)科技創(chuàng)新精神,傳遞更多科技創(chuàng)新信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),在此我們謹(jǐn)向原作者和原媒體致以崇高敬意。如果您認(rèn)為本站文章侵犯了您的版權(quán),請(qǐng)與我們聯(lián)系,我們將第一時(shí)間刪除。