(請(qǐng)本版圖片的作者與本報(bào)聯(lián)系。)
本報(bào)記者 王寧
第三次浪潮的華彩樂(lè)章
1980年,著名未來(lái)學(xué)家阿爾文·托夫勒便在《第三次浪潮》一書(shū)中,將大數(shù)據(jù)熱情地贊頌為“第三次浪潮的華彩樂(lè)章”。大約從2009年開(kāi)始,“大數(shù)據(jù)”成為互聯(lián)網(wǎng)信息技術(shù)行業(yè)的流行詞匯。
什么是大數(shù)據(jù)
1980年,著名未來(lái)學(xué)家阿爾文·托夫勒便在《第三次浪潮》一書(shū)中,將大數(shù)據(jù)熱情地贊頌為“第三次浪潮的華彩樂(lè)章”。大約從2009年開(kāi)始,“大數(shù)據(jù)”成為互聯(lián)網(wǎng)信息技術(shù)行業(yè)的流行詞匯。
大數(shù)據(jù),或稱巨量數(shù)據(jù)、海量數(shù)據(jù);是由數(shù)量巨大、結(jié)構(gòu)復(fù)雜、類型眾多數(shù)據(jù)構(gòu)成的數(shù)據(jù)集合,是基于云計(jì)算的數(shù)據(jù)處理與應(yīng)用模式,通過(guò)數(shù)據(jù)的集成共享,交叉復(fù)用形成的智力資源和知識(shí)服務(wù)能力。
有研究機(jī)構(gòu)如此定義“大數(shù)據(jù)”:“大數(shù)據(jù)”是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。從某種程度上說(shuō),大數(shù)據(jù)是數(shù)據(jù)分析的前沿技術(shù)。簡(jiǎn)言之,從各種各樣類型的數(shù)據(jù)中,快速獲得有價(jià)值信息的能力,就是大數(shù)據(jù)技術(shù)。
大數(shù)據(jù)從何而來(lái)
美國(guó)互聯(lián)網(wǎng)數(shù)據(jù)中心指出,互聯(lián)網(wǎng)上的數(shù)據(jù)每年將增長(zhǎng)50%,每?jī)赡瓯銓⒎环?目前世界上90%以上的數(shù)據(jù)是最近幾年才產(chǎn)生的。此外,全世界的工業(yè)設(shè)備、汽車、電表上有著無(wú)數(shù)的數(shù)碼傳感器,隨時(shí)測(cè)量和傳遞著有關(guān)位置、運(yùn)動(dòng)、震動(dòng)、溫度、濕度乃至空氣中化學(xué)物質(zhì)的變化,也產(chǎn)生了海量的數(shù)據(jù)信息。
物聯(lián)網(wǎng)、云計(jì)算、移動(dòng)互聯(lián)網(wǎng)、車聯(lián)網(wǎng)、手機(jī)、平板電腦、PC以及各種各樣的傳感器,無(wú)一不是數(shù)據(jù)來(lái)源或者承載的方式。
大數(shù)據(jù)有多大
僅以互聯(lián)網(wǎng)為例,一天之中,互聯(lián)網(wǎng)產(chǎn)生的全部?jī)?nèi)容可以刻滿1.68億張DVD;發(fā)出的郵件有2940億封之多;發(fā)出的社區(qū)帖子達(dá)200萬(wàn)個(gè),相當(dāng)于《時(shí)代》雜志770年的文字量……
截止到2012年,數(shù)據(jù)量已經(jīng)從TB(1024GB=1TB)級(jí)別躍升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)級(jí)別。國(guó)際數(shù)據(jù)公司(IDC)的研究結(jié)果表明,2008年全球產(chǎn)生的數(shù)據(jù)量高達(dá)1.82ZB,相當(dāng)于全球每人產(chǎn)生200GB以上的數(shù)據(jù)。而到2012年為止,人類生產(chǎn)的所有印刷材料的數(shù)據(jù)量是200PB,全人類歷史上說(shuō)過(guò)的所有話的數(shù)據(jù)量大約是5EB。IBM的研究稱,整個(gè)人類文明所獲得的全部數(shù)據(jù)中,有90%是過(guò)去兩年內(nèi)產(chǎn)生的。而到了2020年,全世界所產(chǎn)生的數(shù)據(jù)規(guī)模將達(dá)到今天的44倍。
大數(shù)據(jù)的“4個(gè)V”
大數(shù)據(jù)的4個(gè)“V”指的是大數(shù)據(jù)的4個(gè)特點(diǎn):第一,數(shù)據(jù)體量巨大。從TB級(jí)別,躍升到PB級(jí)別;第二,數(shù)據(jù)類型繁多,數(shù)據(jù)來(lái)源于各種各樣的渠道。第三,價(jià)值密度低,商業(yè)價(jià)值高。以視頻為例,連續(xù)不間斷監(jiān)控過(guò)程中,可能有用的數(shù)據(jù)僅僅有一兩秒。第四,處理速度快。一般要在秒級(jí)時(shí)間范圍內(nèi)給出分析結(jié)果,時(shí)間太長(zhǎng)就失去價(jià)值了。這個(gè)速度要求是大數(shù)據(jù)處理技術(shù)和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)最大的區(qū)別。
由此,業(yè)界將大數(shù)據(jù)的特點(diǎn)歸納為4個(gè)“V”——Volume(大量)、Velocity(高速)、Variety(多樣)、Veracity(精確)。
什么是云計(jì)算?
云計(jì)算(cloud computing)是通過(guò)互聯(lián)網(wǎng)把多個(gè)成本較低的計(jì)算實(shí)體整合成一個(gè)具有強(qiáng)大計(jì)算能力的完美系統(tǒng)。簡(jiǎn)單理解就是,運(yùn)營(yíng)公司提供服務(wù)器、應(yīng)用程序、存儲(chǔ)空間,用戶通過(guò)網(wǎng)絡(luò)遠(yuǎn)程登錄服務(wù)器,并按照需要使用這些存儲(chǔ)空間和應(yīng)用程序。狹義云計(jì)算是指IT基礎(chǔ)設(shè)施的交付和使用模式,指通過(guò)網(wǎng)絡(luò)以按需、易擴(kuò)展的方式獲得所需資源;廣義云計(jì)算指服務(wù)的交付和使用模式,指通過(guò)網(wǎng)絡(luò)以按需、易擴(kuò)展的方式獲得所需服務(wù)。它意味著計(jì)算能力也可作為一種商品通過(guò)互聯(lián)網(wǎng)進(jìn)行流通和交易。
大數(shù)據(jù)與云計(jì)算
從技術(shù)上看,大數(shù)據(jù)與云計(jì)算的關(guān)系就像一枚硬幣的正反面一樣密不可分。大數(shù)據(jù)必然無(wú)法用單臺(tái)的計(jì)算機(jī)進(jìn)行處理,必須采用分布式計(jì)算架構(gòu)。它的特色在于對(duì)海量數(shù)據(jù)的挖掘,但它必須依托云計(jì)算的分布式處理、分布式數(shù)據(jù)庫(kù)、云存儲(chǔ)和虛擬化技術(shù)。
數(shù)字時(shí)代的石油與黃金
一分鐘內(nèi),微博推特上新發(fā)的數(shù)據(jù)量超過(guò)10萬(wàn);社交網(wǎng)絡(luò)“臉譜”的瀏覽量超過(guò)600萬(wàn)……
巨大的數(shù)據(jù)量,意味著什么?
大數(shù)據(jù)對(duì)社會(huì)經(jīng)濟(jì)生活產(chǎn)生的影響絕不限于技術(shù)層面,它為我們看待世界提供了一種全新的方法,即決策行為將日益基于數(shù)據(jù)分析做出,而不是像過(guò)去更多憑借經(jīng)驗(yàn)和直覺(jué)做出。
“這是一場(chǎng)革命,龐大的數(shù)據(jù)資源使得各個(gè)領(lǐng)域開(kāi)始了量化進(jìn)程,無(wú)論學(xué)術(shù)界、商界還是政府,所有領(lǐng)域都將開(kāi)始這種進(jìn)程。”哈佛大學(xué)社會(huì)學(xué)教授加里·金指出。
業(yè)內(nèi)人士指出,大數(shù)據(jù)是一種全新的致富手段,它的價(jià)值堪比石油和黃金。
雖然大數(shù)據(jù)在國(guó)內(nèi)還處于初級(jí)階段,但是商業(yè)價(jià)值已經(jīng)顯現(xiàn)出來(lái)。首先,手中握有數(shù)據(jù)的公司站在金礦上,基于數(shù)據(jù)交易即可產(chǎn)生很好的效益;其次,基于數(shù)據(jù)挖掘會(huì)有很多商業(yè)模式誕生,定位角度不同,或側(cè)重?cái)?shù)據(jù)分析。比如幫企業(yè)做內(nèi)部數(shù)據(jù)挖掘,或側(cè)重優(yōu)化,幫企業(yè)更精準(zhǔn)找到用戶,降低營(yíng)銷成本,提高企業(yè)銷售率,增加利潤(rùn)。
數(shù)據(jù)——
未來(lái)最大的交易商品
未來(lái),數(shù)據(jù)可能成為最大的交易商品。
IBM執(zhí)行總裁羅睿蘭認(rèn)為,“數(shù)據(jù)將成為一切行業(yè)當(dāng)中決定勝負(fù)的根本因素,最終數(shù)據(jù)將成為人類至關(guān)重要的自然資源。”
大數(shù)據(jù)的價(jià)值是通過(guò)數(shù)據(jù)共享、交叉復(fù)用后獲取最大的數(shù)據(jù)價(jià)值。麥肯錫則預(yù)測(cè)未來(lái)大數(shù)據(jù)產(chǎn)品在三大行業(yè)的應(yīng)用就將產(chǎn)生7千億美元的潛在市場(chǎng),中國(guó)大數(shù)據(jù)產(chǎn)品的潛在市場(chǎng)規(guī)模有望達(dá)到1.57萬(wàn)億元,給IT行業(yè)開(kāi)拓了新的黃金時(shí)代。
大數(shù)據(jù)正在重構(gòu)很多傳統(tǒng)行業(yè)。通過(guò)收集、整理生活中方方面面的數(shù)據(jù),并對(duì)其進(jìn)行分析挖掘,進(jìn)而從中獲得有價(jià)值信息,最終衍化出新的商業(yè)模式。麥當(dāng)勞、肯德基以及蘋(píng)果公司等旗艦專賣店的位置都是建立在數(shù)據(jù)分析基礎(chǔ)之上的精準(zhǔn)選址。在零售業(yè)中,數(shù)據(jù)分析的技術(shù)與手段更得到廣泛的應(yīng)用,卓越亞馬遜、淘寶等通過(guò)對(duì)海量數(shù)據(jù)的掌握和分析,為用戶提供更加專業(yè)化和個(gè)性化的服務(wù)。
與此同時(shí),大數(shù)據(jù)在社會(huì)管理等方面,也具有不可替代的重大價(jià)值。
案例——
大數(shù)據(jù)魅力初現(xiàn)
美國(guó)華爾街“德溫特資本市場(chǎng)”公司首席執(zhí)行官保羅·霍廷每天利用電腦程序分析全球3.4億微博賬戶的留言,進(jìn)而判斷民眾情緒,再?zèng)Q定如何處理手中數(shù)以百萬(wàn)美元計(jì)的股票。
霍廷的判斷原則很簡(jiǎn)單:如果所有人似乎都高興,那就買(mǎi)入;如果大家的焦慮情緒上升,那就拋售。當(dāng)年第一季度,霍廷的公司獲得了7%的收益率。
沃爾瑪為其網(wǎng)站設(shè)計(jì)了搜索引擎Polaris,利用語(yǔ)義數(shù)據(jù)進(jìn)行分析挖掘。根據(jù)沃爾瑪?shù)恼f(shuō)法,這使得在線購(gòu)物的完成率提升了10%到15%。這意味著增加了數(shù)十億美元的銷售金額。
一家名為Express scripts Holding Co.的公司,依托大數(shù)據(jù)分析,發(fā)現(xiàn)那些需要服藥的人常常也是最可能忘記服藥的人。因此,他們開(kāi)發(fā)了新產(chǎn)品:會(huì)響鈴的藥品蓋和自動(dòng)電話呼叫,提醒患者按時(shí)服藥。
美國(guó)零售商Target發(fā)現(xiàn)婦女在懷孕的中間三個(gè)月會(huì)經(jīng)常購(gòu)買(mǎi)沒(méi)有氣味的護(hù)膚液和某些維生素。通過(guò)鎖定這些購(gòu)物者,商店提供將這些婦女變成忠誠(chéng)客戶的優(yōu)惠券。
邁克·弗勞爾斯是紐約市打擊金融犯罪行動(dòng)組主管,他的新職務(wù)是“紐約市首席分析官”。在弗勞爾斯看來(lái),大數(shù)據(jù)在市政管理中的應(yīng)用帶來(lái)的好處是有助于優(yōu)化行政資源的使用,使公共支出產(chǎn)生最大效益。大數(shù)據(jù)在紐約市的執(zhí)法、經(jīng)濟(jì)規(guī)劃、防災(zāi)和災(zāi)后恢復(fù)等方面都有應(yīng)用。比如,大數(shù)據(jù)的應(yīng)用,可讓執(zhí)法人員先發(fā)制人,在犯罪行為造成損害之前就采取行動(dòng)。
大數(shù)據(jù)熱潮席卷全球 ——各國(guó)大數(shù)據(jù)產(chǎn)業(yè)發(fā)展動(dòng)態(tài)
中國(guó):依托大數(shù)據(jù)推進(jìn)智慧城市物聯(lián)網(wǎng)建設(shè)
隨著我國(guó)智慧城市試點(diǎn)工作的啟動(dòng),2013年,以“智慧城市”為焦點(diǎn)的技術(shù)和產(chǎn)業(yè)盛宴正式開(kāi)席,物聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算等新一代信息技術(shù)成為智慧城市建設(shè)的攻堅(jiān)方向。
智慧城市以提高城鎮(zhèn)化質(zhì)量、提升城市軟實(shí)力、實(shí)現(xiàn)經(jīng)濟(jì)轉(zhuǎn)型為目標(biāo),在金融、交通、安全、醫(yī)療等領(lǐng)域率先開(kāi)展“智慧”布局,預(yù)計(jì)未來(lái)10年將涌現(xiàn)一批智慧城市樣板。智慧城市的建設(shè)帶來(lái)數(shù)據(jù)量的爆發(fā)式增長(zhǎng),目前,與智慧城市相關(guān)的項(xiàng)目所產(chǎn)生的數(shù)據(jù)量已超過(guò)了200PB,大數(shù)據(jù)遍布智慧交通、智慧醫(yī)療、智慧生活等智慧城市建設(shè)的各個(gè)方面。
智慧城市熱潮的背后,大數(shù)據(jù)與云計(jì)算的結(jié)合、云計(jì)算與大數(shù)據(jù)的結(jié)合、各行各業(yè)的數(shù)據(jù)業(yè)務(wù)主營(yíng)化傾向、物聯(lián)網(wǎng)逐漸走入人們的普通生活。
而在我國(guó)工信部發(fā)布的物聯(lián)網(wǎng)“十二五”規(guī)劃上,把信息處理技術(shù)作為4項(xiàng)關(guān)鍵技術(shù)創(chuàng)新工程之一,其中包括的海量數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)挖掘、圖像視頻智能分析,這都是大數(shù)據(jù)的重要組成部分。而另外3項(xiàng)關(guān)鍵技術(shù)創(chuàng)新工程,包括信息感知技術(shù)、信息傳輸技術(shù)、信息安全技術(shù),也都與“大數(shù)據(jù)”密切相關(guān)。
美國(guó):大數(shù)據(jù)戰(zhàn)略上升為國(guó)策
2012年,奧巴馬政府將“大數(shù)據(jù)戰(zhàn)略”上升為最高國(guó)策,認(rèn)為大數(shù)據(jù)是“未來(lái)的新石油”,將對(duì)數(shù)據(jù)的占有和控制作為陸權(quán)、海權(quán)、空權(quán)之外的另一種國(guó)家核心能力。
在大數(shù)據(jù)分析的應(yīng)用上,美國(guó)政府和大公司領(lǐng)先新興國(guó)家至少20年。15年前,美國(guó)的信用卡公司就可以進(jìn)行數(shù)據(jù)挖掘?qū)崿F(xiàn)精準(zhǔn)營(yíng)銷。隨著智能電話和電腦網(wǎng)絡(luò)的普及,美國(guó)政府和大公司把自己的觸角伸到個(gè)人生活的每個(gè)方面。美國(guó)個(gè)人的一切在線行為數(shù)據(jù)都被收集儲(chǔ)存,再加上已被有關(guān)機(jī)構(gòu)掌握的個(gè)人信用數(shù)據(jù)、犯罪記錄和人口統(tǒng)計(jì)等數(shù)據(jù),有關(guān)公司和政府機(jī)構(gòu)可以運(yùn)用數(shù)據(jù)挖掘的辦法,監(jiān)控和預(yù)測(cè)個(gè)人的行為,并做出相關(guān)決策。
歐 盟
歐盟于2012年,發(fā)布“發(fā)揮歐洲云計(jì)算潛力”新戰(zhàn)略,以推動(dòng)云計(jì)算帶動(dòng)經(jīng)濟(jì)成長(zhǎng)和創(chuàng)造就業(yè)。預(yù)計(jì)到2020年,通過(guò)利用云計(jì)算的優(yōu)勢(shì)將可節(jié)省大約10~20%的成本和顯著提高生產(chǎn)率,云計(jì)算市場(chǎng)規(guī)模將增加2倍,達(dá)到8000億歐元。
根據(jù)歐盟統(tǒng)計(jì),到2020年,投資于云計(jì)算可為歐盟帶來(lái)年平均經(jīng)濟(jì)效益為1600億美元,這個(gè)金額相當(dāng)于GDP的10%,歐盟欲通過(guò)這一戰(zhàn)略,制造新型產(chǎn)業(yè)以對(duì)抗美國(guó)等國(guó)家,同時(shí)創(chuàng)造出250萬(wàn)~380萬(wàn)個(gè)新的就業(yè)機(jī)會(huì)。
韓國(guó):建設(shè)首個(gè)開(kāi)放大數(shù)據(jù)中心
韓國(guó)致力于通過(guò)建設(shè)大數(shù)據(jù)中心,幫助科技行業(yè)趕上世界頂尖科技公司。這是該國(guó)第一個(gè)開(kāi)放的數(shù)據(jù)中心,任何人均可通過(guò)該中心對(duì)大數(shù)據(jù)進(jìn)行提煉和分析。
韓國(guó)計(jì)劃使大數(shù)據(jù)中心成為服務(wù)大數(shù)據(jù)企業(yè)的一個(gè)實(shí)驗(yàn)基地,并為大學(xué)培養(yǎng)研究人員。該中心計(jì)劃創(chuàng)建一種基礎(chǔ)解決方案,這樣任何人都可以使用其中的服務(wù)對(duì)大數(shù)據(jù)進(jìn)行分析。該中心面向中小型企業(yè)、風(fēng)險(xiǎn)企業(yè)、大學(xué)和普通公民,用戶可以利用大數(shù)據(jù)技術(shù)解決業(yè)務(wù)或者研究方面的問(wèn)題。該中心的設(shè)立是基于韓國(guó)總統(tǒng)樸槿惠2013年2月提出的創(chuàng)新型經(jīng)濟(jì)框架,該框架呼吁將信息技術(shù)作為韓國(guó)經(jīng)濟(jì)增長(zhǎng)的一個(gè)新支柱。
日本:利用大數(shù)據(jù)對(duì)抗大規(guī)模災(zāi)害
日本政府決定,在發(fā)生大規(guī)模災(zāi)害時(shí)導(dǎo)入“大數(shù)據(jù)”,分析手機(jī)等龐大的電子數(shù)據(jù),以求迅速收集情報(bào),快速支援受災(zāi)地區(qū)?!?br />
因?yàn)?ldquo;大數(shù)據(jù)”中包含了手機(jī)、汽車導(dǎo)航系統(tǒng)等發(fā)射的位置信息,所以,就算通信中斷地區(qū)較廣的情況下,也能夠推測(cè)出受災(zāi)程度。并且從汽車的行駛速度還可以掌握無(wú)法通行的路段等。
免責(zé)聲明:本網(wǎng)轉(zhuǎn)載自其它媒體的文章,目的在于弘揚(yáng)科技創(chuàng)新精神,傳遞更多科技創(chuàng)新信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),在此我們謹(jǐn)向原作者和原媒體致以敬意。如果您認(rèn)為本站文章侵犯了您的版權(quán),請(qǐng)與我們聯(lián)系,我們將第一時(shí)間刪除。