7月7日—10日,以“智聯(lián)世界 眾智成城”為主題的2021世界人工智能大會在上海舉行。中國領(lǐng)先的人工智能及大數(shù)據(jù)科技企業(yè)合合信息在本次大會上展示了能“讀懂”甲骨文的智能文字識別技術(shù),并發(fā)布“數(shù)字政務大腦”平臺。
甲骨文是迄今為止中國發(fā)現(xiàn)的年代最早的成熟文字系統(tǒng),是漢字的源頭和中華優(yōu)秀傳統(tǒng)文化的根脈?,F(xiàn)在的甲骨文多在出版物上以圖片形式出現(xiàn),給文字檢索帶來困難,如今的年輕人對甲骨文的意義更是知之甚少。
此次在世界人工智能大會上展示智能文字識別技術(shù)能對甲骨文進行識別,將形象豐富的甲骨文復刻在龜甲上再進行重新排列組合后,“單身狗”“白富美”“買它買它”等網(wǎng)絡(luò)熱詞被一一識別出來。
據(jù)介紹,合合信息的智能文字識別技術(shù)主要包含了智能圖像處理,基于深度學習的復雜場景文字識別,自然語言處理三個核心技術(shù)層。智能圖像處理技術(shù)主要對用戶拍攝的復雜文檔圖像進行預處理,使得文檔圖像質(zhì)量得到大幅度提升?;谏疃葘W習的復雜場景文字識別技術(shù),主要利用合合信息自研的手寫印刷混排識別,抗強干擾識別,扭曲文字識別,復雜印章和手寫識別等一系列先進深度學習識別技術(shù)來解決各種不同復雜場景下的文字識別問題,而自然語言處理技術(shù),則是對識別出的結(jié)果進行進一步的語義理解。
合合信息相關(guān)技術(shù)負責人表示,“甲骨文識別的難點在于甲骨殘缺嚴重、素材難獲取、拓片清晰度低等難點,這些都是需要通過技術(shù)來解決。例如樣本素材少,從技術(shù)層面上,我們需要解決少樣本訓練的問題。目前我們主要是初步研究,更多的工作還在路上?!?/p>
據(jù)了解,目前合合信息的智能文字識別技術(shù)支持中、英、俄等56種語言的文檔圖像、100+種證件的快讀智能分類,以及全球不同國家、不同行業(yè)的卡證、票據(jù)、定制識別等多個AI場景的產(chǎn)品和解決方案。
除了智能文字識別技術(shù)以外,合合信息在此次世界人工智能大會上還發(fā)布了“數(shù)字政務大腦”平臺。該平臺基于合合信息商業(yè)大數(shù)據(jù)平臺,對全量企業(yè)、全產(chǎn)業(yè)鏈和區(qū)域經(jīng)濟進行多維度政企數(shù)據(jù)融合、分析、挖掘。
“數(shù)字政務大腦”由四個主要部分構(gòu)成:區(qū)域經(jīng)濟數(shù)字監(jiān)測大腦、產(chǎn)業(yè)鏈數(shù)字招商大腦、轄區(qū)企業(yè)數(shù)字監(jiān)管服務大腦、精準政策數(shù)字服務大腦。這背后離不開合合信息的大數(shù)據(jù)庫,其有超過2.3億企業(yè)及組織機構(gòu)實時數(shù)據(jù)、1000億條企業(yè)全景信息、1000多個數(shù)據(jù)維度向外輸出數(shù)字化風控方案。
區(qū)別于普通政務平臺簡單的數(shù)字羅列,“數(shù)字政務大腦”可以將城市產(chǎn)業(yè)數(shù)據(jù)進行匯聚、融合、建模,打破城市數(shù)據(jù)孤島,拓寬招商通道,優(yōu)選招商企業(yè)。通過對重點產(chǎn)業(yè)發(fā)展分析與研判,發(fā)現(xiàn)本地優(yōu)勢企業(yè),尋找區(qū)域產(chǎn)業(yè)發(fā)力點。(戰(zhàn)釗)
免責聲明:本網(wǎng)轉(zhuǎn)載自其它媒體的文章,目的在于弘揚科技創(chuàng)新精神,傳遞更多科技創(chuàng)新信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責,在此我們謹向原作者和原媒體致以敬意。如果您認為本站文章侵犯了您的版權(quán),請與我們聯(lián)系,我們將第一時間刪除。