連日來,隨著深度求索公司(DeepSeek)發(fā)布其最新開源模型DeepSeek-R1在國內外引發(fā)熱烈關注,百度、騰訊、阿里巴巴、字節(jié)跳動等企業(yè)紛紛宣布旗下AI大模型、AI應用新動作,包括全面免費使用、接入DeepSeek模型以及拓展國際合作等,進一步競速AI大模型賽道。
2月13日,百度官方宣布,隨著文心大模型的迭代升級和成本不斷下降,文心一言將于4月1日零時起全面免費,所有PC端和App端用戶均可體驗文心系列最新模型。文心一言官網還同步透露即日起上線深度搜索功能,具備更強大的思考規(guī)劃和工具調用能力,并處理多場景任務,實現(xiàn)多模態(tài)輸入與輸出。此外,百度計劃在今年下半年發(fā)布下一代人工智能模型Ernie 5.0,將在模型多模態(tài)能力方面有重大增強。
就在同一天,騰訊AI助手“騰訊元寶”迎來重大更新,同時支持混元和DeepSeek兩大模型。據(jù)悉,“騰訊元寶”提供的DeepSeek支持聯(lián)網搜索,并整合了微信公眾號、視頻號等騰訊生態(tài)信息源,能為用戶提供更穩(wěn)定、實時、全面、準確的回答。此外,阿里巴巴聯(lián)合創(chuàng)始人、董事局主席蔡崇信確認了阿里巴巴將與蘋果公司就AI展開合作,蘋果公司在中國銷售的iPhone手機將采用阿里巴巴的人工智能技術。
2月12日,字節(jié)跳動豆包大模型團隊宣布提出了全新的稀疏模型架構UltraMem,該架構有效解決了MoE推理時高額的訪存問題,推理速度較MoE架構提升2至6倍,推理成本最高可降低83%。
業(yè)內人士認為,DeepSeek有望開啟全球大模型開發(fā)和應用的新階段,重塑人工智能行業(yè)和市場競爭格局?!拔磥淼拇竽P透偁帉膯渭兊乃懔Ω傎愞D向算法效率和推理能力的提升,深度優(yōu)化算法成為新的焦點?!辟愔钱a業(yè)研究院人工智能研究所副所長安赟表示,這有望激發(fā)一波創(chuàng)新浪潮,推動各大模型廠商探索具有成本效益的AI開發(fā)和部署方法。
國產大模型加快創(chuàng)新步伐的同時,也有望加速AI行業(yè)的滲透速度和商業(yè)化應用,引發(fā)AI算力快速發(fā)展。
例如,2025年春節(jié)期間,三家基礎電信企業(yè)均全面接入DeepSeek開源大模型,實現(xiàn)在多場景、多產品中應用,針對熱門的DeepSeek-R1模型提供專屬算力方案和配套環(huán)境,助力國產大模型性能釋放。與此同時,近期百度智能云、華為云、阿里云、60數(shù)字安全集團等多個平臺宣布上線DeepSeek旗下大模型。
國際數(shù)據(jù)公司IDC聯(lián)合浪潮信息2月13日發(fā)布的《2025年中國人工智能計算力發(fā)展評估報告》認為,DeepSeek帶來的算法效率的提升并未抑制算力需求,反而因更多的用戶和場景的加入,推動大模型普及與應用落地,重構產業(yè)創(chuàng)新范式,帶動數(shù)據(jù)中心、邊緣及端側算力建設。該報告研究顯示,2024年中國人工智能算力市場規(guī)模達到190億美元,同比增長86.9%,預計2025年將達到259億美元,同比增長為36.2%。
“人工智能應用落地不僅需要算力基礎設施,還需要算法、數(shù)據(jù)以及運維等全方位就緒?!崩顺毙畔⒏呒壐笨偛脛④娬f,大模型企業(yè)加速創(chuàng)新腳步,通過先進的算法優(yōu)化和高效的模型性能,有望激發(fā)新的應用場景的需求,拉動數(shù)據(jù)中心、端側及邊緣計算的應用發(fā)展。同時,針對高性能算力供不應求及算力利用率低問題的挑戰(zhàn),需要進一步推動算力“擴容”和“提效”,實現(xiàn)充足的多元算力供給,提高算力利用率。
免責聲明:本網轉載自其它媒體的文章,目的在于弘揚科技創(chuàng)新精神,傳遞更多科技創(chuàng)新信息,宣傳國家科技政策,展示國家科技形象,增強國家科技軟實力,參與國際科技輿論競爭,提高國際科技話語權,并不代表本網贊同其觀點和對其真實性負責,在此我們謹向原作者和原媒體致以敬意。如果您認為本網文章及圖片侵犯了您的版權,請與我們聯(lián)系,我們將第一時間刪除。