奔馳即將在中國開展自動(dòng)駕駛L4級(jí)測試、文遠(yuǎn)知行獲準(zhǔn)在美國進(jìn)行自動(dòng)駕駛汽車載客測試、英偉達(dá)和聯(lián)發(fā)科合作開發(fā)的AI PC芯片……生成式AI在多個(gè)領(lǐng)域正在加速融合與快速迭代。
中國AI大模型
作為生成式AI核心技術(shù)之一的大模型,在我國多個(gè)領(lǐng)域的融合應(yīng)用正呈現(xiàn)出前所未有的活躍態(tài)勢,尤其是在工業(yè)等產(chǎn)業(yè)應(yīng)用場景應(yīng)用中,中國AI大模型不止會(huì)聊天,也正在突破傳統(tǒng)行業(yè)的技術(shù)瓶頸,帶來顛覆性的變革。
而“中國AI大模型的應(yīng)用落地方向究竟在哪里?”這個(gè)話題成為當(dāng)下最核心的關(guān)注點(diǎn)。
日前,中國信息通信研究院人工智能所專家在8月初召開的“AI大模型應(yīng)用場景”產(chǎn)學(xué)研融通創(chuàng)新活動(dòng)——產(chǎn)業(yè)問題專家研討會(huì)上談到AI大模型應(yīng)用方向時(shí)表示:“大模型的實(shí)際應(yīng)用價(jià)值正在受到多方關(guān)注,市場希望大模型能夠解決工業(yè)化問題,推動(dòng)生態(tài)力和新型工業(yè)化發(fā)展,而不是僅僅停留在聊天、生成視頻和圖片的層面。”
火山引擎生態(tài)合作專家也提到:“大模型C端應(yīng)用產(chǎn)品用量最大,而企業(yè)級(jí)客戶對模型精準(zhǔn)度要求最高,B端企業(yè)級(jí)應(yīng)用還沒跑出來,如何將模型適配到產(chǎn)業(yè)發(fā)展上是個(gè)難題。”
那么問題來了,中國的AI大模型想要將AI大模型適配到產(chǎn)業(yè)發(fā)展上,有效轉(zhuǎn)化為實(shí)際的產(chǎn)業(yè)價(jià)值,在其實(shí)際應(yīng)用落地過程中會(huì)遇到多少挑戰(zhàn)?
技術(shù)方面
首先是模型幻覺問題,大模型幻覺問題是一直存在的,生成的一些看上去比較合理,但其實(shí)是不正確的答案。對于生產(chǎn)制造企業(yè)來說,這個(gè)風(fēng)險(xiǎn)隱患是不能有的。
其次是基礎(chǔ)通用大模型能力不足,模型迭代較慢,關(guān)鍵技術(shù)依賴國外,多訴求下的專業(yè)模型建模存在技術(shù)困難。例如三峽提出的問題,安全角度出發(fā),要求水位盡量降低,水位過高當(dāng)洪水發(fā)生時(shí)會(huì)有安全隱患,發(fā)電需求角度出發(fā),要求水位越高越好,水位高、水頭高發(fā)電量就大,這時(shí)兩方的需求是矛盾的。在這種多訴求目標(biāo)下進(jìn)行基礎(chǔ)建模,大模型廠商的能力可能還是不足的。
最后是數(shù)據(jù)質(zhì)量的問題,例如,國產(chǎn)模型生成視頻經(jīng)常出現(xiàn)外國人臉的現(xiàn)象,分析其背后的原因發(fā)現(xiàn),一是國內(nèi)的視頻資源不夠豐富,所以必須用國外的影視資料來進(jìn)行訓(xùn)練,二是即使能夠獲取國內(nèi)視頻數(shù)據(jù),企業(yè)也會(huì)擔(dān)心肖像安全隱私問題,不敢使用。
智源研究院專家表示:“國家一直在倡導(dǎo)數(shù)據(jù)先行。數(shù)據(jù)雖然看似特別多,但是真正用起來的高質(zhì)量的數(shù)據(jù)非常非常少。行業(yè)數(shù)據(jù)、專業(yè)數(shù)據(jù)等高質(zhì)量數(shù)據(jù)難以獲取,這些數(shù)據(jù)大量都掌握在企業(yè)端和專業(yè)的機(jī)構(gòu)端,渠道的打通是問題。”
此外還有多模態(tài)的、異構(gòu)的數(shù)據(jù)的整理和處理是目前工作的難點(diǎn)之一,它需要花大量的時(shí)間和精力。清華大學(xué)計(jì)算機(jī)系原系主任、教授周立柱表示:“創(chuàng)建人工智能大模型,建模和算法占20%,數(shù)據(jù)準(zhǔn)備占80%。建立不同的模型,需要選擇不同的數(shù)據(jù)。數(shù)據(jù)選擇以后進(jìn)行數(shù)據(jù)清洗,數(shù)據(jù)清洗完以后數(shù)據(jù)增強(qiáng)之后數(shù)據(jù)混合,最后再數(shù)據(jù)集成。但這一系列的步驟需要大量的人力,需要這個(gè)生態(tài)系統(tǒng)里面的很多工具進(jìn)行支持。”
算力方面
國內(nèi)算力缺口不斷擴(kuò)大,尤其智能算力。清華大學(xué)計(jì)算機(jī)系原系主任、教授周立柱還表示:“高端算力尚未實(shí)現(xiàn)自主可供,關(guān)鍵就是只能自主發(fā)展了。比如算力中心的安全運(yùn)營需要相關(guān)設(shè)備場上的創(chuàng)新支持,算力中心安全涉及的問題很多。”
科智咨詢研究總監(jiān)弓瑞峰表示:“算力方面主要是高端算力不足,工信部數(shù)據(jù)顯示,總算力美國35%,中國31%,差距較??;智能算力美國45%中國28%,中美差距較大,高端算力的不足導(dǎo)致的直接后果就是中國千億以上參數(shù)大模型訓(xùn)練算力不足,大模型能力受到影響。”
此外,如果要建千億以上的大模型,訓(xùn)練數(shù)據(jù)需要包括上萬塊卡,智算中心運(yùn)營壓力非常大。在智算中心,一臺(tái)GPU一臺(tái)服務(wù)器可能要上千瓦的耗電量,功耗非常大,有時(shí)候普通機(jī)柜跟一個(gè)GPU服務(wù)器機(jī)柜耗電量可能相差十倍,電費(fèi)也可能相差十倍。
不僅如此,大模型在應(yīng)用落地過程還缺乏場景需求,一方面企業(yè)行業(yè)有需求,另一面行業(yè)熱度也在降溫,到底算力支持跟不跟得上,業(yè)務(wù)本身到底能不能做大模型,技術(shù)到底可不可達(dá)以及安全性,數(shù)據(jù)歸屬等問題都有不確定性,所以企業(yè)場景落地還在摸索。
業(yè)內(nèi)專家還表示,在新能源行業(yè)很關(guān)心這個(gè)大模型是怎么發(fā)揮它的價(jià)值,在落地過程中發(fā)現(xiàn),很多生產(chǎn)單位其實(shí)對于問答用大模型來做問答不是特別感興趣,更關(guān)心成本問題。
其次是技術(shù)人才,在大模型場景落地中,會(huì)遇到技術(shù)方懂技術(shù)不懂業(yè)務(wù),客戶懂業(yè)務(wù)不懂技術(shù),雙方溝通成本較高,懂技術(shù)又懂業(yè)務(wù)交叉型的人才少,例如醫(yī)療領(lǐng)域,有醫(yī)療背景又懂技術(shù)的人是能幫助技術(shù)大模型落地重要環(huán)節(jié)。
現(xiàn)誠邀AI大模型應(yīng)用場景解決方案及數(shù)字化轉(zhuǎn)型企業(yè)踴躍申報(bào)參與由中國科協(xié)企業(yè)創(chuàng)新服務(wù)中心主辦的"產(chǎn)學(xué)研融通創(chuàng)新活動(dòng)"——《AI大模型應(yīng)用場景》案例集評(píng)選。
“AI大模型應(yīng)用場景”產(chǎn)學(xué)研融通創(chuàng)新活動(dòng)
2024年6月,率先啟動(dòng)“產(chǎn)學(xué)研融通創(chuàng)新活動(dòng)”,本活動(dòng)由中國科協(xié)企業(yè)創(chuàng)新服務(wù)中心主辦,中關(guān)村產(chǎn)業(yè)技術(shù)聯(lián)盟聯(lián)合會(huì)、中國通信工業(yè)協(xié)會(huì)數(shù)據(jù)中心委員會(huì)(CIDC)承辦,數(shù)字開物、中國IDC圈協(xié)辦,聚焦AI大模型場景應(yīng)用上中下游企業(yè),面向產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型的央國企及行業(yè)龍頭企業(yè)、中國優(yōu)秀大模型企業(yè)及大模型解決方案企業(yè)、支撐AI大模型的算力基礎(chǔ)設(shè)施領(lǐng)域企業(yè)全面征集優(yōu)秀企業(yè)案例,全方位彰顯國內(nèi)外數(shù)字領(lǐng)域領(lǐng)先企業(yè)在中國產(chǎn)業(yè)數(shù)字化進(jìn)程中的突出成就。