www.AV天堂2019.com ,无码一区二区三区视频,天天躁日日躁狠狠躁一区,天天做天天爱天天综合网,无码无遮挡又大又爽又黄的视频

2024年8月6日,麻省理工學(xué)院計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室主任Daniela Rus全新力作《心靈之鏡:人工智能時(shí)代的風(fēng)險(xiǎn)與回報(bào)》正式發(fā)布!

進(jìn)入下半年,經(jīng)過持續(xù)了1年多的“AI狂熱”之后,理性的企業(yè)開始全面著手探索AI的能力邊界,這本書通過AI七大能力的核心展示,深入探討了底層技術(shù)及其局限性和可能性。與此同時(shí),本書還專門展示了企業(yè)實(shí)施AI大模型落地項(xiàng)目的12個(gè)關(guān)鍵步驟。

全球首發(fā)|企業(yè)實(shí)施AI大模型落地項(xiàng)目指南

全球首發(fā)|企業(yè)實(shí)施AI大模型落地項(xiàng)目指南

以下為《企業(yè)實(shí)施AI大模型落地項(xiàng)目指南》原文:

當(dāng)下正在上演的AI革命,與二十年前的數(shù)字化變革同樣重要。原生AI企業(yè)將享有類似于原生數(shù)字企業(yè)的優(yōu)勢(shì)——它們能更快擁抱和部署新技術(shù),從而盡早嘗到甜頭。而其他企業(yè)呢?員工、基建、戰(zhàn)略,統(tǒng)統(tǒng)要升級(jí)換代。但我可不提倡一股腦兒地采用市場(chǎng)上所有新潮的AI方案。行動(dòng)太慢,恐落人后;操之過急,問題多多。

成功轉(zhuǎn)型的關(guān)鍵,在于針對(duì)企業(yè)的特定需求來謀劃,設(shè)計(jì)實(shí)施能直擊痛點(diǎn)、價(jià)值最大化的AI戰(zhàn)略,同時(shí)引進(jìn)必要人才,讓轉(zhuǎn)型紅利始終惠及公司。在這個(gè)新時(shí)代,人才的重要性前所未有。評(píng)估AI如何助力業(yè)務(wù)時(shí),我建議從任務(wù)維度拆分組織各崗位,再考慮AI能否協(xié)助、增強(qiáng)或自動(dòng)化這些任務(wù)。

01 助手ASSIST

這種模式下,AI系統(tǒng)被用來輔助人工操作,幫助實(shí)時(shí)做出更優(yōu)決策,讓任務(wù)完成得更輕松、更快捷。比如說,人雖然也能分析數(shù)據(jù),但AI能快速處理海量數(shù)據(jù),發(fā)現(xiàn)人類分析師可能忽略的規(guī)律和洞見,為營銷策劃、財(cái)務(wù)預(yù)測(cè)、運(yùn)營管理等領(lǐng)域的決策提供支持。

02 增強(qiáng)AUGMENT

在這里,AI不只是助手,更是一種突破人類極限、全面提升工作效率的法寶。編程助手Copilot就是一個(gè)活生生的例子。再比如,創(chuàng)意廣告公司越來越愛用"換臉"技術(shù)搞事情。百事可樂在印度推出了一支廣受好評(píng)的視頻,知名演員薩爾曼·汗在其中"一分為二";博彩公司FanDuel則用生成式AI給當(dāng)紅解說、前NBA球星查爾斯·巴克利P了個(gè)年輕版。換臉版和真人版巴爺躺沙發(fā)上侃大山,為品牌站臺(tái)。兩則廣告都表明,借助AI,創(chuàng)意團(tuán)隊(duì)能搞出多少出其不意、讓人拍案叫絕的新花樣。不過在我看來,一項(xiàng)醫(yī)學(xué)研究案例最能體現(xiàn)這一點(diǎn)。研究發(fā)現(xiàn),特定診斷任務(wù)上AI可能表現(xiàn)優(yōu)異,人類專家略勝一籌,但當(dāng)人機(jī)聯(lián)手,效果最為驚艷。實(shí)驗(yàn)中(這在我的《芯手相連》一書中也提過),醫(yī)生和一個(gè)AI系統(tǒng)需要查看淋巴結(jié)掃描圖像,判斷是否患癌。人類醫(yī)生的錯(cuò)誤率為3.5%,AI系統(tǒng)則為7.5%。但通過合作,準(zhǔn)確率提高了80%,錯(cuò)誤率驟降至0.5%,因?yàn)槿撕蜋C(jī)器看待事物的角度各不相同。

03 自動(dòng)化AUTOMATE

自動(dòng)化,意味著AI系統(tǒng)能徹底接管任務(wù),取代人力。這可大可小,從簡單的日程安排,到自動(dòng)駕駛。對(duì)于財(cái)務(wù)、運(yùn)營等部門,AI無需人工干預(yù)就能生成例行報(bào)告,保證利益相關(guān)方及時(shí)獲得最新信息。在保險(xiǎn)業(yè),創(chuàng)企們正開發(fā)自動(dòng)化數(shù)據(jù)錄入工具,讓理賠員從事更有價(jià)值的工作。

縱觀全局,你得判斷哪些任務(wù)可歸入哪一類。這事兒可不簡單,非得雇傭一批新型人才不可:"雙語"專才。這里說的可不是那些精通多國語言的家伙。你需要的是既懂AI又懂業(yè)務(wù)的人。拿我丈夫的公司Coda Metrix來說,他們?cè)诎厌t(yī)療編碼自動(dòng)化。醫(yī)療編碼是保險(xiǎn)報(bào)銷必不可少的一環(huán),但活兒又細(xì)又繁,經(jīng)常得由醫(yī)生這樣的"大材小用"人士來干。

編碼識(shí)別和輸入,再適合自動(dòng)化不過了。一則確有可能,二則能給醫(yī)生騰出寶貴的時(shí)間。但這不意味著這門生意好做。醫(yī)療編碼領(lǐng)域十分小眾,實(shí)現(xiàn)流程自動(dòng)化的技術(shù)也非常復(fù)雜。所以Coda Metrix需要即熟悉醫(yī)療編碼、又了解AI的人才來測(cè)試評(píng)估效果。機(jī)器做不到百分百準(zhǔn)確,當(dāng)運(yùn)算充滿變數(shù)、需要人工接管時(shí),這些"雙語"人才就派上用場(chǎng)了。

無論你身處何行,都離不開這樣的人才,他們?cè)诮?jīng)濟(jì)中舉足輕重。作為商業(yè)領(lǐng)袖,你還得學(xué)習(xí)這些AI解決方案,營造善學(xué)善變的企業(yè)文化,多培養(yǎng)"雙語"人才,廣納合作伙伴以豐富工具箱和知識(shí)庫,沒準(zhǔn)還要跟高校聯(lián)手,時(shí)刻關(guān)注新技術(shù)動(dòng)向。你需要了解什么,取決于你在公司里的角色,以及是負(fù)責(zé)領(lǐng)導(dǎo)、使用、部署,還是開發(fā)AI解決方案。

引入AI可不是兒戲。要將理論收益轉(zhuǎn)化為實(shí)際效益,需要周密規(guī)劃、充足資源、對(duì)AI目標(biāo)和局限有清晰認(rèn)識(shí)。

意識(shí)到這一復(fù)雜性,我和幾位同事制定了一套全面的問題清單和行動(dòng)步驟,為大型機(jī)構(gòu)設(shè)計(jì)實(shí)施AI解決方案提供指引。這是我們面向國家安全領(lǐng)導(dǎo)者和企業(yè)開設(shè)的系列AI課程的一部分。美國空軍退役將軍斯蒂芬·威爾遜和麻省理工林肯實(shí)驗(yàn)室的黛安·斯塔赫利最先提出,要制定他們口中的"行動(dòng)藍(lán)圖"。麻省理工林肯實(shí)驗(yàn)室的阿努·邁恩和羅伯特·邦德將概念付諸實(shí)踐,制作了藍(lán)圖資料,然后我們組團(tuán)開發(fā)了這門課程。隨著AI日新月異,學(xué)員隊(duì)伍不斷壯大,行動(dòng)藍(lán)圖也在與時(shí)俱進(jìn)。以下內(nèi)容改編自該模板和課程,讓你得以一窺AI落地的諸多細(xì)節(jié)。目的是幫你確保你的方法不僅技術(shù)上靠譜,更要在戰(zhàn)略上與業(yè)務(wù)目標(biāo)保持一致。首要一問:AI現(xiàn)在是否真適合你的企業(yè)?

04 經(jīng)濟(jì)性與戰(zhàn)略規(guī)劃

ECONOMICS&STRATEGY

在一頭扎進(jìn)AI項(xiàng)目前,你得預(yù)測(cè)成本收益及其未來走向。規(guī)模很關(guān)鍵。如果待自動(dòng)化的任務(wù)人手寥寥,費(fèi)盡心思上AI可能得不償失。但如果這任務(wù)在多個(gè)組織或行業(yè)中不可或缺,你就可以考慮搞個(gè)平臺(tái),把服務(wù)賣出去。

假設(shè)你闖過這第一關(guān),然后呢?

1.一個(gè)目標(biāo)明確

下一步,搞清楚你希望AI為公司帶來什么。比如,用聊天機(jī)器人自動(dòng)化客服咨詢,用圖像識(shí)別系統(tǒng)提高質(zhì)檢準(zhǔn)確度,甚至通過分析消費(fèi)者行為數(shù)據(jù)挖掘新的市場(chǎng)洞見。你得明確是否真需要AI,必須確信引入AI是為了應(yīng)對(duì)獨(dú)特挑戰(zhàn)的戰(zhàn)略舉措。

自建還是買現(xiàn)成?這時(shí)你得決定,是從供應(yīng)商那兒買現(xiàn)成的,還是自己動(dòng)手搞定。"自建還是買現(xiàn)成"的決定,應(yīng)基于全面評(píng)估你的具體AI需求、市場(chǎng)調(diào)研、成本效益分析,以及考慮定制方案可能帶來的更廣泛應(yīng)用和收益。研究現(xiàn)成AI產(chǎn)品或平臺(tái)能否滿足你的特殊需求時(shí),要考慮兼容性、可擴(kuò)展性、定制空間等因素。如果市場(chǎng)解決方案稍作調(diào)整就能用,買現(xiàn)成可能更高效經(jīng)濟(jì)。但如果市面上沒有讓你滿意的,或者得大刀闊斧地改造才能用,量身定制AI方案可能是更好的選擇。這樣你就可以按需定制,全程把控開發(fā),打造一套完美契合你業(yè)務(wù)流程和目標(biāo)的系統(tǒng)。當(dāng)然,在時(shí)間、資源、專業(yè)知識(shí)上也要下血本。一個(gè)有意思的點(diǎn)是,把你量身定制的AI系統(tǒng)做成生意,商業(yè)化并賣給其他公司。比如你開發(fā)的AI庫存管理系統(tǒng),改進(jìn)后就能賣給那些嚴(yán)重依賴庫存控制的企業(yè),如零售連鎖、制造商、物流公司等。這樣不僅能開辟新的收入來源,還能把你的公司打造成AI領(lǐng)域的創(chuàng)新標(biāo)桿。

算算投資回報(bào)(ROI)。接下來,你得制定期望路線圖,列出具體的可量化目標(biāo),包括潛在投資回報(bào)率(ROI)。如果實(shí)施后只能帶來一丁點(diǎn)兒收益,那真不值當(dāng)。切記:并非所有能自動(dòng)化的任務(wù)都該自動(dòng)化。有時(shí)候,為完成任務(wù)而開發(fā)或采購AI系統(tǒng)的成本可能高得離譜。理想情況下,在深入一個(gè)項(xiàng)目之前,你心里要有這筆AI投資的預(yù)期數(shù)。

圈定利益相關(guān)方。然后,找出誰來使用和管理這套AI系統(tǒng)(包括那些"雙語"人才),誰會(huì)從中受益(包括公司內(nèi)外部的團(tuán)體或部門)。使用者可能是那些每天和AI工具打交道的員工,比如用AI聊天機(jī)器人的客服、用AI驅(qū)動(dòng)分析的數(shù)據(jù)分析師,或操作AI自動(dòng)化機(jī)器的工人。了解他們的工作流程、痛點(diǎn)和期望,是設(shè)計(jì)一套能提高工效和滿意度的AI系統(tǒng)的關(guān)鍵。別忘了那些管理或監(jiān)督AI部署的人,他們要負(fù)責(zé)監(jiān)控和維護(hù)AI系統(tǒng)。在定義系統(tǒng)需求、與現(xiàn)有工作流程的整合、持續(xù)管理需求等方面,他們的見解至關(guān)重要。

采用AI可不是小事。要把理論收益變成實(shí)實(shí)在在的效益,需要周密規(guī)劃、充足資源,還要明白AI的目標(biāo)和局限。

正因如此,我和幾位同事制定了一套全面的問題清單和行動(dòng)步驟,為大型機(jī)構(gòu)設(shè)計(jì)實(shí)施AI解決方案提供指引。這是我們面向國家安全領(lǐng)導(dǎo)者和企業(yè)開設(shè)的系列AI課程的一部分。美國空軍退役將軍斯蒂芬·威爾遜和麻省理工林肯實(shí)驗(yàn)室的黛安·斯塔赫利最先提出,要制定他們口中的"行動(dòng)藍(lán)圖"。麻省理工林肯實(shí)驗(yàn)室的阿努·邁恩和羅伯特·邦德將這個(gè)概念變成了現(xiàn)實(shí),制作了藍(lán)圖資料,然后我們組團(tuán)開發(fā)了這門課程。隨著AI迅猛發(fā)展,學(xué)員隊(duì)伍不斷壯大,行動(dòng)藍(lán)圖也在與時(shí)俱進(jìn)。以下內(nèi)容改編自藍(lán)圖模板和我們的課程,讓你得以一窺AI落地的種種細(xì)節(jié),幫你確保自己的方法不僅在技術(shù)上站得住腳,在戰(zhàn)略上更要與業(yè)務(wù)目標(biāo)保持一致。首要一問:AI現(xiàn)在是否真的適合你的企業(yè)?

明確價(jià)值定位。對(duì)于AI解決方案能帶來的獨(dú)特優(yōu)勢(shì),你得心里有數(shù)。要搞清楚這個(gè)AI"神器"能做到什么,是其他方案或人力"望塵莫及"的。同時(shí),別忘了好好琢磨可能帶來的客戶體驗(yàn)。(老實(shí)說,那些笨手笨腳的聊天機(jī)器人和機(jī)械化的電話服務(wù)真讓人抓狂。)找準(zhǔn)了需要改進(jìn)的地方,就得想辦法把AI技術(shù)的優(yōu)勢(shì)發(fā)揮到極致,看看是用來幫忙、錦上添花,還是全盤接管。

選對(duì)搭檔很關(guān)鍵。接下來要明確誰來參與你的AI項(xiàng)目。誰來幫你把現(xiàn)成的AI應(yīng)用改造成你想要的樣子?誰來為你量身定制全新的AI方案?此外,你還需要確定誰將與你攜手組建高效的人機(jī)"夢(mèng)之隊(duì)"。別忘了明確誰來評(píng)估AI計(jì)劃的方方面面,包括范圍、安全性和道德問題,以及誰來負(fù)責(zé)數(shù)據(jù)的全生命周期管理。數(shù)據(jù)共享的規(guī)矩得定清楚,包括誰能碰這些"金子",還得有專門的團(tuán)隊(duì)或"大佬"來掌舵,及時(shí)解決可能冒出來的各種問題。

別以為引入AI就是裝個(gè)新軟件那么簡單。這可是個(gè)"厲害角色",會(huì)影響你的整個(gè)"江山"和所有"子民"。除了培養(yǎng)一幫既懂業(yè)務(wù)又懂AI的"全能選手",你可能還得找"大牛"幫忙。他們能幫你設(shè)計(jì)、組建和維護(hù)一支能跟AI"眉來眼去"的隊(duì)伍。這支隊(duì)伍得有"十八般武藝",重點(diǎn)是要安全、高效地駕馭AI,讓公司和員工都能"吃香喝辣"。

怎么知道AI是不是"中看不中用"?我們上課時(shí)說過,得有一套全面的"考核標(biāo)準(zhǔn)"。先想想怎么衡量AI的能力,比如準(zhǔn)不準(zhǔn)、快不快,還有對(duì)業(yè)績有多大幫助。說到人機(jī)合作,得看看AI能不能讓團(tuán)隊(duì)更給力、決策更靠譜、大家干活更開心。AI做決定得公平、透明,還得合規(guī)。數(shù)據(jù)質(zhì)量可是AI的"命脈",得有靠譜的招兒來驗(yàn)證數(shù)據(jù),經(jīng)常查漏補(bǔ)缺。還得從安全性、可靠性、公平性、可解釋性和穩(wěn)定性這幾個(gè)方面給AI來個(gè)"全身體檢"??赡苄枰ㄆ?復(fù)查",看看有沒有"偏心",能不能經(jīng)得起各種"風(fēng)吹雨打"。

要讓大家接受和支持AI可不是件容易事。有些AI工具可能很快就能上手,但要來個(gè)徹底的"大變身",往往得啃一些又硬又難啃的骨頭。光說AI多厲害可不夠,你得讓人看到AI怎么能幫公司實(shí)現(xiàn)目標(biāo),解決問題,抓住機(jī)會(huì),還得說清楚對(duì)員工有啥影響。別小看了實(shí)施的難度,有時(shí)候可能還得搞些"高科技"設(shè)備,我在第15章里可是說得明明白白。

你得掂量掂量,現(xiàn)有的家當(dāng)夠不夠用,能不能支撐AI這個(gè)"大胃王"。不行的話,是得自己添置"硬貨",還是找個(gè)"云端"托管?最重要的是,別忘了考慮人的因素。員工肯定想知道,這AI會(huì)不會(huì)搶他們的飯碗。你得讓用戶群體接受這個(gè)新來的"成員"??赡艿谜倚?擁護(hù)者",好好溝通,解釋為啥要用AI,怎么能讓公司和用AI的人都能"魚和熊掌兼得"。

風(fēng)險(xiǎn)可得想清楚。用AI可能會(huì)有啥坑,有啥短板,都得摸清楚。數(shù)據(jù)質(zhì)量和代表性可重要了,得找"行家里手"好好查查,看看訓(xùn)練數(shù)據(jù)有沒有"偏心",會(huì)不會(huì)"死記硬背",能不能適應(yīng)"千變?nèi)f化"的情況。這事兒可關(guān)鍵了,因?yàn)閿?shù)據(jù)質(zhì)量直接影響AI的表現(xiàn)和公正性。如果訓(xùn)練數(shù)據(jù)不能反映"真實(shí)世界",AI可能會(huì)"走火入魔"或"以偏概全"。還得想想可能會(huì)出現(xiàn)啥意外情況。比如說,客服聊天機(jī)器人可能搞不定復(fù)雜的問題,反而把客戶惹毛了。得有招兒及時(shí)發(fā)現(xiàn)和解決這些問題,必要時(shí)還得讓人來"救火"。數(shù)據(jù)保護(hù)和隱私也得考慮到,得建立"銅墻鐵壁"。你得清楚項(xiàng)目需要啥數(shù)據(jù),有沒有權(quán)限用這些"寶貝",不管是用自己的設(shè)備還是"云上漫步"。別忘了想想對(duì)環(huán)境的影響,這些AI可能是個(gè)"電老虎"。在訓(xùn)練和使用AI時(shí),網(wǎng)絡(luò)安全措施得跟上,防止數(shù)據(jù)被"偷梁換柱"或"竊聽"。

組建一支既懂業(yè)務(wù)又懂AI的"全能戰(zhàn)隊(duì)"可重要了。我怎么強(qiáng)調(diào)都不過分。培養(yǎng)這樣一支能駕馭AI的隊(duì)伍,對(duì)成功簡直是"一錘定音"。

部署得好好規(guī)劃。得想清楚怎么處理人的問題,怎么解決道德問題,還有技術(shù)上需要啥。讓人和AI好好"攜手共進(jìn)"可不容易,得設(shè)計(jì)好用的界面,好好培訓(xùn)員工,定清楚人機(jī)互動(dòng)的"規(guī)矩"。AI做決定得公平、不帶偏見,過程得"透明如水",還得尊重隱私和數(shù)據(jù)保護(hù)法。你還得算算需要多少算力、存儲(chǔ)空間和網(wǎng)絡(luò)帶寬,保證AI能"行云流水"般運(yùn)行。

數(shù)據(jù)戰(zhàn)略也得有。得想清楚需要啥數(shù)據(jù),怎么收集-是不是得一直"開著水龍頭",還是定期收集,或者就收集一次。收集來的數(shù)據(jù)怎么處理,怎么用來"喂養(yǎng)"AI。數(shù)據(jù)存儲(chǔ)和管理得安全,還得合規(guī),而且要能根據(jù)AI的需求隨時(shí)"變臉"。得防著有人篡改數(shù)據(jù)。讓最終用戶參與開發(fā)挺重要的,這樣能確保AI真的能解決"痛點(diǎn)"。考慮一下數(shù)據(jù)是不是需要貼標(biāo)簽,能不能用模擬數(shù)據(jù)來訓(xùn)練。搞點(diǎn)"紅隊(duì)"活動(dòng),測(cè)試系統(tǒng)的"抗壓能力"。把AI的開發(fā)安全運(yùn)維和傳統(tǒng)流程"珠聯(lián)璧合",確保開發(fā)過程安全順暢。

資源需求得摸清楚。不同類型的AI功能,需要的基礎(chǔ)設(shè)施和資源差別可大了。企業(yè)級(jí)的AI可能需要"神級(jí)"的數(shù)據(jù)處理和存儲(chǔ)能力,來應(yīng)對(duì)"海量"的業(yè)務(wù)數(shù)據(jù)。而用于運(yùn)營的AI可能更需要"閃電般"的處理能力和邊緣計(jì)算資源。項(xiàng)目的依賴關(guān)系會(huì)影響時(shí)間表。比如說,如果AI需要和現(xiàn)有的企業(yè)系統(tǒng)""打成一片",那這些系統(tǒng)是否就緒、是否兼容就成了關(guān)鍵。如果需要外部供應(yīng)商提供特殊的AI組件或數(shù)據(jù),這也會(huì)影響進(jìn)度。

別忘了給員工培訓(xùn)和支持"留點(diǎn)錢",這對(duì)提高人機(jī)團(tuán)隊(duì)的效率很重要。如果AI需要直接和人"對(duì)話",可能還需要特殊的"裝備",比如生物識(shí)別傳感器或定制界面。像是用于自然對(duì)話的語音識(shí)別系統(tǒng),或者能監(jiān)測(cè)人體反應(yīng)、讓AI更"懂人心"的可穿戴設(shè)備。獲取數(shù)據(jù)的時(shí)間也是個(gè)大問題。這取決于數(shù)據(jù)有多容易"到手",以及收集、清理、整理數(shù)據(jù)需要多長時(shí)間。最后,你得算算開發(fā)AI需要多少"算力",這取決于AI模型有多"高深",要處理多少數(shù)據(jù),還得考慮訓(xùn)練模型要"燒"多少錢?,F(xiàn)在這成本可不低,有時(shí)候高得讓人"望而卻步"。不過,隨著時(shí)間推移,可能會(huì)"親民"一些。

最后,你得想清楚在哪些環(huán)境下測(cè)試、評(píng)估、驗(yàn)證這些功能。找內(nèi)部專家或外部合作伙伴來處理這些問題太重要了,我怎么強(qiáng)調(diào)都不過分。記住,在AI這條路上,"獨(dú)行快,眾行遠(yuǎn)"。有了靠譜的團(tuán)隊(duì)和合作伙伴,你的AI之旅才能"一帆風(fēng)順"。

2.收集和準(zhǔn)備數(shù)據(jù)

完成這個(gè)嚴(yán)格的初始階段后,你就該考慮如何將計(jì)劃付諸實(shí)施了。首要任務(wù)是收集符合所有監(jiān)管、法律和合規(guī)要求的相關(guān)數(shù)據(jù)。雖然有許多技術(shù)工具可以輔助這一步驟,但你仍需要合適的人才來監(jiān)督整個(gè)過程。

3.選擇合適的AI模型

這個(gè)決策不能僅靠簡單的網(wǎng)絡(luò)搜索來完成。你需要具備專業(yè)知識(shí)的人才來協(xié)助你選擇一個(gè)最符合需求的模型——既要滿足成本要求,又要符合可持續(xù)發(fā)展原則。

4.執(zhí)行開發(fā)和訓(xùn)練

獲得更大規(guī)模的數(shù)據(jù)后,你需要將數(shù)據(jù)劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集三個(gè)部分,然后開始模型訓(xùn)練。典型的數(shù)據(jù)劃分比例為70%、15%、15%。

5.模型評(píng)估

訓(xùn)練和驗(yàn)證完成后,你需要確認(rèn)模型的實(shí)際效果。這就是測(cè)試數(shù)據(jù)集的用途所在。這里有幾個(gè)重要的評(píng)估指標(biāo),包括準(zhǔn)確率、F1分?jǐn)?shù)(精確率和召回率的調(diào)和平均值)和均方根誤差(RMSE),這些指標(biāo)可以幫助你評(píng)估機(jī)器學(xué)習(xí)模型預(yù)測(cè)的準(zhǔn)確性。

6.部署實(shí)施

如果模型通過了評(píng)估測(cè)試,你就可以開始將它整合到先前定義的流程中,無論你的目標(biāo)是協(xié)助、增強(qiáng)還是自動(dòng)化某項(xiàng)任務(wù)。

7.持續(xù)監(jiān)控,定期維護(hù)

這不是一個(gè)"設(shè)置后就可以忘記"的操作。這些智能系統(tǒng)能夠?qū)W習(xí)和改進(jìn),但也可能犯錯(cuò),因此持續(xù)監(jiān)控至關(guān)重要。此外,你的業(yè)務(wù)環(huán)境會(huì)變化,市場(chǎng)趨勢(shì)會(huì)轉(zhuǎn)變。因此,你需要不斷監(jiān)控、更新,必要時(shí)重新訓(xùn)練模型。

8.迭代優(yōu)化

你應(yīng)該制定政策和最佳實(shí)踐,定期重新評(píng)估模型的性能及其設(shè)定的目標(biāo)。你的目標(biāo)是讓解決方案隨著與實(shí)際數(shù)據(jù)的交互而不斷改進(jìn)。

9.評(píng)估偏見和公平性

雖然你會(huì)在數(shù)據(jù)編譯的早期階段就考慮偏見和公平性問題,但這應(yīng)該是一個(gè)持續(xù)關(guān)注的領(lǐng)域。你部署的任何AI解決方案都必須符合道德標(biāo)準(zhǔn),不存在偏見。理想情況下,你希望模型的決策過程是透明的。

10.溝通與教育

從最終用戶到管理層,你的所有利益相關(guān)者都應(yīng)該理解AI如何以及為什么被引入你的業(yè)務(wù)。對(duì)AI的擔(dān)憂是真實(shí)存在的,錯(cuò)誤信息也很普遍。你越能幫助組織內(nèi)的人理解你選擇的工具及其設(shè)計(jì)目的,效果就越好。

11.建立反饋機(jī)制

你的團(tuán)隊(duì)成員將親身體驗(yàn)AI解決方案在實(shí)際操作中的表現(xiàn),因此你需要建立機(jī)制和溝通渠道,讓用戶或系統(tǒng)能夠?qū)I的預(yù)測(cè)或決策提供反饋。這些反饋將有助于你改進(jìn)和優(yōu)化AI模型。

12.長遠(yuǎn)規(guī)劃

這不是一個(gè)快速或簡單的過程。然而,遵循這些指導(dǎo)原則將增加你成功高效實(shí)施的機(jī)會(huì)。同時(shí),每個(gè)應(yīng)用領(lǐng)域可能都有其特殊性,因此靈活性和適應(yīng)特定情況的能力也很關(guān)鍵。

讓我們看一個(gè)具體例子:假設(shè)你正在管理一家醫(yī)院。你面臨的一個(gè)長期問題是患者再入院。當(dāng)患者出院后30天內(nèi)再次入院時(shí),這不僅增加了醫(yī)療成本,也可能給患者帶來額外的經(jīng)濟(jì)負(fù)擔(dān),同時(shí)暗示著護(hù)理質(zhì)量可能存在問題。因此,你希望運(yùn)用AI來預(yù)測(cè)患者在這個(gè)時(shí)間段內(nèi)再次入院的可能性,從而改善醫(yī)療服務(wù)質(zhì)量。

1.明確目標(biāo):你的目標(biāo)是識(shí)別那些高風(fēng)險(xiǎn)患者,并在他們?cè)俅稳朐褐安扇「深A(yù)措施。

2.數(shù)據(jù)收集與準(zhǔn)備:首先,以電子健康記錄(EHR)作為你的數(shù)據(jù)源??紤]到這些數(shù)據(jù)的敏感性,需要實(shí)施嚴(yán)格的安全措施,包括強(qiáng)加密以及定期審計(jì)。數(shù)據(jù)還需要經(jīng)過清理,并評(píng)估可能存在的偏見,必要時(shí)進(jìn)行重新平衡以確保數(shù)據(jù)集和模型本身的公平性。

例如,如果預(yù)測(cè)模型主要基于大量低收入患者的數(shù)據(jù)進(jìn)行訓(xùn)練,而這些患者可能無法獲得充分的藥物和其他醫(yī)療資源,那么在預(yù)測(cè)再入院風(fēng)險(xiǎn)時(shí)可能會(huì)出現(xiàn)偏見。如果這些條件導(dǎo)致訓(xùn)練數(shù)據(jù)中再入院率偏高,模型可能會(huì)高估低收入患者再入院的風(fēng)險(xiǎn),因?yàn)樗鼜囊粋€(gè)不均衡的數(shù)據(jù)集中學(xué)習(xí),其中這個(gè)群體的再入院率不成比例地高。這種偏見可能導(dǎo)致模型對(duì)某些群體做出不公平的預(yù)測(cè),影響醫(yī)療資源的合理分配。

3.選擇合適的AI模型:不同類型的數(shù)據(jù)和任務(wù)需要不同類型的模型,每種模型都有其獨(dú)特的優(yōu)勢(shì)和局限性。EHR數(shù)據(jù)可能包含復(fù)雜的關(guān)系——例如,各種癥狀、病史和用藥如何相互作用可能導(dǎo)致某種結(jié)果。簡單的線性模型可能無法捕捉數(shù)據(jù)中更深層次的非線性模式。

應(yīng)該考慮更高級(jí)的模型,如梯度提升機(jī)或深度神經(jīng)網(wǎng)絡(luò)。梯度提升機(jī)是一種機(jī)器學(xué)習(xí)模型,它通過順序構(gòu)建決策樹的集合,每一個(gè)新樹都試圖糾正前一個(gè)樹的錯(cuò)誤。這種方法特別擅長處理復(fù)雜的非線性關(guān)系。另外,深度神經(jīng)網(wǎng)絡(luò)可能能夠識(shí)別簡單模型可能忽略的數(shù)據(jù)中的非線性關(guān)系和模式。

4.執(zhí)行開發(fā)和訓(xùn)練:接下來,你應(yīng)該將數(shù)據(jù)集劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,然后開始在訓(xùn)練集上進(jìn)行模型訓(xùn)練。

5.模型評(píng)估:在這一階段,你需要使用適當(dāng)?shù)闹笜?biāo)評(píng)估模型性能。對(duì)于這種情況,受試者工作特征曲線下面積(AUC)是衡量模型有效性的良好指標(biāo)。

6.部署實(shí)施:現(xiàn)在將模型整合到醫(yī)院的IT系統(tǒng)中。這里是跨學(xué)科人才發(fā)揮重要作用的地方,因?yàn)樗麄兡軌驅(qū)?duì)模型的技術(shù)理解與對(duì)病例和整個(gè)醫(yī)院運(yùn)營的洞察相結(jié)合。

7.持續(xù)監(jiān)控,定期維護(hù):模型投入使用后,需要持續(xù)衡量其預(yù)測(cè)的有效性,并根據(jù)需要進(jìn)行重新訓(xùn)練。

8.迭代優(yōu)化:假設(shè)研究發(fā)現(xiàn)某種特定藥物與較高的再入院風(fēng)險(xiǎn)相關(guān)。你需要更新模型,使其能夠更準(zhǔn)確地將使用這些藥物的患者識(shí)別為潛在的再入院高風(fēng)險(xiǎn)群體。

9.評(píng)估偏見和公平性:模型不得對(duì)任何患者群體產(chǎn)生歧視,因此這些檢查需要定期持續(xù)進(jìn)行。這不僅是道德要求,也是確保模型在各種人群中都能準(zhǔn)確預(yù)測(cè)的關(guān)鍵。

10.溝通與教育:醫(yī)務(wù)人員需要接受新AI工具的培訓(xùn),以更好地理解其預(yù)測(cè)結(jié)果和相關(guān)干預(yù)措施。這些跨學(xué)科人才有助于確保所有相關(guān)人員,包括醫(yī)院領(lǐng)導(dǎo)層,都能及時(shí)了解情況。

11.建立反饋機(jī)制:醫(yī)護(hù)人員需要跟蹤并報(bào)告模型的有效性和影響。這種持續(xù)的反饋不僅有助于改進(jìn)模型,也能幫助醫(yī)護(hù)人員更好地理解和信任AI系統(tǒng)。

12.長遠(yuǎn)規(guī)劃:像這樣的工具可能不會(huì)立即產(chǎn)生顯著效果,因?yàn)樗枰S時(shí)間優(yōu)化和重新訓(xùn)練,而且醫(yī)院工作人員和醫(yī)療專業(yè)人員也需要一定的學(xué)習(xí)適應(yīng)期。但是,如果整個(gè)組織都能積極支持,醫(yī)療專業(yè)人員致力于提供反饋來幫助訓(xùn)練和改進(jìn)模型,那么我們可以預(yù)期你的醫(yī)院將在一年內(nèi)看到30天再入院率顯著降低。

這不僅展示了AI的有效實(shí)際應(yīng)用,還會(huì)對(duì)所有參與者產(chǎn)生積極影響,從批準(zhǔn)項(xiàng)目的管理層或行政領(lǐng)導(dǎo)到利用該工具改善患者護(hù)理的醫(yī)療專業(yè)人員。更重要的是,它能夠提高醫(yī)療質(zhì)量,減少不必要的再入院,從而使患者受益并優(yōu)化醫(yī)療資源的使用。

在整個(gè)過程中,重要的是要記住AI是一個(gè)工具,它的目的是協(xié)助、增強(qiáng)或自動(dòng)化某些任務(wù),而不是取代醫(yī)疑專業(yè)人員的判斷。通過正確的實(shí)施和持續(xù)的改進(jìn),AI可以成為提高醫(yī)療質(zhì)量、改善患者預(yù)后的強(qiáng)大助手。

術(shù)語解釋:

紅隊(duì):由專家組成的團(tuán)隊(duì),負(fù)責(zé)測(cè)試系統(tǒng)的安全性和可靠性,通過模擬攻擊來發(fā)現(xiàn)系統(tǒng)的潛在漏洞。

DevSecOps(開發(fā)、安全和運(yùn)營):一種軟件開發(fā)方法,將安全性整合到整個(gè)開發(fā)和運(yùn)營(DevOps)生命周期中,強(qiáng)調(diào)在開發(fā)過程的每個(gè)階段都要考慮安全性。

分?jǐn)?shù):機(jī)器學(xué)習(xí)中用于評(píng)估分類模型準(zhǔn)確性的指標(biāo),是精確率和召回率的調(diào)和平均值。在類別不平衡的分類問題中特別有用。

均方根誤差(RMSE):衡量定量數(shù)據(jù)預(yù)測(cè)誤差的標(biāo)準(zhǔn)方法,計(jì)算為預(yù)測(cè)值和實(shí)際值之間的平方差的平均值的平方根。

受試者工作特征曲線下面積(AUC):用于評(píng)估分類模型性能的指標(biāo),在機(jī)器學(xué)習(xí)中常用于評(píng)估模型預(yù)測(cè)二元結(jié)果的準(zhǔn)確性。

關(guān)注中國IDC圈官方微信:idc-quan 我們將定期推送IDC產(chǎn)業(yè)最新資訊

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高興

  • 震驚

  • 憤怒

  • 無聊

  • 無奈

  • 謊言

  • 槍稿

  • 不解

  • 標(biāo)題黨
2024-12-06 14:29:25
算力新聞 朱嘯虎再度發(fā)聲回應(yīng)“月之暗面”事件
雖然我們對(duì)大模型有不同的理解,但支持年輕人追求AGI夢(mèng)想 <詳情>
2024-11-22 09:52:00
算力新聞 變革——從芯片、智算集群到大模型應(yīng)用 算力技術(shù)創(chuàng)新與應(yīng)用論壇正式啟動(dòng)
如今,AI大模型浪潮席卷,帶來前所未有的計(jì)算挑戰(zhàn)、算力挑戰(zhàn)、能源挑戰(zhàn)、散熱挑戰(zhàn)與應(yīng)用挑戰(zhàn)。 <詳情>
2024-11-11 10:30:00
算力新聞 4個(gè)大模型大單超億元;昆侖萬維 AI將在美上線;首個(gè)纖維知識(shí)大模型發(fā)布...|一周產(chǎn)業(yè)盤點(diǎn)
[開物有新]數(shù)字科技產(chǎn)業(yè)一周熱聞大盤點(diǎn),過去一周有哪些政策及行業(yè)動(dòng)態(tài)、前沿科技、大事件,一起回顧。 <詳情>
中興通訊發(fā)布第三代模塊化間接蒸發(fā)冷卻解決方案,樹立數(shù)據(jù)中心綠色制冷新標(biāo)桿
2025-04-29 17:08:57
面向未來 Rambus CryptoManager如何重塑數(shù)據(jù)中心安全格局?
2025-04-29 13:22:16
1年5000P!算力“國家隊(duì)”京算公司樹行業(yè)新標(biāo)桿
2025-04-28 11:01:06
萬國數(shù)據(jù)全國首單“數(shù)據(jù)中心持有型不動(dòng)產(chǎn)ABS”在上交所 成功掛牌上市
2025-04-25 11:11:02
供需牽引,生態(tài)共筑:2025中國智算產(chǎn)業(yè)生態(tài)發(fā)展大會(huì)即將啟幕
2025-04-25 10:02:00
智算中心面臨“分水嶺”:施耐德電氣以四維創(chuàng)新驅(qū)動(dòng)價(jià)值破局
2025-04-24 14:35:25
上海市啟動(dòng)2024年度全市算力資源摸底工作通知
2025-04-24 13:44:00
聚焦投資、技術(shù)與可持續(xù)發(fā)展——中國—東南亞數(shù)字基礎(chǔ)設(shè)施合作論壇圓滿舉行
2025-04-23 17:54:00
從算力變革到AI生產(chǎn)力創(chuàng)新 首屆酒仙橋論壇丨AIDC創(chuàng)新驅(qū)動(dòng)生產(chǎn)力新變革論壇成功舉辦
2025-04-22 10:19:00
Rambus 通過新一代CryptoManager安全I(xiàn)P解決方案增強(qiáng)數(shù)據(jù)中心與人工智能保護(hù)
2025-04-16 10:55:15
油城算力攀“新峰” 絲路云網(wǎng)架“金橋” ——克拉瑪依市算力產(chǎn)業(yè)發(fā)展紀(jì)實(shí)
2025-04-15 10:57:00
筑AI生產(chǎn)力底座 酒仙橋論壇丨AIDC創(chuàng)新驅(qū)動(dòng)力新變革專場(chǎng)將于4月16日隆重舉行
2025-04-11 18:26:00
26億!普洛斯中國首支數(shù)據(jù)中心基金完成募集 AI驅(qū)動(dòng)算力資產(chǎn)升溫
2025-04-07 16:10:47
科智咨詢:寒冬將盡,春山可望!AI引領(lǐng)中國IDC市場(chǎng)進(jìn)入新一輪增長周期
2025-04-03 12:04:48
原創(chuàng)|中國智算中心建設(shè)“過剩論”的另一面
2025-04-02 11:38:00