北美當(dāng)?shù)貢r間26日,OpenAI的獨家云服務(wù)器供應(yīng)商微軟報告稱,其北美地區(qū)的一個數(shù)據(jù)中心出現(xiàn)了“電源問題”,導(dǎo)致OpenAI旗下ChatGPT、Sora和API服務(wù)在美東時間12月26日下午發(fā)生宕機(jī)事件,并在當(dāng)天晚上9點大部分恢復(fù)上線。此次事件是本月內(nèi)ChatGPT及其相關(guān)服務(wù)的第二次大規(guī)模宕機(jī)。
下午2點左右,OpenAI發(fā)布信息稱,當(dāng)前ChatGPT、API以及Sora目前錯誤率很高,并指出問題來自“上游供應(yīng)商”。而眾所周知,ChatGPT的算力,也即數(shù)據(jù)中心服務(wù)由微軟Azure提供。
同一天,微軟報告稱,旗下數(shù)據(jù)中心出現(xiàn)“電源問題”,主要影響到北美地區(qū)用戶,Microsoft 的云游戲服務(wù) Xbox Cloud 也受到影響。兩家企業(yè)的聲明時間之巧合,不免令人聯(lián)想兩者之間的聯(lián)系。
這已經(jīng)是ChatGPT本月來第二次宕機(jī),上一次宕機(jī)的直接因素是OpenAI新品發(fā)布帶來的突發(fā)流量。頻繁宕機(jī)在某種程度上體現(xiàn)了當(dāng)前AI算力的稀缺與不穩(wěn)定性。無論是突發(fā)的用戶流量,還是電源故障,都是AI算力供給的復(fù)雜性的一部分,確保算力的穩(wěn)定、可靠、可持續(xù),依舊是算力產(chǎn)業(yè)需要面對的難題。