導(dǎo)航菜單

底層服務(wù)組件故障,專家:牽一發(fā)而動(dòng)全身

導(dǎo)讀 底層服務(wù)組件故障,專家:牽一發(fā)而動(dòng)全身作者/ IT時(shí)報(bào)見習(xí)記者 孫永會(huì)編輯/ 孫妍阿里云上熱搜了,但卻是“崩”上熱搜。

底層服務(wù)組件失效,專家:一招牽一發(fā)而動(dòng)全身

作者/IT時(shí)報(bào)實(shí)習(xí)記者孫永輝

編輯/孫艷

阿里云熱搜,卻是“崩潰”的熱搜。

阿里云一個(gè)月崩兩次

“淘寶崩了”、“釘釘崩了”、“閑魚崩了”……11月12日晚,阿里云因多個(gè)應(yīng)用出現(xiàn)故障登上熱搜榜。 該話題引發(fā)了包括知乎、小紅在內(nèi)的眾多網(wǎng)友的討論。 在數(shù)、脈脈等平臺(tái)上,關(guān)于“阿里云崩盤”的話題也層出不窮。 阿里云此前已經(jīng)發(fā)生過多次失敗,但這次影響范圍之廣實(shí)屬罕見。

阿里云實(shí)時(shí)“官方公告”處理進(jìn)度:11月12日18時(shí)14分,阿里云發(fā)布公告稱,自17時(shí)44分起,阿里云產(chǎn)品控制臺(tái)訪問及API調(diào)用出現(xiàn)異常,工程師緊急介入處理故障排除; 17點(diǎn)50分,阿里云確認(rèn)故障原因與底層服務(wù)組件有關(guān); 18時(shí)54分,公告顯示杭州、北京等地區(qū)控制臺(tái)及API服務(wù)已恢復(fù); 19時(shí)20分,公告稱工程師分批重啟組件服務(wù)。 大部分地區(qū)已恢復(fù)控制臺(tái)和API服務(wù); 截至21時(shí)11分,公告顯示,所有受影響的云產(chǎn)品均已恢復(fù)。

這并不是阿里云的第一次事故。 2018年6月,阿里云被曝重大技術(shù)故障,持續(xù)近半小時(shí); 2019年3月,發(fā)生疑似宕機(jī),影響部分互聯(lián)網(wǎng)企業(yè); 2022年12月,香港區(qū)可用區(qū)C發(fā)生大規(guī)模服務(wù)中斷,對(duì)眾多客戶的業(yè)務(wù)造成重大影響,且影響擴(kuò)大至香港可用區(qū)的EBS、OSS、RDS等云服務(wù)C... 6年內(nèi)多次發(fā)生不同程度的失敗,讓人不禁思考:阿里云還值得信賴嗎?

阿里云一個(gè)月崩兩次

01 底層服務(wù)組件故障“牽一發(fā)而動(dòng)全身”

從事發(fā)當(dāng)天第一時(shí)間發(fā)布響應(yīng)公告,到當(dāng)晚發(fā)布“云產(chǎn)品已恢復(fù)”結(jié)果,整個(gè)事件歷時(shí)3個(gè)小時(shí),影響地域范圍廣泛,如華南1號(hào)(深圳)、西南1號(hào)(深圳)等。成都)、華南3(廣州)、華東1(杭州)、華北5(呼和浩特)等,以及海外如印度(孟買)、英國(guó)(倫敦)、美國(guó)(硅谷) 、韓國(guó)(首爾)等

公司使用阿里云服務(wù)的欣蓉(化名)告訴《IT時(shí)報(bào)》記者,公司相關(guān)業(yè)務(wù)運(yùn)營(yíng)受到很大影響,她的研發(fā)同事周日“被迫”加班幾個(gè)小時(shí)。 “我覺得這次主要是因?yàn)榘⒗镌频腁K認(rèn)證異常,影響到了OSS和MQ這兩個(gè)組件,其他公司的很多服務(wù)都使用了阿里云的這兩個(gè)組件,所以當(dāng)它們被破壞的時(shí)候,就會(huì)受到牽連。” 欣榮說道。

底層服務(wù)組件在中臺(tái)中發(fā)揮著關(guān)鍵作用。 行業(yè)專家王奇(化名)告訴《IT時(shí)報(bào)》記者,阿里云本身采用的是大中臺(tái)的技術(shù)架構(gòu)。 中間平臺(tái)高度復(fù)雜、密集。 當(dāng)?shù)讓映霈F(xiàn)錯(cuò)誤時(shí),需要完成容災(zāi)切換和恢復(fù)。 難度較高。 “相當(dāng)于‘大腦’癱瘓了?!?王琪表示,目前故障雖然已經(jīng)恢復(fù),但如果在發(fā)生之前不處理好或者預(yù)防的話,隨時(shí)會(huì)再次面臨“癱瘓”。

中間平臺(tái)的故障不僅僅會(huì)發(fā)生在阿里云上。 在王奇看來,任何擁有云計(jì)算服務(wù)的公司都會(huì)有失敗的風(fēng)險(xiǎn)。

02 裁員和管理是否會(huì)成為“導(dǎo)火索”?

《IT時(shí)報(bào)》此前報(bào)道,今年5月,有關(guān)阿里巴巴裁員的消息在微博、脈脈等各大社交媒體上引發(fā)熱議。 此次裁員涉及桃田集團(tuán)、菜鳥、本地生活、云智能集團(tuán)、大文娛樂等板塊。 其中,阿里巴巴六大業(yè)務(wù)之一的阿里云智能被曝裁員約7%。 當(dāng)時(shí)阿里云回應(yīng)稱,這是公司正常的組織定位和人員優(yōu)化。

阿里云一個(gè)月崩兩次

阿里云智能人員對(duì)媒體表示:“每年公司都會(huì)進(jìn)行正常的組織崗位和人員優(yōu)化,本次人事調(diào)整將在5月份進(jìn)行,將在4月底年終獎(jiǎng)金發(fā)放完畢后啟動(dòng)。”整體優(yōu)化比例在7%左右,薪酬標(biāo)準(zhǔn)為N+1+1,未休年假、陪伴假等可打折。

據(jù)阿里巴巴第二季度業(yè)績(jī)報(bào)告顯示,截至今年6月底,阿里巴巴員工人數(shù)較3月份的235216人減少了6541人。 僅2023年上半年,阿里巴巴就裁員11065人。 阿里巴巴集團(tuán)官方微博此前回應(yīng)稱,六大事業(yè)群2023年共需要招聘1.5萬名新員工,其中學(xué)校招聘3000多人。

人們普遍認(rèn)為,裁員,尤其是高級(jí)技術(shù)人才的缺乏,可能是阿里云大規(guī)模倒閉的主要原因。 王奇還表示,維護(hù)復(fù)雜的中間平臺(tái)需要大量專業(yè)的開發(fā)和運(yùn)營(yíng)人員,而阿里云今年的裁員或多或少對(duì)此造成了影響。 此外,管理也是因素之一。

獨(dú)立分析師付亮也表示,今年阿里巴巴管理模式的重大調(diào)整可能會(huì)帶來新的管理風(fēng)險(xiǎn)。 “從管理層面,阿里巴巴全面推進(jìn)各事業(yè)群及其下屬公司的獨(dú)立性,以及各主體之間的‘公司化協(xié)議運(yùn)作’,各事業(yè)群及符合條件的公司獨(dú)立盈虧,其結(jié)果必然是各業(yè)務(wù)群集團(tuán)及公司強(qiáng)化盈利項(xiàng)目,壓縮非盈利項(xiàng)目,跨業(yè)務(wù)集團(tuán)的支持難免受到盈利目標(biāo)的影響。

阿里云一個(gè)月崩兩次

“阿里云的內(nèi)部能量正在從‘云’轉(zhuǎn)向仍處于投資期的大型AI模型?!?付亮說道。

在本月初舉行的云棲大會(huì)上,阿里云發(fā)布了大規(guī)模機(jī)器人模型解決方案,號(hào)稱將統(tǒng)一千文、統(tǒng)一萬象等基礎(chǔ)模型與阿里云物聯(lián)網(wǎng)平臺(tái)融合,將機(jī)器人知識(shí)庫問答和流程流程代碼全面融合生成、機(jī)械臂軌跡規(guī)劃、3D目標(biāo)檢測(cè)和動(dòng)態(tài)環(huán)境理解等能力可以顯著降低機(jī)器人開發(fā)門檻。 付亮認(rèn)為,阿里云高管調(diào)整、業(yè)務(wù)團(tuán)隊(duì)變動(dòng)、精力轉(zhuǎn)移等,增加了不確定性,降低了業(yè)務(wù)穩(wěn)定性。 “利潤(rùn)考核逐步降低,降低成本提高利潤(rùn),但資源配置卻減少,這是阿里云業(yè)務(wù)支撐存在隱患的重要原因。”

排版/季佳瑩

來源/《IT時(shí)報(bào)》公眾號(hào)vittimes

免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!

猜你喜歡:

最新文章: