“如果說(shuō)互聯(lián)網(wǎng)是一片汪洋,那么數(shù)據(jù)中心就是深藏其中的珊瑚礁生態(tài)系統(tǒng),服務(wù)器則是構(gòu)筑這個(gè)生態(tài)系統(tǒng)的基石?!?/p>
孟繁超作為北京電信資深技術(shù)專家,親身經(jīng)歷了我國(guó)從傳統(tǒng)的基礎(chǔ)運(yùn)維向云端智慧化運(yùn)營(yíng)的華麗轉(zhuǎn)身,他在北京電信親眼見證并參與這場(chǎng)有關(guān)算力的“技術(shù)革命”。
2024年4月20日,我國(guó)正式接入互聯(lián)網(wǎng)30周年。這30年來(lái),互聯(lián)網(wǎng)技術(shù)由簡(jiǎn)單的網(wǎng)頁(yè)搜索,發(fā)展到復(fù)雜的大數(shù)據(jù)處理、人工智能應(yīng)用;算力領(lǐng)域?qū)崿F(xiàn)了從單機(jī)計(jì)算到云計(jì)算、邊緣計(jì)算的跨越;核心網(wǎng)建設(shè)經(jīng)歷了從窄帶通信到寬帶網(wǎng)絡(luò)、從2G到5G的飛躍;物聯(lián)網(wǎng)從最初的簡(jiǎn)單連接,到現(xiàn)在的智能感知、遠(yuǎn)程控制,發(fā)展日新月異,滲透到智能家居、智慧交通、智慧農(nóng)業(yè)等方方面面。
圖:中國(guó)電信永豐數(shù)據(jù)中心,同時(shí)也是北京人工智能公共算力平臺(tái)永豐節(jié)點(diǎn)。
從厚重的物理網(wǎng)元,邁向靈動(dòng)的云端之旅
寂靜無(wú)聲的機(jī)房里,只有機(jī)器運(yùn)轉(zhuǎn)的微弱嗡鳴和冷氣流動(dòng)的聲音相伴,技術(shù)人員手持手電筒和檢測(cè)工具,穿梭在宛如迷宮般的機(jī)柜走廊間。
他們逐一檢查每臺(tái)服務(wù)器的指示燈狀態(tài)、溫度讀數(shù)以及網(wǎng)絡(luò)設(shè)備的鏈路狀況……這是早期現(xiàn)場(chǎng)維護(hù)的工作場(chǎng)景。
圖:中國(guó)電信永豐數(shù)據(jù)中心內(nèi)部服務(wù)器機(jī)架鱗次櫛比。
孟繁超曾是中國(guó)電信永豐數(shù)據(jù)中心的一位技術(shù)工程師,“那個(gè)時(shí)代,機(jī)柜中的網(wǎng)絡(luò)設(shè)備如同互聯(lián)網(wǎng)的神經(jīng)中樞,每一次故障都可能導(dǎo)致整個(gè)業(yè)務(wù)的癱瘓。”徹夜保持待命狀態(tài),已經(jīng)是技術(shù)工程師們的家常便飯。
網(wǎng)元,這個(gè)詞,既熟悉又陌生。據(jù)孟繁超介紹,“網(wǎng)元就是網(wǎng)絡(luò)設(shè)備,一種網(wǎng)絡(luò)單元”,運(yùn)營(yíng)商在這變革的30年,其角色從維護(hù)物理網(wǎng)元,到提供賦能千行百業(yè)的云服務(wù),再到聚焦人工智能、大模型等的算力服務(wù),實(shí)現(xiàn)“數(shù)智化”華麗轉(zhuǎn)型。
2015年,我國(guó)云計(jì)算產(chǎn)業(yè)規(guī)模高速增長(zhǎng),產(chǎn)業(yè)格局重新洗牌。北京電信積極落實(shí)中國(guó)電信發(fā)展戰(zhàn)略,在云計(jì)算領(lǐng)域政務(wù)、教育、金融、醫(yī)療和園區(qū)方面迅速發(fā)力。
“隨著云計(jì)算技術(shù)的逐漸成熟,云基礎(chǔ)設(shè)施提供商開始嶄露頭角,為企業(yè)提供了更加靈活、高效的IT基礎(chǔ)設(shè)施服務(wù)?!卑戏背趦?nèi)的技術(shù)人員也順應(yīng)技術(shù)發(fā)展的潮流,積極參與到平臺(tái)的自動(dòng)化運(yùn)維工作中。北京電信緊隨技術(shù)發(fā)展步伐,通過(guò)云平臺(tái)的自動(dòng)化運(yùn)維能力,實(shí)現(xiàn)快速部署、彈性擴(kuò)展和故障恢復(fù),提高了運(yùn)維效率和可靠性。
以“特殊的學(xué)習(xí)方式”,直面大模型的挑戰(zhàn)
技術(shù)的變革永不停歇。2023年,隨著ChatGPT的橫空出世,全球掀起了AI大模型熱潮,北京電信也接下了大模型的“挑戰(zhàn)書”。
“從傳統(tǒng)的網(wǎng)絡(luò)運(yùn)維到擁抱開源、熟悉IT和敏捷開發(fā)的轉(zhuǎn)變,是一段充滿挑戰(zhàn)和成長(zhǎng)的歷程。我最大的挑戰(zhàn)之一是適應(yīng)新的工作方式和技術(shù)。需要不斷更新知識(shí),學(xué)習(xí)新的技能,以確保自己跟上行業(yè)發(fā)展的步伐?!泵戏背v到自己在大模型時(shí)代面臨的挑戰(zhàn)。
面對(duì)新技術(shù)的挑戰(zhàn),孟繁超有自己“特殊的學(xué)習(xí)方式”——在使用中學(xué)習(xí)。通過(guò)使用生成式大模型,了解其中蘊(yùn)涵的技術(shù)邏輯,找出應(yīng)用中存在的契機(jī),并不斷探索如何將其更好地應(yīng)用于實(shí)際業(yè)務(wù)中。“基于大規(guī)模語(yǔ)料庫(kù)的生成式大模型有時(shí)會(huì)產(chǎn)生看似真實(shí),但實(shí)際上是錯(cuò)誤的或不存在的信息?!?/p>
在孟繁超等專家團(tuán)隊(duì)的努力下,北京電信積極擁抱人工智能大模型時(shí)代,按照首都“2+15+N”人工智能算力布局規(guī)劃要求,加快打造數(shù)網(wǎng)協(xié)同、數(shù)云協(xié)同、云邊協(xié)同、綠色智能的多層次算力設(shè)施體系,滿足大數(shù)據(jù)大算力需求。
截至目前,北京電信已經(jīng)建成并運(yùn)營(yíng)了24 個(gè)數(shù)據(jù)中心,京津冀智能算力中心、北京人工智能公共算力平臺(tái)永豐節(jié)點(diǎn)及各邊緣與專屬智算節(jié)點(diǎn),推進(jìn)構(gòu)建“1+1+X”的算力布局,積極打造京內(nèi)“1ms”、京津冀“3ms”的低時(shí)延、大帶寬、高可靠智能算力體系。
產(chǎn)生顛覆性變革 網(wǎng)絡(luò)運(yùn)維模式躍遷
“‘技多不壓身’是我從業(yè)多年感受最深的一個(gè)詞,我感覺自己的技能遠(yuǎn)遠(yuǎn)不夠?!泵鎸?duì)互聯(lián)網(wǎng)技術(shù)“翻天覆地”的創(chuàng)新變革,孟繁超如是說(shuō)。
“從開始接觸算力維護(hù)那一刻起,我深刻地感受到創(chuàng)新竟發(fā)生得如此神奇和頻繁,我所接觸的硬件、協(xié)議及軟件都產(chǎn)生了顛覆性變革?!泵戏背a(bǔ)充道,“對(duì)于運(yùn)營(yíng)商來(lái)說(shuō),變化最大的還是網(wǎng)絡(luò)的迭代更替?!?/p>
從專業(yè)角度,傳統(tǒng)的網(wǎng)絡(luò)運(yùn)維模式主要依賴于基于TCP/IP協(xié)議的網(wǎng)絡(luò)架構(gòu),需要進(jìn)行大量的配置和管理工作,同時(shí)存在一定的延遲和性能瓶頸。而在智算場(chǎng)景中,RDMA(遠(yuǎn)程直接數(shù)據(jù)存?。┚W(wǎng)絡(luò)被大量應(yīng)用,打破了這種傳統(tǒng)的網(wǎng)絡(luò)技術(shù)架構(gòu),可以直接在網(wǎng)絡(luò)適配器之間進(jìn)行數(shù)據(jù)傳輸,避免了CPU的參與,降低了數(shù)據(jù)傳輸?shù)难舆t和負(fù)載,從而提高了網(wǎng)絡(luò)通信的效率和性能。
圖:北京電信用于機(jī)房巡檢5G四足AI智能“機(jī)器狗”,具備自主巡航能力。
如今,穿梭在北京電信機(jī)房巡檢的,已經(jīng)變成AI智能巡檢“機(jī)器狗”。正如孟繁超所言:“未來(lái),所有的互聯(lián)網(wǎng)軟件應(yīng)用都將被重構(gòu),都將擁抱大模型!”對(duì)于北京電信來(lái)說(shuō),立足于創(chuàng)新驅(qū)動(dòng),深化云網(wǎng)融合,提升算力服務(wù)效能,勢(shì)必是在新的征程中加快數(shù)字中國(guó)建設(shè)、推進(jìn)中國(guó)式現(xiàn)代化的必然選擇。