“如果說互聯網是一片汪洋,那么數據中心就是深藏其中的珊瑚礁生態系統,服務器則是構筑這個生態系統的基石?!?/p>
孟繁超作為北京電信資深技術專家,親身經歷了我國從傳統的基礎運維向云端智慧化運營的華麗轉身,他在北京電信親眼見證并參與這場有關算力的“技術革命”。
2024年4月20日,我國正式接入互聯網30周年。這30年來,互聯網技術由簡單的網頁搜索,發展到復雜的大數據處理、人工智能應用;算力領域實現了從單機計算到云計算、邊緣計算的跨越;核心網建設經歷了從窄帶通信到寬帶網絡、從2G到5G的飛躍;物聯網從最初的簡單連接,到現在的智能感知、遠程控制,發展日新月異,滲透到智能家居、智慧交通、智慧農業等方方面面。
圖:中國電信永豐數據中心,同時也是北京人工智能公共算力平臺永豐節點。
從厚重的物理網元,邁向靈動的云端之旅
寂靜無聲的機房里,只有機器運轉的微弱嗡鳴和冷氣流動的聲音相伴,技術人員手持手電筒和檢測工具,穿梭在宛如迷宮般的機柜走廊間。
他們逐一檢查每臺服務器的指示燈狀態、溫度讀數以及網絡設備的鏈路狀況……這是早期現場維護的工作場景。
圖:中國電信永豐數據中心內部服務器機架鱗次櫛比。
孟繁超曾是中國電信永豐數據中心的一位技術工程師,“那個時代,機柜中的網絡設備如同互聯網的神經中樞,每一次故障都可能導致整個業務的癱瘓?!睆匾贡3执鼱顟B,已經是技術工程師們的家常便飯。
網元,這個詞,既熟悉又陌生。據孟繁超介紹,“網元就是網絡設備,一種網絡單元”,運營商在這變革的30年,其角色從維護物理網元,到提供賦能千行百業的云服務,再到聚焦人工智能、大模型等的算力服務,實現“數智化”華麗轉型。
2015年,我國云計算產業規模高速增長,產業格局重新洗牌。北京電信積極落實中國電信發展戰略,在云計算領域政務、教育、金融、醫療和園區方面迅速發力。
“隨著云計算技術的逐漸成熟,云基礎設施提供商開始嶄露頭角,為企業提供了更加靈活、高效的IT基礎設施服務?!卑戏背趦鹊募夹g人員也順應技術發展的潮流,積極參與到平臺的自動化運維工作中。北京電信緊隨技術發展步伐,通過云平臺的自動化運維能力,實現快速部署、彈性擴展和故障恢復,提高了運維效率和可靠性。
以“特殊的學習方式”,直面大模型的挑戰
技術的變革永不停歇。2023年,隨著ChatGPT的橫空出世,全球掀起了AI大模型熱潮,北京電信也接下了大模型的“挑戰書”。
“從傳統的網絡運維到擁抱開源、熟悉IT和敏捷開發的轉變,是一段充滿挑戰和成長的歷程。我最大的挑戰之一是適應新的工作方式和技術。需要不斷更新知識,學習新的技能,以確保自己跟上行業發展的步伐?!泵戏背v到自己在大模型時代面臨的挑戰。
面對新技術的挑戰,孟繁超有自己“特殊的學習方式”——在使用中學習。通過使用生成式大模型,了解其中蘊涵的技術邏輯,找出應用中存在的契機,并不斷探索如何將其更好地應用于實際業務中?!盎诖笠幠UZ料庫的生成式大模型有時會產生看似真實,但實際上是錯誤的或不存在的信息?!?/p>
在孟繁超等專家團隊的努力下,北京電信積極擁抱人工智能大模型時代,按照首都“2+15+N”人工智能算力布局規劃要求,加快打造數網協同、數云協同、云邊協同、綠色智能的多層次算力設施體系,滿足大數據大算力需求。
截至目前,北京電信已經建成并運營了24 個數據中心,京津冀智能算力中心、北京人工智能公共算力平臺永豐節點及各邊緣與專屬智算節點,推進構建“1+1+X”的算力布局,積極打造京內“1ms”、京津冀“3ms”的低時延、大帶寬、高可靠智能算力體系。
產生顛覆性變革 網絡運維模式躍遷
“‘技多不壓身’是我從業多年感受最深的一個詞,我感覺自己的技能遠遠不夠?!泵鎸ヂ摼W技術“翻天覆地”的創新變革,孟繁超如是說。
“從開始接觸算力維護那一刻起,我深刻地感受到創新竟發生得如此神奇和頻繁,我所接觸的硬件、協議及軟件都產生了顛覆性變革?!泵戏背a充道,“對于運營商來說,變化最大的還是網絡的迭代更替?!?/p>
從專業角度,傳統的網絡運維模式主要依賴于基于TCP/IP協議的網絡架構,需要進行大量的配置和管理工作,同時存在一定的延遲和性能瓶頸。而在智算場景中,RDMA(遠程直接數據存?。┚W絡被大量應用,打破了這種傳統的網絡技術架構,可以直接在網絡適配器之間進行數據傳輸,避免了CPU的參與,降低了數據傳輸的延遲和負載,從而提高了網絡通信的效率和性能。
圖:北京電信用于機房巡檢5G四足AI智能“機器狗”,具備自主巡航能力。
如今,穿梭在北京電信機房巡檢的,已經變成AI智能巡檢“機器狗”。正如孟繁超所言:“未來,所有的互聯網軟件應用都將被重構,都將擁抱大模型!”對于北京電信來說,立足于創新驅動,深化云網融合,提升算力服務效能,勢必是在新的征程中加快數字中國建設、推進中國式現代化的必然選擇。