汽車行業是最先享受智能制造紅利的高端制造業之一,其中,新能源汽車在雙碳背景下增長勢頭尤為強勁。據國家統計局數據,2023年我國新能源產銷分別完成958.7萬輛和949.5萬輛,在整體年度市場中占比達到31.6%,同比增長速度達到37.9%。
廣袤的前景、飚速的增長,也讓新能源車廠走在了智能制造前列。四年前,數據要素被正式列為新型生產要素,如今,它已成為組成智能制造、守護安全生產的要塞之地。汽車相較于一般制造業,有著一套更嚴苛、更精密的標準,而車規級的數據安全也需要更加更高級別的冗余與容錯來防護。在位于深圳的國內某知名新能源汽車主機廠,正攜手研華開展一場新能源汽車的“數據保衛戰”。
停產、宕機、斷線,汽車生產之痛知多少
我們知道工業數據的特殊性就在于它與生產現場息息相關:時序性、準確性、閉環性……牽一發而動全身,軟件和系統如果突發停滯、宕機、數據丟失等故障,帶來的非計劃停機直接影響著實際產量、交付周期、產品質量等等,而這些對于有著高標準、嚴要求、準交付的汽車行業而言,是要堅決杜絕的。
在汽車“新四化”競爭下,汽車芯片國產化的也逐漸成為主機廠們護城河的一部分。其中,存儲芯片作為汽車主機部分的核心部件之一,在使用中扮演著保存汽車各系統數據和行使狀態的重要作用,也支撐著網聯化、智能化、共享化等豐富的應用范式。車規級芯片的生產線,當然要“車規級安全”來守護。在該新能源車廠的Flash存儲芯片生產線上,需要一套穩定的工業級容錯系統。作為汽車主機廠的核心生產線,對容錯服務器伙伴的選擇慎之又慎。它需要在主服務器發生故障時,能夠快速承接過來所有數據和應用,確保數據不丟失,關鍵任務照常進行。研華Always-On 工業級容錯服務器解決方案成為了工業物聯網產線的理想選擇。
研華容錯系統基于兩組冗余的硬件模組,通過對虛擬機的CPU狀態、內存數據、磁盤數據的實時同步,保障了兄余單元雙活同步運行。當主機節點發生硬件故障時,業務可無縫切換至備機節點,磁盤和內存數據不丟失,業務持續不間斷運行。高可靠工業級平臺確保關鍵數據99.999%安全保護。
據項目負責人介紹,這條Flash存儲芯片生產線從生產出來到集成主機、到汽車裝配出廠以及消費者使用,每一顆芯片要履行很長的生命周期,因此車廠就需要將芯片的生產過程數據進行收錄,這是芯片出廠前的質量管理必要步驟,也是未來2-3年甚至更長時間質量追溯的來源。從這個角度來說,該芯片產線上任何一個關鍵應用的“差之毫厘”,都可能為以后汽車追溯的“失之千里”埋下隱患。為了滿足車規級數據鏈的完整性,研華的容錯服務器解決方案在技術精度下足功夫:秒級切換、完整備份、異地保護。
秒級切換,零中斷感
如上文所說,研華容錯服務器基于對產線設備實時的監測工作,為現場織就了一張平行于主服務器的“保險網”。研華單臺服務器可控制100多臺設備,在容錯模式下,當故障一旦發生,觸發容錯引擎,備用服務器可在一秒內接管主服務器上所有的重要應用,保證了任務的連續性,對使用者來說幾乎完全沒有“中斷感”。
事實上,該車廠對網絡延時的耐受值的要求是不超過30毫秒,而研華容錯服務器部署后實際延時約在20毫秒左右,遠遠超出業內平均水平,達成了該產線實現極致容錯的期望。
-完整備份,一鍵修復
秒級接管的硬實力意味著更少的數據丟失,這對故障前后完整數據鏈的修復工作大有裨益。汽車芯片生產對數據連續性的要求頗高,如何讓備份服務器遷回主服務器后達到近乎“無痕修復”?研華負責人介紹道,相比較傳統的雙機熱備技術,研華容錯方案對各級數據的保存都進行了升級。例如,傳統冗余只能保護到磁盤/硬盤中的數據,而研華可以保護到保全到內存的運行數據,這將是復原某項重要應用的數據連續性的關鍵,而容錯級別的精益求精才能更好地滿足了汽車芯片生產的合規性。
-異地部署,分攤風險
此外,為了保證“災備”工程自身的安全,研華還考慮到主、備服務器因突發事件同時受到影響的極端情況,例如地震、供電不穩導致的局部大范圍斷電/斷網。對此,研華容錯服務器還支持兩臺服務器異地部署一公里范圍內,通過光纖直連的方式將小概率風險因素進行物理隔離,進一步保證了災備工程的高可用性。
提質-降本-增效,為產線節能增效提供安全數據保護!
在大型的數字化項目的考量上,除了技術能力,企業最看重的還有綜合成本。所謂綜合成本,就是與隨著容錯服務器方案投入的前期上線成本以及后續維護一系列人力物力的投入。
在傳統的雙機熱備方案,企業需要在主、備兩臺服務器上分別裝載熱備軟件和操作系統,因此傳統的集群方式也需要多一份軟件授權的年費。研華方案通過底層虛擬化技術將主備服務器連接,并支持在此之上部署多個操作系統(Windows/Linux),因此軟件授權以及操作系統授權也都需要一套,長期來看研華的容錯方案可幫助客戶實現技術降本:顯性層面,直降近半的軟件授權成本;細究來看,因多操作系統耦合/切換而衍生的一系列軟件層bug、設備故障也將免除。
另一項成本需要劃分給運維階段。該車廠對服務器運維的響應度的要求很高,否則一旦備用服務器不在線+主服務器故障同時發生,整個容錯工程就等于白忙一場。研華三管齊下,從方案設計底層虛擬防護+1h技術響應+12h現場響應,來保障整個容錯服務器的高質量運維。強大的在地化服務團隊急客戶之所急,打造“車規級”標桿速度。
目前研華與該車廠的容錯服務器項目已交付兩期,在投入使用近一年的時間里,客戶實際生產的故障停機時間大大縮短,顯著提升了芯片全流程生產的數據質量,降低了軟件側與運維側的綜合成本,為整個車廠轉型升級打好了提質、降本、增效的結實基礎。接下來,雙方將繼續擴大合作規模,并與更多行業客戶、集成商伙伴一道持續探索新能源汽車的安全生產議題,以領先的容錯技術助推我國新能源汽車駛入高質量、高可靠的高速路段。