12月30日,快科技的相关报道引起了广泛关注。华为在南方工厂生产的高端存储系统,其可靠性达到了九个九的级别。这一显著成就揭示了其技术背后的秘密。基于这一成就,该系统的年度意外停机时间缩短至三秒以内。这一成就对企业存储关键数据的安全至关重要。其中蕴含着许多引人入胜的故事,值得深入挖掘。

部件级可靠性起点

华为南方工厂如何实现年意外停机不超过3秒?揭秘7个9可靠性的背后故事  第1张

华为致力于提升高端存储系统的稳定性,在组件层面进行深入优化。通过实施冗余策略,逐步提升了系统对三台磁盘故障的应对能力。同时,该策略也被应用于单个引擎或硬盘框的故障处理,增强了系统对单一设备故障的容忍度。这些可靠性措施并非一蹴而就,而是研发团队持续努力的成果,体现了电路设计的巧妙和制造流程的严格监控。这种逐步增强的可靠性设计,为达成九个九的可靠性目标打下了坚实基础。

在可靠性设计的不同阶段,众多团队与数据研究紧密协作。员工们全天候投入工作,不断进行可靠性测试。他们详尽记录数据波动情况,力求将潜在风险降到最低。这一过程对人力和物力资源的需求极大。

华为南方工厂位置

华为南方工厂如何实现年意外停机不超过3秒?揭秘7个9可靠性的背后故事  第2张

华为南方工厂如何实现年意外停机不超过3秒?揭秘7个9可靠性的背后故事  第3张

华为于东莞松山湖高新技术园区建立了其南方制造基地,该区域是高端存储产品研发的重要基地。工厂在生产数据存储设备过程中,运用了人工智能质检等先进技术,确保了产品质量的全面控制。松山湖地理位置优越,周边高新技术产业集中,人才资源丰富。这些有利条件共同为华为南方工厂生产高端存储产品创造了有利环境。

华为南方工厂如何实现年意外停机不超过3秒?揭秘7个9可靠性的背后故事  第4张

松山湖华为南方工厂洋溢着科技创新的活力。工厂内,众多先进设备井然有序、高效运作,员工职责清晰,协作紧密。科研成果得以快速转化为实际生产力。在此优越条件下,华为有望在高端存储可靠性领域取得卓越成就,前景光明。

AI质检解决方案组成

华为南方工厂如何实现年意外停机不超过3秒?揭秘7个9可靠性的背后故事  第5张

华为的AI质检系统结构新颖,由OceanStor2910计算存储系统、慧视AI质检软件和中心训练平台三个关键部分组成。这三部分紧密相连,彼此不能缺少。OceanStor2910计算存储系统具备多功能集成优势,慧视AI质检软件在多个领域扮演着重要角色,而中心训练平台则为质检流程提供了全面的技术支持。

华为南方工厂如何实现年意外停机不超过3秒?揭秘7个9可靠性的背后故事  第6张

各组件独立运作,同时相互配合。在OceanStor2910计算型存储系统中,其内置平台为慧视AI平台的稳定性提供了有力保障。慧视AI质检软件在多个终端上精确收集并传输数据,这一整体方案因而能高效执行质检任务,对达成99.999999%的可靠性目标起到了关键作用。

质检软件工作流程

华为南方工厂如何实现年意外停机不超过3秒?揭秘7个9可靠性的背后故事  第7张

慧视AI质检软件包括产线端的端侧软件以及OceanStor2910设备中集成的AI平台。该端侧软件主要职能是在工位上搜集质检所需数据,利用摄像机获取数据后,再将数据传输至AI平台。以某特定生产线为例,摄像机每秒钟持续收集数据,并确保数据的稳定上传。

AI系统在接收数据后,快速执行图像与视频的解析与处理任务,用以评估产品是否存有质量问题。该系统基于其领先的算法与模型,融合了400余项产线AI质检算法的研发与实施经验,并涉及16个类别及800余种工业操作。整个流程既遵循规范又效率高,成功实现了对质量问题的精准识别,准确率达到了99.5%。

OceanStor2910特性

OceanStor2910计算型存储设备具备多项优势。该设备融合了计算、推理、企业级存储和网络技术,体现了其卓越的集成实力,显著提升了设备间的连接速度。设备内嵌的DME和慧视AI平台,极大地简化了部署和运维流程。

华为南方工厂如何实现年意外停机不超过3秒?揭秘7个9可靠性的背后故事  第8张

该系统在可靠性方面表现出色,配备了主存储的双重控制和高级企业级功能。它能够确保达到电信标准的高可靠性,即99.9999%,从而保障生产线能够不间断、全天候稳定运行。当生产线出现需要追溯质量问题的情况时,DME系统在处理大量视频和图片的检索与管理方面表现出卓越能力,实现了百亿文件的秒级检索,其性能显著。

AI训练中心优势

华为南方工厂如何实现年意外停机不超过3秒?揭秘7个9可靠性的背后故事  第9张

AI训练中心成功采纳了大型模型分割技术,并实现了显著的成效。该技术具备单次标注或零样本标注的功能,使得标注效率平均提高了80%。这项技术革新对质检领域产生了重大影响,借助常规样本及少量未知缺陷样本,有效控制了质量风险。以华为南方工厂的新产品线为例,该技术迅速部署并大幅降低了人力成本。到2024年,南方工厂已有1500多个工位接入AI质检系统,成功避免了超过15000起质量风险事件。

华为在南方设立的生产基地致力于打造高品质的高端存储产品,这一追求将如何推动整个存储行业的发展?我们热切期待您的参与,请踊跃点赞、分享,并在评论区分享您的观点。

华为南方工厂如何实现年意外停机不超过3秒?揭秘7个9可靠性的背后故事  第10张