11月11日,快科技带来重磅消息:英特尔Linux内核性能显著增强,成为科技领域关注的焦点。Phoronix报道称,英特尔测试结果显示,主线Linux内核性能提升了3888.9%,这一数据令人震撼。这一成绩凸显了内核性能的显著改善。

性能提升明显的测试

英特尔 Linux 内核性能竟提升 3888.9%,背后原因竟然是  第1张

在IntelXeonPlatinum(CooperLake)测试服务器上,“will-it-scale.per_process_ops”可扩展性测试用例实现了显著性能增长。该服务器在特定测试环境中,Linux内核性能提升了3888.9%。这一数据充分展示了内核在此环境下的高效性能。这种性能提升预计将对众多使用该内核的场景产生积极影响,例如加速数据处理等。

英特尔 Linux 内核性能竟提升 3888.9%,背后原因竟然是  第2张

从内核自身的角度分析,众多优化措施或许构成了推动性能提升的关键因素。这一提升结果显现了英特尔在特定测试场景下对Linux内核优化所取得的成效。

英特尔 Linux 内核性能竟提升 3888.9%,背后原因竟然是  第3张

英特尔 Linux 内核性能竟提升 3888.9%,背后原因竟然是  第4张

关键代码提交的功劳

英特尔 Linux 内核性能竟提升 3888.9%,背后原因竟然是  第5张

此次性能的显著提升,主要得益于一个关键的代码更新——“mm,mmap:限制匿名映射的THP对齐至PMD对齐大小”。这一更新对既有的运行机制产生了变革。根据补丁信息,自版本号efa7df3e3bb5起,所有未指定地址且大小至少为PMD_SIZE的匿名内存映射在mmap()操作时,均开始采用PMD对齐,从而能够从THP的底层页面中获取优势。此代码变更优化了内存处理流程,对内核性能的提升起到了决定性作用。

英特尔 Linux 内核性能竟提升 3888.9%,背后原因竟然是  第6张

在操作系统内核这一底层软件中,微小的代码变动即可带来显著的性能飞跃。此类代码经过了英特尔众多开发者的精心研究及反复测试,最终达成了令人瞩目的性能提升效果。

英特尔 Linux 内核性能竟提升 3888.9%,背后原因竟然是  第7张

部分工作负载性能下降

英特尔 Linux 内核性能竟提升 3888.9%,背后原因竟然是  第8张

然而,这一变化并非无懈可击,它导致了部分工作负载性能的下滑。以cactusBSSN基准测试为例,某些平台上的测试速度甚至下降了600%。这些问题在基准测试中显现,不容小觑。原因在于,基准测试似乎生成了大量4632kB的映射,在代码提交编号为efa7df3e3bb5之前,这些映射被合并至一个大型THP支持的区域。而现在,这些映射被分割成多个区域,且每个区域都与PMD边界对齐,这导致了中间出现间隙,进而影响了性能。

英特尔 Linux 内核性能竟提升 3888.9%,背后原因竟然是  第9张

性能的降低反映出,尽管整体性能有所提升,但某些工作负载的执行效果却呈现出相反的趋势。这一现象提示开发者,在优化内核性能时,需全面考虑,以防出现顾此失彼的情况。

英特尔 Linux 内核性能竟提升 3888.9%,背后原因竟然是  第10张

性能下降的具体情况分析

深入分析表明,原先的4632kB映射本应有效合并以提高效率。然而,现在它们已被分割,并存在间隙。尽管每个区域与PMD边界对齐看似规范,但整体上却损害了性能。在不同工作负载中,对内存映射的需求和利用存在差异。尽管本次代码提交对整体内核性能提升大有裨益,但未考虑到特定基准测试下的内存映射使用情况,导致性能显著下降。

开发者在进行代码编写时,需充分理解众多不同工作负载的具体需求。优化工作不应仅从单一角度出发,而应全面审视各种情境下的技术细节。

英特尔提出的解决方案

英特尔针对该问题提出了一项解决方案,即增设一项条件。该条件规定映射尺寸需为PMD尺寸的整数倍,而非之前规定的至少与PMD尺寸相等。此调整使得原本的odd-sizedmapping不再错位且有间隙,而是能自然地重新合并。若此方案得以顺利实施,有望提升如cactusBSSN基准测试等部分工作负载的性能表现。

英特尔在发现问题后迅速提出了解决方案,这一举措释放出积极的信号。同时,这也反映出英特尔在追求高效内核的过程中,并未忽略优化可能带来的不利影响,并且他们展现了主动采取措施进行纠正的意愿。

关于英特尔提出的解决方案,人们普遍关注其是否能够根本解决部分工作负载性能下滑的问题。我们期待着大家的积极反馈,并欢迎在评论区发表各自的观点。同时,我们也鼓励大家点赞与分享,以促进这一讨论的广泛传播。

英特尔 Linux 内核性能竟提升 3888.9%,背后原因竟然是  第11张