LWN:6.6合并窗口的前半部分!
关注了就能看到更多这么棒的文章哦~
The first half of the 6.6 merge window
By Jonathan Corbet
August 31, 2023
ChatGPT assisted translation
https://lwn.net/Articles/942954/
截至目前,已经有4588个non-merging changset合并到了6.6内核版本的mainline 仓库中。换句话说,6.6合并窗口刚刚开始。尽管如此也已经合并了相当多的重要改动,因此现在是总结迄今为止在这个开发周期中发生的事情的时候了。
迄今为止为6.6合并的值得关注的改动有:
Architecture-specific
-
PA-RISC架构增加了just-in-time BPF编译器。
Core kernel
-
/sys/devices/system/cpu/smt/control 这个开关目前为止只能接受两个值:on 表示启用 simultaneous multithreading("超线程 hyperthreading"),或off表示禁用。现在增强之后还可以接受一个数字,表示每个core上可以支持的线程数。这个功能首先将被PowerPC架构使用,该架构中的某些CPU可以运行多达16个线程。
-
最早合格虚拟截止时间优先(EEVDF, earliest eligible virtual deadline first)这个CPU调度程序已经合并;它应该可以在提供更好的性能和公平性的同时,减少对脆弱的启发式规则的依赖。merge message里指出,某些工作负载下可能会出现极少见的性能下降,开发者正在努力解决这些问题。
Filesystems and block I/O
-
mount API有了一个新flag名为FSCONFIG_CMD_CREATE_EXCL,如果这个flag存在的话,就可以避免两个mmount在kernel里共用同一个superblock。如commit message中所解释的,superblock共享可能会导致mount选项被忽略,从而可能导致安全问题。做这个工作的目的是启用mount命令的新增的 –exclusive标志,以便管理员可以要求不允许进行superblock共享。
-
虚拟文件系统(VFS)层现在支持文件拥有更细粒度的时间戳了。正如这篇文章所描述的,这些时间戳允许像NFS这样的文件系统可以快速检测到发生了更改,以便正确地管理缓存,同时又最小化对时间戳维护的开销。目前,细粒度时间戳在Btrfs、ext4、tmpfs和XFS文件系统中都支持。
-
tmpfs文件系统增加了许多功能,包括quota支持、user extended attributes、direct I/O和stable directory offsets(用来修复通过NFS export的文件系统的问题)。
-
内核将不再允许更改符号链接的权限。
-
添加了fchmodat2()系统调用。当前版本支持flags参数,这根flags被定义为fchmodat()的一部分,但从未在Linux中得到支持。这个新的系统调用将使一些必备功能在C库实现中的一些hack方法可以被移除了。merge message描述了目前支持的flags。
-
erofs文件系统增加了一个bloom filter,加速了negative extended-attribute 的查找,并且支持了Deflate压缩算法。
-
XFS文件系统已经能够在page cache中使用folio,也进行了一些相关的优化,这些应该能显著提高某些工作负载的性能。
-
现在可以构建一个没有buffer-head功能的内核,尽管这会导致可用的文件系统数量大大减小。这是为了继续努力摆脱内核中对buffer-head的使用,至少大幅减少使用它的地方。
-
ublk用户空间block驱动程序已经获得(尚未有文档的)对zoned-storage设备的支持。
Hardware support
-
GPIO和引脚控制:ADI DS4520基于I2C的GPIO扩展器。
-
硬件监控:瑞萨HS3001湿度和温度传感器。
-
杂项:龙芯SPI控制器和Cirrus Logic CS42L43 SPI控制器。
-
网络:Broadcom ASP 2.0以太网控制器,Marvell 88Q2XXX PHY,以及TI PRU ICSS工业以太网外围设备。
-
稳压器:高通REFGEN电压稳压器,ADI MAX77857/MAX77831稳压器,Richtek RTQ2208 SubPMIC稳压器,以及Awinic AW37503双输出电源稳压器。
Miscellaneous
-
内核已经升级到Rust 1.71.1和bindgen 0.65.1。底层的工具程序有许多改动;相关的详细信息请参见merge message。
Networking
-
AF_XDP地址族(address family)已经具备处理存储在多个缓冲区中的数据包的能力;相关的changelog和文档改动中有关于其工作原理的详细信息。
-
新增一个BPF hook用于进行数据包重组(defragment),从而更容易查看(和过滤)完整的数据包;相关的merge message有更多信息。
-
新增一个BPF hook(update_socket_protocol)用来让BPF程序更改新建socket所请求的协议。其主要使用场景似乎是用来透明地修改TCP连接的程序为使用multipath TCP。MPTCP也添加了对将数据包路由到不同subflow的BPF程序的初步支持。
-
io_uring子系统已部分支持网络操作,尽管完整的功能需要等待6.7周期。
security-related
-
seccomp()系统调用新增了一个标志(SECCOMP_USER_NOTIF_FD_SYNC_WAKE_UP),表示将同步处理来自受监视的进程的event;这可以让内核更有效地来调度这两个进程。
-
kmalloc()随机性patch已合并。这项工作在内存分配中添加了一些熵,让对系统的攻击变得更加困难。
-
SELinux子系统,以前称为"NSA SELinux",已经"去掉了品牌"。"尽管NSA是最初的主要开发者并继续帮助维护SELinux,但SELinux早已变成了拥有广泛的开发者和维护者社区"。
Virtualization and containers
-
userfaultfd()系统调用新增了一个操作,UFFDIO_POISON,可以将page标记为受污染状态(poisoned)。使用场景是在虚拟机迁移过程中;如果旧系统上的内存页面已损坏(因此"受污染"),则可以使用userfaultfd()在新系统上保留该标记。
Internal kernel changes
-
"kunit"单元测试框架现在可以运行Rust documentation test。
-
Frontswap机制于2010年添加到内核中。到了2023年,它被彻底移除了。
-
struct ptdesc patch 已被合并。它们将struct page的page-table相关的字段拆分为一个独立结构,从而继续进行拆分struct page的各种用途的大业。
-
合并了一项internal symbol处理的改动,使专有模块(proprietary module)更难绕过GPL-only符号的限制。
-
dynamic software I/O TLB系列patch已被合并,为因一些原因需要使用bounce buffering 机制的设备提供更好的支持。
6.6合并窗口预计将保持开放,直到9月10日,之后开发社区将花费七八周来稳定所有这些工作。和往常一样,LWN将在合并窗口关闭后继续补上相关信息。
全文完
LWN 文章遵循 CC BY-SA 4.0 许可协议。
长按下面二维码关注,关注 LWN 深度文章以及开源社区的各种新近言论~