EC2 Graviton Windows 11 ARM ENA 网卡性能实测
EC2 Graviton Windows 11 ARM ENA 网卡性能实测
Graviton 实例跑 Windows 11 ARM 用的是 AWS ENA ARM64 驱动,而这个驱动目前只有一个版本(2.2.1)。它能跑满 t4g.large 的网络突发上限吗?本文用 iperf3 做了完整吞吐测试。
测试环境
| 项目 | 配置 |
|---|---|
| 被测实例 | t4g.large(2 vCPU / 8 GB),Windows 11 Pro 25H2 ARM64 |
| ENA 驱动 | AWS ENA ARM64 2.2.1.65(ena.inf) |
| 链路速度 | 25 Gbps(ENA 报告值) |
| 对端实例 | t4g.medium,Amazon Linux 2023 aarch64(同子网) |
| 测试工具 | iperf3 3.21(Windows x64 版,模拟层运行) |
t4g.large 网络规格:Up to 5 Gbps(突发)。
ENA ARM64 驱动现状
AWS 提供的 ENA Windows 驱动分两个架构:
- x64:最新版本 2.11.0(2025-07),持续更新
- ARM64:只有 2.2.1.A(2024-05 发布),此后无更新
ARM64 驱动没有升级路径,不要尝试装 x64 版本(内核驱动不走模拟层,无法加载)。2.2.1.65 已经是 ARM64 唯一可用版本。
测试结果
TCP 吞吐
| 场景 | 方向 | 吞吐 | 重传 |
|---|---|---|---|
| 单流 TCP | 上传(Win → Linux) | 4.63 Gbps | — |
| 4 流并行 | 上传(Win → Linux) | 4.72 Gbps | — |
| 单流 TCP | 下载(Linux → Win) | 3.61 Gbps | 0 |
| 4 流并行 | 下载(Linux → Win) | 3.78 Gbps | 1 |
UDP
| 场景 | 方向 | 吞吐 | 丢包率 | Jitter |
|---|---|---|---|---|
| UDP 1G 目标 | 上传 | 378 Mbps | 0% | 0.081 ms |
| UDP 5G 目标 | 上传 | 385 Mbps | 0% | 0.066 ms |
分析
TCP 上传接近上限:单流 4.63 Gbps、4 流 4.72 Gbps,达到 t4g.large 的 5 Gbps 突发上限的 92-94%。单流即可接近打满,说明 TCP offload(checksum、segmentation)正常工作。
TCP 下载低约 20%:下载方向 3.61-3.78 Gbps,可能原因是接收路径 CPU 开销更大、对端 t4g.medium 基线更低、或 ENA ARM64 2.2.1 的 RSS 支持不如新版 x64 驱动成熟。实际生产场景 3.6 Gbps 接收带宽已经很充足。
UDP 被测试工具限制:UDP 只跑到 ~385 Mbps 不是驱动问题——iperf3 是 x64 模拟运行,UDP 发包是纯用户态操作(不像 TCP 有内核 offload),单线程发包性能受 CPU + 模拟层双重限制。零丢包和极低 jitter(0.066 ms)说明网络路径没有问题。
测试命令
对端 Linux 启动 iperf3 server:
sudo dnf install -y iperf3
iperf3 -s -p 5201被测 Windows 端执行:
# 单流上传(30 秒)
iperf3.exe -c <server-ip> -p 5201 -t 30 -i 5
# 4 流并行上传
iperf3.exe -c <server-ip> -p 5201 -t 30 -i 5 -P 4
# 单流下载(反向)
iperf3.exe -c <server-ip> -p 5201 -t 30 -i 5 -R
# 4 流并行下载
iperf3.exe -c <server-ip> -p 5201 -t 30 -i 5 -P 4 -R
# UDP 测试
iperf3.exe -c <server-ip> -p 5201 -u -b 1G -t 30 -i 5
iperf3.exe -c <server-ip> -p 5201 -u -b 5G -t 30 -i 5结论
ENA ARM64 驱动 2.2.1.65 在 Graviton2 + Windows 11 ARM 上的网络性能:
- TCP 上传:4.63-4.72 Gbps,达到突发上限的 92-94%
- TCP 下载:3.61-3.78 Gbps,满足大多数工作负载
- UDP:零丢包、低 jitter,网络质量优秀
- 重传几乎为零:连接质量优秀
驱动版本虽老(2.2.1,x64 已到 2.11.0),但在 t4g.large 的网络配额范围内不构成瓶颈。如果 AWS 后续发布更高版本的 ARM64 ENA 驱动(更多 RSS 队列、更优中断合并),接收方向性能可能还有提升空间。
注意事项
- burst vs baseline:t4g 是突发实例,长时间高带宽传输会消耗 network burst credit。30 秒测试期间 credit 充足,持续跑会回落到基线(约 0.5-1 Gbps)。
- iperf3 无 ARM64 Windows 版:TCP offload 在内核态完成,模拟层不影响 TCP 吞吐结论。但 UDP 结论需注意测试工具限制。
- 不要装 x64 ENA 驱动:内核驱动不走模拟层,会直接加载失败导致实例不可达。
