Sglang 每日 Commit 报告

报告日期: 2026-04-19 (UTC+8)
统计时间: 2026-04-19 00:00 ~ 23:59 (UTC+8)
Commit 总数: 4


概述

昨日 main 分支共有 4 个 commit,主要涉及以下几个方面:CI 测试修复与升级、NSA 注意力内核性能优化、以及 Qwen3.5 视频处理的 bug 修复。昨日无新模型支持、无 server_args.py 新增参数、无新增环境变量。


分类总结

1. CI/CD 与测试

昨日有 2 个 commit 与 CI/CD 相关,主要是 AMD 平台测试修复和 CUDA CI 环境升级。

Commit Message 总结 PR 链接
[AMD]Fix AMD multimodal-gen-test-2-gpu timeout by adding partition for standalone test (#23130) 修复 AMD 多模态生成器 2-GPU 测试超时问题,通过添加独立测试分区来解决 PR #23130
[CI] Add per-job uv venv isolation and upgrade CI version to Cuda 13 (#23119) 为每个 CI 任务添加独立的 uv 虚拟环境隔离,并将 CI CUDA 版本升级到 13 PR #23119

2. 性能优化

昨日有 1 个 commit 涉及性能优化,针对 AMD 平台的 NSA(Nested Sparse Attention)索引器内核进行了减少和融合优化。

Commit Message 总结 PR 链接
[AMD] Reduce NSA indexer kernels (weights_proj, k-cache store kernel fusion) (#22850) 减少 AMD 平台 NSA 索引器的内核数量,将 weights_proj 和 k-cache store 内核进行融合,降低内核启动开销 PR #22850

3. Bug Fix

昨日有 1 个 bug 修复,针对 Qwen3.5 模型的视频处理。

Commit Message 总结 PR 链接
Fix Qwen3.5 video processing when passing video_data in "processor_output" format (#22431) 修复 Qwen3.5 模型在以 “processor_output” 格式传递 video_data 时的视频处理问题 PR #22431

重点关注

新增模型支持

昨日无新增模型支持的 commit。

性能优化

  • NSA 索引器内核融合(AMD): 将 weights_proj 和 k-cache store 内核进行融合,减少内核启动次数,预期在 AMD GPU 上使用 NSA 注意力时可获得性能提升。修改文件:nsa_indexer.py

Bug Fix

  • Qwen3.5 视频处理修复: 修复了当 video_data 以 “processor_output” 格式传递时的处理问题,确保 Qwen3.5 VL 模型的视频理解功能正常工作。修改文件:qwen_vl.py

server_args.py 新增参数

昨日无 server_args.py 新增参数。

新增环境变量

昨日无新增环境变量。