Sglang Daily Commit Report - 2026-04-19 (UTC+8)
Sglang 每日 Commit 报告
报告日期: 2026-04-19 (UTC+8)
统计时间: 2026-04-19 00:00 ~ 23:59 (UTC+8)
Commit 总数: 4
概述
昨日 main 分支共有 4 个 commit,主要涉及以下几个方面:CI 测试修复与升级、NSA 注意力内核性能优化、以及 Qwen3.5 视频处理的 bug 修复。昨日无新模型支持、无 server_args.py 新增参数、无新增环境变量。
分类总结
1. CI/CD 与测试
昨日有 2 个 commit 与 CI/CD 相关,主要是 AMD 平台测试修复和 CUDA CI 环境升级。
| Commit Message | 总结 | PR 链接 |
|---|---|---|
[AMD]Fix AMD multimodal-gen-test-2-gpu timeout by adding partition for standalone test (#23130) |
修复 AMD 多模态生成器 2-GPU 测试超时问题,通过添加独立测试分区来解决 | PR #23130 |
[CI] Add per-job uv venv isolation and upgrade CI version to Cuda 13 (#23119) |
为每个 CI 任务添加独立的 uv 虚拟环境隔离,并将 CI CUDA 版本升级到 13 | PR #23119 |
2. 性能优化
昨日有 1 个 commit 涉及性能优化,针对 AMD 平台的 NSA(Nested Sparse Attention)索引器内核进行了减少和融合优化。
| Commit Message | 总结 | PR 链接 |
|---|---|---|
[AMD] Reduce NSA indexer kernels (weights_proj, k-cache store kernel fusion) (#22850) |
减少 AMD 平台 NSA 索引器的内核数量,将 weights_proj 和 k-cache store 内核进行融合,降低内核启动开销 | PR #22850 |
3. Bug Fix
昨日有 1 个 bug 修复,针对 Qwen3.5 模型的视频处理。
| Commit Message | 总结 | PR 链接 |
|---|---|---|
Fix Qwen3.5 video processing when passing video_data in "processor_output" format (#22431) |
修复 Qwen3.5 模型在以 “processor_output” 格式传递 video_data 时的视频处理问题 | PR #22431 |
重点关注
新增模型支持
昨日无新增模型支持的 commit。
性能优化
- NSA 索引器内核融合(AMD): 将 weights_proj 和 k-cache store 内核进行融合,减少内核启动次数,预期在 AMD GPU 上使用 NSA 注意力时可获得性能提升。修改文件:
nsa_indexer.py。
Bug Fix
- Qwen3.5 视频处理修复: 修复了当 video_data 以 “processor_output” 格式传递时的处理问题,确保 Qwen3.5 VL 模型的视频理解功能正常工作。修改文件:
qwen_vl.py。
server_args.py 新增参数
昨日无 server_args.py 新增参数。
新增环境变量
昨日无新增环境变量。
All articles on this blog are licensed under CC BY-NC-SA 4.0 unless otherwise stated.