Hexo

Hexo

SGLang main分支每日Commit总结 - 2026-04-21
Created2026-04-22|技术笔记
SGLang main分支 Commit 总结 (2026-04-21 UTC+8)本文总结了2026年4月21日(UTC+8 0:00-24:00)期间 SGLang main分支的所有commit,共计 51个commit。 一、新模型支持昨日新增了对以下模型或模型特性的支持: Commit Message 总结 PR链接 [AMD] Fused qk rmsnorm bf16 for amd/Kimi-K2.5-MXFP4 (#23186) 为AMD GPU上的Kimi-K2.5-MXFP4模型实现fused qk rmsnorm bf16优化 #23186 [AMD] Enable MTP for GLM-5-mxfp4 model (#23219) 为GLM-5-mxfp4模型启用MTP(Multi-Token Prediction)支持 #23219 [Diffusion][CPU] Init CPU platform support for SGLang Diffusion (#20816) 为SGLang Diffusion初始化CPU平台支...
SGLang 每日 Commit 总结 (2026-04-20)
Created2026-04-21|SGLang
SGLang 每日 Commit 总结日期: UTC+8 2026-04-20 00:00 ~ 24:00分支: mainCommit 总数: 20 个 一、总体概述昨日的修改主要集中在以下几个方向: Multi platform Plugin 系统:引入了平台插件机制,支持 OOT(Out-of-Tree)平台通过插件方式接入,包括平台接口定义、插件钩子注册、server_args 默认值注入等核心基础设施。 Native gRPC 支持:添加了原生 gRPC 服务器的 proto 定义、Rust crate 脚手架以及 server_args 集成,支持环境变量控制。 StreamingSession 核心重构:将 StreamingSession 深度集成到 UnifiedRadixCache 中,包括 session 模块目录迁移和 always-on 模式。 Diffusion 模型优化:针对 diffusion 模型的图像/视频输入加载方式进行了性能优化,并对 LTX2.3 进行了代码清理。 Bugfix 和 CI 改进:修复了 DeepEP 编译超时、...
Sglang Daily Commit Report - 2026-04-19 (UTC+8)
Created2026-04-20|Sglang
Sglang 每日 Commit 报告报告日期: 2026-04-19 (UTC+8)统计时间: 2026-04-19 00:00 ~ 23:59 (UTC+8)Commit 总数: 4 概述昨日 main 分支共有 4 个 commit,主要涉及以下几个方面:CI 测试修复与升级、NSA 注意力内核性能优化、以及 Qwen3.5 视频处理的 bug 修复。昨日无新模型支持、无 server_args.py 新增参数、无新增环境变量。 分类总结1. CI/CD 与测试昨日有 2 个 commit 与 CI/CD 相关,主要是 AMD 平台测试修复和 CUDA CI 环境升级。 Commit Message 总结 PR 链接 [AMD]Fix AMD multimodal-gen-test-2-gpu timeout by adding partition for standalone test (#23130) 修复 AMD 多模态生成器 2-GPU 测试超时问题,通过添加独立测试分区来解决 PR #23130 [CI] Add per-j...
Sglang 每日 Commit 总结 (2026-04-18)
Created2026-04-19|开源项目Sglang
Sglang 每日 Commit 总结 (2026-04-18) 统计时间范围:UTC+8 2026-04-18 00:00 - 23:59提交总数:17 个 commit 总览昨日的提交涵盖了多个模块的改进,主要包括: Diffusion 模块:HunyuanVideo 性能优化、LTX-2 两阶段设备管理器、NVFP4 后端支持 模型支持:Qwen3-next 自动启用 flashinfer allreduce、MLX 平台 radix cache 支持 性能优化:MoE Triton runner 重构去重、norm dispatch 简化 Bug Fix:HiCacheFile key suffix 修复、AMD 测试修复 API 变更:合并 /get_load 到 /v1/loads、移除废弃的 double sparsity 特性 平台支持:NPU 文档更新、AMD ROCm DFLASH speculative decoding 一、新模型与新特性新增模型支持 Commit Message 总结 PR 链接 Qwen3...
SGLang 每日 Commit 总结 (2026-04-17 UTC+8)
Created2026-04-18|SGLang
统计时间范围:2026-04-17 00:00 ~ 24:00 (UTC+8)分支:mainCommit 总数:47 一、重点修改概览新模型支持 Commit Message 总结 PR 链接 [CPU] Add gemma4_rmsnorm_cpu kernel (#22842) 为 CPU 后端添加 Gemma-4 模型的 RMSNorm 内核支持 PR #22842 [CI] Adding Gemma 4 to Nightly CI (#22408) 将 Gemma-4 模型加入夜间 CI 测试 PR #22408 feat: Support MXFP4 quantized dense models on AMD CDNA2/CDNA3 GPUs (#19143) 支持 AMD CDNA2/CDNA3 GPU 上的 MXFP4 量化稠密模型(新增 petit_mxfp4 量化选项,后被 revert) PR #19143 Revert "feat: Support MXFP4 quantized dense models on...
Sglang Main Branch 每日变更总结 (2026-04-16)
Created2026-04-17|技术
Sglang Main Branch 每日变更总结日期: UTC+8 2026-04-16 (00:00 ~ 24:00)统计范围: 共 43 个 commits 一、新模型 / 模型支持昨日的提交中没有引入全新的模型,但有多项对已有模型的增强支持。 Commit Message 总结 PR 链接 [VLM] Enable per-image ViT cache and avoid TP CUDA context creation for Kimi-K2.5 (#22858) 为 Kimi-K2.5 启用逐图像 ViT 缓存,避免 TP CUDA 上下文创建,降低显存占用 PR #22858 [EPD][VLM] Support Kimi VL EPD (#22490) 为 Kimi VL 模型添加 EPD(Encode-Prefill-Decode) disaggregation 支持 PR #22490 [Bugfix] Preserve auto-detected quant_config for GLM NextN draft model ...
Sglang 每日变更总结 - 2026-04-15
Created2026-04-16|Sglang
Sglang 每日变更总结 (2026-04-15 UTC+8) 统计时间范围:2026-04-15 00:00:00 ~ 2026-04-15 23:59:59 (UTC+8)共计 26 个 commit 合并到 main 分支。 一、新功能1. Ray DataParallel 支持新增了基于 Ray 的 DataParallel(DP)和 DP Attention 支持,允许通过 Ray Engine 进行分布式部署。 Commit Message 总结 PR 链接 [Ray] Add data parallel (DP) and DP attention support to RayEngine (#21887) 新增 RayDataParallelController,用 Ray SchedulerActor 替代 multiprocessing.Process 实现 DP/DP Attention 分布式推理 PR #21887 2. Diffusion RL 训练支持为 T2I(Text-to-Image)后训练新增了完整的 RL ro...
SGLang Daily Commit Summary - 2026-04-14
Created2026-04-15|AI Framework
SGLang Main Branch Commit Summary (UTC+8 2026-04-14)统计时间范围:UTC+8 2026-04-14 00:00 至 2026-04-14 23:59(UTC 2026-04-13 16:00 至 2026-04-14 15:59) 共统计 46 个 commit。 一、新模型/新功能支持本时段新增了对多个模型和功能的支持,包括扩散模型、量化格式、存储后端等。 Commit Message 总结 PR 链接 [diffusion] model: support Ltx 2.3 two stage ti2v (#22667) 为扩散模型添加 LTX 2.3 两阶段 text-to-video 生成支持 PR #22667 [diffusion] quant: add FLUX.1-dev modelopt nvfp4 support (#22672) 为 FLUX.1-dev 模型添加 ModelOpt NVFP4 量化支持 PR #22672 [HiCache & HybridModel] ...
SGLang 每日提交总结 - 2026年4月13日
Created2026-04-14|SGLangDaily Reports
SGLang 每日提交总结 - 2026年4月13日 (UTC+8) 统计范围: 2026-04-13 00:00 ~ 23:59 (UTC+8)分支: main提交总数: 32 个 一、新模型与新功能昨日新增了 Stable Diffusion 3 和 LTX-2 相关的模型支持,以及 JIT Kernel 的 TP QK Norm 融合算子。 Commit Message 总结 PR 链接 [diffusion] model: support stable-diffusion-3-medium-diffusers (#19225) 新增 Stable Diffusion 3 Medium 模型的完整支持,包括 DiT、VAE 配置、Pipeline 和文本编码器 #19225 [Feature][JIT Kernel] Fused TP QK norm For Minimax (#20673) 为 MiniMax M2 模型新增 fused TP QK Norm 内核,优化张量并行场景下的 QK 归一化性能 #20673 [diffusion] ref...
SGLang 每日 Commit 总结 2026-04-12
Created2026-04-13|SGLang
SGLang 每日 Commit 总结日期: 2026-04-12 (UTC+8)总提交数: 22时间范围: 2026-04-12 00:00 ~ 24:00 (UTC+8) 概述昨日的 22 个 commit 主要集中在以下几个领域:Diffusion 模型支持增强(LTX2.3 两阶段、ModelOpt 量化)、性能优化(AMD GLM-5、Whisper 批量编码、Tokenizer 流式优化)、Bug 修复、LoRA MoE Marlin 后端支持、Unified Radix Cache 和 Breakable CUDA Graph 新特性、以及 CI 基础设施改进。 新模型/新功能重点内容 LTX2.3 两阶段支持: 为 Diffusion 模型 LTX2.3 添加了两阶段推理支持 ModelOpt 量化 FLUX: 启用了 ModelOpt 量化后的 FLUX 模型部署 Unified Radix Cache: 新增统一的 Radix 缓存架构,支持 Full、SWA、Mamba、Tree 等多种缓存组件 Breakable CUDA Graph: 新增可...
12
avatar
John Doe
Articles
20
Tags
11
Categories
10
Follow Me
Announcement
This is my Blog
Recent Posts
SGLang main分支每日Commit总结 - 2026-04-212026-04-22
SGLang 每日 Commit 总结 (2026-04-20)2026-04-21
Sglang Daily Commit Report - 2026-04-19 (UTC+8)2026-04-20
Sglang 每日 Commit 总结 (2026-04-18)2026-04-19
SGLang 每日 Commit 总结 (2026-04-17 UTC+8)2026-04-18
Categories
  • AI Framework1
  • SGLang6
    • Daily Reports1
  • Sglang7
  • Tech1
  • 开源项目1
    • Sglang1
  • 技术3
Tags
Sglang Commit Summary AI/LLM commit AI 每日总结 Code Review daily-summary SGLang Daily Summary Daily Report
Archives
  • April 2026 20
Website Info
Article Count :
20
Unique Visitors :
Page Views :
Last Update :
© 2025 - 2026 By John DoeFramework Hexo 8.1.1|Theme Butterfly 5.5.4