GLM-5.1-HighSpeed 是 GLM-5.1 的高速版本,输出速度达到 400 tokens/s。该模型仅面向智谱 BigModel 开放平台部分企业客户定向开放。
它支持 Function Call、JSON 等结构化输出和 MCP,主打低延迟场景,包括 Coding Agent、多轮代码生成、实时 UI 构建、运营问答、语音助手和实时客服等。
GLM-5.1-HighSpeed 是 GLM-5.1 的高速版本,输出速度达到 400 tokens/s。该模型仅面向智谱 BigModel 开放平台部分企业客户定向开放。
它支持 Function Call、JSON 等结构化输出和 MCP,主打低延迟场景,包括 Coding Agent、多轮代码生成、实时 UI 构建、运营问答、语音助手和实时客服等。
Previous: 字节跳动开源 3B 统一多模态模型 Lance