xAI 发布 Grok Code Fast 1,一种新的代理编码模型缩略图

xAI 发布 Grok Code Fast 1,一种新的代理编码模型

xAI 推出了grok-code-fast-1,这是一个专为代理编码工作流开发的模型。该架构从头开始构建,其预训练语料库由编程相关数据组成,后训练集则来自真实的拉取请求和实际编码任务。

该模型包括对grep等工具使用命令、终端操作和文件编辑的优化,旨在与编码环境和 IDE 顺畅集成。它还使用服务技术和快速缓存来提高响应速度,据报道,合作伙伴工作流程中的缓存命中率超过 90%。

它还支持多种编程语言,包括 TypeScript、Python、Java、Rust、C++ 和 Go。它可以处理一系列日常开发人员任务,从项目搭建和代码库查询,到在极少的监督下进行精确的错误修复。

该模型的性能基于SWE-Bench-Verified基准进行评估,使用 xAI 的内部评估套件,其得分为 70.8%。除了基准测试之外,xAI 还结合了人工评估和自动化评估来指导开发,并注重实际可用性。

为了支持快速交互,该模型使用 256 k 个令牌上下文窗口,使其能够在上下文中处理更大的代码库。在内部,它采用混合专家架构,估计有 3140 亿个参数,旨在平衡速度和编码能力。在实际使用中,吞吐量约为每秒 92 个令牌,从而能够在开发会话期间实现交互式节奏。

与其他专注于编码的大型语言模型相比,grok-code-fast-1更注重速度和与工具的集成,而非最大化基准准确率。例如,OpenAI 的o1-mini和 Anthropic 的 Claude Sonnet 3.5在某些任务上报告了更高的原始推理或编码准确率,但在快速缓存优化或吞吐量方面却不尽相同。该模型的混合专家设计在架构方面更接近 Google DeepMind 的Gemini 1.5 Pro,尽管它专门针对软件开发工作流程进行了调整。

社区反馈凸显了 Grok Code Fast 1 执行速度的诸多方面。软件开发者Eric Jiang分享道:

过去几周我一直在用这款机型,它的速度让我的工作效率有了显著提升。用起来真是太棒了!

其他评论者则转向用例和可访问性,讨论 Grok Code Fast 1 如何融入日常开发。问题主要集中在与代码编辑器和命令行工具的集成上。 

软件开发人员乔纳森·帕拉 (Jonathan Parra)指出:

不错,一直想要这样的东西,需要一个 CLI 来与 Claude Code 竞争。

可通过精选发布合作伙伴(包括GitHub CopilotCursorClineRoo CodeKilo CodeopencodeWindsurf )在有限时间内免费访问 grok-code-fast-1。xAI表示将频繁更新该模型,并指出具有多模式输入、并行工具使用和扩展上下文长度的新变体已在训练中。