
階躍星辰 Step 3.5 Flash 榮登 OpenRouter Trending 榜首,不僅驗證了該模型作為技術黑馬在高吞吐與復雜推理場景下的強勁實力,更彰顯了其作為兼具極致性能與穩定性的實戰首選地位作為面向實時 Agent 工作流場景的模型,Step 3.5 Flash 在推理效率上表現突出,最高推理速度可達每秒 350 個 token。該模型款稀疏混合專家(MoE)架構,在保持較為精巧的1960總參數量的同時,每個 token 在處理過程中僅需激活約 110 億個參數,在保障模型性能的同時實現運行效率的優化,從而彌合前沿級智能體智能與計算效率之間的鴻溝。
在官方發布的Step 3.5 Flash Tech Report里顯示,該模型聚焦于構建智能體的精準推理能?以及快速可靠的執行效率。Step 3.5 Flash 通過交錯的 3:1 滑動窗口/全注意力機制(Sliding Window/Full Attention)和多 Token 預測(MTP-3)進行優化,以最小化多輪智能體交互的延遲和成本。為實現前沿級智能,Step 3.5 Flash 還采用了可擴展的強化學習(RL)框架,推動模型在數學、代碼和?具使用等領域持續自我提升。
Step 3.5 Flash 在智能體、編碼和數學任務中展現出卓越性能:在 IMO-AnswerBench 上達到 85.4% 的準確率,在 LiveCodeBench-v6(2024.08?2025.05)上達到 86.4%,在 τ2-Bench 上達到 88.2%,在 BrowseComp(含上下文管理)上達到 69.0%,在 Terminal-Bench 2.0 上達到 51.0%——其性能與 GPT-5.2 xHigh、Gemini 3.0 Pro 等前沿模型相當。通過重新定義效率邊界,Step 3.5 Flash 為在真實工業環境中部署復雜智能體提供了高密度基礎。
Step3.5Flash 僅1960億總參數、110億激活參數,就能做到與前沿“巨模”在推理能力、智能體能力上性能相當。

上圖:Step 3.5 Flash 僅需 110 億激活參數(1960 億 MoE 總參數)即可實現前沿級智能,性能比肩主流閉源和開源模型。
責任編輯: 江曉蓓