Step-2 mini:AI 語言模型的性價(jià)比新寵
一、Step-2 mini 的基本介紹
2025 年 1 月 20 日,階躍星辰推出 Step-2 mini,它是 Step-2 系列語言模型的新品。參數(shù)量小但性價(jià)比高,僅用 3% 左右的參數(shù)量就保有 Step-2 80% 以上的性能。計(jì)算處理速度快,輸入 4000tokens 時(shí)平均首字時(shí)延僅 0.17 秒。定價(jià)親民,輸入 1 元 / 百萬 token,輸出 2 元 / 百萬 token。
技術(shù)架構(gòu)上,采用自主研發(fā)的新型注意力機(jī)制架構(gòu) MFA 及其變體 MFA-Key-Reuse,相比常用的 MHA 架構(gòu),節(jié)省近 94% 的 KV 緩存開銷,推理速度更快,成本更低,在對響應(yīng)速度要求高的場景優(yōu)勢明顯。

二、Step-2 mini 的相關(guān)介紹
Step-2 mini 源于強(qiáng)大的 Step-2 語言模型,Step-2 于 2024 年表現(xiàn)出色,在指令遵從能力方面,在 LiveBench 的 IFAverage 測試中位列全球第五。
Step-2 采用的 MoE 架構(gòu)通過選擇性激活部分專家網(wǎng)絡(luò)提升性能和計(jì)算效率。階躍星辰選擇從頭開始訓(xùn)練的策略,雖難度大、資源投入高,但能提升模型性能上限。
Step-2 mini 繼承了 Step-2 的優(yōu)秀特質(zhì),并在參數(shù)量、性價(jià)比、生成速度等方面改進(jìn)優(yōu)化,MFA 架構(gòu)與 MoE 架構(gòu)分別在推理速度和整體性能上做出貢獻(xiàn)。
三、Step-2 mini 的應(yīng)用場景
(一)文本生成相關(guān)應(yīng)用
可用于快速生成文字內(nèi)容的場景,如撰寫新聞簡訊、商業(yè)文案、創(chuàng)意寫作等。
(二)交互領(lǐng)域
適用于智能聊天機(jī)器人開發(fā)或優(yōu)化,如小型在線客服、社交聊天 APP、在線教育平臺(tái)的智能答疑等。
(三)作為基礎(chǔ)模塊協(xié)助其他系統(tǒng)
可嵌入其他軟件系統(tǒng)或工作流程,如自動(dòng)化文檔處理、智能寫作輔助工具、代碼批注生成等。
四、Step-2 mini 的使用方式
用戶可在階躍星辰開放平臺(tái)調(diào)用其 API 接口使用,按規(guī)定輸入數(shù)據(jù)并接收輸出,輸入按 1 元 / 百萬 token 計(jì)費(fèi),輸出按 2 元 / 百萬 token 付費(fèi)。使用時(shí)要合理評(píng)估輸入任務(wù),參考官方開發(fā)文檔掌握準(zhǔn)確方法。
五、Step-2 mini 的優(yōu)缺點(diǎn)
(一)優(yōu)點(diǎn)
-
性價(jià)比高
適合預(yù)算有限的小型企業(yè)、創(chuàng)業(yè)團(tuán)隊(duì)和個(gè)人開發(fā)者,以低成本獲得較好的語言處理能力。 -
生成速度快
在實(shí)時(shí)性要求高的場景如實(shí)時(shí)聊天和新聞編寫中表現(xiàn)出色,能及時(shí)回復(fù)和快速出稿。 -
推理成本低
采用的架構(gòu)節(jié)省 KV 緩存開銷,降低計(jì)算開銷,能應(yīng)對更多交互請求。
(二)缺點(diǎn)
-
參數(shù)量有限帶來的性能局限
處理高度復(fù)雜和深度推理任務(wù)時(shí)可能吃力,如復(fù)雜學(xué)術(shù)研究論文創(chuàng)作。 -
可能不太適合大規(guī)模深度定制
相對緊湊的結(jié)構(gòu)和性能設(shè)定,可能不適合企業(yè)級(jí)大型定制項(xiàng)目。