Step-2 mini：AI 語言模型的性價(jià)比新寵

AI百科 2025-01-23 09:18:53 奇想AI導(dǎo)航網(wǎng)

一、Step-2 mini 的基本介紹

2025 年 1 月 20 日，階躍星辰推出 Step-2 mini，它是 Step-2 系列語言模型的新品。參數(shù)量小但性價(jià)比高，僅用 3% 左右的參數(shù)量就保有 Step-2 80% 以上的性能。
計(jì)算處理速度快，輸入 4000tokens 時(shí)平均首字時(shí)延僅 0.17 秒。定價(jià)親民，輸入 1 元 / 百萬 token，輸出 2 元 / 百萬 token。

技術(shù)架構(gòu)上，采用自主研發(fā)的新型注意力機(jī)制架構(gòu) MFA 及其變體 MFA-Key-Reuse，相比常用的 MHA 架構(gòu)，節(jié)省近 94% 的 KV 緩存開銷，推理速度更快，成本更低，在對響應(yīng)速度要求高的場景優(yōu)勢明顯。

二、Step-2 mini 的相關(guān)介紹

Step-2 mini 源于強(qiáng)大的 Step-2 語言模型，Step-2 于 2024 年表現(xiàn)出色，在指令遵從能力方面，在 LiveBench 的 IFAverage 測試中位列全球第五。
Step-2 采用的 MoE 架構(gòu)通過選擇性激活部分專家網(wǎng)絡(luò)提升性能和計(jì)算效率。階躍星辰選擇從頭開始訓(xùn)練的策略，雖難度大、資源投入高，但能提升模型性能上限。
Step-2 mini 繼承了 Step-2 的優(yōu)秀特質(zhì)，并在參數(shù)量、性價(jià)比、生成速度等方面改進(jìn)優(yōu)化，MFA 架構(gòu)與 MoE 架構(gòu)分別在推理速度和整體性能上做出貢獻(xiàn)。

三、Step-2 mini 的應(yīng)用場景

（一）文本生成相關(guān)應(yīng)用

可用于快速生成文字內(nèi)容的場景，如撰寫新聞簡訊、商業(yè)文案、創(chuàng)意寫作等。

（二）交互領(lǐng)域

適用于智能聊天機(jī)器人開發(fā)或優(yōu)化，如小型在線客服、社交聊天 APP、在線教育平臺(tái)的智能答疑等。

（三）作為基礎(chǔ)模塊協(xié)助其他系統(tǒng)

可嵌入其他軟件系統(tǒng)或工作流程，如自動(dòng)化文檔處理、智能寫作輔助工具、代碼批注生成等。

四、Step-2 mini 的使用方式

用戶可在階躍星辰開放平臺(tái)調(diào)用其 API 接口使用，按規(guī)定輸入數(shù)據(jù)并接收輸出，輸入按 1 元 / 百萬 token 計(jì)費(fèi)，輸出按 2 元 / 百萬 token 付費(fèi)。使用時(shí)要合理評(píng)估輸入任務(wù)，參考官方開發(fā)文檔掌握準(zhǔn)確方法。

五、Step-2 mini 的優(yōu)缺點(diǎn)

（一）優(yōu)點(diǎn)

性價(jià)比高
適合預(yù)算有限的小型企業(yè)、創(chuàng)業(yè)團(tuán)隊(duì)和個(gè)人開發(fā)者，以低成本獲得較好的語言處理能力。
生成速度快
在實(shí)時(shí)性要求高的場景如實(shí)時(shí)聊天和新聞編寫中表現(xiàn)出色，能及時(shí)回復(fù)和快速出稿。
推理成本低
采用的架構(gòu)節(jié)省 KV 緩存開銷，降低計(jì)算開銷，能應(yīng)對更多交互請求。

（二）缺點(diǎn)

參數(shù)量有限帶來的性能局限
處理高度復(fù)雜和深度推理任務(wù)時(shí)可能吃力，如復(fù)雜學(xué)術(shù)研究論文創(chuàng)作。
可能不太適合大規(guī)模深度定制
相對緊湊的結(jié)構(gòu)和性能設(shè)定，可能不適合企業(yè)級(jí)大型定制項(xiàng)目。