GameFactory:游戲領(lǐng)域的創(chuàng)新力量
一、GameFactory 的定義
香港大學與快手科技合作的項目中,GameFactory 于 2025 年被提出,是一個創(chuàng)新框架,旨在解決游戲視頻生成中的場景泛化難題。在傳統(tǒng)游戲開發(fā)概念里,也存在名為 The GameFactory(The Games Factory)的軟件或平臺,例如 The GameFactory 是專為游戲開發(fā)愛好者定制的軟件,The Games Factory 是多功能游戲開發(fā)工具,能助用戶在短時間內(nèi)完成游戲設(shè)計與發(fā)布。
二、不同概念下的功能
(一)作為解決游戲視頻場景泛化的框架
在游戲視頻生成領(lǐng)域,場景泛化(即創(chuàng)造新游戲場景的能力)一直是挑戰(zhàn)。盡管大規(guī)模動作標注視頻數(shù)據(jù)集可應(yīng)對,但成本高且對開放域場景不實用,GameFactory 框架應(yīng)運而生。它利用開放域視頻數(shù)據(jù)上預(yù)訓練的視頻擴散模型(從 U - Net 架構(gòu)發(fā)展到基于 Transformer 的架構(gòu),能生成更逼真、時長更長的視頻),克服現(xiàn)有方法對特定游戲數(shù)據(jù)集的依賴。
GameFactory 采用獨特的三階段訓練策略:
-
第一階段通過 LoRA 微調(diào)預(yù)訓練模型以適應(yīng)目標游戲領(lǐng)域,保留大部分原始參數(shù)。
-
第二階段凍結(jié)預(yù)訓練參數(shù)和 LoRA,專注訓練動作控制模塊,避免風格與控制糾纏。
-
第三階段移除 LoRA 權(quán)重,保留動作控制模塊參數(shù),使系統(tǒng)能在開放域場景生成受控游戲視頻。

同時,研究評估不同控制機制,發(fā)現(xiàn)交叉注意力機制處理離散控制信號優(yōu)于拼接方法,拼接方法處理連續(xù)鼠標移動信號更有效,框架支持自回歸動作控制,能生成無限長度交互式游戲視頻。研究人員還發(fā)布高質(zhì)量動作標注視頻數(shù)據(jù)集 GF - Minecraft 用于訓練和評估。

(二)作為游戲創(chuàng)作平臺(以 The GameFactory 為例)
-
圖形化編程:降低編程門檻,采用事件驅(qū)動的圖形化編程,用戶拖放操作即可確立游戲邏輯流程。
-
資源管理:內(nèi)置資源編輯器,方便導(dǎo)入和編輯圖像、聲音、動畫等素材,為游戲創(chuàng)建提供便利。
-
物理引擎:集成物理引擎,讓游戲場景更真實,如物體下落、碰撞檢測等,增強游戲真實感和互動性。
-
多層地圖編輯:支持多層地圖編輯,構(gòu)建復(fù)雜游戲空間,如設(shè)計城堡關(guān)卡時分層設(shè)置元素和機關(guān)。
-
角色與對象:提供角色和對象庫,含預(yù)設(shè)動作和行為,直接用于游戲,節(jié)省開發(fā)時間。
-
腳本支持:支持 Lua 腳本,為有經(jīng)驗開發(fā)者提供更多發(fā)揮空間,實現(xiàn)特殊技能效果等復(fù)雜功能。
三、應(yīng)用場景
(一)游戲視頻創(chuàng)作領(lǐng)域(針對 GameFactory 框架)
-
新游戲場景拓展:在游戲開發(fā)前期,GameFactory 框架能創(chuàng)造新場景,如為沙盒類游戲增加特殊地形或氣候場景,節(jié)省開發(fā)成本和時間。
-
不同游戲類型的通用場景生成:適用于多種游戲類型,生成多樣化場景,支持不同類型控制,創(chuàng)建交互式游戲視頻,提供不同體驗。
-
優(yōu)化現(xiàn)有游戲視頻:對已有游戲項目的視頻資源進行補充和優(yōu)化,如在探險游戲中增加遺跡或陷阱場景。
(二)游戲開發(fā)創(chuàng)作領(lǐng)域(以 The GameFactory 為例)
-
獨立游戲開發(fā)者的創(chuàng)作工具:為資源有限的獨立開發(fā)者提供便利,幫助制作風格獨特的 2D 街機游戲等,快速創(chuàng)建框架并優(yōu)化。
-
教育領(lǐng)域的游戲編程教學:適合作為教學工具,引導(dǎo)學生理解游戲開發(fā)概念,創(chuàng)建簡單游戲模型,如猜數(shù)字或走迷宮游戲。
-
創(chuàng)意者快速驗證游戲想法:為有創(chuàng)意的人提供快速驗證平臺,如制作寵物養(yǎng)成類游戲原型,測試和改進基本玩法邏輯。
四、發(fā)展歷程
(一)GameFactory 框架的發(fā)展
在視頻生成和游戲物理學發(fā)展的背景下,從早期的 U - Net 架構(gòu)到基于 Transformer 的架構(gòu),相關(guān)方法在相機控制方面不斷進步。
此前游戲領(lǐng)域項目如 DIAMOND、GameNGen 和 PlayGen 等存在對特定游戲和數(shù)據(jù)集過度擬合、場景泛化能力有限的問題。2025 年,香港大學和快手科技組建團隊提出 GameFactory 框架,從借鑒優(yōu)勢到設(shè)計訓練策略,再到探索控制機制和發(fā)布數(shù)據(jù)集,不斷突破游戲視頻場景生成的局限。
(二)The GameFactory(游戲開發(fā)軟件)的發(fā)展
為降低游戲編程門檻,The GameFactory 應(yīng)運而生,采用圖形化編程等方式吸引用戶。
功能不斷完善,從基礎(chǔ)資源管理到優(yōu)化物理引擎和多層地圖編輯等。社區(qū)支持也從弱到強,建立龐大用戶群,提供資源。同時優(yōu)化與不同系統(tǒng)的適配性,滿足多樣化需求。
五、同類對比(GameFactory 框架相關(guān)對比)
(一)DIAMOND、GameNGen 和 PlayGen 等項目
-
場景泛化能力:這些項目存在對特定游戲和數(shù)據(jù)集過度擬合的問題,GameFactory 利用預(yù)訓練模型和獨特訓練策略,實現(xiàn)多樣化新場景生成。
-
對已有技術(shù)的依賴:早期項目依賴特定數(shù)據(jù)結(jié)構(gòu)或模型架構(gòu),靈活性受限,GameFactory 采用預(yù)訓練模型和優(yōu)化控制機制,適應(yīng)更多游戲場景構(gòu)建需求。
(二)與傳統(tǒng)游戲開發(fā)方式對比(針對 The GameFactory)
-
編程復(fù)雜度:傳統(tǒng)游戲開發(fā)需專業(yè)編程語言,難度大,The GameFactory 圖形化編程降低難度,如碰撞檢測邏輯構(gòu)建更簡單。
-
開發(fā)周期:傳統(tǒng)開發(fā)周期長,The GameFactory 能加快開發(fā)速度,如制作 2D 平臺游戲,初期創(chuàng)意驗證和基礎(chǔ)邏輯構(gòu)建有優(yōu)勢。
-
資源利用效率:傳統(tǒng)開發(fā)中資源管理需專業(yè)知識和精力,The GameFactory 內(nèi)置資源編輯器提高效率,避免性能問題。
六、如何使用
(一)GameFactory 框架(推測情況)
-
數(shù)據(jù)準備:準備相關(guān)視頻數(shù)據(jù)和游戲元素數(shù)據(jù),如賽車游戲需收集賽道、操作控制等數(shù)據(jù)。
-
模型選擇與適應(yīng)調(diào)整(第一階段):根據(jù)游戲目標選擇預(yù)訓練模型,用 LoRA 微調(diào)適應(yīng)特定需求。
-
動作控制模塊訓練(第二階段):凍結(jié)參數(shù),訓練動作控制模塊,避免風格與控制糾纏。
-
生成現(xiàn)有游戲場景(第三階段):移除 LoRA 權(quán)重,生成游戲視頻,用于概念測試等。
-
評估與優(yōu)化:根據(jù)生成視頻評估真實度和適配性,優(yōu)化模型參數(shù)和邏輯。
(二)The GameFactory 軟件的使用
-
安裝下載:從官網(wǎng)下載,解壓后雙擊主程序安裝,可更改安裝路徑,選擇是否創(chuàng)建桌面快捷鍵等。
-
新建項目:打開軟件,新建項目,確定游戲類型和分辨率等基礎(chǔ)參數(shù)。
-
場景設(shè)計:利用地圖編輯器設(shè)計場景,添加層和對象,調(diào)整物理屬性。
-
角色創(chuàng)建:可導(dǎo)入或繪制角色,配置動作和行為,如設(shè)定角色動作切換邏輯。
-
邏輯編寫:用事件編輯器設(shè)定規(guī)則和交互邏輯,初學者圖形化操作,有經(jīng)驗者可編寫 Lua 腳本。
-
測試與調(diào)試:在軟件播放器中測試,修復(fù)問題,如調(diào)整角色速度等。
-
發(fā)布游戲:開發(fā)完成后導(dǎo)出為各平臺可執(zhí)行文件,如 Windows、Mac 或 HTML5 版本。