改變遊戲行業的,或許不是遊戲公司
作者 | 門宇闊
編輯 | Momo
“這遊戲我等了足足8年”,周楊頗具儀式感地打開了一個平淡無奇的瓦楞紙箱,炫耀著裡面黃色封面的盒子。
早在一個月前,周楊就在淘寶上訂購了英文版的《賽博朋克2077》,PS4上的實體光碟售價為378元,他覺得,對於一款精雕細琢的遊戲來說,貴,才體現出它的價值。
但在試玩30分鐘後,周楊臉上的笑容消失了,遊戲在主機上的執行並不流暢,大量出現的bug讓人齣戲,甚至幾次出現了卡關的現象,必須重啟或讀檔才能繼續。
有同樣心理落差的玩家不在少數,差評蜂擁而來,在一些網站上,該遊戲的使用者評分已經跌到2.9分的低水準,開發商CD Projeket Red(CDPR)發出官方道歉,索尼更是罕見地直接將遊戲從平臺下架。
遭遇滑鐵盧其實並不意外,《賽博朋克2077》的開發難度巨大,作為一款開放式遊戲,它不僅蘊含了120平方千米可探索的空間,有超過1000名有自己生活規律的NPC,以及龐大繁複的劇本,所有這些元素都直接造成了該遊戲在長達幾年的跳票後依然問題重重。
高度專業化的工業文化已經深入遊戲業,和好萊塢一樣,遊戲開發有非常規範的流程和職業細分,上百人分工合作,分別負責不同的部分,這讓現代遊戲可以無比精細,連搶聲都經過真實模擬,可以還原在不同射擊距離、不同空間下的聲音效果。
不過,遊戲開發的效率並沒有本質上的提升,設計一款遊戲背後所需的資源和人力正在變多而不是變少,疫情下的居家辦公,讓多工種的協作力發生斷裂,即使是遊戲開發中一次微小的調整,比如加入一個角色可以互動的物品,都需要耗費幾天而非幾小時的時間,反映在結果上就是延期和製作成本劇增。
《賽博朋克2077》的困境讓產業轉型再次成為焦點,如何簡化流程,讓遊戲開發從人力密集型的生產方式,過度到更自動化的流水線生產?如何在保證遊戲質量的同時,更好地縮減經濟和時間成本?
遊戲行業需要更具效率的開發手段,而AI可能是最好的答案。
銀行劫案中的顛覆性技術想要窺探AI在遊戲開發中的革命性作用,《盜夢人》是個不錯的觀測點。
在這個銀行搶劫案的小遊戲裡,除了玩家外,其餘4個NPC(經理、同謀、顧客、櫃員)均是AI控制的,他們會依據玩家的決策進行反應,彼此之間也會互相影響。
每個NPC都有自己的人物設定,但遊戲本身不存在固定劇本的概念,玩家不同的舉措會造成截然不同的結局:當玩家拿槍恐嚇經理時,他可能會乖乖交出密碼,玩家攜款而逃;而如果玩家沒表現出足夠的威脅,經理可能就會揭竿而起。
《盜夢人》背後的開發公司是rct studio,他們製作該遊戲的核心技術,是基於深度強化學習技術的AI引擎。強化學習的技術也是AlphaGo的核心原理,簡單來說是給AI設定一套規則,透過左右手互搏,讓AI自己學習出最佳的遊戲模式。
銀行搶劫案的場景中,rct給四個NPC賦予了不同的性格,他們中有的威猛,有的膽小,有的投機。在訓練伊始,膽小性格的顧客沒有學會該如何行事,他可能表現的非常勇敢,會直接衝上去毆打劫匪。但這樣的行為,顯然不符合他的人設,整個劇情就會被博弈掉,在經過上百萬次演練後,最後剩下來的劇情中,顧客的行為便會貼近他弱小的設定,AI就會記住此人該有的行為模式。
行為模式是動態的,怯懦的顧客如果被逼急了,可能也會進行反抗,這種行為並不違揹他的性格,屬於“在正確的場景下,做他該做的事”。在遊戲裡,玩家可以幫助搶劫,可以主持正義,可以坐視不管,不同的舉措會導致不同的結局,也就讓遊戲產生了幾乎無限的劇情。
《盜夢人》中,開發者只設計了遊戲場景、人設、規則等大方向,NPC的行為、臺詞和劇本全部都是AI來推動的。
只需人為定義幾項屬性,NPC會自動生成指令碼和行為
負責《賽博朋克2077》NPC故事線的團隊超過400人,《GTA5》有1000多人的劇本和對話策劃團隊,《荒野大鏢客2》花掉R星公司近8億美元。試想一下,當遊戲工作室只需要設定NPC的基本性格和遊戲內的物理規律,剩下的劇情和對話全部交由AI去模擬,那麼節省下來的將是大量的開發耗時和時間,將重新定義一款遊戲的標準開發週期。
脫身於AI公司,續寫未來故事“改變遊戲產業的,不一定來自遊戲公司”,陳雨恆是AI技術的篤信者,他此前曾是百度智慧硬體事業部專案總負責人,負責並參與了百度智慧硬體部門從設計、研發、宣傳到銷售的整個體系的組建與運營。
離開百度後,陳雨恆和幾個老同事一同創立了rct studio,核心成員在人工智慧領域的多年積累和實踐讓他們迅速吸引到資本的關注,併成功獲得來自星瀚資本、Y Combinator和Makers Fund的融資。
陳雨恆曾致力於打造基於人工智慧和新互動為基礎的下一代作業系統,從這一點上來看,rct依然在續寫之前的故事,並畫出了更大的藍圖。
rct沒有把自己侷限在單機遊戲,它所構想的是《西部世界》裡的模樣,打造極度智慧的NPC和極度個性化的劇情體驗,帶給玩家更多的歸屬感和情感繫結。
“真實的人類一定有弱點,一定有缺點,但是虛擬的人可以個性化,永遠可以按照你所想的那樣存在,可以讓你得到你所需要的東西,你不會因為他們的自我性而生氣,當然如果你就是喜歡吵架,你也可以找人吵架。”
在陳雨恆看來,當線下社交被壓制的時候,大家會追求虛擬世界裡的社交,未來這個趨勢還會不斷放大,而智慧NPC所提供的不僅僅是更多的劇情,它們可以提供完美的社交模式,因為它永遠線上,可以按照每個人喜歡的方式相處,“如果你心中完美的女朋友是一種想象,那麼在NPC那裡,想象就是現實。”
要實現這一點,AI就不能一直在“左右手互搏”的狀態下模擬,它需要接入真實的資料。普通遊戲收集的資料,主要是使用者畫像和使用者消費行為,比如騰訊根據《王者榮耀》使用者資料,有針對性地研究要上新的面板和營銷策略。而遊戲內產生的資料,大部分都只應用於戰報呈現、使用者資料統計圖、舉報判定等有限場景。
而rct想要利用的是遊戲內的個人行為特徵,總結出使用者的偏好,讓劇情和NPC按照符合玩家的喜好去演進。
比如在一個開放世界中,一個玩家喜好探索而無心戀戰,遊戲就可以提供更多的驚喜劇情,並讓NPC的戰鬥慾望降低。rct最終希望打造一個平臺,讓其中的使用者行為資料在不同的遊戲裡通用,當NPC的互動能根據玩家的性格特徵發生變化時,就可以真正打造出千人千面的體驗。
AI的路還很長,網路無限寬廣在和rct員工的接觸中,《西部世界》、《銀翼殺手》、《駭客帝國》等科幻作品被不斷提及,rct希望用AI顛覆產業,夢想用技術改變更遙遠的未來。
不過就像rct自己的《盜夢人》所展示的那樣,未來從來都是無法預知的。眼下,作為一家剛起步的創業公司,rct需要面對資本、技術、市場等多如牛毛般的現實問題。
陳雨恆承認,遊戲圈和影視圈一樣,是一個相對保守的行業,上下游和供應鏈的利益鏈條盤根錯節,外來者很難切入,很難像滴滴那樣,用單一技術打破整個產業結構和利益分配格局。
同時,和歐美相比,中國的遊戲圈又更偏商業導向,充斥著質量堪憂、缺乏創意的氪金遊戲。很多遊戲商的首要目的就是實行資本變現,也間接導致資本市場對於一款遊戲的短期回報格外迷戀,缺乏對於長期技術和耗時大作的關注和投入。
從技術上來講,強化學習折射在NPC上的結果也並不完美。圍棋AI的目標只有一個,就是贏下比賽。相比於圍棋非黑即白的輸贏,NPC的行為模式的標準判定要複雜很多,NPC想要保命,想要掙錢,想要實現一個夢想,它們甚至不存在明確的目標,因此最後訓練出來的決策模型,可能會存在諸多缺陷。
在《盜夢人》中,被訓練好的NPC依然會做出一些匪夷所思的事情,比如顧客搶奪了劫匪的箱子後,職員會主動為顧客開啟保險櫃等迷之操作。在AI看來,這種行為符合他的人設,可對於玩家來說,引發NPC行為轉變的衝突並不夠多,劇情的推進就缺乏邏輯上的合理性。在大型遊戲中,劇情主線和結局可能是設定好的,但智慧NPC的“反常識”行為,可能會扭曲故事的敘事走向,割裂遊戲體驗的完整性。
AI技術可以覆蓋很多產業應用,在眾多的設想場景中,AI總被給予無限期待,但產品落地往往成為橫亙在創業者面前的鴻溝,其後在面對市場時,模糊的商業模式也會成為致命傷,讓無數的AI暢想化為雲煙。
陳雨恆表示,公司當務之急是出一個足夠好的作品,讓團隊可以獲得資料,最佳化演算法,讓遊戲公司瞭解AI的高效率,改變上下游利益分配格局,讓資本看到潛在的商機,增大投資慾望。
rct要走的路還很長,好在公司已經得到了很多業內的認可和好奇,rct是中國屈指可數的獲得OpenAI API內測使用權的團隊,公司與GTA 5主製作人、南京大學人工智慧創新研究院等行業頂尖人才和機構保持了密切的溝通和聯絡,與完美世界等頭部遊戲公司建立了商業合作關係。
rct還正與遊戲開發商悠米互娛展開合作,共同打造一款3A級開放世界MMO遊戲《代號:奧德賽》。運用《盜夢人》裡的技術,rct幫助悠米互娛在遊戲中創造了海量的智慧NPC,實現與玩家的逼真互動。
這款遊戲的主題和《賽博朋克2077》相似,後者在鉅額的開發成本下還是留下層層陰雲,而深度融合AI技術的《代號:奧德賽》或許可以另闢蹊徑,用更高的效率和更多元的玩法,為玩家勾勒出一條新的道路。
在和周楊探討AI在遊戲中的可能性時,他剛下載完《2077》裡一個10G的大補丁,卻對於更新後的互動體驗依然非常不滿。個性化劇情、智慧NPC、完美社交...rct正在建造的新世界讓他浮想聯翩,失望的臉也終於露出微笑:“我願意為那樣的遊戲再等8年。”