首頁>科技>

大資料不能取代人的創作,但它可以在文藝創作生產各個環節提供有益參考,賦能更多好作品

什麼是大資料?它有4個特徵:資料量大、多樣性、產生速度快和價值密度低。隨著網際網路的快速發展和廣泛應用,產生了海量資料。相對於傳統資料而言,這些資料體量極大,資料來源繁雜多樣,容納大量影象、文字、網頁、音訊、視訊等,因而被稱為“大資料”。

傳統資料技術已經無法處理大資料,於是,大資料處理技術應運而生。目前通用的大資料處理技術是具備海量處理能力的分散式計算系統。它擁有巨量的資料儲存能力,以及由強大的中央處理器、圖形處理器和專有晶片構成的計算叢集。這些資料處理工具可以做到6小時內處理100PB資料(相當於1億部高清電影),每秒處理7.8萬張圖片。而在底層儲存計算能力之上,是自然語言、計算機視覺和語音等技術。有了它們,機器能更好地學習、理解和處理複雜資料。

在文藝創作領域,人們對資料背後規律的探尋,早在網際網路時代到來之前就已開始。比如,電影行業對票房、排片率、上座率等資料的關注。但直到網際網路大資料出現,線上文藝作品最後的“黑匣子”才真正開啟。現在,所有觀影資料、使用者互動資料、播放表現、演員等構成一個龐大的資料系統,通過人工智慧的分析,量化成一些固定指標。這些指標可以在一定程度上反映使用者面貌,已經廣泛為採買、製作、投資、宣發和播放各個環節提供參考。

比如,“選角”是大資料應用的一大場景,大資料演算法可通過輿情資料提煉出網友對演員的評價標籤,計算演員和候選角色的標籤相關性,網路劇《長安十二時辰》中張小敬的扮演者就是由大資料參與推薦的。除了選角,大資料還能指導剪輯。觀眾對視訊的觀看反應,比如何時拖動視訊進度條快進等等,都會納入監測範圍,從而讓製作者對觀眾喜好判斷有據可依。而在重大體育賽事中,機器甚至可以智慧生成精彩短視訊(如進球瞬間),直接成為內容生產的一環。此外,在“千人千面”的分發機制下,不同使用者在視訊平臺看到的首頁是不同的。就算是看到同一內容,其封面圖和推薦文案也可能是量身定製。

大資料對文藝創作的指導作用到底有多大?一段時間以來,一直存在兩種截然相反的觀點。一是將大資料描述為文藝創作的“爆款鍊金術”。伴隨網路視聽的迅猛發展,競爭越發凸顯,為了從中突圍,製作方對於“爆款”的追求較以往更甚。用資料說話,一定程度上可以消除節目反饋“不確定性”,提升“爆款”命中率。另一種觀點則將大資料置於藝術家“創意”“靈感”的對立面,認為技術探索在文藝創作者的智慧面前顯得虛妄。這兩種觀點都失之偏頗,文藝作品具有特殊屬性,用大資料描繪它的難度遠高於一般商品,但否認科技與藝術在當下深度融合的趨勢,同樣不可取。事實上,5G、人工智慧、虛擬現實、超高清顯示等新技術無一不在深刻影響文藝發展。

因此,應合理認識大資料在文藝創作中的參考價值,善於利用而不是一味追捧。通過分析資料,有助於了解觀眾喜好和習慣,認識當下藝術潮流、創作方向,從而為創作提供參考。大資料和人工智慧的結合應用,甚至可以將人力解放出來,使創作者得以騰出更多精力,投入到不可替代的精神創造中去。

但大資料提供的參考仍然是有限的,觀眾淺層的娛樂需求容易歸納,更深層次的文化追求和價值取向卻不易探究。“爆款”沒有標準計算公式,一部文藝精品誕生依靠的是艱苦創造和不斷創新。如果本末倒置,以為集納了大資料推薦的流行元素和吸睛話題就高枕無憂,沒有在打磨作品上下足夠功夫,是不可能創作出優秀作品的。此外,對大資料的過度依賴,容易帶來統一標準趨向下的跟風與同化,使作品缺乏藝術個性和創新。以《中國詩詞大會》為例,如果單憑大資料監測,“詩詞”算不上熱門元素,但節目傳達出的優秀傳統文化內涵與質感,仍使它贏得觀眾喜愛,節目的模式創新和創作者的文化堅持才是作品的核心競爭力。

大資料不能取代人的創作,但它可以在文藝創作生產各個環節提供有益參考,賦能更多好作品。隨著社會發展和科技進步,未來大資料的應用前景將更為廣闊。比如,隨著資料維度不斷細分,越來越多內在創作規律將被大資料探勘出來;而隨著更有效的技術手段和認知框架的引入,在原來“大資料”基礎上,可以生產出更多“好資料”,比如在性別、年齡等人口統計學資料之外建立心理學標籤,和原有資料整合,就能形成觀察使用者的一種“好資料”。從儲存計算到高度定製化的運用,相信只要我們善於利用,大資料將為文藝創作發揮更多積極作用。

(作者莊卓然,阿里文娛首席技術官兼優酷營運長)

  • 整治雙十一購物亂象,國家再次出手!該跟這些套路說再見了
  • 打敗順豐排第一!中國快遞界新霸主誕生,半年送走53億個包裹