導讀
隨近百年的進步,內容分析廣泛運用在傳播學、心理學、政治學、文學、歷史學、人類學、語言學等各類學科中,已是社科研究中最重要的研究方法之一。那麼問題來了,內容分析法到底要怎麼做呢?在大資料背景下,內容分析法如何測量和解釋大規模的文字資料?
有的讀者認為內容分析法的全部意義就是統計關鍵詞次數,或使用情感分析?[1]不太符合自己的研究需求;還有一些手握大量文字資料的讀者,想要透過計算機對文字資料進行分詞、編碼,找出資料間的內部聯絡並進行假設檢驗、進行視覺化呈現等等,卻苦於程式設計基礎較弱或是沒有適合的工具。
什麼是大資料技術輔助線上內容分析法(BACA)?內容分析法是社會科學研究方法中的一種對文字內容進行編碼、分類、語義判斷及形成可供統計分析之用的量化分析方法。它是指一種以系統、客觀與量化的方式,來研究與分析傳播內容,以測量及解讀內容的研究方法。[2]
將傳統內容分析的操作流程搬到“線上”,結合大資料技術,用網路挖掘、機器學習、自然語言文字處理等實現文字資料的線上處理,使得內容分析法的全部流程線上一站式完成,大大縮短研究時間,提升研究效率,快速產出研究論文。
總而言之,大資料技術輔助線上內容分析法就是把雜亂無章的非結構化文字內容轉化成結構化的資料,不僅可對文字資料進行質性的挖掘和解讀,還可以解釋資料過程(趨勢、路徑),使用交叉、聚類等方式解釋變數之間的差異和關係,獲得深度分析結果,回答研究問題、檢驗研究假設和建立模型。
DiVoMiner®簡介DiVoMiner®文字大資料探勘及分析平臺,遵循學術界認可的內容分析法全流程,以大資料技術輔助,一站式完成從資料上載、資料探索、資料檢索、資料處理、類目建構、人工編碼/大資料演算法編碼、信度測試到資料統計分析、演算法模型、視覺化結果全流程。
DiVoMiner®操作流程上述方法操作流程是把非結構化內容轉化成結構化資料的過程,簡單來說就是對文字進行分類-賦值-統計分析,符合學術界通用的類目建構-編碼-統計分析。當然,科學的研究方法需要嚴謹、系統的流程,以確保研究結果的有效,因此需結合信度效度的測試。下面這個圖就是一個完整的大資料技術輔助線上內容分析流程圖。
無顏色填充為傳統內容分析法,綠色為計算機輔助內容分析法,黃色為大資料技術輔助內容分析法完成的。由此可見整個大資料技術輔助線上內容分析法[3]都可以在DiVoMiner®文字大資料探勘及分析平臺上進行,在確保研究流程科學、嚴謹方面,這個平臺具有完備的質量控制機制,尤其是編碼員間的信度計算程式清晰、自帶學術界認可的四種信度計算方法並具有編碼追蹤功能,可以隨時定位編碼結果,所有的資料分析結果也可以追蹤回溯至原文。
DiVoMiner®操作第一步:建立話題很多讀者不明白DiVoMiner“話題”的意思,小編在這裡解釋下:在註冊平臺之後,即可建立免費的“學習話題”。在平臺上一個研究專案等於一個“話題”。平臺上的話題分為三類:學習話題、案例話題和研究話題。
學習話題:學習話題是供學習平臺操作使用用途,免費提供。免費學習話題的資料量100條,檔案儲存空間10MB,類目上限3個,支援1個管理員帳號。不可升級話題,建議只做學習平臺流程使用。在建立免費學習話題之後,進入【資料管理】-【總覽】頁面,可看到提供的示例資料。您可以瞭解上傳EXCEL文件格式資料的結構,也可用示例資料嘗試完成整個學習流程。案例話題:平臺還提供了一些案例,供您參考學習,透過已經制作好的案例,您可以直觀地看到如何運用DiVoMiner進行研究。研究話題:當用戶覺得學習話題資料量、檔案儲存空間、類目上限、編碼員數量不足以滿足研究需求時,可付費使用,具體付費標準請參看平臺【購買話題】。看了這麼多,快來跟我們一起,註冊登入平臺(me.divominer.cn),來一趟大資料輔助內容分析法之旅吧!
參考文獻
[1]梁海(2020). 內容分析, 從貝雷爾森到涵化理論: 偶爾正經的量化傳播學史(九). 網際網路挖掘實驗室. 取自https://mp.weixin.qq.com/s/Q-1alL-_9fwBAfQtUXQUTQ
[2] Kerlinger, F.N. (1973). Foundations of behavioral research (2nd ed.). New York: Holt, Rinehart & Winston.
[3]張榮顯,曹文鴛:《網路輿情研究新路徑:大資料技術輔助網路內容挖掘與分析》,《汕頭大學學報》(人文社會科學版)2016年,第8期,第111-121頁。