前言
數字化時代,各種智能設備的普及和泛在化,使互聯網上的異構海量信息變得觸手可及。在這種數字化、網絡化及泛在化的信息氾濫場景下智能信息獲取變得極為重要。
信息獲取不僅包括信息搜索,還包括各種各樣的信息交互活動,特別是在信息搜索之後用戶會與所收集的信息開展進一步交互,以發現、識別和使用有用信息來完成當前任務。本文將這種發現和使用有用信息的行為稱為信息利用行為。信息利用行為關注的往往是用戶與文獻內細粒度信息單元之間的交互行為,如文獻內語義組件或修辭性功能組件等。
由於當前信息檢索受制於細粒度信息組織及其與信息需求匹配方面的難度,如細粒度信息單元的自動化識別、抽取、描述、揭示等。此外,工作任務及其所產生的問題情景是信息需求產生的來源,會引導從信息搜索到最終利用的整個信息交互過程,通常會包括一個或多個信息交互循環。
現有搜索引擎對複雜任務場景下的信息獲取支持仍然有限,尤其是缺少對以工作任務為導向的信息利用的支持,需要用戶人為地實現信息的有效利用。
因此,從工作任務視角出發,瞭解用戶在任務完成過程中開展信息搜索和利用行為的特點,對設計和開發以用戶任務為導向的智能信息獲取系統具有重要意義,也有助於為用戶信息素養教育提供一定的啟發。
在已有文獻中,研究者主要關注的是信息搜索,忽視了對信息利用行為的研究。特別是較少有研究者結合工作任務視角來分析信息搜索與利用行為的差異,大多數針對任務完成過程的研究,主要是限定在信息搜索任務過程而不是工作任務過程。
例如,Song等從任務過程出發探索了學習任務場景下的用戶信息交互行為,隨後她們進一步調查了任務完成過程中用戶的搜索、閱讀和寫作這三類交互行為及其轉變,將任務完成過程定義為用戶開始搜索直到用戶收集到足夠的信息完成搜索任務的過程。
類似地,還有研究者分別調查了在搜索任務完成過程中用戶主題知識水平和相關性標準的變化以及新手用戶關於學術數據庫的心智模型的分類和演變。
但是已有研究建議,信息搜索與利用行為應該考慮工作任務的整個生命週期,以任務完成過程為中心。
另外,由於在學習型任務中,文獻通常以PDF全文形式呈現和使用,因此信息利用也可以從參考文獻管理軟件使用行為視角開展調查,但是這些研究更加註重的是這些工具所具備的功能以及工具使用行為,如PDF文獻保存、文獻重命名、自動引文元數據抽取以及標註等,並未從任務過程以及信息單元層面對信息行為加以深入研究與分析。
在大學生高等教育中,撰寫課程論文作為一種課程考核方式越來越普遍。撰寫課程論文不僅對教師來說是一種重要的考評方式,而且對學生來說也是一個良好的學習途徑。例如,學生不僅需要追蹤、消化課堂之外的其他來源的知識,權衡這些知識與主題的相關性並充分理解所選定的主題,還需要在一個邏輯化的框架中表達出來。
通常撰寫一篇短文包括如下步驟:閱讀和理解問題,識別相關的材料,制定短文撰寫提綱,完成初稿,修改直到完成終稿。簡單地,這些步驟可以分為兩個環節或部分,分別是準備和撰寫,前者包括提出所要研究的問題以及建立對這些問題的理解等,後者包括建立一個清晰的框架、組織和表達想法等。
因此,深入調查和比較不同工作任務環節下信息搜索和利用行為的差異,對於設計和開發更有效且高效的搜索引擎,以及提升用戶信息搜索和利用技能、完善信息素養課程教學方案等,顯得非常重要且必要。
鑑於此,本文以課程論文寫作這一任務為研究場景,將工作任務劃分為不同的環節,採用日記法調查不同任務環節下大學生在搜索和利用信息方面存在的差異。選題環節主要是開展相應的準備工作,如確定撰寫的主題等;寫作環節,根據實證論文的結構,進一步分為引言、研究綜述、研究方法、結果和結論不同子環節。
雖然在真實寫作過程中這些子環節之間可能會存在一些交叉,但是這些子環節之間的界限相對較為清晰,當我們僅考慮不同寫作環節顯式發生的信息搜索與利用行為時是比較容易區分的。
需要注意的是,雖然在選題環節中也存在信息利用行為,但是更多的是認知上的隱性行為,因此我們主要關注(不同)寫作環節中的信息利用行為。此外,對於某些發生頻次較低的行為,在數據分析中會將不同的具體寫作環節彙總到寫作環節這一大類上。
在具體內容上,要求學生儘可能全面地記錄在這些不同環節中的信息搜索行為和信息利用行為,前者包括每個環節所使用的檢索工具、檢索字段及與查詢式有關的搜索策略、檢索範圍限制等;後者包括寫作環節中有用信息在文獻的具體位置及其發現與利用的方式。為了減少參與者的負荷,在每個寫作環節,我們僅要求學生選擇最多三條他們認為有用的文獻進行記錄。
需要注意的是,這可能存在一定的選擇性偏見,即當存在多於三條有用的文獻時,他們可能會選擇那些對當前寫作任務更有用的文獻,而對於這些有用性更高的文獻,學生也可能更傾向於採用全篇閱讀的方式來獲取文獻內的有用信息。總體上來說,大學生課程論文撰寫過程都存在一定的信息需求,會比較頻繁地進行檢索。
檢索行為更多集中在選題、引言和綜述這三個環節,在研究方法、研究結果和結論寫作環節的檢索次數總體較少,但也有少數人會開展多次檢索。研究發現選題與不同部分的寫作任務環節之間的檢索頻次具有顯著的差異。
在檢索工具使用方面,研究發現所有人都會使用中國知網等學術文獻數據庫,與成穎等、徐瀅璐和李剛等研究一致。同時也印證了大學生信息搜索行為的一般性現象,即學生往往只會使用少數幾個熟知的搜索工具,如某個特定的數據庫資源或互聯網搜索服務等。
這一現象尤其是在除引言之外的其他寫作環節表現更為突出,可能原因是學生在這些環節的信息需求通常更為明確;而在選題和引言環節,為了獲得多渠道、多來源的信息,大多數學生還是會綜合使用多種檢索工具。
在搜索戰略方面,學生更傾向於使用主題檢索和關鍵詞檢索等搜索戰略,這些戰略更多的是數據庫默認設置的檢索字段,而較少使用非默認字段如作者檢索、引文檢索等方式,這與歐陽崢崢等、成穎等、徐瀅璐和李剛等研究相一致。
研究也發現,大部分人會組合使用多種搜索戰略,並在任務完成過程中對所使用的搜索戰略及其組合進行調整。針對課程論文寫作場景招募某一高校某門課程的研究生,考察了真實任務場景下用戶信息搜索與利用行為,及其在不同工作任務環節的差異。
研究發現,信息檢索行為在不同任務階段是存在一定差異的,尤其是檢索次數、檢索工具在不同任務階段的差異是顯著的。此外,對於有用信息出現的位置,以及有用信息的發現與利用方式,不僅需要考慮工作任務環節,還需要考慮所用文獻的類型等因素。
本研究對於學生信息素養教育和信息系統設計與開發方面存在一定的啟示與價值。在信息素養教育方面,本研究認為,學校應該為學生在數據庫使用、搜索過程和有效的搜索策略方面提供更多的指導,以幫助學生在課程論文寫作等任務中解決搜索和利用有用信息時面臨的挑戰;
此外,除了重點提升學生的信息搜索能力之外,還應該著重提升和鼓勵學生努力應用所學信息素養技能來更好地完成任務的動機,以及鼓勵學生克服相應的認知偏見,如大多數學生在任務完成中存在只採取最小的努力來達到目標的傾向,以及過於依賴和偏好可立即且方便獲取的、習慣使用或熟悉的資源。這些方面與信息素養中的實際技能無關,但是也會讓學生在信息搜索與利用中遇到一些障礙,並影響任務效果。
在信息系統設計與開發方面,本研究認為,系統對任務完成中整個信息交互過程進行無縫性支持,以及幫助學生組織和管理過程中的各類信息產品等,尤其是細粒度信息交互階段,具有非常重要的意義與價值;另外,實現對粗粒度信息的分解、抽取和標引等,能夠促進有用信息的快速識別、發現與利用,這也是系統設計與開發的另一個方向。
當然,本研究也存在一定的侷限性,如研究樣本量較小且限定在圖書館學情報學研究生這一群體,同時研究情景也只是針對課程論文的寫作,對於本研究結論是否可以移植到其他群體以及其他任務情景下的信息交互行為,則需要進一步來開展研究。