檢索表示式主要有邏輯表示式、截詞檢索表示式、位置檢索表示式等,其中,最為常用的是邏輯表示式。
1、邏輯表示式是指利用布林邏輯算符,對檢索詞的關係進行表達,又稱布林邏輯表示式。布林邏輯是目前計算機檢索最簡單、最基本的匹配模式,也是計算機檢索領域廣泛採用的邏輯表達方式。布林算符有“邏輯與”(“AND”)、“邏輯或”(“OR”)、“邏輯非”(“NOT”)等。
2、截詞檢索表示式指在檢索式中用專門符號(截詞符號)表示檢索詞的某一部分,檢索詞允許有部分變化,檢索詞的不變部分加上由截詞符號所代表的任何變化形式所構成的詞彙都是合法檢索詞。截詞檢索表示式在西方語言檢索中應用比較廣泛,在中文資訊檢索中也有一定的應用。採用截詞檢索表示式,既能防止漏檢,又能節省時間,是提高檢索效率的有力措施。不同檢索系統採用的截詞符不完全相同,一般常採用“?”、“*”等。
截詞方式有多種,按截斷的位置來分,截詞有前截斷、中間截斷、後截斷等;按截斷的字元數量來分,可分為有限截斷和無限截斷兩種。
3、位置檢索表示式表示兩個檢索詞之間的位置鄰近關係(不同的的檢索系統採用的表達符號可能不同),
常用的有:
W(nW):W是with的縮寫,(W)表示其兩側的檢索詞必須按前後順序出現在記錄中,兩詞之間不允許插入其它詞,只可能有空格或一個標點符號。(nW)表示兩側的檢索詞中間允許插入的詞最多隻能有n個,且檢索詞的位置不能顛倒。
F: 是field的縮寫,(F)表示其兩側的檢索詞必須出現在同一個欄位中,但兩個檢索詞的詞序不限,且兩個檢索詞之間的單詞數量也不限制。如,兩個檢索詞必須同時出現在篇名欄位、文摘欄位或敘詞欄位。
N:是near的縮寫,(N)表示其兩側的檢索詞位置可以互換,在兩詞之間不能插入其它詞,但允許有空格或標點符號。(nN)表示允許在此運算子兩策的檢索詞之間最多插入n個詞,且兩個檢索詞的位置可顛倒。
L:是link的縮寫,(L)表示其兩側的檢索詞之間有主從關係,前者為主,後者為副。L可用來連線主、副標題詞。
S:是subfield的縮寫,(S)表示兩側的檢索詞必須出現在同一個子欄位中,如同一個句子或短語中,但詞序不限,且兩個檢索詞之間可有若干個其它詞。
在某些檢索系統中,還使用雙引號“ ” 標示不可分割的片語或短語,如“civil engineering”,在檢索結果中civil engineering必須
檢索表示式主要有邏輯表示式、截詞檢索表示式、位置檢索表示式等,其中,最為常用的是邏輯表示式。
1、邏輯表示式是指利用布林邏輯算符,對檢索詞的關係進行表達,又稱布林邏輯表示式。布林邏輯是目前計算機檢索最簡單、最基本的匹配模式,也是計算機檢索領域廣泛採用的邏輯表達方式。布林算符有“邏輯與”(“AND”)、“邏輯或”(“OR”)、“邏輯非”(“NOT”)等。
2、截詞檢索表示式指在檢索式中用專門符號(截詞符號)表示檢索詞的某一部分,檢索詞允許有部分變化,檢索詞的不變部分加上由截詞符號所代表的任何變化形式所構成的詞彙都是合法檢索詞。截詞檢索表示式在西方語言檢索中應用比較廣泛,在中文資訊檢索中也有一定的應用。採用截詞檢索表示式,既能防止漏檢,又能節省時間,是提高檢索效率的有力措施。不同檢索系統採用的截詞符不完全相同,一般常採用“?”、“*”等。
截詞方式有多種,按截斷的位置來分,截詞有前截斷、中間截斷、後截斷等;按截斷的字元數量來分,可分為有限截斷和無限截斷兩種。
3、位置檢索表示式表示兩個檢索詞之間的位置鄰近關係(不同的的檢索系統採用的表達符號可能不同),
常用的有:
W(nW):W是with的縮寫,(W)表示其兩側的檢索詞必須按前後順序出現在記錄中,兩詞之間不允許插入其它詞,只可能有空格或一個標點符號。(nW)表示兩側的檢索詞中間允許插入的詞最多隻能有n個,且檢索詞的位置不能顛倒。
F: 是field的縮寫,(F)表示其兩側的檢索詞必須出現在同一個欄位中,但兩個檢索詞的詞序不限,且兩個檢索詞之間的單詞數量也不限制。如,兩個檢索詞必須同時出現在篇名欄位、文摘欄位或敘詞欄位。
N:是near的縮寫,(N)表示其兩側的檢索詞位置可以互換,在兩詞之間不能插入其它詞,但允許有空格或標點符號。(nN)表示允許在此運算子兩策的檢索詞之間最多插入n個詞,且兩個檢索詞的位置可顛倒。
L:是link的縮寫,(L)表示其兩側的檢索詞之間有主從關係,前者為主,後者為副。L可用來連線主、副標題詞。
S:是subfield的縮寫,(S)表示兩側的檢索詞必須出現在同一個子欄位中,如同一個句子或短語中,但詞序不限,且兩個檢索詞之間可有若干個其它詞。
在某些檢索系統中,還使用雙引號“ ” 標示不可分割的片語或短語,如“civil engineering”,在檢索結果中civil engineering必須