SMART引數詳解
01(001)底層資料讀取錯誤率 Raw Read Error Rate
資料為0或任意值,當前值應遠大於與臨界值。
底層資料讀取錯誤率是磁頭從磁碟表面讀取資料時出現的錯誤,對某些硬碟來說,大於0的資料表明磁碟表面或者讀寫磁頭髮生問題,如介質損傷、磁頭汙染、磁頭共振等等。不過對希捷硬碟來說,許多硬碟的這一項會有很大的資料量,這不代表有任何問題,主要是看當前值下降的程度。
在固態硬碟中,此項的資料值包含了可校正的錯誤與不可校正的RAISE錯誤(UECC+URAISE)。
注:RAISE(Redundant Array of Independent Silicon Elements)意為獨立矽元素冗餘陣列,是固態硬碟特有的一種冗餘恢復技術,保證內部有類似RAID陣列的資料安全性。
02(002)磁碟讀寫通量效能 Throughput Performance
此引數表示硬碟的讀寫通量效能,資料值越大越好。當前值如果偏低或趨近臨界值,表示硬碟存在嚴重的問題,但現在的硬碟通常顯示資料值為0或根本不顯示此項,一般在進行了人工離線SMART測試後才會有資料量。
03(003)主軸起旋時間 Spin Up Time
主軸起旋時間就是主軸電機從啟動至達到額定轉速所用的時間,資料值直接顯示時間,單位為毫秒或者秒,因此資料值越小越好。不過對於正常硬碟來說,這一項僅僅是一個參考值,硬碟每次的啟動時間都不相同,某次啟動的稍慢些也不表示就有問題。
硬碟的主軸電機從啟動至達到額定轉速大致需要4秒~15秒左右,過長的啟動時間說明電機驅動電路或者軸承機構有問題。旦這一引數的資料值在某些型號的硬碟上總是為0,這就要看當前值和最差值來判斷了。
對於固態硬碟來說,所有的資料都是儲存在半導體積體電路中,沒有主軸電機,所以這項沒有意義,資料固定為0,當前值固定為100。
04(004)啟停計數 Start/Stop Count
這一引數的資料是累計值,表示硬碟主軸電機啟動/停止的次數,新硬碟通常只有幾次,以後會逐漸增加。系統的某些功能如空閒時關閉硬碟等會使硬碟啟動/停止的次數大為增加,在排除定時功能的影響下,過高的啟動/停止次數(遠大於通電次數0C)暗示硬碟電機及其驅動電路可能有問題。
這個引數的當前值是依據某種公式計算的結果,例如對希捷某硬碟來說臨界值為20,當前值是透過公式“100-(啟停計數/1024)”計算得出的。若新硬碟的啟停計數為0,當前值為100-(0/1024)=100,隨著啟停次數的增加,該值不斷下降,當啟停次數達到81920次時,當前值為100-(81920/1024)=20,已達到臨界值,表示從啟停次數來看,該硬碟已達設計壽命,當然這只是個壽命參考值,並不具有確定的指標性。
這一項對於固態硬碟同樣沒有意義,資料固定為0,當前值固定為100。
05(005)重對映扇區計數 Reallocated Sectors Count/ 退役塊計數 Retired Block Count
資料應為0,當前值應遠大於臨界值。
當硬碟的某扇區持續出現讀/寫/校驗錯誤時,硬碟韌體程式會將這個扇區的物理地址加入缺陷表(G-list),將該地址重新定向到預先保留的備用扇區並將其中的資料一併轉移,這就稱為重對映。執行重對映操作後的硬碟在Windows常規檢測中是無法發現不良扇區的,因其地址已被指向備用扇區,這等於遮蔽了不良扇區。
這項引數的資料值直接表示已經被重對映扇區的數量,當前值則隨著資料值的增加而持續下降。當發現此項的資料值不為零時,要密切注意其發展趨勢,若能長期保持穩定,則硬碟還可以正常執行;若資料值不斷上升,說明不良扇區不斷增加,硬碟已處於不穩定狀態,應當考慮更換了。如果當前值接近或已到達臨界值(此時的資料值並不一定很大,因為不同硬碟保留的備用扇區數並不相同),表示缺陷表已滿或備用扇區已用盡,已經失去了重對映功能,再出現不良扇區就會顯現出來並直接導致資料丟失。
這一項不僅是硬碟的壽命關鍵引數,而且重對映扇區的數量也直接影響硬碟的效能,例如某些硬碟會出現資料量很大,但當前值下降不明顯的情況,這種硬碟儘管還可正常執行,但也不宜繼續使用。因為備用扇區都是位於磁碟尾部(靠近碟片軸心處),大量的使用備用扇區會使尋道時間增加,硬碟效能明顯下降。
這個引數在機械硬碟上是非常敏感的,而對於固態硬碟來說同樣具有重要意義。快閃記憶體的壽命是正態分佈的,例如說MLC能寫入一萬次以上,實際上說的是寫入一萬次之前不會發生“批次損壞”,但某些單元可能寫入幾十次就損壞了。換言之,機械硬碟的碟片不會因讀寫而損壞,出現不良扇區大多與工藝質量相關,而快閃記憶體的讀寫次數則是有限的,因而損壞是正常的。所以固態硬碟在製造時也保留了一定的空間,當某個儲存單元出現問題後即把損壞的部分隔離,用好的部分來頂替。這一替換方法和機械硬碟的扇區重對映是一個道理,只不過機械硬碟正常時極少有重對映操作,而對於固態硬碟是經常性的。
在固態硬碟中這一項的資料會隨著使用而不斷增長,只要增長的速度保持穩定就可以。通常情況下,資料值=100-(100×被替換塊/必需塊總數),因此也可以估算出硬碟的剩餘壽命。
Intel固態硬碟型號的第十二個字母表示了兩種規格,該字母為1表示第一代的50奈米技術的SSD,為2表示第二代的34奈米技術的SSD,如SSDSA2M160G2GN就表示是34nm的SSD。所以引數的檢視也有兩種情況:
50nm的SSD(一代)要看當前值。這個值初始是100,當出現替換塊的時候這個值並不會立即變化,一直到已替換四個塊時這個值變為1,之後每增加四個塊當前值就+1。也就是100對應0~3個塊,1對應4~7個塊,2對應8~11個塊……
34nm的SSD(二代)直接檢視資料值,資料值直接表示有多少個被替換的塊。
06(006)讀取通道餘量 Read Channel Margin
這一項功能不明,現在的硬碟也不顯示這一項。
07(007)尋道錯誤率 Seek Error Rate
資料應為0,當前值應遠大於與臨界值。
這一項表示磁頭尋道時的錯誤率,有眾多因素可導致尋道錯誤率上升,如磁頭元件的機械系統、伺服電路有區域性問題,碟片表面介質不良,硬碟溫度過高等等。
通常此項的資料應為0,但對希捷硬碟來說,即使是新硬碟,這一項也可能有很大的資料量,這不代表有任何問題,還是要看當前值是否下降。
08(008)尋道效能 Seek Time Performance
此項表示硬碟尋道操作的平均效能(尋道速度),通常與前一項(尋道錯誤率)相關聯。當前值持續下降標誌著磁頭元件、尋道電機或伺服電路出現問題,但現在許多硬碟並不顯示這一項。
09(009)通電時間累計 Power-On Time Count (POH)
這個引數的含義一目瞭然,表示硬碟通電的時間,資料值直接累計了裝置通電的時長,新硬碟當然應該接近0,但不同硬碟的計數單位有所不同,有以小時計數的,也有以分、秒甚至30秒為單位的,這由磁碟製造商來定義。
這一引數的臨界值通常為0,當前值隨著硬碟通電時間增加會逐漸下降,接近臨界值表明硬碟已接近預計的設計壽命,當然這並不表明硬碟將出現故障或立即報廢。參考磁碟製造商給出的該型號硬碟的MTBF(平均無故障時間)值,可以大致估計剩餘壽命或故障機率。
對於固態硬碟,要注意“裝置優先電源管理功能(device initiated power management,DIPM)”會影響這個統計:如果啟用了DIPM,持續通電計數里就不包括睡眠時間;如果關閉了DIPM功能,那麼活動、空閒和睡眠三種狀態的時間都會被統計在內。
0A(010)主軸起旋重試次數 Spin up Retry Count
資料應為0,當前值應大於臨界值。
主軸起旋重試次數的資料值就是主軸電機嘗試重新啟動的計數,即主軸電機啟動後在規定的時間裡未能成功達到額定轉速而嘗試再次啟動的次數。資料量的增加表示電機驅動電路或是機械子系統出現問題,整機供電不足也會導致這一問題。
0B(011)磁頭校準重試計數 Calibration Retry Count
硬碟在溫度發生變化時,機械部件(特別是碟片)會因熱脹冷縮出現形變,因此需要執行磁頭校準操作消除誤差,有的硬碟還內建了磁頭定時校準功能。這一項記錄了需要再次校準(通常因上次校準失敗)的次數。
這一項的資料量增加,表示電機驅動電路或是機械子系統出現問題,但有些型號的新硬碟也有一定的資料量,並不表示有問題,還要看當前值和最差值。
0C(012)通電週期計數 Power Cycle Count
通電週期計數的資料值表示了硬碟通電/斷電的次數,即電源開關次數的累計,新硬碟通常只有幾次。
這一項與啟停計數(04)是有區別的,一般來說,硬碟通電/斷電意味著計算機的開機與關機,所以經歷一次開關機資料才會加1;而啟停計數(04)表示硬碟主軸電機的啟動/停止(硬碟在執行時可能多次啟停,如系統進入休眠或被設定為空閒多少時間而關閉)。所以大多情況下這個通電/斷電的次數會小於啟停計數(04)的次數。
通常,硬碟設計的通電次數都很高,如至少5000次,因此這一計數只是壽命參考值,本身不具指標性。
0D(013)軟體讀取錯誤率 Soft Read Error Rate
軟體讀取錯誤率也稱為可校正的讀取誤位元速率,就是報告給作業系統的未經校正的讀取錯誤。資料值越低越好,過高則可能暗示碟片磁介質有問題。
AA(170)壞塊增長計數 Grown Failing Block Count(Micron 鎂光)
讀寫失敗的塊增長的總數。
AB(171)程式設計失敗塊計數 Program Fail Block Count
Flash程式設計失敗塊的數量。
AC(172)擦寫失敗塊計數 Erase Fail Block Count
擦寫失敗塊的數量。
AD(173)磨損平衡操作次數(平均擦寫次數) / Wear Leveling Count(Micron 鎂光)
所有好塊的平均擦寫次數。
Flash晶片有寫入次數限制,當使用FAT檔案系統時,需要頻繁地更新檔案分配表。如果快閃記憶體的某些區域讀寫過於頻繁,就會比其它區域磨損的更快,這將明顯縮短整個硬碟的壽命(即便其它區域的擦寫次數還遠小於最大限制)。所以,如果讓整個區域具有均勻的寫入量,就可明顯延長晶片壽命,這稱為磨損均衡措施。
AE(174)意外失電計數 Unexpected Power Loss Count
硬碟自啟用後發生意外斷電事件的次數。
B1(177)磨損範圍對比值 Wear Range Delta
磨損最重的塊與磨損最輕的塊的磨損百分比之差。
B4(180)未用的備用塊計數 Unused Reserved Block Count Total(惠普)
固態硬碟會保留一些容量來準備替換損壞的儲存單元,所以可用的預留空間數非常重要。這個引數的當前值表示的是尚未使用的預留的儲存單元數量。
B5(181)程式設計失敗計數 Program Fail Count
用4個位元組顯示已程式設計失敗的次數,與(AB)引數相似。
B5(181)非4KB對齊訪問數 Non-4k Aligned Access(Micron 鎂光)
B6(182)擦寫失敗計數 Erase Fail Count
用4個位元組顯示硬碟自啟用後塊擦寫失敗的次數,與(AC)引數相似。
B7(183)串列埠降速錯誤計數 SATA Downshift Error Count
這一項表示了SATA介面速率錯誤下降的次數。通常硬碟與主機板之間的相容問題會導致SATA傳輸級別降級執行。
B8(184)I/O錯誤檢測與校正 I/O Error Detection and Correction(IOEDC)
“I/O錯誤檢測與校正”是惠普公司專有的SMART IV技術的一部分,與其他製造商的I/O錯誤檢測和校正架構一樣,它記錄了資料透過驅動器內部快取記憶體RAM傳輸到主機時的奇偶校驗錯誤數量。
B8(184)點到點錯誤檢測計數 End to End Error Detection Count
Intel第二代的34nm固態硬碟有點到點錯誤檢測計數這一項。固態硬盤裡有一個LBA(logical block addressing,邏輯塊地址)記錄,這一項顯示了SSD內部邏輯塊地址與真實物理地址間對映的出錯次數。
B8(184)原始壞塊數 Init Bad Block Count(Indilinx晶片)
硬碟出廠時已有的壞塊數量。
B9(185)磁頭穩定性 Head Stability(西部資料)
意義不明。
BA(186)感應運算振動檢測 nduced Op-Vibration Detection(西部資料)
BB(187)無法校正的錯誤 Reported Uncorrectable Errors(希捷)
報告給作業系統的無法透過硬體ECC校正的錯誤。如果資料值不為零,就應該備份硬碟上的資料了。
報告給作業系統的在所有存取命令中出現的無法校正的RAISE(URAISE)錯誤。
BC(188)命令超時 Command Timeout
由於硬碟超時導致操作終止的次數。通常資料值應為0,如果遠大於零,最有可能出現的是電源供電問題或者資料線氧化致使接觸不良,也可能是硬碟出現嚴重問題。
BD(189)高飛寫入 High Fly Writes
磁頭飛行高度監視裝置可以提高讀寫的可靠性,這一裝置時刻監測磁頭的飛行高度是否在正常範圍來保證可靠的寫入資料。如果磁頭的飛行高度出現偏差,寫入操作就會停止,然後嘗試重新寫入或者換一個位置寫入。這種持續的監測過程提高了寫入資料的可靠性,同時也降低了讀取錯誤率。這一項的資料值就統計了寫入時磁頭飛行高度出現偏差的次數。
BD(189)出廠壞塊計數 Factory Bad Block Count(Micron 鎂光晶片)
BE(190)氣流溫度 Airflow Temperature
這一項表示的是硬碟內部碟片表面的氣流溫度。在希捷公司的某些硬碟中,當前值=(100-當前溫度),因此氣流溫度越高,當前值就越低,最差值則是當前值曾經到達過的最低點,臨界值由製造商定義的最高允許溫度來確定,而資料值不具實際意義。許多硬碟也沒有這一項引數。
BF(191)衝擊錯誤率 G-sense error rate
這一項的資料值記錄了硬碟受到機械衝擊導致出錯的頻度。
C0(192)斷電返回計數 Power-Off Retract Count
當計算機關機或意外斷電時,硬碟的磁頭都要返回停靠區,不能停留在碟片的資料區裡。正常關機時電源會給硬碟一個通知,即Standby Immediate,就是說主機要求將快取資料寫入硬碟,然後就準備關機斷電了(休眠、待機也是如此);意外斷電則表示硬碟在未收到關機通知時就失電,此時磁頭會自動復位,迅速離開碟片。
這個引數的資料值累計了磁頭返回的次數。但要注意這個引數對某些硬碟來說僅記錄意外斷電時磁頭的返回動作;而某些硬碟記錄了所有(包括休眠、待機,但不包括關機時)的磁頭返回動作;還有些硬碟這一項沒有記錄。因此這一引數的資料值在某些硬碟上持續為0或稍大於0,但在另外的硬碟上則會大於通電週期計數(0C)或啟停計數(04)的資料。在一些新型節能硬碟中,這一引數的資料量還與硬碟的節能設計相關,可能會遠大於通電週期計數(0C)或啟停計數(04)的資料,但又遠小於磁頭載入/解除安裝計數(C1)的資料量。
對於固態硬碟來說,雖然沒有磁頭的載入/解除安裝操作,但這一項的資料量仍然代表了不安全關機,即發生意外斷電的次數。
C1(193)磁頭載入/解除安裝計數 Load/Unload Cycle Count
對於過去的硬碟來說,碟片停止旋轉時磁頭臂停靠於碟片中心軸處的停泊區,磁頭與碟片接觸,只有當碟片旋轉到一定轉速時,磁頭才開始漂浮於碟片之上並開始向外側移動至資料區。這使得磁頭在硬碟啟停時都與碟片發生摩擦,雖然碟片的停泊區不儲存資料,但無疑啟停一個迴圈,就使磁頭經歷兩次磨損。所以對以前的硬碟來說,磁頭起降(載入/解除安裝)次數是一項重要的壽命關鍵引數。
而在現代硬碟中,平時磁頭臂是停靠於碟片之外的一個專門設計的停靠架上,遠離碟片。只有當碟片旋轉達到額定轉速後,磁頭臂才開始向內(碟片軸心)轉動使磁頭移至碟片區域(載入),磁頭臂向外轉動返回至停靠架即解除安裝。這樣就徹底杜絕了硬碟啟停時磁頭與碟片接觸的現象,西部資料公司將其稱為“斜坡載入技術”。由於磁頭在載入/解除安裝過程中始終不與碟片接觸,不存在磁頭的磨損,使得這一引數的重要性已經大大下降。
這個引數的資料值就是磁頭執行載入/解除安裝操作的累計次數。從原理上講,這個載入/解除安裝次數應當與硬碟的啟停次數相當,但對於筆記本內建硬碟以及桌上型電腦新型節能硬碟來說,這一項的資料量會很大。這是因為磁頭臂元件設計有一個固定的返回力矩,保證在意外斷電時磁頭能靠彈簧力自動離開碟片半徑範圍,迅速返回停靠架。所以要讓硬碟執行時磁頭保持在碟片的半徑之內,就要使磁頭臂驅動電機(尋道電機)持續通以電流。而讓磁頭臂在硬碟空閒幾分鐘後就立即執行解除安裝動作,返回到停靠架上,既有利於節能,又降低了硬碟受外力衝擊導致磁頭與碟片接觸的機率。雖然再次載入會增加一點尋道時間,但畢竟弊大於利,所以在這類硬碟中磁頭的載入/解除安裝次數會遠遠大於通電週期計數(0C)或啟停計數(04)的資料量。不過這種載入/解除安裝方式已經沒有了磁頭與碟片的接觸,所以設計值也已大大增加,通常筆記本內建硬碟的磁頭載入/解除安裝額定值在30~60萬次,而桌上型電腦新型節能硬碟的磁頭載入/解除安裝設計值可達一百萬次。
C2(194)溫度 Temperature
溫度的資料值直接表示了硬碟內部的當前溫度。硬碟執行時最好不要超過45℃,溫度過高雖不會導致資料丟失,但引起的機械變形會導致尋道與讀寫錯誤率上升,降低硬碟效能。硬碟的最高允許執行溫度可檢視硬碟廠商給出的資料,一般不會超過60℃。
不同廠家對溫度引數的當前值、最差值和臨界值有不同的表示方法:希捷公司某些硬碟的當前值就是實際溫度(攝氏)值,最差值則是曾經達到過的最高溫度,臨界值不具意義;而西部資料公司一些硬碟的最差值是溫度上升到某值後的時間函式,每次升溫後的持續時間都將導致最差值逐漸下降,當前值則與當前溫度成反比,即當前溫度越高,當前值越低,隨實際溫度波動。
C3(195)硬體ECC校正 Hardware ECC Recovered
ECC(Error Correcting Code)的意思是“錯誤檢查和糾正”,這個技術能夠容許錯誤,並可以將錯誤更正,使讀寫操作得以持續進行,不致因錯誤而中斷。這一項的資料值記錄了磁頭在碟片上讀寫時透過ECC技術校正錯誤的次數,不過許多硬碟有其製造商特定的資料結構,因此資料量的大小並不能直接說明問題。
C3(195)實時無法校正錯誤計數 On the fly ECC Uncorrectable Error Count
這一引數記錄了無法校正(UECC)的錯誤數量。
C3(195)程式設計錯誤塊計數 Program Failure block Count(Indilinx晶片)
C4(196)重對映事件計數 Reallocetion Events Count
這個引數的資料值記錄了將重對映扇區的資料轉移到備用扇區的嘗試次數,是重對映操作的累計值,成功的轉移和不成功的轉移都會被計數。因此這一引數與重對映扇區計數(05)相似,都是反映硬碟已經存在不良扇區。
C4(196)擦除錯誤塊計數 Erase Failure block Count(Indilinx晶片)
在固態硬碟中,這一引數記錄了被重對映的塊程式設計失敗的數量。
C5(197)當前待對映扇區計數 Current Pending Sector Count
這個引數的資料表示了“不穩定的”扇區數,即等待被對映的扇區(也稱“被掛起的扇區”)數量。如果不穩定的扇區隨後被讀寫成功,該扇區就不再列入等待範圍,資料值就會下降。
僅僅讀取時出錯的扇區並不會導致重對映,只是被列入“等待”,也許以後讀取就沒有問題,所以只有在寫入失敗時才會發生重對映。下次對該扇區寫入時如果繼續出錯,就會產生一次重對映操作,此時重對映扇區計數(05)與重對映事件計數(C4)的資料值增加,此引數的資料值下降。
C5(197)讀取錯誤塊計數(不可修復錯誤)Read Failure block Count(Indilinx晶片)
C6(198)離線無法校正的扇區計數 Offline Uncorrectable Sector Count
這個引數的資料累計了讀寫扇區時發生的無法校正的錯誤總數。資料值上升表明碟片表面介質或機械子系統出現問題,有些扇區肯定已經不能讀取,如果有檔案正在使用這些扇區,作業系統會返回讀盤錯誤的資訊。下一次寫操作時會對該扇區執行重對映。
C6(198)總讀取頁數 Total Count of Read Sectors(Indilinx晶片)
C7(199)Ultra ATA訪問校驗錯誤率 Ultra ATA CRC Error Rate
這個引數的資料值累計了透過介面迴圈冗餘校驗(Interface Cyclic Redundancy Check,ICRC)發現的資料線傳輸錯誤的次數。如果資料值不為0且持續增長,表示硬碟控制器→資料線→硬碟接口出現錯誤,劣質的資料線、介面接觸不良都可能導致此現象。由於這一項的資料值不會復零,所以某些新硬碟也會出現一定的資料量,只要更換資料線後資料值不再繼續增長,即表示問題已得到解決。
C7(199)總寫入頁數 Total Count of Write Sectors(Indilinx晶片)
C8(200)寫入錯誤率 Write Error Rate / 多區域錯誤率 Multi-Zone Error Rate(西部資料)
這個引數的資料累計了向扇區寫入資料時出現錯誤的總數。有的新硬碟也會有一定的資料量,若資料值持續快速升高(當前值偏低),表示碟片、磁頭元件可能有問題。
C8(200)總讀取指令數 Total Count of Read Command(Indilinx晶片)
C9(201)脫道錯誤率 Off Track Error Rate / 邏輯讀取錯誤率 Soft Read Error Rate
資料值累積了讀取時脫軌的錯誤數量,如果資料值不為0,最好備份硬碟上的資料。
C9(201)TA Counter Detected(意義不明)
C9(201)寫入指令總數 Total Count of Write Command(Indilinx晶片)
CA(202)資料地址標記錯誤 Data Address Mark errors
此項的資料值越低越好(或者由製造商定義)。
CA(202)TA Counter Increased(意義不明)
CA(202)剩餘壽命 Percentage Of The Rated Lifetime Used(Micron 鎂光晶片)
當前值從100開始下降至0,表示所有塊的擦寫餘量統計。計算方法是以MLC擦寫次數除以50,SLC擦寫次數除以1000,結果取整數,將其與100的差值作為當前值(MLC預計擦寫次數為5000,SLC預計擦寫次數為100000)。
CA(202)快閃記憶體總錯誤bit數 Total Count of error bits from flash(Indilinx晶片)
SMART引數詳解
01(001)底層資料讀取錯誤率 Raw Read Error Rate
資料為0或任意值,當前值應遠大於與臨界值。
底層資料讀取錯誤率是磁頭從磁碟表面讀取資料時出現的錯誤,對某些硬碟來說,大於0的資料表明磁碟表面或者讀寫磁頭髮生問題,如介質損傷、磁頭汙染、磁頭共振等等。不過對希捷硬碟來說,許多硬碟的這一項會有很大的資料量,這不代表有任何問題,主要是看當前值下降的程度。
在固態硬碟中,此項的資料值包含了可校正的錯誤與不可校正的RAISE錯誤(UECC+URAISE)。
注:RAISE(Redundant Array of Independent Silicon Elements)意為獨立矽元素冗餘陣列,是固態硬碟特有的一種冗餘恢復技術,保證內部有類似RAID陣列的資料安全性。
02(002)磁碟讀寫通量效能 Throughput Performance
此引數表示硬碟的讀寫通量效能,資料值越大越好。當前值如果偏低或趨近臨界值,表示硬碟存在嚴重的問題,但現在的硬碟通常顯示資料值為0或根本不顯示此項,一般在進行了人工離線SMART測試後才會有資料量。
03(003)主軸起旋時間 Spin Up Time
主軸起旋時間就是主軸電機從啟動至達到額定轉速所用的時間,資料值直接顯示時間,單位為毫秒或者秒,因此資料值越小越好。不過對於正常硬碟來說,這一項僅僅是一個參考值,硬碟每次的啟動時間都不相同,某次啟動的稍慢些也不表示就有問題。
硬碟的主軸電機從啟動至達到額定轉速大致需要4秒~15秒左右,過長的啟動時間說明電機驅動電路或者軸承機構有問題。旦這一引數的資料值在某些型號的硬碟上總是為0,這就要看當前值和最差值來判斷了。
對於固態硬碟來說,所有的資料都是儲存在半導體積體電路中,沒有主軸電機,所以這項沒有意義,資料固定為0,當前值固定為100。
04(004)啟停計數 Start/Stop Count
這一引數的資料是累計值,表示硬碟主軸電機啟動/停止的次數,新硬碟通常只有幾次,以後會逐漸增加。系統的某些功能如空閒時關閉硬碟等會使硬碟啟動/停止的次數大為增加,在排除定時功能的影響下,過高的啟動/停止次數(遠大於通電次數0C)暗示硬碟電機及其驅動電路可能有問題。
這個引數的當前值是依據某種公式計算的結果,例如對希捷某硬碟來說臨界值為20,當前值是透過公式“100-(啟停計數/1024)”計算得出的。若新硬碟的啟停計數為0,當前值為100-(0/1024)=100,隨著啟停次數的增加,該值不斷下降,當啟停次數達到81920次時,當前值為100-(81920/1024)=20,已達到臨界值,表示從啟停次數來看,該硬碟已達設計壽命,當然這只是個壽命參考值,並不具有確定的指標性。
這一項對於固態硬碟同樣沒有意義,資料固定為0,當前值固定為100。
05(005)重對映扇區計數 Reallocated Sectors Count/ 退役塊計數 Retired Block Count
資料應為0,當前值應遠大於臨界值。
當硬碟的某扇區持續出現讀/寫/校驗錯誤時,硬碟韌體程式會將這個扇區的物理地址加入缺陷表(G-list),將該地址重新定向到預先保留的備用扇區並將其中的資料一併轉移,這就稱為重對映。執行重對映操作後的硬碟在Windows常規檢測中是無法發現不良扇區的,因其地址已被指向備用扇區,這等於遮蔽了不良扇區。
這項引數的資料值直接表示已經被重對映扇區的數量,當前值則隨著資料值的增加而持續下降。當發現此項的資料值不為零時,要密切注意其發展趨勢,若能長期保持穩定,則硬碟還可以正常執行;若資料值不斷上升,說明不良扇區不斷增加,硬碟已處於不穩定狀態,應當考慮更換了。如果當前值接近或已到達臨界值(此時的資料值並不一定很大,因為不同硬碟保留的備用扇區數並不相同),表示缺陷表已滿或備用扇區已用盡,已經失去了重對映功能,再出現不良扇區就會顯現出來並直接導致資料丟失。
這一項不僅是硬碟的壽命關鍵引數,而且重對映扇區的數量也直接影響硬碟的效能,例如某些硬碟會出現資料量很大,但當前值下降不明顯的情況,這種硬碟儘管還可正常執行,但也不宜繼續使用。因為備用扇區都是位於磁碟尾部(靠近碟片軸心處),大量的使用備用扇區會使尋道時間增加,硬碟效能明顯下降。
這個引數在機械硬碟上是非常敏感的,而對於固態硬碟來說同樣具有重要意義。快閃記憶體的壽命是正態分佈的,例如說MLC能寫入一萬次以上,實際上說的是寫入一萬次之前不會發生“批次損壞”,但某些單元可能寫入幾十次就損壞了。換言之,機械硬碟的碟片不會因讀寫而損壞,出現不良扇區大多與工藝質量相關,而快閃記憶體的讀寫次數則是有限的,因而損壞是正常的。所以固態硬碟在製造時也保留了一定的空間,當某個儲存單元出現問題後即把損壞的部分隔離,用好的部分來頂替。這一替換方法和機械硬碟的扇區重對映是一個道理,只不過機械硬碟正常時極少有重對映操作,而對於固態硬碟是經常性的。
在固態硬碟中這一項的資料會隨著使用而不斷增長,只要增長的速度保持穩定就可以。通常情況下,資料值=100-(100×被替換塊/必需塊總數),因此也可以估算出硬碟的剩餘壽命。
Intel固態硬碟型號的第十二個字母表示了兩種規格,該字母為1表示第一代的50奈米技術的SSD,為2表示第二代的34奈米技術的SSD,如SSDSA2M160G2GN就表示是34nm的SSD。所以引數的檢視也有兩種情況:
50nm的SSD(一代)要看當前值。這個值初始是100,當出現替換塊的時候這個值並不會立即變化,一直到已替換四個塊時這個值變為1,之後每增加四個塊當前值就+1。也就是100對應0~3個塊,1對應4~7個塊,2對應8~11個塊……
34nm的SSD(二代)直接檢視資料值,資料值直接表示有多少個被替換的塊。
06(006)讀取通道餘量 Read Channel Margin
這一項功能不明,現在的硬碟也不顯示這一項。
07(007)尋道錯誤率 Seek Error Rate
資料應為0,當前值應遠大於與臨界值。
這一項表示磁頭尋道時的錯誤率,有眾多因素可導致尋道錯誤率上升,如磁頭元件的機械系統、伺服電路有區域性問題,碟片表面介質不良,硬碟溫度過高等等。
通常此項的資料應為0,但對希捷硬碟來說,即使是新硬碟,這一項也可能有很大的資料量,這不代表有任何問題,還是要看當前值是否下降。
08(008)尋道效能 Seek Time Performance
此項表示硬碟尋道操作的平均效能(尋道速度),通常與前一項(尋道錯誤率)相關聯。當前值持續下降標誌著磁頭元件、尋道電機或伺服電路出現問題,但現在許多硬碟並不顯示這一項。
09(009)通電時間累計 Power-On Time Count (POH)
這個引數的含義一目瞭然,表示硬碟通電的時間,資料值直接累計了裝置通電的時長,新硬碟當然應該接近0,但不同硬碟的計數單位有所不同,有以小時計數的,也有以分、秒甚至30秒為單位的,這由磁碟製造商來定義。
這一引數的臨界值通常為0,當前值隨著硬碟通電時間增加會逐漸下降,接近臨界值表明硬碟已接近預計的設計壽命,當然這並不表明硬碟將出現故障或立即報廢。參考磁碟製造商給出的該型號硬碟的MTBF(平均無故障時間)值,可以大致估計剩餘壽命或故障機率。
對於固態硬碟,要注意“裝置優先電源管理功能(device initiated power management,DIPM)”會影響這個統計:如果啟用了DIPM,持續通電計數里就不包括睡眠時間;如果關閉了DIPM功能,那麼活動、空閒和睡眠三種狀態的時間都會被統計在內。
0A(010)主軸起旋重試次數 Spin up Retry Count
資料應為0,當前值應大於臨界值。
主軸起旋重試次數的資料值就是主軸電機嘗試重新啟動的計數,即主軸電機啟動後在規定的時間裡未能成功達到額定轉速而嘗試再次啟動的次數。資料量的增加表示電機驅動電路或是機械子系統出現問題,整機供電不足也會導致這一問題。
0B(011)磁頭校準重試計數 Calibration Retry Count
資料應為0,當前值應遠大於與臨界值。
硬碟在溫度發生變化時,機械部件(特別是碟片)會因熱脹冷縮出現形變,因此需要執行磁頭校準操作消除誤差,有的硬碟還內建了磁頭定時校準功能。這一項記錄了需要再次校準(通常因上次校準失敗)的次數。
這一項的資料量增加,表示電機驅動電路或是機械子系統出現問題,但有些型號的新硬碟也有一定的資料量,並不表示有問題,還要看當前值和最差值。
0C(012)通電週期計數 Power Cycle Count
通電週期計數的資料值表示了硬碟通電/斷電的次數,即電源開關次數的累計,新硬碟通常只有幾次。
這一項與啟停計數(04)是有區別的,一般來說,硬碟通電/斷電意味著計算機的開機與關機,所以經歷一次開關機資料才會加1;而啟停計數(04)表示硬碟主軸電機的啟動/停止(硬碟在執行時可能多次啟停,如系統進入休眠或被設定為空閒多少時間而關閉)。所以大多情況下這個通電/斷電的次數會小於啟停計數(04)的次數。
通常,硬碟設計的通電次數都很高,如至少5000次,因此這一計數只是壽命參考值,本身不具指標性。
0D(013)軟體讀取錯誤率 Soft Read Error Rate
軟體讀取錯誤率也稱為可校正的讀取誤位元速率,就是報告給作業系統的未經校正的讀取錯誤。資料值越低越好,過高則可能暗示碟片磁介質有問題。
AA(170)壞塊增長計數 Grown Failing Block Count(Micron 鎂光)
讀寫失敗的塊增長的總數。
AB(171)程式設計失敗塊計數 Program Fail Block Count
Flash程式設計失敗塊的數量。
AC(172)擦寫失敗塊計數 Erase Fail Block Count
擦寫失敗塊的數量。
AD(173)磨損平衡操作次數(平均擦寫次數) / Wear Leveling Count(Micron 鎂光)
所有好塊的平均擦寫次數。
Flash晶片有寫入次數限制,當使用FAT檔案系統時,需要頻繁地更新檔案分配表。如果快閃記憶體的某些區域讀寫過於頻繁,就會比其它區域磨損的更快,這將明顯縮短整個硬碟的壽命(即便其它區域的擦寫次數還遠小於最大限制)。所以,如果讓整個區域具有均勻的寫入量,就可明顯延長晶片壽命,這稱為磨損均衡措施。
AE(174)意外失電計數 Unexpected Power Loss Count
硬碟自啟用後發生意外斷電事件的次數。
B1(177)磨損範圍對比值 Wear Range Delta
磨損最重的塊與磨損最輕的塊的磨損百分比之差。
B4(180)未用的備用塊計數 Unused Reserved Block Count Total(惠普)
固態硬碟會保留一些容量來準備替換損壞的儲存單元,所以可用的預留空間數非常重要。這個引數的當前值表示的是尚未使用的預留的儲存單元數量。
B5(181)程式設計失敗計數 Program Fail Count
用4個位元組顯示已程式設計失敗的次數,與(AB)引數相似。
B5(181)非4KB對齊訪問數 Non-4k Aligned Access(Micron 鎂光)
B6(182)擦寫失敗計數 Erase Fail Count
用4個位元組顯示硬碟自啟用後塊擦寫失敗的次數,與(AC)引數相似。
B7(183)串列埠降速錯誤計數 SATA Downshift Error Count
這一項表示了SATA介面速率錯誤下降的次數。通常硬碟與主機板之間的相容問題會導致SATA傳輸級別降級執行。
B8(184)I/O錯誤檢測與校正 I/O Error Detection and Correction(IOEDC)
“I/O錯誤檢測與校正”是惠普公司專有的SMART IV技術的一部分,與其他製造商的I/O錯誤檢測和校正架構一樣,它記錄了資料透過驅動器內部快取記憶體RAM傳輸到主機時的奇偶校驗錯誤數量。
B8(184)點到點錯誤檢測計數 End to End Error Detection Count
Intel第二代的34nm固態硬碟有點到點錯誤檢測計數這一項。固態硬盤裡有一個LBA(logical block addressing,邏輯塊地址)記錄,這一項顯示了SSD內部邏輯塊地址與真實物理地址間對映的出錯次數。
B8(184)原始壞塊數 Init Bad Block Count(Indilinx晶片)
硬碟出廠時已有的壞塊數量。
B9(185)磁頭穩定性 Head Stability(西部資料)
意義不明。
BA(186)感應運算振動檢測 nduced Op-Vibration Detection(西部資料)
意義不明。
BB(187)無法校正的錯誤 Reported Uncorrectable Errors(希捷)
報告給作業系統的無法透過硬體ECC校正的錯誤。如果資料值不為零,就應該備份硬碟上的資料了。
報告給作業系統的在所有存取命令中出現的無法校正的RAISE(URAISE)錯誤。
BC(188)命令超時 Command Timeout
由於硬碟超時導致操作終止的次數。通常資料值應為0,如果遠大於零,最有可能出現的是電源供電問題或者資料線氧化致使接觸不良,也可能是硬碟出現嚴重問題。
BD(189)高飛寫入 High Fly Writes
磁頭飛行高度監視裝置可以提高讀寫的可靠性,這一裝置時刻監測磁頭的飛行高度是否在正常範圍來保證可靠的寫入資料。如果磁頭的飛行高度出現偏差,寫入操作就會停止,然後嘗試重新寫入或者換一個位置寫入。這種持續的監測過程提高了寫入資料的可靠性,同時也降低了讀取錯誤率。這一項的資料值就統計了寫入時磁頭飛行高度出現偏差的次數。
BD(189)出廠壞塊計數 Factory Bad Block Count(Micron 鎂光晶片)
BE(190)氣流溫度 Airflow Temperature
這一項表示的是硬碟內部碟片表面的氣流溫度。在希捷公司的某些硬碟中,當前值=(100-當前溫度),因此氣流溫度越高,當前值就越低,最差值則是當前值曾經到達過的最低點,臨界值由製造商定義的最高允許溫度來確定,而資料值不具實際意義。許多硬碟也沒有這一項引數。
BF(191)衝擊錯誤率 G-sense error rate
這一項的資料值記錄了硬碟受到機械衝擊導致出錯的頻度。
C0(192)斷電返回計數 Power-Off Retract Count
當計算機關機或意外斷電時,硬碟的磁頭都要返回停靠區,不能停留在碟片的資料區裡。正常關機時電源會給硬碟一個通知,即Standby Immediate,就是說主機要求將快取資料寫入硬碟,然後就準備關機斷電了(休眠、待機也是如此);意外斷電則表示硬碟在未收到關機通知時就失電,此時磁頭會自動復位,迅速離開碟片。
這個引數的資料值累計了磁頭返回的次數。但要注意這個引數對某些硬碟來說僅記錄意外斷電時磁頭的返回動作;而某些硬碟記錄了所有(包括休眠、待機,但不包括關機時)的磁頭返回動作;還有些硬碟這一項沒有記錄。因此這一引數的資料值在某些硬碟上持續為0或稍大於0,但在另外的硬碟上則會大於通電週期計數(0C)或啟停計數(04)的資料。在一些新型節能硬碟中,這一引數的資料量還與硬碟的節能設計相關,可能會遠大於通電週期計數(0C)或啟停計數(04)的資料,但又遠小於磁頭載入/解除安裝計數(C1)的資料量。
對於固態硬碟來說,雖然沒有磁頭的載入/解除安裝操作,但這一項的資料量仍然代表了不安全關機,即發生意外斷電的次數。
C1(193)磁頭載入/解除安裝計數 Load/Unload Cycle Count
對於過去的硬碟來說,碟片停止旋轉時磁頭臂停靠於碟片中心軸處的停泊區,磁頭與碟片接觸,只有當碟片旋轉到一定轉速時,磁頭才開始漂浮於碟片之上並開始向外側移動至資料區。這使得磁頭在硬碟啟停時都與碟片發生摩擦,雖然碟片的停泊區不儲存資料,但無疑啟停一個迴圈,就使磁頭經歷兩次磨損。所以對以前的硬碟來說,磁頭起降(載入/解除安裝)次數是一項重要的壽命關鍵引數。
而在現代硬碟中,平時磁頭臂是停靠於碟片之外的一個專門設計的停靠架上,遠離碟片。只有當碟片旋轉達到額定轉速後,磁頭臂才開始向內(碟片軸心)轉動使磁頭移至碟片區域(載入),磁頭臂向外轉動返回至停靠架即解除安裝。這樣就徹底杜絕了硬碟啟停時磁頭與碟片接觸的現象,西部資料公司將其稱為“斜坡載入技術”。由於磁頭在載入/解除安裝過程中始終不與碟片接觸,不存在磁頭的磨損,使得這一引數的重要性已經大大下降。
這個引數的資料值就是磁頭執行載入/解除安裝操作的累計次數。從原理上講,這個載入/解除安裝次數應當與硬碟的啟停次數相當,但對於筆記本內建硬碟以及桌上型電腦新型節能硬碟來說,這一項的資料量會很大。這是因為磁頭臂元件設計有一個固定的返回力矩,保證在意外斷電時磁頭能靠彈簧力自動離開碟片半徑範圍,迅速返回停靠架。所以要讓硬碟執行時磁頭保持在碟片的半徑之內,就要使磁頭臂驅動電機(尋道電機)持續通以電流。而讓磁頭臂在硬碟空閒幾分鐘後就立即執行解除安裝動作,返回到停靠架上,既有利於節能,又降低了硬碟受外力衝擊導致磁頭與碟片接觸的機率。雖然再次載入會增加一點尋道時間,但畢竟弊大於利,所以在這類硬碟中磁頭的載入/解除安裝次數會遠遠大於通電週期計數(0C)或啟停計數(04)的資料量。不過這種載入/解除安裝方式已經沒有了磁頭與碟片的接觸,所以設計值也已大大增加,通常筆記本內建硬碟的磁頭載入/解除安裝額定值在30~60萬次,而桌上型電腦新型節能硬碟的磁頭載入/解除安裝設計值可達一百萬次。
C2(194)溫度 Temperature
溫度的資料值直接表示了硬碟內部的當前溫度。硬碟執行時最好不要超過45℃,溫度過高雖不會導致資料丟失,但引起的機械變形會導致尋道與讀寫錯誤率上升,降低硬碟效能。硬碟的最高允許執行溫度可檢視硬碟廠商給出的資料,一般不會超過60℃。
不同廠家對溫度引數的當前值、最差值和臨界值有不同的表示方法:希捷公司某些硬碟的當前值就是實際溫度(攝氏)值,最差值則是曾經達到過的最高溫度,臨界值不具意義;而西部資料公司一些硬碟的最差值是溫度上升到某值後的時間函式,每次升溫後的持續時間都將導致最差值逐漸下降,當前值則與當前溫度成反比,即當前溫度越高,當前值越低,隨實際溫度波動。
C3(195)硬體ECC校正 Hardware ECC Recovered
ECC(Error Correcting Code)的意思是“錯誤檢查和糾正”,這個技術能夠容許錯誤,並可以將錯誤更正,使讀寫操作得以持續進行,不致因錯誤而中斷。這一項的資料值記錄了磁頭在碟片上讀寫時透過ECC技術校正錯誤的次數,不過許多硬碟有其製造商特定的資料結構,因此資料量的大小並不能直接說明問題。
C3(195)實時無法校正錯誤計數 On the fly ECC Uncorrectable Error Count
這一引數記錄了無法校正(UECC)的錯誤數量。
C3(195)程式設計錯誤塊計數 Program Failure block Count(Indilinx晶片)
C4(196)重對映事件計數 Reallocetion Events Count
資料應為0,當前值應遠大於臨界值。
這個引數的資料值記錄了將重對映扇區的資料轉移到備用扇區的嘗試次數,是重對映操作的累計值,成功的轉移和不成功的轉移都會被計數。因此這一引數與重對映扇區計數(05)相似,都是反映硬碟已經存在不良扇區。
C4(196)擦除錯誤塊計數 Erase Failure block Count(Indilinx晶片)
在固態硬碟中,這一引數記錄了被重對映的塊程式設計失敗的數量。
C5(197)當前待對映扇區計數 Current Pending Sector Count
資料應為0,當前值應遠大於臨界值。
這個引數的資料表示了“不穩定的”扇區數,即等待被對映的扇區(也稱“被掛起的扇區”)數量。如果不穩定的扇區隨後被讀寫成功,該扇區就不再列入等待範圍,資料值就會下降。
僅僅讀取時出錯的扇區並不會導致重對映,只是被列入“等待”,也許以後讀取就沒有問題,所以只有在寫入失敗時才會發生重對映。下次對該扇區寫入時如果繼續出錯,就會產生一次重對映操作,此時重對映扇區計數(05)與重對映事件計數(C4)的資料值增加,此引數的資料值下降。
C5(197)讀取錯誤塊計數(不可修復錯誤)Read Failure block Count(Indilinx晶片)
C6(198)離線無法校正的扇區計數 Offline Uncorrectable Sector Count
資料應為0,當前值應遠大於臨界值。
這個引數的資料累計了讀寫扇區時發生的無法校正的錯誤總數。資料值上升表明碟片表面介質或機械子系統出現問題,有些扇區肯定已經不能讀取,如果有檔案正在使用這些扇區,作業系統會返回讀盤錯誤的資訊。下一次寫操作時會對該扇區執行重對映。
C6(198)總讀取頁數 Total Count of Read Sectors(Indilinx晶片)
C7(199)Ultra ATA訪問校驗錯誤率 Ultra ATA CRC Error Rate
這個引數的資料值累計了透過介面迴圈冗餘校驗(Interface Cyclic Redundancy Check,ICRC)發現的資料線傳輸錯誤的次數。如果資料值不為0且持續增長,表示硬碟控制器→資料線→硬碟接口出現錯誤,劣質的資料線、介面接觸不良都可能導致此現象。由於這一項的資料值不會復零,所以某些新硬碟也會出現一定的資料量,只要更換資料線後資料值不再繼續增長,即表示問題已得到解決。
C7(199)總寫入頁數 Total Count of Write Sectors(Indilinx晶片)
C8(200)寫入錯誤率 Write Error Rate / 多區域錯誤率 Multi-Zone Error Rate(西部資料)
資料應為0,當前值應遠大於臨界值。
這個引數的資料累計了向扇區寫入資料時出現錯誤的總數。有的新硬碟也會有一定的資料量,若資料值持續快速升高(當前值偏低),表示碟片、磁頭元件可能有問題。
C8(200)總讀取指令數 Total Count of Read Command(Indilinx晶片)
C9(201)脫道錯誤率 Off Track Error Rate / 邏輯讀取錯誤率 Soft Read Error Rate
資料值累積了讀取時脫軌的錯誤數量,如果資料值不為0,最好備份硬碟上的資料。
C9(201)TA Counter Detected(意義不明)
C9(201)寫入指令總數 Total Count of Write Command(Indilinx晶片)
CA(202)資料地址標記錯誤 Data Address Mark errors
此項的資料值越低越好(或者由製造商定義)。
CA(202)TA Counter Increased(意義不明)
CA(202)剩餘壽命 Percentage Of The Rated Lifetime Used(Micron 鎂光晶片)
當前值從100開始下降至0,表示所有塊的擦寫餘量統計。計算方法是以MLC擦寫次數除以50,SLC擦寫次數除以1000,結果取整數,將其與100的差值作為當前值(MLC預計擦寫次數為5000,SLC預計擦寫次數為100000)。
CA(202)快閃記憶體總錯誤bit數 Total Count of error bits from flash(Indilinx晶片)