1. 低格硬碟數據深度恢復 200高分請不吝賜教
低格後再寫入數據的硬碟要恢復低格前的數據,目前國內幾本無法全完恢復。
問題1:真的有讀盤機能夠恢復硬碟的數據嗎?
最近幾年,國內的數據恢復行業有了較大的發展,人們對這個行業也逐漸有了一定的認識,但出於商業利益的考慮,從事這個行業的商家在技術上遮遮掩掩,甚至故弄玄虛,讓消費者不辯真假,自從國內某網站發了幾個號稱是國外的讀盤機的照片後,被人炒的沸沸揚揚,有人還寫文章說國內哪兒有這個設備在對外服務,更有無良商家號稱自己開發出了這種設備,現對外服務雲雲,坑騙消費者;真的有這種設備嗎?我們下面就有關的技術問題做一個探討。
要不依靠磁頭,採用所謂的激光直接讀取硬碟的數據,目前從原理上來說無非有兩種方法:一種是利用磁光的克爾效應,一種是利用已在磁性材料研究方面廣泛應用的磁力顯微鏡,下面我們詳細分析一下它們各自的原理和局限性。
一、磁光克爾效應
克爾效應是1876年由物理學家克爾發現的,當偏振光照射到磁性物質上發生反射時,反射光的偏振角在磁場的作用下會發生改變;那麼如果我們將一束偏振光照到硬碟的碟片上,再檢測它的反射光的偏振角的變化不就能讀出硬碟上的數據嗎?理論上是這樣,甚至我們都能買到這樣的產品,那就是MO,可惜到現在3.5吋的MO最大容量也不過1個多G,算上硬碟的兩個面也就3G左右,誰還會有單碟容量3G的盤要用這種方法恢復數據呢?那為什麼不能生產容量大一些的呢?如果要生產大容量的產品,就要減小偏振光的波長,必然需要短波長的偏振光發生器,而現在最大容量的藍光光碟的容量才多大呢?那還是5.25吋的,要3.25吋容量還更小;同時因為克爾效應所產生的偏振角的改變是非常小的,只有零點幾度,而且還要受到磁場強度和偏振光波長的影響,即便有了滿足容量要求的偏振光發生器,這么高精度的檢偏器也生產不出來,更何況它們還必須做成一體的,而且這種方法的讀取速度也是很慢的,大家看看MO的速度就知道,所以使用這個原理的讀盤機是不存在的,那網站的圖片是什麼呢?由於圖片不夠清晰,不能准確分辯其生產廠和型號,就只能讓人去猜測了。
二、磁力顯微鏡
磁力顯微鏡是上世紀80年代末發明的一種顯微鏡,它是將一個以很小的探針懸在磁性物質的上面,在磁場的作用下,探針會發生偏轉進而帶動上面的一個小鏡面,利用一束激光照射鏡面,然後探測激光的反射角的變化來檢測磁場的大小,再將激光的偏轉角經過光電轉換形成磁場的偽圖像的裝置(有興趣深入研究的話,可以下載附件看看);如果是硬碟碟片的話,用磁力顯微鏡可以得到碟片上的磁力圖,按理說是可以得到硬碟的數據的,但請注意,我發現在磁力圖上不能分辯磁化的方向,要知道硬碟上可是用磁化方向的改變來判定0和1的,但這個似乎還不是大問題,問題是,磁力顯微鏡一次能觀測的范圍很小,約10×10平方微米,耗時約5分鍾,大家可以算算,要用它完整掃描3.5吋盤的一個面需要多長時間,更不要說多盤面的硬碟了,而且,在轉換掃描點的過程中的准確定位問題如何解決?還有,它得到的是圖像文件,大家可以想像一下一個完整盤面的數據量會有多大?要將這些圖片拼接識別成數據需要什麼樣的電腦來處理呢?所以這個方法也不太現實。
除了上面分析的原因外,還有其它的方面,一是硬碟存儲數據的時候並不是我們往數據介面上輸入個1它就寫個1,它是經過RLL編碼才寫入的,不同型號的硬碟編碼的方式不一定相同,再加上不同的硬碟的0磁軌的起點不同,壞道的數量、位置不同(P-List、G-List不同)需要識別的工作量就更大。只有所有的這些技術問題都得到了完滿的解決才能生產出所謂的讀盤機,這樣的可能性在現有的技術條件下有多大呢?
既然採用所謂激光直接讀取碟片數據的讀盤機不可能生產出來,那麼有沒有其它辦法生產出能直接讀取碟片上的數據的設備呢?理論上是可能的,不過依然只能使用磁頭來讀取數據,在碟片生產過程中有一種碟片動態測試儀就是這么工作的,它能測出碟片的信噪比和誤碼率,不過它測試的碟片連伺服信息都沒有,如果是讀取一個寫了數據的碟片,那麼它的定位、中心調整、動平衡等機械問題和數據預放、ECC、CRC、RLL解碼、P-List、G-List的處理等工作,特別是機械方面的難度是非常大的,更何況要適應所有廠家、所有型號的硬碟就更困難,反正到現在也沒見到過類似的數據恢復設備,但有數據恢復研究機構早就在做一些研究性的工作,感興趣的網友可以下載附件研究研究,希望有一天能見到這種設備在數據恢復工作中使用,畢竟市場的需求是很大的,如果真的像大家希望的連碟片物理損壞都能讀到數據那何樂而不為呢。
問題2:數據恢復機構能恢復覆蓋了的數據嗎?
我們有時會看到數據恢復機構的廣告中說他們能恢復覆蓋了的數據,在網上也能查到有關的說法;這可能有兩種情況,第一種是他們能恢復被部分覆蓋的介質的沒有覆蓋的部分的數據,第二種情況是他們的確有能力恢復被覆蓋的扇區覆蓋前的數據。
如果只是第一種情況,那麼顯然這些廣告或文章中偷換了概念,對數據恢復方面稍有了解的人都知道,沒有覆蓋的部分的數據依然是存在的,要恢復它並不是一件困難的事;而第二種情況顯然要復雜得多,通過查閱相關的資料發現有很多說法認為覆蓋前的數據是有可能恢復的,主要有以下幾種理由:第一種理由是,由於縱向磁記錄的硬碟的磁介質由多層的小磁柱組成,在磁頭對介質磁化的過程中,下層的小磁柱沒有被充分磁化而保留了原來的數據信息,只要用適當的設備讀取深層磁柱的信號,就能分析出覆蓋前的數據;第二種理由是由於硬碟主要是由機械部件構成的數據記錄媒體,那麼在記錄過程中因為機械的重復性誤差的存在,使得後寫入的數據不能准確覆蓋前面的數據,在磁力顯微鏡下是能看到在現有數據記錄的邊緣還有前面的記錄的殘存,這樣通過分析邊緣的殘存的信息就能恢復覆蓋前的數據;第三種理由是由於磁性材料在外磁場撤銷後(就是磁頭移位後)的磁場強度會發生微小的變化,那麼如果是在原來為0的數據位寫上了個1,那麼它的磁場強度就只有0.95個標准1的強度,如果是在原來為1的數據位上寫上了個1,那麼它的磁場強度就有1.05個標准1的強度,這樣,只要在硬碟的預放電路部分接上一個足夠靈敏的放大器,將磁頭讀取的信號放大後與標準的1的電平進行比較就能得到覆蓋前的數據。
經過查閱相關的資料,我們發現關於深層數據恢復的說法似乎並無根據,由於硬碟的數據是用RLL編碼的形式編碼後存入硬碟的,而RLL編碼有一個很重要的特性就是只有有翻轉才有數值的變化,然後再根據編碼規律進行解碼;既然磁頭在寫入數據時需要讓小磁柱翻轉,那麼它寫入時的磁場強度必須足夠大,至少要大於磁性材料的矯頑力,實際上還要大才行,這樣就不存在深層的粒子無法翻轉的情況,至於測量其磁場強度,目前並沒有發現相關的實驗方法,而且就算能測量,由於已經發生了翻轉,還有什麼意義呢?
關於後兩種說法,查閱資料發現都來源於Peter Gutmann的《Secure Deletion of Data from Magnetic and Solid-State Memory》,在IEEE上有很多相關的文章,其中關於邊緣殘留問題,我沒有找到原文中提到的磁力顯微鏡的磁力圖,但從本站的附件的Data-Independent Data Recovery Ver14Alrs.pdf中看到確實存在,這也是我查閱了大量資料後唯一發現的一張圖片,但請大家注意,這篇Gutmann的文章第一次發表於1996年,那時的硬碟容量很小,磁軌寬度和間距都很大、碟片轉速低,對機械的精度要求低,所以有這種情況,而Data-Independent Data Recovery Ver14Alrs.pdf中的圖片也無法確認是用什麼盤做的實驗;在很多的爭論文章中,這位Daniel FeenBerg的《Can Intelligence Agencies Read Overwritten Data?》中描述了Gutmann的圖片情況,也並不是每一張圖的每一位都能看到邊緣的殘留,那麼這少量分散的殘留對恢復數據有什麼意義呢?同時,由於磁力顯微鏡的解析度最高就只有30nm,而現在的硬碟的磁軌寬度已經接近甚至小於這個數,那還怎麼分辨邊緣的那一點點殘留呢?
關於0上寫1和1上寫1的問題,由於有翻轉才有數值的改變,那麼如果是往IDE口寫個1或0,經過編碼已經不是原來的1和0了,如果是編碼後的情況,那麼還有1上寫0和0上寫0的情況,0和1並不是用磁場強度的大小來衡量的,而是根據翻轉來衡量的,這樣一來,這種說法就沒有什麼意義了。
在《Can Intelligence Agencies Read Overwritten Data?》中作者還調查了幾個國家的相關機構,並沒有發現哪裡能恢復已被覆蓋了的數據,而且這篇文章的發表日期還晚幾年,所以從目前的情況來看,已經被覆蓋的數據還是沒有被恢復的直接證據的。
當然,由於條件所限,我沒查到更多的IEEE中的相關研究文獻,如果哪位網友有有關的資料,我很有興趣研究一下。
問題3:國內數據恢復市場初步印象!
因為工作的原因,去年有機會對國內的數據恢復市場做了個初步的了解,這兩年國內的數據恢復市場的發展的確很快,用戶對數據恢復的需求也有較大增長,同時對數據恢復行業也逐漸有了了解。
我通過網上搜索的方式找尋有實力的數據恢復機構,同時也走訪了國內的一些電腦市場,盡可能的找機會到可能有實力的數據恢復機構考察,發現現在國內的數據恢復機構差不多遍地開花,很多電腦市場都能看到數據恢復廣告,數據恢復培訓機構也很容易找到。
數據恢復是一個比較特殊的行業,可以說是在用最原始的工具解決一些非常棘手的技術問題,是對客戶出現意外情況的一種補救措施,它對機構的設備、管理、人員技術素質和職業道德水準有很高的要求,忽視任何一個問題都有可能給客戶帶來進一步的損失,從我的了解來看目前國內的數據恢復行業的狀況是令人擔憂的。
首先,我們說說設備,從各種數據恢復機構的網站上看,國內似乎擁有國際最先進的設備,幾乎個個機構都有100級的無塵設備,擁有全套的開盤設備,甚至電腦市場的一個攤檔就聲稱有讀盤機,能處理任何的硬體故障,因為只要拆出碟片就能將數據讀出來;但仔細看看網頁就會發現,大多數聲稱擁有無塵設備的機構都是盜用國內外相關機構的網頁圖片,或者是利用客戶不了解無塵設備知識的情況,將一個根本就沒有空氣過濾系統的房間或玻璃箱樣的東西聲稱為無塵設備,更有甚者,用繪圖軟體畫個模糊的圖像也說是無塵工作間,這些機構要麼是在普通的工作環境下開盤,要麼又將客戶的介質交給另一家聲稱擁有無塵設備的機構去處理,由於部分硬碟故障的確在普通環境下打開盤體處理能夠成功,所以這些機構就這樣不負責任地處理,實際上由此給更多的客戶帶來了不可估量的損失;從我的調查來看,國內真正擁有1000級無塵室又對外開展數據恢復服務的機構寥寥無幾,即使是擁有能滿足開盤要求的無塵工作台的機構也沒幾家 (就不要提100級的無塵室了,數據恢復沒必要,它的建設和運營成本也受不了),還有機構聲稱可以借用硬碟生產廠的無塵廠房開盤,這更是不可能,那麼大一個廠房,要滿足生產硬碟的技術要求,需要連續24小時開機,頭一天還不能工作,它的電費就不是數據恢復的利潤能負擔得起的。
人員的情況也不容樂觀,看看網上售賣的那些中文的資料價格和需求量以及漢化軟體的下載量就知道,如果算上電腦市場那些攤檔的話,國內數據恢復從業人員能看懂英文設備說明書的比例都不容樂觀,更不要說閱讀相關的英文技術資料了,大多數的機構就是從網上下載幾個數據恢復的軟體(有的還一定得漢化的)就開業了,只要電腦能認盤,就用軟體搜,也不認真分析數據丟失的原因,殊不知,有些數據丟失的情況是很復雜的,這樣盲目地用軟體讓硬碟長期工作,不但不能讓客戶得到滿意的結果還會帶來進一步的損壞;至於有些機構聲稱的研究能力,當然,的確有極少數的機構擁有進行深層技術研究所必須的專業人員和設備,但大多數是靠道聽途說的所謂經驗和秘籍在工作的,這特別表現在需要開盤的數據恢復方面,連最起碼的符合要求的無塵設備都沒有,研究從何而來;另外,有的機構聲稱的研究方向可能令全球的磁力學家汗顏,實際上,只要認真查查國內外的有關的技術文章就知道,他們聲稱的研究課題根本就不可能在研究,因為那樣的研究就連國外的磁力學專家也未必有條件去做,之所以這樣寫,不過是想擴大影響而已,對機構技術的提高是不會有任何幫助的。
再來說說數據恢復的成功率的問題,國內的數據恢復機構的廣告能力的確讓人佩服,我看到的最高的數據恢復成功率居然高達99.9%,開盤的數據恢復成功率也高達90%,這可能是世界上成功率最高的了,如果真有這樣的機構,不要說在國內,國外的情報機構恐怕要千方百計地網羅這樣的人才,實際的情況呢,真正能做到總體的成功率80%已經不容易了,估計很多的機構連50%也達不到,剩下本應該能恢復的30%完全因為他們的二次損壞導致客戶要付出更大的代價甚至完全無法恢復;至於開盤成功率,由於硬碟設計、生產和客觀條件的原因,針對不同型號的硬碟約在30%到80%之間,有些型號的硬碟由於其固有的特點,出現故障後,碟片嚴重劃傷的比例很高,我不知道他們怎麼能讀出數據,據我查閱的資料,就是國外的專業數據恢復機構對這類問題也沒有很好的解決方法。
另外,數據恢復還涉及到為客戶保密的問題,這需要從業機構從設備和管理上入手,同時從業人員也要有嚴格的道德約束,在這里就不作過多敘述了,希望出現意外的用戶能找到真正對自己負責的數據恢復機構來完成自己所希望的工作。
問題4:數據恢復機構如何「銷毀」您的數據?
看到這個標題,很多網友可能覺得不可思議,數據恢復機構不是幫客戶恢復數據的嗎?怎麼「銷毀」數據呢?請注意,我並不是說的正常的銷毀數據,而是說的在我們求助數據恢復機構的過程中,數據恢復機構出於種種原因,他們所採取的措施並不會導致恢復您的重要數據的結果,恰恰相反,可能導致您的重要數據不可能再被恢復或者恢復的難度被人為加大的情況。
我們在搜索引擎中搜索一下數據恢復網頁,您會看到,到處都是數據恢復權威、數據恢復專家等稱號,您打一個數據恢復機構的電話,很多時候,人家還沒聽完您的故障描述,就可能很肯定地告訴您,您的數據恢復的可能性在他們那裡是99%,等您真正送到那裡,您卻變成了那剩下的1% ,等您把存儲媒體送到下一家數據恢復機構的時候,被告知已經不可能恢復了,這是為什麼呢?當然有時是您的存儲媒體或數據的確由於損壞的情況很嚴重,在現有的技術條件下確實不能恢復,但另一個跟讓人遺憾的事實可能是第一個數據恢復機構由於技術、設備、職業道德或純粹出於商業競爭的目的等原因,有意或無意的行為導致您的存儲媒體或數據被進一步破壞了,由於目前數據恢復行業並沒有說由於數據恢復機構本身的原因導致的進一步損壞需要賠償(當然這個從技術上說沒有可操作性),所以種種手段被不斷上演,客戶的數據徹底丟失,欲哭無淚。我們下面談談可能給您的數據帶來「破壞」的種種情況。
一、不仔細了解客戶關於故障發生的過程和現象的描述就動手。由於某些設備的故障情況可以從客戶描述的故障發生過程和現象中推斷,如果可能是磁頭物理損壞等特別情況的話,盲目地通電檢查有可能帶來更嚴重的損壞(如磁頭進一步劃傷碟片等),甚至導致完全無法恢復。
二、沒徹底搞清楚設備的工作原理,拿客戶的設備做實驗品。有關國內數據恢復的實際情況,我們在國內數據恢復市場初步印象中已經做過介紹,但出於商業利益的目的,不少數據恢復機構往往過分誇大其能力和經驗,明知自己沒有完成這個工作的條件,還是接下客戶的設備拿來做實驗,這樣一來自己多了一個不花錢的實驗機會,讓競爭對手少了一個機會,同時萬一成功了,自己還能有一筆收入;這主要表現在RAID的數據恢復方面,由於大多數的機構不可能投資這么大一筆錢去進行有關的試驗、研究,如是客戶的設備就成了最好的試驗品,拿到手以後最常見的操作是重建RAID,客戶的數據被恢復回來的可能性是可想而知的。
三、只要認盤就用軟體來恢復,不仔細分析導致數據丟失或設備故障的原因。有很多時候,一個能被正確識別的盤的數據丟失可能是由於該盤長期處於硬體不穩定工作狀態導致的,這時再用軟體強行讓它工作進行數據恢復,能得到滿意結果的可能性很小,大多數情況下會導致硬體的進一步損壞甚至不能被正確識別,數據恢復的難度必然增大。
四、盤不轉就換板,不能解決的時候,有意或無意換掉客戶的電路板。由於有相當多型號的硬碟的電路板上有記憶該硬碟的專有參數的晶元,丟失了這個晶元而該型號的盤又沒有合適的設備重寫這部分信息的話,這個盤的數據恢復的可能性就沒有了。
五、動手能力太差,焊接的水平不過關。這同樣發生在第四條所說的硬碟上,由於焊接時的溫度、時間等的控制不好導致關鍵晶元損壞,結果是一樣的。可能大多數人認為焊接可能是維修中最簡單的活,實際上現在需要焊接的大多是SMT晶元,要用手工焊到廠家用專用設備才能做到的水平並不是一件很容易的事,而且在關鍵器件的焊接上必須保證做到100%成功,對於一個負責任的技術人員來說,在心理上本身就有壓力。
六、亂寫固件。由於固件中記憶了硬碟的壞道表,而現在的大容量硬碟的壞道表有多達數千甚至上萬的壞道數據記錄,如果該數據及可能能恢復壞道表的相關數據被破壞,那麼這個硬碟的數據被正確恢復的可能性微乎其微;同時象寫錯了不同磁頭數的硬碟固件等情況有可能導致數據徹底不能恢復。
七、在沒有無塵設備的情況下開盤。當然有一些的確成功了,但如果統計一下的話,絕對是沒有成功的要佔大多數;由於在沒有無塵設備的情況下開盤,不可避免地會有大量不同大小的灰塵進入盤體,即使盤能正常工作,也有可能由於這些灰塵引起的壞道導致重要數據恢復不正確,如果失敗的話就更慘,由於清洗硬碟碟片需要用到特殊的清洗劑,這種清洗劑是限制進口的,國家有嚴格的規定,數據恢復機構是不可能有這種清洗劑的,更何況還涉及到其它的技術問題;同時,更換盤體內的零件並不像人們想像的那樣擰上就好的,由於硬碟各個零件之間的配合機械精度要求很高,除了選擇合適的備件外,還需要進行調節,這對操作的技術人員本身就是一個挑戰,在普通的環境下進行這項工作,對數據可能帶來災難性的影響;而且像磁頭損壞等情況往往伴隨著固件的損壞,一個內部有灰塵而各零件之間的配合又沒有調節好的盤體,成功修復固件的概率是很低的。
八、恢復不成功,給硬碟設置密碼。當然這是針對盤能正確識別的情況,有些數據恢復機構為了不讓競爭對手恢復他們恢復不了的數據,給硬碟設置密碼;目前雖然有技術能解開部分型號的硬碟的密碼,但不能做到解開所有型號硬碟的密碼,這招的結果可想而之。
九、恢復不成功,將硬碟填0或低格。這同樣是針對上述的情況,目的也一樣,結果就要嚴重得多,因為已經不可能恢復了。
十、恢復不成功,將硬碟進一步破壞或調換。基於第八條的原因,同時可能發現您的盤體有利用價值,就拿一個沒什麼利用價值的同型盤交換,換盤的標簽早就不是什麼高技術活了
來自無憂存儲BBS
2. 電腦硬碟是如何記錄資料的
硬磁碟的存貯原理
硬磁碟是一種磁表面存儲器,其記錄信息的過程即是電磁信息的轉換過程,它是通過磁頭和磁記錄介質(碟片)共同實現的。
寫過程就是把要記錄的數據序列經過寫電路形成寫電流,寫電流經過寫線圈,產生與數據相對應的磁場,磁化磁頭縫隙下的磁介質層,完成「電_磁」轉換。當磁碟在磁頭下作恆速運動時,就將在碟片表面「刻」下一串與輸入電脈沖序列相應的小的磁化單元,從而完成了「寫入」過程。
在「讀出」信息時,碟片在磁頭下方運動,磁頭線圈將切割磁碟表面磁化單元的磁力線,在磁頭線圈內產生相應的感應電勢信號,該信號經過讀電路放大和處理就還原寫入的脈沖序列,完成了「磁_電」轉換,實現了「讀出」過程。
早期的磁表面存儲器在記錄二進制數據序列時,直接按數據序列的磁化狀態作記錄,不作任何編碼。這種非編碼的磁記錄方式的存儲密度、存取速度都很低,可靠性也很差。隨著磁表面存儲技術的發展,普遍採用了編碼磁記錄方式。目前,磁記錄的編碼方式有若干種,主要有FM、MFM、RLL三種編碼方式。
3. 光存儲系統的光存儲系統結構
光存儲系統由編解碼系統(Encoder&Decoder),讀寫信道(Channel),均衡器(Equalizer)和信號檢測器(Detector)組成。其中,CD、DVD等光存儲技術普遍使用RLL(d,k)編碼(RLL,RunLengthLimitedCode遊程長度受限碼),在通過讀寫信道之後使用均衡器(Equalizer)消除ISI(InterSymbolInterference,碼間干擾),然後經過檢測編碼和解碼後得到原始數據。
由前面的理論分析,使用RLL(1,7)編解碼,Braat-Hopkins信道模型,MMSE均衡器,使用Viterbi演算法作為檢測器(Detector)構建了和CD/DVD存儲系統相符合的光存儲系統模型。
4. 請教CD達人!翻錄問題
本文是《有多少錯誤可以忍耐?CD與DVD光碟質量深入探討》專題的一部分
可以說,CD光碟是人類信息化歷史上的一個重要的突破。CD最早於1982年10月份誕生,雖然距今已經有20多年的歷史,但它的相關設計在今天看來,仍是非常先進的,而且生命力仍然旺盛,即使是在DVD日益盛行的今天,也是重要的數據載體(媒介)。
要想了解CD光碟的糾錯原理,就不能不先了解CD光碟的數據結構,確切的說就是CD光碟上數據的編碼原理,它幾乎囊括了當時最先進的編碼技術,DVD與之相比,也並沒有本質的變化。
CD光碟最早的產品是CD-Audio,其技術規范被稱為紅皮書(Red Book),應用於唱片領域,所以即使有了日後的其他擴展規范,也都是以它為基礎制定的。
小資料:CD光碟的規范種類
CD光碟的規范被業界以不同顏色的Book來區分,目前共有以下幾種:
CD01.jpg
除此之外,還有兩個從黃皮書和綠皮書擴展出來的規范,它們分別是Multisession CD和Photo CD,索尼與飛利浦(CD的發明者)並沒有給它們單獨規定顏色。
在 CD光碟中,數據的最小的可訪問存儲單位是Block(塊),在CD-ROM規范中則稱之為Sector(扇區)。在Red Book規范中規定,它們由若干個子塊組成,這個子塊就是比較難於理解的幀(Frame)。什麼叫幀呢?我們可以理解為CD光碟編碼的單位。從下面這張CD光碟的數據流程圖中,我們可以了解幀與塊的關系和概念。
CD光碟的數據流程,以CD-Audio為例(點擊放大)
我們現在可以反向的來理解CD-Audio的數據結構的設計原理。由於CD-Audio分為左右立體聲道,每個聲道的取樣精度為16bit,取樣頻率為 44.1KHz,也就是說每秒取樣44100次。CD-Audio規定,每一秒鍾所讀取的塊數為75個,每個塊又包含98個幀,那麼采樣數分攤下來是多少呢?44100÷75÷98=6,也就是說每一幀的取樣次數為6次,每次兩個聲道,每聲道的取樣精度為16bit,因此一幀的容量就是 6×2×16=192bit=24位元組。這就是一幀數據為什麼是24位元組的來歷(請注意圖中紅圈的部分,那就是決定CD光碟糾錯的重要部分,也將是下文中著重介紹的內容)。
我們現在知道了CD光碟一個塊的容量就是2352位元組,這也是所有CD規范的通用塊容量。但是,後來出現的CD-ROM規范中則將扇區的內部設計進行了更改,
CD- ROM的幾種扇區格式(點擊放大):Mode 1就是我們常用的CD-ROM電腦數據光碟的格式,Mode 2則是CD-I、VCD、CD-ROM XA 等光碟的格式(其中Form 1也是電腦數據光碟格式)。其中ECC代表額外的錯誤糾正碼,EDC為錯誤檢測碼(CRC校驗)
注意,上圖只是扇區(塊)的格式圖,不要將它與上面的CD數據流程圖弄混了,尤其是ECC部分,與圖1中的「校驗」是兩碼事,這一點我們將在下文會進一步講到。
CD光碟的編碼與流程
CD光碟使用了兩種編碼來分別保證光碟的刻錄質量,一個是從信息的邏輯正確性上保證,一個是從物理刻錄的通道脈沖的識別可靠性上保證。它們分別是CIRC編碼與EFM調制編碼。
CIRC 的全稱是交叉交錯理德-所羅門編碼(Cross Interleaved Read-Solomon Code),它的主旨是除了增加二維糾錯編碼外,還將源數據打散,根據一定的規則進行擾頻和交錯編碼,使數據相互交叉交錯,從而進一步提高糾錯的能力,因為這樣一來用戶數據的錯誤將很難連續起來,有利於提高整體的糾錯能力。
點擊查看大圖
我們現在再來看看上面這張CD數據流程圖(點擊放大),圖中的編號就是CD刻錄時的數據生成的過程。
第一步首先生成一個幀的原始數據,24位元組,我們可以稱之為初始幀(在相關標准中則叫Frame-1,簡稱F1)
第二步就是加入CIRC編碼,一共8個位元組,我們可以稱之為校驗幀(在相關標准中則叫Frame-2,簡稱F2),總位元組數為32個。我們常說的,所謂的C1與C2糾錯碼就是在這一階段加進去的,C1與C2的C就是CIRC編碼的縮寫。
第三步就是加入控制碼,一個位元組,我們可以稱之為數據幀(在相關標准中則叫Frame-3,簡稱F3),此時幀的容量為33位元組。
之後每個F3幀再加入3個位元組的同步信息碼就成為了最終用於刻錄的幀,總容量為36位元組。最後經過EFM調制,基本上是以每位元組8bit轉換成每位元組17 bit的方式生成最終的信道脈沖(Channel bit)以控制刻錄激光的開與關。
什麼是EFM編碼呢?就是Eight to Fourteen Molation的縮寫,即8至14調制。為什麼會使用這樣的編碼對源數據進行「修改」呢?這還要從光碟的讀取原理說起。
光碟上的凹坑與平面並不直接代表0和1
光碟的讀取是根據反射激光的強弱來進行邏輯1與0的分辨,但激光反射功率的強與弱並不直接代表1或0。反射功率強弱的突變點,也就是反射電平的翻轉點,將被判斷為邏輯值1,長時間的凹坑與平面則都是邏輯值0。
這樣一來,如果是連續的1,那麼就意味著凹坑與平面要突變多次,會佔用更多的刻錄空間,從而將影響有效的數據容積(或者說是信息量),而若以電平的高低來代表1和0,如果連續的0或1很長,又很難判斷有多少個1和0,0與1的轉變也較難分辨,所以必須要加以一定的規則限制。這個規則可以藉助某種編碼方式來禁止連續的1,並且又能把連續的0的長度限制在某種范圍之內以利於識別,這就是所謂的「遊程限制(RLL,Run Length Limited)編碼規則」。
EFM就是這樣的一種專用於信息記錄的信道調制編碼,它將原始數據重新進行編排,以保證不會有連續的1出現,而連續的0則被控制在2至10 個之間,可以表示為RLL(2,10)。也就是說,光碟上的信息中,兩個邏輯1之間,最多有連續10個0,最少要有連續兩個0。這樣,有了相應的規則後,再配合時鍾計時信息(每個信道脈沖的時間長度),就可以准確的分辨出數據了。需要指出的是,當8bit數據重新編成14bit數據後,兩個14bit代碼之間則還要符合RLL(2,10)的要求,因此還要根據相鄰14bit代碼的情況加入3bit的合並碼(Merging bit),從而使最終的編碼長度變為17bit。
EFM調制編碼示意圖,為了保證兩個14位編碼之間仍符合RLL(2,10)的要求又加入了3位合並碼,因此EFM其實是8至17編碼
了解了CIRC與EFM在CD數據刻錄中的作用,就不難理解與之相關的CD刻錄質量標準的含義,下面我們就將深入介紹有關CD光碟的C1與C2編碼與糾錯標准。而與EFM相關的就是我們常常能聽到「高手」們討論的Jitter,將在本專題後面的章節詳細講述。
CIRC編碼流程
上文已經講過,每個24位元組的原始數據幀都要附加上8位元組的校驗碼以保證幀數據的可靠性,而這個校驗碼則分為兩個步驟來生成,我們來具體看一下。
點擊查看大圖
CIRC編碼流程圖(點擊放大),圖出的W12代表組成一個F1幀的12個字(16bit),n代表F1幀的編號,A、B代表組成一個字的兩個位元組(8bit)
第一步:交叉交錯後生成C2校驗碼
在介紹CD數據生成過程的時候,我們知道CIRC編碼處於F2生成階段,因此要先導入F1原始數據幀,也就是24位元組。要知道,之所以稱為CIRC編碼,是因為在編碼的過程中,源數據有交叉和交錯的過程。首先,源數據要按兩個字(圖中的A、B)一組分成6個大組,偶數組進行兩個位元組的延遲,從而形成擾頻交錯編碼。
這里要解釋一下所謂的延遲,兩個位元組的延遲意味著延遲兩幀。也就是說,當進行交錯之後,偶數組已經不再是原來F1幀中的源數據,而是當前幀的前兩幀中的偶數組數據(相對於前兩幀,當前幀就意味著兩個位元組的延遲),原始的偶數組將在後兩幀的交錯編碼中出現。另外,從圖中可以看出,字的順序在交錯後發生了很大不同,這種前後幀數據交叉並且順序交錯的過程就是擾頻交錯編碼。
此後,擾頻交錯後生成的新數據進入C2編碼器生成Q校驗碼。Q校驗碼為4位元組,最後生成的新數據為28位元組,因此C2也被稱為(28,24)編碼,意思是指輸入24個位元組,輸出28個位元組。
由此可見,C2編碼並是針對原始F1幀的數據進行,但為什麼要進行如此復雜的交叉交錯的編碼呢?這是為了保證糾錯效率而設計,下文將有更詳細的講述。
第二步:位元組依次延遲4幀後生成C1編碼
將 C2編碼完成後,將進行大規模的位元組延遲交錯編碼,執行這個操作的就是延遲線,延遲單位為4位元組,也就是說4幀,操作單位是每個字中的單個位元組。這個要怎麼理解呢?比方說,C2編碼後的的第一個位元組不延遲,第二個位元組則將延後4幀,第三位元組將延後8幀……如此反復直至第28個位元組,將被延後108幀。也就是說,C2編碼後的28個位元組,將被有規律的分散到109個幀中(第一個位元組延後0幀,加上最後一個位元組延後108幀,一共是109幀)。
延遲操作之後則進入了C1編碼器,顯然此時的數據與原始的F1幀數據差別更大了,C1編碼器將在28個位元組的基礎上再生成4個位元組的P校驗碼,從而完成了建立了 F2幀的操作。由於輸入28個位元組,輸出32個位元組,因此C1也被稱為(32,28)編碼。從這個過程中不難看出,C1編碼的對象中包含了C2編碼(雖然是交錯延後的),也承擔了對Q校驗碼進行保護的任務。
現在的F2幀已經與F1幀有了很大不同,如果幀編號為n,那麼F2-n幀中只有一個位元組來自於F1-n幀。所以,嚴格的講,C1、C2並不是對F1幀的校驗編碼,因為從C2編碼開始,對象就已經不再是F1幀中的原始數據。這樣(交叉交錯)的目的就在於防止一幀中出現連續大量的錯誤而無法糾正,如果原原本本地按原始F1——C2編碼——C1編碼的過程生成校驗碼,將是非常脆弱的,如果這一幀的24 個位元組中出現連續大量的錯誤碼,僅憑CIRC的設計,糾錯能力仍然有限。若將源數據分散到不同的數據幀中,然後再進行校驗,將大大提供單個數據幀的糾錯能力。理論上即使24個位元組原始數據全有問題,但由於每個位元組最終分布在間距為4的28個幀(跨度為109幀)中,也有可能被完全修復。顯然,如果不進行交叉交錯的話,這種可能性是不會存在的。
好啦,當我們了解了CD光碟的CIRC編碼過程之後,就不難理解CD的解碼過程,而解碼過程就涉及到了糾錯,糾錯的效果將體現刻錄的質量,或者說是驅動器的讀盤能力。
CD光碟中的C1與C2解碼流程圖(點擊放大)
在解碼時,其實就是CIRC解碼的反過程,原先C2先編碼,現在是C1先解碼,原先延遲的,解碼時不延遲,而原先不延遲的則會根據規則進行延遲以反交叉交錯進行數據還原。
從流程圖中,我們可以發現,C1、C2解碼是必經的過程,而並不像某些文章中所說的,C1應付不了的錯誤才會交給C2解碼。事實上,不管C1解碼過程中有沒有錯誤,都要C2解碼。從編碼過程中,我們可以知道,兩者所解碼的對象完全不同,這也是為什麼C1糾正不了的錯誤,C2反而能糾正,其實就是這個道理,而並不是說C2的糾錯級別比C1高。
言歸正傳,C1與C2的糾錯標準是怎樣的呢?這里,業界使用了錯誤等級來對C1與C2解碼進行了規定,可簡寫為En1和En2,其中E代表Error(錯誤),n代表出現錯誤的次數,1代表一次C1解碼過程,2代表一次C2解碼過程。
如果在一次C1解碼中,發現了一個錯誤位元組,即為E11,如果發現了兩個錯誤位元組即為E21,如果發現3個或更多的錯誤位元組即為E31。其中,E11與 E21都可以在C1階段糾正,而E31則不行。但是,不要忘了延遲交錯的設計,當前幀(F2)的錯誤位元組是分散在跨度為109幀的28個幀中,經過反延遲後,這些錯誤的位元組肯定不會再在同一幀中了,所以通過C2編碼仍然有可能被糾正。此時,如果在一次C2解碼中,發現了一個錯誤位元組,即為E12,如果發現了兩個錯誤位元組即為E22,如果發現了3個或更多的錯誤位元組,即為E32。與E31一樣,E32也不能在C2解碼過程被糾正,由於C2是最後一個CIRC 解碼器,所以E32的出現就意味著出現了一個不可修復的錯誤幀,因此它又稱為CU(C-Uncorrectable,不可修復),對於CD來說,CU是絕對要盡量避免出現的。
在CD測試系統中,專門為C1與C2設置了狀態標記(Flag),通過它們即可知道當前的糾錯狀態:
通過4個C1、C2狀態標記來表示糾錯狀態表
有關CD光碟糾錯的業界標准
在業界標准中,並沒有對C2錯誤水平進行明確規定,而是更多的對C1錯誤率進行了限定,這是因為如果C2錯誤肯定會有C1錯誤,但如果有C1錯誤,不見得會有C2錯誤。
在 CD-ROM的規范中規定,隨機錯誤的標準是,每10秒鍾出現C1解碼的錯誤(E11、E21或E31)幀數不超過3%。我們可以算一下,按一倍速1秒讀取75個扇區,每扇區98個幀計算,10秒鍾里共有10×75×98=73500個幀,3%就是2205個幀,約為平均一秒220個幀。由於一個壞幀就意味著一個壞塊(扇區),因此也可以認為塊錯誤率(BLER,BLock Error Rate)為每秒220個,我們可以理解為1秒鍾C1錯誤的總合(E11+E21+E31)不能超過220個。
對於連續的突發性錯誤,CD-ROM規范中規定,當在C1解碼時出現E31,則視為不可修復的幀錯誤,連續出現C1不可修復錯誤的幀要少於7個。
這里需要指出的是,BLER並不區分哪些塊是可以被修復的,哪些塊是不能被修復的,因為這里仍包括E31這一C1解碼器所不能修復的錯誤。所以低的BLER 並不能說明光碟質量的好壞。比如一張光碟的BLER=210,但沒有E31錯誤,而另一張光碟的BLER=50,但全是E31錯誤,那麼完全可以說後者的質量不及前者,雖然它的BLER更低,但有著E32的隱患。
小常識:關於CD光碟的C3解碼
在很多相關的文章中,大都提到CD光碟還會有一個C3解碼的過程,但這並不確切。
在上文中,我們已經講到CD光碟有多種規范,而各規范中的扇區格式並不相同,有的有ECC校驗碼,有的沒有ECC校驗碼,而這個ECC校驗就是所謂的C3解碼,可見並不是每個CD光碟規格都具備。
嚴格的說,扇區的ECC校驗並不是C3解碼,而是被稱為RSPC(Reed-Solomon ProdUCt-like Code,理德-所羅門乘積編碼)解碼。注意,CIRC是給每一幀進行校驗的編碼,而RSPC是給數據扇區進行校驗的編碼,兩者不要混淆。我們可以這樣理解:每個扇區——RSPC編碼—— 分成98個幀——每個幀再進行CIRC編碼——生成最後的 刻錄數據。
在支持CD-ROM/-R/-RW的驅動器中,也都會有相應的 RSPC解碼器,由於RSPC的存在,因此即使在C2解碼中出現了E32錯誤,仍有可能在RSPC解碼過程中進行修正。這也是為什麼CD- ROM(Mode 1和Mode 2-Form 1)是針對計算機數據存儲而開發的原因,保證數據文件的准確性遠比保證歌曲數據的准確性更重要。如果是普通的CD-Audio播放機,則不會有RSPC解碼器(Decoder)。
5. 全面的硬碟知識
硬碟,英文「hard-disk」簡稱HD 。是一種儲存量巨大的設備,作用是儲存計算機運行時需要的數據。
體現硬碟好壞的主要參數為傳輸率,其次的為轉速、單片容量、尋道時間、緩存、噪音和S.M.A.R.T.
1956年IBM公司製造出世界上第一塊硬碟350 RAMAC(Random Access Method of Accounting and Control),它的數據為:容量5MB、碟片直徑為24英寸、碟片數為50片、重量上百公斤。碟片上有一層磁性物質,被軸帶著旋轉,有磁頭移動著存儲數據,實現了隨機存取。
1970年磁碟誕生
1973年IBM公司製造出了一台640MB的硬碟、第一次採用「溫徹斯特」技術,是現在硬碟的開端,因為磁頭懸浮在碟片上方,所以鍍磁的碟片在密封的硬碟里可以飛速的旋轉,但有好幾十公斤重。
1975年Soft-adjacent layer(軟接近層)專利的MR磁頭結構產生
1979年IBM發明了薄膜磁頭,這意味著硬碟可以變的很小,速度可以更快,同體積下硬碟可以更大。
1979年IBM 3370誕生,它是第一款採用thin-film感應磁頭及Run-Length-Limited(RLL)編碼配置的硬碟,"2-7"RLL編碼將能減小硬碟錯誤
1986年IBM 9332誕生,它是第一款使用更高效的1-7 run-length-limited(RLL)代碼的硬碟。
1989年第一代MR磁頭出現
1991年IBM磁阻MR(Magneto Resistive)磁頭硬碟出現。帶動了一個G的硬碟也出現。磁阻磁頭對信號變化相當敏感,所以碟片的存儲密度可以得到幾十倍的提高。意味著硬碟的容量可以作的更大。意味著硬碟進入了G級時代。
1993年GMR(巨磁阻磁頭技術)推出,這使硬碟的存儲密度又上了一個台階。
認識硬碟
硬碟是電腦中的重要部件,大家所安裝的操作系統(如:Windows 9x、Windows 2k…)及所有的應用軟體(如:Dreamwaver、Flash、Photoshop…)等都是位於硬碟中,或許你沒感覺到吧!但硬碟確實非常重要,至少目前它還是我們存儲數據的主要場所,那你對硬碟究竟了解多少了?可能你對她一竅不通,不過沒關系,請見下文。
一、硬碟的歷史與發展
從第一塊硬碟RAMAC的產生到現在單碟容量高達15GB多的硬碟,硬碟也經歷了幾代的發展,下面就介紹一下其歷史及發展。
1.1956年9月,IBM的一個工程小組向世界展示了第一台磁碟存儲系統IBM 350 RAMAC(Random Access Method of Accounting and Control),其磁頭可以直接移動到碟片上的任何一塊存儲區域,從而成功地實現了隨機存儲,這套系統的總容量只有5MB,共使用了50個直徑為24英寸的磁碟,這些碟片表面塗有一層磁性物質,它們被疊起來固定在一起,繞著同一個軸旋轉。此款RAMAC在那時主要用於飛機預約、自動銀行、醫學診斷及太空領域內。
2.1968年IBM公司首次提出「溫徹斯特/Winchester」技術,探討對硬碟技術做重大改造的可能性。「溫徹斯特」技術的精隋是:「密封、固定並高速旋轉的鍍磁碟片,磁頭沿碟片徑向移動,磁頭懸浮在高速轉動的碟片上方,而不與碟片直接接觸」,這也是現代絕大多數硬碟的原型。
3.1973年IBM公司製造出第一台採用「溫徹期特」技術的硬碟,從此硬碟技術的發展有了正確的結構基礎。
4.1979年,IBM再次發明了薄膜磁頭,為進一步減小硬碟體積、增大容量、提高讀寫速度提供了可能。
5.80年代末期IBM對硬碟發展的又一項重大貢獻,即發明了MR(Magneto Resistive)磁阻,這種磁頭在讀取數據時對信號變化相當敏感,使得碟片的存儲密度能夠比以往20MB每英寸提高了數十倍。
6.1991年IBM生產的3.5英寸的硬碟使用了MR磁頭,使硬碟的容量首次達到了1GB,從此硬碟容量開始進入了GB數量級。
7.1999年9月7日,Maxtor宣布了首塊單碟容量高達10.2GB的ATA硬碟,從而把硬碟的容量引入了一個新里程碑。
8.2000年2月23日,希捷發布了轉速高達15,000RPM的Cheetah X15系列硬碟,其平均尋道時間只有3.9ms,這可算是目前世界上最快的硬碟了,同時它也是到目前為止轉速最高的硬碟;其性能相當於閱讀一整部Shakespeare只花.15秒。此系列產品的內部數據傳輸率高達48MB/s,數據緩存為4~16MB,支持Ultra160/m SCSI及Fibre Channel(光纖通道) ,這將硬碟外部數據傳輸率提高到了160MB~200MB/s。總得來說,希捷的此款("捷豹")Cheetah X15系列將硬碟的性能提高到了一個新的里程碑。
9.2000年3月16日,硬碟領域又有新突破,第一款「玻璃硬碟」問世,這就是IBM推出的Deskstar 75GXP及Deskstar 40GV,此兩款硬碟均使用玻璃取代傳統的鋁作為碟片材料,這能為硬碟帶來更大的平滑性及更高的堅固性。另外玻璃材料在高轉速時具有更高的穩定性。此外Deskstar 75GXP系列產品的最高容量達75GB,這是目前最大容量的硬碟,而Deskstar 40GV的數據存儲密度則高達14.3 十億數據位/每平方英寸,這再次涮新數據存儲密度世界記錄。
二、硬碟分類
目前的硬碟產品內部碟片有:5.25,3.5,2.5和1.8英寸(後兩種常用於筆記本及部分袖珍精密儀器中,現在台式機中常用3.5英寸的碟片);如果按硬碟與電腦之間的數據介面,可分為兩大類:IDE介面及SCSI介面硬碟兩大陣營。
三、技術規格
目前台式機中硬碟的外形差不了多少,在技術規格上有幾項重要的指標:
1.平均尋道時間(average seek time),指硬碟磁頭移動到數據所在磁軌時所用的時間,單位為毫秒(ms)。注意它與平均訪問時間的差別,平均尋道時間當然是越小越好,現在選購硬碟時應該選擇平均尋道時間低於9ms的產品。
2.平均潛伏期(average latency),指當磁頭移動到數據所在的磁軌後,然後等待所要的數據塊繼續轉動(半圈或多些、少些)到磁頭下的時間,單位為毫秒(ms)。
3.道至道時間(single track seek),指磁頭從一磁軌轉移至另一磁軌的時間,單位為毫秒(ms)。
4.全程訪問時間(max full seek),指磁頭開始移動直到最後找到所需要的數據塊所用的全部時間,單位為毫秒(ms)。
5.平均訪問時間(average access),指磁頭找到指定數據的平均時間,單位為毫秒。通常是平均尋道時間和平均潛伏時間之和。注意:現在不少硬碟廣告之中所說的平均訪問時間大部分都是用平均尋道時間所代替的。
6.最大內部數據傳輸率(internal data transfer rate),也叫持續數據傳輸率(sustained transfer rate),單位Mb/S(注意與MB/S之間的差別)。它指磁頭至硬碟緩存間的最大數據傳輸率,一般取決於硬碟的碟片轉速和碟片數據線密度(指同一磁軌上的數據間隔度)。注意,在這項指標中常常使用Mb/S或Mbps為單位,這是兆位/秒的意思,如果需要轉換成MB/S(兆位元組/秒),就必須將Mbps數據除以8(一位元組8位數)。例如,WD36400硬碟給出的最大內部數據傳輸率為131Mbps,但如果按MB/S計算就只有16.37MB/s(131/8)。
7.外部數據傳輸率:通稱突發數據傳輸率(burst data transfer rate),指從硬碟緩沖區讀取數據的速率,在廣告或硬碟特性表中常以數據介面速率代替,單位為MB/S。目前主流硬碟普通採用的是Ultra ATA/66,它的最大外部數據率即為66.7MB/s,而在SCSI硬碟中,採用最新的Ultra 160/m SCSI介面標准,其數據傳輸率可達160MB/s,採用Fibra Channel(光纖通道),最大外部數據傳輸將可達200MB/s。在廣告中我們有時能看到說雙Ultra 160/m SCSI的介面,這理論上將最大外部數據傳輸率提高到了320MB/s,但目前好像還沒有結合有此介面的產品推出。
8.主軸轉速:是指硬碟內主軸的轉動速度,目前ATA(IDE)硬碟的主軸轉速一般為5400~7200rpm,主流硬碟的轉速為7200RPM,至於SCSI硬碟的主軸轉速可達一般為7200~10,000RPM,而最高轉速的SCSI硬碟轉速高達15,000RPM(即希捷「捷豹X15」系列硬碟)。
9.數據緩存:指在硬碟內部的高速存儲器:目前硬碟的高速緩存一般為512KB~2MB,目前主流ATA硬碟的數據緩存應該為2MB,而在SCSI硬碟中最高的數據緩存現在已經達到了16MB。對於大數據緩存的硬碟在存取零散文件時具有很大的優勢。
10.硬碟表面溫度:它是指硬碟工作時產生的溫度使硬碟密封殼溫度上升情況。這項指標廠家並不提供,一般只能在各種媒體的測試數據中看到。硬碟工作時產生的溫度過高將影響薄膜式磁頭(包括GMR磁頭)的數據讀取靈敏度,因此硬碟工作表面溫度較低的硬碟有更好的數據讀、寫穩定性。如果對於高轉速的SCSI硬碟一般來說應該加一個硬碟冷卻裝置,這樣硬碟的工作穩定性才能得到保障。
11.MTBF(連續無故障時間):它指硬碟從開始運行到出現故障的最長時間,單位是小時。一般硬碟的MTBF至少在30000或40000小時。這項指標在一般的產品廣告或常見的技術特性表中並不提供,需要時可專門上網到具體生產該款硬碟的公司網址中查詢。
四、介面標准
ATA介面,這是目前台式機硬碟中普通採用的介面類型。
ST-506/412介面:
這是希捷開發的一種硬碟介面,首先使用這種介面的硬碟為希捷的ST-506及ST-412。ST-506介面使用起來相當簡便,它不需要任何特殊的電纜及接頭,但是它支持的傳輸速度很低,因此到了1987年左右這種介面就基本上被淘汰了,採用該介面的老硬碟容量多數都低於200MB。早期IBM PC/XT和PC/AT機器使用的硬碟就是ST-506/412硬碟或稱MFM硬碟,MFM(Modified Frequency Molation)是指一種編碼方案 。
ESDI介面:
即(Enhanced Small Drive Interface)介面,它是邁拓公司於1983年開發的。其特點是將編解碼器放在硬碟本身之中,而不是在控制卡上,理論傳輸速度是前面所述的ST-506的2…4倍,一般可達到10Mbps。但其成本較高,與後來產生的IDE介面相比無優勢可言,因此在九十年代後就補淘汰了
IDE及EIDE介面:
IDE(Integrated Drive Electronics)的本意實際上是指把控制器與盤體集成在一起的硬碟驅動器,我們常說的IDE介面,也叫ATA(Advanced Technology Attachment)介面,現在PC機使用的硬碟大多數都是IDE兼容的,只需用一根電纜將它們與主板或介面卡連起來就可以了。 把盤體與控制器集成在一起的做法減少了硬碟介面的電纜數目與長度,數據傳輸的可靠性得到了增強,硬碟製造起來變得更容易,因為廠商不需要再擔心自己的硬碟是否與其它廠商生產的控制器兼容,對用戶而言,硬碟安裝起來也更為方便。
ATA-1(IDE):
ATA是最早的IDE標準的正式名稱,IDE實際上是指連在硬碟介面的硬碟本身。ATA在主板上有一個插口,支持一個主設備和一個從設備,每個設備的最大容量為504MB,ATA最早支持的PIO-0模式(Programmed I/O-0)只有3.3MB/s,而ATA-1一共規定了3種PIO模式和4種DMA模式(沒有得到實際應用),要升級為ATA-2,你需要安裝一個EIDE適配卡。
ATA-2(EIDE Enhanced IDE/Fast ATA):
這是對ATA-1的擴展,它增加了2種PIO和2種DMA模式,把最高傳輸率提高到了16.7MB/s,同時引進了LBA地址轉換方式,突破了老BIOS固有504MB的限制,支持最高可達8.1GB的硬碟。如你的電腦支持ATA-2,則可以在CMOS設置中找到(LBA,LogicalBlock Address)或(CHS,Cylinder,Head,Sector)的設置。其兩個插口分別可以連接一個主設備和一個從設置,從而可以支持四個設備,兩個插口也分為主插口和從插口。通常可將最快的硬碟和CD—ROM放置在主插口上,而將次要一些的設備放在從插口上,這種放置方式對於486及早期的Pentium電腦是必要的,這樣可以使主插口連在快速的PCI匯流排上,而從插口連在較慢的ISA匯流排上。
ATA-3(FastATA-2):
這個版本支持PIO-4,沒有增加更高速度的工作模式(即仍為16.7MB/s),但引入了簡單的密碼保護的安全方案,對電源管理方案進行了修改,引入了S.M.A.R.T(Self-Monitoring,Analysis and Reporting Technology,自監測、分析和報告技術)
ATA-4(UltraATA、UltraDMA、UltraDMA/33、UltraDMA/66):
這個新標准將PIO-4下的最大數據傳輸率提高了一倍,達到33MB/s,或更高的66MB/s。它還在匯流排佔用上引入了新的技術,使用PC的DMA通道減少了CPU的處理負荷。要使用Ultra-ATA,需要一個空閑的PCI擴展槽,如果將UltraATA硬碟卡插在ISA擴展槽上,則該設備不可能達到其最大傳輸率,因為ISA匯流排的最大數據傳輸率只有8MB/s 。其中的Ultra ATA/66(即Ultra DMA/66)是目前主流桌面硬碟採用的介面類型,其支持最大外部數據傳輸率為66.7MB/s。
Serial ATA:
新的Serial ATA(即串列ATA),是英特爾公司在今年IDF(Intel Developer Forum,英特爾開發者論壇) 發布的將於下一代外設產品中採用的介面類型,就如其名所示,它以連續串列的方式傳送資料,在同一時間點內只會有1位數據傳輸,此做法能減小介面的針腳數目,用四個針就完成了所有的工作(第1針發出、2針接收、3針供電、4針地線)。這樣做法能降低電力消耗,減小發熱量。最新的硬碟介面類型ATA-100就是Serial ATA是初始規格,它支持的最大外部數據傳輸率達100MB/s,上面介紹的那兩款IBM Deskstar 75GXP及Deskstar 40GV就是第一次採用此ATA-100介面類型的產品。在2001年第二季度將推出Serial ATA 1x標準的產品,它能提高150MB/s的數據傳輸率。對於Serial ATA介面,一台電腦同時掛接兩個硬碟就沒有主、從盤之分了,各設備對電腦主機來說,都是Master,這樣我們可省了不少跳線功夫。
SCSI介面:
SCSI就是指Small Computer System Interface(小型計算機系統介面),它最早研製於1979,原是為小型機的研製出的一種介面技術,但隨著電腦技術的發展,現在它被完全移植到了普通PC上。現在的SCSI可以劃分為SCSI-1和SCSI-2(SCSI Wide與SCSI Wind Fast),最新的為SCSI-3,不過SCSI-2是目前最流行的SCSI版本。 SCSI廣泛應用於如:硬碟、光碟機、ZIP、MO、掃描儀、磁帶機、JAZ、列印機、光碟刻錄機等設備上。它的優點非常多主要表現為以下幾點:
1、適應面廣; 使用SCSI,你所接的設備就可以超過15個,而所有這些設備只佔用一個IRQ,這就可以避免IDE最大外掛15個外設的限制。
2、多任務;不像IDE,SCSI允許對一個設備傳輸數據的同時,另一個設備對其進行數據查找。這將在多任務操作系統如Linux、Windows NT中獲得更高的性能。
3、寬頻寬;在理論上,最快的SCSI匯流排有160MB/s的帶寬,即Ultra 160/s SCSI;這意味著你的硬碟傳輸率最高將達160MB/s(當然這是理論上的,實際應用中可能會低一點)。
4、少CPU佔用率
從最早的SCSI到現在Ultra 160/m SCSI,SCSI介面具有如下幾個發展階段
1、SCSI-1 —最早SCSI是於1979年由美國的Shugart公司(Seagate希捷公司的前身)制訂的,並於1986年獲得了ANSI(美國標准協會)承認的SASI(Shugart Associates System Interface施加特聯合系統介面) ,這就是我們現在所指的SCSI -1,它的特點是,支持同步和非同步SCSI外圍設備;支持7台8位的外圍設備最大數據傳輸速度為5MB/S;支持WORM外圍設備。
2、SCSI-2 —90年代初(具體是1992年),SCSI發展到了SCSI-2,當時的SCSI-2 產品(通稱為Fast SCSI)是能過提高同步傳輸時的頻率使數據傳輸率提高為10MB/S,原本為8位的並行數據傳輸稱為:Narrow SCSI;後來出現了16位的並行數據傳輸的WideSCSI,將其數據傳輸率提高到了20MB/S 。
3、SCSI-3 —1995年推出了SCSI-3,其俗稱Ultra SCSI,全稱為SCSI-3 Fast-20 Parallel Interface(數據傳輸率為20M/S)它採用了同步傳輸時鍾頻率提高到20MHZ以提高數據傳輸的技術,因此使用了16位傳輸的Wide模式時,數據傳輸即可達到40MB/s。其允許介面電纜的最大長度為1.5米。
4、1997年推出了Ultra 2 SCSI(Fast-40),其採用了LVD(Low Voltage Differential,低電平微分)傳輸模式,16位的Ultra2SCSI(LVD)介面的最高傳輸速率可達80MB/S,允許介面電纜的最長為12米,大大增加了設備的靈活性。
5、1998年9月更高的數據傳輸率的Ultra160/m SCSI(Wide下的Fast-80)規格正式公布,其最高數據傳輸率為160MB/s,這將給電腦系統帶來更高的系統性能。
現有最流行的串列硬碟技術
隨著INTEL的915平台的發布,最新的ICH6-M也進入了我們的視野。而ICH6除了在一些電源管理特性方面有所增強外,也正式引入了SATA(串列ATA,以下簡稱SATA)和PCI-E概念。對於筆記本來說,從它誕生的那天起就一直使用著PATA(並行ATA,以下簡稱PATA)來連接硬碟,SATA的出現無疑是一項硬碟介面的革命。而如今隨著INTEL的積極推動,筆記本也開始邁入SATA的陣營。
關於SATA的優勢,筆者相信諸位也都有了解。確實,比起PATA,SATA有著很多不可比擬的優勢,而筆者將在本文中透過技術細節來多其進行分析。相信您讀完本文後會對SATA有著更深入的了解。另外由於本文主要針對筆記本和台式機,所以諸如RAID等技術不在本文討論范圍之內。
串列通信和並行通信
再進行詳細的介紹之前,我們先了解一下串列通信和並行通信的特點。
一般來說,串列通信一般由二根信號線和一根地線就可完成互相的信息的傳送。如下圖,我們看到設備A和設備B之間的信號交換僅用了兩根信號線和一根地線就完成了。這樣,在一個時鍾內,二個bit的數據就會被傳輸(每個方向一個bit,全雙工),如果能時鍾頻率足夠高,那麼數據的傳輸速度就會足夠快。
如果為了節省成本,我們也可以只用一根信號線和一根地線連接。這樣在一個時鍾內只有一個bit被傳輸(半雙工),我們也同樣可以提高時鍾頻率來提升其速度。
而並行通信在本質上是和串列通信一樣的。唯一的區別是並行通信依靠多條數據線在一個時鍾周期里傳送更多的bit。下圖中,數據線已經不是一條或者是兩條,而是多條。我們很容易知道,如果有8根數據線的話,在同一時鍾周期內傳送的的數據量是8bit。如果我們的數據線足夠多的話,比如PCI匯流排,那一個周期內就可以傳送32bit的數據。
在這里,筆者想提醒各位讀者,對於一款產品來說,用最低的成本來滿足帶寬的需要,那就是成功的設計,而不會在意你是串列通信還是並行通信,也不會管你的傳輸技術是先進還是落後。
PATA介面的速度
我們知道,ATA-33的速度為33MB/S,ATA-100的速度是100MB/S。那這個速度是如何計算出來的呢?
首先,我們需要知道匯流排上的時鍾頻率,比如ATA-100是25MHz,PATA的並行數據線有16根,一次能傳送16bit的數據。而ATA-66以上的規范為了降低匯流排本身的頻率,PATA被設計成在時鍾的上下沿都能傳輸數據(類似DDR的原理),使得在一個時鍾周期內能傳送32bit。
這樣,我們很容易得出ATA-100的速度為:25M*16bit*2=800Mbps=100MByte/s。
PATA的局限性
在相同頻率下,並行匯流排優於串列匯流排。隨著當前硬碟的數據傳輸率越來越高,傳統的並行ATA介面日益逐漸暴露出一些設計上的缺陷,其中最致命的莫過於並行線路的信號干擾問題。
那各信號線之間是如何干擾的呢?
1,首先是信號的反射現象。從南橋發出的PATA信號,通過扁長的信號線到達硬碟(在筆記本上對應的也有從南橋引出PATA介面,一直布線到硬碟的介面)。學過微波通信的讀者肯定知道,信號在到達PATA硬碟後不可避免的會發生反彈,而反彈的信號必將疊加到當前正在被傳輸的信號上,導致傳輸中數據的完整性被破壞,引起接受端誤判。
所以在實際的設計中,都必須要設計相應的電路來保證信號的完整性。
我們看到,從南橋發出的PATA信號一般都需要經過一個排阻才發送到PATA的設備。我們必須加上至少30個電阻(除了16根數據線,還有一些控制信號)才能有效的防止信號的反彈。而在硬碟內部,硬碟廠商會在裡面接上終端電阻以防止引號反彈。這不僅對成本有所上升,也對PCB的布局也造成了困擾。
當然,信號反彈在任何高速電路里都會發生,在SATA里我們也會看到終端電阻,但因為SATA的數據線比PATA少很多,並且採用了差分信號傳輸,所以這個問題並不突出。
2,其次是信號的偏移問題
理論上,並行匯流排的數據線的長度應該是一致的。而在實際上,這點很難得到保證。信號線長度的不一致性會導致某個信號過快/過慢到達接受端,導致邏輯誤判。不僅如此,導致信號延遲的原因還有很多,比如線路板上的分布電容、信號線在高頻時產生的感抗等都會引起信號的延遲。
如圖,在左側南橋端我們發送的數據為[1,1,1,0],在發送到硬碟的過程中,第四個信號由於某種原因出現延遲,在判斷時刻還沒到達接受端。這樣,接受端判斷接受到的信號為[1,1,1,1],出現錯誤。由此也可看出,並行數據線越多,出現錯誤的概率也越大。
下圖是SONY Z1的硬碟轉接線,我們看到,設計師做了不少蛇行走線以滿足PATA數據線的長度一致性要求。
我們可以很容易想像,信號的時鍾越快,被判斷信號判斷的時間就越短,出現誤判的可能性就越大。在較慢的匯流排上(上),允許數據信號和判斷信號的時間誤差為a,而在高速的匯流排上(下),允許誤差為b。速度越快,允許的誤差越小。這也是PATA的匯流排頻率提升的局限性,而匯流排頻率直接影響著硬碟傳輸速度。。。
3,還有是信號線間的干擾(串音干擾)
這種干擾幾乎存在與任何電路。和信號偏移一樣,串音干擾也是並行通信的通病。由於並行通信需要多條信號線並行走線(以滿足長度、分布電容等參數的一致性),而串音干擾就是在這時候導致的。由於信號線在傳輸數據的過程中不停的以0,1間變換,導致其周邊的磁場變化甚快。通過法拉第定律我們知道,磁場變化越快,切割磁力線的導線上的電壓越大。這個電壓將導致信號的變形,信號頻率越高,干擾愈加嚴重,直至完全無法工作。串音干擾可以說這是對並行的PATA線路影響最大的不利因素,並且大大限制了線路的長度。
硬碟的恢復主要是靠備份,還有一些比較專業的恢復技術就是要專業學習的了.不過我不專業,現在最常用的就是GHOST,它可以備份任何一個盤付,並生成一個備份文件必要的時候可以用來恢復數據
現在市場上的主要幾款硬碟就是邁托,西部數據(WD),希捷(ST),三星,東之,松下,還有最新的那個易拓保密硬碟