回覆列表
  • 1 # 使用者9845801293974

    不出錯是不可能的呀,哈哈。

    首先回答出錯的問題。出錯又要從設計和製造兩方面入手。設計的話,藉助各種simulation 軟體,基本可以保證大部分的設計沒問題。但小問題肯定有很多啊。所以一個晶片在上市之前,已經是經過了很多輪的設計修改了。而且晶片行業這個修改成本是相當高的。比如說最初版本A0a,要流片,拿到之後要做wafer testing(晶圓測試),然後封裝,再做晶片測試。電腦上的CPU,GPU 這類的晶片還要放到主機板上做system level 測試。全部資料收集好,分析好,才能知道設計那邊哪裡有問題,哪裡需要改。小的改動,只改到一點metal layer 的,是相對便宜的,然後版本升級到A0b,A0c等。改完再走一遍前面的流片,測試,封裝,再測試。回來發現還有bug 的話還得改。稍大些的改動,就升級到A1a,動到silicon level 的改動,直接升級到B1a那種,就要給foundry 很多錢了。改一次幾百萬美金這個價位。所以晶片行業的研發費用真的高。一個產品上市的時候,已經不知道經過多少輪改動了,我以前有遇到過已經到D1a版本還沒上市的產品,光燒錢了。

    然後是製造方面的。這個就更容易出錯啦。一個晶片產品,剛剛設計出來的版本,交給foundry 生產,最初的良率很可能低的嚇人。就說我手上的新產品,開始的時候一片晶圓上面幾百個die, 良率20%也不新鮮啊。然後經過工藝的慢慢改進,最後投產時良率能達到80%以上。然後封裝那邊也會損失掉小一部分。封裝完了的晶片還要再測試,再淘汰掉一部分。

    另外針對製造缺陷,是有設計方面的應對的。比如有些記憶體單元,設計了冗餘單元。原本的單元失敗了,可以用冗餘單元替換失敗單元。再就是最後的晶片等級。比如一共10CU,全部透過的是頂級。fail了一個或兩個的可以按8CU賣,再往下可以按6CU賣便宜點。

    再說可靠性,我們叫reliability。針對這個是有專門的高電壓,高電流測試的,這可以淘汰掉一些潛在的可靠性不好的晶片。還有比如我以前公司製造的汽車用的晶片,要經過-45°,25°,130°三個溫度的測試。另外還有封裝之後的burn in ,把封裝好的晶片放在一定溫度的裝置裡烤24小時,屬於模擬老化的一種吧。烤完再測試又淘汰掉一些。

    以上,手機打字,太累啦,大家將就看吧

    =============更新一下=======

    另外,關於可靠性這點,我又想起來一個操作。以前工作的公司對於汽車上面用的晶片,除了-45°,25°,130°三個溫度的測試,外加高電流高電壓的high stress testing 之外,還有額外的篩選機制。當時的公司是從設計到晶圓的fab,到切割封裝測試,一條線都是自己公司的,不是用代工廠的,所以低良率的產品那是說報廢就報廢,非常任性。比如一個wafer lot有25片晶圓,單片晶圓的良率低於某臨界值的話,整片晶圓報廢。我記得我有個產品是低於68%就整片報廢的。然後一個lot 25片晶圓,超過幾片晶圓報廢,或者整體良率低於某臨界值,就整個lot 25片晶圓全部報廢。當然報廢之前是要做很多資料分析,過程分析去找到低良率根源,改善process的。

    再有就是晶圓上面,如果測試失敗的那些晶片位置(die location )如果集中在某固定區域,那麼這些區域周圍,挨著這些失敗晶片的那些好的晶片也要受牽連。雖然這些晶片通過了測試,但被認為有可靠性風險,還是要被丟棄。

    再有,對於類比電路較多的汽車晶片,比如應用在power train 那塊的,晶片測試項的讀數還要進一步分析篩選。比如一個測試項要求最低界限-10ua, 最高界限10ua, 一個lot裡面一共一萬顆晶片,把這一萬顆晶片的讀數畫個distribution 的圖,要求必須是個normal distribution,算出mean, 西格瑪這些統計值。+/-3西格瑪以外的那些晶片,就是有可靠性風險的(reliability concern )。即便這些+/-3西格瑪以外的晶片讀數就在+/-10ua 區間沒有超出,ATE 測試完還是好的晶片,但是之後經過系統的6西格瑪篩選,還是被報廢掉了。

    即使是經過這麼多測試,做了這麼多額外的報廢,還是會有一些晶片到了客戶那邊,甚至到了客戶的客戶那邊才發現有可靠性問題的。我們公司曾為一批可靠性問題的晶片,賠了鉅額賠款的。

    再來一個題外話,半導體行業,世界上工藝最複雜的行業,沒有之一,真的是蠻難做的。投入高,見效慢,賺錢少。哎,當初怎麼進了這一行,攤手┐(´-`)┌

  • 中秋節和大豐收的關聯?
  • 怎樣看待高鶚和程偉元續作的《紅樓夢》後四十回?可不可讀?