可靠性工作需要做的事情非常多,該從哪里下手?
實(shí)際上,整個(gè)產(chǎn)品的可靠性工作沒(méi)有那么復(fù)雜,可靠性工作歸根到底是跟故障打交道,就是解決故障問(wèn)題。首先是減少故障,其次是減少影響,如果影響減少不了,就要評(píng)估影響有多大。減少故障主要通過(guò)避錯(cuò)和排錯(cuò)。避錯(cuò)主要針對(duì)研發(fā)階段,通過(guò)研發(fā)的設(shè)計(jì)和測(cè)試去實(shí)施保障;排錯(cuò)主要針對(duì)制造階段,通過(guò)來(lái)料和生產(chǎn)制程的攔截實(shí)施保障。減少影響的措施是容錯(cuò),容錯(cuò)就是運(yùn)行功能的保障,主要通過(guò)軟件來(lái)實(shí)現(xiàn),如果出了問(wèn)題,通過(guò)一些檢測(cè)、定位、隔離、恢復(fù)等保障。評(píng)估影響的措施是預(yù)錯(cuò),基于故障機(jī)理的評(píng)估,預(yù)測(cè)失效率、壽命等,評(píng)估風(fēng)險(xiǎn)影響。
02
國(guó)內(nèi)企業(yè)可靠性工作開(kāi)展,會(huì)經(jīng)歷哪些發(fā)展階段?
國(guó)內(nèi)企業(yè)的發(fā)展,可靠性工作可能會(huì)經(jīng)歷五個(gè)不同的階段。
第一個(gè)階段是市場(chǎng)試錯(cuò)。通過(guò)市場(chǎng)應(yīng)用去識(shí)別問(wèn)題,反饋給設(shè)計(jì),迭代下一版本。這個(gè)市場(chǎng)試錯(cuò)階段一般是一些很小規(guī)模的企業(yè),比如說(shuō)十幾個(gè)人的企業(yè)沒(méi)有那么多人力去開(kāi)展很多工作,經(jīng)常是產(chǎn)品出來(lái),調(diào)試成功后就發(fā)往市場(chǎng),一旦出了問(wèn)題,開(kāi)發(fā)人員直接到市場(chǎng)定位解決。
第二個(gè)階段是事后檢測(cè)。在生產(chǎn)后端,經(jīng)過(guò)質(zhì)量檢測(cè)、篩選、數(shù)據(jù)處理、試驗(yàn)評(píng)價(jià)的手段,把不合格的產(chǎn)品篩除,但一般的檢測(cè)對(duì)整個(gè)制造的失效率是沒(méi)什么貢獻(xiàn)的。
第三個(gè)階段是事前預(yù)防。重視生產(chǎn)過(guò)程的預(yù)防,把整個(gè)生產(chǎn)過(guò)程的每個(gè)工序做一些優(yōu)化,進(jìn)行SPC、CPK、6西格瑪等一系列管控措施,事前預(yù)防對(duì)產(chǎn)品的直通率會(huì)有很大的提升。
第四個(gè)階段是事前控制。從生產(chǎn)前移到研發(fā),不僅僅在生產(chǎn)要控制好,在研發(fā)階段重點(diǎn)研究產(chǎn)品失效的機(jī)理,重點(diǎn)抓產(chǎn)品研發(fā)設(shè)計(jì),從設(shè)計(jì)層面來(lái)降低市場(chǎng)的失效。
第五個(gè)階段是端到端管控。實(shí)際上,在市場(chǎng)上的產(chǎn)品有大量的物料問(wèn)題,那么這里面就是一道端到端的管控問(wèn)題,從物料-研發(fā)-生產(chǎn)-市場(chǎng)應(yīng)用進(jìn)行全方位管控,才能真正意義上降低產(chǎn)品市場(chǎng)的問(wèn)題。除了這五個(gè)階段,后面還有沒(méi)有?我想肯定還會(huì)有,因?yàn)殡S著科技的發(fā)展,還有更先進(jìn)技術(shù)管理措施。
國(guó)內(nèi)大部分企業(yè)都在事前預(yù)防和事前控制之間的階段,華為目前是到了端到端管控階段,華為是我們國(guó)內(nèi)可靠性工作的標(biāo)桿企業(yè)。我們企業(yè)要多做一些主動(dòng)的可靠性工作,不然會(huì)很被動(dòng),老是感覺(jué)在救火,對(duì)于產(chǎn)品的可靠性,我們不能心存僥幸。
03
降本,可以從哪些角度考慮進(jìn)行降本?一旦降本,可靠性模型如何構(gòu)建?是在原有設(shè)計(jì)冗余基礎(chǔ)上還是重新構(gòu)建模型?
降成本的策略:物料歸一化,減少物料編碼數(shù),提升單一物料的采購(gòu)額,降低采購(gòu)成本和物料的管理成本。物料替代,尋找并識(shí)別質(zhì)量同等甚至更好,但成本更低的供應(yīng)商,這也是物料技術(shù)工程師的價(jià)值?;趯?duì)物料應(yīng)用的深入理解,簡(jiǎn)化設(shè)計(jì),并做物料方案級(jí)的替代。提倡的產(chǎn)品降本,是要求在不降低產(chǎn)品可靠性的前提下進(jìn)行降本,如物料通過(guò)物料技術(shù)認(rèn)證,選用規(guī)格“合適”的物料,從而達(dá)到降本的目的。對(duì)原有可靠性模型影響不大。
04
企業(yè)要如何去解決可靠性預(yù)計(jì)的準(zhǔn)確性問(wèn)題?
主要有兩個(gè)因素,一是模型。不管多高級(jí)的模型,只要沒(méi)有反映產(chǎn)品的實(shí)際工作狀態(tài)和故障狀態(tài)就不是一個(gè)好模型,依據(jù)這樣的模型計(jì)算出來(lái)的結(jié)果就不會(huì)準(zhǔn)確。二是基礎(chǔ)數(shù)據(jù)。失效率這塊企業(yè)不能僅僅依靠國(guó)軍標(biāo)299等標(biāo)準(zhǔn),要聯(lián)合相關(guān)部門(mén)一起統(tǒng)計(jì)產(chǎn)品實(shí)際的失效率??煽啃灶A(yù)計(jì)工作要想做好并不容易,但只有這樣做了之后,可靠性預(yù)計(jì)的結(jié)果才能支持市場(chǎng)端,將可靠性預(yù)計(jì)工具化。
05
FTA適合作為一個(gè)流程活動(dòng)嗎?
一種可靠性方法是否適合放入流程需要具體問(wèn)題具體分析,F(xiàn)TA這種方法實(shí)施起來(lái)比較耗時(shí)耗力,因?yàn)镕TA這種方法頂事件過(guò)多,難以確定。比如通訊網(wǎng)絡(luò)的故障狀態(tài)就非常多樣化,很難確定將哪個(gè)故障狀態(tài)作為頂事件。而且底事件組合的量也是爆炸性的,比如環(huán)境的影響、人為操作的影響等,很多底事件范圍都超出產(chǎn)品本身的范圍,很難操作。另外,新開(kāi)發(fā)的產(chǎn)品,沒(méi)有人能對(duì)產(chǎn)品非常熟悉,如果將FTA放到流程活動(dòng)里面,就無(wú)法落實(shí)責(zé)任人。這種方法也不是一無(wú)是處,更適合現(xiàn)場(chǎng)故障診斷應(yīng)用。但“兵無(wú)常勢(shì),水無(wú)常形”,可靠性的設(shè)計(jì)分析方法需要結(jié)合產(chǎn)品摸索應(yīng)用之道,才能做出實(shí)效。
06
DFMECA分析,如何才能發(fā)現(xiàn)潛在失效問(wèn)題,并且怎么樣才能分析提出有效的控制措施?
FMEA的主要目的其實(shí)并不是發(fā)現(xiàn)產(chǎn)品存在的問(wèn)題,而是確定產(chǎn)品最關(guān)鍵的單元(失效率高+影響大),并對(duì)這些單元采取必要的可靠性措施,確保其不出問(wèn)題,從而確保整個(gè)系統(tǒng)的可靠性??煽啃缘拇胧┌瑑深?lèi):避錯(cuò),即從器件選型、電路設(shè)計(jì)、生產(chǎn)工藝等方面提出避免出現(xiàn)問(wèn)題的措施;容錯(cuò),即從故障后的處理(故障檢測(cè)、隔離、診斷、恢復(fù)等)上考慮設(shè)計(jì)措施。
07
企業(yè)失效率數(shù)據(jù)的收集流程具體是?
統(tǒng)計(jì)失效率所需的數(shù)據(jù)包括:發(fā)貨量,這些發(fā)貨的設(shè)備中有多少在運(yùn)行使用(有些發(fā)貨設(shè)備是作為備件存儲(chǔ)在備件庫(kù)里,并未運(yùn)行使用),在運(yùn)行使用的這些設(shè)備中有多少發(fā)生了故障,它們各自的運(yùn)行時(shí)間,如果要統(tǒng)計(jì)器件失效率,還要一環(huán)環(huán)的追溯到哪些器件發(fā)生了故障,以及這些器件的運(yùn)行時(shí)間,這個(gè)過(guò)程十分繁雜。
08
對(duì)IC產(chǎn)品,量產(chǎn)前后的可靠性預(yù)計(jì)如何去做,需要收集哪些信息來(lái)佐證結(jié)論?
大的芯片廠家都有專(zhuān)門(mén)的可靠性統(tǒng)計(jì)試驗(yàn),有些是通過(guò)加速實(shí)現(xiàn)的,并在器件手冊(cè)上會(huì)給出失效率的數(shù)據(jù),但這些失效率屬于基本失效率,并未考慮芯片應(yīng)用廠家的實(shí)際使用環(huán)境和應(yīng)力,因此芯片應(yīng)用廠家還需要采用應(yīng)力法做芯片的可靠性預(yù)計(jì)才能得到該芯片的使用失效率。
09
關(guān)于可靠性模型準(zhǔn)確性的問(wèn)題,在可靠性模型預(yù)測(cè)方面,有什么驗(yàn)證方法嗎?
最簡(jiǎn)單直接的驗(yàn)證方法就是把預(yù)測(cè)的結(jié)果和實(shí)際統(tǒng)計(jì)的結(jié)果拿來(lái)對(duì)比,這樣不僅可以檢驗(yàn)預(yù)測(cè)模型的準(zhǔn)確性,也可以檢驗(yàn)基礎(chǔ)失效率數(shù)據(jù)的準(zhǔn)確性。
10
企業(yè)FRACAS系統(tǒng)如何建立、運(yùn)轉(zhuǎn),才能起到真正的作用?
好的系統(tǒng)要依靠好的流程和體制來(lái)保障落地,否則再好的系統(tǒng)也是空的。FRACAS系統(tǒng)是非常重要的一個(gè)工具,我們前期的可靠性設(shè)計(jì)得好不好,有什么問(wèn)題,以及可靠性工作所需的基礎(chǔ)數(shù)據(jù)都來(lái)源于它,一定要利用好這個(gè)系統(tǒng)。