資源描述:
《基于獨(dú)立任務(wù)的分布式容錯(cuò)調(diào)度算法》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、第30卷第3期2013年6月沈陽(yáng)航空航天大學(xué)學(xué)報(bào)JournalofShenyangAerospaceUniversityV01.30No.3Jun.2013文章編號(hào):2095—1248(2013)03一0044—05基于獨(dú)立任務(wù)的分布式容錯(cuò)調(diào)度算法李偉英(遼寧省公安邊防總隊(duì)司令部,沈陽(yáng)110034)摘要:主副版本法是常見(jiàn)的容錯(cuò)方法,將每個(gè)任務(wù)的主版本和副版本分配到兩個(gè)不同的處理機(jī)上執(zhí)行,只要任務(wù)的主版本分配到一個(gè)處理機(jī),則對(duì)應(yīng)的副版本可以在另一個(gè)處理機(jī)上重疊執(zhí)行。筆者研究了分布式控制系統(tǒng)中,基于主副版本容錯(cuò)算法的副版本可以在執(zhí)行時(shí)間上重疊來(lái)調(diào)度分配獨(dú)立的任務(wù),該容錯(cuò)算法以副版本執(zhí)行時(shí)間重疊部分
2、的最小化為復(fù)制代價(jià),通過(guò)仿真實(shí)驗(yàn)與集中式調(diào)度和分布式調(diào)度算法進(jìn)行對(duì)比分析。關(guān)鍵詞:容錯(cuò)算法;分布式;主副版本中圖分類號(hào):弼38.8文獻(xiàn)標(biāo)志碼:Adoi:10.3969/j.issn.2095—1248.2013.03.010Fault-toleranceschedulingalgorithmofindependenttasksindistributedcontrolsystemsLIWei·ying(LiaoningProvincialPublicSecurityFrontierCorpsCommand,Shenyang110034)Abstract:Primary—backupisacomm
3、onapproachusedforfault—tolerancewhichineachtaskhasaprimarycopyandabackupcopycarriedontwodifferentprocessors.Thecorrespondingbackupcopiescanoverlapontheotherprocessor,aslongastheprimarycopiesarescheduledonthesanleprocessors.Inthispaper,westIldythefault—tolerantschedulingofindependenttasksusingprimary
4、—backupapproachwithbackupoverlap—pingindistributedsystem.Afault—tolerantschedulingalgorithmisdeveloped,whichminimizesreplicationcostsforbackupcopybytakingintoaccountbackupoverlappingincostfunction.Acentralizedschemeandadistributedschemearedevelopedfortheproposedalgorithmandtheirperformancesarecompar
5、edandana-lyzedthroughsimulationexperiments.Keywords:fault—tolerancealgorithm;distribution;primary/backupcopy隨著各種應(yīng)用復(fù)雜性的提高,分布式實(shí)時(shí)系統(tǒng)開(kāi)始越來(lái)越廣泛地應(yīng)用于各種領(lǐng)域,如工業(yè)控制系統(tǒng)、武器防御控制系統(tǒng)、飛行控制系統(tǒng)、電站控制系統(tǒng)及實(shí)時(shí)多媒體系統(tǒng)等。但是隨著分布式系統(tǒng)中節(jié)點(diǎn)數(shù)目的增加,系統(tǒng)出現(xiàn)故障的可能性增大。在實(shí)時(shí)系統(tǒng)中,每個(gè)任務(wù)都有嚴(yán)格的時(shí)間約束(截止期),如果控制器故障使某些任務(wù)不能在其截止期前完成,就可能造成很大的損失。為了避免控制器出現(xiàn)故障而造成嚴(yán)重后果,需要在分布式
6、實(shí)時(shí)系統(tǒng)中提供一定的容錯(cuò)能力,且保證任務(wù)仍可以滿足其截止期,以提高整個(gè)系統(tǒng)的可靠性‘1—2。。實(shí)時(shí)容錯(cuò)調(diào)度算法是在分布式系統(tǒng)容錯(cuò)調(diào)度算法的基礎(chǔ)上,通過(guò)軟件解決分布式實(shí)時(shí)系統(tǒng)容錯(cuò)問(wèn)題,其優(yōu)點(diǎn)是不需要額外的硬件開(kāi)銷來(lái)保證系統(tǒng)可靠性。A.Iamnitchi等∞o把容錯(cuò)方法分為兩類:(1)將容錯(cuò)機(jī)制嵌入到中間設(shè)備軟件中,與文獻(xiàn)[4—5]方法相似;(2)把容錯(cuò)機(jī)制嵌入算法內(nèi),文獻(xiàn)[2,6,7]為第一種類方法。A.Iamnitchi等舊1提出了一個(gè)基于空間算法的故障恢復(fù)機(jī)制,收稿日期:2013—03—17基金項(xiàng)目:國(guó)家自然科學(xué)基金項(xiàng)目(項(xiàng)目編號(hào):60434030;61070024)作者簡(jiǎn)介:李偉英(196
7、7一),男,遼寧沈陽(yáng)人,工程師,主要研究方向:控制系統(tǒng)和網(wǎng)絡(luò)安全技術(shù),E·mail:1742781769@qq.corn。第3期李偉英:基于獨(dú)立任務(wù)的分布式容錯(cuò)調(diào)度算法45A.Dogan等‘8。91拓展了該算法,使其應(yīng)用和系統(tǒng)中的故障率減到最小。主副版本法也叫被動(dòng)復(fù)制策略,是一種用于容錯(cuò)的常用方法。此方法是將一個(gè)任務(wù)的主版本和多個(gè)副版本被調(diào)度執(zhí)行,且副版本只有在主版本沒(méi)通過(guò)測(cè)試時(shí)才被執(zhí)行¨o-11