資源描述:
《系統(tǒng)日常維護說明》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在應用文檔-天天文庫。
1、RS/6000系統(tǒng)維護說明l維護目的?盡早發(fā)現(xiàn)系統(tǒng)及設(shè)備存在的潛在問題,使可能的故障消除在萌芽狀態(tài)。?可以減少緊急故障發(fā)生頻率,減少對系統(tǒng)的影響。?監(jiān)測系統(tǒng)的當前運行狀況。?做好數(shù)據(jù)及系統(tǒng)的備份工作,減輕問題發(fā)生時的風險和責任l一般維護的方法(RS/6000系統(tǒng))一、系統(tǒng)啟動及關(guān)閉系統(tǒng)啟動遵循先開外設(shè)再開主機的順序;系統(tǒng)關(guān)閉則先關(guān)主機再關(guān)外設(shè)。1.系統(tǒng)啟動在開機之前,應檢查所有的外設(shè)(如磁盤陣列,外接磁帶設(shè)備等)已經(jīng)加電。如您的系統(tǒng)為兩臺主機+磁盤陣列并使用了HACMP軟件時:請注意系統(tǒng)啟動順序。正常順序如下:1、打開磁盤陣列
2、,待磁盤陣列完全啟動后再進行下一步。2、打開主控臺、外置磁帶機、帶庫、或光盤庫、打印機等外設(shè),待這些外設(shè)完全啟動后再進行下一步。如果雙機采用主備模式,則:3、啟動生產(chǎn)主機,待生產(chǎn)主機完全啟動后再進行下一步,這時在終端上應可login。_______________________________________________________________________________Page12of121、啟動備份主機,待備份主機可以登陸時再進行下一步。如果雙機采用互備模式或其它無優(yōu)先級別之分的雙機模式時,兩臺主機啟動的
3、順序可不分先后,或根據(jù)具體需要決定啟動順序。2、檢查主備機的網(wǎng)絡地址、路由表(可用“netstat–in”、“netstat–rn”等),檢查文件系統(tǒng)、邏輯卷(可用“mount”、“l(fā)svg–o”等)。3、檢查各項業(yè)務是否工作正常。1.關(guān)閉系統(tǒng)系統(tǒng)關(guān)閉遵循以下的流程1、關(guān)閉所有應用程序2、關(guān)閉所有數(shù)據(jù)庫3、如果安裝了如TSM的備份軟件和網(wǎng)管軟件,關(guān)閉這些程序。上述3個步驟如果已經(jīng)配置到HACMP中,則不需另外執(zhí)行4、停止HACMP(參見后面HACMP的維護說明)5、關(guān)閉系統(tǒng)以root用戶登錄,?如果要關(guān)閉掉系統(tǒng),執(zhí)行:#shu
4、tdown–F等到主機前部面板上的液晶屏顯示“OK”時,系統(tǒng)即告關(guān)閉完成。?如果只需要重啟機器,而不是關(guān)閉,執(zhí)行#shutdown–Fr6、關(guān)閉外設(shè)電源。一、系統(tǒng)狀態(tài)檢查和監(jiān)控2.錯誤日志?#errpt
5、pg_______________________________________________________________________________Page12of12最簡單,最基本,最常用的發(fā)現(xiàn)錯誤的命令。我們知道其中有很多錯誤是冗余或可以忽略的,但也的確需要注意下面這類報錯:?#errpt–dH主要列出硬件類
6、的報錯。如果同一天大量出現(xiàn)“Diskoperationerror”,參照LVM(staled)、SSA(degraded)小節(jié),做進一步的判斷,需要的話更換這塊硬盤。如果同一天大量出現(xiàn)“Tapeoperationerror”,首先說明需要用清洗帶清潔磁頭,必要的話更換磁帶機。偶爾的SSA“AdapterDetectedOpenSerialLink”一般是因為共享對機關(guān)機造成的,通過判斷可以忽略。如果sysplanar0的報錯緊跟著“errorloggingturnedon”,通常說明機器被非正常關(guān)機,例如掉電。如無持續(xù)報錯,可
7、不理會。?#errpt–aN查看來自報錯源的詳細錯誤信息。在AIX運行時errdemon進程隨時對系統(tǒng)進行檢測,當該進程發(fā)現(xiàn)任何異常情況時將發(fā)出錯誤警告,這些警告記錄在錯誤日志errlog中,其中有些錯誤還會在終端上顯示。不能忽視這些錯誤警告,它們很可能是您系統(tǒng)的故障隱患。系統(tǒng)管理員應每日檢查錯誤日志,及時處理異常情況。檢查錯誤日志可用smit或errpt。如:#errptIDENTIFIERTIMSTAMPTCRESOURCE_NAMEDESCRIPTION22006
8、5230323111298THrmt0TAPEDRIVEFAILUREAA8AB2410323110098TOclstrmgtOPERATORNOTIFACATIONAA8AB2410323110098TOclstrmgtOPERATORNOTIFACATION其中IDENTIFIER為錯誤編號,當需要檢查詳細信息時常會用到。TIMESTAMP為時間標簽,它記錄的是出錯時間,其格式為:月日時分年,如以上rmt0的錯誤發(fā)生在98年3月23日11時12分。T是Type的縮寫,它記錄的是錯誤類型。C是Class的縮寫,它記錄的是錯誤
9、種類,如H:HardwareS:SftwareO:Errlogercommandmessages_______________________________________________________________________________Page12of12U