資源描述:
《基于網(wǎng)格的中醫(yī)藥數(shù)據(jù)挖掘的研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、基于網(wǎng)格的中醫(yī)藥數(shù)據(jù)挖掘的研究【摘要】建立在網(wǎng)格基礎(chǔ)上的數(shù)據(jù)挖掘結(jié)合了網(wǎng)格技術(shù)的優(yōu)點(diǎn),能夠?qū)nternet上廣域分布的海量信息進(jìn)行高效的處理、分析和挖掘。文章分析了網(wǎng)格與數(shù)據(jù)挖掘的特點(diǎn),并將基于網(wǎng)格的數(shù)據(jù)挖掘技術(shù)引入到中醫(yī)藥領(lǐng)域,為中醫(yī)藥的發(fā)展開辟了一條新途徑?!娟P(guān)鍵詞】網(wǎng)格;數(shù)據(jù)挖掘;中醫(yī)藥信息化11隨著lnternet的普及和計(jì)算機(jī)軟、硬件技術(shù)的發(fā)展,以及國(guó)家對(duì)中醫(yī)藥產(chǎn)業(yè)的重視,中醫(yī)藥信息化建設(shè)取得初步成效,相繼建成了中醫(yī)藥文獻(xiàn)數(shù)據(jù)庫(kù)、臨床醫(yī)學(xué)數(shù)據(jù)庫(kù)、中藥方劑數(shù)據(jù)庫(kù)等一批中醫(yī)藥數(shù)據(jù)庫(kù)。隨著中醫(yī)藥
2、數(shù)據(jù)庫(kù)的建立和發(fā)展,數(shù)據(jù)急劇增加,可是目前用于對(duì)這些數(shù)據(jù)進(jìn)行分析處理的工具卻不是很多。為了獲取隱藏在這些數(shù)據(jù)之后的更重要的信息采用了數(shù)據(jù)挖掘。通過數(shù)據(jù)挖掘可以從大量的、不完全的、有噪聲的、模糊的隨機(jī)數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在的有用信息和知識(shí)。但是隨著科技和中醫(yī)藥產(chǎn)業(yè)的發(fā)展,將會(huì)產(chǎn)生越來越多的數(shù)據(jù),并且和各個(gè)領(lǐng)域產(chǎn)生融合,成為了廣域產(chǎn)業(yè)。那么要分析和挖掘這些廣域分布的海量數(shù)據(jù),以獲取新的科學(xué)知識(shí)、規(guī)律和決策支持,傳統(tǒng)的數(shù)據(jù)挖掘模式和技術(shù)已經(jīng)無法勝任。而網(wǎng)格計(jì)算技術(shù)是解決復(fù)雜海
3、量科學(xué)數(shù)據(jù)的訪問存儲(chǔ)組織和管理的一種有效技術(shù),是廣域分布的異構(gòu)虛擬組織間實(shí)現(xiàn)協(xié)同資源共享、多領(lǐng)域的科學(xué)和工程的問題求解。建立在網(wǎng)格基礎(chǔ)上的數(shù)據(jù)挖掘結(jié)合網(wǎng)格計(jì)算的思想及其技術(shù)的優(yōu)點(diǎn),能夠?qū)V域分布的海量數(shù)據(jù)進(jìn)行高效的處理、分析和挖掘,將給中醫(yī)藥領(lǐng)域帶來新的發(fā)展和機(jī)遇?! ?數(shù)據(jù)挖掘和網(wǎng)格 廣義上來說,網(wǎng)格是一個(gè)集成的資源環(huán)境,或者說是一個(gè)資源池,它能夠充分吸納各種資源,并將它們轉(zhuǎn)化成一種隨處可得的、可靠的、標(biāo)準(zhǔn)的、經(jīng)濟(jì)的能力。這些資源包括計(jì)算資源、網(wǎng)絡(luò)通信資源、數(shù)據(jù)資料、儀器設(shè)備、知識(shí)等各種各樣的資源
4、。網(wǎng)格計(jì)算就是基于網(wǎng)格的問題求解[1]。數(shù)據(jù)挖掘指從數(shù)據(jù)庫(kù)或數(shù)據(jù)倉(cāng)庫(kù)中發(fā)現(xiàn)隱藏的、預(yù)先未知的、有趣的信息的過程,該過程可以看作是知識(shí)發(fā)現(xiàn)中的一個(gè)核心的步驟。數(shù)據(jù)挖掘就是從大量的數(shù)據(jù)中發(fā)現(xiàn)或"挖掘"知識(shí),而網(wǎng)格上含有豐富的數(shù)據(jù),是數(shù)據(jù)挖掘的理想目標(biāo)。網(wǎng)格的數(shù)據(jù)挖掘建立在數(shù)據(jù)網(wǎng)格的基礎(chǔ)設(shè)施和相關(guān)技術(shù)的基礎(chǔ)上,在廣域分布的海量數(shù)據(jù)和計(jì)算資源的環(huán)境中發(fā)現(xiàn)數(shù)據(jù)模式,獲取新的科學(xué)知識(shí)和規(guī)律[2]?! ?基于網(wǎng)格的數(shù)據(jù)挖掘 2.1網(wǎng)格數(shù)據(jù)挖掘過程11 2.1.1數(shù)據(jù)的處理數(shù)據(jù)的處理階段主要完成從數(shù)據(jù)網(wǎng)格環(huán)境中收
5、集廣域分布的數(shù)據(jù)和計(jì)算資源,并對(duì)原始數(shù)據(jù)進(jìn)行歸檔處理,更正校對(duì),過濾清理和數(shù)據(jù)的轉(zhuǎn)換、合并,最后再對(duì)經(jīng)過處理后的數(shù)據(jù)進(jìn)行歸檔。 2.1.2數(shù)據(jù)的分析與挖掘該階段主要完成對(duì)處理后的數(shù)據(jù)進(jìn)行分析、概括和挖掘,生成關(guān)聯(lián)的規(guī)則,發(fā)現(xiàn)新的數(shù)據(jù)關(guān)系等,并歸檔概括出來的數(shù)據(jù)。 2.1.3模式的評(píng)價(jià)該階段對(duì)處理后的數(shù)據(jù)和歸納后的數(shù)據(jù)再次進(jìn)行分析,得出一些數(shù)據(jù)模式,并評(píng)價(jià)數(shù)據(jù)挖掘結(jié)果的有效性和可靠性,提交得出的結(jié)論或新的關(guān)系、趨勢(shì)。 2.2網(wǎng)格數(shù)據(jù)挖掘特點(diǎn)網(wǎng)格數(shù)據(jù)挖掘是在已有數(shù)據(jù)挖掘技術(shù)的基礎(chǔ)上結(jié)合了網(wǎng)格的特點(diǎn),
6、具有更強(qiáng)的功能?! ?.2.1超強(qiáng)的計(jì)算能力網(wǎng)格計(jì)算能夠?yàn)榭茖W(xué)計(jì)算領(lǐng)域和社會(huì)經(jīng)濟(jì)生活領(lǐng)域提供超級(jí)的計(jì)算能力。網(wǎng)格的數(shù)據(jù)挖掘系統(tǒng)建立在網(wǎng)格計(jì)算的技術(shù)基礎(chǔ)上,數(shù)據(jù)的傳輸具有高效的并行性特點(diǎn),而且數(shù)據(jù)處理能力超強(qiáng)?! ?.2.211具有分布性和動(dòng)態(tài)性數(shù)據(jù)分布范圍廣,在網(wǎng)格計(jì)算環(huán)境中,廣域分布的各種資源都是動(dòng)態(tài)創(chuàng)建和刪除的,因此,網(wǎng)格的數(shù)據(jù)挖掘系統(tǒng)具備分布性和動(dòng)態(tài)性,并以分布計(jì)算的方式,同時(shí)考慮數(shù)據(jù)流通負(fù)載來分析數(shù)據(jù)。 2.2.3具有高性能的I/O負(fù)載平衡能力在對(duì)廣域分布的海量數(shù)據(jù)處理的過程中,無論是數(shù)據(jù)的
7、遠(yuǎn)程傳輸還是挖掘過程中的數(shù)據(jù)處理、分析挖掘模式評(píng)價(jià)等過程,數(shù)據(jù)的工作流都是很大的,這需要網(wǎng)格提供網(wǎng)絡(luò)負(fù)載調(diào)度、管理和高性能的1/0負(fù)載平衡能力?! ?.2.4高效的數(shù)據(jù)存儲(chǔ)服務(wù)、傳輸服務(wù)和復(fù)制管理在數(shù)據(jù)挖掘過程中要進(jìn)行大數(shù)據(jù)集存儲(chǔ)復(fù)制的時(shí)候,網(wǎng)格能夠提供高效的廣域網(wǎng)數(shù)據(jù)高速緩存服務(wù)以解決網(wǎng)絡(luò)帶寬管理的問題;數(shù)據(jù)傳輸策略能夠支持多種存儲(chǔ)系統(tǒng),并行數(shù)據(jù)傳輸,部分文件傳輸和數(shù)據(jù)重傳、容錯(cuò)能力;數(shù)據(jù)復(fù)制策略能在不同站點(diǎn)之間高速移動(dòng)和復(fù)制數(shù)據(jù),保持遠(yuǎn)程數(shù)據(jù)拷貝的一致性。 2.2.5網(wǎng)絡(luò)安全性要求更高數(shù)據(jù)挖掘涉
8、及廣域分布的屬于不同虛擬組織的數(shù)據(jù)源,數(shù)據(jù)的安全性和訪問權(quán)限問題至關(guān)重要。在數(shù)據(jù)存儲(chǔ)、轉(zhuǎn)輸、復(fù)制管理和網(wǎng)絡(luò)通信過程中,網(wǎng)格操作系統(tǒng)必須具有抗拒各種非法攻擊和入侵的能力,保證系統(tǒng)正常高效運(yùn)行和各種信息的安全(袁明.基于網(wǎng)格的數(shù)據(jù)挖掘應(yīng)用研究[D].碩士論文,2007)?! ?基于網(wǎng)格服務(wù)的中醫(yī)藥數(shù)據(jù)挖掘11 中醫(yī)藥學(xué)具有系統(tǒng)性、整體性、復(fù)雜性、不確定性等特點(diǎn),中醫(yī)藥臨床積累的信息很多,數(shù)據(jù)類型及相互關(guān)系錯(cuò)綜復(fù)雜,不適宜運(yùn)用傳統(tǒng)的還原論的方法研究。將數(shù)據(jù)挖