醫(yī)學(xué)數(shù)據(jù)挖掘的技術(shù)、方法及應(yīng)用

醫(yī)學(xué)數(shù)據(jù)挖掘的技術(shù)、方法及應(yīng)用

ID:12813421

大?。?3.00 KB

頁數(shù):3頁

時間:2018-07-19

醫(yī)學(xué)數(shù)據(jù)挖掘的技術(shù)、方法及應(yīng)用_第1頁
醫(yī)學(xué)數(shù)據(jù)挖掘的技術(shù)、方法及應(yīng)用_第2頁
醫(yī)學(xué)數(shù)據(jù)挖掘的技術(shù)、方法及應(yīng)用_第3頁
資源描述:

《醫(yī)學(xué)數(shù)據(jù)挖掘的技術(shù)、方法及應(yīng)用》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。

1、醫(yī)學(xué)數(shù)據(jù)挖掘的技術(shù)、方法及應(yīng)用 計算機信息管理系統(tǒng)在醫(yī)療機構(gòu)的廣泛應(yīng)用促進了醫(yī)學(xué)信息的數(shù)字化;同時,電子病歷和病案的大量應(yīng)用、醫(yī)療設(shè)備和儀器的數(shù)字化,使得醫(yī)院數(shù)據(jù)庫的信息容量不斷地膨脹。這些寶貴的醫(yī)學(xué)信息資源對于疾病的診斷、治療和醫(yī)學(xué)研究都是非常有價值的。然而,目前大多數(shù)醫(yī)院對數(shù)據(jù)庫的處理僅限數(shù)據(jù)的錄入、修改、查詢、刪除等平凡過程,屬于醫(yī)學(xué)數(shù)據(jù)庫的低端操作,缺乏數(shù)據(jù)的集成和分析,更談不上醫(yī)學(xué)決策和知識的自動獲取。如何利用這些海量的信息資源來為疾病的診斷和治療提供科學(xué)的決策總結(jié)各種醫(yī)治方案的療效,更好地為醫(yī)院的決策管理、醫(yī)療、科研和教學(xué)服務(wù),已越來越為人們關(guān)注。另一方面,隨著人們生

2、活水平的提高、保健意識的增強以及我國醫(yī)療體制改革的深入,基于計算機技術(shù)、通信技術(shù)的遠程醫(yī)療和社區(qū)醫(yī)療,已經(jīng)逐漸成為各大醫(yī)院的另一個潛在市場。如何對醫(yī)學(xué)數(shù)據(jù)庫進行自動提升和處理,使其更好地為遠程醫(yī)療和社區(qū)醫(yī)療提供全面的、準確的診斷決策和保健措施,已成為促進醫(yī)院發(fā)展、提高服務(wù)質(zhì)量而必須解決的新問題。正是在這種背景下,醫(yī)學(xué)數(shù)據(jù)挖掘應(yīng)運而生?! ?shù)據(jù)挖掘概述數(shù)據(jù)挖掘(Datamining),是指從數(shù)據(jù)庫中提取隱含在其中的、人們事先未知的、潛在的有用信息和知識[1]。所提取的知識可以表示為概念、規(guī)則、規(guī)律、模式等形式。數(shù)據(jù)挖掘是一門近幾年才發(fā)展起來的涉及到數(shù)據(jù)庫、人工智能、統(tǒng)計學(xué)、模式識別

3、、可視化技術(shù)、并行計算等多領(lǐng)域知識的交叉學(xué)科,它和數(shù)據(jù)庫中的知識發(fā)現(xiàn)是兩個等價的概念。廣義的數(shù)據(jù)挖掘?qū)ο蟀〝?shù)據(jù)庫、數(shù)據(jù)倉庫、文件系統(tǒng)、Web信息以及其他方式的數(shù)據(jù)集合。常用的數(shù)據(jù)挖掘方法有:統(tǒng)計方法、機器學(xué)習、神經(jīng)計算和可視化等。由于實際的數(shù)據(jù)庫種類繁多,從關(guān)系型到面向?qū)ο笮汀⒖臻g型、時間型乃至多媒體等復(fù)雜數(shù)據(jù)庫,在挖掘算法設(shè)計中往往將幾種方法和幾種技術(shù)綜合起來運用。國外的許多零售、金融、保險、電信、民航等大型企業(yè)都開始應(yīng)用數(shù)據(jù)挖掘來指導(dǎo)實際問題的求解。如對金融數(shù)據(jù)進行挖掘來預(yù)測貸款的償還、制定客戶的信用政策和偵破金融犯罪;電信業(yè)應(yīng)用數(shù)據(jù)挖掘來確定電信的運營模式、捕捉盜用行為和

4、改進服務(wù)質(zhì)量等等?! ♂t(yī)學(xué)數(shù)據(jù)挖掘具有特殊性醫(yī)院信息涵蓋了醫(yī)療過程和醫(yī)院活動的全部數(shù)據(jù)資源,包括臨床醫(yī)療信息和醫(yī)院管理信息[2]。我們感興趣的主要是臨床醫(yī)療信息,只有這部分數(shù)據(jù)才能反映醫(yī)學(xué)信息的獨特之處,醫(yī)學(xué)數(shù)據(jù)挖掘的主要對象也是針對這部分信息資源的。醫(yī)學(xué)信息具有以下特點模式的多態(tài)性。醫(yī)學(xué)信息包括純數(shù)據(jù)(如體征參數(shù)、化驗結(jié)果)、信號(如肌電信號、腦電信號等)、圖像(如B超、CT等醫(yī)學(xué)成像設(shè)備的檢測結(jié)果)、文字(如病人的身份記錄、癥狀描述、檢測和診斷結(jié)果的文字表述),以及用于科普、咨詢的動畫、語音和視頻信息。醫(yī)學(xué)信息的多模式特性是它區(qū)分其它領(lǐng)域數(shù)據(jù)的最顯著特征,這種多屬性模式并存加

5、大了醫(yī)學(xué)數(shù)據(jù)挖掘的難度?! 〔煌暾浴2±筒“傅挠邢扌允贯t(yī)學(xué)數(shù)據(jù)庫不可能對任何一種疾病信息都能全面地反映,表現(xiàn)為醫(yī)學(xué)信息的不完全性。同時,許多醫(yī)學(xué)信息的表達、記錄本身就具有不確定和模糊性的特點[2]。疾病信息所體現(xiàn)出的客觀不完整和描述疾病的主觀不確切,形成了醫(yī)學(xué)信息的不完整性。時間性。醫(yī)學(xué)檢測的波形、圖像都是時間的函數(shù);還有一部分醫(yī)學(xué)信息,比如病人的身份記錄等靜態(tài)數(shù)據(jù),雖然不帶有時序性,但都是對病人在某一時刻醫(yī)療活動的記錄。冗余性。醫(yī)學(xué)數(shù)據(jù)庫是一個龐大的數(shù)據(jù)資源,每天都會有大量相同的或部分相同的信息存儲在其中。比如,對于某些疾病,病人所表現(xiàn)的癥狀、化驗的結(jié)果、采取的治療措施都可

6、能完全一樣?! ♂t(yī)學(xué)信息的所具有的這些特點,使得醫(yī)學(xué)數(shù)據(jù)挖掘與普通的數(shù)據(jù)挖掘存在較大的差異,決定了醫(yī)學(xué)數(shù)據(jù)挖掘的特殊性。醫(yī)學(xué)信息是由文字、數(shù)據(jù)、波形信號、圖像、以及少量的語音和視頻信號組成。對這些不同物理屬性的醫(yī)學(xué)數(shù)據(jù),應(yīng)采用不同的技術(shù)和措施進行處理,使其在屬性上趨同或一致,再對處理的結(jié)果進行綜合。醫(yī)學(xué)信息的多源性、時序性和非時序性數(shù)據(jù)共存、數(shù)字型數(shù)據(jù)和非數(shù)字型數(shù)據(jù)共存的特點,加大了信息融合的難度。醫(yī)學(xué)數(shù)據(jù)庫是一個涉及面廣、信息量大的信息庫。要在這樣龐大的數(shù)據(jù)庫中提取知識,需要花費比其它數(shù)據(jù)庫更多的時間,因此必須考慮醫(yī)學(xué)數(shù)據(jù)挖掘的效率問題。研究快速挖掘算法對于遠程醫(yī)療和社區(qū)醫(yī)療具

7、有更深遠的意義,將直接影響其響應(yīng)速度和醫(yī)療成本。同時,醫(yī)學(xué)數(shù)據(jù)庫的類型較多,并且又是動態(tài)變化的,要求挖掘算法具有一定的容錯性和魯棒性。本文轉(zhuǎn)載自:http://www.heblunwen.com/請尊重原創(chuàng),轉(zhuǎn)載請注明出處。

當前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。