資源描述:
《淺談多媒體信息處理技術(shù)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、淺談多媒體信息處理技術(shù) 摘要:多媒體技術(shù)是信息技術(shù)發(fā)展的產(chǎn)物。它集中了已經(jīng)比較成熟的圖像處理、聲音處理、視頻處理、三維動(dòng)畫技術(shù)等信息處理技術(shù),改變了傳統(tǒng)計(jì)算機(jī)單一的字符、平面圖形的人機(jī)界面。為人們提供了一個(gè)具有圖像、聲音、視頻、動(dòng)畫等多種視聽信息,具備良好的交互式可操作性能的信息系統(tǒng)?! £P(guān)鍵詞:多媒體;信息處理;信息與計(jì)算科學(xué) 【中圖分類號(hào)】G712 多媒體技術(shù)運(yùn)用多種現(xiàn)代化手段對(duì)信息進(jìn)行加工處理,顯示與重放,模擬、仿真與動(dòng)畫技術(shù)的應(yīng)用可以使一些在普通條件下無(wú)法實(shí)現(xiàn)或無(wú)法觀察到的過(guò)程與現(xiàn)象生動(dòng)而形象地顯示出來(lái),可大大增強(qiáng)人們對(duì)抽象事物
2、與過(guò)程的理解與感受。交互式多媒體技術(shù)將圖、文、聲、像融為一體,可以達(dá)到在短時(shí)間內(nèi)獲取大量知識(shí)信息的效果?! ∫弧⑹裁词嵌嗝襟w信息處理技術(shù) 多媒體技術(shù)涉及面相當(dāng)廣泛,主要包括:音頻技術(shù):音頻采樣、壓縮、合成及處理、語(yǔ)音識(shí)別等。視頻技術(shù):視頻數(shù)字化及處理。圖像技術(shù):圖像處理、圖像、圖形動(dòng)態(tài)生成。圖像壓縮技術(shù):圖像壓縮、動(dòng)態(tài)視頻壓縮。通信技術(shù):語(yǔ)音、視頻、圖像的傳輸。標(biāo)準(zhǔn)化:多媒體標(biāo)準(zhǔn)化。多媒體信息處理技術(shù)可以看作是對(duì)音頻、視頻、圖像等進(jìn)行處理的技術(shù)?! 《?、多媒體的關(guān)鍵技術(shù):5 多媒體的傳統(tǒng)關(guān)鍵技術(shù)主要集中在以下四類中:數(shù)據(jù)壓縮技術(shù)、大規(guī)模集
3、成電路(VLSI)制造技術(shù)、大容量的光盤存儲(chǔ)器(CD-ROM)、實(shí)時(shí)多任務(wù)操作系統(tǒng)。因?yàn)檫@些技術(shù)取得了突破性的進(jìn)展,多媒體技術(shù)才得以迅速的發(fā)展,而成為像今天這樣具有強(qiáng)大的處理聲音、文字、圖像等媒體信息的能力的高科技技術(shù)。但說(shuō)到當(dāng)前要用于互聯(lián)網(wǎng)絡(luò)的多媒體關(guān)鍵技術(shù),有些專家卻認(rèn)為可以按層次分為媒體處理與編碼技術(shù)、多媒體系統(tǒng)技術(shù)、多媒體信息組織與管理技術(shù)、多媒體通信網(wǎng)絡(luò)技術(shù)、多媒體人機(jī)接口與虛擬現(xiàn)實(shí)技術(shù),以及多媒體應(yīng)用技術(shù)這六個(gè)方面。而且還應(yīng)該包括多媒體同步技術(shù)、多媒體操作系統(tǒng)技術(shù)、多媒體中間件技術(shù)、多媒體交換技術(shù)、多媒體數(shù)據(jù)庫(kù)技術(shù)、超媒體技術(shù)、基
4、于內(nèi)容檢索技術(shù)、多媒體通信中的QoS管理技術(shù)、多媒體會(huì)議系統(tǒng)技術(shù)、多媒體視頻點(diǎn)播與交互電視技術(shù)、虛擬實(shí)景空間技術(shù)等等?! ∪⒁纛l處理技術(shù) 1、聲音的物理特征。聲音一般可能通過(guò)連續(xù)的波形來(lái)表示,波形的最大位移也就是振幅反映音量(音高、響度或強(qiáng)度)。波形中連續(xù)兩個(gè)波峰或波谷之間的時(shí)間距離稱為周期,周期的倒數(shù)稱為頻率。頻率用Hz表示,用來(lái)反映聲音的音調(diào)。另外,由于不同材質(zhì),不同的環(huán)境,所產(chǎn)生的聲音所伴隨的泛音也不同,所以也就產(chǎn)生了聲音的音色特征。(1)低于20Hz的聲音稱為次聲(2)頻率范圍在20Hz~20kHz范圍的可聽聲稱為音頻(3)頻率高
5、于20kHz的稱為超音頻(或超聲) 2、音頻采集。在Wind2K系統(tǒng)中,提供了錄音參數(shù)的選擇設(shè)置功能,其中的音質(zhì)選擇分為CD音質(zhì)、電話質(zhì)量、收音質(zhì)量和Default5Quality4種。還可以選擇不同的采樣頻率、位寬和聲道。為了防止錄音過(guò)程中出現(xiàn)失真,可通過(guò)“音量控制”對(duì)話框來(lái)檢測(cè)、調(diào)節(jié)進(jìn)入計(jì)算機(jī)的音源強(qiáng)度。windows中的錄音機(jī)只能錄60s的音頻數(shù)據(jù),可以借助專業(yè)的音頻處理軟件進(jìn)行音頻錄入,不但能夠提供不限時(shí)長(zhǎng)的錄入功能,還可以使用不同的編碼進(jìn)行壓縮存儲(chǔ)。音頻編輯一般包括音頻內(nèi)容剪切、合成以及音質(zhì)和效果的編輯等方面?! ?、音量控制程序
6、。為了實(shí)現(xiàn)音量的控制,微軟提供了一些與Mixer(混音器)相關(guān)的API函數(shù)。在控制系統(tǒng)總音量時(shí),首先通過(guò)mixerOpen函數(shù)打開混音設(shè)備,然后通過(guò)mixerGetLineInfo函數(shù)獲取控制線信息取得設(shè)備ID號(hào)并通過(guò)mixerGetLineControls函數(shù)得到控制線的控制,最后通過(guò)mixerGetControlDetails得到具體的音量信息,通過(guò)mixerSetControlDetails函數(shù)來(lái)設(shè)置音量?! ?、播放WAVE文件。WAVE音頻文件是比較常用的音頻文件,對(duì)于音頻的播放可以有多種方法?! ∥濉D形與圖像處理 圖形與圖像是
7、人類視覺所感受到的一種形象化的信息,其最大特點(diǎn)是直觀可見、形象生動(dòng)。圖形與圖像處理是一門非常成熟而發(fā)展又十分迅速的實(shí)用性科學(xué),其應(yīng)用范圍遍及科技、教育、商業(yè)和藝術(shù)等領(lǐng)域。圖像與視頻技術(shù)關(guān)系密切,實(shí)際應(yīng)用中的許多圖像就來(lái)自于視頻采集?! ∫?、圖形處理的內(nèi)容。圖形處理技術(shù)主要用于計(jì)算機(jī)輔助設(shè)計(jì)和制造、計(jì)算機(jī)教育、計(jì)算機(jī)藝術(shù)、計(jì)算機(jī)模擬、計(jì)算機(jī)動(dòng)畫和虛擬現(xiàn)實(shí)領(lǐng)域。圖形處理的內(nèi)容包括:①幾何變換,如平移、旋轉(zhuǎn)、縮放、透視和投影等;②5曲線和曲面擬合;③建?;蛟煨停虎茈[線、隱面消除;⑤陰暗處理;⑥紋理產(chǎn)生;⑦配色?! 《?、數(shù)字圖像處理的內(nèi)容。數(shù)字圖像處
8、理內(nèi)容包括: ?。?)圖像變換。由于圖像陣列很大,直接在空間域中進(jìn)行處理,涉及的計(jì)算量很大。因此,往往采用各種圖像變換方法,如傅立葉變換、離散余弦變換等間接處理技術(shù)