資源描述:
《基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)學(xué)習(xí)行為研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)學(xué)習(xí)行為研究 【摘要】隨著信息技術(shù)的發(fā)展,網(wǎng)絡(luò)學(xué)習(xí)已成為一種主要的學(xué)習(xí)途徑,本文探討了通過Web對(duì)網(wǎng)絡(luò)學(xué)習(xí)行為進(jìn)行數(shù)據(jù)采集,收集學(xué)習(xí)者的特征。并利用數(shù)據(jù)挖掘工具Weka進(jìn)行數(shù)據(jù)分析網(wǎng)絡(luò)學(xué)習(xí)與學(xué)習(xí)者之間的關(guān)系。 【關(guān)鍵詞】網(wǎng)絡(luò)學(xué)習(xí)行為;Web數(shù)據(jù)挖掘;Weka 1研究背景 在以信息技術(shù)為代表的科學(xué)技術(shù)飛速發(fā)展的當(dāng)下,網(wǎng)絡(luò)已經(jīng)成為一種重要的學(xué)習(xí)途徑,而網(wǎng)絡(luò)學(xué)習(xí)也成為越來越多學(xué)習(xí)者的一種學(xué)習(xí)習(xí)慣。據(jù)統(tǒng)計(jì),截至2014年6月,我國網(wǎng)民規(guī)模達(dá)6.32億,互聯(lián)網(wǎng)普及率為46.9%。另據(jù)艾瑞咨詢數(shù)據(jù)顯示,2014在線教育市場(chǎng)規(guī)模將達(dá)998億,增長率達(dá)19%,未來
2、學(xué)歷教育、職業(yè)在線教育將是市場(chǎng)規(guī)模高速增長的主要?jiǎng)恿?。教育部關(guān)于教育信息化十年發(fā)展規(guī)劃(2011-2020年)也提到,雖然面向全國的教學(xué)信息基礎(chǔ)設(shè)施體系初步形成,數(shù)字教育資源不斷豐富,信息化教學(xué)的應(yīng)用不斷拓展和深入;教育管理信息化初見成效。但與學(xué)習(xí)者的需求和世界發(fā)達(dá)國家水平相比還有明顯差距。到2020年,目標(biāo)全面完成《教育規(guī)劃綱要》所提出的教育信息化任務(wù),基本建成人人可享有優(yōu)質(zhì)教育資源的信息化學(xué)習(xí)環(huán)境,信息技術(shù)與教育融合發(fā)展的水平顯著提升,信息化環(huán)境下學(xué)生自主學(xué)習(xí)能力明顯增強(qiáng),教學(xué)方式與教育模式創(chuàng)新不斷深入,信息化對(duì)教育變革的促進(jìn)作用充分顯現(xiàn)。7 2研究意義 伴隨互聯(lián)網(wǎng)
3、技術(shù)的發(fā)展和人們對(duì)網(wǎng)絡(luò)學(xué)習(xí)認(rèn)知的改變,網(wǎng)絡(luò)教學(xué)平臺(tái)也迅速從點(diǎn)播式教學(xué)平臺(tái)、交互式教學(xué)平臺(tái)向社會(huì)化教學(xué)平臺(tái)轉(zhuǎn)變,即學(xué)習(xí)者可以通過智能化的搜索引擎、Blog、以及社交軟件等,最大范圍的搜索學(xué)習(xí)資源,建立符合自己個(gè)性的學(xué)習(xí)網(wǎng)絡(luò)。對(duì)于廣大的一線教師來說,一方面可以利用的教學(xué)資源異常豐富,能夠利用網(wǎng)絡(luò)將教學(xué)場(chǎng)所延伸到課堂之外。另一方面,學(xué)生仍存在著學(xué)習(xí)效率偏低,學(xué)習(xí)動(dòng)機(jī)偏弱,師生及生生交互不充分,學(xué)習(xí)資源及工具利用率低下等突出問題。這將直接導(dǎo)致學(xué)習(xí)效果不理想,也不利于教師把握教學(xué)過程,進(jìn)而給網(wǎng)絡(luò)教學(xué)的效果帶來極大的困難與挑戰(zhàn)?! ?shù)據(jù)挖掘是從大量的、不完全的、模糊的、隨機(jī)的數(shù)據(jù)中提取
4、潛在的有用信息和知識(shí)的過程,目前,數(shù)據(jù)挖掘技術(shù)已經(jīng)廣泛的被應(yīng)用于銀行、電信、保險(xiǎn)、交通、零售(如超級(jí)市場(chǎng))等商業(yè)領(lǐng)域,但在教育領(lǐng)域的應(yīng)用還較少。本文研究的是數(shù)據(jù)挖掘在Web上的應(yīng)用,通過記錄學(xué)習(xí)者訪問數(shù)據(jù);如參考頁面、訪問時(shí)間和日期、用戶站點(diǎn)等信息獲得出學(xué)習(xí)行為的特征信息。研究學(xué)生網(wǎng)絡(luò)學(xué)習(xí)的行為問題為構(gòu)建個(gè)性化、智能化的學(xué)習(xí)系統(tǒng)提供有益的支持,總結(jié)其一般規(guī)律,并將其應(yīng)用于教學(xué)平臺(tái)及教學(xué)資源開發(fā)、教學(xué)評(píng)價(jià)、教學(xué)管理與支持服務(wù),將能更有效地發(fā)揮網(wǎng)絡(luò)學(xué)習(xí)的優(yōu)勢(shì),提高教學(xué)效率和成效。 3Web數(shù)據(jù)挖掘的相關(guān)概念 3.1Web挖掘的定義和分類7 萬維網(wǎng)是全球最大的信息服務(wù)中心,
5、其包含豐富的動(dòng)態(tài)超鏈接信息和Web頁面的訪問使用信息。這些數(shù)據(jù)具有復(fù)雜性高、動(dòng)態(tài)性強(qiáng)、半結(jié)構(gòu)化等特點(diǎn)。Web挖掘是數(shù)據(jù)挖掘在Web技術(shù)中的應(yīng)用,就是利用數(shù)據(jù)挖掘技術(shù)在因特網(wǎng)文件及服務(wù)中發(fā)現(xiàn)并提取隱含的信息?! eb數(shù)據(jù)挖掘可以分為Web內(nèi)容挖掘、Web結(jié)構(gòu)挖掘和Web日志挖掘三類。Web內(nèi)容挖掘是從Web頁面中抽取有用信息的過程。即從圖片、文本、視頻等網(wǎng)頁中眾多非結(jié)構(gòu)化的數(shù)據(jù)中找出類似的信息。其重點(diǎn)是頁面的分類和聚類;Web結(jié)構(gòu)挖掘是從Web組織結(jié)構(gòu)和鏈接關(guān)系中推導(dǎo)知識(shí)。頁面鏈接信息是Web數(shù)據(jù)的一個(gè)重要的方面,發(fā)掘網(wǎng)頁之間的鏈接信息,可以用來指導(dǎo)對(duì)頁面進(jìn)行分類和聚類,幫
6、助用戶找到權(quán)威頁面、中心頁面,從而提高檢索的性能Web結(jié)構(gòu)挖掘可以分為Web文檔內(nèi)部結(jié)構(gòu)挖掘和文檔間的超鏈接結(jié)構(gòu)挖掘;Web日志挖掘也稱為Web使用挖掘,是從服務(wù)器端記錄的用戶訪問日志或從用戶的瀏覽信息中抽取感興趣的模式,通過分析這些數(shù)據(jù)可以幫助理解用戶隱藏在數(shù)據(jù)中的行為模式,做出預(yù)測(cè)性分析,從而改進(jìn)站點(diǎn)的結(jié)構(gòu)或?yàn)橛脩籼峁﹤€(gè)性化的服務(wù)?! ?.2Web日志挖掘的過程 Web服務(wù)器在收到用戶請(qǐng)求并響應(yīng)時(shí),會(huì)將相關(guān)的信息寫入日志文件,這些數(shù)據(jù)便是Web挖掘的原始數(shù)據(jù),網(wǎng)站日志文件包含的數(shù)據(jù)信息有:使用者的IP地址、日期、需求的資源、資源存取的狀態(tài)等。Web日志挖掘的過程如圖1
7、所示: 1)數(shù)據(jù)預(yù)處理:獲取Web日志數(shù)據(jù),并將其轉(zhuǎn)換為適合數(shù)據(jù)挖掘的形式;7 2)模式發(fā)掘:利用數(shù)據(jù)挖掘工具及適當(dāng)?shù)乃惴▽?duì)數(shù)據(jù)進(jìn)行挖掘并生成模式; 3)模式分析:對(duì)發(fā)掘生成的模式進(jìn)行轉(zhuǎn)換,從中提取對(duì)用戶有用的信息。 4網(wǎng)絡(luò)學(xué)習(xí)行為數(shù)據(jù)的采集 Web日志挖掘通過對(duì)網(wǎng)絡(luò)學(xué)習(xí)平臺(tái)學(xué)習(xí)者交互信息的數(shù)據(jù)庫進(jìn)行分析并發(fā)現(xiàn)學(xué)習(xí)者的學(xué)習(xí)行為特征。Web日志可以記錄使用者的一切操作,如通過記錄學(xué)習(xí)者頻繁登錄的頁面,頁面駐留的時(shí)間,可以發(fā)掘最受歡迎的教學(xué)資源,并將其推薦給其他可能的學(xué)習(xí)者。通過記錄學(xué)習(xí)者的發(fā)帖數(shù)、提交作業(yè)等