資源描述:
《基于數(shù)據(jù)挖掘的學(xué)生選課及學(xué)習(xí)行為分析算法研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、基于數(shù)據(jù)挖掘的學(xué)生選課及學(xué)習(xí)行為分析算法研究 摘要:依據(jù)教育數(shù)據(jù)挖掘技術(shù),通過關(guān)聯(lián)規(guī)則挖掘中的確定因素法和序列模式挖掘,分別對學(xué)生課程選擇的最小關(guān)聯(lián)規(guī)則和學(xué)生的臨時興趣學(xué)習(xí)模式進(jìn)行挖掘,以此進(jìn)行學(xué)生的行為分析。首先,通過最小關(guān)聯(lián)規(guī)則挖掘中的確定因素(DF)法,從課程數(shù)據(jù)庫中挖掘?qū)W生課程選擇的最小關(guān)聯(lián)規(guī)則。其次,通過臨時興趣序列模式(TIPS)技術(shù),在學(xué)習(xí)活動序列中發(fā)現(xiàn)短期的學(xué)習(xí)行為模式。最后,通過數(shù)據(jù)實驗驗證該算法具有實際意義關(guān)鍵詞:數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則;確定因素法;序列模式中圖分類號:TN911
2、?34;TM417文獻(xiàn)標(biāo)識碼:A文章編號:1004?373X(2016)13?0145?04Abstract:Accordingtotheeducationaldatamining(EDM)technology,theminimumassociationruleofstudentscourseselectionandstudenttemporaryinterestlearningpatternareminedrespectivelybymeansofdefinitefactormethodands
3、equencepatternmininginassociationrulesminingtoanalyzethestudentbehavior.Thedefinitefactors(DF)methodinminimumassociationruleminingisusedtominetheminimumassociationrulesofstudentscourseselectioninthecoursesdatabase.Andthen,thetemporaryinterestsequencep
4、attern(TIPS)techniqueisusedtofindouttheshort?termlearningbehaviorpatterninlearningactivitysequences.Theexperimentalverificationresultsshowthisalgorithmhasapracticalsignificance.Keywords:datamining;associationrule;definitefactormethod;sequencepattern近些
5、年,圍繞著大數(shù)據(jù)可被用于造福教育與學(xué)習(xí)科學(xué)這一共同利益,兩個方面的技術(shù)逐漸得到了發(fā)展,這兩個方面就是教育數(shù)據(jù)挖掘(EDM)以及學(xué)習(xí)分析[1]。隨著教育數(shù)據(jù)挖掘的快速發(fā)展,數(shù)據(jù)挖掘中的各項技術(shù),諸如關(guān)聯(lián)規(guī)則挖掘,序列模式挖掘等技術(shù)都相繼得到了應(yīng)用,這也進(jìn)一步促進(jìn)了教育數(shù)據(jù)挖掘技術(shù)的發(fā)展。同時,通過教育數(shù)據(jù)挖掘?qū)逃龜?shù)據(jù)進(jìn)行的數(shù)據(jù)挖掘而得到的潛在信息或是關(guān)聯(lián)規(guī)則也得到了更多的應(yīng)用,通過這些潛在信息和關(guān)聯(lián)規(guī)則,管理者可以更好地制定管理策略和教學(xué)策略,這對提高學(xué)校的管理和教學(xué)有著非常重要的意義[2]1學(xué)生
6、課程選擇的最小關(guān)聯(lián)規(guī)則的挖掘?qū)W生的課程選擇是大學(xué)生日常學(xué)習(xí)生活中必須接觸到的,并且會直接影響到學(xué)生在校學(xué)習(xí),所以課程選擇顯然是一種重要的學(xué)生行為[3]。因此,采用確定因素法,從課程數(shù)據(jù)庫中挖掘?qū)W生課程可以采用最小關(guān)聯(lián)規(guī)則挖掘技術(shù)1.1關(guān)聯(lián)規(guī)則(1)關(guān)聯(lián)規(guī)則的挖掘關(guān)聯(lián)關(guān)系可以采用置信度、支持度、期望置信度、作用度四個標(biāo)量進(jìn)行表述。通常來說,置信度就是關(guān)聯(lián)規(guī)則下準(zhǔn)確度的衡量標(biāo)準(zhǔn),而支持度則體現(xiàn)了重要性標(biāo)準(zhǔn)。支持度越大,說明這個關(guān)聯(lián)規(guī)則就更加重要。如果在數(shù)據(jù)挖掘中,存在關(guān)聯(lián)規(guī)則的置信度較高,但是支持度卻
7、相對較低,那么這種規(guī)則的實際應(yīng)用效果就很難保障[4](2)關(guān)聯(lián)規(guī)則挖掘的過程關(guān)聯(lián)規(guī)則的挖掘需要通過兩個階段來實現(xiàn):第一個階段就是從現(xiàn)有的數(shù)據(jù)集合中找到高頻項目組,并進(jìn)行整合;第二個階段就是通過這些高頻項目組構(gòu)建關(guān)聯(lián)規(guī)則在第一個階段中涉及到的高頻項目組中的高頻內(nèi)涵指的是其中某一個具體的項目組出現(xiàn)的頻率,只有這個項目組在記錄中出現(xiàn)的頻率達(dá)到了某一個水平,那么就叫做高頻項目組。而且一個項目組出現(xiàn)的頻率實際上就是支持度。比如以包含了物品集合和物品集合的項目為例,通過式(1)就能夠獲得的項目支持度通過式(1
8、)計算出來的支持度如果大于設(shè)定的最小支持度,那么{A,B}這個項目組就可以稱作高頻項目組。比如某個項目組K?滿足了這個最小支持度,就說明這個項目組K?是高頻項目組,可以使用Largek表示這種高頻項目組。然后關(guān)聯(lián)算法就從Largek中進(jìn)行延伸,從而產(chǎn)生Largek+1,直到找到了所有的高頻項目組關(guān)聯(lián)規(guī)則的第二個階段自然就是找到關(guān)聯(lián)規(guī)則。實際上很多高頻項目組就是產(chǎn)生關(guān)聯(lián)規(guī)則的搖籃。利用第一個過程中的項目組K?獲得關(guān)聯(lián)規(guī)則。在設(shè)置最小置信度的門檻下,如果每一個關(guān)聯(lián)規(guī)則超過了這個置信度,