資源描述:
《基于數(shù)據(jù)挖掘的學(xué)生選課及學(xué)習(xí)行為分析算法研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、基于數(shù)據(jù)挖掘的學(xué)生選課及學(xué)習(xí)行為分析算法研究 摘要:依據(jù)教育數(shù)據(jù)挖掘技術(shù),通過關(guān)聯(lián)規(guī)則挖掘中的確定因素法和序列模式挖掘,分別對(duì)學(xué)生課程選擇的最小關(guān)聯(lián)規(guī)則和學(xué)生的臨時(shí)興趣學(xué)習(xí)模式進(jìn)行挖掘,以此進(jìn)行學(xué)生的行為分析。首先,通過最小關(guān)聯(lián)規(guī)則挖掘中的確定因素(DF)法,從課程數(shù)據(jù)庫中挖掘?qū)W生課程選擇的最小關(guān)聯(lián)規(guī)則。其次,通過臨時(shí)興趣序列模式(TIPS)技術(shù),在學(xué)習(xí)活動(dòng)序列中發(fā)現(xiàn)短期的學(xué)習(xí)行為模式。最后,通過數(shù)據(jù)實(shí)驗(yàn)驗(yàn)證該算法具有實(shí)際意義關(guān)鍵詞:數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則;確定因素法;序列模式中圖分類號(hào):TN911?3
2、4;TM417文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1004?373X(2016)13?0145?04Abstract:Accordingtotheeducationaldatamining(EDM)technology,theminimumassociationruleofstudentscourseselectionandstudenttemporaryinterestlearningpatternareminedrespectivelybymeansofdefinitefactormethodandseque
3、ncepatternmininginassociationrulesminingtoanalyzethestudentbehavior.Thedefinitefactors(DF)methodinminimumassociationruleminingisusedtominetheminimumassociationrulesofstudentscourseselectioninthecoursesdatabase.Andthen,thetemporaryinterestsequencepattern
4、(TIPS)techniqueisusedtofindouttheshort?termlearningbehaviorpatterninlearningactivitysequences.Theexperimentalverificationresultsshowthisalgorithmhasapracticalsignificance.Keywords:datamining;associationrule;definitefactormethod;sequencepattern近些年,圍繞著大數(shù)據(jù)
5、可被用于造福教育與學(xué)習(xí)科學(xué)這一共同利益,兩個(gè)方面的技術(shù)逐漸得到了發(fā)展,這兩個(gè)方面就是教育數(shù)據(jù)挖掘(EDM)以及學(xué)習(xí)分析[1]。隨著教育數(shù)據(jù)挖掘的快速發(fā)展,數(shù)據(jù)挖掘中的各項(xiàng)技術(shù),諸如關(guān)聯(lián)規(guī)則挖掘,序列模式挖掘等技術(shù)都相繼得到了應(yīng)用,這也進(jìn)一步促進(jìn)了教育數(shù)據(jù)挖掘技術(shù)的發(fā)展。同時(shí),通過教育數(shù)據(jù)挖掘?qū)逃龜?shù)據(jù)進(jìn)行的數(shù)據(jù)挖掘而得到的潛在信息或是關(guān)聯(lián)規(guī)則也得到了更多的應(yīng)用,通過這些潛在信息和關(guān)聯(lián)規(guī)則,管理者可以更好地制定管理策略和教學(xué)策略,這對(duì)提高學(xué)校的管理和教學(xué)有著非常重要的意義[2]1學(xué)生課程選擇的最小關(guān)聯(lián)規(guī)
6、則的挖掘?qū)W生的課程選擇是大學(xué)生日常學(xué)習(xí)生活中必須接觸到的,并且會(huì)直接影響到學(xué)生在校學(xué)習(xí),所以課程選擇顯然是一種重要的學(xué)生行為[3]。因此,采用確定因素法,從課程數(shù)據(jù)庫中挖掘?qū)W生課程可以采用最小關(guān)聯(lián)規(guī)則挖掘技術(shù)1.1關(guān)聯(lián)規(guī)則(1)關(guān)聯(lián)規(guī)則的挖掘關(guān)聯(lián)關(guān)系可以采用置信度、支持度、期望置信度、作用度四個(gè)標(biāo)量進(jìn)行表述。通常來說,置信度就是關(guān)聯(lián)規(guī)則下準(zhǔn)確度的衡量標(biāo)準(zhǔn),而支持度則體現(xiàn)了重要性標(biāo)準(zhǔn)。支持度越大,說明這個(gè)關(guān)聯(lián)規(guī)則就更加重要。如果在數(shù)據(jù)挖掘中,存在關(guān)聯(lián)規(guī)則的置信度較高,但是支持度卻相對(duì)較低,那么這種規(guī)則的
7、實(shí)際應(yīng)用效果就很難保障[4](2)關(guān)聯(lián)規(guī)則挖掘的過程關(guān)聯(lián)規(guī)則的挖掘需要通過兩個(gè)階段來實(shí)現(xiàn):第一個(gè)階段就是從現(xiàn)有的數(shù)據(jù)集合中找到高頻項(xiàng)目組,并進(jìn)行整合;第二個(gè)階段就是通過這些高頻項(xiàng)目組構(gòu)建關(guān)聯(lián)規(guī)則在第一個(gè)階段中涉及到的高頻項(xiàng)目組中的高頻內(nèi)涵指的是其中某一個(gè)具體的項(xiàng)目組出現(xiàn)的頻率,只有這個(gè)項(xiàng)目組在記錄中出現(xiàn)的頻率達(dá)到了某一個(gè)水平,那么就叫做高頻項(xiàng)目組。而且一個(gè)項(xiàng)目組出現(xiàn)的頻率實(shí)際上就是支持度。比如以包含了物品集合和物品集合的項(xiàng)目為例,通過式(1)就能夠獲得的項(xiàng)目支持度通過式(1)計(jì)算出來的支持度如果大于設(shè)
8、定的最小支持度,那么{A,B}這個(gè)項(xiàng)目組就可以稱作高頻項(xiàng)目組。比如某個(gè)項(xiàng)目組K?滿足了這個(gè)最小支持度,就說明這個(gè)項(xiàng)目組K?是高頻項(xiàng)目組,可以使用Largek表示這種高頻項(xiàng)目組。然后關(guān)聯(lián)算法就從Largek中進(jìn)行延伸,從而產(chǎn)生Largek+1,直到找到了所有的高頻項(xiàng)目組關(guān)聯(lián)規(guī)則的第二個(gè)階段自然就是找到關(guān)聯(lián)規(guī)則。實(shí)際上很多高頻項(xiàng)目組就是產(chǎn)生關(guān)聯(lián)規(guī)則的搖籃。利用第一個(gè)過程中的項(xiàng)目組K?獲得關(guān)聯(lián)規(guī)則。在設(shè)置最小置信度的門檻下,如果每一個(gè)關(guān)聯(lián)規(guī)則超過了這個(gè)置信度,