資源描述:
《引文分析法共詞分析法淺析.ppt》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫(kù)。
1、引文分析法、共詞分析法淺析于偉科學(xué)研究前沿代表了科學(xué)發(fā)展的難點(diǎn)、熱點(diǎn)以及發(fā)展趨勢(shì),從浩瀚的科技信息中探測(cè)研究前沿是科技創(chuàng)新的關(guān)鍵任務(wù)之一。因此,如何能夠科學(xué)、準(zhǔn)確地把握研究前沿已經(jīng)成為科學(xué)研究人員及其管理者關(guān)注的焦點(diǎn)??茖W(xué)家提出各種方法與技術(shù)用于探測(cè)研究前沿,其中以利用引文分析和共詞分析的研究最為常見。引文分析引文分析是利用各種數(shù)學(xué)、統(tǒng)計(jì)學(xué)以及邏輯方法,對(duì)科技期刊、論文、著作等各種分析對(duì)象的引用或被引用現(xiàn)象進(jìn)行分析研究,以便揭示其數(shù)量特征和內(nèi)在規(guī)律,達(dá)到評(píng)價(jià)、預(yù)測(cè)科學(xué)發(fā)展趨勢(shì)的目的。近幾年主要的關(guān)注研究對(duì)象或熱點(diǎn)集中在“引文網(wǎng)絡(luò)”、“自引與自引率”、“共
2、引分析”、“影響因子”以及“引文分析和統(tǒng)計(jì)中的誤差”等方面。在引文分析中,引文網(wǎng)絡(luò)得到了學(xué)者們的高重視。國(guó)外方面,將引文看作代表信賴的原型。他們認(rèn)為在虛擬環(huán)境中,引文實(shí)際上代表了一種信賴。當(dāng)A引用B的文章時(shí),A認(rèn)為B的觀點(diǎn)是支持性的,而B引用的內(nèi)容是被協(xié)商許可了的,引用內(nèi)容的同時(shí)也就影響了B的思維。因此,引文網(wǎng)絡(luò)系統(tǒng)可以被看成是信賴系統(tǒng),引文索引則可以被看成是一個(gè)推薦系統(tǒng)———推薦被引次數(shù)多的文章。引文網(wǎng)絡(luò)在引文網(wǎng)絡(luò)中存在大量的同引和耦合。同引(或稱同被引)是指兩篇或兩篇以上文獻(xiàn)共同被之后的一篇或多篇文獻(xiàn)引用,如圖中5和6同時(shí)被之后的8和8′引用;引用它
3、們的論文的多少,即同被引程度,稱為同被引強(qiáng)度。耦合則是指兩篇文獻(xiàn)共同引用了一篇或多篇文獻(xiàn),如圖中2和4共同引用了1;耦合的文獻(xiàn)之間總存在著這樣或那樣的聯(lián)系,其聯(lián)系的程度稱為耦合強(qiáng)度。引文網(wǎng)絡(luò)的結(jié)構(gòu)特點(diǎn)有:①引文網(wǎng)絡(luò)是靜態(tài)的,不可以在任何已有節(jié)點(diǎn)上增加新的代表引用的單向箭頭,也不可以隨意刪除已有的代表引用的單向箭頭,因?yàn)槲墨I(xiàn)一經(jīng)出版之后,它的參考文獻(xiàn)就一成不變了;②引文網(wǎng)絡(luò)中的引用是單向的,即只能是后期的文獻(xiàn)引用前期的文獻(xiàn),而前期的文獻(xiàn)不能反過來引用后期的文獻(xiàn);③引文網(wǎng)絡(luò)中的引文不可以自引,引文不能自己引用自己,在引文分析中,自引主體只能是作者、期刊、學(xué)科
4、、機(jī)構(gòu)等;④引文網(wǎng)絡(luò)中的引用是有固定時(shí)間的,即文獻(xiàn)A引用文獻(xiàn)B是有固定時(shí)間的,這個(gè)固定時(shí)間正好是文獻(xiàn)A的發(fā)表時(shí)間,且文獻(xiàn)A的發(fā)表時(shí)間必然在文獻(xiàn)B之后,如圖3中8和8′同時(shí)發(fā)表,故不存在8引用8′或8′引用8;⑤引文網(wǎng)絡(luò)中引文間的引用呈現(xiàn)出主題集中,因?yàn)橐拈g引用的正式性和文獻(xiàn)出版的質(zhì)量控制,引文基本來自同一科學(xué)領(lǐng)域或關(guān)系緊密的領(lǐng)域。常見的引文網(wǎng)絡(luò)測(cè)度指標(biāo)可以分為四類:①引文數(shù)量特征測(cè)度指標(biāo):引文數(shù);②引文分布特征測(cè)度指標(biāo):平均引用數(shù)、自引數(shù)與自引率、被引次數(shù)與引用數(shù)的比值;③期刊(論文)影響力測(cè)度指標(biāo):被引用數(shù)、同引和耦合、期刊影響因子即年指標(biāo);④文獻(xiàn)老
5、化規(guī)律測(cè)度指標(biāo):衰減系數(shù)等自引自引率關(guān)于自引和自引率的研究是引文分析的內(nèi)容之一。目前在國(guó)外研究最多的是關(guān)于期刊的自引和自引率。一般認(rèn)為,期刊高自引有助于提升其影響因子;也有研究人員研究去除期刊自引數(shù)對(duì)影響因子的影響,認(rèn)為未去除影響因子的數(shù)據(jù)可以采用;還有研究顯示期刊自引與自引率與影響因子的負(fù)相關(guān)性。共引(co-citation)就是兩篇文獻(xiàn)同時(shí)被其他文獻(xiàn)引用。一般認(rèn)為同被引用的文獻(xiàn)在主題上具有或多或少的相似性,因此同被引次數(shù)即共引強(qiáng)度可以測(cè)度文獻(xiàn)在內(nèi)容方面的相關(guān)度。由此,通過一組文獻(xiàn)之間的共引關(guān)系可以形成共引網(wǎng)絡(luò),該網(wǎng)絡(luò)內(nèi)節(jié)點(diǎn)之間的遠(yuǎn)近便可以反映它們主題
6、內(nèi)容的親疏關(guān)系。共引分析方法始于small于1973年提出的以文獻(xiàn)為單位的共引分析,但共引概念可以推廣到與文獻(xiàn)相關(guān)的各種特征對(duì)象上,形成各種類型的共引概念,如詞的共引、文獻(xiàn)共引、著者共引、期刊共引、主題共引和類的共引等。共引的意義自1973年被提出以來,共引分析已成為引文分析里面一種潛在多產(chǎn)的分析方法,它不僅可以用來揭示科學(xué)結(jié)構(gòu)的發(fā)展現(xiàn)狀乃至變化情況,還可以用來進(jìn)行前沿分析、領(lǐng)域分析、科研評(píng)價(jià)等,進(jìn)而為宏觀科技決策提供先行支持,為科技規(guī)劃與評(píng)估提供基礎(chǔ)。共引分析的一般過程共引分析方法的一般過程可以概括為分析領(lǐng)域的確定分析對(duì)象的選擇及共引矩陣的形成共引數(shù)據(jù)
7、的處理聚類分析和多維標(biāo)度結(jié)果分析和解釋。方法的演進(jìn)過程以分析過程中分析對(duì)象的選擇和聚類方法中的參數(shù)修正為主。選擇對(duì)象搜索數(shù)據(jù)構(gòu)建矩陣聚類分析/多維尺度分析/計(jì)算戰(zhàn)略坐標(biāo)分析結(jié)果幾乎國(guó)內(nèi)外所有學(xué)者都是按照統(tǒng)一的方法模式來進(jìn)行共被引分析,即第一步構(gòu)造共被引矩陣;第二步將該矩陣轉(zhuǎn)化為相似系數(shù)矩陣,方法大多為皮爾遜相關(guān)系數(shù)法(Pearson’SCorrelationCoeficient);第三步是進(jìn)行聚類(Cluster)和多維尺度分析(MDS)。這基本是大家默認(rèn)的方法,在我國(guó)許多相關(guān)教材和相關(guān)論文中也多是采用這樣的方法。從2003年開始,在科學(xué)計(jì)量學(xué)學(xué)者之間又
8、引發(fā)了關(guān)于共被引分析方法的討論。焦點(diǎn)主要集中在對(duì)皮爾遜相關(guān)系數(shù)是否適合應(yīng)用到共被