資源描述:
《citespace軟件操作問答》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、WORD格式整理Citespace軟件操作問答(摘自陳超美博士的科學(xué)網(wǎng)博客)(8)如何在CiteSpace中控制節(jié)點的取舍CiteSpace提供了幾種方式來控制最終生成的網(wǎng)絡(luò)將由哪些節(jié)點構(gòu)成:1.TopN2.TopN%3.ThresholdInterpolation4.SelectCiters第一種辦法最簡單,最適于初學(xué)階段,所以目前版本將其放在首位。其余幾種辦法逐漸變得復(fù)雜,最好等熟悉系統(tǒng)之后再考慮。下面簡要介紹一下各個方法的細(xì)節(jié)。TopN:系統(tǒng)設(shè)定N=30,意為在每個timeslice中提取N個被引次數(shù)最高的文獻(xiàn)。N越大生成的網(wǎng)絡(luò)將相對更全面一些。TopN%:將每個t
2、imeslice中的被引文獻(xiàn)按被引次數(shù)排序后,保留最高的N%作為節(jié)點。ThresholdInterpolation:設(shè)定三個timeslices的值,其余timeslices的值由線性插值賦值。三組需要設(shè)置的slices為第一個,中間一個,和最后一個slice。每組中的三個值分別為c,cc,和ccv。c為最低被引次數(shù)。只有滿足這個條件的文獻(xiàn)才能參加下面的運算。cc為本slice內(nèi)的共被引次數(shù)。ccv為規(guī)范化以后的共被引次數(shù)(0~100)。SelectCiters:與以上方法不同的是這個方法先選施引文獻(xiàn),然后需再用方法1-3之一。先CheckTCDistribution然后
3、填寫UseTCFilter后面的兩個數(shù)字:最低和最高TC值(TimeCited),選定UserTCFilter前的選項。按Continue,再設(shè)定方法1,2,或3。節(jié)點總數(shù)在ProgressReports中給出。節(jié)點總數(shù)越大需要內(nèi)存越多。下回將介紹如何選擇網(wǎng)絡(luò)的連接密度。CiteSpace提供了多項參數(shù)選擇,初學(xué)者難免有時不知從何下手。這里介紹一些要點以供參考。CiteSpace的功能類似一架照相機,只是它拍攝的對象是科學(xué)文獻(xiàn)而不是自然景色。設(shè)置CiteSpace的各項參數(shù)大致相當(dāng)于取景,調(diào)焦,對光圈。不過這些過程在如今的相機中基本都已完全透明。所以,參數(shù)設(shè)置對CiteS
4、pace所產(chǎn)生的圖譜有直接影響。最初使用時,最簡單的辦法是先采用系統(tǒng)的預(yù)定參數(shù);熟悉之后,再按下面提供的要點調(diào)整參數(shù)。那么什么樣的CiteSpace圖譜才算好圖譜呢?CiteSpace的設(shè)計實際上是有針對性的。能滿足CiteSpace設(shè)計要求的圖譜才視為好圖譜。CiteSpace要展現(xiàn)的是一個領(lǐng)域的知識發(fā)展的歷史和現(xiàn)狀。這是CiteSpace的取景范圍。由于深受庫恩《科學(xué)革命的結(jié)構(gòu)》的影響,對CiteSpace來說,焦點自然是在范式(paradigm)和范式轉(zhuǎn)移(paradigm專業(yè)知識分享WORD格式整理shift)。近年來大家傾向于這種認(rèn)識:范式是一種更為廣泛的現(xiàn)象,
5、可以在各個層次上出現(xiàn)。換句話說,并非50年一遇或100年一遇。所以CiteSpace竭盡全力所要甄別,顯示,突出的就是在廣義的范式轉(zhuǎn)移中起關(guān)鍵作用的轉(zhuǎn)折點。與廣義范式相對應(yīng)的是科學(xué)文獻(xiàn)中自然呈現(xiàn)的聚類。轉(zhuǎn)折點便是聯(lián)結(jié)不同聚類的橋梁。如果CiteSpace生成的圖譜能清晰的顯示出這些要素,這種圖譜便屬上乘之作。關(guān)于解讀CiteSpace圖譜的要點,來日再寫。有了這個目標(biāo)以后,圖譜如能顯示倆三個或更多的自然網(wǎng)絡(luò)聚類,而且各聚類之間有少量的聯(lián)系,便為最佳。這樣的圖譜很容易帶來有趣的和有意義的發(fā)現(xiàn)。相反,如果圖譜中所有節(jié)點都糾纏在一起,則很難理出頭緒。如果碰到這種情況,檢查下面幾
6、種原因:數(shù)據(jù)范圍是否過窄,門檻設(shè)置是否過高(threshold),曝光時間是否過短(timeslice)。另外,可用CiteSpace中的鏈接剔除功能(pruning)來剔除一些次要的鏈接以突出核心結(jié)構(gòu)。成像以后,CiteSpace可提供進(jìn)一步的指標(biāo)。比如,modularity大約在0.4~0.8時的圖譜通常會符合或接近上述要求。另外,如果可能從每年或每個時間段中選取數(shù)量大致相當(dāng)?shù)臄?shù)據(jù),會比每年都使用同樣的門檻要更有效(相對于上述目標(biāo)而言)。做專利分析的時候,發(fā)現(xiàn)轉(zhuǎn)換德溫特專利的數(shù)據(jù);還有就是,C、CC和CCV閾值的選擇有沒有什么標(biāo)準(zhǔn)呢?TopN和TopN%更直接,建議你
7、用這兩項。c,cc,ccv的選擇靈活但較為復(fù)雜,參考2004年我的PNAS文章。從前,c有選5次以上的,ccv有選25%以上等等在文獻(xiàn)中都可見到。閾值低的覆蓋面會稍微廣一些??紤]到文獻(xiàn)數(shù)據(jù)本身的誤差,以及大部分人的注意力往往集中在最有代表性的工作,所以閾值的選擇總是相對的。WOS并不包括所有的文獻(xiàn)。另外,信息和噪音比也是一個考慮因素。關(guān)于闕值的選擇,我是不是可以這樣理解,就是說,知識圖譜是需要不斷探索和試驗的,對所選擇領(lǐng)域文獻(xiàn)的分析必須是基于文獻(xiàn)實際情況的,而不只是就圖說圖,理想的知識圖譜應(yīng)該是能夠正確反映文獻(xiàn)實際情況的那一張