資源描述:
《dwpi數(shù)據(jù)庫加工過程的研究new》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、2008年第1期專利文獻(xiàn)研究2008年2月德溫特世界專利索引(DWPI)數(shù)據(jù)庫加工過程的研究專利檢索咨詢中心張秉齋?DWPI(DerwentWorldPatentIndex)數(shù)的專利文件,每周的處理量約為3.8萬件。據(jù)庫是湯姆森科技(ThomsonScientific)公司數(shù)據(jù)呈現(xiàn)多樣性:生產(chǎn)的世界上首屈一指的專利信息資源,主1.數(shù)據(jù)遞送介質(zhì)以電子形式為主,如:要用于技術(shù)預(yù)警與分析,競爭性情報(bào)、現(xiàn)有硬盤、軟盤、磁帶等,但也有少量紙件;技術(shù)和可專利性的檢索,以及專利侵權(quán)和無2.數(shù)據(jù)格式多種多樣,如:ASC
2、II文本、效檢索。截止到2007年6月,數(shù)據(jù)庫共包SGML、XML、TIFF圖像、PDF等;括約1550萬條記錄,涵蓋約3307萬件專利3.數(shù)據(jù)內(nèi)容包括著錄項(xiàng)目數(shù)據(jù)、摘要、文件。DWPI數(shù)據(jù)庫的一條記錄究竟是怎樣說明書全文等;制作的呢?本文旨在概括地介紹湯姆森科4.語言共18種。技的專利分析師在生產(chǎn)DWPI過程中所做的工作,希望本文能為我局的專利文獻(xiàn)和非專三、加工過程利文獻(xiàn)的數(shù)據(jù)深加工工作提供一點(diǎn)參考。在過去的30多年里,DWPI的加工流程有一定的調(diào)整,但其基本加工流程如圖1一、人員所示。湯姆森科技現(xiàn)在
3、從事DWPI數(shù)據(jù)庫生1.初步加工產(chǎn)的專業(yè)分析師約350人,按技術(shù)領(lǐng)域分為為了管理如此大量、多樣化的專利信以下12個(gè)組:1.聚合物;2.普通化學(xué);3.藥息,數(shù)據(jù)分析師首先要對(duì)接收到的數(shù)據(jù)做一物(化學(xué));4.藥物(生物);5.儀器;6.半系列的初步加工處理,以便將數(shù)據(jù)轉(zhuǎn)換成統(tǒng)導(dǎo)體;7.視聽與信號(hào)處理;8.計(jì)算;9.通一格式,識(shí)別并校正系統(tǒng)數(shù)據(jù)差錯(cuò),進(jìn)行名信;10.運(yùn)輸;11.工業(yè);12.電力電子。新稱標(biāo)準(zhǔn)化,識(shí)別新的發(fā)明或?qū)⒁延邪l(fā)明歸于進(jìn)人員至少需要經(jīng)過6—8個(gè)月的基礎(chǔ)培訓(xùn)。已有專利族。DWPI的編輯中心設(shè)
4、在英國。此外,TS非羅馬字符名稱的音譯、拼寫錯(cuò)誤或不(TeamSpeak,一種IP語音通信系統(tǒng))編輯正確的格式都會(huì)造成名稱錯(cuò)誤,通過識(shí)別并設(shè)施目前正在印度安裝。補(bǔ)充的編輯資源將修正公司名稱和發(fā)明人名稱中的錯(cuò)誤可提會(huì)改善數(shù)據(jù)質(zhì)量和及時(shí)性。高專利信息的準(zhǔn)確度。根據(jù)內(nèi)部登記文檔來檢查公司名稱,對(duì)識(shí)別出的公司添加德溫特二、數(shù)據(jù)公司代碼;對(duì)于新的公司名稱,給定一個(gè)新DWPI現(xiàn)在收錄41個(gè)專利機(jī)構(gòu)所公開的代碼并添加到內(nèi)部登記文檔中。接收著錄項(xiàng)目數(shù)據(jù),電子饋入或鍵盤輸入(對(duì)于紙件)同族專利分析,確定“基本”/“等同”
5、專利,捕獲選定的著錄數(shù)據(jù)國家知識(shí)產(chǎn)權(quán)局專利局文獻(xiàn)部1對(duì)于“基本”專利文件,對(duì)于“等同”專利文件,將著錄創(chuàng)建新的記錄項(xiàng)目添加到已有的記錄中2008年第1期專利文獻(xiàn)研究2008年2月圖1DWPI的基本加工流程例如:2007年5月經(jīng)過人工修正的專利際專利分類的數(shù)量如圖2所示:權(quán)人/發(fā)明人名稱、優(yōu)先權(quán)日、申請(qǐng)日、國圖22007年5月通過手工修正的錯(cuò)誤量(DWPI)DWPI采用“一個(gè)發(fā)明一條記錄的原則”。在接收一件專利文件時(shí),要根據(jù)德溫2國家知識(shí)產(chǎn)權(quán)局專利局文獻(xiàn)部2008年第1期專利文獻(xiàn)研究2008年2月特內(nèi)部的
6、專利優(yōu)先權(quán)數(shù)據(jù)登記文檔來進(jìn)行由德溫特分析師做最后決定,并將“非常規(guī)”“基本”/“等同”檢索。如果新收到的專的等同專利文件也添加到專利族中。這些利文件中的優(yōu)先權(quán)數(shù)據(jù)與先前處理過的任“非常規(guī)”等同專利文件是在巴黎公約條款何一件專利文件的優(yōu)先權(quán)數(shù)據(jù)都不匹配,則規(guī)定之外(在12個(gè)月的優(yōu)先權(quán)期限之后或該專利文件被確定為描述了一個(gè)新的發(fā)明,由非簽約國)申請(qǐng)的、沒有優(yōu)先權(quán)信息的文件。被指定為“基本”,并且用一個(gè)新的、唯一在DWPI的加工過程中,對(duì)原專利數(shù)據(jù)的入藏號(hào)創(chuàng)建一條新的DWPI記錄。如果該進(jìn)行如上所述的智力性整
7、理是使專利信息專利文件的優(yōu)先權(quán)數(shù)據(jù)與已經(jīng)列在內(nèi)部登增值的重要途徑之一。記文檔中一件發(fā)明的優(yōu)先權(quán)數(shù)據(jù)相匹配,則2.深加工將其指定為“等同”,并將其著錄項(xiàng)目數(shù)據(jù)湯姆森科技除了對(duì)原專利數(shù)據(jù)進(jìn)行智添加到已有的DWPI記錄中。力性整理外還有許多由分析師完成的深加DWPI專利族是在不同國家(地區(qū))、工項(xiàng)目,以實(shí)現(xiàn)專利信息的進(jìn)一步增值。這以不同(或相同)語言公開的與同一發(fā)明相些深加工項(xiàng)目包括:分類;發(fā)明名稱和摘要關(guān)的文件的集合。通過直接優(yōu)先權(quán)數(shù)據(jù)比對(duì)的改寫;手工代碼的標(biāo)引;化合物和聚合物來識(shí)別密切相關(guān)的同族專利以及間
8、接關(guān)聯(lián)的深度標(biāo)引。它們一起構(gòu)成了專利信息增值的同族專利,并創(chuàng)建同族專利之間的連接。拼圖,如圖3所示:圖3DWPI的信息增值拼圖1)分類多個(gè)德溫特類。每個(gè)類由代表部的字母和隨德溫特于1970年開發(fā)了自己的分類系后的兩位數(shù)字組成,例如:統(tǒng),它是一種技術(shù)領(lǐng)域分類系統(tǒng),2006年出¢X22是表示汽車電子裝置的類號(hào);版了第3版。該分類系統(tǒng)將發(fā)明分成21個(gè)¢C04是表示化學(xué)肥料的類號(hào)。寬泛的技術(shù)領(lǐng)域——部:德溫特分類始終是由本技術(shù)領(lǐng)域的分¢M(化學(xué))析