sphinx中文分詞coreseek的配置.doc

sphinx中文分詞coreseek的配置.doc

ID:57650394

大?。?7.50 KB

頁數(shù):5頁

時間:2020-08-30

sphinx中文分詞coreseek的配置.doc_第1頁
sphinx中文分詞coreseek的配置.doc_第2頁
sphinx中文分詞coreseek的配置.doc_第3頁
sphinx中文分詞coreseek的配置.doc_第4頁
sphinx中文分詞coreseek的配置.doc_第5頁
資源描述:

《sphinx中文分詞coreseek的配置.doc》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。

1、coreseek的配置vicsft.conf第13行改成數(shù)據(jù)源名稱23行修改數(shù)據(jù)庫信息73行打開這兩個選項(xiàng)第79行寫出要查詢的SQL語句根據(jù)表與表結(jié)構(gòu)109行根據(jù)什么表中的那一列字段來排序256行為對增量數(shù)據(jù)源的配置暫時全部注釋掉271行為主索引test1為名字我取名為documentindex276行source設(shè)置數(shù)據(jù)源的來源既是上面配置數(shù)據(jù)源的名稱所以填寫document280行path設(shè)置數(shù)據(jù)源存放的路徑一般把后面的名字改成主索引的名稱就是了documentindex,315,321,330行對停詞的設(shè)置默認(rèn)是英文停詞這里

2、把他注釋掉340行設(shè)置編碼charset_type=zh_cn.utf-8然后在后面加上一句charset_dictpath=/usr/local/mmseg/etc/中文字典路徑353行UTF8的注釋去掉錯誤操作應(yīng)該要注釋掉477行這里是對增量索引的配置由于剛才把增量源給注釋掉了所以這里也暫時先注釋掉492行對分布式的設(shè)置意義不大關(guān)閉agentagent506和507行或者全部注釋掉533行推薦256M配置好過后進(jìn)入bin目標(biāo)生成索引/usr/local/coreseek/bin/indexer-c/usr/local/core

3、seek/etc/csft.conf--all增量索引配置創(chuàng)建一個計(jì)數(shù)器的表CREATETABLE`sph_counter`(`counter_id`int(10)unsignedNOTNULLAUTO_INCREMENT,`max_doc_id`int(11)NOTNULL,PRIMARYKEY(`counter_id`))ENGINE=MyISAMDEFAULTCHARSET=utf8修改配置文件主數(shù)據(jù)源里面:我們需要把欲查詢語句改成下面的語句:13行Sourcemain{把sql_query_pre的改成下面的語句79行sq

4、l_query_pre=REPLACEINTOsph_counterSELECT1,MAX(id)FROMdocumentssql_query=SELECTid,group_id,UNIX_TIMESTAMP(date_added)ASdate_added,title,contentFROMdocumentsWHEREid<=(SELECTmax_doc_idFROMsph_counterWHEREcounter_id=1)}256行配置增量索引源src1throttlet為增量索引源名稱:src1為繼承的主索引源將其改成:

5、sourcedelta:document{sql_query_pre=setnamesutf8sql_query=SELECTid,group_id,UNIX_TIMESTAMP(date_added)ASdate_added,title,contentfromdocumentswhereid>(selectmax_doc_idfromsph_counterwherecounter_id=1)}第485行配置增量索引deltaindex為增量索引名稱:后面繼承主索引487行path寫上存放路徑通常改掉后面名稱為deltaindex

6、就行并在上邊加上數(shù)據(jù)源的來源indexdeltaindex:documentindex{source=deltapath=/usr/local/coreseek/var/data/deltaindexmorphology=stem_en}配置完成后/usr/local/coreseek/bin/indexer-c/usr/local/coreseek/etc/csft.conf--rotate--all生成所有索引/usr/local/coreseek/bin/indexer-c/usr/local/coreseek/etc/cs

7、ft.conf--rotatedeltaindex生成增量索引/usr/local/coreseek/bin/indexer-c/usr/local/coreseek/etc/csft.conf--mergedocumentindexdeltaindex合并索引給PHP安裝模塊tarzxfsphinx-1.1.0.tgz解壓包/usr/local/php/bin/phpize./configure--with-php-config=/usr/local/php/bin/php-config--with-sphinx如果提示出錯:m

8、ake:***沒有指明目標(biāo)并且找不到makefile。停止。找到libsphinxclient在/root/soft/coreseek-3.2.14/csft-3.2.14/api/libsphinxclient把他編譯安裝了./configure

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。