ThinkPHP之中文分詞查詢

這裡用到的分詞是 第四版的 PSCWS,雖速度然比較慢,但是簡單啊,不多廢話,下面開始步驟。

首先在官網上下載對應版本

這裡需要下載XDB詞典和pscws4的sdk,解壓這兩個文件,將dict.utf8.xdb詞典和sdk文件夾下的rules.utf8.ini放在PUblic下的dict文件夾裡

將sdk下的這兩個文件移動到Vendor下的Pscws裡

並修改名稱為PSCWS4.PHP和xdb_r.PHP,在PSCWS4.PHP的120行左右把建構函式修改為如下形式

三、新增分詞私有方法

四、在需要分詞的地方呼叫該方法就能夠進行分詞,如下

$key_array = $this->get_tags($content);

接下來就是邏輯實現了,

關鍵詞:中文分詞 ThinkPHP

相關推薦:

R語言jiebaR包的分詞學習

python 結巴分詞(jieba)詳解

使用python+機器學習方法進行情感分析(詳細步驟)

postgresql全文檢索部署實施

jiba中文分詞原理

PHP分詞使用之Jieba分詞(結巴分詞)應用

使用PostgreSQL進行全文檢索

word2vec詞向量及中文文字

jieba分詞