ThinkPHP之中文分詞查詢

這裡用到的分詞是 第四版的 PSCWS,雖速度然比較慢,但是簡單啊,不多廢話,下面開始步驟。

首先在官網上下載對應版本

ThinkPHP之中文分詞查詢
ThinkPHP之中文分詞查詢

這裡需要下載XDB詞典和pscws4的sdk,解壓這兩個文件,將dict.utf8.xdb詞典和sdk文件夾下的rules.utf8.ini放在PUblic下的dict文件夾裡

ThinkPHP之中文分詞查詢
ThinkPHP之中文分詞查詢
ThinkPHP之中文分詞查詢
ThinkPHP之中文分詞查詢

將sdk下的這兩個文件移動到Vendor下的Pscws裡

ThinkPHP之中文分詞查詢
ThinkPHP之中文分詞查詢

並修改名稱為PSCWS4.PHP和xdb_r.PHP,在PSCWS4.PHP的120行左右把建構函式修改為如下形式

ThinkPHP之中文分詞查詢
ThinkPHP之中文分詞查詢

三、新增分詞私有方法

ThinkPHP之中文分詞查詢
ThinkPHP之中文分詞查詢

四、在需要分詞的地方呼叫該方法就能夠進行分詞,如下

$key_array = $this->get_tags($content);

接下來就是邏輯實現了,

ThinkPHP之中文分詞查詢
ThinkPHP之中文分詞查詢