ThinkPHP之中文分詞查詢

這裡用到的分詞是 第四版的 PSCWS,雖速度然比較慢,但是簡單啊,不多廢話,下面開始步驟。

首先在官網上下載對應版本

這裡需要下載XDB詞典和pscws4的sdk,解壓這兩個文件,將dict.utf8.xdb詞典和sdk文件夾下的rules.utf8.ini放在PUblic下的dict文件夾裡

將sdk下的這兩個文件移動到Vendor下的Pscws裡

並修改名稱為PSCWS4.PHP和xdb_r.PHP,在PSCWS4.PHP的120行左右把建構函式修改為如下形式

三、新增分詞私有方法

四、在需要分詞的地方呼叫該方法就能夠進行分詞,如下

$key_array = $this->get_tags($content);

接下來就是邏輯實現了,

關鍵詞:中文分詞 ThinkPHP

相關推薦:

自然語言處理中“中文分詞”技術中“自動切分”的幾點理解

初識php非同步多執行緒擴充套件swoole

B 站直播間資料爬蟲

我用Python爬了4400條淘寶商品資料,竟發現了這些“潛規則”

python環境jieba分詞的安裝

用PaddlePaddle調戲郵件詐騙犯-Part1

python詞雲(二):中文詞雲介紹及其存在的問題

R語言jiebaR包的分詞學習

postgresql全文檢索部署實施

[DeepNLP] 初識命名實體識別