文章采集過濾不相關文章的教程
快捷導讀:
一、打開詞庫
二、添加敏感詞
三、調用詞庫
四、總結
很多網友提出,在采集的時候會采集到一些不相關的文章,這是因為大家沒有設置敏感詞庫,在設置了敏感詞庫后就可以大大避免采集到不相關的文章,下面就是采集工具,過濾不相關文章的教程:
在采集首頁,找到窗口右上方的【詞庫配置】,彈出詞庫界面,然后在詞庫界面點擊右上角的【新增詞庫】。
如下圖所示,在新增詞庫界面選中【敏感詞】,然后在下方的方框內輸入用戶不像采集的敏感詞,多個敏感詞的話,只需要跳行輸入即可,設置好后點擊上方的保存就可以了。
回到采集任務界面,按照下圖所示,點擊1號箭頭所指的【設置】彈出2號箭頭所指的詞庫調用界面,在此界面選到剛剛設置好的詞庫就可以了。
通過增加敏感詞的方式確實能大大過濾采集時的不相關文章,但是根據用戶自己需求,敏感字還需要用戶多多挖掘和發現。
轉載請說明出處
147SEO » 文章采集過濾不相關的文章教程
147SEO » 文章采集過濾不相關的文章教程