文章采集过滤不相关的文章教程

文章采集过滤不相关文章的教程

快捷导读:

一、打开词库

二、添加敏感词

三、调用词库

四、总结



很多网友提出,在采集的时候会采集到一些不相关的文章,这是因为大家没有设置敏感词库,在设置了敏感词库后就可以大大避免采集到不相关的文章,下面就是采集工具,过滤不相关文章的教程:

一、打开词库

在采集首页,找到窗口右上方的【词库配置】,弹出词库界面,然后在词库界面点击右上角的【新增词库】。

二、添加敏感词

如下图所示,在新增词库界面选中【敏感词】,然后在下方的方框内输入用户不像采集的敏感词,多个敏感词的话,只需要跳行输入即可,设置好后点击上方的保存就可以了。

三、调用词库

回到采集任务界面,按照下图所示,点击1号箭头所指的【设置】弹出2号箭头所指的词库调用界面,在此界面选到刚刚设置好的词库就可以了。

四、总结

通过增加敏感词的方式确实能大大过滤采集时的不相关文章,但是根据用户自己需求,敏感字还需要用户多多挖掘和发现。


转载请说明出处
147SEO » 文章采集过滤不相关的文章教程

发表评论

欢迎 访客 发表评论

一个令你着迷的主题!

查看演示 官网购买