许多朋友在采集的时候会遇到这样的问题,一些网站上的文章来源里会出现两个甚至多个来源媒体,这样就很不容易写文章来源的匹配规则,而且许多来源都是有链接的,这样又增加了写匹配规则的难度,在这种情况下,我们很有必要为所有的采集文章指定一个固定的文章来源
具体方法如下:
在采集规则写好后,点击“更改配置”,在字段配置可以找到这段代码:
{dede:item field='source' value='' isunit='' isdown=''}
{dede:match}{/dede:match}
{dede:trim}<a([^>]*)>{/dede:trim}
{dede:trim}</a>{/dede:trim}
{dede:function}{/dede:function}
{/dede:item}
在这里我们可以给source的value附一个值,比如"织梦论坛",修改后的代码如下:
{dede:item field='source' value='织梦论坛' isunit='' isdown=''}
{dede:match}{/dede:match}
{dede:trim}<a([^>]*)>{/dede:trim}
{dede:trim}</a>{/dede:trim}
{dede:function}{/dede:function}
{/dede:item}
这样修改,就可以将所有采集到的文章的来源固定为“织梦论坛”了。
但是有些朋友还有些特殊的要求,需要为这个来源添加一个链接,还是很简单的,只需把value的值改成
<a href="http://bbs.dedecms.com">织梦论坛</a>
但是在默认的情况下,文章内容页中的文章来源是不会显示的,因为数据库中对source的长度做了限制,只要进入数据库中找到表dede_archives 修改source的长度就可以了
采集数据导入完成后,找到采集-批量维护-自动摘要/分页,然后[开始执行]就可以自动采集文章摘要了,最后更新一下HTML就OK 了

免责声明:本站所有文章和图片均来自用户分享和网络收集,文章和图片版权归原作者及原出处所有,仅供学习与参考,请勿用于商业用途,如果损害了您的权利,请联系网站客服处理。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。