首页 [考试]织梦常用采集规则

[考试]织梦常用采集规则

举报
开通vip

[考试]织梦常用采集规则[考试]织梦常用采集规则 织梦cms自带的采集系统确实很不错,可以免去一些手工添加信息的麻 烦,设置一下dede采集规则、采集点,然后点采集,OK,一下子就可以 搞定~确实很省事的~下面介绍几种常用采集规则的过滤方法: copyright 应用示例一:来源作者中连接的过滤 在采集文章的时候,有的网站系统里面作者或者来源处都带有连接, 直接采集的话将连接采集回来了,然后由于这两个字段有限制,通常会 造成需要采集的内容没有采集回来,所以需要在过滤处添加下面正则过 滤。 1,如果要保留dedecms链...

[考试]织梦常用采集规则
[考试]织梦常用采集规则 织梦cms自带的采集系统确实很不错,可以免去一些手工添加信息的麻 烦,设置一下dede采集规则、采集点,然后点采集,OK,一下子就可以 搞定~确实很省事的~下面介绍几种常用采集规则的过滤方法: copyright 应用示例一:来源作者中连接的过滤 在采集文章的时候,有的网站系统里面作者或者来源处都带有连接, 直接采集的话将连接采集回来了,然后由于这两个字段有限制,通常会 造成需要采集的内容没有采集回来,所以需要在过滤处添加下面正则过 滤。 1,如果要保留dedecms链接中的文字: {dede:trim}]*)>{/dede:trim} {dede:trim}{/dede:trim} copyright 2,如果去掉链接中的文字: {dede:trim}]*)>([^<]*){/dede:trim} 应用示例二:织梦cms模板过滤标题空格 经常在采集文章的时候,标题文字里面有空格,采回来后应用很是麻 烦,所以需要在标题处过滤处添加下面正则过滤 {dede:trim} {/dede:trim} 中间有一空格 应用示例三:过滤GG广告代码 其实这个就是在上面的内容过滤,但是很多论坛里的网友经常问这个 ,所以单独作为一个应用列出来: {dede:trim}]*)>([^>]*){/dede:trim} 下面是在综合论坛上网友的各种正则的一个dedecms规则过滤全集: {dede:trim}]*)>{/dede:trim} {dede:trim}]*)>([^>]*){/dede:trim} {dede:trim}]*)>{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}]*)>([^>]*){/dede:trim} {dede:trim}]*)>{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}]*)>([^>]*){/dede:trim} {dede:trim}]*)>{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}]*)>([^>]*){/dede:trim} {dede:trim}]*)>{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}]*)>([^>]*){/dede:trim} {dede:trim}]*)>{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}]*)>([^<]*){/dede:trim} {dede:trim}]*)>{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}]*)>([^<]*){/dede:trim} {dede:trim}]*)>{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}]*)>([^>]*){/dede:trim} {dede:trim}]*)>{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}]*)>([^>]*){/dede:trim} {dede:trim}]*)>{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}]*)>([^>]*){/dede:trim} {dede:trim}{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}]*)>([^>]*){/dede:trim} {dede:trim}]*)>{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}]*)>{/dede:trim} {dede:trim}]*)>{/dede:trim} {dede:trim}{/dede:trim} {dede:trim} {/dede:trim} {dede:trim}{/dede:trim} {dede:trim}{/dede:trim} 应用示例四:文章内容中连接以及其他广告代码的过滤 这个就不用说了,当需要对所有东西过滤的时候,直接用上面所有的 代码过滤就可以,但是实际应用中,我们只需要对连接、动画、调用等 进行过滤。(这个需要按照对方内容里面具体含有什么代码来具体操作 ) 一般的只有链接,使用二中的代码进行过滤就可以了,但是实际上一 般的网站现在都在内容里面加有广告等,所以采取下面的过滤正则就可 以完成过滤: {dede:trim}]*)>([^<]*){/dede:trim} {dede:trim}]*)>([^>]*){/dede:trim} {dede:trim}]*)>([^>]*){/dede:trim} {dede:trim}]*)>([^>]*){/dede:trim} 织梦 模板 过滤div可以用 {dede:trim}]*)>{/dede:trim} {dede:trim} {/dede:trim} 过滤js用下面这个 {dede:trim}]*)>([^<]*){/dede:trim} 过滤未知变量字符 固定(.*)固定 上面几种应用基本上涵盖了采集的各种应用,掌握了这个,过滤基本上 就不用求人了~下面来说一个更简单的方法,把下面的过滤规则复制到 你那里去,几乎就可以处理所有的问题了,当然也可以自己分析一下。 {dede:trim}{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}
{/dede:trim} {dede:trim}
  • {/dede:trim} {dede:trim}
  • {/dede:trim} {dede:trim}
      {/dede:trim} {dede:trim}
    {/dede:trim} {dede:trim}{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}{/dede:trim} {dede:trim}{/dede:trim} 上面这一段万能采集过滤代码,不能用来采集带有视频的页面,因为已 经过滤了视频,最后的四行是过滤掉视频的。如果你确认要采集视频, 那就去掉最后四行。这就是织梦cms万能采集过滤代码~
    本文档为【[考试]织梦常用采集规则】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
    该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
    [版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
    本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
    网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
    下载需要: 免费 已有0 人下载

    你可能还喜欢

    最新资料
    资料动态
    专题动态
    is_954223
    暂无简介~
    格式:doc
    大小:21KB
    软件:Word
    页数:5
    分类:企业经营
    上传时间:2017-09-30
    浏览量:33