欢迎来到王星个人博客!seo教程,DEDECMS织梦免费模板

王星个人博客

DedeCMS

当前位置:主页 > CMS教程 > DedeCMS >

dedecms采集过滤常用代码集合

时间:2019-03-28|栏目:DedeCMS|点击:

文章摘要:下面是在综合正则的一个全集: {dede:trim} {/dede:trim} {dede:trim} ]*){/dede:trim} {dede:trim}]*)([^]*){/dede:trim} {dede:trim}]*){/dede:trim} {dede:trim}{/dede:trim} {dede:trim}]*)([^]*){/dede:trim} {dede:trim}]*){/dede:trim} {dede:trim}{/dede:trim} {dede:trim}]*)([^]*

下面是在综合正则的一个全集: 
 
{dede:trim} 
{/dede:trim} 
{dede:trim} ]*)>{/dede:trim} 
{dede:trim}]*)>([^>]*){/dede:trim} 
{dede:trim}]*)>{/dede:trim} 
{dede:trim}{/dede:trim} 
{dede:trim}]*)>([^>]*){/dede:trim} 
{dede:trim}]*)>{/dede:trim} 
{dede:trim}{/dede:trim} 
{dede:trim}]*)>([^>]*){/dede:trim} 
{dede:trim}]*)>{/dede:trim} 
{dede:trim}{/dede:trim} 
{dede:trim}]*)>([^>]*){/dede:trim} 
{dede:trim}]*)>{/dede:trim} 
{dede:trim}{/dede:trim} 
{dede:trim}]*)>([^>]*){/dede:trim} 
{dede:trim}]*)>{/dede:trim} 
{dede:trim}{/dede:trim} 
{dede:trim}]*)>([^<]*){/dede:trim} 
{dede:trim}]*)>{/dede:trim} 
{dede:trim}{/dede:trim} 
{dede:trim}]*)>([^<]*){/dede:trim} 
{dede:trim}]*)>{/dede:trim} 
{dede:trim}{/dede:trim} 
{dede:trim} ]*)>([^>]*) 
 
{/dede:trim} 
{dede:trim} ]*)>{/dede:trim} 
{dede:trim} 
 
{/dede:trim} 
{dede:trim} 
]*)>([^>]*) 
 
{/dede:trim} 
{dede:trim} 
]*)>{/dede:trim} 
{dede:trim} 
 
{/dede:trim} 
{dede:trim} 
]*)>([^>]*) 
 
{/dede:trim} 
{dede:trim} 
{/dede:trim} 
{dede:trim} 
 
{/dede:trim} 
{dede:trim} 
]*)>([^>]*) 
 
{/dede:trim} 
{dede:trim} 
]*)>{/dede:trim} 
{dede:trim} 
 
{/dede:trim} 
{dede:trim}]*)>{/dede:trim} 
{dede:trim}]*)>{/dede:trim} 
{dede:trim}{/dede:trim} 
{dede:trim} {/dede:trim} 
{dede:trim}{/dede:trim} 
{dede:trim}{/dede:trim} 
 
应用示例一:标题中空格的过滤 
经常在采集文章的时候,标题文字里面有空格,采回来后应用很是麻烦,所以需要在过滤处添加下面正则过滤 
 
{dede:trim} {/dede:trim} 
 
应用示例二:来源作者中连接的过滤 
在采集文章的时候,有的系统里面作者或者来源处都有连接,直接采集的话将连接采集回来了,然后由于这两个字段有限制,通常会造成需要采集的内容没有采集回来,所以需要在过滤处添加下面正则过滤 
 
{dede:trim}]*)>([^<]*){/dede:trim} 
 
应用示例三:文章内容中连接以及其他广告代码的过滤 
这个就不用说了,当需要对所有东西过滤的时候,直接用上面所有的代码过滤就可以,但是实际应用中,我们只需要对连接、动画、调用等进行过滤。(这个需要按照对方内容里面具体含有什么代码来具体操作) 
一般的只有链接,使用二中的代码进行过滤就可以了,但是实际上一般的网站现在都在内容里面加有广告等,所以采取下面的过滤正则就可以完成过滤: 
 
{dede:trim}]*)>([^<]*){/dede:trim} 
{dede:trim}]*)>([^>]*){/dede:trim} 
{dede:trim}]*)>([^>]*){/dede:trim} 
{dede:trim}]*)>([^>]*){/dede:trim} 
 
应用示例四:过滤GG广告代码 
其实这个就是在上面的内容过滤,但是很多论坛里的网友经常问这个,所以单独作为一个应用列出来: 
 
{dede:trim}]*)>([^>]*){/dede:trim} 

上一篇:dedecms中如何在栏目列表和文章页面中获得当前栏目标题

栏    目:DedeCMS

下一篇:织梦后台dedecms精简和安全需要删除的文件

本文标题:dedecms采集过滤常用代码集合

本文地址:http://www.aiquhu.com/CMSjiaocheng/DedeCMS/405.html

广告投放 | 联系我们 | 版权申明 | 网站地图(html) | 网站地图(xml)

重要申明:本站所有的文章、图片、评论等,均由网友发表或上传并维护或收集自网络,属个人行为,与本站立场无关。

如果侵犯了您的权利,请与我们联系,我们将在24小时内进行处理、任何非本站因素导致的法律后果,本站均不负任何责任。

联系QQ:520031800 | 邮箱:520031800@qq.com

Copyright ©2019-2020 王星个人博客 版权所有 苏ICP备18070909号