解决Teleport Pro软件抓取后遗留标签tppabs的问题

今天试了一下Teleport Pro软件,效果杠杠的,不过使用该软件抓取后的HTML文件,存在大量的tppabs标签,几乎每一个链接都会在后面留下tppabs标签,影响代码的阅读,百度并稍微修改一下,可以使用以下的方法将这些标签替换掉。

本人使用DreamWeaver中的正则表达式批量清除这些代码:

步骤一:匹配href代码:

查找

tppabs="h[^"]*"

并替换成

(空)

 

步骤二:匹配javascript代码:

查找

href="javascript:if\(confirm\(%27htt[^"]*"

并替换成

href="#"

 

步骤三:替换CSS中的图标链接:

示例代码:background: url(sky.jpg)/*tpa=http://xxx.com/images/sky.jpg*/

查找

\/\*tpa[^\*]*\*/

并替换成

(空)

 

本文固定链接: http://gevin.me/770.html | Gevin's Blog

该日志由 admin 于2014年08月30日发表在 IT 分类下, 通告目前不可用,你可以至底部留下评论。
原创文章转载请注明: 解决Teleport Pro软件抓取后遗留标签tppabs的问题 | Gevin's Blog
关键字: , ,

解决Teleport Pro软件抓取后遗留标签tppabs的问题:等您坐沙发呢!

发表评论

快捷键:Ctrl+Enter