ASP信息采集程序图解教程[图文]
来源:
互联网
日期:2006-12-11
程序名称:ASP神偷 马上使用 英文名称:AspStealer 版本:Beta1.0 发布日期:2006.10.01 官方网址:http://www.fz10000.com/stealer/index.asp 运行环境:B/S,Win9X/Win2000/WinXP/Win2003,浏览器
【界面截图】
【软件简介】
ASP神偷(AspStealer)可以把远程网站上的数据(如新闻、博客文章、客户资料等)一次性、无限制记录数、全自动保存到自己网站的数据库的程序。
与其他的ASP小偷程序相比,ASP神偷(AspStealer)具有如下优点:
1.ASP小偷来自其他网站,它随着该网站的更新而更新,如果目标网站无法访问、数据有误或者改变页面结构,您的网站也无法读取到相关数据,有时还需要修改ASP小偷相应的程序;ASP神偷是采用一次性、无限制记录数、全自动保存到自己网站数据库的方式采集数据的,不会受到目标网站的任何影响。
2.ASP小偷属于远程调用,访问远程速度较慢;ASP神偷属于同一网站数据库调用,您的网站有多快,访问速度就有多快。
【采集范例】
ASP神偷 Beta1.0 支持采集如 http://www.fz10000.com/view.asp?ClassID=177 类型(文件名.asp?ClassID=数值)的网址。
以采集www.fz10000.com(私房博客)的文章为例,步骤如下:
1.打开文章列表页,http://www.fz10000.com/blog.asp
2.发现文章链接页网址的规律性,如 view.asp?ClassID=数值 ,正常这些数值都是三位数或四位数的;也有网站是采用多位随机数做为ID,如view.asp?ClassID=2006092955641(ClassID=年月日+五位随机数),或2006092955641.htm(年月日+五位随机数.htm),ASP神偷 Beta1.0 暂不支持后两种类型的网址;
3.使用ASP神偷 Beta1.0 的默认设置,直接点击『预览』,即可采集从ClassID=177开始至ClassID=187的十篇文章的标题;
4.此例从ClassID=177开始至ClassID=187,采集十篇文章的内容;
5.在ASP神偷 Beta1.0 的 『网址』填入 『http://www.fz10000.com/view.asp?ClassID=』,『从』填入『177』,『到』填入『187』;
6.用浏览器打开 http://www.fz10000.com/view.asp?ClassID=177 页面,点击『菜单栏』->『查看』->『源文件』,记事本将打开该页面的html源文件;
7.找出在页面html源文件内正文内容前的一段标识符,该标识符最好是唯一的整句代码,可用Ctrl+F在记事本内查询您找到的这段标识符,验证该标识符的唯一性,以保证采集数据的有效性(如下图);
8.将唯一前标识符拷入ASP神偷 Beta1.0 的『前标识』 栏目,『右移』填入『0』;
9.用同样的方法,找出正文内容后的那段标识符,拷入的『后标识』 栏目,『左移』填入『0』;
10.注意:前标识符和后标识符必须是每篇文章共同拥有的,不能含有某篇或某几篇文章独有的html代码,否则采集的信息可能会出错,最终的采集设置(如下图);
11.点击『预览』,即可采集到您要的内容了。
备注:ASP神偷 Beta1.0 目前限制预览前20条记录,且暂不开通『导入数据库』功能;使用者勿将该程序用于非法用途,否则后果自负!使用过程中遇到任何的难题、意见、建议或者找不出前后标识符的用户,欢迎在http://www.fz10000.com/view.asp?ClassId=437 『发表评论』,我们将会在第一时间为您提供帮助!
更多的ASP信息采集程序图解教程[图文]请到论坛查看: http://BBS.TC711.COM
【 双击滚屏 】 【 评论 】 【 收藏 】 【 打印 】 【 关闭 】
来源:
互联网
日期:2006-12-11
|
|
|