","//") & "/"
findurlhost = left(findurlhost,len(findurlhost)-1)
end function
先选中一个你想 “偷” 的网页程序。。。
我这里看中了它。。呵呵 。。。很多妹妹图片。。。口水中。。
http://www.linkmm.com/photo/ads2.html
然后建立个ASP网页,先把以下代码复制进去
<%Function bytes2BSTR(vIn)
strReturn = ""
For i = 1 To LenB(vIn)
ThisCharCode = AscB(MidB(vIn,i,1))
If ThisCharCode < &H80 Then
strReturn = strReturn & Chr(ThisCharCode)
Else
NextCharCode = AscB(MidB(vIn,i+1,1))
strReturn = strReturn & Chr (CLng(ThisCharCode) * &H100 + CInt(NextCharCode))
i = i + 1
End If
Next
bytes2BSTR = strReturn
End Function
Url = "http://www.linkmm.com/photo/ads2.html";;;
set oSend=createobject("Microsoft.XMLHTTP")
SourceCode = oSend.open ("GET",url,false)
oSend.send()
if err.number<>0 then
Response.write err.description
Response.End()
end if
SourceCode = bytes2BSTR(oSend.responseBody)%>
其中Url = "http://www.linkmm.com/photo/ads2.html";;;就是你想要 偷 的网页,换成你需要的就可以了。。
这个时候response.write 一下。。是不是很多图片看不见啊。。不急,我们有replace呢。。把你现在的网页查看下原文件
把原来的网页查看下愿文件对比下就知道怎么让这些无法显示的显示出来。。。比起那些一个个replace替换图片的方法
用这个方法好多了就是在有src的地方在他前面直接替换网址多方便呵呵。。
在写这段代码。。程序就完了呵呵
<%baseurl1="http://www.linkmm.com/photo";;;
SourceCode =replace(sourcecode,"src=""img/","src=""http://www.linkmm.com/photo/img/";;;)
SourceCode =replace(sourcecode,"new.gif",baseurl1&"/new.gif")
SourceCode =replace(sourcecode,"href=""photo888","href=""http://www.linkmm.com/photo/photo888";;;)
SourceCode =replace(sourcecode,"site.css","http://www.linkmm.com/photo/site.css";;;)
response.write SourceCode%>
是不是很简单啊。不懂的联系我52596464
完整代码如下:
<html>
<head>
<meta name="GENERATOR" content="Microsoft FrontPage 5.0">
<meta name="ProgId" content="FrontPage.Editor.Document">
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
<meta http-equiv="refresh" content="3600">
<title></title>
</head>
<body>
<%
Function bytes2BSTR(vIn)
strReturn = ""
For i = 1 To LenB(vIn)
ThisCharCode = AscB(MidB(vIn,i,1))
If ThisCharCode < &H80 Then
strReturn = strReturn & Chr(ThisCharCode)
Else
NextCharCode = AscB(MidB(vIn,i+1,1))
strReturn = strReturn & Chr (CLng(ThisCharCode) * &H100 + CInt(NextCharCode))
i = i + 1
End If
Next
bytes2BSTR = strReturn
End Function
Url = "http://www.linkmm.com/photo/ads2.html";;;
set oSend=createobject("Microsoft.XMLHTTP")
SourceCode = oSend.open ("GET",url,false)
oSend.send()
if err.number<>0 then
Response.write err.description
Response.End()
end if
SourceCode = bytes2BSTR(oSend.responseBody)
baseurl1="http://www.linkmm.com/photo";;;
SourceCode =replace(sourcecode,"src=""img/","src=""http://www.linkmm.com/photo/img/";;;)
SourceCode =replace(sourcecode,"new.gif",baseurl1&"/new.gif")
SourceCode =replace(sourcecode,"href=""photo888","href=""http://www.linkmm.com/photo/photo888";;;)
SourceCode =replace(sourcecode,"site.css","http://www.linkmm.com/photo/site.css";;;)
response.write SourceCode
%>
</body>
</html>
小偷程序原理和简单示例
现在网上流行的小偷程序比较多,有新闻类小偷,音乐小偷,下载小偷,那么它们是如何做的呢,
下面我来做个简单介绍,希望对各位站长有所帮助。
(一)原理
小偷程序实际上是通过了XML中的XMLHTTP组件调用其它网站上的网页。
比如新闻小偷程序,很多都是调用了sina的新闻网页,并且对其中的html进行了一些替换,
同时对广告也进行了过滤。用小偷程序的优点有:无须维护网站,因为小偷程序中的数据来自其他网站,它将随着该网站的更新而更新;可以节省服务器资源,一般小偷程序就几个文件,所有网页内容都是来自其他网站。
缺点有:不稳定,如果目标网站出错,程序也会出错,而且,如果目标网站进行升级维护,那么小偷程序也要进行相应修改;
速度,因为是远程调用,速度和在本地服务器上读取数据比起来,肯定要慢一些。
(二)事例
下面就XMLHTTP在ASP中的应用做个简单说明
<%
'常用函数
'1、输入url目标网页地址,返回值getHTTPPage是目标网页的html代码
function getHTTPPage(url)
dim Http
set Http=server.createobject("MSXML2.XMLHTTP")
Http.open "GET",url,false
Http.send()
if Http.readystate<>4 then
exit function
end if
getHTTPPage=bytesToBSTR(Http.responseBody,"GB2312")
set http=nothing
if err.number<>0 then err.Clear
end function
'2、转换乱玛,直接用xmlhttp调用有中文字符的网页得到的将是乱玛,可以通过adodb.stream组件进行转换
Function BytesToBstr(body,Cset)
dim objstream
set objstream = Server.CreateObject("adodb.stream")
objstream.Type = 1
objstream.Mode =3
objstream.Open
objstream.Write body
objstream.Position = 0
objstream.Type = 2
objstream.Charset = Cset
BytesToBstr = objstream.ReadText
objstream.Close
set objstream = nothing
End Function
'下面试着调用http://www.3doing.com/earticle/的html内容
Dim Url,Html
Url="http://www.3doing.com/earticle/";
Html = getHTTPPage(Url)
Response.write Html
%>
如何写ASP入库小偷程序
作者:allen
转载请注明出自玛雅论坛
最近大家都对小偷程序感兴趣,尤其是入库类的,在这里我简单的介绍一下。希望大家对这个能有所了解,如果您还不知道什么叫小偷,请参考我写的另外一片文章(小偷程序原理和简单示例
):http://www.cnmaya.org/viewthread.php?tid=68&fpage=1
个人认为小偷只是一个很通俗的说法,也给很多人带来了误解,认为小偷是什么不好的东西,
其实不然,用数据采集程序来形容应该更准确些。
这里是我昨天刚完成的新浪娱乐入库小偷程序::http://www.saynew.com/news/Class/popjb/popjb02.html
在这里我根据该程序的制作简单介绍一下:
入库小偷的原理也很简单:就是用XMLHTTP远程读取网页的内容,然后根据需要,对读到的内容进行加工(过滤,替换,分类),最后得到自己需要的数据,加入到数据库中。
首先:我们先用XMLHTTP读取远程网页(我的另一片文章中有介绍)。
其次:对内容进行过滤,这个是比较关键的步骤,比如说,我要从远程网页上提取出所有url连接,我应该怎么做呢?
‘这里用的是正则式
Set objRegExp = New Regexp '建立对象
objRegExp.IgnoreCase = True '大小写忽略
objRegExp.Global = True '全局为真
objRegExp.Pattern = "http://.+?"; '匹配字段
set mm=objRegExp.Execute(str) '执行查找,str为输入参数
For Each Match in mm '进入循环
Response.write(Match.Value) '输出url地址
next
然后,我们需要根据需要做一些替换功能,把不必要的数据替换掉,这个比较简单,用Replace函数即可。
最后,进行数据库操作,这个我想大家应该都会,就不做介绍了。
文章共5页: [
1] [
2] [
3] [
4] [
5]
更多的献给学习小偷程序的朋友请到论坛查看: http://BBS.TC711.COM
【 双击滚屏 】 【 评论 】 【 收藏 】 【 打印 】 【 关闭 】
来源:
互联网
日期:2006-12-2