Asp自己做采集程序
发布时间:2023-06-01 13:58:13 所属栏目:Asp教程 来源:
导读:现在网上的采集程序很多,但是有时候你发现一个好的网站,想自己做个采集工具采集一些信息,就需要自己去写程序了,其实这样的采集程序并不难写,主要是去分析源网站的网页结构。
首先去下载个XMLHTTP的类文件:
<
首先去下载个XMLHTTP的类文件:
<
现在网上的采集程序很多,但是有时候你发现一个好的网站,想自己做个采集工具采集一些信息,就需要自己去写程序了,其实这样的采集程序并不难写,主要是去分析源网站的网页结构。 首先去下载个XMLHTTP的类文件: <% Class xhttp private cset,sUrl,sError Private Sub Class_Initialize() 'cset="UTF-8" cset="GB2312" sError="" end sub Private Sub Class_Terminate() End Sub Public Property LET URL(theurl) sUrl=theurl end property public property GET BasePath() BasePath=mid(sUrl,1,InStrRev(sUrl,"/")-1) end property public property GET FileName() FileName=mid(sUrl,InStrRev(sUrl,"/")+1) end property public property GET Html() Html=BytesToBstr(getBody(sUrl)) end property public property GET xhttpError() xhttpError=sError end property private Function BytesToBstr(body) on error resume next 'Cset:GB2312 UTF-8 dim objstream set objstream = Server.CreateObject("adodb.stream") with objstream .Type = 1 ' .Mode = 3 ' .Open .Write body ' .Position = 0 ' .Type = 2 ' .Charset = Cset ' BytesToBstr = .ReadText ' .Close end with set objstream = nothing End Function private function getBody(surl) on error resume next dim xmlHttp 'Set xmlHttp=server.createobject("Msxml2.XMLHTTP.4.0") 'set xmlHttp=server.createobject("Microsoft.XMLHTTP") set xmlHttp=server.createobject("MSXML2.ServerXMLHTTP") xmlHttp.setTimeouts 10000,10000,10000,30000 xmlHttp.open "GET",surl,false xmlHttp.send if xmlHttp.readystate=4 then 'if xmlHttp.status=200 then getBody=xmlhttp.responsebody 'end if else getBody="" end if if Err.Number<>0 then sError=Err.Number Err.clear else sError="" end if set xmlHttp=nothing end function Public function saveimage(tofile,isoverwrite) on error resume next dim objStream,objFSO,imgs if Not isoverwrite Then Set objFSO = Server.CreateObject("Scripting.FileSystemObject") If objFSO.FileExists(Server.MapPath(tofile)) Then Exit Function End If Set objFSO = Nothing End IF imgs=getBody(sUrl) Set objStream = Server.CreateObject("ADODB.Stream") with objStream .Type =1 .Open .write imgs .SaveToFile server.mappath(tofile),2 .Close() end with set objstream=nothing end function end class %> 用了这个类文件,做起事情来就方便多了。 然后就可以分析采集网站的网页结构,写采集程序了。 下面给个例子: <!--#include file="conn.asp"--> <!--#include file="inc/xhttp_class.asp"--> <!--#include file="inc/function.asp"--> <% server.ScriptTimeout = 1000 %> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=gb2312" /> <title>BT采集器</title> (编辑:汽车网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
推荐文章
站长推荐