加入收藏 | 设为首页 | 会员中心 | 我要投稿 汽车网 (https://www.0577qiche.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长学院 > PHP教程 > 正文

php file_get_contents 设置代理拿取页面示例

发布时间:2023-06-14 13:59:12 所属栏目:PHP教程 来源:
导读:ile_get_contents函数在php中可以直接打开本地文件也可以直接抓取远程服务器文件,如果简单的采集我们可以使用file_get_contents直接来操作,如果有防采集我们可能需要代理来操作,下面我来介绍file_get_contents抓取页
ile_get_contents函数在php中可以直接打开本地文件也可以直接抓取远程服务器文件,如果简单的采集我们可以使用file_get_contents直接来操作,如果有防采集我们可能需要代理来操作,下面我来介绍file_get_contents抓取页面示例.

例1,普通页面获取

例如,访问54master论坛,想抓取首页里 所有h3标记内的元素,代码如下:

$url=http://www.Cuoxin.com; 
$contents=@file_get_contents($url); 
//preg_match_all("/<p class="right forumcount">(.*?)</p>/is",$contents,$content); 
preg_match_all("/<h3>(.*?)</h3>/is",$contents,$content); 
print_r($content[0]); 
例2,设置代码IP去采集数据

使用file_get_contents 和 stream_context_create 即可,代码如下:

$aContext = array(  
    'http' => array(  
        'proxy' => 'tcp://192.168.0.2:3128',  //这里设置你要使用的代理ip及端口号  
        'request_fulluri' => true,  
    ),  
);  
$cxContext = stream_context_create($aContext);  
$sFile = file_get_contents("http://www.Cuoxin.com", False, $cxContext);  
echo $sFile; 
以上代码适用于正常情况,但是如果目标页面需要登录或需要认证信息才能访问的话,可以加多一句代码,代码如下:

$auth = base64_encode('LOGIN:PASSWORD');//LOGIN:PASSWORD 这里是你的账户名及密码  
$aContext = array(  
    'http' => array(  
        'proxy' => 'tcp://192.168.0.2:3128',//这里设置你要使用的代理ip及端口号  
        'request_fulluri' => true,  
        'header' => "Proxy-Authorization: Basic $auth",  
    ),  
);  
$cxContext = stream_context_create($aContext);  
$sFile = file_get_contents(http://www.Cuoxin.com, False, $cxContext);  
echo $sFile; 
这样就可以使用代理来抓取页面或文件了.
 

(编辑:汽车网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章