PHP 模拟浏览器 CURL 采集阿里巴巴

星火燎原 · 发表于 2011-5-18 10:56:50

都说阿里巴巴有不能采集和防采集的神话，今天就用张老师讲的Curl采集写了一个模拟浏览器的代码。没有不可能只有不去做，哈哈

<?php
set_time_limit(0);
function _rand() {
$length=26;
$chars = "0123456789abcdefghijklmnopqrstuvwxyz";
$max = strlen($chars) - 1;
mt_srand((double)microtime() * 1000000);
$string = '';
for($i = 0; $i < $length; $i++) {
$string .= $chars[mt_rand(0, $max)];
}
return $string;
}
$HTTP_SESSION=_rand();
$HTTP_SESSION;
$HTTP_Server="search.china.alibaba.com";
$HTTP_URL="/company/k-%CB%AE%CB%AE%CB%AE_n-y.html";
$ch = curl_init();
curl_setopt ($ch,CURLOPT_URL,"http://".$HTTP_Server.$HTTP_URL);
curl_setopt($ch,CURLOPT_RETURNTRANSFER,true);
curl_setopt($ch,CURLOPT_USERAGENT,"Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322; .NET CLR 2.0.50727)");
$res = curl_exec($ch);
curl_close ($ch);
print_r($res);
?>

复制代码

卡卡猫 · 发表于 2011-5-18 19:29:49

哈哈收了你

kikiya11 · 发表于 2011-5-18 23:29:54

很好很强大。。谢谢分享

婷婷爱牛牛 · 发表于 2011-5-19 04:29:40

支持楼主，顶一下

YY大兔子 · 发表于 2011-5-19 05:29:53

继续来索要

ningbear · 发表于 2011-5-19 11:29:57

哈哈收了你

lightning123 · 发表于 2011-5-19 18:30:52

支持!好东西，拿走了！

TRACYFLYING · 发表于 2011-5-19 23:29:39

很好很强大。。谢谢分享

82xiaochong911 · 发表于 2011-5-20 00:29:52

我回不回呢考虑再三还是不回了吧 ^_^

卡卡猫 · 发表于 2011-5-20 01:29:38

很好很强大。。谢谢分享