一言爬虫php实例

最近闲来无聊,玩上了一言。写了个php版的一言爬虫,爬的接口你们可以自己改,测试用的是一言网的api,用定时任务半个小时爬一次。不然容易被屏蔽!!将代码保存为get.php,调用方法:get.php?t=1(直接输出) get.php?t=2保存为名为text的文档。这个爬出来的建议配合强哥博客的一言api源码使用。他的代码我就不发了自行到qiangwl.com查找。下面是代码:


<?php
if($_GET{'t'}==1){
while($t<=100){
    echo file_get_contents('http://api.hitokoto.cn/?c=f&encode=text');
    echo '|';
    $t++ ;}
    exit();}
if($_get['t']==2){
  while($t<=200){
    $textx=file_get_contents('hhttp://api.hitokoto.cn/?c=f&encode=text');
    $text=$textx.'|';
$myfile = fopen("text.txt", "a+") or die("Unable to open file!");
fwrite($myfile, $text);
fclose($myfile);
    $t++ ;}exit();}
?>

更换curl效率更高(用法不变):

<?php
function httpGet($url) {
	$curl = curl_init();
	$httpheader[] = "Accept:*/*";
	$httpheader[] = "Accept-Language:zh-CN,zh;q=0.8";
	$httpheader[] = "Connection:close";
    curl_setopt($curl, CURLOPT_USERAGENT, "Mozilla/5.0 (Windows; U; Windows NT 5.1; rv:1.7.3) Gecko/20041001 Firefox/0.10.1" );
	curl_setopt($curl, CURLOPT_HTTPHEADER, $httpheader);
	curl_setopt($curl, CURLOPT_RETURNTRANSFER, true);
	curl_setopt($curl, CURLOPT_TIMEOUT, 3);
	curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, false);
	curl_setopt($curl, CURLOPT_SSL_VERIFYHOST, false);
	curl_setopt($curl, CURLOPT_URL, $url);
	$res = curl_exec($curl);
	curl_close($curl);
	return $res;
}
if($_GET{'t'}==1){
while($t<=100){
    echo httpGet('http://api.hitokoto.cn/?c=f&encode=text');
    echo '|';
    $t++ ;}
    exit();}else{
  while($t<=200){
    $textx=httpGet('https://api.lwl12.com/hitokoto/main/get');
    $text=$textx.'|';
$myfile = fopen("text.txt", "a+") or die("Unable to open file!");
fwrite($myfile, $text);
fclose($myfile);
    $t++ ;}exit();}
?>

本博客所有文章如无特别注明均为原创。作者:创始人大大复制或转载请以超链接形式注明转自 阳光博客
原文地址《一言爬虫php实例
分享到:更多

相关推荐

发表评论

路人甲 表情
看不清楚?点图切换 Ctrl+Enter快速提交

网友评论(2)

来学习一番
瓶盖灭烟头 北京市 联通 10个月前 (2017-12-26) 回复
个人感觉超赞
阳光 广东省佛山市禅城区 华英学校(湖景路39号) 10个月前 (2017-12-18) 回复