Discuz教程网

PHP 抓取新浪读书频道的小说并生成txt电子书的代码

[复制链接]
authicon dly 发表于 2011-9-1 11:21:10 | 显示全部楼层 |阅读模式
代码如下:

  1. /* Author: Yang Yu <yangyu@sina.cn> */
  2. //想看什么电子书,先去新浪读书搜索,然后填入对应的参数即可
  3. //http://vip.book.sina.com.cn/
  4. //电子书参数
  5. $array_book[0] = 38884; //小说id
  6. $array_book[1] = 22172; //章节起始id
  7. $array_book[2] = 32533; //章节结束id
  8. $array_book[3] = '中国特种部队生存实录:狼牙'; //小说名字

  9. //匹配参数
  10. $title_pre = "/<h1>(.*?)<\/h1>/"; //标题部分
  11. $contents_pre = "/<div id="contTxt" class="contTxt1">(.*?)<\/div>/"; //内容部分

  12. //生成电子书
  13. for( $i = $array_book[1]; $i <= $array_book[2]; $i++){
  14. $url = "http://vip.book.sina.com.cn/book/chapter_{$array_book[0]}_{$i}.html";
  15. $html = file_get_contents($url);
  16. preg_match_all($title_pre,$html,$title);
  17. preg_match_all($contents_pre,$html,$contents);
  18. $fh = fopen($array_book[3].'.txt','a+');
  19. $write_contents = $title[1][0]."\r\n".str_replace('</p>',"\r\n",str_replace('<p>',' ',$contents[1][0]))."\r\n";
  20. if( fwrite($fh,$write_contents) ){
  21. echo '第'.$i.'节抓取完毕< /br>';
  22. }
  23. fclose($fh);
  24. }
复制代码








上一篇:PHP 手机归属地查询 api
下一篇:一个比较简单的PHP 分页分组类
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

1314学习网 ( 浙ICP备10214163号 )

GMT+8, 2025-5-2 06:07

Powered by Discuz! X3.4

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表