将网页文章内容存放到txt文本里,目的是节省数据库-php(1)

之前www.dxszw.com这个网站的程序是自己写的,可是呢,生成的文章内容是放到数据库里的,结果让数据库比较庞大。其实也不大吧,5000篇文章数据库有20M。主要是我的万网空间,有限制,最大20M……为了省钱,那就改改吧。 1,生成txt目录构架归划。如果把所有文章都放到一个文件夹里的话,显然不好,为什么不好?我是担心会影响请求txt文件速度,不过这个我没有验证过。还是按月存放吧。 下边是dir_check.php 全部程序: $dir_upload=’uploads/’.date(“Y”).date(“m”);#获得

Read more

批量下载文件的程序构思-类似于搜索引擎蜘蛛

正则表达式是一个很重要的东西,他被应用到字符串的解析,提取,替换等各个方面。 今天又一次学习php正则表达式,借此机会,来做一个批量下载jpg的脚本工具(实际上就是一个函数)。 先介绍一下写出的函数,小诱惑一下: 函数有一个参数就是某个url的网址,然后函数的功能是从该url的html中匹配出jpg链接,然后下载到本地的pics文件夹,同时遍历html中的a标记,以此解析出相应的href,再进行上次操作,这样一个jpg爬虫(姑且这么叫吧)爬行的第一步就做好了。我们要实现的就是这一步。如果你选择的url链接较多或者图片较多,估计会运行很长时间。看过社交网络的人应该都知道,facebook刚开始起

Read more