400-800-9385
网站建设资讯详细

怎么抓取网站中的图片

发表日期:2023-06-21 09:42:00   作者来源:刘红旺   浏览:1848   标签:抓取网站图片    
我们以深圳方维网络的官网为例子:

方维网络

 
1.首先读取整个网页的内容

读取网页内容

获取到了整个页面的代码

网页HTML代码

2.通过正则匹配到所有的img 标签里面的图片url地址
  正则表达式:/<img.*?src="(.*?)"/

正则表达式

$matches[1] 存放的就是页面中所有img 标签的图片
 

uRL地址

如果图片地址不是绝对路径的图片 可以通过查找路径中是否有http或者https
如果没有就加上网站的域名就可以打开图片:

正则

所有图片都变成了绝对路径地址

地址路径

 
3.然后将图片下载到本地:

  1.通过file_put_contents

获取文件名

 2.第二种通过curl

curl

3.方法fopen读取二进制图片信息
 
        $imgFile =
        $imgName = trim(strrchr($imgFile,'/'),'/');
        //读取远程图片资源
        $source = fopen($imgFile,'rb');
        // 创建本地文件资源句柄,用于保存图片信息$down= fopen($imgName,'wb');
        while ($chunk = fread($source,1924))fwrite($down, $chunk, 1024);
        fclose($source);
fclose($down);
 
获取图片资源
如没特殊注明,文章均为方维网络原创,转载请注明来自https://www.szfangwei.cn/news/6808.html