Skip to content

Next-One/spider

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

spider

com.cwj.spider.Crawler 是一个爬虫对象
最少需要2个参数,一个是需要爬取的站点域名,和另一个是图片下载的存放目录。
在实例化Crawler对象后,可以调用start方法开始爬取图片。
start可以定义图片的过滤形式,有对图片链接的过滤,也有对图片本身尺寸,大小的过滤。以及图片下载的数量设置

About

Picture crawler using java

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages