Spider

Simple Web crawler written in Java.

Building

ant

Running

java -cp spider.jar org.spektom.spider.SpiderTool

Usage

java Spider [options] URL

Where options are:

-r <true|false>  Follow robots.txt and META robot tag rules (default: true) 
-t <number>      Number of concurrent downloads (default: 5)
-f <true|false>  Follow other domains (default: false)
-c <timeout>     Connect/read timeout in milliseconds (default: 5000)
-u <string>      String that will be sent in User-Agent header (default: none)
-p <pattern>     Follow only URLs that match pattern
-v <true|false>  Verbose output (default: false)

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
src/org/spektom/spider		src/org/spektom/spider
.classpath		.classpath
.project		.project
README.md		README.md
build.xml		build.xml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Spider

Building

Running

Usage

About

Releases

Packages

Languages

spektom/spider

Folders and files

Latest commit

History

Repository files navigation

Spider

Building

Running

Usage

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages