在此示例中, 我们将打印URL的全部链接。为此, 我们将调用Document类的select()方法, 该方法返回Elements的引用。 Elements类具有可以通过for-each循环遍历的元素。 Element类提供attr()和text()方法来返回链接和链接的文本。
import java.io.IOException;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class JsoupPrintLinks {
public static void main( String[] args ) throws IOException{
Document doc = Jsoup.connect("http://www.srcmini02.com").get();
Elements links = doc.select("a[href]");
for (Element link : links) {
System.out.println("\nlink : " + link.attr("href"));
System.out.println("text : " + link.text());
}
}
}
输出:
link : http://www.srcmini02.com/contribute-us
text : Contribute Us
link : http://www.srcmini02.com/asknewquestion.jsp
text : Ask Question
link : http://www.srcmini02.com/login.jsp
text : login
.....
评论前必须登录!
注册