用java下载网页

java

使用java下载指定URL的网页内容:

 

[java] view plain copy

 

  1. package com.learn.test;  
  2.   
  3. import java.io.BufferedReader;  
  4. import java.io.IOException;  
  5. import java.io.InputStreamReader;  
  6. import java.net.SocketTimeoutException;  
  7. import java.net.URL;  
  8. import java.net.URLConnection;  
  9.   
  10. public class TestDownload {  
  11.   
  12.     public static void main(String[] args) {  
  13.         TestDownload loader = new TestDownload();  
  14.         String page = loader.Download("http://top.baidu.com/detail/buzz?boardid=11");  
  15.         if (!page.isEmpty())  
  16.             System.out.println(page);  
  17.     }  
  18.   
  19.     public String Download(String strURL) {  
  20.         try {  
  21.             URL url = new URL(strURL);// 取得资源对象  
  22.             URLConnection uc = url.openConnection();// 生成连接对象  
  23.             uc.setRequestProperty("User-Agent", "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:38.0) Gecko/20100101 Firefox/38.0");  
  24.             uc.setRequestProperty("Accept","text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8");  
  25.             uc.setConnectTimeout(20);//设置超时时间  
  26.             uc.setDoOutput(true);  
  27.               
  28.             try{  
  29.                 uc.connect(); // 发出连接  
  30.             }catch(SocketTimeoutException e){  
  31.                 e.printStackTrace();  
  32.             }  
  33.   
  34.             final BufferedReader in = new BufferedReader(new InputStreamReader(  
  35.                     url.openStream(), "utf8"));  
  36.   
  37.             String temp;  
  38.             final StringBuffer sb = new StringBuffer();  
  39.             while ((temp = in.readLine()) != null) {  
  40.                 sb.append("\n");  
  41.                 sb.append(temp);  
  42.             }  
  43.   
  44.             in.close();  
  45.             return sb.toString();  
  46.         } catch (IOException e) {  
  47.             e.printStackTrace();  
  48.         }  
  49.   
  50.         return "";  
  51.     }  
  52. }  

以上是 用java下载网页 的全部内容, 来源链接: utcz.com/z/390639.html

回到顶部