用户登录  |  用户注册
首 页商业源码原创产品编程论坛
当前位置:PB创新网文章中心Java

通过java.net.Socket 类抓取网页内容

减小字体 增大字体 作者:佚名  来源:本站整理  发布时间:2009-03-16 18:53:01
/**
文件名 : FirstSocket.java
描述 :通过 java.net.Socket 类访问一个Web页面,并且返回结果
作者: 慈勤强 cqq1978@yeah.net
参考:http://java.sun.com
**/

import java.io.*;
import java.net.*;

public class FirstSocket
{
public static void main(String args[])
{

//判断参数是否为两个,正确的用法为 FirstSocket 网站 页面
if(args.length!=2)
{
System.out.println("Usage : FirstSocket host page\r\nExample:FirstSocket www.google.com /");
System.exit(0);
}
String strServer=args[0]; //取得第一个参数
String strPage = args[1]; //取得第二个参数

try
{
String hostname = strServer;
int port = 80;
InetAddress addr = InetAddress.getByName(hostname);
Socket socket = new Socket(addr, port); //建立一个Socket

//发送命令
BufferedWriter wr = new BufferedWriter(new OutputStreamWriter(socket.getOutputStream(), "UTF8"));
wr.write("GET " + strPage + " HTTP/1.0\r\n");
wr.write("HOST:" + strServer + "\r\n");
wr.write("\r\n");
wr.flush();

//接收返回的结果
BufferedReader rd = new BufferedReader(new InputStreamReader(socket.getInputStream()));
String line;
while ((line = rd.readLine()) != null) {
System.out.println(line);
}
wr.close();
rd.close();
}
catch (Exception e)
{
System.out.println(e.toString());
}
}
}


Tags:

作者:佚名

文章评论评论内容只代表网友观点,与本站立场无关!

   评论摘要(共 0 条,得分 0 分,平均 0 分) 查看完整评论
PB创新网ourmis.com】Copyright © 2000-2009 . All Rights Reserved .
页面执行时间:20,046.88000 毫秒
Email:ourmis@126.com QQ:2322888 蜀ICP备05006790号