日期:2014-05-20  浏览次数:20603 次

通过url获取网页标题
通过网页的url获取网页的标题,如果网页没有指定标题,则获取到"未命名"

------解决方案--------------------
使用htmlParser.jar

Java code

String line;
URL myUrl=new URL("http://www.google.cn#myinfo");
StringBuffer sb = new StringBuffer();
DataInputStream dis=new DataInputStream(myUrl.openStream());
while((line=dis.readLine())!=null)
     sb.append(line);

Parser = Parser.createParser(sb.toString(), "GBK"); 
HtmlPage htmlvisitor = new HtmlPage(myParser); 
String title = htmlvisitor.getTitle();

------解决方案--------------------
首先我不知道htmlParser.jar的效率如何,但是我想如果想获得Title,而title肯定是在<title></title>标签之内,如果是个符合语法的HTML,那么就没有什么问题,用正则表达式也可以处理,或者就用String的subString这样的方法来处理。