日期:2014-05-20  浏览次数:20710 次

htmlparser问题
请问htmlparser的一个node是代表什么
HTML code

<html>
  <head>
    <title>DOM Tutorial</title> 
  </head> 
  <body> 
    <h1>DOM Lesson one</h1> 
    <p>Hello world!</p> 
  </body> 
</html>


为什么我打印节点text(node.getText())只打印出"html",难道<head>等不是节点吗?
Java code
String jlu= "http://127.0.0.1:8080/node.html";
        try{
            Parser parser = new Parser(jlu);
            for(NodeIterator it = parser.elements(); it.hasMoreNodes();){
                Node node = it.nextNode();
                System.out.println(node.getText());
            }
        }catch(Exception e){
            System.out.println(e.getMessage());
        }





------解决方案--------------------
呵呵,这个东西很冷门啊,不过以前刚好用过,应该是一个dom元素,还有那个getText是只能给打印文本节点的文本出来,而你的Head不是一个文本节点,因此是不会出来的
------解决方案--------------------
node就是一个节点。
XML可以看成一个树,那个每个体标签就是一个节点。
------解决方案--------------------
我没有调试,但应该是这样的
html是顶级,head,body是html的子节点,title是head的子节点