日期:2014-05-17  浏览次数:20442 次

java正则表达式取得html标签内的内容
HTML code

        <div id="text-chinese" style="display:none;">
            
            <p>
                
                <span id="chinese-1">对不起!</span>
                
            </p>
            
            <p>
                
                <span id="chinese-2">什么事?</span>
                
            </p>
            
            <p>
                
                <span id="chinese-3">这是您的手提包吗?</span>
                
            </p>
            
            <p>
                
                <span id="chinese-4">对不起,请再说一遍。</span>
                
            </p>
            
            <p>
                
                <span id="chinese-5">这是您的手提包吗?</span>
                
            </p>
            
            <p>
                
                <span id="chinese-6">是的,它是。</span>
                
            </p>
            
            <p>
                
                <span id="chinese-7">非常感谢你。</span>
                
            </p>
            
        </div>


从从其中标签中取得中文,正则表达式该怎么写呢?

------解决方案--------------------
新建一个1.txt
HTML code

 <div id="text-chinese" style="display:none;">
            
            <p>
                
                <span id="chinese-1">对不起!</span>
                
            </p>
            
            <p>
                
                <span id="chinese-2">什么事?</span>
                
            </p>
            
            <p>
                
                <span id="chinese-3">这是您的手提包吗?</span>
                
            </p>
            
            <p>
                
                <span id="chinese-4">对不起,请再说一遍。</span>
                
            </p>
            
            <p>
                
                <span id="chinese-5">这是您的手提包吗?</span>
                
            </p>
            
            <p>
                
                <span id="chinese-6">是的,它是。</span>
                
            </p>
            
            <p>
                
                <span id="chinese-7">非常感谢你。</span>
                
            </p>
            
        </div>

------解决方案--------------------
探讨

新建一个1.txt
HTML code

<div id="text-chinese" style="display:none;">

<p>

<span id="chinese-1">对不起!</span>

</p>
……

------解决方案--------------------
Java code

(?<=<span\b[^>]*?>)[^<>]+(?=</span>)