日期:2014-05-17  浏览次数:20586 次

struts2项目中静态html在firefox下乱码的解决

struts2 项目,通常开发过程中,一些简单的表单文件或者静态描述页面,能不走action流程就可以用html来做,可以一定程度上减少 struts2 的流程开销,如果前端有apache的话,也可以进一步分摊业务服务器压力。按照这样的原则,一个系统做下来,难免有一些或者很多的静态html文件。?
?? 在我的一个工程里面,所有文件的编码格式均为 utf-8,包括这些静态 html 文件。 在 IE 下访问,页面显示完全没有问题。用 httplook 查看 http 头信息,也可以看到服务器回送的页面字符集编码为正常的 utf-8。 但是用 firefox 浏览的时候,所有的动态页面(*.do)正常,唯独 html 页面全部乱码,在浏览器菜单内手动选择页面编码格式为 utf-8,则可以正常显示中文了。虽然可以暂时解决,但不可能假设所有的用户每次浏览这些静态html的时候,都会手动去选择编码格式。这里必须要有一 个治本的办法。?
??? 在firefox内乱码的html页面上,右键“查看页面信息”,可以看到http头信息内的编码格式为 gb2312,而页面meta信息内指定的是utf-8。即firefox是按gb2312的缺省行为来解析utf-8编码的页面,当然会乱码。问题就出 在,firefox并不会像IE那样可以根据meta信息覆盖服务器回送的http头信息,它是严格按照http协议规范的行为方式:按照http头指定 的编码格式来解析页面。也就是说,如果http头回送里面指定了页面的编码格式,firefox会忽略meta信息的字符集指定。而IE则以meta优 先。
????为什么我的服务器输出html页面的时候,http头会回送gb2312的编码集?我在 web.xml 内加上 SetCharacterEncodingFilter,强制所有输出字符集为 utf-8,问题依旧。因为项目做了 SEO,用到了 UrlRewriterFilter,便怀疑是这个 filter 在做 url forward 的时候,改变了输出字符集,可是去掉这个 filter 后,问题还是存在。 于是再考察struts2的 FilterDispatcher,这是一个全局的派发过滤器,struts2的核心派发控制器。 最初的配置如下:

?

<filter>
????????<filter-name>struts2</filter-name>
????????<filter-class>org.apache.struts2.dispatcher.FilterDispatcher</filter-class>
????</filter>
????<filter-mapping>
????????<filter-name>struts2</filter-name>
????????<url-pattern>/*</url-pattern>
????????<dispatcher>REQUEST</dispatcher>
????????<dispatcher>FORWARD</dispatcher>
????</filter-mapping>


url-pattern 是 /* 的全范围映射,当然也包括了 html 后缀文件。这种情况下,项目中任何一个请求,会经过3次filter,首先是SetCharacterFilter、然后是 UrlRewriterFilter、最后是 FilterDispatcher,之前已经排除了 UrlRewriterFilter 的问题。于是修改 FilterDispatcher 的 url-pattern 为 *.do,即只过滤 *.do 的请求,其他请求比如 *.html,则不会经过这个 filter。?
????这样修改后,一切都正常了。
????
????当 url-pattern 为 /* 时,所有请求包括对静态资源文件的请求,都会有FilterDispatcher来接管派发。如果请求类型为静态资源,则 FilterDispatcher 不会调用 action 处理模块来接收这个请求,而是简单的回送静态资源。在这个回送过程中,FilterDispatcher 做的工作如下:

FilterDispatcher.java