多言语网站开发技术剖析-ASP教程-爱易网页

多言语网站开发技术剖析

日期：2008-07-24　浏览次数：21295 次

Aiyiweb.Com提示：多言语网站，顾名思义就是能够以多种言语（而不是单种言语）为用户提供信息服务，让使用不同言语的用户都能够从同个网站获得内容相反的信息。

言语是信息传播的次要妨碍。

多言语网站，顾名思义就是能够以多种言语（而不是单种言语）为用户提供信息服务，让使用不同言语的用户都能够从同个网站获得内容相反的信息。

多言语网站实现方案 1，静态：就是为每种言语分别预备一套页面文件，要么通过文件后缀名来区分不同言语，要么通过子目录来区分不同言语。

例如对于首页文件index_en.htm提供英语界面，index_gb.htm提供简体中文界面，index_big.htm提供繁体中文界面，或者是en/index.htm提供英语界面，gb/index.htm提供简体中文界面，big/index.htm提供繁体中文界面，一旦用户选择了需求的言语后，自动跳转到相应的页面，首页以下其他链接也是按照同样方式处理。从维护的角度来看，通过子目录比通过文件后缀名来区分不同言语版本显得要简单明了。

2，动态：站点内所有页面文件都是动态页面文件（PHP，ASP等）而不是静态页面文件，在需求输出言语文字的地方统一采用言语变量来表示，这些言语变量可以依据用户选择不同的言语赋予不同的值，从而能够实如今不同的言语环境下输出不同的文字。

例如：言语变量ln_name，当用户选择的言语是英语时赋值为“Name”，当用户选择的言语是简体中文时赋值为“姓名”，这样就可以顺应不同言语时的输出。

采用静态方式的优点是页面直接输出到客户端，不需求在服务器上运转，占用服务器的资源比较少，系统能够支持的并发连接数较多，缺点是要为每种言语制造一套页面文件，很多内容即便是和言语无关的也要分不同言语来存储，因此占用的存储空间较多。

采用动态方式和静态方式的优缺点正好相反，它的优点是动态页面文件只要一套，不同言语的文字使用言语变量来存储，和言语无关的内容只存储一份，占用的存储空间较少，并且扩展新言语比较容易，缺点需求在服务器上运转，然后把结果输入到客户端，占用服务器的资源比较多，系统能够支持的并发连接数较少。

动态数据存贮涉及的一些技术问题

由于如今网站上动态使用日益增多，相当多的网站还会使用文件或者数据库来存储使用信息，因此如果文件或者数据库中存储的内容与言语相关时，还需求特别留意。对于存储在数据库中信息，可以采取以下几种方式支持多言语：

1，在数据库级别支持多言语：为每种言语建立独立的数据库，不同言语的用户操作不同的数据库。

2，在表级别支持多言语：为每种言语建立独立的表，不同言语的用户操作不同的表，但是它们在同一个数据库中。

3，在字段级别支持多言语：在同一个表中为每种言语建立独立的字段，不同言语的用户操作不同的字段，它们在同一个表中。

由于数据库中有大量的信息（如标志，编码，数字等）是用于内部处理使用的，与言语无关的，因此在数据库级别支持多言语会导致空间的极大浪费，在字段级别支持多言语最大的问题是一旦需求支持新的言语，由于需求修正表结构，维护起来非常麻烦，可扩展性不好。

相比之下，在表级别支持多言语比较好，由于并不是所有的表都需求支持多言语，对于与言语无关的表，不同言语的用户共用一套，那些和言语相关的表依据支持言语的品种来建立，不同言语的用户存取访问不同的表格。这样使得维护简单，节省了存储空间，即便是扩展起来也比较方便，只需把需求支持多言语的表，多建立一套即可。

还需求留意的问题是：有些表中某些字段是不同言语版本的表共享的（例如库存量），由于各种言语的表之间的绝对独立性，使得数据共享有些困难。处理的方法有两个：

1，不同言语的表的共享字段同步：也就是说，只需修正了其中一个表的共享字段，其他言语表中该字段也作相应改变，实际上当不同言语的用户同时访问时处理还是比较麻烦的，并且扩充新言语时修正任务比较大。

2，添加一个新的表：把所有言语共享的字段（例如货物编号，产地编码等）全部放在这个表，支持多言语的表只存放与各种言语相关的字段。不同言语的用户在使用数据库时，需求操作两个数据表。比较而言，第二种方法比较简单，并且效率比较高，维护也比较方便。
使用字符集的选择

一个定位于不同言语国家的企业网站势必需求提供多种言语版本的产品和销售信息来满足其世界各地使用不同言语的客户和合作伙伴，其中包括法语、德语、意大利语、葡萄牙语、西班牙语、阿拉伯语等等。但有一个问题却极易被网站设计者们所忽略。这就是网站的字符集设置问题。

普通我们使用的是简体中文(GB2312)字符集，而对多言语网站来说，中文字符集却可能会使你辛辛劳苦的努力大功告成。缘由很简单：就是这个毫不起眼的小小字符集在作祟。

计算机使用领域中存在着几十种互不相反的字符集，而不同言语客户在浏览不同言语网页时，往往会由于互相间所使用字符集无法兼容而出现乱码情况。我们在浏览国外一些网站时，往往也会出现为了能正常地看到网站上的信息而不得不在各种字符集之间来回切换的情况。

试想一下：如果一个网站提供了中，英，法，德等多种言语版本的内容，内容全之又全，设计美仑美奂。我们在中文编码环境下浏览这些非中文版本的页面觉得非常完满，如今一个法国客户对你的产品发生了兴味，当他进到法语版面一看—乱码多多，甚至可能整个版面都一塌里糊涂。你的网站再下大时间又有什么意义呢?

所以对提供了多言语版本的网站来说，Unicode字符集应该是最理想的选择。它是一种双字节编码机制的字符集，不管是东方文字还是西方文字，在Unicode中一概用两个字节来表示，因此至少可以定义65536个不同的字符，几乎可以涵盖世界上目前所有通用的言语的每一种字符。所以在设计和开发多言语网站时，一定要留意先把非中文页面的字符集定义为“utf-8”格式。

这一步非常重要，缘由在于若等页面做好之后再更改字符集设置，可说是一件非常非常费劲不讨好的任务，有时候甚至可能需求从头再来，重新输入网站的文字内容。

HTML中的META标签：
<META HTTP-EQUIV=“Content-Type” CONTENT=“text/html; CHARSET=字符集">
不写，依据浏览器默认字符集显示

charset=gb2312 简体中文
charset=big5 繁体中文
charset=EUC_KR 韩语
charset=Shift_JIS 或 EUC_JP 日语
charset= KOI8-R / Windows-1251 俄语
charset=iso-8859-1 西欧语系（荷兰语,英语,法语,德语,意大利语,挪威语,葡萄牙语,瑞士语.等十八种言语）
charset=iso-8859-2 中欧语系
charset=iso-8859-5 斯拉夫语系（保加利亚语,Byelorussian语,马其顿语,俄语,塞尔维亚语,乌克兰语等）
charset=uft-8 unicode多言语

PHP与脚本引擎页码的概念由于我们传统使用的内码像Big5,GB2312与unicode并不是逐一对应,故两者之间的转换要靠codepage(页码)来实现
<?php=Language=VBScript CodePage=xxx?>

不写，依据服务器端解析引擎默认代码页自动解析并前往浏览器。如果制造的网页脚本与WEB服务端的默认代码页不同，则必须指明代码页：

codepage=936 简体中文
GBK codepage=950 繁体中文
BIG5 codepage=437 美国/加拿大英语
codepage=932 日文 codepage=949 […]

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

多言语网站开发技术剖析

相关资料更多>

推荐阅读更多>