GB2312和UTF8编码相互转换的解决方案
更新时间:[2014-6-17]  点击数:[]
最方便的方法如下:
不要转换任何模块网页的编码该utf-8的还是utf-8,该Gb22312的还是Gb2312
在Utf-8模块的包文档(如conn.asp,但是要注意conn.asp必须是在第一行调用)最前面加上
<%@LANGUAGE="VBSCRIPT" CODEPAGE="65001"%>
<%Session.CodePage=65001%>
在GB2312模块的包文档最前面加上
<%@LANGUAGE="VBSCRIPT" CODEPAGE="936"%>
<%Session.CodePage=936%>
其他编码的类推。

UTF-8编码是一种支持多语言的国际化编码格式,它能够让不同语言操作系统和浏览器的用户访问中文网站时不用下载语言包即可正常浏览。而GB2312却做不到这一点,国内目前很多程序已经开始支持UTF-8编码。以下是博客作者对ASP中使用UTF-8编码的技巧小节

以前做网页都是用的GB2312,因为刚开始不太了解,也就没注意这些。Dreamweaver中文版默认的就是简体中文,不写编码类型的话也是如此。然而,现在越来越多的网站采用unicode编码,这样做的好处自然不必多说。但是,要想真正用好utf-8并不是那么容易。下面我就总结一下自己遇到的问题。

首先,要把meta区的charset由gb2312改为utf-8,这点应该没有人不知道吧。在dreamweaver里可以直接设置[页面属性]中的[编码],然后会发现编辑器里的字体已经变了。但仅仅这样做是远远不够的,重要的还在下面。

然后要将所有文件保存成utf-8格式的。具体的方法是,用记事本打开要保存的文件,选[另存为],然后,在编码中将默认的ANSI(也就是ascii编码)改为utf-8,是utf-8而不是unicode或其他。

以上两点是其他很多网站都讲过的地方,仅仅这样做之后会发现,还有很多问题,比如汉字乱码,或者出现“未结束的字符串”等。下面还有三步!

1)ASP文件最前面写<%@CODEPAGE="65001"%>,原来就有的要改变CODEPAGE,utf-8就要用65001,前面那个脚本语言,如果就用vbscript的话就不用写了。不是每个文件都要写,而是只要在独立的页面写上就可以了,不包括包含文件。

2)经过上面的那些步骤,刷新一下,基本上就应该可以了。但是,你关闭浏览器重新打开试试,发现了什么?页面一片空白!打开右键菜单,找到编码,选择utf-8,这才一切正常。也就是说,浏览器可能不会自动识别编码。在第1)步内容的后面加上response.charset="utf-8"即可。

3)完成之后,重新打开浏览器,发现一切正常。但这并不代表工作已经完成了。多刷新几次试试?结果发现,第一次很正常,刷新之后,汉字就出现乱码了。这时,还要在第2)步的后面加上session.CodePage = 65001才行。这一句并不是每个文件都要加,只要在首页加上就行了。既然用session,就可能出现过期的现象,那就都加上吧。这时,如果你的站点中还有gb2312的页面,刷新它,就会发现,那个页面中的汉字已经出现乱码了。

经过以上若干步骤,不出意外,就可以正常使用utf-8了。

注意

有时会遇到奇数汉字或中英文混合时出现乱码或“未结束的字符串”,如果你用的是netbox而不是IIS的话,就请换用IIS,不用netbox,或把网页传到虚拟空间上再试。基本上都是netbox本身引起的。

数据库不需改动,因为数据库内部就是unicode编码的,出来的时候再转换成其他编码。另外,需要注意的是,在utf-8中不可以通过URL参数传递汉字,如果需要的话,要加上server.URLEncode(),记得以前使用gb2312时没遇到过这样的问题。

网站首页 | 广州网站建设 | 网站建设客户案例 | 关于建站 | 在线留言 | 联系我们网站地图