首页

java文章|window系统|linux系统|mssql基础|MYSQL基础|ORACLE基础

中文字符乱码的原因及解决办法

摘录：java基础来源：java基础加入时间：2007年03月06日

摘要：
中文字符乱码的原因及解决办法

java的内核是Unicode的，也就是说，在程序处理字符时是用Unicode来表示字符的，但是文件和流的保存方式是使用字节流的。在java的基本数据类型中，char是Unicode的，而byte是字节，因此，在不同的环节java要对字节流和char进行转换。这种转换发生时如果字符集的编码选择不当，就会出现乱码问题。

转载：转载请保留本信息，本文来自
http://www.51dibs.com
/html/2006/article/info8/a_a6d4cfad4d454a00.htm

中文字符乱码的原因及解决办法

站点：爱心种子小博士关键字：中文字符乱码的原因及解决办法

中文字符乱码的原因及解决办法

java的内核是Unicode的，也就是说，在程序处理字符时是用Unicode来表示字符的，但是文件和流的保存方式是使用字节流的。在java的基本数据类型中，char是Unicode的，而byte是字节，因此，在不同的环节java要对字节流和char进行转换。这种转换发生时如果字符集的编码选择不当，就会出现乱码问题。

我们常见的乱码大致有如下几种情形：
1、汉字变成了问号"？"
2、有的汉字显示正确，有的则显示错误
3、显示乱码（有些是汉字但并不是你预期的）
4、读写数据库出现乱码

下面我们逐一对它们出现的原因做一些解释：

首先，我们讨论汉字变成问号的问题。

Java中byte与char相互转换的方法在sun.io包中。其中，byte到char的常用转换方法是：
public static ByteToCharConverter getConverter(String encoding);

为了便于大家理解，我们先来做一个小实验：比如，汉字"你"的GBK编码为0xc4e3，其Unicode编码是\u4f60。我们的实验是这样的，先有一个页面比如名为a_gbk.jsp输入汉字"你"，提交给页面b_gbk.jsp。在b_gbk.jsp文件中以某种编码方式得到"你"的字节数组，再将该数组以某种编码方式转换成char，如果得到的char值是0x4f60则转换是正确的。

a_gbk.jsp的代码如下：

参考文献：

UTF-8 and Unicode FAQ

《JSP动态网站技术入门与提高》太阳工作室孙晓龙赵莉编著

发布人：java基础
→ 推荐给我的好友 → 报告错误链接

上篇文章：Struts常见异常信息和解决方法
下篇文章：用Struts上传多个文件的方法

关于我们 - 网站留言 - 友情链接 - 与我在线 - 与我聊天 - 领取红包 - TOP

客户服务中心信箱：[email protected] [email protected] 网站地图

声明

合作伙伴：