在mysql对字符编码的查看我们使用SHOW VARIABLES LIKE character即可,修改我们需要修改my.ini中的配置方法了,下面我一起来看看.
最近,在项目组使用的mysql数据库中,插入数据出现乱码,关于这个问题做了下总结,我们从最基本的地方说起,到错误产生的深层次原因和解决办法.
基本概念:
• 字符(Character)是指人类语言中最小的表义符号。例如’A'、’B'等;
• 给定一系列字符,对每个字符赋予一个数值,用数值来代表对应的字符,这一数值就是字符的编码(Encoding)。例如,我们给字符’A'赋予数值0,给字符’B'赋予数值1,则0就是字符’A'的编码;
• 给定一系列字符并赋予对应的编码后,所有这些字符和编码对组成的集合就是字符集(Character Set)。例如,给定字符列表为{’A',’B'}时,{’A'=>0, ‘B’=>1}就是一个字符集;
• 字符序(Collation)是指在同一字符集内字符之间的比较规则;
• 确定字符序后,才能在一个字符集上定义什么是等价的字符,以及字符之间的大小关系;
• 每个字符序唯一对应一种字符集,但一个字符集可以对应多种字符序,其中有一个是默认字符序(Default Collation);
• MySQL中的字符序名称遵从命名惯例:以字符序对应的字符集名称开头;以_ci(表示大小写不敏感)、_cs(表示大小写敏感)或_bin(表示按编码值比较)结尾。例如:在字符序“utf8_general_ci”下,字符“a”和“A”是等价的;
MySQL的字符集支持:
1、字符集(Character set)。
2、排序比较方式(Collation)。
通过命令:show character set 和 show collation 可以分别查看Mysql支持的字符集和排序方式.
– mysql> show character set;
– mysql> show collation;
Mysql对于字符集的支持细化到四个层次:
1、服务器(server);
2、数据库(database);
3、数据表(table)(字段column);
4、连接(connection);
MySQL字符集变量:
– character_set_server:默认的内部操作字符集
– character_set_client:客户端来源数据使用的字符集
– character_set_connection:连接层字符集
– character_set_results:查询结果字符集
– character_set_database:当前选中数据库的默认字符集
– character_set_system:系统元数据(字段名等)字符集
– 还有以collation_开头的同上面对应的变量,用来描述字符序.
用introducer指定文本字符串的字符集:
格式为:[_charset] ’string’ [COLLATE collation]
例如:
– SELECT _latin1 ’string’;– SELECT _utf8 ‘你好’ COLLATE utf8_general_ci;
由introducer修饰的文本字符串在请求过程中不经过多余的转码,直接转换为内部字符集处理.
1、查看默认字符集(默认情况下,Mysql的字符集是latin1(ISO_8859_1),通常,查看系统的字符集和排序方式的设定可以通过下面的两条命令:
- –mysql>SHOWVARIABLESLIKE'character%';
- +--------------------------+---------------------------------+
- |Variable_name|Value|
- +--------------------------+---------------------------------+
- |character_set_client|utf8|
- |character_set_connection|utf8|
- |character_set_database|utf8|
- |character_set_filesystem|binary|
- |character_set_results|utf8|
- |character_set_server|utf8|
- |character_set_system|utf8|
- |character_sets_dir|D:ProgramFilesMySQLMySQLServer5.1sharecharsets|
- +--------------------------+---------------------------------+
- –mysql>SHOWVARIABLESLIKE'collation_%';
- +----------------------+-----------------+
- |Variable_name|Value|
- +----------------------+-----------------+
- |collation_connection|utf8_general_ci|
- |collation_database|utf8_general_ci|
- |collation_server|utf8_general_ci|
- +----------------------+-----------------+
2、修改默认字符集
(1) 最简单的修改方法,就是修改mysql的my.ini文件中的字符集键值(共6个),如:
- [client]
- default-character-set=utf8
- default-character-set=utf8
- character-set-server=utf8
- collation-server=utf8_general_ci
- init_connect='SETcollation_connection=utf8_general_ci'
- init_connect='SETNAMESutf8'//phpfensi.com
修改完后,重启mysql的服务.
(2) 还有一种修改字符集的方法,就是使用mysql的命令,代码如下:
- –mysql>SETcharacter_set_connection=utf8;
- –mysql>SETcharacter_set_database=utf8;
- –mysql>SETcharacter_set_server=utf8;
- –mysql>SETcollation_server=utf8;
- –mysql>SETcollation_database=utf8;
- –mysql>SETcharacter_set_client=utf8;
- –mysql>SETcharacter_set_results=utf8;
- –mysql>SETcollation_connection=utf8;
一般就算设置了表的默认字符集为utf8并且通过UTF-8编码发送查询,你会发现存入数据库的仍然是乱码,问题就出在这个connection连接层上.
解决方法是在发送查询前执行一下下面这句:SET NAMES 'utf8';
它相当于下面的三句指令,代码如下: