说明:1、char:固定长度的非 Unicode 字符数据,最大长度为 8,000 个字符。
2、varchar:可变长度的非 Unicode 数据,最长为 8,000 个字符。
3、nvarchar:可变长度 Unicode 数据,其最大长度为 4,000 字符。
4、nchar:固定长度的 Unicode 数据,最大长度为 4,000 个字符。
5、char和varchar都是字符串类型的,用Unicode编码的字符串,结果是字符的整数值.
如有以下数据结构:
- 工号姓名部门
- ———————–
- 1张三财务
- 2李四人事
- 3王五销售
- ……..
我们定义”姓名”为char(10)(静态)的时简单地用php代码表示,简单地模拟底层数据存储链表$data,代码如下:
- $col_num_len=1;//工号长度为1
- $col_name_len=10;//姓名长度为10
- $col_unit_len=4;//部门长度为4
- $col_len=$col_num_len+$col_name_len+$col_unit_len+3;
- //表示每笔记录的总长度,包括3个分隔符
实现如下,代码如下:
- $data="1|张三 |财务|2|李四 |人事|3|王五 |销售|...";//简单地模拟底层数据存储链表
- //假设查找第2条记录的"姓名"字段数据
- $record_start=$col_len*1+1;//获取第2行的起始位置
- $record=substr($data,$record_start,$col_len);//获取第2条记录
- $col_name_start=$col_num_len+2;//获取"姓名"字段的起始位置
- $col_name=substr($record,$col_name_start,$col_name_len);//获取"姓名"字段的数据
- echo$col_name;
代码如下:
- //假设更新第2条记录的"姓名"字段数据为"李小四"
- $update_info="李小四";
- $data=substr_replace($data,$update_info,$col_name_start,$col_name_len);//更新字段,流程结束
而如果我们定义”姓名”字段为varchar(10)(动态)的时候情况则要复杂,注意存储”姓名”的字段没有空格,这是char和varchar的存储区别:
- $col_num_len=1;//工号长度为1
- $col_name_len=10;//姓名长度为10
- $col_unit_len=4;//部门长度为4
- $col_len=$col_num_len+$col_name_len+$col_unit_len+3;
实现如下,代码如下:
- //动态存放数据行的起始位置,数据为更新时生成(重新)
- $record_1_start=1;$record_1_name_dynamic_len=4;//$col_1_name_dynamic_len记录"姓名"动态字段的长度
- $record_2_start=13;$record_2_name_dynamic_len=4;
- $record_3_start=26;$record_3_name_dynamic_len=6;
- ...
- $data="1|张三|财务|2|李四|人事|3|王小明|销售|...";//简单地模拟底层数据存储链表,注意存储"姓名"的字段没有空格
- //假设查找第2条记录的"姓名"字段数据
- $record_2_end=$record_3_start-1;//获取第2行的结束位置
- $record=substr($data,$record_2_start,$record_2_end);//获取第2条记录
- $col_name_start=$col_num_len+2;//获取"姓名"字段的起始位置
- $col_name=substr($record,$col_name_start,$record_2_name_dynamic_len);//获取"姓名"字段的数据
- echo$col_name;
- //假设更新第2条记录的"姓名"字段数据为"李小四",这边比静态的复杂很多
- $update_info="李小四";
- $update_len=strlen($update_info);//获取更新内容的长度
- if($diff_len=$update_len-$record_2_name_dynamic_len)
- {
- $data=substr_replace($data,"",$col_name_start,$record_2_name_dynamic_len);//清除原先数据
- $record_2_name_dynamic_len=$update_len;//更新字段的长度(并存储新值)
- //在此假设总记录数为n
- for($i=2;$i<=n;$i++)
- {//phpfensi.com
- ${'record_'.$i.'_start'}=${'record_'.$i.'_start'}+$diff_len;//重新更新每个行的起始位置(并存储新值),系统开销大(实际上有不同的方法解决)
- }
- }
- $data=substr_replace($data,$update_info,$col_name_start,0);
文中直接使用”substr_replace”,而在数据量很大的时候,底层实现上的开销也是不小的,在mysql中表现为(Row Migration)现象,在此不作赘述.
根据以上的粗略实现证明:
1、varchar类型在更新环节上的系统开销是远大于char类型的。
2、两者间查找搜索性能上是不相上下的。
3、两者间的存储数据量($data)环节上,char要显示大于varchar。
4、大数据量提取时varchar的磁盘IO消耗更低,意味着varchar综合查询性能会更好。
5、没有了。
实际应用中的结论(如在mysql中):
1、char适合字段频繁更新时的应用。
2、varchar更节省磁盘空间。
3、实际应用中大数据量(多行)查询返回,varchar的查询性能比起char来要好出不少。
4、选择char和varchar会改变整体数据结构的算法以及存储方式。在mysql应用中,如已存在varchar字段,那么其它所有的char字段将以varchar方式存储。
5、没有了。
(以上算法仅以PHP简单描述,欢迎更好的思路加以指教)
注:此文原作者的写作时间比较久远了,所以有些地方和现在的有些出入,体现在:
1.在innodb引擎中,char和varchar的实现已无异,效率上并没多大区别。
2.选择char和varchar并不会改变整体数据结构的算法以及存储方式,我记得这是在MYSQL4里的特性,网上的老文章有讲述,到了MYSQL5实测已无此特性.
总结分析:
文字字段若长度固定,如:身分证号码,就不要用 varchar 或 nvarchar,应该用 char 或 nchar.
支持多语言的站点应考虑使用 Unicode nchar 或 nvarchar 数据类型以尽量减少字符转换问题.
文字字段若长度不固定,如:地址,则该用 varchar 或 nvarchar。除了可节省存储空间外,存取硬盘时也会较有效率.