很多朋友都可能碰到几万数据查询mysql就会占很高的内存和cup特别是在windows系统下,下面我们来看看原因分析吧.
有同事在PHP讨论群里提到,他做的一个项目由于MySQL查询返回的结果太多(达10万条), 从而导致PHP内存不够用.所以,他问,在执行下面的代码遍历返回的MySQL结果之前, 数据是否已经在内存中了? 代码如下:
while ($row = mysql_fetch_assoc($result)) { // ... }
当然, 这种问题有许多优化的方法,不过,就这个问题来讲,我首先想到,MySQL是经典的C/S(Client/Server, 客户端/服务器)模型, 在遍历结果集之前,底层的实现可能已经把所有的数据通过网络(假设使用TCP/IP)读到了Client的缓冲区,也有另一种可能,就是数据还在Server端的发送缓冲区里,并没有传给Client.
在查看PHP和MySQL的源码之前,我注意到PHP手册里有两个功能相近的函数,代码如下:
mysql_query() mysql_unbuffered_query()
两个函数的字面意思和说明证实了我的想法,前一个函数执行时,会把所有的结果集从Server端读到Client端的缓冲区中,而后一个则没有,这就是”unbuffered(未缓冲)”的意思.
那就是说,如果用mysql_unbuffered_query()执行了一条返回大量结果集的SQL语句,在遍历结果之前,PHP的内存是没有被结果集占用的,而用mysql_query()来执行同样的语句的话,函数返回时,PHP的内存占用便会急剧增加,立即耗光内存.
如果阅读PHP的相关代码,可以看到这两个函数的实现上的异同,代码如下:
- /*{{{protoresourcemysql_query(stringquery[,intlink_identifier])SendsanSQLquerytoMySQL*/PHP_FUNCTION(mysql_query){
- php_mysql_do_query(INTERNAL_FUNCTION_PARAM_PASSTHRU,MYSQL_STORE_RESULT);}
- --phpfensi.com
- /*}}}*/
- /*{{{protoresourcemysql_unbuffered_query(stringquery[,intlink_identifier])SendsanSQLquerytoMySQL,withoutfetchingandbufferingtheresultrows*/PHP_FUNCTION(mysql_unbuffered_query){php_mysql_do_query(INTERNAL_FUNCTION_PARAM_PASSTHRU,MYSQL_USE_RESULT);}/*}}}*/
两个函数都调用了php_mysql_do_query(),只差了第2个参数的不同,MYSQL_STORE_RESULT和MYSQL_USE_RESULT.再看php_mysql_do_query()的实现:
- if(use_store==MYSQL_USE_RESULT){
- mysql_result=mysql_use_result(&mysql->conn);
- }else{
- mysql_result=mysql_store_result(&mysql->conn);
- }
mysql_use_result()和mysql_store_result()是MySQL的C API函数,这两个C API函数的区别就是后者把结果集从MySQL Server端全部读取到了Client端,前者只是读取了结果集的元信息.
回到PHP,使用mysql_unbuffered_query(),可以避免内存的立即占用,如果在遍历的过程不对结果进行”PHP缓存”(如放到某数组中),则整.