PreparedStatement效率为什么高/为什么要使用PreparedStatement代替Statement
在JDBC应用中,如果你已经是稍有水平开发者,你就应该始终以PreparedStatement代替Statement.也就是说,在任何时候都不要使用Statement.
基于以下的原因:
一.代码的可读性和可维护性.
虽然用PreparedStatement来代替Statement会使代码多出几行,但这样的代码无论从可读性还是可维护性上来说.都比直接用Statement的代码高很多档次:
stmt.executeUpdate("insert into tb_name (col1,col2,col2,col4) values ('"+var1+"','"+var2+"',"+var3+",'"+var4+"')");
perstmt = con.prepareStatement("insert into tb_name (col1,col2,col2,col4) values (?,?,?,?)");
perstmt.setString(1,var1);
perstmt.setString(2,var2);
perstmt.setString(3,var3);
perstmt.setString(4,var4);
perstmt.executeUpdate();
不用我多说,对于第一种方法.别说其他人去读你的代码,就是你自己过一段时间再去读,都会觉得伤心.
二.PreparedStatement尽最大可能提高性能.
每一种数据库都会尽最大努力对预编译语句提供最大的性能优化.因为预编译语句有可能被重复调用.所以语句在被DB的编译器编译后的执行代码被缓存下来,那么下次调用时只要是相同的预编译语句就不需要编译,只要将参数直接传入编译过的语句执行代码中(相当于一个涵数)就会得到执行.这并不是说只有一个Connection中多次执行的预编译语句被缓存,而是对于整个DB中,只要预编译的语句语法和缓存中匹配.那么在任何时候就可以不需要再次编译而可以直接执行.而statement的语句中,即使是相同一操作,而由于每次操作的数据不同所以使整个语句相匹配的机会极小,几乎不太可能匹配.比如:
insert into tb_name (col1,col2) values ('11','22');
insert into tb_name (col1,col2) values ('11','23');
即使是相同操作但因为数据内容不一样,所以整个个语句本身不能匹配,没有缓存语句的意义.事实是没有数据库会对普通语句编译后的执行代码缓存.这样每执行一次都要对传入的语句编译一次.
当然并不是所以预编译语句都一定会被缓存,数据库本身会用一种策略,比如使用频度等因素来决定什么时候不再缓存已有的预编译结果.以保存有更多的空间存储新的预编译语句.
三.最重要的一点是极大地提高了安全性.
即使到目前为止,仍有一些人连基本的恶义SQL语法都不知道.
String sql = "select * from tb_name where name= '"+varname+"' and passwd='"+varpasswd+"'";
如果我们把[' or '1' = '1]作为varpasswd传入进来.用户名随意,看看会成为什么?
select * from tb_name = '随意' and passwd = '' or '1' = '1';
因为'1'='1'肯定成立,所以可以任何通过验证.更有甚者:
把[';drop table tb_name;]作为varpasswd传入进来,则:
select * from tb_name = '随意' and passwd = '';drop table tb_name;有些数据库是不会让你成功的,但也有很多数据库就可以使这些语句得到执行.
而如果你使用预编译语句.你传入的任何内容就不会和原来的语句发生任何匹配的关系.(前提是数据库本身支持预编译,但上前可能没有什么服务端数据库不支持编译了,只有少数的桌面数据库,就是直接文件访问的那些)只要全使用预编译语句,你就用不着对传入的数据做任何过虑.而如果使用普通的statement,有可能要对drop,;等做费尽心机的判断和过虑.
上面的几个原因,还不足让你在任何时候都使用PreparedStatement吗?
首先指出axman 是这个坛子里少有的几个发有价值帖子的人, 但是此帖过于偏激,可能axman为了加强语气, 强化读者印象, 但是正确性应属首位。
我同意大多数情况下, 都可考虑使用PreparedStatement。 但是选择PreparedStatement还是Statement取决于你要怎么使用它们. 对于只执行一次的SQL语句选择Statement是最好的. 相反, 如果SQL语句被多次执行选用PreparedStatement是 <B>也许<B> 是更好的.
PreparedStatement的第一次执行消耗是很高的. 它的性能体现在后面的重复执行. 以你的例子来看:
con.prepareStatement("insert into tb_name (col1,col2,col2,col4) values (?,?,?,?)");
这时会发送一个网络请求到数据库解析和优化这个查询.
而执行时:
perstmt.executeUpdate();
会产生另一个网络请求.
诚然, PreparedStatement会有后续缓存优化查询的好处, 但是网络请求成本的增加 有可能 大于这个好处, 需要具体问题的分析。以此例来看, 90% 的可能性是若App Server 与 DB Server分布部署, 网络请求成本的增加 大于 后续优化执行带来的好处。
另外,还要指出的是, 不仅如此, 实际上Statement的执行,不一定是没有缓存的,而恰恰相反, 现在大多数的数据库软件的查询分析模块, 会透明的在第一次执行 像insert into tb_name (col1,col2) values ('11','22') 这样的sql简单语句时将其转化为 insert into tb_name (col1,col2) values (?,?), 为后面重复执行缓存优化。 当然不同的数据库实现的策略是不同的。我研究过Oracle和SQL Server, 都是这样。而且他们的文档里也都写了。
而且, 自定义动态查询等情况是绝对适合Statement的。 一个查询模块, 可选的条件有20种, 每个用户每次查询都可能大大不同, 这时无论从编码实现(拼SQL)还是性能考虑, Statement都更适合。
>另外,还要指出的是, 不仅如此, 实际上Statement的执行,不一定是没有缓
>存的,而恰恰相反, 现在大多数的数据库软件的查询分析模块, 会透明的在>
>第一次执行 像insert into tb_name (col1,col2) values ('11','22') 这样
>的sql简单语句时将其转化为 insert into tb_name (col1,col2) values
>(?,?), 为后面重复执行缓存优化。 当然不同的数据库实现的策略是不同
>的。我研究过Oracle和SQL Server, 都是这样。而且他们的文档里也都写了。
SQLSERVER是不是这样我不清楚,Oracle好象不完全是这样。Oracle从8i开始引入了一个配置参数,cursor_sharing。在9i中,对于cursor_sharing的取值有多了一项:similar
加入cursor_sharing的目的,就是为了解决对statement的多次硬解析问题。其缺省值是EXACT,也就是说,只有SQL完全一样的statement才能共享执行计划。如果把cursor_sharing的值设为FORCE,这样会强制SQL中的文字值都替换为变量。这样共享的范围就大大扩展了。
比较赞成,看hibernate的底层sql都是用的preparestatement.另外补充一点自己的经验.preparestatement能不能提高性能还要看数据库配置,比如oracle,要配置指针共享参数为true,否则性能没有变化。如果配置为force的话,statement也能达到preparestatment的性能效果。
还有就是oracle的sql语句长度限制问题等都可以通过preparestatement获得解决。
同意楼上得,大多数要求尽量使用PreparedStatement,但是有些情况也得使用Statement
这个主要要从数据库角度来考虑。
你需要了解一下什么叫什么bind variable
而prepareSta