日期:2014-05-16 浏览次数:20805 次
对于一些数据量较大的系统,面临的问题除了是查询效率低下,还有一个很重要的问题就是插入时间长。当导入的数据量较大时,插入操作耗费的时间相当可观。因此,提高大数据量系统的MySQL insert效率是很有必要的。
常用的插入语句如:
INSERT INTO `insert_table` (`datetime`, `uid`, `content`, `type`) VALUES ('0', 'userid_0', 'content_0', 0); INSERT INTO `insert_table` (`datetime`, `uid`, `content`, `type`) VALUES ('1', 'userid_1', 'content_1', 1);修改成:
INSERT INTO `insert_table` (`datetime`, `uid`, `content`, `type`) VALUES ('0', 'userid_0', 'content_0', 0), ('1', 'userid_1', 'content_1', 1);Java实现:
Connection connection = DriverManager.getConnection("jdbc:mysql://localhost:3306/test","root","123"); // 关闭自动提交,默认情况下每执行一条sql提交一次 connection.setAutoCommit(false); PreparedStatement statement = connection.prepareStatement("INSERT INTO insert_table VALUES(?, ?)"); //记录1 statement.setString(1, "2012-12-27 11:11:11"); statement.setString(2, "userid_0"); statement.setString(3, "content_0"); statement.setInt(4, 0); statement.addBatch(); //记录2 statement.setString(1, "2012-12-27 12:12:12"); statement.setString(2, "userid_1"); statement.setString(3, "content_1"); statement.setInt(4, 1); statement.addBatch(); //记录3 statement.setString(1, "2012-12-27 13:13:13"); statement.setString(2, "userid_2"); statement.setString(3, "content_2"); statement.setInt(4, 2); statement.addBatch(); //批量执行上面3条语句. int [] counts = statement.executeBatch(); //Commit connection.commit();
修改后的插入操作能够提高程序的插入效率。这里第二种SQL执行效率高的主要原因有两个,一是减少SQL语句解析的操作, 只需要解析一次就能进行数据的插入操作,二是SQL语句较短,可以减少网络传输的IO。
记录数 | 单条数据插入 | 多条数据插入 |
1百 | 0.149s | 0.011s |
1千 | 1.231s | 0.047s |
1万 | 11.678s | 0.218s |
把插入修改成:
START TRANSACTION; INSERT INTO `insert_table` (`datetime`, `uid`, `content`, `type`) VALUES ('0', 'userid_0', 'content_0', 0); INSERT INTO `insert_table` (`datetime`, `uid`, `content`, `type`) VALUES ('1', 'userid_1', 'content_1', 1); ... COMMIT;使用事务可以提高数据的插入效率,这是因为进行一个INSERT操作时,MySQL内部会建立一个事务,在事务内进行真正插入处理。通过使用事务可以减少数据库执行插入语句时多次“创建事务,提交事务”的消耗,所有插入都在执行后才进行提交操作。
记录数 | 不使用事务 | 使用事务 |
1百 | 0.149s | 0.033s |
1千 | 1.231s | 0.115s |
1万 | 11.678s | 1.050s |
记录数 | 单条数据插入 | 合并数据+事务插入 |
1万 | 0m15.977s | 0m0.309s |
10万 | 1m52.204s | 0m2.271s |
100万 | 18m31.317s | 0m23.332s |
从测试结果可以看到,insert的效率大概有50倍的提高,这个一个很客观的数字。