日期:2014-05-16 浏览次数:20396 次
问题:
项目为工作流系统,工作流核心表涉及三张表,分别为
表A:工单表
表B:工单任务表
表C:工单任务参与表
随着数据量急剧增加,表C达到1亿,表B达到2000万,表A达到500万
此时对这三张表做关联查询时,尽管通过索引以及SQL优化等方式,也无法解决性能问题时
只能对表结构进行切分
?
方案:
数据库分表主要有两种:横向切分、纵向切分
通过分析这三张表主要应用于工作流系统,主要根据表A的endTime字段从数据上可划分为活动数据、不活动数据、历史数据(endTime字段的意义是:如果工单结束,endTime为结束时间)。
活动数据-频繁的查询、增删改操作
不活动数据-查询统计报表操作
历史数据-很少进行查询,一般为几年前的数据
?
实施:
步骤一、
以表A为例,增加archive字段,根据该字段将数据划分为
archive=-1:历史数据
archive=0:不活动数据
archive=1:活动数据
原始表A的定义为:
create table table_A
(
?? ID??????????????? VARCHAR(128) PRIMARY KEY,
?? PARENTID??? VARCHAR(128),
?? ……
?? ENDTIME????? VARCHAR(128)
);
改造后的表A定义为:
create table table_A
(
?? ID??????????????? VARCHAR(128) PRIMARY KEY,
?? PARENTID??? VARCHAR(128),
?? ……
?? ENDTIME????? VARCHAR(128) ,
?? ARCHIVE????? NUMBER(1) DEFAULT 1 NOT NULL
);
partition by range (ARCHIVE)
(
? partition SUBS_0 values less than (0)
? partition SUBS_1 values less than (1)
? partition SUBS_2 values less than (2)
);
?
步骤二、
insert、update、delete操作不做改动
对表A的查询操作增加条件(只针对活动数据的查询)
archive=1
?
步骤三、
建立oracle job完成每天数据的自动归档任务
存储过程为:
create or replace procedure PROC_TABLE_A as
? TYPE ridArray IS TABLE OF ROWID INDEX BY BINARY_INTEGER;
? type cur_type is ref cursor;
? v_rid??? ridArray;
? v_cursor cur_type;
begin
? dbms_output.put_line(' Start purging finished processes...... ');
? open v_cursor for 'select? ROWID from table_A partition(SUBS_2) where endtime is not null';
? loop
??? FETCH v_cursor BULK COLLECT
????? INTO v_rid LIMIT 10000;
??? forall row in 1 .. v_rid.count()
????? UPDATE tbl_process_draft partition(SUBS_2)
???????? set archive = 0
?????? where rowid = v_rid(row);
??? COMMIT;
??? EXIT WHEN v_cursor%NOTFOUND;
? END LOOP;
? close v_cursor;
? dbms_output.put_line(' done! ');
exception
? when others then
??? dbms_output.put_line('error is' || sqlcode ||
???????????????????????? '?? error?? message?? is' ||substr(sqlerrm, 1, 100));
??? rollback;
end;
?
job为:
begin
? sys.dbms_job.submit(job => :job,
????????????????????? what => 'PROC_TABLE_A;',
????????????????????? next_date => to_date('04-05-2011 01:00:00', 'dd-mm-yyyy hh24:mi:ss'),
????????????????????? interval => 'TRUNC(sysdate) + 1 +1/ (24)');
? commit;
end;
有没有搞错,提交之后,发现内容变一半了,只能再把丢掉的内容补上
javaeye,别让我失望!