我擦,数据被我给删没了。

moon聊技术

共 9129字,需浏览 19分钟

 ·

2021-10-01 01:49

作者:LuciferLiu  
作者简介:中国 DBA 联盟 (ACDU) 成员、目前从事 Oracle DBA 工作、曾从事 Oracle 数据库开发工作,主要服务于生产制造,汽车金融等行业;现拥有 Oracle OCP、OceanBase OBCA 认证、擅长 Oracle 数据库运维开发、备份恢复、安装迁移、Linux 自动化运维脚本编写等。

前言

俗话说的好,常在河边走,哪有不湿鞋?

昨天大周末的,本想着要好好休息一下,没想到客户联系我说误更新数据表,导致数据错乱了,希望能尽快恢复下。

数据库版本为:11.2.0.1,操作系统是:Windows 64 位,数据已经被更改超过 1 周时间,数据库已开启归档模式、没有 DG 容灾、有 RMAN 备份并希望将这张表恢复到一周前的指定时间点。

一、分析

以下只列出常规恢复手段:

1、数据已经误操作超过一周,所以排除使用 UNDO 快照来找回;

2、没有 DG 容灾环境,排除使用 DG 闪回;

3、主库已开启归档模式,并且存在 RMAN 备份,可使用 RMAN 异机恢复表对应表空间,使用 DBLINK 捞回数据表;

4、Oracle 12C 后支持单张表恢复;

结论:安全起见,使用 RMAN 异机恢复表空间来捞回数据表。

二、思路

客户希望将表数据恢复到 2021/06/08 17:00:00 之前某个时间点。

大致操作步骤如下:

1、主库查询误更新数据表对应的表空间和无需恢复的表空间。

2、新主机安装 Oracle 11.2.0.1 数据库软件,无需建库,目录结构最好保持一致。

3、主库拷贝参数文件,密码文件至新主机,根据新主机修改参数文件和创建新实例所需目录。

4、新主机使用修改后的参数文件打开数据库实例到 nomount 状态。

5、主库拷贝备份的控制文件至新主机,新主机使用 RMAN 恢复控制文件,并且 MOUNT 新实例。

6、新主机 RESTORE TABLESPACE 恢复至时间点  2021/06/08 16:00:00

7、新主机 RECOVER DATABASE SKIP TABLESPACE 恢复至时间点  2021/06/08 16:00:00

8、新主机实例开启到只读模式。

9、确认新主机实例的表数据是否正确,若不正确则重复 第7步 调整时间点慢慢往 2021/06/08 17:00:00 推进恢复。

10、主库创建连通新主机实例的 DBLINK,通过 DBLIN K从新主机实例捞取表数据。

注意:选择表空间恢复是因为主库数据量比较大,如果全库恢复需要大量时间。

三、测试环境模拟

为了数据脱敏,因此以测试环境模拟场景进行演示。

1、环境准备

节点主机版本主机名实例名Oracle版本IP地址
主库rhel6.9orclorcl11.2.0.110.211.55.111
新主机rhel6.9orcl不创建实例11.2.0.110.211.55.112

环境部署可以通过 Oracle 一键安装脚本进行初始化环境,然后手动安装即可。

可参考:

https://blog.csdn.net/m0_50546016/category_11127389.html


主库:./OracleShellInstall.sh -i 10.211.55.111 -m Y -txh Y
新主机:./OracleShellInstall.sh -i 10.211.55.112 -m Y -txh Y

2、模拟测试场景

主库开启归档模式

--设置归档路径
alter system set log_archive_dest_1='LOCATION=/archivelog';

--重启开启归档模式
shutdown immediate
startup mount
alter database archivelog

--打开数据库
alter database open;

创建测试数据

sqlplus / as sysdba
--创建表空间
create tablespace lucifer datafile '/oradata/orcl/lucifer01.dbf' size 10autoextend off;
create tablespace ltest datafile '/oradata/orcl/ltest01.dbf' size 10autoextend off;

--创建用户
create user lucifer identified by lucifer;
grant dba to lucifer;

--创建表
conn lucifer/lucifer
create table lucifer(id number not null,name varchar2(20)) tablespace lucifer;

--插入数据
insert into lucifer values(1,'lucifer');
insert into lucifer values(2,'test1');
insert into lucifer values(3,'test2');
commit;

测试数据

进行数据库全备

run {
allocate channel c1 device type disk;
allocate channel c2 device type disk;
crosscheck backup;
crosscheck archivelog all; 
sql"alter system switch logfile";
delete noprompt expired backup;
delete noprompt obsolete device type disk;
backup database include current controlfile format '/backup/backlv0_%d_%T_%t_%s_%p';
backup archivelog all DELETE INPUT;
release channel c1;
release channel c2;
}

备份记录

模拟数据修改

sqlplus / as sysdba
conn lucifer/lucifer
delete from lucifer where id=1;
update lucifer set name='lucifer' where id=2;
commit;

修改后数据

注意:为了模拟客户环境,假设无法通过UNDO快照找回,当前删除时间点为:2021/06/17 18:10:00
如果使用 UNDO 快照,比较方便:
--查找UNDO快照数据是否正确
select * from lucifer.lucifer as of timestamp to_timestamp('2021-06-17 18:05:00','YYYY-MM-DD HH24:MI:SS');
--将UNDO快照数据捞至新建表中
create table lucifer.lucifer_0617 as select * from lucifer.lucifer as of timestamp to_timestamp('2021-06-17 18:05:00','YYYY-MM-DD HH24:MI:SS');

undo快照恢复数据

四、RMAN完整恢复过程

主库查询误更新数据表对应的表空间和无需恢复的表空间

--查询误更新数据表对应表空间
select owner,tablespace_name from dba_segments where segment_name='LUCIFER';
--查询所有表空间
select tablespace_name from dba_tablespaces;

查询表空间

查询所有表空间

主库拷贝参数文件,密码文件至新主机,根据新主机修改参数文件和创建新实例所需目录

##生成pfile参数文件
sqlplus / as sysdba
create pfile='/home/oracle/pfile.ora' from spfile;
##拷贝至新主机
su - oracle
scp /home/oracle/pfile.ora 10.211.55.112:/tmp
scp $ORACLE_HOME/dbs/orapworcl 10.211.55.112:$ORACLE_HOME/dbs
###新主机根据实际情况修改参数文件并且创建目录
mkdir -p /u01/app/oracle/admin/orcl/adump
mkdir -p /oradata/orcl/
mkdir -p /archivelog
chown -R oracle:oinstall /archivelog
chown -R oracle:oinstall /oradata

参数文件

新主机使用修改后的参数文件打开数据库实例到nomount状态

sqlplus / as sysdba
startup nomount pfile='/tmp/pfile.ora';

startup nomount

主库拷贝备份的控制文件至新主机,新主机使用RMAN恢复控制文件,并且MOUNT新实例

rman target /
list backup of controlfile;
##拷贝备份文件至新主机
scp /backup/backlv0_ORCL_20210617_107548592* 10.211.55.112:/tmp
scp /u01/app/oracle/product/11.2.0/db/dbs/0c01l775_1_1 10.211.55.112:/tmp
##新主机恢复控制文件并开启到mount状态
rman target /
restore controlfile from '/tmp/backlv0_ORCL_20210617_1075485924_9_1';
alter database mount;

通过 list backup of controlfile; 可以看到控制文件位置。

list controlfile

拷贝备份文件

恢复控制文件

新主机RESTORE TABLESPACE恢复至时间点 2021/06/17 18:06:00

##新主机注册备份集
rman target /
catalog start with '/tmp/backlv0_ORCL_20210617_107548592';
crosscheck backup;
delete noprompt expired backup;
delete noprompt obsolete device type disk;
##恢复表空间LUCIFER和系统表空间,指定时间点 `2021/06/17 18:06:00`
run {
sql 'alter session set nls_date_format="yyyy-mm-dd hh24:mi:ss"';
set until time '2021-06-17 18:06:00';
allocate channel ch01 device type disk;
allocate channel ch02 device type disk;
restore tablespace SYSTEM,SYSAUX,UNDOTBS1,USERS,LUCIFER;
release channel ch01;
release channel ch02;
}

restore恢复表空间

新主机 RECOVER DATABASE SKIP TABLESPACE 恢复至时间点 2021/06/17 18:06:00

rman target /
run {
sql 'alter session set nls_date_format="yyyy-mm-dd hh24:mi:ss"';
set until time '2021-06-17 18:06:00';
allocate channel ch01 device type disk;
recover database skip tablespace LTEST,EXAMPLE;
release channel ch01;
}

recover恢复

这里有一个小BUG:客户环境是Windows,执行这一步最后报错,手动offline数据文件依然无法开启数据库。

windows恢复报错

解决方案:

--将恢复跳过的表空间都offline drop掉,执行以下查询结果
select 'alter database datafile '|| file_id ||' offline drop;' from dba_data_files where tablespace_name in ('LTEST','EXAMPLE');
--再次开启数据库
alter database open read only;
注意:如果显示缺归档日志,可以参考如下步骤:
##查询恢复需要的归档日志号时间 
alter session set nls_date_format="yyyy-mm-dd hh24:mi:ss"
select first_time,sequence# from v$archived_log where sequence#='7';

##通过备份RESTORE吐出所需的归档日志 
rman target / 
catalog start with '/tmp/0c01l775_1_1'
crosscheck archivelog all; 
run { 
allocate channel ch01 device type disk; 
SET ARCHIVELOG DESTINATION TO '/archivelog';
restore ARCHIVELOG SEQUENCE 7; 
release channel ch01; 
}

##再次recover进行恢复至指定时间点 2021-06-17 18:06:00 
run { 
sql 'alter session set nls_date_format="yyyy-mm-dd hh24:mi:ss"'
set until time '2021-06-17 18:06:00'
allocate channel ch01 device type disk; 
recover database skip tablespace LTEST,EXAMPLE; 
release channel ch01; 

新主机实例开启到只读模式

sqlplus / as sysdba
alter database open read only;

开启到只读

确认新主机实例的表数据是否正确

select * from lucifer.lucifer;

校验恢复数据
注意:若不正确则重复 第7步 调整时间点慢慢往 2021/06/17 18:10:00 推进恢复:
##关闭数据库
sqlplus / as sysdba
shutdown immediate;

##开启数据库到mount状态
startup mount pfile='/tmp/pfile.ora';

##重复 第7步,往前推进1分钟,调整时间点为 `2021/06/08 18:07:00`
rman target /
run {
sql 'alter session set nls_date_format="yyyy-mm-dd hh24:mi:ss"';
set until time '2021-06-17 18:07:00';
allocate channel ch01 device type disk;
recover database skip tablespace LTEST,EXAMPLE;
release channel ch01;
}

主库创建连通新主机实例的DBLINK,通过DBLINK从新主机实例捞取表数据

sqlplus / as sysdba
CREATE PUBLIC DATABASE LINK ORCL112
CONNECT TO lucifer
IDENTIFIED BY lucifer
USING '(DESCRIPTION_LIST=
(DESCRIPTION=
(ADDRESS=(PROTOCOL=tcp)(HOST=10.211.55.112)(PORT=1521))
(CONNECT_DATA=
(SERVICE_NAME=orcl)
)
)
)'
;
--通过dblink捞取数据
create table lucifer.lucifer_0618 as select /*+full(lucifer)*/ * from lucifer.lucifer@ORCL112;
select * from lucifer.lucifer_0618;

创建DBLINK

通过dblink恢复数据

至此,整个 RMAN 恢复过程就结束了。

总之,有备份什么都好说。所以,作为 DBA,备份一定要做好!!!

浏览 24
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报