我擦,数据被我给删没了。

杰哥的IT之旅

共 9262字,需浏览 19分钟

 ·

2021-06-23 19:07

作者:LuciferLiu  
作者简介:中国 DBA 联盟 (ACDU) 成员、目前从事 Oracle DBA 工作、曾从事 Oracle 数据库开发工作,主要服务于生产制造,汽车金融等行业;现拥有 Oracle OCP、OceanBase OBCA 认证、擅长 Oracle 数据库运维开发、备份恢复、安装迁移、Linux 自动化运维脚本编写等。

前言

俗话说的好,常在河边走,哪有不湿鞋?

昨天大周末的,本想着要好好休息一下,没想到客户联系我说误更新数据表,导致数据错乱了,希望能尽快恢复下。

数据库版本为:11.2.0.1,操作系统是:Windows 64 位,数据已经被更改超过 1 周时间,数据库已开启归档模式、没有 DG 容灾、有 RMAN 备份并希望将这张表恢复到一周前的指定时间点。

一、分析

以下只列出常规恢复手段:

1、数据已经误操作超过一周,所以排除使用 UNDO 快照来找回;

2、没有 DG 容灾环境,排除使用 DG 闪回;

3、主库已开启归档模式,并且存在 RMAN 备份,可使用 RMAN 异机恢复表对应表空间,使用 DBLINK 捞回数据表;

4、Oracle 12C 后支持单张表恢复;

结论:安全起见,使用 RMAN 异机恢复表空间来捞回数据表。

二、思路

客户希望将表数据恢复到 2021/06/08 17:00:00 之前某个时间点。

大致操作步骤如下:

1、主库查询误更新数据表对应的表空间和无需恢复的表空间。

2、新主机安装 Oracle 11.2.0.1 数据库软件,无需建库,目录结构最好保持一致。

3、主库拷贝参数文件,密码文件至新主机,根据新主机修改参数文件和创建新实例所需目录。

4、新主机使用修改后的参数文件打开数据库实例到 nomount 状态。

5、主库拷贝备份的控制文件至新主机,新主机使用 RMAN 恢复控制文件,并且 MOUNT 新实例。

6、新主机 RESTORE TABLESPACE 恢复至时间点  2021/06/08 16:00:00

7、新主机 RECOVER DATABASE SKIP TABLESPACE 恢复至时间点  2021/06/08 16:00:00

8、新主机实例开启到只读模式。

9、确认新主机实例的表数据是否正确,若不正确则重复 第7步 调整时间点慢慢往 2021/06/08 17:00:00 推进恢复。

10、主库创建连通新主机实例的 DBLINK,通过 DBLIN K从新主机实例捞取表数据。

注意:选择表空间恢复是因为主库数据量比较大,如果全库恢复需要大量时间。

三、测试环境模拟

为了数据脱敏,因此以测试环境模拟场景进行演示。

1、环境准备

节点主机版本主机名实例名Oracle版本IP地址
主库rhel6.9orclorcl11.2.0.110.211.55.111
新主机rhel6.9orcl不创建实例11.2.0.110.211.55.112

环境部署可以通过 Oracle 一键安装脚本进行初始化环境,然后手动安装即可。

可参考:

https://blog.csdn.net/m0_50546016/category_11127389.html


主库:./OracleShellInstall.sh -i 10.211.55.111 -m Y -txh Y
新主机:./OracleShellInstall.sh -i 10.211.55.112 -m Y -txh Y

2、模拟测试场景

主库开启归档模式

--设置归档路径
alter system set log_archive_dest_1='LOCATION=/archivelog';

--重启开启归档模式
shutdown immediate
startup mount
alter database archivelog

--打开数据库
alter database open;

创建测试数据

sqlplus / as sysdba
--创建表空间
create tablespace lucifer datafile '/oradata/orcl/lucifer01.dbf' size 10autoextend off;
create tablespace ltest datafile '/oradata/orcl/ltest01.dbf' size 10autoextend off;

--创建用户
create user lucifer identified by lucifer;
grant dba to lucifer;

--创建表
conn lucifer/lucifer
create table lucifer(id number not null,name varchar2(20)) tablespace lucifer;

--插入数据
insert into lucifer values(1,'lucifer');
insert into lucifer values(2,'test1');
insert into lucifer values(3,'test2');
commit;

测试数据

进行数据库全备

run {
allocate channel c1 device type disk;
allocate channel c2 device type disk;
crosscheck backup;
crosscheck archivelog all; 
sql"alter system switch logfile";
delete noprompt expired backup;
delete noprompt obsolete device type disk;
backup database include current controlfile format '/backup/backlv0_%d_%T_%t_%s_%p';
backup archivelog all DELETE INPUT;
release channel c1;
release channel c2;
}

备份记录

模拟数据修改

sqlplus / as sysdba
conn lucifer/lucifer
delete from lucifer where id=1;
update lucifer set name='lucifer' where id=2;
commit;

修改后数据

注意:为了模拟客户环境,假设无法通过UNDO快照找回,当前删除时间点为:2021/06/17 18:10:00
如果使用 UNDO 快照,比较方便:
--查找UNDO快照数据是否正确
select * from lucifer.lucifer as of timestamp to_timestamp('2021-06-17 18:05:00','YYYY-MM-DD HH24:MI:SS');
--将UNDO快照数据捞至新建表中
create table lucifer.lucifer_0617 as select * from lucifer.lucifer as of timestamp to_timestamp('2021-06-17 18:05:00','YYYY-MM-DD HH24:MI:SS');

undo快照恢复数据

四、RMAN完整恢复过程

主库查询误更新数据表对应的表空间和无需恢复的表空间

--查询误更新数据表对应表空间
select owner,tablespace_name from dba_segments where segment_name='LUCIFER';
--查询所有表空间
select tablespace_name from dba_tablespaces;

查询表空间

查询所有表空间

主库拷贝参数文件,密码文件至新主机,根据新主机修改参数文件和创建新实例所需目录

##生成pfile参数文件
sqlplus / as sysdba
create pfile='/home/oracle/pfile.ora' from spfile;
##拷贝至新主机
su - oracle
scp /home/oracle/pfile.ora 10.211.55.112:/tmp
scp $ORACLE_HOME/dbs/orapworcl 10.211.55.112:$ORACLE_HOME/dbs
###新主机根据实际情况修改参数文件并且创建目录
mkdir -p /u01/app/oracle/admin/orcl/adump
mkdir -p /oradata/orcl/
mkdir -p /archivelog
chown -R oracle:oinstall /archivelog
chown -R oracle:oinstall /oradata

参数文件

新主机使用修改后的参数文件打开数据库实例到nomount状态

sqlplus / as sysdba
startup nomount pfile='/tmp/pfile.ora';

startup nomount

主库拷贝备份的控制文件至新主机,新主机使用RMAN恢复控制文件,并且MOUNT新实例

rman target /
list backup of controlfile;
##拷贝备份文件至新主机
scp /backup/backlv0_ORCL_20210617_107548592* 10.211.55.112:/tmp
scp /u01/app/oracle/product/11.2.0/db/dbs/0c01l775_1_1 10.211.55.112:/tmp
##新主机恢复控制文件并开启到mount状态
rman target /
restore controlfile from '/tmp/backlv0_ORCL_20210617_1075485924_9_1';
alter database mount;

通过 list backup of controlfile; 可以看到控制文件位置。

list controlfile

拷贝备份文件

恢复控制文件

新主机RESTORE TABLESPACE恢复至时间点 2021/06/17 18:06:00

##新主机注册备份集
rman target /
catalog start with '/tmp/backlv0_ORCL_20210617_107548592';
crosscheck backup;
delete noprompt expired backup;
delete noprompt obsolete device type disk;
##恢复表空间LUCIFER和系统表空间,指定时间点 `2021/06/17 18:06:00`
run {
sql 'alter session set nls_date_format="yyyy-mm-dd hh24:mi:ss"';
set until time '2021-06-17 18:06:00';
allocate channel ch01 device type disk;
allocate channel ch02 device type disk;
restore tablespace SYSTEM,SYSAUX,UNDOTBS1,USERS,LUCIFER;
release channel ch01;
release channel ch02;
}

restore恢复表空间

新主机 RECOVER DATABASE SKIP TABLESPACE 恢复至时间点 2021/06/17 18:06:00

rman target /
run {
sql 'alter session set nls_date_format="yyyy-mm-dd hh24:mi:ss"';
set until time '2021-06-17 18:06:00';
allocate channel ch01 device type disk;
recover database skip tablespace LTEST,EXAMPLE;
release channel ch01;
}

recover恢复

这里有一个小BUG:客户环境是Windows,执行这一步最后报错,手动offline数据文件依然无法开启数据库。

windows恢复报错

解决方案:

--将恢复跳过的表空间都offline drop掉,执行以下查询结果
select 'alter database datafile '|| file_id ||' offline drop;' from dba_data_files where tablespace_name in ('LTEST','EXAMPLE');
--再次开启数据库
alter database open read only;
注意:如果显示缺归档日志,可以参考如下步骤:
##查询恢复需要的归档日志号时间 
alter session set nls_date_format="yyyy-mm-dd hh24:mi:ss"
select first_time,sequence# from v$archived_log where sequence#='7';

##通过备份RESTORE吐出所需的归档日志 
rman target / 
catalog start with '/tmp/0c01l775_1_1'
crosscheck archivelog all; 
run { 
allocate channel ch01 device type disk; 
SET ARCHIVELOG DESTINATION TO '/archivelog';
restore ARCHIVELOG SEQUENCE 7; 
release channel ch01; 
}

##再次recover进行恢复至指定时间点 2021-06-17 18:06:00 
run { 
sql 'alter session set nls_date_format="yyyy-mm-dd hh24:mi:ss"'
set until time '2021-06-17 18:06:00'
allocate channel ch01 device type disk; 
recover database skip tablespace LTEST,EXAMPLE; 
release channel ch01; 

新主机实例开启到只读模式

sqlplus / as sysdba
alter database open read only;

开启到只读

确认新主机实例的表数据是否正确

select * from lucifer.lucifer;

校验恢复数据
注意:若不正确则重复 第7步 调整时间点慢慢往 2021/06/17 18:10:00 推进恢复:
##关闭数据库
sqlplus / as sysdba
shutdown immediate;

##开启数据库到mount状态
startup mount pfile='/tmp/pfile.ora';

##重复 第7步,往前推进1分钟,调整时间点为 `2021/06/08 18:07:00`
rman target /
run {
sql 'alter session set nls_date_format="yyyy-mm-dd hh24:mi:ss"';
set until time '2021-06-17 18:07:00';
allocate channel ch01 device type disk;
recover database skip tablespace LTEST,EXAMPLE;
release channel ch01;
}

主库创建连通新主机实例的DBLINK,通过DBLINK从新主机实例捞取表数据

sqlplus / as sysdba
CREATE PUBLIC DATABASE LINK ORCL112
CONNECT TO lucifer
IDENTIFIED BY lucifer
USING '(DESCRIPTION_LIST=
(DESCRIPTION=
(ADDRESS=(PROTOCOL=tcp)(HOST=10.211.55.112)(PORT=1521))
(CONNECT_DATA=
(SERVICE_NAME=orcl)
)
)
)'
;
--通过dblink捞取数据
create table lucifer.lucifer_0618 as select /*+full(lucifer)*/ * from lucifer.lucifer@ORCL112;
select * from lucifer.lucifer_0618;

创建DBLINK

通过dblink恢复数据

至此,整个 RMAN 恢复过程就结束了。

总之,有备份什么都好说。所以,作为 DBA,备份一定要做好!!!

推荐阅读

SQL:我能玩出这花样儿?

手把手教你在 Linux 7 环境下部署 Oracle RAC!

手把手教你 Oracle 数据库升级!

手把手教你在 Linux 环境下部署 Oracle 数据库!

杰哥的另一个公众号,主要分享关于个人成长经历的那点事,欢迎您的关注。

浏览 72
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报