查看原文
其他

Oracle 数据坏块的 N 种修复方式

Editor's Note

小伙伴们下午好,给大家推荐一篇朋友写的文章 Oracle 数据库坏块修复,可点击下方公众号关注,获取更多干货!

The following article is from Lucifer三思而后行 Author Lucifer、风清扬

如有帮助,记得点击下方 "JiekeXu DBA之路”设为星标⭐更多干货第一时间到达!


👆点击上方卡片关注

前言

Oracle 数据库的运行不可避免的会遇到各种各样的错误,就比如数据表出现坏块,此时,你这张表的数据就无法访问了,有什么好的办法可以恢复呢?

什么,你没有遇到过?😱


😏 那就祝你不久的将来遇到,哈哈开个玩笑~  玩归玩,闹归闹,经验必须要老到!👍🏻


一、介绍

今天就给大家讲讲怎么处理数据表的坏块情况!🎉

对于 Oracle 数据块物理损坏 的情形,通常可以分为两种情况:

  • 有备份,通过 RMAN 恢复
  • 无备份,通过 DBMS_REPAIR 修复

1、RMAN

有备份的情况下,这是很理想的情形,我们可以直接通过 RMAN 块介质恢复(BLOCK MEDIA RECOVERY)功能来完成受损块的恢复。

这里我是不建议恢复整个数据库或者数据库文件来修复这些少量受损的数据块,有点浪费时间。

可参考官方文档:Block Media Recovery with RMAN

2、DBMS_REPAIR

那如果没有任何备份怎么办? (PS:备份大于一切!)

我们可以使用 Oracle 自带的 DBMS_REPAIR 包来实现修复。

📢 注意: 使用 DBMS_REPAIR 包来修复,并非完全恢复,而是标记坏块,然后不对其进行访问,这部分被标记的数据也就丢失了,这是无法避免的。

可参考MOS文档:DBMS_REPAIR SCRIPT (Doc ID 556733.1)

二、实战环境准备

1、环境安装

可参考我的一键安装脚本:Oracle 数据库一键安装,从未如此简单

cd /Volumes/DBA/voracle/github/single_db
vagrant up
vagrant ssh

2、测试数据准备

创建表空间:

create tablespace eason datafile '/oradata/orcl/eason.dbf' size 1autoextend on;

创建用户:

create user eason identified by eason default tablespace eason;
grant dba to eason;

创建测试表:

create table hyj as select * from dba_objects;

创建表索引:

create index i_hyj on hyj(object_id);

3、查看表相关信息

查看表段上的相关信息:

select segment_name , header_file , header_block,blocks from dba_segments where segment_name ='HYJ'

查出包含行记录的数据块:

select distinct dbms_rowid.rowid_block_number(rowidfrom eason.hyj order by 1;

DBMS_ROWID.ROWID_BLOCK_NUMBER(ROWID)
------------------------------------
                                1411
                                1412
                                1413
        ...
        ...
        ... 
                                2665
                                2666
                                2667

1232 rows selected.
select * from dba_extents where segment_name='HYJ';

📢 注意: 这里看到 HEADER_BLOCKBLOCK_ID 不一致,其实一个 segment 的第一个区的第一个块是 FIRST LEVEL BITMAP BLOCK,第二个块是 SECOND LEVEL BITMAP BLOCK,这两个块是用来管理 free block 的,第三个块是 PAGETABLE SEGMENT HEADER,这个块才是 segment 里的 HEADER_BLOCK。

4、RMAN 备份

首先,我们先做一个全备份,用来演示 RMAN 修复坏块!

run {
allocate channel c1 device type disk;
allocate channel c2 device type disk;
crosscheck backup;
crosscheck archivelog all;
sql"alter system switch logfile";
delete noprompt expired backup;
delete noprompt obsolete device type disk;
backup database include current controlfile format '/backup/backlv_%d_%T_%t_%s_%p';
backup archivelog all DELETE INPUT;
release channel c1;
release channel c2;
}

5、模拟坏块

破坏 146816882468 数据块的内容:

dd if=/dev/zero of=/oradata/orcl/eason.dbf bs=8192 conv=notrunc seek=1468 count=1
dd if=/dev/zero of=/oradata/orcl/eason.dbf bs=8192 conv=notrunc seek=1688 count=1
dd if=/dev/zero of=/oradata/orcl/eason.dbf bs=8192 conv=notrunc seek=2468 count=1

清除 buffer cache 的内容:

alter system flush buffer_cache;

再次查询表 hyj,此时查询已经报错,发现有坏块:

select * from eason.hyj;

当然,也可以使用 bbed 进行坏块模拟!

6、坏块检查

下面再介绍几种发现坏块的方式:

1、使用 DBV 检查当前文件的坏块:

dbv file=/oradata/orcl/eason.dbf blocksize=8192;

使用 DBV检查,同样发现了坏块!

2、使用 rman 检查数据库坏块:

## 检查对应的数据文件
backup check logical validate datafile 5;
## 检查当前数据库
backup validate check logical database;

结合 V$DATABASE_BLOCK_CORRUPTION 视图查看,更加方便:

select * from V$DATABASE_BLOCK_CORRUPTION;

使用 RMAN 检查后,同样发现了坏块!

3、通过数据库的告警日志也可以发现报错:

4、通过报错信息快速查找对应的坏表,依次填写数据文件 ID 5 和 坏块 ID 1468

SELECT tablespace_name, segment_type, owner, segment_name
FROM dba_extents
        WHERE file_id = &fileid
and &blockid between block_id AND block_id + blocks - 1;

实验环境准备完毕,下面开始实战!

三、实战演示

今天,我打算使用上述介绍的 2 种方式来演示!

1、RMAN 修复

由于我们之前已经备份了,因此直接使用备份来恢复坏块:

blockrecover datafile 5 block 1468;
blockrecover datafile 5 block 1688,2468;

使用同样的方式,依次修复坏块 16882468,修复成功后,查询已恢复正常!

再次检查坏块情况:

backup validate check logical database;
select * from V$DATABASE_BLOCK_CORRUPTION;

坏块已经都被恢复,并且数据没有丢失!

2、DBMS_REPAIR 修复

首先,依然使用 dd 先模拟坏块:

dd if=/dev/zero of=/oradata/orcl/eason.dbf bs=8192 conv=notrunc seek=3333 count=1
dd if=/dev/zero of=/oradata/orcl/eason.dbf bs=8192 conv=notrunc seek=3368 count=1
dd if=/dev/zero of=/oradata/orcl/eason.dbf bs=8192 conv=notrunc seek=4000 count=1

在没有备份的前提下,我们就无法做到无损修复坏块了,需要损失对应坏块的数据。

1、创建 repair 表,用于记录需要被修复的表:

begin
dbms_repair.admin_tables (
     table_name => 'REPAIR_TABLE',
     table_type => dbms_repair.repair_table,
     action => dbms_repair.create_action,
     tablespace => 'USERS');
end;
/

2、创建 Orphan Key 表,用于记录在表块损坏后那些孤立索引,也就是指向坏块的那些索引 :

begin
dbms_repair.admin_tables (
     table_name => 'ORPHAN_KEY_TABLE',
     table_type => dbms_repair.orphan_table,
     action => dbms_repair.create_action,
     tablespace => 'USERS');
end;
/

3、检查坏块,检测对象上受损的情形,并返回受损块数为 3

declare
  num_corrupt int;
begin
  num_corrupt := 0;
DBMS_REPAIR.CHECK_OBJECT (
  schema_name =>'EASON',
  object_name =>'HYJ',
  repair_table_name =>'REPAIR_TABLE',
  corrupt_count =>num_corrupt);
  dbms_output.put_line('number corrupt:' || to_char(num_corrupt));
end;
/

4、查看受损的块信息:

select object_name, block_id, corrupt_type, marked_corrupt, repair_description from repair_table;

📢 注意: 这里 marked_corrupt 被标记为 TRUE,应该是系统在执行  CHECK_OBJECT 过程中自动完成了FIX_CORRUPT_BLOCKS。如果被标记为 FALSE,需要再运行 FIX_CORRUPT_BLOCKS 来完成坏块的标记工作。

5、修复被损坏的数据块,这些被损坏的数据块是在执行了 check_object 之后生成的:

declare
  cc number;
begin
  dbms_repair.fix_corrupt_blocks(schema_name => 'EASON',
  object_name => 'HYJ',
  fix_count => cc);
  dbms_output.put_line('Number of blocks fixed: ' || to_char(cc));
end;
/

标记了 0 个坏块,说明 CHECK_OBJECT 完成了标记工作。

6、使用 DUMP_ORPHAN_KEYS 过程将那些指向坏块的索引键值填充到 ORPHAN_KEY_TABLE:

declare
   cc number;
begin
  dbms_repair.dump_orphan_keys
  (
     schema_name => 'EASON',
     object_name => 'I_HYJ'
     object_type => dbms_repair.index_object,
     repair_table_name => 'REPAIR_TABLE',
     orphan_table_name=> 'ORPHAN_KEY_TABLE',
     key_count => cc
  );
  dbms_output.put_line('Number of orphan keys: ' || to_char(cc));
end;
/

表明 202 条记录被损坏丢失!

📢 注意: 此处一定要注意 object_name 是索引名,而不是 table_name,这里 dump 的是损坏的索引信息.如果表有多个索引,需要为每个索引执行 DUMP_ORPHAN_KEYS 操作。

7、验证对象是否可以查询,下面的结果显示依旧无法查询:

select count(*) from eason.hyj;

8、跳过坏块:

BEGIN
  DBMS_REPAIR.SKIP_CORRUPT_BLOCKS (
     SCHEMA_NAME => 'EASON',
     OBJECT_NAME => 'HYJ',
     OBJECT_TYPE => dbms_repair.table_object,
     FLAGS => dbms_repair.skip_flag);
END;
/

📢 注意: 丢失 202 条记录,丢失记录的 rowid 可以在 ORPHAN_KEY_TABLE 表中找到。

9、重建索引:

alter index eason.I_HYJ rebuild;

10、验证结果

至此,表中数据可以顺利被访问!

由于坏块并没有消失,而是被标记跳过,因此还是可以查看坏块:

select * from V$DATABASE_BLOCK_CORRUPTION;

用这种方法可以找回部分数据,也可以找回建了索引的值,但是使用dbv再检查表空间的数据文件时,仍然会显示有损坏的数据块。

这时需要把表的数据全部导出,再重建表或者表空间,然后再把找回的数据导入数据库,推荐用 expdp/impdp 命令做,可以彻底消除 dbv 检查到的坏块。

写在最后

备份大于一切,也是最后的防线,千万不要裸奔,所以请大家一定要做好备份!数据安全,不可小视,定期验证数据有效性更有必要!!!


扫一扫进入群聊

作者简介:CSDN全站前100,HDZ核心组成员,华为云享专家全栈领域博主CSDN原力计划作者掘金优秀作者资讯创作者公众号【Lucifer三思而后行】,全网粉丝6万+。我是一枚喜欢学习,专研,输出的数据库DBA,专注于各种数据库、Linux等后端技术,分享各种干货实战文!灵感来源于生活,故而热爱生活~  


——————————————————————--—--————

公众号:JiekeXu DBA之路
墨天轮:https://www.modb.pro/u/4347
CSDN :https://blog.csdn.net/JiekeXu
腾讯云:https://cloud.tencent.com/developer/user/5645107

————————————————————————----———




VMWARE16 Oracle Linux7.9 安装 Oracle19c RAC 详细配置方案

使用 VMware 16 RHEL7.7 虚拟机静默安装 Oracle 19c RAC

爆肝一万字终于把 Oracle Data Guard 核心参数搞明白了

Oracle 12c 及以上版本补丁更新说明及下载方法(收藏版)

Oracle 19c 19.10DBRU 最新补丁升级看这一篇就够了

Redhat 7.7 安装最新版 MongoDB 5.0.1 手册

ASM 管理的内部工具:KFED、KFOD、AMDU

性能优化|关于数据库历史性能问题的一道面试题

一线运维 DBA 五年经验常用 SQL 大全(二)

ORA-00349|激活 ADG 备库时遇到的问题

OGG-01004|OGG 初始化数据问题处理

Oracle 轻量级实时监控工具 oratop

Linux 7.7 源码安装 MySQL 8.0.26

MySQL OCP 认证考试你知道吗?

Oracle 19C RAC 安装遇到的坑

国产数据库|TiDB 5.0 快速体验

Oracle 19C MAA 搭建指南

Oracle 参数文件三两事儿

Oracle 每日一题系列合集

百花齐放的国产数据库


继续滑动看下一个

Oracle 数据坏块的 N 种修复方式

向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存