见鬼了,明明删除了数据,空间却没减少??

苦逼的码农

共 2378字,需浏览 5分钟

 ·

2020-10-16 12:42




迁移数据常用



1、导出文件 - mysqldump 命令


mysqldump 是 Mysql 自带的逻辑备份工具。其备份原理是通过协议连接到 Mysql 数据库,将需要备份的数据查询出来转换成对应的 insert 语句。当需要还原这些数据时,只要执行这些 insert 语句,即可将对应的数据还原。



常用命令:


  • 导出所有数据库

mysqldump -uroot -p123456 --all-databases  >/tmp/all.sql
  • 导出指定数据库

mysqldump -uroot -p123456 --databases  db  >/tmp/db.sql
  • 导出指定表

mysqldump -uroot -p123456 --databases  db  --tables a >/tmp/a.sql
  • 根据条件导出数据

mysqldump -uroot -p123456 --databases db --tables a --where='id=1' >/tmp/a.sql
  • 只导出表结构

mysqldump -uroot -p123456 --no-data --databases db  >/tmp/db.sql


2、导入文件 - source 命令


source 命令可以将导出的 sql 文件导入进指定数据库。


操作步骤:

  • use 数据库;

  • soucre 已导出的 sql 文件。




迁移思路


1. 数据库A历史数据迁移到 hdfs(一种分布式文件系统)上进行归档;


2. 删除数据库A已归档的表,使用 drop 命令;


3. 数据库A上新建表,用于数据库B迁移;


4. 数据库B中除未完成单外都迁移至数据库A;


5. 脚本进行删除数据库B上已迁移数据。




阿丁开讲


1、参数介绍


在 Innodb 存储引擎中,innodb_file_per_table 参数是用来控制表数据的存储方式的。


当参数为 OFF 的时候,所有数据都存放于默认路径下名为 ibdata* 的共享表空间里,即将数据库所有的表数据及索引文件存放到一个文件中。在删除数据表的时候,ibdata* 文件不会自动收缩。


当参数为 ON 的时候,每一个表都将存储在一个以 .ibd 为后缀的文件中。这样每个表都有了自己独立的表空间,通过 drop table 命令就可以将表空间进行回收。


从 Mysql 5.6.6 版本开始,innodb_file_per_table 默认为 ON 状态


2、参数设置


通过 show variables like '%per_table%' 命令,可以查看 innodb_file_per_table 参数的当前状态:



如果想修改参数的状态,可通过 SET GLOBAL 动态地修改为 ON 或 OFF,也可以在 my.cnf 中做永久性修改。需要注意的是,在 my.cnf 中修改后生效的话需要重启 mysqld 服务。


疑问:如果之前参数为 OFF 状态,设置为 ON 状态后,表空间如何分配?


答案是仅对后续操作生效。


什么意思呢?修改前的数据还维持原状,也就是说之前的数据继续存放于 ibdata* 文件中,修改后的使用独立表空间。


所以建议在开始就将该参数设置为 ON 状态。


第二天




阿丁二次开讲


在这之前要先介绍下 Innodb 存储数据所用的 B+ 树结构,画个图你理解下:

在图中,P 代表一页数据,R 代表一行数据。


假设我们要删掉 R2 这条记录,InnoDB 引擎只会将其标记为删除状态,并不会真正把这行数据所占的空间释放掉,也就是说这个坑位还留着。如果后续所插入的数据在 R1 与 R3 之间的话,这个空间是可以被使用上的。


假设我们恰好删除了 R1、R2、R3 这三条记录,也就是说 P1 这一页的数据都被删掉了,那么 P1 所在的空间都会被标记为可复用。如果插入的数据需要使用新页的话,P1 的坑位就可以被利用起来了。


那么你可能会问了,我插入的数据恰好巧妙的避开了这些位置呢。那我还能说啥,骚呗。这样会造成很多空间被浪费,如果删除大量的数据的话,被浪费的空间也会是巨大的。


optimize table 的本质是 ALTER TABLE xxx ENGINE = InnoDB;


在5.5版本之前,重建表的过程是这样的:



然后用临时文件替换旧表,这样便实现了表的重建。


注意


1、控制迁移速度,防止主从延迟导致线上故障;


2、创建大表时,使用下面的建表语句可节省 50% 左右的空间:

ROW_FORMAT=COMPRESSED KEY_BLOCK_SIZE=8


3、使用 optimize table 压缩表时,需要留够一定的空间。


读者福利
《程序员内功修炼》第二版强势来袭,汇总了高质量的算法、计算机基础文章并且每一篇文章,要嘛是漫画讲解,要嘛是对话讲解,一步步引导,要嘛是图形并茂,如果你想学习算法,学习计算机基础,那么我决定这份 PDF,一定会让你有所帮助。当然,如果一是一位有那么点迷茫的在校生,相信我的个人经历,可以给你打一份鸡血,让你更好着去寻找自己的目标。

文章整体目录

如何获取

很简单,在我的微信公众号 帅地玩编程 回复 程序员内功修炼 即可获取《程序员内功修炼》第一版和第二版的 PDF。

推荐,推荐一个 GitHub,这个 GitHub 整理了几百本常用技术PDF,绝大部分核心的技术书籍都可以在这里找到,GitHub地址:https://github.com/iamshuaidi/CS-Book(电脑打开体验更好),地址阅读原文直达

浏览 44
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报