172021.09

技术干货 | git上2500星的闪回小工具是什么神仙工具?一起来测测~

2021.09.17

生产上发生误删数据或者误更新数据的事故时,传统恢复方法是利用备份重搭实例,利用binlog来恢复数据,有时候需要找回的数据条数非常少,却要恢复几十甚至上百G的备份,费时费力。


那有没有像Oracle一样用闪回的方式来方便地恢复数据呢?答案是有的。MySQL有binlog,binlog以event的形式,记录了MySQL server从启用binlog以来所有的变化。


关于binlog不做过多赘述,我们可以利用binlog记录的信息,在不做备份恢复的情况下来迅速找回误操作的数据。


MySQL不像Oracle直接一个命令就搞定了,MySQL需要借助工具来完成,今天我们来测试下git上2500星的闪回小工具。


框架目录:

> 1、实验环境 

> 2、软件下载 

> 3、开始测试 

> 4、附参数说明


01 实验环境

> 操作系统:centos 7 

> 数据库版本:MySQL 5.7.34 

> 软件:binlog2sql


02 软件下载

https://github.com/danfengcao/binlog2sql 


解压安装:

unzip binlog2sql-master.zip 

cd binlog2sql-master

pip install -r requirements.txt


MySQL server必须设置以下参数:

server_id = 1

log_bin = /var/log/mysql/mysql-bin.log

max_binlog_size = 1G

binlog_format = row

binlog_row_image = full


user需要的最小权限集合:

select

super/replication client

replication slave


建议授权:

GRANT SELECT, REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO


03 开始测试


权限说明:

 - select:需要读取server端information_schema.COLUMNS表,获取表结构的元信息,拼接成可视化的sql语句

 - super/replication client:两个权限都可以,需要执行'SHOW MASTER STATUS',获取server端的binlog列表 

 - replication slave:通过BINLOG_DUMP协议获取binlog内容的权限


创建用户,造实验数据:

使用sysbench生成测试表,此步骤略


授权用户:

GRANT SELECT, REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO test_flash@'%' identified by 'test_flash';


修改数据:


INSERT INTO test_flash.test_flash_tab (`id`, `k`, `c`,`pad`,`test_col1`) VALUES (10001,'5014614','68487932199-96439406143-93774651418-41631865787-96406072701-20604855487-25459966574-28203206787-41238978918-19503783441','22195207048-70116052123-74140395089-76317954521-98694025897','');
update  test_flash.test_flash_tab set pad='22195207048-70116052123-74140395089-76317954521-98694025897' where  id=10000;
delete from  test_flash.test_flash_tab where  id=9998;


找回数据:

将 binlog2sql-master/binlog2sql 下的内容拷贝到binlog所在的目录

python binlog2sql.py --flashback -h192.168.176.130 -P5506 -utest_flash -p'test_flash' -dtest_flash -t test_flash_tab --start-file='mysql-bin.000001'


输出结果:确认无误后可直接入库

INSERT INTO `test_flash`.`test_flash_tab`(`c`, `k`, `pad`, `id`, `test_col1`) VALUES ('26540399442-75345224560-23949007931-31007424094-85536370579-90557582232-52492275484-59891643786-99516288129-15346323350', 4994166, '09437973687-45231478323-39177308217-32926675721-14740893381', 9998, NULL); #start 1290 end 1731 time 2021-08-17 19:44:10
UPDATE `test_flash`.`test_flash_tab` SET `c`='34838736059-24362714610-75033330387-17863378665-80928638402-33892306210-78377564998-17324442332-39178876426-77334528413', `k`=4533452, `pad`='11946195857-63616115598-80208325001-42313633529-35180183845', `id`=10000, `test_col1`=NULL WHERE `c`='34838736059-24362714610-75033330387-17863378665-80928638402-33892306210-78377564998-17324442332-39178876426-77334528413' AND `k`=4533452 AND `pad`='22195207048-70116052123-74140395089-76317954521-98694025897' AND `id`=10000 AND `test_col1` IS NULL LIMIT 1; #start 627 end 1259 time 2021-08-17 19:43:59
DELETE FROM `test_flash`.`test_flash_tab` WHERE `c`='68487932199-96439406143-93774651418-41631865787-96406072701-20604855487-25459966574-28203206787-41238978918-19503783441' AND `k`=5014614 AND `pad`='22195207048-70116052123-74140395089-76317954521-98694025897' AND `id`=10001 AND `test_col1`='' LIMIT 1; #start 4 end 596 time 2021-08-17 19:43:47


04 附参数说明


选项,mysql连接配置

> -h host; -P port; -u user; -p password


解析模式:

  • --stop-never持续解析binlog。可选。默认False,同步至执行命令时最新的binlog位置。

  • -K, --no-primary-key 对INSERT语句去除主键。可选。默认False 。

  • - -B, --flashback生成回滚SQL,可解析大文件,不受内存限制。可选。默认False。与stop-never或no-primary-key不能同时添加。

  •  - --back-interval -B模式下,每打印一千行回滚SQL,加一句SLEEP多少秒,如不想加SLEEP,请设为0。可选。默认1.0。


解析范围控制:

  • --start-file起始解析文件,只需文件名,无需全路径,必须。

  • --start-position/--start-pos起始解析位置。可选。默认为start-file的起始位置。

  • --stop-file/--end-file终止解析文件。可选。默认为start-file同一个文件。若解析模式为stop-never,此选项失效。

  • --stop-position/--end-pos终止解析位置。可选。默认为stop-file的最末位置;若解析模式为stop-never,此选项失效。

  • --start-datetime 起始解析时间,格式'%Y-%m-%d %H:%M:%S'。可选。默认不过滤。

  • --stop-datetime终止解析时间,格式'%Y-%m-%d %H:%M:%S'。可选。默认不过滤。


对象过滤:

  • - -d, --databases 只解析目标db的sql,多个库用空格隔开,如-d db1 db2。可选。默认为空。

  • - -t, --tables只解析目标table的sql,多张表用空格隔开,如-t tbl1 tbl2。可选。默认为空。

  • - --only-dml只解析dml,忽略ddl。可选。默认False。

  • - --sql-type只解析指定类型,支持INSERT, UPDATE, DELETE。多个类型用空格隔开,如--sql-type INSERT DELETE。可选。默认为增删改都解析。用了此参数但没填任何类型,则三者都不解析。


Enjoy GreatSQL