使用pymysql循环删除重复数据，并修改自增字段偏移值

Z时代
2024-01-10
分类：综合

database

创建表：

　　CREATE TABLE `info` (
　　`id` tinyint NOT NULL AUTO_INCREMENT,
　　`name` varchar(20) NOT NULL,
　　PRIMARY KEY (`id`)
　　) ENGINE=InnoDB AUTO_INCREMENT=0 DEFAULT CHARSET=utf8

插入数据：INSERT INTO info(`name`) VALUE("张三"),("李四"),("麻婆"),("王五");

再插入一次：INSERT INTO info(`name`) VALUE("张三"),("李四"),("麻婆"),("王五");

看见好多重复数据了吧，干掉它！

delete from info where info.id in 
             (select tmp.id from 
               (select max(id) id from info group by `name` having count(`name`)>1 ) tmp
             )
但这个办法，一次只能干掉重复数据的最大id，没关系，用循环嘛。
多来几次，世界清爽了：

　　id name
　　1 张三
　　2 李四
　　3 麻婆
　　4 王五

再插入一次：INSERT INTO info(`name`) VALUE("麻老五");

　　id name
　　1 张三
　　2 李四
　　3 麻婆
　　4 王五
　　13 麻老五

但且慢，麻老五的id值变成了13，应该是5才对啊。看看创建表的过程，原来是设置了自增字段，delete 清除了数据，但没有清除自增字段值。

解决它：

先删除掉刚刚插人的这行，

查查现在有多少行：

select count(id) from info

重置自增字段偏移值为行数：

alter table info AUTO_INCREMENT = 4

现在再插入：INSERT INTO info(`name`) VALUE("麻老五");

　　id name
　　1 张三
　　2 李四
　　3 麻婆
　　4 王五
　　5 麻老五

用pymysql实现上述过程，完整代码如下：　

import pymysql

conn = pymysql.connect(host="xx.xxx.xxx.x", port=3306, user="root", passwd="root123", charset="utf8", db="luffydb")
cursor = conn.cursor()

# 功能：循环删除重复数据，并修改自增字段偏移值为count(id)。

sql = "select max(id) from info group by `name` having count(`name`)>1"
cursor.execute(sql)
ret = cursor.fetchall()  # 查询重复数据，但只取到重复数据的最大id，所以要用while循环，直到这个值为空。
while ret:
    # 先删除查出的id
    cursor.execute(delete from info where info.id in 
                       (select tmp.id from 
                   (select max(id) id from info group by `name` having count(`name`)>1 ) tmp
                       ) 
　　　　　　　　　　　)
    conn.commit()

    # 执行删除后再查询，重新获得ret值，供while判断。
    cursor.execute(sql)
    ret = cursor.fetchall()

# 重置自增字段偏移值
cursor.execute("select count(id) from info")
ret = cursor.fetchone()  # 查到现在的行数
sql = "alter table info AUTO_INCREMENT = %s"
cursor.execute(sql, [ret[0]])  # 重置自增字段偏移值为行数。

注意：mysql不支持，在一条语句对同一个表，先查询再更新的操作。所以要在"tmp"表外面再套一个表。否则报1093错误。

以上是使用pymysql循环删除重复数据，并修改自增字段偏移值的全部内容，来源链接： utcz.com/z/535781.html

使用pymysql循环删除重复数据，并修改自增字段偏移值

其他人也看了：