mysql随机产生1到100_MySQL随机生成百万级数据

MySQL随机生成百万级数据

参考

最近再一个博客看到了一篇文章，主要是讲述如何使用MySQL存储过程和函数创建百万级别测试数据，作者原文标题是千万级测试数据，但是我亲自测试过，超过10级别插入速度已经很慢了，而且还不能一次过创建不然会卡死。

测试环境

%E7%94%B5%E8%84%91%E9%85%8D%E7%BD%AE.png

CPU i5@2.30GHz

内存 15GB

MySQL版本—8.0.17

MySQLWORKBENCH

1.创建数据表

创建两张表，一张为内存表，一张为正式表,内存表主要放存储过程生成的随机数据，正式表再用查询插入从内存表中获取数据。

CREATE TABLE `vote_record` (

`id` int(11) NOT NULL AUTO_INCREMENT,

`user_id` varchar(20) NOT NULL,

`vote_id` int(11) NOT NULL,

`group_id` int(11) NOT NULL,

`create_time` datetime NOT NULL,

PRIMARY KEY (`id`),

KEY `index_user_id` (`user_id`)

) ENGINE = InnoDB DEFAULT CHARSET = utf8mb4;

1.1创建内存表

CREATE TABLE `vote_record_memory` (

`id` int(11) NOT NULL AUTO_INCREMENT,

`user_id` varchar(20) NOT NULL,

`vote_id` int(11) NOT NULL,

`group_id` int(11) NOT NULL,

`create_time` datetime NOT NULL,

PRIMARY KEY (`id`),

KEY `index_user_id` (`user_id`)

) ENGINE = InnoDB DEFAULT CHARSET = utf8mb4;

2.使用存储过程

随机生成字符串，传入参数是字符串长度

CREATE DEFINER=`root`@`%` FUNCTION `rand_string`(n INT) RETURNS varchar(255) CHARSET utf8mb4

DETERMINISTIC

BEGIN

DECLARE chars_str varchar(100) DEFAULT 'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789';

DECLARE return_str varchar(255) DEFAULT '' ;

DECLARE i INT DEFAULT 0;

WHILE i < n DO

SET return_str = concat(return_str, substring(chars_str, FLOOR(1 + RAND() * 62), 1));

SET i = i + 1;

END WHILE;

RETURN return_str;

END

2.1创建存储过程

传入参数是创建的数据量

CREATE DEFINER=`root`@`%` PROCEDURE `add_vote_memory`(IN n int)

BEGIN

DECLARE i INT DEFAULT 1;

WHILE (i <= n) DO

INSERT INTO vote_record_memory (user_id, vote_id, group_id, create_time) VALUES (rand_string(20), FLOOR(RAND() * 1000), FLOOR(RAND() * 100), NOW());

SET i = i + 1;

END WHILE;

END

MySQL的存储过程要注意两个点：

1、在执行上面的语句之前要先执行DELIMITER $$,这条命令的作用是可以将分号;暂时注销原先功能，要不然存储过程中间的分号就会报错。

2、存储过程的名称所用的不是单引号而是左边键盘数字1左边的反引号。

单引号 '

反引号 `

双引号 "

2.2调用存储过程

CALL add_vote_memory(1000000)

这里第一次使用MySQL WORKBENCH执行的时候大概在30秒左右报错,这是 WORKBENCH的一个设置，大概就是最长的连接时间，修改方式

edit>>Preferences>>SQL Editor>>DBMS connection read timeout interval(in seconds):

大概执行时间30W数据要15分钟以上，至于100W数据就已经没耐心等下去了。

这里还有一个容易报错的地方就是单表的最大容量，mysql默认每张表占据的存储空间有一个最大值，可以修改这个最大值,具体细节可以查看配置文件.

调用存储过程，并且参数为10W的结果:

%E5%8D%81%E4%B8%87%E6%95%B0%E6%8D%AE%E6%8F%92%E5%85%A5.png

cmd%E4%B8%AD%E6%B5%8B%E8%AF%95%E6%8F%92%E5%85%A510W%E6%95%B0%E6%8D%AE.png

100W就是这个时间乘以10倍，大概40分钟左右

总结:

看别人的文章学习技巧的时候还是要自己动手操作一遍才能知道有哪些坑，因为每个人的知识边界都不一样，有些你认为是常识的东西说不定别人就不知道，反之亦然，所以学习编程重点就是多写代码多做测试。

原文链接：https://blog.csdn.net/weixin_42526249/article/details/113223830