從mysql搬一個(gè)大表到redis中,你會(huì)發(fā)現(xiàn)在提取、轉(zhuǎn)換或是載入一行數(shù)據(jù)時(shí),速度慢的讓你難以忍受。這里我就要告訴一個(gè)讓你解脫的小技巧。使用“管道輸出”的方式把mysql命令行產(chǎn)生的內(nèi)容直接傳遞給redis-cli,以繞過“中間件”的方式使兩者在進(jìn)行數(shù)據(jù)操作時(shí)達(dá)到最佳速度。
一個(gè)約八百萬行數(shù)據(jù)的mysql表,原本導(dǎo)入到redis中需要90分鐘,使用這個(gè)方法后,只需要兩分鐘。不管你信不信,反正我是信了。
Mysql到Redis的數(shù)據(jù)協(xié)議
redis-cli命令行工具有一個(gè)批量插入模式,是專門為批量執(zhí)行命令設(shè)計(jì)的。這第一步就是把Mysql查詢的內(nèi)容格式化成redis-cli可用的數(shù)據(jù)格式。here we go!
我的統(tǒng)計(jì)表:
CREATE TABLE events_all_time (
id int(11) unsigned NOT NULL AUTO_INCREMENT,
action varchar(255) NOT NULL,
count int(11) NOT NULL DEFAULT 0,
PRIMARY KEY (id),
UNIQUE KEY uniq_action (action)
);
準(zhǔn)備在每行數(shù)據(jù)中執(zhí)行的redis命令如下:
HSET events_all_time [action] [count]
按照以上redis命令規(guī)則,創(chuàng)建一個(gè)events_to_redis.sql文件,內(nèi)容是用來生成redis數(shù)據(jù)協(xié)議格式的SQL:
-- events_to_redis.sql
SELECT CONCAT(
"*4
",
'$', LENGTH(redis_cmd), '
',
redis_cmd, '
',
'$', LENGTH(redis_key), '
',
redis_key, '
',
'$', LENGTH(hkey), '
',
hkey, '
',
'$', LENGTH(hval), '
',
hval, '
'
)
FROM (
SELECT
'HSET' as redis_cmd,
'events_all_time' AS redis_key,
action AS hkey,
count AS hval
FROM events_all_time
) AS t
ok, 用下面的命令執(zhí)行:
mysql stats_db --skip-column-names --raw < events_to_redis.sql | redis-cli --pipe
很重要的mysql參數(shù)說明:
--raw: 使mysql不轉(zhuǎn)換字段值中的換行符。
--skip-column-names: 使mysql輸出的每行中不包含列名。
英文原文:http://dcw.ca/blog/2013/01/02/mysql-to-redis-in-one-step/