MySQL如何创建自定义储存引擎 - Custom Storage Engine
前言
MySQL 是支持动态可插拔的储存引擎体系架构,从而可以创建新的储存引擎并直接将其添加到正在运行的 MySQL 中,而无需重新编译 MySQL。
这种架构使得为 MySQL 开发新的储存引擎和部署变得更加容易。
本系列文章主要是想谈谈自定义储存引擎的一些创建指南,部分是官网的翻译,部分是自己的理解。
概述
储存引擎在 MySQL 中的作用主要是进行 data 和 index 数据的存储和管理。
MySQL 服务器通过一系列的 API 来与储存引擎交互。
每一个储存引擎都有一个类定义,并且都继承于一个特殊的接口类 handler,这个类通常都会被命名为 ha_xxx (比如说 innodb 命名为 ha_innobase,ndb 命名为 ha_ndbcluster)。
handler 类上定义了一系列表 table 的接口:
create创建表;
open打开表;
delete_table删除表;
write_row插入记录;
delete_row删除记录;
update_row更新记录
……
等等
实现自定义的储存引擎,需要一一实现这些接口,这些接口就是 SQL 层与储存引擎交互的 API。
在实现这些接口之前,需要搞明白 handler 的一些特性。
handler是表级别的
handler是句柄的概念,而且是表的句柄,所有的接口方法都是针对于表的:handler句柄与连接会话的关系
MySQL 是单进程多线程的 CS 模型,每条 SQL 可能涉及到一张表或多张表,但每涉及到一张表时,必然是通过先获取到该表的一个handler句柄,然后通过句柄对该表进行DDL和CRUD等操作的。
所以 handler 是基于表和连接会话的,每一个连接的每一个表都有一个独立的句柄,保证互相独立。
举例:
如果有 3 个连接同时访问同一张表, 那么需要初始化创建3个该表的handler句柄。
同理,一个连接的一条 SQL 涉及到 2 张表,那么也需要分别获取这 2 张表的各 1 个句柄。
Tips:
本处句柄概念同文件系统的文件句柄,在一个文件系统中,不同应用同时打开同一个文件,其实每一个应用都会创建获取到该文件的一个句柄,如果同一个应用需要打开多个文件,那么需要获取每一个文件的句柄。
文件系统已经定义了文件的API接口,通过句柄调用不同的方法对文件进行操作。
实现自定义的储存引擎,即是通过继承 handler 类,通常命名为 ha_xxx ,实现其对应与表的接口即是。
handler 和 handlerton
handler 是每个存储引擎定义表相关行为操作的接口类,是表级别的行为接口。
handlerton ( handler singleton 的缩写),则是定义了一个存储引擎插件属性和行为的类,可视为引擎级别。
通常一个储存引擎只会实例出一个 handlerton 实例,目的是提供存储引擎的一些 global 级别的特性行为。
例如:
涉及到存储引擎上的事务操作,commit 和 rollback 方法等。
而 handler 类(通常由自定义的 ha_xxx 继承),是 table 级别的方法,涉及的是的 per-table 的一些操作。
两者的区别可以这么理解:
对于数据库而言,事务是一个单位操作,即每一个操作或一系列操作都是以事务为一个单位的。而特定的存储引擎,其事务的提交、回滚行为是统一的,即
global级别的,与表无关,由handlerton负责。具体到事务操作中的每一条
SQL时,其可能是简单的单表操作,也有可能是多表操作(multi_update/multi_delete/union/join等)。操作时,每一个表都有其属性或特定记录的CRUD操作,所以每个表都应该有自己的句柄,这是由handler类(通常由ha_xxx继承并实现)负责的,所以handler是表级别的,并且不同连接应该是有独立的handler,即使是操作同一张表。
简而言之,存储引擎级别的,放在 handlerton 类上,表级别的,放在 handler 上。
下面分别来看看各自的定义
- handlerton
struct handlerton
+---------------------------------------------------------------+
| state : SHOW_COMP_OPTION |
| db_type : enum legacy_db_type |
| slot : uint |
| savepoint_offset : uint |
| flags : uint32 |
| license : uint32 |
| data : void * |
| (*close_connection)() : int |
| (*kill_connection)() : void |
| (*savepoint_set)() : int |
| (*savepoint_rollback)() : int |
| (*savepoint_rollback_can_release_mdl)() : bool |
| (*savepoint_release)() : int |
| (*commit)() : int |
| (*rollback)() : int |
| (*prepare)() : int |
| (*recover)() : int |
| (*commit_by_xid)() : int |
| (*rollback_by_xid)() : int |
| *(*create)() : handler |
| (*drop_database)() : void |
| (*panic)() : int |
| (*start_consistent_snapshot)() : int |
| (*flush_logs)() : bool |
| (*show_status)() : bool |
| (*partition_flags)() : uint |
| (*get_tablespace)() : int |
| (*alter_tablespace)() : int |
| (*fill_is_table)() : int |
| (*binlog_func)() : int |
| (*binlog_log_query)() : void |
| (*release_temporary_latches)() : int |
| (*discover)() : int |
| (*find_files)() : int |
| (*table_exists_in_engine)() : int |
| (*make_pushed_join)() : int |
| (*system_database)() : const char* |
| (*is_supported_system_table)() : bool |
| (*get_cost_constants)() : SE_cost_constants * |
| (*replace_native_transaction_in_thd)() : void |
| (*notify_exclusive_mdl)() : bool |
| (*notify_alter_table)() : bool |
| (*rotate_encryption_master_key)() : bool |
----------------------------------------------------------------+
对于 handlerton 来说,总体上大概有40多个成员,但只要几个是必需的,db_type、comment、state、create()等。
+
下面是handlerton 和 handler 的关系,MySQL 在初始化的时候,为每一个储存引擎实例化出了各自的一个handlerton类(实例化大致流程可以参考MySQL插件(二)源码分析-InnoDB储存引擎插件定义和初始化过程),
handler有一个handlerton的指针,
handlerton
+-----Fake_handlerton
+-----hton_list_st
+-----st_alter_tablespace
+-----st_ha_create_information
+-----handler
| +-----ha_archive //archive引擎
| +-----ha_blackhole
| +-----ha_example //示范例子
| +-----ha_federated //federated存储引擎
| +-----ha_heap //MEMORY存储引擎
| +-----ha_innobase //innodb引擎,默认储存引擎,支持事务
| +-----ha_myisam //myisam引擎,不支持事务;
| +-----ha_myisammrg
| +-----ha_ndbcluster //分布式存储引擎
| +-----ha_ndbinfo
| +-----ha_partition
| +-----ha_perfschema
| +-----ha_tina
| +-----QUICK_RANGE_SELECT
| +-----Partition_helper
| +-----TABLE
+-----partition_element
+-----partition_info
+-----YYSTYPE
+-----TABLE_SHARE
+-----Ha_trx_info
对 MySQL 自定义引擎工作感兴趣的
v 信:yutellite