MySQL
数据库区别于其他数据库的很重要的一个特点就是其插件式的表存储引擎,其基于表,而不是数据库。由于每个存储引擎都有其特点,因此我们可以针对每一张表来挑选最合适的存储引擎。
作为DBA
,我们应该深刻的认识存储引擎。今天介绍两种最常见的存储引擎和它们的区别:InnoDB
和MyISAM
。
InnoDB
存储引擎
InnoDB
存储引擎支持事务,其设计目标主要就是面向OLTP(On Line Transaction Processing 在线事务处理)
的应用。特点为行锁设计、支持外键,并支持非锁定读。从5.5.8
版本开始,InnoDB
成为了MySQL
的默认存储引擎。
InnoDB
存储引擎采用聚集索引(clustered)的方式来存储数据,因此每个表都是按照主键的顺序进行存放,如果没有指定主键,InnoDB
会为每行自动生成一个6
字节的ROWID
作为主键。
MyISAM
存储引擎
MyISAM
存储引擎不支持事务、表锁设计,支持全文索引,主要面向OLAP(On Line Analytical Processing 联机分析处理)
应用,适用于数据仓库等查询频繁的场景。在5.5.8
版本之前,MyISAM
是MySQL
的默认存储引擎。该引擎代表着对海量数据进行查询和分析的需求。它强调性能,因此在查询的执行速度比InnoDB
更快。
InnoDB
和MyISAM
的区别
事务
为了数据库操作的原子性,我们需要事务。保证一组操作要么都成功,要么都失败,比如转账的功能。我们通常将多条SQL
语句放在begin
和commit
之间,组成一个事务。
InnoDB
支持,MyISAM
不支持。
主键
由于InnoDB
的聚集索引,其如果没有指定主键,就会自动生成主键。MyISAM
支持没有主键的表存在。
外键
为了解决复杂逻辑的依赖,我们需要外键。比如高考成绩的录入,必须归属于某位同学,我们就需要高考成绩数据库里有准考证号的外键。
InnoDB
支持,MyISAM
不支持。
索引
为了优化查询的速度,进行排序和匹配查找,我们需要索引。比如所有人的姓名从a-z
首字母进行顺序存储,当我们查找zhangsan
或者第44
位的时候就可以很快的定位到我们想要的位置进行查找。
InnoDB
是聚集索引,数据和主键的聚集索引绑定在一起,通过主键索引效率很高。如果通过其他列的辅助索引来进行查找,需要先查找到聚集索引,再查询到所有数据,需要两次查询。
MyISAM
是非聚集索引,数据文件是分离的,索引保存的是数据的指针。
从InnoDB 1.2.x
版本,MySQL5.6
版本后,两者都支持全文索引。
auto_increment
自增
对于自增数的字段,InnoDB
要求该列必须是索引,同时必须是索引的第一个列,否则会报错:
mysql> create table test( -> a int auto_increment, -> b int, -> key(b,a) -> ) engine=InnoDB; ERROR 1075 (42000): Incorrect table definition; there can be only one auto column and it must be defined as a key
把(b,a)
顺序替换为(a,b)
即可。
而MyISAM
可以将该字段与其他字段随意顺序组成成联合索引。
表行数
很常见的需求是看表中有多少条数据,此时我们需要select count(*) from table_name
。
InnoDB
不保存表行数,需要进行全表扫描。MyISAM
用一个变量保存,直接读取该值,更快。当时当带有where
查询的时候,两者一样。
存储
数据库的文件都是需要在磁盘中进行存储,当应用需要时再读取到内存中。一般包含数据文件、索引文件。
InnoDB
分为:
.frm
表结构文件.ibdata1
共享表空间.ibd
表独占空间.redo
日志文件
MyISAM
分为三个文件:
.frm
存储表定义.MYD
存储表数据.MYI
存储表索引
执行速度
如果你的操作是大量的查询操作,如SELECT
,使用MyISAM
性能会更好。
如果大部分是删除和更改的操作,使用InnoDB
。
InnoDB
和MyISAM
的索引都是B+
树索引,通过索引可以查询到数据的主键,不熟悉B+
树的可以查看MySQL InnoDB索引原理和算法。两者的性能区别主要在于查询到数据主键后两者的处理方式却不同。
InnoDB
会缓存索引和数据文件,一般以16KB
为一个最小单元(数据页大小)和磁盘进行交互,InnoDB
在查询到索引数据后实际得到的是主键的ID
,它需要在内存中的数据页中查找该行的全部数据,但如果该数据不是加载过的热数据,还需要进行数据页的查找和替换,这其中可能牵涉到多次I/O
操作和内存中数据查找,导致耗时较高。
而MyISAM
存储引擎只缓存索引文件,不缓存数据文件,其数据文件的缓存直接使用操作系统的缓存,这点非常独特。此时相同的空间能够加载