来自:架构师之路
2024年IDEA最新激活方法教程,后台回复:激活码
之前分享了阿里巴巴MySQL【强制】规范,大伙反馈不过瘾,希望补充【推荐】规范与【参考】规范。好滴,满足大家的心愿。
规范内容取自“阿里巴巴MySQL规范”(黄山版),发布时间为2022.2.3,开源。
1. 表达是否概念的字段,必须使用is_xxx的形式命名;
2. 数据类型必须是 unsigned tinyint;
正确:使用is_deleted,1表示删除,0表示未删除
错误:deleted, if_deleted, delete_or_not
画外音:MySQL在Windows下不区分大小写,Linux下虽然区分,但为了避免节外生枝,统一禁止大写。
正确:aliyun_admin,level3_name
错误:AliyunAdmin,level_3_name
常见的例如:desc,range,match,delayed...
画外音:float和double存在精度损失,比较的时候,可能得到意想不到的结果。
3. 如果范围超过decimal,可以拆成整数与小数分开存储;
【强制】规范七:字符串长度非常相近,必须使用定长char
1. 如果字符串长度较长,且内容长度差异较大,使用varchar;
2. 如果字符串长度大部分超过5000,使用text,独立出一张表单独存储;
1. 必须具备id字段:类型为bigint unsigned,单表时自增,步长为1,不具备业务含义;
2. 必须具备create_time字段:类型为datetime(除非记录时区信息,使用timestamp);
画外音:逻辑操作保留了数据资产的同时,能够追溯操作行为。
1. 如果修改字段含义,或者追加字段状态,建议同步更新注释;
允许通过数据冗余来提高查询性能,但要考虑数据一致性,冗余的字段建议遵循:
画外音:选择合适的类型,能节约表空间,节约索引空间,提升检索速度。
1. 业务上具备唯一特性的字段,即使是组合字段,也必须建立成唯一索引。
1. 唯一索引虽然影响插入速度,但针对于互联网大数据量高并发量的数据存储场景来说,插入的影响可以忽略不计,查询效率的提升是主要矛盾;
1. 针对于互联网大数据量高并发量的数据存储场景来说,join对性能的潜在影响较大;
2. 数据类型不对,没有索引,对性能的潜在影响较大;
1. 没有必要对过长的varchar全字段建立索引;
2. varchar字段上的索引必须指定索引长度;
3. 索引长度可参考文本区分度,索引长度N可用count(distinct left(column, N))/count(*)来测试;
2. 如果有相关业务需求,必须走搜索引擎方案解决;
1. order by场景要注意组合索引的顺序,order by的字段应该放在组合索引的最后;
where a=? and b=? order by c
【推荐】规范六:利用索引覆盖来进行查询,可以避免回表
索引分为主键索引、唯一索引、普通索引三种,覆盖索引只是一种查询效果,explain时,extra会出现using index。
【推荐】规范七:利用延迟关联或者子查询,可以优化分页场景
select t1.* from biao1 as t1,
(select id from biao1 where XXX limit 100000, 20) as t2
画外音:MySQL并不跳过offset行,而是先取offset+N行,然后放弃前面offset行,再返回N行。如果offset特别大,效率就非常低。常见的优化手段,是通过id对SQL进行改写。
SQL优化目标为:至少达到range级别,要求达到ref级别,如果是const级别那最好。
MySQL的官网解释非常简洁,只用了3个单词:连接类型(the join type)。它描述了找到所需数据使用的扫描方式。
(1)system:系统表,少量数据,往往不需要进行磁盘IO;
(3)eq_ref:主键索引(primary key)或者非空唯一索引(unique not null)等值扫描;
(7)ALL:全表扫描(full table scan);
【推荐】规范十:避免字段类型不同产生隐式转换,导致索引失效
2. 认为索引占Buffer Pool就不建立索引;
3. 认为可以通过应用层“先查询再插入”的方式变相实现唯一索引;
1. 不要使用count(column)或者count(1),请使用count(*)
1. count(*)是SQL92标准定义的统计行的语法,与数据库无关,与值无关;
2. count(*)会统计值为NULL的行,count(column)不会;
1. 如果要计算排除NULL值的不重复行计数,请使用count(distinct column);
使用count(distinct column1, column2)时,如果一列全为NULL,另一列即使有不同值,也会返回0;
1. 如果一列全是NULL,sum(column)返回的是NULL,因此在使用sum时,应用程序务必考虑NPE问题;
画外音:NPE,NullPointerException
1. 使用ISNULL(column)判断列是否为空,不要使用column is null 或者column is not null;
2. column is (not) null可能导致换行,影响可读性,而ISNULL(column)是一个整体;
3. ISNULL(column)的执行效率更高;
1. 应用层分页查询逻辑,必须加上count为0时直接返回的判断;
1. 针对于互联网大数据量高并发量的数据存储场景来说,外键与级联查询对性能的潜在影响较大;
级联查询是指,一个查询的结果依赖于另一个查询的结果,通常是通过子查询或者嵌套查询实现的。
更新风暴问题是指,由于某些约束,例如外键约束或者触发器约束,当一条记录被更新时,相关约束的记录也会被更新,引发一系列连锁反应,导致短时间大量更新操作引发数据库性能下降甚至死锁的问题。因此,分布式场景一般禁止使用外键约束,或者触发器约束。
1. 但针对于互联网大数据量高并发量的数据存储场景来说,存储过程对性能的潜在影响较大;
1. SQL中对于列的查询与修改,如果涉及多个表,必须使用表名(或者别名)对列进行限定;
1. 如果不进行限定,未来对表DDL时,不同表可能出现同名列,使得原本正常的程序在DDL后突然异常;
1. 线上数据库进行update/delete操作时,必须先同查询条件select执行,确认结果后再update/delete;
1. 表的别名前加as,并以t1, t2, t3, ...依次命名;
1. 尽量避免in,实在避免不了,也建议将集合元素个数控制在1000个以内;
1. 因国际化需要,字符编码建议采用utf8mb4字符集;
truncate在功能上与不带where的delete相同,但速度更快,使用的系统资源与日志资源更少,但避免在代码中使用此语句。
画外音:truncate不触发触发器,MySQL删除数据时需要注意:
推荐阅读:
为什么 idea 建议去掉 StringBuilder,使用“+”拼接字符串
SpringBoot统一属性配置,以数据库作为配置中心
推荐一个我自己写的工具站:http://cxytools.com,专为程序员设计,包括时间日期、JSON处理、SQL格式化、随机字符串生成、UUID生成、随机数生成、文本Hash...等功能,提升开发效率。
⬇戳阅读原文直达! 朕已阅