学会Sequelize,让你操作数据更丝滑
Sequelize 是一个基于 promise 的 Node.js ORM, 目前支持 Postgres, MySQL, MariaDB, SQLite 以及 Microsoft SQL Server. 它具有强大的事务支持, 关联关系, 预读和延迟加载,读取复制等功能。
一、前言
本文希望通过下面的知识讲解及一些实战经验分享,给予即将入门或正在学习的同学一些帮助。
在之前刚接触 Sequelize
的时候,遇到挺多问题,比如数据的聚合统计应该怎么做?复杂的排序规则应该怎么写?索引这块应该如何定义?性能如何衡量?等等这些问题,后来经过自己的琢磨及与后台人员交流探讨,这些问题都得予解决。
我们直接进入主题,学习目录结构如下:
一、前言
二、入门
1.配置
2.创建模型
3.增删改查
4.查询条件
三、进阶
1.联表查询
2.分组
3.聚合函数
4 索引
5.事务
四、实战演练
五、问题思考
二、入门
1.配置
module.exports = () => {
const config = (exports = {})
config.sequelize = {
//支持的数据库类型
dialect: 'mysql',
//连接数据库的主机
host: 'localhost',
//连接数据库的端口
port: 3306,
//数据库名称
database: 'db_test',
//数据库用户名
username: 'root',
//数据库密码
password: 'xxxxxx',
//设置标准时区
timezone: '+08:00',
//配置
dialectOptions: {
// 时间格式化,返回字符串
dateStrings: true,
typeCast(field, next) {
if (field.type === 'DATETIME') {
return field.string()
}
return next()
}
}
}
return config
}
注:如果没有加 dialectOptions
配置上的 typeCast
属性值为 true
的话,返回的时间是 ISO
标准时间日期字符。(如:'2022-04-16T15:02:08.017Z')
2.创建模型
2.1 常用数据类型
类型 | 说明 |
---|---|
INTEGER | 整数类型 |
STRING | 字符串 |
TEXT | 文本类型 |
BOOLEAN | 布尔类型 |
DATE | 时间类型 |
像数字、字符类型默认都有一些长度的限定,有时候因为长度问题导致接口出错,所以需要根据情况而定。
还有其他类型就不一一列了,需要用到的可以参照文档看看。Sequelize数据类型[1]
2.2 定义模型
module.exports = (app) => {
const { STRING, INTEGER, DATE } = app.Sequelize
const model = app.model.define(
'student',
{
id: {
//类型
type: INTEGER(11),
//是否允许为空
allowNull: false,
//是否为主键
primaryKey: true,
//自动自增
autoIncrement: true,
//备注
comment: '学生id',
},
name: {
type: STRING(50),
allowNull: false,
validate: {
notEmpty: true,
},
comment: '学生姓名',
},
class_id: {
type: INTEGER(11),
allowNull: false,
validate: {
notEmpty: true,
},
comment: '班级',
},
cid: {
type: STRING(50),
allowNull: false,
unique: 'cid',
validate: {
notEmpty: true,
},
comment: '身份证',
}
},
{
// 启动时间,设置为ture会自动生成创建和更新时间,默认字段名称为createAt、updateAt。
timestamps: true,
//对应的表名将与model名相同
freezeTableName: true,
//表备注
comment: '表1',
//创建时间字段别名或不展示
createdAt: 'createTime',
//更新时间字段别名或不展示
updatedAt: 'updateTime'
}
)
return model
}
使用 model.sync(options)
可自动执行 SQL
语句建表,但这个不建议用,第一这么做容易出现问题,第二我们的规范也不允许这么做。
2.3 表字段规范
这里讲的是我们公司的 SQL
规范,先来看一个案例:
CREATE TABLE `student` (
`id` int NOT NULL AUTO_INCREMENT COMMENT '学生id',
`name` varchar(50) NOT NULL COMMENT '学生姓名',
`cid` varchar(50) NOT NULL COMMENT '身份证',
`class_id` int NOT NULL COMMENT '班级',
`create_time` datetime NOT NULL COMMENT '',
`update_time` datetime NOT NULL COMMENT '更新时间',
`mobile` varchar(50) DEFAULT NULL COMMENT '手机号',
PRIMARY KEY (`id`),
UNIQUE KEY `cid_unique` (`cid`),
KEY `class_id` (`class_id`)
) ENGINE = InnoDB DEFAULT CHARSET = utf8mb4 COMMENT = '学生表';
审核结果:
下面讲一下基本的设计规范:
1) 禁用关键字
在设计的时候注意不要用到关键字,比如 name
、type
、status
等字段。
常见关键字:
2) 字段禁止默认值为null
从上面的案例中 mobile
字段使用了允许为 null
值,审核平台这块没有强限制,但不建议用 null
为默认值,很容易出现问题。
3) 需要添加字段注释和表注释
CREATE TABLE `student` (
`id` int NOT NULL AUTO_INCREMENT COMMENT '学生id',
`username` varchar(50) NOT NULL COMMENT '学生姓名',
`cid` varchar(50) NOT NULL COMMENT '身份证',
`class_id` int NOT NULL COMMENT '班级',
`create_time` datetime NOT NULL COMMENT '创建时间',
`update_time` datetime NOT NULL COMMENT '更新时间',
`mobile` varchar(50) DEFAULT NULL COMMENT '手机号',
PRIMARY KEY (`id`),
UNIQUE KEY `cid` (`cid`),
KEY `iclass_id` (`class_id`)
) ENGINE = InnoDB DEFAULT CHARSET = utf8mb4 COMMENT = '学生表';
4)创建时间和更新时间字段
该表中必须含有 create_time
和 update_time
字段,如果没有该2个字段的话审核会不通过。
5) 索引命名
唯一索引:必须以 uniq_
前缀命名。
普通索引:必须以 idx_
前缀命名。
6) 其它
以上是常用的基本规范,更多根据自己公司情况而定。
3.增删改查
3.1 create
创建数据
const values = {
username: '张三',
age: 18
}
const result = await this.model.create(values)
console.log(result)
3.2 findAll
查询数据并返回数组
const filter = {
username: '张三',
age: 18
}
const result = await this.model.findAll({
where: filter
})
console.log(result)
3.3 findAndCountAll
查询数据并返回总数和数组列表
const filter = {
username: '张三',
age: 18
}
const result = await this.model.findAndCountAll({
where: filter
})
console.log(result)
3.4 findOne
查询某一条数据返回对象
const filter = {
id: 20
}
const result = await this.model.findOne({
where: filter
})
console.log(result)
3.5 count
返回总条数
const total = await this.model.count()
console.log(total)
3.6 update
更新数据
const value = {
id: 2,
username: '张三',
age: 20
}
const result = await this.model.update(value)
console.log(result)
3.7 destroy
删除数据
const filter = {
id: 1
}
const result = await this.model.destroy({
where: filter
})
console.log(result)
3.8 其它
还有一些其他的方法,具体可以看看Sequelize方法文档[2]。
4.查询条件
这个具体的查询用法就不一一说了,根据自己需要的查询条件看下对应的查询功能即可。
this.Op = this.app.Sequelize.Op
this.model.findAll({
where: {
[Op.and]: [{ a: 5 }, { b: 6 }], // (a = 5) AND (b = 6)
[Op.or]: [{ a: 5 }, { b: 6 }], // (a = 5) OR (b = 6)
someAttribute: {
// 基本
[Op.eq]: 3, // = 3
[Op.ne]: 20, // != 20
[Op.is]: null, // IS NULL
[Op.not]: true, // IS NOT TRUE
[Op.or]: [5, 6], // (someAttribute = 5) OR (someAttribute = 6)
// 使用方言特定的列标识符 (以下示例中使用 PG):
[Op.col]: 'user.organization_id', // = "user"."organization_id"
// 数字比较
[Op.gt]: 6, // > 6
[Op.gte]: 6, // >= 6
[Op.lt]: 10, // < 10
[Op.lte]: 10, // <= 10
[Op.between]: [6, 10], // BETWEEN 6 AND 10
[Op.notBetween]: [11, 15], // NOT BETWEEN 11 AND 15
// 其它操作符
[Op.all]: sequelize.literal('SELECT 1'), // > ALL (SELECT 1)
[Op.in]: [1, 2], // IN [1, 2]
[Op.notIn]: [1, 2], // NOT IN [1, 2]
[Op.like]: '%hat', // LIKE '%hat'
[Op.notLike]: '%hat', // NOT LIKE '%hat'
[Op.startsWith]: 'hat', // LIKE 'hat%'
[Op.endsWith]: 'hat', // LIKE '%hat'
[Op.substring]: 'hat', // LIKE '%hat%'
[Op.iLike]: '%hat', // ILIKE '%hat' (不区分大小写) (仅 PG)
[Op.notILike]: '%hat', // NOT ILIKE '%hat' (仅 PG)
[Op.regexp]: '^[h|a|t]', // REGEXP/~ '^[h|a|t]' (仅 MySQL/PG)
[Op.notRegexp]: '^[h|a|t]', // NOT REGEXP/!~ '^[h|a|t]' (仅 MySQL/PG)
[Op.iRegexp]: '^[h|a|t]', // ~* '^[h|a|t]' (仅 PG)
[Op.notIRegexp]: '^[h|a|t]', // !~* '^[h|a|t]' (仅 PG)
[Op.any]: [2, 3], // ANY ARRAY[2, 3]::INTEGER (仅 PG)
[Op.match]: Sequelize.fn('to_tsquery', 'fat & rat') // 匹配文本搜索字符串 'fat' 和 'rat' (仅 PG)
// 在 Postgres 中, Op.like/Op.iLike/Op.notLike 可以结合 Op.any 使用:
[Op.like]: { [Op.any]: ['cat', 'hat'] } // LIKE ANY ARRAY['cat', 'hat']
}
}
});
三、进阶
1.联表查询
1.1 一对一
比如学生表和身份证表,一名学生只会有一个身份证号码,一张身份证只会对应一名学生。
这种就是一对一的关系,如图:
假如学生表作为主表,身份证表作为副表,那边这张副表的外键就是学生表的id。
在使用 Sequelize
库中,我们想通过学生表关联到相应的身份证表信息,可通过 hasOne
方法做关联:
student.hasOne(card, {foreignKey : 'id'});
如果我们想通过身份证表反向关联到学生表,这是可以用 belongsTo
方法做关联:
card.belongsTo(student, {foreignKey : 'cid'});
总结一下 hasOne
和 belongsTo
的区别:
方法 | 说明 |
---|---|
hasOne | 正向关联,可以理解为一名学生拥有一张身份证。 |
belongsTo | 反向关联,可以理解为一张身份证属于一名学生。 |
1.2 一对多
比如学生表和班级表,一名学生只有一个班级,一个班级由多名学生组成,这种是一对多(多对一)的关系,如图:
在使用 Sequelize
库中,可通过 hasMany
方法做关联:
class.hasMany(student, {foreignKey : 'class_id'});
1.3 多对多
比如学生表和课程表,一名学生可以有多门课程,一门课程可以由多名学生参与,这种是多对多的关系,如图:
在使用 Sequelize
库中,可通过 belongsToMany
方法做关联:
const Student = sequelize.define('Student', { name: DataTypes.STRING });
const Course = sequelize.define('Course', { name: DataTypes.STRING });
const StudentCourse = sequelize.define('StudentCourse', {
studentId: {
type: DataTypes.INTEGER,
references: {
model: Student,
key: 'id'
}
},
courseId: {
type: DataTypes.INTEGER,
references: {
model: Course,
key: 'id'
}
}
});
Student.belongsToMany(Course, { through: StudentCourse });
Course.belongsToMany(Student, { through: StudentCourse });
1.4 联表查询优劣
优点:联表查询用起来很方便,不需要做太多了处理,尤其在 B 端场景会用的比较多。
缺点:对于 C 端这种流量较大场景,使用联表查询效率会很低下,可能会导致服务器崩溃,所以现在大多数在 C 端都不采用 SQL 自带的联表查询功能,一般会通过代码逻辑来处理,大大减少查询效率。
有兴趣的可以了解下 mysql
联表查询的步骤是怎样的,这样对比起来会更加直观一点。
2.分组
举个例子,你想对订单各个状态的数量进行一个统计,你应该会怎么做?
在之前不知道分组这个功能时,我是这么做的:
const obj = {}
obj.problemAmoumt = await this.model.count()
obj.resolvedAmoumt = await this.model.count({
where: {
problemStatus:2
}
})
return ctx.returnStatus.SUCCESS(obj)
这似乎看起来很粗暴。
后来发现可通过 SQL 语句中的 group
进行一个分组,group
是指定要进行分组的字段,示例如下:
this.model.count({
attributes: ['order_status'],
group: 'order_status'
})
最终转换成 SQL 语句如下:
SELECT `order_status`, count(*) AS `count` FROM `order_list` AS `order_list` GROUP BY `order_status`;
返回结果
[
{
"order_status": 1,
"count": 4
},
{
"order_status": 2,
"count": 2
},
{
"order_status": 3,
"count": 2
}
]
思考:
1.分组在应用时会不会有坑?自己在使用时可以看看。
2.如果想对 order_status
进行一个别名 bbb
字段返回,这时的查询语句应该如何调整?
3.聚合函数
3.1 count
统计总数,比如统计各个订单的数量:
this.model.findAll({
attributes: [
'orderStatus',
[sequelize.fn('count', sequelize.col('order_status')), 'total']
],
group: 'orderStatus'
})
3.2 sum
求和,比如统计全部同学的成绩总数:
this.model.findAll({
attributes: [
[sequelize.fn('sum', sequelize.col('score')), 'score']
]
})
3.3 max
查询最大值,比如找到这个分数最高的同学:
this.model.findAll({
attributes: [
[sequelize.fn('max', sequelize.col('score')), 'score']
]
})
3.4 min
查询最小值,比如找到这个分数最低的同学:
this.model.findAll({
attributes: [
[sequelize.fn('min', sequelize.col('score')), 'score']
]
})
当然这些方法也可以通过 this.model.方法(字段名称)
来实现,参数为指定的字段。
4 索引
索引就是一种将数据库中的记录按照特殊形式存储的数据结构。通过索引,能够提高数据查询的效率,从而提升服务器的性能。
4.1 主键索引
一个表只能由一个主键索引,且不为空。
可通过 primaryKey
属性来设置主键,通常会把 id
设为该表的主键,当然你也可以指定其它字段来作为主键,该字段值必须是唯一的。
const student = app.model.define(
'student',
{
id: {
type: INTEGER(11),
allowNull: false,
primaryKey: true,
autoIncrement: true,
default: 10000,
comment: '学生id',
},
name: {
type: STRING(50),
allowNull: false,
validate: {
notEmpty: true,
},
comment: '学生姓名',
}
}
)
return student
4.2 唯一索引
唯一索引的列的值必须唯一,但是允许出现空值。
可通过 unique
属性设置为唯一索引,值为 true
的话,索引名称会自动生成,也可以设置为自定义索引名称。
const student = app.model.define(
'student',
{
id: {
type: INTEGER(11),
allowNull: false,
primaryKey: true,
autoIncrement: true,
default: 10000,
comment: '学生id',
},
name: {
type: STRING(50),
allowNull: false,
validate: {
notEmpty: true,
},
comment: '学生姓名',
},
cid: {
type: STRING(50),
allowNull: false,
unique: 'cid_unique',
validate: {
notEmpty: true,
},
comment: '身份证',
}
}
)
return student
4.3 组合索引
用多个列组合构建的索引,这多个列中的值不允许有空值。
const student = app.model.define(
'student',
{
id: {
type: INTEGER(11),
allowNull: false,
primaryKey: true,
autoIncrement: true,
default: 10000,
comment: '学生id',
},
name: {
type: STRING(50),
allowNull: false,
validate: {
notEmpty: true,
},
comment: '学生姓名',
},
class_id: {
type: INTEGER(11),
allowNull: false,
validate: {
notEmpty: true,
},
comment: '班级',
},
cid: {
type: STRING(50),
allowNull: false,
unique: 'cid',
validate: {
notEmpty: true,
},
comment: '身份证',
}
},
{
indexes: [{
name: 'name',
fields: ['name']
}, {
name: 'cid',
fields: ['cid']
}]
}
)
return student
4.4 普通索引
用表中的普通列构建的索引,没有任何限制。
用法只要在 indexed
属性里不设置 unique
字段即可。
const student = app.model.define(
'student',
{
id: {
type: INTEGER(11),
allowNull: false,
primaryKey: true,
autoIncrement: true,
default: 10000,
comment: '学生id',
},
name: {
type: STRING(50),
allowNull: false,
validate: {
notEmpty: true,
},
comment: '学生姓名',
},
class_id: {
type: INTEGER(11),
allowNull: false,
validate: {
notEmpty: true,
},
comment: '班级',
},
cid: {
type: STRING(50),
allowNull: false,
unique: 'cid',
validate: {
notEmpty: true,
},
comment: '身份证',
}
},
{
indexes: [{
unique: true,
name: 'name',
fields: ['name']
}, {
unique: true,
name: 'class_id',
fields: ['class_id']
}]
}
)
return student
4.5 加与不加索引的区别?
优点:增加索引会提供查询效率
缺点:增加内存空间
我们来看一条查询语句:
explain select * from `experience_problem_list` where `experience_problem_list`.`page_type` = 2;
先看看没加索引的执行结果:
id | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
---|---|---|---|---|---|---|---|---|
1 | ALL | (NULL) | (NULL) | (NULL) | (NULL) | 16416 | 10 | (NULL) |
表中总共有16416条数据,扫描行数也是16416条。
再看下加了索引的执行结果:
id | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
---|---|---|---|---|---|---|---|---|
1 | ref | page_type | page_type | 4 | const | 4 | 100 | Using where |
我们来看下 rows
字段的对比,加了索引的扫描行数只有4条,由此可以看到,加索引的查询效率大大高于普通查询。
5.事务
可以理解为一个事务对应的是一组完整的业务,并且在这个事务中所作的一切操作要么全部成功,要么全部失败,只要有一个操作没成功,整个事务都将回滚到事务开始前。
这里简单放一个官方使用案例吧:
// 首先,我们开始一个事务并将其保存到变量中
const t = await sequelize.transaction();
try {
// 然后,我们进行一些调用以将此事务作为参数传递:
const user = await User.create({
firstName: 'Bart',
lastName: 'Simpson'
}, { transaction: t });
await user.addSibling({
firstName: 'Lisa',
lastName: 'Simpson'
}, { transaction: t });
// 如果执行到此行,且没有引发任何错误.
// 我们提交事务.
await t.commit();
} catch (error) {
// 如果执行到达此行,则抛出错误.
// 我们回滚事务.
await t.rollback();
}
四、实战演练
1.查询数据不想返回内置的数据结构,只想单纯返回纯数据结构怎么处理?
来看下默认返回查询的数据结果:
{
count: 8,
rows: [
student {
dataValues: [Object],
_previousDataValues: [Object],
uniqno: 1,
_changed: Set(0) {},
_options: [Object],
isNewRecord: false
}
]
}
这里 rows
里面对象返回了很多层,在业务处理时可能取值会不太方便,我们可以在调用方法的参数里加上 raw
等于 true
,就返回正常的数据格式。
const result = await this.model.findAll({
where: filter,
raw: true
})
返回:
{
count: 8,
rows: [
{
id: 8,
name: '张三',
cid: 'xxx',
createTime: '2022-04-08 18:06:52',
updateTime: '2022-04-08 18:06:52'
}
]
}
2.如果列表筛选涉及到主副表应该怎么查询合适?
有几种方案:
1)直接用 mysql
语句做表关联即可,但性能比较低下。
2)用代码逻辑处理,但写起来可能有点绕,但效率比直接用 mysql
表关联效率高。
3)如果主表字段固定且不多的话,可以直接冗余副表中,但如果后续主表加字段的话,副表更新是个问题。
4)采用 ES
,将这2张表的数据合并同步到 ES
的一张表里,但 ES
使用场景一般都是量很大的,加上 nodejs
新增其它数据库交互,有额外的开销成本。
综合以上考虑,如果是内部项目,量也不是很多的话,查询比较复杂的话可以直接采用第一种方法,如果逻辑相对比较简单,也可以采用第二种方法。
3.分组 group 遇到的问题。
group
只能填写已有的查询字段。比如你表中有这个字段 aaa
,但查询返回的字段 aaa
被过滤了,这时不能以 aaa
进行分组。
4.如何获取今日、最近7天、一个月的数据?
可通过字符串函数 DATE_FORMAT
实现:
1)首先通过时间选择器获取到今日、最近7天、一个月的开始时间和结束时间。
2)然后使用对改模型使用 count
进行查询,这时获取到的知识该时期的总条数。
3)对改数据进行分组,使用 group
属性,字段为创建的时间,但我们创建的时间是包含时分秒的,如果这么聚合的话,生成的数据并不是我们想到的,我们需要的是针对年月日,所以需要对这个时间进行一个处理。
[
{
"create_time": "2022-04-12 17:02:36",
"count": 1
},
{
"create_time": "2022-04-14 17:02:38",
"count": 1
},
{
"create_time": "2022-04-14 17:03:38",
"count": 1
},
{
"create_time": "2022-04-14 17:03:58",
"count": 1
}
]
这个显然不是我们想要的一个结果。
4)然后函数 DATE_FORMAT
,将时间格式化为年月日。
总体实现如下:
const countArr = await this.model.count({
where: filter,
attributes: [
[sequelize.fn('DATE_FORMAT', sequelize.col('create_time'), '%Y-%m-%d'), 'createTime'],
], group: 'createTime',
})
假设我想获取4月10日-4月14日的数据,正常返回结构如下:
[
{
"createTime": "2022-04-12",
"count": 1
},
{
"createTime": "2022-04-14",
"count": 3
}
]
5)因为表中只有12号和14号的数据,10、11、13号没有,这块需要自己对代码进行一个处理,把其它日期没有的数据为0即可。
最终希望达到的效果:
[
{
"time": "2022-04-10",
"count": 0
},
{
"time": "2022-04-11",
"count": 0
},
{
"time": "2022-04-12",
"count": 1
},
{
"time": "2022-04-13",
"count": 0
},
{
"time": "2022-04-14",
"count": 3
}
]
五、问题思考
如果想要获取一年中每个月的订单量,应该怎么查询?
答案:关注 "大转转FE" 公众号,回复"统计"、"一年"其中一个即可
如何根据查询条件的顺序,返回相应的数据顺序?
答案:关注 "大转转FE" 公众号,,回复"filed"、"排序"其中一个即可
如何进行动态分表?
答案:关注 "大转转FE" 公众号,回复"分表"即可。
注:如果您还有其它问题想交流,欢迎在底部留言。
参考资料
Sequelize数据类型: https://www.sequelize.com.cn/core-concepts/model-basics
[2]Sequelize方法文档: https://www.sequelize.com.cn/core-concepts/model-querying-finders