# 数据库应用（MySQL）

数据库（Database）是按照数据结构来组织、存储和管理数据的仓库。MySQL是一种关系型数据库管理系统（RDBMS），采用关系型数据结构，通过像表格一样的结构来表示和管理数据。

以下是关系型数据结构的主要特点和概念：

表: 表是关系型数据库中最基本的数据存储单元。每个表由行和列组成，表中的每一行代表一条记录，每一列代表一个属性或字段
列：列定义了表中每个字段的名称和数据类型。每一列代表实体的一个属性，例如在用户表中，可能有 id、name、email 等列。
行：行是表中的一个具体实例，表示一组相关的数据。每一行对应一个实体的各个属性。
字段：在关系型数据库中，字段指表中的一列（字段和列在数据库设计中是同一个概念的不同称呼。）
主键：主键用于标识表中的每一个行，每一行的主键值必须是唯一的，并且不能为空。
外键：外键用于建立表与表之间的关联关系，外键是一个表中的字段，其值引用另一个表的主键。
复合键：是由多个字段组合而成的主键，用于唯一标识表中的每一行记录。当单个字段无法唯一标识表中的记录时，可以使用多个字段的组合来实现唯一性。
索引：索引是对数据库表中一列或多列的值进行排序的一种结构。类似于书籍的目录。在处理大量数据时可以提高查询的效率。

# 安装 MySQL

下载链接：MySQL Community Downloads (opens new window)

# 管理 MySQL

# 启动或关闭 MySQL 服务器

在 Windows 系统下启动 MySQL 服务器

net start mysql

关闭 MySQL 服务器

net stop mysql

在Linux 系统下启动 MySQL 服务器

sudo systemctl start mysql

如果不行可以尝试 sudo service mysql start

关闭 MySQL 服务器

sudo systemctl stop mysql

或者sudo service mysql stop

重启 MySQL 服务器

sudo systemctl restart mysql

或者使用 service 命令：sudo service mysql restart

检查 MySQL 服务器状态

sudo systemctl status mysql

或者使用 service 命令：sudo service mysql status

# 查看数据库

列出所有可查看的数据库

SHOW DATABASES;

# 查看用户名

查看所有用户

SELECT User FROM mysql.user;

查看用户及其主机信息

SELECT User, Host FROM mysql.user;

# 查看字符集

这个语句可以查询所有的字符集的名称以及与其对应的默认排序规则和最大字符长度

SHOW CHARACTER SET

# 注释

单行注释以 -- 或 # 开头，-- 后面必须跟一个空格，否则会被误认为是 SQL 命令的一部分

-- 创建一个名为 users 的表
# 创建一个名为 users 的表

多行注释以 /* 开头，以 */ 结尾

/*
创建一个名为 users 的表
包含 id、name 和 email 字段
*/

# 连接数据库

使用命令行连接 MySQL 服务器

mysql -u your_username -p

使用命令行连接远程 MySQL 服务器

mysql -u your_username -h remote_host -P port -p

-u 参数用于指定用户名，参数后的 your_username 表示用户名
-p 若该用户名设置了密码则应当加上这个参数
-h 指定远程 MySQL 服务器的地址（IP 地址或域名）remote_host 是服务器地址
-P 指定 MySQL 服务器的端口号（默认是 3306）port 表示端口号

示例：

-- 连接本地 MySQL服务器
mysql -u root -p

-- 连接 IP 地址为 192.168.1.100 的远程 MySQL 服务器
mysql -u root -h 192.168.1.100 -P 3306 -p

# 创建数据库

一般使用 CREATE 命令创建数据库，database_name 为要创建的数据库名称

CREATE DATABASE database_name;

提示

在使用 MySQL 时，每段代码后都要用;结尾
在创建和删除数据库时需要最高权限，一般使用 root 用户登录

数据库创建的基本语法：

CREATE DATABASE [IF NOT EXISTS] database_name
  [CHARACTER SET charset_name]
  [COLLATE collation_name];

用[]括起来的内容为非必要语句，如果不写则会按照默认情况创建数据库，MySQL 8.0+ 版本默认字符集为 utf8mb4，默认排序规则为 utf8mb4_0900_ai_ci

示例：

CREATE DATABASE mydatabase
  CHARACTER SET utf8mb4
  COLLATE utf8mb4_general_ci;

如果所要创建的数据库名称已经存在，执行 CREATE DATABASE 创建数据库将会报错，为了避免报错，可以在语句中添加 IF NOT EXISTS

CREATE DATABASE IF NOT EXISTS mydatabase;

# 使用命令行创建数据库

mysqladmin 是 MySQL 提供的一个用于执行管理任务的命令行工具。通过 mysqladmin 可以执行各种数据库管理和 MySQL 服务器管理的操作

mysqladmin -u your_username -p create database_name

-u 参数用于指定 MySQL 用户名
your_username 表示用户名
-p 若该用户名设置了密码则需要添加这个参数
create 是执行的操作，表示创建数据库
database_name 是要创建的数据库的名称

查看 MySQL 服务器的状态

mysqladmin -u your_username -p status

your_username 表示用户名

# 删除数据库

在删除数据库时需要最高权限，一般使用 root 用户登录。

在 SQL 语句中使用 DROP 命令来删除数据库，格式如下：

DROP DATABASE [IF EXISTS] database_name

IF EXISTS 是可选语句，用于在创建数据库前先检查数据库是否存在，可以避免因为数据库不存在而引发错误
database_name 表示所要删除的数据库的名称

示例：

-- 删除指定数据库
DROP DATABASE mydatabase;

-- 删除指定数据库（如果数据库不存在则不会报错）
DROP DATABASE IF EXISTS mydatabase;

# 使用命令行删除数据库

mysqladmin -u your_username -p drop database_name

-u 参数用于指定 MySQL 用户名
your_username 表示用户名
-p 若该用户名设置了密码则需要添加这个参数
drop 是执行的操作，表示删除数据库
database_name 是要创建的数据库的名称

# 选择数据库

在 MySQL 中可以使用 USE 语句来选择要使用的数据库

USE database_name;

database_name 表示要选择的数据库的名称

选择数据库后，后续的所有操作都会在这个选择的数据库中执行

# 使用命令行选择数据库

mysql -u your_username -p -D your_database

-u 参数用于指定 MySQL 用户名
your_username 表示用户名
-p 若该用户名设置了密码则需要添加这个参数
-D 参数用于指定要选择的数据库, your_database 表示要选择的数据库的名称

# 修改数据库

使用 ALTER DATABASE 语句可以修改数据库的字符集和排序规则。

ALTER DATABASE database_name 
CHARACTER SET = charset_name 
COLLATE = collation_name;

database_name：要修改的数据库名称。
charset_name：新的字符集，例如 utf8mb4。
collation_name：新的排序规则，例如 utf8mb4_general_ci

# 数据类型

MySQL 支持多种数据类型，大致可以分为三类：数值类型、日期时间类型、字符串类型。

# 数值类型

数据类型	大小（bytes）	范围（有符号）	范围（无符号）	说明
`TINYINT`	1	(-128, 127)	(0, 255)	较小的整数值
`SMALLINT`	2	(-32,768, 32,767)	(0, 16,777,215)	整数值
`MEDIUMINT`	3	(-8,388,608, 8,388,607)	(0, 16,777,215)	整数值
`INT`	4	(-2,147,483,648, 2,147,483,647)	(0, 4,294,967,295)	整数值
`BIGINT`	8	(-9,223,372,036,854,775,808, 9,223,372,036,854,775,807)	(0, 18,446,744,073,709,551,615)	较大的整数值
`FLOAT`	4	(-3.402 823 466 E+38, -1.175 494 351 E-38), 0, (1.175 494 351 E-38, 3.402 823 466 351 E+38)	0, (1.175 494 351 E-38, 3.402 823 466 E+38)	单精度浮点数
`DOUBLE`	8	(-1.797,693,134,862,315,7 E+308, -2.225,073,858,507,201,4 E-308), 0, (2.225,073,858,507,201,4 E-308, 1.797,693,134,862,315,7 E+308)	0, (2.225,073,858,507,201,4 E-308, 1.797,693,134,862,315,7 E+308)	双精度浮点数

FLOAT和DOUBLE在不指定精度时，默认会按照实际的精度来显示

定点浮点数类型：

该类型用 DOUBLE 表示，没有固定的范围，范围由实际的精度决定，常用于表示高精度浮点数
DOUBLE(M,D) 参数 M 表示有效数字的位数（范围1~65），参数 D 指小数点后的位数（范围0~30且不超出M），不设置参数时默认为DECIMAL(10, 0)
该类型的数据大小由精度决定，若M大于D，为M+2，否则为D+2

# 日期时间类型

数据类型	大小（bytes）	范围	格式	说明
DATE	3	1000-01-01/9999-12-31	YYYY-MM-DD	日期值
TIME	3	'-838:59:59'/'838:59:59'	HH:MM:SS	时间值
YEAR	1	1901/2155	YYYY	年份值
DATETIME	8	'1000-01-01 00:00:00' 到 '9999-12-31 23:59:59'	YYYY-MM-DD hh:mm:ss	日期时间值
TIMESTAMP	4	'1970-01-01 00:00:01' UTC 到 '2038-01-19 03:14:07' UTC	YYYY-MM-DD hh:mm:ss	时间戳

# 字符串类型

数据类型	范围	说明
`CHAR`	0 ~ 255	定长字符串
`VARCHAR`	0 ~ 65,535	变长字符串
`TINYBLOB`	0 ~ 255	不超过 255 个字符的二进制字符串
`TINYTEXT`	0 ~ 255	短文本字符串
`TEXT`	0 ~ 65,535	长文本数据
`MEDIUMTEXT`	0 ~ 16,777,215	中等长度文本数据
`LONGTEXT`	0 ~ 4,294,967,295	极大文本数据
`BLOB`	0 ~ 65,535	二进制形式的长文本数据
`MEDIUMBLOB`	0 ~ 16,777,215	二进制形式的中等长度文本数据
`LONGBLOB`	0 ~ 4,294,967,295	二进制形式的极大文本数据

# CHAR

CHAR(n) 表示定长数据，占用空间是n个字符，n的取值在0~255之间
存储的字符串长度不满 n 则右端补足空格，在读出时会自动将右端空格去除
存储的字符串长度超过存储范围n，存储不会成功

# VARCHAR

VARCHAR(n) 表示变长数据，数据占用空间会根据实际字符串长度加1（自动添加一个字符串的结束标志）
存储字符串在保存和检索时尾部的空格保留

CHAR(4)和VARCHAR(4)的实际存储对比:

值	CHAR(4)	占用空间	VARCHAR (4)	占用空间
''	' '	4 bytes	''	1 byte
'ab'	'ab '	4 bytes	'ab'	3 bytes
'abcd'	'abcd'	4 bytes	'abcd'	5 bytes
'abcdefgh'	'abcd'	4 bytes	'abcd'	5 bytes

BINARY 和 VARBINARY 类型类似于 CHAR 和 VARCHAR，但它们存储的是二进制字符串而不是非二进制字符串

# BINARY

BINARY(n) 指定一个固定长度的二进制字符串，长度为 n 字节。
如果存储的值长度小于 n，则会用 \0（零字节）填充到指定长度，如果超过 n 则会在 n 处截断。存储：无论实际数据长度如何，都会占用 n 字节的存储空间。

# VARBINARY

VARBINARY(n) 类型指定一个可变长度的二进制字符串，最大长度为 n 字节
不会进行填充，存储的实际数据长度即为数据本身的长度
只占用实际数据长度加 1 或 2 字节的存储空间（用于记录长度信息）

提示

数据检索效率：CHAR > VACHAR > TEXT，能不用TEXT就不用TEXT。

枚举类型：

ENUM 是一种字符串类型的对象，其值必须从预定义的列表中选择，且只能选其中一个。
一个 ENUM 最多支持 65,535 个元素
ENUM中的每个值对应一个索引（从 1 开始）

# 语法

column_name ENUM('value1', 'value2', 'value3', ...)

# 集合类型

SET 是一种字符串对象，其值是预定义列表中的零个或多个值的组合。
每个列的值可以包含多个选项，用逗号分隔。
单个 SET 列最多支持 64 个元素

语法：

column_name SET('value1', 'value2', 'value3', ...)

# 创建数据表

创建一个数据表最重要的三个信息：

表名
表字段名（列的名称）
定义每个表字段的数据类型（每一列的数据类型）

语法：

这是创建一个数据表最基本的数据格式

CREATE TABLE table_name (
    column1 datatype,
    column2 datatype,
    ...
);

table_name 是你要创建的表的名称
column1, column2, ... 是表中的列名
datatype 是每个列的数据类型

示例：

CREATE TABLE users (
    id INT AUTO_INCREMENT PRIMARY KEY,
    name VARCHAR(100) NOT NULL,
    email VARCHAR(255) NOT NULL UNIQUE,
    created_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP
);

注意

创建数据表时定义的每一个字段后都要加 , 最后一行不用加 ,

创建一个表名为 users 的数据表
创建名为 id 的字段，使用 AUTO_INCREMENT 属性，每次插入新记录时自动递增，将该字段设置为主键(PRIMARY KEY)
创建名为 name 的字段，设置该字段数据类型为 VARCHAR 并将最大长度设置为 100，添加 NOT NULL 约束，确保该字段不能为空.
创建名为 email 的字段，设置该字段数据类型为 VARCHAR 并将最大长度设置为 255，添加 NOT NULL 约束，确保该字段不能为空；添加 UNIQUE 约束，确保每个邮箱地址在表中是唯一的。
创建名为 created_at 的字段，设置该字段数据类型为 TIMESTAMP，用于存储日期和时间，设置默认值为 CURRENT_TIMESTAMP

通过以上操作创建出的数据表效果：

id	name	email	created_at

在创建表时可以通过这种方式设置表的字符集和排序规则

CREATE TABLE mytable (
    ...
)CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci;

也可以通过这种方式设置存储引擎（ENGINE）和编码方式（CHARSET）

CREATE TABLE mytable(
   ...
)ENGINE=InnoDB DEFAULT CHARSET=utf8;

在创建数据表时也可以使用 IF NOT EXISTS 语句，避免重复创建或引发错误

CREATE TABLE IF NOT EXISTS (
  ...
);

# 复制数据表结构

这种方式会复制表结构（包括索引、约束等），但不会复制数据。

CREATE TABLE new_table LIKE original_table;

如果需要复制数据可以在新复制的数据表中插入数据

INSERT INTO new_table SELECT * FROM original_table;

original_table：原数据表
new_table：新复制的数据表

# 查看数据表

# 查看数据库中数据表的名称

方法一：

USE 数据库名; -- 先选择数据库
SHOW TABLES; -- 查看当前数据库中所有的数据表

方法二：

SHOW TABLES FROM 数据库名;

# 查看数据表的结构

方法一：

USE 数据库名; -- 选择数据库
DESC 数据表名 -- 查看数据表的结构

方法二：

SHOW COLUMNS FROM 数据表名 FROM 数据库名;

# 查看表的创建语句

USE 数据库名; -- 选择数据库
SHOW CREATE TABLE 数据表名; -- 查看数据表的创建语句

# 修改数据表

使用 ALTER TABLE 语句修改数据表原有的结构

添加字段：

ALTER TABLE table_name ADD COLUMN col data_type;

table_name：数据表名称
data_type：数据类型
col：要添加的字段

修改字段数据类型：

ALTER TABLE table_name MODIFY COLUMN col data_type;

table_name：数据表名称
data_type：数据类型
col：要修改的字段

修改字段名称：

ALTER TABLE table_name CHANGE COLUMN old_name new_name INT;

table_name：数据表名称
old_name：旧的字段名
new_name：新的字段名

删除字段：

ALTER TABLE table_name DROP COLUMN col;

table_name：数据表名称
col：要删除的字段

添加主键：

ALTER TABLE table_name ADD PRIMARY KEY (col);

table_name: 数据表名称
col：要设置的字段

删除主键：

ALTER TABLE table_name DROP PRIMARY KEY;

table_name: 数据表名称

修改数据表名称：

ALTER TABLE old_table RENAME TO new_table;

old_table：旧的数据表
new_table：新的数据表

# 删除数据表

语法：

DROP TABLE [IF EXISTS] table_name;

table_name：要删除的数据表名称。
IF EXISTS：该语句是可选的，用于检查数据表是否存在。如果表不存在，使用 IF EXISTS 可以避免报错。

示例：

删除名为 mytable 的数据表

DROP TABLE mytable;

也可以同时删除多个数据表

DROP TABLE table1, table2, table3;

# 存储引擎

常用的存储引擎对比

特性	InnoDB	MyISAM	Memory
事务	支持	不支持	不支持
锁	行级锁	表级锁	表级锁
外键	支持	不支持	不支持
崩溃恢复	支持	不支持	不支持
全文索引	MySQL 5.6+ 支持	支持	不支持

InnoDB：适合高并发场景，例如订单支付、实时交易等重要数据 MyISAM：适合存储大量需要快速查找的数据，读取数据效率高，但一次只能一人查找。 Memory：适合临时会话和存储，数据断电丢失

什么是锁？锁存在的意义是什么？

锁如同十字路口的红绿灯，协调“数据”有序存储，避免出现数据错误，在并发环境下，有序控制资源的访问。MyISAM 和 Memory 使用的是表级锁，在同一时间只能由一个事务操作表，所以不具有并发性，但是比较稳定不会出错；InnoDB 使用的是行级锁，仅锁定当前操作的这一行，可以实现高并发，但有可能会出现死锁（指两个或多个事务在执行过程中，因互相等待对方释放锁，而陷入无限等待的状态）的情况

# 查看支持的存储引擎

SHOW ENGINES;

# 指定表的存储引擎

创建一个名为 table_name 的表，该表的存储引擎为 InnoDB

CREATE TABLE table_name (
  ...
) ENGINE=InnoDB;

# 修改数据表的存储引擎

将数据表 table_name 的存储引擎修改为 MyISAM

ALTER TABLE table_name ENGINE=MyISAM;

# 约束

# 主键

将某字段设置为主键，主键起唯一标识表中每行数据的作用，主键的值不能为空

示例：

将字段 id 设置为主键，一个表中只要一个字段可以为主键，用 PRIMARY KEY 表示

CREATE TABLE users (
    id INT PRIMARY KEY,
    name VARCHAR(50)
);

# 外键

外键是用于与其他表建立关系的字段
外键引用的字段必须是唯一的，通常是另一个表的主键
外键可以有多个
外键用语句 FOREIGN KEY 表示

示例：

user_id 当前表的字段
users 要引用字段所在的表
id 引用的字段

将 user_id 设置为外键，引用数据表 users 中的字段 id

CREATE TABLE orders (
    order_id INT PRIMARY KEY,
    user_id INT,
    FOREIGN KEY (user_id) REFERENCES users(id)
        ON DELETE CASCADE  -- 级联删除关联记录
);

外键的其他操作：

操作	说明
`ON DELETE CASCADE`	当主表中的某条记录被删除时，自动删除从表中所有与之关联的记录
`ON DELETE RESTRICT`	阻止删除主表记录（若存在关联从表记录），默认行为
`ON DELETE SET NULL`	主表记录删除时，从表关联字段设为 NULL（字段需允许 NULL 时）
`ON UPDATE CASCADE`	主表主键更新时，从表外键字段同步更新（如修改 users.id 的值时联动）

# 唯一约束

确保字段中的值是唯一的，用 UNIQUE 表示

示例：

CREATE TABLE employees (
    email VARCHAR(100) UNIQUE,
    ...
);

# 非空约束

要求该字段中的值不能为空，用 NOT NULL 语句表示

示例：

CREATE TABLE products (
    name VARCHAR(100) NOT NULL,
    price DECIMAL NOT NULL
);

# 默认值

插入数据时，若未指定值，自动填充默认值。用 DEFAULT 语句表示

示例：

表示如果插入数据时没有指定字段 created_at 的值，将自动使用当前的日期和时间作为默认值。（CURRENT_TIMESTAMP 是一个 MySQL 中的一个函数，用于表示当前的日期和时间）

CREATE TABLE logs (
    created_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP,
    ...
);

# 检查约束

限制字段中的值的范围，用 CHECK () 语句表示 () 中的是限制范围

示例：

将字段 age 的限制在为小于等于 18 的整数

CREATE TABLE students (
    age INT CHECK (age >= 18),
    ...
);

# 自增约束

自动生成唯一递增值（通常与主键搭配），用 AUTO_INCREMENT 语句表示

示例：

CREATE TABLE items (
    id INT AUTO_INCREMENT PRIMARY KEY,
    ...
);

# 查询数据

MySQL 查询数据的语句：

SELECT：指定要查询的列名称
FROM：指定要查询的表
WHERE：指定要查询的条件
GROUP BY：子句用于对查询结构进行分组
HAVING：指定分组的条件
ORDER BY：用于对查询结果的进行排序
LIMIT：限制查询的输出结果的行数

# 查询表中所有数据

SELECT 后面跟着的是要查询的字段
* 是通配符表示查询所有字段
FROM 后面跟着的是所查询的数据表

SELECT * FROM table_name;

# 查询指定字段

查询数据表 table_name 中的字段 a 和 b 这两列的数据

SELECT a, b FROM table_name;

# 条件查询

WHERE 后跟着的是筛选条件

查询数据表 table_name 中字段 a 的数据，并筛选出满足条件 c 的数据

SELECT a FROM table_name 
WHERE c;

示例

查询标价高于20的产品名称和价格

SELECT ProductName, UnitPrice
FROM products
WHERE UnitPrice>20;

查询所有男性雇员的信息（sex是字段名）

SELECT*
FROM employees
WHERE Sex='男';

MySQL 支持算术运算符、比较运算符、逻辑运算符、位运算符

基本运算符

算数运算符

运算符	说明
`+`	加法
`-`	减法
`*`	乘法
`/`或`DIV`	除法
`%`或`MOD`	取余

逻辑运算符

运算符	说明
`NOT`或`!`	非
`AND`或`&&`	与
`OR`和`\| \|`	或
`XOR`	异或

位运算符

运算符	说明	用法
`\`	`\|` 或位或	`a \\| b`
`&`	位与	`a & b`
`^`	位异或	`a ^ b`
`~`	位取反	`~a`
`<<`	位左移	`a << b`
`>>`	位右移	`a >> b`

运算符	说明
`=`	等于
`!=` 或 `<>`	不等于
`>`	大于
`<`	小于
`>=`	大于等于
`<=`	小于等于
`IS NULL`	判断是否为 NULL
`IS NOT NULL`	判断是否不为 NULL

# IN

用于匹配字段值是否在指定的集合中，如果字段值匹配集合中的任意一个值，则返回该行

SELECT * FROM table_name 
WHERE column_name IN (value1, value2, ...);

示例：返回所有 department_id 是 10、20 或 30 的员工记录

SELECT * FROM employees 
WHERE department_id IN (10, 20, 30);

使用子查询，返回所有部门位于 New York 的员工记录（子查询是嵌套在另一个查询中的查询语句）

SELECT * FROM employees 
WHERE department_id IN (SELECT id FROM departments WHERE location = 'New York');

# NOT IN

若该字段没有指定的集合中的值，则返回该行

SELECT * FROM table_name 
WHERE column_name NOT IN (value1, value2, ...);

如果集合或子查询中包含 NULL ，NOT IN 可能会导致意外的结果，因为 NULL 表示未知值，无法判断，查询结果是要保证没有 NULL 值，或者排除 NULL

SELECT * FROM employees 
WHERE department_id NOT IN (10, 20, NULL);

# BETWEEN AND

判断某个字段值是否在一个闭区间范围内

value1：区间的起始值
value2：区间的结束值

value1 <= column_name <= value2

SELECT * FROM table_name 
WHERE column_name BETWEEN value1 AND value2;

示例

示例1：查询年龄在 20 到 30 岁之间的员工

SELECT * FROM employees 
WHERE age BETWEEN 20 AND 30;

等价于

SELECT * FROM employees 
WHERE age >= 20 AND age <= 30;

示例2：查询日期在某个时间段内的记录

SELECT * FROM orders 
WHERE order_date BETWEEN '2024-01-01' AND '2024-12-31';

# NOT BETWEEN AND

BETWEEN AND 的否定，用于表示字段值不在指定的区间内

SELECT * FROM table_name 
WHERE column_name NOT BETWEEN value1 AND value2;

等价于

SELECT * FROM table_name 
WHERE column_name < value1 OR column_name > value2

注意

BETWEEN 可用于数值、日期、字符串等类型，但要确保字段和比较值的类型一致
BETWEEN 'A' AND 'Z' 是有效的，而 BETWEEN 'Z' AND 'A' 会返回空结果
如果字段为 NULL，BETWEEN 和 NOT BETWEEN 都不会匹配它

# IS NULL

由于 NULL 表示“未知”或“无值”，它不能通过普通的比较运算符（如 =、!=）来判断，必须使用 IS NULL 或 IS NOT NULL

不能用 WHERE column = NULL 来判断，必须使用 WHERE column IS NULL
COUNT(*) 包含 NULL

SELECT * FROM table_name 
WHERE column_name IS NULL;

# IS NOT NULL

用于筛选出字段值不为 NULL 的记录

SELECT * FROM table_name 
WHERE column_name IS NOT NULL;

# LIKE

用于模糊匹配字符串的逻辑运算符

SELECT * FROM table_name 
WHERE column_name LIKE pattern;

通配符

通配符	说明
`%`	匹配任意数量的字符（包括零个或多个字符）
`_`	匹配任意一个字符

示例

示例1：查询名字以 "A" 开头的用户

SELECT * FROM users 
WHERE name LIKE 'A%';

示例2：查询名字是 5 个字母的用户

SELECT * FROM users 
WHERE name LIKE '_____' ; -- 五个下划线

# NOT LIKE

LIKE 的否定，用于匹配字段值不符合指定的规则的行

SELECT * FROM table_name 
WHERE column_name NOT LIKE pattern;

示例：查询名字不以 "A" 开头的用户

SELECT * FROM users 
WHERE name NOT LIKE 'A%';

注意

默认情况下 LIKE 不区分大小写，若需区分大小写，可使用 BINARY 模式或 utf8mb4_bin 排序规则
如果需要匹配存在 % 或 _ 字符时会被误以为成通配符，可以使用 ESCAPE 关键字进行转义，例如：LIKE '10\%' ESCAPE '\' 表示匹配 "10%"

# REGEXP

REGEXP 可以通过正则表达式进行匹配，相比 LIKE 运算符 REGEXP 提供了更强大、灵活的模式匹配能力

SELECT * FROM table_name 
WHERE column_name REGEXP 'pattern';

这里的 pattern 指正则表达式

正则表达式常见符号

符号	含义
`^`	匹配字符串的开始位置
`$`	匹配字符串的结束位置
`.`	匹配任意一个字符
`*`	匹配前面的字符 0 次或多次
`+`	匹配前面的字符 1 次或多次
`?`	匹配前面的字符 0 次或 1 次
`[abc]`	匹配括号中的任意一个字符（如 a、b 或 c）
`[^abc]`	不匹配括号中的任意一个字符
`[a-z]`	匹配指定范围内的任意一个字符（如 a 到 z）

示例

示例1：查询以 "A" 开头的名字

SELECT * FROM users 
WHERE name REGEXP '^A';

示例2：查询以 "son" 结尾的名字

SELECT * FROM users 
WHERE name REGEXP 'son$';

示例3：查询包含数字的名字

SELECT * FROM users 
WHERE name REGEXP '[0-9]';

示例4：查询包含 "Li" 或 "Wang" 的名字

SELECT * FROM users 
WHERE name REGEXP 'Li|Wang';

示例5：查询长度为 5 个字母的名字

SELECT * FROM users 
WHERE name REGEXP '^[A-Za-z]{5}$';

# 多条件查询

多条件查询指的是使用多个条件来过滤数据，可以通过 WHERE 使用逻辑运算符（如 AND、OR、NOT）实现

使用 AND 进行多条件查询

示例：查询部门为 "HR" 且工资大于 5000 的员工

SELECT * FROM employees 
WHERE department = 'HR' AND salary > 5000;

使用 OR 进行多条件查询

示例：查询部门为 "HR" 或 "Finance" 的员工

SELECT * FROM employees 
WHERE department = 'HR' OR department = 'Finance';

可以使用括号 ( ) 来控制条件的优先级

示例：查询部门为 "HR" 且工资大于 5000 的员工，或者部门为 "IT" 的员工

SELECT * FROM employees 
WHERE (department = 'HR' AND salary > 5000) OR department = 'IT';

# 排序查询

ORDER BY 是排序语句，ASC 表示升序排序，DESC 表示降序排序
column 是指定的字段，按该列的值进行排序

语法：

ORDER BY column [ASC | DESC]

示例：

查询数据表 table_name 中的所有数据，按照字段 column2 升序排序查询结果

SELECT * FROM table_name 
ORDER BY column2 ASC;

查询数据表 table_name 中的字段 column1 的数据，按照字段 column2 降序排序查询结果

SELECT column1 FROM table_name 
ORDER BY column2 DESC;

# 分组查询

GROUP BY 分组查询常用于分类统计，例如计算每个类别的总数、平均值、最大值、最小值等

column1:：所要查询的字段
column2：查询是会根据 column2 进行分组
table_name：所要查询的数据表
COUNT(*) 表示每个分组中的对象数（行数）

查询数据表 table_name 中的字段 column1 和每个分组中的行数 COUNT(*)，按照字段 column2 进行分组

SELECT column1, COUNT(*) FROM table_name 
GROUP BY column2;

# HAVING

HAVING 子句用于对分组后的结果进行过滤，通常与 GROUP BY 一起使用。它的作用类似于 WHERE 子句，但 WHERE 是在分组前对记录进行过滤，而 HAVING 是在分组后对聚合结果进行过滤

示例

对部门进行分组，并统计每个部门的员工数量，只返回员工数大于 5 的部门

SELECT department, COUNT(*) AS num_employees
FROM employees
GROUP BY department
HAVING num_employees > 5;

# 查询去重

DISTINCT 是一个用于去除重复记录的关键字，通常与 SELECT 语句一起使用

SELECT DISTINCT column_name FROM table_name;

column_name 是需要去重的列

# 单列去重

查询表 employees 中所有不同的部门名称，去除重复值

SELECT DISTINCT department FROM employees;

# 多列去重

查询表 employees 不同部门和职位的组合，只有 department 和 position 当两个字段值都相同时才视为重复

SELECT DISTINCT department, position FROM employees;

DISTINCT 会将多个 NULL 被视为相同的值并只保留一个

# 限制查询结果数

LIMIT 是一个用于限制查询结果返回行数的关键字，常用于仅获取前几条记录的场景

SELECT column1, column2, ... FROM table_name 
WHERE condition LIMIT number;

number 指定返回的最大行数

# 多表查询

当所要查询的信息来自不同的表时，就需要将相关的数据整合在一起查询，这个整合的过程就叫做连接，连接大致分为三种：

交叉连接 CROSS JOIN
内连接 INNER JOIN
外连接 OUTER JOIN（包括左连接 LEFT JOIN 、右连接 RIGHT JOIN、全外连接 FULL JOIN）

# 表别名

为了查询时方便，可以给表设置一个更简短或语义化的名称，方便查询时使用

SELECT 列名
FROM 表名 AS 别名;

示例

原始查询：

SELECT users.name, departments.department_name
FROM users
JOIN departments ON users.department_id = departments.id;

使用表别名后：

SELECT u.name, d.department_name
FROM users AS u
JOIN departments AS d ON u.department_id = d.id;

u 是 users 表的别名
d 是 departments 表的别名

除了表别名列也可以设置别名，例如

SELECT e.employee_name AS "员工姓名", 
       d.department_name AS "部门名称"
FROM employees AS e
JOIN departments AS d ON e.department_id = d.department_id;

# 交叉连接

CROSS JOIN 交叉连接的结果是两个表的笛卡尔积，即第一个表的每一行与第二个表的每一行组合

语法

SELECT 字段名
FROM 表1
CROSS JOIN 表2;

或者用跟简单的写法

SELECT 字段名
FROM 表1, 表2;

示例

表1：学生表

学号	姓名	系别
1001	李勇	信息系
3111	刘晨	信息系
3220	王敏	会计系

表2：成绩表

学号	课程号	成绩
1001	R001	95
1001	S066	80
3111	R001	55

将表1和表2交叉连接后的结果：（两表的笛卡尔积）

学号	姓名	系别	学号	课程号	成绩
1001	李勇	信息系	1001	R001	95
1001	李勇	信息系	1001	S066	80
1001	李勇	信息系	3111	R001	55
3111	刘晨	信息系	1001	R001	95
3111	刘晨	信息系	1001	S066	80
3111	刘晨	信息系	3111	R001	55
3220	王敏	会计系	1001	R001	95
3220	王敏	会计系	1001	S066	80
3220	王敏	会计系	3111	R001	55

交叉连接后的结果并非符合实际情况，如下，两表连接后学号出现不一致的情况

学号	姓名	系别	学号	课程号	成绩
1001	李勇	信息系	3111	R001	55

所以我们要用 WHERE 语句对结果进行筛选，使其只输出符合实际情况的结果

WHERE 学生表.学号 = 成绩表.学号;

注意

利用交叉连接时，是先进行元组连接再进行条件筛选，效率较低；这时可以用内连接的方式，边连接边过滤，提高效率。

# 内连接

INNER JOIN 返回两个表中满足连接条件的所有行的组合。

从第一个表中取出每一行
根据连接条件查找第二个表中的匹配行
对于两表匹配的行进行组合，输出一行结果

如果某行在其中一个表中没有匹配的行，则该行不会出现在结果中。

SELECT 字段名
FROM table1
[INNER] JOIN table2 ON table1.列 = table2.列;

INNER 关键字可以省略，直接写 JOIN 默认为内连接
只有当连接条件 (ON 子句) 满足时，才会返回结果
通常使用主键-外键关系作为连接条件

内连接中允许自连接的情况，就是同一张表进行连接，通常用于查询同一张表中各个记录之间的关系

例如：

SELECT e.emp_id AS '员工ID',
       e.emp_name AS '员工姓名',
       m.emp_id AS '主管ID',
       m.emp_name AS '主管姓名'
FROM employees e
JOIN employees m ON e.manager_id = m.emp_id;

查询结果：

员工ID	员工姓名	主管ID	主管姓名
1002	张三	1001	王经理
1003	李四	1001	王经理
1004	赵五	1002	张三
1005	钱六	1002	张三
1006	孙七	1003	李四

# 外连接

外连接分为以下三种

左连接：LEFT JOIN 保留左表所有记录，匹配的右表记录并连接

SELECT 列名
FROM 表1
LEFT JOIN 表2 ON 表1.列 = 表2.列;

右连接：RIGHT JOIN 保留右表所有记录，匹配的左表记录并连接

SELECT 列名
FROM 表1
RIGHT JOIN 表2 ON 表1.列 = 表2.列;

全外连接：FULL JOIN 连接时保留两表所有记录

SELECT 列名
FROM 表1
FULL JOIN 表2 ON 表1.列 = 表2.列;

为了方便理解外连接中的三种不同连接方式之间的区别，接下来将使用以下两个表举例说明

表1：学生表

student_id	name
1	张三
2	李四
3	王五

表2：课程表

course_id	course_name	student_id
101	数学	1
102	英语	2
103	物理	4

左连接

SELECT s.name, c.course_name 
FROM students s
LEFT JOIN courses c ON s.student_id = c.student_id;

结果：

name	course_name
张三	数学
李四	英语
王五	NULL

右连接

SELECT s.name, c.course_name 
FROM students s
RIGHT JOIN courses c ON s.student_id = c.student_id;

结果：

name	course_name
张三	数学
李四	英语
NULL	物理

全外连接

SELECT s.name, c.course_name 
FROM students s
LEFT JOIN courses c ON s.student_id = c.student_id
UNION
SELECT s.name, c.course_name 
FROM students s
RIGHT JOIN courses c ON s.student_id = c.student_id
WHERE s.student_id IS NULL;

结果：

name	course_name
张三	数学
李四	英语
王五	NULL
NULL	物理

# 子查询

子查询是指嵌套在其他 SQL 查询中的查询语句

语法

SELECT column1 
FROM table1 
WHERE column2 IN (SELECT column2 FROM table2 WHERE condition);

通常用于以下场景：

WHERE 子句中的子查询：作为过滤条件

-- 查询工资高于平均工资的员工
SELECT * FROM employees 
WHERE salary > (SELECT AVG(salary) FROM employees);

FROM 子句中的子查询：作为临时表

-- 查询每个部门的平均工资
SELECT dept_id, avg_salary 
FROM (SELECT dept_id, AVG(salary) AS avg_salary FROM employees GROUP BY dept_id);

SELECT 子句中的子查询：作为返回的值

-- 显示员工姓名及其部门人数
SELECT name, 
       (SELECT COUNT(*) FROM employees e2 WHERE e2.dept_id = e1.dept_id) AS dept_count
FROM employees e1;

EXISTS 或 NOT EXISTS 子查询：检查子查询是否返回结果

-- 查询有订单的客户
SELECT * FROM customers c 
WHERE EXISTS (SELECT 1 FROM orders o WHERE o.customer_id = c.id);

如果子查询无匹配值则主查询不会返回任何行，NOT EXISTS 反之亦然

# 联合查询

联合查询就是将多个查询结果合并成一个结果集。使用联合查询需要满足以下条件：

两个查询必须具有相同数量的字段
字段排列顺序必须相同
对应列的数据类型必须兼容
各结果的字段名可以不同，但结果集会使用第一个查询结果的字段名

语法

SELECT column1, column2, ... FROM table1
UNION [ALL]
SELECT column1, column2, ... FROM table2
[ORDER BY column1, column2, ...];

提示

UNION 会自动去除重复行，UNION ALL 会保留所有行（包括重复的）

# 插入数据

使用 INSERT INTO 向数据表中插入数据

语法

INSERT INTO table_name (column1, column2, ...)
VALUES (value1, value2, ...);

(column1, column2, ...) 是要插入数据的字段，关键字 VALUES 后的 (value1, value2, ...) 是插入数据库的数据
字段名与字段值的顺序要相同，例如值 value1 对应字段 column1；value2 对应字段 column2

如果不写字段名则默认为插入所有字段

INSERT INTO table_name 
VALUES (value1, value2, ...);

如果要一次性插入多行数据可以这样

INSERT INTO table_name (column1, column2, ...)
VALUES 
    (value1, value2, ...),
    (value3, value4, ...),
    ...;

注意

插入数据时值可以为空但不能缺少，例如三个字段只插入了两个值

(value1, value2) 是错误的
(value1, value2, ) 是正确的，由于最后一个值为空，会被设为 NULL

# 将查询结果插入表中

插入其他表中的数据，例如

INSERT INTO archive_users (id, username, email)
SELECT id, username, email FROM users 
WHERE created_at < '2023-01-01';

这段 SQL 语句将 users 表中筛选出来的数据插入了数据表 archive_users 中

# 替换数据

使用 REPLACE 替换表中的数据，如果插入的记录在数据表中已存在，则执行替换原有数据，如不存在，则执行插入操作

示例：

REPLACE INTO settings (user_id, theme)
VALUES (1, 'dark');

# 更新数据

通过 UPDATE 语句实现更新数据表中的数据

语法

UPDATE table_name 
SET column1 = value1, column2 = value2, ...
WHERE condition;

SET 语句用于设置更新的数据，以 字段 = 值 的格式编写，如果有多字段的更新用
WHERE 语句用于设置筛选条件，确定要更新的地方，例如确定更新该字段的哪一条记录，如果没有 WHERE 语句，将更新该字段的所有记录

# 删除数据

使用 DELETE 语句删除数据表中的数据

-- 删除表中所有数据
DELETE FROM table_name;

删除数据表中满足条件的数据

DELETE FROM table_name WHERE condition;

示例

-- 删除users表中id为5的记录
DELETE FROM users WHERE id = 5;

-- 删除订单表中3天前的数据
DELETE FROM orders WHERE created_at < DATE_SUB(NOW(), INTERVAL 3 DAY);

-- 分批删除数据（先删除1000条记录）
DELETE FROM large_table WHERE id < 10000 LIMIT 1000;

使用 TRUNCATE TABLE 清空表

TRUNCATE TABLE table_name;

各删除语句对比

	`TRUNCATE`	`DELETE`	`DROP`
作用	清空表	删除行	删除表
语句类别	DDL	DML	DDL
删除表内容	✅	✅	✅
删除表结构	❌	❌	✅
释放空间	✅	❌	✅
执行速度	⚡极快	⏱️较慢	⚡极快
可回滚	❌	✅	❌

# 视图

视图是一种虚拟表，基于一个或多个表的查询结果集

视图本身不存储数据，数据来自基本表
视图可以封装复杂查询逻辑，简化查询，隐藏表结构细节，方便复用
视图保存的是表的结构，如果改变基本表的结构不会影响视图的定义
视图不支持索引

视图一般情况下是不可更新的，若要更新视图需要满足以下条件

只从一个基表派生
不包含聚合函数
不包含 DISTINCT、GROUP BY、HAVING 语句
不包含子查询

满足以上条件可以执行 UPDATE、DELETE、INSERT 操作

创建视图

CREATE VIEW view_name AS
...

示例：

CREATE VIEW view_name AS
SELECT column1, column2, ...
FROM table_name
WHERE condition;

修改视图

ALTER VIEW view_name AS
...

示例：

ALTER VIEW view_name AS
SELECT column1, column2, ...
FROM table_name
WHERE new_condition;

示例：用视图简化查询

这是一个复杂的基本表的查询语句

SELECT 
    c.customer_id,
    c.customer_name,
    c.email,
    o.order_id,
    o.order_date,
    o.total_amount,
    p.product_name,
    oi.quantity,
    oi.price
FROM 
    customers c
JOIN 
    orders o ON c.customer_id = o.customer_id
JOIN 
    order_items oi ON o.order_id = oi.order_id
JOIN 
    products p ON oi.product_id = p.product_id;

给这个复杂的查询创建一个视图

CREATE VIEW customer_order_details AS
SELECT 
    c.customer_id,
    c.customer_name,
    c.email,
    o.order_id,
    o.order_date,
    o.total_amount,
    p.product_name,
    oi.quantity,
    oi.price
FROM 
    customers c
JOIN 
    orders o ON c.customer_id = o.customer_id
JOIN 
    order_items oi ON o.order_id = oi.order_id
JOIN 
    products p ON oi.product_id = p.product_id;

现在我们就可以直接使用视图，通过简单的查询语句查询之前那个复杂查询结果集里的数据

-- 查询所有客户订单详情
SELECT * FROM customer_order_details;

-- 查询特定客户的订单
SELECT * FROM customer_order_details 
WHERE customer_id = 1001;

-- 查询特定产品的销售情况
SELECT * FROM customer_order_details 
WHERE product_name = '智能手机';

# 权限

常用权限列表

权限	说明
`ALL`	所有权限
`CREATE`	创建数据库/表
`DROP`	删除数据库/表
`ALTER`	修改表结构
`DELETE`	删除数据
`INSERT`	插入数据
`SELECT`	查询数据
`UPDATE`	更新数据
`INDEX`	创建/删除索引
`CREATE VIEW`	创建视图
`SHOW VIEW`	查看视图定义
`EXECUTE`	执行存储过程
`GRANT OPTION`	授权其他用户

# 创建用户

CREATE USER 'username'@'host' IDENTIFIED BY 'password';

若 host 为 % 时表示从任何 IP 连接
host 可以为IP地址，例如 192.168.43.1，也可以为 localhost 表示本地
username 为用户名 password 为用户密码

# 授予权限

GRANT 权限类型 ON 数据库.对象 TO '用户'@'主机';

示例：给用户 'admin'@'localhost' 授予在数据库 myshop 中 SELECT（查询数据）和 INSERT（插入数据）的权限

GRANT SELECT, INSERT ON myshop.* TO 'admin'@'localhost';

# 撤销权限

REVOKE 权限类型 ON 数据库.对象 FROM '用户'@'主机';

示例：撤销用户 'shop_user'@'192.168.43.1' 在数据库 myshop 的 orders 字段上的 DELETE（删除数据）的权限

REVOKE DELETE ON myshop.orders FROM 'shop_user'@'192.168.43.1';

# 查看权限

查看当前用户权限

SHOW GRANTS;

查看指定用户权限

SHOW GRANTS FOR 'username'@'host';