零基础学SQL(1):初识数据库与SQL
一、初识数据库
数据库是将大量数据保存起来,通过计算机加工而成的可以 进行高效访问的数据集合。该数据集合称为数据库(Database,DB)。用来管理数据库的计算机系统称为数据库管理系统(Database Management System,DBMS)。
什么是数据库?
大家都有过下面这样的经历吧?
- 收到曾经为自己诊治过的牙医寄来的明信片,上面写着“距上次检查已有半年,请您再来做个牙齿健康检查”。
- 在生日的前一个月,收到曾入住过的旅店或宾馆发来的“生日当月入住优惠”的邮件或者明信片。
- 在网上商城购物之后,收到内附“推荐商品列表”的邮件。
这可能是因为牙医、旅店或商城的经营者掌握了顾客上一次的就诊日期、生日和购买历史等信息,并且拥有能够从大量汇总信息中快速获取所需信息(比如你的住址或爱好)的设备(计算机系统)。如果利用人工完成同样的工作,真不知道要多长时间呢。
另外,现在所有地区的图书馆都配备了计算机,实现了图书的自动查询。使用该系统,可以通过检索书名或出版年份快速查找出希望借阅的图书的所在位置,以及是否已经借出等信息。正是因为拥有了可以保存图书名称、出版年份以及保管位置和外借情况等信息,并且可以按需查询的设备,才使这一切成为可能。
像这样将大量数据保存起来,通过计算机加工而成的可以进行高效访问的数据集合称为数据库(Database,DB)。将姓名、住址、电话号码、邮箱地址、爱好和家庭构成等数据保存到数据库中,就可以随时迅速获取想要的信息了。
转自https://www.sohu.com/a/319739059_120104204
什么是数据库管理系统(DBMS)?
用来管理数据库的计算机系统称为数据库管理系统(Database Management System,DBMS)。为什么要使用专用系统(DBMS)来管理数据呢?
我们通过计算机管理数据的时候,通常使用文本文件或者Excel 那样的电子制表软件就可以完成了,非常简单。但也有不足。下面就举几个有代表性的例子。
-
无法多人共享数据。保存在已连接网络的计算机中的文件,可以通过共享设定实现多个用户在线阅读或编辑。但是,当某个用户打开该文件的时候,其他用户就无法进行编辑了。如果是网上商城的话,当某个用户购买商品的时候,其他用户就无法购买了。
-
无法提供操作大量数据所需的格式。要想瞬间从几十万或者上百万的数据中获取想要的数据,必须把数据保存为适当的格式,但是文本文件和Excel 工作表等无法提供相应的格式。
3.实现读写自动化需要编程能力。通过编写计算机程序(以下简称程序)可以实现数据读取和编辑自动化,但这必须以了解数据结构为前提,还需具备一定的计算机编程技术。
4.无法应对突发事故。当文件被误删、硬盘出现故障等导致无法读取的时候,可能会造成重要数据丢失,同时数据还可能被他人轻易读取或窃用。
DBMS 可以克服这些不足,实现多个用户同时安全简单地操作大量数据,这也是我们一定要使用DBMS 的原因。
1.1 DBMS的种类
DBMS 主要通过数据的保存格式(数据库的种类)来进行分类,现阶段主要有以下 5 种类型.
- 层次数据库(Hierarchical Database,HDB)——“树形”结构
- 关系数据库(Relational Database,RDB)——行列组成的二维表
- 面向对象数据库(Object Oriented Database,OODB)——把数据以及对数据的操作集合起来以对象为单位进行管理,保存这些对象。
- XML数据库(XML Database,XMLDB)——XMLB 作为在网络上进行交互的数据的形式逐渐普及起来。XML 数据库可以对XML 形式的大量数据进行高速处理。
- 键值存储系统(Key-Value Store,KVS),举例:MongoDB——这是一种单纯用来保存查询所使用的主键(Key)和值(Value)的组合的数据库。具有编程语言知识的读者可以把它想象成关联数组或者散列(hash)。近年来,随着键值存储系统被应用到Google 等需要对大量数据进行超高速查询的Web 服务当中,它正逐渐为人们所关注。
在这5种中,关系数据库是现在应用最广泛的数据库。关系数据库在1969 年诞生,可谓历史悠久。和Excel 工作表一样,它也采用由行和列组成的二维表来管理数据,所以简单易懂。同时,它还使用专门的SQL(Structured Query Language,结构化查询语言)对数据进行操作。这种类型的 DBMS 称为关系数据库管理系统(Relational Database Management System,RDBMS)。
比较具有代表性的 RDBMS 有如下 5 种:
- Oracle Database:甲骨文公司的RDBMS
- SQL Server:微软公司的RDBMS
- DB2:IBM公司的RDBMS
- PostgreSQL:开源的RDBMS
- MySQL:开源的RDBMS
本文向大家介绍使用 SQL 语言的数据库管理系统,也就是关系数据库管理系统(RDBMS)的操作方法。
1.2 RDBMS的常见系统结构
使用 RDBMS 时,最常见的系统结构就是客户端 / 服务器类型(C/S类型)这种结构。
服务器指的是用来接收其他程序发出的请求,并对该请求进行相应处理的程序(软件),或者是安装了此类程序的设备(计算机)。在计算机上持续执行处理,并等待接收下一条请求。RDBMS 也是一种服务器,它能够从保存在硬盘上的数据库中读取数据并返回,还可以把数据变更为指定内容。
与之相对,向服务器发出请求的程序(软件),或者是安装了该程序的设备(计算机)称为客户端。访问由RDBMS 管理的数据库,进行数据读写的程序称为RDBMS 客户端。RDBMS 客户端将想要获取什么样的数据,或者想对哪些数据进行何种变更等信息通过SQL 语句发送给RDBMS 服务器。RDBMS 根据该语句的内容返回所请求的数据,或者对存储在数据库中的数据进行更新。
客户端就如同委托方,而服务器就像是受托方。由于两者关系类似受托方执行委托方发出的指令,故而得名。
这样就可以使用SQL 语句来实现关系数据库的读写操作了。
另外,RDBMS 既可以和其客户端安装在同一台计算机上,也可以分别安装在不同的计算机上。这样一来,不仅可以通过网络使二者相互关联,还可以实现多个客户端访问同一个RDBMS。
虽然RDBMS 的系统结构多种多样,但是从客户端发来的SQL 语句基本上都是一样的。
1.3 数据库安装(必须学习)
本次学习大家可以选择使用阿里云数据库服务器或者本地安装数据库进行学习,在下面对应的学习教程中也给告诉了大家如何创建本次学习需要的数据库表和数据,所以大家必须使用一个方式安装数据库,才能完成后面学习。
1.3.1 阿里云MySQL服务器使用介绍
节约篇幅,具体相关介绍以及给大家写到pdf里了,大家点击链接即可进入查看:
http://tianchi-media.oss-cn-beijing.aliyuncs.com/dragonball/SQL/other/阿里云MySQL服务器使用介绍.pdf
优点: 操作使用方便,未来趋势(数据上云),导入、导出数据方便,运行速度快。
缺点: 需要付费购买,不过现在对开发者有优惠活动,基础版本 1核1G,存储空间20G的,目前优惠价半年只需9.9元,一杯奶茶钱不到。
1.3.2 本地MySQL环境搭建方法介绍
节约篇幅,具体相关介绍以及给大家写到pdf里了,大家点击链接即可进入查看:
http://tianchi-media.oss-cn-beijing.aliyuncs.com/dragonball/SQL/other/本地MySQL环境搭建方法介绍.pdf
优点: 免费,增强动手能力。
缺点: 安装、配置麻烦,数据导入、导出耗时长。
二、初识SQL
2.1 概念介绍
数据库中存储的表结构类似于excel中的行和列,在数据库中,行称为记录,它相当于一条记录,列称为字段,它代表了表中存储的数据项目。
行和列交汇的地方称为单元格,一个单元格中只能输入一条记录。
SQL是为操作数据库而开发的语言。国际标准化组织(ISO)为 SQL 制定了相应的标准,以此为基准的SQL 称为标准 SQL(相关信息请参考专栏——标准 SQL 和特定的 SQL)。
完全基于标准 SQL 的 RDBMS 很少,通常需要根据不同的 RDBMS 来编写特定的 SQL 语句,原则上,本文介绍的是标准 SQL 的书写方式。
SQL 语句及其种类
SQL 用关键字、表名、列名等组合而成的一条语句(SQL 语句)来描述操作的内容。关键字是指那些含义或使用方法已事先定义好的英语单词,存在包含“对表进行查询”或者“参考这个表”等各种意义的关键字。
根据对RDBMS 赋予的指令种类的不同,SQL 语句可以分为以下三类。
- DDL(Data Definition Language,数据定义语言) 用来创建或者删除存储数据用的数据库以及数据库中的表等对象。
DDL 包含以下几种指令:
CREATE : 创建数据库和表等对象
DROP : 删除数据库和表等对象
ALTER : 修改数据库和表等对象的结构
- DML(Data Manipulation Language,数据操纵语言) 用来查询或者变更表中的记录。
DML 包含以下几种指令。
SELECT :查询表中的数据
INSERT :向表中插入新数据
UPDATE :更新表中的数据
DELETE :删除表中的数据
- DCL(Data Control Language,数据控制语言) 用来确认或者取消对数据库中的数据进行的变更。除此之外,还可以对 RDBMS 的用户是否有权限操作数据库中的对象(数据库表等)进行设定。
DCL 包含以下几种指令。
COMMIT : 确认对数据库中的数据进行的变更
ROLLBACK : 取消对数据库中的数据进行的变更
GRANT : 赋予用户操作权限
REVOKE : 取消用户的操作权限
实际使用的 SQL 语句当中有 90% 属于 DML,本课程会以 DML 为中心进行讲解
2.2 SQL的基本书写规则
- SQL语句要以分号( ; )结尾
- SQL 不区分关键字的大小写,但是插入到表中的数据是区分大小写的
- win 系统默认不区分表名及字段名的大小写
- linux / mac 默认严格区分表名及字段名的大小写
- 本教程已统一调整表名及字段名的为小写,以方便初学者学习使用。
- 常数的书写方式是固定的
‘abc’, 1234, ‘26 Jan 2010’, ‘10/01/26’, ‘2010-01-26’…
SQL 语句的单词之间需使用半角空格或换行符来进行分隔,且不能使用全角空格作为单词的分隔符,否则会发生错误,出现无法预期的结果。
请大家认真查阅《附录1 - SQL 语法规范》,养成规范的书写习惯。
2.3 数据库的创建( CREATE DATABASE 语句)
语法:
CREATE DATABASE < 数据库名称 > ;
创建本课程使用的数据库
CREATE DATABASE shop;
2.4 表的创建( CREATE TABLE 语句)
语法:
CREATE TABLE < 表名 >
( < 列名 1> < 数据类型 > < 该列所需约束 > ,
< 列名 2> < 数据类型 > < 该列所需约束 > ,
< 列名 3> < 数据类型 > < 该列所需约束 > ,
< 列名 4> < 数据类型 > < 该列所需约束 > ,
.
.
.
< 该表的约束 1> , < 该表的约束 2> ,……);
创建本课程用到的商品表
CREATE TABLE product(
product_id CHAR(4) NOT NULL,
product_name VARCHAR(100) NOT NULL,
product_type VARCHAR(32) NOT NULL,
sale_price INTEGER,
purchase_price INTEGER,
regist_date DATE,
PRIMARY KEY(product_id)
) ;
2.5 命名规则
- 只能使用半角英文字母、数字、下划线(_)作为数据库、表和列的名称
- 名称必须以半角英文字母开头
表1-3 商品表和 product 表列名的对应关系
2.6 数据类型的指定
数据库创建的表,所有的列都必须指定数据类型,每一列都不能存储与该列数据类型不符的数据。
四种最基本的数据类型
-
INTEGER 型。用来指定存储整数的列的数据类型(数字型),不能存储小数。
-
CHAR 型。用来存储定长字符串,当列中存储的字符串长度达不到最大长度的时候,使用半角空格进行补足,由于会浪费存储空间,所以一般不使用。
-
VARCHAR 型。用来存储可变长度字符串,定长字符串在字符数未达到最大长度时会用半角空格补足,但可变长字符串不同,即使字符数未达到最大长度,也不会用半角空格补足。
-
DATE 型。用来指定存储日期(年月日)的列的数据类型(日期型)。
2.7 约束的设置
约束是除了数据类型之外,对列中存储的数据进行限制或者追加条件的功能。
NOT NULL
是非空约束,即该列必须输入数据。
PRIMARY KEY
是主键约束,代表该列是唯一值,可以通过该列取出特定的行的数据。
2.8 表的删除和更新
DROP TABLE < 表名 > ;
- 删除 product 表。需要特别注意的是,删除的表是无法恢复的,只能重新插入,请执行删除操作时无比要谨慎。
DROP TABLE product;
ALTER TABLE < 表名 > ADD COLUMN < 列的定义 >;
- 添加一列可以存储100位的可变长字符串的 product_name_pinyin 列
ALTER TABLE product ADD COLUMN product_name_pinyin VARCHAR(100);
ALTER TABLE < 表名 > DROP COLUMN < 列名 >;
ALTER TABLE product DROP COLUMN product_name_pinyin;
ALTER TABLE 语句和 DROP TABLE 语句一样,执行之后无法恢复。误添的列可以通过 ALTER TABLE 语句删除,或者将表全部删除之后重新再创建。
【扩展内容】
TRUNCATE TABLE TABLE_NAME;
优点:相比drop``/``delete
,truncate
用来清除数据时,速度最快。
基本语法:
UPDATE <表名>
SET <列名> = <表达式> [, <列名2>=<表达式2>…];
WHERE <条件>; – 可选,非常重要。
ORDER BY 子句; --可选
LIMIT 子句; --可选
使用 update 时要注意添加 where 条件,否则将会将所有的行按照语句修改
– 修改所有的注册时间
UPDATE product
SET regist_date = ‘2009-10-10’;
– 仅修改部分商品的单价
UPDATE product
SET sale_price = sale_price * 10
WHERE product_type = ‘厨房用具’;
使用 UPDATE 也可以将列更新为 NULL(该更新俗称为NULL清空)。此时只需要将赋值表达式右边的值直接写为 NULL 即可。
– 将商品编号为0008的数据(圆珠笔)的登记日期更新为NULL
UPDATE product
SET regist_date = NULL
WHERE product_id = ‘0008’;
和 INSERT 语句一样, UPDATE 语句也可以将 NULL 作为一个值来使用。
但是,只有未设置 NOT NULL 约束和主键约束的列才可以清空为NULL。如果将设置了上述约束的列更新为 NULL,就会出错,这点与INSERT 语句相同。
多列更新
UPDATE 语句的 SET 子句支持同时将多个列作为更新对象。
– 基础写法,一条UPDATE语句只更新一列
UPDATE product
SET sale_price = sale_price * 10
WHERE product_type = ‘厨房用具’;
UPDATE product
SET purchase_price = purchase_price / 2
WHERE product_type = ‘厨房用具’;
该写法可以得到正确结果,但是代码较为繁琐。可以采用合并的方法来简化代码。
– 合并后的写法
UPDATE product
SET sale_price = sale_price * 10,
purchase_price = purchase_price / 2
WHERE product_type = ‘厨房用具’;
需要明确的是,SET 子句中的列不仅可以是两列,还可以是三列或者更多。
2.9 向 product 表中插入数据
为了学习INSERT
语句用法,我们首先创建一个名为productins
的表,建表语句如下:
CREATE TABLE productins
(product_id CHAR(4) NOT NULL,
product_name VARCHAR(100) NOT NULL,
product_type VARCHAR(32) NOT NULL,
sale_price INTEGER DEFAULT 0,
purchase_price INTEGER ,
regist_date DATE ,
PRIMARY KEY (product_id));
基本语法:
INSERT INTO <表名> (列1, 列2, 列3, ……) VALUES (值1, 值2, 值3, ……);
对表进行全列 INSERT 时,可以省略表名后的列清单。这时 VALUES子句的值会默认按照从左到右的顺序赋给每一列。
– 包含列清单
INSERT INTO productins (product_id, product_name, product_type, sale_price, purchase_price, regist_date) VALUES (‘0005’, ‘高压锅’, ‘厨房用具’, 6800, 5000, ‘2009-01-15’);
– 省略列清单
INSERT INTO productins
VALUES (‘0005’, ‘高压锅’, ‘厨房用具’, 6800, 5000, ‘2009-01-15’);
原则上,执行一次 INSERT 语句会插入一行数据。插入多行时,通常需要循环执行相应次数的 INSERT 语句。其实很多 RDBMS 都支持一次插入多行数据
– 通常的INSERT
INSERT INTO productins VALUES (‘0002’, ‘打孔器’, ‘办公用品’, 500, 320, ‘2009-09-11’);
INSERT INTO productins VALUES (‘0003’, ‘运动T恤’, ‘衣服’, 4000, 2800, NULL);
INSERT INTO productins VALUES (‘0004’, ‘菜刀’, ‘厨房用具’, 3000, 2800, ‘2009-09-20’);
– 多行INSERT ( DB2、SQL、SQL Server、PostgreSQL 和 MySQL多行插入)
INSERT INTO productins VALUES (‘0002’, ‘打孔器’, ‘办公用品’, 500, 320, ‘2009-09-11’),(‘0003’, ‘运动T恤’, ‘衣服’, 4000, 2800, NULL),(‘0004’, ‘菜刀’, ‘厨房用具’, 3000, 2800, ‘2009-09-20’);
– Oracle中的多行INSERT
INSERT ALL INTO productins VALUES (‘0002’, ‘打孔器’, ‘办公用品’, 500, 320, ‘2009-09-11’)
INTO productins VALUES (‘0003’, ‘运动T恤’, ‘衣服’, 4000, 2800, NULL)
INTO productins VALUES (‘0004’, ‘菜刀’, ‘厨房用具’, 3000, 2800, ‘2009-09-20’)
SELECT * FROM DUAL;
– DUAL是Oracle特有(安装时的必选项)的一种临时表A。因此“SELECT *FROM DUAL” 部分也只是临时性的,并没有实际意义。
INSERT 语句中想给某一列赋予 NULL 值时,可以直接在 VALUES子句的值清单中写入 NULL。想要插入 NULL 的列一定不能设置 NOT NULL 约束。
INSERT INTO productins (product_id, product_name, product_type, sale_price, purchase_price, regist_date) VALUES (‘0006’, ‘叉子’, ‘厨房用具’, 500, NULL, ‘2009-09-20’);
还可以向表中插入默认值(初始值)。可以通过在创建表的CREATE TABLE 语句中设置DEFAULT约束来设定默认值。
CREATE TABLE productins
(product_id CHAR(4) NOT NULL,
(略)
sale_price INTEGER
(略) DEFAULT 0, – 销售单价的默认值设定为0;
PRIMARY KEY (product_id));
可以使用INSERT … SELECT 语句从其他表复制数据。
– 将商品表中的数据复制到商品复制表中
INSERT INTO productocpy (product_id, product_name, product_type, sale_price, purchase_price, regist_date)
SELECT product_id, product_name, product_type, sale_price, purchase_price, regist_date
FROM Product;
本课程用表插入数据sql如下:
- DML :插入数据
STARTTRANSACTION;
INSERT INTO product VALUES(‘0001’, ‘T恤衫’, ‘衣服’, 1000, 500, ‘2009-09-20’);
INSERT INTO product VALUES(‘0002’, ‘打孔器’, ‘办公用品’, 500, 320, ‘2009-09-11’);
INSERT INTO product VALUES(‘0003’, ‘运动T恤’, ‘衣服’, 4000, 2800, NULL);
INSERT INTO product VALUES(‘0004’, ‘菜刀’, ‘厨房用具’, 3000, 2800, ‘2009-09-20’);
INSERT INTO product VALUES(‘0005’, ‘高压锅’, ‘厨房用具’, 6800, 5000, ‘2009-01-15’);
INSERT INTO product VALUES(‘0006’, ‘叉子’, ‘厨房用具’, 500, NULL, ‘2009-09-20’);
INSERT INTO product VALUES(‘0007’, ‘擦菜板’, ‘厨房用具’, 880, 790, ‘2008-04-28’);
INSERT INTO product VALUES(‘0008’, ‘圆珠笔’, ‘办公用品’, 100, NULL, ‘2009-11-11’);
COMMIT;
三、练习题
编写一条 CREATE TABLE 语句,用来创建一个包含表 1-A 中所列各项的表 Addressbook (地址簿),并为 regist_no (注册编号)列设置主键约束
表1-A 表 Addressbook (地址簿)中的列
3.2
假设在创建练习1.1中的 Addressbook 表时忘记添加如下一列 postal_code (邮政编码)了,请把此列添加到 Addressbook 表中。
列名 : postal_code
数据类型 :定长字符串类型(长度为 8)
约束 :不能为 NULL
3.3
编写 SQL 语句来删除 Addressbook 表。
3.4
编写 SQL 语句来恢复删除掉的 Addressbook 表。