完美世界辰东,完美世界辰东小说下载

主頁 > 知識庫 > MySQL中建表時可空（NULL）和非空（NOT NULL）的用法詳解

MySQL中建表時可空（NULL）和非空（NOT NULL）的用法詳解

對于MySQL的一些個規(guī)范，某些公司建表規(guī)范中有一項要求是所有字段非空，意味著沒有值的時候存儲一個默認值。其實所有字段非空這么說應該是絕對了，應該說是盡可能非空，某些情況下不可能給出一個默認值。
那么這條要求，是基于哪些考慮因素，存儲空間？相關增刪查改操作的性能？亦或是其他考慮？該理論到底有沒有道理或者可行性，本文就個人的理解，做一個粗淺的分析。

1，基于存儲的考慮

1，對于變長字段，當相關的字段值為NULL時，相關字段不會占用存儲空間。NULL值沒有存儲，不占空間，但是需要一個標志位（一行一個）。
2，對于變長字段，相關字段要求NOT NULL，存儲成''的時候，也不占用空間，如果一個表中所有的字典都NOT NULL，行頭不需要NULL的標志位
3，所有字段都是定長，不管是否要求為NOT NULL，都不需要標志位，同時不需要存儲變長列長度

鑒于null值和非空（not null default ''）兩種情況，如果一個字段存儲的內(nèi)容是空，也就是什么都沒有，前者存儲為null，后者存儲為空字符串'',兩者字段內(nèi)容本身存儲空間大小是一樣的。
但是如果一個表中存儲在可空字段的情況下，其對應的數(shù)據(jù)行的頭部，都需要一個1字節(jié)的NULL標志位，這個就決定了存儲同樣的數(shù)據(jù)，如果允許為null，相比not null的情況下，每行多了一個字節(jié)的存儲空間的。
這個因素或者就是某些公司或者個人堅持“所有表禁止null字段”這個信仰的原因之一（個人持否定態(tài)度，可以嘗試將數(shù)據(jù)庫中所有的字段都至為not null 然后default一個值后會不會雞飛狗跳）。
這里不再去做“微觀”的分析，直接從“宏觀”的角度來看一下差異。

測試demo

直接創(chuàng)建結構一致，但是一個表字段not null，一個表字段為null，然后使用存儲此過程，兩張表同時按照null值與非null值1:10的比例寫入數(shù)據(jù)，也就是說每10行數(shù)據(jù)中1行數(shù)據(jù)字段為null的方式寫入600W行數(shù)據(jù)。

CREATE TABLE a
(
 id INT AUTO_INCREMENT,
 c2 VARCHAR(50) NOT NULL DEFAULT '',
 c3 VARCHAR(50) NOT NULL DEFAULT '',
 PRIMARY KEY (id)
);

CREATE TABLE b
(
 id INT AUTO_INCREMENT,
 c2 VARCHAR(50),
 c3 VARCHAR(50),
 PRIMARY KEY (id)
);


CREATE DEFINER=`root`@`%` PROCEDURE `create_test_data`(
 IN `loop_cnt` INT
)
LANGUAGE SQL
NOT DETERMINISTIC
CONTAINS SQL
SQL SECURITY DEFINER
COMMENT ''
BEGIN
 DECLARE v2 , v3 VARCHAR(36);
 
 START TRANSACTION;
 
 while loop_cnt>0 do
 SET v2 = UUID();
 SET v3 = UUID();

 
 if (loop_cnt MOD 10) = 0 then
 INSERT INTO a (c2,c3) VALUES(DEFAULT,DEFAULT);
 INSERT INTO b (c2,c3) VALUES(DEFAULT,DEFAULT);
 else
 INSERT INTO a (c2,c3) VALUES (v2,v3);
 INSERT INTO b (c2,c3) VALUES (v2,v3);
 END if ;
 
 SET loop_cnt=loop_cnt-1;
 END while;
 COMMIT;

a,b兩張表生產(chǎn)完全一致的數(shù)據(jù)。

查看占用的存儲空間情況，從information_schema.TABLES中查詢這兩個表的存儲信息

1，一個字節(jié)的差別，體現(xiàn)在avg_row_length,a表因為所有的字段都是not null，因此相比b表，每行節(jié)省了每行節(jié)省了一個字節(jié)的存儲
2，總得空間的差別：a表662683648/1024/1024=631.98437500MB，b表666877952/1024/1024=635.98437500MB，
　也當前情況下，600W行數(shù)據(jù)有4MB的差異，差異在1%之內(nèi)，其實實際情況下，字段多，table size更大的的時候，這個差異會遠遠小于1%。

就存儲空間來說，你跟我說1T的數(shù)據(jù)庫你在乎1GB的存儲空間，隨便一點數(shù)據(jù)/索引碎片空間，一點預留空間，垃圾文件空間，無用索引空間……，都遠遠大于可為空帶來的額外這一點差異。

2，增刪查改的效率

讀寫操作對比，通過連續(xù)讀寫一個范圍之內(nèi)的數(shù)據(jù)，來對比a，b兩張表在讀上面的情況。
　　2.1.）首先buffer pool是遠大于table size的，因此不用擔心物理IO引起的差異，目前兩張表的數(shù)據(jù)完全都存在與buffer pool中。
　　2.1.）讀測試操作放在MySQL實例機器上，因此網(wǎng)絡不穩(wěn)定引起的差異可以忽略。

增刪查改的差異與存儲空間的差異類似，甚至更小，因為單行相差1個字節(jié)，放大到600W+才能看到一個5MB級別的差異，增刪查改的話，各種測試下來，沒有發(fā)現(xiàn)有明顯的差異

#!/usr/bin/env python3
import pymysql
import time
mysql_conn_conf = {'host': '127.0.0.1', 'port': 3306, 'user': 'root', 'password': '******', 'db': 'db01'}


def mysql_read(table_name):
 conn = pymysql.connect(host=mysql_conn_conf['host'], port=mysql_conn_conf['port'], database=mysql_conn_conf['db'],user=mysql_conn_conf['user'],password = mysql_conn_conf['password'])
 cursor = conn.cursor()
 try:
 cursor.execute(''' select id,c2,c3 from {0} where id>3888888 and id3889999;'''.format(table_name))
 row = cursor.fetchall()
 except pymysql.Error as e:
 print("mysql execute error:", e)
 cursor.close()
 conn.close()


def mysql_write(loop,table_name):
 conn = pymysql.connect(host=mysql_conn_conf['host'], port=mysql_conn_conf['port'], database=mysql_conn_conf['db'],user=mysql_conn_conf['user'],password = mysql_conn_conf['password'])
 cursor = conn.cursor()
 try:
 if loop%10 == 0:
 cursor.execute(''' insert into {0}} (c2,c3) values(DEFAULT,DEFAULT)'''.format(table_name))
 else:
 cursor.execute(''' insert into {1}} (c2,c3) values(uuid(),uuid())'''.format(table_name))
 except pymysql.Error as e:
 print("mysql execute error:", e)
 cursor.close()
 conn.commit()
 conn.close()


if __name__ == '__main__':
 time_start = time.time()
 loop=10
 while loop>0:
 mysql_write(loop)
 loop = loop-1

 time_end = time.time()
 time_c= time_end - time_start
 print('time cost', time_c, 's')

3，相關字段上的語義解析和邏輯考慮

這一點就觀點差異就太多了，也是最容易引起口水或者爭議的了。

1，對于字符類型，NULL就是不存在，‘'就是空，不存在和空本身就不是一回事，不太認同一定要NOT NULL，然后給出默認值。
2，對于字符類型，任何數(shù)據(jù)庫中，NULL都是不等于NULL的，因為在處理相關字段上進行join或者where篩選的時候，是不需要考慮連接雙方都為NULL的情況的，一旦用''替代了NULL，''是等于''的，此時就會出現(xiàn)與存儲NULL完全不用的語義
3，對于字符類型，一旦將相關字段default成''，如何區(qū)分''與空字符串，比如備注字段，不允許為NULL，default成‘'，那么怎么區(qū)分，NULL表達的空和默認值的空字符串''
4，對于相關的查詢操作，如果允許為NULL，篩選非NULL值就是where *** is not null，語義上很清晰直觀，一旦用字段非空，默認成''，會使用where *** >''這種看起來超級惡心的寫法，究竟要表達什么，語義上就已經(jīng)開始模糊了
5，對于時間類型，絕大多數(shù)時候是不允許有默認值的，默認多少合適，當前時間合適么，千禧年2000合適么，2008年北京奧運會開幕時間合適么？
6，對于數(shù)值類型，比如int，比如decimal，在可空的情況下，如果禁止為NULL，默認給多少合適，0合適嗎？-1合適嗎？-9999999……合適嗎？10086合適嗎？1024合適嗎？說實話，默認多少都不合適，NULL自身就是最合適的。

個人觀點很明確，除非有特殊的需求要求一個字段絕對不能出現(xiàn)NULL值的情況，正常情況下，該NULL就NULL。
如果NULL沒有存在的意義，干脆數(shù)據(jù)庫就不要存在這個NULL就好了，事實上，哪個數(shù)據(jù)庫沒有NULL類型？
當然也不排除，某些DBA為了顯得自己專業(yè)，弄出來一些莫須有的東西，現(xiàn)在就是有一種風氣，在數(shù)據(jù)庫上能提出來的限制條件越多，越有優(yōu)越感。

想起來一個有關于默認值有意思的事，B站看視頻的時候某up主曾提到過，因為B站把注冊用戶默認為男，出生日期某認為某個指定的日期，導致該up主在對用戶點為分析后得到一些無法理解的數(shù)據(jù)。

個人認識有限，數(shù)據(jù)實話，非常想知道“所有字段非空”會帶來什么其他哪些正面的影響，以及如何衡量這個正面的因素，還有，你們真的做到了，可以禁止整個實例下所有的庫表中的字段禁止可空（nullable）？

到此這篇關于MySQL中建表時可空（NULL）和非空（NOT NULL）的用法詳解的文章就介紹到這了,更多相關MySQL中建表時可空和非空內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

為什么mysql字段要使用NOT NULL
解決mysql使用not in 包含null值的問題
解決從集合運算到mysql的not like找不出NULL的問題
MySQL null與not null和null與空值''''''''的區(qū)別詳解
MySQL中NOT IN填坑之列為null的問題解決
MySQL中可為空的字段設置為NULL還是NOT NULL
MySQL查詢空字段或非空字段(is null和not null)
mysql not in、left join、IS NULL、NOT EXISTS 效率問題記錄
MySQL非空約束(not null)案例講解

標簽：臺灣阜新合肥貴州鎮(zhèn)江北京鷹潭日照

巨人網(wǎng)絡通訊聲明：本文標題《MySQL中建表時可空（NULL）和非空（NOT NULL）的用法詳解》，本文關鍵詞 MySQL,中建,表時,可空,NULL,；如發(fā)現(xiàn)本文內(nèi)容存在版權問題，煩請?zhí)峁┫嚓P信息告之我們，我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡，涉及言論、版權與本站無關。