本篇博客稍微有點長,它實際上包括兩個內(nèi)容:一是mysql字段類型的介紹,二是在mysql建表過程中是如何正確選擇這些字段類型;
MySQL 的數(shù)值數(shù)據(jù)類型可以大致劃分為兩個類別,一個是整數(shù),另一個是浮點數(shù)或小數(shù)。
許多不同的子類型對這些類別中的每一個都是可用的,每個子類型支持不同大小的數(shù)據(jù),并且 MySQL 允許我們指定數(shù)值字段中的值是否有正負之分(UNSIGNED)或者用零填補(ZEROFILL)。
MySQL 以一個可選的顯示寬度指示器的形式對 SQL 標準進行擴展(如 INT(6),6即是其寬度指示器,該寬度指示器并不會影響int列存儲字段的大小,也就是說,超過6位它不會自動截取,依然會存儲,只有超過它本身的存儲范圍才會截取;此處寬度指示器的作用在于該字段是否有zerofill,如果有就未滿足6位的部分就會用0來填充),這樣當從數(shù)據(jù)庫檢索一個值時,可以把這個值加長到指定的長度。例如,指定一個字段的類型為 INT(6),就可以保證所包含數(shù)字少于 6 個的值從數(shù)據(jù)庫中檢索出來時能夠自動地用空格填充。需要注意的是,使用一個寬度指示器不會影響字段的大小和它可以存儲的值的范圍。
萬一我們需要對一個字段存儲一個超出許可范圍的數(shù)字,MySQL 會根據(jù)允許范圍最接近它的一端截短后再進行存儲。還有一個比較特別的地方是,MySQL 會在不合規(guī)定的值插入表前自動修改為 0。
為什么mysql存儲的值要分有符號和無符號呢?因為一個字節(jié),占8bit;也就1個bit有0和1兩種可能,8個bit就是2^8 = 256種可能,也就是0~255;但如果是有符號的話,就得拿一個1bit來存儲這個負號,本來8bit只剩7bit,2^7 = 128,也就是-128~127(正數(shù)部分包含一個0);
關于flaot和double
在這里我建議,干脆忘記mysql有double這個數(shù)據(jù)類型。至于why?就不要管它了
MySQL 提供了 8 個基本的字符串類型,可以存儲的范圍從簡單的一個字符到巨大的文本塊或二進制字符串數(shù)據(jù)。
BINARY
BINARY不是函數(shù),是類型轉換運算符,它用來強制它后面的字符串為一個二進制字符串,可以理解為在字符串比較的時候區(qū)分大小寫
SELECT BINARY 'ABCD' = 'abcd' as COM1,'ABCD' = 'abcd' as COM2; -- COM1輸出為0,COM2輸出為1;
CHAR 類型可以使用 BINARY 修飾符。當用于比較運算時,這個修飾符使 CHAR 以二進制方式參于運算,而不是以傳統(tǒng)的區(qū)分大小寫的方式。
CHAR 類型的一個變體是 VARCHAR 類型。它是一種可變長度的字符串類型,并且也必須帶有一個范圍在 0-255 之間的指示器。
CHAR 和 VARCHGAR 不同之處在于 MYSQL 數(shù)據(jù)庫處理這個指示器的方式:CHAR 把這個大小視為值的大小,不長度不足的情況下就用空格補足。而 VARCHAR 類型把它視為最大值并且只使用存儲字符串實際需要的長度(增加一個額外字節(jié)來存儲字符串本身的長度)來存儲值。所以短于指示器長度的 VARCHAR 類型不會被空格填補,但長于指示器的值仍然會被截短。
因為 VARCHAR 類型可以根據(jù)實際內(nèi)容動態(tài)改變存儲值的長度,所以在不能確定字段需要多少字符時使用 VARCHAR 類型可以大大地節(jié)約磁盤空間、提高存儲效率。但如果確切知道字符串長度,比如就在50~55之間,那就用 CHAR 因為 CHAR 類型由于本身定長的特性使其性能要高于 VARCHAR;
VARCHAR 類型在使用 BINARY 修飾符時與 CHAR 類型完全相同。
TEXT 和 BLOB 類型在分類和比較上存在區(qū)別。BLOB 類型區(qū)分大小寫,而 TEXT 不區(qū)分大小寫。大小修飾符不用于各種 BLOB 和 TEXT 子類型。比指定類型支持的最大范圍大的值將被自動截短。
在處理日期和時間類型的值時,MySQL 帶有 5 個不同的數(shù)據(jù)類型可供選擇。
需要注意的是,沒有冒號分隔符的 TIME 類型值,將會被 MySQL 理解為持續(xù)的時間,而不是時間戳。
MySQL 還對日期的年份中的兩個數(shù)字的值,或是 SQL 語句中為 YEAR 類型輸入的兩個數(shù)字進行最大限度的通譯。因為所有 YEAR 類型的值必須用 4 個數(shù)字存儲。MySQL 試圖將 2 個數(shù)字的年份轉換為 4 個數(shù)字的值。把在 00-69 范圍內(nèi)的值轉換到 2000-2069 范圍內(nèi)。把 70-99 范圍內(nèi)的值轉換到 1970-1979 之內(nèi)。如果 MySQL 自動轉換后的值并不符合我們的需要,請輸入 4 個數(shù)字表示的年份。
如果我們對 TIMESTAMP 類型的字段沒有明確賦值,或是被賦與了 null 值。MySQL 會自動使用系統(tǒng)當前的日期和時間來填充它。
MySQL 還支持兩種復合數(shù)據(jù)類型 ENUM 和 SET,它們擴展了 SQL 規(guī)范。雖然這些類型在技術上是字符串類型,但是可以被視為不同的數(shù)據(jù)類型。一個 ENUM 類型只允許從一個集合中取得一個值;而 SET 類型允許從一個集合中取得任意多個值。
ENUM 類型在系統(tǒng)內(nèi)部可以存儲為數(shù)字,并且從 1 開始用數(shù)字做索引。一個 ENUM 類型最多可以包含 65536 個元素,其中一個元素被 MySQL 保留,用來存儲錯誤信息,這個錯誤值用索引 0 或者一個空字符串表示。
MySQL 認為 ENUM 類型集合中出現(xiàn)的值是合法輸入,除此之外其它任何輸入都將失敗。這說明通過搜索包含空字符串或對應數(shù)字索引為 0 的行就可以很容易地找到錯誤記錄的位置。
雖然上面列出了很多字段類型,但最常用也就是 varchar(255),char(255),text,tinyint(4),smallint(6),mediumint,int(11)幾種。
復合類型我們一般用tinyint,更快的時間更省的空間以及更容易擴展
關于手機號,推薦用char(11),char(11)在查詢上更有效率,因為手機號是一個活躍字段參與邏輯會很多。
選擇合理范圍內(nèi)最小的
我們應該選擇最小的數(shù)據(jù)范圍,因為這樣可以大大減少磁盤空間及磁盤I/0讀寫開銷,減少內(nèi)存占用,減少CPU的占用率。
但是,工作中隨著項目越做越多,業(yè)務邏輯的處理越來越難以后,我發(fā)現(xiàn)時間類型還是用時間類型本身的字段類型要好一些,因為mysql有著豐富的時間函數(shù)供我使用,方便我完成很多與時間相關的邏輯,比如月排行榜,周排行榜,當日熱門,生日多少天等等邏輯
不要使用null
為什么這么說呢,因為MYSQL對NULL字段索引優(yōu)化不佳,增加更多的計算難度,同時在保存與處理NULL類形時,也會做更多的工作,所以從效率上來說,不建議用過多的NULL。有些值他確實有可能沒有值,怎么辦呢?解決方法是數(shù)值弄用整數(shù)0,字符串用空來定義默認值即可。
字符串類型的使用
字符串數(shù)據(jù)類型是一個萬能數(shù)據(jù)類型,可以儲存數(shù)值、字符串、日期等。
保存數(shù)值類型最好不要用字符串數(shù)據(jù)類型,這樣存儲的空間顯然是會更大,而且在排序時字符串的9是大于22的,其實如果進行運算時mysql會將字符串轉換為數(shù)值類型,大大降低效果,而且這種轉換是不會走原有的索引的。
如果明確數(shù)據(jù)在一個完整的集合中如男,女,那么可以使用set或enum數(shù)據(jù)類型,這種數(shù)據(jù)類型在運算及儲存時以數(shù)值方式操作,所以效率要比字符串更好,同時空間占用更少。
VARCHAR與CHAR
VARCHAR是可變長度字符串類型,那么即然長度是可變的就會使用1,2個字節(jié)來保存字符的長度,如果長度在255內(nèi)使用1個字節(jié)來保存字符長度,否則使用2個字符來保存長度。由于varchar是根據(jù)儲存的值來保存數(shù)據(jù),所以可以大大節(jié)約磁盤空間。
如果數(shù)據(jù)經(jīng)常被執(zhí)行更新操作,由于VARCHAR是根據(jù)內(nèi)容來進行儲存的,所以mysql將做更多的工作來完成更新操作,如果新數(shù)據(jù)長度大于老數(shù)據(jù)長度一些存儲引擎會進行拆分操作處理。同時varchar會完全保留內(nèi)部所有數(shù)據(jù),最典型的說明就是尾部的空格。
CHAR固定長度的字符串保存類型,CHAR會去掉尾部的空格。在數(shù)據(jù)長度相近時使用char類型比較合適,比如md5加密的密碼用戶名等。
如果數(shù)據(jù)經(jīng)常進行更新修改操作,那么CHAR更好些,因為char長度固定,性能上要快。
數(shù)值類型的選擇
數(shù)值數(shù)據(jù)類型要比字符串執(zhí)行更快,區(qū)間小的數(shù)據(jù)類型占用空間更少,處理速度更快,如tinyint可比bigint要快的多
選擇數(shù)據(jù)類型時要考慮內(nèi)容長度,比如是保存毫米單位還是米而選擇不同的數(shù)值類型
整數(shù)
整數(shù)類型很多比如tinyint、int、smallint、bigint等,那么我們要根據(jù)自己需要存儲的數(shù)據(jù)長度決定使用的類型,同時tinyint(10)與tinyint(100)在儲存與計算上并無任何差別,區(qū)別只是顯示層面上,但是我們也要選擇適合合適的數(shù)據(jù)類型長度??梢酝ㄟ^指定zerofill屬性查看顯示時區(qū)別。
浮點數(shù)與精度數(shù)值
浮點數(shù)float在儲存空間及運行效率上要優(yōu)于精度數(shù)值類型decimal,但float與double會有舍入錯誤而decimal則可以提供更加準確的小數(shù)級精確運算不會有錯誤產(chǎn)生計算更精確,適用于金融類型數(shù)據(jù)的存儲。
更多建議: