MySQL的數(shù)據(jù)類(lèi)型和建庫(kù)策略詳解

發(fā)布時(shí)間:2010/5/21 15:00:00

無(wú)論是在小得可憐的免費(fèi)數(shù)據(jù)庫(kù)空間或是大型電子商務(wù)網(wǎng)站,合理的設(shè)計(jì)表結(jié)構(gòu)、充分利用空間是十分必要的。這就要求我們對(duì)數(shù)據(jù)庫(kù)系統(tǒng)的常用數(shù)據(jù)類(lèi)型有充分的認(rèn)識(shí)。下面我就將我的一點(diǎn)心得寫(xiě)出來(lái)跟大家分享。

一、數(shù)字類(lèi)型

數(shù)字類(lèi)型按照我的分類(lèi)方法分為三類(lèi):整數(shù)類(lèi)、小數(shù)類(lèi)和數(shù)字類(lèi)。

我所謂的“數(shù)字類(lèi)”,就是指DECIMAL和NUMERIC,它們是同一種類(lèi)型。它嚴(yán)格的說(shuō)不是一種數(shù)字類(lèi)型,因?yàn)樗麄儗?shí)際上是將數(shù)字以字符串形式保存的;他的值的每一位(包括小數(shù)點(diǎn))占一個(gè)字節(jié)的存儲(chǔ)空間,因此這種類(lèi)型耗費(fèi)空間比較大。但是它的一個(gè)突出的優(yōu)點(diǎn)是小數(shù)的位數(shù)固定,在運(yùn)算中不會(huì)“失真”,所以比較適合用于“價(jià)格”、“金額”這樣對(duì)精度要求不高但準(zhǔn)確度要求非常高的字段。

小數(shù)類(lèi),即浮點(diǎn)數(shù)類(lèi)型,根據(jù)精度的不同,有FLOAT(單精度)和DOUBLE(雙精度)兩種。它們的優(yōu)勢(shì)是精確度,F(xiàn)LOAT可以表示絕對(duì)值非常小、小到約 1.17E-38 (0.000...0117, 小數(shù)點(diǎn)后面有37個(gè)零)的小數(shù),而DOUBLE更是可以表示絕對(duì)值小到約 2.22E-308 (0.000...0222, 小數(shù)點(diǎn)后面有307個(gè)零)的小數(shù)。FLOAT類(lèi)型和DOUBLE類(lèi)型占用存儲(chǔ)空間分別是4字節(jié)和8字節(jié)。如果需要用到小數(shù)的字段,精度要求不高的,當(dāng)然用FLOAT了!可是說(shuō)句實(shí)在話(huà),我們“民用”的數(shù)據(jù),哪有要求精度那么高的呢?這兩種類(lèi)型至今我沒(méi)有用過(guò)——我還沒(méi)有遇到適合于使用它們的事例。

用的最多的,最值得精打細(xì)算的,是整數(shù)類(lèi)型。從只占一個(gè)字節(jié)存儲(chǔ)空間的TINYINT到占8個(gè)字節(jié)的BIGINT,挑選一個(gè)“夠用”并且占用存儲(chǔ)空間最小的類(lèi)型是設(shè)計(jì)數(shù)據(jù)庫(kù)時(shí)應(yīng)該考慮的。TINYINT、SMALLINT、MEDIUMINT、INT和BIGINT占用存儲(chǔ)空間分別為1字節(jié)、2字節(jié)、3字節(jié)、4字節(jié)和8字節(jié),就無(wú)符號(hào)的整數(shù)而言,這些類(lèi)型能表示的最大整數(shù)分別為255、65535、16777215、4294967295和18446744073709551615。如果用來(lái)保存用戶(hù)的年齡(舉例來(lái)說(shuō),數(shù)據(jù)庫(kù)中保存年齡是不可取的),用TINYINT就夠了;九城的《縱橫》里,各項(xiàng)技能值,用SMALLINT也夠了;如果要用作一個(gè)肯定不會(huì)超過(guò)16000000行的表的AUTO_INCREMENT的IDENTIFY字段,當(dāng)然用 MEDIUMINT 不用 INT ,試想,每行節(jié)約一個(gè)字節(jié),16000000行可以節(jié)約10兆多呢!

二、日期時(shí)間類(lèi)型

日期和時(shí)間類(lèi)型比較簡(jiǎn)單,無(wú)非是 DATE、TIME、DATETIME、TIMESTAMP和YEAR等幾個(gè)類(lèi)型。只對(duì)日期敏感,而對(duì)時(shí)間沒(méi)有要求的字段,就用DATE而不用DATETIME是不用說(shuō)的了;單獨(dú)使用時(shí)間的情況也時(shí)有發(fā)生——使用TIME;但最多用到的還是用DATETIME。在日期時(shí)間類(lèi)型上沒(méi)有什么文章可做,這里就不再詳述。

三、字符(串)類(lèi)型

不要以為字符類(lèi)型就是 CHAR !CHAR和VARCHAR的區(qū)別在于CHAR是固定長(zhǎng)度,只要你定義一個(gè)字段是CHAR(10),那么不論你存儲(chǔ)的數(shù)據(jù)是否達(dá)到了10個(gè)字節(jié),它都要占去10個(gè)字節(jié)的空間;而VARVHAR則是可變長(zhǎng)度的,如果一個(gè)字段可能的值是不固定長(zhǎng)度的,我們只知道它不可能超過(guò)10個(gè)字符,把它定義為 VARCHAR(10)是最合算的,VARCHAR 類(lèi)型的實(shí)際長(zhǎng)度是它的值的(實(shí)際長(zhǎng)度+1)。為什么“+1”呢?這一個(gè)字節(jié)用于保存實(shí)際使用了多大的長(zhǎng)度呀!從這個(gè)“+1”中也應(yīng)該看到,如果一個(gè)字段,它的可能值最長(zhǎng)是10個(gè)字符,而多數(shù)情況下也就是用到了10個(gè)字符時(shí),用VARCHAR就不合算了:因?yàn)樵诙鄶?shù)情況下,實(shí)際占用空間是11個(gè)字節(jié),比用CHAR(10)還多占用一個(gè)字節(jié)!

舉個(gè)例子,就是一個(gè)存儲(chǔ)股票名稱(chēng)和代碼的表,股票名稱(chēng)絕大部分是四個(gè)字的,即8個(gè)字節(jié);股票代碼,上海的是六位數(shù)字,深圳的是四位數(shù)字。這些都是固定長(zhǎng)度的,股票名稱(chēng)當(dāng)然要用 CHAR(8) ;股票代碼雖然是不固定長(zhǎng)度,但如果使用VARVHAR(6),一個(gè)深圳的股票代碼實(shí)際占用空間是5個(gè)字節(jié),而一個(gè)上海的股票代碼要占用7個(gè)字節(jié)!考慮到上海的股票數(shù)目比深圳的多,那么用VARCHAR(6)就不如CHAR(6)合算了。

雖然一個(gè)CHAR或VARVHAR的最大長(zhǎng)度可以到255,我認(rèn)為大于20的CHAR是幾乎用不到的——很少有大于20個(gè)字節(jié)長(zhǎng)度的固定長(zhǎng)度的東東吧?不是固定長(zhǎng)度的就用VARCHAR!大于100的VARCHAR也是幾乎用不到的——比這更大的用TEXT就好了。TINYTEXT,最大長(zhǎng)度為255,占用空間也是(實(shí)際長(zhǎng)度+1);TEXT,最大長(zhǎng)度65535,占用空間是(實(shí)際長(zhǎng)度+2);MEDIUMTEXT,最大長(zhǎng)度16777215,占用空間是(實(shí)際長(zhǎng)度+3);LONGTEXT,最大長(zhǎng)度4294967295,占用空間是(實(shí)際長(zhǎng)度+4)。為什么“+1”?“+2”?“+3”?“+4”?你要是還不知道就該打PP了。這些可以用在論壇啊、新聞啊,什么的,用來(lái)保存文章的正文。根據(jù)實(shí)際情況的不同,選擇從小到大的不同類(lèi)型。

四、枚舉和集合類(lèi)型

枚舉(ENUM)類(lèi)型,最多可以定義65535種不同的字符串從中做出選擇,只能并且必須選擇其中一種,占用存儲(chǔ)空間是一個(gè)或兩個(gè)字節(jié),由枚舉值的數(shù)目決定;集合(SET)類(lèi)型,最多可以有64個(gè)成員,可以選擇其



Copyright© 2004-2020 河南海騰電子技術(shù)有限公司 版權(quán)所有   經(jīng)營(yíng)性ICP/ISP證 備案號(hào):B1-20180452   豫公網(wǎng)安備 41019702002018號(hào)    電子營(yíng)業(yè)執(zhí)照