原文地址:http://imysql.com/2014/09/14/mysql-faq-why-innodb-table-using-autoinc-int-as-pk.shtml
我們先了解下InnoDB引擎表的一些關(guān)鍵特征:
- InnoDB引擎表是基于B+樹的索引組織表(IOT);
- 每個表都需要有一個聚集索引(clustered index);
- 所有的行記錄都存儲在B+樹的葉子節(jié)點(diǎn)(leaf pages of the tree);
- 基于聚集索引的增、刪、改、查的效率相對是最高的;
- 如果我們定義了主鍵(PRIMARY KEY),那么InnoDB會選擇其作為聚集索引;
- 如果沒有顯式定義主鍵,則InnoDB會選擇第一個不包含有NULL值的唯一索引作為主鍵索引;
- 如果也沒有這樣的唯一索引,則InnoDB會選擇內(nèi)置6字節(jié)長的ROWID作為隱含的聚集索引(ROWID隨著行記錄的寫入而主鍵遞增,這個ROWID不像ORACLE的ROWID那樣可引用,是隱含的)。
綜上總結(jié),如果InnoDB表的數(shù)據(jù)寫入順序能和B+樹索引的葉子節(jié)點(diǎn)順序一致的話,這時候存取效率是最高的,也就是下面這幾種情況的存取效率最高:
- 使用自增列(INT/BIGINT類型)做主鍵,這時候?qū)懭腠樞蚴亲栽龅?,和B+數(shù)葉子節(jié)點(diǎn)分裂順序一致;
- 該表不指定自增列做主鍵,同時也沒有可以被選為主鍵的唯一索引(上面的條件),這時候InnoDB會選擇內(nèi)置的ROWID作為主鍵,寫入順序和ROWID增長順序一致;
- 除此以外,如果一個InnoDB表又沒有顯示主鍵,又有可以被選擇為主鍵的唯一索引,但該唯一索引可能不是遞增關(guān)系時(例如字符串、UUID、多字段聯(lián)合唯一索引的情況),該表的存取效率就會比較差。
實際情況是如何呢?經(jīng)過簡單TPCC基準(zhǔn)測試,修改為使用自增列作為主鍵與原始表結(jié)構(gòu)分別進(jìn)行TPCC測試,前者的TpmC結(jié)果比后者高9%倍,足見使用自增列做InnoDB表主鍵的明顯好處,其他更多不同場景下使用自增列的性能提升可以自行對比測試下。
附圖:
1、B+樹典型結(jié)構(gòu)

2、InnoDB主鍵邏輯結(jié)構(gòu)

延伸閱讀:
1、TPCC-MySQL使用手冊
2、B+Tree index structures in InnoDB
3、B+Tree Indexes and InnoDB – Percona
4、MySQL官方手冊: Clustered and Secondary Indexes
更多建議: