寫在前面
MongoDB支持的索引種類很多,諸如單鍵索引,復合索引,多鍵索引,TTL索引,文本索引,空間地理索引等。同時索引的屬性可以具有唯一性,即唯一索引。唯一索引用于確保索引字段不存儲重復的值,即強制索引字段的唯一性。缺省情況下,MongoDB的_id字段在創(chuàng)建集合的時候會自動創(chuàng)建一個唯一索引。本文主要描述唯一索引的用法。
關于什么是索引以及唯一索引這里就不做說明了,不清楚的可以自行谷歌或者百度。是什么引起我寫這篇文章呢,這來自于之前項目中的一個問題。
我們用的是MongoDB數(shù)據(jù)存儲用戶信息,用戶表中曾經用戶注冊是通過手機號注冊的,所以很理所當然的給手機號加上了唯一索引(Unique),這是沒有什么毛病。后期,我們需求改了。你也可以想到變成了既可以手機號注冊又可以郵箱注冊,這個時候由于手機號加了Unique索引,事實上這時候是會出現(xiàn)問題的。
func init() {
phoneIndex := mgo.Index{
Key: []string{"phone"},
Unique: true,
}
col := db.Collection(User{})
col.EnsureIndex(phoneIndex)
}
當然這問題其實也容易想到,當用戶通過郵箱注冊此時手機號填空的時候,第一次沒什么問題,下個用戶再以這種方式注冊的時候便會提示建立在phone上的索引值重復,很正常嘛,因為插入了兩個空值,注意這里是空字符串,而不是null。
于是我們嘗試修改,由于MongoDB是文檔型靈活的數(shù)據(jù)庫,少插多插一兩個字段不受影響,所以我們嘗試修改User實體Phone字段的入口,當phone是空字符串的時候,不讓插入此字段。于是,我們便在phone字段中加入了omitempty標簽(我們微服務用Go語言寫的)。下面展示User一部分內容:
type User struct {
Email string `bson:"email"`
Salt string `bson:"salt"`
Phone string `bson:"phone,omitempty"`
IDCard string `bson:"idcard"`
RealName string `bson:"realname"`
AuthStatus int `bson:"auth_status"`
}
可以看到phone字段后加了omitempty標簽,表示當該字段為空的時候不插入。這還是會出現(xiàn)問題,那么既然還是會出問題為什么會想到這么解決呢?這源于對Mysql的使用經驗,習慣性的以為MongoDB和Mysql那樣,對null的值會不做其索引。也就是說,在Mysql中,若在多條記錄中Phone值為Null是被允許的。
上面那種做法,還是會報錯,提示插入了重復的值,只不過這時不是空字符串,而是null。所以有時候就不要把Mysql那套拿來了,Mysql是可以的,但Mongo不行。mongo還是會對該條記錄索引,即使該字段為被插入。
我喜歡看官方文檔,下面給出MongoDB官方文檔說明:
If a document does not have a value for the indexed field in a unique
index, the index will store a null value for this document. Because of
the unique constraint, MongoDB will only permit one document that
lacks the indexed field. If there is more than one document without a
value for the indexed field or is missing the indexed field, the index
build will fail with a duplicate key error.
其實已經說得很清楚了,稍微會點英語應該都能看懂,下面還是給出翻譯版:
如果文檔沒有唯一索引中索引字段的值,則索引將為此文檔存儲null值。由于唯一約束,MongoDB只允許一個缺少索引字段的文檔。如果有多個文檔沒有索引字段的值或缺少索引字段,則索引構建將失敗并出現(xiàn)重復鍵錯誤。
也就是說這個字段哪怕在文檔中沒有,那么該字段將會存null值,該字段上也不能同時出現(xiàn)兩個null值,這就是為什么上面那種做法還是行不通的原因,其實上面那種做法也打破了數(shù)據(jù)結構,雖然手機號未填,但數(shù)據(jù)庫中也不應該缺少這個字段,盡管是非關系數(shù)據(jù)庫,畢竟還得考慮下業(yè)務設計。
解決方式
是不是就沒有解決方式了呢?當然有,Mongo提供了Sparse Index,被翻譯為稀疏索引。下面是創(chuàng)建稀疏索引的例子:
db.getCollection("test").createIndex( { "phone": 1 }, { sparse: true })
執(zhí)行上面的語句后,不會去索引不存在phone字段的文檔。也就是說存在才對其索引,那么此時和Unique索引結合起來就可以派上用場了。Unqiue是唯一,Sparse是存在才索引。所以,當phone或email為空的時候我們可以不將其插入這是可以實現(xiàn)的。
db.getCollection("test").createIndex( { "phone": 1 }, { sparse: true,unique: true } )
上面是是mongo shell語法,通常我們一般通過代碼中建立索引,修改如下(當然User結構體中Phone字段omitempty標簽還是要有的):
func init() {
phoneIndex := mgo.Index{
Key: []string{"phone"},
Unique: true,
Sparse: true,
}
col := db.Collection(User{})
col.EnsureIndex(phoneIndex)
}
但是這又正如我們前面說的那樣,打破了數(shù)據(jù)原有的數(shù)據(jù)結構。哎,有得有得。當然我們還可以從業(yè)務層面去解決,比如注冊時對其查詢等操作,當然會耗一定性能,不管你是那空間換時間,還是拿時間換空間總得付出一個,別做一個太貪心的人。
總結
以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作具有一定的參考學習價值,如果有疑問大家可以留言交流,謝謝大家對腳本之家的支持。
您可能感興趣的文章:- MongoDB索引使用詳解
- MongoDB的基礎查詢和索引操作方法總結
- MongoDB中創(chuàng)建索引需要注意的事項
- MongoDB性能篇之創(chuàng)建索引,組合索引,唯一索引,刪除索引和explain執(zhí)行計劃
- 深入理解MongoDB的復合索引
- mongodb處理中文索引與查找字符串詳解
- MongoDB查詢字段沒有創(chuàng)建索引導致的連接超時異常解案例分享
- 關于MongoDB索引管理-索引的創(chuàng)建、查看、刪除操作詳解
- MongoDB自動刪除過期數(shù)據(jù)的方法(TTL索引)
- 關于對MongoDB索引的一些簡單理解