濮阳杆衣贸易有限公司

主頁 > 知識庫 > MongoDB索引使用詳解

MongoDB索引使用詳解

熱門標(biāo)簽:智能電銷機(jī)器人銷售話術(shù) 徐州ai電銷機(jī)器人原理 企業(yè)智能外呼系統(tǒng)價格多少 福州電銷機(jī)器人源代碼 機(jī)器人外呼系統(tǒng)軟件存在問題 南京400電話怎樣辦理 高德地圖標(biāo)注商戶位置 沈陽營銷電銷機(jī)器人招商 兗州電話外呼營銷系統(tǒng)

索引就像書的目錄,如果查找某內(nèi)容在沒有目錄的幫助下,只能全篇查找翻閱,這導(dǎo)致效率非常的低下;如果在借助目錄情況下,就能很快的定位具體內(nèi)容所在區(qū)域,效率會直線提高。

索引簡介

首先打開命令行,輸入mongo。默認(rèn)mongodb會連接名為test的數(shù)據(jù)庫。

➜ ~ mongo
MongoDB shell version: 2.4.9
connecting to: test
> show collections
> 

可以使用show collections/tables查看數(shù)據(jù)庫為空。

然后在mongodb命令行終端執(zhí)行如下代碼

> for(var i=0;i100000;i++) {
... db.users.insert({username:'user'+i})
... }
> show collections
system.indexes
users
> 

再查看數(shù)據(jù)庫發(fā)現(xiàn)多了system.indexes 和 users兩個表,前者即所謂的索引,后者為新建的數(shù)據(jù)庫表。
這樣user表中即有了10萬條數(shù)據(jù)。

> db.users.find()
{ "_id" : ObjectId("5694d5da8fad9e319c5b43e4"), "username" : "user0" }
{ "_id" : ObjectId("5694d5da8fad9e319c5b43e5"), "username" : "user1" }
{ "_id" : ObjectId("5694d5da8fad9e319c5b43e6"), "username" : "user2" }
{ "_id" : ObjectId("5694d5da8fad9e319c5b43e7"), "username" : "user3" }
{ "_id" : ObjectId("5694d5da8fad9e319c5b43e8"), "username" : "user4" }
{ "_id" : ObjectId("5694d5da8fad9e319c5b43e9"), "username" : "user5" }

現(xiàn)在需要查找其中任意一條數(shù)據(jù),比如

> db.users.find({username: 'user1234'})
{ "_id" : ObjectId("5694d5db8fad9e319c5b48b6"), "username" : "user1234" }

發(fā)現(xiàn)這條數(shù)據(jù)成功找到,但需要了解詳細(xì)信息,需要加上explain方法

> db.users.find({username: 'user1234'}).explain()
{
  "cursor" : "BasicCursor",
  "isMultiKey" : false,
  "n" : 1,
  "nscannedObjects" : 100000,
  "nscanned" : 100000,
  "nscannedObjectsAllPlans" : 100000,
  "nscannedAllPlans" : 100000,
  "scanAndOrder" : false,
  "indexOnly" : false,
  "nYields" : 0,
  "nChunkSkips" : 0,
  "millis" : 30,
  "indexBounds" : {
    
  },
  "server" : "root:27017"
}

參數(shù)很多,目前我們只關(guān)注其中的"nscanned" : 100000和"millis" : 30這兩項(xiàng)。

nscanned表示mongodb在完成這個查詢過程中掃描的文檔總數(shù)??梢园l(fā)現(xiàn),集合中的每個文檔都被掃描了,并且總時間為30毫秒。

如果數(shù)據(jù)有1000萬個,如果每次查詢文檔都遍歷一遍。呃,時間也是相當(dāng)可觀。

對于此類查詢,索引是一個非常好的解決方案。

> db.users.ensureIndex({"username": 1})

然后再查找user1234

> db.users.ensureIndex({"username": 1})
> db.users.find({username: 'user1234'}).explain()
{
  "cursor" : "BtreeCursor username_1",
  "isMultiKey" : false,
  "n" : 1,
  "nscannedObjects" : 1,
  "nscanned" : 1,
  "nscannedObjectsAllPlans" : 1,
  "nscannedAllPlans" : 1,
  "scanAndOrder" : false,
  "indexOnly" : false,
  "nYields" : 0,
  "nChunkSkips" : 0,
  "millis" : 0,
  "indexBounds" : {
    "username" : [
      [
        "user1234",
        "user1234"
      ]
    ]
  },
  "server" : "root:27017"
}

的確有點(diǎn)不可思議,查詢在瞬間完成,因?yàn)橥ㄟ^索引只查找了一條數(shù)據(jù),而不是100000條。

當(dāng)然使用索引是也是有代價的:對于添加的每一條索引,每次寫操作(插入、更新、刪除)都將耗費(fèi)更多的時間。這是因?yàn)?,?dāng)數(shù)據(jù)發(fā)生變化時,不僅要更新文檔,還要更新級集合上的所有索引。因此,mongodb限制每個集合最多有64個索引。通常,在一個特定的集合上,不應(yīng)該擁有兩個以上的索引。

小技巧

如果一個非常通用的查詢,或者這個查詢造成了性能瓶頸,那么在某字段(比如username)建立索引是非常好的選擇。但只是給管理員用的查詢(不太在意查詢耗費(fèi)時間),就不該對這個字段建立索引。

復(fù)合索引

索引的值是按一定順序排列的,所以使用索引鍵對文檔進(jìn)行排序非???。

db.users.find().sort({'age': 1, 'username': 1})

這里先根據(jù)age排序再根據(jù)username排序,所以username在這里發(fā)揮的作用并不大。為了優(yōu)化這個排序,可能需要在age和username上建立索引。

db.users.ensureIndex({'age':1, 'username': 1})
這就建立了一個復(fù)合索引(建立在多個字段上的索引),如果查詢條件包括多個鍵,這個索引就非常有用。

建立復(fù)合索引后,每個索引條目都包括一個age字段和一個username字段,并且指向文檔在磁盤上的存儲位置。
此時,age字段是嚴(yán)格升序排列的,如果age相等時再按照username升序排列。

查詢方式

點(diǎn)查詢(point query)

用于查詢單個值(盡管包含這個值的文檔可能有多個)

db.users.find({'age': 21}).sort({'username': -1})

因?yàn)槲覀円呀?jīng)建立好復(fù)合索引,一個age一個username,建立索引時使用的是升序排序(即數(shù)字1),當(dāng)使用點(diǎn)查詢查找{age:21},假設(shè)仍然是10萬條數(shù)據(jù),可能年齡是21的很多人,因此會找到不只一條數(shù)據(jù)。然后sort({'username': -1})會對這些數(shù)據(jù)進(jìn)行逆序排序,本意是這樣。但我們不要忘記建立索引時'username':1是升序(從小到大),如果想得到逆序只要對數(shù)據(jù)從最后一個索引開始,依次遍歷即可得到想要的結(jié)果。

排序方向并不重要,mongodb可以從任意方向?qū)λ饕M(jìn)行遍歷。
綜上,復(fù)合索引在點(diǎn)查詢這種情況非常高效,直接定位年齡,不需要對結(jié)果進(jìn)行排序,返回結(jié)果。

多值查詢(multi-value-query)

db.users.find({'age': {"$gte": 21, "$lte": 30}})

查找多個值相匹配的文檔。多值查詢也可以理解為多個點(diǎn)查詢。
如上,要查找年齡介于21到30之間。monogdb會使用索引的中的第一個鍵"age"得到匹配的結(jié)果,而結(jié)果通常是按照索引順序排列的。

db.users.find({'age': {"$gte": 21, "$lte": 30}}).sort({'username': 1})

與上一個類似,這次需要對結(jié)果排序。
在沒有sort時,我們查詢的結(jié)果首先是根據(jù)age等于21,age等于22..這樣從小到大排序,當(dāng)age等于21有多個時,在進(jìn)行usernameA-Z(0-9)這樣排序。所以,sort({'username': 1}),要將所有結(jié)果通過名字升序排列,這次不得不先在內(nèi)存中進(jìn)行排序,然后返回。效率不如上一個高。

當(dāng)然,在文檔非常少的情況,排序也花費(fèi)不了多少時間。
如果結(jié)果集很大,比如超過32MB,MongoDB會拒絕對如此多的數(shù)據(jù)進(jìn)行排序工作。

還有另外一種解決方案

也可以建立另外一個索引{'username': 1, 'age': 1}, 如果先對username建立索引,當(dāng)再sortusername,相當(dāng)沒有進(jìn)行排序。但是需要在整個文檔查找age等于21的帥哥美女,所以搜尋時間就長了。

但哪個效率更高呢?

如果建立多個索引,如何選擇使用哪個呢?
效率高低是分情況的,如果在沒有限制的情況下,不用進(jìn)行排序但需要搜索整個集合時間會遠(yuǎn)超過前者。但是在返回部分?jǐn)?shù)據(jù)(比如limit(1000)),新的贏家就產(chǎn)生了。

>db.users.find({'age': {"$gte": 21, "$lte": 30}}).
sort({username': 1}).
limit(1000).
hint({'age': 1, 'username': 1})
explain()['millis']
2031ms

>db.users.find({'age': {"$gte": 21, "$lte": 30}}).
sort({username': 1}).
limit(1000).
hint({'username': 1, 'age': 1}).
explain()['millis']
181ms

其中可以使用hint指定要使用的索引。
所以這種方式還是很有優(yōu)勢的。比如一般場景下,我們不會把所有的數(shù)據(jù)都取出來,只是去查詢最近的,所以這種效率也會更高。

索引類型

唯一索引

可以確保集合的每個文檔的指定鍵都有唯一值。

db.users.ensureIndex({'username': 1, unique: true})
比如使用mongoose框架,在定義schema時,即可指定unique: true.
如果插入2個相同都叫張三的數(shù)據(jù),第二次插入的則會失敗。_id即為唯一索引,并且不能刪除。

稀疏索引

使用sparse可以創(chuàng)建稀疏索引

>db.users.ensureIndex({'email': 1}, {'unique': true, 'sparse': true})

索引管理

system.indexes集合中包含了每個索引的詳細(xì)信息

db.system.indexes.find()

1.ensureIndex()創(chuàng)建索引

db.users.ensureIndex({'username': 1})
后臺創(chuàng)建索引,這樣數(shù)據(jù)庫再創(chuàng)建索引的同時,仍然能夠處理讀寫請求,可以指定background選項(xiàng)。

db.test.ensureIndex({"username":1},{"background":true})

2.getIndexes()查看索引

db.collectionName.getIndexes()
db.users.getIndexes()
[
  {
    "v" : 1,
    "key" : {
      "_id" : 1
    },
    "ns" : "test.users",
    "name" : "_id_"
  },
  {
    "v" : 1,
    "key" : {
      "username" : 1
    },
    "ns" : "test.users",
    "name" : "username_1"
  }
]

其中v字段只在內(nèi)部使用,用于標(biāo)識索引版本。

3.dropIndex刪除索引

> db.users.dropIndex("username_1")
{ "nIndexesWas" : 2, "ok" : 1 }

全選復(fù)制放進(jìn)筆記> db.users.dropIndex({"username":1})

您可能感興趣的文章:
  • MongoDB中唯一索引(Unique)的那些事
  • MongoDB的基礎(chǔ)查詢和索引操作方法總結(jié)
  • MongoDB中創(chuàng)建索引需要注意的事項(xiàng)
  • MongoDB性能篇之創(chuàng)建索引,組合索引,唯一索引,刪除索引和explain執(zhí)行計(jì)劃
  • 深入理解MongoDB的復(fù)合索引
  • mongodb處理中文索引與查找字符串詳解
  • MongoDB查詢字段沒有創(chuàng)建索引導(dǎo)致的連接超時異常解案例分享
  • 關(guān)于MongoDB索引管理-索引的創(chuàng)建、查看、刪除操作詳解
  • MongoDB自動刪除過期數(shù)據(jù)的方法(TTL索引)
  • 關(guān)于對MongoDB索引的一些簡單理解

標(biāo)簽:本溪 景德鎮(zhèn) 鶴崗 大理 吉安 邯鄲 昭通 丹東

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《MongoDB索引使用詳解》,本文關(guān)鍵詞  MongoDB,索引,使用,詳解,MongoDB,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《MongoDB索引使用詳解》相關(guān)的同類信息!
  • 本頁收集關(guān)于MongoDB索引使用詳解的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    泰兴市| 宝坻区| 威宁| 桐庐县| 庐江县| 桓台县| 磐安县| 临泽县| 岳池县| 田林县| 永新县| 江西省| 云龙县| 松阳县| 峨边| 宜阳县| 青河县| 宁晋县| 贺州市| 江口县| 酒泉市| 丽江市| 马龙县| 昭觉县| 杂多县| 弥渡县| 新邵县| 新丰县| 乐业县| 新余市| 乌拉特前旗| 浠水县| 宁城县| 西青区| 井研县| 松溪县| 南郑县| 应城市| 延安市| 嘉义市| 石景山区|