GridFS簡(jiǎn)介
GridFS是MongoDB中的一個(gè)內(nèi)置功能,可以用于存放大量小文件。
GridFS使用
MongoDB提供了一個(gè)命令行工具mongofiles可以來(lái)處理GridFS,
列出所有文件:
復(fù)制代碼 代碼如下:
mongofiles list
上傳一個(gè)文件:
復(fù)制代碼 代碼如下:
mongofiles put xxx.txt
下載一個(gè)文件:
復(fù)制代碼 代碼如下:
mongofiles get xxx.txt
查找文件:
復(fù)制代碼 代碼如下:
//會(huì)查找所有文件名中包含“xxx”的文件
mongofiles search xxx
//會(huì)查找所有文件名以“xxx”為前綴的文件
mongofiles list xxx
參數(shù)說(shuō)明:
–d 指定數(shù)據(jù)庫(kù) ,默認(rèn)是fs,Mongofiles list –d testGridfs
-u –p 指定用戶(hù)名,密碼
-h 指定主機(jī)
-port 指定主機(jī)端口
-c 指定集合名,默認(rèn)是fs
-t 指定文件的MIME類(lèi)型,默認(rèn)會(huì)忽略
GridFS實(shí)現(xiàn)原理
GridFS在數(shù)據(jù)庫(kù)中,默認(rèn)使用fs.chunks和fs.files來(lái)存儲(chǔ)文件。
其中fs.files集合存放文件的信息,fs.chunks存放文件數(shù)據(jù)。
一個(gè)fs.files集合中的一條記錄內(nèi)容如下,即一個(gè)file的信息如下:
復(fù)制代碼 代碼如下:
{
"_id" : ObjectId("4f4608844f9b855c6c35e298"), //唯一id,可以是用戶(hù)自定義的類(lèi)型
"filename" : "CPU.txt", //文件名
"length" : 778, //文件長(zhǎng)度
"chunkSize" : 262144, //chunk的大小
"uploadDate" : ISODate("2012-02-23T09:36:04.593Z"), //上傳時(shí)間
"md5" : "e2c789b036cfb3b848ae39a24e795ca6", //文件的md5值
"contentType" : "text/plain" //文件的MIME類(lèi)型
"meta" : null //文件的其它信息,默認(rèn)是沒(méi)有”meta”這個(gè)key,用戶(hù)可以自己定義為任意BSON對(duì)象
}
對(duì)應(yīng)的fs.chunks中的chunk如下:
復(fù)制代碼 代碼如下:
{
"_id" : ObjectId("4f4608844f9b855c6c35e299"), //chunk的id
"files_id" : ObjectId("4f4608844f9b855c6c35e298"), //文件的id,對(duì)應(yīng)fs.files中的對(duì)象,相當(dāng)于fs.files集合的外鍵
"n" : 0, //文件的第幾個(gè)chunk塊,如果文件大于chunksize的話(huà),會(huì)被分割成多個(gè)chunk塊
"data" : BinData(0,"QGV...") //文件的二進(jìn)制數(shù)據(jù),這里省略了具體內(nèi)容
}
默認(rèn)chunk的大小是256K。
所以在把文件存入到GridFS過(guò)程中,如果文件大于chunksize,則把文件分割成多個(gè)chunk,再把這些chunk保存到fs.chunks中,最后再把文件信息存入到fs.files中。
在讀取文件的時(shí)候,先據(jù)查詢(xún)的條件,在fs.files中找到一個(gè)合適的記錄,得到“_id”的值,再據(jù)這個(gè)值到fs.chunks中查找所有“files_id”為“_id”的chunk,并按“n”排序,最后依次讀取chunk中“data”對(duì)象的內(nèi)容,還原成原來(lái)的文件。
注意事項(xiàng)
1.GridFS不自動(dòng)處理md5相同的文件,對(duì)于md5相同的文件,如果想在GridFS中只有一個(gè)存儲(chǔ),要用戶(hù)自已處理。Md5值的計(jì)算由客戶(hù)端完成。
2.因?yàn)镚ridFS在上傳文件過(guò)程中是先把文件數(shù)據(jù)保存到fs.chunks,最后再把文件信息保存到fs.files中,所以如果在上傳文件過(guò)程中失敗,有可能在fs.chunks中出現(xiàn)垃圾數(shù)據(jù)。這些垃圾數(shù)據(jù)可以定期清理掉。
您可能感興趣的文章:- PHP MongoDB GridFS 存儲(chǔ)文件的方法詳解
- MongoDB系列教程(八):GridFS存儲(chǔ)詳解
- Mongodb批量刪除gridfs文件實(shí)例
- PHP操作MongoDB GridFS 存儲(chǔ)文件的詳解
- mongodb+php實(shí)現(xiàn)簡(jiǎn)單的增刪改查
- PHP簡(jiǎn)單操作MongoDB的方法(安裝及增刪改查)
- C# 對(duì)MongoDB 進(jìn)行增刪改查的簡(jiǎn)單操作實(shí)例
- MongoDB錯(cuò)誤32-bit servers don''t have journaling enabled by default解決方法
- MongoDB插入數(shù)據(jù)的3種方法
- MongoDB.NET 2.2.4驅(qū)動(dòng)版本對(duì)Mongodb3.3數(shù)據(jù)庫(kù)中GridFS增刪改查