你曾經(jīng)是否想要把一個(gè)大文件分割成多個(gè)小文件?比如一個(gè)5gb日志文件,我們需要把它分成多個(gè)小文件,這樣我們才有可能使用普通的文本編輯器讀取它。有時(shí)我們需要傳輸20gb的大文件到另一臺(tái)服務(wù)器,這就需要我們把它分割成多個(gè)文件,這樣便于傳輸數(shù)據(jù)。下面我們來講解使用split命令來切割文件的方法。
[root@localhost database]# ls -lh gkdb.db
-r--r--r-- 1 root root 411M Jul 23 17:20 gkdb.db
將將這個(gè)276M文件分割成20M的小文件,文件分割操作如下:
[root@localhost database]# split -b 20m gkdb.db gkdb_pack_
split 是命今。
-B 20M 是指將每個(gè)分卷文件最大20M 。
gkdb.db 需要分割的文件。
gkdb_pack_ 是指分割后的文件開頭, 分割后后的文件名一般為 gkdb_pack_aa、gkdb_pack_ab、gkdb_pack_ac依次類推。
顯示分割后的文件名及大小
[root@localhost database]# ll -lh gkdb_pack_a*
-rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_aa
-rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_ab
-rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_ac
-rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_ad
-rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_ae
-rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_af
-rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_ag
-rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_ah
-rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_ai
-rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_aj
-rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_ak
-rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_al
-rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_am
-rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_an
-rw-r--r-- 1 root root 20M Jul 27 16:09 gkdb_pack_ao
-rw-r--r-- 1 root root 20M Jul 27 16:10 gkdb_pack_ap
-rw-r--r-- 1 root root 20M Jul 27 16:10 gkdb_pack_aq
-rw-r--r-- 1 root root 20M Jul 27 16:10 gkdb_pack_ar
-rw-r--r-- 1 root root 20M Jul 27 16:10 gkdb_pack_as
-rw-r--r-- 1 root root 20M Jul 27 16:10 gkdb_pack_at
-rw-r--r-- 1 root root 11M Jul 27 16:10 gkdb_pack_au
最下面的那個(gè)文件是剩余的文件。 20*20+11=411MB
合并文件
[root@localhost database]# cat gkdb_pack_*>gkdb.tar.gz
組裝前和組裝后的MD5值都是一樣的,不信的話可以使用md5sum命令來檢測(cè)一下。
如果要分割的是一個(gè)文本文件,比如有好幾千行,當(dāng)然每行的字符數(shù)是不等的,想要以行數(shù)為分割,比如每100行生成1個(gè)文件,只需要 -l 參數(shù),如下:
[root@pps public_rw]# split -l 100 test.txt
其實(shí),如果不加任何參數(shù),默認(rèn)情況下是以1000行大小來分割的。
實(shí)例1、以每個(gè)文件1000行分割
split命令分割文件成每個(gè)文件1000行,并且文件名依次為 [前綴]aa, [前綴]ab, [前綴]ac等,默認(rèn)的前綴是X,每個(gè)文件的行數(shù)為1000行,命令如下:
$ split mylog
$ wc -l *
4450 mylog
1000 xaa
1000 xab
1000 xac
1000 xad
450 xae
實(shí)例2、以每個(gè)文件20MB分割
分割文件為多個(gè)20MB的文件,附帶-b選項(xiàng)命令如下:
$ split -b 20M logdata
$ ls -lh | tail -n +2
-rw------- 1 sathiya sathiya 102M Jul 25 18:47 logdata
-rw------- 1 sathiya sathiya 20M Jul 25 19:20 xaa
-rw------- 1 sathiya sathiya 20M Jul 25 19:20 xab
-rw------- 1 sathiya sathiya 20M Jul 25 19:20 xac
-rw------- 1 sathiya sathiya 20M Jul 25 19:20 xad
-rw------- 1 sathiya sathiya 20M Jul 25 19:20 xae
-rw------- 1 sathiya sathiya 1.6M Jul 25 19:20 xaf
實(shí)例3、以每個(gè)文件50MB指定前綴分割
使用–bytes選項(xiàng)把文件分割成多個(gè)50MB的文件,–bytes類似-b選項(xiàng),在第二個(gè)參數(shù)指定前綴。
$ split --bytes=50M logdata mydatafile
$ ls -lh
total 204M
-rw------- 1 sathiya sathiya 102M Jul 25 18:47 logdata
-rw------- 1 sathiya sathiya 50M Jul 25 19:23 mydatafileaa
-rw------- 1 sathiya sathiya 50M Jul 25 19:23 mydatafileab
-rw------- 1 sathiya sathiya 1.6M Jul 25 19:23 mydatafileac
實(shí)例4、基于行數(shù)分割文件
使用-l選項(xiàng)指定行數(shù)來把文件分割成多個(gè)行數(shù)相同的文件。
$ wc -l testfile
2591 testfile
$ split -l 1500 testfile importantlog
$ wc -l *
1500 importantlogaa
1091 importantlogab
2591 testfile
實(shí)例5、以數(shù)字后綴命名分割文件
使用-d選項(xiàng)可以指定后綴為數(shù)字,如00,01,02..,而不是aa,ab,ac。
$ split -d testfile
$ ls
testfile x00 x01 x02