什么是粘包問(wèn)題
最近在使用Golang編寫(xiě)Socket層,發(fā)現(xiàn)有時(shí)候接收端會(huì)一次讀到多個(gè)數(shù)據(jù)包的問(wèn)題。于是通過(guò)查閱資料,發(fā)現(xiàn)這個(gè)就是傳說(shuō)中的TCP粘包問(wèn)題。下面通過(guò)編寫(xiě)代碼來(lái)重現(xiàn)這個(gè)問(wèn)題:
服務(wù)端代碼 server/main.go
func main() {
l, err := net.Listen("tcp", ":4044")
if err != nil {
panic(err)
}
fmt.Println("listen to 4044")
for {
// 監(jiān)聽(tīng)到新的連接,創(chuàng)建新的 goroutine 交給 handleConn函數(shù) 處理
conn, err := l.Accept()
if err != nil {
fmt.Println("conn err:", err)
} else {
go handleConn(conn)
}
}
}
func handleConn(conn net.Conn) {
defer conn.Close()
defer fmt.Println("關(guān)閉")
fmt.Println("新連接:", conn.RemoteAddr())
result := bytes.NewBuffer(nil)
var buf [1024]byte
for {
n, err := conn.Read(buf[0:])
result.Write(buf[0:n])
if err != nil {
if err == io.EOF {
continue
} else {
fmt.Println("read err:", err)
break
}
} else {
fmt.Println("recv:", result.String())
}
result.Reset()
}
}
客戶(hù)端代碼 client/main.go
func main() {
data := []byte("[這里才是一個(gè)完整的數(shù)據(jù)包]")
conn, err := net.DialTimeout("tcp", "localhost:4044", time.Second*30)
if err != nil {
fmt.Printf("connect failed, err : %v\n", err.Error())
return
}
for i := 0; i 1000; i++ {
_, err = conn.Write(data)
if err != nil {
fmt.Printf("write failed , err : %v\n", err)
break
}
}
}
運(yùn)行結(jié)果
listen to 4044
新連接: [::1]:53079
recv: [這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)�
recv: �][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包]
recv: [這里才是一個(gè)完整的數(shù)據(jù)包]
recv: [這里才是一個(gè)完整的數(shù)據(jù)包]
recv: [這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包][這里才是一個(gè)完整的數(shù)據(jù)包]
recv: [這里才是一個(gè)完整的數(shù)據(jù)包]
...省略其它的...
從服務(wù)端的控制臺(tái)輸出可以看出,存在三種類(lèi)型的輸出:
- 一種是正常的一個(gè)數(shù)據(jù)包輸出。
- 一種是多個(gè)數(shù)據(jù)包“粘”在了一起,我們定義這種讀到的包為粘包。
- 一種是一個(gè)數(shù)據(jù)包被“拆”開(kāi),形成一個(gè)破碎的包,我們定義這種包為半包。
為什么會(huì)出現(xiàn)半包和粘包?
- 客戶(hù)端一段時(shí)間內(nèi)發(fā)送包的速度太多,服務(wù)端沒(méi)有全部處理完。于是數(shù)據(jù)就會(huì)積壓起來(lái),產(chǎn)生粘包。
- 定義的讀的buffer不夠大,而數(shù)據(jù)包太大或者由于粘包產(chǎn)生,服務(wù)端不能一次全部讀完,產(chǎn)生半包。
什么時(shí)候需要考慮處理半包和粘包?
TCP連接是長(zhǎng)連接,即一次連接多次發(fā)送數(shù)據(jù)。
每次發(fā)送的數(shù)據(jù)是結(jié)構(gòu)的,比如 JSON格式的數(shù)據(jù) 或者 數(shù)據(jù)包的協(xié)議是由我們自己定義的(包頭部包含實(shí)際數(shù)據(jù)長(zhǎng)度、協(xié)議魔數(shù)等)。
解決思路
- 定長(zhǎng)分隔(每個(gè)數(shù)據(jù)包最大為該長(zhǎng)度,不足時(shí)使用特殊字符填充) ,但是數(shù)據(jù)不足時(shí)會(huì)浪費(fèi)傳輸資源
- 使用特定字符來(lái)分割數(shù)據(jù)包,但是若數(shù)據(jù)中含有分割字符則會(huì)出現(xiàn)Bug
- 在數(shù)據(jù)包中添加長(zhǎng)度字段,彌補(bǔ)了以上兩種思路的不足,推薦使用
拆包演示
通過(guò)上述分析,我們最好通過(guò)第三種思路來(lái)解決拆包粘包問(wèn)題。
Golang的bufio庫(kù)中有為我們提供了Scanner,來(lái)解決這類(lèi)分割數(shù)據(jù)的問(wèn)題。
type Scanner
Scanner provides a convenient interface for reading data such as a file of newline-delimited lines of text. Successive calls to the Scan method will step through the 'tokens' of a file, skipping the bytes between the tokens. The specification of a token is defined by a split function of type SplitFunc; the default split function breaks the input into lines with line termination stripped. Split functions are defined in this package for scanning a file into lines, bytes, UTF-8-encoded runes, and space-delimited words. The client may instead provide a custom split function.
簡(jiǎn)單來(lái)講即是:
Scanner為 讀取數(shù)據(jù) 提供了方便的 接口。連續(xù)調(diào)用Scan方法會(huì)逐個(gè)得到文件的“tokens”,跳過(guò) tokens 之間的字節(jié)。token 的規(guī)范由 SplitFunc 類(lèi)型的函數(shù)定義。我們可以改為提供自定義拆分功能。
接下來(lái)看看 SplitFunc 類(lèi)型的函數(shù)是什么樣子的:
type SplitFunc func(data []byte, atEOF bool) (advance int, token []byte, err error)
Golang官網(wǎng)文檔上提供的使用例子🌰:
func main() {
// An artificial input source.
const input = "1234 5678 1234567901234567890"
scanner := bufio.NewScanner(strings.NewReader(input))
// Create a custom split function by wrapping the existing ScanWords function.
split := func(data []byte, atEOF bool) (advance int, token []byte, err error) {
advance, token, err = bufio.ScanWords(data, atEOF)
if err == nil token != nil {
_, err = strconv.ParseInt(string(token), 10, 32)
}
return
}
// Set the split function for the scanning operation.
scanner.Split(split)
// Validate the input
for scanner.Scan() {
fmt.Printf("%s\n", scanner.Text())
}
if err := scanner.Err(); err != nil {
fmt.Printf("Invalid input: %s", err)
}
}
于是,我們可以這樣改寫(xiě)我們的程序:
服務(wù)端代碼 server/main.go
func main() {
l, err := net.Listen("tcp", ":4044")
if err != nil {
panic(err)
}
fmt.Println("listen to 4044")
for {
conn, err := l.Accept()
if err != nil {
fmt.Println("conn err:", err)
} else {
go handleConn2(conn)
}
}
}
func packetSlitFunc(data []byte, atEOF bool) (advance int, token []byte, err error) {
// 檢查 atEOF 參數(shù) 和 數(shù)據(jù)包頭部的四個(gè)字節(jié)是否 為 0x123456(我們定義的協(xié)議的魔數(shù))
if !atEOF len(data) > 6 binary.BigEndian.Uint32(data[:4]) == 0x123456 {
var l int16
// 讀出 數(shù)據(jù)包中 實(shí)際數(shù)據(jù) 的長(zhǎng)度(大小為 0 ~ 2^16)
binary.Read(bytes.NewReader(data[4:6]), binary.BigEndian, l)
pl := int(l) + 6
if pl = len(data) {
return pl, data[:pl], nil
}
}
return
}
func handleConn2(conn net.Conn) {
defer conn.Close()
defer fmt.Println("關(guān)閉")
fmt.Println("新連接:", conn.RemoteAddr())
result := bytes.NewBuffer(nil)
var buf [65542]byte // 由于 標(biāo)識(shí)數(shù)據(jù)包長(zhǎng)度 的只有兩個(gè)字節(jié) 故數(shù)據(jù)包最大為 2^16+4(魔數(shù))+2(長(zhǎng)度標(biāo)識(shí))
for {
n, err := conn.Read(buf[0:])
result.Write(buf[0:n])
if err != nil {
if err == io.EOF {
continue
} else {
fmt.Println("read err:", err)
break
}
} else {
scanner := bufio.NewScanner(result)
scanner.Split(packetSlitFunc)
for scanner.Scan() {
fmt.Println("recv:", string(scanner.Bytes()[6:]))
}
}
result.Reset()
}
}
客戶(hù)端代碼 client/main.go
func main() {
l, err := net.Listen("tcp", ":4044")
if err != nil {
panic(err)
}
fmt.Println("listen to 4044")
for {
conn, err := l.Accept()
if err != nil {
fmt.Println("conn err:", err)
} else {
go handleConn2(conn)
}
}
}
func packetSlitFunc(data []byte, atEOF bool) (advance int, token []byte, err error) {
// 檢查 atEOF 參數(shù) 和 數(shù)據(jù)包頭部的四個(gè)字節(jié)是否 為 0x123456(我們定義的協(xié)議的魔數(shù))
if !atEOF len(data) > 6 binary.BigEndian.Uint32(data[:4]) == 0x123456 {
var l int16
// 讀出 數(shù)據(jù)包中 實(shí)際數(shù)據(jù) 的長(zhǎng)度(大小為 0 ~ 2^16)
binary.Read(bytes.NewReader(data[4:6]), binary.BigEndian, l)
pl := int(l) + 6
if pl = len(data) {
return pl, data[:pl], nil
}
}
return
}
func handleConn2(conn net.Conn) {
defer conn.Close()
defer fmt.Println("關(guān)閉")
fmt.Println("新連接:", conn.RemoteAddr())
result := bytes.NewBuffer(nil)
var buf [65542]byte // 由于 標(biāo)識(shí)數(shù)據(jù)包長(zhǎng)度 的只有兩個(gè)字節(jié) 故數(shù)據(jù)包最大為 2^16+4(魔數(shù))+2(長(zhǎng)度標(biāo)識(shí))
for {
n, err := conn.Read(buf[0:])
result.Write(buf[0:n])
if err != nil {
if err == io.EOF {
continue
} else {
fmt.Println("read err:", err)
break
}
} else {
scanner := bufio.NewScanner(result)
scanner.Split(packetSlitFunc)
for scanner.Scan() {
fmt.Println("recv:", string(scanner.Bytes()[6:]))
}
}
result.Reset()
}
}
運(yùn)行結(jié)果
listen to 4044
新連接: [::1]:55738
recv: [這里才是一個(gè)完整的數(shù)據(jù)包]
recv: [這里才是一個(gè)完整的數(shù)據(jù)包]
recv: [這里才是一個(gè)完整的數(shù)據(jù)包]
recv: [這里才是一個(gè)完整的數(shù)據(jù)包]
recv: [這里才是一個(gè)完整的數(shù)據(jù)包]
recv: [這里才是一個(gè)完整的數(shù)據(jù)包]
recv: [這里才是一個(gè)完整的數(shù)據(jù)包]
recv: [這里才是一個(gè)完整的數(shù)據(jù)包]
...省略其它的...
總結(jié)
以上就是這篇文章的全部?jī)?nèi)容了,希望本文的內(nèi)容對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,謝謝大家對(duì)腳本之家的支持。
您可能感興趣的文章:- golang之tcp自動(dòng)重連實(shí)現(xiàn)方法
- 利用Golang實(shí)現(xiàn)TCP連接的雙向拷貝詳解
- 6行代碼快速解決golang TCP粘包問(wèn)題