在最近遇到的一次問(wèn)題中,有這樣一種現(xiàn)象:
系統(tǒng)有一個(gè)測(cè)試腳本會(huì)不斷的執(zhí)行docker run命令來(lái)運(yùn)行容器,在測(cè)試過(guò)程中發(fā)現(xiàn)有一個(gè)情況是,有時(shí)候容器沒(méi)有完全被運(yùn)行到"Up"狀態(tài),而是處于"created"狀 態(tài),現(xiàn)象十分奇怪。
上環(huán)境首先查看了"created"狀態(tài)的容器,以及dockerd日志:
(1) dockerd的日志中只有"post create"請(qǐng)求,但是居然沒(méi)有收到該容器的"post start"請(qǐng)求;
(2) 手動(dòng)執(zhí)行docker start是可以將此容器拉起到"Up"狀態(tài),說(shuō)明容器、鏡像本身沒(méi)有問(wèn)題。
綜合上面現(xiàn)象,懷疑是"docker run"流程沒(méi)有執(zhí)行完畢,docker run就退出了導(dǎo)致。立刻翻閱"docker run"在cli/command/container/run.go中對(duì)于"docker run"命令的處理函數(shù)func runRun()的實(shí)現(xiàn)中有如下情況:
func runRun(dockerCli *command.DockerCli, flags *pflag.FlagSet, opts *runOptions, copts *runconfigopts.ContainerOptions) error {
。。。。。。
createResponse, err := createContainer(ctx, dockerCli, config, hostConfig, networkingConfig, hostConfig.ContainerIDFile, opts.name)
。。。。。。
if err := client.ContainerStart(ctx, createResponse.ID, types.ContainerStartOptions{}); err != nil {)
。。。。。
}
如果在執(zhí)行完createContainer()函數(shù)后"docker run"命令異常退出(如遇到kill信號(hào)),此時(shí)ContainerStart()函數(shù)無(wú)法繼續(xù)運(yùn)行。這就會(huì)導(dǎo)致容器雖然創(chuàng)建成功處于"created"狀態(tài),但是并沒(méi)有真正的給dockerd"post start",最終造成上述現(xiàn)象。
因而在日常生產(chǎn)過(guò)程中有必要對(duì)"docker run"命令進(jìn)行監(jiān)控,比如判斷它是否執(zhí)行成功,是否異常退出,退出時(shí)返回值是否為0等等。
補(bǔ)充:docker運(yùn)行容器后處于運(yùn)行狀態(tài)三種方法
第一種解決方法
我們?cè)谶\(yùn)行docker容器的時(shí)候很多時(shí)候處于 Exited狀態(tài)。
比如下面的命令 docker run -d --name nginx -P nginx /bin/bash 這種交互形式在運(yùn)行完之后就會(huì)退出,重新docker start的也沒(méi)有用;
如果想在運(yùn)行之后容器處于運(yùn)行狀態(tài)只需把/bin/bash去掉即可。
第二種解決方法
docker run -it --name nginxit -P nginx
現(xiàn)在容器nginxit處于退出狀態(tài);
只要我們用docker啟動(dòng)下就可以使用
第三種和第二種類(lèi)似:
docker run -it --name nginxit2 -P nginx /bin/bash
前后臺(tái)交互需要退出:
root@de4dbb27f905:/# exit
然后再重啟:
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教。