好看的小说完本推荐,盗墓笔记

主頁 > 知識庫 > pgsql之pg_stat_replication的使用詳解

pgsql之pg_stat_replication的使用詳解

pg_stat_replication是一個視圖，主要用于監(jiān)控一個基于流的設置，建議您注意系統(tǒng)上稱作pg_stat_replication的視圖。（注：當前版本為pg 10.0,10.0以下版本，字段名會有差異）此視圖包含以下信息：

\d pg_stat_replication

每個字段代碼的含義：

• pid 這代表負責流連接的wal_sender進程的進程ID。如果您在您的操作系統(tǒng)上檢查您進程表，您應該會找到一個帶有那個號碼的PostgreSQL進程。

• usesysid 每個內部用戶都有一個獨一無二的編號。該系統(tǒng)的工作原理很像UNIX。 usesysid 是 (PostgreSQL) 用戶連接到系統(tǒng)的唯一標識符。

• usename (不是用戶名, 注意少了 r)它存儲與用戶相關的 usesysid 的名字。這是客戶端放入到連接字符串中的東西。

• application_name這是同步復制的通常設置。它可以通過連接字符串傳遞到master。

• client_addr它會告訴您流連接從何而來。它擁有客戶端的IP地址。

• client_hostname除了客戶端的IP，您還可以這樣做，通過它的主機名來標識客戶端。您可以通過master上的postgresql.conf中的log_hostname啟用DNS反向查找。

• client_port這是客戶端用來和WALsender進行通信使用的TPC端口號。如果不本地UNIX套接字被使用了將顯示-1。

• backend_start它告訴我們slave什么時間創(chuàng)建了流連接。

• state此列告訴我們數據的連接狀態(tài)。如果事情按計劃進行，它應該包含流信息。

• sent_lsn這代表發(fā)送到連接的最后的事務日志的位置。

• write_lsn這是寫到standby系統(tǒng)磁盤上最后的事務日志位置。

• flush_lsn這是被刷新到standby系統(tǒng)的最后位置。（這里注意寫和刷新之間的區(qū)別。寫并不意味著刷新。）

• replay_lsn這是slave上重放的最后的事務日志位置。

• sync_priority這個字段是唯一和同步復制相關的。每次同步復制將會選擇一個優(yōu)先權 —sync_priority—會告訴您選擇了那個優(yōu)先權。

• sync_state最后您會看到slave在哪個狀態(tài)。這個狀態(tài)可以是

async, sync, or potential。當有一個帶有較高優(yōu)先權的同步slave時，PostgreSQL會把slave 標記為 potential。

在這個系統(tǒng)視圖中每個記錄只代表一個slave。因此，可以看到誰處于連接狀態(tài)，在做什么任務。pg_stat_replication也是檢查slave是否處于連接狀態(tài)的一個好方法。

上面說到pid代表負責流連接的wal_sender進程的進程ID，我們在機器上通過ps命令查看該進程的狀態(tài):

ps -aux|grep 8225

在Linux上我們可以看到那個進程不僅有自己的作用 (在這種情況下, wal_sender)，而且還帶有終端用戶的名字以及相關的網絡連接信息。在上圖中我們可以看到已經有人從192.168.47.127（對應pg_stat_replication的client_addr字段）通過51519(對應pg_stat_replication的client_port字段）)端口連接到了master。

bonus：

上面我們提到replay_lsn是slave上重放的最后的事務日志位置。

pg_current_wal_lsn（）函數的作用是獲取當前的wal log的寫位置。

pg_wal_lsn_diff()函數的作用是計算兩個wal日志之間的差距。

所以我們可以通過下面的方法獲取高可用架構下從庫的復制延遲情況：

 SELECT
   pg_wal_lsn_diff(A .c1, replay_lsn) /(1024 * 1024) AS slave_latency_MB
  FROM
   pg_stat_replication,
   pg_current_wal_lsn() AS A(c1)
  WHERE client_addr='%s' and application_name = '%s'
  ORDER BY
   slave_latency_MB
  LIMIT 1;

補充：PostgreSQL pg_stat_replication sync_state introduce

PostgreSQL 9.2引入同步復制后, pg_stat_replication的sync_state列有3種狀態(tài).

sync

async

potential

分別代表同步standby, 異步standby, 可升級為同步的standby.

狀態(tài)來自以下函數 : pg_stat_get_wal_senders

[測試]

環(huán)境:

1個 primary, 3個 standby.

第一種配置 :

primary配置

postgresql.conf
synchronous_standby_names = 'test1,test2,test3'

standby1配置

primary_conninfo = 'application_name=test1 host=127.0.0.1 port=1999 user=postgres keepalives_idle=60'

standby2配置

primary_conninfo = 'application_name=test2 host=127.0.0.1 port=1999 user=postgres keepalives_idle=60'

standby3配置

primary_conninfo = 'application_name=test3 host=127.0.0.1 port=1999 user=postgres keepalives_idle=60'

primary查詢

digoal=# select pid,application_name,client_addr,sync_state from pg_stat_replication;
 pid | application_name | client_addr | sync_state 
------+------------------+-------------+------------
 6311 | test1   | 127.0.0.1 | sync
 6321 | test2   | 127.0.0.1 | potential
 6391 | test3   | 127.0.0.1 | potential
(3 rows)

如果sync節(jié)點掛掉, 按synchronous_standby_names的順序, 第一個potential節(jié)點會變成sync狀態(tài).

pg_ctl stop -m fast -D /pgdata11999
digoal=# select pid,application_name,client_addr,sync_state from pg_stat_replication;
 pid | application_name | client_addr | sync_state 
------+------------------+-------------+------------
 6564 | test2   | 127.0.0.1 | sync
 6568 | test3   | 127.0.0.1 | potential
(2 rows)

當test1重新起來后又會變成sync狀態(tài).

pg93@db-172-16-3-33-> pg_ctl start -D /pgdata11999
server starting
digoal=# select pid,application_name,client_addr,sync_state from pg_stat_replication;
 pid | application_name | client_addr | sync_state 
------+------------------+-------------+------------
 6564 | test2   | 127.0.0.1 | potential
 6605 | test1   | 127.0.0.1 | sync
 6568 | test3   | 127.0.0.1 | potential
(3 rows)

第二種配置 :

primary配置

synchronous_standby_names = 'test1,test2'

standby1配置不變

standby2配置不變

standby3配置不變

primary查詢

digoal=# select pid,application_name,client_addr,sync_state from pg_stat_replication;
 pid | application_name | client_addr | sync_state 
------+------------------+-------------+------------
 6470 | test1   | 127.0.0.1 | sync
 6472 | test3   | 127.0.0.1 | async
 6474 | test2   | 127.0.0.1 | potential
(3 rows)

test3變成異步了. 因為test3沒有配置在primary的synchronous_standby_names 中.

第三種配置 :

primary配置

synchronous_standby_names = 'test1'

standby1配置不變

standby2配置不變

standby3配置不變

primary查詢

digoal=# select pid,application_name,client_addr,sync_state from pg_stat_replication;
 pid | application_name | client_addr | sync_state 
------+------------------+-------------+------------
 6519 | test2   | 127.0.0.1 | async
 6521 | test3   | 127.0.0.1 | async
 6523 | test1   | 127.0.0.1 | sync
(3 rows)

test2,test3變成異步了. 因為test2,test3沒有配置在primary的synchronous_standby_names 中.

1. src/backend/replication/walsender.c

/*
 * Returns activity of walsenders, including pids and xlog locations sent to
 * standby servers.
 */
Datum
pg_stat_get_wal_senders(PG_FUNCTION_ARGS)
{
...略
   /*
    * More easily understood version of standby state. This is purely
    * informational, not different from priority.
    */
   if (sync_priority[i] == 0)
    values[7] = CStringGetTextDatum("async");
   else if (i == sync_standby)
    values[7] = CStringGetTextDatum("sync");
   else
    values[7] = CStringGetTextDatum("potential");
...略

以上為個人經驗，希望能給大家一個參考，也希望大家多多支持腳本之家。如有錯誤或未考慮完全的地方，望不吝賜教。

您可能感興趣的文章:

PostgreSQL 恢復誤刪數據的操作
在postgreSQL中運行sql腳本和pg_restore命令方式
PostgreSQL物理備份恢復之 pg_rman的用法說明

標簽：濮陽杭州昭通溫州榆林辛集寶雞海西

巨人網絡通訊聲明：本文標題《pgsql之pg_stat_replication的使用詳解》，本文關鍵詞 pgsql,之,stat,replication,的,；如發(fā)現本文內容存在版權問題，煩請?zhí)峁┫嚓P信息告之我們，我們將及時溝通與處理。本站內容系統(tǒng)采集于網絡，涉及言論、版權與本站無關。