在江蘇常州,一家長期專注于 Zabbix 產(chǎn)品化二次開發(fā)的研發(fā)機構(gòu)-縱目信息(ZMOPS),正在為這一愿景付諸實踐。以數(shù)據(jù)采集→處理→分析→觀測為產(chǎn)品主干,以 Zabbix 為底層**打造的統(tǒng)一監(jiān)控產(chǎn)品應(yīng)用于數(shù)十個行業(yè),同時不斷推進(jìn)基于 Zabbix 的物聯(lián)網(wǎng)數(shù)據(jù)平臺的開源。Argus 是一個面向私有化及混合云數(shù)據(jù)中心提供***多層次的統(tǒng)一監(jiān)控和運維管理平臺,幫助用戶實時對各類IT資源(網(wǎng)絡(luò)設(shè)備、服務(wù)器、存儲、數(shù)據(jù)庫、中間件等)執(zhí)行性能指標(biāo)監(jiān)控,實現(xiàn)事前運維。zabbix大流量數(shù)據(jù)的存儲。企業(yè)級zabbix項目
開放性:源代碼全公開,任何用戶都可以編譯和發(fā)布自己的版本。同時,社區(qū)和互聯(lián)網(wǎng)可以找到大量的模版??蓴U展性:支持用戶自定義監(jiān)控項,只要能想得到的KPI,基本都能監(jiān)控的到。數(shù)據(jù)采集:可用性和性能檢測,自動發(fā)現(xiàn),支持agent、SNMP、JMX、telnet等多種采集方式,支持主動和被動模式數(shù)據(jù)傳輸高可用:server對設(shè)備性能要求低,支持proxy分布式監(jiān)控,分布式集中管理,開放式接口,擴展性強告警管理:支持多條件告警,支持多種告警方式,模板能力:支持多組模板,模板繼承。告警設(shè)置:告警周期,告警級別,告警恢復(fù)通知、告警暫停,時段閾值、支持維護周期、支持單機停用歷史數(shù)據(jù):歷史數(shù)據(jù)查詢可配置,內(nèi)置housekeeping數(shù)據(jù)清理機制安全審計:具備安全的用戶審計日志,權(quán)限認(rèn)證,用戶可以限制允許維護的列表。無商業(yè)版本:平臺本身沒有商業(yè)版和社區(qū)版本的區(qū)分,ZABBIX只對商業(yè)服務(wù)收費(如培訓(xùn)、定制開發(fā)、部署服務(wù)等)。zabbix 6.2支持場景基于TimeScaleDB(PG時序數(shù)據(jù)庫)離線部署Zabbix5.4。
在實際的工作環(huán)境中,根據(jù)網(wǎng)絡(luò)環(huán)境和監(jiān)控的規(guī)模不同,zabbix一共有三種框架,分別是server_client架構(gòu)、master_node_client架構(gòu)和server_proxy_client架構(gòu)。1、server_client架構(gòu)zabbix**簡單的架構(gòu),監(jiān)控設(shè)備和被監(jiān)控設(shè)備之間直接相連,zabbix_server和zabbix_client之間直接進(jìn)行數(shù)據(jù)交互。2、zabbix_proxy_client架構(gòu)proxy是連接server和client之間的橋梁,其本身不存放數(shù)據(jù),只是將zabbix_agent端發(fā)來的數(shù)據(jù)暫存,然后再提交給server。這種架構(gòu)一般用于跨機房、跨網(wǎng)絡(luò)的中型網(wǎng)絡(luò)架構(gòu)。在server_proxy_client架構(gòu)中,server設(shè)備的宕機會導(dǎo)致整個系統(tǒng)癱瘓而無法正常工作。3、master_node_client架構(gòu)master_node_client架構(gòu)是zabbix**復(fù)雜的架構(gòu)。一般用于跨機房、跨網(wǎng)絡(luò)、監(jiān)控設(shè)備較多的大型網(wǎng)絡(luò)架構(gòu)。與server_proxy_client架構(gòu)相比,master_node_client架構(gòu)的主要區(qū)別在于node與proxy上.在master_node_client架構(gòu)中,每個node可以理解為一個小的server端,在自己的配置文件和數(shù)據(jù)庫,node下游可以直接連接client,也可以再次經(jīng)過proxy代理后連接client。在master_node_client架構(gòu)中,master設(shè)備宕機不會影響node節(jié)點的正常工作。
既然進(jìn)程之間是流水線式的協(xié)作,我們看一下監(jiān)控數(shù)據(jù)在三類進(jìn)程之間如何進(jìn)行輸入和輸出。首先,Trapper和poller進(jìn)程接收到的數(shù)據(jù)按照來源分為兩種,一種是來自proxy端,一種是來自agent端。由于來自proxy端的數(shù)據(jù)已經(jīng)由proxy完成了預(yù)處理,所以,這部分?jǐn)?shù)據(jù)會直接輸出到共享內(nèi)存,供historysyncer進(jìn)程使用。對于來自agent端的數(shù)據(jù),無論其監(jiān)控項是否設(shè)置了預(yù)處理步驟,都會通過unix域套接字傳遞給預(yù)處理進(jìn)程。預(yù)處理進(jìn)程接收到數(shù)據(jù)以后,如果發(fā)現(xiàn)該數(shù)據(jù)并沒有設(shè)置預(yù)處理步驟,則直接寫入共享內(nèi)存,供historysyncer進(jìn)程使用;如果發(fā)現(xiàn)需要預(yù)處理,則在預(yù)處理完畢以后再寫入共享內(nèi)存,供historysyncer進(jìn)程使用。對于historysyncer進(jìn)程來說,其輸入數(shù)據(jù)來自共享內(nèi)存,它會批量地從共享內(nèi)存讀取數(shù)據(jù)進(jìn)行處理,具體處理過程是先寫入數(shù)據(jù)庫,然后計算觸發(fā)器表達(dá)式生成event。Zabbix前端的高可用性如何?
Zabbix能監(jiān)視各種網(wǎng)絡(luò)參數(shù),保證服務(wù)器系統(tǒng)的安全運營,并提供靈活的通知機制以讓系統(tǒng)管理員快速定位/解決存在的各種問題。是一個基于WEB界面的提供企業(yè)級的開源分布式系統(tǒng)監(jiān)視以及網(wǎng)絡(luò)監(jiān)視功能的企業(yè)級的開源解決方案。Agent端:主機通過安裝agent方式采集數(shù)據(jù);Server端:通過收集agent發(fā)送的數(shù)據(jù),寫入數(shù)據(jù)庫(MySQL,ORACLE),在通過php+apache/nginx在web前端展示。優(yōu)點:基于兩款工具(cacti+Nagios)優(yōu)點于一身并更強大,實現(xiàn)企業(yè)級分布式監(jiān)控。缺點:需在被監(jiān)控主機上安裝agent,所有數(shù)據(jù)都存在數(shù)據(jù)庫里,產(chǎn)生的數(shù)據(jù)量很大,瓶頸主要在數(shù)據(jù)庫。Zabbix 6.2將又一次提升新用戶和老用戶的用戶體驗。企業(yè)級zabbix項目
在所有Zabbix Agent配置文件中的Server和ServerActive參數(shù)中列出Zabbix Server集群節(jié)點信息;企業(yè)級zabbix項目
各個大廠都有提供相關(guān)監(jiān)控產(chǎn)品,比如說微軟的SCOM,IBM的Tivoli,華為的Esight,HP的BSM等,如果環(huán)境都是單一的某一家廠家的產(chǎn)品,用該廠家提供的監(jiān)控工具肯定是合適的,筆者就曾經(jīng)深度使用過SCOM,2005年還叫MOM,是SystemCenter中的一個套件,這個產(chǎn)品對于微軟周邊的產(chǎn)品如AD、Exchange、Windows、SQLServer、SharePoint、Lync等監(jiān)控非常深入,同時微軟官方還提供了相關(guān)故障知識庫,報表也做得非常不錯。但是,如果拿SCOM去監(jiān)控Linux、AIX、Oracle或者網(wǎng)絡(luò)通訊設(shè)備就顯得不合適了。Zabbix很好地平衡了監(jiān)控的深度和廣度,而且源于開源的力量,在全球用戶的持續(xù)貢獻(xiàn)下,他的深度和廣度是在持續(xù)不斷地延展的。企業(yè)級zabbix項目
上海觀縱科技有限公司致力于傳媒、廣電,是一家服務(wù)型的公司。公司自成立以來,以質(zhì)量為發(fā)展,讓匠心彌散在每個細(xì)節(jié),公司旗下webfunny前端監(jiān)控,webfunny前端埋點,全鏈路應(yīng)用性能監(jiān)控,Argus-IT運維監(jiān)控深受客戶的喜愛。公司注重以質(zhì)量為中心,以服務(wù)為理念,秉持誠信為本的理念,打造傳媒、廣電良好品牌。在社會各界的鼎力支持下,持續(xù)創(chuàng)新,不斷鑄造高質(zhì)量服務(wù)體驗,為客戶成功提供堅實有力的支持。