97色精品视频在线观看免费,日韩欧美亚洲每日更新网,国产精品色婷婷99久久精品,99e热久久免费精品首页

運維思索:系統(tǒng)監(jiān)控體系

2024-07-10 14:01:17 Jinyu

因此接下來一段時間,我可能會陸續(xù)分享運維過程中對一些問題的思考,希望給大家?guī)硪欢ǖ膯l(fā)。


本次分享的是確立一套運維監(jiān)控體系,構(gòu)建可持續(xù)成長的監(jiān)控平臺。


系統(tǒng)監(jiān)控現(xiàn)狀及問題

1.如何監(jiān)控?

硬件、基礎(chǔ)狀態(tài)、應(yīng)用、業(yè)務(wù),監(jiān)控對象多而且雜,如何能夠全部覆蓋?

企業(yè)內(nèi)部的各種監(jiān)控工具,我們應(yīng)該如何管理?

監(jiān)控工具之間的信息孤島如何處理?

2.如何告警?

告警太多,如何沉淀有效告警?

告警泛濫,如何進行收斂,避免告警的狂轟濫炸?

3.如何處理?

告警處理無記錄,和企業(yè)運維流程脫節(jié),怎樣形成知識沉淀?-----所謂的知識庫,線下整理不及時,增加工作負擔。

告警處理純靠手動,每個月都在重復處理相同故障,如何避免?-----手動處理效率不高,牽扯太多的精力。


以上問題是在建設(shè)監(jiān)控系統(tǒng)時面臨的一些問題,以前我總是想用一個監(jiān)控產(chǎn)品來實現(xiàn)所有的需求,避免我們在多個產(chǎn)品間來回切換,看來有點舍本逐末。


平臺化監(jiān)控思路轉(zhuǎn)變

首先,我們先從監(jiān)控的本質(zhì)出發(fā):監(jiān)控系統(tǒng)的目的是為了及時發(fā)現(xiàn)問題,解決問題,直至預(yù)測問題,不是為了整合系統(tǒng)


其次,隨著公司技術(shù)棧的不斷升級,業(yè)務(wù)系統(tǒng)的架構(gòu)也在不斷演進,而原來傳統(tǒng)監(jiān)控可能就不能夠滿足監(jiān)控需求。此時就需要不斷補充監(jiān)控手段,例如Grafana、Prometheus、ELK,實現(xiàn)圖形化監(jiān)控、容器監(jiān)控、日志監(jiān)控。因此監(jiān)控平臺一定是多種監(jiān)控產(chǎn)品并存,而運維需要構(gòu)建可持續(xù)成長的監(jiān)控平臺


最后,在認清以上監(jiān)控治理的現(xiàn)狀后,我們需要實現(xiàn)監(jiān)控建設(shè)的思路轉(zhuǎn)變:由產(chǎn)品化思路向平臺化思路轉(zhuǎn)變。即:由要找一個大而全的監(jiān)控產(chǎn)品,囊括全部的監(jiān)控訴求轉(zhuǎn)變?yōu)樾枰粋€具備功能生長性的監(jiān)控平臺,來承載核心監(jiān)控訴求,并能統(tǒng)一集成外部的各種監(jiān)控產(chǎn)品,服務(wù)于業(yè)務(wù)監(jiān)控的目標。



PaaS屬性

構(gòu)建功能可持續(xù)成長的監(jiān)控平臺,關(guān)鍵在于監(jiān)控平臺需要具備paas屬性:


1

監(jiān)控iPaaS層


監(jiān)控平臺層,負責提供面向各類監(jiān)控對象的基本的監(jiān)控采集、存儲、分析和告警的能力和工具;同時需要提供paas集成能力,能夠?qū)雍图赏獠勘O(jiān)控工具和系統(tǒng)。


2

監(jiān)控aPaaS層


監(jiān)控場景工具層,通過調(diào)用平臺層的監(jiān)控能力和監(jiān)控工具,面向具體的應(yīng)用和業(yè)務(wù),提供組裝式的、復合的監(jiān)控場景工具,例如:統(tǒng)一告警中心、監(jiān)控可視化、故障自愈等。


總結(jié)大體布局如下:

圖片


從這套監(jiān)控架構(gòu)來看,相信很多小伙伴都已經(jīng)實現(xiàn)到了iPaaS(監(jiān)控平臺層)級別的監(jiān)控,往往忽視了aPaaS(監(jiān)控場景層)的多樣性需求,如統(tǒng)一告警中心、故障自愈等的需求。而我們建立監(jiān)控系統(tǒng)就是通過場景去發(fā)現(xiàn)問題、解決問題、甚至是預(yù)測問題。


雖然以上統(tǒng)一監(jiān)控完成了監(jiān)控由產(chǎn)品到平臺的轉(zhuǎn)變,也同樣存在以下優(yōu)缺點:

  1. 集成不同的監(jiān)控工具,一定程度上實現(xiàn)了監(jiān)控數(shù)據(jù)之前的共享和融合;

  2. 業(yè)務(wù)和應(yīng)用無法有效關(guān)聯(lián),導致告警在一定程度上是脫離業(yè)務(wù)的,需要運維人員自行腦圖總結(jié);

  3. 由于不同工具的接入,平臺層和場景層如何聯(lián)動,需要運維人員統(tǒng)一API接入;


看到這,小伙伴會想:為什么問題都是會不期而至呢?因為這些就是我們平時會忽略的細節(jié)問題。如果我們能集中資源從細節(jié)入手,那么我們可能就會得到意想不到的收獲!


總結(jié)

了解過藍鯨的小伙伴,可能對以上內(nèi)容比較熟悉,但重點是我們?nèi)绾握驹诰奕说募绨蛏蟻砜辞逦覀兊牟蛔悖瑥氖裁唇嵌热ニ伎紗栴}。


以上的平臺化監(jiān)控架構(gòu)可以為我們構(gòu)建系統(tǒng)監(jiān)控體系提供了思路,剩下的就是我們?nèi)绾螐募毠?jié)性問題入手,利用技術(shù)手段去解決問題了。


我要咨詢
主站蜘蛛池模板: 宜良县| 建平县| 孙吴县| 土默特右旗| 井冈山市| 平阳县| 体育| 吐鲁番市| 大悟县| 常德市| 三明市| 南皮县| 石泉县| 即墨市| 汽车| 廉江市| 安吉县| 克拉玛依市| 全州县| 康平县| 榕江县| 漳州市| 宝兴县| 肥城市| 泽库县| 华安县| 丰原市| 德清县| 濮阳县| 呼图壁县| 磴口县| 高青县| 得荣县| 贡山| 拜泉县| 邵阳市| 贞丰县| 屏东市| 陈巴尔虎旗| 鄱阳县| 舞阳县|