看人工智能如何在DevOps中大展身手

來源：北大青鳥總部 2023年07月06日 08:55

摘要： DevOps，即研發(fā)運(yùn)維，它指的是技術(shù)團(tuán)隊(duì)一種新的軟件研發(fā)管理思想，把團(tuán)隊(duì)開發(fā)人員和運(yùn)維人員一體化，將業(yè)務(wù)需求拆分原子化，使用云計(jì)算、微服務(wù)、持續(xù)集成交付工具來最大化的將業(yè)務(wù)流程自動(dòng)化，對所有的過程進(jìn)行記錄和分析，使用數(shù)據(jù)來精準(zhǔn)營銷與決策。

對于人工智能，我們通過機(jī)器學(xué)習(xí)、深度學(xué)習(xí)算法已經(jīng)有很了很多了解了。但實(shí)際上，我們還在人工智能的初級階段，未來一段時(shí)間內(nèi)可能處于并將長期處于人工智能初級階段。在人工智能逐漸“智能”的過程中，有一種形態(tài)有點(diǎn)意思，那便是知識圖譜。

這是Google在2012年5月17日提出的新概念，它本質(zhì)上是實(shí)體之間關(guān)系的語義網(wǎng)絡(luò)，把信息轉(zhuǎn)化為知識。日常生活中我們接觸到的信息是外部的客觀事實(shí)，比如這里有一只冰淇淋，它現(xiàn)在是凝固狀態(tài)，而知識是對外部客觀規(guī)律的歸納和總結(jié)，比如冰淇淋的保存維度是0度以下，大于0度時(shí)就會(huì)融化。

DevOps，即研發(fā)運(yùn)維，它指的是技術(shù)團(tuán)隊(duì)一種新的軟件研發(fā)管理思想，把團(tuán)隊(duì)開發(fā)人員和運(yùn)維人員一體化，將業(yè)務(wù)需求拆分原子化，使用云計(jì)算、微服務(wù)、持續(xù)集成交付工具來最大化的將業(yè)務(wù)流程自動(dòng)化，對所有的過程進(jìn)行記錄和分析，使用數(shù)據(jù)來精準(zhǔn)營銷與決策。

大家覺得DevOps和人工智能都是技術(shù)領(lǐng)域的兩個(gè)分支，都是賦能業(yè)務(wù)的，兩者之間不會(huì)有什么交集。那你可就錯(cuò)了。人工智能是技術(shù)領(lǐng)域的一個(gè)分支，它適用的范圍非常廣，只要有數(shù)據(jù)的地方它都能發(fā)揮作用，用戶使用產(chǎn)品產(chǎn)生的數(shù)據(jù)，研發(fā)開發(fā)產(chǎn)品所產(chǎn)生的數(shù)據(jù)，系統(tǒng)內(nèi)部交互的數(shù)據(jù)，它都可以做分析。DevOps可以讓人工智能領(lǐng)域的開發(fā)人員更好的開發(fā)，讓業(yè)務(wù)部門的開發(fā)人員更好的利用人工智能領(lǐng)域的數(shù)據(jù)，反過來，人工智能數(shù)據(jù)也可以讓DevOps更好的進(jìn)行，我們就一起來看看人工智能的分支知識圖譜如何在DevOps中大展身手吧。

在軟件研發(fā)過程中，從需求的開發(fā)到上線包含很多數(shù)據(jù)。它包含需求評審確認(rèn)之后的研發(fā)開發(fā)工時(shí)、測試工時(shí)、整個(gè)需求上線時(shí)長；研發(fā)開發(fā)過程中的代碼提交次數(shù)、代碼量；上線過程中的成功發(fā)布次數(shù)、回滾次數(shù)；運(yùn)行產(chǎn)品的數(shù)據(jù)中心、物理機(jī)、虛擬機(jī)、接入交換機(jī)、核心交換機(jī)、路由、部署實(shí)例。通過一整套數(shù)據(jù)可以搭建軟硬件研發(fā)運(yùn)維知識圖譜，以全局的視角只是系統(tǒng)內(nèi)各個(gè)應(yīng)用、軟件、硬件、虛擬機(jī)、物理機(jī)的邏輯、調(diào)用關(guān)系、鏈接關(guān)系，幫助研發(fā)人員在遇到問題時(shí)更好的找到問題、解決問題，幫助產(chǎn)品人員在產(chǎn)品開發(fā)時(shí)更好的知道風(fēng)險(xiǎn)、解決風(fēng)險(xiǎn)。

研發(fā)運(yùn)維知識圖譜其實(shí)很好搭建，它的模型其實(shí)是最簡單的。為什么這么說呢？因?yàn)樗臄?shù)據(jù)來源、數(shù)據(jù)類型、數(shù)據(jù)結(jié)構(gòu)、使用用戶都是固定的，機(jī)器硬件產(chǎn)生的數(shù)據(jù)、系統(tǒng)之間調(diào)用的數(shù)據(jù)、研發(fā)工具軟件產(chǎn)生的數(shù)據(jù)全匯聚到一起，每一個(gè)實(shí)體與實(shí)體之間的關(guān)系也是相對固定的，比如系統(tǒng)間的調(diào)用關(guān)系、部署集群與業(yè)務(wù)的所屬關(guān)系、數(shù)據(jù)與數(shù)據(jù)的上下游關(guān)系。相對業(yè)務(wù)所遇到的不同場景的半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)的收集與處理，實(shí)體之間關(guān)系的甄別、論證、優(yōu)化來說，研發(fā)運(yùn)維知識圖譜真的太簡單了。

在研發(fā)運(yùn)維知識圖譜搭建的過程中，我們可以使用圖數(shù)據(jù)庫來進(jìn)行存儲。圖數(shù)據(jù)庫的模式天然就是和知識圖譜匹配的，都以實(shí)體為中心，實(shí)體與實(shí)體之間通過關(guān)系鏈接起來，因此采用圖數(shù)據(jù)庫存儲數(shù)據(jù)是最好的選擇。此外圖數(shù)據(jù)庫在查詢數(shù)據(jù)、獲取數(shù)據(jù)時(shí)性能也很好，不需要像關(guān)系型數(shù)據(jù)庫那么復(fù)雜。圖數(shù)據(jù)庫的擴(kuò)展性也很好，有新的數(shù)據(jù)增加時(shí)就增加新的實(shí)體屬性、關(guān)系屬性就好了，不用像關(guān)系型數(shù)據(jù)庫那樣還需要增加新的表、新的字段、新的關(guān)聯(lián)關(guān)系。

在研發(fā)運(yùn)維知識圖譜搭建好了之后，我們就可以基于此建立我們的告警規(guī)則了。在系統(tǒng)數(shù)據(jù)告警中，可以基于告警數(shù)據(jù)的模型訓(xùn)練來智能建立告警規(guī)則，也可以通過人為的經(jīng)驗(yàn)值來設(shè)定告警閾值，不斷的調(diào)整適應(yīng)。通過人為經(jīng)驗(yàn)值就比較簡單了，有經(jīng)驗(yàn)的開發(fā)同學(xué)他會(huì)根據(jù)所遇到的業(yè)務(wù)規(guī)模、用戶流量、機(jī)器系統(tǒng)硬件配置、負(fù)載情況來設(shè)定，比如設(shè)置CPU達(dá)到90%時(shí)觸發(fā)告警，內(nèi)存使用率超過80%時(shí)告警。通過數(shù)據(jù)訓(xùn)練告警模型就是一個(gè)比較長期的事情，我們需要先采集告警數(shù)據(jù)，數(shù)據(jù)分類，歷史發(fā)生過的告警次數(shù)，準(zhǔn)確告警次數(shù)來學(xué)習(xí)告警、分類告警，最后達(dá)到預(yù)測告警。

智能運(yùn)維的目標(biāo)是實(shí)現(xiàn)告警風(fēng)暴收斂、告警準(zhǔn)確預(yù)測、告警自動(dòng)恢復(fù)、根因自動(dòng)定位，這也是研發(fā)運(yùn)維中所期待的內(nèi)容。隨著知識圖譜技術(shù)不斷的發(fā)展，運(yùn)維知識圖譜的不斷建設(shè)和豐富，告警知識圖譜的不斷優(yōu)化和完善，人工智能與DevOps必定會(huì)更好的協(xié)同，共同提升開發(fā)運(yùn)維人員的工作效率，為企業(yè)降本提效，為用戶提供更好服務(wù)～

標(biāo)簽: devops