×
×

專訪必示科技CEO劉大鵬:智能運維是不可避免的大趨勢

2019-09-12 09:18:21 來源:雷鋒網
越是傳統的行業,在被人工智能改造時,所迸發出來的潛力就越大。從某種程度上看,這句話是完全成立的,經過多輪新技術仍舊沒有完全進化的行業,往往有著很堅固的改造壁壘,相對應的,一旦遇到適用于該行業的新技術,技術斷代所積累的潛力也將一并爆發。伴隨最初的IT而興起的運維行業,似乎正打開智能化的大門。

智能運維行業的現狀是——搞機器學習的人很難迅速了解智能運維的知識和場景,比如各類監控數據,要梳理很長時間才能理解;搞運維的人又很難把機器學習吃透,兩者之間存在一個巨大的鴻溝。
 

純粹從人工智能算法方向切入的智能運維產品的提供商在國內還屬于少數派,新技術的誕生期走的總是“高大上”路線,運維這一傳統行業還未到廣泛擁抱人工智能的爆發期,但先行者已經著手。
 

近日,必示科技發布了國內首款多場景、可編排智能運維平臺——必示智能運維平臺。今年年初,必示科技完成數千萬人民幣A輪融資,順為資本領投,老股東明勢資本跟投;時隔數月,必示在6月又完成了由高榕資本領投,東方富海以及老股東順為資本、明勢資本跟投的數千萬人民幣的A+輪融資。
 

眾多一線投資人的態度顯示了資本對于必示科技以及智能運維賽道的看好,智能運維成為當前人工智能落地的又一希望之地。關于智能運維以及必示科技的發展,雷鋒網(公眾號:雷鋒網)就此話題采訪了必示科技CEO劉大鵬。
 


運維發展的三個階段
 

對于任何一家現代企業,運維都是必不可少的一部分,甚至小到修電腦(服務器),大到支撐千萬DAU應用、十萬級服務器的業務穩定,都是運維的工作范疇。


運維行業的整體發展大致經歷三個階段:
 

手工運維:初級運維方法,所有決策和操作都由人工完成,低效、重復、易出錯;自動化運維:通過腳本化提高操作效率,但仍需人工分析海量數據,決策速度慢、不準確、耗人力;智能運維 AIOps:利用AI算法分析海量運維數據,自動、準確發現和定位問題,從決策層面進一步提高運維效率。劉大鵬表示,運維的確是一個很傳統的行業,所有的企業只要有IT的軟件和硬件,就會有運維需求,關于智能運維的討論逐漸火熱,實際上也是因為運維行業隨著底層IT基礎架構、軟件規模量級的提高,原來的運維方式越來越難以支撐,所以開始出現智能運維的概念。
 

從2016年開始,行業開始探索智能運維,運維行業的數據分析起步較早,但當時還沒有嚴格意義上智能運維的概念,隨著人工智能被行業接受,Gartner提出AIOps后智能運維成為行業統一術語。
 

運維監控的項目繁多,監控難以精準。另外發生事故后,如何定位問題,上萬臺服務器,幾千個軟件模塊,互相之間的大量訪問數據,管理員越來越難以做到事事細化。
 

舉例來看,監控一家企業底層IT軟件、硬件狀態,每天需要收集監控數據,一家大型一點的金融機構基本上會有10個TB左右數據,這僅僅是一天,如此量級的數據人力已經很難對數據本身做細致分析,時效性和準確性都不足以支撐。有的時候甚至可能系統出了問題,但運維人員還沒有反應過來。
 

因此,企業使用人工智能進行IT運維(AIOps),以增強和偶爾地替代傳統的應用程序性能監視(APM)和網絡性能監視和診斷工具(NPMD),成為新嘗試。有數據顯示,全球APM市場規模大約在60億美元左右,預計在五年內達到90億美元。Gartner報告顯示,2019年NPMD預估的市場規模為22億美元,復合年增長率為1.8%。
 

但參考AIOps的市場規模,并不是和這兩部分工具重合,而是要看整個傳統運維市場,以及人工智能應用的市場價值,難以準確測算。
 

“一般不太有人會選運維行業作為創業方向,聽到之后就覺得很苦、很累,甚至很多外部的人可能會聽到運維覺得這個屬于技術鏈條比較偏下游的,大家會有這樣的一些誤解”,劉大鵬談到。
 

必示科技之所以選擇做AIOps與創始團隊背景有很大關系,必示科技主要創始團隊均來自于清華智能運維實驗室,從學術到實踐,是技術演進的自然過程,據了解,必示有10位智能運維方向的博士,十幾位經驗在10年以上行業資深專家,有50%的成員來自清華大學。
 

AIOps的催化劑
 

運維行業如此之“固執”,為何現在是運維行業智能化的契機?
 

以銀行系統為例,劉大鵬表示,首先從外部環境角度,用戶量、交易量、業務種類、還有用戶體驗要求的提高,導致銀行內部的系統必須要變得越來越龐大、靈活,以支撐外部環境的變化。
 

第二個方面,隨著最近幾年銀行,包括其他行業如運營商、電網等,IT監控越來越普及,相比之前,監控系統還沒做得特別好,數據量也少,做運維沒有更好的方法。
 

監控系統越來越完善之后,數據量很大,但是數據反而成為無法處理的新問題,企業思考的維度自然演化——怎么讓花費大量資源建設的監控系統,所收集的大量數據真正發揮價值?
 

自動分析數據的需求涌現,自然而然就演進出了智能運維行業。
 

劉大鵬以應急處理為例,當金融企業的內部系統出現問題,比如用戶交易失敗,或者用戶交易開始變慢等告警情況。
 

第一步,針對這家金融機構的業務系統大量交易指標做檢測,包括不同系統的交易量、響應時間、用戶的成功率等指標。看起來只有幾個指標,但實際上銀行的業務系統非常多,每個不同的交易類型展開后就是成千上萬個,再乘以這些指標種類,數據量異常巨大,而且這些指標會隨著業務而變化。
 

在這個階段,靠人力制定一個簡單規則無法適配幾萬種形態各異的指標,必示科技在業內第一個推出產品,針對時序數據做準確的檢測,而且可以適配金融行業內常見的各種情況,檢測準確率基本能達到90%以上。
 

第二步,傳統業務報警之后,運維人員會收到一條短信,但也僅此而已,沒有任何額外信息。業務報警時經常伴隨的情況是,網絡,服務器,數據庫,應用系統等各條線,所有團隊都要開始排查與自己相關的部分。每條線排查量很大,而且沒有任何指向性,全憑經驗,短則幾十分鐘,長則十數小時或幾天。
 

“解決問題很快,但是找原因很慢。這個過程面對的是海量數據,能不能經過一些算法處理,把最有嫌疑的數據量找出來,管理員會更有聚焦性,再結合領域知識,可能會很快定位一些問題。出現問題之后的自動定位和推薦方法,這也是智能運維的典型場景”,劉大鵬介紹道。
 

智能運維的錯位競爭
 

各行各業的運維都有一定的基礎,必示科技補足的是運維行業的數據分析能力
 

必示科技的前身,清華智能運維實驗室從2012年即開始研究智能運維課題,彼時即便像BAT尚且沒有智能運維的理念,更多的是單一數據的規則化分析,而不是系統化把運維數據分析單獨抽象出一層做研究。
 

“運維場景很多,很難去單點的做。而且涉及到很多算法和領域知識的結合。傳統運維行業中的人員構成基本上百分之百都是運維工程師,軟件工程師。這些人都很厲害,他們能駕馭很大型的系統,做很強壯的海量數據的監控和收集。但是有一個問題,這類工程型專家的知識庫和技能集和智能運維所要求的技能是不一致的”。

必示智能運維平臺
 

這種困難也體現在算法層面,難點主要有二,第一是對數據分析型問題的定義,問題的拆解、梳理、定義;第二是針對具體問題的算法設計。
 

在一個未知開放的環境下,定義問題是困難的第一步,算法工程師既要對運維有很深的了解,同時又對算法能力有廣泛積累,才能做好架構的拆解,問題的梳理和定義。
 

大量的機器學習算法在提出時,并不是針對運維場景,這些開源算法的假設并不和實際運維問題相符,實際效果也并不好,運維算法研究實際上是以開源算法為起點,結合實際運維問題和數據的特點,進行不斷的算法改進和方案組合的創新過程。
 

劉大鵬解釋道,智能運維本質是數據分析,從業人員至少要知道常見的數據分析方法。比如說關于文本、關于時序數據等,同時還要熟悉運維場景。運維行業有很高的領域知識門檻,純做AI的人創業做一家智能運維公司,基本不存在這種情況。
 

“我們要找到運維行業中,現有AI技術能力范圍內可以解決的問題,它一定是定義的很清楚,它的數據是充足的,運維中的問題拆得非常非常細,故障定位我們可能會拆成10多個場景,每一個場景都是相對來說比較具體的”,劉大鵬指出了運維行業的目前發力方向。
 

另外,劉大鵬也清晰的指出,并不是所有運維問題都適合用AI解決,某些問題與其花費精力用AI算法去推斷,不如把數據監控、自動化系統完善,解決問題更簡單高效。
 

雷鋒網了解到,必示科技推出的智能運維平臺已經在大量運維場景和運維數據中打磨,內置專業垂直算法可以做到開箱即用,同時支持不同種類的數據進行綜合的高性能分析,一個大型企業監控數據每天都會達到TB級甚至超過10TB,這樣一個量級數據的分析,需要高性能的架構進行支撐。使用該平臺不需繁瑣調參,算法參數可以根據數據自動適配,人工只需要做簡單的配置。


劉大鵬坦言,智能運維行業已經有一些玩家,但目前真正有競爭力的廠商并不多,主要還是前述傳統運維能力和新需求不匹配的問題。必示科技擁有一個較長的窗口期技術和人才儲備,在創業賽道已經算不小的領先優勢。


免責聲明:本文由作者原創。文章內容系作者個人觀點,轉載目的在于傳遞更多信息,并不代表EETOP贊同其觀點和對其真實性負責。如涉及作品內容、版權和其它問題,請及時聯系我們,我們將在第一時間刪除!

全部評論

vr赛车彩票哪里开奖的 pk10计划苹果下载 时时彩免费软件计划 青海11选五中奖查询 刮刮乐 pk10赛车计划软件手机 彩29彩票安卓下载 贵州快三走势图一定牛快三 体球网即时比分手机版 辽宁十一选五 双色球基本走势图表图 闲来宁夏麻将微信群 8码倍投