經(jīng)過近十年發(fā)展,云原生的火熱不只停留在概念上,而是已成為數(shù)字基建的必需品。Gartner的一份報告顯示:到 2025 年,云原生平臺將成為超過 95% 的新數(shù)字計劃的基礎(chǔ)——高于 2021 年的不到 40%。這說明,云原生正在引領(lǐng)全球技術(shù)趨勢,而KubeSphere已成為云原生的基石!
為什么說KubeSphere是云原生基石?
問題是,什么是云原生?云原生要經(jīng)歷哪些關(guān)鍵階段?當(dāng)前,企業(yè)的云原生發(fā)展到了何種程度?青云QingCloud(qingcloud.com,股票代碼:688316)容器平臺資深產(chǎn)品經(jīng)理于爽,在QKCP3.2產(chǎn)品升級發(fā)布之際,進行了詳細(xì)解讀。
大概從2013年開始,“云原生”這三個字被首次提出,要求企業(yè)的應(yīng)用從設(shè)計之初就要考慮到云的環(huán)境,應(yīng)用程序要運行在云中,而不是傳統(tǒng)的數(shù)據(jù)中心,要能夠充分利用和發(fā)揮云的彈性。說白了,真正的云原生要生于云、長于云、用于云。
云原生,為企業(yè)業(yè)務(wù)帶來了更大的彈性,但也存在諸多挑戰(zhàn)。如果,我們打開CNCF官網(wǎng)看全景圖,就會發(fā)現(xiàn)云原生正面臨和安卓手機一樣的問題——碎片化。比如:只在監(jiān)控和日志領(lǐng)域,就有很多解決方案和工具,IT團隊可能沒有足夠精力按需運維,而KubeSphere從底層統(tǒng)一了架構(gòu)標(biāo)準(zhǔn),具有與生俱來的業(yè)務(wù)封裝性,可以自然屏蔽應(yīng)用的碎片化問題。
至于KubeSphere和QKCP到底是怎樣一種關(guān)系?于爽給出了一個形象的比喻!在他看來,就像在家里自己做火鍋,想吃什么就買什么食材,想怎么吃就怎么吃,KubeSphere能靈活地把各種業(yè)務(wù)組裝在一個產(chǎn)品里,讓用戶直接忽視底層資源的復(fù)雜性問題,滿足用戶需求。但是,很多企業(yè)用戶會認(rèn)為很麻煩,想一步到位,獲得類似于“海底撈”式服務(wù),那么QKCP就能在各個環(huán)節(jié)提供可靠服務(wù)。
此種背景下,青云推出了QKCP 3.2版本升級,最根本目的是希望通過更多加強、進化的功能,助力用戶全面擁抱云原生。也許一個DBA不懂K8s,但是有了QKCP,他可以基于他熟悉的MySQL管理環(huán)境進行操作,剩下的底層問題,都由QKCP平臺本身來解決。
青云云原生團隊產(chǎn)品開發(fā)的初衷是,將云原生能力借助一個產(chǎn)品化的形態(tài)給到終端客戶。最開始,青云以公有云形式上線了 K8s 服務(wù),逐漸發(fā)現(xiàn)不同用戶使用 K8s 集群遇到的問題都大同小異,比如:K8s 之上怎么做監(jiān)控、怎么做 DevOps 等,于是開始從總結(jié)、收集、解決問題的角度入手,打造更具競爭力的產(chǎn)品。2018年,為了實現(xiàn)在Kubernetes 之上構(gòu)建面向云原生應(yīng)用的分布式操作系統(tǒng),KubeSphere橫空出世。
KubeSphere沒有改變底層的 K8s,任何 K8s 社區(qū)用戶都可以無縫接入到KubeSphere。開源的KubeSphere憑借原生性確保了其與社區(qū)相連的緊密性,被很多團隊參考、學(xué)習(xí)甚至直接拿去使用。KubeSphere 為整個開源社區(qū)的累積貢獻數(shù)量達到240多個,很多志愿者現(xiàn)在依然活躍在社區(qū)里。青云容器在很多企業(yè)的關(guān)注度和使用量一下大幅上升,有近千家企業(yè)在使用KubeSphere構(gòu)建 K8s 集群,支撐與管理其核心業(yè)務(wù),有大約7.5萬個集群及其生態(tài)環(huán)境是由KubeSphere做支撐。
站在企業(yè)用戶的角度,KubeSphere已經(jīng)很好,但青云并不滿足于此,盡管很多社區(qū)用戶能輕松玩轉(zhuǎn)KubeSphere,但對于很多傳統(tǒng)企業(yè)來說,其實并不知道如何擁抱云原生路線,并且不同行業(yè)有不同訴求,而云原生只是一個手段,還有太多可提升空間。
而QKCP就是KubeSphere的“伴生物”,她像“sidecar”一樣伴隨著KubeSphere,和KubeSphere成為互為最重要的能量來源之一。QKCP在能力上完全復(fù)刻了 KubeSphere 既有的各種功能,同時結(jié)合很多業(yè)務(wù)場景、青云的其他產(chǎn)品,以及各個領(lǐng)域合作伙伴進行延展與拓寬,為企業(yè)提供滿足不同場景、不同行業(yè)所需的能力和方案,包括青云售前團隊、售后團隊提供的軟能力,也都融合在QKCP里。
比如:從戰(zhàn)略規(guī)劃的角度看,云原生的第一步該怎么走?企業(yè)客戶面臨的最真實訴求是,不單純把一個打包好的KubeSphere丟給企業(yè)就可以了,青云必須進入到企業(yè),了解其真實業(yè)務(wù),然后再借助容器產(chǎn)品以及青云的其他能力,一步步給出相應(yīng)的規(guī)劃。拿DevOps來說,市場上有很多工具與實現(xiàn)方法,哪些更適合企業(yè)業(yè)務(wù)現(xiàn)狀?微服務(wù)、函數(shù)計算及代碼,都不能只拿出一套理論,或者給一套工具就能解決,青云希望借助QKCP以及更多能力,針對不同的行業(yè)、不同企業(yè)給出一套適合的云原生實踐規(guī)劃。
尤其,對于一些創(chuàng)業(yè)公司來說,前期需要快速迭代,業(yè)務(wù)急需上線,QKCP不僅能夠全面滿足需求,降低硬件采購成本,還免去了人力成本,省去了學(xué)習(xí)過程。同時,QKCP也適用一些大企業(yè),這類企業(yè)一般組織關(guān)系錯綜復(fù)雜,團隊業(yè)務(wù)比較多,并且每條業(yè)務(wù)線都有自己的一套理論與標(biāo)準(zhǔn),每個團隊又都有自己的業(yè)務(wù)訴求和技術(shù)主張,讓所有人都通過一個技術(shù)棧使用一套技術(shù)標(biāo)準(zhǔn),也不太現(xiàn)實,而QKCP能從業(yè)務(wù)角度考慮問題,全面實現(xiàn)業(yè)務(wù)價值的提升。
QKCP 相比 KubeSphere 還有一些功能上的提升。比如:會有基于新形態(tài)、新架構(gòu)的芯片支持,國產(chǎn)化操作系統(tǒng)的支持等等。社區(qū)版本的KubeSphere僅提供了核心組件的項目,客戶可以基于 ARM 架構(gòu)安裝KubeSphere,但如果想用DevOps組件、微服務(wù)組件等,其實無法通過社區(qū)版的KubeSphere產(chǎn)品獲得這個能力,需要自己打包代碼,兼容 ARM 芯片和國產(chǎn)芯片。但在 QKCP 里,青云可提供全程全量的支持。
另外,QKCP還有多集群管理能力。不管用戶把K8s 集群放在不同的云上,QKCP 都可以在一個控制平面上統(tǒng)一管理,實現(xiàn)整個平臺的調(diào)度,包括可以實現(xiàn)GPU層面的管理調(diào)度。
值得一提的是,QKCP 不僅單純地把K8s 管理起來,還實現(xiàn)了與青云更多產(chǎn)品的整合,包括數(shù)據(jù)庫、中間件、低代碼平臺、云管平臺等。為什么要把數(shù)據(jù)庫和中間件統(tǒng)一納管起來?其實也是和企業(yè)業(yè)務(wù)訴求相關(guān)!云原生客戶不僅關(guān)心K8s本身能力如何,還要能滿足數(shù)據(jù)庫、中間件業(yè)務(wù)對接需求,如何讓這些應(yīng)用在K8s環(huán)境中跑起來,并穩(wěn)定、強大、靈活地管理起來,都是用戶選型的關(guān)鍵點。
QKCP 3.2版帶來哪些核心能力?
問題是,在QKCP 3.2新版里,青云到底提供了什么樣的管理能力呢?
總結(jié)下來,QKCP 3.2版本有三大主要更新。
第一, 更易用的GPU管理。原生的開源平臺KubeSphere 提供了自定義監(jiān)控面板,如果用戶想拿到GPU數(shù)據(jù),需要先部署GPU模板,然后自己配想要的監(jiān)控頁面。雖然比較靈活,可以按訴求自配,但其實企業(yè)客戶不需要這么靈活。QKCP 優(yōu)化過后,在集群監(jiān)控數(shù)據(jù)里就可以看到 GPU 使用大屏,即在首頁就可以看到使用情況。
第二, 更強大的通知管理。在通知配置里,QKCP 支持不同的通知媒介,比如釘釘、郵件、微信等,底下有一個菜單叫“通知歷史”。如果配置好了微信或者釘釘之后,可以看站在平臺視角統(tǒng)一管理發(fā)出去的所有通知。
第三, 深入到云原生 DBaaS領(lǐng)域給DBA提供強大的管理功能。新版QKCP集成了三個數(shù)據(jù)庫:MySQL、PostgreSQL 和 ClickHouse。以MySQL為例,用戶進入界面可以直接點擊、部署,然后通過可視化的方式配置 MySQL 的各種數(shù)據(jù)庫特性的指標(biāo)。部署完以后,用戶可以直接在 QKCP 界面里管理自己的數(shù)據(jù)庫業(yè)務(wù)。通過MySQL專有的監(jiān)控指標(biāo),可以快速創(chuàng)建 MySQL 的賬戶并授予相應(yīng)的權(quán)限,這是DBA非常喜歡的一個功能。不用跳出QKCP子平臺,就可以更改各種MySQL的參數(shù)。
QKCP 將在更多場景上持續(xù)優(yōu)化。比如,提供跨基礎(chǔ)設(shè)施的、統(tǒng)一視角的多集群監(jiān)控大屏,業(yè)界也有些人叫駕駛艙。具體到業(yè)務(wù)層面,比如:跑一個應(yīng)用,可以直接創(chuàng)建相應(yīng)的 GPU 工作負(fù)載,就可以跑一些類似 TensorFlow 這種 AI 類、大數(shù)據(jù)類的任務(wù),然后調(diào)用業(yè)務(wù),直接可以看到相應(yīng)的資源使用情況,也可以管理這些資源。比如:在某個 GPU 節(jié)點上,用戶可以在監(jiān)控里直接看到 GPU 的顯存用量、溫度、用電功率等。
如前文所述,盡管QKCP平臺變得越來越強大,但并不代表青云只簡單提供一款產(chǎn)品,而是圍繞云原生路線,基于用戶的業(yè)務(wù)架構(gòu),配合行業(yè)解決方案,提供專屬的云原生套餐。其中,既包括QKCP,也可能會有混合云方案、IaaS、PaaS、存儲、云管、低代碼、數(shù)據(jù)庫等,最終目標(biāo)是以用戶業(yè)務(wù)為核心,提供全生命周期的服務(wù)保障。