作者 | 肖長(zhǎng)軍(穹谷)阿里云智能事業(yè)群技術(shù)專家??
導(dǎo)讀:隨著云原生系統(tǒng)的演進(jìn),如何保障系統(tǒng)的穩(wěn)定性受到很大的挑戰(zhàn),混沌工程通過(guò)反脆弱思想,對(duì)系統(tǒng)注入故障,提前發(fā)現(xiàn)系統(tǒng)問(wèn)題,提升系統(tǒng)的容錯(cuò)能力。ChaosBlade 工具可以通過(guò)聲明式配置執(zhí)行混沌實(shí)驗(yàn),簡(jiǎn)單高效。本文將會(huì)重點(diǎn)介紹 ChaosBlade 以及云原生相關(guān)的實(shí)驗(yàn)場(chǎng)景實(shí)踐。
ChaosBlade 是阿里巴巴開源的一款遵循混沌實(shí)驗(yàn)?zāi)P偷幕煦鐚?shí)驗(yàn)執(zhí)行工具,具有場(chǎng)景豐富度高、簡(jiǎn)單易用等特點(diǎn),而且可以很方便的擴(kuò)展實(shí)驗(yàn)場(chǎng)景,開源后不久就被加入到 CNCF Landspace 中,成為主流的一款混沌工具。
目前支持的實(shí)驗(yàn)場(chǎng)景如下:
基礎(chǔ)資源場(chǎng)景:CPU 負(fù)載、內(nèi)存占用、磁盤 IO 負(fù)載、磁盤占用、網(wǎng)絡(luò)延遲、網(wǎng)絡(luò)丟包、網(wǎng)絡(luò)屏蔽、域名不可訪問(wèn)、shell 腳本篡改、殺進(jìn)程、進(jìn)程 Hang、機(jī)器重啟等;
應(yīng)用服務(wù)場(chǎng)景:支持 Java 應(yīng)用和 C++ 應(yīng)用內(nèi)的實(shí)驗(yàn)場(chǎng)景。Java 的場(chǎng)景組件豐富,例如支持 Dubbo、RocketMQ、HttpClient、Servlet、Druid等,而且支持編寫 Java 或 Groovy 腳本實(shí)現(xiàn)復(fù)雜的實(shí)驗(yàn)場(chǎng)景;
以上所有的實(shí)驗(yàn)場(chǎng)景都遵循混沌實(shí)驗(yàn)?zāi)P?,此模型共分為四層,包含?/p>
比如一臺(tái) IP 是 10.0.0.1 機(jī)器上的應(yīng)用,調(diào)用 com.example.HelloService[@1.0.0 ]() Dubbo 服務(wù)延遲 3s,基于此模型可以描述為對(duì) Dubbo 組件(Target)進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)實(shí)施的范圍是 10.0.0.1 主機(jī)(Scope),調(diào)用 com.example.HelloService[@1.0.0 ]() (Matcher)服務(wù)延遲 3s(Action),對(duì)應(yīng)的 chaosblade 命令為:
blade create dubbo delay --time 3000 --service com.example.HelloService --version 1.0.0
所以此模型很簡(jiǎn)單清晰的表達(dá)出實(shí)驗(yàn)場(chǎng)景,易于理解。下文中的云原生實(shí)驗(yàn)場(chǎng)景也基于此模型定義。
將混沌實(shí)驗(yàn)場(chǎng)景按照上述的實(shí)驗(yàn)?zāi)P停x為 Kubernetes 中的資源,并通過(guò)自定義控制器來(lái)管理,可以通過(guò) Yaml 配置或者直接執(zhí)行 blade 命令執(zhí)行。
ChaosBlade Operator 定義了資源控制器,并且會(huì)以 daemonset 的方式,在每個(gè)節(jié)點(diǎn)上部署一個(gè) chaosblade-tool pod 來(lái)執(zhí)行混沌實(shí)驗(yàn)。不同的實(shí)驗(yàn)場(chǎng)景內(nèi)部實(shí)現(xiàn)方式不同,比如 Node 實(shí)驗(yàn)場(chǎng)景,其上面部署的 chaosblade-tool 內(nèi)部執(zhí)行即可,而 Container 內(nèi)的實(shí)驗(yàn)場(chǎng)景,控制器會(huì)將 chaosblade 包拷貝到目標(biāo) Container 中執(zhí)行。
安裝 ChaosBlade Operator,可通過(guò)地址下載 chaosblade-operator-0.0.1.tgz,使用以下命令安裝:
helm install --namespace kube-system --name chaosblade-operator chaosblade-operator-0.0.1.tgz
安裝在 kube-system 命令空間下。ChaosBlade Operator 啟動(dòng)后會(huì)在每個(gè)節(jié)點(diǎn)部署 chaosblade-tool Pod 和一個(gè) chaosblade-operator Pod。可通過(guò)以下命令查看安裝結(jié)果:
kubectl get pod -n kube-system -o wide | grep chaosblade
執(zhí)行方式有兩種:
下面以指定一臺(tái)節(jié)點(diǎn),做 CPU 負(fù)載 80% 實(shí)驗(yàn)舉例。
yaml 配置方式
apiVersion: chaosblade.io/v1alpha1
kind: ChaosBlade
metadata:
name: cpu-load
spec:
experiments:
- scope: node
target: cpu
action: fullload
desc: "increase node cpu load by names"
matchers:
- name: names
value:
- "cn-hangzhou.192.168.0.205"
- name: cpu-percent
value:
- "80"
如上所示,配置好文件后,保存為 chaosblade_cpu_load.yaml,使用以下命令執(zhí)行實(shí)驗(yàn)場(chǎng)景:
kubectl apply -f chaosblade_cpu_load.yaml
可通過(guò)以下命令查看每個(gè)實(shí)驗(yàn)的執(zhí)行狀態(tài):
kubectl get blade cpu-load -o json
查看更多實(shí)驗(yàn)場(chǎng)景配置事例。
blade 命令執(zhí)行方式
下載 chaosblade 工具包,解壓即可使用。還是上述例子,使用 blade 命令執(zhí)行如下:
blade create k8s node-cpu fullload --names cn-hangzhou.192.168.0.205 --cpu-percent 80 --kubeconfig ~/.kube/config
使用 blade 命令執(zhí)行,會(huì)返回實(shí)驗(yàn)的執(zhí)行結(jié)果。
yaml 配置文件的方式支持場(chǎng)景動(dòng)態(tài)修改,比如將上述的 cpu 負(fù)載調(diào)整為 60%,則只需將上述 value 的值從 80 改為 60 即可,例如:
apiVersion: chaosblade.io/v1alpha1
kind: ChaosBlade
metadata:
name: cpu-load
spec:
experiments:
- scope: node
target: cpu
action: load
desc: "cpu load"
flags:
- name: cpu-percent
value: "60"
- name: ip
value: 192.168.0.34
然后使用 kubeclt apply -f chaosblade_cpu_load.yaml
命令執(zhí)行更新即可。
可以通過(guò)以下三種方式停止實(shí)驗(yàn):
根據(jù)實(shí)驗(yàn)資源名停止
比如上述 cpu-load 場(chǎng)景,可以執(zhí)行以下命令停止實(shí)驗(yàn):
kubectl delete chaosblade cpu-load
通過(guò) yaml 配置文件停止
指定上述創(chuàng)建好的 yaml 文件進(jìn)行刪除,命令如下:
kubectl delete -f chaosblade_cpu_load.yaml
通過(guò) blade 命令停止
此方式僅限使用 blade 創(chuàng)建的實(shí)驗(yàn),使用以下命令停止:
blade destroy <UID>
是執(zhí)行 blade create 命令返回的結(jié)果,如果忘記,可使用 blade status --type create 命令查詢。
執(zhí)行 helm del --purge chaosblade-operator
卸載即可,將會(huì)停止全部實(shí)驗(yàn),刪除所有創(chuàng)建的資源。
ChaosBlade 基于混沌實(shí)驗(yàn)?zāi)P?,友好地?Kubernetes 資源控制結(jié)合,部署簡(jiǎn)單而且使用簡(jiǎn)潔,實(shí)驗(yàn)可控。除此之外 ChaosBlade 基于實(shí)驗(yàn)?zāi)P蛯?shí)現(xiàn)了很多領(lǐng)域場(chǎng)景執(zhí)行器,可以很方便的擴(kuò)展實(shí)驗(yàn)場(chǎng)景,可詳見附錄中的項(xiàng)目列表。
ChaosBlade 自開源以來(lái),共有近 30 多位貢獻(xiàn)者加入和很多企業(yè)×××常感謝各位。同時(shí)非常歡迎更多的人參與進(jìn)來(lái),使 ChaosBlade 變的更加強(qiáng)大,覆蓋更多的場(chǎng)景,成為各個(gè)企業(yè)穩(wěn)定的、通用的混沌工程工具。
貢獻(xiàn)的形式可以是提 bug、提交代碼、編寫文檔、補(bǔ)充單元測(cè)試、參與問(wèn)題討論等等。ChaosBlade 相信:開源世界中,任何幫助都是貢獻(xiàn)。
項(xiàng)目列表如下:
“ 阿里巴巴云×××icloudnative×××erverless、容器、Service Mesh等技術(shù)領(lǐng)域、聚焦云原生流行技術(shù)趨勢(shì)、云原生大規(guī)模的落地實(shí)踐,做最懂云原生開發(fā)×××
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)cdcxhl.cn,海內(nèi)外云服務(wù)器15元起步,三天無(wú)理由+7*72小時(shí)售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國(guó)服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡(jiǎn)單易用、服務(wù)可用性高、性價(jià)比高”等特點(diǎn)與優(yōu)勢(shì),專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場(chǎng)景需求。
網(wǎng)站欄目:面向云原生的混沌工程工具-ChaosBlade-創(chuàng)新互聯(lián)
當(dāng)前鏈接:http://aaarwkj.com/article12/ccoddc.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站設(shè)計(jì)公司、企業(yè)網(wǎng)站制作、軟件開發(fā)、網(wǎng)站排名、自適應(yīng)網(wǎng)站、網(wǎng)站營(yíng)銷
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容