![]() |
新聞中心
當(dāng)前位置:網(wǎng)站首頁 > 新聞中心
云計算和容器如何重寫監(jiān)視和管理規(guī)則手冊
在獲得數(shù)據(jù)中心轉(zhuǎn)型的一些成功之后,很多過于心急的企業(yè)在實施中希望盡可能多地消除IT數(shù)據(jù)中心成本。這可能會需要采用多種云服務(wù)、實驗融合基礎(chǔ)架構(gòu)和軟件堆棧,以及采用DevOps友好型技術(shù),例如容器化。這些技術(shù)都可以幫助減少日益繁瑣的資本支出,并提高敏捷性。
盡管如此,在這種數(shù)據(jù)中心整合的過程中,人們可能會忽略一些重要的事情。云計算和容器的應(yīng)用規(guī)模非常巨大,并且具有更加廣闊的前途,但通常他們根本沒有通過完整的企業(yè)管理和經(jīng)過考驗的安全性,或者正如專家所述,其不能保證服務(wù)水平。
融合、云計算和容器都是熱門技術(shù)。它們提供的價值是增加工作負(fù)載和基礎(chǔ)設(shè)施之間的抽象。對于新的分布式的、面向DevOps的世界而言,有更多的抽象是有用的,但它也往往會掩蓋對提高IT性能的最終可見性。有很多方法可以衡量性能,而將工作負(fù)載響應(yīng)時間作為衡量最終用戶對IT體驗的滿意程度的重要指標(biāo)之一。想象一下,圖表中的CPU利用率在X軸上從0%線性增加到100%。如果在Y軸上繪制該CPU的平均交互式交易性能,最終會得到一個指數(shù)曲線,從合理的服務(wù)時間的0%開始,但是在100%的利用率下,將向無窮大發(fā)展。(注意:對于數(shù)學(xué)上的思考,可以使用排隊理論對響應(yīng)時間曲線進行建模,以計算日益繁忙的資源的概率等待時間。)
通過增加負(fù)載來盡可能提高基礎(chǔ)設(shè)施資源的利用率,最終會在IT績效管理方面產(chǎn)生相反的效果。
確實,批量工作負(fù)載更多地是通過吞吐量來衡量的,吞吐量可以達(dá)到最大利用率。但是,響應(yīng)時間對任何交互式工作負(fù)載都至關(guān)重要。在當(dāng)今的快速數(shù)據(jù)世界中,通過交互式操作和應(yīng)用程序近乎實時地處理更多的數(shù)據(jù)源和數(shù)據(jù)流。如今的大數(shù)據(jù)是盡可能收集數(shù)據(jù)帶來盡可能多的信息。
云計算和容器各自以不同的方式改變IT性能管理,雖然變化可能很顯著,但I(xiàn)T管理人員可以通過多種方式確保性能保持在可接受的范圍內(nèi)。
云計算應(yīng)用程序設(shè)計人員傾向于將關(guān)鍵代碼的某些部分視為可替代的實例,而不像他們過去在傳統(tǒng)數(shù)據(jù)中心基礎(chǔ)設(shè)施孤島中的歷史實例。用戶需要仔細(xì)監(jiān)控和管理任務(wù)關(guān)鍵型應(yīng)用程序及其資源,任何偏離正常的情況都會立即進行分類。對于當(dāng)今的許多云計算應(yīng)用程序,性能偏差將導(dǎo)致應(yīng)用程序重新配置更好的新的云計算實例。
要理解這一點,需要了解虛擬化,它帶來了許多好處,但并不總是更好的性能。在虛擬化主機中,保證實際響應(yīng)時間性能一直是一個問題。
雖然虛擬管理員可以將主機資源配額(就利用率而言)分配給給定虛擬機,但是根據(jù)定義,每個主機資源可以同時由多個虛擬機共享。一旦了解響應(yīng)時間性能相對于系統(tǒng)總利用率是非線性的,就可以立即看到如何在頻繁使用的虛擬服務(wù)器上出現(xiàn)嘈雜鄰居問題,即使關(guān)鍵虛擬機具有有保證的利用率。
例如,考慮給定主機服務(wù)器上的所有虛擬機如何具有有保證的容量片段。如果足夠的虛擬機同時使用其容量來將服務(wù)器的總利用率提高到50%-60%以上,則響應(yīng)時間將因所有這些而降低。在一定的利用率閾值遠(yuǎn)低于100%的情況下,底層服務(wù)器資源仍然具有剩余容量,但經(jīng)驗豐富的性能可能會降低一半。隨著利用率接近100%,響應(yīng)性可能降低到甚至很少有實際工作通過系統(tǒng)的程度。
如果人們將云計算(公共云或私有云)視為大型虛擬服務(wù)器場,就可以看到為什么云計算機器實例可能無法始終提供應(yīng)得的性能。當(dāng)用戶支付費用采用云計算服務(wù)器時,云計算服務(wù)提供商承諾提供一定的資源利用率。但是,云計算提供商通常不會證明用戶的特定計算機實例不會與許多其他競爭實例共存。這意味著在繁忙時段,許多托管計算機實例將無法提供與其底層云計算基礎(chǔ)設(shè)施不到一半空閑時相同的性能級別。
從根本上說,云計算是經(jīng)濟高效的,因為它們盡可能廣泛地共享基礎(chǔ)設(shè)施。用戶在經(jīng)濟上鼓勵云計算服務(wù)提供商,將盡可能多的虛擬實例填充到給定的云計算基礎(chǔ)設(shè)施的足跡中。實際上,云計算提供商的利潤率的關(guān)鍵領(lǐng)域之一是能夠在多個租戶中盡可能多地超額預(yù)訂真實的基礎(chǔ)設(shè)施,許多機器實例在很多時候都沒有得到充分利用。
因此,Web應(yīng)用程序管理員和明智的DevOps管理人員謹(jǐn)慎地對待他們的云計算應(yīng)用程序。他們跨多個機器實例以分布式方式構(gòu)建其Web應(yīng)用程序,這樣如果該池中的任何一個機器實例的性能受到影響,那么它們只會將其終止,并重新啟動它。當(dāng)企業(yè)的服務(wù)提供商規(guī)模足夠大時,重啟操作幾乎可以保證新實例將在云計算基礎(chǔ)架構(gòu)的不同區(qū)域生成,遠(yuǎn)離嘈雜的鄰居。值得注意的是,這種方法在應(yīng)用不太廣泛的私有云上可能效果不佳。
容器的可見度
對于容器化來說,微服務(wù)大量應(yīng)用的性能可能更不透明。原始定義的單個微服務(wù)即使其性能很糟糕,但不會持續(xù)很長時間。對于大規(guī)模容器化的應(yīng)用程序來說,可能只看到總體最終結(jié)果的性能不佳。而且由于微服務(wù)可能是短暫的,無法更好地進行管理。
當(dāng)將微服務(wù)分配到他們自己的隔離基礎(chǔ)設(shè)施時,端到端基礎(chǔ)設(shè)施性能管理工具使IT管理員能夠識別并糾正明顯的性能問題。雖然虛擬化開始使IT性能管理變得混亂,但仍然存在將應(yīng)用程序性能與虛擬化基礎(chǔ)設(shè)施相關(guān)聯(lián)的有效方法。但是,一旦我們將應(yīng)用程序遷移到公共云,管理頂級性能就變得更像一種貓捉老鼠的游戲?,F(xiàn)在隨著容器的興起,管理績效是一個更大的挑戰(zhàn)。
而好消息是,通過容器架構(gòu),可以在應(yīng)用程序中輕松地在非常精細(xì)的級別上添加性能檢測。鑒于新一批高度可擴展且響應(yīng)迅速的管理工具,應(yīng)該可以使用智能的IT操作自動化(可能基于有效使用機器學(xué)習(xí))將大量的容器遷移到性能更好的服務(wù)器中。
對于技術(shù)組織而言,真正的訣竅是,如果不是可預(yù)測并持續(xù)存在,需要在實施選擇成本支出政策的同時,實現(xiàn)更高的性能。在某些方面,云計算和容器的這種平衡行為變得更加困難,這是因為增加了不透明性和可擴展性,但是采用分布式數(shù)據(jù)和處理技術(shù)將會使其更容易實施。
|