AWS 宣布全面推出 Amazon DevOps Guru
西雅圖--今天,Amazon.com, Inc. (NASDAQ: AMZN) 旗下公司 Amazon Web Services, Inc. (AWS) 宣布全面推出 Amazon DevOps Guru,這是一種使用機器的完全托管的運營服務學習通過自動檢測操作問題并推薦具體的補救措施,使開發人員更容易提高應用程序的可用性。憑借多年的 Amazon.com 和 AWS 卓越運營經驗,Amazon DevOps Guru 應用機器學習來自動分析數據,例如應用程序指標、日志、事件和跟蹤偏離正常運營模式的行為。當 Amazon DevOps Guru 識別出可能導致潛在中斷或服務中斷的異常應用程序行為時,它會向開發人員提醒問題詳細信息,以幫助他們快速了解問題的潛在影響和可能原因,并提供具體的補救建議。開發人員可以使用來自 Amazon DevOps Guru 的補救建議來縮短問題出現時的解決時間并提高應用程序的可用性——所有這些都不需要手動設置或機器學習專業知識。 Amazon DevOps Guru 沒有前期成本或承諾,客戶只需為 Amazon DevOps Guru 分析的數據付費。要開始使用 Amazon DevOps Guru,請訪問:
AWS 宣布全面推出 Amazon DevOps Guru
隨著越來越多的組織轉向基于云的應用程序部署和微服務架構來擴展業務,應用程序變得越來越分散,開發人員需要更多的自動化實踐來維護應用程序的可用性并減少檢測、調試和解決運營問題所花費的時間和精力。由錯誤代碼或配置更改、不平衡的容器集群或資源耗盡(例如 CPU、內存、磁盤等)導致的應用程序停機事件不可避免地導致糟糕的客戶體驗和收入損失。公司投入大量開發人員資源、時間和金錢來部署多個監控工具,這些工具通常是單獨管理的,然后必須針對負載均衡器錯誤峰值或應用程序請求率下降等常見問題開發和維護自定義警報。設置閾值以在應用程序資源行為異常時進行識別和警告很難正確設置,涉及手動設置,并且需要隨著應用程序使用情況的變化(例如,促銷期間異常大量的請求)必須不斷更新閾值。如果閾值設置得太高,開發人員在操作性能受到嚴重影響之前不會看到警報。當閾值設置得太低時,開發人員會得到太多誤報,他們很容易忽略這些誤報。即使當開發人員收到潛在操作問題的警報時,確定根本原因的過程仍然很困難。使用現有工具,開發人員通常難以從圖表和警報中確定操作問題的根本原因,即使他們能夠找到根本原因,他們也常常沒有正確的信息來修復它。每次故障排除嘗試都是一個冷啟動,團隊必須花費數小時或數天來識別問題,這會導致耗時、乏味的工作,從而減慢解決操作故障的時間,并可能延長應用程序中斷時間。
Amazon DevOps Guru 的機器學習模型利用了 20 多年為 Amazon.com 構建、擴展和維護高可用性應用程序的運營專業知識。這使 Amazon DevOps Guru 能夠自動檢測操作問題(例如丟失或配置錯誤的警報、資源耗盡的早期警告、可能導致中斷的配置更改等),提供有關資源和相關事件的上下文,并建議補救措施.只需在 Amazon DevOps Guru 控制臺中單擊幾下,歷史應用程序和基礎設施指標(如延遲、錯誤率和資源請求率)就會自動從用戶的 AWS 應用程序中提取并進行分析,以建立正常的操作范圍。然后,Amazon DevOps Guru 使用預訓練的機器學習模型來識別與該既定基線的偏差(例如,配置不足的計算容量、數據庫 I/O 利用率、內存泄漏等)。當 Amazon DevOps Guru 分析系統和應用程序數據以自動檢測異常時,它還將這些數據分組為運營洞察力,包括異常指標、應用程序行為隨時間變化的可視化以及補救措施建議——所有這些都可以在 Amazon DevOps Guru 控制臺中輕松查看. Amazon DevOps Guru 還關聯和分組相關的應用程序和基礎設施指標(例如 Web 應用程序延遲峰值、磁盤空間不足、錯誤代碼部署等),以減少冗余警報并幫助用戶將注意力集中在高嚴重性問題上。客戶可以查看配置更改歷史記錄和部署事件,以及系統和用戶活動,通過 Amazon DevOps Guru 控制臺中的儀表板生成操作問題可能原因的優先列表。為幫助客戶快速解決問題,Amazon DevOps Guru 提供帶有修復步驟的智能建議,并與 AWS Systems Manager 集成以提供運行手冊和協作工具,使客戶能夠更有效地維護應用程序并管理其部署的基礎設施。例如,當使用 Amazon Relational Database Service (RDS) 的分析應用程序開始出現延遲下降時,Amazon DevOps Guru 將通過自動分析整個應用程序堆棧的相關指標來檢測變化,確定潛在的根本原因(例如并發數增加計算實例寫入 RDS),并提供解決問題的建議(例如,增加預置的 RDS 容量和 IOPS 存儲以處理更高的負載)。
AWS 亞馬遜機器學習副總裁 Swami Sivasubramanian 說:“客戶不斷要求 AWS 提供更多服務,使他們能夠利用我們數十年來在提高運行 Amazon.com 的應用程序可用性方面的卓越運營優勢。” “借助 Amazon DevOps Guru,我們利用了這些專業知識并構建了專門的機器學習模型,以便在運營問題影響客戶之前很久就檢測、排除故障和預防它們,而無需在每次出現問題時都處理冷啟動。 Amazon DevOps Guru 立即為客戶提供了我們在運行 Amazon.com 時學到的最佳運營實踐的好處,而且我們將 Amazon DevOps Guru 設計得非常簡單,以至于每個 AWS 客戶都可以輕松選擇啟用它。”
只需在 AWS 管理控制臺中單擊幾下,客戶就可以讓 Amazon DevOps Guru 在幾分鐘內開始分析賬戶和應用程序活動,以提供運營見解。 Amazon DevOps Guru 為客戶提供單一控制臺體驗,通過匯總多個來源(例如 AWS CloudTrail、Amazon CloudWatch、AWS Config、AWS CloudFormation、AWS X-Ray)的相關數據來可視化其運營數據,并減少在多個工具之間切換的需要.客戶還可以在 Amazon DevOps Guru 控制臺中查看相關的操作事件和上下文數據以獲得操作見解,并通過 Amazon SNS 接收警報。此外,Amazon DevOps Guru 通過 AWS 開發工具包支持 API 終端節點,使 Amazon 合作伙伴網絡合作伙伴和客戶可以輕松地將 Amazon DevOps Guru 集成到他們現有的解決方案中,以便針對高嚴重性問題進行工單、尋呼和自動通知工程師。 PagerDuty 和 Atlassian 是已將 Amazon DevOps Guru 集成到其運營監控和事件管理平臺的 AWS 合作伙伴之一,使用他們的解決方案的客戶現在可以從 Amazon DevOps Guru 提供的運營洞察中受益。 Amazon DevOps Guru 現已在美國東部(弗吉尼亞北部)、美國東部(俄亥俄)和美國西部(俄勒岡)、亞太地區(新加坡)、亞太地區(悉尼)、亞太地區(東京)、歐洲(法蘭克福)推出、歐洲(愛爾蘭)和歐洲(斯德哥爾摩),未來幾個月將在其他地區推出。
與 Amazon CodeGuru(一種由機器學習提供支持的開發人員工具,可提供智能建議以提高代碼質量和識別應用程序中最昂貴的代碼行)一起使用,Amazon DevOps Guru 為客戶提供機器學習對其操作數據的自動化優勢,以便開發人員能夠更多輕松提高應用程序的可用性和可靠性。
超過 194,000 家公司的團隊依靠 Atlassian 產品簡化團隊合作,并幫助他們組織、討論和完成工作。 “Atlassian 很高興我們的客戶正在使用 Amazon DevOps Guru 實施 AIOps 戰略來管理其云應用程序的運營性能,”Opsgenie 產品主管 Emel Dogrusoz 說。 “通過我們新的 Opsgenie 和 Jira Service Management 集成,當 Amazon DevOps Guru 發現潛在問題并使用機器學習 (ML) 根據事件的嚴重性對其進行優先級排序時,合適的團隊會立即收到通知。這種集成可確保每個團隊都可以快速響應、使用 ML 支持的建議解決問題,并從每個事件中學習。”
富達投資幫助超過 3500 萬人對他們最重要的財務目標更有信心,管理超過 22,000 家企業的員工福利計劃,并通過創新的投資和技術解決方案支持超過 13,500 家金融機構發展業務。 “在富達,我們正在利用云技術來增強我們的全球客戶體驗并提高我們應用程序的彈性,”富達投資公共云服務高級副總裁 Keith Blizard 說。 “Amazon DevOps Guru 等 AIOps 工具正在幫助我們為客戶提供更高效的體驗和更具彈性的平臺。”
PagerDuty, Inc. (NYSE:PD) 是數字運營管理領域的領導者。 “PagerDuty 很高興在與 Amazon DevOps Guru 的新集成中進一步深化我們與 AWS 的合作。 PagerDuty 的數字運營管理平臺旨在推動向 DevOps 文化的轉變,我們很高興通過這種集成繼續履行這一承諾,”PagerDuty 產品高級副總裁 Jonathan Rende 說。 “利用 Amazon DevOps Guru 的機器學習功能,PagerDuty 為我們的共同客戶提供了更多的實時信號到行動功能。通過 PagerDuty 通過 Amazon DevOps Guru 引入 Amazon SNS,AWS 客戶可以在運營問題成為影響客戶的中斷之前對其采取實時行動。”Thomson Reuters 是世界上最值得信賴的答案提供商之一,幫助專業人士做出自信的決策并經營更好的業務。 “客戶體驗和滿意度是我們的首要任務。當收到多個警報源和監控事件時,過濾噪音以識別影響客戶的事件可能具有挑戰性且耗時,”湯森路透網站可靠性工程和云總監 Steve Thoennes 說。 “借助 Amazon DevOps Guru,我們能夠利用其基于 ML 的洞察力來提供清晰的行動路徑,以減少(在許多情況下甚至消除)問題對我們客戶的影響。 Amazon DevOps Guru 與 PagerDuty 的集成還提供了一條直接路徑,可以在正確的時間快速高效地向正確的人提供建議,我們預計因此會顯著減少運營停機時間。”
HCL Technologies 是一家下一代全球技術公司,可幫助企業重新構想數字時代的業務。其技術產品和服務建立在四個十年的創新之上,擁有世界知名的管理理念、強烈的發明和冒險文化,以及對客戶關系的不懈關注。 “我們一直在尋找減少團隊在解決運營問題上花費的時間的方法,現在我們正在使用 Amazon DevOps Guru 并利用其基于機器學習的洞察力來幫助我們快速識別、關聯和修復運營問題,” HCL Technologies DevOps 高級技術主管 Anchal Gupta 說。 “借助 Amazon DevOps Guru 提供的洞察力,我們的團隊現在可以快速發現問題,而無需從頭開始嘗試找出問題的根源。我們的 IT 團隊顯著縮短了我們的平均恢復時間 (MTTR),他們節省了數小時解決問題的時間——同時確保我們的客戶盡可能獲得最佳的最終用戶體驗。”
605 是一家獨立的電視測量公司,基于其涵蓋超過 2100 萬個美國家庭的多源收視數據集,提供廣告和內容測量、全渠道歸因、媒體規劃、優化和分析解決方案。 “我們有十幾個 AWS 賬戶和數以萬計的資源需要監控。即使使用基礎設施即代碼并為這些服務創建動態警報,也很難管理和關聯指標以快速解決問題。” . 的 DevOps 總監 Jared Williams 說。 “借助 Amazon DevOps Guru,我們相信我們收到的警報和通知是準確的,它們來自跨多個服務相關的機器學習驅動的指標。集成 Amazon DevOps Guru 只需幾分鐘即可實施,與我們數千個 AWS CloudFormation 堆棧集成是輕而易舉的事。 Amazon DevOps Guru 提供的見解有助于我們專注于基礎設施路線圖。”
關于亞馬遜網絡服務
15 年來,Amazon Web Services 一直是世界上最全面、應用最廣泛的云平臺。 AWS 一直在不斷擴展其服務以支持幾乎任何云工作負載,現在它擁有 200 多項功能齊全的服務,用于計算、存儲、數據庫、網絡、分析、機器學習和人工智能 (AI)、物聯網 (IoT) 、移動、安全、混合、虛擬和增強現實(VR 和 AR)、媒體以及來自 25 個地理區域內的 80 個可用區 (AZ) 的應用程序開發、部署和管理,并宣布計劃再增加 15 個可用區和另外 5 個可用區澳大利亞、印度、印度尼西亞、西班牙和瑞士的 AWS 區域。數以百萬計的客戶(包括發展最快的初創公司、最大的企業和領先的政府機構)信任 AWS 來支持他們的基礎設施、變得更加敏捷并降低成本。
關于亞馬遜
亞馬遜遵循四項原則:以客戶為中心而非以競爭對手為中心、對發明的熱情、對卓越運營的承諾以及長期思考。亞馬遜努力成為地球上最以客戶為中心的公司、地球上最好的雇主和地球上最安全的工作場所。客戶評論、一鍵購物、個性化推薦、Prime、亞馬遜物流、AWS、Kindle Direct Publishing、Kindle、Career Choice、Fire 平板電腦、Fire TV、亞馬遜 Echo、Alexa、Just Walk Out 技術、亞馬遜工作室和 The Climate承諾是亞馬遜開創的一些東西。
特別聲明:以上文章內容僅代表作者本人觀點,不代表ESG跨境電商觀點或立場。如有關于作品內容、版權或其它問題請于作品發表后的30日內與ESG跨境電商聯系。
二維碼加載中...
使用微信掃一掃登錄
使用賬號密碼登錄
平臺顧問
微信掃一掃
馬上聯系在線顧問
小程序
ESG跨境小程序
手機入駐更便捷
返回頂部