AWS 宣布推出新的分析功能以幫助客戶接受大規模數據
西雅圖--今天在 AWS re:Invent 大會上,Amazon.com 旗下公司(納斯達克股票代碼:AMZN)亞馬遜網絡服務公司 (AWS) 宣布了重要的新分析功能,可幫助客戶接受當前和未來規模的數據. AWS 推出了幾項新的 Redshift 功能,這些功能可將查詢性能提高一個數量級以上,并在客戶大規模跨數據存儲、數據倉庫和運營數據庫工作時為他們提供更大的靈活性。 AWS 還為 Amazon Elasticsearch Service 宣布了一個新的、高度可擴展、節省成本的創新暖存儲層。
“Amazon Redshift 使我們能夠每天大規模地攝取、優化、轉換和聚合數十億個交易事件,這些事件來自各種第一方和第三方來源”
今天的客戶經常嘗試處理 PB 甚至 EB 的數據。這種新的數據規模以及新的應用程序要求意味著分析工具必須進行重大更改才能有效擴展。客戶希望能夠對其所有數據執行分析,無論數據格式或數據位于何處,并擴展其應用程序以支持世界各地的數百萬用戶。 AWS 提供所有云提供商中最廣泛和最深入的分析服務,并根據客戶對這種新數據規模的需求不斷創新。
具有托管存儲的 Amazon Redshift RA3 實例使客戶能夠以比任何其他云數據倉庫快 3 倍的速度經濟高效地擴展和運行
隨著數據規模不斷擴大(達到每周 PB 級),客戶正在將更多數據攝取到他們的 Amazon Redshift 數據倉庫中。為了擴展他們的數據倉庫,客戶使用 Redshift 的 Elastic 調整大小功能向他們的集群添加額外的實例。如今,Redshift 的實例包括固定數量的計算和存儲,因此客戶最終可能會過度配置其中任何一個,并為他們不使用的容量付費。客戶要求能夠在不過度配置計算的情況下增加存儲,并在不增加存儲成本的情況下更靈活地增加計算容量。
帶有托管存儲的新 Amazon Redshift RA3 實例(今天可用)允許客戶通過獨立擴展和支付計算和存儲費用來優化他們的數據倉庫。借助 Amazon Redshift RA3 實例,客戶可以根據其數據倉庫工作負載的性能要求選擇所需的實例數量,并且只需為他們使用的托管存儲付費。 Redshift Managed Storage 在每個 Amazon Redshift RA3 實例中使用大型高性能 SSD 實現快速本地存儲,并使用 Amazon S3 實現更長期的持久存儲。如果實例中的數據增長到超過大型本地存儲的大小,Redshift Managed Storage 會自動將該數據卸載到 Amazon S3。客戶為 Redshift Managed Storage 支付相同的低費率,無論數據位于高性能本地存儲還是 Amazon S3 中,他們只需為在本地 RA3 存儲上使用的存儲量付費,這意味著他們不會結束浪費在未使用的存儲容量上的開支。對于需要大量存儲但計算容量不大的工作負載,客戶可以自動擴展其數據倉庫存儲容量,而無需添加和支付額外的實例。 Redshift Managed Storage 使用各種高級數據管理技術來優化數據從 Amazon S3 卸載和檢索的效率。此外,Amazon Redshift RA3 實例基于 AWS Nitro 系統構建,具有高帶寬網絡功能,可進一步減少從 Amazon S3 卸載和檢索數據所需的時間。總之,這些功能使帶有托管存儲的 Amazon Redshift RA3 實例能夠提供任何其他云數據倉庫服務 3 倍的性能,而使用密集存儲 (DS2) 實例的現有 Amazon Redshift 客戶將獲得高達 2 倍的性能提升和 2 倍的存儲容量同樣的費用。 RA3 16xlarge 實例現在普遍可用,以支持 PB 級數據(壓縮高達 8 PB)的工作負載,明年年初將推出 RA3 4xlarge 實例。要開始使用 Redshift RA3 實例,請訪問 。
適用于 Amazon Redshift 的 AQUA(高級查詢加速器)將計算引入存儲層,性能比任何其他云數據倉庫快 10 倍
客戶需要在其數據倉庫中處理的數據量的快速增長導致在性能和具有成本效益的擴展之間難以平衡。數據倉庫的流行方法是構建一種架構,在該架構中,大量集中存儲被移動到等待計算節點來處理數據。這種方法的挑戰在于共享數據和計算節點之間存在大量數據移動。隨著數據量繼續快速增長,這種數據移動會使可用的網絡帶寬飽和并降低性能。此外,即使可以克服網絡瓶頸,因為在過去七年中,進出存儲節點的 SSD 存儲吞吐量比 CPU 從內存處理數據的能力快 6 倍,如果沒有一些重大變化,CPU 無法為了跟上更快的存儲能力,這將成為性能瓶頸本身或產生更多成本,因為客戶被迫提供更多計算以快速完成工作。
適用于 Amazon Redshift 的 AQUA(高級查詢加速器)(2020 年年中推出)是適用于 Amazon Redshift 的新型分布式硬件加速緩存,可為新數據規模的分析提供下一階段的性能改進和創新。 AQUA 將計算帶到了存儲層,因此數據不必在兩者之間來回移動,使 Redshift 的運行速度比任何其他云數據倉庫快 10 倍。 AQUA 是基于 Amazon S3 的大型高速緩存架構,可以跨多個節點并行擴展和處理數據。每個節點都擁有一個由 AWS 設計的分析處理器組成的硬件模塊,可顯著加速數據壓縮、加密和數據處理(包括過濾和聚合)。這種新架構使查詢的運行速度比當今的云數據倉庫快得多,客戶將能夠直接查詢原始數據,甚至是大規模查詢,從而為他們提供更多最新的儀表板、更少的開發時間和更易于維護系統。由 AQUA 提供支持的 Amazon Redshift 將保持 100% 與當前版本的 Amazon Redshift 兼容,因此客戶無需更改代碼即可輕松遷移現有數據倉庫。 AQUA 為新數據規模的分析提供下一階段的性能創新,并將于 2020 年年中推出。要了解有關 AQUA 的更多信息,請訪問。
Amazon Redshift Data Lake Export 可輕松將查詢結果直接保存到數據湖
客戶需要在他們的數據倉庫和數據湖中組合數據,并且不希望數據鎖定在孤島和專有格式中。例如,一個組織可能想了解他們的客戶在購買之前瀏覽了什么,這要求他們將位于數據倉庫中的訂單歷史記錄與位于 Amazon S3 數據湖中的點擊流數據結合起來。 Amazon Redshift 使客戶能夠直接查詢和連接其 Amazon Redshift 數據倉庫和 Amazon S3 數據湖中的數據,從而為客戶提供一種“湖屋”數據倉庫方法。在這個湖邊小屋的世界中,數據同時存儲在 Amazon Redshift 和 Amazon S3 中,客戶還需要一種簡單的方法來將 Amazon Redshift 查詢的結果以開放格式返回到 Amazon S3 中,以供其他服務使用。
Amazon Redshift Data Lake Export(今天可用)允許客戶以針對分析進行優化的開放數據格式 (Apache Parquet) 將數據直接從 Amazon Redshift 導出到 Amazon S3。客戶現在可以將他們在 Amazon Redshift 中執行的查詢結果以開放格式保存到他們的數據湖中,以便他們可以使用其他分析服務(如 Amazon SageMaker、Amazon Athena 和 Amazon EMR)分析該數據。沒有其他云數據倉庫可以讓查詢數據和以開放格式將數據寫回數據湖變得如此簡單。要開始使用 Amazon Redshift Data Lake Export,請訪問 。
Amazon Redshift 聯合查詢允許客戶跨數據倉庫、數據湖和運營數據庫分析數據
將大量數據從關系數據庫聚合、轉換和上傳到數據倉庫可能是資源密集型和耗時的,這就是為什么許多客戶選擇每天只這樣做一次。當客戶需要查詢他們的數據倉庫以獲取最初存儲在操作數據庫中的某些類型的及時信息時,這可能會產生問題。例如,幫助客戶解決最近訂單問題的客戶服務代表在調出客戶的購買歷史記錄時可能會獲得一天前的結果,從而使信息變得無關緊要。今天,客戶可以通過編寫自定義應用程序代碼來直接查詢操作數據庫來解決這個問題,但是構建這樣做的集成系統成本高昂、耗時且難以維護。
Amazon Redshift 聯合查詢(提供預覽版)使客戶能夠在 Amazon Redshift 中對跨 Amazon Redshift 數據倉庫、Amazon S3 數據湖以及 Amazon RDS 和 Amazon Aurora (PostgreSQL) 操作數據庫的實時數據運行查詢。通過允許客戶使用熟悉的 SQL 語句將所有這些數據組合到他們的各種數據存儲中,這簡化了應用程序開發。借助此功能,Amazon Redshift 查詢現在可以提供來自運營數據庫的及時和最新數據,以推動更好的洞察力和決策。為了獲得最佳性能,Redshift 查詢優化器智能地將盡可能多的工作分配給底層數據庫。要了解有關 Amazon Redshift 聯合查詢的更多信息,請訪問。
UltraWarm for Amazon Elasticsearch Service 以十分之一的成本提供對日志數據的快速交互式分析
隨著越來越多的應用程序是使用微服務、容器和專用數據存儲構建的,它們會產生越來越多的日志數據。 Amazon Elasticsearch Service 使從網站、移動設備和傳感器收集、分析和可視化機器生成的日志數據變得簡單。 Amazon Elasticsearch Service 是完全托管的,因此客戶可以在幾分鐘內部署生產就緒的集群,向上和向下擴展集群,并保護靜態和傳輸中的數據。然而,鑒于日志數據的爆炸式增長,大規模存儲和分析數月或數年的數據成本高昂。這導致客戶使用多種分析工具,或刪除有價值的數據,從而錯過了長期數據可能產生的重要見解。為了解決這一客戶挑戰,AWS 為 Amazon Elasticsearch Service 構建了一個名為 UltraWarm 的新存儲層,它最終為 Elasticsearch 客戶提供了一個溫暖的存儲層,既可以經濟高效地存儲大量數據,又可以提供 Elasticsearch 那種快速的交互式體驗客戶期望。 UltraWarm 為更頻繁訪問的數據提供分布式緩存,同時使用高級放置技術來確定哪些數據塊訪問頻率較低,應將其移出緩存到 Amazon S3。 UltraWarm 還使用高性能 EC2 實例與存儲在 S3 中的數據進行交互,與競爭的暖層解決方案相比,查詢執行速度提高了 50%,并為客戶提供了與所有日志數據相同的交互式分析體驗。 UltraWarm 將如今在 Elasticsearch 中存儲相同數量的數據的成本降低了 90%,并且比其他托管 Elasticsearch 產品的暖層存儲成本低 80%。借助 UltraWarm,客戶可以使用單個 Amazon Elasticsearch Service 集群管理多達 3 PB 的日志數據;并且憑借跨多個集群的查詢能力,客戶可以有效地保留任意數量的當前和歷史日志數據,用于交互式運營分析和可視化。 UltraWarm 是 Amazon Elasticsearch Service 的無縫擴展。客戶可以通過 Kibana 界面輕松查詢和可視化他們最近和長期的運營數據,而成本只是當今的一小部分。這允許開發人員、DevOps 工程師和 InfoSec 專家使用 Amazon Elasticsearch Service 分析最近(幾周)和長期(幾個月或幾年)的運營數據,而無需花費數天時間從存檔(Amazon S3 或 Amazon Glacier)中恢復數據到 Elasticsearch 集群中的活動可搜索狀態。 UltraWarm 服務今天提供預覽版。要了解有關 UltraWarm 的更多信息,請訪問
“我們的客戶告訴我們,他們經常處理 PB 甚至 EB 的數據,而他們現有的分析系統無法跟上,”AWS 數據庫服務副總裁 Raju Gulabani 說。 “這些客戶希望對其數據倉庫和數據湖中的所有原始數據進行快速分析,并以經濟高效的方式處理日志數據的爆炸式增長,以保留可能幫助他們更好地運營業務的信息。通過今天的公告,我們正在幫助 AWS 客戶完成所有這些工作,并無所畏懼地接受大規模數據。”
Duolingo 是世界上最受歡迎的語言學習平臺和下載量最大的教育應用程序,擁有超過 3 億用戶。該公司的使命是讓所有人都可以免費、有趣地接受教育。 “我們使用 Amazon Redshift 分析來自我們應用程序的事件,以深入了解用戶如何使用 Duolingo 進行學習。我們每天將數十億個事件加載到 Amazon Redshift 中,擁有數百 TB 的數據,并且預計每年都會翻一番。雖然我們存儲和處理所有數據,但大多數分析只使用該數據的子集,”Duolingo 高級軟件工程師 Jonathan Burket 說。 “與我們之前基于 DS2 實例的 Redshift 集群相比,具有托管存儲的新 Redshift RA3 實例為我們的大多數查詢提供了 2 倍的性能。 Redshift Managed Storage 會自動適應我們的使用模式。這意味著我們不需要手動維護冷熱數據層,而且當我們處理更多數據時,我們可以保持成本不變。”
Yelp 的使命是將人們與當地的優秀企業聯系起來;為此,數據挖掘和高效的數據分析對于構建最佳用戶體驗非常重要。 “我們繼續采用新的 Redshift 功能,并對新的 RA3 實例類型感到非常興奮,”Yelp 軟件工程師 Stephen Moy 說。 “在我們的工作負載中,我們觀察到 DS2 的性能提高了 1.9 倍,DC2 的性能提高了 1.5 倍,同時保持了相同的成本并提供了可擴展的托管存儲。這使我們能夠跟上爆炸性數據增長的步伐,并有必要的燃料來訓練我們的機器學習系統。”
西部數據 (WD) 是全球領先的數據存儲品牌,使用戶能夠在各種設備上創建、體驗和保存數字內容。 WD 使用戶能夠控制并巧妙地將對他們最重要的內容保存在一個安全的地方。 “在 WD,我們使用 Amazon Redshift 使企業能夠從大型、復雜和分散的數據集中獲得價值和洞察力,”西部數據大數據平臺高級經理 Fayaz Syed 說。 “我們的數據幾乎每年翻一番,我們運行六個 Redshift 集群,總共 78 個節點和 631+ TB 的壓縮數據存儲,以獲得我們的業務分析師和領導層所依賴的洞察力。與之前的 Redshift 集群相比,新的 Redshift RA3 實例使我們能夠更經濟高效地處理不斷增長的數據,同時我們的存儲容量翻了一番。我們還喜歡我們的 ETL、BI 和數據攝取流程無需更改即可利用托管存儲的 RA3 實例。”
NTT DOCOMO 是日本最大的移動服務提供商,為超過 7900 萬客戶提供服務。 “2014 年遷移到 Amazon Redshift 使我們能夠擴展到超過 10 PB 的未壓縮數據,性能比我們之前的本地系統提高了 10 倍。今天,它是我們分析環境的中心,”NTT DOCOMO 服務創新部總經理 Takaaki Sato 說。 “自從我們開始使用 Amazon Redshift 以來,我們的數據和用戶數量都急劇增加。即使在我們擴展用戶和數據時,我們也對靈活性和易用性印象深刻。新的 Amazon Redshift Data Lake Export 功能使我們能夠簡化工作流程,以利用整個數據湖中的更多數據。我們對帶有托管存儲的新 Amazon Redshift RA3 實例感到興奮,這使我們能夠分別擴展計算和存儲。隨著我們繼續提高 Amazon Redshift 數據倉庫的性能和規模,我們也期待實現 AQUA(高級查詢加速器)對 Amazon Redshift 的好處。我們代表客戶感謝 AWS 的持續創新。”
Intuit 是 TurboTax、QuickBooks 和 Mint 的制造商,是一家全球金融平臺公司,旨在幫助消費者、個體經營者和小型企業改善財務生活。 Intuit 首席架構師 Alex Balazs 表示:“我們期待探索 AQUA 如何讓我們的團隊能夠花更多時間代表客戶進行創新。” “這些新功能補充了我們的戰略,即在我們的平臺上以速度和效率大規模創建更多數據驅動的洞察力。”
Warner Bros. Interactive Entertainment 是全球首屈一指的娛樂內容發行商、開發商、許可方和分銷商,為所有平臺的互動空間提供娛樂內容,包括用于內部和第三方游戲的控制臺、手持設備、移動設備和基于 PC 的游戲。 “我們使用了許多 AWS 和第三方分析工具,我們很高興看到 Amazon Redshift 繼續采用與我們自己的解決方案相同的多樣化數據轉換模式,”Warner 分析營銷運營技術總監 Kurt Larson 說兄弟分析。 “自 2017 年以來,我們利用 Amazon Redshift 的能力通過 Redshift Spectrum 在我們的數據湖中查詢開放數據格式,現在借助新的 Redshift Data Lake Export 功能,我們可以方便地將數據寫回我們的數據湖。這一切都發生在始終如一的快速性能下,即使在我們最高的查詢負載下也是如此。我們期待利用集成大數據堆棧的協同作用來推動跨 Amazon Redshift 集群的更多數據共享,并以更低的成本為我們所有的游戲創造更多價值。”
FOX Corporation 通過一些世界領先和最有價值的品牌制作和分發內容,包括:FOX News、FOX Sports、FOX Network 和 FOX 電視臺。 FOX 使各種故事創作者能夠想象和開發具有文化意義的內容,同時建立一個在創意、運營專業知識和戰略思維上蓬勃發展的組織。 “Amazon Redshift 使我們能夠每天從各種第一方和第三方來源大規模提取、優化、轉換和聚合數十億個事務事件,”消費品與工程數據服務副總裁 Alex Tverdohleb 說,福克斯公司。 “我們在我們的數據倉庫和數據湖中查詢實時數據,現在借助新的 Amazon Redshift 聯合查詢功能,我們還可以輕松地查詢和分析我們關系數據庫中的實時數據。我們的 PB 級數據正在快速增長,隨著 Amazon Redshift RA3 實例和 Amazon Redshift 的 AQUA(高級查詢加速器)的創新,我們很高興能夠為我們最苛刻的工作負載獲得 10 倍的性能提升,同時保持我們的成本不變. AQUA for Amazon Redshift 是 AWS 如何在堆棧的每一層進行創新以為其客戶提供最佳解決方案的一個很好的例子。”
Sophos 是下一代網絡安全領域的全球領導者。 “包括 Amazon Redshift 在內的 Amazon Web Services 使我們能夠將我們的一系列下一代安全解決方案生成的實時數據提供給超過 409,000 個組織進行分析,”Sophos 中央內容集團副總裁 John Peterson 說。 “Amazon Redshift 中的新聯合查詢功能可以幫助我們將其提升到一個新的水平,使我們能夠直接在我們的 Aurora 和 RDS PostgreSQL 數據庫中查詢數據,而無需為數據移動設置工作流。我們很高興看到這可以如何加快我們的洞察時間,并有助于更輕松地將來自多個事務數據庫的最新數據與我們的數據倉庫和數據湖中的數據合并。”
Ancestry 是家族史和消費者基因組學領域的全球領導者,致力于推動個人發現之旅以豐富生活。 “借助 Amazon Elasticsearch Service,我們可以實時收集和分析公司的運營日志,”Ancestry 工程開發高級經理 Clint Smith 說。 “現在,用于 Amazon Elasticsearch Service 的 UltraWarm 將幫助我們識別日志事件之間的關聯,并快速找到根本原因應用程序問題。在使用 UltraWarm for Amazon Elasticsearch Service 之前,我們的成本限制意味著我們只能存儲五天的數據。借助適用于 Amazon Elasticsearch Service 的 UltraWarm,我們將能夠將該窗口延長至 90 天,并通過 Kibana 以顯著降低的成本分析數據。這些額外的數據將幫助我們識別以前存儲的五天數據無法發現的應用程序問題。”
關于亞馬遜網絡服務
13 年來,Amazon Web Services 一直是世界上最全面、應用最廣泛的云平臺。 AWS 為計算、存儲、數據庫、網絡、分析、機器人、機器學習和人工智能 (AI)、物聯網 (IoT)、移動、安全、混合、虛擬和增強現實(VR 和 AR)提供超過 165 項功能齊全的服務)、媒體和應用程序開發、部署和管理,來自 22 個地理區域內的 69 個可用區 (AZ),并宣布計劃在印度尼西亞、意大利、南非和西班牙再增加 13 個可用區和 4 個 AWS 區域。數以百萬計的客戶(包括發展最快的初創公司、最大的企業和領先的政府機構)信任 AWS 來支持他們的基礎設施、變得更加敏捷并降低成本。
關于亞馬遜
亞馬遜遵循四項原則:以客戶為中心而非以競爭對手為中心、對發明的熱情、對卓越運營的承諾以及長期思考。客戶評論、一鍵購物、個性化推薦、Prime、亞馬遜物流、AWS、Kindle Direct Publishing、Kindle、Fire 平板電腦、Fire TV、亞馬遜 Echo 和 Alexa 是亞馬遜率先推出的一些產品和服務。
特別聲明:以上文章內容僅代表作者本人觀點,不代表ESG跨境電商觀點或立場。如有關于作品內容、版權或其它問題請于作品發表后的30日內與ESG跨境電商聯系。
二維碼加載中...
使用微信掃一掃登錄
使用賬號密碼登錄
平臺顧問
微信掃一掃
馬上聯系在線顧問
小程序
ESG跨境小程序
手機入駐更便捷
返回頂部