Data science

HPE thêm Lakehouse vào GreenLake, Target Databricks

Bắt chước có thể là hình thức nịnh hót chân thành nhất. Nhưng nếu bạn là Databricks, bạn có thể không quá hài lòng bởi HPE, công ty hôm nay đã công bố Ezmeral Unified Analytics, một dịch vụ cung cấp Lakehouse mới dựa trên công nghệ Delta Lake của Spark và Databricks mà khách hàng có thể chạy tại chỗ với chi phí bằng 2/3 HPE tuyên bố các dịch vụ đám mây công cộng. Nó cũng ra mắt một hệ thống lưu trữ đối tượng dựa trên Kubernetes được gọi là Ezmeral Data Fabric Object Store nhằm mục đích cung cấp dữ liệu ở bất cứ nơi nào cần truy cập. HPE có thể đang bắt kịp không gian phân tích dữ liệu lớn. Nhưng gã khổng lồ hệ thống, đã mua lại MapR Technologies trong 2019, có vẻ như bị thuyết phục rằng họ đã sẵn sàng đi trước các nhà lãnh đạo ngành trong lĩnh vực này bằng cách cung cấp một nền tảng thế hệ thứ ba sử dụng công nghệ mới nhất để cung cấp phân tích hiệu suất cao và học máy trên tiền thân và trên đám mây mà không phải trả chi phí cao hoặc bị khóa mà khách hàng ngày càng mong đợi từ đám mây. “Theo cách chúng tôi nghĩ về nó, chúng tôi đang ở thế hệ thứ ba của phân tích dữ liệu,” Vishal Lall, phó chủ tịch cấp cao và tổng giám đốc của GreenLake Cloud Services cho biết trong buổi thuyết trình hôm thứ Hai. “Nếu bạn quay lại '80 s và' 90 s, đó là kỷ nguyên của kho bãi với các công ty như Teradata, v.v. Sau đó, tất cả về dữ liệu có cấu trúc vào thời điểm đó. Sau đó, vào những năm đầu 2000, chúng tôi bước vào kỷ nguyên dữ liệu phi cấu trúc này, nơi các hồ dữ liệu lớn được hình thành các công ty mới như Hortonworks và Cloudera. ” Ông nói, các dịch vụ Hadoop thế hệ thứ hai đã gặp phải một rào cản khi hỗ trợ cho các giao dịch, vốn đòi hỏi phải có một lượng lớn việc sao chép dữ liệu kém hiệu quả. Các nền tảng đám mây công cộng và các nhà cung cấp như Databricks đã giúp giải quyết vấn đề đó, nhưng với những cảnh báo và chi phí cao hơn. Nhưng không phải ai cũng có con đường phía trước, Lall nói. Ông nói: “Những khách hàng sử dụng công nghệ thế hệ thứ hai hoặc thế hệ thứ nhất đang thấy mình bị mắc kẹt. “Họ nhận thấy rằng không thực sự có nhiều lộ trình sản phẩm khi nói đến các công nghệ hiện có như Cloudera hoặc Hortonworks. Và khi họ nhìn vào Spark hoặc Delta Lake, họ giống như không có gì trên cơ sở. ” HPE Ezmeral bao gồm bốn thành phần (HPE lịch sự hình ảnh) Đó là điểm hấp dẫn mà HPE đang tìm cách chiếm giữ với các dịch vụ Ezmeral đang phát triển của mình, được ra mắt lần đầu tiên vào tháng 6 2020 như nền tảng của nó để chạy khối lượng công việc phân tích, máy học và AI được chứa trong container. Giờ đây, HPE cho biết họ đã biến Ezmeral thành một nền tảng đầu tiên của loại hình này có thể chạy tại chỗ, trên nền tảng hoặc trên đám mây; làm việc với dữ liệu có cấu trúc và phi cấu trúc; phục vụ nhu cầu của các nhà phân tích dữ liệu và các nhà khoa học dữ liệu; và có thể làm như vậy mà không cần tốn kém chi phí và khóa các giải pháp độc quyền. Sản phẩm có sẵn dưới dạng phần mềm hoặc dịch vụ, bao gồm bốn yếu tố, hai trong số đó là mới, bao gồm Ezmeral Analytics và kho dữ liệu kết cấu đối tượng. Đối với người mới bắt đầu, có Ezmeral Runtime (có sẵn trong các phiên bản mã nguồn mở và doanh nghiệp) cung cấp hệ thống điều phối Kubernetes. Sau đó là Ezmeral Analytics (một trong những thành phần mới), bao gồm Apache Spark, bộ máy dữ liệu của Quân đội Thụy Sĩ, cũng như Delta Lake, lớp lưu trữ mã nguồn mở do Databricks tạo ra, mang các giao dịch ACID đến Apache Spark và dữ liệu lớn khối lượng công việc. Ngoài ra còn có RAPIDS Accelerator cho Apache Spark, phần mềm từ Nvidia được thiết kế để tăng tốc khối lượng công việc Spark chạy trên GPU. Ezmeral Analytics là “giải pháp đầu tiên của ngành dành cho phân tích và hồ nước kết hợp”, Matt Maccaux, CTO lĩnh vực toàn cầu của HPE cho phần mềm Ezmeral tuyên bố. “Chúng tôi đang triển khai các thư viện mã nguồn mở đó và chúng tôi đang cung cấp dịch vụ đó thông qua HPE Green Lake, nhưng có thể triển khai trên các môi trường khác nhau. Tất cả đều dựa trên cốt lõi của Apache Spark. Vì vậy, một lần nữa, khi người dùng đang viết khối lượng công việc phân tích và các ứng dụng của họ, họ đang sử dụng các API nguồn mở trong khi vẫn nhận được trải nghiệm Databricks và Snowflake. ” Điều phối khối lượng công việc được xử lý thông qua Ezmeral ML Ops, hỗ trợ các gói Airflow, ML Flow và Kubeflow mã nguồn mở. Cuối cùng, có tệp đối tượng và tệp dữ liệu Ezmeral Data Fabric mới, nó cho biết là kho lưu trữ đầu tiên của ngành kết hợp kho đối tượng gốc S3 với hỗ trợ tệp, luồng và cơ sở dữ liệu, tất cả trong một nền tảng chạy trên nền tảng , trên rìa, hoặc trong đám mây. Trên hết, HPE đang làm việc với hàng chục ISV để cho phép các dịch vụ của họ chạy trong Ezmeral Analytics, bao gồm H2O.ai, Starburst, Dremio và những người khác. Ezmeral Unified Analytics hỗ trợ các tính cách khác nhau (HPE cho phép hình ảnh) Tất cả là do sự lựa chọn, Lall nói. “Chúng tôi có một môi trường gốc kết hợp, về cơ bản, bạn có thể chạy đám mây của mình ở nơi dữ liệu của bạn đang sử dụng nền tảng này, tại cơ sở hoặc trên đồng los,” ông nói. “Thực sự đó là về việc cung cấp sự lựa chọn. Bằng cách đó, bạn không cảm thấy bị khóa với tư cách là khách hàng và cuối cùng điều đó chuyển thành nhiều TCO hơn [total cost of ownership]. ” Maccaux cho biết, khả năng hỗ trợ những người dùng khác nhau và các công cụ họ cần, cho dù đó là các nhà khoa học dữ liệu đầu tiên làm việc trong sổ ghi chép Juypter hay các nhà phân tích dữ liệu làm việc trong Tableau, là một dấu hiệu nổi bật của phương pháp tiếp cận Ezmeral của HPE. Ông nói: “Khi chúng tôi nói phân tích hợp nhất, ý chúng tôi là một tập hợp các cửa hàng ứng dụng phổ biến, nơi những người dùng này có thể truy cập để tạo ra các công cụ của họ. “Chúng tôi đang triển khai Apache Spark làm thời gian chạy cốt lõi và là nhà môi giới cho rất nhiều dịch vụ này. Và sau đó, sử dụng những thứ như máy chủ Thrift và máy chủ Livy và thư viện Delta Lake, tất cả đều là mã nguồn mở, nhưng mang lại trải nghiệm Databricks và Snowflake giống nhau ở bất kỳ nơi nào mà những người dùng này cần thực hiện công việc của họ – cho dù đó là tại cơ sở, cho dù đó là trên đám mây hay ngoài rìa. ” Ezmeral chứa các yếu tố của các thương vụ mua lại HPE trước đây, bao gồm cả nhà điều hành Kubernetes mà công ty này có được nhờ mua lại BlueData, cũng như nền tảng MapR mà công ty đã mua trong vụ mua lại MapR Technologies vào mùa hè 2019. Ezmeral Analytics và Cửa hàng đối tượng vải dữ liệu Ezmeral sẽ được giao trong nửa đầu của 2022. Các mục liên quan: HPE Ra mắt Nền tảng 'Ezmeral' cho các ứng dụng thế hệ tiếp theo Nền tảng container HPE Ships, bao gồm Kubernetes và Hệ thống tệp MapR HPE có được MapR

Back to top button