Data science

Bây giờ có phải là thời gian cho ảo hóa cơ sở dữ liệu?

Trong 20 năm qua, hầu như tất cả các phần tử của hệ thống CNTT đã được ảo hóa. Chúng tôi có bộ nhớ ảo, mạng ảo và máy chủ ảo. Nhưng một phần của ngăn xếp rõ ràng vắng mặt trong câu chuyện ảo hóa: cơ sở dữ liệu. Đã đến lúc ảo hóa cơ sở dữ liệu? Một số người nói rằng thời gian không thể tốt hơn. Ảo hóa cơ sở dữ liệu không phải là một khái niệm mới, nhưng nó cũng không phải là một khái niệm được triển khai rộng rãi. Trong một kiểu ảo hóa cơ sở dữ liệu, chẳng hạn như kiểu được thực hiện bởi Datometry của công ty San Francisco, một lớp trừu tượng được chèn vào giữa cơ sở dữ liệu và ứng dụng. Trình giả lập che giấu sự khác biệt giữa các cơ sở dữ liệu, cho phép khách hàng di chuyển cơ sở dữ liệu dễ dàng hơn nhiều so với trước đây. Theo Mike Waas, Giám đốc điều hành Datometry, ảo hóa cơ sở dữ liệu có tiềm năng mang lại cho sự kết hợp nhiều quyền tự do hơn để sử dụng các cơ sở dữ liệu khác. “Thoát khỏi một cơ sở dữ liệu chỉ là cơn ác mộng của mọi người,” cựu cơ sở dữ liệu nói với Datanami. “Mọi người, trong suốt 50 năm qua, đều phải chịu đựng sự cố nhà cung cấp khóa cơ sở dữ liệu, nhưng chưa ai thực sự làm được gì với nó. Đó là điều chúng tôi muốn thay đổi ”. Cung cấp của Datometry, được gọi là Hyper-Q, hiện nhắm mục tiêu đến cơ sở dữ liệu phân tích Teradata và hỗ trợ cho thiết bị Exadata của Oracle sẽ ra mắt vào cuối quý này. Theo Waas, người đã chặt chẽ về cơ sở dữ liệu với Microsoft trong 1990 trước khi làm việc tại Amazon.com và Greenplum, các công ty thường ngân sách $ 20 triệu đến $ 30 triệu trong khoảng thời gian ba năm để chuyển đổi từ một thiết bị Teradata hạng trung. Tuy nhiên, các dự án thực tế thường chiếm tới 20 triệu đô la, chỉ với một 15% tỉ lệ thành công. “Điều này trong quá khứ có thể là một quyết định khả thi,” ông nói về sự thất bại trong việc ngừng hoạt động hoàn toàn một hệ thống OLAP. “Nhưng khi bạn chuyển sang đám mây và nếu bạn thực sự muốn loại bỏ phần cứng và hệ thống hiện tại, đó không còn là một lựa chọn nữa. Vì vậy, chúng tôi cho phép họ thực sự hôn tạm biệt thứ đó, di chuyển tất cả những gì họ có và dỡ bỏ chiếc hộp cũ. ” Cung cấp của Cơ sở dữ liệu Mô phỏng Cơ sở dữ liệu về cơ bản là một trình giả lập cho cơ sở dữ liệu. Công ty chủ yếu tập trung vào cơ sở dữ liệu quan hệ hướng cột hoặc hệ thống OLAP, chẳng hạn như sản phẩm phổ biến của Teradata. Không có lý do gì mà trình giả lập cơ sở dữ liệu của nó không thể được sử dụng cho các hệ thống OLTP, nhưng việc di chuyển kho dữ liệu có xu hướng tốn kém và khó khăn nhất, vì vậy công ty đang bắt đầu từ đó. Đây là cách Waas mô tả sản phẩm: “Chúng tôi chặn giao tiếp từ ứng dụng, giải nén các yêu cầu, lấy ra SQL và sau đó làm những gì hiệu quả gần giống như những gì nửa trên của bất kỳ cơ sở dữ liệu nào làm, nghĩa là xây dựng toàn bộ mô hình đại số cho yêu cầu đến, tối ưu hóa yêu cầu đó và sau đó tổng hợp ý nghĩa của SQL được tối ưu hóa cho đích đó, ”ông nói. Kiến trúc Datometry (Nguồn: Sách trắng về Datometry “Việc áp dụng nhanh chóng Công nghệ Kho Dữ liệu Đám mây Sử dụng Datometry Hyper-Q”) Khi phần mềm Datometry đã khám phá các đặc điểm xác định của cơ sở dữ liệu nguồn, thì một giải pháp thay thế, bao gồm khối lượng công việc theo thời gian thực lớp dịch thuật, có thể được triển khai tại hiện trường để hỗ trợ khách hàng hệ thống cơ sở dữ liệu mới. Chạy trong đám mây riêng ảo của khách hàng (VPC), giải pháp Đo dữ liệu nằm giữa hệ thống yêu cầu, chẳng hạn như máy khách Tableau hoặc Looker BI và mới kho dữ liệu mà khách hàng đã chọn, có thể là Amazon Redshift của Amazon Web Services, Google Cloud BigQuery hoặc Microsoft Azure Synapse Analytics. Waas nói rằng ưu điểm chính mà cách tiếp cận này có là không có ứng dụng phân tích nào biết rằng họ không nói chuyện với kho dữ liệu Teradata nữa. Khi ứng dụng khách Tableau hoặc Looker BI kích hoạt các truy vấn SQL hoặc khi công cụ Informatica hoặc Talend ETL tải dữ liệu nguồn vào kho, trình giả lập Datometry sẽ diễn giải các yêu cầu và điều chỉnh chúng khi cần thiết để giải thích sự khác biệt giữa Teradata cũ và mới Hệ thống Redshift / Synapse / BigQuery. Waas cho biết Datometry đã hoàn thành bài tập của mình trong việc phát triển giải pháp của mình để tính đến thiết kế cụ thể và đặc thù của các hệ thống Teradata và Oracle, vốn là những cỗ máy phân tích cực kỳ phức tạp với nhiều bộ phận chuyển động. Anh ấy nói rằng ngay lập tức, Hyper-Q có thể tái tạo 99 6% các chức năng của Teradata. Một lưu ý là cho đến nay Datometry vẫn chưa phát triển hỗ trợ cho XML. (Âm thanh mà bạn nghe thấy là các giám đốc điều hành của MarkLogic thở phào nhẹ nhõm.) “Teradata có những điều tuyệt vời: macro, thủ tục được lưu trữ. Bạn đặt tên cho nó, chúng tôi làm tất cả những điều đó, ”Waas nói. “Ngay cả khi cơ sở dữ liệu đích mới của bạn không có các thủ tục được lưu trữ, chúng tôi cung cấp cho bạn các thủ tục được lưu trữ vì một thủ tục được lưu trữ thực sự là một tập hợp hoặc chuỗi các câu lệnh SQL được kết nối với luồng điều khiển. Và vì vậy chúng tôi thực sự diễn giải luồng điều khiển và thực thi các câu lệnh SQL, giả sử ngược lại với BigQuery hoặc Synapse. “Vì vậy, bạn có được độ trung thực đầy đủ của thủ tục được lưu trữ, với tất cả sự tốt đẹp của việc xử lý lỗi và các câu lệnh đi đến và bạn đặt tên cho nó,” ông tiếp tục. “Nhưng nó không thực thi trong cơ sở dữ liệu. Luồng điều khiển được thực thi trong Hyper-Q sản phẩm của chúng tôi, nhưng tất cả các công việc nặng nhọc đều được thực hiện trong cơ sở dữ liệu. ” Grander Vision Datometry định giá sản phẩm của mình dựa trên ước tính khối lượng công việc. Đối với một hệ thống Teradata hạng trung điển hình, chi phí sẽ là vài trăm nghìn đô la mỗi năm, Waas nói. Quá trình di chuyển được hoàn thành với chi phí bằng 1/10 và tốc độ bằng 1/10 so với quá trình di chuyển truyền thống được xử lý bởi nhà tích hợp hệ thống, với xác suất thắng 90%, anh ta yêu cầu. Sau khi dành sự nghiệp của một khách hàng cơ sở dữ liệu và làm việc cho các nhà cung cấp cơ sở dữ liệu, Waas đã thấy những tác động to lớn mà cơ sở dữ liệu dính có thể có. Khi anh ấy bắt đầu với Amazon.com trong 2005, anh ấy đã tham gia vào giai đoạn đầu của quá trình chuyển đổi của người bán sách trực tuyến khỏi cơ sở dữ liệu Oracle mà cuối cùng đã lên đến đỉnh điểm vào năm ngoái – a 15 dự án năm. Tương tự, Facebook đã mất vài năm chỉ để nâng cấp từ một phiên bản Postgres lên một phiên bản khác. Datometry hy vọng sẽ giúp khách hàng tôn vinh sự tự do khỏi khóa cơ sở dữ liệu (Pakthongchai / Shutterstock) Khách hàng không phải là những người duy nhất bị tổn thương bởi khóa cơ sở dữ liệu, Waas nói. Khi các nhà cung cấp cơ sở dữ liệu cải thiện sản phẩm của họ, khách hàng thường không thể nâng cấp lên nó để tận dụng các tính năng của họ, điều này làm ảnh hưởng đến triển vọng dài hạn của nhà cung cấp. “Nếu chúng tôi thực hiện Đo lường dữ liệu 10 nhiều năm trước, bạn sẽ chuyển từ Oracle với phần cứng cố định sang SQL Server với phần cứng cố định. Tomato, toh-mah-to, ”anh nói. “Giá trị tốt nhất sẽ là 10% đến 15%. Không có một bước nhảy vọt về mặt lượng tử nào về giá trị. ” Nhưng đám mây thực sự mang lại bước nhảy vọt về giá trị, với khả năng mở rộng, hiệu suất và thị trường ứng dụng, Waas nói. Cuối cùng, sau nhiều năm điều trị cơn đau do di chuyển cơ sở dữ liệu bằng thuốc mỡ bôi ngoài da, cuối cùng có thể đã có cách chữa trị. Ông nói: “Nó thực sự được kết tinh như thể, đây là thời điểm cuối cùng trong lịch sử nơi có một lực lượng bên ngoài chuyển mọi người từ tại chỗ sang đám mây. “Có thể nói, đây là một sự mở đầu lý tưởng để công nghệ này có thể chuyển từ hệ thống cơ sở dữ liệu này sang hệ thống cơ sở dữ liệu khác, để đưa ảo hóa vào bảng.” Di chuyển cơ sở dữ liệu là cách sử dụng rõ ràng nhất để ảo hóa cơ sở dữ liệu. Nhưng tầm nhìn Datometry lớn hơn thế, Waas nói. “Hãy nghĩ đến VMware,” anh ấy nói. “Hai mươi năm trước, mọi người xem nó như một công cụ hợp nhất cho đa lõi. Không ai nhìn vào điều này ngày hôm nay theo cách này nữa. Có rất nhiều chức năng mà VMware có được. ” Datometry có cùng suy nghĩ. Waas cho biết khi bạn đã ở trong đường dẫn dữ liệu, có nhiều chức năng hơn mà bạn có thể xây dựng, bao gồm quản lý, điều phối, bảo mật, lập hồ sơ và tối ưu hóa. Ông nói: “Trong vài năm tới, tôi tin rằng sẽ không còn ai kết nối trực tiếp một ứng dụng với cơ sở dữ liệu nữa, giống như không ai đặt phần mềm doanh nghiệp trên một máy chủ kim loại thô ngày nay”. “Tập lệnh đã bị lật hoàn toàn bởi ảo hóa trong 15 năm qua và tôi hy vọng điều tương tự sẽ xảy ra trong không gian cơ sở dữ liệu.” Các mục liên quan: Di chuyển cơ sở dữ liệu chuyển sang bánh răng cao Ai đang chiến thắng cơ sở dữ liệu đám mây Cuộc chiến Đám mây bây giờ Nền tảng mặc định cho cơ sở dữ liệu, Gartner nói

  • Trang chủ
  • Trí tuệ nhân tạo
  • Chuyên viên phân tích kinh doanh
  • Thông tin kinh doanh
  • Khoa học dữ liệu
  • Back to top button