Data science

Dữ liệu Voltron thực hiện chuyến bay đến cộng đồng mũi tên thống nhất

Bạn có thể biết đến Apache Arrow là định dạng dữ liệu trong bộ nhớ nhanh được sử dụng để tăng tốc khối lượng công việc phân tích dữ liệu và khoa học dữ liệu. Những gì bạn có thể chưa biết là một trong những người sáng tạo ban đầu của Arrow và một thành viên cốt lõi của nhóm RAPIDS của Nvidia đang hợp lực để đưa toàn bộ hệ sinh thái Arrow lên một tầm cao mới với một liên doanh mới có tên là Voltron Data. Wes McKinney và Josh Patterson đã lên web vào tuần trước để viết một lá thư chào mừng đến với thế giới và mô tả mục tiêu của họ với Voltron Data. McKinney, một 2018 Người cần theo dõi của Datanami, là người đồng sáng tạo Apache Arrow, đồng thời là người tạo ra dự án Pandas, trong khi Patterson đang làm giám đốc cấp cao của RAPIDS dành cho Nvidia. Bộ đôi – với Patterson là Giám đốc điều hành và McKinney là CTO – đã đặt ra mục tiêu cao cả cho mình tại Voltron Data, dường như để tỏ lòng kính trọng đối với loạt phim truyền hình nổi tiếng về một siêu rô bốt gồm năm nhà thám hiểm không gian (xem hình trên). “Giai đoạn phát triển tiếp theo là chứng kiến ​​Arrow không chỉ được sử dụng làm tiêu chuẩn cho việc di chuyển dữ liệu nhanh chóng mà còn là định dạng gốc cho tính toán phân tích hiệu quả về chi phí”, cặp đôi viết trong bài đăng trên blog. “Chúng tôi hình dung ra một nền tảng phổ biến, được tối ưu hóa phần cứng giúp đơn giản hóa và tăng tốc khối lượng công việc phân tích dữ liệu trên các ngôn ngữ lập trình.” Dữ liệu Voltron là sự kết hợp của một số ít các thực thể có trước nó (có vẻ là tự nhiên, nếu xét đến tên của nó). Danh sách bao gồm Ursa Computing và Ursa Labs, do McKinney thành lập 2018 và 2020, tương ứng. Nó cũng bao gồm các thành viên trong nhóm từ BlazingSQL, công cụ SQL phân tán mã nguồn mở cho Python được phát triển trên nền tảng GPU RAPIDS, cũng như các thành viên của nhóm Nvidia RAPIDS. McKinney và Patterson viết: “Bạn sẽ thấy chúng tôi làm nhiều việc hơn trong cộng đồng Arrow so với những gì chúng tôi đã làm trong quá khứ và chúng tôi mong muốn nâng cao dấu ấn của Arrow trên thế giới. “Cùng nhau, chúng tôi đang thống nhất chuyên môn chung của mình về hiệu suất, tính di động và khả năng lập trình để xây dựng nhiều cầu nối hơn trên hệ sinh thái dữ liệu nhằm cải thiện các công cụ mà bạn biết và yêu thích”. Voltron Data hiện liệt kê 15 các cơ hội việc làm, từ kỹ sư hạt nhân máy tính đến giám đốc kỹ thuật hỗ trợ mã nguồn mở. Mặc dù bề ngoài công ty có trụ sở tại Mountain View, California, nhưng tất cả các vị trí được liệt kê trên trang web đều ở xa. Khi chúng tôi biết thêm về các mục tiêu cụ thể của Voltron Data, bạn có thể đọc tại đây. Các mục liên quan: Apache Arrow bắt đầu 'bay' với Big Data Net RAPIDS Momentum Build với Analytics, Cloud Backup

  • Trang chủ
  • Trí tuệ nhân tạo
  • Chuyên viên phân tích kinh doanh
  • Thông tin kinh doanh
  • Khoa học dữ liệu
  • Back to top button