Data science

Lấy dấu vân tay dữ liệu: Một phương pháp tiếp cận AI tinh gọn sáng tạo cho các công ty khởi nghiệp

Các công ty khởi nghiệp công nghệ có áp lực rất lớn trong việc áp dụng máy học và AI để duy trì sự phù hợp trong hoạt động kinh doanh của họ. Học máy, nếu được triển khai tốt, có thể có tác động trực tiếp đến khả năng phát triển và huy động vốn tiếp theo của một công ty khởi nghiệp. Tuy nhiên, các công ty ở giai đoạn đầu phải đối mặt với những thách thức đặc biệt trong việc phát triển các tính năng và sản phẩm dựa trên học máy vì chất lượng của các giải pháp phụ thuộc vào chất lượng của dữ liệu miền cụ thể có sẵn để đào tạo các mô hình. Các công ty khởi nghiệp thường thiếu dữ liệu cụ thể cho vấn đề kinh doanh mà họ đang cố gắng giải quyết và các bộ dữ liệu chung chung không hữu ích lắm cho các vấn đề duy nhất mà họ đang cố gắng giải quyết. Để tạo dữ liệu họ cần, sản phẩm / tính năng cần phải hoạt động. Tình trạng tiến thoái lưỡng nan này có thể làm trì hoãn hoặc cấm hoàn toàn việc sử dụng máy học đối với nhiều công ty khởi nghiệp. Để vượt qua trở ngại này, các công ty khởi nghiệp có thể áp dụng cách tiếp cận “AI tinh gọn” bằng cách bắt đầu với các thuật toán đơn giản và dần dần đưa sự phức tạp của máy học vào sản phẩm khi họ thu thập thêm dữ liệu. Để điều này xảy ra, cần phải có sức mạnh tổng hợp giữa dữ liệu và các thuật toán có khả năng xử lý dữ liệu. Chúng ta hãy xem xét kỹ hơn cách tiếp cận AI tinh gọn có thể hoạt động. Thuật toán trước khi có dữ liệu Bất chấp niềm tin phổ biến rằng dữ liệu thực thi các yêu cầu thuật toán hoặc dữ liệu có trước thuật toán, có một cách sử dụng các thuật toán để xác định yêu cầu dữ liệu. Cách tiếp cận này cho phép các nhà phát triển dần dần làm việc theo cách của họ để tạo ra một thuật toán phức tạp hơn cho một tính năng của sản phẩm. Kỹ thuật xác định yêu cầu dữ liệu cụ thể cho một thuật toán là những gì chúng tôi gọi là dấu vân tay dữ liệu. (Ryzhi / Shutterstock) Dấu vân tay dữ liệu có thể được coi là một công cụ nhận dạng mẫu có thể nhận ra một số lớp dữ liệu nhất định trong ngữ cảnh của thuật toán xử lý cơ bản. Bằng cách bắt đầu với một thuật toán đơn giản và dữ liệu hạn chế, có thể từng bước tạo ra một thuật toán phức tạp hơn bằng cách kiểm soát tính toán bản chất của dữ liệu. Sử dụng phương pháp lấy dấu vân tay dữ liệu, các công ty có thể chuyển đầu vào cho một số lớp dữ liệu nhất định có thể được xử lý bằng thuật toán đã chọn. Nếu dấu vân tay của dữ liệu đầu vào không thể được nhận dạng, một logic mặc định bỏ qua logic chính sẽ được gọi. Điều mong muốn là hệ thống tạo dấu vân tay có thể chuyển đổi dữ liệu đầu vào thành dấu vân tay không phân biệt loại dữ liệu. Trong thực tế, điều này không thể đạt được trừ khi chúng ta có logic xử lý dữ liệu cụ thể trước khi dữ liệu có thể được lấy dấu vân tay. Ví dụ, nếu dữ liệu đầu vào là văn bản, chúng ta cần một mô-đun xử lý văn bản để chuyển đổi văn bản thành dạng chuẩn. Nếu chúng ta có hình ảnh làm dữ liệu đầu vào, chúng ta cần một mô-đun xử lý hình ảnh để chuyển đổi hình ảnh thành dạng chuẩn. Yêu cầu thứ hai đối với hệ thống dấu vân tay là có thể phát triển từng bước dựa trên sự phát triển của độ phức tạp của thuật toán cơ bản. Start Simple, Grow Complex Một trong những khía cạnh hấp dẫn nhất của lấy dấu dữ liệu là nó cho phép các tổ chức bắt đầu quy mô nhỏ với một thuật toán đơn giản và bất kỳ lượng dữ liệu khiêm tốn nào họ có cho tính năng sản phẩm mà họ muốn kết hợp máy học vào. Họ có thể bắt đầu bằng cách xác định đầu tiên một kỹ thuật học máy cụ thể như nhận dạng hình ảnh hoặc xử lý văn bản cần thiết cho tính năng này. Bước tiếp theo là đưa ra một thuật toán cơ bản hỗ trợ sự phát triển của tính năng này. Thuật toán này sẽ được hưởng lợi từ cách tiếp cận học tập không giám sát như phân cụm hoặc kỹ thuật học có giám sát đơn giản. Tuy nhiên, sự cân nhắc quan trọng là xác định loại dữ liệu mà thuật toán có thể sử dụng để đạt được mục tiêu này — đó là cách thuật toán xác định yêu cầu dữ liệu, chứ không phải ngược lại. Khi các nhà phát triển hiểu điều đó, họ chỉ cần sử dụng dữ liệu mà thuật toán có thể xử lý để có được phiên bản hoạt động cơ bản của tính năng mong muốn. Sau khi tính năng được xây dựng, họ có thể kết hợp một thuật toán nâng cao hơn để tinh chỉnh các mục tiêu cho dữ liệu đầu vào và cải thiện khả năng của tính năng theo thời gian. Ý nghĩa đối với khởi nghiệp Việc lấy dấu vân tay dữ liệu thực thi sức mạnh tổng hợp giữa dữ liệu và các thuật toán có khả năng xử lý dữ liệu. Đối với các công ty khởi nghiệp, hệ lụy là rất lớn. Phương pháp luận này cho phép các công ty khởi nghiệp sử dụng học máy trong các dịch vụ sản phẩm ban đầu của họ bằng cách triển khai các thuật toán đơn giản để bắt đầu và từng bước phát triển độ phức tạp của thuật toán – tạo ra sự khác biệt. Nó cũng cho phép họ vượt qua tình huống khó xử về dữ liệu đào tạo cụ thể trên miền giới hạn mà họ thường xuyên gặp phải, vì vậy họ vẫn có thể xây dựng các tính năng học máy đáng tin cậy với dữ liệu mà chúng có. Sử dụng máy học và AI là yếu tố quan trọng đối với sự thành công của các công ty này, các sản phẩm mà họ phát triển và khách hàng tin cậy vào chúng. Thông tin về tác giả: Manjusha Madabushi là Đồng sáng lập và CTO của Talentica Software, công ty hàng đầu toàn cầu về dịch vụ phát triển sản phẩm thuê ngoài cho các công ty công nghệ giai đoạn đầu và giai đoạn tăng trưởng. Talentica đã giúp 150 – cộng với các công ty khởi nghiệp phát triển thành công các sản phẩm công nghệ sáng tạo thông qua sự kết hợp của chuyên môn sâu về công nghệ, DNA khởi nghiệp và tập trung vào kết quả của khách hàng. Theo dõi Manjusha tại LinkedIn. Các mục liên quan: Sự khác biệt giữa AI, ML, Deep Learning và Active Learning là gì? 'Vụ nổ lớn' của Khoa học dữ liệu và Công cụ ML

  • Trang chủ
  • Trí tuệ nhân tạo
  • Chuyên viên phân tích kinh doanh
  • Thông tin kinh doanh
  • Khoa học dữ liệu
  • Back to top button