Business intelligence

Khai thác dữ liệu là gì?

Khai thác dữ liệu là một tập hợp con cũ hơn (và hiện là liên minh) của máy học và trí tuệ nhân tạo xử lý các tập dữ liệu lớn. Nó sử dụng các công nghệ nhận dạng mẫu với các kỹ thuật thống kê và toán học để dự báo xu hướng kinh doanh và tìm ra các mẫu hữu ích. “Khai phá dữ liệu còn được gọi là Khám phá tri thức trong dữ liệu (KDD).” Một thành phần của khai thác dữ liệu, khai thác văn bản, phân tích tài liệu với phân tích văn bản, bằng cách phân loại nội dung tự động thành các bản thể học có thể dễ dàng tìm kiếm. Các kỹ thuật khai thác dữ liệu và văn bản bao gồm: Lập hồ sơ: Đặc trưng hóa các chuẩn mực và phát hiện sự bất thường Giảm dữ liệu: Thay thế một tập dữ liệu lớn bằng một tập hợp nhỏ hơn chứa nhiều thông tin quan trọng trong tập hợp lớn hơn, để xử lý và phân tích dễ dàng hơn để tìm mối quan hệ giữa các yếu tố nghiên cứu dựa trên các giao dịch liên quan đến chúng. ” Điều này bao gồm “khai thác tập hợp mục thường xuyên, khám phá quy tắc và phân tích dựa trên thị trường” Phân cụm: Nhóm các phần tử lại với nhau theo các đặc điểm chung (ví dụ: phân khúc khách hàng) Bản đồ tự tổ chức: Phân tích các cụm bằng phương pháp mạng nơ-ron Thông thường, ngôn ngữ máy tính Python thực hiện khai thác dữ liệu. Khai thác dữ liệu hứa hẹn sẽ hiệu quả hơn khi các công cụ và kỹ thuật dữ liệu lớn tiếp tục được cải thiện. Giống như những tiến bộ đạt được trong việc dự đoán khi nào và ở đâu một cơn bão hoặc cuồng phong sẽ ập đến, việc khai thác dữ liệu tiếp tục được cải thiện, chẳng hạn như khai thác dữ liệu tùy chỉnh xung quanh một doanh nghiệp cụ thể. Các định nghĩa khác về Khai thác dữ liệu bao gồm: “Quá trình doanh nghiệp sàng lọc dữ liệu để tìm kiếm thông tin có liên quan.” (David Anderson) “Quá trình khám phá các mối tương quan, mô hình và xu hướng có ý nghĩa bằng cách chọn lọc một lượng lớn dữ liệu được lưu trữ trong kho lưu trữ. Khai thác dữ liệu sử dụng các công nghệ nhận dạng mẫu, cũng như các kỹ thuật thống kê và toán học. ” (Gartner IT Glossary) “Quá trình khám phá các mẫu và xu hướng hữu ích trong các tập dữ liệu lớn”. (OReilly) “Một lĩnh vực đang phát triển nhanh chóng liên quan đến việc phát triển các kỹ thuật để hỗ trợ các nhà quản lý sử dụng thông minh“ kho lưu trữ điện tử ”. (MIT) “Một công nghệ không thể thiếu đối với các doanh nghiệp và các nhà nghiên cứu trong nhiều lĩnh vực. Dựa trên công việc trong các lĩnh vực như thống kê, học máy, nhận dạng mẫu, cơ sở dữ liệu và máy tính hiệu suất cao, khai thác dữ liệu sẽ trích xuất thông tin hữu ích. ” (Báo chí MIT). Các trường hợp sử dụng khai thác dữ liệu Bao gồm: Một nhà bán lẻ đã “tìm ra cách xác định khách hàng lần đầu tiên có khả năng trở thành người chi tiêu lâu dài” Một công ty bảo hiểm đã giảm chi phí và tăng tốc dịch vụ khách hàng sau khi “khám phá ra văn phòng nào xử lý một số loại yêu cầu phổ biến hiệu quả hơn hơn bất kỳ cơ quan thực thi pháp luật nào khác “Một cơ quan thực thi pháp luật đã loại bỏ một quy trình không hiệu quả, ưu tiên các trường hợp và làm việc gì đó tốt hơn” Một nhà sản xuất xác định các dấu hiệu cảnh báo về sự cố tràn hóa chất, cung cấp thông tin cần thiết để ngăn ngừa các tai nạn trong tương lai, bảo vệ môi trường và tránh đầu tư vốn tốn kém và kiện tụng “Doanh nghiệp Sử dụng Khai thác dữ liệu Để: Giúp tránh những sai lầm tốn kém Làm cho việc xử lý dữ liệu phù hợp hơn Xác định các lỗ hổng trong việc Tăng lợi nhuận Phát sóng biến động giá trong ngắn hạn Hình ảnh được sử dụng theo giấy phép từ Shutterstock.com

  • Trang chủ
  • Trí tuệ nhân tạo
  • Chuyên viên phân tích kinh doanh
  • Thông tin kinh doanh
  • Khoa học dữ liệu
  • Back to top button