Business intelligence

Tương lai của AI: Hỗ trợ dịch giọng nói thành văn bản

Nhấp để tìm hiểu thêm về tác giả Rachel Roumeliotis. Trí tuệ nhân tạo (AI) hiện đang cung cấp năng lượng cho thương mại đàm thoại trong bán lẻ, ngày càng sử dụng nhiều chatbot để hợp lý hóa và cải thiện dịch vụ khách hàng. Điều này có thể trợ giúp mọi thứ, từ việc trả lời các câu hỏi của khách hàng và giải quyết các vấn đề để giúp bán được nhiều hàng hơn thông qua các đề xuất sản phẩm. Dịch giọng nói sang văn bản là một phần quan trọng của sự hiểu biết này giữa con người và máy móc, và nó ngày càng trở nên tinh vi hơn. Mặc dù bán lẻ là một trong những ứng dụng chính của công nghệ này, nhưng chúng tôi thực sự mới chỉ sơ lược về bề nổi của những gì sắp xảy ra. Đây là lý do tại sao: Âm thanh là dữ liệu phi cấu trúc. Phiên âm của thông tin này cho phép chúng tôi phân tích thông tin đó dễ dàng hơn để cung cấp thông tin chi tiết hữu ích về doanh nghiệp. Nếu không dịch âm thanh này sang văn bản, các công ty không có khả năng xử lý ngôn ngữ tự nhiên (NLP) nâng cao để kết nối các điểm giữa văn bản tự do và dữ liệu có cấu trúc – và hầu hết không – sẽ gặp nguy hiểm. Tóm lại, thật khó để có được bức tranh toàn cảnh về người tiêu dùng nếu chúng ta bỏ qua những phần quan trọng của cuộc trò chuyện. Bạn có thể tưởng tượng điều này có thể bất lợi như thế nào nếu chúng ta đang nói về các ứng dụng trong một ngành như chăm sóc sức khỏe hoặc dược phẩm. Nếu bạn không thể liên kết lịch sử y tế quan trọng của bệnh nhân, cho dù được lưu trữ trong hồ sơ y tế điện tử hoặc ghi chú của bác sĩ, với những lo ngại được nêu ra trong cuộc trò chuyện trong cuộc hẹn khám sức khỏe từ xa, thì việc điều trị và kết quả có thể bị ảnh hưởng. Mặc dù dịch giọng nói thành văn bản đã thành công như thế nào qua các ngành dọc, nó không phải là điều cần lưu ý đối với người dùng tiềm năng. Trên thực tế, nghiên cứu toàn cầu gần đây của công ty chúng tôi cho thấy 18% người trả lời khảo sát chỉ ra rằng các bản dịch ngay lập tức là lĩnh vực kém thú vị nhất để AI phát triển, trước đó là in 3D (11. 7%), khuyến nghị (13. 3%), đầu tư vào công nghệ ( 15. 9%), và nhận dạng khuôn mặt (16. 8%). Mặc dù bản dịch chuyển giọng nói sang văn bản có thể không có sức hấp dẫn như ô tô tự lái hoặc trợ lý ảo, nhưng nó có những ứng dụng thực tế, thiết thực cho người lao động. Trên thực tế, gần 30% số người được hỏi từ cùng cuộc khảo sát đã trích dẫn bản dịch chuyển giọng nói sang văn bản khi được hỏi họ muốn AI giúp họ trong công việc. Mặc dù con số này thấp hơn so với các lĩnh vực khác – cung cấp và hỗ trợ kiến ​​thức, giám sát và tối ưu hóa triển khai phần mềm, cá nhân hóa, v.v. – nhưng nó chắc chắn có thể cải thiện quy trình làm việc của nhân viên trong các hoạt động hàng ngày. Điều này cho phép người lao động tập trung vào các nhiệm vụ quan trọng hơn, có giá trị kinh doanh cao hơn, có thể mang lại lợi nhuận cao hơn về mặt năng suất. Ví dụ, các bộ ứng dụng văn phòng được sử dụng rộng rãi như Microsoft cung cấp tính năng đọc chính tả bằng giọng nói. Tính năng chuyển lời nói thành văn bản của Word cho phép người dùng nói các từ thay vì phải nhập chúng trên bàn phím. Điều này giúp nắm bắt các luồng ý thức hoặc đơn giản là giảm thời gian bấm các chữ cái theo cách thủ công. Phiên âm giọng nói từ các cuộc gọi dịch vụ khách hàng, âm thanh và video hội nghị, và các lĩnh vực khác có thể được lập bảng và lưu trữ nhanh chóng, giúp người nghe có mặt ngay lập tức và quay lại xem lại nội dung để củng cố kiến ​​thức của họ sau này. Một lĩnh vực khác có thể đặc biệt hữu ích là dịch từ giọng nói sang văn bản là kết nối trải nghiệm đa ngôn ngữ. Khi lực lượng lao động trở nên phân tán và toàn cầu hơn, một xu hướng được thúc đẩy bởi sự thay đổi công việc từ xa và kết hợp do đại dịch mang lại, nhu cầu dịch ngôn ngữ đang trở nên phổ biến hơn. Các sắc thái giữa nói và viết có thể khó giải mã, nhưng việc chuyển lời nói thành văn bản đa ngôn ngữ có thể giúp tạo sân chơi bình đẳng và thúc đẩy văn hóa cộng tác giữa các nhóm trên bản đồ. Bằng cách thu thập thông tin ở nhiều định dạng – trong trường hợp này là âm thanh và văn bản – chúng tôi có thể có được thông tin chi tiết tốt hơn về doanh nghiệp. May mắn thay, tính năng dịch văn bản sang giọng nói được hỗ trợ bởi AI cho phép chúng tôi thực hiện việc này theo cách tự động mà không yêu cầu nhập dữ liệu thủ công, việc này vừa tốn thời gian vừa dễ xảy ra lỗi của con người. Mặc dù vẫn còn là những ngày đầu đối với việc dịch chuyển giọng nói sang văn bản, nhưng tiềm năng để thăng tiến và phát triển là rõ ràng. Khi NLP và các lĩnh vực nhận dạng giọng nói khác trở nên phức tạp hơn, thì khả năng những gì chúng ta có thể làm trong lĩnh vực này cũng sẽ tăng lên.

  • Trang chủ
  • Trí tuệ nhân tạo
  • Chuyên viên phân tích kinh doanh
  • Thông tin kinh doanh
  • Khoa học dữ liệu
  • Back to top button