Business intelligence

Học tập củng cố sâu sắc là chìa khóa để tạo nên trí tuệ nhân tạo

Rất nhiều AI bị mắc kẹt trong kỹ thuật số. Nó nhắm mục tiêu chúng tôi bằng các quảng cáo trên YouTube. Nó tạo ra các câu chuyện và bản sao tiếp thị với các mô hình ngôn ngữ như GPT-3. Nó tạo ra các video giả sâu mới và tốt hơn để giải trí cho chúng ta. Nhưng một loạt vấn đề khó khăn hơn đối mặt với AI khi nó tiến vào thế giới vật chất. Học tăng cường sâu (RL) là một trong những công nghệ quan trọng sẽ giải quyết các vấn đề ở đó. Deep RL là một loại AI có thể học cách đạt được mục tiêu qua nhiều bước, thường bằng cách phát minh ra các động thái đáng ngạc nhiên để điều hướng các môi trường phức tạp. Nó thiết lập các mạng thần kinh nhân tạo sâu trong một khuôn khổ học tập củng cố để đào tạo các mạng thần kinh này thông qua các phần thưởng và hình phạt khi chúng cố gắng đạt được mục tiêu của mình. RL hoạt động trong các tình huống mà các quyết định tuần tự có thể được đưa ra trên con đường dẫn đến mục tiêu và giống như các vấn đề về điều khiển và tối ưu hóa bằng rô-bốt (ví dụ: “học cách đi ngang qua phòng”), các quyết định sớm trong trình tự xác định những gì có thể được thực hiện sau đó. Có nghĩa là, chúng làm cho các hành động của bạn phụ thuộc vào đường đi, giống như một nước đi sớm trong một trò chơi cờ vua loại trừ một số nước đi sau đó trong một trò chơi cờ vua. Sự kết hợp của những cách tiếp cận này có nghĩa là RL sâu có thể giành chiến thắng trong trò chơi và làm chủ môi trường thế giới thực bởi vì nó có nghĩa là AI có thể vừa nhìn thấy vừa hành động theo những gì nó nhìn thấy một cách chiến lược. Học sâu cần nhiều dữ liệu và thường được sử dụng cho các quyết định một lần, chẳng hạn như “những đối tượng nào trong hình ảnh này?” Nhưng cũng như bất kỳ công nghệ tiềm năng cao nào, có nhiều vấn đề cần giải quyết trước khi RL có thể được triển khai rộng rãi. Khám phá các hạn chế của Deep RL Để huấn luyện mạng nơ-ron thực hiện nhận dạng hình ảnh, tất cả những gì bạn cần là hình ảnh có nhãn. Ai đó phải đặt tên cho thứ được mô tả trong các pixel và mạng nơ-ron có thể học cách dự đoán tên từ các pixel. Tìm người để gắn nhãn cho ảnh của bạn thường dễ dàng và bạn có thể thuê họ trên Scale hoặc Mechanical Turk. Khi bạn đào tạo một thuật toán học tăng cường, bạn cần hiểu toàn bộ hệ thống mà thuật toán phải điều hướng khi nó tìm kiếm mục tiêu của nó. Trò chơi điện tử tương đối dễ dàng, vì một vài lý do khác nhau: Chúng là môi trường kỹ thuật số hoàn chỉnh. tốt cho RL cũng cho chúng ta biết một số lý do tại sao RL phải đối mặt với những thách thức khi nó được áp dụng vào các vấn đề trong thế giới thực. Thế giới thực hầu hết không được số hóa. Có nghĩa là, không có bản sao kỹ thuật số nào tồn tại cho hầu hết các tình huống, tương tác và hành vi trong thế giới thực và thường không có cảm biến nào để thuật toán tìm ra điều gì đang xảy ra. Vì lý do riêng tư, đó có lẽ là một điều tốt, nhưng đào tạo một AI để giải quyết một vấn đề trong không gian vật lý, đó là một hạn chế. AI không có dữ liệu cũng hữu ích như máy nướng bánh mì không cần điện. Các API của thế giới thực – cách chúng ta quan sát nó và hành động dựa trên nó – không sạch sẽ. Các giác quan của chúng ta cho chúng ta biết những gì đang xảy ra trong môi trường xung quanh ngay lập tức của chúng ta, nhưng ngay cả những thứ đó chỉ có thể quan sát được một phần, và chúng ta phải suy luận rất nhiều từ những gì chúng ta có thể cảm nhận được. Ví dụ, tôi có thể nghe thấy tiếng bước trong phòng bên cạnh và phải đoán xem ai đang đi qua sàn. Dữ liệu IoT nổi tiếng là lộn xộn. Cũng giống như các giác quan của chúng ta, các cảm biến mà máy móc dựa vào để điều hướng thế giới có thể tạo ra rất nhiều lỗi. Diễn giải dữ liệu cảm giác có nghĩa là liên tục lọc ra tiếng ồn để xem liệu còn tín hiệu nào không. Hãy suy nghĩ một chút về các thao tác có sẵn trên bảng điều khiển trò chơi điện tử, sau đó so sánh các thao tác đó với các hành động bạn cần thực hiện để đi ngang qua phòng và chọn một tách trà (hoặc phức tạp hơn là tìm một công việc mới). Các quyết định mà chúng ta thực hiện trong cuộc sống thực để đạt được mục tiêu của mình rất phức tạp và cái gọi là không gian hành động, hoặc mảng lựa chọn mà chúng ta có, dường như không giới hạn. Thật khó để học cách đưa ra quyết định đúng đắn khi đối mặt với sự lựa chọn không giới hạn. Rất nhiều thứ làm cho thế giới tích tắc là vô hình đối với chúng ta. Chúng ta không nhìn thấy những gì đã xảy ra, chứ đừng nói đến việc hiểu được chuỗi nhân quả của các sự kiện. Điều này cũng đúng với các thuật toán. Họ không thể nhìn thấy mọi thứ hoặc biết điều gì dẫn đến điều gì. Đó là điều họ phải vượt qua khi chúng tôi yêu cầu họ đưa ra quyết định phải làm gì tiếp theo. Đây là một số thách thức với việc áp dụng RL vào thế giới thực. Bạn thường cần xây dựng một bản sao kỹ thuật số của hệ thống mà bạn muốn đạt được mục tiêu của mình – đôi khi chúng được gọi là cặp song sinh kỹ thuật số, những lần khác chúng được gọi là mô phỏng. Bạn có thể không có dữ liệu cho phép bạn xem những gì đang diễn ra trong thế giới đó và nếu bạn có dữ liệu, nó có thể không sạch. Và cuối cùng, có thể khó học được những hành động dẫn đến thành công, nếu thực sự có tồn tại. Với tất cả những gì đã nói, RL sâu cực kỳ hiệu quả trong việc đạt được mục tiêu trong thế giới thực, trong những tình huống mà nó có quyền truy cập vào dữ liệu và có thể kiểm tra các quyết định của mình về môi trường. Những cải tiến mà RL thể hiện trong những trường hợp đó tương tự như những cải tiến mà các thuật toán của DeepMind đã thể hiện trong trò chơi cờ vây. Nó làm chủ chúng theo những cách mà con người không làm được. Do đó, nó có tiềm năng cách mạng hóa toàn bộ các ngành công nghiệp. Đánh giá đạo đức Điều này dẫn đến câu hỏi về đạo đức. Tôi không tin rằng các đạo đức riêng biệt tồn tại đối với AI, trái ngược với các công nghệ khác và các lựa chọn của người vận hành chúng. Phần lớn đạo đức AI, như nó được thực hiện, là một lá sung để giảm bớt những lời chỉ trích khỏi các hành động và lựa chọn mà một công ty hoặc chính phủ đang thực hiện độc lập với công nghệ. Và, với một vài trường hợp ngoại lệ, đây là một chương trình việc làm dành cho những người không thể tự xây dựng AI hoặc hiểu sâu về nó, nhưng vẫn muốn chọn công nghệ mới và mạnh mẽ. Thật không may, chúng sẽ ảnh hưởng đến các chính sách của chính phủ cũng như chúng kích thích nỗi sợ hãi của công chúng. Tổ hợp công nghiệp đạo đức AI là một cái cớ tốt như bất kỳ cái cớ nào để đổ những ý kiến ​​đã có từ trước về chủ nghĩa tư bản và công nghệ vào một cái lọ mới. Chúng tôi không có đạo đức riêng cho ô tô hoặc ốc vít. Chúng ta có những cách suy nghĩ về mức độ gây ra hoặc khả năng gây ra tác hại. Nhưng, bây giờ chúng ta không cần phải phát minh lại kỷ luật đạo đức mà nó áp dụng cho các mô hình thống kê lớn. Một lý do bổ sung khiến đạo đức AI hầu như vô ích là mọi công nghệ đều đóng vai trò của nó, bất kể chúng ta làm gì để ngăn chặn nó. Trong điều kiện cạnh tranh địa chính trị và doanh nghiệp tư bản, một người nào đó ở đâu đó sẽ tiếp tục làm việc trên hầu hết mọi công nghệ mang lại lợi thế cho họ, cho dù những người chuyên nghiệp có nói gì đi chăng nữa. Thật vậy, mỗi cuộc xung đột lớn đều dẫn đến một công nghệ mới lớn. Thế chiến I đã cho chúng ta máy bay chiến đấu, Thế chiến II cho chúng ta bom hạt nhân, và cuộc chiến tranh mạng đang diễn ra có thể sẽ cho chúng ta một trí tuệ siêu việt trong bối cảnh phát triển vũ khí ngày càng leo thang. Tôi có nghĩ rằng chúng ta nên vượt qua vòng pháp luật không? Nếu trí tuệ siêu việt có thể phát sinh từ sự kết hợp của toán học, mã lệnh và máy tính, thì tôi không nghĩ rằng việc viết luật về nó sẽ hiệu quả. Thay vì tranh luận về đạo đức, hãy nói về việc hạn chế rủi ro ngắn hạn của RL sâu, ít nhất là trong khoảng thời gian ân hạn này chúng ta có trước khi một siêu trí tuệ ra đời. RL sâu có thể đưa ra các quyết định tuần tự trong một không gian phức tạp để đạt được mục tiêu. Một cách mà nó có thể làm điều này là điều khiển robot. Giờ đây, robot có thể chia sẻ không gian với chúng ta và chúng có thể làm tổn thương chúng ta nếu chúng đi quá nhanh. Vì vậy, một cách dễ dàng để làm cho các rô-bốt trong phạm vi tự do an toàn hơn là sử dụng giới hạn tốc độ được mã hóa cứng. Một vấn đề quan trọng khác trong việc triển khai RL sâu liên quan đến các loại quyết định mà chúng tôi cho phép nó thực hiện. Khi nó được triển khai đến chiến trường, chúng ta cần có con người bóp cò, giống như chúng ta làm với máy bay không người lái bây giờ. Điều đó dẫn chúng ta trở lại đạo đức cũ mà chúng ta luôn có. Hiểu Tiềm năng Thực sự Hầu hết các đổi mới của Thung lũng Silicon đều được áp dụng cho Internet người tiêu dùng và phần mềm dựa trên web. Điều đó làm cho Internet trở thành một nơi tuyệt vời, nhưng chúng ta không chỉ trực tuyến, bất kể chúng ta nhìn vào bao nhiêu màn hình. Để đạt được tiến bộ trong các vấn đề khó, vật lý, bạn phải tập trung và nỗ lực tương tự vào việc chế tạo và vận chuyển các vật thể. Trong sản xuất và hậu cần, mọi thứ không thay đổi theo tốc độ của mã. Rất nhiều tiềm năng của RL sâu là trong thế giới thực, điều khiển robot, phương tiện và các phần cứng khác. Khi RL sâu được triển khai, chúng ta sẽ thấy hiệu quả thu được (làm được nhiều hơn với ít hơn), đây là một trong những cách chống biến đổi khí hậu bị đánh giá thấp. Và RL sẽ hoạt động không chỉ trên quy mô của một robot riêng lẻ đang nhặt đồ vật, mà của toàn bộ hệ thống, nơi các đội xe, cần cẩu và cánh tay robot phải được điều phối và có thể học cách làm việc theo nhóm. Thay vì hoạt động như một bộ não riêng lẻ, RL có tiềm năng đóng vai trò như một tháp điều khiển cho một nhóm các diễn viên, các nhóm chỉ đạo liên kết với nhau vì sự phức tạp. Nghe có vẻ nhàm chán, nhưng nơi đầu tiên điều này sẽ tác động đến thế giới vật chất của kinh doanh là trong lịch trình của nó, vũ đạo của chủ nghĩa tư bản. Đơn hàng nào nhà máy nên xử lý tiếp theo? Cái gì được tạo ra khi nào bằng máy móc nào và với số lượng bao nhiêu là một bài toán khó giải đối với hàng trăm nghìn công ty trên toàn thế giới. Sự chậm trễ trong thời gian ngắn của dòng hàng hóa quan trọng có thể dẫn đến sự đổ vỡ lớn trong chuỗi cung ứng, như chúng ta đã thấy ở Kênh đào Suez. Tóm lại, deep RL là một công nghệ đột phá giúp giải quyết rất nhiều vấn đề hóc búa mà trước đây chúng tôi không thể giải quyết được. Giống như tất cả các công nghệ mạnh mẽ khác, nó là con dao hai lưỡi, vì vậy chúng ta phải suy nghĩ về cả tác hại và lợi ích mà nó tạo ra. Các yêu cầu của Deep RL gây khó khăn cho việc thiết lập ban đầu vì nó học tốt nhất trong các mô phỏng nơi nó có thể kiểm tra nhiều quyết định mà không sợ hậu quả thảm khốc trong thế giới thực. Một trong những lĩnh vực chính của các ứng dụng RL sâu sẽ là sản xuất toàn cầu và chuỗi cung ứng vì những lĩnh vực đó đã phải điều phối công việc của nhiều máy móc với nhau để tối ưu hóa hiệu suất của chúng. Tiểu sử: Chris Nicholson là người sáng lập Pathmind, một công ty khởi nghiệp về AI áp dụng phương pháp học tăng cường sâu vào chuỗi cung ứng và các hoạt động công nghiệp. Pathmind được thành lập để giúp các doanh nghiệp xử lý sự thay đổi kinh tế sâu sắc và tăng khả năng phục hồi hoạt động của họ với AI. Chris giám sát tầm nhìn chiến lược và quá trình thực thi hàng ngày của công ty, thúc đẩy sự đổi mới và tăng trưởng cho nền tảng công nghệ của Pathmind, đồng thời tối ưu hóa hiệu suất trong kho hàng và trên tầng nhà máy như một phần của quá trình chuyển đổi kỹ thuật số trong kinh doanh, Kênh xã hội: https: // twitter. com / chrisvnicholson https://www.linkedin.com/in/chrisvnicholson https://twitter.com/PathmindAI https://www.linkedin.com/company/pathmind-inc https://www.facebook.com/ PathmindAI https://www.youtube.com/channel/UC1ULB0BBaaCjeuDWHgK2qpQ Bởi Chris Nicholson, Giám đốc điều hành của Pathmind

  • Trang chủ
  • Trí tuệ nhân tạo
  • Chuyên viên phân tích kinh doanh
  • Thông tin kinh doanh
  • Khoa học dữ liệu
  • Back to top button