Artificial intelligence

Làm thế nào để các nhà khảo cổ bẻ khóa mã của các ngôn ngữ đã chết?

Cho đến 200 năm trước, không ai trong thời kỳ hiện đại có thể hiểu được chữ tượng hình Ai Cập; tiếng Ai Cập cổ đại về cơ bản là một ngôn ngữ đã mất. Việc các nhà sử học hiện nay có thể đọc và hiểu các chữ khắc bằng chữ tượng hình là do một hành động năng lực khảo cổ liên quan đến một văn bản pháp lý cổ xưa nhưng khá tầm thường được đục trên một phiến đá nổi tiếng thế giới. Roland Enmarch, giảng viên cao cấp về Ai Cập học tại Đại học Liverpool, Vương quốc Anh cho biết: “Năm tới đánh dấu kỷ niệm hai năm của giải mã Rosetta, đây thực sự là một thời điểm quan trọng đối với Ai Cập học. “Đó là một tạo tác dịch thuật nổi tiếng nhất.” Hòn đá Rosetta, một bản khắc của một tuyên ngôn được ban hành vào năm 196 trước Công nguyên, tỏ ra rất hữu ích trong việc giải mã các chữ tượng hình của Ai Cập vì sắc lệnh được lặp đi lặp lại ba lần. Chữ đầu tiên được viết bằng chữ tượng hình và chữ thứ hai bằng chữ ma quỷ, một dạng chữ thảo của người Ai Cập cổ đại có phong cách tương tự như chữ viết Ả Rập. Phiên bản thứ ba là bằng tiếng Hy Lạp cổ đại. Bởi vì tiếng Hy Lạp cổ đại đã được hiểu, điều này cung cấp một lộ trình để giải mã tiếng Ai Cập cổ đại. Enmarch nói: “Nếu bạn có một kịch bản song ngữ và một trong số chúng bằng ngôn ngữ mà bạn hiểu thì điều đó thực sự hữu ích miễn là nội dung của văn bản lặp lại. Sử dụng kỹ thuật này, bạn có thể thấy nơi các phần tái hiện và dịch các bit đó. Đáng buồn thay, bản dịch kết quả của phiến đá Rosetta không tiết lộ bất cứ điều gì đặc biệt kinh thiên động địa – nó chỉ là một đoạn văn bản hành chính để đánh dấu kỷ niệm năm thánh của một vị vua, nhưng nó đã cung cấp phương tiện để hiểu các văn bản khác, thú vị hơn. Một cách khác để hồi sinh một ngôn ngữ đã chết từ lâu là thông qua xử lý dữ liệu cơ bản. Enmarch nói: “Có một số viên đất sét từ khoảng 1450-1200 trước Công nguyên đã được đào lên ở Hy Lạp và trong nhiều thập kỷ, mọi người đã cố gắng tìm hiểu xem họ đã nói cái quái gì. Ngôn ngữ này được gọi là “tuyến tính B” và nó có trước bảng chữ cái Hy Lạp và vì vậy hầu hết các nhà sử học đồng ý rằng nó có lẽ là một ngôn ngữ riêng biệt hoàn toàn. Tuy nhiên, các nhà giải mã từng làm việc để bẻ khóa mật mã Enigma của Đức trong Thế chiến II đã có thể giải mã tuyến tính B bằng cách giả định rằng nó thực sự là tổ tiên của tiếng Hy Lạp. Họ xem xét các mẫu biến thể trong tập lệnh để xem liệu điều đó có thể cung cấp manh mối hay không. Một số chuỗi ký hiệu nhất định chỉ xuất hiện trên các bảng được tìm thấy trên đảo Crete, nhưng không xuất hiện trên những bảng được phát hiện trên đất liền Hy Lạp. Điều này khiến các nhà giải mã cho rằng các chuỗi do đó là địa danh trên đảo, điều này hóa ra là đúng. Từ suy luận này, họ đã có thể làm việc ngược lại để dịch toàn bộ văn bản. Enmarch nói: “Đây là ví dụ nổi tiếng duy nhất về thành công khi sử dụng phương pháp này. Có những nỗ lực để làm cho việc dịch các ngôn ngữ cổ trở thành một mục tiêu hiện đại hơn. Các nhà nghiên cứu tại Đại học Macquarie ở Australia đã hợp tác với các chuyên gia từ Google để sử dụng trí thông minh nhân tạo với mục đích đẩy nhanh quá trình dịch chữ tượng hình Ai Cập cổ đại sang tiếng Anh và tiếng Ả Rập. “Điều mà cỗ máy làm tốt là nhận ra đâu là chữ tượng hình và đâu là không có. Điều đó không hề tầm thường vì nó có nghĩa là cỗ máy không chỉ nhìn thấy gobbledygook, ”Camilla Di Biase-Dyson, giảng viên môn Ai Cập học tại Đại học Macquarie, người tham gia dự án cho biết. “Vấn đề là nó không dựa trên rất nhiều dữ liệu đào tạo. Để chụp một bức ảnh về bức tường lăng mộ Ai Cập và dịch nó một cách nhanh chóng, máy sẽ cần thêm rất nhiều dữ liệu ”. Hiện tại, phần mềm vẫn cần rất nhiều đầu vào của con người để đảm bảo kết quả cuối cùng là một bản dịch đáng tin cậy, nhưng nếu phần mềm tiếp xúc với đủ dữ liệu mẫu, có thể phần mềm không cần sự trợ giúp của con người trong tương lai.

Back to top button