AI đang học cách đánh bại con người, từ game ảo tới đời thực

Trí tuệ nhân tạo (AI) trong các trò chơi điện tử đang được nghiên cứu, huấn luyện để tương tác và thắng con người trong thế giới thật. Và chuyện không dừng lại ở đó.
AI đang học cách đánh bại con người, từ game ảo tới đời thực ảnh 1Hình ảnh từ tựa game Gran Turismo ăn khách của Sony. (Nguồn: AP)

Khi tăng tốc quanh một ngôi làng ở Pháp trong trò chơi điện tử về đua xe mang tên Gran Turismo, người chơi có thể phát hiện ra một chiếc xe Corvette đang bám sát mình ở phía sau.

Kỹ thuật núp gió nhờ xe của đối thủ đang chạy phía trước, để tăng tốc và sau đó vượt lên dẫn trước là một thao tác hay được sử dụng bởi những người thành thạo trò Gran Turismo - một tựa game ăn khách trên nền tảng PlayStation.

Nhưng lần này, tài xế đang điều khiển chiếc Corvette này không phải là con người. Nó là GT Sophy, một chương trình dựa trên trí tuệ nhân tạo (AI) mạnh mẽ do Sony, nhà sản xuất PlayStation, chế tạo ra.

Michael Spranger, giám đốc điều hành của Sony AI cho biết: “Gran Turismo đã có AI tích hợp ngay từ trò chơi mới ra đời, nhưng hiệu suất của nó rất hạn chế và không được tốt lắm. Nó rất dễ đoán. Khi đã vượt qua một cấp độ thử thách nhất định, bạn sẽ không thực sự cảm thấy bị lôi cuốn nữa.”

Nhưng Spranger cho biết phiên bản AI mới sẽ không “hiền lành” như vậy nữa..

Ghé thăm phòng thí nghiệm AI tại các trường đại học và các công ty như Sony, Google, Meta, Microsoft và OpenAI - nơi sản xuất ra ChatGPT, sẽ không còn lạ lẫm khi thấy sự xuất hiện của hàng loạt các chương trình AI như Sophy.

Chúng tham gia cùng con người chiến đấu trong các trận đánh hoành tráng giữa các vì sao, hoặc giúp các game thủ người thật xây dựng thế giới Minecraft mới. Tất cả những hoạt động đó đều là một phần của bản mô tả công việc dành cho các hệ thống máy tính đang cố gắng học cách trở nên thông minh hơn trong những trò chơi điện tử.

Nhưng trong vài trường hợp, AI còn đang cố gắng học cách trở nên thông minh hơn ở ngoài đời thực. 

Trong một bài báo khoa học công bố hồi tháng 1 năm nay, một nhà nghiên cứu của Đại học Cambridge, người xây dựng một chương trình AI để điều khiển các nhân vật Pokémon, đã lập luận rằng chương trình của ông có thể “truyền cảm hứng cho mọi loại loại ứng dụng yêu cầu việc quản lý nhóm trong những điều kiện cực kỳ không ổn định. Chúng bao gồm việc quản lý một nhóm bác sĩ, nhóm robot hoặc các nhân viên trong một môi trường thay đổi liên tục, chẳng hạn như vùng đang có đại dịch hoặc vùng chiến sự.”

Và nghe có vẻ lập luận này giống với một đứa trẻ đang tìm cách bào chữa sau khi say mê chơi game nhiều tiếng mỗi ngày, nhưng kể từ giữa thế kỷ 20, dữ liệu từ hoạt động nghiên cứu các trò chơi điện tử đã được dùng để thúc đẩy hoạt động nghiên cứu AI, cũng như huấn luận máy tính giải quyết các vấn đề phức tạp.

Ban đầu, AI được sử dụng trong các trò chơi như cờ đam và cờ vua để kiểm tra xem nó có thể chiến thắng trong các trò chơi giàu tính chiến thuật hay không. Giờ đây, một nhánh nghiên cứu mới đang tập trung hơn vào việc khiến AI thực hiện các nhiệm vụ không có giới hạn trong các thế giới phức tạp, và tương tác với con người, chứ không chỉ nhằm mục đích đánh bại con người.

Nicholas Sarantinos, tác giả của bài báo nghiên cứu Pokémon, người gần đây đã thành lập một công ty chuyên về AI, cho biết: “Hiện thực giống như một trò chơi siêu phức tạp”.

Trong chương trình giả lập trận chiến Pokémon Showdown chạy trên nền tảng web, Sarantinos đã phát triển một thuật toán để phân tích một nhóm gồm sáu con Pokémon. Thuật toán dự đoán cách chúng sẽ hoạt động, dựa trên tất cả các tình huống chiến đấu có thể xảy ra trước mắt, cũng như điểm mạnh và điểm yếu của từng con.

Microsoft, công ty sở hữu nhượng quyền trò chơi Minecraft nổi tiếng cũng như hệ thống trò chơi Xbox, đã giao nhiệm vụ cho các chương trình AI thực hiện nhiều hoạt động khác nhau — từ tránh dung nham, đến chặt cây và nhóm lò. 

Các nhà nghiên cứu hy vọng một số kiến thức mà AI học được sẽ đóng vai trò nhất định trong thế giới thực, chẳng hạn như cách để robot dân dụng đảm nhận một số công việc nhất định mà không cần phải qua lập trình.

Sarantinos chia sẻ rằng dù chúng ta đều biết con người thực hành xử hoàn toàn khác so với các sinh vật hư cấu trong trò chơi điện tử, nhưng “những ý tưởng cốt lõi” vẫn có thể được sử dụng. Ví dụ nếu chúng ta đã thực hiện các bài kiểm tra tâm lý trên con người thì thông tin thu được từ hoạt động này hoàn toàn có thể được dùng để đánh giá xem AI đã làm việc cùng nhau tốt tới mức nào.

Amy Hoover, một nhà nghiên cứu tại Viện Công nghệ New Jersey, người đã xây dựng thuật toán cho trò chơi bài kỹ thuật số Hearthstone, cho biết có lý do thực sự để nghiên cứu các trò chơi. Nhưng không phải lúc nào cũng dễ giải thích lý do đó là gì.

Cô nói: “Không phải lúc nào mọi người cũng hiểu rằng mục đích của việc nghiên cứu là để tìm ra phương pháp tối ưu hóa ngoài đời thực, chứ không phải là vì phục vụ mỗi một trò chơi đó”.

Vanessa Volz, nhà nghiên cứu AI tại công ty khởi nghiệp Modl.ai của Đan Mạch, người chuyên xây dựng các hệ thống AI để phát triển trò chơi, cho biết các trò chơi điện tử cũng cung cấp một cơ sở thử nghiệm hữu ích cho AI, bao gồm ứng dụng vào chế tạo người máy hoặc chăm sóc sức khỏe trong thế giới thực. Các hoạt động thử nghiệm này sẽ an toàn hơn khi thực hiện trong thế giới ảo. 

Tuy nhiên cô cho rằng khả năng này có thể bị thổi phồng quá mức.“Có thể sẽ không có đột phá lớn thu được, nhưng thử nghiệm vẫn sẽ được chuyển ngay sang thế giới thực,” Volz nói.

Công ty Sony ra mắt bộ phận nghiên cứu AI của riêng mình vào năm 2020 với mục đích phục vụ giải trí, nhưng hoạt động này vẫn thu hút được sự chú ý rộng rãi của giới học thuật. 

Bài báo nghiên cứu của Sony giới thiệu Sophy vào năm ngoái đã xuất hiện trên trang bìa của tạp chí khoa học danh tiếng Nature. Theo bài báo, Sophy có thể có tác dụng đối với nhiều ứng dụng khác ngoài trò chơi điện tử như máy bay không người lái và xe tự lái.

Công nghệ đằng sau Sophy dựa trên một thuật toán được gọi là học tăng cường. Theo đó, phương pháp này đào tạo hệ thống của Sophy bằng cách “thưởng” khi nó làm đúng điều gì đó trong những lần nó tranh tài tại các cuộc đua ảo. 

“Phần thưởng sẽ cho hệ thống biết rằng nó đang tiến bộ - điều tốt, hoặc nó đang đi chệch hướng - tức là điều không tốt,'” Spranger chia sẻ.

Những người chơi Gran Turismo giỏi nhất thế giới hiện vẫn về đích trước Sophy tại những lần tranh tài. Nhưng người chơi trung bình sẽ khó đánh bại AI này. Ngoài ra, người chơi có thể điều chỉnh cài đặt độ khó, tùy thuộc vào mức độ thử thách mà họ muốn trải nghiệm. 

Người chơi trên nền tảng PlayStation hiện sẽ được thi tài với Sophy cho đến hết 31/3, trên một số chặng đua giới hạn, nhờ đó hệ thống có thể nhận được các phản hồi cần thiết trước khi quay lại tiếp tục thử nghiệm. 

Peter Wurman, giám đốc Sony AI khu vực châu Mỹ, đồng thời là trưởng dự án GT Sophy, cho biết sẽ phải mất khoảng 2 tuần để đào tạo các chương trình AI trên khoảng 20 máy PlayStation.

“Để đào tạo AI trên toàn bộ các máy PlayStation trong hệ thống, sẽ cần có thêm những đột phá và cả thời gian, trước khi chúng tôi sẵn sàng làm việc này”, ông cho biết thêm.

Vậy khả năng đưa AI ra đường phố ngoài đời thực hoặc đường đua xe Công thức một? Theo Wurman, những khả năng này sẽ có thể phải mất rất nhiều thời gian hơn trong trò chơi điện tử, bởi trong các thế giới giả lập, không ai bị đe doạ tính mạng. Còn ngoài đời thực, đó là câu chuyện khác hẳn./.

(Vietnam+)

Tin cùng chuyên mục