GÜNDEM

Yapay Zeka:1980 Oyunlarını Tamamladı

Bilim adamları, 1980’lerin çeşitli keşif oyunlarında ustalaşabilen ve kendi kendine yeten robotların yolunu açan bir bilgisayar programı geliştirdiler.

Pitfall gibi klasik Atari oyunlarını tamamlayabilen bir algoritma ailesi (bir problemi çözmek için yazılım tabanlı talimatlar) oluşturdular.

Daha önce, bu kaydırmalı platform oyunlarının yapay zeka (AI) kullanılarak çözülmesi zordu.

Algoritmalar, robotların gerçek dünya ortamlarında daha iyi gezinmesine yardımcı olabilir.

Bu algoritmalar, robotik ve yapay zeka alanlarında temel bir zorluk olmaya devam ediyor. Söz konusu ortam türleri, robotların hayatta kalanları aramak için gönderilebileceği felaket bölgeleri veya sıradan bir ev olabilir. Dolayısıyla yapay zeka tüm koşullara hazır olmalı.

Bu çalışma, pekiştirmeli öğrenme olarak bilinen bir yapay zeka (AI) araştırma alanına giriyor.

Araştırmada kullanılan bu eski oyunlar, oyuncunun ödüller, engeller ve tehlikeler içeren labirentleri keşfetmesini konu alıyor. Kategorisi Go-Explore olarak bilinen algoritma ailesi, 1984’te piyasaya sürülen Montezuma’s Revenge, Freeway (1981) ve yukarıda bahsedilen Pitfall (1982) gibi oyunları çözme girişimlerinde önemli iyileştirmeler sağladı.

Araştırmacıların algoritmanın çalışma şeklini daha önce ziyaret ettikleri alanların arşivlerini oluşturan ve bunları hızlıca karşılaştırıp birleştirebilen algoritmalar olarak açıklıyor.

Montezuma’nın İntikamı (Montezuma’s Revenge) bir algoritmanın çözmesi için oldukça zor bir oyun.

Araştırmacılar Adrien Ecoffet, Joost Huizinga ve Jeff Clune, e-posta yoluyla gönderilen sorulara yanıt olarak, “Yöntemimiz gerçekten oldukça basit ve anlaşılır, ancak neredeyse tüm bilimsel buluşlarda durum böyle.”

“Yaklaşımımızın daha önce başarılı olamamasının nedeni, tarihi olarak pekiştirmeli örnek almak için kullanılan Başkentten güçlü bir sekilde farklı, bu yaklaşım ‘içsel motivasyon’ olarak adlandırılır. yapan ajan, yeni keşfetme karşılığını alıyor. “

İçsel motivasyon yaklaşımıyla ilgili bir sorun, algoritmanın bir çözümü, hala keşfedilmesi gereken vaat eden alanları “unutabilmesidir”. Bu “müfreze” olarak bilinir.

Ekip, bunun üstesinden gelmenin bir yolunu buldu: Ziyaret ettiği alanların arşivini derleyerek, daha fazla bilgi için bir nokta olarak oyunun gelecek vaat eden bir ara aşamasına geri dönebilir.

Ancak bu oyunlarda ustalaşmak için önceki yaklaşımlarda başka bir sorun vardı. Bilim adamları farklı basın mecralarına verdikleri demeçte, “O an keşfedilmesi gereken ortamlara girdiklerinde bile hala kodlanmış veri ve tepkilerle hareket etmeye çalışılıyordu.” dedi.

“Eylemlerinizin doğru ve kesin olması gereken bir ortamdaysanız, örneğin sizi anında öldürebilecek pek çok tehlikeye sahip bir oyun gibi, bu tür rastgele eylemler gerçekten ulaşmak istediğiniz alana ulaşmanızı engelleyebilir.”

Bunun teknik terimi “raydan çıkma” dır.

Prestijli dergi Nature’da anlatılan yeni yöntem, raydan çıkma sorununu, daha önce ziyaret edilen bölgelere dönme sürecini yenilerini keşfetme sürecinden ayırarak çözüyor ve bunları farklı şekillerde ele alıyor.

Kaliforniya’daki Uber AI Labs’ta çalışan ekip üyeleri, çalışmanın evde veya endüstriyel ortamlarda robotlara rehberlik etmek için kullanılan algoritmalara katkıda bulunduğunu söyledi.

Go-Explore’un pekiştirmeli öğrenme yöntemini uzun süredir devam eden sorunları çözmek için tasarlandığını söylüyorlar. “Bir robottan size bir kahve ısmarlamasını istemeyi düşünün: Kahve makinesini sadece basitçe kodlanmış komutlarla çalıştırıp kahve almasının imkanı yok.”

Bilim adamları şunları ekledi: “Robot teknolojisine ek olarak, Go-Explore’un, metin tabanlı bir oyunu keşfederek kelimelerin anlamını öğrendiğini veya otonom araçların davranışlarındaki potansiyel hataları keşfetmeye yönelik, bazı deneysel araştırmalarda kullanıldığını gördük.”

Makanoucchi

PC donanım meraklısı. Teknoloji, anime ve PC oyunlarına tutkulu. HardwareTurk aracılığı ile teknolojik gelişmeleri sizin için yorumluyor.

İlgili Makaleler

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Başa dön tuşu