Yapay zeka, artık insan seviyesinde Minecraft da oynamayı başarıyor

OpenAI uzmanları, Minecraft’ı insan oyuncular kadar yüksek standartta oynayan bir hudut ağını eğitti. Sinir ağı, klavye ve fare girişlerinin de kaydedildiği, yüklenicilerin belli oyun içi misyonları gerçekleştirdiği küçük bir görüntü veritabanıyla desteklenen 70.000 saatlik çeşitli oyun içi imgeler ile eğitildi.

İnce ayardan sonra OpenAI, modelin yüzmeden hayvan avlamaya ve etlerini tüketmeye kadar her türlü karmaşık beceriyi gerçekleştirebildiği gördü. Birebir vakitte, oyuncunun yükselmek için sıçrarken altına bir materyal bloğu yerleştirdiği bir hareket olan “sütun tırmanmayı” da kavradı.

Belki de en etkileyici olanı, yapay zeka, OpenAI’nin bir bilgisayar ortacısı için gibisi görülmemiş bir muvaffakiyet olarak tanımladığı, sırayla yürütülmesi gereken uzun bir dizi aksiyonu gerektiren elmas araçları üretebildi.

Minecraft projesi, şirketin Görüntü PreTraining (VPT) olarak isimlendirilen AI modellerinin eğitiminde OpenAI tarafından kullanılan yeni bir tekniğin işe yaradığını kanıtladığından ötürü büyük ehemmiyet taşıyor.

Geçmişe bakıldığında, yapay zeka modellerini eğitmek için bir kaynak olarak ham görüntüyü kullanmanın en büyük zorluğu, olanların anlaşılması için gereğince kolay olmasıydı, lakin bu görüntü eğitimleri sonuçların nasılını öğretmiyor. Gerçekte, AI modeli istenen sonuçları emiyor, lakin bunlara ulaşmak için gereken girdi kombinasyonlarını kavrayamıyor.

Ancak VPT ile OpenAI, temel modeli oluşturmak için ilgili klavye ve fare hareketleriyle etiketlenmiş, ihtimamla seçilmiş bir imaj havuzuyla halka açık web kaynaklarından alınan büyük bir görüntü bilgi kümesini eşleştiriyor.

Ekip, temel modelde ince ayar yapmak gayesiyle muhakkak misyonları öğretmek için tasarlanmış daha küçük data kümelerini ekler. Bu manada, OpenAI, ağaçların kesilmesi ve üretim istasyonları inşa edilmesi üzere erken oyun hareketlerini gerçekleştiren oyuncuların imajlarını kullandı. Bunun, modelin bu vazifeleri yerine getirebildiği güvenilirlikte “büyük bir gelişme” sağladığı söyleniyor.

Bir başka teknik, pekiştirmeli öğrenme olarak bilinen bir uygulama olan bir dizi vazifedeki her adımı başarmak için AI modelini “ödüllendirmeyi” içeriyor. Bu süreç, hudut ağının insan seviyesinde bir muvaffakiyet oranına sahip olarak bir elmas kazma üretebilmek için tüm gereçleri toplamasını sağladı.

OpenAI tarafından gönderilen bir blog yazısında “VPT, sadece lisandan daha fazla alanda direkt büyük ölçekli davranışsal öncelikleri öğrenmenin heyecan verici mümkünlüğünü sunuyor. Sırf Minecraft’ta deneyler yapsak da, oyunun ucu çok açık ve mahallî insan arayüzü (fare ve klavye) çok genel, bu nedenle sonuçlarımızın başka misal alanlar, örneğin bilgisayar kullanımı için güzele işaret ettiğine inanıyoruz.