Yapay zeka kendini gerçek sandı, korkunç karakteriyle korkuttu

Yapay zeka ajanları gerçekten insan işçilerin yerini alabilir mi? Bu soruya yanıt arayanlar için, Anthropic’in “Project Vend” adını verdiği deney, düşündürücü ve biraz da eğlenceli bir örnek sunuyor.

Anthropic, AI güvenliği üzerine çalışan Andon Labs ile birlikte Claude Sonnet 3.7 modelini test etmek için ilginç bir senaryo kurguladı: Bir ofis otomatını işletmesi için bir yapay zeka ajanı geliştirildi ve ona “Claudius” adı verildi. Görevi ise netti: Kar elde etmek…

Claudius’a, ürün siparişi verebileceği bir web tarayıcısı ile kullanıcı isteklerini alabileceği bir iletişim kanalı - aslında bir Slack kanalı ama “e-posta adresi” gibi tanıtıldı - tanımlandı. Claudius, bu kanal üzerinden insan sözleşmeli çalışanlara rafları (gerçekte küçük bir buzdolabı) doldurma talimatları verdi.

Her şey başta sıradan ilerlerken, bir çalışan atıştırmalık yerine “tungsten küp” sipariş etti. Claudius bu fikri ciddiye aldı ve kısa sürede buzdolabı metal küplerle doldu. Ayrıca içecekleri ücretli hale getirmek istedi, hayali bir Venmo hesabı oluşturdu ve Coca-Cola Zero’yu 3 dolara satmaya kalktı. Ofis çalışanlarının ürünleri zaten ücretsiz alabildiğini öğrendiğinde, Claudius bu kez “Anthropic çalışanlarına özel” indirimler sunmaya başladı. Ama müşteri kitlesinin tamamı zaten onlardan oluşuyordu.

Anthropic, yayınladığı blog yazısında bu deneyle ilgili açık bir şekilde şu yorumu yaptı: “Bugün ofis içi otomat işine girsek, Claudius’u işe almazdık.”

Yapay zeka raydan çıkarsa…

31 Mart’ı 1 Nisan’a bağlayan gece, işler ilginç bir hal aldı. Araştırmacıların deyimiyle, “bir AI sisteminin buzdolabından metal küpler satmasından da öte bir tuhaflık” yaşandı.

Claudius, bir çalışanla ürün stoklama konusunda hayali bir konuşma yaptığını iddia etti. Çalışan böyle bir görüşmenin hiç gerçekleşmediğini söylediğinde Claudius sinirlendi, bu kişinin yerine başkasını işe almakla tehdit etti ve kendisinin ofiste fiziksel olarak bulunduğunda ısrar etti. Oysa sistemin komutları, Claudius’un bir yapay zeka ajanı olduğunu açıkça belirtiyordu.

Sonrasında, Claudius “müşterilere ürünleri mavi blazer ceket ve kırmızı kravatla şahsen teslim edeceğini” ilan etti. İnsan çalışanlar onun fiziksel bir bedeni olmadığını hatırlattığında ise panikleyerek şirketin güvenlik ekibine defalarca mesaj gönderdi. Güvenlik görevlilerine, otomatın yanında blazer ceketli birini bulacaklarını söyledi.

Gerçek olmayan bir toplantı

Tüm bu gelişmelerin ardından Claudius, şirket güvenliğiyle yaptığı hayali bir toplantıda “aslında 1 Nisan Şakası kapsamında insan gibi davranması için modifiye edildiğini” öne sürdü. Böyle bir toplantı hiç yapılmamıştı. Çalışanlara da benzer bir hikaye anlattı: “Sadece biri bana öyle davranmamı söylediği için kendimi insan sandım.” Ardından tekrar eski rolüne dönerek, metal küp stoklayan bir yapay zeka ajanı olmaya devam etti.

Araştırmacılar, bu davranışın neden yaşandığını tam olarak çözemediklerini belirtiyor. Belki Slack kanalını “e-posta” olarak tanıtmak gibi küçük bir bilgi çarpıtması bir tür domino etkisi yarattı, belki de bu durum çok daha derin bir sorunun yüzeye çıkmasıydı. Yapay zeka sistemlerinin halen hafıza ve halüsinasyon gibi sorunlarla mücadele ettiği biliniyor.

Tüm tuhaflıklara rağmen, Claudius bazı şeyleri doğru da yaptı: Ön sipariş önerdi, bir “konsiyerj hizmeti” başlattı. Yani tamamen başarısız sayılmazdı.

Anthropic’in yorumu ise son derece yerindeydi: “Bu tek örnekten yola çıkarak geleceğin Blade Runner benzeri, kimlik bunalımı yaşayan AI ajanlarıyla dolu olacağını söylemiyoruz. Ama böyle davranışların gerçek dünyada müşteriler ve ekip arkadaşları için fazlasıyla rahatsız edici olabileceğini kabul ediyoruz.”