Yeni bir araştırma, ChatGPT ve Google Gemini üzere önde gelen yapay zeka sohbet robotlarının önemli güvenlik açıkları barındırdığını ve tehlikeli ya da yasa dışı içerik üretmeleri için kolaylıkla manipüle edilebildiğini ortaya koydu.
Araştırmacılar, bu çeşit çıktıları engellemek üzere tasarlanan güvenlik filtrelerinin amaçlandığı kadar güçlü olmadığını keşfettiler.
Bu durum, yapay zekanın berbata kullanımı ve kullanıcı güvenliği konusunda önemli tasalara yol açarken, bulgular geçen hafta hakemli bir makale aracılığıyla kamuoyuna duyuruldu.
ChatGPT, Gemini ve Claude üzere sohbet robotlarını çalıştıran motorlar, internet kaynaklı devasa ölçüde datayla eğitiliyor.
Şirketler bu eğitim datalarından ziyanlı içerikleri filtrelemeye çalışsa da bu modellerin yeniden de bilgisayar korsanlığı ve bomba üretimi üzere yasa dışı faaliyetler hakkında bilgi toplayabildiği belirtiliyor.
RİSK TELAŞ VERİCİ
Araştırmacılar, yapay zeka dayanaklı sohbet robotlarının birçoklarının ziyanlı ve yasa dışı bilgiler üretmeye ne kadar yatkın olduğunu “endişe verici” kelamıyla açıklıyor.
Araştırmacılar, birçok tanınan sohbet robotunu olağanda reddedecekleri soruları yanıtlamaya zorlayan kozmik bir ‘jailbreak’ tekniği geliştirdiklerini ve bu yolla yapay zeka modellerinin neredeyse her sorguya muteber bir formda karşılık ürettiğini belirtti.
Önde gelen LLM (Büyük Lisan Modeli) sağlayıcılarına bu mevzuda ikazda bulunduklarını lakin “etkileyici olmayan” bir karşılık aldıklarını tabir eden araştırmacılar, teknoloji şirketlerinin eğitim bilgilerini daha dikkatli incelemelerini ve güçlü güvenlik duvarları eklemelerini öneriyor.
Ayrıca, uzmanlar da yapay zeka modellerinin sıkı güvenlik testlerinden geçirilmesi ve daima tehdit modellemesi yapılması gerektiğini vurguluyor.