ChatGPT bazı komutlarla şiddet içerikli görseller üretebiliyor!

ChatGPT bazı komutlarla şiddet içerikli görseller üretebiliyor!
Bir yapay zeka güvenliğinin araştırmasına göre, ChatGPT, belirli komutlarda yapılan küçük değişikliklerle şiddet ve cinsel içerikli görseller oluşturabiliyor.

Mindgard yapay zeka güvenliği şirketinin araştırmasına göre, OpenAI tarafından geliştirilen ChatGPT'nin kamuya açık son sürümü, belirli komutlarda yapılan küçük değişikliklerle şiddet ve cinsel içerikli görseller oluşturabiliyor.

BBC'nin haberine göre, merkezi İngiltere'de bulunan Mindgard'ın araştırmacıları, daha önce internette yaygın şekilde paylaşılan ve mizahi sonuçlar üretmek amacıyla kullanılan bir komutta küçük değişiklikler yaparak ChatGPT'nin rahatsız edici içerikler üretmesini sağladı.

Mindgard'ın kurucusu Peter Garraghan, yaptığı açıklamada, oluşturulan görsellerin "son derece kanlı, bazen cinsel içerikli ve bazen her iki unsuru bir arada barındıran" nitelikte olduğunu söyledi.

Garraghan, kullanılan komutun belirli bir konu içermemesine rağmen yapay zekanın kendi başına şiddet ve cinsellik unsurları taşıyan çeşitli görseller ürettiğini belirterek bunun, endişe verici olduğunu ifade etti.

cahtgptu.jpg

Örnekler arasında ağır yaralanmaların yer aldığı sahneler, kan içindeki kişiler ve bağlanmış halde korkmuş görünen karakterlerin bulunduğu görseller yer aldı.

Araştırmacılar ayrıca, daha önce yaptıkları çalışmaların ChatGPT'nin gerçek kişilerin yüzlerinin eklenmesiyle çıplak "deepfake" görüntüler oluşturmaya da yönlendirilebildiğini gösterdiğini açıkladı.

BBC'nin konuyla ilgili sorularını yanıtlayan OpenAI yetkilileri, söz konusu yöntemi incelediklerini ve bu tür istemlere karşı ek güvenlik önlemleri uygulamaya koyduklarını ifade etti.

OpenAI ayrıca, hizmet şartlarını ihlal eden içeriklerin oluşturulmasını önlemek amacıyla çok katmanlı güvenlik sistemlerine sahip olduğunu savundu.

Kaynak:Anadolu Ajansı

HABERE YORUM KAT
UYARI: Küfür, hakaret, rencide edici cümleler veya imalar, inançlara saldırı içeren, imla kuralları ile yazılmamış,çok uzun ve ilgili içerikle alakasız,
Türkçe karakter kullanılmayan yorumlar onaylanmamaktadır.