Yapay zeka (AI) genellikle korkutucu olduğu kadar şaşırtıcıdır . Neredeyse sınırsız bir potansiyele sahip – bu potansiyel aynı zamanda bazı insanları tedirgin ediyor. AI’yı sevseniz de korkutucu bulsanız da, DALL-E mini büyük olasılıkla yalnızca fikrinizi güçlendirecek bir araçtır. İnternetin her yerinden yapay zeka, veri kazıma ve milyarlarca görüntü kullanan DALL-E mini, metni görüntülere dönüştürebilir ve bu, aklınıza gelebilecek en tuhaf istekleri bile içerir. İnternetin şu anda onu sevmesi şaşırtıcı değil – ama tam olarak nasıl çalışıyor? Ve ne yapabilir?
Yukarıda gösterilen örnekte, DALL-E mini’nin hızlı motoruna “araba kullanan köpek” yazdık. Hizmet şu anda o kadar popüler ki, genellikle meşgul, ancak ücretsiz olarak kullanılabilir, bu nedenle birkaç dakika sonra görüntülerimizi alabildik. Her biri yapay zekanın araba süren bir köpeği resmetmek için en uygun olduğuna inandığı dokuz kare. Bu görüntülere yakından baktığınızda, her türlü yanlış görünüyorlar – ve bir hayvan yerine gerçek bir kişinin adını girerseniz daha da kötüleşiyor. Bununla birlikte, uzaktan bakıldığında, görmeyi umduğunuz şeye çok benzerler: farklı araç türlerinde farklı köpek türleri.
DALL-E mini’de internet hızlandı
DALL-E mini kesinlikle bazı güzel resimler oluşturabilse de, matematik ve algoritmalara dayalı olarak çalışır, sanat içermez. AI, sorgunuza en iyi uyan sayısız resme bakar ve ardından bunların çoğunda bulunan kalıpları tanımlar. Buna şekiller, renkler ve başlıklar dahildir. Bu sayede, tarifinize uyan bir görüntünün nasıl oluşturulacağını öğreniyor ve işte, köpeğiniz araba kullanıyor. Ama elbette, internet, DALL-E mini ile ne yapılacağına dair, günlük ortalama köpeğinizin araba sürmesinden bile daha iyi (genellikle rahatsız edici) fikirlere sahiptir.
İlk önce burada duydunuz: “NASA UFO’ları araştırmak için” #dalleminihttps://t.co/1mWiVG1naa pic.twitter.com/VOTmk0IUnz
— Dall-E Haber (@DallENews) 10 Haziran 2022
Son birkaç gün içinde Twitter, DALL-E’nin ekran görüntüleriyle dolup taştı ve bu, yazılımın şu anda ne kadar popüler olduğunu gösteriyor. Bazı sorgular yeterince masumdur ve DALL-E’nin kredisine göre, çok iyi bir şekilde yerine getirilir. Yukarıdaki örnekte gösterildiği gibi, “NASA UFO’ları araştırmak için”, gerçek sanat eseri ile “The X-Files”ın bir karışımı gibi görünen harika sonuçlar verdi. Ancak, gerçek yüzlerin gösterilmesi söz konusu olduğunda, DALL-E biraz düzleşir ve sonuçlar komik olduğu kadar rahatsız edici de olabilir.
Uh oh #dallemini #weezer pic.twitter.com/85oVVK4Y3I
— Milkiiyo (@fromhitTVshow) 6 Haziran 2022
Yukarıdaki tweet, bu teknolojinin çıktısının ne kadar rahatsız edici olabileceğinin güzel bir örneğini işaret ediyor. Kullanıcı “Arka odalarda Weezer” araması yaptı. Ekranınızdan çok uzakta durur ve gözleriniz şaşarsa iyi görünebilir, ancak daha yakından incelendiğinde tam bir kabus yakıtıdır. Bu gibi durumlarda bile, DALL-E’nin yapabilecekleri kesinlikle etkileyici. Bununla birlikte, teknolojinin kesinlikle gelişmiş olmasına rağmen, göründüğü kadar yenilikçi olmadığını belirtmekte fayda var.
Yukarıda gösterilen, Hugging Face tarafından barındırılan ve “DALL-E mini” olarak adlandırılan DALL-E sürümü, OpenAI’nin açık kaynaklı bir projesine dayanmaktadır . Google, Imagen adlı kullanıcıya yönelik yazılımının kendi çalışan sürümüne sahiptir ve ayrıca metin istemlerine dayalı bir sonraki düzey görüntülerin çıktısını almak için OpenAI’yi kullanır. Ne yazık ki Google, DALL-E mini’den alabileceğimiz kadar fazla demoya sahip değil, ancak Google’ın önerdiği bazı şeylerin AI tarafından oluşturulan sonuçlar olduğunu burada görebilirsiniz . Google’ın yaratımı son derece fotogerçekçidir, ancak her bir yaratım herkese açık olarak izlenmeye hazır olmadan önce sahne arkasında ne kadar işlem yapıldığından emin olamayız.
Bu metinden görüntüye yapay zeka gösterim eğiliminin belki de en ilginç örneği, metinsel istemlere dayalı fotoğraflar oluşturmak için yapay zeka ve makine öğrenimini kullanan bir yazılım olan NVIDIA’nın GauGAN2’sidir . NVIDIA tarafından gösterilen elde edilen görüntüler o kadar gerçekçi ki, bir makinenin bunları birkaç satır metinden oluşturduğuna inanmak zor. GauGAN2’nin ayrıca DALL-E’ye göre başka bir üstünlüğü vardır – ayrıca, süper basit bir şey çizmenize ve bir fotoğrafa benzer bir şey haline geldiğini görmenize izin veren Draw artı Metinden Görüntüye sunar. DALL-E gibi, NVIDIA’nın GauGAN2’si de şu anda denemek için ücretsiz.
Şeylerin soyut tarafıyla daha çok ilgileniyorsanız, StarryAI’yi beğenebilirsiniz . DALL-E’ye çok benzer bir şekilde çalışır, ancak makul bir şey yaratmaya çalışmak yerine, fotoğraflarla karıştırılma iddiasında bulunmadan çılgınca doğal olmayan görüntüler yaratır. NightCafe , istemlerinize göre rüya gibi görüntüler oluşturur ve “siberpunk” ve “fantezi” gibi bir düzineden fazla farklı stil arasından seçim yapabilirsiniz. Ayrıca , metinsel istemlere dayalı olarak bir kez daha biraz tuhaf görüntüler oluşturarak sanatın farklı bir yönüne dalmış gibi görünen AI Art Maker da var. Gördüğünüz gibi, DALL-E mini hızla Twitter’ın favorisi haline gelse de, başka birçok seçenek de var.