Yapay Zeka Görsel Oluşturucularını kıyaslayalım!

oyageron
24 Haz 2023
3 dakikada okunur

Sunum hazırlarken, iç iletişim posteri hazırlarken, ya da herhangi bir tasarım yaparken görselleri nereden buluyorsunuz?

Presentation Superpowers eğitiminde bu soruyu çok sorarım çünkü genelde cevap "google"dan olur, ya da Powerpoint'in kendi görselleri. Ben de ücretsiz stok görsel indirilebilecek siteleri gösterir, onları kıyaslarım. Bazılarında ücretli üyeliklerim de var. Görsel, ikon, video ihtiyacımı harika bir şekilde karşılıyorlar.

Tabi bu durum benim için üretken yapay zeka ile görsel oluşturan araçların hayatımıza girmesiyle biraz değişti. Aklımdaki görsele ulaşmak için belli anahtar kelimelerle stok görsel sitelerinde aramak yerine kendim yapmaya başladım. Aklımdakini tarif ediyorum, yani prompt yazıyorum. Hoop, 5 -10 saniyede karşımda. Beğenmedim mi, biraz promptu değiştiriyorum, hoop bir tane daha. O kadar çok ve hızlıca görsel üretebiliyorum ki bu sayede. (Buna aslında görsel tüketmek de denilebilir. )

Tabi görsel yaratmak ChatGPT'de metin yaratmak kadar kolay değil. Ama aynen ChatGPT'de olduğu gibi ihtiyacınızı çok net ve detaylı bir şekilde tarif etmelisiniz. Zaten aslında üretken yapay zeka hayatımıza girdiğinden beri bence en önemli konu bu oldu, ihtiyacını tarifleyebilmek, doğru soruları sorabilmek. Bir paradigma dönüşümü yaşıyoruz. Aradığına ulaşmak kolay gibi görünse de kolay olmayan ne istediğini tarifleyebilmek.

ChatGPT ya da dil modelleri özelinde bu konuyu detaylı olarak eğitimlerde, önceki newsletterlarda, youtube'da, linkedin postlarında anlatıyorum. O yüzden burada kısa kesip, görsel yaratma heyecanıyla devam ediyorum :)

Çok sayıda görsel üreten yapay zeka aracı çıktı son dönemde, ben de artık yetişemiyorum, ne zaman ne çıktı. Bunların bir çoğu önümüzdeki sene hayatta olmayacak büyük ihtimal o nedenle benim kullandıklarım, daha popüler olan ve önümüzdeki dönemlerde de hayatta kalma ihtimali yüksek olanlarla küçük bir deney yapacağız. Hepsine aynı prompt'u yazacağım ve sonuçları kıyaslayacağız. Hazırsanız başlayalım :)

Önce hangi araçlar olduğunu ve nereden ulaşabileceğinizi yazayım:

Midjourney : Piyasadaki en gelişmiş görsel üretici. Ancak geçtiğimiz aylarda ücretli oldu. Şu anda ondan daha gelişmişi olmadığı için ben ücretli versiyonu kullanıyorum. Discord üzerinden çalışıyor. Önce bilgisayar ya da telefonunuza discord indirmeniz gerekiyor. (Discord, kullanıcıların sesli, yazılı ve görüntülü iletişim kurabileceği, özellikle oyun toplulukları arasında popüler olan bir çevrimiçi topluluk platformu) https://www.midjourney.com/

Adobe Firefly: Adobe'nin görsel üreten aynı zamanda metin efektleri ya da görsel düzenleme yapabileceğiniz yapay zekası.

https://www.youtube.com/watch?v=_sJfNfMAQHw

Bluewillow: Yine discord üzerinden çalışan ve hemen hemen aynı görünümde olan, aynı şekilde çalışan başka bir görsel üretici. Şu anda ücretsiz. https://www.bluewillow.ai/

Dall-e : OpenAI tarafından geliştirilen ve GPT dil modelinin prensiplerini kullanarak görsel üretebilen bir yapay zeka modeli. Şu anda ücretsiz. https://openai.com/dall-e-2

DreamStudio: Stable Diffusion tarafından geliştirilen metinden görsel üreten yapay zeka aracı. DALL-E2'ye benzer şekilde, görüntüler oluşturmak için doğal dil işlemeyi kullanıyor ve görselinizi özelleştirebilmeniz için çok sayıda prompt kontrolü sağlıyor. https://dreamstudio.ai/generate

Leonardo ai: Görseli kontrol edebilmek için başlangıçta çok sayıda parametre sağlıyor ancak kullanıcı dostu olduğunu düşünmüyorum biraz kafa karıştıryor. Ücretsiz ve ücretli versiyonları var. Hemen kullanamıyorsunuz bekleme listesine girmeniz lazım. https://leonardo.ai/

Şimdi tüm bu YZ (yapay zeka) araçlarına aynı promptu girelim ve sonuçları karşılaştıralım.

PROMPT: a brunette business woman smiling with proud, dept of field, natural lighting, full body from extreme low angle, in a meeting room, Kodak Gold 400, --ar 4:3

Türkçesi : Gururla gülümseyen kumral bir iş kadını, derinlik alanı, doğal aydınlatma, çok düşük açıdan tam vücut, bir toplantı odasında, Kodak Gold 400, --ar 4:3

Henüz bu araçlar Türkçe dilini algılamıyor. O nedenle sadece İngilizce olarak prompt yazabiliyorum. (Türkçesinde nasıl bir sonuç alınıyor görmek için sayfanın en sonuna gidebilirsiniz)

Bu promptun neden böyle olduğu içindekilerin ne anlama geldiğini bu newsletterda anlatamayacağım. Ancak dümdüz "gururla gülümseyen bir iş kadını" da yazabilirsiniz. Diğerleri, ışık, açı, ambiyans, stil gibi konuları belirleyen terimler.

MIDJOURNEY

ADOBE FIREFLY

BLUEWILLOW:

DALL-E:

DREAMSTUDIO:

LEONARDO AI:

Aralarındaki üretim farkı sanırım bu şekilde net anlaşılıyor. Benim tercihim bu nedenle midjourney oldu. Ama yine de hepsi bir şekilde kullanılabilir ve oldukça zaman kazandırabilir.

Bitirmeden, Türkçe prompt yazınca ne olacağını test ettiğimde midjourney de şöyle bir sonuç aldım :) Sanırım Türkçe dili olduğunu anladı ve Türkiye'ye özgü görseller üretti. Güleyim mi üzeleyim mi bilemedim, yorumu da size bırakıyorum.

Yapay Zeka Görsel Oluşturucularını kıyaslayalım!

Son Yazılar

Yorumlar