Bir hikâye fikrinin “kıvılcımı” çoğu zaman tek bir görüntüden çıkar: bir yüz ifadesi, tuhaf bir nesne, zamanın dışına taşmış bir mekân. Görselleştirilmiş promptlar (görsel + metin yönergesi), bu kıvılcımı sistematik şekilde çoğaltmanızı sağlar: görseli “okursunuz”, belirsizlikleri işaretlersiniz, sonra aynı görselden farklı tür ve tonlarda birden fazla hikâye tohumu üretirsiniz.
Bu rehberde amaç, yaratıcı yazarlık için görsel destekli promptlarla fikir üretmeyi pratik bir rutine dönüştürmek: hangi sırayla ne sorulur, nasıl storyboard’a bağlanır, çıktı nasıl değerlendirilir ve iterasyonlar nasıl yönetilir. Model ve araçlar hızla değiştiği için şablonları “evrensel formül” gibi değil, test ederek uyarlayacağınız başlangıç noktaları olarak düşünün.
Görselleştirilmiş promptlar nedir ve neden işe yarar?
Görselleştirilmiş prompt, bir yapay zekâ modeline görsel girdi (fotoğraf, illüstrasyon, ekran görüntüsü, eskiz vb.) verip bunun üzerine metinsel görev tanımlamanızdır: “Bu sahneden bir hikâye fikri çıkar”, “Karakterin motivasyonunu yaz”, “Üç farklı çatışma üret” gibi.
Resmi rehberlerde öne çıkan yaklaşım şudur: görseli önce verin, modelin önce görseli betimlemesini isteyin, sonra hedef görevi ve çıktı formatını netleştirin. Bu, hem yanlış anlamaları erkenden yakalamanıza hem de daha tutarlı çıktılar almanıza yardımcı olur. (Kaynaklar: Microsoft Learn, OpenAI Cookbook)
Başlamadan önce: gerekli “malzemeler”
- Bir görsel kaynak: Kendi çekiminiz, telif hakkı uygun bir stok görsel, kamuya açık lisanslı bir görsel veya kendi eskiziniz.
- Not alanı: Basit bir doküman bile olur; önemli olan varyasyonları ve kararları kaydetmek.
- Storyboard alanı: Dijital beyaz tahta veya storyboard şablonu. Örneğin Miro’nun storyboard şablonu, panel panel düşünmeyi kolaylaştırır. (Kaynak: Miro Storyboarding Template)
- Net bir hedef: “3 kısa fikir + 1 logline + 5 sahnelik özet” gibi somut bir çıktı tanımı.
Not: Bu yazı hukuki tavsiye değildir. Görsel kullanımı, telif ve kişilik hakları açısından aracın kullanım şartlarını ve ilgili mevzuatı kontrol etmek gerekir.
Yazarlar için 6 adımlı iş akışı (görsel → fikir → storyboard)
1) Hedefi ve kısıtları 30 saniyede belirleyin
Görsel destekli üretimde en büyük hız kazancı, “ne istemediğinizi” de söylemekten gelir. Kendinize şu mini brifi yazın:
- Tür: gizem / bilimkurgu / romantik / kara mizah
- Ton: umutlu / tekinsiz / komik / melankolik
- Uzunluk: 150 kelimelik fikir, 1 sayfalık özet, 5 sahne
- Anlatıcı: 1. tekil / 3. tekil / güvenilmez anlatıcı
- Yasaklar: (ör.) “Zaman yolculuğu olmasın”, “Okul ortamı olmasın”
2) Görseli seçin: “anlatı potansiyeli” olan detay arayın
Hikâye için görsel seçerken teknik mükemmellikten çok, yorum boşluğu olan unsurları arayın:
- Belirsiz bir ifade (korku mu, sevinç mi?)
- Yerinden oynatılmış bir nesne (masada tek anahtar, kırık saat)
- Çelişki (güneşli günde ıslak zemin)
- İpucu gibi duran yazılar, işaretler, renk kodları
Bu noktada amacınız “tek doğru açıklama” bulmak değil, çoklu yorum üretmeye uygun bir zemin hazırlamak.
3) Görsel okuma: modele önce betimletin, sonra belirsizlikleri işaretleyin
Resmi prompt mühendisliği önerileri, görsel görevlerde önce görseli analiz ettirmenin ve ardından görevi netleştirmenin faydalı olduğunu vurgular. (Kaynak: Microsoft Learn) Uygulanabilir bir şablon:
Görev 1 (görsel okuma): Bu görseli 8–12 maddeyle betimle. Nesneler, ortam, ışık, duygu, olası zaman dilimi. Emin olmadığın yerleri “belirsiz” diye işaretle.
Görev 2 (odak): Betimlemede en fazla hikâye potansiyeli taşıyan 3 unsuru seç ve her biri için 2 soru üret.
Bu iki görev, hikâyeyi “modelin uydurduğu detaylardan” ziyade görseldeki gerçek ipuçlarına daha sıkı bağlamaya yardımcı olur.
4) Hikâye çekirdeği çıkarın: logline + çatışma + vaat
Şimdi görselden 3 farklı hikâye tohumu alın. En pratik format, her fikir için şu üçlüdür:
- Logline: (Kim) (ne ister) ama (engelle karşılaşır), bu yüzden (risk).
- Çatışma türü: insan-insan / insan-kendisi / insan-toplum / insan-doğa
- Vaat: Okur bu hikâyeden hangi duyguyu alacak? (gerilim, merak, rahatlama)
Çıktıyı formatlamak, özellikle multimodal görevlerde daha öngörülebilir sonuç verir; bu da resmi rehberlerde öne çıkan bir ilkedir. (Kaynaklar: Microsoft Learn, OpenAI Cookbook)
5) Storyboard’a geçin: 6 panel ile “hızlı iskelet”
Fikri anında test etmenin en hızlı yolu, yazmadan önce panel panel düşünmektir. Miro gibi storyboard şablonları, sahne akışını somutlaştırır. (Kaynak: Miro)
Her fikir için 6 panel:
- Açılış görüntüsü: Görselin aynısı veya benzeri “kanca”.
- Kıvılcım: Düzeni bozan olay.
- İlk deneme: Kahramanın ilk hamlesi ve küçük kayıp.
- Derinleşme: Gizli bilgi / ikinci katman.
- Tepe noktası: En zor seçim.
- Yankı: Sonucun duygusal izi.
Her panelin altına sadece 2 satır yazın: “ne olur” + “neden önemli”. Fazlası, fikri erken aşamada ağırlaştırabilir.
6) İterasyon: küçük, tek değişiklikli düzeltmeler yapın
Görsel üretim ve multimodal iş akışlarında, her iterasyonda tek bir değişkeni değiştirmek (ör. sadece ton, sadece anlatıcı, sadece mekân) kontrolü artırır. OpenAI’nin görsel prompt rehberleri de bu tür küçük iterasyonlarla iyileştirmeyi pratik bir yöntem olarak ele alır. (Kaynak: OpenAI Cookbook)
- V1: “Tekinsiz gizem, 3 fikir”
- V2: Aynı görsel + “Kara mizah, 3 fikir”
- V3: Seçilen fikri koru + “1. tekil anlatıcı, 5 sahne”
Prompt yapısı: kontrol için güvenilir bir “sıralama”
Görsel üretim rehberlerinde sık görülen bir yaklaşım, istemi düzenli bir sırada yazmaktır: arka plan/konu → nesne/karakter → ayrıntılar → kısıtlar. Bu, kompozisyon ve ayrıntı kontrolünü artırmaya yardımcı olabilir. (Kaynak: OpenAI Cookbook)
Bunu hikâye fikrine uyarlayan bir metin şablonu:
Arka plan/konu: Tür, ton, tema (ör. “yakın gelecek, sessiz gerilim, hafıza”).
Karakter(ler): 1 cümlede hedef + zaaf.
Ayrıntılar: Görseldeki 3 nesne/işaret ve bunların olası anlamları.
Kısıtlar: Uzunluk, anlatıcı, kaç fikir, çıktı formatı.
3 hazır prompt şablonu (kopyala-uyarla)
Şablon A: “Görsel Okuma → 5 Hikâye Tohumu”
Önce görseli 10 maddeyle betimle; emin olmadıklarını “belirsiz” diye işaretle. Sonra aşağıdaki formatta 5 hikâye fikri üret:
- Logline (1 cümle)
- Çatışma (1 satır)
- Görseldeki 2 detayın hikâyedeki rolü
- Başlık önerisi
Kısıt: Her fikir farklı türde olsun (gizem, dram, bilimkurgu, komedi, fantastik).
Şablon B: “Tek Fikir Derinleştir → 6 Panel Storyboard”
Seçtiğim fikri koru ve 6 panel storyboard yaz. Her panel için:
- Panel başlığı
- Görüntüde görülen unsur (hangi detay referans alınıyor)
- Eylem (1–2 cümle)
- Duygu (tek kelime)
Çıktıyı numaralı liste olarak ver.
Şablon C: “A/B Varyasyon Testi (Ton ve Anlatıcı)”
Aynı görsel ve aynı temel olay örgüsüyle iki varyasyon üret:
- A: 1. tekil, hızlı tempo, kara mizah
- B: 3. tekil, yavaş tempo, tekinsiz
Her varyasyon için 120–160 kelimelik kısa özet yaz ve en sonda farkları 5 maddede karşılaştır.
Gelişmiş teknik: belirli bölgeye referans verme (varsa)
Bazı multimodal araçlar, görselin belirli bir bölgesine işaret ederek (ör. kutu içine alma, koordinat/bölge seçimi) modele “şu kısma bak” demeyi destekleyebilir. Akademik literatürde bu tür visual prompt yaklaşımlarının, modelin dikkatini hedefleyerek bağlama oturtmayı (grounding) güçlendirebileceği incelenir. (Kaynak: ACL 2025 VP-MEL)
Eğer kullandığınız araç bölge seçimini desteklemiyorsa, metinle de benzer etkiyi hedefleyebilirsiniz:
- “Sol üst köşedeki yırtık poster…” gibi konumsal dil
- “En parlak renkli nesne…” gibi görsel salience tanımı
- “Arka plandaki küçük tabeladaki yazı…” gibi mikro-detay talebi
Sınır: Her model/araç konumsal referansları aynı doğrulukla izlemeyebilir; sonuçları örnekleyerek kendi kontrol listenizi oluşturmanız gerekir.
Çıktıyı değerlendirme: hızlı puanlama tablosu
Fikir üretirken “çok üretmek” kadar “iyi seçmek” de önemlidir. Aşağıdaki tabloyla 5 fikri 3 dakikada eleyebilirsiniz:
| Kriter | Soru | 1 (zayıf) | 3 (orta) | 5 (güçlü) |
|---|---|---|---|---|
| Görsele bağlılık | Görseldeki detaylar olay örgüsünü taşıyor mu? | Detaylar süs | Bazı detaylar işlevli | Detaylar kilit |
| Çatışma netliği | Karakter ne istiyor ve bedel ne? | Belirsiz | Kısmen net | Çok net |
| Özgün kanca | Tek cümlede merak uyandırıyor mu? | Tanıdık | Tanıdık ama temiz | Akılda kalıcı |
| Genişletilebilirlik | 6 panelden 12 sahneye büyür mü? | Tıkanır | Zorlanır | Rahat büyür |
Sık hatalar ve hızlı düzeltmeler
Hata 1: Görev belirsiz, çıktı dağınık
Düzeltme: “Kaç fikir, hangi format, kaç kelime”yi yazın. Resmi rehberlerde çıktı formatını tanımlamak, özellikle görsel görevlerde faydalı bir prensip olarak geçer. (Kaynak: Microsoft Learn)
Hata 2: Model görseli yanlış okuyor
Düzeltme: İlk adımda betimlemeyi isteyin ve “belirsiz” işaretlenen maddeleri soru-cevapla netleştirin. Ardından hikâye üretimine geçin.
Hata 3: Her iterasyonda çok şey değişiyor
Düzeltme: Tek değişken kuralı uygulayın (sadece ton, sadece anlatıcı, sadece tür). Bu, neyin işe yaradığını görmeyi kolaylaştırır. (Kaynak: OpenAI Cookbook)
Hata 4: Storyboard yok, fikir “kağıt üstünde” kalıyor
Düzeltme: 6 panel storyboard ile olay akışını test edin. Panel başına 2 satırı geçmeyin. (Kaynak: Miro)
Etik ve telif için kısa kontrol listesi
- Görselin kullanım hakkı: Kendi üretiminiz mi, lisanslı mı, kamuya açık mı?
- Kişisel veri ve yüzler: Tanınabilir kişilerin görsellerinde ek izin gerekip gerekmediğini değerlendirin.
- Marka ve logolar: Görselde belirgin markalar varsa, üretim ve yayımlama planınızı gözden geçirin.
- Aracın kullanım şartları: Kullandığınız modelin/servisin güncel politikalarını kontrol edin.
Bu alanlar bağlama göre değişebilir; kuşkunuz varsa profesyonel görüş almak daha güvenlidir.
Uygulama: 10 dakikalık mini egzersiz
- Bir görsel seçin (telefon fotoğrafı bile olur).
- Şablon A ile 5 fikir üretin.
- Tablodan puanlayıp en iyi 1 fikri seçin.
- Şablon B ile 6 panel storyboard çıkarın.
- Şablon C ile A/B ton testi yapın ve hangi versiyonun daha güçlü olduğunu not edin.
Bu döngüyü haftada 2 kez uyguladığınızda, görsel destekli fikir üretimi bir “ilham bekleme” meselesi olmaktan çıkıp tekrarlanabilir bir rutine dönüşür.