Google, yapay zeka asistanı Gemini'nin ücretli kullanıcıları için fotoğrafları kısa video kliplere dönüştürme özelliğini kullanıma açıyor. Şirket, bu özelliğin önce web sürümünde, ardından hafta boyunca Gemini mobil uygulamasında kullanıma sunulacağını duyurdu.
FOTOĞRAFTAN 8 SANİYELİK SESLİ VİDEO OLUŞTURACAK
Yeni özellik, kullanıcıların yükledikleri bir fotoğraf ve ekledikleri metin açıklamasıyla 8 saniyelik sesli video klip üretmelerine imkan tanıyor. Videolar, MP4 formatında, 720p çözünürlükte ve 16:9 yatay formatta hazırlanacak. Bu güncelleme, Gemini’nin sohbet arayüzü üzerinden güçlü video üretim özelliğini erişilebilir kılarak Google’ı OpenAI ve Runway AI gibi ABD’li rakipleriyle rekabette ileri taşımayı hedefliyor.
VEO 3 İLE DESTEKLENİYOR
Fotoğraftan videoya dönüştürme özelliği, Google’ın Mayıs ayında geliştirici konferansında tanıttığı Veo 3 video üretim modeli ile çalışıyor. Bu model, daha önce Flow adlı bağımsız ücretli film yapım aracıyla sınırlı kullanıcı kitlesine sunuluyordu. Google, video üretimini “uygun ve güvenli bir deneyim” haline getirmek için önemli adımlar attığını belirtiyor.
ÜNLÜLERDE KISITLAMA VAR
Google, ünlüler, devlet başkanları ve tanınmış CEO’lar gibi kamusal olarak tanınabilir kişilerin görüntülerinin kullanılmasıyla video üretimine izin vermiyor. Ayrıca tehlikeli aktiviteleri teşvik eden, şiddet veya zorbalığı teşvik eden içeriklerin oluşturulması da yasak.
YÜZ TANIMA VE HAREKET EKLEMEDE SORUNLAR YAŞANIYOR
Bloomberg’in yaptığı testlerde, kişisel fotoğraflardan konuşan video üretmek istendiğinde, yapay zekanın bazen kişinin yüz hatlarını veya ten rengini değiştirdiği görüldü. Hareketli bitki veya konuşan kedi gibi basit talepler başarıyla yerine getirilirken, bir fotoğraftaki kişinin breakdance yapmasını istemek gibi karmaşık isteklerde yapay zeka yalnızca kişinin kameraya el salladığı videolar üretebildi.
Google, modelin kişilerin yüz animasyonunda hala gelişim aşamasında olduğunu ve tek bir görüntü üzerinden üretilen videoların bazen orijinal görseli tam olarak yansıtmayabileceğini belirtti. Şirket, gelecekteki güncellemelerde yüz animasyonu dahil tüm modelin geliştirilmesine devam edileceğini açıkladı.
Google, yapay zeka destekli video üretiminde ABD’deki rakiplerinin yanı sıra Çinli Alibaba, Manus ve Kuaishou gibi şirketlerin son aylarda geliştirdiği yeni araçlarla da küresel bir rekabet içinde yer alıyor. Yeni fotoğraftan videoya geçiş özelliği, Google’ın bu alandaki konumunu güçlendirmeyi hedefleyen önemli adımlardan biri olarak öne çıkıyor.