Ana Sayfa Teknoloji Meta, 2025’te Instagram’ı vuracak güçlü Film Gen ile yapay zeka video savaşlarına...

Meta, 2025’te Instagram’ı vuracak güçlü Film Gen ile yapay zeka video savaşlarına giriyor

24
0

Sektör lideri yapay zeka kapsamına ilişkin en son güncellemeler ve özel içerik için günlük ve haftalık bültenlerimize katılın. Daha fazla bilgi edin


Şirketi popüler sosyal ağ Fb’un üzerine kuran Meta kurucusu ve CEO’su Mark Zuckerberg, bu haftayı güçlü bir şekilde tamamladı: Leg press yaptığı bir videoyu yayınlıyor kişisel Instagram hesabında (Fb’un 2012’de satın aldığı bir sosyal ağ) spor salonundaki bir makinede egzersiz yapıyor.

Ancak videoda leg press makinesinin neon siberpunk versiyonuna, Antik Roma versiyonuna ve ayrıca altın alevli versiyonuna dönüştüğü görülüyor.

Görünüşe göre Zuck egzersiz yapmaktan fazlasını yapıyordu: videoyu duyuru yapmak için kullanıyordu Film GenMeta’nın, metin istemlerinden hem video hem de ses oluşturabilen ve kullanıcıların kendi videolarını özelleştirmelerine, özel efektler, aksesuarlar, kostümler eklemelerine ve seçilen öğeleri yalnızca metin kılavuzu aracılığıyla değiştirmelerine olanak tanıyan, Zuck’ın kitabında yaptığı gibi, Meta’nın yeni üretken çok modlu yapay zeka modelleri ailesi. video.

Modeller son derece güçlü görünüyor; Pika’nın eski modellerdeki spot düzenlemesine benzer şekilde, kullanıcıların video klibin yalnızca seçilen öğelerini “yeniden oynatmak” veya tümünü yeniden oluşturmak yerine değiştirmesine olanak tanıyor, ancak daha uzun klip oluşturma ve dahili ses özelliğiyle birlikte .

Teknik bir şekilde özetlenen Meta testleri kağıt Bugün piyasaya sürülen mannequin ailesi, tutarlılık ve hareketin “doğallığı” gibi farklı niteliklere ilişkin birçok izleyici derecelendirmesinde Runway Gen 3, Luma Dream Machine, OpenAI Sora ve Kling 1.5 dahil olmak üzere alandaki önde gelen rakiplerinden daha iyi performans gösterdiğini gösteriyor.

Meta, Film Gen’i hem dijital hikaye anlatımlarını geliştirmek isteyen sıradan kullanıcılar hem de profesyonel video yaratıcıları ve editörleri, hatta Hollywood movie yapımcıları için bir araç olarak konumlandırdı.

Film Gen, video ve ses yeteneklerini tek bir sistemde birleştiren Meta’nın üretken yapay zeka teknolojisindeki en son adımını temsil ediyor.

Özellikle Film Gen dört modelden oluşur:

1. Movie Gen Videosu – 30B parametreli metinden videoya oluşturma modeli

2. Movie Gen Sesi – 13B parametreli videodan sese üretim modeli

3. Kişiselleştirilmiş Movie Oluşturma Videosu – Film Gen Video’nun bir kişinin yüzüne göre kişiselleştirilmiş videolar oluşturmak için sonradan eğitilmiş bir sürümü

4. Movie Gen Düzenleme – hassas video düzenleme için yeni bir eğitim sonrası prosedüre sahip bir mannequin

Bu modeller, 48kHz sesin yanı sıra 16 FPS’de 16 saniyeye kadar gerçekçi, kişiselleştirilmiş HD videoların oluşturulmasına olanak tanır ve video düzenleme yetenekleri sağlar.

Kişiselleştirilmiş video oluşturma, gelişmiş video düzenleme ve yüksek kaliteli ses oluşturmaya kadar çeşitli görevleri yerine getirmek üzere tasarlanan Film Gen, kullanıcıların yaratıcı seçeneklerini geliştirmek için güçlü yapay zeka modellerinden yararlanır.

Film Gen paketinin temel özellikleri şunları içerir:

Video Üretimi: Film Gen ile kullanıcılar, yalnızca metin istemlerini girerek yüksek çözünürlüklü (HD) videolar üretebilirler. Bu videolar 1080p çözünürlükte, 16 saniyeye kadar uzunlukta görüntülenebiliyor ve 30 milyar parametreli bir transformatör modeli tarafından destekleniyor. Yapay zekanın ayrıntılı istemleri yönetme yeteneği, kamera hareketi, nesne etkileşimleri ve çevre fiziği dahil olmak üzere video oluşturmanın çeşitli yönlerini ele almasına olanak tanır.

Kişiselleştirilmiş Videolar: Film Gen, kullanıcıların yapay zeka tarafından oluşturulan videolarda yer almak üzere kendilerinin veya başkalarının resimlerini yükleyebilecekleri heyecan verici kişiselleştirilmiş bir video özelliği sunuyor. Mannequin, bireyin kimliğini korurken çeşitli yönlendirmelere uyum sağlayabiliyor ve bu da onu özelleştirilmiş içerik oluşturma için faydalı kılıyor.

Hassas Video Düzenleme: Film Gen paketi ayrıca kullanıcıların bir videodaki belirli öğeleri değiştirmesine olanak tanıyan gelişmiş video düzenleme yetenekleri de içerir. Bu mannequin, tümü basit metin talimatlarına dayalı olarak nesneler veya renkler gibi yerelleştirilmiş özelliklerin yanı sıra arka plan değişimleri gibi küresel değişiklikleri de değiştirebilir.

Ses Üretimi: Film Gen, video özelliklerine ek olarak 13 milyar parametreli ses oluşturma modelini de bünyesinde barındırıyor. Bu özellik, görsel içerikle kusursuz bir şekilde uyum sağlayan ses efektlerinin, ortam müziğinin ve senkronize sesin oluşturulmasına olanak tanır. Kullanıcılar oluşturabilir Foley sesleri (kumaşların hışırdaması ve yankılanan ayak sesleri gibi gerçek hayattaki sesleri güçlendiren ancak sağlamlaştıran ses efektleri), enstrümantal müzik ve 45 saniyeye kadar uzunluktaki diğer ses öğeleri. Meta, aşağıda Foley seslerinin yer aldığı örnek bir video yayınladı (duymak için sesi açın):

Milyarlarca çevrimiçi video konusunda eğitim aldı

Film Gen, Meta’nın devam eden yapay zeka araştırma çabalarındaki en son gelişmedir. Meta, modelleri eğitmek için “web ölçeğindeki görüntü, video ve ses verilerine”, özellikle de “videoları ‘izleyerek’ görsel dünya hakkında bilgi edindiği 100 milyon video ve 1 milyar görüntüye” dayandığını söylüyor. teknik kağıt.

Ancak Meta, verilerin gazetede mi yoksa kamu malı olarak mı lisanslandığını ya da diğer birçok yapay zeka modeli üreticisinin yaptığı gibi verileri basitçe kazıyıp çıkarmadığını belirtmedi; bu durum YouTuber Marques Brownlee (MKBHD) gibi sanatçıların ve video yaratıcılarının eleştirilerine yol açtı. AI video modeli sağlayıcısı Runway durumunda, içerik oluşturucular tarafından açılan toplu dava telif hakkı ihlali davası (hala mahkemelerde görülüyor). Bu nedenle Meta’nın veri kaynakları nedeniyle anında eleştirilerle karşı karşıya kalması beklenebilir.

Eğitimle ilgili yasal ve etik sorular bir yana, Meta, büyük dil modeli (LLM) eğitimi ve yeni bir eğitimin yanı sıra tipik yayılma modeli eğitiminin (video ve ses yapay zekasında yaygın olarak kullanılır) bir kombinasyonunu kullanarak Film Gen oluşturma sürecini açıkça yeni bir süreç olarak konumlandırıyor. “Akış Eşleştirme” adı verilen teknikten ikincisi, bir veri kümesinin zaman içindeki dağılımındaki değişikliklerin modellenmesine dayanır.

Her adımda mannequin, numunelerin hedef dağılıma doğru “hareket etmesi” gereken hızı tahmin etmeyi öğrenir. Akış Eşleştirme, standart dağıtım tabanlı modellerden önemli noktalarda farklılık gösterir:

Sıfır Terminal Sinyal-Gürültü Oranı (SNR): Sıfır terminal SNR’sini korumak için özel gürültü programları gerektiren geleneksel difüzyon modellerinden farklı olarak Akış Eşleştirme, doğası gereği, ek ayarlamalara gerek kalmadan sıfır terminal SNR’yi sağlar. Bu, gürültü programı seçimine karşı dayanıklılık sağlayarak daha tutarlı ve daha yüksek kaliteli video çıkışlarına katkıda bulunur.

Eğitim ve Çıkarımda Verimlilik: Akış Eşleştirmenin, yayılma modellerine kıyasla hem eğitim hem de çıkarım açısından daha verimli olduğu bulunmuştur. Kullanılan gürültü programlarının türü açısından esneklik sunar ve çeşitli mannequin boyutlarında gelişmiş performans gösterir. Bu yaklaşım aynı zamanda insan değerlendirme sonuçlarıyla daha iyi uyum sağladığını da göstermiştir.

Film Gen sisteminin eğitim süreci, hem video hem de ses üretimi için esnekliği ve kaliteyi en üst düzeye çıkarmaya odaklanır. Her biri kapsamlı eğitim ve ince ayar prosedürlerine sahip iki ana modele dayanır:

Movie Gen Video Modeli: Bu modelin 30 milyar parametresi vardır ve temel metin-görüntü oluşturmayla başlar. Daha sonra metinden videoya geçerek 16 saniyeye kadar HD kalitesinde videolar üretir. Eğitim süreci, modelin hareket, etkileşimler ve kamera dinamikleri gibi karmaşık görsel kavramları anlamasına olanak tanıyan geniş bir video ve görüntü veri kümesi içerir. Modelin yeteneklerini geliştirmek için, metin altyazılı yüksek kaliteli videolardan oluşan bir dizi üzerinde ince ayar yaptılar, bu da çıktılarının gerçekçiliğini ve hassasiyetini artırdı. Ekip, modeli kişiselleştirilmiş içerik ve düzenleme komutlarını yönetecek şekilde eğiterek esnekliğini daha da genişletti.

Film Gen Ses Modeli: 13 milyar parametreyle bu mannequin, videodaki görsel öğelerle senkronize olan yüksek kaliteli ses üretir. Eğitim seti, modelin ses ve görseller arasındaki hem fiziksel hem de psikolojik bağlantıları kavramasına olanak tanıyan bir milyon saatten fazla ses içeriyordu. Seçilen yüksek kaliteli ses ve metin çiftlerini kullanarak denetimli ince ayar yoluyla bu modeli geliştirdiler. Bu süreç, farklı video sahneleri için gerçekçi ortam sesleri, senkronize ses efektleri ve ruh haline uygun arka plan müziği oluşturulmasına yardımcı oldu.

Yüksek kaliteli görüntü ve animasyon oluşturmaya odaklanan Make-A-Scene ve Llama Picture modelleri gibi daha önceki projeleri takip ediyor.

Bu sürüm, Meta’nın üretken yapay zeka yolculuğundaki üçüncü önemli kilometre taşını işaret ediyor ve şirketin medya oluşturma araçlarının sınırlarını zorlama konusundaki kararlılığının altını çiziyor.

2025’te Insta’da kullanıma sunulacak

2025’te Instagram’da yayınlanacak olan Film Gen, gelişmiş video oluşturmayı platformun geniş kullanıcı yelpazesi için daha erişilebilir hale getirmeye hazırlanıyor.

Modeller şu anda araştırma aşamasında olsa da Meta, Film Gen’in kullanıcılara kolaylıkla ilgi çekici içerik üretme olanağı sağlayacağına dair iyimserliğini dile getirdi.

Ürün gelişmeye devam ederken Meta, Film Gen’in özelliklerini iyileştirmek ve kullanıcı ihtiyaçlarını karşıladığından emin olmak için yaratıcılar ve movie yapımcılarıyla işbirliği yapmayı planlıyor.

Meta’nın Film Gen’e yönelik uzun vadeli vizyonu, gelişmiş video düzenleme araçlarına erişimi demokratikleştirmeye yönelik daha geniş bir hedefi yansıtıyor. Paket önemli bir potansiyel sunsa da Meta, Film Gen gibi üretken yapay zeka araçlarının profesyonel sanatçıların ve animatörlerin çalışmalarını değiştirmeyi değil, geliştirmeyi amaçladığını kabul ediyor.

Meta, Film Gen’i pazara sunmaya hazırlanırken şirket, teknolojiyi geliştirmeye ve mevcut sınırlamaları gidermeye odaklanmaya devam ediyor. Çıkarım süresini iyileştirmeyi ve modelin yeteneklerini büyütmeyi amaçlayan daha fazla optimizasyon planlıyor. Meta ayrıca, tamamen kullanıcı girişiyle yönlendirilen özelleştirilmiş animasyonlu selamlamalar veya kısa filmler oluşturmak gibi gelecekteki potansiyel uygulamalara da işaret etti.

Film Gen’in piyasaya sürülmesi, Meta platformlarında içerik oluşturma konusunda yeni bir çağın sinyalini verebilir; Instagram kullanıcıları bu yenilikçi aracı ilk deneyimleyenler arasındadır. Teknoloji geliştikçe Film Gen, Meta ekosisteminin ve hem profesyonel hem de bağımsız yaratıcıların ekosisteminin hayati bir parçası haline gelebilir.


Kaynak

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz