Google Menjadi Serius Tentang Video Buatan AI di Google I/O 2024

Admin Newsroom - Redaksi

Rabu, 15 Mei 2024

URL berhasil dicopy

Google membidik Sora OpenAI dengan Veo, model AI yang dapat membuat klip video 1080p berdurasi sekitar satu menit dengan perintah teks.

Diluncurkan pada hari Selasa di konferensi pengembang Google I/O 2024, Veo dapat menangkap gaya visual dan sinematik yang berbeda, termasuk bidikan lanskap dan timelapse, serta melakukan pengeditan dan penyesuaian pada rekaman yang sudah dibuat.

GULIR UNTUK MELANJUTKAN KONTEN

“Kami sedang mengeksplorasi fitur-fitur seperti storyboard dan menghasilkan adegan yang lebih panjang untuk melihat apa yang dapat dilakukan Veo,” Demis Hassabis, kepala laboratorium R&D AI Google DeepMind, mengatakan kepada wartawan selama diskusi virtual. “Kami telah membuat kemajuan luar biasa dalam video.”

Kredit Gambar:

Veo dibangun berdasarkan karya komersial awal Google dalam pembuatan video, yang dipratinjau pada bulan April, yang memanfaatkan rangkaian model pembuatan gambar Imagen 2 milik perusahaan untuk membuat klip video berulang.

Namun tidak seperti alat berbasis Imagen 2, yang hanya dapat membuat video beresolusi rendah dan berdurasi beberapa detik, Veo tampaknya mampu bersaing dengan model generasi video terkemuka saat ini — tidak hanya Sora, tetapi juga model dari startup seperti Pika, Runway, dan Kurang sopan. laboratorium.

Dalam sebuah pengarahan, Douglas Eck, yang memimpin upaya penelitian di DeepMind di bidang media generatif, menunjukkan kepada saya beberapa contoh pilihan tentang apa yang dapat dilakukan Veo. Salah satunya – pemandangan pantai yang sibuk dari udara – menunjukkan kekuatan Veo dibandingkan model video pesaing, katanya.

“Detail seluruh perenang di pantai terbukti sulit untuk pemodelan gambar dan video – karena banyak sekali karakter yang bergerak,” ujarnya. “Kalau diperhatikan lebih dekat, ombaknya terlihat cukup bagus. Dan arti kata 'hidup', menurut saya, dapat dimengerti oleh semua orang — pantai yang ramai dan dipenuhi oleh orang-orang yang berjemur.”

Kredit Gambar: Google

Veo dilatih pada banyak rekaman. Biasanya seperti itulah cara kerjanya dengan model AI generatif: Fed memberikan contoh demi contoh beberapa bentuk data, model tersebut mengambil pola dalam data yang memungkinkan mereka menghasilkan data baru — video, dalam kasus Veo.

Dari mana asal rekaman latihan Veo? Eck tidak menjelaskan secara pasti, namun ia mengakui bahwa beberapa video mungkin berasal dari YouTube milik Google.

“Model Google mungkin dilatih tentang beberapa konten YouTube, namun selalu sesuai dengan perjanjian kami dengan pembuat YouTube,” katanya.

Bagian “kesepakatan” mungkin secara teknis Jadilah benar. Namun benar juga bahwa, mengingat dampak jaringan YouTube, pembuat konten tidak punya pilihan selain mengikuti aturan Google jika mereka ingin menjangkau pemirsa seluas mungkin.

Kredit Gambar: Google

Pelaporan oleh The New York Times pada bulan April mengungkapkan bahwa Google memperluas persyaratan layanannya tahun lalu untuk memungkinkan perusahaan memanfaatkan lebih banyak data untuk melatih model AI-nya. Berdasarkan ToS lama, tidak jelas apakah Google dapat menggunakan data YouTube untuk membuat produk di luar platform video. Hal ini tidak terjadi pada ketentuan baru, yang sangat melonggarkan kontrol.

Google bukan satu-satunya raksasa teknologi yang memanfaatkan data pengguna dalam jumlah besar untuk melatih model internal. (Lihat: Meta.) Tapi yang pasti mengecewakan beberapa pembuat konten adalah desakan Eck bahwa Google menetapkan “standar emas”, di sini, berdasarkan etika.

“Solusi dari tantangan (data pelatihan) ini akan ditemukan dengan mempertemukan seluruh pemangku kepentingan untuk mengetahui langkah selanjutnya,” ujarnya. “Sampai kita mengambil langkah-langkah tersebut bersama-sama dengan para pemangku kepentingan – kita berbicara tentang industri film, industri musik, para artis itu sendiri – kita tidak akan bergerak cepat.”

Namun Google telah menyediakan Veo untuk pembuat konten tertentu, termasuk Donald Glover (AKA Childish Gambino) dan agensi kreatifnya Gilga. (Seperti OpenAI dengan Sora, Google memposisikan Veo sebagai alat untuk materi iklan.)