Alat kecerdasan buatan terbaru Google, “Whisk,” membolehkan orang memuat naik foto untuk mendapatkan imej gabungan yang dihasilkan oleh AI – walaupun tanpa pengguna memasukkan sebarang teks untuk menerangkan apa yang mereka mahu.
Pengguna boleh memasukkan imej yang menggambarkan subjek, latar dan gaya sebelum Whisk menggabungkan semuanya menjadi satu imej.
Whisk adalah “alat kreatif” untuk inspirasi cepat, kata Google dalam satu catatan blog, berbanding dengan “editor imej tradisional.” Pada dasarnya, Whisk dimaksudkan sebagai ciri AI yang menyeronokkan, bukannya sesuatu yang sepatutnya menjadi kerja profesional yang halus.
Berikut adalah beberapa fakta menarik berkaitan dengan Whisk dan imej yang dijana oleh AI:
- Penjanaan Imej-ke-Imbas: Tidak seperti penjana imej-ke-teks tradisional, Whisk membolehkan pengguna memuat naik foto untuk mencipta imej gabungan yang dijana oleh AI. Ini menjadikannya lebih intuitif dan kreatif untuk pengguna bereksperimen dengan idea-idea visual.
-
Alat Kreatif: Whisk direka sebagai alat kreatif untuk inspirasi cepat dan bukannya penyunting imej tradisional. Ia membolehkan pengguna untuk mengubah subjek, adegan, dan gaya dengan cara yang baru dan kreatif, menawarkan penerokaan visual yang pantas.
-
AI Generatif: Whisk dibina berdasarkan AI generatif yang dibangunkan oleh DeepMind, yang diperoleh oleh Google pada tahun 2014. Ia menggunakan tawaran AI teras Google, Gemini, dan menggabungkannya dengan Imagen 3, penjana teks-ke-imej terkini yang dikeluarkan oleh DeepMind.
-
Keupayaan Remix: Pengguna boleh “remix” imej akhir dengan mengedit input mereka dan mencampurkan kategori untuk menghasilkan imej yang berbeza seperti mainan plushie, pin enamel, atau pelekat. Teks boleh ditambah untuk mengarahkan butiran tertentu, tetapi ia tidak diperlukan untuk mencipta imej.
-
Persaingan AI: Syarikat-syarikat Teknologi Besar seperti Google dan OpenAI berlumba-lumba untuk mengeluarkan produk pengguna yang mempamerkan keupayaan teknologi AI baharu. OpenAI baru-baru ini melancarkan penjana teks-ke-video yang dipanggil Sora, menonjolkan persaingan dalam perlumbaan AI dan teknologi.
Whisk adalah perkembangan yang menarik dalam dunia imej yang dijana oleh AI, menawarkan cara yang menyeronokkan dan kreatif untuk pengguna meneroka idea-idea visual. Apa pendapat anda tentang pendekatan ini untuk menjana imej?