Flux (model teks-ke-gambar)

model teks-ke-gambar
(Dialihkan dari Flux AI)


Flux (juga dikenal sebagai FLUX.1) adalah sebuah model teks-ke-gambar yang dikembangkan oleh Black Forest Labs, yang berpusat di Freiburg, Jerman. Seperti halnya model teks-ke-gambar lainnya, Flux menghasilkan gambar dari deskripsi bahasa alami, yang dikenal sebagai perintah (prompt).

Flux
Gambar yang dihasilkan oleh Flux 1.1 Pro (dengan moda Ultra)
Tipemodel teks-ke-gambar dan transformer (en) Terjemahkan Edit nilai pada Wikidata
Versi pertamaAgustus 2024
GenreModel teks-ke-gambar
Lisensi
Informasi pengembang
PembuatBlack Forest Labs
PengembangBlack Forest Labs
Sumber kode
Sunting di Wikidata Sunting di Wikidata • Sunting kotak info • L • B
Info templat
Bantuan penggunaan templat ini

Sejarah

sunting

Black Forest Labs didirikan pada tahun 2024 oleh sejumlah mantan karyawan Stability AI.yang terdiri dari Robin Rombach, Andreas Blattmann, dan Patrick Esser.[2][3] Ketiga pendiri sebelumnya terlibat dalam penelitian pembuatan gambar kecerdasan buatan di Universitas Ludwig Maximilian München sebagai asisten peneliti di bawah Björn Ommer.[4][5][6] Mereka menerbitkan hasil penelitiannya tentang pembuatan gambar pada tahun 2022, yang menghasilkan Stable Diffusion.[6][7] Pada bulan Agustus 2024, Flux diintegrasikan ke dalam chatbot Grok yang dikembangkan oleh xAI dan tersedia sebagai bagian dari fitur berbayar di X (sebelumnya dikenal sebagai Twitter).[8][9][10] Investor yang terlibat dalam Black Forest Labs diantaranya Andrerssen Horowitz, Brendan Iribe, Michael Ovitz, dan Garry Tan. Perusahaan menerima pendanaan awal sebesar US$  juta.[11][12]

Flux adalah serangkaian model teks-ke-gambar yang digunakan dalam seni kecerdasan buatan. Model ini didasarkan pada arsitektur campuran yang terdiri dari kombinasi blok transformator difusi multimodal dan paralel yang memiliki 12 miliar parameter.[13] Varian model tersebut dirilis dengan lisensi yang berbeda-beda, mulai dari Schnell (secara harfiah berarti Cepat dalam bahasa Jerman) dirilis sebagai perangkat lunak sumber terbuka di bawah Lisensi Apache, Dev dirilis sebagai perangkat lunak sumber tersedia di bawah lisensi non-komersial, dan Pro dirilis sebagai perangkat lunak milik perorangan dan hanya tersedia dalam bentuk API yang dapat dilisensikan oleh pihak ketiga.[14][15] Pengguna tetap memiliki kepemilikan atas hasil keluaran terlepas dari varian model yang digunakan.[16][17]

Model-model tersebut dapat digunakan secara daring atau lokal dengan menggunakan antarmuka pengguna kecerdasan buatan generatif seperti ComfyUI.[13]

Sebuah model unggulan yang disempurnakan, Flux 1.1 Pro dirilis pada tanggal 2 Oktober 2024.[18][19] Dua mode tambahan ditambahkan pada kemudian hari, yaitu Ultra yang dapat menghasilkan gambar dengan resolusi empat kali lebih tinggi dan hingga 4 megapiksel tanpa mempengaruhi kecepatan pembuatan dan Raw yang dapat menghasilkan gambar hiper-realistis dalam gaya fotografi kejutan pada tanggal 6 November 2024.[20][21][22]

Masih terkait dengan Flux yaitu model teks-ke-video SOTA, yang pada saat ini sedang dalam pengembangan.[13]

Kritik

sunting

Flux dikritik karena gambar yang dihasilkannya sangat realistis seperti foto yang dapat digunakan untuk pemalsuan dalam. Menurut laporan sejumlah media, penggambaran tersebut berkisar dari gambar Donald Trump berpose dengan senjata hingga adegan-adegan yang tidak layak, yang memicu diskusi tentang implikasi etis dari penggunaan Flux dan teknologi serupa.[4][10]

Setelah model tersebut dirilis, media sosial X dibanjiri gambar yang dihasilkan Flux.[23][24] Black Forest Labs belum memberikan rincian pasti mengenai data yang digunakan untuk melatih Flux.[20] Ars Technica menduga bahwa Flux didasarkan pada kumpulan gambar besar yang digali dari internet, sebuah praktik kontroversial dengan konsekuensi hukum yang potensial.[25][26]

Referensi

sunting
  1. ^ "Announcing FLUX1.1 [pro] and the BFL API". Black Forest Labs. 2 October 2024. Diakses tanggal 2024-11-17. 
  2. ^ Killian, Nicolas (2024-08-27). "Black Forest Labs: Sie sind ein Teil von jener Kraft". Die Zeit (dalam bahasa Jerman). ISSN 0044-2070. Diakses tanggal 2024-11-17. 
  3. ^ Growcoot, Matt (2024-08-05). "AI Image Generator Made by Stable Diffusion Inventors on Par With Midjourney and DALL-E". PetaPixel (dalam bahasa Inggris). Diakses tanggal 2024-11-17. 
  4. ^ a b "Black Forest Labs unter Beschuss: Schockierende KI-Bilder sorgen für…". AlleAktien (dalam bahasa Jerman). 2024-08-22. Diakses tanggal 2024-11-17. 
  5. ^ "Black Forest Labs: KI-Tools aus dem Schwarzwald". trend.at (dalam bahasa Jerman). 2024-08-08. Diakses tanggal 2024-11-17. 
  6. ^ a b "Black Forest Labs: Die Schwarzwald-KI, auf die Elon Musk setzt". capital.de (dalam bahasa Jerman). 2024-08-15. Diakses tanggal 2024-11-17. 
  7. ^ "High-Resolution Image Synthesis with Latent Diffusion Models". Computer Vision & Learning Group (dalam bahasa Inggris). Diakses tanggal 2024-11-17. 
  8. ^ meedia.de. "Generative AI. Black Forest Labs und Flux.1: Vom Superstar zum Buhmann in fünf Tagen". MEEDIA (dalam bahasa Jerman). Diakses tanggal 2024-11-17. 
  9. ^ "Flux.1 – ein deutscher KI-Bildgenerator dreht mit Grok frei". Handelsblatt (dalam bahasa Jerman). Diakses tanggal 2024-11-17. 
  10. ^ a b Weatherbed, Jess (2024-08-14). "xAI's new Grok-2 chatbots bring AI image generation to X". The Verge (dalam bahasa Inggris). Diakses tanggal 2024-11-17. 
  11. ^ Steinschaden, Jakob (2024-08-12). "Black Forest Labs: 31 Mio. Dollar für Herausforderer von OpenAI und Midjourney". Trending Topics (dalam bahasa Jerman). Diakses tanggal 2024-11-17. 
  12. ^ Nuñez, Michael (2024-08-01). "Stable Diffusion creators launch Black Forest Labs, secure $31M for FLUX.1 AI image generator". VentureBeat (dalam bahasa Inggris). Diakses tanggal 2024-11-17. 
  13. ^ a b c "Announcing Black Forest Labs". Black Forest Labs (dalam bahasa Inggris). 2024-08-01. Diakses tanggal 2024-11-17. 
  14. ^ "Get Flux". Black Forest Labs (dalam bahasa Inggris). Diakses tanggal 2024-11-17. 
  15. ^ Wiggers, Kyle (2024-10-03). "Black Forest Labs, the startup behind Grok's image generator, releases an API". TechCrunch (dalam bahasa Inggris). Diakses tanggal 2024-11-17. 
  16. ^ "flux/model_licenses/LICENSE-FLUX1-dev at main · black-forest-labs/flux". GitHub (dalam bahasa Inggris). Diakses tanggal 2024-11-18. Outputs. We claim no ownership rights in and to the Outputs. You are solely responsible for the Outputs you generate and their subsequent uses in accordance with this License. You may use Output for any purpose (including for commercial purposes), except as expressly prohibited herein. You may not use the Output to train, fine-tune or distill a model that is competitive with the FLUX.1 [dev] Model. 
  17. ^ "API Agreement - BFL Docs (Pro)". Black Forest Labs. 2024-08-01. Diakses tanggal 2024-11-18. Output. Company claims no ownership rights in and to the Outputs, and Developer and Users may use the Output for their own personal or commercial purposes, subject to any restrictions set forth herein or in the Flux Service Terms. For the avoidance of doubt, Outputs do not include any components of the Flux API or the Flux AI model, such as its weights or parameters. 
  18. ^ "Announcing FLUX1.1 [pro] and the BFL API". Black Forest Labs. 2 October 2024. Diakses tanggal 2024-11-17. 
  19. ^ Franzen, Carl (2024-10-03). "Black Forest Labs releases Flux 1.1 Pro and an API". VentureBeat (dalam bahasa Inggris). Diakses tanggal 2024-11-17. 
  20. ^ a b Growcoot, Matt (2024-11-07). "Flux AI Introduces Raw Mode That 'Captures the Genuine Feel of Candid Photography'". PetaPixel (dalam bahasa Inggris). Diakses tanggal 2024-11-19. 
  21. ^ Bastian, Matthias (2024-11-06). "Flux 1.1 Pro AI image model adds "amateur" RAW photo mode and 4K image generation". The Decoder (dalam bahasa Inggris). Diakses tanggal 2024-11-17. 
  22. ^ "Introducing FLUX1.1 [pro] Ultra and Raw Modes". Black Forest Labs (dalam bahasa Inggris). 2024-11-06. Diakses tanggal 2024-11-17. 
  23. ^ Zeff, Maxwell (2024-08-14). "Meet Black Forest Labs, the startup powering Elon Musk's unhinged AI image generator". TechCrunch (dalam bahasa Inggris). Diakses tanggal 2024-11-17. 
  24. ^ Schwarzer, Matthias (2024-08-16). "Drogen, Bomben und Gewalt: KI-Bildgenerator von Elon Musk zeigt alles – mit deutscher Technik". RND.de (dalam bahasa Jerman). Diakses tanggal 2024-11-17. 
  25. ^ Künne, Christoph (2024-08-07). "FLUX.1: Neuer KI-Bildgenerator". DOCMA (dalam bahasa Jerman). Diakses tanggal 2024-11-17. 
  26. ^ Edwards, Benj (2024-08-02). "FLUX: This new AI image generator is eerily good at creating human hands". Ars Technica (dalam bahasa Inggris). Diakses tanggal 2024-11-17. 

Pranala luar

sunting