EleutherAI
EleutherAI (/əˈluːθər/[1]) adalah sebuah lembaga penelitian kecerdasan buatan nirlaba. Kelompok yang dianggap sebagai versi sumber terbuka dari OpenAI ini,[2] terbentuk dalam sebuah peladen Discord untuk memulai program replikasi GPT-3. Pada awal 2023, kelompok ini secara formal berdiri sebagai EleutherAI Foundation, sebuah lembaga penelitian nirlaba.[3]
EleutherAI | |
---|---|
URL | https://www.eleuther.ai/ |
Tipe | perangkat lunak sumber terbuka dan organisasi nirlaba |
Subjek utama | kecerdasan buatan |
Berdiri sejak | 25 Januari 2023 |
Negara | Amerika Serikat |
Sejarah
suntingEleutherAI berawal dari sebuah peladen di Discord pada Juli 2020 dengan nama tentatif "LibreAI" sebelum melakukan penjenamaan ulang menjadi "EleutherAI" pada akhir bulan tersebut,[4] nama ini merujuk pada eleutheria, sebuah istilah bahasa Yunani kuno untuk libertas.[2]
Pada 30 Desember 2020, EleutherAI merilis The Pile, sebuah kumpulan data yang berisikan teks untuk melatih model bahasa besar. Walaupun artikel akademis terkait mereferensikan keberadaan model GPT-Neo, model tersebut tidak dirilis hingga 21 Maret 2021.[5] Menurut sebuah artikel kilas balik yang ditulis beberapa bulan kemudian, penulis tidak menyangka bahwa "orang-orang akan sangat peduli terhadap model kecil kami."[6] Pada 9 Juni 2021, EleutherAI merilis GPT-J-6B, sebuah model bahasa dengan enam miliar parameter yang juga merupakan model bahasa mirip GPT-3 dengan sumber terbuka terbesar di dunia.[7] Kumpulan model bahasa tersebut dirilis di bawah lisensi Apache 2.0 dan dianggap telah "menyalakan gelombang perusahaan rintisan yang benar-benar baru".[3]
Setelah dirilisnya DALL-E oleh OpenAI pada Januari 2021, EleutherAI mulai bekerja pada model sintesis teks-ke-gambar. Ketika OpenAI tidak merilis DALL-E secara luas, Katherine Crowson dari EleutherAI dan seniman digital Ryan Murdock mengembangkan sebuah teknik untuk menggunakan CLIP (model lain yang dikembangkan oleh OpenAI) untuk menkonversi model generatif gambar biasa menjadi model sintesis teks-ke-gambar.[10][11][12][13] Dengan pijakan ide dari Google DeepDream,[14] mereka menemukan kesuksesan menggabungkan CLIP dengan model lainnya yang tersedia secara luas yang disebut VQGAN, hasilnya dikenal sebagai VQGAN-CLIP.[15] Crowson merilis teknologi ini dengan mengirimkan tweet berupa notebook Jupyter yang mendemonstrasikan teknik dimana khalayak umum dapat menggunakannya secara gratis tanpa peralatan khusus.[16][17][18] Karya ini dianggap oleh Direktur Utama Stability AI Emad Mostaque sebagai salah satu motivasi dalam pendirian Stability AI.
Penelitian
suntingMenurut situs web mereka, EleutherAI adalah sebuah perkumpulan kolektif yang terdiri dari peneliti sukarelawan, insinyur, dan pengembang yang berfokus pada pengendalian kecerdasan buatan, penskalaan, dan penelitian kecerdasan buatan dengan sumber terbuka".[19] Walaupun mereka tidak menjual teknologi mereka sebagai produk, mereka mempublikasikan hasil penelitian mereka dalam ranah akademis, menulis postingan blog mengenai ide dan metodologi mereka, dan menyediakan model terlatih untuk siapapun secara gratis.
The Pile
suntingThe Pile adalah sebuah kumpulan data berukuran 886 GB yang dirancang untuk melatih model bahasa besar. Awalnya dikembangkan oleh EleutherAI untuk melatih model GPT-Neo namun kumpulan data juga digunakan untuk melatih model lainnya, seperti Microsoft Megatron-Turing Natural Language Generation,[20][21] Meta AI Open Pre-trained Transformers, LLaMA, dan Galactica, Stanford University BioMedLM 2.7B,[22] Beijing Academy of Artificial Intelligence Chinese-Transformer-XL,[23] dan Yandex YaLM 100B.[24] Ketimbang kumpulan data lainnya, fitur yang membedakan The Pile adalah seleksi data yang dilakukan oleh para peneliti di EleutherAI untuk memastikan bahwa informasi yang digunakan layak untuk pelatihan dan merupakan satu-satunya kumpulan data yang didokumentasikan secara lengkap oleh peneliti yang mengembangkannya.[25]
Model-model GPT
suntingPenelitian yang paling terkenal dari EleutherAI berhubungan dengan model bahasa besar yang terinspirasi dari OpenAI GPT-3.[26] Seri model GPT-Neo terdiri dari model dengan parameter sejumlah 125 juta, 1.3 miliar, 2.7 miliar, 6 miliar, dan 20 miliar.
- GPT-Neo (125JT, 1.3M, 2.7M):[27] dirilis pada Maret 2021, model ini adalah model bahasa mirip GPT-3 dengan sumber terbuka terbesar di dunia saat dirilis.
- GPT-J (6M):[28][29] dirilis pada Maret 2021, model ini adalah model bahasa mirip GPT-3 dengan sumber terbuka terbesar di dunia saat dirilis.[30]
- GPT-NeoX (20M): dirilis pada Februari 2022, model ini adalah model bahasa dengan sumber terbuka terbesar di dunia saat dirilis.
Walaupun mayoritas dari model bahasa besar dilatih dalam bahasa Inggris ataupun bahasa Tionghoa, EleutherAI juga melatih model bahasa dalam bahasa lainnya, seperti Polyglot-Ko dalam bahasa Korea.[31]
Tanggapan publik
suntingPujian
suntingPekerjaan EleutherAI untuk mendemokratisasi GPT-3 telah mendapatkan banyak pujian dari sejumlah pegiat sumber terbuka. Mereka memenangi UNESCO Netexplo Global Innovation Award pada 2021,[32] InfoWorld Best of Open Source Software Award pada 2021[33] pada 2022,[34] dan dinominasikan untuk VentureBeat AI Innovation Award pada 2021.[35]
Gary Marcus, seorang peneliti kognitif dan pengkritik badan usaha pemelajaran dalam seperti OpenAI dan DeepMind,[36] berulang kali memuji dedikasi EleutherAI terhadap penelitian sumber terbuka dan transparan.
Maximilian Gahntz, seorang peneliti kebijakan senior di Mozilla Foundation, memuji upaya EleutherAI dalam memberikan kemampuan bagi para peneliti untuk melakukan audit dan mengukur teknologi kecerdasan buatan. "Jika model-model bersifat terbuka dan jika kumpulan data bersifat terbuka, ini akan memungkinkan lebih banyak penelitian kritis yang menunjukan banyaknya kekurangan dan kekacauan yang berkaitan dengan kecerdasan buatan generatif dan itu seringkali lebih sulit untuk dilakukan."[37]
Kritikan
suntingJurnalis teknologi Kyle Wiggers menyampaikan kekhawatiran mengenai apakah EleutherAI benar-benar independen seperti klaim mereka, atau "keterlibatan ventura komersil seperti Stability AI dan Hugging Face — keduanya dibekingi oleh modal ventura yang cukup besar — mungkin mempengaruhi penelitian EleutherAI."[38]
Referensi
sunting- ^ "Talk with Stella Biderman on The Pile, GPT-Neo and MTG". The Interference Podcast. 2021-04-02. Diakses tanggal 2023-03-26.
- ^ a b Smith, Craig (2022-03-21). "EleutherAI: When OpenAI Isn't Open Enough". IEEE Spectrum. IEEE. Diakses tanggal 2023-08-08. Kesalahan pengutipan: Tanda
<ref>
tidak sah; nama "openai-not-enough" didefinisikan berulang dengan isi berbeda - ^ a b Wiggers, Kyle (2023-03-02). "Stability AI, Hugging Face and Canva back new AI research nonprofit". TechCrunch (dalam bahasa Inggris). Diakses tanggal 2023-08-08. Kesalahan pengutipan: Tanda
<ref>
tidak sah; nama ":0" didefinisikan berulang dengan isi berbeda - ^ Leahy, Connor; Hallahan, Eric; Gao, Leo; Biderman, Stella (2021-07-07). "What A Long, Strange Trip It's Been: EleutherAI One Year Retrospective". EleutherAI Blog (dalam bahasa Inggris). Diakses tanggal 2023-04-14.
- ^ "GPT-3's free alternative GPT-Neo is something to be excited about". VentureBeat (dalam bahasa Inggris). 2021-05-15. Diakses tanggal 2023-04-14.
- ^ Leahy, Connor; Hallahan, Eric; Gao, Leo; Biderman, Stella (2021-07-07). "What A Long, Strange Trip It's Been: EleutherAI One Year Retrospective".
- ^ "GPT-J-6B: An Introduction to the Largest Open Source GPT Model | Forefront". www.forefront.ai. Diarsipkan dari versi asli tanggal 9 March 2023. Diakses tanggal 2023-03-01.
- ^ "CLIP-Guided Diffusion". EleutherAI (dalam bahasa Inggris). Diakses tanggal 2023-08-20.
- ^ "CLIP Guided Diffusion HQ 256x256.ipynb - Colaboratory". Google Colab (dalam bahasa Inggris). Diakses tanggal 2023-08-20.
- ^ MIRANDA, LJ. "The Illustrated VQGAN". ljvmiranda921.github.io. Diakses tanggal 8 March 2023.
- ^ "Inside The World of Uncanny AI Twitter Art". Nylon. Diakses tanggal 8 March 2023.
- ^ "This AI Turns Movie Text Descriptions Into Abstract Posters". Yahoo Life. Diakses tanggal 8 March 2023.
- ^ Quach, Katyanna. "A man spent a year in jail on a murder charge involving disputed AI evidence. Now the case has been dropped". www.theregister.com. Diakses tanggal 8 March 2023.
- ^ "Alien Dreams: An Emerging Art Scene - ML@B Blog". Alien Dreams: An Emerging Art Scene - ML@B Blog. Diakses tanggal 8 March 2023.
- ^ "VQGAN-CLIP". EleutherAI (dalam bahasa Inggris). Diakses tanggal 2023-08-20.
- ^ "We asked an AI tool to 'paint' images of Australia. Critics say they're good enough to sell". 14 July 2021. Diakses tanggal 8 March 2023.
- ^ Nataraj, Poornima (28 February 2022). "Online tools to create mind-blowing AI art". Analytics India Magazine. Diakses tanggal 8 March 2023.
- ^ "Meet the Woman Making Viral Portraits of Mental Health on TikTok". www.vice.com. Diakses tanggal 8 March 2023.
- ^ "EleutherAI Website". EleutherAI. Diakses tanggal 1 July 2021.
- ^ "Microsoft and Nvidia team up to train one of the world's largest language models". 11 October 2021. Diakses tanggal 8 March 2023.
- ^ "AI: Megatron the Transformer, and its related language models". 24 September 2021. Diakses tanggal 8 March 2023.
- ^ "Model Card for BioMedLM 2.7B". huggingface.co. Diakses tanggal 5 June 2023.
- ^ Yuan, Sha; Zhao, Hanyu; Du, Zhengxiao; Ding, Ming; Liu, Xiao; Cen, Yukuo; Zou, Xu; Yang, Zhilin; Tang, Jie (1 January 2021). "WuDaoCorpora: A super large-scale Chinese corpora for pre-training language models". AI Open. 2: 65–68. doi:10.1016/j.aiopen.2021.06.001. Diakses tanggal 8 March 2023.
- ^ Grabovskiy. (Siaran pers). Yandex. Tidak memiliki atau tanpa
|title=
(bantuan); - ^ Khan, Mehtab; Hanna, Alex (13 September 2022). "The Subjects and Stages of AI Dataset Development: A Framework for Dataset Accountability". SSRN 4217148 Periksa nilai
|ssrn=
(bantuan). Diakses tanggal 8 March 2023. - ^ "GPT-3's free alternative GPT-Neo is something to be excited about". 15 May 2021.
- ^ Andonian, Alex; Biderman, Stella; Black, Sid; Gali, Preetham; Gao, Leo; Hallahan, Eric; Levy-Kramer, Josh; Leahy, Connor; Nestler, Lucas (13 August 2021). "GPT-NeoX: Large Scale Autoregressive Language Modeling in PyTorch".
- ^ "EleutherAI/gpt-j-6B · Hugging Face". huggingface.co.
- ^ "ChatGPT Demo". Diakses tanggal 11 Oktober 2023.
- ^ "GPT-J-6B: An Introduction to the Largest Open Source GPT Model | Forefront". www.forefront.ai. Diarsipkan dari versi asli tanggal 9 March 2023. Diakses tanggal 1 March 2023.
- ^ ""한국어기반 AI소스 공개합니다 마음껏 쓰세요"". 매일경제. 31 October 2022.
- ^ "Request Rejected". Diakses tanggal 8 March 2023.
- ^ Yegulalp, James R. Borck, Martin Heller, Andrew C. Oliver, Ian Pointer, Matthew Tyson and Serdar (18 October 2021). "The best open source software of 2021". InfoWorld. Diakses tanggal 8 March 2023.
- ^ Yegulalp, James R. Borck, Martin Heller, Andrew C. Oliver, Ian Pointer, Isaac Sacolick, Matthew Tyson and Serdar (17 October 2022). "The best open source software of 2022". InfoWorld. Diakses tanggal 8 March 2023.
- ^ "VentureBeat presents AI Innovation Awards nominees at Transform 2021". 16 July 2021. Diakses tanggal 8 March 2023.
- ^ "What's next for AI: Gary Marcus talks about the journey toward robust artificial intelligence". ZDNET. Diakses tanggal 8 March 2023.
- ^ Chowdhury, Meghmala (2022-12-29). "Will Powerful AI Disrupt Industries Once Thought to be Safe in 2023?". Analytics Insight (dalam bahasa Inggris). Diakses tanggal 2023-04-06.
- ^ Wiggers, Kyle (2 March 2023). "Stability AI, Hugging Face and Canva back new AI research nonprofit". Diakses tanggal 8 March 2023.