Google Terjemahan
Google Terjemahan (bahasa Inggris: Google Translate) adalah layanan penerjemahan statistik dan mesin neural multibahasa bahasa yang dikembangkan oleh Google, untuk menerjemahkan teks dan situs web dari satu bahasa ke bahasa lain. Google Terjemahan menawarkan antarmuka situs web, aplikasi seluler untuk Android dan iOS, dan antarmuka pemrograman aplikasi yang membantu pengembang membangun ekstensi browser dan aplikasi perangkat lunak. Pada April 2020, Google Terjemahan menyediakan 109 bahasa di berbagai tingkatan dan hingga April 2016, mengklaim lebih dari 500 juta total pengguna, dengan lebih dari 100 miliar kata diterjemahkan setiap hari.[1]
Google Translate | |
---|---|
URL | translate |
Tipe | Statistik dan mesin neural |
Bersifat komersial? | Ya |
Pendaftaran | Opsional |
Bahasa | 109 bahasa, lihat dibawah |
Pengguna | Lebih dari 500 juta pengguna setiap hari |
Pemilik | |
Pembuat | |
Web developer | |
Berdiri sejak | 28 April 2001 | (Sebagai mesin terjemahan statistik)15 November 2016 (sebagai mesin terjemahan neural)
Status | Aktif |
Blog resmi | https://blog.google/products/translate |
Diluncurkan pada April 2006 sebagai layanan mesin terjemahan statistik, layanan ini menggunakan dokumen dan transkrip PBB dan Parlemen Eropa untuk mengumpulkan data-data linguistik. Alih-alih menerjemahkan bahasa secara langsung, pertama-tama menerjemahkan teks ke bahasa Inggris dan kemudian berporos ke bahasa target di sebagian besar kombinasi bahasa yang ditempatkan di barisnya,[2] dengan beberapa pengecualian termasuk Catalan-Spanyol.[3] Selama terjemahan, layanan ini mencari pola dalam jutaan dokumen untuk membantu memutuskan kata mana yang akan dipilih dan bagaimana mengaturnya dalam bahasa target.
Sejarah
Google Translate adalah layanan terjemahan komplementer yang dikembangkan oleh Google pada bulan April 2020.[4] Ini menerjemahkan berbagai bentuk teks dan media seperti kata, frasa, dan halaman web.
Awalnya Google Translate dirilis sebagai layanan terjemahan mesin statistik.[4] Menerjemahkan teks yang diperlukan ke dalam bahasa Inggris sebelum menerjemahkan ke dalam bahasa yang dipilih adalah langkah wajib yang harus diambil. Karena SMT menggunakan algoritma prediksi untuk menerjemahkan teks, ia memiliki akurasi tata bahasa yang buruk. Namun, Google pada awalnya tidak mempekerjakan para ahli untuk mengatasi keterbatasan ini karena sifat bahasa yang terus berkembang.
Pada Januari 2010, Google telah memperkenalkan aplikasi Android dan versi iOS pada Februari 2011 untuk berfungsi sebagai penerjemah pribadi portabel.[4] Pada Februari 2010, itu diintegrasikan ke dalam browser seperti Chrome dan dapat mengucapkan teks, secara otomatis mengenali kata-kata dalam gambar dan menemukan teks dan bahasa yang tidak dikenal.
Pada Mei 2014, Google mengakuisisi Word Lens untuk meningkatkan kualitas terjemahan visual dan suara.[5] Ia dapat memindai teks atau gambar dengan perangkat seseorang dan menerjemahkannya secara instan. Selain itu, sistem secara otomatis mengidentifikasi bahasa asing dan menerjemahkan ucapan tanpa mengharuskan individu untuk mengetuk tombol mikrofon setiap kali terjemahan ucapan diperlukan.[5]
Pada November 2016, Google mentransisikan metode penerjemahannya ke sistem yang disebut terjemahan mesin saraf.[6] Ini menggunakan teknik pembelajaran mendalam untuk menerjemahkan seluruh kalimat pada satu waktu, yang telah diukur agar lebih akurat antara bahasa Inggris dan Prancis, Jerman, Spanyol, dan Cina.[7] Tidak ada hasil pengukuran yang disediakan oleh peneliti Google untuk GNMT dari bahasa Inggris ke bahasa lain, bahasa lain ke bahasa Inggris, atau antara pasangan bahasa yang tidak termasuk bahasa Inggris. Pada 2018, itu menerjemahkan lebih dari 100 miliar kata sehari.[6]
Fungsi alat
Google Translate dapat menerjemahkan berbagai bentuk teks dan media, yang mencakup teks, ucapan, dan teks di dalam gambar diam atau gambar bergerak. Secara khusus, fungsinya meliputi:
- Terjemahan Kata-kata Tertulis: suatu fungsi yang menerjemahkan kata-kata atau teks tertulis ke bahasa asing.[8]
- Penerjemahan Situs Web: fungsi yang menerjemahkan seluruh halaman web ke bahasa yang dipilih.[9]
- Penerjemahan Dokumen: fungsi yang menerjemahkan dokumen yang diunggah oleh pengguna ke bahasa yang dipilih. Dokumen-dokumen harus dalam bentuk: .doc, .docx, .odf, .pdf, .pptx, .ps, .rtf, .txt, .xls, .xlsx.[9]
- Terjemahan Bicara: suatu fungsi yang secara instan menerjemahkan bahasa lisan ke dalam bahasa asing yang dipilih.[10]
- Terjemahan Aplikasi Seluler: pada tahun 2018, Google Translate telah memperkenalkan fitur barunya yang disebut “Ketuk untuk Menerjemahkan,” yang membuat terjemahan instan dapat diakses di dalam aplikasi apa pun tanpa keluar atau mengubahnya.[11]
- Penerjemahan Gambar: fungsi yang mengidentifikasi teks dalam gambar yang diambil oleh pengguna dan menerjemahkan teks di layar secara instan dengan gambar.[12]
- Terjemahan Tulisan Tangan: suatu fungsi yang menerjemahkan bahasa yang ditulis tangan pada layar ponsel atau digambar pada keyboard virtual tanpa dukungan keyboard.[12]
Untuk sebagian besar fitur-fiturnya, Google Translate menyediakan pelafalan, kamus, dan mendengarkan terjemahan. Selain itu, Google Translate telah memperkenalkan aplikasi Translate-nya sendiri, sehingga terjemahan tersedia dengan ponsel dalam mode offline.[11]
Bahasa yang didukung
109 bahasa berikut didukung oleh Google Translate pada April 2020.[13] Bahasa Mandarin (Sederhana) dan Bahasa Mandarin (Tradisional) merujuk pada dua sistem penulisan yang berbeda untuk bahasa yang sama, sehingga jumlah total sebenarnya bahasa dalam daftar adalah 108.
- Afrikaans
- Albanian
- Amhar
- Arab
- Armenian
- Azerbaijani
- Basque
- Belarusian
- Bengali
- Bosnia
- Bulgaria
- Burma
- Catalan
- Cebuano
- Chichewa
- Tionghoa (Sederhana)
- Tionghoa (Tradisional)
- Korsika
- Kroasia
- Ceska
- Denmark
- Belanda
- Inggris
- Esperanto
- Estonia
- Filipina
- Finlandia
- Perancis
- Galicia
- Georgia
- Jerman
- Yunani
- Gujarati
- Kreol Haiti
- Hausa
- Hawaii
- Ibrani
- Hindi
- Hmong
- Hungaria
- Islandia
- Igbo
- Indonesia
- Irlandia
- Italia
- Jepang
- Jawa
- Kanada
- Kazakh
- Khmer
- Kinyarwanda
- Korea
- Kurdi (Kurmanji)
- Kirgiz
- Laos
- Latin
- Latvia
- Lithuania
- Luksemburg
- Makedonia
- Malagasi
- Melayu
- Malayalam
- Malta
- Maori
- Marathi
- Mongolia
- Nepal
- Norwegia (Bokmål)
- Odia
- Pashto
- Persia
- Polandia
- Portugis
- Punjabi (Gurmukhi)
- Rumania
- Russia
- Samoa
- Skotlandia Gaelik
- Serbia
- Sesotho
- Shona
- Sindhi
- Sinhala
- Slovakia
- Slovenia
- Somali
- Spanyol
- Sunda
- Swahili
- Swedia
- Tajik
- Tamil
- Tatar
- Telugu
- Thai
- Turki
- Turkmen
- Ukrainia
- Urdu
- Uyghur
- Uzbek
- Vietnam
- Welsh
- West Frisian
- Xhosa
- Yiddi
- Yoruba
- Zulu
- Tahap ke-1
- Tahap ke-2
- Bahasa Inggris ke dan dari Portugis
- Tahap ke-3
- Bahasa Inggris ke dan dari Italia
- Tahap ke-4
- Bahasa Inggris ke dan dari Cina(Disederhanakan)
- Bahasa Inggris ke dan dari Jepang
- Bahasa Inggris ke dan dari Korea
- Tahap ke-5 (diluncurkan 28 April, 2006)[14]
- Bahasa Inggris ke dan dari Arab
- Tahap ke-6 (diluncurkan 16 Desember 2006)
- Bahasa Inggris ke dan dari Russia
- Tahap ke-7 (diluncurkan 9 Februari 2007)
- Bahasa Inggris ke dan dari Cina(Tradisional)
- Mandarin (Disederhanakan ke dan dari Tradisional)
- Tahap ke-8 (semua 25 pasangan bahasa menggunakan sistem terjemahan mesin Google) (diluncurkan 22 Oktober 2007)
- Tahap ke-9
- Bahasa Inggris ke dan dari Hindi
- Tahap 10 (pada tahap ini, terjemahan dapat dilakukan antara dua bahasa, menggunakan bahasa Inggris sebagai langkah perantara, jika diperlukan) (diluncurkan 8 Mei 2008)
- Tahap 11 (diluncurkan 25 September 2008)
- Tahap ke-12 (diluncurkan 30 Januari 2009)
- Tahap ke-13 (diluncurkan 19 Juni 2009)
- Tahap ke-14 (diluncurkan 24 Agustus 2009)
- Persia
- Tahap Beta selesai. Pengguna sekarang dapat memilih untuk membuat romanisasi ditulis untuk Belarusia, Bulgaria, Cina, Yunani, Hindi, Jepang, Korea, Rusia, Thailand, dan Ukraina. Untuk terjemahan dari bahasa Arab, Hindi dan Persia, pengguna dapat memasukkan transliterasi teks Latin dan teks akan ditransliterasikan ke skrip asli untuk bahasa-bahasa ini saat pengguna mengetik. Teks sekarang dapat dibaca oleh sebuah text-to-speechprogram dalam bahasa Inggris, Prancis, Jerman dan Italia.
- Tahap 16 (diluncurkan 30 Januari 2010)
- Tahap 17 (diluncurkan April 2010)
- Program bicara diluncurkan in Hindi dan Spanyol.
- Tahap 18 (diluncurkan 5 Mei 2010)
- Program bicara diluncurkan dalam bahasa Afrika, Albania, Katalan, Cina (Mandarin), Kroasia, Ceko, Denmark, Belanda, Finlandia, Yunani, Hongaria, Islandia, Indonesia, Latvia, Makedonia, Norwegia, Polandia, Portugis, Rumania, Rusia, Serbia, Slovakia , Swahili, Swedia, Turki, Vietnam dan Welsh (berdasarkan eSpeak)[15]
- Tahap ke-19 (diluncurkan 13 Mei 2010)[16]
- Tahap ke-20 (diluncurkan Juni 2010)
- Menyediakan romanisasi untuk bahasa Arab.
- Tahap ke-21 (diluncurkan September 2010)
- Tahap 22 (diluncurkan Desember 2010)
- Romanisasi Arab dihapus.
- Periksa ejaan ditambahkan.
- Untuk beberapa bahasa, Google mengganti synthesizer text-to-speech dari suara robot eSpeak ke teknologi suara alami penutur asli yang dibuat oleh SVOX[18] (Cina, Ceko, Denmark, Belanda, Finlandia, Yunani, Hongaria, Norwegia, Polandia, Portugis, Rusia, Swedia, Turki), dan juga versi lama Prancis, Jerman, Italia, dan Spanyol; Latin menggunakan synthesizer yang sama dengan Italia.
- Program bicara diluncurkan dalam bahasa Arab, Jepang dan Korea.
- Tahap 23 (diluncurkan Januari 2011)
- Pilihan terjemahan berbeda untuk satu kata.
- Tahap 24 (diluncurkan Juni 2011)
- Tahap 25 (diluncurkan Juli 2011)
- Peringkat terjemahan diperkenalkan.
- Tahap 26 (diluncurkan Januari 2012)
- Synthesizer suara pria Belanda diganti dengan wanita.
- Elena oleh SVOX menggantikan suara Slovak eSpeak.
- Transliterasi Yiddish ditambahkan.
- Tahap 27 (diluncurkan Februari 2012)
- Tahap 28 (diluncurkan September 2012)
- Tahap 29 (diluncurkan Oktober 2012)
- Tahap 30 (diluncurkan Oktober 2012)
- Program bicara baru diluncurkan dalam bahasa Inggris.
- Tahap 31 (diluncurkan November 2012)
- Program bicara baru dalam bahasa Prancis, Jerman, Italia, Latin dan Spanyol.
- Tahap 32 (diluncurkan Maret 2013)
- Buku frasa ditambahkan.
- Tahap 33 (diluncurkan April 2013)
- Tahap 34 (diluncurkan Mei 2013)
- Tahap 35 (diluncurkan Mei 2013)
- 16 bahasa tambahan dapat digunakan dengan input kamera: Bulgaria, Catalan, Kroasia, Denmark, Estonia, Finlandia, Hongaria, Indonesia, Islandia, Latvia, Lituania, Norwegia, Rumania, Slovakia, Slovenia, dan Swedia.
- Tahap 36 (diluncurkan Desember 2013)
- Tahap ke-37 (diluncurkan Juni 2014)
- Definisi kata ditambahkan.
- Tahap ke-38 (diluncurkan Desember 2014)
- Tahap 39 (diluncurkan Oktober 2015)
- Terjemahan bahasa Arab dipulihkan.
- Tahap ke-40 (diluncurkan November 2015)
- Tahap ke-41 (diluncurkan Februari 2016)
- Aurebesh dihapus.
- Program bicara dilucurkan di Bengali
- Amhar
- Korsika
- Hawaii
- Kurdi ( Kurmanji)
- Kirgistan
- Bahasa Luksemburg
- Pashto
- Bahasa Samoa
- Gaelic Skotlandia
- Shona
- Sindhi[23][24][25]
- Frisia Barat
- Xhosa[26][27][28]
- Tahap ke-42 (diluncurkan September 2016)
- Program bicara diluncurkan di Ukraina
- Tahap ke-43 (diluncurkan Desember 2016)
- Program bicara diluncurkan di Khmer dan Sinhala.
- Tahap ke-44 (diluncurkan Juni 2018)
- Program bicara diluncurkan di Burma, Malayalam, Marathi dan Telugu.
- Tahap ke-45 (diluncurkan September 2019)
- Program bicara diluncurkan di Gujarati, Kannada, dan Urdu.
- Tahap ke-46 (diluncurkan Februari 2020)
Bahasa dalam pengembangan
Bahasa-bahasa ini belum didukung oleh Google Translate, tetapi tersedia di Komunitas Terjemahan.[29]
Ketepatan
Google Translate tidak selalu dapat diandalkan seperti terjemahan manusia. Ketika teks terstruktur dengan baik, ditulis menggunakan bahasa formal, dengan kalimat-kalimat sederhana, berkaitan dengan topik formal yang datanya cukup banyak, sering menghasilkan konversi yang mirip dengan terjemahan manusia antara bahasa Inggris dan sejumlah bahasa sumber daya tinggi.[30] Keakuratan menurun untuk bahasa-bahasa itu ketika lebih sedikit dari kondisi-kondisi itu berlaku, misalnya ketika panjang kalimat bertambah atau teks menggunakan bahasa yang akrab atau sastra. Untuk banyak bahasa lain vis-à-vis Bahasa Inggris, ini dapat menghasilkan inti teks dalam keadaan formal tersebut.[31] Evaluasi manusia dari bahasa Inggris ke 102 bahasa menunjukkan bahwa gagasan utama sebuah teks disampaikan lebih dari 50% dari waktu untuk 35 bahasa. Untuk 67 bahasa, hasil minimal yang dapat dipahami tidak tercapai 50% dari waktu atau lebih.[32]
Ketika digunakan sebagai kamus untuk menerjemahkan satu kata, Google Translate sangat tidak akurat karena harus menebak antara kata-kata polisemik. Di antara 100 kata teratas dalam bahasa Inggris, yang merupakan lebih dari 50% dari semua bahasa Inggris tertulis, kata rata-rata memiliki lebih dari 15 pengertian.[33] yang membuat kemungkinan terjemahan yang benar sekitar 15 hingga 1 jika setiap indra memetakan kata yang berbeda dalam bahasa target. Kata-kata bahasa Inggris yang paling umum memiliki setidaknya dua indera, yang menghasilkan peluang 50/50 dalam hal kemungkinan bahwa bahasa target menggunakan kata-kata yang berbeda untuk indra yang berbeda. Peluangnya mirip dari bahasa lain dengan bahasa Inggris.
Google Terjemahan membuat perkiraan statistik yang meningkatkan kemungkinan menghasilkan kata yang paling sering, dengan konsekuensi bahwa terjemahan yang akurat tidak akan diperoleh dalam kasus yang tidak sesuai dengan mayoritas atau kemunculan corpus pluralitas. Keakuratan prediksi satu kata belum diukur untuk bahasa apa pun. Karena hampir semua pasangan bahasa non-Inggris berporos melalui bahasa Inggris, peluang untuk mendapatkan terjemahan kata tunggal yang akurat dari satu bahasa non-Inggris dapat diperkirakan dengan mengalikan jumlah indera dalam bahasa sumber dengan jumlah indra masing-masing istilah dalam bahasa Inggris. Ketika Google Translate tidak memiliki kata dalam kosakata, itu membuat hasil sebagai bagian dari algoritma.[34]
Lisensi dan komponen open-source
Bahasa | WordNet | Lisensi |
---|---|---|
Albania | Albanet | CC-BY 3.0/GPL 3 |
Arab | Arabic Wordnet | CC-BY-SA 3 |
Catalan | Multilingual Central Repository | CC-BY-3.0 |
Cina | Chinese Wordnet | Wordnet |
Denmark | Dannet | Wordnet |
Inggris | Princeton Wordnet | Wordnet |
Finlandia | FinnWordnet | Wordnet |
Perancis | WOLF (WOrdnet Libre du Français) | CeCILL-C |
Galicia | Multilingual Central Repository | CC-BY-3.0 |
Hebrew | Hebrew Wordnet | Wordnet |
Hindi | IIT Bombay Wordnet | Indo Wordnet |
Indonesia | Wordnet Bahasa | MIT |
Italia | MultiWordnet | CC-BY-3.0 |
Jepang | Japanese Wordnet | Wordnet |
Jawa | Javanese Wordnet | Wordnet |
Melayu | Wordnet Bahasa | MIT |
Norwegia | Norwegian Wordnet | Wordnet |
Persia | Persian Wordnet | Free to Use |
Portugis | plWordnet | Wordnet |
Portugis | OpenWN-PT | CC-BY-SA-3.0 |
Spanyol | Multilingual Central Repository | CC-BY-3.0 |
Thailand | Thai Wordnet | Wordnet |
Referensi
- ^ "Ten years of Google Translate". Google (dalam bahasa Inggris). 2016-04-28. Diakses tanggal 2020-04-27.
- ^ "How GT Pivots through English". Teach You Backwards (dalam bahasa Inggris). Diakses tanggal 2020-04-27.
- ^ "Catalan to Spanish translations". Teach You Backwards (dalam bahasa Inggris). Diakses tanggal 2020-04-27.
- ^ a b c "The remarkable way Google Translate actually works". The Independent (dalam bahasa Inggris). 2018-06-19. Diakses tanggal 2020-04-27.
- ^ a b "Google Translate just got smarter: Word Lens and instant voice translations in latest update". Android Authority (dalam bahasa Inggris). 2015-01-14. Diakses tanggal 2020-04-27.
- ^ a b McGuire, Nick (2018-07-26). "How Accurate Is Google Translate in 2018?". Argo Translation Inc. (dalam bahasa Inggris). Diakses tanggal 2020-04-27.
- ^ Wu, Yonghui; Schuster, Mike; Chen, Zhifeng; Le, Quoc V.; Norouzi, Mohammad; Macherey, Wolfgang; Krikun, Maxim; Cao, Yuan; Gao, Qin (2016-10-08). "Google's Neural Machine Translation System: Bridging the Gap between Human and Machine Translation". arXiv:1609.08144 [cs].
- ^ "Menerjemahkan kata-kata tertulis - Android - Bantuan Google Translate". support.google.com. Diakses tanggal 2020-05-06.
- ^ a b "Menerjemahkan halaman & dokumen - Android - Bantuan Google Translate". support.google.com. Diakses tanggal 2020-05-06.
- ^ "Menerjemahkan dengan ucapan - Android - Bantuan Google Translate". support.google.com. Diakses tanggal 2020-05-06.
- ^ a b "Google Translate - A Personal Interpreter on Your Phone or Computer". translate.google.com. Diakses tanggal 2020-05-06.
- ^ a b "Menerjemahkan dengan tulisan tangan atau keyboard virtual - Android - Bantuan Google Translate". support.google.com. Diakses tanggal 2020-05-06.
- ^ "See which features work with each language". Diakses tanggal July 9, 2017.
- ^ Kesalahan pengutipan: Tag
<ref>
tidak sah; tidak ditemukan teks untuk ref bernamaStatistical machine translation
- ^ Henderson, Fergus (November 5, 2010). "Giving a voice to more languages on Google Translate". Google Blog. Diakses tanggal December 22, 2011.
- ^ "Five more languages on Google Translate". Google Translate Blog. May 13, 2010. Diakses tanggal December 22, 2011.
- ^ Jakob Uszkoreit, Ingeniarius Programmandi (September 30, 2010). "Veni, Vidi, Verba Verti". Google Blog. Diakses tanggal December 22, 2011.
- ^ SVOX Diarsipkan December 26, 2010, di Wayback Machine.
- ^ "Google Translate welcomes you to the Indic web". Google Translate Blog.
- ^ Google Translate Blog: Tutmonda helplingvo por ĉiuj homoj
- ^ Brants, Thorsten (September 13, 2012). "Translating Lao". Google Translate Blog. Diakses tanggal September 19, 2012.
- ^ Crum, Chris (September 13, 2012). "Google Adds its 65th Language to Google Translate with Lao". WebProNews. Diakses tanggal September 19, 2012.
- ^ "Google can now translate text into Sindhi, Pashto and vice versa". Dawn. February 19, 2016. Diakses tanggal August 10, 2016.
- ^ "Salinan arsip". Diarsipkan dari versi asli tanggal 2016-05-29. Diakses tanggal 2021-01-26.
- ^ http://awamiawaz.com/سنڌي-104-ٻولين-۾-ترجمو-ٿيندڙ-ٻولي-بڻجي-ويئ/ [pranala nonaktif]
- ^ "Google adds Sindhi to its translate language options Latest News & Updates at Daily News & Analysis". DNA India. Diligent Media Corporation Ltd. February 18, 2016. Diakses tanggal August 10, 2016.
- ^ "Google adds Sindhi to its translate language options". Yahoo! News. Asian News International. February 18, 2016. Diakses tanggal August 10, 2016.
- ^ Ahmed, Ali (February 18, 2016). "Google Translate now includes Sindhi and Pashto". Business Recorder. Diakses tanggal August 10, 2016.
- ^ "Translate Community: Help us improve Google Translate!".
- ^ "Conclusions: Real Data, Fake Data & Google Translate". Teach You Backwards (dalam bahasa Inggris). 2019-03-30. Diakses tanggal 2020-04-27.
- ^ "Empirical Evaluation of Google Translate across 107 Languages". Teach You Backwards (dalam bahasa Inggris). 2019-03-30. Diakses tanggal 2020-04-27.
- ^ "Evaluation Scores of Google Translate in 107 Languages". Google Docs. Diakses tanggal 2020-04-27.
- ^ "Most common words in English". Wikipedia (dalam bahasa Inggris). 2020-04-08.
- ^ "Qualitative Analysis of Google Translate across 108 Languages". Teach You Backwards (dalam bahasa Inggris). 2019-04-01. Diakses tanggal 2020-04-27.