MP3

format terbuka kompresi lossy standar untuk audio digital
Revisi sejak 15 November 2024 15.23 oleh Madeyahog (bicara | kontrib) (Desain)
(beda) ← Revisi sebelumnya | Revisi terkini (beda) | Revisi selanjutnya → (beda)

MPEG-1 Audio Layer 3 atau lebih dikenal sebagai MP3 adalah salah satu format berkas pengodean suara yang memiliki kompresi yang baik (meskipun bersifat lossy) sehingga ukuran berkas bisa memungkinkan menjadi lebih kecil. Berkas ini dikembangkan oleh seorang insinyur Jerman Karlheinz Brandenburg. MP3 memakai pengodean Pulse Code Modulation (PCM). MP3 mengurangi jumlah bit yang diperlukan dengan menggunakan model psychoacoustic untuk menghilangkan komponen-komponen suara yang tidak terdengar oleh manusia.

MPEG-1 or MPEG-2 Audio Layer III
Ekstensi berkas.mp3[1]
Jenis MIMEaudio/mpeg,[2] audio/MPA,[3] audio/mpa-robust[4]
Rilis pertama1993 (1993)[5]
Jenis formatFormat kompresi audio, format berkas audio
StandarISO/IEC 11172-3,[5]
ISO/IEC 13818-3[6]
Struktur berkas mp3

MP3 memakai sebuah transformasi hybrid untuk mentransformasikan sinyal pada ranah waktu ke sinyal pada ranah frekuensi:

  • Filter polyphase quadrature 32-band
  • 36 atau 12 MDCT (modified discrete cosine transform), dengan ukuran dapat dipilih secara independen untuk sub-band 0…1 dan 2…31
  • Postproses aliasing reduction

Standar MPEG-1 tidak menspesifikasikan secara spesifik cara melakukan encode MP3. Sebaliknya, algoritme decode serta format file didefinisikan secara spesifik. Yang ingin mengimplementasikan encoder MP3 harus membuat sendiri algorima untuk menghilangkan bagian dari informasi pada file audio asal (atau pada representasi MDCT pada ranah frekuensi).

Karena itu, maka cara encode setiap encoder MP3 berlainan dan menghasilkan kualitas hasil yang berlainan juga. Hal yang harus diperhatikan adalah dari semua encoder yang ada, terdapat encoder yang bagus untuk bitrate tinggi maupun encoder yang bagus untuk bitrate rendah.

MP3 mempunyai beberapa batasan/limit:

  • Bit rate terbatas, maksimum 320 kbit/s (beberapa encoder dapat menghasilkan bit rate yang lebih tinggi, tetapi sangat sedikit dukungan untuk mp3-mp3 tersebut yang memiliki bit rate tinggi)
  • Resolusi waktu yang digunakan mp3 dapat menjadi terlalu rendah untuk sinyal-sinyal suara yang sangat transient, sehingga dapat menyebabkan noise.
  • Resolusi frekuensi terbatasi oleh ukuran window yang panjang kecil, mengurangi efisiensi coding
  • Tidak ada scale factor band untuk frekuensi di atas 15,5 atau 15,8 kHz
  • Mode jointstereo dilakukan pada basis per frame
  • Delay bagi encoder/decoder tidak didefinisikan, sehingga tidak ada dorongan untuk gapless playback (pemutaran audio tanpa gap). Tetapi, beberapa encoder seperti LAME dapat menambahkan metadata tambahan yang memberikan informasi kepada MP3 player untuk mengatasi hal itu.

Desain

Struktur file

File MP3 terdiri dari bingkai MP3, yang terdiri dari header dan blok data.[7] Urutan bingkai ini disebut aliran dasar.[8] Karena adanya "reserve bit", frame bukanlah elemen independen dan biasanya tidak dapat diekstraksi pada batas frame yang berubah-ubah. Blok data MP3 berisi informasi audio (terkompresi) dalam bentuk frekuensi dan amplitudo.[9]

Pengkodean dan penguraian kode

Kompresi MP3 bekerja dengan mengurangi keakuratan komponen suara tertentu,[10] yang diyakini (menurut analisis psikoakustik) berada di luar kemampuan pendengaran sebagian besar orang.[11][12] Metode ini biasanya disebut sebagai pengkodean perseptual atau pemodelan psikoakustik. Informasi audio yang tersisa kemudian direkam dengan cara yang ekonomis menggunakan algoritme MDCT dan FFT.

Kualitas

Dalam pengkodean audio lossy, seperti membuat aliran data MP3, ada pertukaran antara jumlah data yang dihasilkan dan kualitas suara. Pengguna yang membuat MP3 memilih kecepatan bit, yang menentukan berapa kilobyte per detik audio yang diperlukan. Semakin tinggi bit rate, semakin besar aliran data MP3 dan biasanya akan semakin mendekati rekaman aslinya.[13][14] Jika kecepatan data terlalu rendah, artefak kompresi (t. е. suara yang tidak ada dalam rekaman asli) dapat didengar saat pemutaran. Beberapa suara sulit dikompresi karena keacakan dan perubahan volume yang tiba-tiba. Ketika suara tersebut dikompresi, artefak seperti dering atau gema biasanya terdengar.

Referensi

  1. ^ "Happy Birthday MP3!". Fraunhofer IIS. 12 July 2005. Diakses tanggal 18 July 2010. 
  2. ^ "The audio/mpeg Media Type — RFC 3003". IETF. November 2000. Diakses tanggal 7 December 2009. 
  3. ^ "MIME Type Registration of RTP Payload Formats — RFC 3555". IETF. July 2003. Diakses tanggal 7 December 2009. 
  4. ^ "A More Loss-Tolerant RTP Payload Format for MP3 Audio — RFC 5219". IETF. February 2008. Diakses tanggal 7 December 2009. 
  5. ^ a b "ISO/IEC 11172-3:1993 – Information technology — Coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbit/s — Part 3: Audio". ISO. 1993. Diakses tanggal 14 July 2010. 
  6. ^ "ISO/IEC 13818-3:1995 – Information technology — Generic coding of moving pictures and associated audio information — Part 3: Audio". ISO. 1995. Diakses tanggal 14 July 2010. 
  7. ^ "Explaining MP3: Definition, Origins, Compression, Design". www.techquintal.com. Diakses tanggal 2024-11-15. 
  8. ^ "MP3: Anatomy of an Audio File". www.dataconversionlaboratory.com. Diakses tanggal 2024-11-15. 
  9. ^ "What is an MP3 file?". docs.fileformat.com. Diakses tanggal 2024-11-15. 
  10. ^ "MP3 Converter". itkool.com. Diakses tanggal 2024-11-15. 
  11. ^ "How Does MP3 Compression Work?". ledgernote.com. Diakses tanggal 2024-11-15. 
  12. ^ "Audio Compression: Psychoacoustics of MP3". mdsoar.org. Diakses tanggal 2024-11-15. 
  13. ^ "What Data Compression Does To Your Music". www.soundonsound.com. Diakses tanggal 2024-11-15. 
  14. ^ "The relationship between MP3 frequencies, bit rates, bit rates, and sound quality". topic.alibabacloud.com. Diakses tanggal 2024-11-15. 

Pranala luar