Format FASTQ
Format file
Format FASTQ merupakan format berbasis teks untuk meyimpan sekuen data biologi (nukleotida) dan nilai kualitasnya. Hal ini berbeda dengan format FASTA yang hanya menuliskan sekuen data biologi. Nilai kualitas dari sekuen ditulis dalam deret ASCII. Format ini pertama kali dikembangkan oleh Wellcome Trust Sanger Institute untuk menyatukan FASTA dan nilai kualitasnya, tetapi saat ini telah digunakan oleh untuk menyimpan hasil sekuensing dari Illumina.[1]
Format
Berkas FASTQ memiliki format sebagai berikut:
- Baris pertama dimulai dengan simbol @ dan diikuti dengan pengenal sekuen, seperti berkas FASTA pada umumnya.[1]
- Baris kedua diisi dengan sekuen nukleotida.[1]
- Baris ketiga dimulai dengan simbol + dan umumnya diisi seperti baris pertama, tetapi ini hanyalah sebuah opsi.[1]
- Baris keempat diisi dengan kualitas sekuen dari baris kedua.[1]