Kuo skiriasi FASTA ir FASTQ

Turinys:

Kuo skiriasi FASTA ir FASTQ
Kuo skiriasi FASTA ir FASTQ

Video: Kuo skiriasi FASTA ir FASTQ

Video: Kuo skiriasi FASTA ir FASTQ
Video: 10 лучших продуктов для перерыва 2024, Lapkritis
Anonim

Pagrindinis skirtumas tarp FASTA ir FASTQ yra tas, kad FASTA yra teksto formatas, kuriame saugomos tik nukleotidų arba b altymų sekos, o FASTQ yra tekstu pagrįstas formatas, kuriame saugomos ir sekos, ir susijusios sekos kokybės reikšmės.

Bioinformatika yra sritis, kurioje naudojama skirtinga programinė įranga biologiniams duomenims analizuoti ir suprasti, ypač kai duomenų rinkinys yra sudėtingas ir didelis. Ši sritis apjungia biologiją, chemiją, fiziką, kompiuterių mokslą, informacijos inžineriją, matematiką ir statistiką, kad analizuotų ir interpretuotų biologinius duomenis. FASTA ir FASTQ yra du sekos vaizdavimo formatai bioinformatikos srityje, siekiant suderinti ir analizuoti sekas. Tiesą sakant, FASTQ yra sekos failo formatas, kuris praplečia FASTA formatą ir gali išsaugoti sekos kokybę.

Kas yra FASTA?

FASTA yra DNR ir b altymų sekos derinimo programinė įranga. FASTA programinė įranga naudoja FASTA formatą. Tai tekstas pagrįstas formatas, vaizduojantis arba nukleotidų sekas, arba aminorūgščių (b altymų) sekas. Čia vienos raidės kodai žymi abi šias sekas. FASTA yra svarbi priemonė bioinformatikos ir biochemijos srityse. Šis formatas leidžia sekų pavadinimus ir komentarus pateikti prieš sekas.

FASTA vs FASTQ lentelės forma
FASTA vs FASTQ lentelės forma

01 pav.: FASTA seka

Šis formatas atsirado iš FASTA programinės įrangos ir 1985 m. jį pristatė Davidas J. Lipmannas ir Williamas R. Pearsonas. Laikui bėgant FASTA įrankis buvo daug modifikuotas, o naujausią versiją sudaro programos, skirtos b altymams: b altymams, DNR:DNR, b altymas:išversta DNR (su kadrų poslinkiais) ir sutvarkytos arba netvarkingos peptidų paieškos. FASTA nuskaito nurodytą nukleotidų arba aminorūgščių seką ir ieško atitinkamos sekos duomenų bazės naudodama vietinį sekų derinimą, kad surastų panašių duomenų bazės sekų atitikmenis.

Kas yra FASTQ?

FASTQ yra bioinformatikos srityje naudojama derinimo programinė įranga, kuri saugo ir biologinę seką (dažniausiai nukleotidų seką), ir atitinkamus kokybės balus. „Wellcome Trust Sanger Institute“iš pradžių FASTQ sukūrė FASTA formato sekai ir susijusiems kokybės duomenims susieti. Tobulėjant bioinformatikos sričiai, FASTQ tapo de facto standartu, leidžiančiu saugoti daugelio didelio našumo sekos nustatymo prietaisų išvestį.

FASTQ formato sekoje naudojamos keturios skirtingos eilutės. 1 eilutė prasideda @ simboliu, o po jos pateikiamas sekos identifikatorius (panašus į FASTA pavadinimo eilutę). 2 eilutė susideda iš neapdorotų sekos raidžių. 3 eilutėje seka prasideda simboliu „+“ir pasirinktinai seka tas pats sekos identifikatorius.4 eilutėje užkoduotos 2 eilutės sekos kokybės reikšmės ir ją turėtų sudaryti toks pat simbolių skaičius, kaip ir raidžių sekoje.

Kokie yra FASTA ir FASTQ panašumai?

  • FASTA ir FASTQ yra lygiavimo įrankiai.
  • Tai yra du sekos vaizdavimo formatai.
  • Abu yra susiję su bioinformatikos sritimi.
  • Tiek FAST, tiek FASTQ yra svarbūs saugojimo ir sekos nustatymo įrankiai.
  • FASTQ yra FASTA formato plėtinys su galimybe išsaugoti sekos kokybę.

Kuo skiriasi FASTA ir FASTQ?

FASTA yra teksto formatas, kuriame saugomos tik nukleotidų arba b altymų sekos, o FASTQ yra teksto formatas, kuriame saugomos ir sekos, ir susijusios sekos kokybės reikšmės. Taigi, tai yra pagrindinis skirtumas tarp FASTA ir FASTQ. Be to, FASTA saugo sekos fragmentus po atvaizdavimo, o FASTQ saugo sekos fragmentus prieš kartografavimą. Be to, kitas skirtumas tarp FASTA ir FASTQ yra tas, kad FASTA susideda iš vienos aprašo eilutės, o FASTAQ – iš keturių eilučių.

Toliau pateiktoje infografikoje pateikiami skirtumai tarp FASTA ir FASTQ lentelės pavidalu, kad būtų galima palyginti.

Santrauka – FASTA vs FASTQ

Bioinformatika naudoja skirtingus sekų formatus, pvz., FASTA ir FASTQ ir tt. FASTA išsaugo sekos fragmentus po susiejimo, o FASTQ saugo sekos fragmentus prieš kartografavimą. FASTA yra DNR ir b altymų sekos derinimo programinė įranga. Jį sudaro programos, skirtos b altymas:b altymas, DNR:DNR, b altymas:išversta DNR (su kadrų poslinkiais) ir užsakytos arba netvarkingos peptidų paieškos. FASTQ yra derinimo programinė įranga, naudojama bioinformatikos srityje ir saugo tiek biologinę seką (dažniausiai nukleotidų seką), tiek atitinkamus kokybės balus. FASTA susideda iš vienos aprašo eilutės, o FASTQ – iš keturių eilučių. Taigi, tai apibendrina skirtumą tarp FASTA ir FASTQ.

Rekomenduojamas: