GenBank
| GenBank | |
|---|---|
| Skraćenica | GB |
| Prethodnik | Novoosnovana |
| Datum osnivanja | 1982. |
| Vrsta | Javna baza podataka o nukleotidima |
| Status | Aktivan |
| Cilj | Prikupljanje nolvih podataka o nukleotidima i genima Do 2023.: Nukleotidne sekvence za više od 300.000 organizama s pratećom bibliografskom i biološkom napomenom |
| Glavno sjedište | NCBI |
| Članstvo | Neograničeni |
| Jezik | Engleski |
| Ključne osobe | Walter Goad |
| Glavni organ | Uredništvo |
| Br. zaposlenih | ? |
| Veb-sajt | = NCBI |
GenBank baza podataka sekvenci je otvoreno pristupna, označena zbirka svih javno dostupnih nukleotidnih sekvenci i njihovih proteinskih prijevoda. Proizvodi ga i održava Nacionalni centar za informacije o biotehnologiji (NCBI; dio Nacionalnih instituta za zdravlje u Sjedinjenim Državama) kao dio Međunarodne baze podataka o nukleotidnim sekvencama Saradnja (INSDC).
GenBank i njeni saradnici primaju sekvence proizvedene u laboratorijama širom svijeta od više od 500.000 formalno opisanih vrsta.[1] Bazu podataka pokrenuli su Walter Goad i Nacionalna laboratorija Los Alamosa, 1982. GenBank je postala važna baza podataka za istraživanja u biološkim poljima i rastao je posljednjih godina eksponencijalnom stopom udvostručavajući se otprilike svakih 18 mjeseci.[2][3]
Izdanje 250.0, objavljeno u junu 2022., sadržavalo je preko 17 triliona nukleotidnih baza u više od 2,45 milijardi sekvenci.[4] GenBank je napravljen direktnim podnošenjem iz pojedinačnih laboratorija, kao i iz masovnih predaja iz velikih centara sekvenciranje.
Prijave
GenBank se mogu poslati samo originalne sekvence. Direktno podnošenje se vrši GenBank koristeći BankIt, koji je web-bazirani obrazac, ili samostalni program za podnošenje, Sequin. Po prijemu predaje sekvence, osoblje GenBank-a ispituje originalnost podataka i dodjeljuje pristupni broj sekvenci i vrši provjere osiguranja kvaliteta. Prijave se zatim puštaju u javnu bazu podataka, gdje se unosi mogu pronaći putem Entrez ili preuzeti putem FTP. Grupno slanje eksprimirana oznaka sekvence (EST), lokacija označena sekvencom (STS), sekvenca istraživanja genoma (GSS) i sekvenca genoma visoke propusnosti (HTGS) podatke najčešće dostavljaju veliki centri za sekvenciranje. Grupa za direktno podnošenje GenBank-a također obrađuje kompletne sekvence mikrobnog genoma.[5][6]
Baza podataka GenBank uključuje dodatne skupove podataka koji su konstruisani mehanički iz prikupljanja podataka glavne sekvence, i stoga su isključeni iz ovog brojanja.
| Organizam | Bazni parovi |
|---|---|
| Triticum aestivum | 2,15443744183×1011 |
| SARS-CoV-2 | 1,65771825746×1011 |
| Hordeum vulgare ssp. vulgare | 1,01344340096×1011 |
| Mus musculus | 3,0614386913×1010 |
| Homo sapiens | 2,7834633853×1010 |
| Avena sativa | 2,1127939362×1010 |
| Escherichia coli | 1,5517830491×1010 |
| Klebsiella pneumoniae | 1,1144687122×1010 |
| Danio rerio | 1,0890148966×1010 |
| Bos taurus | 1,0650671156×1010 |
| Triticum turgidum subsp. durum | 9,981529154×109 |
| Zea mays | 7,412263902×109 |
| Avena insularis | 6,924307246×109 |
| Secale cereale | 6,749247504×109 |
| Rattus norvegicus | 6,548854408×109 |
| Aegilops longissima | 5,920483689×109 |
| Canis lupus familiaris | 5,776499164×109 |
| Aegilops sharonensis | 5,272476906×109 |
| Sus scrofa | 5,179074907×109 |
| Rhinatrema bivittatum | 5,178626132×109 |
Također pogledajte
- Ensembl
- Referentna baza podataka o ljudskim proteinima (HPRD)
- Analiza sekvence
- UniProt
- Entrez
- Lista sekvenciranih eukariotskih genoma
- Lista sekvenciranih arhealnih genoma
- RefSeq — baza podataka referentnih sekvenci
- Geneious — uključuje GenBank alat za podnošenje
- Otvoreni naučni podaci
- Proteinska banka podataka
Reference
- ^ Eric W Sayers; Mark Cavanaugh; Karen Clark; Kim D Pruitt; Conrad L Schoch; Stephen T Sherry; Ilene Karsch-Mizrachi (7. 1. 2022). "GenBank". Nucleic Acids Archive. 50 (D1): D161–D164. doi:10.1093/nar/gkab1135.
- ^ Benson D; Karsch-Mizrachi, I.; Lipman, D. J.; Ostell, J.; Wheeler, D. L.; et al. (2008). "GenBank". Nucleic Acids Research. 36 (Database): D25–D30. doi:10.1093/nar/gkm929. PMC 2238942. PMID 18073190.
- ^ Benson D; Karsch-Mizrachi, I.; Lipman, D. J.; Ostell, J.; Sayers, E. W.; et al. (2009). "GenBank". Nucleic Acids Research. 37 (Database): D26–D31. doi:10.1093/nar/gkn723. PMC 2686462. PMID 18940867.
- ^ a b "GenBank release notes (Release 250)". NCBI. 15. 6. 2022. Pristupljeno 20. 7. 2022.
- ^ "How to submit data to GenBank". NCBI. Pristupljeno 20. 7. 2022.
- ^ "GenBank Submission Types". NCBI. Pristupljeno 20. 7. 2022.
Vanjski linkovi
- GenBank
- Example sequence record, for hemoglobin beta
- BankIt
- Sequin — a stand-alone software tool developed by the NCBI for submitting and updating entries to the GenBank sequence database.
- EMBOSS — free, open source software for molecular biology
- GenBank, RefSeq, TPA and UniProt: What's in a Name?
Content Disclaimer
Informasi ini disarikan dari Wikipedia dan disajikan kembali untuk tujuan edukasi. Konten tersedia di bawah lisensi CC BY-SA 3.0. Kami tidak bertanggung jawab atas ketidakakuratan data yang bersumber dari kontribusi publik tersebut.
- The information displayed on this website is sourced in part or in whole from Wikipedia and has been adapted for the purpose of restating it. We strive to provide accurate and relevant information, however:
- There is no guarantee of absolute accuracy. Wikipedia is an open, collaborative project that can be edited by anyone, so information is subject to change.
- It is not intended to constitute professional advice. The content displayed is for informational and educational purposes only. For important decisions (e.g., medical, legal, or financial), please consult a professional.
- Content copyright. Wikipedia is licensed under the Creative Commons Attribution-ShareAlike License (CC BY-SA). This means that content may be reused with appropriate attribution and shared under a similar license.
- Responsible use. Any risk arising from the use of information from this website is entirely the responsibility of the user.









