Genomika, bioinformatika

Obor Genomika se zabývá komplexní analýzou genomů různých organismů. K tomuto účelu využívá různé metody molekulární biologie a to především sekvenování DNA v kombinaci s klonováním úseků DNA do vektorů.

V současné době je známa kompletní sekvence desítek genomů, a to nejen bakteriálních, ale i genomů vyšších organismů, např. kvasinky Saccharomyces cerevisiae (12 Mbp), drozofily (137 Mbp) a od roku 2000 je známá i nukleotidová sekvence lidského genomu (3 Gbp).

Genomové sekvence představují obrovský objem biologických dat, který nelze zpracovávat bez odpovídajícího počítačového vybavení. Pro účely přehledného uchovávání biologických dat, vyhledávání potřebných informací a jejich následné analýzy jsou využívány přístupy bioinformatiky.

Termín bioinformatika se objevil poprvé v roce 1991, představuje spojení dvou technologií (oblast molekulární biologie a biotechnologií a oblast informačních technologií), u nichž došlo v posledních letech k explozivnímu růstu nových poznatků. Hlavní oblastí zájmu bioinformatiky je vyhledávání informací v databázích, srovnávání sekvencí nukleových kyselin a proteinů, vyhledávání genů, funkční genomika, klasifikace proteinů a proteomika, fylogenetické studie a srovnávací genomika.

Shromažďováním a správou dat, vývojem nástrojů pro jejich analýzu a poskytováním informací se ve světě zabývá několik institucí. Na internetových stránkách těchto institucí jsou veřejně přístupné biologické databáze, které obsahují rozsáhlé soubory dat (nukleotidových nebo aminokyselinových sekvencí), které jsou obvykle spojeny s počítačovým softwarem pro aktualizaci a vyhledávání dat.


Nejdůležitější databáze sekvencí nukleových kyselin a proteinů:

Databáze EMBL byla zřízená v roce 1980 jako první databanka nukleotidových sekvencí Evropskou molekulárně biologickou laboratoří (EMBL - European Molecular Biology Laboratory) ve Velké Británii. Je veřejně přístupná na stránkách Evropského institutu pro bioinformatiku (EBI - European Bioinformatic Institute) http://www.ebi.ac.uk.

Databáze DDBJ zahájila svojí činnost v roce 1984, shromažďuje data především z japonských výzkumů. Databáze je spravována Centrem informační biologie (CIB - Center for Information Biology, založen v roce 1995 jako oddělení Národního genetického institutu) v Japonsku a je veřejně přístupná na adrese http://www.ddbj.nig.ac.jp/.

GenBank byla založena v roce 1992. Databázi nukleotidových sekvencí spravuje Národní centrum biotechnologických informací (NCBI - National Center for Biotechnology Information). Je přístupná na adrese http://www.ncbi.nlm.nih.gov/.

Swiss-Prot a TrEMBL je databáze zřízená v roce 1986 Švýcarským institutem pro bioinformatiku (SIB - Swiss Institute of Bioinformatics). Databáze obsahuje aminokyselinové sekvence proteinů a je přístupná na adrese http://www. expasy.org/sprot/.


Množství molekulárně-biologických dat se zvyšuje tak rychle, že je nezbytné mít k dispozici prostředky, pomocí kterých můžeme k těmto datům snadno přistupovat. Existují tři prostředky na získávání informací, které jsou vstupním bodem do několika (až 80) integrovaných databází: Entrez (vyvinut v NCBI, http://www.ncbi.nlm.nih.gov/Entrez/), SRS (Sequence Retrieval System, vyvinut v EBI, http://srs.ebi.ac.uk/) a DBGET/Link DB (Integrated Database Retrieval System, vyvinut v Institutu pro chemický výzkum v Japonsku, http://www.genome.ad.jp/dbget/).

Nukleotidové sekvence můžeme pomocí počítačových analýz dále zpracovávat. Pomocí vhodného softwaru je možné identifikovat geny, jejich strukturu (exony a introny), nebo regulační oblasti (např. promotory, terminátory transkripce atd.). Na základě nalezených genů můžeme, opět s použitím vhodného softwaru, stanovit aminokyselinovou sekvenci proteinů kódovaných těmito geny a stanovit jejich základní charakteristiky (např. sekundární strukturu). Software vhodný k podobným analýzám je volně přístupný na Internetu např. na adresách http://www.ensembl.org nebo http://www.expasy.org.

Kromě výše zmíněné základní charakterizace lze také srovnávat nukleotidové sekvence různých buněk (organizmů, druhů atd.) mezi sebou, což je náplní komparativní (srovnávací) genomiky. Můžeme např. identifikovat rozdíly mezi genomy příbuzných druhů a určit tak jejich evoluční příbuznost.

Tyto výukové materiály byly spolufinancovány Evropským sociálním fondem a státním rozpočtem ČR.

 
Logo OPVK

OPVK

Veterinární a farmaceutická univerzita Brno

Palackého 1/3, 612 42 Brno

tel.: +420 54156 1111
IČ 62157124