Ensembl

Kohteesta Wikipedia
Siirry navigaatioon Siirry hakuun

Ensembl on Euroopan bioinformaatioiden instituutin ja Sanger instituutin yhteenliittymä joka on perustettu vuonna 1999 Human Genome Projectin valmistuttua. Ensemblin tehtävä on tarjota keskitetty tietolähde genetiikan, molekyylibiologian, ja muiden tutkijoiden käyttöön jotka tutkivat selkärankaisten genomeja.

Ensemblin kanssa vastaavia tietokantoja ovat NCBI ja USCS Genome browser.

Tausta[muokkaa | muokkaa wikitekstiä]

Ihmisen genomi sisältää kolme miljoonaa emäsparia jotka ovat koodattu 20 000 - 25 000 geeniin. Pelkällä genomilla on vain vähän käyttöä mikäli geenien sijaintia ja keskenäisiä vuorovaikutuksia ei kyetä tunnistamaan. Yhtenä vaihtoehtona on käsityönä tehtävä geenien selvittäminen. Tässä tavassa joukko tutkijoita yrittää paikallistaa geenejä hyödyntäen tutkimustyössä syntynyttä dataa ja julkisia tietokantoja. Tämä on hidas tapa. Toinen tapa on automaattinen tiedonetsintä jossa käytetään tietokoneiden laskentatehoa sekvenssien laskemiseen.

Ensembl projektissa sekvenssidata on purettu muistiinpanosysteemiin ( kokoelmaan ohjelmaputkia jotka on kirjoitettu Perl illä joka tekee tunnettujen geenien sijainnista tietokannan ja tallentaa ne MySQL tietokantaan tulevaa analysointia ja käyttöä varten. Ensembl tekee datasta vapaasti saatavaa tutkijoiden käyttöön. Kaikki Ensemblin tuottama data ja ohjelmakoodi on ladattavissa ja käyttäjille on olemassa myös julkinen tietokantapalvelin. Ensemblin nettisivusto tarjoaa myös visuaalisia näkymiä kerättyyn dataan.

Ajan kanssa projekti on laajentunut kattamaan keskeisiä tutkimustyössä käytettäviä eläimiä kuten Hiiri, Banaanikärpänen ja seeprakala. Näiden lisäksi on laajempi kirjo genomin dataa kuten geenien muuntelua ja muita ominaisuuksia. Huhtikuusta 2009 lähtien sisarprojekti Ensebl genomes on laajentanut tutkimuksia koskemaan kasveja sieniä bakteereja ja alkueliöitä alkuperäisen projektin keskittyessä selkärankaisiin.

Aiheesta muualla[muokkaa | muokkaa wikitekstiä]