Bio-informatica

Moderator: ArcherBarry

Reageer
Berichten: 71

Bio-informatica

voor het vak NLT hebben we een Reading Frame gekregen van 5429 nucleotide. Nu heb ik daarvan het pre-mRNA gemaakt. Ik heb aangenomen dat pre-mRNA hetzelfde is als mRNA (is dit niet zo hoor ik het dan graag) en dit heb ik vertaald naar een aminozuursequentie. Deze heb ik via de website http://fungen.wur.nl/~rkuipers/index.php?mode=blast geBLAST. Hieruit kwam o.a. het volgende:

Formaat: FASTA

Type: eiwit

Lengte: 71

>Sequentie1 YMVVDDGHYCPDRLCRGKRYHHRSPFLRLNFSSEPLKLCHGKLPLLFYPVPSLFKDSNFC LNLSDLRFQTT

Resultaten

gi|32892174|gb|AAP50841.1|

Soortnaam: Monodelphis domestica

Eiwitfunctie: BRCA1

Hit length: 20; Bit-score: 22,3

Query: GKRYHHRSPFLRLNFSSEPL

Alignment: GK YH +S LN+ +E L

Hit: GKTYHRKSVHTNLNYVTENL

Nu wordt er gevraagd op welk chromosoom dit gen is gelegen en welke functie dat heeft. Dat moet ik doen aan de hand van de gevonden internationale gennaam en internationale codering. Wat is nu in het bovenstaande stuk de internationele gennaam en codering. En hoe kan ik hieruit leiden op welk chromosoom dit gen is gelegen en welke functie het heeft. Ik vraag om een voorbeeld, niet om een antwoord. Ik moet er namelijk nog 6 andere doen.

Alvast bedankt voor de hulp

Berichten: 339

Re: Bio-informatica

* pre-mRNA bevat ook intronen; deze worden er uit-ge'splice'd, en er wordt een poly-A staart toegevoegd om mRNA te maken.

* Je kunt misschien beter het pre-mRNA blasten tegen het genoom (DNA), dan het afgeleide eiwitsequentie tegen een eiwit-bank. Zeker als je wilt weten op welk chromosoom je gen te vinden is.

* Let goed op met welke data je in welke databank zoekt (DNA, RNA, eiwit; reference sequence of raw) en op welk organisme je resultaat betrekking heeft. In dit geval dus blijkbaar de kortstaartoppossum. Is dat wat je wilt? Of wil je weten waar het gen bij mens of rat te vinden is?

* Officiele benamingen voor genen worden toegekend door: http://www.genenames.org/ (tenminste voor mensen). In bovenstaande voorbeeld is BRCA1 het gen, wat volgens genoemde site (genenames) op 17 ligt (bij de mens). Maar dat kan ik niet afleiden uit de info die je geeft, maar omdat ik de letters BRCA1 herken als een bekend gen.

* Waarom gebruik je niet de NCBI databanken? Bv. om te blast-en: http://www.ncbi.nlm.nih.gov/BLAST/

Berichten: 71

Re: Bio-informatica

Ik weet dat het OLR dat ik heb gekregen op chromosoom 13 ligt bij een homo sapiens. Dus gewoon bij een mens.

Je hebt het over intronen uit het pre-mRNA te uitsplicen en over een poly-A staart om zo het mRNA te krijgen. Hoe doe ik dit? Er staat niks over in de module van NLT :S

En over BRCA1. Dit is dus borst kanker 1 in vroege fase.

Dan weet ik de codering dus en de gennaam.

Bij de volgende vraag moet ik bepalen welk aminozuur (mRNA triplet) in het gevonden genexpressie-product afwijkt t.o.v. het normale eiwit. Geef exact deze sequentie de positie (aminozuurnummer) en variatie/afwijking aan.

Wat is het normale eiwit?

Gebruikersavatar
Berichten: 4.220

Re: Bio-informatica

Gesp geeft je een goede suggestie: blast (NCBI zou ik gebruiken) tegen het humaan genoom. Je krijgt dan vrijwel zeker een gen waar de sequentie uit komt en dan kan je verder zoeken naar je eiwit met die data: van bekende genen is ook de mRNA sequentie bekend.

Over BRCA1 zeg je "Dit is dus borst kanker 1 in vroege fase." Maar dat moet je eigenlijk wat meer nuanceren: zoek de functie even na op Entrez Gene. Daar kan je overigens ook zat info vinden over mRNA, eiwit, etc.

Voor meer info over eiwitten: Uniprot bijvoorbeeld.
Of course, the theory of relativity only works if you're going west.

-Calvin-

Berichten: 339

Re: Bio-informatica

Waarschijnlijk is jullie cursus geschreven op een wat vereenvoudigde versie van BLAST, om de opdrachten niet te moeilijk te maken, dus ik heb nog wat beter naar deze site gekeken (anders is de hulp slechts averechts).

http://fungen.wur.nl/~rkuipers/index.php?mode=blast

De Blast-versie op deze website zoekt in een eiwitbank. Je kunt echter ook nucleotidesequentie invoeren, dan zet het programma het automatisch om in een aminozuurvolgorde.

De antwoorden die gevonden hebben hebben waren 5 als onderstaande, er zijn dus tenminste 5 eiwitten in de bank gevonden waarop jou lettervolgorde lijkt. Wat betekenen de verschillende regels?
gi|32892174|gb|AAP50841.1| > dit is een naam voor een aminozuurvolgorde (eiwit) in de bank

Soortnaam: Monodelphis domestica > dit is het organisme waaruit het eiwit komt, dus: kortstaartoppossum

Eiwitfunctie: BRCA1 > Dit is (blijkbaar) de naam voor het eiwit (hoewel er "functie" staat).

Hit length: 20; Bit-score: 22,3

> van je 71 aminozuren is over een lengte van 20 aminozuren een overeenkomst gevonden

> met de genoemd Bit-score


Query: GKRYHHRSPFLRLNFSSEPL > dit is een deel van wat je hebt opgegeven

Alignment: GK YH +S LN+ +E L

Hit: GKTYHRKSVHTNLNYVTENL > dit is een deel van het eiwit in de bank waarop het lijkt
De tussenliggende regel (alignment) laat de overeenkomst zien: slechts 9 aminozuren (op 71). Dit is dus een lage score, en niet het eiwit waarnaar je zoekt (maar iets wat een beetje lijkt op wat je zoekt). Dit Bit-score is immers ook veel te laag.

Waarschijnlijk is je omzetting van DNA > pre-mRNA > veronderstelde aminozuurvolgorde niet helemaal gelukt. Of je hebt een eiwit ontdekt wat niet in je databank zit (maar dat is in dit geval minder waarschijnlijk).

Suggestie: probeer het hele OLR te blasten (als nucleotidesequentie).

Je overige vragen waren:

* Hoe vind ik de intronen?

De intronen zijn die stukken uit je pre-mRNA die niet in het uiteindelijke eiwit zijn terug te vinden.

* Wat is het normale eiwit?

Als de sequentie waarmee je zoekt afkomstig is uit een patient, en de bank bestaat uit referentie-volgordes dan is het de bank. Maar als je een gezond persoon hebt sequenced, en de bank is een verzameling van patientenmateriaal dan is het (waarschijnlijk) andersom. Het hangt er dus vanaf waarmee je zoekt, en waar je in zoekt.

Reageer