Springen naar inhoud

Bio-informatica: vinden van homologen



  • Log in om te kunnen reageren

#1

Themisto

    Themisto


  • >25 berichten
  • 86 berichten
  • Ervaren gebruiker

Geplaatst op 05 april 2012 - 14:55

Hallo iedereen,

Momenteel ben ik bezig met opgaven maken voor de module bio-informatica. Hierbij moeten we met behulp van Entrez en UniProtKB (voorkeur voor swiss-prot) de paralogen en orthologen van bepaalde eiwitten opzoeken.

Nu weet ik al dat je met behulp van BLAST naar de E-waardes kan kijken om te zien in hoeverre een gevonden eiwit verwant is aan de ingevoerde sequentie. Maar wat is eigenlijk de cut-off waarde van de E-waardes, waarbij je een eiwit wel/niet een homoloog van de ingevoerde sequentie kan benoemen?

Wat ik echter lastiger vind is vanuit de UniProtKB entry van één eiwit de paralogen en orthologen op te zoeken. Ik snap hoe een fylogenetische boom in elkaar steekt, dat paralogen eiwitten zijn van hetzelfde organismen die verwant aan elkaar zijn en orthologen verwante eiwitten zijn in een ander organisme.

Kunnen jullie mij misschien duidelijk maken hoe ik dit moet aanpakken?

Dit forum kan gratis blijven vanwege banners als deze. Door te registeren zal de onderstaande banner overigens verdwijnen.

#2

rwwh

    rwwh


  • >5k berichten
  • 6847 berichten
  • Moderator

Geplaatst op 05 april 2012 - 20:53

Ik ben geen ervarings-expert, dus ik kan alleen vanuit mijn gevoel van statistiek antwoorden.

De E-waarde in BLAST is een schatting van het aantal hits dat je zou kunnen vinden als de database volledig willekeurig zou zijn. Dus E=1 betekent ongeveer dat 1 van je hits puur toeval zou kunnen zijn, je verwacht 1 hit als er geen informatie in zit. De E waarde neemt heel snel af als je sequenties langer zijn.

Er is natuurlijk geen "harde limiet" waaronder je kunt zeggen "dit is een homoloog" en erboven niet. Het gaat allemaal om waarschijnlijkheden.

#3

Themisto

    Themisto


  • >25 berichten
  • 86 berichten
  • Ervaren gebruiker

Geplaatst op 11 april 2012 - 07:11

Bedankt rwwh voor je antwoord. Ik ben het eens met wat je daar zegt, daarom vind ik dit ook een lastig onderwerp. Want stel iemand vraagt aan mij "Zoek alle paralogen op van dUTPase uit het organisme Escherischia Coli", dan kan ik hier niet zo 1 2 3 een antwoord op vinden.

#4

Sjitty

    Sjitty


  • >250 berichten
  • 320 berichten
  • Ervaren gebruiker

Geplaatst op 11 april 2012 - 10:22

Bedoel je dan dat je niet goed weet hoe het onderscheid te maken tussen paralogen en homologen in de lijst van hits? Indien zo kun je toch gewoon kijken uit welk organisme je hit komt, indien dezelfde, paraloog, indien een ander, homoloog.

#5

Themisto

    Themisto


  • >25 berichten
  • 86 berichten
  • Ervaren gebruiker

Geplaatst op 12 april 2012 - 07:35

Bedoel je dan dat je niet goed weet hoe het onderscheid te maken tussen paralogen en homologen in de lijst van hits? Indien zo kun je toch gewoon kijken uit welk organisme je hit komt, indien dezelfde, paraloog, indien een ander, homoloog.


Ik denk dat je hier het verschil tussen paralogen en orthologen bedoeld, zowel paralogen als orthologen zijn homologen namelijk. Maar is het echt zo makkelijk dan? Want als ik de vraag krijg "Zoek alle paralogen op dUTPase uit het organisme Escherichia Coli", dan vermoed ik dat er toch een bepaalde grenswaarde is aan het aantal paralogen en dat je die dan ook moet kunnen onderscheiden.

Vooral bij het BLASTen van een aminozuurvolgorde krijg je vele hits, als je hieruit alle paralogen moet opzoeken dan lijkt me dat een ongedane kwestie. Of is er een manier om deze lijst te vereenvoudigen of om de database zelf de opdracht te geven om paralogen/orthologen op te zoeken? (Ik heb het hier m.n. over UniProtKB)

Veranderd door Callisto, 12 april 2012 - 07:36







Also tagged with one or more of these keywords: biologie

0 gebruiker(s) lezen dit onderwerp

0 leden, 0 bezoekers, 0 anonieme gebruikers

Ook adverteren op onze website? Lees hier meer!

Gesponsorde vacatures

Vacatures