Άσκηση 6
Αναζήτηση
και ανάλυση ακολουθιών πρωτεϊνών χρησιμοποιώντας το Internet
Οι περισσότερες ασκήσεις που αναπτύσσονται παρακάτω χρησιμοποιούν την μέθοδο της αντιγραφής μιάς νουκλεοτιδικής ή πρωτεϊνικής ακολουθίας από παράθυρο (Netscape ή Explorer) σε παράθυρο. Γι’αυτό είναι χρήσιμο να χρησιμοποιούνται
δύο παράθυρα ταυτόχρονα με το ίδιο πρόγραμμα δικτύου (Netscape ή Explorer) και την μεταφορά της πληροφορίας με
«Αποκοπή-Επικόλληση» (Cut-Paste).
Διαδικτυακά κέντρα (Internet Sites) που θα χρησιμοποιηθούν:
1. Αναζητώντας ακολουθίες στις πρωτεϊνικές βάσεις δεδομένων με την χρήση του FASTA.
A. Χρησιμοποιείστε
το FASTA για την αναγνώριση ομολόγων της SRP54 πρωτείνης
από βακτήρια. Επιλέξτε
σαν ακολουθία στόχο την SRP54
πρωτείνη από ποντικό ("sw:sr54_mouse").
B. Η έκφραση από διαβιβαστές της φερριτίνης (ferritin) και τρανσφερριτίνης (transferrin) ρυθμίζετε από μιά πρωτείνη που ονομάζεται πρωτείνη δέσμευσης του IRE (iron responsive element) binding protein. ¨Οταν η αμινοξική της ακολουθία εντοπίστηκε από ένα κλώνο cDNA αναγνωρίστηκε μία μή αναμενόμενη ομολογία με μία άλλη πρωτείνη. Μπορείτε να την βρείτε; Χρησιμοποιείστε το SRS
ή την Entrez για να εντοπίσετε την πρωτεϊνική ακολουθία της IRE binding protein στην β.δ. Swissprot database (Χρησιμοποιείστε iron,responsive
σαν λέξεις κλειδιά). Κατόπιν
χρησιμοποιείστε το FASTA για να την συγκρίνετε με την ίδια βάση . Αναγνωρίζετε
την πρωτείνη που είναι ομόλογη με την IRE
binding protein?
2. Πολλαπλή ευθυγράμμιση
ακολουθιών.
Α. Η ανάλυση των ακολουθιών των πρωτεϊνών των ομοιοτικών γονιδίων της Δροσόφιλάς ( Drosophila homeotic genes) αποκαλύπτει μία περιοχή πολύ συντηρημένη, το homeobox. Στην πρωτείνη antennapedia
(antp) αυτή η ακολουθία είναι:
Arg Arg
Arg Ile Glu Ile Ala His Ala Leu Cys Leu Thr Glu Arg Gln Ile Lys Ile Trp Phe Gln
Asn Arg Arg Met Lys
Εισάγετε την ακολουθία αυτή (με κωδικό ενός γράμματος) στο FASTAκαι αναγνωρίστε ομόλογες ακολουθίες στην β.δ. Κατόπιν επιλέξτε 6-7 από αυτές και
κάνετε πολλαπλή ευθυγράμμιση. Μπορείτε να εντοπίσετε το homeobox motif ;
Το
αποτέλεσμα θα μοιάζει με αυτό που ακολουθεί:
301 350
HMSC_DROME
YPWMKRVHLG TSTVNANGET KRQ.RTSYTR YQTLELEKEF HFNRYLTRRR
HMSC_APIME
.......... ..TVNANGEV KRQ.RTSYTR YQTLELEKEF HFNRYLTRRR
HMAA_DROME
MGSPFERVVC GDFNGPNGCP RRRGRQTYTR FQTLELEKEF HFNHYLTRRR
HMAA_APIME ..........
...PGPNGCP RRRGRQTYTR FQTLELEKEF HYNHYLTRRR
HMAA_SCHGR
.......... .....PNGCP RRRGRQTYTR FQTLELEKEF HFNHYLTRRR
HMUX_DROME
.......... ....GTNG.L RRRGRQTYTR YQTLELEKEF HTNHYLTRRR
HXB6_HUMAN PVYPWMQRMN SCNSSSFGPS GRRGRQTYTR YQTLELEKEF HYNRYLTRRR
351 400
HMSC_DROME
RIEIAHALCL TERQIKIWFQ NRRMKWKKE. HKMASMNIVP YHMGPYGHPY
HMSC_APIME
RIEIAHALCL TERQIKIWFQ NRRMKWKKE. HKMASMNIVP YHMSPYGHPY
HMAA_DROME
RIEIAHALCL TERQIKIWFQ NRRMKLKKEL RAVKEINEQA RRDREEQEKM
HMAA_APIME
RIEIAHALCL TERQIKIWFQ NRRMKLKKEL RAVKEIN... ..........
HMAA_SCHGR
RIEIAHALCL TERQIKIWFQ NRRMKLKKEL RAVKEINEQA RREREEQDRL
HMUX_DROME
RIEMAHALCL TERQIKIWFQ NRRMKLKKEI QAIKELNEQE KQAQAQKAAA
HXB6_HUMAN
RIEIAHALCL TERQIKIWFQ NRRMKWKKES KLLSASQLSA EEEEEKQAE.
3. Πρωτεϊνικές
οικογένειες
Οι τέσσερεις παρακάτω ακολουθίες προέρχονται από ανθρώπινες πρωτείνες που όλες δεσμεύουν και υδρολύουν GTP.
EF1-ALPHA
MGKEKTHINI VVIGHVDSGK STTTGHLIYK CGGIDKRTIE
KFEKEAAEMG KGSFKYAWVL
DKLKAERERG ITIDISLWKF ETSKYYVTII DAPGHRDFIK
NMITGTSQAD CAVLIVAAGV
GEFEAGISKN GQTREHALLA YTLGVKQLIV GVNKMDSTEP
PYSQKRYEEI VKEVSTYIKK
IGYNPDTVAF VPISGWNGDN MLEPSANMPW FKGWKVTRKD
GNASGTTLLE ALDCILPPTR
PTDKPLRLPL QDVYKIGGIG TVPVGRVETG VLKPGMVVTF
APVNVTTEVK SVEMHHEALS
EF-2
MVNFTVDQIR AIMDKKANIR NMSVIAHVDH GKSTLTDSLV
CKAGIIASAR AGETRFTDTR
KDEQERCITI KSTAISLFYE LSENDLNFIK QSKDGAGFLI
NLIDSPGHVD FSSEVTAALR
VTDGALVVVD CVSGVCVQTE TVLRQAIAER IKPVLMMNKM
DRALLELQLE PEELYQTFQR
IVENVNVIIS TYGEGESGPM GNIMIDPVLG TVGFGSGLHG
WAFTLKQFAE MYVAKFAAKG
EGQLGPAERA KKVEDMMKKL WGDRYFDPAN GKFSKSATSP
EGKKLPRTFC QLILDPIFKV
SRP54
KELVKLVDPG VKAWTPTKGK QNVIMFVGLQ GSGKTTTCSK
LAYYYQRKGW KTCLICADTF RAGAFDQLKQ NATKARIPFY GSYTEMDPVI IASEGVEKFK NENFEIIIVD
TSGRHKQEDS
LFEEMLQVAN AIQPDNIVYV MDASIGQACE AQAKAFKDKV
DVASVIVTKL DGHAKGGGAL SAVAATKSPI IFIGTGEHID DFEPFKTQPF ISKLLGMGDI
SR-alpha
RRVDMLRDIM DAQRRQRPYV VTFCGVNGVG KSTNLAKISF
WLLENGFSVL IAACDTFRAG AVEQLRTHTR RLSALHPPEK HGGRTMVQLF EKGYGKDAAG IAMEAIAFAR
NQGFDVVLVD TAGRMQDNAP LMTALAKLIT VNTPDLVLFV GEALVGNEAV DQLVKFNRAL ADHSMAQTPR
LIDGIVLTKF DTIDDKVGAA ISMTYITSKP IVFVGTGQTY CDLRSLNAKA VVAALMKA
Χρησιμοποιείστε πολλαπλή
ευθυγράμμιση για να τις συγκρίνετε. Ποιές δύο από αυτές είναι ποιό συγγενείς;
Αυτές αποτελούν μία ξεχωριστή κατηγορία GTP
binding proteins. Μπορείτε να αναγνωρίσετε την ακολουθία ( consensus
sequence) GXXXXGK(S/T) (το 'X' είναι οποιοδήποτε αμινοξύ) που είναι τυπικό για τις GTP binding
proteins? Η ακολουθία αυτή είναι μέρος μιάς στροφής που δεσμεύει την
φωσφορική ομάδα του GTP.
4. Κατασκευή και
αναζήτηση προφίλ ακολουθιών (Profile search)
Υπάρχουν ενδείξεις από την σύγκριση των ακολουθιών ότι η συνθετάση της ασπαραγίνης συνδέεται εξελικτικά με την συνθετάση του tRNA του ασπαρτικού (aspartyl - tRNA synthetase) (Hinchman, S.K. et al 1992 J.Biol. Chem. 267: 144-149). Το μοτίφ που ακολουθεί είναι από πέντε διαφορετικές συνθετάσες του tRNA του ασπαρτικού :
Syd2human
PPHAGGGIGLERVTML
Syd2rat
PPHAGGGIGLERVTML
Sydcyeast
PPHAGGGIGLERVVMF
Sydmyeast
PPHAGFAIGFDRMCAM
Sydecoli PPHAGLAFGLDRLTML
Εισάγετε τις ακολουθίες στο πρόγραμμα . bio.lundberg.gu.se/edu/msf1.html για να κατασκευάσετε ένα προφίλ από τις ακολουθίες. Τέλος διερευνήστε
τις πρωτείνες της E. Coliστην Swissprot (sw:*_ecoli) με
το FASTA. χρησιμοποιώντας το προηγούμενο προφίλ. Μπορείτε να αναγνωρίσετε την
σχέση με την συνθετάση της ασπαραγίνης;
5. Αναζήτηση και αποκομιδή δεδομένων
από δομικές μοριακές βάσεις δεδομένων.
Σε αυτή την άσκηση θέλουμε να
αναζητήσουμε πληροφορίες για βιολογικά μόρια (DNA και πρωτείνες) που αφορούν την τρισδιάστατη δομή και λειτουργία τους. Θα
απαντήσουμε σε ερωτήσεις όπως:
Επιλέξτε απο την NCBI-Entrez (www3.ncbi.nlm.nih.gov/Entrez/) την επιλογή
"3D structures" β.δ.
·
Ειναι γνωστή η τρισδιάστατη δομή της
HPRT ; Από ποιούς οργανισμούς; (Χρησιμοποιήστε την λέξη
"hypoxanthine" για την αναζήτηση σας). Επαναφέρατε
τις hprt πρωτείνες επιλέγοντας
"Structure summary". Αναγνωρίστε την ανθρώπινη πρωτείνη .
·
Παρατηρείστε το μόριο χρησιμοποιώντας το πρόγραμμα Rasmol (Επιλέξτε Programs RasMol viewer). Πόσες υπομονάδες
συνθέτουν την πρωτείνη; (Στο Rasmol επιλέξτε "Color - Chain" .
Κάθε
αλυσίδα θα χρωματιστεί διαφορετικά).
·
Με το Rasmol μπορείτε να δείτε
ένα μικρό μόριο δεσμευμένο στην πρωτείνη. Τι χημική ένωση είναι; Για να
απαντήσετε αυτή την ερώτηση επιλέξτε την σύνδεση με την β.δ. PDB ("1HMP") στην σελίδα του Entrez . Στην σελίδα της β.δ. PDB επιλέξτε "complete with coordinates" για να δείτε
τα δεδομένα της PDB και πληροφορίες για
την χημική ένωση.
·
Υπάρχουν τρισδιάστατες δομές που μοιάζουν με την 1ΗΜΡ;
(Επιλέξτε την ιστοσελίδα της Entrez το
"VAST Structure comparison: A"). Συγκρίνετε
τα αποτελέσματα με την την προηγούμενη
αναζήτηση με το BLAST.
Οι αναζητήσεις της τρισδιάστατης δομής
μπορούν επίσης να πραγματοποιηθούν χρησιμοποιώντας τα διαδικτυακά κέντρα "PDB" ή "Molecules R US" .