Άσκηση 6

 

Αναζήτηση και ανάλυση ακολουθιών πρωτεϊνών χρησιμοποιώντας το Internet

 

Οι περισσότερες ασκήσεις που αναπτύσσονται παρακάτω χρησιμοποιούν την μέθοδο της αντιγραφής μιάς νουκλεοτιδικής ή πρωτεϊνικής ακολουθίας από παράθυρο (Netscape ή Explorer) σε παράθυρο. Γι’αυτό είναι χρήσιμο να χρησιμοποιούνται δύο παράθυρα ταυτόχρονα με το ίδιο πρόγραμμα δικτύου (Netscape ή Explorer) και την μεταφορά της πληροφορίας με «Αποκοπή-Επικόλληση» (Cut-Paste).  

 

 

Διαδικτυακά κέντρα (Internet Sites) που θα χρησιμοποιηθούν:

 

 



 

1. Αναζητώντας ακολουθίες στις πρωτεϊνικές βάσεις δεδομένων με την χρήση του FASTA.

 

 

 

 

A.           Χρησιμοποιείστε το  FASTA για την αναγνώριση ομολόγων της  SRP54 πρωτείνης από βακτήρια. Επιλέξτε σαν ακολουθία στόχο την SRP54 πρωτείνη από ποντικό ("sw:sr54_mouse").

 

B.         Η έκφραση από διαβιβαστές της φερριτίνης (ferritin) και τρανσφερριτίνης  (transferrin) ρυθμίζετε από μιά πρωτείνη που ονομάζεται πρωτείνη δέσμευσης του IRE (iron responsive element) binding protein.  ¨Οταν η αμινοξική της ακολουθία εντοπίστηκε από ένα κλώνο cDNA αναγνωρίστηκε μία μή αναμενόμενη ομολογία με μία άλλη πρωτείνη. Μπορείτε να την βρείτε; Χρησιμοποιείστε το SRS ή την Entrez για να εντοπίσετε την πρωτεϊνική ακολουθία της IRE binding protein στην β.δ. Swissprot database (Χρησιμοποιείστε  iron,responsive σαν λέξεις κλειδιά). Κατόπιν χρησιμοποιείστε το  FASTA για να την συγκρίνετε με την ίδια βάση . Αναγνωρίζετε την πρωτείνη που είναι ομόλογη με την IRE binding protein?

 

 

 

 

2. Πολλαπλή ευθυγράμμιση ακολουθιών.

 

 

 

Α.         Η ανάλυση των ακολουθιών των πρωτεϊνών των ομοιοτικών γονιδίων της Δροσόφιλάς ( Drosophila homeotic genes) αποκαλύπτει μία περιοχή πολύ συντηρημένη, το homeobox. Στην πρωτείνη antennapedia (antp) αυτή η ακολουθία είναι:

 

            Arg Arg Arg Ile Glu Ile Ala His Ala Leu Cys Leu Thr Glu Arg Gln Ile Lys Ile Trp Phe Gln Asn Arg Arg Met Lys

 

            Εισάγετε την ακολουθία αυτή (με κωδικό ενός γράμματος) στο FASTAκαι αναγνωρίστε ομόλογες ακολουθίες στην β.δ.  Κατόπιν επιλέξτε 6-7 από αυτές και κάνετε πολλαπλή ευθυγράμμιση. Μπορείτε να εντοπίσετε το  homeobox motif ;

 

 

Το αποτέλεσμα θα μοιάζει με αυτό που ακολουθεί:

 

 

            301                                                350

HMSC_DROME  YPWMKRVHLG TSTVNANGET KRQ.RTSYTR YQTLELEKEF HFNRYLTRRR

HMSC_APIME  .......... ..TVNANGEV KRQ.RTSYTR YQTLELEKEF HFNRYLTRRR

HMAA_DROME  MGSPFERVVC GDFNGPNGCP RRRGRQTYTR FQTLELEKEF HFNHYLTRRR

HMAA_APIME  .......... ...PGPNGCP RRRGRQTYTR FQTLELEKEF HYNHYLTRRR

HMAA_SCHGR  .......... .....PNGCP RRRGRQTYTR FQTLELEKEF HFNHYLTRRR

HMUX_DROME  .......... ....GTNG.L RRRGRQTYTR YQTLELEKEF HTNHYLTRRR

HXB6_HUMAN  PVYPWMQRMN SCNSSSFGPS GRRGRQTYTR YQTLELEKEF HYNRYLTRRR 

 

            351                                                400

HMSC_DROME  RIEIAHALCL TERQIKIWFQ NRRMKWKKE. HKMASMNIVP YHMGPYGHPY

HMSC_APIME  RIEIAHALCL TERQIKIWFQ NRRMKWKKE. HKMASMNIVP YHMSPYGHPY

HMAA_DROME  RIEIAHALCL TERQIKIWFQ NRRMKLKKEL RAVKEINEQA RRDREEQEKM

HMAA_APIME  RIEIAHALCL TERQIKIWFQ NRRMKLKKEL RAVKEIN... ..........

HMAA_SCHGR  RIEIAHALCL TERQIKIWFQ NRRMKLKKEL RAVKEINEQA RREREEQDRL

HMUX_DROME  RIEMAHALCL TERQIKIWFQ NRRMKLKKEI QAIKELNEQE KQAQAQKAAA

HXB6_HUMAN  RIEIAHALCL TERQIKIWFQ NRRMKWKKES KLLSASQLSA EEEEEKQAE.

 

 

 


 

3. Πρωτεϊνικές οικογένειες

 

Οι τέσσερεις παρακάτω ακολουθίες προέρχονται από ανθρώπινες πρωτείνες που όλες δεσμεύουν και υδρολύουν GTP.

 

EF1-ALPHA

 

MGKEKTHINI VVIGHVDSGK STTTGHLIYK CGGIDKRTIE KFEKEAAEMG KGSFKYAWVL

DKLKAERERG ITIDISLWKF ETSKYYVTII DAPGHRDFIK NMITGTSQAD CAVLIVAAGV

GEFEAGISKN GQTREHALLA YTLGVKQLIV GVNKMDSTEP PYSQKRYEEI VKEVSTYIKK

IGYNPDTVAF VPISGWNGDN MLEPSANMPW FKGWKVTRKD GNASGTTLLE ALDCILPPTR

PTDKPLRLPL QDVYKIGGIG TVPVGRVETG VLKPGMVVTF APVNVTTEVK SVEMHHEALS

 

EF-2

 

MVNFTVDQIR AIMDKKANIR NMSVIAHVDH GKSTLTDSLV CKAGIIASAR AGETRFTDTR

KDEQERCITI KSTAISLFYE LSENDLNFIK QSKDGAGFLI NLIDSPGHVD FSSEVTAALR

VTDGALVVVD CVSGVCVQTE TVLRQAIAER IKPVLMMNKM DRALLELQLE PEELYQTFQR

IVENVNVIIS TYGEGESGPM GNIMIDPVLG TVGFGSGLHG WAFTLKQFAE MYVAKFAAKG

EGQLGPAERA KKVEDMMKKL WGDRYFDPAN GKFSKSATSP EGKKLPRTFC QLILDPIFKV

 

SRP54

 

KELVKLVDPG VKAWTPTKGK QNVIMFVGLQ GSGKTTTCSK LAYYYQRKGW KTCLICADTF RAGAFDQLKQ NATKARIPFY GSYTEMDPVI IASEGVEKFK NENFEIIIVD TSGRHKQEDS

LFEEMLQVAN AIQPDNIVYV MDASIGQACE AQAKAFKDKV DVASVIVTKL DGHAKGGGAL SAVAATKSPI IFIGTGEHID DFEPFKTQPF ISKLLGMGDI

 

SR-alpha

 

RRVDMLRDIM DAQRRQRPYV VTFCGVNGVG KSTNLAKISF WLLENGFSVL IAACDTFRAG AVEQLRTHTR RLSALHPPEK HGGRTMVQLF EKGYGKDAAG IAMEAIAFAR NQGFDVVLVD TAGRMQDNAP LMTALAKLIT VNTPDLVLFV GEALVGNEAV DQLVKFNRAL ADHSMAQTPR LIDGIVLTKF DTIDDKVGAA ISMTYITSKP IVFVGTGQTY CDLRSLNAKA VVAALMKA

 

Χρησιμοποιείστε πολλαπλή ευθυγράμμιση για να τις συγκρίνετε. Ποιές δύο από αυτές είναι ποιό συγγενείς; Αυτές αποτελούν μία ξεχωριστή κατηγορία GTP binding proteins. Μπορείτε να αναγνωρίσετε την ακολουθία ( consensus sequence) GXXXXGK(S/T) (το 'X' είναι οποιοδήποτε αμινοξύ) που είναι τυπικό για τις  GTP binding proteins? Η ακολουθία αυτή είναι μέρος μιάς στροφής που δεσμεύει την φωσφορική ομάδα του   GTP.

 

 


 

 

4. Κατασκευή και αναζήτηση προφίλ ακολουθιών (Profile search)

 

 

 

Υπάρχουν ενδείξεις από την σύγκριση των ακολουθιών ότι η συνθετάση της ασπαραγίνης συνδέεται εξελικτικά με την συνθετάση του tRNA του ασπαρτικού (aspartyl - tRNA synthetase)  (Hinchman, S.K. et al 1992 J.Biol. Chem. 267: 144-149). Το μοτίφ που ακολουθεί είναι από πέντε διαφορετικές συνθετάσες του tRNA του ασπαρτικού :

 

Syd2human  PPHAGGGIGLERVTML

Syd2rat    PPHAGGGIGLERVTML

Sydcyeast  PPHAGGGIGLERVVMF

Sydmyeast  PPHAGFAIGFDRMCAM

Sydecoli   PPHAGLAFGLDRLTML

 

Εισάγετε τις ακολουθίες στο πρόγραμμα . bio.lundberg.gu.se/edu/msf1.html για να κατασκευάσετε ένα προφίλ από τις ακολουθίες. Τέλος διερευνήστε τις πρωτείνες της  E. Coliστην  Swissprot (sw:*_ecoli)  με το  FASTA. χρησιμοποιώντας το προηγούμενο προφίλ. Μπορείτε να αναγνωρίσετε την σχέση με την συνθετάση της ασπαραγίνης;


 

5. Αναζήτηση και αποκομιδή δεδομένων από δομικές μοριακές βάσεις δεδομένων.

 

Σε αυτή την άσκηση θέλουμε να αναζητήσουμε πληροφορίες για βιολογικά μόρια (DNA και πρωτείνες) που αφορούν την τρισδιάστατη δομή και λειτουργία τους. Θα απαντήσουμε σε ερωτήσεις όπως:

 

Επιλέξτε απο την  NCBI-Entrez (www3.ncbi.nlm.nih.gov/Entrez/) την επιλογή "3D structures" β.δ.

·        Ειναι γνωστή η τρισδιάστατη δομή της  HPRT ; Από ποιούς οργανισμούς;  (Χρησιμοποιήστε την λέξη  "hypoxanthine" για την αναζήτηση σας). Επαναφέρατε τις  hprt πρωτείνες επιλέγοντας "Structure summary". Αναγνωρίστε την ανθρώπινη πρωτείνη .

·        Παρατηρείστε το μόριο χρησιμοποιώντας το πρόγραμμα Rasmol  (Επιλέξτε Programs  RasMol viewer). Πόσες υπομονάδες συνθέτουν την πρωτείνη; (Στο Rasmol επιλέξτε "Color - Chain" . Κάθε αλυσίδα θα χρωματιστεί διαφορετικά).

·         Με το Rasmol μπορείτε να δείτε ένα μικρό μόριο δεσμευμένο στην πρωτείνη. Τι χημική ένωση είναι; Για να απαντήσετε αυτή την ερώτηση επιλέξτε την σύνδεση με την β.δ.  PDB  ("1HMP") στην σελίδα του  Entrez . Στην σελίδα της β.δ. PDB επιλέξτε "complete with coordinates" για να δείτε τα δεδομένα της  PDB και πληροφορίες για την χημική ένωση.

·        Υπάρχουν τρισδιάστατες δομές που μοιάζουν με την  1ΗΜΡ;  (Επιλέξτε την ιστοσελίδα της  Entrez  το  "VAST Structure comparison: A"). Συγκρίνετε τα αποτελέσματα με την την προηγούμενη  αναζήτηση με το BLAST.

 

Οι αναζητήσεις της τρισδιάστατης δομής μπορούν επίσης να πραγματοποιηθούν χρησιμοποιώντας τα διαδικτυακά κέντρα "PDB" ή "Molecules R US" .