Γεωπονικό Πανεπιστήμιο Αθηνών

Εργαστήριο Γενετικής

Ηλεκτρονικές Βιολογικές και Γεωπονικές Βάσεις Δεδομένων

Σημειώσεις του εργαστηρίου Βιολογικές Βάσεις  Δεδομένων

 

 

 

 

 

Άσκηση 3η

 

 

 

 

 

 

 

ΗΛΙΑΣ ΗΛΙΟΠΟΥΛΟΣ

ΑΘΗΝΑ 2001


Άσκηση 3

 

Ανάζήτηση ακολουθιών πυρηνικών οξέων χρησιμοποιώντας το Internet

 

 

Οι περισσότερες ασκήσεις που αναπτύσσονται παρακάτω χρησιμοποιούν την μέθοδο της αντιγραφής μιάς νουκλεοτιδικής ή πρωτεϊνικής ακολουθίας από παράθυρο (Netscape ή Explorer) σε παράθυρο. Γι’αυτό είναι χρήσιμο να χρησιμοποιούνται δύο παράθυρα ταυτόχρονα με το ίδιο πρόγραμμα δικτύου (Netscape ή Explorer) και την μεταφορά της πληροφορίας με «Αποκοπή-Επικόλληση» (Cut-Paste).  

 

Εισαγωγή

Σε αυτή την άσκηση θέλουμε να αναζητήσουμε πολλών ειδών πληροφορίες για βιολογικά μόρια (DNA και πρωτείνες). Θα απαντήσουμε σε ερωτήσεις όπως:

Για να απευθύνουμε αυτές τις ερωτήσεις θα χρησιμοποιήσουμε τα παρακάτω διαδικτυακά κέντρα (WWW sites) και βάσεις δεδομένων που αυτά υποστηρίζουν.  Οι βάσεις αυτές είναι προσβάσιμες μέσα από το διαδίκτυο σε εξυπηρετητές του εξωτερικού. Οι βάσεις μπορούν να διερευνηθούν με ειδικό λογισμικό που προσφέρεται και αναλύεται παρακάτω ή με λογισμικό πρόσβασης στο διαδίκτυο (Internet) όπως Netscape Communicator ή Microsoft Explorer.

  1. bio.lundberg.gu.se/edu/msf2.html για πολλαπλή ευθυγράμιση ακολουθιών  

Η βάση πυρηνικών ακολουθιών του EMBL (Ευρωπαϊκού Εργαστηρίου Μοριακής Βιολογίας)


Η βάση πυρηνικών ακολουθιών του EMBL είναι μία πλήρης βάση ακολουθιών DNA και RNA που έχουν συλλεχθεί  από την επιστημονική βιβλιογραφία, αιτήσεις για ευρεσιτεχνίες ή έχουν απευθείας σταλεί από ερευνητές και ομάδες εντοπισμού ακολουθιών. Η συλλογή των δεδομένων γίνεται σε συνεργασία με την GenBank (ΗΠΑ) και την  DNA Database of Japan (DDBJ). Η βάση διπλασιάζεται σε μέγεθος κάθε 12 μήνες και τον Ιούνιο του 1997 αριθμούσε 931 εκατομμύρια βάσεις από 1432941 ακολουθίες.

 

Η βάση πυρηνικών ακολουθιών  GenBank


Η GenBank είναι η βάση γενετικών ακολουθιών του  NIH (Εθνικός Οργανισμός Υγείας των ΗΠΑ), μία συλλογή όλων των δημοσιευμένων ακολουθιών DNA . Υπάρχουν περίπου 967,000,000 βάσεις σε 1,491,000 ακολουθίες τον Ιούνιο του 1997. Για παράδειγμα μπορείτε να δείτε πληροφορίες για το γονίδιο της νευροινιδομάτώσης .Περισσότερες πληροφορίες για την τρέχουσα έκδοση της GenBank είναι διαθέσιμες στο διαδίκτυο. Μία καινούργια έκδοση είναι διαθέσιμη κάθε δύο μήνες.

Η GenBank είναι διαθέσιμη για αναζήτηση μέσω της Entrez ή της SRS.


 Ασκήσεις.

 

Α. Αναζήτηση πληροφοριών για την πρωτείνη σωματίδιο αναγνώρισης μηνύματος ( signal recognition particle (SRP))

 

 

Αναζήτηση με την χρήση της SRS (Sequence Retrieval System)

 

1. Συνδεθείτε με την SRS ιστοσελίδα ( srs.ebi.ac.uk ). Κάνετε κλίκ στο  "Start". Επιλέξτε "Swissprot" ως β.δ. και κάνετε κλικ στο "Query forms standard". Στην επόμενη σελίδα εισάγετε τον όρο "srp54" σε ένα από τα πεδία (AllText) και "human" σε ένα από τα άλλα πεδία αναζήτησης. Κάνετε κλίκ στο  "Submit query". Θα αποκομίσετε μία λίστα από SRP54 ακολουθίες, συμπεριλαμβανομένων και πρωτεϊνών που δεν είναι SRP54 . Για να κάνετε μία περισσότερο ακριβή αναζήτηση πηγαίνετε πίσω στην σελίδα αναζήτησης και επιλέξτε ως "Gene name" srp54. Σε ένα άλλο πλαίσιο επιλέξτε ως  "Organism" homo sapiens (η μόνο homo). Το αποτέλεσμα είναι η ανθρώπινη  SRP54 ακολουθία. Κάνετε κλικ στην επιλογή . Μπορείτε να βρείτε συνδέσεις στις πυρηνικές β.δ. ;

 

Ένας άλλος τρόπος για να δείτε συνδέσεις με άλλες βάσεις είναι : Κάνετε κλικ στην εισαγωγή της SWISSPROT. Θα δείτε ότι αφορά την SRP54_HUMAN μαζί με τις συνδέσεις στις άλλες βάσεις. Επιλέξτε  "PROSITE" ως βάση σύνδεσης (κάνοντας κλικ στην αντίστοιχη εισαγωγή στα δεξιά της λέξης "PROSITE" . Μια γραμμή της PROSITE γράφει:

 

P-[LIVM]-x-[FYL]-[LIVMAT]-[GS]-x-[GS]-[EQ]-x(4)-[LIVMF].

 

Αυτή είναι η τυπική ακολουθία για SRP54 πρωτείνες που ακολουθούν για διάφορους οργανισμούς.

 

 

2. Θέλουμε να βρούμε πληροφορίες για πρωτείνες από E. coli που έχουν πληροφορίες για σύνδεση με  DNA στην περιοχή του κειμένου . Επιλέξτε  Swissprot ως β.δ.  Επιλέξτε στο πεδίο "Feature:FtKey" τον όρο dna_bind (προσέξτε τον χαρακτήρα  underscore ! ) και εισάγετε στο πεδίο "Organism" *coli. (Η έκφραση  *coli σημαίνει κάθε λέξη του τελειώνει σε 'coli'.) . Κάνετε κλίκ στο  "Submit query" και σημειώστε το Accession της πρώτης εισαγωγής.

 

3. Θέλουμε να βρούμε πρωτείνες της  Escerichia coli που έχουν (πιθανά) διαμεμβρανικά τμήματα. Επιλέξτε  Swissprot ως βάση αναζήτησης. Επιλέξτε "FtKey" = "transmem" και "Organism" = "*coli". 

 

4. Οπως στην προηγούμενη άσκηση  με την β.δ.  Entrez θέλουμε να βρούμε πρωτεϊνικές ακολουθίες με μήκος ακολουθίας μεταξύ 10,000 and 20,000. Στην SRS επιλέγετε Swissprot ως βάση, επιλέγετε το πεδίο "SeqLength"  και εισάγετε "10000:20000". Χρησιμοποιήστε άλλα νούμερα εάν δεν βρείτε κάτι. Βρίσκετε τα ίδια αποτελέσματα με την  Entrez?

 

 

 

 

 

 

Β. Αναζήτηση πληροφοριών για το ένζυμο  μεταφεράση της φωσφοριβοσυλιομένης γουανίνης (hypoxanthine (guanine) phosphoribosyl transferase ή hprt ή hgprt)

 

Ι. Ακολουθία DNA

 

1. Συνδεθείτε με την SRS ιστοσελίδα ( srs.ebi.ac.uk ). Κάνετε κλίκ στο  "Start a new SRS session". Επιλέξτε "Swissprot" ως β.δ. και κάνετε κλικ στο "Continue". Δοκιμάστε να βρείτε το γονίδιο που κωδικοποιεί την ανθρώπινη  hprt, δηλαδή ολόκληρη την γενομική ακολουθία συμπεριλαμβανομένων των ιντρονίων. (Χρησιμοποιείστε ώς όρους αναζήτησης: hprt, human, και complete. Εξετάσετε την περιοχή κειμένου της γενομικής ακολουθίας hprt και απαντήστε στις παρακάτω ερωτήσεις:

·        Ποιός είναι ο εισαγωγικός αριθμός (accession number) της ακολουθίας ? (Ο πρώτος αριθμός στην γραμμή " (AC)CESSION" )

·        Πόσα εξόνια υπάρχουν στο γονίδιο;

 

·        Τι μέγεθος έχει η ανθρώπινη hprt (πόσα αμινοξέα);

 

 

ΙΙ. Πρωτεϊνική ακολουθία

 

 

1. Συνδεθείτε με την SRS ιστοσελίδα ( srs.ebi.ac.uk ).  Από την αρχική σελίδα της  SRS επιλέξτε "Start a new SRS session". Επιλέξτε Swissprot σαν β.δ. και κάνετε κλικ στο "Continue". Αναζητήστε την hprt πρωτείνη από Bacillus subtilis. (Εισάγετε "Bacillus subtilis" στο πεδίο "Organism" και "hprt" στο πεδίο "All-text").

·        Κοιτάξετε το περιγραφικό τμήμα για την Bacillus hprt. Θα βρείτε μία σύνδεση στην PROSITE, μία πρωτεϊνική β.δ. που περιέχει πρωτεϊνικά μοτίφ. Ποιό είναι το χαρακτηριστικό μοτίφ αυτής της ομάδος πρωτεϊνών; Πηγαίνετε πίσω στην SRS και επιλέξτε  "Enzyme" ως β.δ. από αυτές των “Metabolic pathway” (αντί της  Swissprot που επιλέξατε προηγουμένως). Αναζητήστε την "hypoxanthine".

·        Μπορείτε να βρείτε ένα άλλο ένζυμο που έχει την υποξανθίνη (hypoxanthine) ως υπόστρωμα.

 

 

Αναζητήστε την  E. coli hprt χρησιμοποιώντας την SRS και Swissprot ως β.δ.. (Organism: Escherichia coli). Μπορείτε να αναζητήσετε ομόλογες πρωτεϊνες χρησιμοποιώντας το πρόγραμμα αναζήτησης ακολουθιών BLAST .

Ζητείστε την παρουσίαση (View) σε μορφή FASTA και αντιγράψτε την ακολουθία με (cut)   (κάνετε κλικ στο δεξί πλήκτρο του ποντικιού) και paste (κάνετε κλικ στο δεξί πλήκτρο του ποντικιού) στο παράθυρο ακολουθίας του BLAST.

Ποια συναφή ένζυμα στην  E. coli hprt βρίσκετε στο αποτέλεσμα της αναζήτησης από το ψάξιμο με το BLAST επιπλέον των ομολόγων της  hprt από άλλους οργανισμούς;

 

 

Γ. Επιλογή ακολουθίας και μετάφραση.

 

I. Επιλογή ακολουθίας και μετάφραση.

 

την ακολουθία. Χρησιμοποιώντας την β.δ. Swissprot αναζητήστε την  E. coli ribosomal protein S16 (rs16_ecoli). Συγκρίνατε την με το αποτέλεσμα της μετάφρασης σας.

 

 

ΙΙ. Μη κανονικός γενετικός κώδικας.

 

της ακολουθίας X07479 από την EMBL (a rat mitochondrial protein gene) με τον κανονικό γενετικό κώδικα όπως επίσης και με τον μιτοχονδιακό κώδικα και συγκρίνατε τα αποτελέσματα.

 

 

ΙΙΙ. Σύγκριση πλαισίων ανάγνωσης ακολουθιών.

 

Το τμήμα  EST της  EMBL περιέχει ακολουθίες με περισσότερα λάθη από τα άλλα τμήματα της β.δ. Οι ερευνητές συχνά κάνουν έναν έλεγχο στην βάση με την ακολουθία τους πρίν να την καταθέσουν. Και συχνά αναφέρουν στα σχόλια την ομοιότητα με κάποια πρωτείνη της βάσης Swissprot.

 

Συνδεθείτε με την SRS ιστοσελίδα ( srs.ebi.ac.uk ). Διερευνήστε το EST τμήμα της EMBL (Seqrelated -> EMESTLIB )για εισαγωγές όπου ο ερευνητής αναφέρει ομοιότητα με την cystic fibrosis protein.

 

Βρήτε την ακολουθία που αναφέρεται και την αντίστοιχη ακολουθία από την Swissprot cftr_human.  

 

Ευθυγραμίστε (www2.ebi.ac.uk/clustalw/) τις δύο ακολουθίες και κάνετε την σύγκριση μεταξύ τους. Τι παρατηρείτε;