Γεωπονικό Πανεπιστήμιο Αθηνών

Εργαστήριο Γενετικής

Ηλεκτρονικές Βιολογικές και Γεωπονικές Βάσεις Δεδομένων

Σημειώσεις του εργαστηρίου Βιολογικές Βάσεις  Δεδομένων

 

 

 

 

 

Άσκηση 2η

 

 

 

 

 

 

 

ΗΛΙΑΣ ΗΛΙΟΠΟΥΛΟΣ

ΑΘΗΝΑ 1999


Άσκηση 2

Αναζήτηση και αποκομιδή δεδομένων από μοριακές βιολογικές βάσεις δεδομένων

 

Εισαγωγή

Σε αυτή την άσκηση θέλουμε να αναζητήσουμε πολλών ειδών πληροφορίες για βιολογικά μόρια (DNA και πρωτείνες). Θα απαντήσουμε σε ερωτήσεις όπως:

Για να απευθύνουμε αυτές τις ερωτήσεις θα χρησιμοποιήσουμε τα παρακάτω διαδικτυακά κέντρα (WWW sites) και βάσεις δεδομένων που αυτά υποστηρίζουν.  Οι βάσεις αυτές είναι προσβάσιμες μέσα από το διαδίκτυο σε εξυπηρετητές του εξωτερικού. Οι βάσεις μπορούν να διερευνηθούν με ειδικό λογισμικό που προσφέρεται και αναλύεται παρακάτω ή με λογισμικό πρόσβασης στο διαδίκτυο (Internet) όπως Netscape Communicator ή Microsoft Explorer.

:

 

 

 

Για παραδείγματα αναζήτησης θα εξετάσουμε δύο πρωτείνες. Το σωματίδιο αναγνώρισης μηνύματος ( signal recognition particle (SRP)) και το ένζυμο  μεταφεράση της φωσφοριβοσυλιομένης γουανίνης (hypoxanthine (guanine) phosphoribosyl transferase) που συχνά αναφέρεται ως 'hprt' ή 'hgprt'.


 

Α. Αναζήτηση πληροφοριών για την πρωτείνη σωματίδιο αναγνώρισης μηνύματος ( signal recognition particle (SRP))

 

I.  Με την χρήση της Entrez

 

1. Αρχικά θα χρησιμοποιήσουμε την βάση Entrez. Η SRP έχει έξη διαφορετικές πρωτεϊνικές υπομονάδες ή αλυσίδες. Ανακτήστε την ακολουθία της ανθρώπινης  SRP54 υπομονάδας. Συνδεθείτε με την ιστοσελίδα της Entrez (http://www.ncbi.nlm.nih.gov/Entrez).  Επιλέξτε Protein ώς την βάση πληροφοριών. Εισάγετε τον  όρο αναζήτησης  srp54 στην πρωτεϊνική Β.Δ. και πατήστε Enter. Για να κάνετε την επιλογή σας πιό εντοπισμένη εισάγετε και  την λέξη human και πατήστε Enter. Κάνετε κλικ στο  "Retrieve ... documents". Μπορείτε να βρείτε την ανθρώπινη πρωτείνη στον κατάλογο (Η σωστή είναι  P13624) ; Κάνετε κλικ στην επιλογή "GenPept " για αυτή την πρωτείνη για να δείτε λεπτομέρειες των σχετικών στοιχείων απο την Β.Δ. Πρώτα θα δείτε γενικές πληροφορίες και στο τέλος την αμινοξική ακολουθία της πρωτείνης.

 

Η Entrez μπορεί να σας οδηγήσει σε άλλα συναφή στοιχεία από άλλες βάσεις δεδομένων. Κάνετε κλίκ στις συνδέσεις υπό τον τίτλο DBSOURCE (gi:...) για να δείτε αναφορές στην πυρηνική Β.Δ. Ένας άλλος τρόπος για να δείτε συνδέσεις σε άλλες β.δ. είναι τα xrefs (cross references). Σημειώστε μερικά και αναζητήστε τα σε άλλες βάσεις. Για να βρείτε την αρχική δημοσίευση αντί για Protein  επιλέξτε Pubmed .

 

Στην αναζήτηση που κάνατε εισάγατε μία λέξη αναζήτησης ("srp54") μαι μετά επικεντρώσατε την αναζήτηση σας με μία άλλη λέξη ("human"). Είναι δυνατόν να εισάγετε δύο λέξεις μαζί με τους παρακάτω τρεις τρόπους:

 

human srp54

human AND srp54

srp54 human

 

και να επιτύχετε το ίδιο αποτέλεσμα. Δοκιμάστε έναν από αυτούς και συγκρίνατε τον  με τα προηγούμενα αποτελέσματα σας.

 

Η αναζήτηση: srp54 OR human τι επιτυγχάνει?

 

Μπορείτε να κάνετε μία πιό εξειδικευμένη αναζήτηση με την επιλογή πεδίων. Πηγαίνετε πίσω στην αρχική σελίδα αναζήτησης  (www.ncbi.nlm.nih.gov/Entrez/protein.html). Επιλέξτε "Limits" και εισάγετε srp54 ως όρο αναζήτησης. Επικεντρώστε την αναζήτηση σας επιλέγοντας το πεδίο "Organism" και με όρο αναζήτησης human. Πρέπει να καταλήξετε με ένα μόνο στόχο την ανθρώπινη SRP54  πρωτείνη.

 

2.      Θέλουμε να βρούμε δημοσιεύσεις στην Medline που αναφέρονται σε πρωτείνες SR  (που εμπλέκονται στην ρύθμιση της επεξεργασίας του RNA ( regulation of RNA processing) και έχουν δημοσιευθεί το 1997 ή  1998 στο περιοδικό Nature, Cell ή Science. Για να το κάνετε αυτό επιλέξτε την β.δ. PubMed. Εισάγετε "SR" και "splicing" ώς όρους αναζήτησης. Επικεντρώστε την αναζήτηση σας με την επιλογή του πεδίου "Publication date" και εισάγετε

"1997 OR 1998" ως όρο αναζήτησης. Για περαιτέρω επικέντρωση επιλέξτε το πεδίο "Journal" και εισάγετε "Nature OR Science OR Cell" ως όρο αναζήτησης. Πόσα άρθρα βρήκατε;  

 

 

Αυτή η αναζήτηση μπορεί να γίνει κα με την έκφραση :

 

splicing [all fields] AND sr [all fields] AND ( nature [JOUR] OR cell [JOUR] OR Science [JOUR]) AND ( 1997 [publication date] OR 1998 [publication date])

 

 


 

Β. Αναζήτηση πληροφοριών για το ένζυμο  μεταφεράση της φωσφοριβοσυλιομένης γουανίνης (hypoxanthine (guanine) phosphoribosyl transferase ή hprt ή hgprt)

 

 

 

Ι. Ακολουθία DNA

 

1. Πηγαίνετε στο NCBI Entrez και επιλέξτε "Search WWW Entrez at NCBI Nucleotide ". Δοκιμάστε να βρείτε το γονίδιο που κωδικοποιεί την ανθρώπινη  hprt, δηλαδή ολόκληρη την γενομική ακολουθία συμπεριλαμβανομένων των ιντρονίων. (Χρησιμοποιείστε ώς όρους αναζήτησης: hprt, human, και complete. Για να δείτε επιμέρους ακολουθίες κάνετε κλικ στην επιλογή "Genbank report". Εξετάσετε την περιοχή κειμένου της γενομικής ακολουθίας hprt και απαντήστε στις παρακάτω ερωτήσεις:

·        Ποιός είναι ο εισαγωγικός αριθμός (accession number) της ακολουθίας ? (Ο πρώτος αριθμός στην γραμμή "ACCESSION" )

·        Πόσα εξόνια υπάρχουν στο γονίδιο;

·        Πόσες μεταλλάξεις περιγράφονται και με τι ασθένειες συνδέονται; Κρατείστε μία σημείωση των μεταλλάξεων και των σχετικών ασθενειών.

 

Όταν έχετε αποκομίσει την ακολουθία του γονιδίου, πηγαίνετε στην προηγούμενη ιστοσελίδα και επιλέξτε "Graphical view".Κάνετε κλικ σε ένα από τα εξόνια και  επικεντρωθείτε στην περιοχή.

Τι μέγεθος έχει η ανθρώπινη hprt (πόσα αμινοξέα);

 

ΙΙ. Πρωτεϊνική ακολουθία

 

Πηγαίνετε πίσω στο  NCBI-Entrez (www3.ncbi.nlm.nih.gov/Entrez/). Επιλέξτε "Protein" ως β.δ. Προσπαθήστε να βρείτε την hprt από Escherichia coli.

·        Πόσα αμινοξέα έχει η πρωτείνη; 

·        Η πρωτείνη από E. coliέχει την ίδια συγγένεια υποστρώματος (substrate specificity) όπως και η ανθρώπινη; (Εξετάστε τα αποτελέσματα που αφορούν την E. coli HPRT και κυττάξτε την περιοχή κειμένου στα σχόλια "Comment ...")

·        Σε ποιές επιστημονικές δημοσιεύσεις αναφέρεται η ακολουθία; (Εξετάστε συνδέσεις στην MEDLINE) .

 

Πηγαίνετε πίσω στο  NCBI-Entrez (www3.ncbi.nlm.nih.gov/Entrez/). Επιλέξτε "Protein" ως β.δ. Προσπαθήστε να βρείτε την hprt από Bacillus subtilis.


 

ΙII. Γενομικά δεδομένα

 

1.  Το ανθρώπινο γένωμα.

Για αυτές τις ασκήσεις θα χρησιμοποιήσουμε την β.δ.  GDB. Αναζητήστε πληροφορίες για την HPRT. Από την αρχική σελίδα της  GDB επιλέξτε  "All biological data" και "keyword" και χρησιμοποιήστε τον όρο  "hypoxanthine" για την αναζήτηση σας .

·        Ποιά γονίδια κωδικοποιούν την  HPRT?

·        Ποιό από αυτά τα γονίδια έχει ένα συναφές φαινότυπο. (συνδέεται με κάποια ασθένεια);

·        Σε ποιό χρωμόσωμα είναι αυτό το γονίδιο; Σε ποια θέση;   Προσπαθήστε να βρείτε ένα χάρτη του χρωμοσώματος που να δείχνει την θέση της hprt. 

·        Ποιά γονίδια βρίσκονται εκατέρωθεν αυτού της HPRT?

·        Υπάρχουν ζευγάρια εκκινητών για την ενίσχυση ολόκληρης της περιοχής κωδικοποίησης της HPRT ;

·        Τι ασθένειες σχετίζονται με την HPRT ? Τι κλινικά συμπτώματα έχουν; 

 

 

2. Το γένωμα της E. coli .

Το πλήρες γένωμα της  E. coli είναι διαθέσιμο από το  1997. Επιλέξτε στην NCBI Entrez "Search the NCBI genomes database" και πηγαίνετε στο γένωμα της  E. coli . Προσπαθήστε να εντοπίσετε το γονίδιο της HPRT στην πυρηνική θέση ~142,000.

·        Τι γονίδια βρίσκονται κοντά στο γονίδιο της HPRT?