Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Γενετικής |
Ηλεκτρονικές Βιολογικές
και Γεωπονικές Βάσεις Δεδομένων
Σημειώσεις του εργαστηρίου Βιολογικές Βάσεις Δεδομένων
Άσκηση 4η
ΗΛΙΑΣ ΗΛΙΟΠΟΥΛΟΣ
ΑΘΗΝΑ 2001
Άσκηση 4
Ανάλυση
ακολουθιών πυρηνικών οξέων χρησιμοποιώντας το Internet
(Sequence analysis using Internet functions)
Η χρήση των γενετικών βάσεων δεδομένων για την δημιουργία
χαρτών περιοριστικών ενζύμων, μετάφραση και εύρεση ομολόγων ακολουθιών (με το BLAST).
Οι περισσότερες ασκήσεις που αναπτύσσονται παρακάτω χρησιμοποιούν την μέθοδο της αντιγραφής μιάς νουκλεοτιδικής ή πρωτεϊνικής ακολουθίας από παράθυρο (Netscape ή Explorer) σε παράθυρο. Γι’αυτό είναι χρήσιμο να χρησιμοποιούνται
δύο παράθυρα ταυτόχρονα με το ίδιο πρόγραμμα δικτύου (Netscape ή Explorer) και την μεταφορά της πληροφορίας με
«Αποκοπή-Επικόλληση» (Cut-Paste).
Διαδικτυακά κέντρα (Internet Sites) που θα χρησιμοποιηθούν:
Α. Δημιουργία χαρτών περιοριστικών
ενζύμων(Restriction mapping)
Συνδεθείτε με το NCBI Entrez στη διεύθυνση http://www.ncbi.nlm.nih.gov/Entrez
. Ανακαλέστε την νουκλεοτιδική
ακολουθία με κωδικό αριθμό (accession code) X01405 στην
μορφή FASTA.
Αντιγράψτε την ακολουθία από την σελίδα του NCBI, και επικολήστε την στο παράθυρο ακολουθιών του Webcutter σε άλλο παράθυρο Netscape ή Explorer (http://www.firstmarket.com/cutter/cut2.html) .
Κάνετε κλίκ στην επιλογή "Analyze sequence" για να δείτε τις
θέσεις των περιοριστικών ενζύμων.
Τώρα θέλετε να εντοπίσετε
που “κόβει” το περιοριστικό ένζυμο BamHI.
Πηγαίνετε πίσω στην αρχική σελίδα του Webcutter με την επιλογή back του Netscape ή Explorer
and ακυρώστε
την επιλογή "Map of restriction sites". Επιλέξτε "Only the
following enzymes" και κάνετε κλικ στην επιλογή BamHI. Κάνετε κλίκ στο
"Analyze
sequence" για
να πάρετε τις θέσεις περιορισμού του BamHI .
Πόσες φορές και που κόβει το BamHI
την ακολουθία X01405;
Πηγαίνετε πίσω στην αρχική
σελίδα του Webcutter με την επιλογή back του Netscape ή
Explorer and επιλέξτε την επιλογή "All enzymes
in the database". Για να δείτε όλα τα
ένζυμα που κόβουν ακριβώς μία φορά μόνο την ακολουθία επιλέξτε "Enzymes cutting once". Κάνετε κλίκ στο "Analyze sequence" για να πάρετε τις
θέσεις περιορισμού. Ποιά ένζυμα κόβουν μία μόνο φορά την ακολουθία X01405 και σε ποιές θέσεις;
Β. Μετάφραση νουκλεοτιδικών ακολουθιών σε
αμινοξικές
Συνδεθείτε με το
NCBI Entrez στη διεύθυνση www.ncbi.nlm.nih.gov/Entrez
. Ανακαλέστε την νουκλεοτιδική
ακολουθία με κωδικό αριθμό (accession code) X01405 στην
μορφή FASTA. Για την μετάφραση της ακολουθίας θα
χρησιμοποιηθεί το πρόγραμμα στην
διεύθυνση http://www2.ebi.ac.uk/translate.
Αντιγράψτε την ακολουθία X01405 όπως στην άσκηση με τα περιοριστικά ένζυμα στο αντίστοιχο παράθυρο της σελίδας http://www2.ebi.ac.uk/translate. Κάνετε κλίκ στην επιλογή "Translate"
για να δείτε τα τρία αναγνωστικά πλάισια. Προσπαθήστε να αναγνωρίσετε το
αναγνωστικό πλαίσιο (open reading
frame) που αντιστοιχεί στην ακολουθία p53. Μπορείτε να βοηθηθείτε από την περιγραφή της σελίδας NCBI για την Χ01405. Όταν έχετε αναγνωρίσει το σωστό αναγνωστικό πλαίσιο (1 από τα 3 δυνατά) κάνετε την μετάφραση πάλι αλλά επιλέξτε το σωστό αναγνωστικό πλαίσιο (με την επιλογή "Translate entire sequence and select reading
frame ...") ώστε να πάρετε την γραμμική αμινοξική ακολουθία που αντιστοιχεί στην p53 στο επάνω μέρος της σελίδας. Ποιό
είναι το σωστό αναγνωστικό πλαίσιο;
Γ. Εντοπισμός αμινοξικής
ακολουθίας από ηλεκτροφόρηση νουκλεοτιδικής .
|
1.
Έχετε καταφέρει να κλωνοποιήσετε ένα γονίδιο μιάς
άγνωστης πρωτείνης. Έχετε χρησιμοποιήσει την μέθοδο Sanger <Q>τερματισμού της αλυσίδας
με διδεοξυνουκλεοτίδια για τον εντοπισμό της ακολουθίας του DNA για έναν από τους
κλώνους σας. Ποιά είναι η ακολουθία που διαβάζετε από την ηλεκτροφόρηση; 2.
Έχοντας την ακολουθία DNA θέλουμε να εντοπίσουμε
ποιά πρωτείνη εκφράζει αυτό το γονίδιο. Υπάρχουν πιθανά δύο τρόποι
εντοπισμού: Α. Εντοπίζοντας ομόλογες ακολουθίες
νουκλεϊνικών οξέων με την χρήση του BLAST και Β. Μεταφράζοντας το τμήμα της
νουκλεοτιδικής ακολουθίας και εντοπίζοντας ομόλογες πρωτείνικές ακολουθίες με
την χρήση του BLAST . Θα χρησιμοποιήσουμε την δεύτερη μέθοδο.
(Δοκιμάστε μόνοι σας την πρώτη). Για την μετάφραση της νουκλεοτιδικής ακολουθίας χρησιμοποιείστε τον μεταφραστή
στην σελίδα http://www2.ebi.ac.uk/translate με την επιλογή "Translate" για να
δείτε τα τρία αναγνωστικά πλαίσια.
Μπορείτε να εντοπίσετε το σωστό αναγνωστικό πλαίσιο; (Βοηθεια: Δεν πρέπει να
περιέχει κωδικόνια τερματισμού ). 3. Για
να αναγνωρίσετε το σωστό αναγνωστικό πλαίσιο (open reading frame) που
αντιστοιχεί στην ακολουθία χρησιμοποιείστε το πρόγραμμα BLAST (όπως στην άσκηση 3) για
να εντοπίσετε ομόλογες ακολουθίες. 4. Επαναλάβατε
το 2Β και 3 για την συμπληρωματική αλυσίδα του DNA. Ποιά από τις έξη πιθανές
πρωτεϊνικές ακολουθίες σας δίνει ομολογία με πραγματική πρωτείνη. Ποιά είναι
αυτή; |
|
|
Μπορείτε να εντοπίσετε
ομόλογες ακολουθίες χρησιμοποιώντας το πρόγραμμα αναζήτησης ακολουθιών BLAST (www2.ebi.ac.uk/blastall/). Eισάγετε
την ακολουθία σας στο παράθυρο (βλ. Σχήμα), επιλέγετε την DATABASE που θέλετε να ψάξετε και
κάνετε κλικ στο RUN
SEARCH. Μετά απο
λίγο θα δείτε τα αποτελέσματα της αναζήτησης. Για την περίπτωση πρωτεϊνικών
ακολουθιών επιλέξτε swissprot
για την DATABASE.
ΠΑΡΑΡΤΗΜΑ
1
Α. Ο χάρτης περιοριστικών
ενζύμων της Χ01405
Enzyme Positions of Recognition
Sites Recognition Sequence
________
______________________________________ ___________
AatI 740 agg/cct
AccI 827 gt/mkac
AccIII 1762 t/ccgga
AflIII 408 a/crygt
AlwNI 423 cagnnn/ctg
AocI 369 cc/tna
.
.
Β. Μετάφραση
της Χ01405
Η γενομική
ακολουθία X01405
ID HSP53R standard; RNA; HUM; 2066 BP.
XX
AC X01405;
XX
SV X01405.1
XX
DT 07-NOV-1985 (Rel. 07, Created)
DT 27-JAN-1995 (Rel. 42, Last updated, Version 8)
XX
DE Human mRNA fragment for phosphoprotein p53
XX
KW Alu repetitive sequence; antigen; phosphoprotein; tumor antigen.
XX
OS Homo sapiens (human)
OC Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Mammalia; Eutheria;
OC Primates; Catarrhini; Hominidae; Homo.
XX
RN [1]
RP 1-2066
RX MEDLINE; 85126934.
RA Matlashewski G., Lamb P., Pim D., Peacock J., Crawford L., Benchimol S.;
RT "Isolation and characterization of a human p53 cDNA clone: expression of
RT the human p53 gene";
RL EMBO J. 3:3257-3262(1984).
XX
RN [2]
RP 1-2066
RA Crawford L.;
RT ;
RL Submitted (06-NOV-1985) to the EMBL/GenBank/DDBJ databases.
XX
DR SWISS-PROT; P04637; P53_HUMAN.
DR TRANSFAC; T00671; T00671.
XX
CC Data kindly reviewed (06-NOV-1985)) by Crawford L.
XX
FH Key Location/Qualifiers
FH
FT source 1..2066
FT /db_xref="taxon:9606"
FT /organism="Homo sapiens"
FT CDS <1..883
FT /codon_start=2
FT /db_xref="SWISS-PROT:P04637"
FT /product="p53"
FT /protein_id="CAA25652.1"
FT /translation="KTYQGSYGFRLGFLHSGTAKSVTCTYSPALNKMFCQLAKTCPVQL
FT WVDSTPPPGTRVRAMAIYKQSQHMTEVVRRCPHHERCSDSDGLAPPQHLIRVEGNLRVE
FT YLDDRNTFRHSVVVPYEPPEVGSDCTTIHYNYMCNSSCMGGMNRRPILTIITLEDSSGN
FT LLGRNSFEVRVCACPGRDRRTEEENLRKKGEPHHELPPGSTKRALPNNTSSSPQPKKKP
FT LDGEYFTLQIRGRERFEMFRELNEALELKDAQAGKEPGGSRAHSSHLKSKKGQSTSRHK
FT KLMFKTEGPDSD"
FT old_sequence 1375..1379
FT /note="aacuu was au in [1]"
FT /citation=[1]
FT old_sequence 1392..1394
FT /note="ggu was gu in [1]"
FT /citation=[1]
FT misc_feature 1626..1936
FT /note="Alu-repeat sequence"
FT misc_feature 2049..2054
FT /note="pot. polyA signal"
FT polyA_site 2066
FT /note="polyA site"
XX
SQ Sequence 2066 BP; 445 A; 568 C; 509 G; 544 T; 0 other;
caaaacctac cagggcagct acggtttccg tctgggcttc ttgcattctg ggacagccaa 60
gtctgtgact tgcacgtact cccctgccct caacaagatg ttttgccaac tggccaagac 120
ctgccctgtg cagctgtggg ttgattccac acccccgccc ggcacccgcg tccgcgccat 180
ggccatctac aagcagtcac agcacatgac ggaggttgtg aggcgctgcc cccaccatga 240
gcgctgctca gatagcgatg gtctggcccc tcctcagcat cttatccgag tggaaggaaa 300
tttgcgtgtg gagtatttgg atgacagaaa cacttttcga catagtgtgg tggtgcccta 360
tgagccgcct gaggttggct ctgactgtac caccatccac tacaactaca tgtgtaacag 420
ttcctgcatg ggcggcatga accggaggcc catcctcacc atcatcacac tggaagactc 480
cagtggtaat ctactgggac ggaacagctt tgaggtgcgt gtttgtgcct gtcctgggag 540
agaccggcgc acagaggaag agaatctccg caagaaaggg gagcctcacc acgagctgcc 600
cccagggagc actaagcgag cactgcccaa caacaccagc tcctctcccc agccaaagaa 660
gaaaccactg gatggagaat atttcaccct tcagatccgt gggcgtgagc gcttcgagat 720
gttccgagag ctgaatgagg ccttggaact caaggatgcc caggctggga aggagccagg 780
ggggagcagg gctcactcca gccacctgaa gtccaaaaag ggtcagtcta cctcccgcca 840
taaaaaactc atgttcaaga cagaagggcc tgactcagac tgacattctc cacttcttgt 900
tccccactga cagcctccca cccccatctc tccctcccct gcgattttgg gttttgggtc 960
tttgaaccct tgcttgcaat aggtgtgcgt cagaagcacc caggacttcc atttgctttg 1020
tcccggggct ccactgaaca agttggcctg cactggtgtt ttgttgtggg gaggaggatg 1080
gggagtagga cataccagct tagattttaa ggtttttact gtgagggatg tttgggagat 1140
gtaagaaatg ttcttgcagt taagggttag tttacaatca gccacattct aggtaggggc 1200
ccacttcacc gtactaacca gggaagctgt ccctcactgt tgaattttct ctaacttcaa 1260
ggcccatatc tgtgaaatgc tggcatttgc acctacctca cagagtgcat tgtgagggtt 1320
aatgaaataa tgtacatctg gccttgaaac caccttttat tacatggggt ctagaacttg 1380
acccccttga gggtgcttgt tccctctccc tgttggtcgg tgggttggta gtttctacag 1440
ttgggcagct ggttaggtag agggagttgt caagtctctg ctggcccagc caaaccctgt 1500
ctgacaacct cttggtgaac cttagatcct aaaaggaaat gtcaccccat cccacaccct 1560
ggaggatttc atctcttgta tagatgatct ggatccacca agacttgttt tagctcaggg 1620
tccaatttct tttttctttt tttttttttt tttctttttc tttgagactg ggtctctttg 1680
ttgccccagg ctggagtgga gtggcgtgat ctggcttact gcagcctttg cctccccggc 1740
tcgagcagtc ctgcctcagc ctccggagta gctgggacca caggttcatg ccaccatggc 1800
cagccaactt ttgcatgttt tgtagagatg gggtctcaca gtgttgccca ggctggtctc 1860
aaactcctgg gctcaggcga tccacctgtc tcagcctccc agagtgctgg gattacaatt 1920
gtgagccacc acgtccagct ggaagggtca acatctttta cattctgcaa gcacatctgc 1980
attttcaccc cacccttccc ctcttctccc tttttatatc ccatttttat atcgatctct 2040
tattttacaa taaaactttg ctgcca 2066
//
Η ακολουθία που θα δώση η σωστή μετάφραση θα είναι:
KTYQGSYGFRLGFLHSGTAKSVTCTYSPALNKMFCQLAKTCPVQLWVDST
50
PPPGTRVRAMAIYKQSQHMTEVVRRCPHHERCSDSDGLAPPQHLIRVEGN
100
LRVEYLDDRNTFRHSVVVPYEPPEVGSDCTTIHYNYMCNSSCMGGMNRRP
150
ILTIITLEDSSGNLLGRNSFEVRVCACPGRDRRTEEENLRKKGEPHHELP
200
PGSTKRALPNNTSSSPQPKKKPLDGEYFTLQIRGRERFEMFRELNEALEL
250
KDAQAGKEPGGSRAHSSHLKSKKGQSTSRHKKLMFKTEGPDSD
Γ. Εντοπισμός αμινοξικής
ακολουθίας από ηλεκτροφόρηση νουκλεοτιδικής .
Η ακολουθία που διαβάζεται από την ηλεκτροφόρηση είναι:
CTGCC CTGTG CAGCT GTGGG TTGAT TCCAC ACTC
Η μετάφραση της ακολουθίας DNA για την κανονική και την συμπληρωματική αλυσίδα δίνει τα παρακάτω πιθανά πρωτεϊνικά τμήματα:
Forward strand:
5' CUGCCCUGUGCAGCUGUGGGUUGAUUCCACACUC 3'
L P C A A V G * F H T
C P V Q L W V D S T L
A L C S C G L I P H
Reverse strand:
3' GACGGGACACGUCGACACCCAACUAAGGUGUGAG 5'
Q G T C S H T S E V S
A R H L Q P N I G C E
G Q A A T P Q N W V