Άσκηση Εξέλιξης 2
Προσομοίωση Εξέλιξης Ακολουθιώv Βάσεων DNA
(SDSE: Simulation of DNA Sequence
Evolution)
Πρόγραμμα από:
Jose L. Oliver, Unidad de Genetica,
Facultad de Ciencias Universidad de Granada, Ε-18071-GRANADA (Spain)
Δημοσιευμένες αναφορές:
Oliver, J.L., Α. Marin & J.R. Medina. 1989. SDSE: Α software package to simulate the evolution of α pair of DNA sequences. Computer Applications in the Biosciences
(CABIOS) 5: 47-50.
Rodriguez, F., J.L. Oliver, Α. Marin & J.R. Medina. The general
stochastic model of nucleotide substitution. Journal of Theoretical Biology (in
the press).
Copyright (C) Jose L. Oliver, 1989
Αll rights reserved
ΕΙΣΑΓΩΓΗ.
Στην μελέτη της μοριακής εξέλιξης, οι ακολουθίες DNA μας δίνουν
περισσότερες πληροφορίες από τις αμινοξικές ακολουθίες μια που όλες οι
ακολουθίες DNA δεν μεταφράζονται σε πρωτείνες. Οι εξελικτικές αλλαγές του DNA
συμβαίνουν είτε με μετάλλαξη βάσεων είτε με διαγραφή ή εισαγωγή βάσεων. Το
πρόγραμμα SDSE προσομοιώνει την εξέλιξη του DNA με μεταλλάξεις. Υπάρχουν πολλοί
τρόποι κάτω από τους οποίους μεταλλαγές βάσεων μπορούν να πραγματοποιηθούν (Nei
1987) και το πρόγραμμα SDSE μας δίνει την ευκαιρία προσομοίωσης με πολλούς από
αυτούς τους τρόπους. Η προσομοίωση γίνεται σε ακολουθίες βάσεων μεταβλητού
μήκους με τυχαίες μεταλλαγές αλλά με ποσοστά μεταλλαγής που επιβάλονται από τον
τρόπο-που έχει προτιμηθεί. Το πρόγραμμα πραγματοποιεί δοθέντα αριθμό τυχαίων
μεταλλαγών σε αρχέγονη ακολουθία βάσεων και με αυτό τον τρόπο δημιουργεί
'εξελιγμένες' ακολουθίες.
Οταν δύο 'απόγονοι' ακολουθίες αποκτήσουν ένα μεγάλο αριθμό
μεταλλαγών (όπως συμβαίνει και στην πραγματικότητα) γίνονται πολλαπλές και
παράλληλες αλλαγές. Ετσι το παρατηρούμενο ποσοστό αλλαγών βάσεων μεταξύ δύο
ακολουθιών πρέπει να είναι μία υποεκτίμηση του πραγματικού αριθμού μεταλλαγών.
Για να αποφεύγεται αυτή η υποεκτίμηση έχουν προταθεί διάφορες στατιστικές
μέθοδοι. Jukes-Cantor (1969) single parameter (JC) method, Kimura's (1980)
two-parameter (Κ2Ρ) method, Kimura's (1981) three-substitution-type
(K3ST) method, Takahata & Kimura's (1981) (ΤΚ) method,Gojobori et al's (1982) (GIN) method, Tajima & Nei's (1984)
(ΤΝ) method, κλπ.
Για την σύγκριση της εγκυρότητας και ακρίβειας αυτών των μεθόδων
και την περιοχή εφαρμογής τους, μία προσομοίωση στον υπολογιστή εξέλιξης
ακολουθιών DNA είναι απαραίτητη.
Για ευκολία ο υπολογιοτής χρησιμοποιεί προκαθωριομένο χρόνο
εξέλιξης αντί για συνεχή προσέγγιοη. Οι συχνότητες ισορροπίας για ένα δεδομένο
σχήμα μεταλλαγής υπολογίζονται με το τετράγωνο του αντίστοιχου πίνακα
μεταπτώσεων. Για κάθε σχήμα μία τυχαία (ή προκαθωρισμένη) ακολουθία DNA με
προκαθωρισμένο μήκος παράγεται και χρησιμοποιείται σαν αρχέγονη ακολουθία στην
προσομοίωση. Από αυτή την ακολουθία απόγονοι ακολουθίες παράγονται και που μετά
μπορούν να συγκριθούν.
ΧΡΗΣΗ ΤΟΥ ΠΡΟΓΡΑΜΜΑΤΟΣ
Το πρόγραμμα τρέχει με την εντολή SDSE οπότε εμφανίζεται ο
παρακάτω πίνακας επιλογής:
SDSE V2.0: Simulation of DNA Sequence
Evolution
1. Set υρ data disk (Επιλογή δίσκου)
2. Enter substitution schemes (Επιλογή σχήματος
μεταλλαγής)
3. Generate random DNA sequences (Παραγωγή
τυχαίων ακολουθιών DNA)
4. Simulate DNA evolution (Προσομοίωση εξέλιξης)
5. Estimate divergence (Υπολογισμός απόκλισης)
6. Exit to DOS (Εξοδος στο DOS)
Επεξηγήσεις.
1. Επιλογή δίσκου που ευρίσκονται τα δεδομένα (π.χ. A:,C:,F:).
2. Αυτή η επιλογή επιτρέπει την μετατροπή σχημάτων μετάλλαξης και
υπολογίζει τις αντίστοιχες συχνότητες ισορροπίας των βάσεων. Είναι δυνατή η
αλλαγή των ποσοστών μεταλλαγής βάσεων και η αλλαγή των διαφόρων παραμέτρων των
μεθόδων Jukes-Cantor (1969) single parameter (JC) method, Kimura's (1980) two-parameter (Κ2Ρ) method, Kimura's (1981) three-substitution-type (K3ST) method, Takahata & Kimura's (1981) (ΤΚ) method, Gojobori et al's (1982) (GIN)
method, and Tajima & Nei's (1984) (ΤΝ). Είναι επίσης δυνατή η απ'ευθείας αλλαγή των δώδεκα
ποσοστών μεταλλαγής, χρησιμοποιώντας έτσι ένα καινούργιο σχήμα (ΟΤ).
3. Με αυτή την επιλοyή παράγονται τυχαίες ακολουθίες βάσεων. Με
αυτό τον τρόπο μπορούν να παραχθούν αρχέγονες ακολουθίες με συχνότητες
ισορροπίας ενός δεδομένου σχήματος (βλ. 2). 0 μέγιστος επιτρεπόμενος αριθμός
βάσεων DNA είναι 3000.Για την διατήρηση του format σύμφωνα με την GENBANK το
πρόγραμμα ζητάει ένα ΟΝΟΜΑ (LOCUS), τον αριθμό των βάσεων και την ημερομηνία
δημιουργίας της ακολουθίας. Στη σειρά DEFINITION γράφεται μία συνοπτική
περιγραφή ενώ στα COMMENT αναφέρονται οι ζητούμενες και πραγματικές συχνότητες
βάσεων. Η γραμμή ORIGIN δίνει την πηγή της ακολουθίας.
4. Με αυτή την επιλογή προσομοιώνεται η εξέλιξη του DNA. Μετά την
επιλογή ενός σχήματος μετάλλαξης, το πρόγραμμα πραγματοποιεί τον ζητούμενο
αριθμό τυχαίων μεταλλάξεων στην αρχέγονη ακολουθία,φτιάχνοντας μία 'απόγονο'
ακολουθία που γράφεται στον δίσκο με το όνομα που επιλέγεται. Περισσότερες της μιας
ακολουθίες μπορούν να παραχθούν και να συγκριθούν.
5. Η επιλογή αυτή επιτρέπει τον υπολογισμό της συγκεντρωτικής
απόκλισης δύο απόγονων ακολουθιών με διαφορετικούς αλγορίθμους. Αυτοί περιέχουν Jukes and Cantor (1969), Kimura (1980,
1981), Takahata and Kimura (1981) Gojobori, Ishii and Nei (1982) and Tajima and
Nei (1984).
6. Τέλος του προγράμματος και επιστροφή στο λειτουργικό σύστημα
DOS.
ΠΕΡΙΓΡΑΦΗ ΤΗΣ ΑΣΚΗΣΗΣ
Μερος lον.
Επιλογή μεθόδου υπολογισμού απόκλισης.
Δίνεται η αρχέγονη ακολουθία ANCESTOR στο αρχείο ANCESTOR.SEQ.
Χρησιμοποιώντας την προσoμοίωση εξέλιξης (4) υπολογίστε δύο νέες
τελικές ακολουθίες (απογόνους) με 20 μεταλλαγές και υπολογίστε την απόκλιση (5)
για όλες τις μεθόδους.
Εφαρμόστε την ίδια τεχνική με 1000 μεταλλαγές.
Φτιάξτε δύο πίνακες της παρακάτω μορφής για τις δύο περιπτώσεις
(20,1000 μεταλλαγές)
|
JK |
K |
TK |
GIN |
TN |
D20 |
|
|
|
|
|
D1000 |
|
|
|
|
|
Ποια κρίνετε ότι είναι η πιο ακριβής μέθοδος;
Μερος 2ον.
Προσδιορισμός απόκλισης πραγματικών δεδομένων.
Δίνονται τρείς τελικές πραγματικές ακολουθίες. Χρησιμοποιώντας την
μέθοδο με την μεγαλύτερη ακρίβεια (μέρος 1ον) ταξινομίστε τις ακολουθίες με
σειρά φθίνουσας συγγένειας (ή αύξουσας απόκλισης).
ΒΙΒΛΙΟΓΡΑΦΙΑ
Bilofsky, H.S., C. Burks,
J.W. Fickett, W.B. Goad, F.L. Lewitter, W.P. Rindone,C.D.Swindell, and C.S.
Tung. 1986. The GenBank genetic sequence databank. Nucl. Acids Res. 14: 1‑4.
Burks, C., Fickett, J.W.,
Goad, W.B., Kanehisa, M., Lewitter, F.I., Rindone, W.P., Swindell, C.D., Tung,
C.S., and Bilofsky, H.S. 1985. The GenBank nucleic acid sequence database.
Computer Applications in the Biosciences (CABIOS) 1: 225-233.
Gojobori, T., Ishii, K., and
Nei, M. 1982. Estimation of average number of nucleotide substitutions when the
rate of substitution varies with nucleotide. J. Mol. Evol. 18: 414-423.
Hamm, G.H. and G.N. Cameron.
1986. The EMBL data library. Nucl. Acids Res. 14: 5-9.
Jukes, T.H., and Cantor, C.R.
1969. Evolution of proteins molecules, in Munro, H.N. (ed.) Mammalian protein
metabolism. Academic Press, New York, pp. 21123.
Kimura, M. 1980. A simple method for estimating evolutionary rates of base substitutions through comparative studies of nucleotide sequences. J. Mol. Evol. 16: 111-120.
Kimura, M. 1981. Estimation
of evolutionary distances between homologous nucleotide sequences. Proc. Natl.
Acad. Sci. USA. 78: 454-458.
Nei, M. 1987. Molecular
Evolutionary Genetics. Columbia University Press, New York.
Oliver, J.L., A. Marin &
J.R. Medina. 1989. SDSE: A software package to simulate the evolution of a pair
of DNA sequences. Computer Applications in the Biosciences (CABIOS) 5: 47-50.
Rodriguez, F., J.L. Oliver,
A. Marin & J.R. Medina. 1989. The general stochastic model of nucleotide
substitution. Journal of Theoretical Biology (in the press).
Tajima, F. and Nei, M. 1984.
Estimation of evolutionary distance between nucleotide sequences. Mol. Biol.
Evol. 1: 269-285.
Takahata, N. and Kimura, M.
1981. A model of evolutionary base substitutions and its application with
special reference to rapid change of pseudogenes. Genetics 98: 641-657.
LOCUS
test6 3088 bp DNA
COMMENT
Simulated evolved sequence
Total changes = 0
(Divergence from the original =
.00)
Multiple changes = 0
Nucleotide frequencies:
Original: qA = .290 qC = .173
qG = .241 qT = .296
Evolved: qA = .290 qC = .173
qG = .241 qT = .296
BASE COUNT
894 a 534 c 745 g
915 t
ORIGIN
Sequence evolved from human.dna
under GIN.SCH scheme
1
GCACGTCAGG GCGCGGGAGC GCGGAGCGAG TTTGGTTGCA CTTACACCGG TACTTAAGCG
61
CGGACCGGCG TGTCCTTGGA CTTAGAGAGT GGGGACGTCC GGCTTCGGAG CGGGAGTGTT
121
CGTTGTGCCA GCGACTAAAA AGAGGTGAGA GCGGGTCGCG GAGGCCGCAC CTGGTTAGAG
181 GCAGAGCTGT GGGAGGCGCG CACTTGCGAG
CGAGCCGAAA CCCAAGCGGG GAGCATTCGA
241
GGTGGAGCCC GCGCTGGGTG GGAGGGCGGG GAGTGAAGAC CCTGGACTGT GGTCAGACCG
301
AGCTGGGCGA GTAACGGCTT GAGGTGCGGC GGAGCCCTAA CTAGGGACAG GTATGGTCTC
361
GGTCAGGGAC TGGAGGCGGC TTGGATACAG ATCCGAGGAG GAGGCGGCCT CTTCCGTAGT
421
GGTTGCTGAA GGGCTATGGA AATGATAGGC AAGACTTCCC TCCTGGAAAG CCGAAGCTTA
481
GAGCTTCACG TTCTTCTTCA GAGGGCAAAA GCTGTTGCTC TTCTAATAAG GGGCCAGTTC
541
TTTTCGTGGG CACATGTTTC TTCCGTCAGT CGTTCTGACA TCCTAGAAGG AGTTTCATCA
601
ATCACCTTGA AACCGACCTG GACGGGTGAC CTCGTGGTCG CCCCAGGAGA TCACAGGTAG
661
GGGAGTTGGG ATCGCCCGGG GGACCGTGCA GCCTGCCCCT GAGCTCCCAT TCACAAGTTC
721
GAGTGTCAAG CTACTCCTGT GACCTGGGCA GATAGAAACA GCCAGGACCG CTTTTTAAAC
781 ATTTGTGTGC
TTTGCGTTAT CCTCAGGGAG AGGTGGCTTT ACATTGTAGT AAGATTAAAT
841
GGTTAGGTCT TTTTAAAAGT TGCGGTTGTG GTGATTTTGG CTTAATGTGT TCGCCCTTGA
901
GCTTCAGATC TGTGACTTCG TGACCATGAT TGTCTCTTCT GAAACTGGAG TTTGAATTAG
961
GTTCCCTCTT TGCTTGGGCT TTAACGTTCC TTCACGTATA CACACAAAAA TACGTTTTTG
1021
AGGAGGTACT CCTAAAAATG TTTTTGGTAT TAAAGAATAT TTGGTATAAA GAGTATTAAA
1081
GCAAAACAAG ATTCATTCTG GTATTTAATG ACATAAATTA GCAATGGATT GGTAATTAAG
1141
TGGCTAGAGT GGTCATTCAT TTACACTGTA TTTGTTACCT GAGGAAAAAT TTACTAAGTT
1201
GAAGCTTTCG TTTTTAGAAT TAAATATGGG TGATGTTGAG AAAGGCAAGA AGATTTTTAT
1261
TATGAAGTGT TCCCAGTGCC ACACCGTTGA AAAGGGAGGC AAGCACAAGA CTGGGCCAAA
1321
TCTCCATGGT CTCTTTGGGC GGAAGACAGG TCAGGCCCCT GGATACTCTT ACACAGCCGC
1381
CAATAAGAAC AAAGGTAAGA GTCACTTGTT AAATAAAACA ACACAAAATG CAGGAATATA
1441
ACATGTGGCA AACTATCAGG AGTGTGAAAT AACCGATGCA TTCTTTCTTG TTTAGGCATC
1501
ATCTGGGGAG AGGATACACT GATGGAGTAT TTGGAGAATC CCAAGAAGTA CATCCCTGGA
1561
ACAAAAATGA TCTTTGTCGG CATTAAGAAG AAGGAAGAAA GGGCAGACTT AATAGCTTAT
1621
CTCAAAAAAG CTACTAATGA GTAATAATTG GGCCACTGCC TTATTTATTA CAAAACAGAA
1681
ATGTCTCATG ACTTTTTTAT GTGTACCATC CTTTAATAGA TCTCATACAC CAGAATTCAG
1741
ATCATGAATG ACTGACAGAA TATTTTGTTG GGCAGTCCTG ATTTAAAACT AAGACTGGCT
1801 TGTGGTTAAA TGAATATGTT CAGTTTTTGA
ATTTTAATAG TAACTCCAAT TCAGTAAATG
1861
GTATCACTGT TTACCCCTTT TAAAGATATG ATTAGACTTC GTTAGTAATG TTCAACTTTT
1921
CACAAAGATG GTGAGTGCCA TCTTAAAACT TACTGGAGAT TGGTTTTATA TTTAGATTTA
1981
TATAACTGGT TATGTGAATA TATTTAAATA CTGGGGAAAT TGCTTCACTG TCTTAGAACC
2041
AAGCAAGATT CACCTGTGTT TTGTGTTCAT GTTCATTTGC CTCTTAAAGG CAAGGGTTGA
2101
AGATAAATAA GGTAGCAATG TCTATAGTTT TGGCCTTAAC TATGCCAATC TAATTATAAT
2161
TCCCTGTATT TAAAATGGTT TCTTTTACTT ATTGAAAGGC ATTTTAGTGT GGTTTATGTG
2221
TAATATTAAA GATTATTCAA CACCTCTCAC ATCTTACAGA TCTATAAGGT CACATGCTTT
2281
TAAAATAGTA GCAAGTTAAA CTTCACTCTT GAATTCTTTA CAATCTAAGT CAAACTAAGT
2341
TATAATTTAG GATTGTCTTT AAACAGCCAT TCAGAAACAA AACTGTAGAA CTGTGTATTT
2401
GATTGGGAAT GGTGCTTTTG CCAACTTAAA AGGATTAAAG TAACGGAGAT ATACACAAAT
2461
TTTAAAATTA TGTGTGATCA CAAGACTAAA GATAATTAAA AAGAAAACCA CAGATCATGA
2521
CTTTTTGACT GTGCTTGATT TCATGACTGA TGCACAAATT TTAATGATTA AAAAGTGCAG
2581
GAGCCCTAAA TGTCAGTGCA GCAGCCCTAA ATGTCAGTGC AGCAGTGTTA ACCAGTCATG
2641
GTGCTAGATT GTTTACTTGG TTTTCTAGGA CTGCCTCAAC TAGAATAACA CTTCACTAAT
2701
TGACTCTTAG TTTCTTTGCT CAGATTGAGA ACTGCAGCAT TTATCGCAGA CATGGACAGA
2761
GGAATGCCTG TGGTCATAGT TTTGTGATGT GTAACAGTGT ATAATTACAT ACTGAATTAT
2821
TTCATGCATA GTCTGTGCCA TACACATTTA GAGTAGTCCT TGGAGATTTT ATGGAGATGG
2881
TGAGCACAAG GTAAGTCATA AAGAATAATG AGAAAATAAA TCTATGCTGG TGCAGCTGAG
2941
AACTGTATCT TTGTGGGACA GTGAGAAGAC TGAGAAGATG TGAATCCATG GTCTCAAAGG
3001
TGATAGGGAC GATTAGATAG GTGTTTTAAG GCCTGAAAGC AATTTATAAC ATATGAGTCT
3061
TATTTTTATT TATAGAAATG TGAAGCTT //
LOCUS
test2 3088 bp DNA
DV
COMMENT
Simulated evolved sequence
Total changes = 66
(Divergence from the original =
.02)
Multiple changes = 66
Nucleotide frequencies:
Original: qA = .290 qC = .173
qG = .241 qT = .296
Evolved: qA = .289 qC = .175
qG = .239 qT = .297
BASE COUNT
893 a 539 c 738 g
918 t
ORIGIN
Sequence evolved from DV.dna
under GIN.SCH scheme
1
GCACGTCAGG GCGCGGGAGC GCGGAGCGAG TTTGGTTGCA CTTACACCGG TACTTAAGCG
61
CGGACCGGCG TGTCCTTGGA CTTAGAGAGT GGGGACGTCC GGCTTCGGAG CGGGAGTGTT
121
CGTTGTGCCA GCGACTAATA AGAGGTGAGA GCGGGTCGCG GAGGCCGCAC CTGGTTAGAG
181
GCAGAGCTGT GGGAGGCGCG CACTTGCGAG CGAGCCGAAA CCCAAGCGGG GAGCATTCGA
241
GGTGGAGCCC GCGCTGGGTG GCAGGGCCGG GTGTGAAGAC CCTGGACTGA GGTCAGACCG
301
AGCTGGGCGA GTAACGGCTT GAGGTGCGGC GGAGCCCTAA CTAGGGACAG GTATGGTCTC
361
GGTCAGGGAC TGGATGCGGC TTGGATACAG ATCCGAGGAG GAGGCGGCCT CTTCCGTAGT
421
GGTTGCTGAA GGGCTATAGA AATGATAGGC AAGACTTCCC TCCTGGAAAG CCGAAGCTTA
481
GAGCTTCACG TTCTTCTTCA GAGGGCATAA CCTGTTGCTC TTCTAATAAG GGGGCAGATC
541
TTTTCGTGGG CACATGTTTC TTCCGTCAGT CGTTCTGTCA TCCCAGAAGG AGTTTCATCA
601
ATCACCTTGA AACCGACCTG GACGGGTGAC CTGGTGGTCG CCCCAGGAGA TCACAGGTAG
661
GGGAGTTGGG ATCGCCCGGG GGACCGTGCA GCCTGCCCCT GAGCTCCCAT TCACAAGCTC
721
GAGTGTCAAG CTACTCCTGT GACCTGGGCA GATAGAAACA GCCAGGACCG CTTTTTAAAC
781
ATTTGTGTGC TTTGCGTTAT CCTCAGGGAG AGGTGGCTTT ACATTGTAGT AAGATTAAAT
841
GGTTAGGACT TTTTAAAAGT TGCGGTTGTG ATGATTTTGG CTTAATGTCT ACGCCCTTGA
901
GCTTCAGATC TGTGACTTCG TGACCATGAT TGTCTCTTCT GAAACTGGAG TTTGAATTAG
961
GTTCCCTCTT TGCTTGGGCT TTAACGTTCC TTCACGTATA CACACAAAAA TACGTTTTTG
1021
TGGAGGTACT CCTAAAAATG TTTTTGGTAT TAAAGAAAAT TTGGTATAAA TAGTATTAAA
1081
GCGAAACAAG ATTCATTCTG GTATTTAATG ACATAAATAA GCAATGTATT GGTAATTATG
1141
TGGCTAGAGT GGTCATTTAT TTACACTGCA TTTGTTACCT GAGGTAAAAT TTACTAAGTT
1201
GAAGCTTTGG TTTTTAGAAT TAAATATGGG AGATGTTGAG AAAGGCAAGA AGATTTTTAT
1261
TATGAAGTGT TCCCAGTGCC ACAGCGTTGA TAAGGTAGGC AAGCACAAGA CTGGGCCAAA
1321
TCTCCATGGT CTCTTTGGGC GGAAGACAGG TCAGGCCCCT GGATACTCTT ACACAGCCGC
1381
CAATAAGAAC AAAGGTAAGA GTCACTTGTT AAATAAAACA ACACAAAATG CAGGAATATA
1441
ACATGTGGCA AACTTTCAGG AGTGTGAAAT AACCGATGGA TTCTTTCTTG TTTAGGCATC
1501
ATCTGGGGAG AGGATACTCT GATGGAGTAT TTGGAGAATC CCAAGAAGTA CATCCCTGGA
1561
ACAAAAATGA TCTTTGTCGG CATTAAGAAG AAGGAAGAAA GGGCAGACTT AATAGCTTAT
1621
CTCAAAAAAG CTACTAGTGA GTAATAATTG GGCCACTGCC TTATTTATTA CAAGACAGAA
1681
ATGTCTCATG ACTTTTTTAT GTGTACCATC CTTTAATAGA TCTCATAGAC CAGAATTCAG
1741 ATCATGAATG
ACTGACAGAA TATTTTGTTG GGCAGTCCTG ATTTAAAACT AAGACTGGCT
1801
TGTGGTTAAA TAAATATGCT CAGTTTTTGA ATTTTAATAG TAACTCCAAT TCAGTAAATG
1861
GTATCACTGT TTACCCCTTT TAAAGATATG ATTAGACTTC GTTAGTAATG TTCAACTTTT
1921
CACAAAGATG GTGAGTGCCA TCTTAAAACT TACTGGAGAT TGGTTTTATA TTTAGATTTA
1981
TATAACTGGT TATGTGAATA TATATAAATA CTGGGGAAAT TGCTTCACTG TCTTAGAACC
2041
AAGCAAGATT CACCTGTGTT TTGTGTCCAT GTTCATTTGC CTCTTAAAGG CAAGGGTTGA
2101
AGATAAATAA GGTAGCAATG TCTATAGTTT TGGCCTTAAC TATACCAATC TAATTAAAAT
2161
TCCCTGTATT TAAAATGGTT TCTTTTACTT ATTGAAAGGC ATTTTAGTGT GGTTTATGTG
2221
TAATATTAAA GATTATTCAA CACCTCTCAC AGCTTACAAA TCTATAAGGT CACATGCTTT
2281
TAAAATAGTA GCAAGTTAAA CTTCACTCTT GAATTCTTTA CAATCTAAGT CAAACTAAGT
2341
TATAATTTAG GATTGTCTTT AAACAGCCAT TCAGAAACAA AACTGTAGAA CTGTGTATTT
2401
GATTCGGAAT GGTGCTTTTG CCAACTTAAA AGGATTAAAG TTACGGAGAT ATACACAAAT
2461
TTTAAACTTA TGTGTGATCA CAAGACTAAA GATAATTAAA AAGAAAACCA CAGATCATGA
2521
CTTTTTGACT GTGCTTGATT TCATGACTGA TGCACAAATT TTAATGATTA AAAAGTGCAG
2581
GAGCCCTAAA TGTCAGTGCA GCAGCCCTAA ATGTCAGTGC AGCAGTTTTA ACCAGTCATG
2641
GTGCTAGATT GTTTACTTGG TTTTCTAGGA CTGCCTCAAC TAGAATAACG CTTCACTAAT
2701
TGACTCTTAG TTTCTATGCT CAGATTGAGT ACTGCAGCAT TTATCGCAAA CATGGACAGA
2761
GGAATGCCTG TGGTCATAGT TTTGTGATGT GTAACAGTGT ATAATTACAC ACTGAATTAT
2821
TTCTTGCATA GTCTGTGCCA TACACATTTA GAGTAATCCT TGGAGATTTT ATGGAGATGG
2881
TGAGCACAAG GTAAGTCATA AAGAATAATG AGAAAATAAA TCTATGCTGG TGCAGCTGAG
2941
AACTGTATCT TTGTGGGACA GTGAGAAGAC TGAGATGATG TGAATCCATG GTCTCAAAGG
3001
TGATAGGGAC GGTTAGATAG GTGTTTTAAG GCCTGAAAGC AATTTATAAC ATATTAGTCT
3061
AATTTTTATT TATAGAAATG TAAAGCTT //
LOCUS
test4 3088 bp DNA DRO
COMMENT
Simulated evolved sequence
Total changes = 33
(Divergence from the original =
.01)
Multiple changes = 33
Nucleotide frequencies:
Original: qA = .290 qC = .173
qG = .241 qT = .296
Evolved: qA = .288 qC = .174
qG = .243 qT = .295
BASE COUNT
890 a 538 c 749 g
911 t
ORIGIN
Sequence evolved from DRO.dna
under GIN.SCH scheme
1
GCACGTCAGG GCGCGGGAGC GCGGAGCGAG TTTGGTTGCG CTTACACCGG TACTTAAGCG
61
CGGACCGGCG TGTCCTTGGA CTTAGAGAGT GGGGACGTCC GGCTTCGGAG CGGGAGTGTT
121
CGTTGTGCCA GCGACTAAAA AGAGGTGAGA GCGGGTCGCG GACGCCGCAC CTGGTTAGAG
181
GCAGAGCTGT GGGAGGCGCG CACTTGCGAG CGAGGCGAAG CCCAAGCGGG GAGCATTCGA
241
GGTGGAGCCC GCGCTGGGTG GGAGGGCGGG GAGTGAAGAC CCTGGACTGT GGTCAGACCG
301
AGCTGGGCGA GTAACGGCTT GAGGTGCGGC GGAGCCCTAA GTAGGGACAG GTATGGTCTC
361
GGTCAGGGAC TGGAGGCGGC TTGGATACAG ATCCGAGGAG GAGGCGGCCT CTTCCGTAGT
421
GGTTGCTGAA GGGCTATGGA AATGATAGGC AAGACTTCCC TCCTGGAAAG CCGAAGCTTA
481
GAGCTTCACG TTCTTCTACA GAGGGCAAAA GCTGTTGCTC TTCTAATAAG GGGCCAGTTC
541
TTTTCGTGGG CACATGTTTC TTCCGTCAGT CGTTCTGACA TCCTAGAAGG AGTTTCATCA
601
ATCACCTTGA AACCGACCTG GACGGGTGAC CTCGTGGTCG CCCCAGGAGA TCACAGGTAG
661
GGGAGCTGGG ATCGCCCGGG GGACCGTGCA GCCTGCCCCT GAGCTCCCAT TCACAAGTTC
721
GAGTGTCAAG CTACTCCTGT TACCTGGCGA GATAGAAACA GCCAGGACCG CTTTTTAAAC
781
ATTTGTGTGC TTTGCGTTCT CCTCAGGGAG AGGTGGCTTT ACATTGTAGT AAGATTAAAT
841
GGTTAGGTCT TTTTAAAAGT TGCGGTTGTG GTGATTTTGG CTTAATGTGT TCGCCCTTGA
901
GCTTCAGATC TGTGACTTCG TGACCATGAT TGTCTCTTCT GAAACTGGAG TTTGAATTAG
961
GTTCCCTCTT TGCTTGGGCT TTAACGTTCC TTCACGTATA CACACAAAAA TACGTTTTTG
1021
AGGAGGTACT CCTAAAAATG TTTTTGGTAT TAAAGAATAT TTGGTATAAA GAGTATAAAA
1081
GCAAAACAAG ATTCATTCTG GTATTTAATG ACATAAATTA GCAATGGATT GGTAAATAAG
1141
TGGCTAGAGT GGTCATTCAT TTACACTGTA TTTGTTACCT GAGGAAAAAT TTACTAAGTT
1201
GAAGCTTTCG TTTTTAGAAT TAAATATGGG TGATGTTGAG AAAGGCAAGA AGATTTTTAT
1261
TATGAAGTGT TCCCAGTGCC TCACCGTTGA AAAGGGAGGC AAGCACAAGA CTGGGCCAAA
1321
TCTCCATGGT CTCTTTGGGC GGAAGACAGG TCAGGCCCCT GGATACTCTT ACACAGCCGC
1381
CAATAAGAAC AAAGGTAAGA CTCACTTGTT AAATAAAACA ACACAAAATG CAGGAATATA
1441
ACATGTGGCA AACTATCAGG AGTGTGAAAT AACCGATGCA TTCTTTCTTG TTTAGGCATC
1501
ATCTGGGGAG AGGATACACT GATGGAGTAT TTGGAGAATC CCAAGAAGTA CATCCCTGGA
1561
ACAAAAATGA TCTTTGTCGG CATTAAGAAG AAGGAAGAAA GGGCAGACTT AATAGCTTAT
1621
CTCAAAAAAG CTACTAATGA GTAATAATTG GGCCACTGCC TTATTTATTA CAAAACAGAA
1681 ATGTCTCATG
ACTTTTTTAT GTGTACCATC CTTTAATAGA TCTCATACAC CAGAATTCAG
1741
ATCATGAATG ACTGACAGAA TATTTTGTTG GGCAGTCCTG ATTTAAAACT AAGACTGGCT
1801
TGTGGTTAAA TGAATATGTT CAGTTTTTGA ATTTTAATAG TAACTCCAAT TCAGTAAATG
1861
GTATCACTGT TTACCCCTTT TAAAGATATG ATTAGACTTC GTTAGTAATG TTCAACTTTT
1921
CACAAAGATG GTGAGTGCCA TCTTAAAACT TACTGGAGAT TGGTTTTATA TTTAGATTTA
1981
TATAACTGGT TATGTGAATA TATTTAAATA CTGCGGAAAT TGCTTCACTG TCTTAGAACC
2041
ATGCAAGATT CACCTGTGTT CTGTGTTCAT GTTCATTTGC CTCTTAAAGG CAAGGGTTGA
2101
AGATAAATAA GGTAGCAATG TCTATAGTTT TGGCCTTAAC TATGCCAATC TAATTATAAT
2161
TCCCTGTATT TAAAATGGTT TCTTTTACTT ATTGAAAGGC ATTTTAGTGT GGTTTATGTG
2221
TAATATTAAA GATTATTCAA CACCTCTCAC ATCTTACAGA TCTATAAGGT CACATGCTTT
2281
TAAAATAGTA GCAACTTAAA CTTCACTCTT GAATTCTTTA CAATCTAAGT CAAACTAAGT
2341
TATAATTTAG GATTGACTTT AAACAGCCAT TCAGAAACAA AACTGTAGAA CTGTGTATTT
2401
GATTGGGAAT GGTGCTTTTG CCAACTTAAA AGCATTAAAG TAACGGAGAT ATACACAAAT
2461
TTTAAAATTA TGTGTGATCA CAAGACTAAA GATTATTAAA AAGATAACCA CAGATCATGA
2521
CTTTTTGACT GTGGTTGATT TCATGAGTGA TGCACAAATT TTAATGATTA AAAAGTGCAG
2581
GAGCCCTAAA TGTCAGTGCA GCAGCCCTAA ATGTCAGTGC AGCAGTGTTA ACCAGTCATG
2641
GTGCTAGATT GTTTACTTGG TTTTCTAGGA CTGCCTCAAC TAGAATGACA CTTCACTAAT
2701 TGACTCTTAG ATTCTTTGCT CAGATGGAGA
ACTGCAGCAT TTATCGCAGG CATGGACAGA
2761
GGAATGCCTG TGGTCATAGT TTCGTGATGT GTAACAGTGT ATAATTACAT ACTGAATTAT
2821
TTCATGCATA GTGTGTGCCA TACACATTTA GAGTAGTCCT TGGAGATTTT ATGGACATGG
2881
TGAGCACAAG GTAAGTCATA AAGAATAATG AGAAAATAAA TCTATGCTGG TGCAGCTGAG
2941
AACTGTATCT TTGTGGGACA GTGAGAAGAC TGAGAAGATG TGAATGCATG GTCTCAAAGG
3001
TGATAGGGAC GATTAGATAG GTGTTTTAAG GCCTGAAAGC AATTTATAAC ATATGAGTCT
3061
TATTTTTATT TATAGAAATG TGAAGCTT //