Άσκηση Εξέλιξης 2

Άσκηση Εξέλιξης 2

Προσομοίωση Εξέλιξης Ακολουθιώv Βάσεων DNA

(SDSE: Simulation of DNA Sequence Evolution)

Πρόγραμμα από:

Jose L. Oliver, Unidad de Genetica, Facultad de Ciencias Universidad de Granada, Ε-18071-GRANADA (Spain)

Δημοσιευμένες αναφορές:

Oliver, J.L., Α. Marin & J.R. Medina. 1989. SDSE: Α software package to simulate the evolution of α pair of DNA sequences. Computer Applications in the Biosciences (CABIOS) 5: 47-50.

Rodriguez, F., J.L. Oliver, Α. Marin & J.R. Medina. The general stochastic model of nucleotide substitution. Journal of Theoretical Biology (in the press).

Αll rights reserved

ΕΙΣΑΓΩΓΗ.

Στην μελέτη της μοριακής εξέλιξης, οι ακολουθίες DNA μας δίνουν περισσότερες πληροφορίες από τις αμινοξικές ακολουθίες μια που όλες οι ακολουθίες DNA δεν μεταφράζονται σε πρωτείνες. Οι εξελικτικές αλλαγές του DNA συμβαίνουν είτε με μετάλλαξη βάσεων είτε με διαγραφή ή εισαγωγή βάσεων. Το πρόγραμμα SDSE προσομοιώνει την εξέλιξη του DNA με μεταλλάξεις. Υπάρχουν πολλοί τρόποι κάτω από τους οποίους μεταλλαγές βάσεων μπορούν να πραγματοποιηθούν (Nei 1987) και το πρόγραμμα SDSE μας δίνει την ευκαιρία προσομοίωσης με πολλούς από αυτούς τους τρόπους. Η προσομοίωση γίνεται σε ακολουθίες βάσεων μεταβλητού μήκους με τυχαίες μεταλλαγές αλλά με ποσοστά μεταλλαγής που επιβάλονται από τον τρόπο-που έχει προτιμηθεί. Το πρόγραμμα πραγματοποιεί δοθέντα αριθμό τυχαίων μεταλλαγών σε αρχέγονη ακολουθία βάσεων και με αυτό τον τρόπο δημιουργεί 'εξελιγμένες' ακολουθίες.

Οταν δύο 'απόγονοι' ακολουθίες αποκτήσουν ένα μεγάλο αριθμό μεταλλαγών (όπως συμβαίνει και στην πραγματικότητα) γίνονται πολλαπλές και παράλληλες αλλαγές. Ετσι το παρατηρούμενο ποσοστό αλλαγών βάσεων μεταξύ δύο ακολουθιών πρέπει να είναι μία υποεκτίμηση του πραγματικού αριθμού μεταλλαγών. Για να αποφεύγεται αυτή η υποεκτίμηση έχουν προταθεί διάφορες στατιστικές μέθοδοι. Jukes-Cantor (1969) single parameter (JC) method, Kimura's (1980) two-parameter (Κ2Ρ) method, Kimura's (1981) three-substitution-type (K3ST) method, Takahata & Kimura's (1981) (ΤΚ) method,Gojobori et al's (1982) (GIN) method, Tajima & Nei's (1984) (ΤΝ) method, κλπ.

Για την σύγκριση της εγκυρότητας και ακρίβειας αυτών των μεθόδων και την περιοχή εφαρμογής τους, μία προσομοίωση στον υπολογιστή εξέλιξης ακολουθιών DNA είναι απαραίτητη.

Για ευκολία ο υπολογιοτής χρησιμοποιεί προκαθωριομένο χρόνο εξέλιξης αντί για συνεχή προσέγγιοη. Οι συχνότητες ισορροπίας για ένα δεδομένο σχήμα μεταλλαγής υπολογίζονται με το τετράγωνο του αντίστοιχου πίνακα μεταπτώσεων. Για κάθε σχήμα μία τυχαία (ή προκαθωρισμένη) ακολουθία DNA με προκαθωρισμένο μήκος παράγεται και χρησιμοποιείται σαν αρχέγονη ακολουθία στην προσομοίωση. Από αυτή την ακολουθία απόγονοι ακολουθίες παράγονται και που μετά μπορούν να συγκριθούν.

ΧΡΗΣΗ ΤΟΥ ΠΡΟΓΡΑΜΜΑΤΟΣ

Το πρόγραμμα τρέχει με την εντολή SDSE οπότε εμφανίζεται ο παρακάτω πίνακας επιλογής:

SDSE V2.0: Simulation of DNA Sequence Evolution

1. Set υρ data disk (Επιλογή δίσκου)

2. Enter substitution schemes (Επιλογή σχήματος

μεταλλαγής)

3. Generate random DNA sequences (Παραγωγή

τυχαίων ακολουθιών DNA)

4. Simulate DNA evolution (Προσομοίωση εξέλιξης)

5. Estimate divergence (Υπολογισμός απόκλισης)

6. Exit to DOS (Εξοδος στο DOS)

Επεξηγήσεις.

1. Επιλογή δίσκου που ευρίσκονται τα δεδομένα (π.χ. A:,C:,F:).

2. Αυτή η επιλογή επιτρέπει την μετατροπή σχημάτων μετάλλαξης και υπολογίζει τις αντίστοιχες συχνότητες ισορροπίας των βάσεων. Είναι δυνατή η αλλαγή των ποσοστών μεταλλαγής βάσεων και η αλλαγή των διαφόρων παραμέτρων των μεθόδων Jukes-Cantor (1969) single parameter (JC) method, Kimura's (1980) two-parameter (Κ2Ρ) method, Kimura's (1981) three-substitution-type (K3ST) method, Takahata & Kimura's (1981) (ΤΚ) method, Gojobori et al's (1982) (GIN) method, and Tajima & Nei's (1984) (ΤΝ). Είναι επίσης δυνατή η απ'ευθείας αλλαγή των δώδεκα ποσοστών μεταλλαγής, χρησιμοποιώντας έτσι ένα καινούργιο σχήμα (ΟΤ).

3. Με αυτή την επιλοyή παράγονται τυχαίες ακολουθίες βάσεων. Με αυτό τον τρόπο μπορούν να παραχθούν αρχέγονες ακολουθίες με συχνότητες ισορροπίας ενός δεδομένου σχήματος (βλ. 2). 0 μέγιστος επιτρεπόμενος αριθμός βάσεων DNA είναι 3000.Για την διατήρηση του format σύμφωνα με την GENBANK το πρόγραμμα ζητάει ένα ΟΝΟΜΑ (LOCUS), τον αριθμό των βάσεων και την ημερομηνία δημιουργίας της ακολουθίας. Στη σειρά DEFINITION γράφεται μία συνοπτική περιγραφή ενώ στα COMMENT αναφέρονται οι ζητούμενες και πραγματικές συχνότητες βάσεων. Η γραμμή ORIGIN δίνει την πηγή της ακολουθίας.

4. Με αυτή την επιλογή προσομοιώνεται η εξέλιξη του DNA. Μετά την επιλογή ενός σχήματος μετάλλαξης, το πρόγραμμα πραγματοποιεί τον ζητούμενο αριθμό τυχαίων μεταλλάξεων στην αρχέγονη ακολουθία,φτιάχνοντας μία 'απόγονο' ακολουθία που γράφεται στον δίσκο με το όνομα που επιλέγεται. Περισσότερες της μιας ακολουθίες μπορούν να παραχθούν και να συγκριθούν.

5. Η επιλογή αυτή επιτρέπει τον υπολογισμό της συγκεντρωτικής απόκλισης δύο απόγονων ακολουθιών με διαφορετικούς αλγορίθμους. Αυτοί περιέχουν Jukes and Cantor (1969), Kimura (1980, 1981), Takahata and Kimura (1981) Gojobori, Ishii and Nei (1982) and Tajima and Nei (1984).

6. Τέλος του προγράμματος και επιστροφή στο λειτουργικό σύστημα DOS.

ΠΕΡΙΓΡΑΦΗ ΤΗΣ ΑΣΚΗΣΗΣ

Μερος lον. Επιλογή μεθόδου υπολογισμού απόκλισης.

Δίνεται η αρχέγονη ακολουθία ANCESTOR στο αρχείο ANCESTOR.SEQ.

Χρησιμοποιώντας την προσoμοίωση εξέλιξης (4) υπολογίστε δύο νέες τελικές ακολουθίες (απογόνους) με 20 μεταλλαγές και υπολογίστε την απόκλιση (5) για όλες τις μεθόδους.

Εφαρμόστε την ίδια τεχνική με 1000 μεταλλαγές.

Φτιάξτε δύο πίνακες της παρακάτω μορφής για τις δύο περιπτώσεις (20,1000 μεταλλαγές)

	JK	K	TK	GIN	TN
D₂₀
D₁₀₀₀

Ποια κρίνετε ότι είναι η πιο ακριβής μέθοδος;

Μερος 2ον. Προσδιορισμός απόκλισης πραγματικών δεδομένων.

Δίνονται τρείς τελικές πραγματικές ακολουθίες. Χρησιμοποιώντας την μέθοδο με την μεγαλύτερη ακρίβεια (μέρος 1ον) ταξινομίστε τις ακολουθίες με σειρά φθίνουσας συγγένειας (ή αύξουσας απόκλισης).

ΒΙΒΛΙΟΓΡΑΦΙΑ

Bilofsky, H.S., C. Burks, J.W. Fickett, W.B. Goad, F.L. Lewitter, W.P. Rindone,C.D.Swindell, and C.S. Tung. 1986. The GenBank genetic sequence databank. Nucl. Acids Res. 14: 1‑4.

Burks, C., Fickett, J.W., Goad, W.B., Kanehisa, M., Lewitter, F.I., Rindone, W.P., Swindell, C.D., Tung, C.S., and Bilofsky, H.S. 1985. The GenBank nucleic acid sequence database. Computer Applications in the Biosciences (CABIOS) 1: 225-233.

Gojobori, T., Ishii, K., and Nei, M. 1982. Estimation of average number of nucleotide substitutions when the rate of substitution varies with nucleotide. J. Mol. Evol. 18: 414-423.

Hamm, G.H. and G.N. Cameron. 1986. The EMBL data library. Nucl. Acids Res. 14: 5-9.

Jukes, T.H., and Cantor, C.R. 1969. Evolution of proteins molecules, in Munro, H.N. (ed.) Mammalian protein metabolism. Academic Press, New York, pp. 21123.

Kimura, M. 1980. A simple method for estimating evolutionary rates of base substitutions through comparative studies of nucleotide sequences. J. Mol. Evol. 16: 111-120.

Kimura, M. 1981. Estimation of evolutionary distances between homologous nucleotide sequences. Proc. Natl. Acad. Sci. USA. 78: 454-458.

Nei, M. 1987. Molecular Evolutionary Genetics. Columbia University Press, New York.

Oliver, J.L., A. Marin & J.R. Medina. 1989. SDSE: A software package to simulate the evolution of a pair of DNA sequences. Computer Applications in the Biosciences (CABIOS) 5: 47-50.

Rodriguez, F., J.L. Oliver, A. Marin & J.R. Medina. 1989. The general stochastic model of nucleotide substitution. Journal of Theoretical Biology (in the press).

Tajima, F. and Nei, M. 1984. Estimation of evolutionary distance between nucleotide sequences. Mol. Biol. Evol. 1: 269-285.

Takahata, N. and Kimura, M. 1981. A model of evolutionary base substitutions and its application with special reference to rapid change of pseudogenes. Genetics 98: 641-657.

LOCUS test6 3088 bp DNA

COMMENT Simulated evolved sequence

Total changes = 0 (Divergence from the original = .00)

Multiple changes = 0

Nucleotide frequencies:

Original: qA = .290 qC = .173 qG = .241 qT = .296

Evolved: qA = .290 qC = .173 qG = .241 qT = .296

BASE COUNT 894 a 534 c 745 g 915 t

ORIGIN Sequence evolved from human.dna under GIN.SCH scheme

1 GCACGTCAGG GCGCGGGAGC GCGGAGCGAG TTTGGTTGCA CTTACACCGG TACTTAAGCG

61 CGGACCGGCG TGTCCTTGGA CTTAGAGAGT GGGGACGTCC GGCTTCGGAG CGGGAGTGTT

121 CGTTGTGCCA GCGACTAAAA AGAGGTGAGA GCGGGTCGCG GAGGCCGCAC CTGGTTAGAG

181 GCAGAGCTGT GGGAGGCGCG CACTTGCGAG CGAGCCGAAA CCCAAGCGGG GAGCATTCGA

241 GGTGGAGCCC GCGCTGGGTG GGAGGGCGGG GAGTGAAGAC CCTGGACTGT GGTCAGACCG

301 AGCTGGGCGA GTAACGGCTT GAGGTGCGGC GGAGCCCTAA CTAGGGACAG GTATGGTCTC

361 GGTCAGGGAC TGGAGGCGGC TTGGATACAG ATCCGAGGAG GAGGCGGCCT CTTCCGTAGT

421 GGTTGCTGAA GGGCTATGGA AATGATAGGC AAGACTTCCC TCCTGGAAAG CCGAAGCTTA

481 GAGCTTCACG TTCTTCTTCA GAGGGCAAAA GCTGTTGCTC TTCTAATAAG GGGCCAGTTC

541 TTTTCGTGGG CACATGTTTC TTCCGTCAGT CGTTCTGACA TCCTAGAAGG AGTTTCATCA

601 ATCACCTTGA AACCGACCTG GACGGGTGAC CTCGTGGTCG CCCCAGGAGA TCACAGGTAG

661 GGGAGTTGGG ATCGCCCGGG GGACCGTGCA GCCTGCCCCT GAGCTCCCAT TCACAAGTTC

721 GAGTGTCAAG CTACTCCTGT GACCTGGGCA GATAGAAACA GCCAGGACCG CTTTTTAAAC

781 ATTTGTGTGC TTTGCGTTAT CCTCAGGGAG AGGTGGCTTT ACATTGTAGT AAGATTAAAT

841 GGTTAGGTCT TTTTAAAAGT TGCGGTTGTG GTGATTTTGG CTTAATGTGT TCGCCCTTGA

901 GCTTCAGATC TGTGACTTCG TGACCATGAT TGTCTCTTCT GAAACTGGAG TTTGAATTAG

961 GTTCCCTCTT TGCTTGGGCT TTAACGTTCC TTCACGTATA CACACAAAAA TACGTTTTTG

1021 AGGAGGTACT CCTAAAAATG TTTTTGGTAT TAAAGAATAT TTGGTATAAA GAGTATTAAA

1081 GCAAAACAAG ATTCATTCTG GTATTTAATG ACATAAATTA GCAATGGATT GGTAATTAAG

1141 TGGCTAGAGT GGTCATTCAT TTACACTGTA TTTGTTACCT GAGGAAAAAT TTACTAAGTT

1201 GAAGCTTTCG TTTTTAGAAT TAAATATGGG TGATGTTGAG AAAGGCAAGA AGATTTTTAT

1261 TATGAAGTGT TCCCAGTGCC ACACCGTTGA AAAGGGAGGC AAGCACAAGA CTGGGCCAAA

1321 TCTCCATGGT CTCTTTGGGC GGAAGACAGG TCAGGCCCCT GGATACTCTT ACACAGCCGC

1381 CAATAAGAAC AAAGGTAAGA GTCACTTGTT AAATAAAACA ACACAAAATG CAGGAATATA

1441 ACATGTGGCA AACTATCAGG AGTGTGAAAT AACCGATGCA TTCTTTCTTG TTTAGGCATC

1501 ATCTGGGGAG AGGATACACT GATGGAGTAT TTGGAGAATC CCAAGAAGTA CATCCCTGGA

1561 ACAAAAATGA TCTTTGTCGG CATTAAGAAG AAGGAAGAAA GGGCAGACTT AATAGCTTAT

1621 CTCAAAAAAG CTACTAATGA GTAATAATTG GGCCACTGCC TTATTTATTA CAAAACAGAA

1681 ATGTCTCATG ACTTTTTTAT GTGTACCATC CTTTAATAGA TCTCATACAC CAGAATTCAG

1741 ATCATGAATG ACTGACAGAA TATTTTGTTG GGCAGTCCTG ATTTAAAACT AAGACTGGCT

1801 TGTGGTTAAA TGAATATGTT CAGTTTTTGA ATTTTAATAG TAACTCCAAT TCAGTAAATG

1861 GTATCACTGT TTACCCCTTT TAAAGATATG ATTAGACTTC GTTAGTAATG TTCAACTTTT

1921 CACAAAGATG GTGAGTGCCA TCTTAAAACT TACTGGAGAT TGGTTTTATA TTTAGATTTA

1981 TATAACTGGT TATGTGAATA TATTTAAATA CTGGGGAAAT TGCTTCACTG TCTTAGAACC

2041 AAGCAAGATT CACCTGTGTT TTGTGTTCAT GTTCATTTGC CTCTTAAAGG CAAGGGTTGA

2101 AGATAAATAA GGTAGCAATG TCTATAGTTT TGGCCTTAAC TATGCCAATC TAATTATAAT

2161 TCCCTGTATT TAAAATGGTT TCTTTTACTT ATTGAAAGGC ATTTTAGTGT GGTTTATGTG

2221 TAATATTAAA GATTATTCAA CACCTCTCAC ATCTTACAGA TCTATAAGGT CACATGCTTT

2281 TAAAATAGTA GCAAGTTAAA CTTCACTCTT GAATTCTTTA CAATCTAAGT CAAACTAAGT

2341 TATAATTTAG GATTGTCTTT AAACAGCCAT TCAGAAACAA AACTGTAGAA CTGTGTATTT

2401 GATTGGGAAT GGTGCTTTTG CCAACTTAAA AGGATTAAAG TAACGGAGAT ATACACAAAT

2461 TTTAAAATTA TGTGTGATCA CAAGACTAAA GATAATTAAA AAGAAAACCA CAGATCATGA

2521 CTTTTTGACT GTGCTTGATT TCATGACTGA TGCACAAATT TTAATGATTA AAAAGTGCAG

2581 GAGCCCTAAA TGTCAGTGCA GCAGCCCTAA ATGTCAGTGC AGCAGTGTTA ACCAGTCATG

2641 GTGCTAGATT GTTTACTTGG TTTTCTAGGA CTGCCTCAAC TAGAATAACA CTTCACTAAT

2701 TGACTCTTAG TTTCTTTGCT CAGATTGAGA ACTGCAGCAT TTATCGCAGA CATGGACAGA

2761 GGAATGCCTG TGGTCATAGT TTTGTGATGT GTAACAGTGT ATAATTACAT ACTGAATTAT

2821 TTCATGCATA GTCTGTGCCA TACACATTTA GAGTAGTCCT TGGAGATTTT ATGGAGATGG

2881 TGAGCACAAG GTAAGTCATA AAGAATAATG AGAAAATAAA TCTATGCTGG TGCAGCTGAG

2941 AACTGTATCT TTGTGGGACA GTGAGAAGAC TGAGAAGATG TGAATCCATG GTCTCAAAGG

3001 TGATAGGGAC GATTAGATAG GTGTTTTAAG GCCTGAAAGC AATTTATAAC ATATGAGTCT

3061 TATTTTTATT TATAGAAATG TGAAGCTT //

LOCUS test2 3088 bp DNA DV

COMMENT Simulated evolved sequence

Total changes = 66 (Divergence from the original = .02)

Multiple changes = 66

Nucleotide frequencies:

Original: qA = .290 qC = .173 qG = .241 qT = .296

Evolved: qA = .289 qC = .175 qG = .239 qT = .297

BASE COUNT 893 a 539 c 738 g 918 t

ORIGIN Sequence evolved from DV.dna under GIN.SCH scheme

1 GCACGTCAGG GCGCGGGAGC GCGGAGCGAG TTTGGTTGCA CTTACACCGG TACTTAAGCG

61 CGGACCGGCG TGTCCTTGGA CTTAGAGAGT GGGGACGTCC GGCTTCGGAG CGGGAGTGTT

121 CGTTGTGCCA GCGACTAATA AGAGGTGAGA GCGGGTCGCG GAGGCCGCAC CTGGTTAGAG

181 GCAGAGCTGT GGGAGGCGCG CACTTGCGAG CGAGCCGAAA CCCAAGCGGG GAGCATTCGA

241 GGTGGAGCCC GCGCTGGGTG GCAGGGCCGG GTGTGAAGAC CCTGGACTGA GGTCAGACCG

301 AGCTGGGCGA GTAACGGCTT GAGGTGCGGC GGAGCCCTAA CTAGGGACAG GTATGGTCTC

361 GGTCAGGGAC TGGATGCGGC TTGGATACAG ATCCGAGGAG GAGGCGGCCT CTTCCGTAGT

421 GGTTGCTGAA GGGCTATAGA AATGATAGGC AAGACTTCCC TCCTGGAAAG CCGAAGCTTA

481 GAGCTTCACG TTCTTCTTCA GAGGGCATAA CCTGTTGCTC TTCTAATAAG GGGGCAGATC

541 TTTTCGTGGG CACATGTTTC TTCCGTCAGT CGTTCTGTCA TCCCAGAAGG AGTTTCATCA

601 ATCACCTTGA AACCGACCTG GACGGGTGAC CTGGTGGTCG CCCCAGGAGA TCACAGGTAG

661 GGGAGTTGGG ATCGCCCGGG GGACCGTGCA GCCTGCCCCT GAGCTCCCAT TCACAAGCTC

721 GAGTGTCAAG CTACTCCTGT GACCTGGGCA GATAGAAACA GCCAGGACCG CTTTTTAAAC

781 ATTTGTGTGC TTTGCGTTAT CCTCAGGGAG AGGTGGCTTT ACATTGTAGT AAGATTAAAT

841 GGTTAGGACT TTTTAAAAGT TGCGGTTGTG ATGATTTTGG CTTAATGTCT ACGCCCTTGA

901 GCTTCAGATC TGTGACTTCG TGACCATGAT TGTCTCTTCT GAAACTGGAG TTTGAATTAG

961 GTTCCCTCTT TGCTTGGGCT TTAACGTTCC TTCACGTATA CACACAAAAA TACGTTTTTG

1021 TGGAGGTACT CCTAAAAATG TTTTTGGTAT TAAAGAAAAT TTGGTATAAA TAGTATTAAA

1081 GCGAAACAAG ATTCATTCTG GTATTTAATG ACATAAATAA GCAATGTATT GGTAATTATG

1141 TGGCTAGAGT GGTCATTTAT TTACACTGCA TTTGTTACCT GAGGTAAAAT TTACTAAGTT

1201 GAAGCTTTGG TTTTTAGAAT TAAATATGGG AGATGTTGAG AAAGGCAAGA AGATTTTTAT

1261 TATGAAGTGT TCCCAGTGCC ACAGCGTTGA TAAGGTAGGC AAGCACAAGA CTGGGCCAAA

1321 TCTCCATGGT CTCTTTGGGC GGAAGACAGG TCAGGCCCCT GGATACTCTT ACACAGCCGC

1381 CAATAAGAAC AAAGGTAAGA GTCACTTGTT AAATAAAACA ACACAAAATG CAGGAATATA

1441 ACATGTGGCA AACTTTCAGG AGTGTGAAAT AACCGATGGA TTCTTTCTTG TTTAGGCATC

1501 ATCTGGGGAG AGGATACTCT GATGGAGTAT TTGGAGAATC CCAAGAAGTA CATCCCTGGA

1561 ACAAAAATGA TCTTTGTCGG CATTAAGAAG AAGGAAGAAA GGGCAGACTT AATAGCTTAT

1621 CTCAAAAAAG CTACTAGTGA GTAATAATTG GGCCACTGCC TTATTTATTA CAAGACAGAA

1681 ATGTCTCATG ACTTTTTTAT GTGTACCATC CTTTAATAGA TCTCATAGAC CAGAATTCAG

1741 ATCATGAATG ACTGACAGAA TATTTTGTTG GGCAGTCCTG ATTTAAAACT AAGACTGGCT

1801 TGTGGTTAAA TAAATATGCT CAGTTTTTGA ATTTTAATAG TAACTCCAAT TCAGTAAATG

1861 GTATCACTGT TTACCCCTTT TAAAGATATG ATTAGACTTC GTTAGTAATG TTCAACTTTT

1921 CACAAAGATG GTGAGTGCCA TCTTAAAACT TACTGGAGAT TGGTTTTATA TTTAGATTTA

1981 TATAACTGGT TATGTGAATA TATATAAATA CTGGGGAAAT TGCTTCACTG TCTTAGAACC

2041 AAGCAAGATT CACCTGTGTT TTGTGTCCAT GTTCATTTGC CTCTTAAAGG CAAGGGTTGA

2101 AGATAAATAA GGTAGCAATG TCTATAGTTT TGGCCTTAAC TATACCAATC TAATTAAAAT

2161 TCCCTGTATT TAAAATGGTT TCTTTTACTT ATTGAAAGGC ATTTTAGTGT GGTTTATGTG

2221 TAATATTAAA GATTATTCAA CACCTCTCAC AGCTTACAAA TCTATAAGGT CACATGCTTT

2281 TAAAATAGTA GCAAGTTAAA CTTCACTCTT GAATTCTTTA CAATCTAAGT CAAACTAAGT

2341 TATAATTTAG GATTGTCTTT AAACAGCCAT TCAGAAACAA AACTGTAGAA CTGTGTATTT

2401 GATTCGGAAT GGTGCTTTTG CCAACTTAAA AGGATTAAAG TTACGGAGAT ATACACAAAT

2461 TTTAAACTTA TGTGTGATCA CAAGACTAAA GATAATTAAA AAGAAAACCA CAGATCATGA

2521 CTTTTTGACT GTGCTTGATT TCATGACTGA TGCACAAATT TTAATGATTA AAAAGTGCAG

2581 GAGCCCTAAA TGTCAGTGCA GCAGCCCTAA ATGTCAGTGC AGCAGTTTTA ACCAGTCATG

2641 GTGCTAGATT GTTTACTTGG TTTTCTAGGA CTGCCTCAAC TAGAATAACG CTTCACTAAT

2701 TGACTCTTAG TTTCTATGCT CAGATTGAGT ACTGCAGCAT TTATCGCAAA CATGGACAGA

2761 GGAATGCCTG TGGTCATAGT TTTGTGATGT GTAACAGTGT ATAATTACAC ACTGAATTAT

2821 TTCTTGCATA GTCTGTGCCA TACACATTTA GAGTAATCCT TGGAGATTTT ATGGAGATGG

2881 TGAGCACAAG GTAAGTCATA AAGAATAATG AGAAAATAAA TCTATGCTGG TGCAGCTGAG

2941 AACTGTATCT TTGTGGGACA GTGAGAAGAC TGAGATGATG TGAATCCATG GTCTCAAAGG

3001 TGATAGGGAC GGTTAGATAG GTGTTTTAAG GCCTGAAAGC AATTTATAAC ATATTAGTCT

3061 AATTTTTATT TATAGAAATG TAAAGCTT //

LOCUS test4 3088 bp DNA DRO

COMMENT Simulated evolved sequence

Total changes = 33 (Divergence from the original = .01)

Multiple changes = 33

Nucleotide frequencies:

Original: qA = .290 qC = .173 qG = .241 qT = .296

Evolved: qA = .288 qC = .174 qG = .243 qT = .295

BASE COUNT 890 a 538 c 749 g 911 t

ORIGIN Sequence evolved from DRO.dna under GIN.SCH scheme

1 GCACGTCAGG GCGCGGGAGC GCGGAGCGAG TTTGGTTGCG CTTACACCGG TACTTAAGCG

61 CGGACCGGCG TGTCCTTGGA CTTAGAGAGT GGGGACGTCC GGCTTCGGAG CGGGAGTGTT

121 CGTTGTGCCA GCGACTAAAA AGAGGTGAGA GCGGGTCGCG GACGCCGCAC CTGGTTAGAG

181 GCAGAGCTGT GGGAGGCGCG CACTTGCGAG CGAGGCGAAG CCCAAGCGGG GAGCATTCGA

241 GGTGGAGCCC GCGCTGGGTG GGAGGGCGGG GAGTGAAGAC CCTGGACTGT GGTCAGACCG

301 AGCTGGGCGA GTAACGGCTT GAGGTGCGGC GGAGCCCTAA GTAGGGACAG GTATGGTCTC

361 GGTCAGGGAC TGGAGGCGGC TTGGATACAG ATCCGAGGAG GAGGCGGCCT CTTCCGTAGT

421 GGTTGCTGAA GGGCTATGGA AATGATAGGC AAGACTTCCC TCCTGGAAAG CCGAAGCTTA

481 GAGCTTCACG TTCTTCTACA GAGGGCAAAA GCTGTTGCTC TTCTAATAAG GGGCCAGTTC

541 TTTTCGTGGG CACATGTTTC TTCCGTCAGT CGTTCTGACA TCCTAGAAGG AGTTTCATCA

601 ATCACCTTGA AACCGACCTG GACGGGTGAC CTCGTGGTCG CCCCAGGAGA TCACAGGTAG

661 GGGAGCTGGG ATCGCCCGGG GGACCGTGCA GCCTGCCCCT GAGCTCCCAT TCACAAGTTC

721 GAGTGTCAAG CTACTCCTGT TACCTGGCGA GATAGAAACA GCCAGGACCG CTTTTTAAAC

781 ATTTGTGTGC TTTGCGTTCT CCTCAGGGAG AGGTGGCTTT ACATTGTAGT AAGATTAAAT

841 GGTTAGGTCT TTTTAAAAGT TGCGGTTGTG GTGATTTTGG CTTAATGTGT TCGCCCTTGA

901 GCTTCAGATC TGTGACTTCG TGACCATGAT TGTCTCTTCT GAAACTGGAG TTTGAATTAG

961 GTTCCCTCTT TGCTTGGGCT TTAACGTTCC TTCACGTATA CACACAAAAA TACGTTTTTG

1021 AGGAGGTACT CCTAAAAATG TTTTTGGTAT TAAAGAATAT TTGGTATAAA GAGTATAAAA

1081 GCAAAACAAG ATTCATTCTG GTATTTAATG ACATAAATTA GCAATGGATT GGTAAATAAG

1141 TGGCTAGAGT GGTCATTCAT TTACACTGTA TTTGTTACCT GAGGAAAAAT TTACTAAGTT

1201 GAAGCTTTCG TTTTTAGAAT TAAATATGGG TGATGTTGAG AAAGGCAAGA AGATTTTTAT

1261 TATGAAGTGT TCCCAGTGCC TCACCGTTGA AAAGGGAGGC AAGCACAAGA CTGGGCCAAA

1321 TCTCCATGGT CTCTTTGGGC GGAAGACAGG TCAGGCCCCT GGATACTCTT ACACAGCCGC

1381 CAATAAGAAC AAAGGTAAGA CTCACTTGTT AAATAAAACA ACACAAAATG CAGGAATATA