Άσκηση Εξέλιξης 2

 

 

 

Προσομοίωση Εξέλιξης Ακολουθιώv Βάσεων DNA

(SDSE: Simulation of DNA Sequence Evolution)

 

 

 

 

 

 

 

 

Πρόγραμμα από:

Jose L. Oliver, Unidad de Genetica, Facultad de Ciencias Universidad de Granada, Ε-18071-GRANADA (Spain)

 

 

 

 

 

 

 

 

 

 

 

Δημοσιευμένες αναφορές:

 

Oliver, J.L., Α. Marin & J.R. Medina. 1989. SDSE: Α software package to simulate the evolution of α pair of DNA sequences. Computer Applications in the Biosciences (CABIOS) 5: 47-50.

 

Rodriguez, F., J.L. Oliver, Α. Marin & J.R. Medina. The general stochastic model of nucleotide substitution. Journal of Theoretical Biology (in the press).

 

 

 

 

 

 

 

 

 

Copyright (C) Jose L. Oliver, 1989

Αll rights reserved

 

 

 

ΕΙΣΑΓΩΓΗ.

 

Στην μελέτη της μοριακής εξέλιξης, οι ακολουθίες DNA μας δίνουν περισσότερες πληροφορίες από τις αμινοξικές ακολουθίες μια που όλες οι ακολουθίες DNA δεν μεταφράζονται σε πρωτείνες. Οι εξελικτικές αλλαγές του DNA συμβαίνουν είτε με μετάλλαξη βάσεων είτε με διαγραφή ή εισαγωγή βάσεων. Το πρόγραμμα SDSE προσομοιώνει την εξέλιξη του DNA με μεταλλάξεις. Υπάρχουν πολλοί τρόποι κάτω από τους οποίους μεταλλαγές βάσεων μπορούν να πραγματοποιηθούν (Nei 1987) και το πρόγραμμα SDSE μας δίνει την ευκαιρία προσομοίωσης με πολλούς από αυτούς τους τρόπους. Η προσομοίωση γίνεται σε ακολουθίες βάσεων μεταβλητού μήκους με τυχαίες μεταλλαγές αλλά με ποσοστά μεταλλαγής που επιβάλονται από τον τρόπο-που έχει προτιμηθεί. Το πρόγραμμα πραγματοποιεί δοθέντα αριθμό τυχαίων μεταλλαγών σε αρχέγονη ακολουθία βάσεων και με αυτό τον τρόπο δημιουργεί 'εξελιγμένες' ακολουθίες.

 

Οταν δύο 'απόγονοι' ακολουθίες αποκτήσουν ένα μεγάλο αριθμό μεταλλαγών (όπως συμβαίνει και στην πραγματικότητα) γίνονται πολλαπλές και παράλληλες αλλαγές. Ετσι το παρατηρούμενο ποσοστό αλλαγών βάσεων μεταξύ δύο ακολουθιών πρέπει να είναι μία υποεκτίμηση του πραγματικού αριθμού μεταλλαγών. Για να αποφεύγεται αυτή η υποεκτίμηση έχουν προταθεί διάφορες στατιστικές μέθοδοι. Jukes-Cantor (1969) single parameter (JC) method, Kimura's (1980) two-parameter (Κ2Ρ) method, Kimura's (1981) three-substitution-type (K3ST) method, Takahata & Kimura's (1981) (ΤΚ) method,Gojobori et al's (1982) (GIN) method, Tajima & Nei's (1984) (ΤΝ) method, κλπ.

Για την σύγκριση της εγκυρότητας και ακρίβειας αυτών των μεθόδων και την περιοχή εφαρμογής τους, μία προσομοίωση στον υπολογιστή εξέλιξης ακολουθιών DNA είναι απαραίτητη.

 

Για ευκολία ο υπολογιοτής χρησιμοποιεί προκαθωριομένο χρόνο εξέλιξης αντί για συνεχή προσέγγιοη. Οι συχνότητες ισορροπίας για ένα δεδομένο σχήμα μεταλλαγής υπολογίζονται με το τετράγωνο του αντίστοιχου πίνακα μεταπτώσεων. Για κάθε σχήμα μία τυχαία (ή προκαθωρισμένη) ακολουθία DNA με προκαθωρισμένο μήκος παράγεται και χρησιμοποιείται σαν αρχέγονη ακολουθία στην προσομοίωση. Από αυτή την ακολουθία απόγονοι ακολουθίες παράγονται και που μετά μπορούν να συγκριθούν.

 

 

 

 

 

 

 

 

 

 


ΧΡΗΣΗ ΤΟΥ ΠΡΟΓΡΑΜΜΑΤΟΣ

 

Το πρόγραμμα τρέχει με την εντολή SDSE οπότε εμφανίζεται ο παρακάτω πίνακας επιλογής:

 

SDSE V2.0: Simulation of DNA Sequence Evolution

 

1. Set υρ data disk (Επιλογή δίσκου)

 

2. Enter substitution schemes (Επιλογή σχήματος

μεταλλαγής)

 

3. Generate random DNA sequences (Παραγωγή

τυχαίων ακολουθιών DNA)

 

4. Simulate DNA evolution (Προσομοίωση εξέλιξης)

 

5. Estimate divergence (Υπολογισμός απόκλισης)

 

6. Exit to DOS (Εξοδος στο DOS)

 

 

Επεξηγήσεις.

 

1. Επιλογή δίσκου που ευρίσκονται τα δεδομένα (π.χ. A:,C:,F:).

 

2. Αυτή η επιλογή επιτρέπει την μετατροπή σχημάτων μετάλλαξης και υπολογίζει τις αντίστοιχες συχνότητες ισορροπίας των βάσεων. Είναι δυνατή η αλλαγή των ποσοστών μεταλλαγής βάσεων και η αλλαγή των διαφόρων παραμέτρων των μεθόδων Jukes-Cantor (1969) single parameter (JC) method, Kimura's (1980) two-parameter (Κ2Ρ) method, Kimura's (1981) three-substitution-type (K3ST) method, Takahata & Kimura's (1981) (ΤΚ) method, Gojobori et al's (1982) (GIN) method, and Tajima & Nei's (1984) (ΤΝ). Είναι επίσης δυνατή η απ'ευθείας αλλαγή των δώδεκα ποσοστών μεταλλαγής, χρησιμοποιώντας έτσι ένα καινούργιο σχήμα (ΟΤ).

 

3. Με αυτή την επιλοyή παράγονται τυχαίες ακολουθίες βάσεων. Με αυτό τον τρόπο μπορούν να παραχθούν αρχέγονες ακολουθίες με συχνότητες ισορροπίας ενός δεδομένου σχήματος (βλ. 2). 0 μέγιστος επιτρεπόμενος αριθμός βάσεων DNA είναι 3000.Για την διατήρηση του format σύμφωνα με την GENBANK το πρόγραμμα ζητάει ένα ΟΝΟΜΑ (LOCUS), τον αριθμό των βάσεων και την ημερομηνία δημιουργίας της ακολουθίας. Στη σειρά DEFINITION γράφεται μία συνοπτική περιγραφή ενώ στα COMMENT αναφέρονται οι ζητούμενες και πραγματικές συχνότητες βάσεων. Η γραμμή ORIGIN δίνει την πηγή της ακολουθίας.

 

4. Με αυτή την επιλογή προσομοιώνεται η εξέλιξη του DNA. Μετά την επιλογή ενός σχήματος μετάλλαξης, το πρόγραμμα πραγματοποιεί τον ζητούμενο αριθμό τυχαίων μεταλλάξεων στην αρχέγονη ακολουθία,φτιάχνοντας μία 'απόγονο' ακολουθία που γράφεται στον δίσκο με το όνομα που επιλέγεται. Περισσότερες της μιας ακολουθίες μπορούν να παραχθούν και να συγκριθούν.

 

5. Η επιλογή αυτή επιτρέπει τον υπολογισμό της συγκεντρωτικής απόκλισης δύο απόγονων ακολουθιών με διαφορετικούς αλγορίθμους. Αυτοί περιέχουν Jukes and Cantor (1969), Kimura (1980, 1981), Takahata and Kimura (1981) Gojobori, Ishii and Nei (1982) and Tajima and Nei (1984).

 

6. Τέλος του προγράμματος και επιστροφή στο λειτουργικό σύστημα DOS.

 

 

ΠΕΡΙΓΡΑΦΗ ΤΗΣ ΑΣΚΗΣΗΣ

 

Μερος lον. Επιλογή μεθόδου υπολογισμού απόκλισης.

 

Δίνεται η αρχέγονη ακολουθία ANCESTOR στο αρχείο ANCESTOR.SEQ.

 

Χρησιμοποιώντας την προσoμοίωση εξέλιξης (4) υπολογίστε δύο νέες τελικές ακολουθίες (απογόνους) με 20 μεταλλαγές και υπολογίστε την απόκλιση (5) για όλες τις μεθόδους.

 

Εφαρμόστε την ίδια τεχνική με 1000 μεταλλαγές.

 

Φτιάξτε δύο πίνακες της παρακάτω μορφής για τις δύο περιπτώσεις (20,1000 μεταλλαγές)

 

 

JK

K

TK

GIN

TN

D20

 

 

 

 

 

D1000

 

 

 

 

 

 

Ποια κρίνετε ότι είναι η πιο ακριβής μέθοδος;

 

Μερος 2ον. Προσδιορισμός απόκλισης πραγματικών δεδομένων.

 

Δίνονται τρείς τελικές πραγματικές ακολουθίες. Χρησιμοποιώντας την μέθοδο με την μεγαλύτερη ακρίβεια (μέρος 1ον) ταξινομίστε τις ακολουθίες με σειρά φθίνουσας συγγένειας (ή αύξουσας απόκλισης).

 

 

 

 

 

 

 

 

 

 

 


ΒΙΒΛΙΟΓΡΑΦΙΑ

 

Bilofsky, H.S., C. Burks, J.W. Fickett, W.B. Goad, F.L. Lewitter, W.P. Rindone,C.D.Swindell, and C.S. Tung. 1986. The GenBank genetic sequence databank. Nucl. Acids Res. 14: 1‑4.

 

Burks, C., Fickett, J.W., Goad, W.B., Kanehisa, M., Lewitter, F.I., Rindone, W.P., Swindell, C.D., Tung, C.S., and Bilofsky, H.S. 1985. The GenBank nucleic acid sequence database. Computer Applications in the Biosciences (CABIOS) 1: 225-233.

 

Gojobori, T., Ishii, K., and Nei, M. 1982. Estimation of average number of nucleotide substitutions when the rate of substitution varies with nucleotide. J. Mol. Evol. 18: 414-423.

 

Hamm, G.H. and G.N. Cameron. 1986. The EMBL data library. Nucl. Acids Res. 14: 5-9.

 

Jukes, T.H., and Cantor, C.R. 1969. Evolution of proteins molecules, in Munro, H.N. (ed.) Mammalian protein metabolism. Academic Press, New York, pp. 21123.

 

Kimura, M. 1980. A simple method for estimating evolutionary rates of base substitutions through comparative studies of nucleotide sequences. J. Mol. Evol. 16: 111-120.

 

Kimura, M. 1981. Estimation of evolutionary distances between homologous nucleotide sequences. Proc. Natl. Acad. Sci. USA. 78: 454-458.

 

Nei, M. 1987. Molecular Evolutionary Genetics. Columbia University Press, New York.

 

Oliver, J.L., A. Marin & J.R. Medina. 1989. SDSE: A software package to simulate the evolution of a pair of DNA sequences. Computer Applications in the Biosciences (CABIOS) 5: 47-50.

 

Rodriguez, F., J.L. Oliver, A. Marin & J.R. Medina. 1989. The general stochastic model of nucleotide substitution. Journal of Theoretical Biology (in the press).

 

Tajima, F. and Nei, M. 1984. Estimation of evolutionary distance between nucleotide sequences. Mol. Biol. Evol. 1: 269-285.

 

Takahata, N. and Kimura, M. 1981. A model of evolutionary base substitutions and its application with special reference to rapid change of pseudogenes. Genetics 98: 641-657.

 


LOCUS       test6        3088 bp    DNA           

COMMENT     Simulated evolved sequence

            Total changes    =     0  (Divergence from the original =  .00)

            Multiple changes =     0

            Nucleotide frequencies:

               Original:  qA = .290   qC = .173   qG = .241   qT = .296

               Evolved:   qA = .290   qC = .173   qG = .241   qT = .296

BASE COUNT      894 a    534 c    745 g    915 t

ORIGIN      Sequence evolved from human.dna    under GIN.SCH  scheme

        1 GCACGTCAGG GCGCGGGAGC GCGGAGCGAG TTTGGTTGCA CTTACACCGG TACTTAAGCG

       61 CGGACCGGCG TGTCCTTGGA CTTAGAGAGT GGGGACGTCC GGCTTCGGAG CGGGAGTGTT

      121 CGTTGTGCCA GCGACTAAAA AGAGGTGAGA GCGGGTCGCG GAGGCCGCAC CTGGTTAGAG

      181 GCAGAGCTGT GGGAGGCGCG CACTTGCGAG CGAGCCGAAA CCCAAGCGGG GAGCATTCGA

      241 GGTGGAGCCC GCGCTGGGTG GGAGGGCGGG GAGTGAAGAC CCTGGACTGT GGTCAGACCG

      301 AGCTGGGCGA GTAACGGCTT GAGGTGCGGC GGAGCCCTAA CTAGGGACAG GTATGGTCTC

      361 GGTCAGGGAC TGGAGGCGGC TTGGATACAG ATCCGAGGAG GAGGCGGCCT CTTCCGTAGT

      421 GGTTGCTGAA GGGCTATGGA AATGATAGGC AAGACTTCCC TCCTGGAAAG CCGAAGCTTA

      481 GAGCTTCACG TTCTTCTTCA GAGGGCAAAA GCTGTTGCTC TTCTAATAAG GGGCCAGTTC

      541 TTTTCGTGGG CACATGTTTC TTCCGTCAGT CGTTCTGACA TCCTAGAAGG AGTTTCATCA

      601 ATCACCTTGA AACCGACCTG GACGGGTGAC CTCGTGGTCG CCCCAGGAGA TCACAGGTAG

      661 GGGAGTTGGG ATCGCCCGGG GGACCGTGCA GCCTGCCCCT GAGCTCCCAT TCACAAGTTC

      721 GAGTGTCAAG CTACTCCTGT GACCTGGGCA GATAGAAACA GCCAGGACCG CTTTTTAAAC

      781 ATTTGTGTGC TTTGCGTTAT CCTCAGGGAG AGGTGGCTTT ACATTGTAGT AAGATTAAAT

      841 GGTTAGGTCT TTTTAAAAGT TGCGGTTGTG GTGATTTTGG CTTAATGTGT TCGCCCTTGA

      901 GCTTCAGATC TGTGACTTCG TGACCATGAT TGTCTCTTCT GAAACTGGAG TTTGAATTAG

      961 GTTCCCTCTT TGCTTGGGCT TTAACGTTCC TTCACGTATA CACACAAAAA TACGTTTTTG

     1021 AGGAGGTACT CCTAAAAATG TTTTTGGTAT TAAAGAATAT TTGGTATAAA GAGTATTAAA

     1081 GCAAAACAAG ATTCATTCTG GTATTTAATG ACATAAATTA GCAATGGATT GGTAATTAAG

     1141 TGGCTAGAGT GGTCATTCAT TTACACTGTA TTTGTTACCT GAGGAAAAAT TTACTAAGTT

     1201 GAAGCTTTCG TTTTTAGAAT TAAATATGGG TGATGTTGAG AAAGGCAAGA AGATTTTTAT

     1261 TATGAAGTGT TCCCAGTGCC ACACCGTTGA AAAGGGAGGC AAGCACAAGA CTGGGCCAAA

     1321 TCTCCATGGT CTCTTTGGGC GGAAGACAGG TCAGGCCCCT GGATACTCTT ACACAGCCGC

     1381 CAATAAGAAC AAAGGTAAGA GTCACTTGTT AAATAAAACA ACACAAAATG CAGGAATATA

     1441 ACATGTGGCA AACTATCAGG AGTGTGAAAT AACCGATGCA TTCTTTCTTG TTTAGGCATC

     1501 ATCTGGGGAG AGGATACACT GATGGAGTAT TTGGAGAATC CCAAGAAGTA CATCCCTGGA

     1561 ACAAAAATGA TCTTTGTCGG CATTAAGAAG AAGGAAGAAA GGGCAGACTT AATAGCTTAT

     1621 CTCAAAAAAG CTACTAATGA GTAATAATTG GGCCACTGCC TTATTTATTA CAAAACAGAA

     1681 ATGTCTCATG ACTTTTTTAT GTGTACCATC CTTTAATAGA TCTCATACAC CAGAATTCAG

     1741 ATCATGAATG ACTGACAGAA TATTTTGTTG GGCAGTCCTG ATTTAAAACT AAGACTGGCT

     1801 TGTGGTTAAA TGAATATGTT CAGTTTTTGA ATTTTAATAG TAACTCCAAT TCAGTAAATG

     1861 GTATCACTGT TTACCCCTTT TAAAGATATG ATTAGACTTC GTTAGTAATG TTCAACTTTT

     1921 CACAAAGATG GTGAGTGCCA TCTTAAAACT TACTGGAGAT TGGTTTTATA TTTAGATTTA

     1981 TATAACTGGT TATGTGAATA TATTTAAATA CTGGGGAAAT TGCTTCACTG TCTTAGAACC

     2041 AAGCAAGATT CACCTGTGTT TTGTGTTCAT GTTCATTTGC CTCTTAAAGG CAAGGGTTGA

     2101 AGATAAATAA GGTAGCAATG TCTATAGTTT TGGCCTTAAC TATGCCAATC TAATTATAAT

     2161 TCCCTGTATT TAAAATGGTT TCTTTTACTT ATTGAAAGGC ATTTTAGTGT GGTTTATGTG

     2221 TAATATTAAA GATTATTCAA CACCTCTCAC ATCTTACAGA TCTATAAGGT CACATGCTTT

     2281 TAAAATAGTA GCAAGTTAAA CTTCACTCTT GAATTCTTTA CAATCTAAGT CAAACTAAGT

     2341 TATAATTTAG GATTGTCTTT AAACAGCCAT TCAGAAACAA AACTGTAGAA CTGTGTATTT

     2401 GATTGGGAAT GGTGCTTTTG CCAACTTAAA AGGATTAAAG TAACGGAGAT ATACACAAAT

     2461 TTTAAAATTA TGTGTGATCA CAAGACTAAA GATAATTAAA AAGAAAACCA CAGATCATGA

     2521 CTTTTTGACT GTGCTTGATT TCATGACTGA TGCACAAATT TTAATGATTA AAAAGTGCAG

     2581 GAGCCCTAAA TGTCAGTGCA GCAGCCCTAA ATGTCAGTGC AGCAGTGTTA ACCAGTCATG

     2641 GTGCTAGATT GTTTACTTGG TTTTCTAGGA CTGCCTCAAC TAGAATAACA CTTCACTAAT

     2701 TGACTCTTAG TTTCTTTGCT CAGATTGAGA ACTGCAGCAT TTATCGCAGA CATGGACAGA

     2761 GGAATGCCTG TGGTCATAGT TTTGTGATGT GTAACAGTGT ATAATTACAT ACTGAATTAT

     2821 TTCATGCATA GTCTGTGCCA TACACATTTA GAGTAGTCCT TGGAGATTTT ATGGAGATGG

     2881 TGAGCACAAG GTAAGTCATA AAGAATAATG AGAAAATAAA TCTATGCTGG TGCAGCTGAG

     2941 AACTGTATCT TTGTGGGACA GTGAGAAGAC TGAGAAGATG TGAATCCATG GTCTCAAAGG

     3001 TGATAGGGAC GATTAGATAG GTGTTTTAAG GCCTGAAAGC AATTTATAAC ATATGAGTCT

     3061 TATTTTTATT TATAGAAATG TGAAGCTT   //

LOCUS       test2        3088 bp    DNA    DV

COMMENT     Simulated evolved sequence

            Total changes    =    66  (Divergence from the original =  .02)

            Multiple changes =    66

            Nucleotide frequencies:

               Original:  qA = .290   qC = .173   qG = .241   qT = .296

               Evolved:   qA = .289   qC = .175   qG = .239   qT = .297

BASE COUNT      893 a    539 c    738 g    918 t

ORIGIN      Sequence evolved from DV.dna    under GIN.SCH  scheme

        1 GCACGTCAGG GCGCGGGAGC GCGGAGCGAG TTTGGTTGCA CTTACACCGG TACTTAAGCG

       61 CGGACCGGCG TGTCCTTGGA CTTAGAGAGT GGGGACGTCC GGCTTCGGAG CGGGAGTGTT

      121 CGTTGTGCCA GCGACTAATA AGAGGTGAGA GCGGGTCGCG GAGGCCGCAC CTGGTTAGAG

      181 GCAGAGCTGT GGGAGGCGCG CACTTGCGAG CGAGCCGAAA CCCAAGCGGG GAGCATTCGA

      241 GGTGGAGCCC GCGCTGGGTG GCAGGGCCGG GTGTGAAGAC CCTGGACTGA GGTCAGACCG

      301 AGCTGGGCGA GTAACGGCTT GAGGTGCGGC GGAGCCCTAA CTAGGGACAG GTATGGTCTC

      361 GGTCAGGGAC TGGATGCGGC TTGGATACAG ATCCGAGGAG GAGGCGGCCT CTTCCGTAGT

      421 GGTTGCTGAA GGGCTATAGA AATGATAGGC AAGACTTCCC TCCTGGAAAG CCGAAGCTTA

      481 GAGCTTCACG TTCTTCTTCA GAGGGCATAA CCTGTTGCTC TTCTAATAAG GGGGCAGATC

      541 TTTTCGTGGG CACATGTTTC TTCCGTCAGT CGTTCTGTCA TCCCAGAAGG AGTTTCATCA

      601 ATCACCTTGA AACCGACCTG GACGGGTGAC CTGGTGGTCG CCCCAGGAGA TCACAGGTAG

      661 GGGAGTTGGG ATCGCCCGGG GGACCGTGCA GCCTGCCCCT GAGCTCCCAT TCACAAGCTC

      721 GAGTGTCAAG CTACTCCTGT GACCTGGGCA GATAGAAACA GCCAGGACCG CTTTTTAAAC

      781 ATTTGTGTGC TTTGCGTTAT CCTCAGGGAG AGGTGGCTTT ACATTGTAGT AAGATTAAAT

      841 GGTTAGGACT TTTTAAAAGT TGCGGTTGTG ATGATTTTGG CTTAATGTCT ACGCCCTTGA

      901 GCTTCAGATC TGTGACTTCG TGACCATGAT TGTCTCTTCT GAAACTGGAG TTTGAATTAG

      961 GTTCCCTCTT TGCTTGGGCT TTAACGTTCC TTCACGTATA CACACAAAAA TACGTTTTTG

     1021 TGGAGGTACT CCTAAAAATG TTTTTGGTAT TAAAGAAAAT TTGGTATAAA TAGTATTAAA

     1081 GCGAAACAAG ATTCATTCTG GTATTTAATG ACATAAATAA GCAATGTATT GGTAATTATG

     1141 TGGCTAGAGT GGTCATTTAT TTACACTGCA TTTGTTACCT GAGGTAAAAT TTACTAAGTT

     1201 GAAGCTTTGG TTTTTAGAAT TAAATATGGG AGATGTTGAG AAAGGCAAGA AGATTTTTAT

     1261 TATGAAGTGT TCCCAGTGCC ACAGCGTTGA TAAGGTAGGC AAGCACAAGA CTGGGCCAAA

     1321 TCTCCATGGT CTCTTTGGGC GGAAGACAGG TCAGGCCCCT GGATACTCTT ACACAGCCGC

     1381 CAATAAGAAC AAAGGTAAGA GTCACTTGTT AAATAAAACA ACACAAAATG CAGGAATATA

     1441 ACATGTGGCA AACTTTCAGG AGTGTGAAAT AACCGATGGA TTCTTTCTTG TTTAGGCATC

     1501 ATCTGGGGAG AGGATACTCT GATGGAGTAT TTGGAGAATC CCAAGAAGTA CATCCCTGGA

     1561 ACAAAAATGA TCTTTGTCGG CATTAAGAAG AAGGAAGAAA GGGCAGACTT AATAGCTTAT

     1621 CTCAAAAAAG CTACTAGTGA GTAATAATTG GGCCACTGCC TTATTTATTA CAAGACAGAA

     1681 ATGTCTCATG ACTTTTTTAT GTGTACCATC CTTTAATAGA TCTCATAGAC CAGAATTCAG

     1741 ATCATGAATG ACTGACAGAA TATTTTGTTG GGCAGTCCTG ATTTAAAACT AAGACTGGCT

     1801 TGTGGTTAAA TAAATATGCT CAGTTTTTGA ATTTTAATAG TAACTCCAAT TCAGTAAATG

     1861 GTATCACTGT TTACCCCTTT TAAAGATATG ATTAGACTTC GTTAGTAATG TTCAACTTTT

     1921 CACAAAGATG GTGAGTGCCA TCTTAAAACT TACTGGAGAT TGGTTTTATA TTTAGATTTA

     1981 TATAACTGGT TATGTGAATA TATATAAATA CTGGGGAAAT TGCTTCACTG TCTTAGAACC

     2041 AAGCAAGATT CACCTGTGTT TTGTGTCCAT GTTCATTTGC CTCTTAAAGG CAAGGGTTGA

     2101 AGATAAATAA GGTAGCAATG TCTATAGTTT TGGCCTTAAC TATACCAATC TAATTAAAAT

     2161 TCCCTGTATT TAAAATGGTT TCTTTTACTT ATTGAAAGGC ATTTTAGTGT GGTTTATGTG

     2221 TAATATTAAA GATTATTCAA CACCTCTCAC AGCTTACAAA TCTATAAGGT CACATGCTTT

     2281 TAAAATAGTA GCAAGTTAAA CTTCACTCTT GAATTCTTTA CAATCTAAGT CAAACTAAGT

     2341 TATAATTTAG GATTGTCTTT AAACAGCCAT TCAGAAACAA AACTGTAGAA CTGTGTATTT

     2401 GATTCGGAAT GGTGCTTTTG CCAACTTAAA AGGATTAAAG TTACGGAGAT ATACACAAAT

     2461 TTTAAACTTA TGTGTGATCA CAAGACTAAA GATAATTAAA AAGAAAACCA CAGATCATGA

     2521 CTTTTTGACT GTGCTTGATT TCATGACTGA TGCACAAATT TTAATGATTA AAAAGTGCAG

     2581 GAGCCCTAAA TGTCAGTGCA GCAGCCCTAA ATGTCAGTGC AGCAGTTTTA ACCAGTCATG

     2641 GTGCTAGATT GTTTACTTGG TTTTCTAGGA CTGCCTCAAC TAGAATAACG CTTCACTAAT

     2701 TGACTCTTAG TTTCTATGCT CAGATTGAGT ACTGCAGCAT TTATCGCAAA CATGGACAGA

     2761 GGAATGCCTG TGGTCATAGT TTTGTGATGT GTAACAGTGT ATAATTACAC ACTGAATTAT

     2821 TTCTTGCATA GTCTGTGCCA TACACATTTA GAGTAATCCT TGGAGATTTT ATGGAGATGG

     2881 TGAGCACAAG GTAAGTCATA AAGAATAATG AGAAAATAAA TCTATGCTGG TGCAGCTGAG

     2941 AACTGTATCT TTGTGGGACA GTGAGAAGAC TGAGATGATG TGAATCCATG GTCTCAAAGG

     3001 TGATAGGGAC GGTTAGATAG GTGTTTTAAG GCCTGAAAGC AATTTATAAC ATATTAGTCT

     3061 AATTTTTATT TATAGAAATG TAAAGCTT   //

LOCUS       test4        3088 bp    DNA            DRO

COMMENT     Simulated evolved sequence

            Total changes    =    33  (Divergence from the original =  .01)

            Multiple changes =    33

            Nucleotide frequencies:

               Original:  qA = .290   qC = .173   qG = .241   qT = .296

               Evolved:   qA = .288   qC = .174   qG = .243   qT = .295

BASE COUNT      890 a    538 c    749 g    911 t

ORIGIN      Sequence evolved from DRO.dna    under GIN.SCH  scheme

        1 GCACGTCAGG GCGCGGGAGC GCGGAGCGAG TTTGGTTGCG CTTACACCGG TACTTAAGCG

       61 CGGACCGGCG TGTCCTTGGA CTTAGAGAGT GGGGACGTCC GGCTTCGGAG CGGGAGTGTT

      121 CGTTGTGCCA GCGACTAAAA AGAGGTGAGA GCGGGTCGCG GACGCCGCAC CTGGTTAGAG

      181 GCAGAGCTGT GGGAGGCGCG CACTTGCGAG CGAGGCGAAG CCCAAGCGGG GAGCATTCGA

      241 GGTGGAGCCC GCGCTGGGTG GGAGGGCGGG GAGTGAAGAC CCTGGACTGT GGTCAGACCG

      301 AGCTGGGCGA GTAACGGCTT GAGGTGCGGC GGAGCCCTAA GTAGGGACAG GTATGGTCTC

      361 GGTCAGGGAC TGGAGGCGGC TTGGATACAG ATCCGAGGAG GAGGCGGCCT CTTCCGTAGT

      421 GGTTGCTGAA GGGCTATGGA AATGATAGGC AAGACTTCCC TCCTGGAAAG CCGAAGCTTA

      481 GAGCTTCACG TTCTTCTACA GAGGGCAAAA GCTGTTGCTC TTCTAATAAG GGGCCAGTTC

      541 TTTTCGTGGG CACATGTTTC TTCCGTCAGT CGTTCTGACA TCCTAGAAGG AGTTTCATCA

      601 ATCACCTTGA AACCGACCTG GACGGGTGAC CTCGTGGTCG CCCCAGGAGA TCACAGGTAG

      661 GGGAGCTGGG ATCGCCCGGG GGACCGTGCA GCCTGCCCCT GAGCTCCCAT TCACAAGTTC

      721 GAGTGTCAAG CTACTCCTGT TACCTGGCGA GATAGAAACA GCCAGGACCG CTTTTTAAAC

      781 ATTTGTGTGC TTTGCGTTCT CCTCAGGGAG AGGTGGCTTT ACATTGTAGT AAGATTAAAT

      841 GGTTAGGTCT TTTTAAAAGT TGCGGTTGTG GTGATTTTGG CTTAATGTGT TCGCCCTTGA

      901 GCTTCAGATC TGTGACTTCG TGACCATGAT TGTCTCTTCT GAAACTGGAG TTTGAATTAG

      961 GTTCCCTCTT TGCTTGGGCT TTAACGTTCC TTCACGTATA CACACAAAAA TACGTTTTTG

     1021 AGGAGGTACT CCTAAAAATG TTTTTGGTAT TAAAGAATAT TTGGTATAAA GAGTATAAAA

     1081 GCAAAACAAG ATTCATTCTG GTATTTAATG ACATAAATTA GCAATGGATT GGTAAATAAG

     1141 TGGCTAGAGT GGTCATTCAT TTACACTGTA TTTGTTACCT GAGGAAAAAT TTACTAAGTT

     1201 GAAGCTTTCG TTTTTAGAAT TAAATATGGG TGATGTTGAG AAAGGCAAGA AGATTTTTAT

     1261 TATGAAGTGT TCCCAGTGCC TCACCGTTGA AAAGGGAGGC AAGCACAAGA CTGGGCCAAA

     1321 TCTCCATGGT CTCTTTGGGC GGAAGACAGG TCAGGCCCCT GGATACTCTT ACACAGCCGC

     1381 CAATAAGAAC AAAGGTAAGA CTCACTTGTT AAATAAAACA ACACAAAATG CAGGAATATA

     1441 ACATGTGGCA AACTATCAGG AGTGTGAAAT AACCGATGCA TTCTTTCTTG TTTAGGCATC

     1501 ATCTGGGGAG AGGATACACT GATGGAGTAT TTGGAGAATC CCAAGAAGTA CATCCCTGGA

     1561 ACAAAAATGA TCTTTGTCGG CATTAAGAAG AAGGAAGAAA GGGCAGACTT AATAGCTTAT

     1621 CTCAAAAAAG CTACTAATGA GTAATAATTG GGCCACTGCC TTATTTATTA CAAAACAGAA

     1681 ATGTCTCATG ACTTTTTTAT GTGTACCATC CTTTAATAGA TCTCATACAC CAGAATTCAG

     1741 ATCATGAATG ACTGACAGAA TATTTTGTTG GGCAGTCCTG ATTTAAAACT AAGACTGGCT

     1801 TGTGGTTAAA TGAATATGTT CAGTTTTTGA ATTTTAATAG TAACTCCAAT TCAGTAAATG

     1861 GTATCACTGT TTACCCCTTT TAAAGATATG ATTAGACTTC GTTAGTAATG TTCAACTTTT

     1921 CACAAAGATG GTGAGTGCCA TCTTAAAACT TACTGGAGAT TGGTTTTATA TTTAGATTTA

     1981 TATAACTGGT TATGTGAATA TATTTAAATA CTGCGGAAAT TGCTTCACTG TCTTAGAACC

     2041 ATGCAAGATT CACCTGTGTT CTGTGTTCAT GTTCATTTGC CTCTTAAAGG CAAGGGTTGA

     2101 AGATAAATAA GGTAGCAATG TCTATAGTTT TGGCCTTAAC TATGCCAATC TAATTATAAT

     2161 TCCCTGTATT TAAAATGGTT TCTTTTACTT ATTGAAAGGC ATTTTAGTGT GGTTTATGTG

     2221 TAATATTAAA GATTATTCAA CACCTCTCAC ATCTTACAGA TCTATAAGGT CACATGCTTT

     2281 TAAAATAGTA GCAACTTAAA CTTCACTCTT GAATTCTTTA CAATCTAAGT CAAACTAAGT

     2341 TATAATTTAG GATTGACTTT AAACAGCCAT TCAGAAACAA AACTGTAGAA CTGTGTATTT

     2401 GATTGGGAAT GGTGCTTTTG CCAACTTAAA AGCATTAAAG TAACGGAGAT ATACACAAAT

     2461 TTTAAAATTA TGTGTGATCA CAAGACTAAA GATTATTAAA AAGATAACCA CAGATCATGA

     2521 CTTTTTGACT GTGGTTGATT TCATGAGTGA TGCACAAATT TTAATGATTA AAAAGTGCAG

     2581 GAGCCCTAAA TGTCAGTGCA GCAGCCCTAA ATGTCAGTGC AGCAGTGTTA ACCAGTCATG

     2641 GTGCTAGATT GTTTACTTGG TTTTCTAGGA CTGCCTCAAC TAGAATGACA CTTCACTAAT

     2701 TGACTCTTAG ATTCTTTGCT CAGATGGAGA ACTGCAGCAT TTATCGCAGG CATGGACAGA

     2761 GGAATGCCTG TGGTCATAGT TTCGTGATGT GTAACAGTGT ATAATTACAT ACTGAATTAT

     2821 TTCATGCATA GTGTGTGCCA TACACATTTA GAGTAGTCCT TGGAGATTTT ATGGACATGG

     2881 TGAGCACAAG GTAAGTCATA AAGAATAATG AGAAAATAAA TCTATGCTGG TGCAGCTGAG

     2941 AACTGTATCT TTGTGGGACA GTGAGAAGAC TGAGAAGATG TGAATGCATG GTCTCAAAGG

     3001 TGATAGGGAC GATTAGATAG GTGTTTTAAG GCCTGAAAGC AATTTATAAC ATATGAGTCT

     3061 TATTTTTATT TATAGAAATG TGAAGCTT   //