~ubuntu-branches/ubuntu/utopic/paml/utopic

« back to all changes in this revision

Viewing changes to examples/MouseLemurs/README.txt

  • Committer: Bazaar Package Importer
  • Author(s): Pjotr Prins
  • Date: 2010-09-11 23:01:37 UTC
  • Revision ID: james.westby@ubuntu.com-20100911230137-jjf5d0blx5p0m9ba
Tags: upstream-4.4c
ImportĀ upstreamĀ versionĀ 4.4c

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
README.txt
 
2
Ziheng Yang, 27 January 2003
 
3
 
 
4
 
 
5
This folder contains files for the local-clock likelihood analysis of Yoder 
 
6
and Yang (2003).
 
7
 
 
8
(A) 
 
9
The clock models are re-written.  Note that the fossil calibration
 
10
points are specified using the symbol '@' in the tree file; the symbol
 
11
is used in the same way as the more familiar symbol ':' for branch
 
12
lengths.  TipDate models are implemented using @ in the sequence name
 
13
to specify the date of determination of the sequence.  Look at the
 
14
examples/TipDate folder for an example.  Local clock models are
 
15
specified by assigning rates to branches, using the symbol # to label
 
16
the branch/node.  The symbol $ is used as a clade label; $ stands
 
17
for the capital greek symbol \Delta, which looks somewhat like a clade.  
 
18
 
 
19
Use clock = 2 for local clock models.  For models of multiple genes,
 
20
clock = 3 represents the "combined analysis" in Yang & Yoder (2003).
 
21
The program assumes the same set of species and the same phylogeny at
 
22
the mutliple loci.
 
23
 
 
24
      clock = 1: global clock, deals with TipDate with no or many fossils, 
 
25
                 ignores branch rates (#) in tree if any.
 
26
            = 2: local clock models, as (1) above, but requires branch 
 
27
                 rates (#) tree.
 
28
            = 3: as (2) above, but requires Mgene and option G in sequence 
 
29
                 file.
 
30
 
 
31
 
 
32
(B) 
 
33
 
 
34
The following describes specifications in baseml.ctl to duplicate the
 
35
ML results in tables 4 and 5 of Yang and Yoder (2003).  Note that the
 
36
ML analysis uses the ingroup sequences only, and the assumed ingroup
 
37
tree is rooted.  In the Bayes analysis of that paper, Thorne's program
 
38
(estbranches) requires an outgroup to root the ingroup tree.  The
 
39
"JeffNode" node numbering corresponds to the the node numbering by
 
40
Jeff Thorne's Bayes MCMC programs divtime5b and multidivtime, used in
 
41
our paper.  My output is correct only if you do what we did, that is,
 
42
only if you use the outgroup in Jeff's estbranches program and do not
 
43
use the outgroup sequences in the baseml ML analysis.  Note that the
 
44
node numbering in Tables 4 and 5 of that paper is according to Jeff's
 
45
programs divtime5b and multidivtime.
 
46
 
 
47
 
 
48
JC69 analysis in Tables 4 and 5
 
49
===============================
 
50
 
 
51
Columns b, c, d.  Use optoin GC on the first line of the sequence data file
 
52
MouseLemurs.nuc.  
 
53
 
 
54
        35 1818  GC
 
55
 
 
56
The tree in the tree file has seven @ specifying seven calibration
 
57
dates.  Use Mgene = 1 for separate analysis.  Other options are
 
58
 
 
59
     model = 0 
 
60
     Mgene = 1
 
61
     fix_alpha = 1
 
62
     alpha = 0
 
63
     clock = 1
 
64
 
 
65
These options should generate the three columns in one analysis.  The
 
66
option clock = 1 has precedence over the branch rate labels # in the
 
67
tree file.  So clock = 1 above means that the model is a global clock
 
68
and the rate labels # are ignored.  
 
69
 
 
70
Columns b, c, d in table 5 (local clock analysis).  If you choose
 
71
clock = 2 in the above, you should recover results for the local clock
 
72
analysis.
 
73
 
 
74
Column i in table 4 (combined global clock analysis under JC69) is
 
75
produced by the following options:
 
76
 
 
77
     model = 0 
 
78
     Mgene = 0
 
79
     fix_alpha = 1
 
80
     alpha = 0
 
81
     clock = 1
 
82
 
 
83
Column i in table 5 (combined local clock analysis under JC69) is
 
84
produced by changing clock = 3 in the above.
 
85
 
 
86
 
 
87
 
 
88
 
 
89
F84G analysis in Tables 4 and 5
 
90
===============================
 
91
 
 
92
Use the following to specify the gamma model.  
 
93
 
 
94
     fix_alpha = 0
 
95
     alpha = 0.5 (or any other initial value)
 
96
     ncatG = 5
 
97
 
 
98
Columns f, g, h in table 4 (global clock analysis).  Use optoin GC on
 
99
the first line of the sequence data file.  The tree in the tree file
 
100
has seven @ specifying seven calibration dates.  Use Mgene = 1 for
 
101
separate analysis.  Other options are
 
102
 
 
103
     model = 3
 
104
     Mgene = 1
 
105
     fix_alpha = 0
 
106
     alpha = 0.5 (or any other initial value)
 
107
     clock = 1
 
108
 
 
109
Columns f, g, h in table 5 (F84G local clock analysis).  Change clock
 
110
= 2 in the above.
 
111
 
 
112
Column j in table 4 (combined global clock analysis under F84G) is
 
113
produced by the following options:
 
114
 
 
115
     model = 3
 
116
     Mgene = 4
 
117
     fix_alpha = 0
 
118
     alpha = 0.5
 
119
     Malpha = 1
 
120
     ncatG = 5
 
121
     clock = 1
 
122
 
 
123
Column j in table 5 (combined local clock analysis under F84G) is
 
124
produced by setting clock = 3 in the above.
 
125
 
 
126
Good luck.
 
127
 
 
128
//end of file