~ubuntu-branches/ubuntu/oneiric/latticeextra/oneiric

« back to all changes in this revision

Viewing changes to man/rootogram.Rd

  • Committer: Bazaar Package Importer
  • Author(s): Dirk Eddelbuettel
  • Date: 2011-05-13 15:40:08 UTC
  • mfrom: (1.4.3 upstream)
  • Revision ID: james.westby@ubuntu.com-20110513154008-ogqy8zo6elhazff4
Tags: 0.6-16-1
* New upstream release

* debian/control: Set (Build-)Depends: to current R version
* debian/control: Set Standards-Version: to current version 

Show diffs side-by-side

added added

removed removed

Lines of Context:
46
46
 
47
47
    A similar interpretation holds for \code{x} and \code{y} in
48
48
    \code{prepanel.rootogram} and \code{panel.rootogram}.
 
49
 
 
50
    Note that the data are assumed to arise from a discrete distribution
 
51
    with some probability mass function.  See details below.
49
52
  }
50
53
 
51
54
  \item{data}{ For the \code{"formula"} method, a data frame containing
80
83
}
81
84
 
82
85
\details{
83
 
  This function implements Tukey's hanging rootograms.  Also consider
84
 
  the \code{rootogram} function in the \code{vcd} package, especially if
85
 
  the number of unique values is small.  }
 
86
 
 
87
  This function implements Tukey's hanging rootograms.  As implemented,
 
88
  \code{rootogram} assumes that the data arise from a discrete
 
89
  distribution (either supplied in raw form, when \code{y} is
 
90
  unspecified, or in terms of the frequency distribution) with some
 
91
  unknown probability mass function (p.m.f.).  The purpose of the plot
 
92
  is to check whether the supplied theoretical p.m.f. \code{dfun} is a
 
93
  reasonable fit for the data.
 
94
 
 
95
  It is reasonable to consider rootograms for continuous data by
 
96
  discretizing it (similar to a histogram), but this must be done by the
 
97
  user before calling \code{rootogram}.  An example is given below.
 
98
 
 
99
  Also consider the \code{rootogram} function in the \code{vcd} package,
 
100
  especially if the number of unique values is small.
 
101
 
 
102
}
86
103
 
87
104
\value{
88
 
  \code{rootogram} produces an object of class \code{"trellis"}. The
 
105
 
 
106
  \code{rootogram} produces an object of class \code{"trellis"}.  The
89
107
  \code{update} method can be used to update components of the object and
90
108
  the \code{print} method (usually called by default) will plot it on an
91
109
  appropriate plotting device.
92
110
 
93
111
}
 
112
 
 
113
\references{
 
114
 
 
115
  John W. Tukey (1972) Some graphic and semi-graphic displays. In
 
116
  T. A. Bancroft (Ed) \emph{Statistical Papers in Honor of George
 
117
  W. Snedecor}, pp. 293--316.  Available online at
 
118
  \url{http://www.edwardtufte.com/tufte/tukey}
 
119
 
 
120
}
 
121
 
94
122
\author{ Deepayan Sarkar \email{deepayan.sarkar@gmail.com}}
95
123
\seealso{
96
124
  \code{\link{xyplot}}
145
173
       xlab = "",
146
174
       sub = "Random sample from Poisson(50)")
147
175
 
 
176
 
 
177
## Example using continuous data
 
178
 
 
179
xnorm <- rnorm(1000)
 
180
 
 
181
## 'discretize' by binning and replacing data by bin midpoints
 
182
 
 
183
h <- hist(xnorm, plot = FALSE)
 
184
 
 
185
## Option 1: Assume bin probabilities proportional to dnorm()
 
186
 
 
187
norm.factor <- sum(dnorm(h$mids, mean(xnorm), sd(xnorm)))
 
188
 
 
189
rootogram(counts ~ mids, data = h,
 
190
          dfun = function(x) {
 
191
              dnorm(x, mean(xnorm), sd(xnorm)) / norm.factor
 
192
          })
 
193
 
 
194
## Option 2: Compute probabilities explicitly using pnorm()
 
195
 
 
196
pdisc <- diff(pnorm(h$breaks, mean = mean(xnorm), sd = sd(xnorm)))
 
197
pdisc <- pdisc / sum(pdisc)
 
198
 
 
199
rootogram(counts ~ mids, data = h,
 
200
          dfun = function(x) {
 
201
              f <- factor(x, levels = h$mids)
 
202
              pdisc[f]
 
203
          })
 
204
 
148
205
}
149
206
 
150
207
\keyword{dplot}