~ubuntu-branches/ubuntu/trusty/qiime/trusty

« back to all changes in this revision

Viewing changes to doc/tutorials/denoising_and_chimera_detection_usage_comparison.rst

  • Committer: Package Import Robot
  • Author(s): Andreas Tille
  • Date: 2013-06-17 18:28:26 UTC
  • mfrom: (9.1.2 sid)
  • Revision ID: package-import@ubuntu.com-20130617182826-376az5ad080a0sfe
Tags: 1.7.0+dfsg-1
Upload preparations done for BioLinux to Debian

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
.. _denoising_and_chimera_detection_usage_comparison.rst:
 
2
 
 
3
Denoising and chimera detection usage differences in QIIME
 
4
----------------------------------------------------------
 
5
 
 
6
This tutorial covers some of the main differences in the utilization of the various denoising and chimera detection software implemented in QIIME.
 
7
 
 
8
The `overview tutorial <tutorial.html>`_ describes the steps one would use to process 454 data without denoising or chimera detection.  The data processing can be roughly summarized as the following:
 
9
 
 
10
1.  SFF (raw 454 data) -> 2.  fasta/qual files -> 3.  demultiplexing/quality filtering -> 4.  OTU picking -> 5.  representative sequences -> 6.  taxonomic assignments/tree building -> 7.  OTU table and downstream processing
 
11
 
 
12
Differences from the default pipeline listed above will be used to describe how each denoising/chimera detection software integrates into the QIIME software package.
 
13
 
 
14
Ampliconnoise
 
15
=============
 
16
 
 
17
Ampliconnoise uses flowgram files generated from SFF files to denoise 454 data and optionally detect chimeras.  See script details here:  `ampliconnoise.py <../scripts/ampliconnoise.html>`_
 
18
 
 
19
Ampliconnoise effectively replaces the demultiplexing/quality filtering step above, making the pipeline this:
 
20
 
 
21
1.  SFF (raw 454 data) -> 2.  flowgram (sff.txt) -> 3.  ampliconnoise.py (plus suggested step of reverse primer removal) -> 4.  OTU picking -> 5.  representative sequences -> 6.  taxonomic assignments/tree building -> 7.  OTU table and downstream processing
 
22
 
 
23
Barcodes and forward primers are removed by ampliconnoise.py, however, reverse primers at the end of the sequence may be retained, so it is strongly recommended that `truncate_reverse_primer.py <../scripts/truncate_reverse_primer.html>`_ be run immediately after ampliconnoise.py so the reverse primer and subsequent sequence does not interfere with downstream steps.
 
24
 
 
25
 
 
26
Denoiser
 
27
========
 
28
 
 
29
`Denoiser <denoising_454_data.html>`_ also utilizes flowgram files to detect and correct sequencing errors (but not chimeras).  However, it utilizes the output of split_libraries.py to limit the sequences tested to those present in the output fasta file generated by split_libraries.py.  Reverse primer removal with `truncate_reverse_primer.py <../scripts/truncate_reverse_primer.html>`_ is also strongly encouraged.  The steps involved are:
 
30
 
 
31
1.  SFF (raw 454 data) -> 2.  fasta/qual/flowgram (sff.txt) files -> 3.  split_libraries.py -> 4.  denoise_wrapper.py (plus suggested step of reverse primer removal) -> 4.  OTU picking -> 5.  representative sequences -> 6.  taxonomic assignments/tree building -> 7.  OTU table and downstream processing
 
32
 
 
33
 
 
34
USEARCH
 
35
=======
 
36
`Usearch <usearch_quality_filter.html>`_ uses cluster abundance for `de novo` chimera detection, a reference sequence set for reference based chimera detection, and a cluster size filtering step (which is similar to filtering singletons as a rough but fast way to remove noise from data), and clusters sequences into OTUs.  Usearch is used after demultiplexing sequences, so the steps for processing data are:
 
37
 
 
38
1.  SFF (raw 454 data) -> 2.  fasta/qual files -> 3.  demultiplexing/quality filtering -> 4.  OTU picking/chimera detection/low abundance cluster filtering with usearch implementation in pick_otus.py -> 5.  representative sequences -> 6.  taxonomic assignments/tree building -> 7.  OTU table and downstream processing
 
39
 
 
40
ChimeraSlayer
 
41
=============
 
42
`ChimeraSlayer <chimera_checking.html>`_ utilizes a reference dataset to detect potential chimeras in a representative sequence set.  The processing pipeline is:
 
43
 
 
44
1.  SFF (raw 454 data) -> 2.  fasta/qual files -> 3.  demultiplexing/quality filtering -> 4.  OTU picking -> 5.  representative sequences -> 6.  Chimera detection with identify_chimeric_seqs.py -> 7.  Filter chimeras as described `here <chimera_checking.html>`_.  -> 8.  taxonomic assignments/tree building -> 9.  OTU table and downstream processing