← Back to branch summary

~ubuntu-branches/ubuntu/trusty/bioperl/trusty

~ubuntu-branches/ubuntu/trusty/bioperl/trusty

« back to all changes in this revision

Viewing changes to scripts/utilities/bp_mask_by_search.pl

Committer: Package Import Robot
Author(s): Charles Plessy
Date: 2013-09-22 13:39:48 UTC
mfrom: (3.1.11 sid)
Revision ID: package-import@ubuntu.com-20130922133948-c6z62zegjyp7ztou

Tags: 1.6.922-1

http://bugs.debian.org/722910

* New upstream release.
* Replaces and Breaks grinder (<< 0.5.3-3~) because of overlaping contents.
Closes: #722910
* Stop Replacing and Breaking bioperl ( << 1.6.9 ): not needed anymore.

files added:
.travis.yml

Bio/DB/IndexedBase.pm

Bio/DB/Taxonomy/greengenes.pm

Bio/DB/Taxonomy/silva.pm

Bio/Seq/SimulatedRead.pm

Bio/SeqFeature/Amplicon.pm

Bio/SeqFeature/SubSeq.pm

Bio/Tools/AmpliconSearch.pm

README.md

examples/align/FastAlign.pl

scripts/Bio-DB-GFF/bp_bulk_load_gff.pl

scripts/Bio-DB-GFF/bp_fast_load_gff.pl

scripts/Bio-DB-GFF/bp_genbank2gff.pl

scripts/Bio-DB-GFF/bp_genbank2gff3.pl

scripts/Bio-DB-GFF/bp_generate_histogram.pl

scripts/Bio-DB-GFF/bp_load_gff.pl

scripts/Bio-DB-GFF/bp_meta_gff.pl

scripts/Bio-DB-GFF/bp_process_gadfly.pl

scripts/Bio-DB-GFF/bp_process_sgd.pl

scripts/Bio-DB-GFF/bp_process_wormbase.pl

scripts/Bio-DB-SeqFeature-Store/bp_seqfeature_delete.pl

scripts/Bio-DB-SeqFeature-Store/bp_seqfeature_gff3.pl

scripts/Bio-DB-SeqFeature-Store/bp_seqfeature_load.pl

scripts/DB-HIV/bp_hivq.pl

scripts/DB/bp_biofetch_genbank_proxy.pl

scripts/DB/bp_bioflat_index.pl

scripts/DB/bp_biogetseq.pl

scripts/DB/bp_flanks.pl

scripts/das/bp_das_server.pl

scripts/index/bp_fetch.pl

scripts/index/bp_index.pl

scripts/index/bp_seqret.pl

scripts/popgen/bp_composite_LD.pl

scripts/popgen/bp_heterogeneity_test.pl

scripts/searchio/bp_fastam9_to_table.pl

scripts/searchio/bp_filter_search.pl

scripts/searchio/bp_hmmer_to_table.pl

scripts/searchio/bp_parse_hmmsearch.pl

scripts/searchio/bp_search2table.pl

scripts/seq/bp_extract_feature_seq.pl

scripts/seq/bp_make_mrna_protein.pl

scripts/seq/bp_seqconvert.pl

scripts/seq/bp_seqcut.pl

scripts/seq/bp_seqpart.pl

scripts/seq/bp_seqretsplit.pl

scripts/seq/bp_split_seq.pl

scripts/seq/bp_translate_seq.pl

scripts/seq/bp_unflatten_seq.pl

scripts/seqstats/bp_aacomp.pl

scripts/seqstats/bp_chaos_plot.pl

scripts/seqstats/bp_gccalc.pl

scripts/seqstats/bp_oligo_count.pl

scripts/taxa/bp_classify_hits_kingdom.pl

scripts/taxa/bp_local_taxonomydb_query.pl

scripts/taxa/bp_query_entrez_taxa.pl

scripts/taxa/bp_taxid4species.pl

scripts/taxa/bp_taxonomy2tree.pl

scripts/tree/bp_blast2tree.pl

scripts/tree/bp_nexus2nh.pl

scripts/tree/bp_tree2pag.pl

scripts/utilities/bp_dbsplit.pl

scripts/utilities/bp_download_query_genbank.pl

scripts/utilities/bp_mask_by_search.pl

scripts/utilities/bp_mrtrans.pl

scripts/utilities/bp_mutate.pl

scripts/utilities/bp_netinstall.pl

scripts/utilities/bp_nrdb.pl

scripts/utilities/bp_pairwise_kaks.pl

scripts/utilities/bp_remote_blast.pl

scripts/utilities/bp_revtrans-motif.pl

scripts/utilities/bp_search2BSML.pl

scripts/utilities/bp_search2alnblocks.pl

scripts/utilities/bp_search2gff.pl

scripts/utilities/bp_search2tribe.pl

scripts/utilities/bp_seq_length.pl

scripts/utilities/bp_sreformat.pl

t/Cluster

t/Cluster/UniGene.t

t/LocalDB/Fasta.t

t/LocalDB/Qual.t

t/LocalDB/Taxonomy

t/LocalDB/Taxonomy/greengenes.t

t/LocalDB/Taxonomy/silva.t

t/Seq/SimulatedRead.t

t/SeqFeature/Amplicon.t

t/SeqFeature/Collection.t

t/SeqFeature/Computation.t

t/SeqFeature/FeaturePair.t

t/SeqFeature/Gene.t

t/SeqFeature/Generic.t

t/SeqFeature/SubSeq.t

t/Tools/AmpliconSearch.t

t/data/NC_000007-ribosomal-slippage.gb

t/data/NC_002058_multDBLINK_bug3375.gb

t/data/bad_dbfa/shotdb.fa

t/data/badfasta.fa

t/data/bug3331.mlc

t/data/codeml45.mlc

t/data/codeml45b.mlc

t/data/dbfa/mixed_alphabet.fasta

t/data/exonerate.output.negativescore.works

t/data/fastq/zero_qual.fastq

t/data/forward_primer.fa

t/data/forward_reverse_primers.fa

t/data/hmmpfam_HSPdashline.txt

t/data/hmmpfam_multiresult.out

t/data/msout/bad_msout_infile1

t/data/msout/bad_msout_infile2

t/data/multiresult_blastn+.bls

t/data/nhmmer-3.1.out

t/data/pfamOutput-bug3376.out

t/data/rpsblast_no_hits.bls

t/data/singlescore.gbk

t/data/spaced_fasta.fa

t/data/taxonomy

t/data/taxonomy/greengenes_taxonomy_16S_candiv_gg_2011_1.txt

t/data/taxonomy/silva_SSURef_108_tax_silva_trunc.fasta

t/data/test-3.0-1.meme

t/data/test-3.0-2.meme

t/data/test-4.9.meme

t/data/tiny.stk

t/data/yn00_45.mlc

travis_scripts

travis_scripts/dependency_installs

files removed:
.pc/fix_berkeleydb3_temp_file_creation

.pc/fix_berkeleydb3_temp_file_creation/Bio

.pc/fix_berkeleydb3_temp_file_creation/Bio/DB

.pc/fix_berkeleydb3_temp_file_creation/Bio/DB/SeqFeature

.pc/fix_berkeleydb3_temp_file_creation/Bio/DB/SeqFeature/Store

.pc/fix_berkeleydb3_temp_file_creation/Bio/DB/SeqFeature/Store/berkeleydb3.pm

Bio/Biblio

Bio/Biblio.pm

Bio/Biblio/Article.pm

Bio/Biblio/BiblioBase.pm

Bio/Biblio/Book.pm

Bio/Biblio/BookArticle.pm

Bio/Biblio/IO

Bio/Biblio/IO.pm

Bio/Biblio/IO/medline2ref.pm

Bio/Biblio/IO/medlinexml.pm

Bio/Biblio/IO/pubmed2ref.pm

Bio/Biblio/IO/pubmedxml.pm

Bio/Biblio/Journal.pm

Bio/Biblio/JournalArticle.pm

Bio/Biblio/MedlineArticle.pm

Bio/Biblio/MedlineBook.pm

Bio/Biblio/MedlineBookArticle.pm

Bio/Biblio/MedlineJournal.pm

Bio/Biblio/MedlineJournalArticle.pm

Bio/Biblio/Organisation.pm

Bio/Biblio/Patent.pm

Bio/Biblio/Person.pm

Bio/Biblio/Proceeding.pm

Bio/Biblio/Provider.pm

Bio/Biblio/PubmedArticle.pm

Bio/Biblio/PubmedBookArticle.pm

Bio/Biblio/PubmedJournalArticle.pm

Bio/Biblio/Ref.pm

Bio/Biblio/Service.pm

Bio/Biblio/TechReport.pm

Bio/Biblio/Thesis.pm

Bio/Biblio/WebResource.pm

Bio/DB/Biblio

Bio/DB/Biblio/biofetch.pm

Bio/DB/Biblio/eutils.pm

Bio/DB/Biblio/soap.pm

Bio/DB/BiblioI.pm

Bio/DB/EUtilities.pm

Bio/FeatureIO

Bio/FeatureIO.pm

Bio/FeatureIO/bed.pm

Bio/FeatureIO/gff.pm

Bio/FeatureIO/gtf.pm

Bio/FeatureIO/interpro.pm

Bio/FeatureIO/ptt.pm

Bio/FeatureIO/vecscreen_simple.pm

Bio/Ontology/SimpleGOEngine/GraphAdaptor02.pm

Bio/Root/Test

Bio/Root/Test/Warn.pm

Bio/Search/HSP/hmmer3HSP.pm

Bio/SeqFeature/Annotated.pm

Bio/Tools/EUtilities

Bio/Tools/EUtilities.pm

Bio/Tools/EUtilities/EUtilDataI.pm

Bio/Tools/EUtilities/EUtilParameters.pm

Bio/Tools/EUtilities/History.pm

Bio/Tools/EUtilities/HistoryI.pm

Bio/Tools/EUtilities/Info

Bio/Tools/EUtilities/Info.pm

Bio/Tools/EUtilities/Info/FieldInfo.pm

Bio/Tools/EUtilities/Info/LinkInfo.pm

Bio/Tools/EUtilities/Link

Bio/Tools/EUtilities/Link.pm

Bio/Tools/EUtilities/Link/LinkSet.pm

Bio/Tools/EUtilities/Link/UrlLink.pm

Bio/Tools/EUtilities/Query

Bio/Tools/EUtilities/Query.pm

Bio/Tools/EUtilities/Query/GlobalQuery.pm

Bio/Tools/EUtilities/Summary

Bio/Tools/EUtilities/Summary.pm

Bio/Tools/EUtilities/Summary/DocSum.pm

Bio/Tools/EUtilities/Summary/Item.pm

Bio/Tools/EUtilities/Summary/ItemContainerI.pm

debian/patches/fix_berkeleydb3_temp_file_creation

examples/biblio

examples/biblio/biblio-eutils-example.pl

examples/biblio/biblio-soap-example.pl

examples/biblio/biblio_soap.pl

scripts/Bio-DB-EUtilities

scripts/Bio-DB-EUtilities/einfo.PLS

scripts/Bio-DB-GFF/bulk_load_gff.PLS

scripts/Bio-DB-GFF/fast_load_gff.PLS

scripts/Bio-DB-GFF/genbank2gff.PLS

scripts/Bio-DB-GFF/genbank2gff3.PLS

scripts/Bio-DB-GFF/generate_histogram.PLS

scripts/Bio-DB-GFF/load_gff.PLS

scripts/Bio-DB-GFF/meta_gff.PLS

scripts/Bio-DB-GFF/process_gadfly.PLS

scripts/Bio-DB-GFF/process_sgd.PLS

scripts/Bio-DB-GFF/process_wormbase.PLS

scripts/Bio-DB-SeqFeature-Store/bp_seqfeature_delete.PLS

scripts/Bio-DB-SeqFeature-Store/bp_seqfeature_gff3.PLS

scripts/Bio-DB-SeqFeature-Store/bp_seqfeature_load.PLS

scripts/DB-HIV/hivq.PLS

scripts/DB/biofetch_genbank_proxy.PLS

scripts/DB/bioflat_index.PLS

scripts/DB/biogetseq.PLS

scripts/DB/flanks.PLS

scripts/biblio

scripts/biblio/TAG

scripts/biblio/biblio.PLS

scripts/das/das_server.pl

scripts/index/bp_fetch.PLS

scripts/index/bp_index.PLS

scripts/index/bp_seqret.PLS

scripts/popgen/composite_LD.PLS

scripts/popgen/heterogeneity_test.PLS

scripts/searchio/fastam9_to_table.PLS

scripts/searchio/filter_search.PLS

scripts/searchio/hmmer_to_table.PLS

scripts/searchio/parse_hmmsearch.PLS

scripts/searchio/search2table.PLS

scripts/seq/extract_feature_seq.PLS

scripts/seq/make_mrna_protein.PLS

scripts/seq/seqconvert.PLS

scripts/seq/seqretsplit.PLS

scripts/seq/split_seq.PLS

scripts/seq/translate_seq.PLS

scripts/seq/unflatten_seq.PLS

scripts/seqstats/aacomp.PLS

scripts/seqstats/chaos_plot.PLS

scripts/seqstats/gccalc.PLS

scripts/seqstats/oligo_count.PLS

scripts/taxa/classify_hits_kingdom.PLS

scripts/taxa/local_taxonomydb_query.PLS

scripts/taxa/query_entrez_taxa.PLS

scripts/taxa/taxid4species.PLS

scripts/taxa/taxonomy2tree.PLS

scripts/tree/blast2tree.PLS

scripts/tree/nexus2nh.PLS

scripts/tree/tree2pag.PLS

scripts/utilities/bp_mrtrans.PLS

scripts/utilities/bp_netinstall.PLS

scripts/utilities/bp_nrdb.PLS

scripts/utilities/bp_sreformat.PLS

scripts/utilities/dbsplit.PLS

scripts/utilities/download_query_genbank.PLS

scripts/utilities/mask_by_search.PLS

scripts/utilities/mutate.PLS

scripts/utilities/pairwise_kaks.PLS

scripts/utilities/remote_blast.PLS

scripts/utilities/revtrans-motif.PLS

scripts/utilities/search2BSML.PLS

scripts/utilities/search2alnblocks.PLS

scripts/utilities/search2gff.PLS

scripts/utilities/search2tribe.PLS

scripts/utilities/seq_length.PLS

t/Biblio

t/Biblio/Biblio.t

t/Biblio/References.t

t/Biblio/biofetch.t

t/Biblio/eutils.t

t/LocalDB/DBFasta.t

t/LocalDB/DBQual.t

t/RemoteDB/EUtilities.t

t/SeqFeature/FeatureIO.t

t/SeqFeature/SeqFeatAnnotated.t

t/SeqFeature/SeqFeatCollection.t

t/SeqFeature/SeqFeature.t

t/SeqFeature/SeqFeaturePrimer.t

t/Tools/EUtilities

t/Tools/EUtilities/EUtilParameters.t

t/Tools/EUtilities/egquery.t

t/Tools/EUtilities/einfo.t

t/Tools/EUtilities/elink_acheck.t

t/Tools/EUtilities/elink_lcheck.t

t/Tools/EUtilities/elink_llinks.t

t/Tools/EUtilities/elink_ncheck.t

t/Tools/EUtilities/elink_neighbor.t

t/Tools/EUtilities/elink_neighbor_history.t

t/Tools/EUtilities/elink_scores.t

t/Tools/EUtilities/epost.t

t/Tools/EUtilities/esearch.t

t/Tools/EUtilities/espell.t

t/Tools/EUtilities/esummary.t

t/data/1.bed

t/data/directives.gff3

t/data/eutils

t/data/eutils/egquery.xml

t/data/eutils/einfo.xml

t/data/eutils/einfo_dbs.xml

t/data/eutils/elink_acheck.xml

t/data/eutils/elink_acheck_corr.xml

t/data/eutils/elink_dball.xml

t/data/eutils/elink_lcheck.xml

t/data/eutils/elink_lcheck_corr.xml

t/data/eutils/elink_llinks.xml

t/data/eutils/elink_llinks_corr.xml

t/data/eutils/elink_multidb.xml

t/data/eutils/elink_multidb_corr.xml

t/data/eutils/elink_ncheck.xml

t/data/eutils/elink_ncheck_corr.xml

t/data/eutils/elink_neighbor.xml

t/data/eutils/elink_neighbor_corr.xml

t/data/eutils/elink_nhist.xml

t/data/eutils/elink_nhist_corr.xml

t/data/eutils/elink_scores.xml

t/data/eutils/epost.xml

t/data/eutils/esearch1.xml

t/data/eutils/esearch2.xml

t/data/eutils/espell.xml

t/data/eutils/esummary1.xml

t/data/eutils/esummary2.xml

t/data/hybrid1.gff3

t/data/knownGene.gff3

t/data/stress_test_medline.xml

t/data/stress_test_pubmed.xml

t/data/test.meme

t/data/test.meme2

t/data/test.ptt

t/data/vecscreen_simple.test_output

t/lib/Array

t/lib/Array/Compare.pm

t/lib/Sub

t/lib/Sub/Uplevel.pm

t/lib/Test

t/lib/Test/Builder

t/lib/Test/Builder.pm

t/lib/Test/Builder/Module.pm

t/lib/Test/Builder/Tester

t/lib/Test/Builder/Tester.pm

t/lib/Test/Builder/Tester/Color.pm

t/lib/Test/Exception.pm

t/lib/Test/Harness

t/lib/Test/Harness.pm

t/lib/Test/Harness/Assert.pm

t/lib/Test/Harness/Iterator.pm

t/lib/Test/Harness/Point.pm

t/lib/Test/Harness/Results.pm

t/lib/Test/Harness/Straps.pm

t/lib/Test/Harness/TAP.pod

t/lib/Test/Harness/Util.pm

t/lib/Test/More.pm

t/lib/Test/Simple.pm

t/lib/Test/Tutorial.pod

t/lib/Test/Warn.pm

t/lib/Tree

t/lib/Tree/DAG_Node.pm

files modified:
.pc/applied-patches

.pc/fix_examples_perl_location/examples/db/getGenBank.pl

Bio/Align/Utilities.pm

Bio/AlignIO.pm

Bio/AlignIO/fasta.pm

Bio/AlignIO/largemultifasta.pm

Bio/AlignIO/meme.pm

Bio/AlignIO/phylip.pm

Bio/AlignIO/stockholm.pm

Bio/Assembly/IO.pm

Bio/Assembly/IO/ace.pm

Bio/Assembly/IO/bowtie.pm

Bio/Assembly/IO/sam.pm

Bio/Assembly/Tools/ContigSpectrum.pm

Bio/Cluster/SequenceFamily.pm

Bio/ClusterIO.pm

Bio/DB/Ace.pm

Bio/DB/CUTG.pm

Bio/DB/Fasta.pm

Bio/DB/Flat/BinarySearch.pm

Bio/DB/GenBank.pm

Bio/DB/HIV/HIVQueryHelper.pm

Bio/DB/NCBIHelper.pm

Bio/DB/Qual.pm

Bio/DB/Query/HIVQuery.pm

Bio/DB/Query/WebQuery.pm

Bio/DB/RandomAccessI.pm

Bio/DB/SeqFeature/Store.pm

Bio/DB/SeqFeature/Store/DBI/Pg.pm

Bio/DB/SeqFeature/Store/DBI/SQLite.pm

Bio/DB/SeqFeature/Store/DBI/mysql.pm

Bio/DB/SeqFeature/Store/LoadHelper.pm

Bio/DB/SeqFeature/Store/berkeleydb.pm

Bio/DB/SeqFeature/Store/berkeleydb3.pm

Bio/DB/SeqFeature/Store/memory.pm

Bio/DB/SeqI.pm

Bio/DB/SeqVersion/gi.pm

Bio/DB/SwissProt.pm

Bio/DB/TFBS/transfac_pro.pm

Bio/DB/Taxonomy.pm

Bio/DB/Taxonomy/entrez.pm

Bio/DB/Taxonomy/flatfile.pm

Bio/DB/Taxonomy/list.pm *

Bio/DB/WebDBSeqI.pm

Bio/FeatureHolderI.pm

Bio/Index/Blast.pm

Bio/Index/Hmmer.pm

Bio/Index/Qual.pm

Bio/Index/Stockholm.pm

Bio/LiveSeq/SeqI.pm

Bio/LocatableSeq.pm

Bio/Location/Simple.pm

Bio/Map/Mappable.pm

Bio/MapIO.pm

Bio/Matrix/IO.pm

Bio/Nexml/Factory.pm

Bio/Ontology/SimpleGOEngine/GraphAdaptor.pm

Bio/OntologyIO.pm

Bio/Perl.pm

Bio/PhyloNetwork.pm

Bio/PopGen/Genotype.pm

Bio/PopGen/IO.pm

Bio/PopGen/IO/hapmap.pm

Bio/PopGen/IO/phase.pm

Bio/PopGen/Individual.pm

Bio/PopGen/Marker.pm

Bio/PopGen/Population.pm

Bio/PopGen/Statistics.pm

Bio/PopGen/Utilities.pm

Bio/PrimarySeq.pm

Bio/PrimarySeqI.pm

Bio/Restriction/IO.pm

Bio/Root/Build.pm

Bio/Root/IO.pm

Bio/Root/Root.pm

Bio/Root/Test.pm

Bio/Root/Utilities.pm

Bio/Root/Version.pm

Bio/Search/HSP/GenericHSP.pm

Bio/Search/HSP/HMMERHSP.pm

Bio/Search/HSP/HSPI.pm

Bio/Search/Hit/ModelHit.pm

Bio/SearchIO.pm

Bio/SearchIO/blast.pm

Bio/SearchIO/blasttable.pm

Bio/SearchIO/blastxml.pm

Bio/SearchIO/cross_match.pm

Bio/SearchIO/exonerate.pm

Bio/SearchIO/hmmer.pm

Bio/SearchIO/hmmer2.pm

Bio/SearchIO/hmmer3.pm

Bio/SearchIO/psl.pm

Bio/Seq.pm

Bio/Seq/EncodedSeq.pm

Bio/Seq/Meta.pm

Bio/Seq/Meta/Array.pm

Bio/Seq/PrimaryQual.pm

Bio/Seq/PrimedSeq.pm

Bio/Seq/SeqFactory.pm

Bio/Seq/SeqFastaSpeedFactory.pm

Bio/SeqFeature/AnnotationAdaptor.pm

Bio/SeqFeature/Computation.pm

Bio/SeqFeature/FeaturePair.pm

Bio/SeqFeature/Generic.pm

Bio/SeqFeature/Lite.pm

Bio/SeqFeature/PositionProxy.pm

Bio/SeqFeature/Primer.pm

Bio/SeqFeature/SiRNA/Pair.pm

Bio/SeqFeature/Similarity.pm

Bio/SeqFeature/Tools/Unflattener.pm

Bio/SeqI.pm

Bio/SeqIO.pm

Bio/SeqIO/FTHelper.pm

Bio/SeqIO/agave.pm

Bio/SeqIO/bsml.pm

Bio/SeqIO/chadoxml.pm

Bio/SeqIO/embl.pm

Bio/SeqIO/entrezgene.pm

Bio/SeqIO/fasta.pm

Bio/SeqIO/fastq.pm

Bio/SeqIO/game/gameWriter.pm

Bio/SeqIO/gbxml.pm

Bio/SeqIO/genbank.pm

Bio/SeqIO/interpro.pm

Bio/SeqIO/msout.pm

Bio/SeqIO/phd.pm

Bio/SeqIO/qual.pm

Bio/SeqIO/raw.pm

Bio/SeqIO/scf.pm

Bio/SeqIO/strider.pm

Bio/SeqIO/tab.pm

Bio/SeqUtils.pm

Bio/SimpleAlign.pm

Bio/Structure/IO.pm

Bio/Taxon.pm

Bio/Tools/Alignment/Consed.pm

Bio/Tools/Analysis/DNA/ESEfinder.pm

Bio/Tools/Analysis/Protein/ELM.pm

Bio/Tools/Analysis/Protein/NetPhos.pm

Bio/Tools/GFF.pm

Bio/Tools/Gel.pm

Bio/Tools/Geneid.pm

Bio/Tools/GuessSeqFormat.pm

Bio/Tools/IUPAC.pm

Bio/Tools/Match.pm

Bio/Tools/Phylo/Gerp.pm

Bio/Tools/Phylo/PAML.pm

Bio/Tools/Phylo/PAML/Codeml.pm

Bio/Tools/Primer3.pm

Bio/Tools/Protparam.pm

Bio/Tools/Run/StandAloneBlast.pm

Bio/Tools/Run/WrapperBase.pm

Bio/Tools/SeqPattern.pm

Bio/Tree/Node.pm

Bio/Tree/Statistics.pm

Bio/Tree/Tree.pm

Bio/Tree/TreeFunctionsI.pm

Bio/TreeIO.pm

Bio/TreeIO/newick.pm

Bio/TreeIO/svggraph.pm

Bio/Variation/IO.pm

Bio/Variation/IO/xml.pm

Build.PL *

Changes

INSTALL

MANIFEST

META.json

META.yml

README

debian/changelog

debian/compat

debian/control

debian/copyright

debian/patches/series

examples/db/getGenBank.pl

t/Align/AlignUtil.t

t/Align/SimpleAlign.t

t/AlignIO/AlignIO.t

t/AlignIO/fasta.t

t/AlignIO/meme.t

t/AlignIO/phylip.t

t/AlignIO/stockholm.t

t/Annotation/Annotation.t

t/Annotation/AnnotationAdaptor.t

t/Assembly/ContigSpectrum.t

t/Assembly/IO/bowtie.t

t/Assembly/IO/sam.t

t/Assembly/core.t

t/ClusterIO/SequenceFamily.t

t/LocalDB/Flat.t

t/LocalDB/Index/Index.t

t/LocalDB/SeqFeature.t

t/Map/Map.t

t/Map/Physical.t

t/Ontology/IO/go.t

t/Ontology/IO/obo.t

t/PopGen/MK.t

t/PopGen/PopGen.t

t/RemoteDB/BioFetch.t

t/RemoteDB/CUTG.t

t/RemoteDB/EMBL.t

t/RemoteDB/GenBank.t

t/RemoteDB/GenPept.t

t/RemoteDB/HIV/HIVQuery.t

t/RemoteDB/SeqVersion.t

t/RemoteDB/SwissProt.t

t/RemoteDB/Taxonomy.t

t/Root/RootIO.t

t/SearchIO/Tiling.t *

t/SearchIO/blast.t

t/SearchIO/blasttable.t

t/SearchIO/exonerate.t

t/SearchIO/hmmer.t

t/Seq/EncodedSeq.t

t/Seq/LocatableSeq.t

t/Seq/MetaSeq.t

t/Seq/PrimaryQual.t

t/Seq/PrimarySeq.t

t/Seq/PrimedSeq.t

t/Seq/Quality.t

t/Seq/Seq.t

t/SeqFeature/Primer.t

t/SeqFeature/Unflattener.t

t/SeqIO/SeqBuilder.t

t/SeqIO/SeqIO.t

t/SeqIO/Splicedseq.t

t/SeqIO/embl.t

t/SeqIO/fasta.t

t/SeqIO/fastq.t

t/SeqIO/genbank.t

t/SeqIO/msout.t

t/SeqTools/CodonTable.t

t/SeqTools/SeqUtils.t

t/Tools/Analysis/Protein/Domcut.t

t/Tools/Analysis/Protein/HNN.t

t/Tools/GFF.t

t/Tools/Genewise.t

t/Tools/Genomewise.t

t/Tools/IUPAC.t

t/Tools/Match.t

t/Tools/Phylo/Gerp.t

t/Tools/Phylo/PAML.t

t/Tools/Primer3.t

t/Tools/Run/RemoteBlast.t

t/Tools/Run/WBCommandExts.t

t/Tools/Run/WrapperBase.t

t/Tree/Tree.t

t/Tree/TreeStatistics.t

t/data/bootstrap.tre

t/data/msout/msout_infile1

t/data/msout/msout_infile2

t/data/msout/msout_infile3

t/data/msout/msout_infile4

t/data/primedseq.fa

t/data/taxdump/names.dmp

t/data/taxdump/nodes.dmp

t/data/testaln.stockholm

t/data/traits.tab

Show diffs side-by-side

added added

removed removed

scripts/utilities/bp_mask_by_search.pl

1

#!perl

2

# Author: Jason Stajich <jason-at-bioperl-dot-org>

3

4

5

=head1 NAME

6

7

bp_mask_by_search - mask sequence(s) based on its alignment results

8

9

=head1 SYNOPSIS

10

11

bp_mask_by_search.pl -f blast genomefile blastfile.bls > maskedgenome.fa

12

13

=head1 DESCRIPTION

14

15

Mask sequence based on significant alignments of another sequence.

16

You need to provide the report file and the entire sequence data which

17

you want to mask. By default this will assume you have done a TBLASTN

18

(or TFASTY) and try and mask the hit sequence assuming you've provided

19

the sequence file for the hit database. If you would like to do the

20

reverse and mask the query sequence specify the -t/--type query flag.

21

22

This is going to read in the whole sequence file into memory so for

23

large genomes this may fall over. I'm using DB_File to prevent

24

keeping everything in memory, one solution is to split the genome into

25

pieces (BEFORE you run the DB search though, you want to use the exact

26

file you BLASTed with as input to this program).

27

28

Below the double dash (--) options are of the form

29

--format=fasta or --format fasta

30

or you can just say

31

-f fasta

32

33

By -f/--format I mean either are acceptable options. The =s or =n

34

or =c specify these arguments expect a 'string'

35

36

Options:

37

-f/--format=s Search report format (fasta,blast,axt,hmmer,etc)

38

-sf/--sformat=s Sequence format (fasta,genbank,embl,swissprot)

39

--hardmask (booelean) Hard mask the sequence

40

with the maskchar [default is lowercase mask]

41

--maskchar=c Character to mask with [default is N], change

42

to 'X' for protein sequences

43

-e/--evalue=n Evalue cutoff for HSPs and Hits, only

44

mask sequence if alignment has specified evalue

45

or better

46

-o/--out/

47

--outfile=file Output file to save the masked sequence to.

48

-t/--type=s Alignment seq type you want to mask, the

49

'hit' or the 'query' sequence. [default is 'hit']

50

--minlen=n Minimum length of an HSP for it to be used

51

in masking [default 0]

52

-h/--help See this help information

53

54

=head1 AUTHOR - Jason Stajich

55

56

Jason Stajich, jason-at-bioperl-dot-org.

57

58

=cut

59

60

61

use strict;

62

use warnings;

63

use Bio::SeqIO;

64

use Bio::SearchIO;

65

use Getopt::Long;

66

use Bio::Seq;

67

use DB_File;

68

# assuming tblastn or tfasty type alignment

69

70

my $format = 'blast';

71

my $sformat= undef;

72

my $evalue = undef;

73

my $type = 'hit';

74

my $minlen = 50;

75

my $hardmask = 0; # mask with $maskchar instead of lowercase

76

my $maskchar = 'N'; # if we hard mask, mask with this cahr

77

my $outfile;

78

GetOptions(

79

'f|format:s' => \$format,

80

'sf|sformat:s'=> \$sformat,

81

'hardmask' => \$hardmask,

82

'maskchar:s' => \$maskchar,

83

'e|evalue:s' => \$evalue,

84

'o|out|outfile:s' => \$outfile,

85

't|type:s' => \$type,

86

'minlen:s' => \$minlen,

87

'h|help' => sub { system('perldoc', $0);

88

exit; },

89

);

90

if( $type !~ /^(hit|query)/i ) {

91

die("type must be query or hit[default] not $type") ;

92

}

93

$type = lc($type);

94

95

if(length($maskchar) > 1 ) {

96

die("expected a mask character, not a string (you gave $maskchar)");

97

}

98

my $genomefile = shift || die('need a file containing the genome');

99

my $reportfile = shift;

100

101

# this could be problem for large genomes, figure out a

102

# better way to do this later on

103

# or force people to split it up

104

my $genomeparser = new Bio::SeqIO(-file => $genomefile,

105

-format=> $sformat);

106

my %seqs;

107

unlink('/tmp/genome.idx');

108

tie(%seqs,'DB_File','/tmp/genome.idx');

109

while( my $seq = $genomeparser->next_seq ) {

110

# should we pre-force to upper case?

111

$seqs{$seq->display_id} = $seq->seq();

112

}

113

114

my $parser = new Bio::SearchIO(-file => $reportfile,

115

-format => $format);

116

117

while( my $r = $parser->next_result ) {

118

while( my $h = $r->next_hit ) {

119

last if( defined $evalue && $h->significance > $evalue );

120

my $hname = $h->name;

121

if( ! $seqs{$hname} ) {

122

die("Cannot find sequence $hname in genome seq");

123

}

124

while( my $hsp = $h->next_hsp ) {

125

last if( defined $evalue && $hsp->evalue > $evalue );

126

next if( $hsp->length('total') < $minlen);

127

my ($s,$len) = ( $hsp->$type()->start,

128

$hsp->$type()->length);

129

130

if( $hardmask ) {

131

substr($seqs{$hname}, $s,$len, $maskchar x $len);

132

} else {

133

substr($seqs{$hname}, $s,$len,

134

lc(substr($seqs{$hname}, $s,$len)));

135

}

136

}

137

}

138

}

139

140

my $out;

141

if( $outfile ) {

142

$out = new Bio::SeqIO(-file => ">$outfile",

143

-format => $sformat);

144

} else {

145

$out = new Bio::SeqIO(-format => $sformat);

146

}

147

148

while( my ($seqname,$seq) = each %seqs ) {

149

$out->write_seq(Bio::Seq->new(-seq => $seq,

150

-display_id => $seqname,

151

-description=> 'MASKED'));

152

}

153

END {

154

unlink('/tmp/genome.idx');

155

}

Older »