~ubuntu-branches/ubuntu/trusty/bioperl/trusty

Viewing changes to scripts/Bio-DB-GFF/bp_fast_load_gff.pl

Committer: Package Import Robot
Author(s): Charles Plessy
Date: 2013-09-22 13:39:48 UTC
mfrom: (3.1.11 sid)
Revision ID: package-import@ubuntu.com-20130922133948-c6z62zegjyp7ztou

Tags: 1.6.922-1

http://bugs.debian.org/722910

* New upstream release.
* Replaces and Breaks grinder (<< 0.5.3-3~) because of overlaping contents.
Closes: #722910
* Stop Replacing and Breaking bioperl ( << 1.6.9 ): not needed anymore.

files added:
.travis.yml

Bio/DB/IndexedBase.pm

Bio/DB/Taxonomy/greengenes.pm

Bio/DB/Taxonomy/silva.pm

Bio/Seq/SimulatedRead.pm

Bio/SeqFeature/Amplicon.pm

Bio/SeqFeature/SubSeq.pm

Bio/Tools/AmpliconSearch.pm

README.md

examples/align/FastAlign.pl

scripts/Bio-DB-GFF/bp_bulk_load_gff.pl

scripts/Bio-DB-GFF/bp_fast_load_gff.pl

scripts/Bio-DB-GFF/bp_genbank2gff.pl

scripts/Bio-DB-GFF/bp_genbank2gff3.pl

scripts/Bio-DB-GFF/bp_generate_histogram.pl

scripts/Bio-DB-GFF/bp_load_gff.pl

scripts/Bio-DB-GFF/bp_meta_gff.pl

scripts/Bio-DB-GFF/bp_process_gadfly.pl

scripts/Bio-DB-GFF/bp_process_sgd.pl

scripts/Bio-DB-GFF/bp_process_wormbase.pl

scripts/Bio-DB-SeqFeature-Store/bp_seqfeature_delete.pl

scripts/Bio-DB-SeqFeature-Store/bp_seqfeature_gff3.pl

scripts/Bio-DB-SeqFeature-Store/bp_seqfeature_load.pl

scripts/DB-HIV/bp_hivq.pl

scripts/DB/bp_biofetch_genbank_proxy.pl

scripts/DB/bp_bioflat_index.pl

scripts/DB/bp_biogetseq.pl

scripts/DB/bp_flanks.pl

scripts/das/bp_das_server.pl

scripts/index/bp_fetch.pl

scripts/index/bp_index.pl

scripts/index/bp_seqret.pl

scripts/popgen/bp_composite_LD.pl

scripts/popgen/bp_heterogeneity_test.pl

scripts/searchio/bp_fastam9_to_table.pl

scripts/searchio/bp_filter_search.pl

scripts/searchio/bp_hmmer_to_table.pl

scripts/searchio/bp_parse_hmmsearch.pl

scripts/searchio/bp_search2table.pl

scripts/seq/bp_extract_feature_seq.pl

scripts/seq/bp_make_mrna_protein.pl

scripts/seq/bp_seqconvert.pl

scripts/seq/bp_seqcut.pl

scripts/seq/bp_seqpart.pl

scripts/seq/bp_seqretsplit.pl

scripts/seq/bp_split_seq.pl

scripts/seq/bp_translate_seq.pl

scripts/seq/bp_unflatten_seq.pl

scripts/seqstats/bp_aacomp.pl

scripts/seqstats/bp_chaos_plot.pl

scripts/seqstats/bp_gccalc.pl

scripts/seqstats/bp_oligo_count.pl

scripts/taxa/bp_classify_hits_kingdom.pl

scripts/taxa/bp_local_taxonomydb_query.pl

scripts/taxa/bp_query_entrez_taxa.pl

scripts/taxa/bp_taxid4species.pl

scripts/taxa/bp_taxonomy2tree.pl

scripts/tree/bp_blast2tree.pl

scripts/tree/bp_nexus2nh.pl

scripts/tree/bp_tree2pag.pl

scripts/utilities/bp_dbsplit.pl

scripts/utilities/bp_download_query_genbank.pl

scripts/utilities/bp_mask_by_search.pl

scripts/utilities/bp_mrtrans.pl

scripts/utilities/bp_mutate.pl

scripts/utilities/bp_netinstall.pl

scripts/utilities/bp_nrdb.pl

scripts/utilities/bp_pairwise_kaks.pl

scripts/utilities/bp_remote_blast.pl

scripts/utilities/bp_revtrans-motif.pl

scripts/utilities/bp_search2BSML.pl

scripts/utilities/bp_search2alnblocks.pl

scripts/utilities/bp_search2gff.pl

scripts/utilities/bp_search2tribe.pl

scripts/utilities/bp_seq_length.pl

scripts/utilities/bp_sreformat.pl

t/Cluster

t/Cluster/UniGene.t

t/LocalDB/Fasta.t

t/LocalDB/Qual.t

t/LocalDB/Taxonomy

t/LocalDB/Taxonomy/greengenes.t

t/LocalDB/Taxonomy/silva.t

t/Seq/SimulatedRead.t

t/SeqFeature/Amplicon.t

t/SeqFeature/Collection.t

t/SeqFeature/Computation.t

t/SeqFeature/FeaturePair.t

t/SeqFeature/Gene.t

t/SeqFeature/Generic.t

t/SeqFeature/SubSeq.t

t/Tools/AmpliconSearch.t

t/data/NC_000007-ribosomal-slippage.gb

t/data/NC_002058_multDBLINK_bug3375.gb

t/data/bad_dbfa/shotdb.fa

t/data/badfasta.fa

t/data/bug3331.mlc

t/data/codeml45.mlc

t/data/codeml45b.mlc

t/data/dbfa/mixed_alphabet.fasta

t/data/exonerate.output.negativescore.works

t/data/fastq/zero_qual.fastq

t/data/forward_primer.fa

t/data/forward_reverse_primers.fa

t/data/hmmpfam_HSPdashline.txt

t/data/hmmpfam_multiresult.out

t/data/msout/bad_msout_infile1

t/data/msout/bad_msout_infile2

t/data/multiresult_blastn+.bls

t/data/nhmmer-3.1.out

t/data/pfamOutput-bug3376.out

t/data/rpsblast_no_hits.bls

t/data/singlescore.gbk

t/data/spaced_fasta.fa

t/data/taxonomy

t/data/taxonomy/greengenes_taxonomy_16S_candiv_gg_2011_1.txt

t/data/taxonomy/silva_SSURef_108_tax_silva_trunc.fasta

t/data/test-3.0-1.meme

t/data/test-3.0-2.meme

t/data/test-4.9.meme

t/data/tiny.stk

t/data/yn00_45.mlc

travis_scripts

travis_scripts/dependency_installs

files removed:
.pc/fix_berkeleydb3_temp_file_creation

.pc/fix_berkeleydb3_temp_file_creation/Bio

.pc/fix_berkeleydb3_temp_file_creation/Bio/DB

.pc/fix_berkeleydb3_temp_file_creation/Bio/DB/SeqFeature

.pc/fix_berkeleydb3_temp_file_creation/Bio/DB/SeqFeature/Store

.pc/fix_berkeleydb3_temp_file_creation/Bio/DB/SeqFeature/Store/berkeleydb3.pm

Bio/Biblio

Bio/Biblio.pm

Bio/Biblio/Article.pm

Bio/Biblio/BiblioBase.pm

Bio/Biblio/Book.pm

Bio/Biblio/BookArticle.pm

Bio/Biblio/IO

Bio/Biblio/IO.pm

Bio/Biblio/IO/medline2ref.pm

Bio/Biblio/IO/medlinexml.pm

Bio/Biblio/IO/pubmed2ref.pm

Bio/Biblio/IO/pubmedxml.pm

Bio/Biblio/Journal.pm

Bio/Biblio/JournalArticle.pm

Bio/Biblio/MedlineArticle.pm

Bio/Biblio/MedlineBook.pm

Bio/Biblio/MedlineBookArticle.pm

Bio/Biblio/MedlineJournal.pm

Bio/Biblio/MedlineJournalArticle.pm

Bio/Biblio/Organisation.pm

Bio/Biblio/Patent.pm

Bio/Biblio/Person.pm

Bio/Biblio/Proceeding.pm

Bio/Biblio/Provider.pm

Bio/Biblio/PubmedArticle.pm

Bio/Biblio/PubmedBookArticle.pm

Bio/Biblio/PubmedJournalArticle.pm

Bio/Biblio/Ref.pm

Bio/Biblio/Service.pm

Bio/Biblio/TechReport.pm

Bio/Biblio/Thesis.pm

Bio/Biblio/WebResource.pm

Bio/DB/Biblio

Bio/DB/Biblio/biofetch.pm

Bio/DB/Biblio/eutils.pm

Bio/DB/Biblio/soap.pm

Bio/DB/BiblioI.pm

Bio/DB/EUtilities.pm

Bio/FeatureIO

Bio/FeatureIO.pm

Bio/FeatureIO/bed.pm

Bio/FeatureIO/gff.pm

Bio/FeatureIO/gtf.pm

Bio/FeatureIO/interpro.pm

Bio/FeatureIO/ptt.pm

Bio/FeatureIO/vecscreen_simple.pm

Bio/Ontology/SimpleGOEngine/GraphAdaptor02.pm

Bio/Root/Test

Bio/Root/Test/Warn.pm

Bio/Search/HSP/hmmer3HSP.pm

Bio/SeqFeature/Annotated.pm

Bio/Tools/EUtilities

Bio/Tools/EUtilities.pm

Bio/Tools/EUtilities/EUtilDataI.pm

Bio/Tools/EUtilities/EUtilParameters.pm

Bio/Tools/EUtilities/History.pm

Bio/Tools/EUtilities/HistoryI.pm

Bio/Tools/EUtilities/Info

Bio/Tools/EUtilities/Info.pm

Bio/Tools/EUtilities/Info/FieldInfo.pm

Bio/Tools/EUtilities/Info/LinkInfo.pm

Bio/Tools/EUtilities/Link

Bio/Tools/EUtilities/Link.pm

Bio/Tools/EUtilities/Link/LinkSet.pm

Bio/Tools/EUtilities/Link/UrlLink.pm

Bio/Tools/EUtilities/Query

Bio/Tools/EUtilities/Query.pm

Bio/Tools/EUtilities/Query/GlobalQuery.pm

Bio/Tools/EUtilities/Summary

Bio/Tools/EUtilities/Summary.pm

Bio/Tools/EUtilities/Summary/DocSum.pm

Bio/Tools/EUtilities/Summary/Item.pm

Bio/Tools/EUtilities/Summary/ItemContainerI.pm

debian/patches/fix_berkeleydb3_temp_file_creation

examples/biblio

examples/biblio/biblio-eutils-example.pl

examples/biblio/biblio-soap-example.pl

examples/biblio/biblio_soap.pl

scripts/Bio-DB-EUtilities

scripts/Bio-DB-EUtilities/einfo.PLS

scripts/Bio-DB-GFF/bulk_load_gff.PLS

scripts/Bio-DB-GFF/fast_load_gff.PLS

scripts/Bio-DB-GFF/genbank2gff.PLS

scripts/Bio-DB-GFF/genbank2gff3.PLS

scripts/Bio-DB-GFF/generate_histogram.PLS

scripts/Bio-DB-GFF/load_gff.PLS

scripts/Bio-DB-GFF/meta_gff.PLS

scripts/Bio-DB-GFF/process_gadfly.PLS

scripts/Bio-DB-GFF/process_sgd.PLS

scripts/Bio-DB-GFF/process_wormbase.PLS

scripts/Bio-DB-SeqFeature-Store/bp_seqfeature_delete.PLS

scripts/Bio-DB-SeqFeature-Store/bp_seqfeature_gff3.PLS

scripts/Bio-DB-SeqFeature-Store/bp_seqfeature_load.PLS

scripts/DB-HIV/hivq.PLS

scripts/DB/biofetch_genbank_proxy.PLS

scripts/DB/bioflat_index.PLS

scripts/DB/biogetseq.PLS

scripts/DB/flanks.PLS

scripts/biblio

scripts/biblio/TAG

scripts/biblio/biblio.PLS

scripts/das/das_server.pl

scripts/index/bp_fetch.PLS

scripts/index/bp_index.PLS

scripts/index/bp_seqret.PLS

scripts/popgen/composite_LD.PLS

scripts/popgen/heterogeneity_test.PLS

scripts/searchio/fastam9_to_table.PLS

scripts/searchio/filter_search.PLS

scripts/searchio/hmmer_to_table.PLS

scripts/searchio/parse_hmmsearch.PLS

scripts/searchio/search2table.PLS

scripts/seq/extract_feature_seq.PLS

scripts/seq/make_mrna_protein.PLS

scripts/seq/seqconvert.PLS

scripts/seq/seqretsplit.PLS

scripts/seq/split_seq.PLS

scripts/seq/translate_seq.PLS

scripts/seq/unflatten_seq.PLS

scripts/seqstats/aacomp.PLS

scripts/seqstats/chaos_plot.PLS

scripts/seqstats/gccalc.PLS

scripts/seqstats/oligo_count.PLS

scripts/taxa/classify_hits_kingdom.PLS

scripts/taxa/local_taxonomydb_query.PLS

scripts/taxa/query_entrez_taxa.PLS

scripts/taxa/taxid4species.PLS

scripts/taxa/taxonomy2tree.PLS

scripts/tree/blast2tree.PLS

scripts/tree/nexus2nh.PLS

scripts/tree/tree2pag.PLS

scripts/utilities/bp_mrtrans.PLS

scripts/utilities/bp_netinstall.PLS

scripts/utilities/bp_nrdb.PLS

scripts/utilities/bp_sreformat.PLS

scripts/utilities/dbsplit.PLS

scripts/utilities/download_query_genbank.PLS

scripts/utilities/mask_by_search.PLS

scripts/utilities/mutate.PLS

scripts/utilities/pairwise_kaks.PLS

scripts/utilities/remote_blast.PLS

scripts/utilities/revtrans-motif.PLS

scripts/utilities/search2BSML.PLS

scripts/utilities/search2alnblocks.PLS

scripts/utilities/search2gff.PLS

scripts/utilities/search2tribe.PLS

scripts/utilities/seq_length.PLS

t/Biblio

t/Biblio/Biblio.t

t/Biblio/References.t

t/Biblio/biofetch.t

t/Biblio/eutils.t

t/LocalDB/DBFasta.t

t/LocalDB/DBQual.t

t/RemoteDB/EUtilities.t

t/SeqFeature/FeatureIO.t

t/SeqFeature/SeqFeatAnnotated.t

t/SeqFeature/SeqFeatCollection.t

t/SeqFeature/SeqFeature.t

t/SeqFeature/SeqFeaturePrimer.t

t/Tools/EUtilities

t/Tools/EUtilities/EUtilParameters.t

t/Tools/EUtilities/egquery.t

t/Tools/EUtilities/einfo.t

t/Tools/EUtilities/elink_acheck.t

t/Tools/EUtilities/elink_lcheck.t

t/Tools/EUtilities/elink_llinks.t

t/Tools/EUtilities/elink_ncheck.t

t/Tools/EUtilities/elink_neighbor.t

t/Tools/EUtilities/elink_neighbor_history.t

t/Tools/EUtilities/elink_scores.t

t/Tools/EUtilities/epost.t

t/Tools/EUtilities/esearch.t

t/Tools/EUtilities/espell.t

t/Tools/EUtilities/esummary.t

t/data/1.bed

t/data/directives.gff3

t/data/eutils

t/data/eutils/egquery.xml

t/data/eutils/einfo.xml

t/data/eutils/einfo_dbs.xml

t/data/eutils/elink_acheck.xml

t/data/eutils/elink_acheck_corr.xml

t/data/eutils/elink_dball.xml

t/data/eutils/elink_lcheck.xml

t/data/eutils/elink_lcheck_corr.xml

t/data/eutils/elink_llinks.xml

t/data/eutils/elink_llinks_corr.xml

t/data/eutils/elink_multidb.xml

t/data/eutils/elink_multidb_corr.xml

t/data/eutils/elink_ncheck.xml

t/data/eutils/elink_ncheck_corr.xml

t/data/eutils/elink_neighbor.xml

t/data/eutils/elink_neighbor_corr.xml

t/data/eutils/elink_nhist.xml

t/data/eutils/elink_nhist_corr.xml

t/data/eutils/elink_scores.xml

t/data/eutils/epost.xml

t/data/eutils/esearch1.xml

t/data/eutils/esearch2.xml

t/data/eutils/espell.xml

t/data/eutils/esummary1.xml

t/data/eutils/esummary2.xml

t/data/hybrid1.gff3

t/data/knownGene.gff3

t/data/stress_test_medline.xml

t/data/stress_test_pubmed.xml

t/data/test.meme

t/data/test.meme2

t/data/test.ptt

t/data/vecscreen_simple.test_output

t/lib/Array

t/lib/Array/Compare.pm

t/lib/Sub

t/lib/Sub/Uplevel.pm

t/lib/Test

t/lib/Test/Builder

t/lib/Test/Builder.pm

t/lib/Test/Builder/Module.pm

t/lib/Test/Builder/Tester

t/lib/Test/Builder/Tester.pm

t/lib/Test/Builder/Tester/Color.pm

t/lib/Test/Exception.pm

t/lib/Test/Harness

t/lib/Test/Harness.pm

t/lib/Test/Harness/Assert.pm

t/lib/Test/Harness/Iterator.pm

t/lib/Test/Harness/Point.pm

t/lib/Test/Harness/Results.pm

t/lib/Test/Harness/Straps.pm

t/lib/Test/Harness/TAP.pod

t/lib/Test/Harness/Util.pm

t/lib/Test/More.pm

t/lib/Test/Simple.pm

t/lib/Test/Tutorial.pod

t/lib/Test/Warn.pm

t/lib/Tree

t/lib/Tree/DAG_Node.pm

files modified:
.pc/applied-patches

.pc/fix_examples_perl_location/examples/db/getGenBank.pl

Bio/Align/Utilities.pm

Bio/AlignIO.pm

Bio/AlignIO/fasta.pm

Bio/AlignIO/largemultifasta.pm

Bio/AlignIO/meme.pm

Bio/AlignIO/phylip.pm

Bio/AlignIO/stockholm.pm

Bio/Assembly/IO.pm

Bio/Assembly/IO/ace.pm

Bio/Assembly/IO/bowtie.pm

Bio/Assembly/IO/sam.pm

Bio/Assembly/Tools/ContigSpectrum.pm

Bio/Cluster/SequenceFamily.pm

Bio/ClusterIO.pm

Bio/DB/Ace.pm

Bio/DB/CUTG.pm

Bio/DB/Fasta.pm

Bio/DB/Flat/BinarySearch.pm

Bio/DB/GenBank.pm

Bio/DB/HIV/HIVQueryHelper.pm

Bio/DB/NCBIHelper.pm

Bio/DB/Qual.pm

Bio/DB/Query/HIVQuery.pm

Bio/DB/Query/WebQuery.pm

Bio/DB/RandomAccessI.pm

Bio/DB/SeqFeature/Store.pm

Bio/DB/SeqFeature/Store/DBI/Pg.pm

Bio/DB/SeqFeature/Store/DBI/SQLite.pm

Bio/DB/SeqFeature/Store/DBI/mysql.pm

Bio/DB/SeqFeature/Store/LoadHelper.pm

Bio/DB/SeqFeature/Store/berkeleydb.pm

Bio/DB/SeqFeature/Store/berkeleydb3.pm

Bio/DB/SeqFeature/Store/memory.pm

Bio/DB/SeqI.pm

Bio/DB/SeqVersion/gi.pm

Bio/DB/SwissProt.pm

Bio/DB/TFBS/transfac_pro.pm

Bio/DB/Taxonomy.pm

Bio/DB/Taxonomy/entrez.pm

Bio/DB/Taxonomy/flatfile.pm

Bio/DB/Taxonomy/list.pm *

Bio/DB/WebDBSeqI.pm

Bio/FeatureHolderI.pm

Bio/Index/Blast.pm

Bio/Index/Hmmer.pm

Bio/Index/Qual.pm

Bio/Index/Stockholm.pm

Bio/LiveSeq/SeqI.pm

Bio/LocatableSeq.pm

Bio/Location/Simple.pm

Bio/Map/Mappable.pm

Bio/MapIO.pm

Bio/Matrix/IO.pm

Bio/Nexml/Factory.pm

Bio/Ontology/SimpleGOEngine/GraphAdaptor.pm

Bio/OntologyIO.pm

Bio/Perl.pm

Bio/PhyloNetwork.pm

Bio/PopGen/Genotype.pm

Bio/PopGen/IO.pm

Bio/PopGen/IO/hapmap.pm

Bio/PopGen/IO/phase.pm

Bio/PopGen/Individual.pm

Bio/PopGen/Marker.pm

Bio/PopGen/Population.pm

Bio/PopGen/Statistics.pm

Bio/PopGen/Utilities.pm

Bio/PrimarySeq.pm

Bio/PrimarySeqI.pm

Bio/Restriction/IO.pm

Bio/Root/Build.pm

Bio/Root/IO.pm

Bio/Root/Root.pm

Bio/Root/Test.pm

Bio/Root/Utilities.pm

Bio/Root/Version.pm

Bio/Search/HSP/GenericHSP.pm

Bio/Search/HSP/HMMERHSP.pm

Bio/Search/HSP/HSPI.pm

Bio/Search/Hit/ModelHit.pm

Bio/SearchIO.pm

Bio/SearchIO/blast.pm

Bio/SearchIO/blasttable.pm

Bio/SearchIO/blastxml.pm

Bio/SearchIO/cross_match.pm

Bio/SearchIO/exonerate.pm

Bio/SearchIO/hmmer.pm

Bio/SearchIO/hmmer2.pm

Bio/SearchIO/hmmer3.pm

Bio/SearchIO/psl.pm

Bio/Seq.pm

Bio/Seq/EncodedSeq.pm

Bio/Seq/Meta.pm

Bio/Seq/Meta/Array.pm

Bio/Seq/PrimaryQual.pm

Bio/Seq/PrimedSeq.pm

Bio/Seq/SeqFactory.pm

Bio/Seq/SeqFastaSpeedFactory.pm

Bio/SeqFeature/AnnotationAdaptor.pm

Bio/SeqFeature/Computation.pm

Bio/SeqFeature/FeaturePair.pm

Bio/SeqFeature/Generic.pm

Bio/SeqFeature/Lite.pm

Bio/SeqFeature/PositionProxy.pm

Bio/SeqFeature/Primer.pm

Bio/SeqFeature/SiRNA/Pair.pm

Bio/SeqFeature/Similarity.pm

Bio/SeqFeature/Tools/Unflattener.pm

Bio/SeqI.pm

Bio/SeqIO.pm

Bio/SeqIO/FTHelper.pm

Bio/SeqIO/agave.pm

Bio/SeqIO/bsml.pm

Bio/SeqIO/chadoxml.pm

Bio/SeqIO/embl.pm

Bio/SeqIO/entrezgene.pm

Bio/SeqIO/fasta.pm

Bio/SeqIO/fastq.pm

Bio/SeqIO/game/gameWriter.pm

Bio/SeqIO/gbxml.pm

Bio/SeqIO/genbank.pm

Bio/SeqIO/interpro.pm

Bio/SeqIO/msout.pm

Bio/SeqIO/phd.pm

Bio/SeqIO/qual.pm

Bio/SeqIO/raw.pm

Bio/SeqIO/scf.pm

Bio/SeqIO/strider.pm

Bio/SeqIO/tab.pm

Bio/SeqUtils.pm

Bio/SimpleAlign.pm

Bio/Structure/IO.pm

Bio/Taxon.pm

Bio/Tools/Alignment/Consed.pm

Bio/Tools/Analysis/DNA/ESEfinder.pm

Bio/Tools/Analysis/Protein/ELM.pm

Bio/Tools/Analysis/Protein/NetPhos.pm

Bio/Tools/GFF.pm

Bio/Tools/Gel.pm

Bio/Tools/Geneid.pm

Bio/Tools/GuessSeqFormat.pm

Bio/Tools/IUPAC.pm

Bio/Tools/Match.pm

Bio/Tools/Phylo/Gerp.pm

Bio/Tools/Phylo/PAML.pm

Bio/Tools/Phylo/PAML/Codeml.pm

Bio/Tools/Primer3.pm

Bio/Tools/Protparam.pm

Bio/Tools/Run/StandAloneBlast.pm

Bio/Tools/Run/WrapperBase.pm

Bio/Tools/SeqPattern.pm

Bio/Tree/Node.pm

Bio/Tree/Statistics.pm

Bio/Tree/Tree.pm

Bio/Tree/TreeFunctionsI.pm

Bio/TreeIO.pm

Bio/TreeIO/newick.pm

Bio/TreeIO/svggraph.pm

Bio/Variation/IO.pm

Bio/Variation/IO/xml.pm

Build.PL *

Changes

INSTALL

MANIFEST

META.json

META.yml

README

debian/changelog

debian/compat

debian/control

debian/copyright

debian/patches/series

examples/db/getGenBank.pl

t/Align/AlignUtil.t

t/Align/SimpleAlign.t

t/AlignIO/AlignIO.t

t/AlignIO/fasta.t

t/AlignIO/meme.t

t/AlignIO/phylip.t

t/AlignIO/stockholm.t

t/Annotation/Annotation.t

t/Annotation/AnnotationAdaptor.t

t/Assembly/ContigSpectrum.t

t/Assembly/IO/bowtie.t

t/Assembly/IO/sam.t

t/Assembly/core.t

t/ClusterIO/SequenceFamily.t

t/LocalDB/Flat.t

t/LocalDB/Index/Index.t

t/LocalDB/SeqFeature.t

t/Map/Map.t

t/Map/Physical.t

t/Ontology/IO/go.t

t/Ontology/IO/obo.t

t/PopGen/MK.t

t/PopGen/PopGen.t

t/RemoteDB/BioFetch.t

t/RemoteDB/CUTG.t

t/RemoteDB/EMBL.t

t/RemoteDB/GenBank.t

t/RemoteDB/GenPept.t

t/RemoteDB/HIV/HIVQuery.t

t/RemoteDB/SeqVersion.t

t/RemoteDB/SwissProt.t

t/RemoteDB/Taxonomy.t

t/Root/RootIO.t

t/SearchIO/Tiling.t *

t/SearchIO/blast.t

t/SearchIO/blasttable.t

t/SearchIO/exonerate.t

t/SearchIO/hmmer.t

t/Seq/EncodedSeq.t

t/Seq/LocatableSeq.t

t/Seq/MetaSeq.t

t/Seq/PrimaryQual.t

t/Seq/PrimarySeq.t

t/Seq/PrimedSeq.t

t/Seq/Quality.t

t/Seq/Seq.t

t/SeqFeature/Primer.t

t/SeqFeature/Unflattener.t

t/SeqIO/SeqBuilder.t

t/SeqIO/SeqIO.t

t/SeqIO/Splicedseq.t

t/SeqIO/embl.t

t/SeqIO/fasta.t

t/SeqIO/fastq.t

t/SeqIO/genbank.t

t/SeqIO/msout.t

t/SeqTools/CodonTable.t

t/SeqTools/SeqUtils.t

t/Tools/Analysis/Protein/Domcut.t

t/Tools/Analysis/Protein/HNN.t

t/Tools/GFF.t

t/Tools/Genewise.t

t/Tools/Genomewise.t

t/Tools/IUPAC.t

t/Tools/Match.t

t/Tools/Phylo/Gerp.t

t/Tools/Phylo/PAML.t

t/Tools/Primer3.t

t/Tools/Run/RemoteBlast.t

t/Tools/Run/WBCommandExts.t

t/Tools/Run/WrapperBase.t

t/Tree/Tree.t

t/Tree/TreeStatistics.t

t/data/bootstrap.tre

t/data/msout/msout_infile1

t/data/msout/msout_infile2

t/data/msout/msout_infile3

t/data/msout/msout_infile4

t/data/primedseq.fa

t/data/taxdump/names.dmp

t/data/taxdump/nodes.dmp

t/data/testaln.stockholm

t/data/traits.tab

Show diffs side-by-side

added added

removed removed

scripts/Bio-DB-GFF/bp_fast_load_gff.pl

#!/usr/bin/perl

use strict;

use warnings;

# use lib './blib/lib';

use DBI;

use IO::File;

use Getopt::Long;

use Bio::DB::GFF::Util::Binning 'bin';

use Bio::DB::GFF::Adaptor::dbi::mysqlopt;

use constant MYSQL => 'mysql';

use constant FDATA => 'fdata';

use constant FTYPE => 'ftype';

use constant FGROUP => 'fgroup';

use constant FDNA => 'fdna';

use constant FATTRIBUTE => 'fattribute';

use constant FATTRIBUTE_TO_FEATURE => 'fattribute_to_feature';

my $DO_FAST = eval "use POSIX 'WNOHANG'; 1;";

=head1 NAME

bp_fast_load_gff.pl - Fast-load a Bio::DB::GFF database from GFF files.

=head1 SYNOPSIS

% bp_fast_load_gff.pl -d testdb dna1.fa dna2.fa features1.gff features2.gff ...

=head1 DESCRIPTION

This script loads a Bio::DB::GFF database with the features contained

in a list of GFF files and/or FASTA sequence files. You must use the

exact variant of GFF described in L<Bio::DB::GFF>. Various

command-line options allow you to control which database to load and

whether to allow an existing database to be overwritten.

This script is similar to load_gff.pl, but is much faster. However,

it is hard-coded to use MySQL and probably only works on Unix

platforms due to its reliance on pipes. See L<bp_load_gff.pl> for an

incremental loader that works with all databases supported by

Bio::DB::GFF, and L<bp_bulk_load_gff.pl> for a fast MySQL loader that

supports all platforms.

=head2 NOTES

If the filename is given as "-" then the input is taken from

standard input. Compressed files (.gz, .Z, .bz2) are automatically

uncompressed.

FASTA format files are distinguished from GFF files by their filename

extensions. Files ending in .fa, .fasta, .fast, .seq, .dna and their

uppercase variants are treated as FASTA files. Everything else is

treated as a GFF file. If you wish to load -fasta files from STDIN,

then use the -f command-line swith with an argument of '-', as in

gunzip my_data.fa.gz | bp_fast_load_gff.pl -d test -f -

The nature of the load requires that the database be on the local

machine and that the indicated user have the "file" privilege to load

the tables and have enough room in /usr/tmp (or whatever is specified

by the \$TMPDIR environment variable), to hold the tables transiently.

If your MySQL is version 3.22.6 and was compiled using the "load local

file" option, then you may be able to load remote databases with local

data using the --local option.

About maxfeature: the default value is 100,000,000 bases. If you have

features that are close to or greater that 100Mb in length, then the

value of maxfeature should be increased to 1,000,000,000. This value

must be a power of 10.

If the list of GFF or fasta files exceeds the kernel limit for the

maximum number of command-line arguments, use the

--long_list /path/to/files option.

The adaptor used is dbi::mysqlopt. There is currently no way to

change this.

=head1 COMMAND-LINE OPTIONS

Command-line options can be abbreviated to single-letter options.

e.g. -d instead of --database.

--database <dsn> Mysql database name

--create Reinitialize/create data tables without asking

--local Try to load a remote database using local data.

--user Username to log in as

--fasta File or directory containing fasta files to load

--password Password to use for authentication

--long_list Directory containing a very large number of

GFF and/or FASTA files

--maxfeature Set the value of the maximum feature size (default 100Mb; must be a power of 10)

--group A list of one or more tag names (comma or space separated)

to be used for grouping in the 9th column.

--gff3_munge Activate GFF3 name munging (see Bio::DB::GFF)

--summary Generate summary statistics for drawing coverage histograms.

This can be run on a previously loaded database or during

the load.

100

--Temporary Location of a writable scratch directory

101

102

=head1 SEE ALSO

103

104

L<Bio::DB::GFF>, L<bulk_load_gff.pl>, L<load_gff.pl>

105

106

=head1 AUTHOR

107

108

Lincoln Stein, lstein@cshl.org

109

110

111

112

This library is free software; you can redistribute it and/or modify

113

it under the same terms as Perl itself. See DISCLAIMER.txt for

114

disclaimers of warranty.

115

116

=cut

117

118

package Bio::DB::GFF::Adaptor::faux;

119

120

use Bio::DB::GFF::Adaptor::dbi::mysqlopt;

121

use vars '@ISA';

122

@ISA = 'Bio::DB::GFF::Adaptor::dbi::mysqlopt';

123

124

sub insert_sequence {

125

my $self = shift;

126

my ($id,$offset,$seq) = @_;

127

print join "\t",$id,$offset,$seq,"\n";

128

}

129

130

package main;

131

132

eval "use Time::HiRes"; undef $@;

133

my $timer = defined &Time::HiRes::time;

134

135

my ($DSN,$CREATE,$USER,$PASSWORD,$FASTA,$FAILED,$LOCAL,%PID,$MAX_BIN,$GROUP_TAG,$LONG_LIST,$MUNGE,$TMPDIR,$SUMMARY_STATS);

136

137

if ($DO_FAST) {

138

$SIG{CHLD} = sub {

139

while ((my $child = waitpid(-1,&WNOHANG)) > 0) {

140

delete $PID{$child} or next;

141

$FAILED++ if $? != 0;

142

}

143

}

144

};

145

146

$SIG{INT} = $SIG{TERM} = sub {cleanup(); exit -1};

147

148

GetOptions ('database:s' => \$DSN,

149

'create' => \$CREATE,

150

'user:s' => \$USER,

151

'local' => \$LOCAL,

152

'password:s' => \$PASSWORD,

153

'fasta:s' => \$FASTA,

154

'group:s' => \$GROUP_TAG,

155

'long_list:s' => \$LONG_LIST,

156

'maxbin|maxfeature:s' => \$MAX_BIN,

157

'gff3_munge' => \$MUNGE,

158

'summary' => \$SUMMARY_STATS,

159

'Temporary:s' => \$TMPDIR,

160

) or (system('pod2text',$0), exit -1);

161

162

$DSN ||= 'test';

163

$MAX_BIN ||= 1_000_000_000; # to accomodate human-sized chromosomes

164

165

my (@args,$AUTH);

166

if (defined $USER) {

167

push @args,(-user=>$USER);

168

$AUTH .= " -u$USER";

169

}

170

if (defined $PASSWORD) {

171

push @args,(-pass=>$PASSWORD);

172

$AUTH .= " -p$PASSWORD";

173

}

174

push @args,(-preferred_groups=>[split(/[,\s+]+/,$GROUP_TAG)]) if defined $GROUP_TAG;

175

176

my $db = Bio::DB::GFF->new(-adaptor=>'faux',-dsn => $DSN,@args)

177

or die "Can't open database: ",Bio::DB::GFF->error,"\n";

178

179

$db->gff3_name_munging(1) if $MUNGE;

180

181

if ($CREATE) {

182

$SUMMARY_STATS++;

183

$MAX_BIN ? $db->initialize(-erase=>1,-MAX_BIN=>$MAX_BIN) : $db->initialize(1);

184

}

185

186

$MAX_BIN ||= $db->meta('max_bin') || 100_000_000;

187

188

# deal with really long lists of files

189

if ($LONG_LIST) {

190

-d $LONG_LIST or die "The --long_list argument must be a directory\n";

191

opendir GFFDIR,$LONG_LIST or die "Could not open $LONG_LIST for reading: $!";

192

@ARGV = map { "$LONG_LIST\/$_" } readdir GFFDIR;

193

closedir GFFDIR;

194

195

if (defined $FASTA && -d $FASTA) {

196

opendir FASTA,$FASTA or die "Could not open $FASTA for reading: $!";

197

push @ARGV, map { "$FASTA\/$_" } readdir FASTA;

198

closedir FASTA;

199

}

200

}

201

202

foreach (@ARGV) {

203

$_ = "gunzip -c $_ |" if /\.gz$/;

204

$_ = "uncompress -c $_ |" if /\.Z$/;

205

$_ = "bunzip2 -c $_ |" if /\.bz2$/;

206

}

207

my(@fasta,@gff);

208

foreach (@ARGV) {

209

if (/\.(fa|fasta|dna|seq|fast)(?:\.|$)/i) {

210

push @fasta,$_;

211

} else {

212

push @gff,$_;

213

}

214

}

215

@ARGV = @gff;

216

push @fasta,$FASTA if defined $FASTA;

217

218

# initialize state variables

219

my $FID = 1;

220

my $GID = 1;

221

my $FTYPEID = 1;

222

my $ATTRIBUTEID = 1;

223

my %GROUPID = ();

224

my %FTYPEID = ();

225

my %ATTRIBUTEID = ();

226

my %DONE = ();

227

my $FEATURES = 0;

228

229

load_tables($db->dbh) unless $CREATE;

230

my ($major,$minor,$sub) = split /\./,$db->dbh->get_info(18); # SQL_DBMS_VER

231

my $can_disable_indexes = ($major >= 4 and $minor >= 0);

232

233

# open up pipes to the database

234

my (%FH,%COMMAND);

235

my $MYSQL = MYSQL;

236

my $tmpdir = $TMPDIR || $ENV{TMPDIR} || $ENV{TMP} || File::Spec->tmpdir();

237

-d $tmpdir or die <<END;

238

I could not find a suitable temporary directory to write scratch files into ($tmpdir by default).

239

Please select a directory and indicate its location by setting the TMP environment variable, or

240

by using the --Temporary switch.

241

END

242

243

my @fasta_files_to_be_unlinked;

244

my @files = (FDATA,FTYPE,FGROUP,FDNA,FATTRIBUTE,FATTRIBUTE_TO_FEATURE);

245

foreach (@files) {

246

my $file = "$tmpdir/$_.$$";

247

print STDERR "creating load file $file...";

248

$DO_FAST &&= (system("mkfifo $file") == 0); # for system(), 0 = success

249

print STDERR "ok\n";

250

my $delete = $CREATE ? "delete from $_" : '';

251

my $local = $LOCAL ? 'local' : '';

252

my $analyze = "analyze table $_";

253

my $command =<<END;

254

$MYSQL $AUTH

255

-N

256

-s

257

-e "lock tables $_ write; $delete; load data $local infile '$file' replace into table $_; unlock tables; $analyze"

258

$DSN

259

END

260

;

261

$command =~ s/\n/ /g;

262

$COMMAND{$_} = $command;

263

264

if ($DO_FAST) {

265

if (my $pid = fork) {

266

$PID{$pid} = $_;

267

print STDERR "pausing for 0.5 sec..." if $DO_FAST;

268

select(undef,undef,undef,0.50); # work around a race condition

269

print STDERR "ok\n";

270

} else { # THIS IS IN CHILD PROCESS

271

die "Couldn't fork: $!" unless defined $pid;

272

exec $command || die "Couldn't exec: $!";

273

exit 0;

274

}

275

}

276

print STDERR "opening load file for writing...";

277

$FH{$_} = IO::File->new($file,'>') or die $_,": $!";

278

print STDERR "ok\n";

279

$FH{$_}->autoflush;

280

}

281

282

print STDERR "Fast loading enabled\n" if $DO_FAST;

283

284

my ($count,$gff3,$last,$start,$beginning,$current_file);

285

286

$last = Time::HiRes::time() if $timer;

287

$beginning = $start = $last;

288

289

# avoid hanging on standalone --fasta load

290

if (!@ARGV) {

291

$FH{NULL} = IO::File->new(">$tmpdir/null");

292

push @ARGV, "$tmpdir/null";

293

}

294

295

while (<>) {

296

297

# reset GFF3 flag if new filehandle

298

$current_file ||= $ARGV;

299

unless ($current_file eq $ARGV) {

300

undef $gff3;

301

$current_file = $ARGV;

302

}

303

304

chomp;

305

my ($ref,$source,$method,$start,$stop,$score,$strand,$phase,$group);

306

307

# close sequence filehandle if required

308

if ( /^\#|\s+|^$|^>|\t/ && defined $FH{FASTA}) {

309

$FH{FASTA}->close;

310

delete $FH{FASTA};

311

}

312

313

# print to fasta file if the handle is open

314

if ( defined $FH{FASTA} ) {

315

$FH{FASTA}->print("$_\n");

316

next;

317

}

318

319

elsif (/^>(\S+)/) { # uh oh, sequence coming

320

$FH{FASTA} = IO::File->new(">$tmpdir/$1\.fa") or die "FASTA: $!\n";

321

$FH{FASTA}->print("$_\n");

322

push @fasta, "$tmpdir/$1\.fa";

323

push @fasta_files_to_be_unlinked,"$tmpdir/$1\.fa";

324

print STDERR "Processing embedded sequence $1\n";

325

next;

326

}

327

328

elsif (/^\#\#\s*group-tags\s+(.+)/) {

329

$db->preferred_groups(split(/\s+/,$1));

330

next;

331

}

332

333

elsif (/^\#\#\s*gff-version\s+(\d+)/) {

334

$gff3 = ($1 >= 3);

335

$db->print_gff3_warning() if $gff3;

336

next;

337

}

338

339

elsif (/^\#\#\s*sequence-region\s+(\S+)\s+(\d+)\s+(\d+)/i) { # header line

340

($ref,$source,$method,$start,$stop,$score,$strand,$phase,$group) =

341

($1,'reference','Component',$2,$3,'.','.','.',$gff3 ? "ID=Sequence:$1": qq(Sequence "$1"));

342

}

343

344

elsif (/^\#/) {

345

next;

346

}

347

348

else {

349

($ref,$source,$method,$start,$stop,$score,$strand,$phase,$group) = split "\t";

350

}

351

next unless defined $ref;

352

$FEATURES++;

353

354

warn "Feature $group is larger than $MAX_BIN. You will have trouble retrieving this feature.\nRerun script with --maxfeature set to a higher power of 10.\n" if $stop-$start+1 > $MAX_BIN;

355

356

$source = '\N' unless defined $source;

357

$score = '\N' if $score eq '.';

358

$strand = '\N' if $strand eq '.';

359

$phase = '\N' if $phase eq '.';

360

361

my ($gclass,$gname,$target_start,$target_stop,$attributes) = $db->split_group($group,$gff3);

362

# GFF2/3 transition

363

$gclass = [$gclass] unless ref $gclass;

364

$gname = [$gname] unless ref $gname;

365

366

for (my $i=0; $i < @$gname; $i++) {

367

my $group_class = $gclass->[$i];

368

my $group_name = $gname->[$i];

369

$group_class ||= '\N';

370

$group_name ||= '\N';

371

$target_start ||= '\N';

372

$target_stop ||= '\N';

373

$method ||= '\N';

374

$source ||= '\N';

375

376

my $fid = $FID++;

377

my $gid = $GROUPID{lc join($;,$group_class,$group_name)} ||= $GID++;

378

my $ftypeid = $FTYPEID{lc join($;,$source,$method)} ||= $FTYPEID++;

379

380

my $bin = bin($start,$stop,$db->min_bin);

381

$FH{ FDATA() }->print( join("\t",$fid,$ref,$start,$stop,$bin,$ftypeid,$score,$strand,$phase,$gid,$target_start,$target_stop),"\n" );

382

$FH{ FGROUP() }->print( join("\t",$gid,$group_class,$group_name),"\n" ) unless $DONE{"fgroup$;$gid"}++;

383

$FH{ FTYPE() }->print( join("\t",$ftypeid,$method,$source),"\n" ) unless $DONE{"ftype$;$ftypeid"}++;

384

385

foreach (@$attributes) {

386

my ($key,$value) = @$_;

387

my $attributeid = $ATTRIBUTEID{lc $key} ||= $ATTRIBUTEID++;

388

$FH{ FATTRIBUTE() }->print( join("\t",$attributeid,$key),"\n" ) unless $DONE{"fattribute$;$attributeid"}++;

389

$FH{ FATTRIBUTE_TO_FEATURE() }->print( join("\t",$fid,$attributeid,$value),"\n");

390

}

391

392

if ( $FEATURES % 1000 == 0) {

393

my $now = Time::HiRes::time() if $timer;

394

my $elapsed = $timer ? sprintf(" in %5.2fs",$now - $last) : '';

395

$last = $now;

396

print STDERR "$fid features parsed$elapsed...";

397

print STDERR -t STDOUT && !$ENV{EMACS} ? "\r" : "\n";

398

}

399

}

400

}

401

402

$FH{FASTA}->close if exists $FH{FASTA};

403

404

printf STDERR "Feature load time %5.2fs\n",(Time::HiRes::time() - $start) if $timer;

405

$start = time();

406

407

for my $fasta (@fasta) {

408

warn "Loading fasta ",(-d $fasta?"directory":"file"), " $fasta\n";

409

my $old = select($FH{FDNA()});

410

my $loaded = $db->load_fasta($fasta);

411

warn "$fasta: $loaded records loaded\n";

412

select $old;

413

}

414

415

printf STDERR "Fasta load time %5.2fs\n",(Time::HiRes::time() - $start) if $timer;

416

$start = time();

417

418

my $success = 1;

419

if ($DO_FAST) {

420

warn "Indexing and analyzing tables. This may take some time (you may see database messages during the process)...\n";

421

}

422

423

$_->close foreach values %FH;

424

425

if (!$DO_FAST) {

426

warn "Loading feature data and analyzing tables. You may see database messages here...\n";

427

$success &&= system($COMMAND{$_}) == 0 foreach @files;

428

}

429

430

# wait for children

431

while (%PID) {

432

sleep;

433

}

434

$success &&= !$FAILED;

435

436

cleanup();

437

438

printf STDERR "Total parse & load time %5.2fs\n",(Time::HiRes::time() - $beginning) if $timer;

439

440

if ($success) {

441

print "SUCCESS: $FEATURES features successfully loaded\n";

442

exit 0;

443

} else {

444

print "FAILURE: Please see standard error for details\n";

445

exit -1;

446

}

447

448

if ($SUMMARY_STATS) {

449

warn "Building summary statistics for coverage histograms...\n";

450

$db->build_summary_statistics;

451

}

452

453

exit 0;

454

455

sub cleanup {

456

foreach (@files,@fasta_files_to_be_unlinked) {

457

unlink "$tmpdir/$_.$$";

458

}

459

}

460

461

# load copies of some of the tables into memory

462

sub load_tables {

463

my $dbh = shift;

464

print STDERR "loading normalized group, type and attribute information...";

465

$FID = 1 + get_max_id($dbh,'fdata','fid');

466

$GID = 1 + get_max_id($dbh,'fgroup','gid');

467

$FTYPEID = 1 + get_max_id($dbh,'ftype','ftypeid');

468

$ATTRIBUTEID = 1 + get_max_id($dbh,'fattribute','fattribute_id');

469

get_ids($dbh,\%DONE,\%GROUPID,'fgroup','gid','gclass','gname');

470

get_ids($dbh,\%DONE,\%FTYPEID,'ftype','ftypeid','fsource','fmethod');

471

get_ids($dbh,\%DONE,\%ATTRIBUTEID,'fattribute','fattribute_id','fattribute_name');

472

print STDERR "ok\n";

473

}

474

475

sub get_max_id {

476

my $dbh = shift;

477

my ($table,$id) = @_;

478

my $sql = "select max($id) from $table";

479

my $result = $dbh->selectcol_arrayref($sql) or die $dbh->errstr;

480

$result->[0];

481

}

482

483

sub get_ids {

484

my $dbh = shift;

485

my ($done,$idhash,$table,$id,@columns) = @_;

486

my $columns = join ',',$id,@columns;

487

my $sql = "select $columns from $table";

488

my $sth = $dbh->prepare($sql) or die $dbh->errstr;

489

$sth->execute or die $dbh->errstr;

490

while (my($id,@cols) = $sth->fetchrow_array) {

491

my $key = lc join $;,@cols;

492

$idhash->{$key} = $id;

493

$done->{$table,$id}++;

494

}

495

}

496

497

__END__

Older »