~akopytov/percona-xtrabackup/bug1166888-2.1

« back to all changes in this revision

Viewing changes to src/libarchive/tar/test/test_patterns.c

  • Committer: Alexey Kopytov
  • Date: 2012-02-10 20:05:56 UTC
  • mto: (391.1.5 staging)
  • mto: This revision was merged to the branch mainline in revision 390.
  • Revision ID: akopytov@gmail.com-20120210200556-6kx41z8wwrqfucro
Rebase of the parallel compression patch on new trunk + post-review
fixes.

Implementation of parallel compression and streaming for XtraBackup.

This revision implements the following changes:

* InnoDB files are now streamed by the xtrabackup binary rather than
innobackupex. As a result, integrity is now verified by xtrabackup and
thus tar4ibd is no longer needed, so it was removed.

* xtrabackup binary now accepts the new '--stream' option which has
exactly the same semantics as the '--stream' option in
innobackupex: it tells xtrabackup to stream all files to the standard
output in the specified format rather than storing them locally.

* The xtrabackup binary can now do parallel compression using the
quicklz library. Two new options were added to xtrabackup to support
this feature:

- '--compress' tells xtrabackup to compress all output data, including
the transaction log file and meta data files, using the specified
compression algorithm. The only currently supported algorithm is
'quicklz'. The resulting files have the qpress archive format,
i.e. every *.qp file produced by xtrabackup is essentially a one-file
qpress archive and can be extracted and uncompressed by the qpress
file archiver (http://www.quicklz.com/).

- '--compress-threads' specifies the number of worker threads used by
xtrabackup for parallel data compression. This option defaults to 1.

Parallel compression ('--compress-threads') can be used together with
parallel file copying ('--parallel'). For example, '--parallel=4
--compress --compress-threads=2' will create 4 IO threads that will
read the data and pipe it to 2 compression threads.

* To support simultaneous compression and streaming, a new custom
streaming format called 'xbstream' was introduced to XtraBackup in
addition to the 'tar' format. That was required to overcome some
limitations of traditional archive formats such as 'tar', 'cpio' and
others that do not allow streaming dynamically generated files, for
example dynamically compressed files.  Other advantages of xbstream over
traditional streaming/archive formats include ability to stream multiple
files concurrently (so it is possible to use streaming in the xbstream
format together with the --parallel option) and more compact data
storage.

* To allow streaming and extracting files to/from the xbstream format
produced by xtrabackup, a new utility aptly called 'xbstream' was
added to the XtraBackup distribution. This utility has a tar-like
interface:

- with the '-x' option it extracts files from the stream read from its
standard input to the current directory unless specified otherwise
with the '-C' option.

- with the '-c' option it streams files specified on the command line
to its standard output.

The utility also tries to minimize its impact on the OS page cache by
using the appropriate posix_fadvise() calls when available.

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
/*-
 
2
 * Copyright (c) 2009 Michihiro NAKAJIMA
 
3
 * Copyright (c) 2003-2007 Tim Kientzle
 
4
 * All rights reserved.
 
5
 *
 
6
 * Redistribution and use in source and binary forms, with or without
 
7
 * modification, are permitted provided that the following conditions
 
8
 * are met:
 
9
 * 1. Redistributions of source code must retain the above copyright
 
10
 *    notice, this list of conditions and the following disclaimer.
 
11
 * 2. Redistributions in binary form must reproduce the above copyright
 
12
 *    notice, this list of conditions and the following disclaimer in the
 
13
 *    documentation and/or other materials provided with the distribution.
 
14
 *
 
15
 * THIS SOFTWARE IS PROVIDED BY THE AUTHOR(S) ``AS IS'' AND ANY EXPRESS OR
 
16
 * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES
 
17
 * OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED.
 
18
 * IN NO EVENT SHALL THE AUTHOR(S) BE LIABLE FOR ANY DIRECT, INDIRECT,
 
19
 * INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT
 
20
 * NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE,
 
21
 * DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY
 
22
 * THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
 
23
 * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF
 
24
 * THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
 
25
 */
 
26
#include "test.h"
 
27
__FBSDID("$FreeBSD: src/usr.bin/tar/test/test_patterns.c,v 1.6 2008/08/21 22:28:00 kientzle Exp $");
 
28
 
 
29
DEFINE_TEST(test_patterns)
 
30
{
 
31
        FILE *f;
 
32
        int r;
 
33
        const char *reffile2 = "test_patterns_2.tar";
 
34
        const char *reffile3 = "test_patterns_3.tar";
 
35
        const char *reffile4 = "test_patterns_4.tar";
 
36
 
 
37
        const char *tar2aExpected[] = {
 
38
                "/tmp/foo/bar/",
 
39
                "/tmp/foo/bar/baz",
 
40
                NULL
 
41
        };
 
42
 
 
43
        /*
 
44
         * Test basic command-line pattern handling.
 
45
         */
 
46
 
 
47
        /*
 
48
         * Test 1: Files on the command line that don't get matched
 
49
         * didn't produce an error.
 
50
         *
 
51
         * John Baldwin reported this problem in PR bin/121598
 
52
         */
 
53
        f = fopen("foo", "w");
 
54
        assert(f != NULL);
 
55
        fclose(f);
 
56
        r = systemf("%s cfv tar1.tgz foo > tar1a.out 2> tar1a.err", testprog);
 
57
        assertEqualInt(r, 0);
 
58
        r = systemf("%s xv --no-same-owner -f tar1.tgz foo bar > tar1b.out 2> tar1b.err", testprog);
 
59
        failure("tar should return non-zero because a file was given on the command line that's not in the archive");
 
60
        assert(r != 0);
 
61
 
 
62
        /*
 
63
         * Test 2: Check basic matching of full paths that start with /
 
64
         */
 
65
        extract_reference_file(reffile2);
 
66
 
 
67
        r = systemf("%s tf %s /tmp/foo/bar > tar2a.out 2> tar2a.err",
 
68
            testprog, reffile2);
 
69
        assertEqualInt(r, 0);
 
70
        assertFileContainsLinesAnyOrder("tar2a.out", tar2aExpected);
 
71
        assertEmptyFile("tar2a.err");
 
72
 
 
73
        /*
 
74
         * Test 3 archive has some entries starting with '/' and some not.
 
75
         */
 
76
        extract_reference_file(reffile3);
 
77
 
 
78
        /* Test 3a:  Pattern tmp/foo/bar should not match /tmp/foo/bar */
 
79
        r = systemf("%s x --no-same-owner -f %s tmp/foo/bar > tar3a.out 2> tar3a.err",
 
80
            testprog, reffile3);
 
81
        assert(r != 0);
 
82
        assertEmptyFile("tar3a.out");
 
83
 
 
84
        /* Test 3b:  Pattern /tmp/foo/baz should not match tmp/foo/baz */
 
85
        assertNonEmptyFile("tar3a.err");
 
86
        /* Again, with the '/' */
 
87
        r = systemf("%s x --no-same-owner -f %s /tmp/foo/baz > tar3b.out 2> tar3b.err",
 
88
            testprog, reffile3);
 
89
        assert(r != 0);
 
90
        assertEmptyFile("tar3b.out");
 
91
        assertNonEmptyFile("tar3b.err");
 
92
 
 
93
        /* Test 3c: ./tmp/foo/bar should not match /tmp/foo/bar */
 
94
        r = systemf("%s x --no-same-owner -f %s ./tmp/foo/bar > tar3c.out 2> tar3c.err",
 
95
            testprog, reffile3);
 
96
        assert(r != 0);
 
97
        assertEmptyFile("tar3c.out");
 
98
        assertNonEmptyFile("tar3c.err");
 
99
 
 
100
        /* Test 3d: ./tmp/foo/baz should match tmp/foo/baz */
 
101
        r = systemf("%s x --no-same-owner -f %s ./tmp/foo/baz > tar3d.out 2> tar3d.err",
 
102
            testprog, reffile3);
 
103
        assertEqualInt(r, 0);
 
104
        assertEmptyFile("tar3d.out");
 
105
        assertEmptyFile("tar3d.err");
 
106
        assertFileExists("tmp/foo/baz/bar");
 
107
 
 
108
        /*
 
109
         * Test 4 archive has some entries starting with windows drive letters
 
110
         * such as 'c:\', '//./c:/' or '//?/c:/'.
 
111
         */
 
112
        extract_reference_file(reffile4);
 
113
 
 
114
        r = systemf("%s x --no-same-owner -f %s -C tmp > tar4.out 2> tar4.err",
 
115
            testprog, reffile4);
 
116
        assert(r != 0);
 
117
        assertEmptyFile("tar4.out");
 
118
        assertNonEmptyFile("tar4.err");
 
119
 
 
120
        for (r = 1; r <= 54; r++) {
 
121
                char file_a[] = "tmp/fileXX";
 
122
                char file_b1[] = "tmp/server/share/fileXX";
 
123
                char file_b2[] = "tmp/server\\share\\fileXX";
 
124
                char file_c[] = "tmp/../fileXX";
 
125
                char *filex;
 
126
                int xsize;
 
127
 
 
128
                switch (r) {
 
129
                case 15: case 18:
 
130
                        /*
 
131
                         * Including server and share names.
 
132
                         * //?/UNC/server/share/file15
 
133
                         * //?/unc/server/share/file18
 
134
                         */
 
135
                        filex = file_b1;
 
136
                        xsize = sizeof(file_b1);
 
137
                        break;
 
138
                case 35: case 38: case 52:
 
139
                        /*
 
140
                         * Including server and share names.
 
141
                         * \\?\UNC\server\share\file35
 
142
                         * \\?\unc\server\share\file38
 
143
                         * \/?/uNc/server\share\file52
 
144
                         */
 
145
                        filex = file_b2;
 
146
                        xsize = sizeof(file_b2);
 
147
                        break;
 
148
                default:
 
149
                        filex = file_a;
 
150
                        xsize = sizeof(file_a);
 
151
                        break;
 
152
                }
 
153
                filex[xsize-3] = '0' + r / 10;
 
154
                filex[xsize-2] = '0' + r % 10;
 
155
                switch (r) {
 
156
                case 5: case 6: case 17: case 20: case 25:
 
157
                case 26: case 37: case 40: case 43: case 54:
 
158
                        /*
 
159
                         * Not extracted patterns.
 
160
                         * D:../file05
 
161
                         * c:../../file06
 
162
                         * //?/UNC/../file17
 
163
                         * //?/unc/../file20
 
164
                         * z:..\file25
 
165
                         * c:..\..\file26
 
166
                         * \\?\UNC\..\file37
 
167
                         * \\?\unc\..\file40
 
168
                         * c:../..\file43
 
169
                         * \/?\UnC\../file54
 
170
                         */
 
171
                        assertFileNotExists(filex);
 
172
                        filex = file_c;
 
173
                        xsize = sizeof(file_c);
 
174
                        filex[xsize-3] = '0' + r / 10;
 
175
                        filex[xsize-2] = '0' + r % 10;
 
176
                        assertFileNotExists(filex);
 
177
                        break;
 
178
                default:
 
179
                        /* Extracted patterns. */
 
180
                        assertFileExists(filex);
 
181
                        break;
 
182
                }
 
183
        }
 
184
}