~ubuntu-branches/ubuntu/quantal/sunpinyin/quantal

« back to all changes in this revision

Viewing changes to src/slm/tools/clean_rmrb.cpp

  • Committer: Package Import Robot
  • Author(s): YunQiang Su
  • Date: 2012-03-30 15:31:55 UTC
  • mfrom: (1.1.3) (1.2.7 sid)
  • Revision ID: package-import@ubuntu.com-20120330153155-qgls77sogzgtg9zp
Tags: 2.0.3+git20120222-1
* Team upload: git snapshot 20120222.
   - fix breaks if LDFLAGS in environment contains
       multiple words (Closese #646001).
   - rm patches merged to upstream:
       append-os-environ-toenv.patch
       fix-ftbfs-on-sh.patch
       remove-10-candidate-words-limitation.patch
   - refresh disable-lm-dict-compile.patch.
* Bump stardard version to 3.9.3: no modify needed.
* add libsunpinyin3-dbg and python-sunpinyin packages.
* debian/compat to 9, multiarch it.
* rewrite debian/rules with dh 7 format.

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
1
/*
2
2
 * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS HEADER.
3
 
 * 
 
3
 *
4
4
 * Copyright (c) 2007 Sun Microsystems, Inc. All Rights Reserved.
5
 
 * 
 
5
 *
6
6
 * The contents of this file are subject to the terms of either the GNU Lesser
7
7
 * General Public License Version 2.1 only ("LGPL") or the Common Development and
8
8
 * Distribution License ("CDDL")(collectively, the "License"). You may not use this
9
9
 * file except in compliance with the License. You can obtain a copy of the CDDL at
10
10
 * http://www.opensource.org/licenses/cddl1.php and a copy of the LGPLv2.1 at
11
 
 * http://www.opensource.org/licenses/lgpl-license.php. See the License for the 
 
11
 * http://www.opensource.org/licenses/lgpl-license.php. See the License for the
12
12
 * specific language governing permissions and limitations under the License. When
13
13
 * distributing the software, include this License Header Notice in each file and
14
14
 * include the full text of the License in the License file as well as the
15
15
 * following notice:
16
 
 * 
 
16
 *
17
17
 * NOTICE PURSUANT TO SECTION 9 OF THE COMMON DEVELOPMENT AND DISTRIBUTION LICENSE
18
18
 * (CDDL)
19
19
 * For Covered Software in this distribution, this License shall be governed by the
21
21
 * Any litigation relating to this License shall be subject to the jurisdiction of
22
22
 * the Federal Courts of the Northern District of California and the state courts
23
23
 * of the State of California, with venue lying in Santa Clara County, California.
24
 
 * 
 
24
 *
25
25
 * Contributor(s):
26
 
 * 
 
26
 *
27
27
 * If you wish your version of this file to be governed by only the CDDL or only
28
28
 * the LGPL Version 2.1, indicate your decision by adding "[Contributor]" elects to
29
29
 * include this software in this distribution under the [CDDL or LGPL Version 2.1]
32
32
 * Version 2.1, or to extend the choice of license to its licensees as provided
33
33
 * above. However, if you add LGPL Version 2.1 code and therefore, elected the LGPL
34
34
 * Version 2 license, then the option applies only if the new code is made subject
35
 
 * to such option by the copyright holder. 
 
35
 * to such option by the copyright holder.
36
36
 */
37
37
 
38
38
#ifdef HAVE_CONFIG_H
51
51
 
52
52
// erase 0xff character
53
53
// return true for empty line(only space)
54
 
bool processline(unsigned char * buf)
 
54
bool
 
55
processline(unsigned char * buf)
55
56
{
56
 
        bool space = true;
57
 
        unsigned char *dst = buf;
58
 
        while (*buf != 0) {
59
 
                if ((unsigned int)*buf == 0xFF || (unsigned int)*buf == (unsigned int)'\n') {
60
 
                        ++buf; continue;
61
 
                }
62
 
                if ((unsigned int)*buf == 0x80 && (unsigned int)*(buf+1) == 0x20) {
63
 
                        ++buf; continue;
64
 
                }
65
 
                if (space && (unsigned int)*buf != (unsigned int)' ' && (unsigned int)*buf != (unsigned int)'\t')
66
 
                        space = false;
67
 
                *dst++ = *buf++;
68
 
        }
69
 
        *dst = *buf;
70
 
        return space;
 
57
    bool space = true;
 
58
    unsigned char *dst = buf;
 
59
    while (*buf != 0) {
 
60
        if ((unsigned int)*buf == 0xFF || (unsigned int)*buf ==
 
61
            (unsigned int)'\n') {
 
62
            ++buf; continue;
 
63
        }
 
64
        if ((unsigned int)*buf == 0x80 && (unsigned int)*(buf + 1) == 0x20) {
 
65
            ++buf; continue;
 
66
        }
 
67
        if (space && (unsigned int)*buf != (unsigned int)' ' &&
 
68
            (unsigned int)*buf != (unsigned int)'\t')
 
69
            space = false;
 
70
        *dst++ = *buf++;
 
71
    }
 
72
    *dst = *buf;
 
73
    return space;
71
74
}
72
75
 
73
 
int main(int argc, char *argv[])
 
76
int
 
77
main(int argc, char *argv[])
74
78
{
75
 
        unsigned char buf[10240];
76
 
        for (int i=1; i < argc; ++i) {
77
 
                FILE *fp = fopen(argv[i], "r");
78
 
                while (fgets((char*)buf, sizeof(buf), fp) != NULL) {
79
 
                        bool emptyline = processline(buf);
80
 
                        if ((unsigned int)buf[0] == '#' || (unsigned int)buf[0] == '0')
81
 
                                continue;
82
 
                        if (emptyline)
83
 
                                printf("\n");
84
 
                        else
85
 
                                printf("%s", buf);
86
 
                }
87
 
                fclose(fp);
 
79
    unsigned char buf[10240];
 
80
    for (int i = 1; i < argc; ++i) {
 
81
        FILE *fp = fopen(argv[i], "r");
 
82
        while (fgets((char*)buf, sizeof(buf), fp) != NULL) {
 
83
            bool emptyline = processline(buf);
 
84
            if ((unsigned int)buf[0] == '#' || (unsigned int)buf[0] == '0')
 
85
                continue;
 
86
            if (emptyline)
88
87
                printf("\n");
 
88
            else
 
89
                printf("%s", buf);
89
90
        }
 
91
        fclose(fp);
 
92
        printf("\n");
 
93
    }
90
94
}