~ubuntu-branches/ubuntu/raring/sunpinyin/raring

« back to all changes in this revision

Viewing changes to src/pinyin/shuangpin_seg.h

  • Committer: Package Import Robot
  • Author(s): YunQiang Su
  • Date: 2012-03-30 15:31:55 UTC
  • mfrom: (1.1.3) (1.2.7 sid)
  • Revision ID: package-import@ubuntu.com-20120330153155-qgls77sogzgtg9zp
Tags: 2.0.3+git20120222-1
* Team upload: git snapshot 20120222.
   - fix breaks if LDFLAGS in environment contains
       multiple words (Closese #646001).
   - rm patches merged to upstream:
       append-os-environ-toenv.patch
       fix-ftbfs-on-sh.patch
       remove-10-candidate-words-limitation.patch
   - refresh disable-lm-dict-compile.patch.
* Bump stardard version to 3.9.3: no modify needed.
* add libsunpinyin3-dbg and python-sunpinyin packages.
* debian/compat to 9, multiarch it.
* rewrite debian/rules with dh 7 format.

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
1
/*
2
2
 * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS HEADER.
3
 
 * 
 
3
 *
4
4
 * Copyright (c) 2007 Sun Microsystems, Inc. All Rights Reserved.
5
 
 * 
 
5
 *
6
6
 * The contents of this file are subject to the terms of either the GNU Lesser
7
7
 * General Public License Version 2.1 only ("LGPL") or the Common Development and
8
8
 * Distribution License ("CDDL")(collectively, the "License"). You may not use this
9
9
 * file except in compliance with the License. You can obtain a copy of the CDDL at
10
10
 * http://www.opensource.org/licenses/cddl1.php and a copy of the LGPLv2.1 at
11
 
 * http://www.opensource.org/licenses/lgpl-license.php. See the License for the 
 
11
 * http://www.opensource.org/licenses/lgpl-license.php. See the License for the
12
12
 * specific language governing permissions and limitations under the License. When
13
13
 * distributing the software, include this License Header Notice in each file and
14
14
 * include the full text of the License in the License file as well as the
15
15
 * following notice:
16
 
 * 
 
16
 *
17
17
 * NOTICE PURSUANT TO SECTION 9 OF THE COMMON DEVELOPMENT AND DISTRIBUTION LICENSE
18
18
 * (CDDL)
19
19
 * For Covered Software in this distribution, this License shall be governed by the
21
21
 * Any litigation relating to this License shall be subject to the jurisdiction of
22
22
 * the Federal Courts of the Northern District of California and the state courts
23
23
 * of the State of California, with venue lying in Santa Clara County, California.
24
 
 * 
 
24
 *
25
25
 * Contributor(s):
26
 
 * 
 
26
 *
27
27
 * If you wish your version of this file to be governed by only the CDDL or only
28
28
 * the LGPL Version 2.1, indicate your decision by adding "[Contributor]" elects to
29
29
 * include this software in this distribution under the [CDDL or LGPL Version 2.1]
32
32
 * Version 2.1, or to extend the choice of license to its licensees as provided
33
33
 * above. However, if you add LGPL Version 2.1 code and therefore, elected the LGPL
34
34
 * Version 2 license, then the option applies only if the new code is made subject
35
 
 * to such option by the copyright holder. 
 
35
 * to such option by the copyright holder.
36
36
 */
37
37
 
38
38
#ifndef SUNPY_SHUANGPIN_SEG_H
47
47
class CShuangpinSegmentor : public IPySegmentor
48
48
{
49
49
public:
50
 
    CShuangpinSegmentor (EShuangpinType  shpType);
51
 
 
52
 
    virtual TSegmentVec& getSegments (bool) {return m_segs;}
53
 
    virtual const wstring& getInputBuffer () {return m_inputBuf;}
54
 
    virtual const char* getSylSeps () {return "'";}
55
 
 
56
 
    virtual unsigned push (unsigned ch);
57
 
    virtual unsigned pop ();
58
 
    virtual unsigned insertAt (unsigned idx, unsigned ch);
59
 
    virtual unsigned deleteAt (unsigned idx, bool backward=true);
60
 
    virtual unsigned clear (unsigned from=0);
61
 
 
62
 
    virtual unsigned updatedFrom () {return m_updatedFrom;}
63
 
 
64
 
    void setGetFuzzySyllablesOp (CGetFuzzySyllablesOp<CPinyinData> *op) {m_pGetFuzzySyllablesOp = op;}
65
 
    
 
50
    CShuangpinSegmentor (EShuangpinType shpType);
 
51
 
 
52
    virtual TSegmentVec& getSegments(bool) { return m_segs; }
 
53
    virtual const wstring& getInputBuffer() { return m_inputBuf; }
 
54
    virtual const char* getSylSeps() { return "'"; }
 
55
 
 
56
    virtual unsigned push(unsigned ch);
 
57
    virtual unsigned pop();
 
58
    virtual unsigned insertAt(unsigned idx, unsigned ch);
 
59
    virtual unsigned deleteAt(unsigned idx, bool backward = true);
 
60
    virtual unsigned clear(unsigned from = 0);
 
61
 
 
62
    virtual unsigned updatedFrom() { return m_updatedFrom; }
 
63
 
 
64
    void setGetFuzzySyllablesOp(CGetFuzzySyllablesOp<CPinyinData> *op) {
 
65
        m_pGetFuzzySyllablesOp = op; }
 
66
 
66
67
private:
67
 
    unsigned _push (unsigned ch);
68
 
    unsigned _clear (unsigned from);
 
68
    unsigned _push(unsigned ch);
 
69
    unsigned _clear(unsigned from);
69
70
    int _getNumberOfNonAlpha() const;
70
71
    int _encode(const char* buf, char ch, bool isComplete);
71
 
    void _locateSegment (unsigned idx, unsigned &strIdx, unsigned &segIdx);
72
 
 
73
 
    inline void _addFuzzySyllables (TSegment &seg);
74
 
    
75
 
    static CShuangpinData               s_shpData;
76
 
    std::string                         m_pystr;
77
 
    wstring                             m_inputBuf;
78
 
    TSegmentVec                         m_segs;
79
 
    unsigned                            m_updatedFrom;
80
 
    int                                 m_nAlpha;     /* number of non-py chars in m_pystr*/
81
 
    bool                                m_hasInvalid; /* true if there is invalid py in m_pystr */
82
 
    unsigned                            m_nLastValidPos;
 
72
    void _locateSegment(unsigned idx, unsigned &strIdx, unsigned &segIdx);
 
73
 
 
74
    inline void _addFuzzySyllables(TSegment &seg);
 
75
 
 
76
    static CShuangpinData s_shpData;
 
77
    std::string m_pystr;
 
78
    wstring m_inputBuf;
 
79
    TSegmentVec m_segs;
 
80
    unsigned m_updatedFrom;
 
81
    int m_nAlpha;                                     /* number of non-py chars in m_pystr*/
 
82
    bool m_hasInvalid;                                /* true if there is invalid py in m_pystr */
 
83
    unsigned m_nLastValidPos;
83
84
 
84
85
    CGetFuzzySyllablesOp<CPinyinData>  *m_pGetFuzzySyllablesOp;
85
86
};