~ubuntu-branches/ubuntu/raring/sunpinyin/raring

Viewing changes to src/slm/tslmpack/slmpack.cpp

Committer: Package Import Robot
Author(s): YunQiang Su
Date: 2012-03-30 15:31:55 UTC
mfrom: (1.1.3) (1.2.7 sid)
Revision ID: package-import@ubuntu.com-20120330153155-qgls77sogzgtg9zp

Tags: 2.0.3+git20120222-1

* Team upload: git snapshot 20120222.
   - fix breaks if LDFLAGS in environment contains
       multiple words (Closese #646001).
   - rm patches merged to upstream:
       append-os-environ-toenv.patch
       fix-ftbfs-on-sh.patch
       remove-10-candidate-words-limitation.patch
   - refresh disable-lm-dict-compile.patch.
* Bump stardard version to 3.9.3: no modify needed.
* add libsunpinyin3-dbg and python-sunpinyin packages.
* debian/compat to 9, multiarch it.
* rewrite debian/rules with dh 7 format.

files added:
.gitattributes

.gitignore

.pc/strndup_in_cxx.patch

.pc/strndup_in_cxx.patch/src

.pc/strndup_in_cxx.patch/src/portability.cpp

.pc/strndup_in_cxx.patch/src/portability.h

debian/clean

debian/patches/strndup_in_cxx.patch

debian/python-sunpinyin.install

src/ime-core/imi_glibHandler.h

src/ime-core/imi_plugin.cpp

src/ime-core/imi_plugin.h

wrapper

wrapper/gtk_standalone

wrapper/gtk_standalone/SConstruct

wrapper/gtk_standalone/images

wrapper/gtk_standalone/images/cnpunc.png

wrapper/gtk_standalone/images/eng.png

wrapper/gtk_standalone/images/enpunc.png

wrapper/gtk_standalone/images/fullwidth.png

wrapper/gtk_standalone/images/halfwidth.png

wrapper/gtk_standalone/images/han.png

wrapper/gtk_standalone/imi_gtkwin.cpp

wrapper/gtk_standalone/imi_gtkwin.h

wrapper/gtk_standalone/sunpinyin.cpp

wrapper/ibus

wrapper/ibus/CMakeLists.txt

wrapper/ibus/COPYING

wrapper/ibus/LGPL.LICENSE

wrapper/ibus/OPENSOLARIS.LICENSE

wrapper/ibus/README

wrapper/ibus/SConstruct

wrapper/ibus/cmake

wrapper/ibus/cmake/modules

wrapper/ibus/cmake/modules/FindSunPinyin.cmake

wrapper/ibus/cmake/modules/FindiBus.cmake

wrapper/ibus/cmake/modules/Gettext.cmake

wrapper/ibus/cmake/modules/LibFindMacros.cmake

wrapper/ibus/cmake/modules/Paths.cmake

wrapper/ibus/data

wrapper/ibus/data/CMakeLists.txt

wrapper/ibus/data/sunpinyin.xml.in

wrapper/ibus/debian

wrapper/ibus/debian/changelog

wrapper/ibus/debian/control.in

wrapper/ibus/debian/rules

wrapper/ibus/icons

wrapper/ibus/icons/cnpunc.svg

wrapper/ibus/icons/eng.svg

wrapper/ibus/icons/enpunc.svg

wrapper/ibus/icons/fullwidth.svg

wrapper/ibus/icons/halfwidth.svg

wrapper/ibus/icons/han.svg

wrapper/ibus/icons/setup.svg

wrapper/ibus/icons/sunpinyin-logo.png

wrapper/ibus/po

wrapper/ibus/po/CMakeLists.txt

wrapper/ibus/po/ibus-sunpinyin.po

wrapper/ibus/po/zh_CN.po

wrapper/ibus/setup

wrapper/ibus/setup/CMakeLists.txt

wrapper/ibus/setup/config.py.in

wrapper/ibus/setup/ibus-setup-sunpinyin.in

wrapper/ibus/setup/main.py

wrapper/ibus/setup/setup.xml

wrapper/ibus/src

wrapper/ibus/src/CMakeLists.txt

wrapper/ibus/src/debug.cpp

wrapper/ibus/src/debug.h

wrapper/ibus/src/engine.cpp

wrapper/ibus/src/engine.h

wrapper/ibus/src/ibus_common.h

wrapper/ibus/src/ibus_portable.cpp

wrapper/ibus/src/ibus_portable.h

wrapper/ibus/src/imi_ibus_win.cpp

wrapper/ibus/src/imi_ibus_win.h

wrapper/ibus/src/main.cpp

wrapper/ibus/src/pointer.h

wrapper/ibus/src/sunpinyin_config.cpp

wrapper/ibus/src/sunpinyin_config.h

wrapper/ibus/src/sunpinyin_config_keys.h

wrapper/ibus/src/sunpinyin_engine.cpp

wrapper/ibus/src/sunpinyin_engine.h

wrapper/ibus/src/sunpinyin_engine_proxy.cpp

wrapper/ibus/src/sunpinyin_engine_proxy.h

wrapper/ibus/src/sunpinyin_lookup_table.cpp

wrapper/ibus/src/sunpinyin_lookup_table.h

wrapper/ibus/src/sunpinyin_property.cpp

wrapper/ibus/src/sunpinyin_property.h

wrapper/macos

wrapper/macos/CandidateWindow.h

wrapper/macos/CandidateWindow.m

wrapper/macos/English.lproj

wrapper/macos/English.lproj/InfoPlist.strings

wrapper/macos/English.lproj/Localizable.strings

wrapper/macos/English.lproj/MainMenu.xib

wrapper/macos/Frameworks

wrapper/macos/Frameworks/Growl.framework

wrapper/macos/Frameworks/Growl.framework/Growl

wrapper/macos/Frameworks/Growl.framework/Headers

wrapper/macos/Frameworks/Growl.framework/Resources

wrapper/macos/Frameworks/Growl.framework/Versions

wrapper/macos/Frameworks/Growl.framework/Versions/A

wrapper/macos/Frameworks/Growl.framework/Versions/A/Growl

wrapper/macos/Frameworks/Growl.framework/Versions/A/Headers

wrapper/macos/Frameworks/Growl.framework/Versions/A/Headers/Growl.h

wrapper/macos/Frameworks/Growl.framework/Versions/A/Headers/GrowlApplicationBridge-Carbon.h

wrapper/macos/Frameworks/Growl.framework/Versions/A/Headers/GrowlApplicationBridge.h

wrapper/macos/Frameworks/Growl.framework/Versions/A/Headers/GrowlDefines.h

wrapper/macos/Frameworks/Growl.framework/Versions/A/Resources

wrapper/macos/Frameworks/Growl.framework/Versions/A/Resources/Info.plist

wrapper/macos/Frameworks/Growl.framework/Versions/Current

wrapper/macos/Frameworks/Sparkle.framework

wrapper/macos/Frameworks/Sparkle.framework/Headers

wrapper/macos/Frameworks/Sparkle.framework/Resources

wrapper/macos/Frameworks/Sparkle.framework/Sparkle

wrapper/macos/Frameworks/Sparkle.framework/Versions

wrapper/macos/Frameworks/Sparkle.framework/Versions/A

wrapper/macos/Frameworks/Sparkle.framework/Versions/A/Headers

wrapper/macos/Frameworks/Sparkle.framework/Versions/A/Headers/SUAppcast.h

wrapper/macos/Frameworks/Sparkle.framework/Versions/A/Headers/SUAppcastItem.h

wrapper/macos/Frameworks/Sparkle.framework/Versions/A/Headers/SUUpdater.h

wrapper/macos/Frameworks/Sparkle.framework/Versions/A/Headers/SUVersionComparisonProtocol.h

wrapper/macos/Frameworks/Sparkle.framework/Versions/A/Headers/Sparkle.h

wrapper/macos/Frameworks/Sparkle.framework/Versions/A/Resources

wrapper/macos/Frameworks/Sparkle.framework/Versions/A/Resources/Info.plist

wrapper/macos/Frameworks/Sparkle.framework/Versions/A/Resources/License.txt

wrapper/macos/Frameworks/Sparkle.framework/Versions/A/Resources/SUModelTranslation.plist

wrapper/macos/Frameworks/Sparkle.framework/Versions/A/Resources/SUStatus.nib

wrapper/macos/Frameworks/Sparkle.framework/Versions/A/Resources/en.lproj

wrapper/macos/Frameworks/Sparkle.framework/Versions/A/Resources/en.lproj/SUAutomaticUpdateAlert.nib

wrapper/macos/Frameworks/Sparkle.framework/Versions/A/Resources/en.lproj/SUUpdateAlert.nib

wrapper/macos/Frameworks/Sparkle.framework/Versions/A/Resources/en.lproj/SUUpdatePermissionPrompt.nib

wrapper/macos/Frameworks/Sparkle.framework/Versions/A/Resources/en.lproj/Sparkle.strings

wrapper/macos/Frameworks/Sparkle.framework/Versions/A/Resources/ja.lproj

wrapper/macos/Frameworks/Sparkle.framework/Versions/A/Resources/ja.lproj/SUAutomaticUpdateAlert.nib

wrapper/macos/Frameworks/Sparkle.framework/Versions/A/Resources/ja.lproj/SUUpdateAlert.nib

wrapper/macos/Frameworks/Sparkle.framework/Versions/A/Resources/ja.lproj/SUUpdatePermissionPrompt.nib

wrapper/macos/Frameworks/Sparkle.framework/Versions/A/Resources/ja.lproj/Sparkle.strings

wrapper/macos/Frameworks/Sparkle.framework/Versions/A/Resources/relaunch

wrapper/macos/Frameworks/Sparkle.framework/Versions/A/Resources/zh_CN.lproj

wrapper/macos/Frameworks/Sparkle.framework/Versions/A/Resources/zh_CN.lproj/SUAutomaticUpdateAlert.nib

wrapper/macos/Frameworks/Sparkle.framework/Versions/A/Resources/zh_CN.lproj/SUUpdateAlert.nib

wrapper/macos/Frameworks/Sparkle.framework/Versions/A/Resources/zh_CN.lproj/SUUpdatePermissionPrompt.nib

wrapper/macos/Frameworks/Sparkle.framework/Versions/A/Resources/zh_CN.lproj/Sparkle.strings

wrapper/macos/Frameworks/Sparkle.framework/Versions/A/Resources/zh_TW.lproj

wrapper/macos/Frameworks/Sparkle.framework/Versions/A/Resources/zh_TW.lproj/SUAutomaticUpdateAlert.nib

wrapper/macos/Frameworks/Sparkle.framework/Versions/A/Resources/zh_TW.lproj/SUUpdateAlert.nib

wrapper/macos/Frameworks/Sparkle.framework/Versions/A/Resources/zh_TW.lproj/SUUpdatePermissionPrompt.nib

wrapper/macos/Frameworks/Sparkle.framework/Versions/A/Resources/zh_TW.lproj/Sparkle.strings

wrapper/macos/Frameworks/Sparkle.framework/Versions/A/Sparkle

wrapper/macos/Frameworks/Sparkle.framework/Versions/Current

wrapper/macos/Info.plist

wrapper/macos/Makefile

wrapper/macos/SunPinyin.icns

wrapper/macos/SunPinyin.xcodeproj

wrapper/macos/SunPinyin.xcodeproj/project.pbxproj

wrapper/macos/SunPinyinApplicationDelegate.h

wrapper/macos/SunPinyinApplicationDelegate.mm

wrapper/macos/SunPinyinInputController.h

wrapper/macos/SunPinyinInputController.mm

wrapper/macos/SunPinyin_Prefix.pch

wrapper/macos/imi_imkitwin.h

wrapper/macos/imi_imkitwin.mm

wrapper/macos/imi_session_wrapper.h

wrapper/macos/imi_session_wrapper.mm

wrapper/macos/macos_keycode.h

wrapper/macos/macos_keycode.mm

wrapper/macos/main.m

wrapper/macos/packaging

wrapper/macos/packaging/README

wrapper/macos/packaging/SunPinyin

wrapper/macos/packaging/SunPinyin/DownloadDataFiles

wrapper/macos/packaging/SunPinyin/DownloadDataFiles/DownloadDataFiles.xcodeproj

wrapper/macos/packaging/SunPinyin/DownloadDataFiles/DownloadDataFiles.xcodeproj/project.pbxproj

wrapper/macos/packaging/SunPinyin/DownloadDataFiles/DownloadDataFilesPane.h

wrapper/macos/packaging/SunPinyin/DownloadDataFiles/DownloadDataFilesPane.m

wrapper/macos/packaging/SunPinyin/DownloadDataFiles/DownloadDataFiles_Prefix.pch

wrapper/macos/packaging/SunPinyin/DownloadDataFiles/English.lproj

wrapper/macos/packaging/SunPinyin/DownloadDataFiles/English.lproj/DownloadDataFiles.xib

wrapper/macos/packaging/SunPinyin/DownloadDataFiles/English.lproj/InfoPlist.strings

wrapper/macos/packaging/SunPinyin/DownloadDataFiles/English.lproj/Localizable.strings

wrapper/macos/packaging/SunPinyin/DownloadDataFiles/Info.plist

wrapper/macos/packaging/SunPinyin/DownloadDataFiles/InstallerSections.plist

wrapper/macos/packaging/SunPinyin/DownloadDataFiles/version.plist

wrapper/macos/packaging/SunPinyin/DownloadDataFiles/zh_CN.lproj

wrapper/macos/packaging/SunPinyin/DownloadDataFiles/zh_CN.lproj/InfoPlist.strings

wrapper/macos/packaging/SunPinyin/DownloadDataFiles/zh_CN.lproj/Localizable.strings

wrapper/macos/packaging/SunPinyin/SunPinyin.packproj

wrapper/macos/packaging/SunPinyin/background.tiff

wrapper/macos/packaging/SunPinyin/license.rtf

wrapper/macos/packaging/SunPinyin/welcome.en.rtf

wrapper/macos/packaging/SunPinyin/welcome.zh-Hans.rtf

wrapper/macos/packaging/appcast.template.xml

wrapper/macos/packaging/dsa_pub.pem

wrapper/macos/packaging/genplist.py

wrapper/macos/packaging/package.py

wrapper/macos/preferences.plist

wrapper/macos/zh_CN.lproj

wrapper/macos/zh_CN.lproj/Localizable.strings

wrapper/macos/zh_CN.lproj/MainMenu.strings

wrapper/scim

wrapper/scim/COPYING

wrapper/scim/LGPL.LICENSE

wrapper/scim/OPENSOLARIS.LICENSE

wrapper/scim/README

wrapper/scim/SConstruct

wrapper/scim/data

wrapper/scim/data/sunpinyin_logo.png

wrapper/scim/src

wrapper/scim/src/imi_scimwin.cpp

wrapper/scim/src/imi_scimwin.h

wrapper/scim/src/sunpinyin_imengine.cpp

wrapper/scim/src/sunpinyin_imengine.h

wrapper/scim/src/sunpinyin_imengine_config_keys.h

wrapper/scim/src/sunpinyin_imengine_setup.cpp

wrapper/scim/src/sunpinyin_keycode.h

wrapper/scim/src/sunpinyin_lookup_table.cpp

wrapper/scim/src/sunpinyin_lookup_table.h

wrapper/scim/src/sunpinyin_private.h

wrapper/scim/src/sunpinyin_utils.cpp

wrapper/scim/src/sunpinyin_utils.h

wrapper/xim

wrapper/xim/COPYING

wrapper/xim/IMdkit

wrapper/xim/IMdkit/FrameMgr.c

wrapper/xim/IMdkit/FrameMgr.h

wrapper/xim/IMdkit/IMConn.c

wrapper/xim/IMdkit/IMMethod.c

wrapper/xim/IMdkit/IMValues.c

wrapper/xim/IMdkit/IMdkit.h

wrapper/xim/IMdkit/Xi18n.h

wrapper/xim/IMdkit/Xi18nX.h

wrapper/xim/IMdkit/XimFunc.h

wrapper/xim/IMdkit/XimProto.h

wrapper/xim/IMdkit/i18nAttr.c

wrapper/xim/IMdkit/i18nClbk.c

wrapper/xim/IMdkit/i18nIMProto.c

wrapper/xim/IMdkit/i18nIc.c

wrapper/xim/IMdkit/i18nMethod.c

wrapper/xim/IMdkit/i18nPtHdr.c

wrapper/xim/IMdkit/i18nUtil.c

wrapper/xim/IMdkit/i18nX.c

wrapper/xim/LGPL.LICENSE

wrapper/xim/OPENSOLARIS.LICENSE

wrapper/xim/README

wrapper/xim/SConstruct

wrapper/xim/common.h

wrapper/xim/data

wrapper/xim/data/chnpunc.png

wrapper/xim/data/eng.png

wrapper/xim/data/eng.svg

wrapper/xim/data/engpunc.png

wrapper/xim/data/full.png

wrapper/xim/data/half.png

wrapper/xim/data/han.png

wrapper/xim/data/han.svg

wrapper/xim/data/settings_ui.xml

wrapper/xim/data/skins

wrapper/xim/data/skins/modern

wrapper/xim/data/skins/modern/eng-hover.png

wrapper/xim/data/skins/modern/eng-press.png

wrapper/xim/data/skins/modern/eng-punc-hover.png

wrapper/xim/data/skins/modern/eng-punc-press.png

wrapper/xim/data/skins/modern/eng-punc.png

wrapper/xim/data/skins/modern/eng.png

wrapper/xim/data/skins/modern/full-hover.png

wrapper/xim/data/skins/modern/full-press.png

wrapper/xim/data/skins/modern/full.png

wrapper/xim/data/skins/modern/half-hover.png

wrapper/xim/data/skins/modern/half-press.png

wrapper/xim/data/skins/modern/half.png

wrapper/xim/data/skins/modern/han-hover.png

wrapper/xim/data/skins/modern/han-press.png

wrapper/xim/data/skins/modern/han-punc-hover.png

wrapper/xim/data/skins/modern/han-punc-press.png

wrapper/xim/data/skins/modern/han-punc.png

wrapper/xim/data/skins/modern/han.png

wrapper/xim/data/skins/modern/icbar.png

wrapper/xim/data/skins/modern/info

wrapper/xim/data/skins/modern/preedit.png

wrapper/xim/data/sunpinyin-logo-big.png

wrapper/xim/data/sunpinyin-logo.png

wrapper/xim/data/xim_config_default

wrapper/xim/debian

wrapper/xim/debian/changelog

wrapper/xim/debian/control.in

wrapper/xim/debian/rules

wrapper/xim/debian/xsunpinyin.install

wrapper/xim/debian/xsunpinyin.postinst

wrapper/xim/debian/xsunpinyin.prerm

wrapper/xim/ic.c

wrapper/xim/ic.h

wrapper/xim/ic_gtk.c

wrapper/xim/ic_skin.c

wrapper/xim/im-switch

wrapper/xim/im-switch/xsunpinyin

wrapper/xim/main.c

wrapper/xim/preferences.c

wrapper/xim/settings.c

wrapper/xim/settings.h

wrapper/xim/skin.c

wrapper/xim/skin.h

wrapper/xim/sunpinyin_preedit.cc

wrapper/xim/sunpinyin_preedit_gtk.cc

wrapper/xim/sunpinyin_preedit_skin.cc

wrapper/xim/sunpinyin_preedit_ui.h

wrapper/xim/ui.c

wrapper/xim/ui.h

wrapper/xim/xim.c

wrapper/xim/xim.h

wrapper/xim/xim_trigger.c

wrapper/xim/xmisc.c

wrapper/xim/xmisc.h

files removed:
.pc/append-os-environ-toenv.patch

.pc/append-os-environ-toenv.patch/SConstruct

.pc/fix-ftbfs-on-mipsel.patch

.pc/fix-ftbfs-on-mipsel.patch/SConstruct

.pc/fix-ftbfs-on-sh.patch

.pc/fix-ftbfs-on-sh.patch/SConstruct

.pc/fix-ldflags-handling.patch

.pc/fix-ldflags-handling.patch/SConstruct

.pc/remove-10-candidate-words-limitation.patch

.pc/remove-10-candidate-words-limitation.patch/src

.pc/remove-10-candidate-words-limitation.patch/src/ime-core

.pc/remove-10-candidate-words-limitation.patch/src/ime-core/imi_view.h

debian/patches/append-os-environ-toenv.patch

debian/patches/fix-ftbfs-on-sh.patch

debian/patches/fix-ldflags-handling.patch

debian/patches/remove-10-candidate-words-limitation.patch

files modified:
.pc/applied-patches

.pc/disable-lm-dict-compile.patch/SConstruct

SConstruct

build/Makefile

debian/changelog

debian/compat

debian/control

debian/libsunpinyin-dev.install

debian/libsunpinyin3.install

debian/patches/disable-lm-dict-compile.patch

debian/patches/series

debian/rules

debian/sunpinyin-utils.install

python/mmseg.py

python/utils.py

src/ime-core/ic_history.cpp

src/ime-core/ic_history.h

src/ime-core/imi_context.cpp

src/ime-core/imi_context.h

src/ime-core/imi_data.cpp

src/ime-core/imi_data.h

src/ime-core/imi_defines.h

src/ime-core/imi_funcobjs.cpp

src/ime-core/imi_funcobjs.h

src/ime-core/imi_keys.h

src/ime-core/imi_option_event.cpp

src/ime-core/imi_option_event.h

src/ime-core/imi_options.cpp

src/ime-core/imi_options.h

src/ime-core/imi_uiobjects.cpp

src/ime-core/imi_uiobjects.h

src/ime-core/imi_view.cpp

src/ime-core/imi_view.h

src/ime-core/imi_view_classic.cpp

src/ime-core/imi_view_classic.h

src/ime-core/imi_winHandler.cpp

src/ime-core/imi_winHandler.h

src/ime-core/lattice_states.cpp

src/ime-core/lattice_states.h

src/ime-core/userdict.cpp

src/ime-core/userdict.h

src/ime-core/utils.h

src/lexicon/genPYT.cpp

src/lexicon/pytrie.cpp

src/lexicon/pytrie.h

src/lexicon/pytrie_gen.cpp

src/lexicon/pytrie_gen.h

src/lexicon/trie_writer.cpp

src/lexicon/trie_writer.h

src/pinyin/datrie.h

src/pinyin/datrie_impl.h

src/pinyin/hunpin_seg.cpp

src/pinyin/hunpin_seg.h

src/pinyin/pinyin_data.cpp

src/pinyin/pinyin_data.h

src/pinyin/pinyin_seg.cpp

src/pinyin/pinyin_seg.h

src/pinyin/quanpin_trie.h

src/pinyin/segmentor.h

src/pinyin/shuangpin_data.cpp

src/pinyin/shuangpin_data.h

src/pinyin/shuangpin_seg.cpp

src/pinyin/shuangpin_seg.h

src/pinyin/syllable.h

src/portability.cpp

src/portability.h

src/slm/getWordFreq/getWordFreq.cpp

src/slm/ids2ngram/idngram.h

src/slm/ids2ngram/idngram_merge.cpp

src/slm/ids2ngram/idngram_merge.h

src/slm/ids2ngram/ids2ngram.cpp

src/slm/mmseg/mmseg.cpp

src/slm/sim_dict.cpp

src/slm/sim_dict.h

src/slm/sim_fmerge.h

src/slm/sim_sen.cpp

src/slm/sim_sen.h

src/slm/sim_slm.cpp

src/slm/sim_slm.h

src/slm/sim_slmbuilder.cpp

src/slm/sim_slmbuilder.h

src/slm/slm.cpp

src/slm/slm.h

src/slm/slmbuild/slmbuild.cpp

src/slm/slminfo/slminfo.cpp

src/slm/slmprune/slmprune.cpp

src/slm/slmseg/slmseg.cpp

src/slm/thread/ValueCompress.cpp

src/slm/thread/ValueCompress.h

src/slm/thread/slmthread.cpp

src/slm/thread/test_vc.cpp

src/slm/tools/clean_rmrb.cpp

src/slm/tools/dumpdict.cpp

src/slm/tslmendian/slm_endian.cpp

src/slm/tslmendian/slm_file.cpp

src/slm/tslmendian/slm_file.h

src/slm/tslmendian/writer.cpp

src/slm/tslmendian/writer.h

src/slm/tslminfo/tslminfo.cpp

src/slm/tslmpack/arpa_conv.cpp

src/slm/tslmpack/arpa_conv.h

src/slm/tslmpack/arpa_slm.cpp

src/slm/tslmpack/arpa_slm.h

src/slm/tslmpack/common.h

src/slm/tslmpack/slmpack.cpp

Show diffs side-by-side

added added

removed removed

src/slm/tslmpack/slmpack.cpp

* Distribution License ("CDDL")(collectively, the "License"). You may not use this

* file except in compliance with the License. You can obtain a copy of the CDDL at

* http://www.opensource.org/licenses/cddl1.php and a copy of the LGPLv2.1 at

* http://www.opensource.org/licenses/lgpl-license.php. See the License for the

* specific language governing permissions and limitations under the License. When

* distributing the software, include this License Header Notice in each file and

* include the full text of the License in the License file as well as the

* following notice:

* NOTICE PURSUANT TO SECTION 9 OF THE COMMON DEVELOPMENT AND DISTRIBUTION LICENSE

* (CDDL)

* For Covered Software in this distribution, this License shall be governed by the

* Any litigation relating to this License shall be subject to the jurisdiction of

* the Federal Courts of the Northern District of California and the state courts

* of the State of California, with venue lying in Santa Clara County, California.

* Contributor(s):

* If you wish your version of this file to be governed by only the CDDL or only

* the LGPL Version 2.1, indicate your decision by adding "[Contributor]" elects to

* include this software in this distribution under the [CDDL or LGPL Version 2.1]

* Version 2.1, or to extend the choice of license to its licensees as provided

* above. However, if you add LGPL Version 2.1 code and therefore, elected the LGPL

* Version 2 license, then the option applies only if the new code is made subject

* to such option by the copyright holder.

#include "arpa_conv.h"

void ShowUsage(const char* progname)

void

ShowUsage(const char* progname)

{

printf("Usage:\n");

printf(" %s arpa_slm dict_file threaded_slm\n", progname);

printf("\n");

printf("Description:\n");

printf(" %s converts the ARPA representation of SLM to the binary format of threaded SLM. \n", progname);

printf(

" %s converts the ARPA representation of SLM to the binary format of threaded SLM. \n",

progname);

exit(100);

}

* bow_eff, bow_values [out]

void build_map(const CArpaSlm& slm, EffRealMap &pr_eff, FreqMap& pr_values, EffRealMap &bow_eff, FreqMap& bow_values)

void

build_map(const CArpaSlm& slm,

EffRealMap &pr_eff,

FreqMap& pr_values,

EffRealMap &bow_eff,

FreqMap& bow_values)

{

bool usingLogPr = slm.usingLogPr();

printf("\nfirst pass..."); fflush(stdout);

for (unsigned lvl=0; lvl < slm.getN(); ++lvl) {

for (unsigned lvl = 0; lvl < slm.getN(); ++lvl) {

typedef CArpaSlm::TNodeLevel TNodeLevel;

const TNodeLevel& level = slm.getLevel(lvl);

for (TNodeLevel::const_iterator node = level.begin(); node != level.end(); ++node) {

for (TNodeLevel::const_iterator node = level.begin();

node != level.end();

100

++node) {

101

float real_pr, eff_pr;

102

real_pr = node->pr;

103

eff_pr = EffectivePr(real_pr);

111

121

}

112

122

typedef CArpaSlm::TLeafLevel TLeafLevel;

113

123

const TLeafLevel& level = slm.getLastLevel();

114

for (TLeafLevel::const_iterator leaf = level.begin(); leaf != level.end(); ++leaf) {

124

for (TLeafLevel::const_iterator leaf = level.begin();

125

leaf != level.end();

126

++leaf) {

115

127

float real_pr, eff_pr;

116

128

real_pr = leaf->pr;

117

129

eff_pr = EffectivePr(real_pr);

125

137

// Following pr value should not be grouped, or as milestone values.

126

138

static const float msprs[] = {

127

139

0.9, 0.8, 0.7, 0.6,

128

1.0/2, 1.0/4, 1.0/8, 1.0/16, 1.0/32, 1.0/64, 1.0/128,

129

1.0/256, 1.0/512, 1.0/1024, 1.0/2048, 1.0/4096, 1.0/8192,

130

1.0/16384, 1.0/32768, 1.0/65536

140

1.0 / 2, 1.0 / 4, 1.0 / 8, 1.0 / 16, 1.0 / 32, 1.0 / 64, 1.0 / 128,

141

1.0 / 256, 1.0 / 512, 1.0 / 1024, 1.0 / 2048, 1.0 / 4096, 1.0 / 8192,

142

1.0 / 16384, 1.0 / 32768, 1.0 / 65536

131

143

};

132

144

133

for (unsigned i=0, sz=sizeof(msprs)/sizeof(float); i < sz; ++i) {

134

float real_pr = (usingLogPr)?(-log(msprs[i])):(msprs[i]);

145

for (unsigned i = 0, sz = sizeof(msprs) / sizeof(float); i < sz; ++i) {

146

float real_pr = (usingLogPr) ? (-log(msprs[i])) : (msprs[i]);

135

147

float eff_pr = EffectivePr(real_pr);

136

148

assert(usingLogPr || (real_pr > 0.0 && real_pr < 1.0));

137

149

assert(!usingLogPr || real_pr > 0.0);

151

163

0.00005, 0.00001, 0.000005, 0.000001, 0.0000005, 0.0000001

152

164

};

153

165

154

for (unsigned i=0; i < sizeof(msbows)/sizeof(msbows[0]); ++i) {

155

float real_bow = (usingLogPr)?(-log(msbows[i])):(msbows[i]);

166

for (unsigned i = 0; i < sizeof(msbows) / sizeof(msbows[0]); ++i) {

167

float real_bow = (usingLogPr) ? (-log(msbows[i])) : (msbows[i]);

156

168

float eff_bow = EffectiveBow(real_bow);

157

169

if (bow_eff.find(eff_bow) == bow_eff.end()) {

158

170

bow_eff[eff_bow] = real_bow;

163

175

}

164

176

}

165

177

166

/**

178

/**

167

179

* group vaules into a smaller set of their approximations

168

180

169

181

* bow_eff [in], bow_values [in], bow_map [out], bow_table [out]

170

182

* pr_eff [in], pr_values [in], pr_map [out], pr_table [out]

171

183

172

173

void group_values(bool usingLogPr,

174

EffRealMap& pr_eff, FreqMap& pr_values, CompressedTable& pr_table, RealIndexMap& pr_map,

175

EffRealMap& bow_eff, FreqMap& bow_values, CompressedTable& bow_table, RealIndexMap& bow_map)

184

185

void

186

group_values(bool usingLogPr,

187

EffRealMap& pr_eff,

188

FreqMap& pr_values,

189

CompressedTable& pr_table,

190

RealIndexMap& pr_map,

191

EffRealMap& bow_eff,

192

FreqMap& bow_values,

193

CompressedTable& bow_table,

194

RealIndexMap& bow_map)

176

195

{

177

196

printf("\nCompressing pr values..."); fflush(stdout);

178

197

CValueCompressor vc;

194

213

printf("%lu float values ==> %lu values", bow_eff.size(), bow_table.size());

195

214

}

196

215

197

TLexicon read_lexicon(const char* filename)

216

TLexicon

217

read_lexicon(const char* filename)

198

218

{

199

219

printf("Loading lexicon..."); fflush(stdout);

200

static char word[1024*10];

220

static char word[1024 * 10];

201

221

FILE* f_lex = fopen(filename, "r");

202

222

TLexicon lexicon;

203

223

while (fgets(word, sizeof(word), f_lex)) {

214

234

while (*p == ' ' || *p == '\t')

215

235

++p;

216

236

if (!(*p >= '0' && *p <= '9')) continue;

217

237

218

238

int id;

219

for (id=0; *p >= '0' && *p <= '9'; ++p)

220

id = 10*id + (*p - '0');

239

for (id = 0; *p >= '0' && *p <= '9'; ++p)

240

id = 10 * id + (*p - '0');

221

241

lexicon[std::string(word)] = id;

222

242

}

223

243

}

229

249

230

250

231

251

232

252

233

253

// filename [in]

234

254

// pr_table [in]

235

255

// bow_table [in]

237

257

// ...

238

258

// levels[N] [in]

239

259

// lastLevel [in]

240

241

void write_out(const char* filename, const CArpaSlm& slm,

242

CompressedTable& pr_table, CompressedTable& bow_table,

243

const TNodeLevels& levels, const CThreadSlm::TLeaf* lastLevel)

260

261

void

262

write_out(const char* filename, const CArpaSlm& slm,

263

CompressedTable& pr_table, CompressedTable& bow_table,

264

const TNodeLevels& levels, const CThreadSlm::TLeaf* lastLevel)

244

265

{

245

266

printf("\nWriting out..."); fflush(stdout);

246

267

247

268

FILE* fp = fopen(filename, "wb");

248

269

const int N = slm.getN();

249

270

fwrite(&N, sizeof(int), 1, fp);

250

271

const unsigned usingLogPr = slm.usingLogPr();

251

272

fwrite(&usingLogPr, sizeof(unsigned), 1, fp);

252

273

253

274

for (int lvl = 0; lvl <= N; ++lvl) {

254

unsigned len = slm.getLevelSize(lvl)+1;

275

unsigned len = slm.getLevelSize(lvl) + 1;

255

276

fwrite(&len, sizeof(unsigned), 1, fp);

256

277

}

257

258

for (int i = 0, sz = pr_table.size(); i < (1 << CThreadSlm::BITS_PR); ++i) {

278

279

for (int i = 0, sz = pr_table.size(); i < (1 << CThreadSlm::BITS_PR);

280

++i) {

259

281

if (i < sz) {

260

282

fwrite(&pr_table[i], sizeof(float), 1, fp);

261

283

} else {

263

285

fwrite(&dummy, sizeof(float), 1, fp);

264

286

}

265

287

}

266

267

for (int i = 0, sz = bow_table.size(); i < (1 << CThreadSlm::BITS_BOW); ++i) {

288

289

for (int i = 0, sz = bow_table.size(); i < (1 << CThreadSlm::BITS_BOW);

290

++i) {

268

291

if (i < sz) {

269

292

fwrite(&bow_table[i], sizeof(float), 1, fp);

270

293

} else {

272

295

fwrite(&dummy, sizeof(float), 1, fp);

273

296

}

274

297

}

275

276

for (int lvl=0; lvl < N; ++lvl) {

277

fwrite(levels[lvl], sizeof(CThreadSlm::TNode), slm.getLevelSize(lvl)+1, fp);

298

299

for (int lvl = 0; lvl < N; ++lvl) {

300

fwrite(levels[lvl], sizeof(CThreadSlm::TNode), slm.getLevelSize(

301

lvl) + 1, fp);

278

302

}

279

280

fwrite(lastLevel, sizeof(CThreadSlm::TLeaf), slm.getLevelSize(N)+1, fp);

281

303

304

fwrite(lastLevel, sizeof(CThreadSlm::TLeaf), slm.getLevelSize(N) + 1, fp);

305

282

306

fclose(fp);

283

307

284

308

printf("done!\n"); fflush(stdout);

285

309

}

286

310

287

311

288

void cleanup(CompressedTable& pr_table, CompressedTable& bow_table,

289

TNodeLevels& levels, CThreadSlm::TLeaf* lastLevel)

312

void

313

cleanup(CompressedTable& pr_table, CompressedTable& bow_table,

314

TNodeLevels& levels, CThreadSlm::TLeaf* lastLevel)

290

315

{

291

for (unsigned lvl=0; lvl < levels.size(); ++lvl)

316

for (unsigned lvl = 0; lvl < levels.size(); ++lvl)

292

317

delete[] levels[lvl];

293

318

delete[] lastLevel;

294

319

bow_table.clear();

295

320

pr_table.clear();

296

321

}

297

322

298

int main(int argc, char* argv[])

323

int

324

main(int argc, char* argv[])

299

325

{

300

301

326

if (argc != 4)

302

327

ShowUsage(argv[0]);

303

328

const char* arpa_path = argv[1];

304

329

const char* lexicon_path = argv[2];

305

330

const char* threaded_path = argv[3];

306

331

307

332

CArpaSlm slm;

308

333

TLexicon lexicon = read_lexicon(lexicon_path);

309

334

slm.load(arpa_path, lexicon);

310

335

311

336

if (!slm.good()) {

312

std::cerr << "Failed to load language model from " << arpa_path << "." << std::endl;

337

std::cerr << "Failed to load language model from " << arpa_path <<

338

"." << std::endl;

313

339

exit(1);

314

340

}

315

341

slm.threading();

316

317

EffRealMap pr_eff, bow_eff; // effval --> val

342

343

EffRealMap pr_eff, bow_eff; // effval --> val

318

344

FreqMap pr_values, bow_values; // effval --> freq

319

345

build_map(slm, pr_eff, pr_values, bow_eff, bow_values);

320

321

RealIndexMap pr_map, bow_map; // result: val --> int

322

CompressedTable pr_table, bow_table; // result: val vector

346

347

RealIndexMap pr_map, bow_map; // result: val --> int

348

CompressedTable pr_table, bow_table; // result: val vector

323

349

group_values(slm.usingLogPr(),

324

350

pr_eff, pr_values, pr_table, pr_map,

325

351

bow_eff, bow_values, bow_table, bow_map);

330

356

CThreadSlm::TLeaf* lastLevel;

331

357

compress(slm, pr_table, pr_map, bow_table, bow_map,

332

358

levels, lastLevel);

333

359

334

360

pr_map.clear();

335

361

bow_map.clear();

336

362

write_out(threaded_path, slm, pr_table, bow_table, levels, lastLevel);

337

363

338

364

cleanup(pr_table, bow_table, levels, lastLevel);

339

365

return 0;

340

366

}

Older »