~ubuntu-branches/ubuntu/lucid/sword/lucid

« back to all changes in this revision

Viewing changes to src/modules/filters/utf8nfkd.cpp

  • Committer: Bazaar Package Importer
  • Author(s): Jonathan Marsden, Jonathan Marsden, Dmitrijs Ledkovs, Closed Bugs
  • Date: 2009-05-30 11:55:55 UTC
  • mfrom: (1.1.3 upstream) (5.1.2 squeeze)
  • Revision ID: james.westby@ubuntu.com-20090530115555-1tdz23ekn0pk1va1
Tags: 1.6.0+dfsg-1
[ Jonathan Marsden ]
* New upstream release. (Closes: #507960) (LP: #320558)
* debian/patches/02_libver.diff:
  - Bump SONAME to 8 -- SWORD 1.6 is not backward compatible with 1.5.11.
* debian/patches/series:
  - Remove 10_diatheke.diff -- included in upstream source.
* debian/patches/:
  - Remove several old unused .diff files.
  - Add 11_regex_only_when_needed.diff to conditionally include regex lib.
  - Add 12_fix_compiler_warnings.diff to remove all compiler warnings.
  - Add 13_fix_osis2mod_compression_default.diff from upstream svn.
  - Add 14_closing_section_not_chapter.diff from upstream svn.
* debian/libsword7.*: 
  - Rename to libsword8.*
  - Change libsword7 to libsword8 within files.
* debian/rules: 
  - SONAME bump to 8.
  - Set library version check to >= 1.6
* debian/control:
  - Change libsword7 to libsword8.
  - Add libsword7 to Conflicts.
  - Fix case of sword to SWORD in package descriptions.
  - Bump Standards-Version to 3.8.1 (no changes needed).
  - Fix section for libsword-dbg to avoid lintian warning.
* debian/rules:
  - Add DFSG get-orig-source target.
* debian/copyright:
  - Fix various mistakes in initial attempt to document copyrights.

[ Dmitrijs Ledkovs ]
* debian/rules: Added utils.mk to use missing-files target and call it on
  each build.
* debian/libsword-dev.install: Added libsword.la, previously missing.
* debian/libsword7.install: Added missing libicu translit files.
* debian/control:
  - Updated all uses of SWORD version to 1.6
  - Added libsword-dbg package
* debian/watch: Fixed a small mistake which was resulting in extra "."
  in final version name.
* debian/rules: simplified manpage processing.
* debian/libsword8.lintian-overrides: added override for module
  installation directory.
* debian/copyright: Updated with information about everyfile.
  Closes: #513448 LP: #322638
* debian/diatheke.examples: moved examples here from the diatheke.install
* debian/rules:
  - enabled shell script based testsuite
  - added commented out cppunit testsuite
* debian/patches/40_missing_includes.diff: 
  - added several missing stdio.h includes to prevent FTBFS of testsuite.

[ Closed Bugs ]
* FTBFS on intrepid (LP: #305172)

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
/******************************************************************************
 
2
 *
 
3
 * utf8nfkd - SWFilter descendant to perform NFKD (compatability decomposition
 
4
 *                   normalization) on UTF-8 text
 
5
 *
 
6
 *
 
7
 * Copyright 2009 CrossWire Bible Society (http://www.crosswire.org)
 
8
 *      CrossWire Bible Society
 
9
 *      P. O. Box 2528
 
10
 *      Tempe, AZ  85280-2528
 
11
 *
 
12
 * This program is free software; you can redistribute it and/or modify it
 
13
 * under the terms of the GNU General Public License as published by the
 
14
 * Free Software Foundation version 2.
 
15
 *
 
16
 * This program is distributed in the hope that it will be useful, but
 
17
 * WITHOUT ANY WARRANTY; without even the implied warranty of
 
18
 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
 
19
 * General Public License for more details.
 
20
 *
 
21
 */
 
22
 
 
23
#ifdef _ICU_
 
24
 
 
25
#include <stdlib.h>
 
26
 
 
27
#include <utilstr.h>
 
28
 
 
29
#include <utf8nfkd.h>
 
30
#include <swbuf.h>
 
31
 
 
32
SWORD_NAMESPACE_START
 
33
 
 
34
UTF8NFKD::UTF8NFKD() {
 
35
        conv = ucnv_open("UTF-8", &err);
 
36
}
 
37
 
 
38
UTF8NFKD::~UTF8NFKD() {
 
39
         ucnv_close(conv);
 
40
}
 
41
 
 
42
char UTF8NFKD::processText(SWBuf &text, const SWKey *key, const SWModule *module)
 
43
{
 
44
        if ((unsigned long)key < 2)     // hack, we're en(1)/de(0)ciphering
 
45
                return -1;
 
46
        
 
47
        int32_t len =  5 + text.length() * 5;
 
48
        source = new UChar[len + 1]; //each char could become a surrogate pair
 
49
 
 
50
        // Convert UTF-8 string to UTF-16 (UChars)
 
51
        int32_t ulen = ucnv_toUChars(conv, source, len, text.c_str(), -1, &err);
 
52
        target = new UChar[len + 1];
 
53
 
 
54
        //compatability decomposition
 
55
        ulen = unorm_normalize(source, ulen, UNORM_NFKD, 0, target, len, &err);
 
56
 
 
57
           text.setSize(len);
 
58
           len = ucnv_fromUChars(conv, text.getRawData(), len, target, ulen, &err);
 
59
           text.setSize(len);
 
60
 
 
61
           delete [] source;
 
62
           delete [] target;
 
63
 
 
64
        return 0;
 
65
}
 
66
 
 
67
SWORD_NAMESPACE_END
 
68
#endif