~showard314/ubuntu/karmic/r-base/remove_start_comments

« back to all changes in this revision

Viewing changes to src/extra/pcre/pcre_tables.c

  • Committer: Bazaar Package Importer
  • Author(s): Dirk Eddelbuettel
  • Date: 2009-01-19 12:40:24 UTC
  • mfrom: (5.1.4 sid)
  • Revision ID: james.westby@ubuntu.com-20090119124024-abxsf4e0y7713w9m
Tags: 2.8.1-2
debian/control: Add another Build-Depends: exclusion for the 
'kfreebsd-i386 kfreebsd-amd64 hurd-i386' architecture to openjdk-6-jdk.
Thanks to Petr Salinger for the heads-up.               (Closes: 512324)

Show diffs side-by-side

added added

removed removed

Lines of Context:
6
6
and semantics are as close as possible to those of the Perl 5 language.
7
7
 
8
8
                       Written by Philip Hazel
9
 
           Copyright (c) 1997-2007 University of Cambridge
 
9
           Copyright (c) 1997-2008 University of Cambridge
10
10
 
11
11
-----------------------------------------------------------------------------
12
12
Redistribution and use in source and binary forms, with or without
87
87
  2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,
88
88
  3,3,3,3,3,3,3,3,4,4,4,4,5,5,5,5 };
89
89
 
 
90
/* Table to translate from particular type value to the general value. */
 
91
 
 
92
const int _pcre_ucp_gentype[] = {
 
93
  ucp_C, ucp_C, ucp_C, ucp_C, ucp_C,  /* Cc, Cf, Cn, Co, Cs */
 
94
  ucp_L, ucp_L, ucp_L, ucp_L, ucp_L,  /* Ll, Lu, Lm, Lo, Lt */
 
95
  ucp_M, ucp_M, ucp_M,                /* Mc, Me, Mn */
 
96
  ucp_N, ucp_N, ucp_N,                /* Nd, Nl, No */
 
97
  ucp_P, ucp_P, ucp_P, ucp_P, ucp_P,  /* Pc, Pd, Pe, Pf, Pi */
 
98
  ucp_P, ucp_P,                       /* Ps, Po */
 
99
  ucp_S, ucp_S, ucp_S, ucp_S,         /* Sc, Sk, Sm, So */
 
100
  ucp_Z, ucp_Z, ucp_Z                 /* Zl, Zp, Zs */
 
101
};
 
102
 
90
103
/* The pcre_utt[] table below translates Unicode property names into type and
91
104
code values. It is searched by binary chop, so must be in collating sequence of
92
105
name. Originally, the table contained pointers to the name strings in the first
94
107
a shared library is dynamically loaded. A significant reduction is made by
95
108
putting all the names into a single, large string and then using offsets in the
96
109
table itself. Maintenance is more error-prone, but frequent changes to this
97
 
data is unlikely. */
 
110
data are unlikely.
 
111
 
 
112
July 2008: There is now a script called maint/GenerateUtt.py which can be used
 
113
to generate this data instead of maintaining it entirely by hand. */
98
114
 
99
115
const char _pcre_utt_names[] =
100
116
  "Any\0"
108
124
  "Buhid\0"
109
125
  "C\0"
110
126
  "Canadian_Aboriginal\0"
 
127
  "Carian\0"
111
128
  "Cc\0"
112
129
  "Cf\0"
 
130
  "Cham\0"
113
131
  "Cherokee\0"
114
132
  "Cn\0"
115
133
  "Co\0"
136
154
  "Inherited\0"
137
155
  "Kannada\0"
138
156
  "Katakana\0"
 
157
  "Kayah_Li\0"
139
158
  "Kharoshthi\0"
140
159
  "Khmer\0"
141
160
  "L\0"
142
161
  "L&\0"
143
162
  "Lao\0"
144
163
  "Latin\0"
 
164
  "Lepcha\0"
145
165
  "Limbu\0"
146
166
  "Linear_B\0"
147
167
  "Ll\0"
149
169
  "Lo\0"
150
170
  "Lt\0"
151
171
  "Lu\0"
 
172
  "Lycian\0"
 
173
  "Lydian\0"
152
174
  "M\0"
153
175
  "Malayalam\0"
154
176
  "Mc\0"
163
185
  "Nl\0"
164
186
  "No\0"
165
187
  "Ogham\0"
 
188
  "Ol_Chiki\0"
166
189
  "Old_Italic\0"
167
190
  "Old_Persian\0"
168
191
  "Oriya\0"
177
200
  "Pi\0"
178
201
  "Po\0"
179
202
  "Ps\0"
 
203
  "Rejang\0"
180
204
  "Runic\0"
181
205
  "S\0"
 
206
  "Saurashtra\0"
182
207
  "Sc\0"
183
208
  "Shavian\0"
184
209
  "Sinhala\0"
185
210
  "Sk\0"
186
211
  "Sm\0"
187
212
  "So\0"
 
213
  "Sundanese\0"
188
214
  "Syloti_Nagri\0"
189
215
  "Syriac\0"
190
216
  "Tagalog\0"
197
223
  "Tibetan\0"
198
224
  "Tifinagh\0"
199
225
  "Ugaritic\0"
 
226
  "Vai\0"
200
227
  "Yi\0"
201
228
  "Z\0"
202
229
  "Zl\0"
204
231
  "Zs\0";
205
232
 
206
233
const ucp_type_table _pcre_utt[] = {
207
 
  { 0,   PT_ANY, 0 },
208
 
  { 4,   PT_SC, ucp_Arabic },
209
 
  { 11,  PT_SC, ucp_Armenian },
210
 
  { 20,  PT_SC, ucp_Balinese },
211
 
  { 29,  PT_SC, ucp_Bengali },
212
 
  { 37,  PT_SC, ucp_Bopomofo },
213
 
  { 46,  PT_SC, ucp_Braille },
214
 
  { 54,  PT_SC, ucp_Buginese },
215
 
  { 63,  PT_SC, ucp_Buhid },
216
 
  { 69,  PT_GC, ucp_C },
217
 
  { 71,  PT_SC, ucp_Canadian_Aboriginal },
218
 
  { 91,  PT_PC, ucp_Cc },
219
 
  { 94,  PT_PC, ucp_Cf },
220
 
  { 97,  PT_SC, ucp_Cherokee },
221
 
  { 106, PT_PC, ucp_Cn },
222
 
  { 109, PT_PC, ucp_Co },
223
 
  { 112, PT_SC, ucp_Common },
224
 
  { 119, PT_SC, ucp_Coptic },
225
 
  { 126, PT_PC, ucp_Cs },
226
 
  { 129, PT_SC, ucp_Cuneiform },
227
 
  { 139, PT_SC, ucp_Cypriot },
228
 
  { 147, PT_SC, ucp_Cyrillic },
229
 
  { 156, PT_SC, ucp_Deseret },
230
 
  { 164, PT_SC, ucp_Devanagari },
231
 
  { 175, PT_SC, ucp_Ethiopic },
232
 
  { 184, PT_SC, ucp_Georgian },
233
 
  { 193, PT_SC, ucp_Glagolitic },
234
 
  { 204, PT_SC, ucp_Gothic },
235
 
  { 211, PT_SC, ucp_Greek },
236
 
  { 217, PT_SC, ucp_Gujarati },
237
 
  { 226, PT_SC, ucp_Gurmukhi },
238
 
  { 235, PT_SC, ucp_Han },
239
 
  { 239, PT_SC, ucp_Hangul },
240
 
  { 246, PT_SC, ucp_Hanunoo },
241
 
  { 254, PT_SC, ucp_Hebrew },
242
 
  { 261, PT_SC, ucp_Hiragana },
243
 
  { 270, PT_SC, ucp_Inherited },
244
 
  { 280, PT_SC, ucp_Kannada },
245
 
  { 288, PT_SC, ucp_Katakana },
246
 
  { 297, PT_SC, ucp_Kharoshthi },
247
 
  { 308, PT_SC, ucp_Khmer },
248
 
  { 314, PT_GC, ucp_L },
249
 
  { 316, PT_LAMP, 0 },
250
 
  { 319, PT_SC, ucp_Lao },
251
 
  { 323, PT_SC, ucp_Latin },
252
 
  { 329, PT_SC, ucp_Limbu },
253
 
  { 335, PT_SC, ucp_Linear_B },
254
 
  { 344, PT_PC, ucp_Ll },
255
 
  { 347, PT_PC, ucp_Lm },
256
 
  { 350, PT_PC, ucp_Lo },
257
 
  { 353, PT_PC, ucp_Lt },
258
 
  { 356, PT_PC, ucp_Lu },
259
 
  { 359, PT_GC, ucp_M },
260
 
  { 361, PT_SC, ucp_Malayalam },
261
 
  { 371, PT_PC, ucp_Mc },
262
 
  { 374, PT_PC, ucp_Me },
263
 
  { 377, PT_PC, ucp_Mn },
264
 
  { 380, PT_SC, ucp_Mongolian },
265
 
  { 390, PT_SC, ucp_Myanmar },
266
 
  { 398, PT_GC, ucp_N },
267
 
  { 400, PT_PC, ucp_Nd },
268
 
  { 403, PT_SC, ucp_New_Tai_Lue },
269
 
  { 415, PT_SC, ucp_Nko },
270
 
  { 419, PT_PC, ucp_Nl },
271
 
  { 422, PT_PC, ucp_No },
272
 
  { 425, PT_SC, ucp_Ogham },
273
 
  { 431, PT_SC, ucp_Old_Italic },
274
 
  { 442, PT_SC, ucp_Old_Persian },
275
 
  { 454, PT_SC, ucp_Oriya },
276
 
  { 460, PT_SC, ucp_Osmanya },
277
 
  { 468, PT_GC, ucp_P },
278
 
  { 470, PT_PC, ucp_Pc },
279
 
  { 473, PT_PC, ucp_Pd },
280
 
  { 476, PT_PC, ucp_Pe },
281
 
  { 479, PT_PC, ucp_Pf },
282
 
  { 482, PT_SC, ucp_Phags_Pa },
283
 
  { 491, PT_SC, ucp_Phoenician },
284
 
  { 502, PT_PC, ucp_Pi },
285
 
  { 505, PT_PC, ucp_Po },
286
 
  { 508, PT_PC, ucp_Ps },
287
 
  { 511, PT_SC, ucp_Runic },
288
 
  { 517, PT_GC, ucp_S },
289
 
  { 519, PT_PC, ucp_Sc },
290
 
  { 522, PT_SC, ucp_Shavian },
291
 
  { 530, PT_SC, ucp_Sinhala },
292
 
  { 538, PT_PC, ucp_Sk },
293
 
  { 541, PT_PC, ucp_Sm },
294
 
  { 544, PT_PC, ucp_So },
295
 
  { 547, PT_SC, ucp_Syloti_Nagri },
296
 
  { 560, PT_SC, ucp_Syriac },
297
 
  { 567, PT_SC, ucp_Tagalog },
298
 
  { 575, PT_SC, ucp_Tagbanwa },
299
 
  { 584, PT_SC, ucp_Tai_Le },
300
 
  { 591, PT_SC, ucp_Tamil },
301
 
  { 597, PT_SC, ucp_Telugu },
302
 
  { 604, PT_SC, ucp_Thaana },
303
 
  { 611, PT_SC, ucp_Thai },
304
 
  { 616, PT_SC, ucp_Tibetan },
305
 
  { 624, PT_SC, ucp_Tifinagh },
306
 
  { 633, PT_SC, ucp_Ugaritic },
307
 
  { 642, PT_SC, ucp_Yi },
308
 
  { 645, PT_GC, ucp_Z },
309
 
  { 647, PT_PC, ucp_Zl },
310
 
  { 650, PT_PC, ucp_Zp },
311
 
  { 653, PT_PC, ucp_Zs }
 
234
  {   0, PT_ANY, 0 },
 
235
  {   4, PT_SC, ucp_Arabic },
 
236
  {  11, PT_SC, ucp_Armenian },
 
237
  {  20, PT_SC, ucp_Balinese },
 
238
  {  29, PT_SC, ucp_Bengali },
 
239
  {  37, PT_SC, ucp_Bopomofo },
 
240
  {  46, PT_SC, ucp_Braille },
 
241
  {  54, PT_SC, ucp_Buginese },
 
242
  {  63, PT_SC, ucp_Buhid },
 
243
  {  69, PT_GC, ucp_C },
 
244
  {  71, PT_SC, ucp_Canadian_Aboriginal },
 
245
  {  91, PT_SC, ucp_Carian },
 
246
  {  98, PT_PC, ucp_Cc },
 
247
  { 101, PT_PC, ucp_Cf },
 
248
  { 104, PT_SC, ucp_Cham },
 
249
  { 109, PT_SC, ucp_Cherokee },
 
250
  { 118, PT_PC, ucp_Cn },
 
251
  { 121, PT_PC, ucp_Co },
 
252
  { 124, PT_SC, ucp_Common },
 
253
  { 131, PT_SC, ucp_Coptic },
 
254
  { 138, PT_PC, ucp_Cs },
 
255
  { 141, PT_SC, ucp_Cuneiform },
 
256
  { 151, PT_SC, ucp_Cypriot },
 
257
  { 159, PT_SC, ucp_Cyrillic },
 
258
  { 168, PT_SC, ucp_Deseret },
 
259
  { 176, PT_SC, ucp_Devanagari },
 
260
  { 187, PT_SC, ucp_Ethiopic },
 
261
  { 196, PT_SC, ucp_Georgian },
 
262
  { 205, PT_SC, ucp_Glagolitic },
 
263
  { 216, PT_SC, ucp_Gothic },
 
264
  { 223, PT_SC, ucp_Greek },
 
265
  { 229, PT_SC, ucp_Gujarati },
 
266
  { 238, PT_SC, ucp_Gurmukhi },
 
267
  { 247, PT_SC, ucp_Han },
 
268
  { 251, PT_SC, ucp_Hangul },
 
269
  { 258, PT_SC, ucp_Hanunoo },
 
270
  { 266, PT_SC, ucp_Hebrew },
 
271
  { 273, PT_SC, ucp_Hiragana },
 
272
  { 282, PT_SC, ucp_Inherited },
 
273
  { 292, PT_SC, ucp_Kannada },
 
274
  { 300, PT_SC, ucp_Katakana },
 
275
  { 309, PT_SC, ucp_Kayah_Li },
 
276
  { 318, PT_SC, ucp_Kharoshthi },
 
277
  { 329, PT_SC, ucp_Khmer },
 
278
  { 335, PT_GC, ucp_L },
 
279
  { 337, PT_LAMP, 0 },
 
280
  { 340, PT_SC, ucp_Lao },
 
281
  { 344, PT_SC, ucp_Latin },
 
282
  { 350, PT_SC, ucp_Lepcha },
 
283
  { 357, PT_SC, ucp_Limbu },
 
284
  { 363, PT_SC, ucp_Linear_B },
 
285
  { 372, PT_PC, ucp_Ll },
 
286
  { 375, PT_PC, ucp_Lm },
 
287
  { 378, PT_PC, ucp_Lo },
 
288
  { 381, PT_PC, ucp_Lt },
 
289
  { 384, PT_PC, ucp_Lu },
 
290
  { 387, PT_SC, ucp_Lycian },
 
291
  { 394, PT_SC, ucp_Lydian },
 
292
  { 401, PT_GC, ucp_M },
 
293
  { 403, PT_SC, ucp_Malayalam },
 
294
  { 413, PT_PC, ucp_Mc },
 
295
  { 416, PT_PC, ucp_Me },
 
296
  { 419, PT_PC, ucp_Mn },
 
297
  { 422, PT_SC, ucp_Mongolian },
 
298
  { 432, PT_SC, ucp_Myanmar },
 
299
  { 440, PT_GC, ucp_N },
 
300
  { 442, PT_PC, ucp_Nd },
 
301
  { 445, PT_SC, ucp_New_Tai_Lue },
 
302
  { 457, PT_SC, ucp_Nko },
 
303
  { 461, PT_PC, ucp_Nl },
 
304
  { 464, PT_PC, ucp_No },
 
305
  { 467, PT_SC, ucp_Ogham },
 
306
  { 473, PT_SC, ucp_Ol_Chiki },
 
307
  { 482, PT_SC, ucp_Old_Italic },
 
308
  { 493, PT_SC, ucp_Old_Persian },
 
309
  { 505, PT_SC, ucp_Oriya },
 
310
  { 511, PT_SC, ucp_Osmanya },
 
311
  { 519, PT_GC, ucp_P },
 
312
  { 521, PT_PC, ucp_Pc },
 
313
  { 524, PT_PC, ucp_Pd },
 
314
  { 527, PT_PC, ucp_Pe },
 
315
  { 530, PT_PC, ucp_Pf },
 
316
  { 533, PT_SC, ucp_Phags_Pa },
 
317
  { 542, PT_SC, ucp_Phoenician },
 
318
  { 553, PT_PC, ucp_Pi },
 
319
  { 556, PT_PC, ucp_Po },
 
320
  { 559, PT_PC, ucp_Ps },
 
321
  { 562, PT_SC, ucp_Rejang },
 
322
  { 569, PT_SC, ucp_Runic },
 
323
  { 575, PT_GC, ucp_S },
 
324
  { 577, PT_SC, ucp_Saurashtra },
 
325
  { 588, PT_PC, ucp_Sc },
 
326
  { 591, PT_SC, ucp_Shavian },
 
327
  { 599, PT_SC, ucp_Sinhala },
 
328
  { 607, PT_PC, ucp_Sk },
 
329
  { 610, PT_PC, ucp_Sm },
 
330
  { 613, PT_PC, ucp_So },
 
331
  { 616, PT_SC, ucp_Sundanese },
 
332
  { 626, PT_SC, ucp_Syloti_Nagri },
 
333
  { 639, PT_SC, ucp_Syriac },
 
334
  { 646, PT_SC, ucp_Tagalog },
 
335
  { 654, PT_SC, ucp_Tagbanwa },
 
336
  { 663, PT_SC, ucp_Tai_Le },
 
337
  { 670, PT_SC, ucp_Tamil },
 
338
  { 676, PT_SC, ucp_Telugu },
 
339
  { 683, PT_SC, ucp_Thaana },
 
340
  { 690, PT_SC, ucp_Thai },
 
341
  { 695, PT_SC, ucp_Tibetan },
 
342
  { 703, PT_SC, ucp_Tifinagh },
 
343
  { 712, PT_SC, ucp_Ugaritic },
 
344
  { 721, PT_SC, ucp_Vai },
 
345
  { 725, PT_SC, ucp_Yi },
 
346
  { 728, PT_GC, ucp_Z },
 
347
  { 730, PT_PC, ucp_Zl },
 
348
  { 733, PT_PC, ucp_Zp },
 
349
  { 736, PT_PC, ucp_Zs }
312
350
};
313
351
 
314
352
const int _pcre_utt_size = sizeof(_pcre_utt)/sizeof(ucp_type_table);