~ubuntu-branches/ubuntu/hoary/kdemultimedia/hoary

« back to all changes in this revision

Viewing changes to mpeglib/lib/mpegplay/copyFunctions.cpp

  • Committer: Bazaar Package Importer
  • Author(s): Martin Schulze
  • Date: 2003-01-22 15:00:51 UTC
  • Revision ID: james.westby@ubuntu.com-20030122150051-uihwkdoxf15mi1tn
Tags: upstream-2.2.2
ImportĀ upstreamĀ versionĀ 2.2.2

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
/*
 
2
  stores heavily used copy functions (makes mmx support easier)
 
3
  Copyright (C) 2000  Martin Vogt
 
4
 
 
5
  This program is free software; you can redistribute it and/or modify
 
6
  it under the terms of the GNU Library General Public License as published by
 
7
  the Free Software Foundation.
 
8
 
 
9
  For more information look at the file COPYRIGHT in this package
 
10
 
 
11
 */
 
12
 
 
13
 
 
14
#include "copyFunctions.h"
 
15
 
 
16
 
 
17
/*
 
18
 * We use a lookup table to make sure values stay in the 0..255 range.
 
19
 * Since this is cropping (ie, x = (x < 0)?0:(x>255)?255:x; ), wee call this
 
20
 * table the "crop table".
 
21
 * MAX_NEG_CROP is the maximum neg/pos value we can handle.
 
22
 */
 
23
/*
 
24
 * We use a lookup table to make sure values stay in the 0..255 range.
 
25
 * Since this is cropping (ie, x = (x < 0)?0:(x>255)?255:x; ), wee call this
 
26
 * table the "crop table".
 
27
 * MAX_NEG_CROP is the maximum neg/pos value we can handle.
 
28
 */
 
29
 
 
30
// Compiler cannot allocate too big arrays.
 
31
 
 
32
 
 
33
 
 
34
 
 
35
CopyFunctions::CopyFunctions() {
 
36
  /* Initialize crop table. */
 
37
  cropTbl=new unsigned char[NUM_CROP_ENTRIES];
 
38
 
 
39
  int i;
 
40
 
 
41
  for (i = (-MAX_NEG_CROP); i < NUM_CROP_ENTRIES - MAX_NEG_CROP; i++) {
 
42
    if (i <= 0) {
 
43
      cropTbl[i + MAX_NEG_CROP] = 0;
 
44
    } else if (i >= 255) {
 
45
      cropTbl[i + MAX_NEG_CROP] = 255;
 
46
    } else {
 
47
      cropTbl[i + MAX_NEG_CROP] = i;
 
48
    }
 
49
  }
 
50
  cm=cropTbl + MAX_NEG_CROP;
 
51
 
 
52
  copyFunctions_asm = new CopyFunctions_MMX();
 
53
  lmmx=copyFunctions_asm->support();
 
54
  
 
55
 
 
56
 
 
57
}
 
58
 
 
59
 
 
60
CopyFunctions::~CopyFunctions() {
 
61
  delete cropTbl;
 
62
}
 
63
 
 
64
void CopyFunctions::startNOFloatSection() {
 
65
  // nothing
 
66
  copyFunctions_asm->startNOFloatSection();
 
67
}
 
68
 
 
69
 
 
70
void CopyFunctions::endNOFloatSection() {
 
71
  copyFunctions_asm->endNOFloatSection();
 
72
 
 
73
}
 
74
 
 
75
 
 
76
void CopyFunctions::copy8_byte(unsigned char* source1,
 
77
                               unsigned char* dest,int inc) {
 
78
  if (lmmx == false) {
 
79
    int rr;
 
80
    
 
81
    for (rr = 0; rr < 8; rr++) {
 
82
      memcpy(dest,source1,sizeof(char)*8);
 
83
      source1+=inc;
 
84
      dest+=inc;
 
85
    }    
 
86
 
 
87
  } else {
 
88
    copyFunctions_asm->copy8_byte(source1,dest,inc);
 
89
  }
 
90
      
 
91
 
 
92
}
 
93
 
 
94
void CopyFunctions::copy8_word(unsigned short* source1,
 
95
                               unsigned short* dest,int inc) {
 
96
  int rr;
 
97
 
 
98
  // Optimisation is slower, leave it in C
 
99
  for (rr = 0; rr < 8; rr++) {
 
100
    memcpy(dest,source1,sizeof(short)*8);
 
101
    source1+=inc;
 
102
    dest+=inc;
 
103
  }    
 
104
 
 
105
}
 
106
 
 
107
 
 
108
 
 
109
void CopyFunctions::copy8_src1linear_crop(short* source1,
 
110
                                          unsigned char* dest,int inc) {
 
111
 
 
112
  if (lmmx == false) {
 
113
    int rr;
 
114
    
 
115
    for (rr = 0; rr < 8; rr++) {
 
116
      
 
117
      dest[0] = cm[source1[0]];
 
118
      dest[1] = cm[source1[1]];
 
119
      dest[2] = cm[source1[2]];
 
120
      dest[3] = cm[source1[3]];
 
121
      dest[4] = cm[source1[4]];
 
122
      dest[5] = cm[source1[5]];
 
123
      dest[6] = cm[source1[6]];
 
124
      dest[7] = cm[source1[7]];
 
125
 
 
126
      
 
127
      dest += inc;
 
128
      source1 += 8;
 
129
      
 
130
    }
 
131
  } else {
 
132
    copyFunctions_asm->copy8_src1linear_crop(source1,dest,inc);
 
133
  }
 
134
 
 
135
}
 
136
 
 
137
void CopyFunctions::copy8_div2_nocrop(unsigned char* source1,
 
138
                                      unsigned char* source2,
 
139
                                      unsigned char* dest,int inc) {
 
140
  if (lmmx == false) {
 
141
    int rr;
 
142
    for (rr = 0; rr < 8; rr++) {
 
143
      
 
144
      dest[0] = (int) (source1[0] + source2[0]+1) >> 1;
 
145
      dest[1] = (int) (source1[1] + source2[1]+1) >> 1;
 
146
      dest[2] = (int) (source1[2] + source2[2]+1) >> 1;
 
147
      dest[3] = (int) (source1[3] + source2[3]+1) >> 1;
 
148
      dest[4] = (int) (source1[4] + source2[4]+1) >> 1;
 
149
      dest[5] = (int) (source1[5] + source2[5]+1) >> 1;
 
150
      dest[6] = (int) (source1[6] + source2[6]+1) >> 1;
 
151
      dest[7] = (int) (source1[7] + source2[7]+1) >> 1;
 
152
      dest += inc;
 
153
      source1 += inc;
 
154
      source2 += inc;
 
155
    }
 
156
  } else {
 
157
    copyFunctions_asm->copy8_div2_nocrop(source1,source2, dest, inc);
 
158
  }
 
159
 
 
160
}
 
161
 
 
162
void CopyFunctions::copy8_div2_destlinear_nocrop(unsigned char* source1,
 
163
                                                 unsigned char* source2,
 
164
                                                 unsigned char* dest,int inc) {
 
165
  
 
166
  if (lmmx == false) {
 
167
    int rr;
 
168
    for (rr = 0; rr < 8; rr++) {
 
169
      dest[0] = (int) (source1[0] + source2[0]) >> 1;
 
170
      dest[1] = (int) (source1[1] + source2[1]) >> 1;
 
171
      dest[2] = (int) (source1[2] + source2[2]) >> 1;
 
172
      dest[3] = (int) (source1[3] + source2[3]) >> 1;
 
173
      dest[4] = (int) (source1[4] + source2[4]) >> 1;
 
174
      dest[5] = (int) (source1[5] + source2[5]) >> 1;
 
175
      dest[6] = (int) (source1[6] + source2[6]) >> 1;
 
176
      dest[7] = (int) (source1[7] + source2[7]) >> 1;
 
177
      dest += 8;
 
178
      source1 += inc;
 
179
      source2 += inc;
 
180
    }
 
181
  } else {
 
182
    copyFunctions_asm->copy8_div2_destlinear_nocrop(source1,source2,dest,inc);
 
183
  }
 
184
}
 
185
  
 
186
 
 
187
void CopyFunctions::copy16_div2_destlinear_nocrop(unsigned char* source1,
 
188
                                                  unsigned char* source2,
 
189
                                                  unsigned char* dest,int inc){
 
190
 
 
191
  if (lmmx == false) {
 
192
    int rr;
 
193
    for (rr = 0; rr < 16; rr++) {
 
194
      dest[0] = (int) (source1[0] + source2[0]) >> 1;
 
195
      dest[1] = (int) (source1[1] + source2[1]) >> 1;
 
196
      dest[2] = (int) (source1[2] + source2[2]) >> 1;
 
197
      dest[3] = (int) (source1[3] + source2[3]) >> 1;
 
198
      dest[4] = (int) (source1[4] + source2[4]) >> 1;
 
199
      dest[5] = (int) (source1[5] + source2[5]) >> 1;
 
200
      dest[6] = (int) (source1[6] + source2[6]) >> 1;
 
201
      dest[7] = (int) (source1[7] + source2[7]) >> 1;
 
202
      dest[8] = (int) (source1[8] + source2[8]) >> 1;
 
203
      dest[9] = (int) (source1[9] + source2[9]) >> 1;
 
204
      dest[10] = (int) (source1[10] + source2[10]) >> 1;
 
205
      dest[11] = (int) (source1[11] + source2[11]) >> 1;
 
206
      dest[12] = (int) (source1[12] + source2[12]) >> 1;
 
207
      dest[13] = (int) (source1[13] + source2[13]) >> 1;
 
208
      dest[14] = (int) (source1[14] + source2[14]) >> 1;
 
209
      dest[15] = (int) (source1[15] + source2[15]) >> 1;
 
210
      dest += 16;
 
211
      source1 += inc;
 
212
      source2 += inc;
 
213
    }
 
214
  } else {
 
215
    copyFunctions_asm->copy16_div2_destlinear_nocrop(source1,source2,dest,inc);
 
216
  }   
 
217
 
 
218
}
 
219
  
 
220
 
 
221
 
 
222
void CopyFunctions::copy8_div4_nocrop(unsigned char* source1,
 
223
                                      unsigned char* source2,
 
224
                                      unsigned char* source3,
 
225
                                      unsigned char* source4,
 
226
                                      unsigned char* dest,int inc) {
 
227
  int rr;
 
228
 
 
229
  for (rr = 0; rr < 8; rr++) {
 
230
    dest[0]=(int) (source1[0]+source2[0]+source3[0]+source4[0] + 2) >> 2;
 
231
    dest[1]=(int) (source1[1]+source2[1]+source3[1]+source4[1] + 2) >> 2;
 
232
    dest[2]=(int) (source1[2]+source2[2]+source3[2]+source4[2] + 2) >> 2;
 
233
    dest[3]=(int) (source1[3]+source2[3]+source3[3]+source4[3] + 2) >> 2;
 
234
    dest[4]=(int) (source1[4]+source2[4]+source3[4]+source4[4] + 2) >> 2;
 
235
    dest[5]=(int) (source1[5]+source2[5]+source3[5]+source4[5] + 2) >> 2;
 
236
    dest[6]=(int) (source1[6]+source2[6]+source3[6]+source4[6] + 2) >> 2;
 
237
    dest[7]=(int) (source1[7]+source2[7]+source3[7]+source4[7] + 2) >> 2;
 
238
    dest += inc;
 
239
    source1 += inc;
 
240
    source2 += inc;
 
241
    source3 += inc;
 
242
    source4 += inc;
 
243
  }
 
244
}
 
245
 
 
246
// Optimize me!
 
247
// should be mmx perfomance analysis shows: 8 % overall time
 
248
 
 
249
void CopyFunctions::copy8_src2linear_crop(unsigned char* source1,
 
250
                                          short int* source2,
 
251
                                          unsigned char* dest,int inc) {
 
252
  int rr;
 
253
  if (lmmx == false) {
 
254
    for (rr = 0; rr < 8; rr++) {
 
255
      dest[0] = cm[(int) source1[0] + (int) source2[0]];
 
256
      dest[1] = cm[(int) source1[1] + (int) source2[1]];
 
257
      dest[2] = cm[(int) source1[2] + (int) source2[2]];
 
258
      dest[3] = cm[(int) source1[3] + (int) source2[3]];
 
259
      dest[4] = cm[(int) source1[4] + (int) source2[4]];
 
260
      dest[5] = cm[(int) source1[5] + (int) source2[5]];
 
261
      dest[6] = cm[(int) source1[6] + (int) source2[6]];
 
262
      dest[7] = cm[(int) source1[7] + (int) source2[7]];
 
263
      dest += inc;
 
264
      source1 += inc;
 
265
      source2 += 8;
 
266
    }
 
267
  } else {
 
268
    copyFunctions_asm->copy8_src2linear_crop(source1,source2,dest,inc);
 
269
  }
 
270
 
 
271
}
 
272
 
 
273
// Optimize me!
 
274
// should be mmx perfomance analysis shows: 13 % overall time
 
275
void CopyFunctions::copy8_div2_src3linear_crop(unsigned char* source1,
 
276
                                               unsigned char* source2,
 
277
                                               short int* source3,
 
278
                                               unsigned char* dest,int inc) {
 
279
  int rr;
 
280
  if (lmmx==false) {
 
281
    for (rr = 0; rr < 8; rr++) {
 
282
      dest[0] = cm[((int) (source1[0] + source2[0]+1) >> 1) + source3[0]];
 
283
      dest[1] = cm[((int) (source1[1] + source2[1]+1) >> 1) + source3[1]];
 
284
      dest[2] = cm[((int) (source1[2] + source2[2]+1) >> 1) + source3[2]];
 
285
      dest[3] = cm[((int) (source1[3] + source2[3]+1) >> 1) + source3[3]];
 
286
      dest[4] = cm[((int) (source1[4] + source2[4]+1) >> 1) + source3[4]];
 
287
      dest[5] = cm[((int) (source1[5] + source2[5]+1) >> 1) + source3[5]];
 
288
      dest[6] = cm[((int) (source1[6] + source2[6]+1) >> 1) + source3[6]];
 
289
      dest[7] = cm[((int) (source1[7] + source2[7]+1) >> 1) + source3[7]];
 
290
      dest += inc;
 
291
      source1 += inc;
 
292
      source2 += inc;
 
293
      source3 += 8;
 
294
      
 
295
    }
 
296
  } else {
 
297
    copyFunctions_asm->copy8_div2_src3linear_crop(source1,source2,source3,
 
298
                                                  dest,inc);
 
299
  }
 
300
 
 
301
 
 
302
}
 
303
 
 
304
 
 
305
void CopyFunctions::copy8_div4_src5linear_crop(unsigned char* source1,
 
306
                                               unsigned char* source2,
 
307
                                               unsigned char* source3,
 
308
                                               unsigned char* source4,
 
309
                                               short int* source5,
 
310
                                               unsigned char* dest,int inc) {
 
311
 
 
312
  int rr;
 
313
 
 
314
  for (rr = 0; rr < 8; rr++) {
 
315
    dest[0]=cm[((int) (source1[0]+source2[0]+source3[0]+source4[0]+2) >> 2) + source5[0]];
 
316
    dest[1]=cm[((int) (source1[1]+source2[1]+source3[1]+source4[1]+2) >> 2) + source5[1]];
 
317
    dest[2]=cm[((int) (source1[2]+source2[2]+source3[2]+source4[2]+2) >> 2) + source5[2]];
 
318
    dest[3]=cm[((int) (source1[3]+source2[3]+source3[3]+source4[3]+2) >> 2) + source5[3]];
 
319
    dest[4]=cm[((int) (source1[4]+source2[4]+source3[4]+source4[4]+2) >> 2) + source5[4]];
 
320
    dest[5]=cm[((int) (source1[5]+source2[5]+source3[5]+source4[5]+2) >> 2) + source5[5]];
 
321
    dest[6]=cm[((int) (source1[6]+source2[6]+source3[6]+source4[6]+2) >> 2) + source5[6]];
 
322
    dest[7]=cm[((int) (source1[7]+source2[7]+source3[7]+source4[7]+2) >> 2) + source5[7]];
 
323
    dest +=inc;
 
324
    source1 += inc;
 
325
    source2 += inc;
 
326
    source3 += inc;
 
327
    source4 += inc;
 
328
    source5 += 8;
 
329
  }
 
330
}