~paparazzi-uav/paparazzi/v5.0-manual

« back to all changes in this revision

Viewing changes to sw/ext/opencv_bebop/opencv/modules/core/include/opencv2/core/cuda/detail/vec_distance_detail.hpp

  • Committer: Paparazzi buildbot
  • Date: 2016-05-18 15:00:29 UTC
  • Revision ID: felix.ruess+docbot@gmail.com-20160518150029-e8lgzi5kvb4p7un9
Manual import commit 4b8bbb730080dac23cf816b98908dacfabe2a8ec from v5.0 branch.

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
/*M///////////////////////////////////////////////////////////////////////////////////////
 
2
//
 
3
//  IMPORTANT: READ BEFORE DOWNLOADING, COPYING, INSTALLING OR USING.
 
4
//
 
5
//  By downloading, copying, installing or using the software you agree to this license.
 
6
//  If you do not agree to this license, do not download, install,
 
7
//  copy or use the software.
 
8
//
 
9
//
 
10
//                           License Agreement
 
11
//                For Open Source Computer Vision Library
 
12
//
 
13
// Copyright (C) 2000-2008, Intel Corporation, all rights reserved.
 
14
// Copyright (C) 2009, Willow Garage Inc., all rights reserved.
 
15
// Third party copyrights are property of their respective owners.
 
16
//
 
17
// Redistribution and use in source and binary forms, with or without modification,
 
18
// are permitted provided that the following conditions are met:
 
19
//
 
20
//   * Redistribution's of source code must retain the above copyright notice,
 
21
//     this list of conditions and the following disclaimer.
 
22
//
 
23
//   * Redistribution's in binary form must reproduce the above copyright notice,
 
24
//     this list of conditions and the following disclaimer in the documentation
 
25
//     and/or other materials provided with the distribution.
 
26
//
 
27
//   * The name of the copyright holders may not be used to endorse or promote products
 
28
//     derived from this software without specific prior written permission.
 
29
//
 
30
// This software is provided by the copyright holders and contributors "as is" and
 
31
// any express or implied warranties, including, but not limited to, the implied
 
32
// warranties of merchantability and fitness for a particular purpose are disclaimed.
 
33
// In no event shall the Intel Corporation or contributors be liable for any direct,
 
34
// indirect, incidental, special, exemplary, or consequential damages
 
35
// (including, but not limited to, procurement of substitute goods or services;
 
36
// loss of use, data, or profits; or business interruption) however caused
 
37
// and on any theory of liability, whether in contract, strict liability,
 
38
// or tort (including negligence or otherwise) arising in any way out of
 
39
// the use of this software, even if advised of the possibility of such damage.
 
40
//
 
41
//M*/
 
42
 
 
43
#ifndef __OPENCV_CUDA_VEC_DISTANCE_DETAIL_HPP__
 
44
#define __OPENCV_CUDA_VEC_DISTANCE_DETAIL_HPP__
 
45
 
 
46
#include "../datamov_utils.hpp"
 
47
 
 
48
//! @cond IGNORED
 
49
 
 
50
namespace cv { namespace cuda { namespace device
 
51
{
 
52
    namespace vec_distance_detail
 
53
    {
 
54
        template <int THREAD_DIM, int N> struct UnrollVecDiffCached
 
55
        {
 
56
            template <typename Dist, typename T1, typename T2>
 
57
            static __device__ void calcCheck(const T1* vecCached, const T2* vecGlob, int len, Dist& dist, int ind)
 
58
            {
 
59
                if (ind < len)
 
60
                {
 
61
                    T1 val1 = *vecCached++;
 
62
 
 
63
                    T2 val2;
 
64
                    ForceGlob<T2>::Load(vecGlob, ind, val2);
 
65
 
 
66
                    dist.reduceIter(val1, val2);
 
67
 
 
68
                    UnrollVecDiffCached<THREAD_DIM, N - 1>::calcCheck(vecCached, vecGlob, len, dist, ind + THREAD_DIM);
 
69
                }
 
70
            }
 
71
 
 
72
            template <typename Dist, typename T1, typename T2>
 
73
            static __device__ void calcWithoutCheck(const T1* vecCached, const T2* vecGlob, Dist& dist)
 
74
            {
 
75
                T1 val1 = *vecCached++;
 
76
 
 
77
                T2 val2;
 
78
                ForceGlob<T2>::Load(vecGlob, 0, val2);
 
79
                vecGlob += THREAD_DIM;
 
80
 
 
81
                dist.reduceIter(val1, val2);
 
82
 
 
83
                UnrollVecDiffCached<THREAD_DIM, N - 1>::calcWithoutCheck(vecCached, vecGlob, dist);
 
84
            }
 
85
        };
 
86
        template <int THREAD_DIM> struct UnrollVecDiffCached<THREAD_DIM, 0>
 
87
        {
 
88
            template <typename Dist, typename T1, typename T2>
 
89
            static __device__ __forceinline__ void calcCheck(const T1*, const T2*, int, Dist&, int)
 
90
            {
 
91
            }
 
92
 
 
93
            template <typename Dist, typename T1, typename T2>
 
94
            static __device__ __forceinline__ void calcWithoutCheck(const T1*, const T2*, Dist&)
 
95
            {
 
96
            }
 
97
        };
 
98
 
 
99
        template <int THREAD_DIM, int MAX_LEN, bool LEN_EQ_MAX_LEN> struct VecDiffCachedCalculator;
 
100
        template <int THREAD_DIM, int MAX_LEN> struct VecDiffCachedCalculator<THREAD_DIM, MAX_LEN, false>
 
101
        {
 
102
            template <typename Dist, typename T1, typename T2>
 
103
            static __device__ __forceinline__ void calc(const T1* vecCached, const T2* vecGlob, int len, Dist& dist, int tid)
 
104
            {
 
105
                UnrollVecDiffCached<THREAD_DIM, MAX_LEN / THREAD_DIM>::calcCheck(vecCached, vecGlob, len, dist, tid);
 
106
            }
 
107
        };
 
108
        template <int THREAD_DIM, int MAX_LEN> struct VecDiffCachedCalculator<THREAD_DIM, MAX_LEN, true>
 
109
        {
 
110
            template <typename Dist, typename T1, typename T2>
 
111
            static __device__ __forceinline__ void calc(const T1* vecCached, const T2* vecGlob, int len, Dist& dist, int tid)
 
112
            {
 
113
                UnrollVecDiffCached<THREAD_DIM, MAX_LEN / THREAD_DIM>::calcWithoutCheck(vecCached, vecGlob + tid, dist);
 
114
            }
 
115
        };
 
116
    } // namespace vec_distance_detail
 
117
}}} // namespace cv { namespace cuda { namespace cudev
 
118
 
 
119
//! @endcond
 
120
 
 
121
#endif // __OPENCV_CUDA_VEC_DISTANCE_DETAIL_HPP__