~paparazzi-uav/paparazzi/v5.0-manual

void cv::cuda::graphcut(GpuMat&, GpuMat&, GpuMat&, GpuMat&, GpuMat&, GpuMat&, GpuMat&, GpuMat&, GpuMat&, GpuMat&, GpuMat&, Stream&) { throw_no_cuda(); }

void cv::cuda::connectivityMask(const GpuMat&, GpuMat&, const cv::Scalar&, const cv::Scalar&, Stream&) { throw_no_cuda(); }

void cv::cuda::labelComponents(const GpuMat&, GpuMat&, int, Stream&) { throw_no_cuda(); }

#else /* !defined (HAVE_CUDA) */

namespace cv { namespace cuda { namespace device

{

namespace ccl

{

void labelComponents(const PtrStepSzb& edges, PtrStepSzi comps, int flags, cudaStream_t stream);

template<typename T>

void computeEdges(const PtrStepSzb& image, PtrStepSzb edges, const float4& lo, const float4& hi, cudaStream_t stream);

}

}}}

static float4 scalarToCudaType(const cv::Scalar& in)

{

return make_float4((float)in[0], (float)in[1], (float)in[2], (float)in[3]);

}

void cv::cuda::connectivityMask(const GpuMat& image, GpuMat& mask, const cv::Scalar& lo, const cv::Scalar& hi, Stream& s)

{

CV_Assert(!image.empty());

int ch = image.channels();

CV_Assert(ch <= 4);

int depth = image.depth();

typedef void (*func_t)(const PtrStepSzb& image, PtrStepSzb edges, const float4& lo, const float4& hi, cudaStream_t stream);

static const func_t suppotLookup[8][4] =

{ // 1, 2, 3, 4

{ device::ccl::computeEdges<uchar>, 0, device::ccl::computeEdges<uchar3>, device::ccl::computeEdges<uchar4> },// CV_8U

{ 0, 0, 0, 0 },// CV_16U

{ device::ccl::computeEdges<ushort>, 0, device::ccl::computeEdges<ushort3>, device::ccl::computeEdges<ushort4> },// CV_8S

{ 0, 0, 0, 0 },// CV_16S

{ device::ccl::computeEdges<int>, 0, 0, 0 },// CV_32S

{ device::ccl::computeEdges<float>, 0, 0, 0 },// CV_32F

{ 0, 0, 0, 0 },// CV_64F

{ 0, 0, 0, 0 } // CV_USRTYPE1

};

func_t f = suppotLookup[depth][ch - 1];

CV_Assert(f);

if (image.size() != mask.size() || mask.type() != CV_8UC1)

mask.create(image.size(), CV_8UC1);

100

cudaStream_t stream = StreamAccessor::getStream(s);

101

float4 culo = scalarToCudaType(lo), cuhi = scalarToCudaType(hi);

102

f(image, mask, culo, cuhi, stream);

103

}

104

105

void cv::cuda::labelComponents(const GpuMat& mask, GpuMat& components, int flags, Stream& s)

106

{

107

CV_Assert(!mask.empty() && mask.type() == CV_8U);

108

109

if (!deviceSupports(SHARED_ATOMICS))

110

CV_Error(cv::Error::StsNotImplemented, "The device doesn't support shared atomics and communicative synchronization!");

111

112

components.create(mask.size(), CV_32SC1);

113

114

cudaStream_t stream = StreamAccessor::getStream(s);

115

device::ccl::labelComponents(mask, components, flags, stream);

116

}

117

118

namespace

119

{

120

typedef NppStatus (*init_func_t)(NppiSize oSize, NppiGraphcutState** ppState, Npp8u* pDeviceMem);

121

122

class NppiGraphcutStateHandler

123

{

124

public:

125

NppiGraphcutStateHandler(NppiSize sznpp, Npp8u* pDeviceMem, const init_func_t func)

126

{

127

nppSafeCall( func(sznpp, &pState, pDeviceMem) );

128

}

129

130

~NppiGraphcutStateHandler()

131

{

132

nppSafeCall( nppiGraphcutFree(pState) );

133

}

134

135

operator NppiGraphcutState*()

136

{

137

return pState;

138

}

139

140

private:

141

NppiGraphcutState* pState;

142

};

143

}

144

145

void cv::cuda::graphcut(GpuMat& terminals, GpuMat& leftTransp, GpuMat& rightTransp, GpuMat& top, GpuMat& bottom, GpuMat& labels, GpuMat& buf, Stream& s)

146

{

147

#if (CUDA_VERSION < 5000)

148

CV_Assert(terminals.type() == CV_32S);

149

#else

150

CV_Assert(terminals.type() == CV_32S || terminals.type() == CV_32F);

151

#endif

152

153

Size src_size = terminals.size();

154

155

CV_Assert(leftTransp.size() == Size(src_size.height, src_size.width));

156

CV_Assert(leftTransp.type() == terminals.type());

157

158

CV_Assert(rightTransp.size() == Size(src_size.height, src_size.width));

159

CV_Assert(rightTransp.type() == terminals.type());

160

161

CV_Assert(top.size() == src_size);

162

CV_Assert(top.type() == terminals.type());

163

164

CV_Assert(bottom.size() == src_size);

165

CV_Assert(bottom.type() == terminals.type());

166

167

labels.create(src_size, CV_8U);

168

169

NppiSize sznpp;

170

sznpp.width = src_size.width;

171

sznpp.height = src_size.height;

172

173

int bufsz;

174

nppSafeCall( nppiGraphcutGetSize(sznpp, &bufsz) );

175

176

ensureSizeIsEnough(1, bufsz, CV_8U, buf);

177

178

cudaStream_t stream = StreamAccessor::getStream(s);

179

180

NppStreamHandler h(stream);

181

182

NppiGraphcutStateHandler state(sznpp, buf.ptr<Npp8u>(), nppiGraphcutInitAlloc);

183

184

#if (CUDA_VERSION < 5000)

185

nppSafeCall( nppiGraphcut_32s8u(terminals.ptr<Npp32s>(), leftTransp.ptr<Npp32s>(), rightTransp.ptr<Npp32s>(), top.ptr<Npp32s>(), bottom.ptr<Npp32s>(),

186

static_cast<int>(terminals.step), static_cast<int>(leftTransp.step), sznpp, labels.ptr<Npp8u>(), static_cast<int>(labels.step), state) );

187

#else

188

if (terminals.type() == CV_32S)

189

{

190

nppSafeCall( nppiGraphcut_32s8u(terminals.ptr<Npp32s>(), leftTransp.ptr<Npp32s>(), rightTransp.ptr<Npp32s>(), top.ptr<Npp32s>(), bottom.ptr<Npp32s>(),

191

static_cast<int>(terminals.step), static_cast<int>(leftTransp.step), sznpp, labels.ptr<Npp8u>(), static_cast<int>(labels.step), state) );

192

}

193

else

194

{

195

nppSafeCall( nppiGraphcut_32f8u(terminals.ptr<Npp32f>(), leftTransp.ptr<Npp32f>(), rightTransp.ptr<Npp32f>(), top.ptr<Npp32f>(), bottom.ptr<Npp32f>(),

196

static_cast<int>(terminals.step), static_cast<int>(leftTransp.step), sznpp, labels.ptr<Npp8u>(), static_cast<int>(labels.step), state) );

197

}

198

#endif

199

200

if (stream == 0)

201

cudaSafeCall( cudaDeviceSynchronize() );

202

}

203

204

void cv::cuda::graphcut(GpuMat& terminals, GpuMat& leftTransp, GpuMat& rightTransp, GpuMat& top, GpuMat& topLeft, GpuMat& topRight,

205

GpuMat& bottom, GpuMat& bottomLeft, GpuMat& bottomRight, GpuMat& labels, GpuMat& buf, Stream& s)

206

{

207

#if (CUDA_VERSION < 5000)

208

CV_Assert(terminals.type() == CV_32S);

209

#else

210

CV_Assert(terminals.type() == CV_32S || terminals.type() == CV_32F);

211

#endif

212

213

Size src_size = terminals.size();

214

215

CV_Assert(leftTransp.size() == Size(src_size.height, src_size.width));

216

CV_Assert(leftTransp.type() == terminals.type());

217

218

CV_Assert(rightTransp.size() == Size(src_size.height, src_size.width));

219

CV_Assert(rightTransp.type() == terminals.type());

220

221

CV_Assert(top.size() == src_size);

222

CV_Assert(top.type() == terminals.type());

223

224

CV_Assert(topLeft.size() == src_size);

225

CV_Assert(topLeft.type() == terminals.type());

226

227

CV_Assert(topRight.size() == src_size);

228

CV_Assert(topRight.type() == terminals.type());

229

230

CV_Assert(bottom.size() == src_size);

231

CV_Assert(bottom.type() == terminals.type());

232

233

CV_Assert(bottomLeft.size() == src_size);

234

CV_Assert(bottomLeft.type() == terminals.type());

235

236

CV_Assert(bottomRight.size() == src_size);

237

CV_Assert(bottomRight.type() == terminals.type());

238

239

labels.create(src_size, CV_8U);

240

241

NppiSize sznpp;

242

sznpp.width = src_size.width;

243

sznpp.height = src_size.height;

244

245

int bufsz;

246

nppSafeCall( nppiGraphcut8GetSize(sznpp, &bufsz) );

247

248

ensureSizeIsEnough(1, bufsz, CV_8U, buf);

249

250

cudaStream_t stream = StreamAccessor::getStream(s);

251

252

NppStreamHandler h(stream);

253

254

NppiGraphcutStateHandler state(sznpp, buf.ptr<Npp8u>(), nppiGraphcut8InitAlloc);

255

256

#if (CUDA_VERSION < 5000)

257

nppSafeCall( nppiGraphcut8_32s8u(terminals.ptr<Npp32s>(), leftTransp.ptr<Npp32s>(), rightTransp.ptr<Npp32s>(),

258

top.ptr<Npp32s>(), topLeft.ptr<Npp32s>(), topRight.ptr<Npp32s>(),

259

bottom.ptr<Npp32s>(), bottomLeft.ptr<Npp32s>(), bottomRight.ptr<Npp32s>(),

260

static_cast<int>(terminals.step), static_cast<int>(leftTransp.step), sznpp, labels.ptr<Npp8u>(), static_cast<int>(labels.step), state) );

261

#else

262

if (terminals.type() == CV_32S)

263

{

264

nppSafeCall( nppiGraphcut8_32s8u(terminals.ptr<Npp32s>(), leftTransp.ptr<Npp32s>(), rightTransp.ptr<Npp32s>(),

265

top.ptr<Npp32s>(), topLeft.ptr<Npp32s>(), topRight.ptr<Npp32s>(),

266

bottom.ptr<Npp32s>(), bottomLeft.ptr<Npp32s>(), bottomRight.ptr<Npp32s>(),

267

static_cast<int>(terminals.step), static_cast<int>(leftTransp.step), sznpp, labels.ptr<Npp8u>(), static_cast<int>(labels.step), state) );

268

}

269

else

270

{

271

nppSafeCall( nppiGraphcut8_32f8u(terminals.ptr<Npp32f>(), leftTransp.ptr<Npp32f>(), rightTransp.ptr<Npp32f>(),

272

top.ptr<Npp32f>(), topLeft.ptr<Npp32f>(), topRight.ptr<Npp32f>(),

273

bottom.ptr<Npp32f>(), bottomLeft.ptr<Npp32f>(), bottomRight.ptr<Npp32f>(),

274

static_cast<int>(terminals.step), static_cast<int>(leftTransp.step), sznpp, labels.ptr<Npp8u>(), static_cast<int>(labels.step), state) );

275

}

276

#endif

277

278

if (stream == 0)

279

cudaSafeCall( cudaDeviceSynchronize() );

280

}

281

282

#endif /* !defined (HAVE_CUDA) */

Older »