~ubuntu-branches/ubuntu/trusty/libthrust/trusty

Viewing changes to detail/backend/cuda/block/reduce.h

Committer: Package Import Robot
Author(s): Andreas Beckmann
Date: 2011-12-02 01:48:24 UTC
mfrom: (1.1.1)
Revision ID: package-import@ubuntu.com-20111202014824-bpfczhbx39usefge

Tags: 1.5.0-1

* New upstream release.
* debian/copyright:
- Update to dep5.mdwn?revision=202.
- Update copyright entries for added/moved files.

files added:
detail/backend

detail/backend/adjacent_difference.h

detail/backend/adjacent_difference.inl

detail/backend/binary_search.h

detail/backend/copy.h

detail/backend/copy.inl

detail/backend/copy_if.h

detail/backend/cpp

detail/backend/cpp/adjacent_difference.h

detail/backend/cpp/binary_search.h

detail/backend/cpp/copy.h

detail/backend/cpp/copy_if.h

detail/backend/cpp/default_decomposition.h

detail/backend/cpp/detail

detail/backend/cpp/detail/copy_backward.h

detail/backend/cpp/detail/general_copy.h

detail/backend/cpp/detail/insertion_sort.h

detail/backend/cpp/detail/stable_merge_sort.h

detail/backend/cpp/detail/stable_merge_sort.inl

detail/backend/cpp/detail/stable_radix_sort.h

detail/backend/cpp/detail/stable_radix_sort.inl

detail/backend/cpp/detail/trivial_copy.h

detail/backend/cpp/dispatch

detail/backend/cpp/dispatch/copy.h

detail/backend/cpp/dispatch/sort.h

detail/backend/cpp/extrema.h

detail/backend/cpp/fill.h

detail/backend/cpp/find.h

detail/backend/cpp/for_each.h

detail/backend/cpp/for_each.inl

detail/backend/cpp/merge.h

detail/backend/cpp/merge.inl

detail/backend/cpp/partition.h

detail/backend/cpp/reduce.h

detail/backend/cpp/reduce_intervals.h

detail/backend/cpp/reduce_intervals.inl

detail/backend/cpp/remove.h

detail/backend/cpp/scan.h

detail/backend/cpp/set_operations.h

detail/backend/cpp/sort.h

detail/backend/cpp/sort.inl

detail/backend/cpp/unique.h

detail/backend/cuda

detail/backend/cuda/adjacent_difference.h

detail/backend/cuda/adjacent_difference.inl

detail/backend/cuda/arch.h

detail/backend/cuda/arch.inl

detail/backend/cuda/block

detail/backend/cuda/block/copy.h

detail/backend/cuda/block/inclusive_scan.h

detail/backend/cuda/block/merge.h

detail/backend/cuda/block/merge.inl

detail/backend/cuda/block/merging_sort.h

detail/backend/cuda/block/odd_even_sort.h

detail/backend/cuda/block/reduce.h

detail/backend/cuda/block/set_difference.h

detail/backend/cuda/block/set_difference.inl

detail/backend/cuda/block/set_intersection.h

detail/backend/cuda/block/set_intersection.inl

detail/backend/cuda/block/set_symmetric_difference.h

detail/backend/cuda/block/set_symmetric_difference.inl

detail/backend/cuda/block/set_union.h

detail/backend/cuda/block/set_union.inl

detail/backend/cuda/copy.h

detail/backend/cuda/copy_cross_space.h

detail/backend/cuda/copy_cross_space.inl

detail/backend/cuda/copy_device_to_device.h

detail/backend/cuda/copy_device_to_device.inl

detail/backend/cuda/copy_if.h

detail/backend/cuda/copy_if.inl

detail/backend/cuda/default_decomposition.h

detail/backend/cuda/default_decomposition.inl

detail/backend/cuda/detail

detail/backend/cuda/detail/b40c

detail/backend/cuda/detail/b40c/kernel_utils.h

detail/backend/cuda/detail/b40c/radixsort_api.h

detail/backend/cuda/detail/b40c/radixsort_kernel_common.h

detail/backend/cuda/detail/b40c/radixsort_key_conversion.h

detail/backend/cuda/detail/b40c/radixsort_reduction_kernel.h

detail/backend/cuda/detail/b40c/radixsort_scanscatter_kernel.h

detail/backend/cuda/detail/b40c/radixsort_spine_kernel.h

detail/backend/cuda/detail/b40c/vector_types.h

detail/backend/cuda/detail/fast_scan.h

detail/backend/cuda/detail/fast_scan.inl

detail/backend/cuda/detail/get_set_operation_splitter_ranks.h

detail/backend/cuda/detail/get_set_operation_splitter_ranks.inl

detail/backend/cuda/detail/launch_calculator.h

detail/backend/cuda/detail/launch_calculator.inl

detail/backend/cuda/detail/launch_closure.h

detail/backend/cuda/detail/launch_closure.inl

detail/backend/cuda/detail/rank_iterator.h

detail/backend/cuda/detail/safe_scan.h

detail/backend/cuda/detail/safe_scan.inl

detail/backend/cuda/detail/set_operation.h

detail/backend/cuda/detail/set_operation.inl

detail/backend/cuda/detail/split_for_set_operation.h

detail/backend/cuda/detail/split_for_set_operation.inl

detail/backend/cuda/detail/stable_merge_sort.h

detail/backend/cuda/detail/stable_merge_sort.inl

detail/backend/cuda/detail/stable_radix_sort.h

detail/backend/cuda/detail/stable_radix_sort.inl

detail/backend/cuda/dispatch

detail/backend/cuda/dispatch/copy.h

detail/backend/cuda/dispatch/scan.h

detail/backend/cuda/extern_shared_ptr.h

detail/backend/cuda/fill.h

detail/backend/cuda/fill.inl

detail/backend/cuda/for_each.h

detail/backend/cuda/for_each.inl

detail/backend/cuda/free.h

detail/backend/cuda/free.inl

detail/backend/cuda/malloc.h

detail/backend/cuda/malloc.inl

detail/backend/cuda/merge.h

detail/backend/cuda/merge.inl

detail/backend/cuda/no_throw_free.h

detail/backend/cuda/no_throw_free.inl

detail/backend/cuda/reduce.h

detail/backend/cuda/reduce.inl

detail/backend/cuda/reduce_by_key.h

detail/backend/cuda/reduce_by_key.inl

detail/backend/cuda/reduce_intervals.h

detail/backend/cuda/reduce_intervals.inl

detail/backend/cuda/scalar

detail/backend/cuda/scalar/rotate.h

detail/backend/cuda/scan.h

detail/backend/cuda/scan.inl

detail/backend/cuda/set_difference.inl

detail/backend/cuda/set_intersection.inl

detail/backend/cuda/set_operations.h

detail/backend/cuda/set_symmetric_difference.inl

detail/backend/cuda/set_union.inl

detail/backend/cuda/sort.h

detail/backend/cuda/sort.inl

detail/backend/cuda/synchronize.h

detail/backend/cuda/synchronize.inl

detail/backend/cuda/trivial_copy.h

detail/backend/cuda/trivial_copy.inl

detail/backend/cuda/warp

detail/backend/cuda/warp/any.h

detail/backend/cuda/warp/scan.h

detail/backend/decompose.h

detail/backend/default_decomposition.h

detail/backend/default_decomposition.inl

detail/backend/dereference.h

detail/backend/dispatch

detail/backend/dispatch/copy.h

detail/backend/dispatch/free.h

detail/backend/dispatch/malloc.h

detail/backend/dispatch/merge.h

detail/backend/dispatch/no_throw_free.h

detail/backend/dispatch/uninitialized_copy.h

detail/backend/extrema.h

detail/backend/fill.h

detail/backend/fill.inl

detail/backend/find.h

detail/backend/for_each.h

detail/backend/for_each.inl

detail/backend/generic

detail/backend/generic/adjacent_difference.h

detail/backend/generic/adjacent_difference.inl

detail/backend/generic/binary_search.h

detail/backend/generic/binary_search.inl

detail/backend/generic/copy.h

detail/backend/generic/copy_if.h

detail/backend/generic/copy_if.inl

detail/backend/generic/extrema.h

detail/backend/generic/extrema.inl

detail/backend/generic/fill.h

detail/backend/generic/find.h

detail/backend/generic/find.inl

detail/backend/generic/for_each.h

detail/backend/generic/for_each.inl

detail/backend/generic/free.h

detail/backend/generic/malloc.h

detail/backend/generic/no_throw_free.h

detail/backend/generic/partition.h

detail/backend/generic/partition.inl

detail/backend/generic/reduce.h

detail/backend/generic/reduce.inl

detail/backend/generic/reduce_by_key.h

detail/backend/generic/reduce_by_key.inl

detail/backend/generic/remove.h

detail/backend/generic/remove.inl

detail/backend/generic/scalar

detail/backend/generic/scalar/binary_search.h

detail/backend/generic/scalar/binary_search.inl

detail/backend/generic/scalar/select.h

detail/backend/generic/scalar/select.inl

detail/backend/generic/scan_by_key.h

detail/backend/generic/scan_by_key.inl

detail/backend/generic/sort.h

detail/backend/generic/unique.h

detail/backend/generic/unique.inl

detail/backend/internal_allocator.h

detail/backend/merge.h

detail/backend/no_throw_free.h

detail/backend/omp

detail/backend/omp/copy.h

detail/backend/omp/copy_device_to_device.h

detail/backend/omp/copy_device_to_device.inl

detail/backend/omp/copy_device_to_host_or_any.h

detail/backend/omp/copy_device_to_host_or_any.inl

detail/backend/omp/copy_host_or_any_to_device.h

detail/backend/omp/copy_host_or_any_to_device.inl

detail/backend/omp/default_decomposition.h

detail/backend/omp/default_decomposition.inl

detail/backend/omp/dispatch

detail/backend/omp/dispatch/copy.h

detail/backend/omp/for_each.h

detail/backend/omp/for_each.inl

detail/backend/omp/reduce_intervals.h

detail/backend/omp/reduce_intervals.inl

detail/backend/omp/scan.h

detail/backend/omp/scan.inl

detail/backend/omp/set_operations.h

detail/backend/omp/sort.h

detail/backend/omp/sort.inl

detail/backend/partition.h

detail/backend/reduce.h

detail/backend/reduce.inl

detail/backend/reduce_intervals.h

detail/backend/reduce_intervals.inl

detail/backend/remove.h

detail/backend/scan.h

detail/backend/scan.inl

detail/backend/set_operations.h

detail/backend/sort.h

detail/backend/sort.inl

detail/backend/uninitialized_copy.h

detail/backend/unique.h

detail/config/compiler_fence.h

detail/copy.h

detail/copy_if.h

detail/copy_if.inl

detail/functional

detail/functional/actor.h

detail/functional/actor.inl

detail/functional/argument.h

detail/functional/composite.h

detail/functional/operators

detail/functional/operators.h

detail/functional/operators/arithmetic_operators.h

detail/functional/operators/assignment_operator.h

detail/functional/operators/bitwise_operators.h

detail/functional/operators/comma_operator.h

detail/functional/operators/compound_assignment_operators.h

detail/functional/operators/logical_operators.h

detail/functional/operators/operator_adaptors.h

detail/functional/operators/relational_operators.h

detail/functional/placeholder.h

detail/functional/value.h

detail/minmax.h

detail/overlapped_copy.h

detail/pointer_base.h

detail/pointer_base.inl

detail/reference_base.h

detail/reference_base.inl

detail/type_traits/iterator/is_discard_iterator.h

detail/type_traits/pointer_traits.h

detail/type_traits/result_of.h

detail/uninitialized_array.h

detail/uninitialized_array.inl

system/detail/bad_alloc.h

files removed:
detail/device

detail/device/adjacent_difference.h

detail/device/binary_search.h

detail/device/copy.h

detail/device/cuda

detail/device/cuda/arch.h

detail/device/cuda/arch.inl

detail/device/cuda/block

detail/device/cuda/block/copy.h

detail/device/cuda/block/inclusive_scan.h

detail/device/cuda/block/merge.h

detail/device/cuda/block/merge.inl

detail/device/cuda/block/merging_sort.h

detail/device/cuda/block/odd_even_sort.h

detail/device/cuda/block/reduce.h

detail/device/cuda/block/set_difference.h

detail/device/cuda/block/set_difference.inl

detail/device/cuda/block/set_intersection.h

detail/device/cuda/block/set_intersection.inl

detail/device/cuda/block/set_symmetric_difference.h

detail/device/cuda/block/set_symmetric_difference.inl

detail/device/cuda/block/set_union.h

detail/device/cuda/block/set_union.inl

detail/device/cuda/copy.h

detail/device/cuda/copy_cross_space.h

detail/device/cuda/copy_device_to_device.h

detail/device/cuda/copy_if.h

detail/device/cuda/copy_if.inl

detail/device/cuda/detail

detail/device/cuda/detail/b40c

detail/device/cuda/detail/b40c/kernel_utils.h

detail/device/cuda/detail/b40c/radixsort_api.h

detail/device/cuda/detail/b40c/radixsort_kernel_common.h

detail/device/cuda/detail/b40c/radixsort_key_conversion.h

detail/device/cuda/detail/b40c/radixsort_reduction_kernel.h

detail/device/cuda/detail/b40c/radixsort_scanscatter_kernel.h

detail/device/cuda/detail/b40c/radixsort_spine_kernel.h

detail/device/cuda/detail/b40c/vector_types.h

detail/device/cuda/detail/fast_scan.h

detail/device/cuda/detail/fast_scan.inl

detail/device/cuda/detail/get_set_operation_splitter_ranks.h

detail/device/cuda/detail/get_set_operation_splitter_ranks.inl

detail/device/cuda/detail/launch_closure.h

detail/device/cuda/detail/launch_closure.inl

detail/device/cuda/detail/rank_iterator.h

detail/device/cuda/detail/safe_scan.h

detail/device/cuda/detail/safe_scan.inl

detail/device/cuda/detail/set_operation.h

detail/device/cuda/detail/set_operation.inl

detail/device/cuda/detail/split_for_set_operation.h

detail/device/cuda/detail/split_for_set_operation.inl

detail/device/cuda/detail/stable_merge_sort.h

detail/device/cuda/detail/stable_merge_sort.inl

detail/device/cuda/detail/stable_radix_sort.h

detail/device/cuda/detail/stable_radix_sort.inl

detail/device/cuda/detail/stable_radix_sort_bits.h

detail/device/cuda/detail/stable_radix_sort_key.inl

detail/device/cuda/detail/stable_radix_sort_key_value.inl

detail/device/cuda/detail/stable_radix_sort_merrill.inl

detail/device/cuda/detail/stable_radix_sort_util.h

detail/device/cuda/detail/trivial_copy.h

detail/device/cuda/dispatch

detail/device/cuda/dispatch/copy.h

detail/device/cuda/dispatch/reduce.h

detail/device/cuda/dispatch/reduce.inl

detail/device/cuda/dispatch/scan.h

detail/device/cuda/extern_shared_ptr.h

detail/device/cuda/fill.h

detail/device/cuda/fill.inl

detail/device/cuda/for_each.h

detail/device/cuda/for_each.inl

detail/device/cuda/free.h

detail/device/cuda/free.inl

detail/device/cuda/malloc.h

detail/device/cuda/malloc.inl

detail/device/cuda/merge.h

detail/device/cuda/merge.inl

detail/device/cuda/no_throw_free.h

detail/device/cuda/no_throw_free.inl

detail/device/cuda/partition.h

detail/device/cuda/reduce.h

detail/device/cuda/reduce.inl

detail/device/cuda/scalar

detail/device/cuda/scalar/rotate.h

detail/device/cuda/scan.h

detail/device/cuda/scan.inl

detail/device/cuda/segmented_scan.h

detail/device/cuda/segmented_scan.inl

detail/device/cuda/set_difference.inl

detail/device/cuda/set_intersection.inl

detail/device/cuda/set_operations.h

detail/device/cuda/set_symmetric_difference.inl

detail/device/cuda/set_union.inl

detail/device/cuda/sort.h

detail/device/cuda/sort.inl

detail/device/cuda/synchronize.h

detail/device/cuda/synchronize.inl

detail/device/cuda/trivial_copy.h

detail/device/cuda/trivial_copy.inl

detail/device/cuda/warp

detail/device/cuda/warp/any.h

detail/device/cuda/warp/scan.h

detail/device/dereference.h

detail/device/dispatch

detail/device/dispatch/copy.h

detail/device/dispatch/fill.h

detail/device/dispatch/for_each.h

detail/device/dispatch/free.h

detail/device/dispatch/malloc.h

detail/device/dispatch/merge.h

detail/device/dispatch/no_throw_free.h

detail/device/dispatch/reduce.h

detail/device/dispatch/scan.h

detail/device/dispatch/set_operations.h

detail/device/dispatch/sort.h

detail/device/dispatch/uninitialized_copy.h

detail/device/extrema.h

detail/device/fill.h

detail/device/fill.inl

detail/device/find.h

detail/device/for_each.h

detail/device/for_each.inl

detail/device/generic

detail/device/generic/adjacent_difference.h

detail/device/generic/adjacent_difference.inl

detail/device/generic/binary_search.h

detail/device/generic/binary_search.inl

detail/device/generic/copy.h

detail/device/generic/copy_if.h

detail/device/generic/copy_if.inl

detail/device/generic/extrema.h

detail/device/generic/extrema.inl

detail/device/generic/fill.h

detail/device/generic/find.h

detail/device/generic/find.inl

detail/device/generic/free.h

detail/device/generic/malloc.h

detail/device/generic/no_throw_free.h

detail/device/generic/partition.h

detail/device/generic/partition.inl

detail/device/generic/reduce.h

detail/device/generic/reduce.inl

detail/device/generic/reduce_by_key.h

detail/device/generic/reduce_by_key.inl

detail/device/generic/remove.h

detail/device/generic/remove.inl

detail/device/generic/scalar

detail/device/generic/scalar/binary_search.h

detail/device/generic/scalar/binary_search.inl

detail/device/generic/scalar/select.h

detail/device/generic/scalar/select.inl

detail/device/generic/scan_by_key.h

detail/device/generic/scan_by_key.inl

detail/device/generic/unique.h

detail/device/generic/unique.inl

detail/device/internal_allocator.h

detail/device/merge.h

detail/device/no_throw_free.h

detail/device/omp

detail/device/omp/copy.h

detail/device/omp/copy_device_to_device.h

detail/device/omp/copy_device_to_device.inl

detail/device/omp/copy_device_to_host_or_any.h

detail/device/omp/copy_device_to_host_or_any.inl

detail/device/omp/copy_host_or_any_to_device.h

detail/device/omp/copy_host_or_any_to_device.inl

detail/device/omp/detail

detail/device/omp/detail/stable_merge_sort.h

detail/device/omp/detail/stable_merge_sort.inl

detail/device/omp/dispatch

detail/device/omp/dispatch/copy.h

detail/device/omp/dispatch/sort.h

detail/device/omp/for_each.h

detail/device/omp/for_each.inl

detail/device/omp/merge.h

detail/device/omp/reduce.h

detail/device/omp/reduce.inl

detail/device/omp/scan.h

detail/device/omp/scan.inl

detail/device/omp/set_operations.h

detail/device/omp/sort.h

detail/device/omp/sort.inl

detail/device/partition.h

detail/device/reduce.h

detail/device/reduce.inl

detail/device/remove.h

detail/device/scan.h

detail/device/scan.inl

detail/device/set_operations.h

detail/device/sort.h

detail/device/sort.inl

detail/device/uninitialized_copy.h

detail/device/unique.h

detail/dispatch/adjacent_difference.h

detail/dispatch/binary_search.h

detail/dispatch/copy.h

detail/dispatch/extrema.h

detail/dispatch/fill.h

detail/dispatch/find.h

detail/dispatch/for_each.h

detail/dispatch/merge.h

detail/dispatch/partition.h

detail/dispatch/reduce.h

detail/dispatch/remove.h

detail/dispatch/scan.h

detail/dispatch/set_operations.h

detail/dispatch/sort.h

detail/dispatch/unique.h

detail/host

detail/host/adjacent_difference.h

detail/host/binary_search.h

detail/host/copy.h

detail/host/detail

detail/host/detail/copy_backward.h

detail/host/detail/general_copy.h

detail/host/detail/insertion_sort.h

detail/host/detail/merge.h

detail/host/detail/merge.inl

detail/host/detail/stable_merge_sort.h

detail/host/detail/stable_merge_sort.inl

detail/host/detail/trivial_copy.h

detail/host/dispatch

detail/host/dispatch/copy.h

detail/host/extrema.h

detail/host/fill.h

detail/host/find.h

detail/host/for_each.h

detail/host/for_each.inl

detail/host/merge.h

detail/host/partition.h

detail/host/reduce.h

detail/host/remove.h

detail/host/scan.h

detail/host/set_operations.h

detail/host/sort.h

detail/host/sort.inl

detail/host/unique.h

detail/move.h

detail/raw_buffer.h

detail/raw_buffer.inl

files modified:
CHANGELOG

THANKS

adjacent_difference.h

copy.h

count.h

debian/changelog

debian/copyright

detail/adjacent_difference.inl

detail/binary_search.inl

detail/config/config.h

detail/copy.inl

detail/cstdint.h

detail/device_free.inl

detail/device_malloc.inl

detail/device_ptr.inl

detail/device_reference.inl

detail/dispatch/uninitialized_copy.h

detail/extrema.inl

detail/fill.inl

detail/find.inl

detail/for_each.inl

detail/generate.inl

detail/internal_functional.h

detail/merge.inl

detail/mpl/math.h

detail/partition.inl

detail/reduce.inl

detail/remove.inl

detail/reverse.inl

detail/scan.inl

detail/sequence.inl

detail/set_operations.inl

detail/sort.inl

detail/swap_ranges.inl

detail/transform.inl

detail/transform_scan.inl

detail/trivial_sequence.h

detail/type_traits.h

detail/type_traits/function_traits.h

detail/unique.inl

detail/vector_base.h

detail/vector_base.inl

device_allocator.h

device_delete.h

device_free.h

device_malloc.h

device_malloc_allocator.h

device_new.h

device_new_allocator.h

device_ptr.h

device_reference.h

device_vector.h

distance.h

equal.h

experimental/cuda/pinned_allocator.h

extrema.h

fill.h

find.h

for_each.h

functional.h

gather.h

generate.h

host_vector.h

inner_product.h

iterator/constant_iterator.h

iterator/counting_iterator.h

iterator/detail/constant_iterator.inl

iterator/detail/counting_iterator.inl

iterator/detail/discard_iterator.inl

iterator/detail/forced_iterator.h

iterator/detail/iterator_traits.inl

iterator/detail/normal_iterator.h

iterator/detail/permutation_iterator.inl

iterator/detail/reverse_iterator.inl

iterator/detail/transform_iterator.inl

iterator/detail/zip_iterator.inl

iterator/detail/zip_iterator_base.h

iterator/discard_iterator.h

iterator/iterator_adaptor.h

iterator/iterator_categories.h

iterator/iterator_facade.h

iterator/iterator_traits.h

iterator/permutation_iterator.h

iterator/reverse_iterator.h

iterator/transform_iterator.h

iterator/zip_iterator.h

logical.h

merge.h

mismatch.h

pair.h

partition.h

random/linear_feedback_shift_engine.h

random/uniform_int_distribution.h

random/uniform_real_distribution.h

reduce.h

remove.h

replace.h

reverse.h

scan.h

scatter.h

sequence.h

set_operations.h

sort.h

swap.h

system/cuda_error.h

system/system_error.h

system_error.h

transform.h

transform_reduce.h

transform_scan.h

tuple.h

uninitialized_copy.h

uninitialized_fill.h

unique.h

version.h

Show diffs side-by-side

added added

removed removed

detail/backend/cuda/block/reduce.h

* Licensed under the Apache License, Version 2.0 (the "License");

* you may not use this file except in compliance with the License.

* You may obtain a copy of the License at

* http://www.apache.org/licenses/LICENSE-2.0

* Unless required by applicable law or agreed to in writing, software

* distributed under the License is distributed on an "AS IS" BASIS,

* WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

* See the License for the specific language governing permissions and

* limitations under the License.

#pragma once

#include <thrust/detail/config.h>

// do not attempt to compile this file, which uses CUDA built-in variables, with any compiler other than nvcc

#if THRUST_DEVICE_COMPILER == THRUST_DEVICE_COMPILER_NVCC

#include <thrust/iterator/iterator_traits.h>

namespace thrust

{

namespace detail

{

namespace backend

{

namespace cuda

{

namespace block

{

template <unsigned int block_size, typename ValueIterator, typename BinaryFunction>

__device__ __forceinline__

void reduce(ValueIterator data, BinaryFunction binary_op)

{

// TODO generalize this code with TMP

if (block_size >= 1024) { if (threadIdx.x < 512) { data[threadIdx.x] = binary_op(data[threadIdx.x], data[threadIdx.x + 512]); } __syncthreads(); }

if (block_size >= 512) { if (threadIdx.x < 256) { data[threadIdx.x] = binary_op(data[threadIdx.x], data[threadIdx.x + 256]); } __syncthreads(); }

if (block_size >= 256) { if (threadIdx.x < 128) { data[threadIdx.x] = binary_op(data[threadIdx.x], data[threadIdx.x + 128]); } __syncthreads(); }

if (block_size >= 128) { if (threadIdx.x < 64) { data[threadIdx.x] = binary_op(data[threadIdx.x], data[threadIdx.x + 64]); } __syncthreads(); }

if (block_size >= 64) { if (threadIdx.x < 32) { data[threadIdx.x] = binary_op(data[threadIdx.x], data[threadIdx.x + 32]); } __syncthreads(); }

if (block_size >= 32) { if (threadIdx.x < 16) { data[threadIdx.x] = binary_op(data[threadIdx.x], data[threadIdx.x + 16]); } __syncthreads(); }

if (block_size >= 16) { if (threadIdx.x < 8) { data[threadIdx.x] = binary_op(data[threadIdx.x], data[threadIdx.x + 8]); } __syncthreads(); }

if (block_size >= 8) { if (threadIdx.x < 4) { data[threadIdx.x] = binary_op(data[threadIdx.x], data[threadIdx.x + 4]); } __syncthreads(); }

if (block_size >= 4) { if (threadIdx.x < 2) { data[threadIdx.x] = binary_op(data[threadIdx.x], data[threadIdx.x + 2]); } __syncthreads(); }

if (block_size >= 2) { if (threadIdx.x < 1) { data[threadIdx.x] = binary_op(data[threadIdx.x], data[threadIdx.x + 1]); } __syncthreads(); }

}

template <typename ValueIterator, typename BinaryFunction>

__device__ __forceinline__

void reduce_n(ValueIterator data, unsigned int n, BinaryFunction binary_op)

{

if (blockDim.x < n)

{

for (unsigned int i = blockDim.x + threadIdx.x; i < n; i += blockDim.x)

data[threadIdx.x] = binary_op(data[threadIdx.x], data[i]);

__syncthreads();

}

while (n > 1)

{

unsigned int half = n / 2;

if (threadIdx.x < half)

data[threadIdx.x] = binary_op(data[threadIdx.x], data[n - threadIdx.x - 1]);

__syncthreads();

n = n - half;

}

} // end namespace block

} // end namespace cuda

} // end namespace backend

} // end namespace detail

} // end namespace thrust

#endif // THRUST_DEVICE_COMPILER == THRUST_DEVICE_COMPILER_NVCC

Older »