tbb

0열

1답변

현재 두 개의 요소 사이의 최대 차이를 계산하기 위해 병렬 알고리즘을 구현 중이며 더 큰 숫자 앞에 작은 숫자가 표시됩니다. 나는 이것을 달성하기 위해 tb30 라이브러리에서 parallel_invoke을 사용하고있다. 내 구현 내가 출력 또는 최대 차이는 있지만 보이는 12되어야하는 상기 샘플의 샘플 배열 int src[] = {12, 9, 18, 3,

2열

1답변

동적으로 할당 된 stl 컨테이너에 할당자를 설정하는 방법은 무엇입니까?

TBB 사용자 지정 메모리 할당자를 사용하고 있습니다. tbb::memory_pool<std::allocator<char>> shortTermPool; typedef tbb::memory_pool_allocator<Result*> custom_allocator; std::vector<Result*,custom_allocator>* results =(st

2열

2답변

TBB equivalent with C++ 11

새로운 환경에서 일부 구현을 사용하려는 오래된 코드베이스가 있습니다. 이전의베이스는 TBB 프레임 워크를 사용했는데, 실제로 익숙하지 않았습니다. 는 C++ 11이 TBB의 유형 implementaions 어떤 등가물 있습니다 TBB :: enumerable_thread_specific < ...> mutex_t mutex_t :: scoped_lock 만

1열

2답변

tbb :: task_scheduler_init를 사용하여 32 개가 넘는 스레드를 만들 수없는 이유는 무엇입니까?

task_scheduler_init를 사용하여 프로그램의 스레드 수를 제어하려고했습니다. 그러나, 내가 설정 한 스레드의 수에 관계없이 최대 스레드 수는 32 개입니다. i7을 사용하고 8 개의 로직 코어가 있습니다. 예를 들어, task_scheduler_init를 이와 같이 설정합니다. tbb::task_scheduler_init init(100);

0열

2답변

TBB 나는 자식 작업을 파괴해야합니까, 아니면 부모가 돌보고 있습니까?

부모가 파괴되면 자식도 자동으로 파괴됩니까? 아니면 명시 적으로 파괴해야합니까? tbb::task *parent = new(tbb::task::allocate_root()) tbb::empty_task; parent->increment_ref_count(); for (...){ new(parent->allocate_child()) aSampl

0열

2답변

tbb를 사용하는 배열에서 병렬 순서 보존 선택

나는 range-image을 가지고 있으며 libpointmatcher point cloud으로 변환하려고합니다. 구름은 4 행 (x, y, z, 1)과 모든 점에 대해 여러 개의 열이있는 Eigen::Matrix입니다. 범위 이미지는 범위 값 (z)과 픽셀 가시성에 대한 정보가 포함 된 unsigned char* 배열을 포함하여 unsigned short

0열

3답변

TBB 동시 정렬되지 않은 맵으로 인해 segfault가 발생합니다.

동시에 삽입하고 가져 오는 다중 스레드를 지원하는 거대한 해시 테이블을 구현해야합니다. 키는 int이고 두 번째 요소는 객체 T의 벡터입니다. class T { //class definitions here } 현재 구현에는 tbb :: concurrent_unordered_map이 도움이됩니다. 이 문서에서는 삽입 및 순회를 동시에 허용하는

1열

2답변

효율적으로 TBB 스레드의 결과를 병합하는 방법

개체의 시각적 감지를 위해 노력하고 있으며 Opencv의 계단식 분류기를 사용합니다. 그것은 잘 작동하지만 너무 느립니다. 나는 Vtune을 사용하여 모든 핫스팟을 얻었으며 140 초에 걸친 실행 (CPU 시간, 실제는 약 60 초)에 123 초의 오버 헤드 시간이 있다는 것을 알았습니다. cvCascadeClassifier는 TBB를 사용하여 더 빠르지

0열

1답변

TBB 오류

를 컴파일 할 때 내가 내가 내가 합계를 계산하는 parllel_for 의 사용을 만들려고 노력하고 #include <iostream> #include <cstring> #include "tbb/tbb.h" using namespace std; using namespace tbb; class Accumulate{ float& arr;

3열

1답변

인텔 TBB를 사용하는 비효율적 인 fibonacci 시리즈 비 스레드 구현보다 훨씬 느림

필자의 병렬화 된 버전의 fibonacci 구현 (비효율적이며 라이브러리의 성능을 비교하는 것)은 일반적인 비효율적 인 구현보다 훨씬 느린 것으로 나타났습니다. 내 i7-6700HQ 프로세서의 8 개 논리 코어를 모두 사용한 후에도 마찬가지입니다. 처리기 팬들은 비 병렬 처리에 비해 처리 시간이 매우 느리다는 것을 알기 시작했습니다. 예는 인텔의 TBB 튜