Merge pull request #198 from iotamudelta/lookup_bag

iotamudelta · web-flow · commit b5cc4ebeed44 · 2018-09-13T16:08:44.000-05:00
Correct the warp size for current AMD GPUs.
diff --git a/aten/src/THCUNN/LookupTableBag.cu b/aten/src/THCUNN/LookupTableBag.cu
@@ -15,7 +15,11 @@
 #include "THCHalfAutoNumerics.cuh"
 #include "THCTensorSort.cuh"
 
+#if defined(__HIP_PLATFORM_HCC__)
+const int WARP_SIZE = 64;
+#else
 const int WARP_SIZE = 32;
+#endif
 const int MODE_SUM = 0;
 const int MODE_MEAN = 1;
 
diff --git a/cmake/public/LoadHIP.cmake b/cmake/public/LoadHIP.cmake
@@ -47,7 +47,7 @@ ENDIF()
 
 # ROCFFT_PATH
 IF(NOT DEFINED ENV{ROCFFT_PATH})
-  SET(ROCBLAS_PATH ${ROCM_PATH}/rocfft)
+  SET(ROCFFT_PATH ${ROCM_PATH}/rocfft)
 ELSE()
   SET(ROCFFT_PATH $ENV{ROCFFT_PATH})
 ENDIF()