arrayfire
diff --git a/‎src/backend/common/half.hpp‎
Lines changed: 18 additions & 6 deletions b/‎src/backend/common/half.hpp‎
Lines changed: 18 additions & 6 deletions
diff --git a/‎src/backend/cpu/kernel/random_engine.hpp‎
Lines changed: 13 additions & 21 deletions b/‎src/backend/cpu/kernel/random_engine.hpp‎
Lines changed: 13 additions & 21 deletions
@@ -822,7 +822,7 @@ AF_CONSTEXPR __DH__ static inline bool isinf(half val) noexcept;
 AF_CONSTEXPR __DH__ static inline bool isnan(common::half val) noexcept;
 
 class alignas(2) half {
-    native_half_t data_ = 0;
+    native_half_t data_ = native_half_t();
 
 #if !defined(NVCC) && !defined(__CUDACC_RTC__)
     // NVCC on OSX performs a weird transformation where it removes the std::
@@ -881,11 +881,19 @@ class alignas(2) half {
         return *this;
     }
 
-#if defined(__CUDA_ARCH__)
-    AF_CONSTEXPR __DH__ explicit half(const __half& value) noexcept
-        : data_(value) {}
-    AF_CONSTEXPR __DH__ half& operator=(__half&& value) noexcept {
-        data_ = value;
+#if defined(NVCC) || defined(__CUDACC_RTC__)
+    AF_CONSTEXPR __DH__ explicit half(__half value) noexcept
+#ifdef __CUDA_ARCH__
+        : data_(value) {
+    }
+#else
+        : data_(*reinterpret_cast<native_half_t*>(&value)) {
+    }
+#endif
+    AF_CONSTEXPR __DH__ half& operator=(__half value) noexcept {
+        // NOTE Assignment to ushort from __half only works with device code.
+        // using memcpy instead
+        data_ = *reinterpret_cast<native_half_t*>(&value);
         return *this;
     }
 #endif
@@ -988,7 +996,11 @@ class alignas(2) half {
 
     AF_CONSTEXPR static half infinity() {
         half out;
+#ifdef __CUDA_ARCH__
+        out.data_ = __half_raw{0x7C00};
+#else
         out.data_ = 0x7C00;
+#endif
         return out;
     }
 };
 
@@ -32,22 +32,9 @@ static const double PI_VAL =
     3.1415926535897932384626433832795028841971693993751058209749445923078164;
 
 // Conversion to half adapted from Random123
-#define HALF_FACTOR ((1.0f) / (std::numeric_limits<ushort>::max() + (1.0f)))
-#define HALF_HALF_FACTOR ((0.5f) * HALF_FACTOR)
-
-// Conversion to half adapted from Random123
-#define SIGNED_HALF_FACTOR \
-    ((1.0f) / (std::numeric_limits<short>::max() + (1.0f)))
-#define SIGNED_HALF_HALF_FACTOR ((0.5f) * SIGNED_HALF_FACTOR)
-
-#define DBL_FACTOR \
-    ((1.0) / (std::numeric_limits<unsigned long long>::max() + (1.0)))
-#define HALF_DBL_FACTOR ((0.5) * DBL_FACTOR)
-
-// Conversion to floats adapted from Random123
-#define SIGNED_DBL_FACTOR \
-    ((1.0) / (std::numeric_limits<long long>::max() + (1.0)))
-#define SIGNED_HALF_DBL_FACTOR ((0.5) * SIGNED_DBL_FACTOR)
+constexpr float unsigned_half_factor =
+    ((1.0f) / (std::numeric_limits<ushort>::max() + (1.0f)));
+constexpr float unsigned_half_half_factor((0.5f) * unsigned_half_factor);
 
 template<typename T>
 T transform(uint *val, uint index);
@@ -85,14 +72,19 @@ static float getFloatNegative11(uint *val, uint index) {
 // Generates rationals in [0, 1)
 common::half getHalf01(uint *val, uint index) {
     float v = val[index >> 1U] >> (16U * (index & 1U)) & 0x0000ffff;
-    return static_cast<common::half>(fmaf(v, HALF_FACTOR, HALF_HALF_FACTOR));
+    return static_cast<common::half>(
+        fmaf(v, unsigned_half_factor, unsigned_half_half_factor));
 }
 
 // Generates rationals in (-1, 1]
 static common::half getHalfNegative11(uint *val, uint index) {
     float v = val[index >> 1U] >> (16U * (index & 1U)) & 0x0000ffff;
-    return static_cast<common::half>(
-        fmaf(v, SIGNED_HALF_FACTOR, SIGNED_HALF_HALF_FACTOR));
+    // Conversion to half adapted from Random123
+    constexpr float factor =
+        ((1.0f) / (std::numeric_limits<short>::max() + (1.0f)));
+    constexpr float half_factor = ((0.5f) * factor);
+
+    return static_cast<common::half>(fmaf(v, factor, half_factor));
 }
 
 // Generates rationals in [0, 1)
@@ -160,8 +152,8 @@ double transform<double>(uint *val, uint index) {
 template<>
 common::half transform<common::half>(uint *val, uint index) {
     float v = val[index >> 1U] >> (16U * (index & 1U)) & 0x0000ffff;
-    return static_cast<common::half>(1.f -
-                                     fmaf(v, HALF_FACTOR, HALF_HALF_FACTOR));
+    return static_cast<common::half>(
+        1.f - fmaf(v, unsigned_half_factor, unsigned_half_half_factor));
 }
 
 // Generates rationals in [-1, 1)