hashcat/deps/sse2neon/tests/common.h

#ifndef SSE2NEONCOMMON_H
#define SSE2NEONCOMMON_H
#include <cstdint>
#if (defined(__aarch64__) || defined(_M_ARM64) || defined(_M_ARM64EC)) || \
    defined(__arm__)
#include "sse2neon.h"
#elif defined(__x86_64__) || defined(__i386__)
#include <emmintrin.h>
#include <smmintrin.h>
#include <tmmintrin.h>
#include <wmmintrin.h>
#include <x86intrin.h>
#include <xmmintrin.h>

// __int64 is defined in the Intrinsics Guide which maps to different datatype
// in different data model
#if !(defined(_WIN32) || defined(_WIN64) || defined(__int64))
#if (defined(__x86_64__) || defined(__i386__))
#define __int64 long long
#else
#define __int64 int64_t
#endif
#endif

#if defined(__GNUC__) || defined(__clang__)
#pragma push_macro("ALIGN_STRUCT")
#define ALIGN_STRUCT(x) __attribute__((aligned(x)))
#else
#define ALIGN_STRUCT(x) __declspec(align(x))
#endif

typedef union ALIGN_STRUCT(16) SIMDVec {
    float m128_f32[4];     // as floats - DON'T USE. Added for convenience.
    int8_t m128_i8[16];    // as signed 8-bit integers.
    int16_t m128_i16[8];   // as signed 16-bit integers.
    int32_t m128_i32[4];   // as signed 32-bit integers.
    int64_t m128_i64[2];   // as signed 64-bit integers.
    uint8_t m128_u8[16];   // as unsigned 8-bit integers.
    uint16_t m128_u16[8];  // as unsigned 16-bit integers.
    uint32_t m128_u32[4];  // as unsigned 32-bit integers.
    uint64_t m128_u64[2];  // as unsigned 64-bit integers.
} SIMDVec;

#if defined(__GNUC__) || defined(__clang__)
#pragma pop_macro("ALIGN_STRUCT")
#endif

/* Tunable testing configuration for precise testing */
/* _mm_min|max_ps|ss|pd|sd */
#ifndef SSE2NEON_PRECISE_MINMAX
#define SSE2NEON_PRECISE_MINMAX (0)
#endif
#endif

#define ASSERT_RETURN(x) \
    if (!(x))            \
        return TEST_FAIL;

namespace SSE2NEON
{
enum result_t {
    TEST_SUCCESS = 1,
    TEST_FAIL = 0,
    TEST_UNIMPL = -1,
};
extern int32_t NaN;
extern int64_t NaN64;

#if defined(__GNUC__) && !defined(__clang__)
#pragma push_macro("OPTNONE")
#define OPTNONE __attribute__((optimize("O0")))
#elif defined(__clang__)
#pragma push_macro("OPTNONE")
#define OPTNONE __attribute__((optnone))
#else
#define OPTNONE
#endif

#include <string.h>
static inline double sse2neon_tool_recast_f64(uint64_t u64)
{
    double f64;
    memcpy(&f64, &u64, sizeof(uint64_t));
    return f64;
}
static inline int64_t sse2neon_tool_recast_i64(double f64)
{
    int64_t i64;
    memcpy(&i64, &f64, sizeof(int64_t));
    return i64;
}
static inline float sse2neon_tool_recast_f32(uint32_t u32)
{
    float f32;
    memcpy(&f32, &u32, sizeof(uint32_t));
    return f32;
}
static inline float sse2neon_tool_recast_f32(int32_t i32)
{
    float f32;
    memcpy(&f32, &i32, sizeof(int32_t));
    return f32;
}
#define ALL_BIT_1_32 sse2neon_tool_recast_f32(UINT32_MAX)
#define ALL_BIT_1_64 sse2neon_tool_recast_f64(UINT64_MAX)

template <typename T>
result_t validate128(T a, T b)
{
    const int32_t *t1 = (const int32_t *) &a;
    const int32_t *t2 = (const int32_t *) &b;

    ASSERT_RETURN(t1[0] == t2[0]);
    ASSERT_RETURN(t1[1] == t2[1]);
    ASSERT_RETURN(t1[2] == t2[2]);
    ASSERT_RETURN(t1[3] == t2[3]);
    return TEST_SUCCESS;
}
result_t validateInt64(__m128i a, int64_t i0, int64_t i1);
result_t validateInt64(__m64 a, int64_t i0);
result_t validateUInt64(__m128i a, uint64_t u0, uint64_t u1);
result_t validateUInt64(__m64 a, uint64_t u0);
result_t validateInt32(__m128i a,
                       int32_t i0,
                       int32_t i1,
                       int32_t i2,
                       int32_t i3);
result_t validateUInt32(__m128i a,
                        uint32_t u0,
                        uint32_t u1,
                        uint32_t u2,
                        uint32_t u3);
result_t validateUInt32(__m64 a, uint32_t u0, uint32_t u1);
result_t validateInt32(__m64 a, int32_t u0, int32_t u1);
result_t validateInt16(__m128i a,
                       int16_t i0,
                       int16_t i1,
                       int16_t i2,
                       int16_t i3,
                       int16_t i4,
                       int16_t i5,
                       int16_t i6,
                       int16_t i7);
result_t validateInt16(__m64 a, int16_t i0, int16_t i1, int16_t i2, int16_t i3);
result_t validateUInt16(__m128i a,
                        uint16_t u0,
                        uint16_t u1,
                        uint16_t u2,
                        uint16_t u3,
                        uint16_t u4,
                        uint16_t u5,
                        uint16_t u6,
                        uint16_t u7);
result_t validateUInt16(__m64 a,
                        uint16_t u0,
                        uint16_t u1,
                        uint16_t u2,
                        uint16_t u3);
result_t validateInt8(__m128i a,
                      int8_t i0,
                      int8_t i1,
                      int8_t i2,
                      int8_t i3,
                      int8_t i4,
                      int8_t i5,
                      int8_t i6,
                      int8_t i7,
                      int8_t i8,
                      int8_t i9,
                      int8_t i10,
                      int8_t i11,
                      int8_t i12,
                      int8_t i13,
                      int8_t i14,
                      int8_t i15);
result_t validateInt8(__m64 a,
                      int8_t i0,
                      int8_t i1,
                      int8_t i2,
                      int8_t i3,
                      int8_t i4,
                      int8_t i5,
                      int8_t i6,
                      int8_t i7);
result_t validateUInt8(__m128i a,
                       uint8_t u0,
                       uint8_t u1,
                       uint8_t u2,
                       uint8_t u3,
                       uint8_t u4,
                       uint8_t u5,
                       uint8_t u6,
                       uint8_t u7,
                       uint8_t u8,
                       uint8_t u9,
                       uint8_t u10,
                       uint8_t u11,
                       uint8_t u12,
                       uint8_t u13,
                       uint8_t u14,
                       uint8_t u15);
result_t validateUInt8(__m64 a,
                       uint8_t u0,
                       uint8_t u1,
                       uint8_t u2,
                       uint8_t u3,
                       uint8_t u4,
                       uint8_t u5,
                       uint8_t u6,
                       uint8_t u7);
result_t validateSingleFloatPair(float a, float b);
result_t validateSingleDoublePair(double a, double b);
result_t validateFloat(__m128 a, float f0, float f1, float f2, float f3);
result_t validateFloatEpsilon(__m128 a,
                              float f0,
                              float f1,
                              float f2,
                              float f3,
                              float epsilon);
result_t validateFloatError(__m128 a,
                            float f0,
                            float f1,
                            float f2,
                            float f3,
                            float err);
result_t validateDouble(__m128d a, double d0, double d1);
result_t validateFloatError(__m128d a, double d0, double d1, double err);

#define VALIDATE_INT8_M128(A, B)                                          \
    validateInt8(A, B[0], B[1], B[2], B[3], B[4], B[5], B[6], B[7], B[8], \
                 B[9], B[10], B[11], B[12], B[13], B[14], B[15])
#define VALIDATE_UINT8_M128(A, B)                                          \
    validateUInt8(A, B[0], B[1], B[2], B[3], B[4], B[5], B[6], B[7], B[8], \
                  B[9], B[10], B[11], B[12], B[13], B[14], B[15])
#define VALIDATE_INT16_M128(A, B) \
    validateInt16(A, B[0], B[1], B[2], B[3], B[4], B[5], B[6], B[7])
#define VALIDATE_UINT16_M128(A, B) \
    validateUInt16(A, B[0], B[1], B[2], B[3], B[4], B[5], B[6], B[7])
#define VALIDATE_INT32_M128(A, B) validateInt32(A, B[0], B[1], B[2], B[3])
#define VALIDATE_UINT32_M128(A, B) validateUInt32(A, B[0], B[1], B[2], B[3])

#define VALIDATE_INT8_M64(A, B) \
    validateInt8(A, B[0], B[1], B[2], B[3], B[4], B[5], B[6], B[7])
#define VALIDATE_UINT8_M64(A, B) \
    validateUInt8(A, B[0], B[1], B[2], B[3], B[4], B[5], B[6], B[7])
#define VALIDATE_INT16_M64(A, B) validateInt16(A, B[0], B[1], B[2], B[3])
#define VALIDATE_UINT16_M64(A, B) validateUInt16(A, B[0], B[1], B[2], B[3])
#define VALIDATE_INT32_M64(A, B) validateInt32(A, B[0], B[1])
#define VALIDATE_UINT32_M64(A, B) validateUInt32(A, B[0], B[1])
#define CHECK_RESULT(EXP)      \
    if (EXP != TEST_SUCCESS) { \
        return TEST_FAIL;      \
    }
#define IMM_2_ITER \
    TEST_IMPL(0)   \
    TEST_IMPL(1)
#define IMM_4_ITER \
    IMM_2_ITER     \
    TEST_IMPL(2)   \
    TEST_IMPL(3)
#define IMM_8_ITER \
    IMM_4_ITER     \
    TEST_IMPL(4)   \
    TEST_IMPL(5)   \
    TEST_IMPL(6)   \
    TEST_IMPL(7)
#define IMM_16_ITER \
    IMM_8_ITER      \
    TEST_IMPL(8)    \
    TEST_IMPL(9)    \
    TEST_IMPL(10)   \
    TEST_IMPL(11)   \
    TEST_IMPL(12)   \
    TEST_IMPL(13)   \
    TEST_IMPL(14)   \
    TEST_IMPL(15)
#define IMM_32_ITER \
    IMM_16_ITER     \
    TEST_IMPL(16)   \
    TEST_IMPL(17)   \
    TEST_IMPL(18)   \
    TEST_IMPL(19)   \
    TEST_IMPL(20)   \
    TEST_IMPL(21)   \
    TEST_IMPL(22)   \
    TEST_IMPL(23)   \
    TEST_IMPL(24)   \
    TEST_IMPL(25)   \
    TEST_IMPL(26)   \
    TEST_IMPL(27)   \
    TEST_IMPL(28)   \
    TEST_IMPL(29)   \
    TEST_IMPL(30)   \
    TEST_IMPL(31)
#define IMM_64_ITER \
    IMM_32_ITER     \
    TEST_IMPL(32)   \
    TEST_IMPL(33)   \
    TEST_IMPL(34)   \
    TEST_IMPL(35)   \
    TEST_IMPL(36)   \
    TEST_IMPL(37)   \
    TEST_IMPL(38)   \
    TEST_IMPL(39)   \
    TEST_IMPL(40)   \
    TEST_IMPL(41)   \
    TEST_IMPL(42)   \
    TEST_IMPL(43)   \
    TEST_IMPL(44)   \
    TEST_IMPL(45)   \
    TEST_IMPL(46)   \
    TEST_IMPL(47)   \
    TEST_IMPL(48)   \
    TEST_IMPL(49)   \
    TEST_IMPL(50)   \
    TEST_IMPL(51)   \
    TEST_IMPL(52)   \
    TEST_IMPL(53)   \
    TEST_IMPL(54)   \
    TEST_IMPL(55)   \
    TEST_IMPL(56)   \
    TEST_IMPL(57)   \
    TEST_IMPL(58)   \
    TEST_IMPL(59)   \
    TEST_IMPL(60)   \
    TEST_IMPL(61)   \
    TEST_IMPL(62)   \
    TEST_IMPL(63)
#define IMM_128_ITER \
    IMM_64_ITER      \
    TEST_IMPL(64)    \
    TEST_IMPL(65)    \
    TEST_IMPL(66)    \
    TEST_IMPL(67)    \
    TEST_IMPL(68)    \
    TEST_IMPL(69)    \
    TEST_IMPL(70)    \
    TEST_IMPL(71)    \
    TEST_IMPL(72)    \
    TEST_IMPL(73)    \
    TEST_IMPL(74)    \
    TEST_IMPL(75)    \
    TEST_IMPL(76)    \
    TEST_IMPL(77)    \
    TEST_IMPL(78)    \
    TEST_IMPL(79)    \
    TEST_IMPL(80)    \
    TEST_IMPL(81)    \
    TEST_IMPL(82)    \
    TEST_IMPL(83)    \
    TEST_IMPL(84)    \
    TEST_IMPL(85)    \
    TEST_IMPL(86)    \
    TEST_IMPL(87)    \
    TEST_IMPL(88)    \
    TEST_IMPL(89)    \
    TEST_IMPL(90)    \
    TEST_IMPL(91)    \
    TEST_IMPL(92)    \
    TEST_IMPL(93)    \
    TEST_IMPL(94)    \
    TEST_IMPL(95)    \
    TEST_IMPL(96)    \
    TEST_IMPL(97)    \
    TEST_IMPL(98)    \
    TEST_IMPL(99)    \
    TEST_IMPL(100)   \
    TEST_IMPL(101)   \
    TEST_IMPL(102)   \
    TEST_IMPL(103)   \
    TEST_IMPL(104)   \
    TEST_IMPL(105)   \
    TEST_IMPL(106)   \
    TEST_IMPL(107)   \
    TEST_IMPL(108)   \
    TEST_IMPL(109)   \
    TEST_IMPL(110)   \
    TEST_IMPL(111)   \
    TEST_IMPL(112)   \
    TEST_IMPL(113)   \
    TEST_IMPL(114)   \
    TEST_IMPL(115)   \
    TEST_IMPL(116)   \
    TEST_IMPL(117)   \
    TEST_IMPL(118)   \
    TEST_IMPL(119)   \
    TEST_IMPL(120)   \
    TEST_IMPL(121)   \
    TEST_IMPL(122)   \
    TEST_IMPL(123)   \
    TEST_IMPL(124)   \
    TEST_IMPL(125)   \
    TEST_IMPL(126)   \
    TEST_IMPL(127)
#define IMM_256_ITER \
    IMM_128_ITER     \
    TEST_IMPL(128)   \
    TEST_IMPL(129)   \
    TEST_IMPL(130)   \
    TEST_IMPL(131)   \
    TEST_IMPL(132)   \
    TEST_IMPL(133)   \
    TEST_IMPL(134)   \
    TEST_IMPL(135)   \
    TEST_IMPL(136)   \
    TEST_IMPL(137)   \
    TEST_IMPL(138)   \
    TEST_IMPL(139)   \
    TEST_IMPL(140)   \
    TEST_IMPL(141)   \
    TEST_IMPL(142)   \
    TEST_IMPL(143)   \
    TEST_IMPL(144)   \
    TEST_IMPL(145)   \
    TEST_IMPL(146)   \
    TEST_IMPL(147)   \
    TEST_IMPL(148)   \
    TEST_IMPL(149)   \
    TEST_IMPL(150)   \
    TEST_IMPL(151)   \
    TEST_IMPL(152)   \
    TEST_IMPL(153)   \
    TEST_IMPL(154)   \
    TEST_IMPL(155)   \
    TEST_IMPL(156)   \
    TEST_IMPL(157)   \
    TEST_IMPL(158)   \
    TEST_IMPL(159)   \
    TEST_IMPL(160)   \
    TEST_IMPL(161)   \
    TEST_IMPL(162)   \
    TEST_IMPL(163)   \
    TEST_IMPL(164)   \
    TEST_IMPL(165)   \
    TEST_IMPL(166)   \
    TEST_IMPL(167)   \
    TEST_IMPL(168)   \
    TEST_IMPL(169)   \
    TEST_IMPL(170)   \
    TEST_IMPL(171)   \
    TEST_IMPL(172)   \
    TEST_IMPL(173)   \
    TEST_IMPL(174)   \
    TEST_IMPL(175)   \
    TEST_IMPL(176)   \
    TEST_IMPL(177)   \
    TEST_IMPL(178)   \
    TEST_IMPL(179)   \
    TEST_IMPL(180)   \
    TEST_IMPL(181)   \
    TEST_IMPL(182)   \
    TEST_IMPL(183)   \
    TEST_IMPL(184)   \
    TEST_IMPL(185)   \
    TEST_IMPL(186)   \
    TEST_IMPL(187)   \
    TEST_IMPL(188)   \
    TEST_IMPL(189)   \
    TEST_IMPL(190)   \
    TEST_IMPL(191)   \
    TEST_IMPL(192)   \
    TEST_IMPL(193)   \
    TEST_IMPL(194)   \
    TEST_IMPL(195)   \
    TEST_IMPL(196)   \
    TEST_IMPL(197)   \
    TEST_IMPL(198)   \
    TEST_IMPL(199)   \
    TEST_IMPL(200)   \
    TEST_IMPL(201)   \
    TEST_IMPL(202)   \
    TEST_IMPL(203)   \
    TEST_IMPL(204)   \
    TEST_IMPL(205)   \
    TEST_IMPL(206)   \
    TEST_IMPL(207)   \
    TEST_IMPL(208)   \
    TEST_IMPL(209)   \
    TEST_IMPL(210)   \
    TEST_IMPL(211)   \
    TEST_IMPL(212)   \
    TEST_IMPL(213)   \
    TEST_IMPL(214)   \
    TEST_IMPL(215)   \
    TEST_IMPL(216)   \
    TEST_IMPL(217)   \
    TEST_IMPL(218)   \
    TEST_IMPL(219)   \
    TEST_IMPL(220)   \
    TEST_IMPL(221)   \
    TEST_IMPL(222)   \
    TEST_IMPL(223)   \
    TEST_IMPL(224)   \
    TEST_IMPL(225)   \
    TEST_IMPL(226)   \
    TEST_IMPL(227)   \
    TEST_IMPL(228)   \
    TEST_IMPL(229)   \
    TEST_IMPL(230)   \
    TEST_IMPL(231)   \
    TEST_IMPL(232)   \
    TEST_IMPL(233)   \
    TEST_IMPL(234)   \
    TEST_IMPL(235)   \
    TEST_IMPL(236)   \
    TEST_IMPL(237)   \
    TEST_IMPL(238)   \
    TEST_IMPL(239)   \
    TEST_IMPL(240)   \
    TEST_IMPL(241)   \
    TEST_IMPL(242)   \
    TEST_IMPL(243)   \
    TEST_IMPL(244)   \
    TEST_IMPL(245)   \
    TEST_IMPL(246)   \
    TEST_IMPL(247)   \
    TEST_IMPL(248)   \
    TEST_IMPL(249)   \
    TEST_IMPL(250)   \
    TEST_IMPL(251)   \
    TEST_IMPL(252)   \
    TEST_IMPL(253)   \
    TEST_IMPL(254)   \
    TEST_IMPL(255)
}  // namespace SSE2NEON

#endif