25 #error "Never use <avx512bwintrin.h> directly; include <immintrin.h> instead." 28 #ifndef __AVX512BWINTRIN_H 29 #define __AVX512BWINTRIN_H 35 #define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("avx512bw"))) 39 return (__m512i)(__v64qi){ 0, 0, 0, 0, 0, 0, 0, 0,
40 0, 0, 0, 0, 0, 0, 0, 0,
41 0, 0, 0, 0, 0, 0, 0, 0,
42 0, 0, 0, 0, 0, 0, 0, 0,
43 0, 0, 0, 0, 0, 0, 0, 0,
44 0, 0, 0, 0, 0, 0, 0, 0,
45 0, 0, 0, 0, 0, 0, 0, 0,
46 0, 0, 0, 0, 0, 0, 0, 0 };
51 return (__m512i)(__v32hi){ 0, 0, 0, 0, 0, 0, 0, 0,
52 0, 0, 0, 0, 0, 0, 0, 0,
53 0, 0, 0, 0, 0, 0, 0, 0,
54 0, 0, 0, 0, 0, 0, 0, 0 };
59 #define _mm512_cmp_epi8_mask(a, b, p) __extension__ ({ \ 60 (__mmask64)__builtin_ia32_cmpb512_mask((__v64qi)(__m512i)(a), \ 61 (__v64qi)(__m512i)(b), (int)(p), \ 64 #define _mm512_mask_cmp_epi8_mask(m, a, b, p) __extension__ ({ \ 65 (__mmask64)__builtin_ia32_cmpb512_mask((__v64qi)(__m512i)(a), \ 66 (__v64qi)(__m512i)(b), (int)(p), \ 69 #define _mm512_cmp_epu8_mask(a, b, p) __extension__ ({ \ 70 (__mmask64)__builtin_ia32_ucmpb512_mask((__v64qi)(__m512i)(a), \ 71 (__v64qi)(__m512i)(b), (int)(p), \ 74 #define _mm512_mask_cmp_epu8_mask(m, a, b, p) __extension__ ({ \ 75 (__mmask64)__builtin_ia32_ucmpb512_mask((__v64qi)(__m512i)(a), \ 76 (__v64qi)(__m512i)(b), (int)(p), \ 79 #define _mm512_cmp_epi16_mask(a, b, p) __extension__ ({ \ 80 (__mmask32)__builtin_ia32_cmpw512_mask((__v32hi)(__m512i)(a), \ 81 (__v32hi)(__m512i)(b), (int)(p), \ 84 #define _mm512_mask_cmp_epi16_mask(m, a, b, p) __extension__ ({ \ 85 (__mmask32)__builtin_ia32_cmpw512_mask((__v32hi)(__m512i)(a), \ 86 (__v32hi)(__m512i)(b), (int)(p), \ 89 #define _mm512_cmp_epu16_mask(a, b, p) __extension__ ({ \ 90 (__mmask32)__builtin_ia32_ucmpw512_mask((__v32hi)(__m512i)(a), \ 91 (__v32hi)(__m512i)(b), (int)(p), \ 94 #define _mm512_mask_cmp_epu16_mask(m, a, b, p) __extension__ ({ \ 95 (__mmask32)__builtin_ia32_ucmpw512_mask((__v32hi)(__m512i)(a), \ 96 (__v32hi)(__m512i)(b), (int)(p), \ 99 #define _mm512_cmpeq_epi8_mask(A, B) \ 100 _mm512_cmp_epi8_mask((A), (B), _MM_CMPINT_EQ) 101 #define _mm512_mask_cmpeq_epi8_mask(k, A, B) \ 102 _mm512_mask_cmp_epi8_mask((k), (A), (B), _MM_CMPINT_EQ) 103 #define _mm512_cmpge_epi8_mask(A, B) \ 104 _mm512_cmp_epi8_mask((A), (B), _MM_CMPINT_GE) 105 #define _mm512_mask_cmpge_epi8_mask(k, A, B) \ 106 _mm512_mask_cmp_epi8_mask((k), (A), (B), _MM_CMPINT_GE) 107 #define _mm512_cmpgt_epi8_mask(A, B) \ 108 _mm512_cmp_epi8_mask((A), (B), _MM_CMPINT_GT) 109 #define _mm512_mask_cmpgt_epi8_mask(k, A, B) \ 110 _mm512_mask_cmp_epi8_mask((k), (A), (B), _MM_CMPINT_GT) 111 #define _mm512_cmple_epi8_mask(A, B) \ 112 _mm512_cmp_epi8_mask((A), (B), _MM_CMPINT_LE) 113 #define _mm512_mask_cmple_epi8_mask(k, A, B) \ 114 _mm512_mask_cmp_epi8_mask((k), (A), (B), _MM_CMPINT_LE) 115 #define _mm512_cmplt_epi8_mask(A, B) \ 116 _mm512_cmp_epi8_mask((A), (B), _MM_CMPINT_LT) 117 #define _mm512_mask_cmplt_epi8_mask(k, A, B) \ 118 _mm512_mask_cmp_epi8_mask((k), (A), (B), _MM_CMPINT_LT) 119 #define _mm512_cmpneq_epi8_mask(A, B) \ 120 _mm512_cmp_epi8_mask((A), (B), _MM_CMPINT_NE) 121 #define _mm512_mask_cmpneq_epi8_mask(k, A, B) \ 122 _mm512_mask_cmp_epi8_mask((k), (A), (B), _MM_CMPINT_NE) 124 #define _mm512_cmpeq_epu8_mask(A, B) \ 125 _mm512_cmp_epu8_mask((A), (B), _MM_CMPINT_EQ) 126 #define _mm512_mask_cmpeq_epu8_mask(k, A, B) \ 127 _mm512_mask_cmp_epu8_mask((k), (A), (B), _MM_CMPINT_EQ) 128 #define _mm512_cmpge_epu8_mask(A, B) \ 129 _mm512_cmp_epu8_mask((A), (B), _MM_CMPINT_GE) 130 #define _mm512_mask_cmpge_epu8_mask(k, A, B) \ 131 _mm512_mask_cmp_epu8_mask((k), (A), (B), _MM_CMPINT_GE) 132 #define _mm512_cmpgt_epu8_mask(A, B) \ 133 _mm512_cmp_epu8_mask((A), (B), _MM_CMPINT_GT) 134 #define _mm512_mask_cmpgt_epu8_mask(k, A, B) \ 135 _mm512_mask_cmp_epu8_mask((k), (A), (B), _MM_CMPINT_GT) 136 #define _mm512_cmple_epu8_mask(A, B) \ 137 _mm512_cmp_epu8_mask((A), (B), _MM_CMPINT_LE) 138 #define _mm512_mask_cmple_epu8_mask(k, A, B) \ 139 _mm512_mask_cmp_epu8_mask((k), (A), (B), _MM_CMPINT_LE) 140 #define _mm512_cmplt_epu8_mask(A, B) \ 141 _mm512_cmp_epu8_mask((A), (B), _MM_CMPINT_LT) 142 #define _mm512_mask_cmplt_epu8_mask(k, A, B) \ 143 _mm512_mask_cmp_epu8_mask((k), (A), (B), _MM_CMPINT_LT) 144 #define _mm512_cmpneq_epu8_mask(A, B) \ 145 _mm512_cmp_epu8_mask((A), (B), _MM_CMPINT_NE) 146 #define _mm512_mask_cmpneq_epu8_mask(k, A, B) \ 147 _mm512_mask_cmp_epu8_mask((k), (A), (B), _MM_CMPINT_NE) 149 #define _mm512_cmpeq_epi16_mask(A, B) \ 150 _mm512_cmp_epi16_mask((A), (B), _MM_CMPINT_EQ) 151 #define _mm512_mask_cmpeq_epi16_mask(k, A, B) \ 152 _mm512_mask_cmp_epi16_mask((k), (A), (B), _MM_CMPINT_EQ) 153 #define _mm512_cmpge_epi16_mask(A, B) \ 154 _mm512_cmp_epi16_mask((A), (B), _MM_CMPINT_GE) 155 #define _mm512_mask_cmpge_epi16_mask(k, A, B) \ 156 _mm512_mask_cmp_epi16_mask((k), (A), (B), _MM_CMPINT_GE) 157 #define _mm512_cmpgt_epi16_mask(A, B) \ 158 _mm512_cmp_epi16_mask((A), (B), _MM_CMPINT_GT) 159 #define _mm512_mask_cmpgt_epi16_mask(k, A, B) \ 160 _mm512_mask_cmp_epi16_mask((k), (A), (B), _MM_CMPINT_GT) 161 #define _mm512_cmple_epi16_mask(A, B) \ 162 _mm512_cmp_epi16_mask((A), (B), _MM_CMPINT_LE) 163 #define _mm512_mask_cmple_epi16_mask(k, A, B) \ 164 _mm512_mask_cmp_epi16_mask((k), (A), (B), _MM_CMPINT_LE) 165 #define _mm512_cmplt_epi16_mask(A, B) \ 166 _mm512_cmp_epi16_mask((A), (B), _MM_CMPINT_LT) 167 #define _mm512_mask_cmplt_epi16_mask(k, A, B) \ 168 _mm512_mask_cmp_epi16_mask((k), (A), (B), _MM_CMPINT_LT) 169 #define _mm512_cmpneq_epi16_mask(A, B) \ 170 _mm512_cmp_epi16_mask((A), (B), _MM_CMPINT_NE) 171 #define _mm512_mask_cmpneq_epi16_mask(k, A, B) \ 172 _mm512_mask_cmp_epi16_mask((k), (A), (B), _MM_CMPINT_NE) 174 #define _mm512_cmpeq_epu16_mask(A, B) \ 175 _mm512_cmp_epu16_mask((A), (B), _MM_CMPINT_EQ) 176 #define _mm512_mask_cmpeq_epu16_mask(k, A, B) \ 177 _mm512_mask_cmp_epu16_mask((k), (A), (B), _MM_CMPINT_EQ) 178 #define _mm512_cmpge_epu16_mask(A, B) \ 179 _mm512_cmp_epu16_mask((A), (B), _MM_CMPINT_GE) 180 #define _mm512_mask_cmpge_epu16_mask(k, A, B) \ 181 _mm512_mask_cmp_epu16_mask((k), (A), (B), _MM_CMPINT_GE) 182 #define _mm512_cmpgt_epu16_mask(A, B) \ 183 _mm512_cmp_epu16_mask((A), (B), _MM_CMPINT_GT) 184 #define _mm512_mask_cmpgt_epu16_mask(k, A, B) \ 185 _mm512_mask_cmp_epu16_mask((k), (A), (B), _MM_CMPINT_GT) 186 #define _mm512_cmple_epu16_mask(A, B) \ 187 _mm512_cmp_epu16_mask((A), (B), _MM_CMPINT_LE) 188 #define _mm512_mask_cmple_epu16_mask(k, A, B) \ 189 _mm512_mask_cmp_epu16_mask((k), (A), (B), _MM_CMPINT_LE) 190 #define _mm512_cmplt_epu16_mask(A, B) \ 191 _mm512_cmp_epu16_mask((A), (B), _MM_CMPINT_LT) 192 #define _mm512_mask_cmplt_epu16_mask(k, A, B) \ 193 _mm512_mask_cmp_epu16_mask((k), (A), (B), _MM_CMPINT_LT) 194 #define _mm512_cmpneq_epu16_mask(A, B) \ 195 _mm512_cmp_epu16_mask((A), (B), _MM_CMPINT_NE) 196 #define _mm512_mask_cmpneq_epu16_mask(k, A, B) \ 197 _mm512_mask_cmp_epu16_mask((k), (A), (B), _MM_CMPINT_NE) 201 return (__m512i) ((__v64qu) __A + (__v64qu) __B);
206 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
213 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
220 return (__m512i) ((__v64qu) __A - (__v64qu) __B);
225 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
232 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
239 return (__m512i) ((__v32hu) __A + (__v32hu) __B);
244 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
251 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
258 return (__m512i) ((__v32hu) __A - (__v32hu) __B);
263 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
270 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
277 return (__m512i) ((__v32hu) __A * (__v32hu) __B);
282 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
289 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
297 return (__m512i) __builtin_ia32_selectb_512 ((
__mmask64) __U,
305 return (__m512i) __builtin_ia32_selectw_512 ((
__mmask32) __U,
313 return (__m512i) __builtin_ia32_pabsb512_mask ((__v64qi) __A,
321 return (__m512i) __builtin_ia32_pabsb512_mask ((__v64qi) __A,
329 return (__m512i) __builtin_ia32_pabsb512_mask ((__v64qi) __A,
337 return (__m512i) __builtin_ia32_pabsw512_mask ((__v32hi) __A,
345 return (__m512i) __builtin_ia32_pabsw512_mask ((__v32hi) __A,
353 return (__m512i) __builtin_ia32_pabsw512_mask ((__v32hi) __A,
361 return (__m512i)__builtin_ia32_packssdw512((__v16si)__A, (__v16si)__B);
367 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
375 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
383 return (__m512i)__builtin_ia32_packsswb512((__v32hi)__A, (__v32hi) __B);
389 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
397 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
405 return (__m512i)__builtin_ia32_packusdw512((__v16si) __A, (__v16si) __B);
411 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
419 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
427 return (__m512i)__builtin_ia32_packuswb512((__v32hi) __A, (__v32hi) __B);
433 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
441 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
449 return (__m512i) __builtin_ia32_paddsb512_mask ((__v64qi) __A,
459 return (__m512i) __builtin_ia32_paddsb512_mask ((__v64qi) __A,
468 return (__m512i) __builtin_ia32_paddsb512_mask ((__v64qi) __A,
477 return (__m512i) __builtin_ia32_paddsw512_mask ((__v32hi) __A,
487 return (__m512i) __builtin_ia32_paddsw512_mask ((__v32hi) __A,
496 return (__m512i) __builtin_ia32_paddsw512_mask ((__v32hi) __A,
505 return (__m512i) __builtin_ia32_paddusb512_mask ((__v64qi) __A,
515 return (__m512i) __builtin_ia32_paddusb512_mask ((__v64qi) __A,
524 return (__m512i) __builtin_ia32_paddusb512_mask ((__v64qi) __A,
533 return (__m512i) __builtin_ia32_paddusw512_mask ((__v32hi) __A,
543 return (__m512i) __builtin_ia32_paddusw512_mask ((__v32hi) __A,
552 return (__m512i) __builtin_ia32_paddusw512_mask ((__v32hi) __A,
561 typedef unsigned short __v64hu
__attribute__((__vector_size__(128)));
562 return (__m512i)__builtin_convertvector(
563 ((__builtin_convertvector((__v64qu) __A, __v64hu) +
564 __builtin_convertvector((__v64qu) __B, __v64hu)) + 1)
572 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
580 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
588 typedef unsigned int __v32su
__attribute__((__vector_size__(128)));
589 return (__m512i)__builtin_convertvector(
590 ((__builtin_convertvector((__v32hu) __A, __v32su) +
591 __builtin_convertvector((__v32hu) __B, __v32su)) + 1)
599 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
607 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
615 return (__m512i) __builtin_ia32_pmaxsb512_mask ((__v64qi) __A,
624 return (__m512i) __builtin_ia32_pmaxsb512_mask ((__v64qi) __A,
634 return (__m512i) __builtin_ia32_pmaxsb512_mask ((__v64qi) __A,
643 return (__m512i) __builtin_ia32_pmaxsw512_mask ((__v32hi) __A,
652 return (__m512i) __builtin_ia32_pmaxsw512_mask ((__v32hi) __A,
662 return (__m512i) __builtin_ia32_pmaxsw512_mask ((__v32hi) __A,
671 return (__m512i) __builtin_ia32_pmaxub512_mask ((__v64qi) __A,
680 return (__m512i) __builtin_ia32_pmaxub512_mask ((__v64qi) __A,
690 return (__m512i) __builtin_ia32_pmaxub512_mask ((__v64qi) __A,
699 return (__m512i) __builtin_ia32_pmaxuw512_mask ((__v32hi) __A,
708 return (__m512i) __builtin_ia32_pmaxuw512_mask ((__v32hi) __A,
718 return (__m512i) __builtin_ia32_pmaxuw512_mask ((__v32hi) __A,
727 return (__m512i) __builtin_ia32_pminsb512_mask ((__v64qi) __A,
736 return (__m512i) __builtin_ia32_pminsb512_mask ((__v64qi) __A,
746 return (__m512i) __builtin_ia32_pminsb512_mask ((__v64qi) __A,
755 return (__m512i) __builtin_ia32_pminsw512_mask ((__v32hi) __A,
764 return (__m512i) __builtin_ia32_pminsw512_mask ((__v32hi) __A,
774 return (__m512i) __builtin_ia32_pminsw512_mask ((__v32hi) __A,
783 return (__m512i) __builtin_ia32_pminub512_mask ((__v64qi) __A,
792 return (__m512i) __builtin_ia32_pminub512_mask ((__v64qi) __A,
802 return (__m512i) __builtin_ia32_pminub512_mask ((__v64qi) __A,
811 return (__m512i) __builtin_ia32_pminuw512_mask ((__v32hi) __A,
820 return (__m512i) __builtin_ia32_pminuw512_mask ((__v32hi) __A,
830 return (__m512i) __builtin_ia32_pminuw512_mask ((__v32hi) __A,
839 return (__m512i)__builtin_ia32_pshufb512((__v64qi)__A,(__v64qi)__B);
845 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
853 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
861 return (__m512i) __builtin_ia32_psubsb512_mask ((__v64qi) __A,
871 return (__m512i) __builtin_ia32_psubsb512_mask ((__v64qi) __A,
880 return (__m512i) __builtin_ia32_psubsb512_mask ((__v64qi) __A,
889 return (__m512i) __builtin_ia32_psubsw512_mask ((__v32hi) __A,
899 return (__m512i) __builtin_ia32_psubsw512_mask ((__v32hi) __A,
908 return (__m512i) __builtin_ia32_psubsw512_mask ((__v32hi) __A,
917 return (__m512i) __builtin_ia32_psubusb512_mask ((__v64qi) __A,
927 return (__m512i) __builtin_ia32_psubusb512_mask ((__v64qi) __A,
936 return (__m512i) __builtin_ia32_psubusb512_mask ((__v64qi) __A,
945 return (__m512i) __builtin_ia32_psubusw512_mask ((__v32hi) __A,
955 return (__m512i) __builtin_ia32_psubusw512_mask ((__v32hi) __A,
964 return (__m512i) __builtin_ia32_psubusw512_mask ((__v32hi) __A,
974 return (__m512i) __builtin_ia32_vpermi2varhi512_mask ((__v32hi) __A,
983 return (__m512i) __builtin_ia32_vpermt2varhi512_mask ((__v32hi) __I ,
991 __m512i __I, __m512i __B)
993 return (__m512i) __builtin_ia32_vpermt2varhi512_mask ((__v32hi) __I ,
1001 __m512i __I, __m512i __B)
1003 return (__m512i) __builtin_ia32_vpermt2varhi512_maskz ((__v32hi) __I
1013 return (__m512i) __builtin_ia32_pmulhrsw512_mask ((__v32hi) __A,
1023 return (__m512i) __builtin_ia32_pmulhrsw512_mask ((__v32hi) __A,
1032 return (__m512i) __builtin_ia32_pmulhrsw512_mask ((__v32hi) __A,
1041 return (__m512i) __builtin_ia32_pmulhw512_mask ((__v32hi) __A,
1051 return (__m512i) __builtin_ia32_pmulhw512_mask ((__v32hi) __A,
1060 return (__m512i) __builtin_ia32_pmulhw512_mask ((__v32hi) __A,
1069 return (__m512i) __builtin_ia32_pmulhuw512_mask ((__v32hi) __A,
1079 return (__m512i) __builtin_ia32_pmulhuw512_mask ((__v32hi) __A,
1088 return (__m512i) __builtin_ia32_pmulhuw512_mask ((__v32hi) __A,
1096 return (__m512i) __builtin_ia32_pmaddubsw512_mask ((__v64qi) __X,
1105 return (__m512i) __builtin_ia32_pmaddubsw512_mask ((__v64qi) __X,
1113 return (__m512i) __builtin_ia32_pmaddubsw512_mask ((__v64qi) __X,
1121 return (__m512i) __builtin_ia32_pmaddwd512_mask ((__v32hi) __A,
1130 return (__m512i) __builtin_ia32_pmaddwd512_mask ((__v32hi) __A,
1138 return (__m512i) __builtin_ia32_pmaddwd512_mask ((__v32hi) __A,
1146 return (__m256i) __builtin_ia32_pmovswb512_mask ((__v32hi) __A,
1153 return (__m256i) __builtin_ia32_pmovswb512_mask ((__v32hi) __A,
1160 return (__m256i) __builtin_ia32_pmovswb512_mask ((__v32hi) __A,
1167 return (__m256i) __builtin_ia32_pmovuswb512_mask ((__v32hi) __A,
1174 return (__m256i) __builtin_ia32_pmovuswb512_mask ((__v32hi) __A,
1181 return (__m256i) __builtin_ia32_pmovuswb512_mask ((__v32hi) __A,
1188 return (__m256i) __builtin_ia32_pmovwb512_mask ((__v32hi) __A,
1195 return (__m256i) __builtin_ia32_pmovwb512_mask ((__v32hi) __A,
1202 return (__m256i) __builtin_ia32_pmovwb512_mask ((__v32hi) __A,
1210 __builtin_ia32_pmovwb512mem_mask ((__v32qi *) __P, (__v32hi) __A, __M);
1216 __builtin_ia32_pmovswb512mem_mask ((__v32qi *) __P, (__v32hi) __A, __M);
1222 __builtin_ia32_pmovuswb512mem_mask ((__v32qi *) __P, (__v32hi) __A, __M);
1227 return (__m512i)__builtin_shufflevector((__v64qi)__A, (__v64qi)__B,
1229 10, 64+10, 11, 64+11,
1230 12, 64+12, 13, 64+13,
1231 14, 64+14, 15, 64+15,
1232 24, 64+24, 25, 64+25,
1233 26, 64+26, 27, 64+27,
1234 28, 64+28, 29, 64+29,
1235 30, 64+30, 31, 64+31,
1236 40, 64+40, 41, 64+41,
1237 42, 64+42, 43, 64+43,
1238 44, 64+44, 45, 64+45,
1239 46, 64+46, 47, 64+47,
1240 56, 64+56, 57, 64+57,
1241 58, 64+58, 59, 64+59,
1242 60, 64+60, 61, 64+61,
1243 62, 64+62, 63, 64+63);
1248 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
1255 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
1262 return (__m512i)__builtin_shufflevector((__v32hi)__A, (__v32hi)__B,
1265 12, 32+12, 13, 32+13,
1266 14, 32+14, 15, 32+15,
1267 20, 32+20, 21, 32+21,
1268 22, 32+22, 23, 32+23,
1269 28, 32+28, 29, 32+29,
1270 30, 32+30, 31, 32+31);
1275 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1282 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1289 return (__m512i)__builtin_shufflevector((__v64qi)__A, (__v64qi)__B,
1294 16, 64+16, 17, 64+17,
1295 18, 64+18, 19, 64+19,
1296 20, 64+20, 21, 64+21,
1297 22, 64+22, 23, 64+23,
1298 32, 64+32, 33, 64+33,
1299 34, 64+34, 35, 64+35,
1300 36, 64+36, 37, 64+37,
1301 38, 64+38, 39, 64+39,
1302 48, 64+48, 49, 64+49,
1303 50, 64+50, 51, 64+51,
1304 52, 64+52, 53, 64+53,
1305 54, 64+54, 55, 64+55);
1310 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
1317 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
1324 return (__m512i)__builtin_shufflevector((__v32hi)__A, (__v32hi)__B,
1328 10, 32+10, 11, 32+11,
1329 16, 32+16, 17, 32+17,
1330 18, 32+18, 19, 32+19,
1331 24, 32+24, 25, 32+25,
1332 26, 32+26, 27, 32+27);
1337 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1344 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1354 return (__m512i)__builtin_convertvector((__v32qs)__A, __v32hi);
1360 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1368 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1376 return (__m512i)__builtin_convertvector((__v32qu)__A, __v32hi);
1382 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1390 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1396 #define _mm512_shufflehi_epi16(A, imm) __extension__ ({ \ 1397 (__m512i)__builtin_shufflevector((__v32hi)(__m512i)(A), \ 1398 (__v32hi)_mm512_undefined_epi32(), \ 1400 4 + (((imm) >> 0) & 0x3), \ 1401 4 + (((imm) >> 2) & 0x3), \ 1402 4 + (((imm) >> 4) & 0x3), \ 1403 4 + (((imm) >> 6) & 0x3), \ 1405 12 + (((imm) >> 0) & 0x3), \ 1406 12 + (((imm) >> 2) & 0x3), \ 1407 12 + (((imm) >> 4) & 0x3), \ 1408 12 + (((imm) >> 6) & 0x3), \ 1410 20 + (((imm) >> 0) & 0x3), \ 1411 20 + (((imm) >> 2) & 0x3), \ 1412 20 + (((imm) >> 4) & 0x3), \ 1413 20 + (((imm) >> 6) & 0x3), \ 1415 28 + (((imm) >> 0) & 0x3), \ 1416 28 + (((imm) >> 2) & 0x3), \ 1417 28 + (((imm) >> 4) & 0x3), \ 1418 28 + (((imm) >> 6) & 0x3)); }) 1420 #define _mm512_mask_shufflehi_epi16(W, U, A, imm) __extension__ ({ \ 1421 (__m512i)__builtin_ia32_selectw_512((__mmask32)(U), \ 1422 (__v32hi)_mm512_shufflehi_epi16((A), \ 1424 (__v32hi)(__m512i)(W)); }) 1426 #define _mm512_maskz_shufflehi_epi16(U, A, imm) __extension__ ({ \ 1427 (__m512i)__builtin_ia32_selectw_512((__mmask32)(U), \ 1428 (__v32hi)_mm512_shufflehi_epi16((A), \ 1430 (__v32hi)_mm512_setzero_hi()); }) 1432 #define _mm512_shufflelo_epi16(A, imm) __extension__ ({ \ 1433 (__m512i)__builtin_shufflevector((__v32hi)(__m512i)(A), \ 1434 (__v32hi)_mm512_undefined_epi32(), \ 1435 0 + (((imm) >> 0) & 0x3), \ 1436 0 + (((imm) >> 2) & 0x3), \ 1437 0 + (((imm) >> 4) & 0x3), \ 1438 0 + (((imm) >> 6) & 0x3), \ 1440 8 + (((imm) >> 0) & 0x3), \ 1441 8 + (((imm) >> 2) & 0x3), \ 1442 8 + (((imm) >> 4) & 0x3), \ 1443 8 + (((imm) >> 6) & 0x3), \ 1445 16 + (((imm) >> 0) & 0x3), \ 1446 16 + (((imm) >> 2) & 0x3), \ 1447 16 + (((imm) >> 4) & 0x3), \ 1448 16 + (((imm) >> 6) & 0x3), \ 1450 24 + (((imm) >> 0) & 0x3), \ 1451 24 + (((imm) >> 2) & 0x3), \ 1452 24 + (((imm) >> 4) & 0x3), \ 1453 24 + (((imm) >> 6) & 0x3), \ 1457 #define _mm512_mask_shufflelo_epi16(W, U, A, imm) __extension__ ({ \ 1458 (__m512i)__builtin_ia32_selectw_512((__mmask32)(U), \ 1459 (__v32hi)_mm512_shufflelo_epi16((A), \ 1461 (__v32hi)(__m512i)(W)); }) 1464 #define _mm512_maskz_shufflelo_epi16(U, A, imm) __extension__ ({ \ 1465 (__m512i)__builtin_ia32_selectw_512((__mmask32)(U), \ 1466 (__v32hi)_mm512_shufflelo_epi16((A), \ 1468 (__v32hi)_mm512_setzero_hi()); }) 1473 return (__m512i)__builtin_ia32_psllv32hi((__v32hi) __A, (__v32hi) __B);
1479 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1487 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1495 return (__m512i)__builtin_ia32_psllw512((__v32hi) __A, (__v8hi) __B);
1501 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1509 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1517 return (__m512i)__builtin_ia32_psllwi512((__v32hi)__A, __B);
1523 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1531 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1536 #define _mm512_bslli_epi128(a, imm) __extension__ ({ \ 1537 (__m512i)__builtin_shufflevector( \ 1538 (__v64qi)_mm512_setzero_si512(), \ 1539 (__v64qi)(__m512i)(a), \ 1540 ((char)(imm)&0xF0) ? 0 : ((char)(imm)>0x0 ? 16 : 64) - (char)(imm), \ 1541 ((char)(imm)&0xF0) ? 1 : ((char)(imm)>0x1 ? 17 : 65) - (char)(imm), \ 1542 ((char)(imm)&0xF0) ? 2 : ((char)(imm)>0x2 ? 18 : 66) - (char)(imm), \ 1543 ((char)(imm)&0xF0) ? 3 : ((char)(imm)>0x3 ? 19 : 67) - (char)(imm), \ 1544 ((char)(imm)&0xF0) ? 4 : ((char)(imm)>0x4 ? 20 : 68) - (char)(imm), \ 1545 ((char)(imm)&0xF0) ? 5 : ((char)(imm)>0x5 ? 21 : 69) - (char)(imm), \ 1546 ((char)(imm)&0xF0) ? 6 : ((char)(imm)>0x6 ? 22 : 70) - (char)(imm), \ 1547 ((char)(imm)&0xF0) ? 7 : ((char)(imm)>0x7 ? 23 : 71) - (char)(imm), \ 1548 ((char)(imm)&0xF0) ? 8 : ((char)(imm)>0x8 ? 24 : 72) - (char)(imm), \ 1549 ((char)(imm)&0xF0) ? 9 : ((char)(imm)>0x9 ? 25 : 73) - (char)(imm), \ 1550 ((char)(imm)&0xF0) ? 10 : ((char)(imm)>0xA ? 26 : 74) - (char)(imm), \ 1551 ((char)(imm)&0xF0) ? 11 : ((char)(imm)>0xB ? 27 : 75) - (char)(imm), \ 1552 ((char)(imm)&0xF0) ? 12 : ((char)(imm)>0xC ? 28 : 76) - (char)(imm), \ 1553 ((char)(imm)&0xF0) ? 13 : ((char)(imm)>0xD ? 29 : 77) - (char)(imm), \ 1554 ((char)(imm)&0xF0) ? 14 : ((char)(imm)>0xE ? 30 : 78) - (char)(imm), \ 1555 ((char)(imm)&0xF0) ? 15 : ((char)(imm)>0xF ? 31 : 79) - (char)(imm), \ 1556 ((char)(imm)&0xF0) ? 16 : ((char)(imm)>0x0 ? 32 : 80) - (char)(imm), \ 1557 ((char)(imm)&0xF0) ? 17 : ((char)(imm)>0x1 ? 33 : 81) - (char)(imm), \ 1558 ((char)(imm)&0xF0) ? 18 : ((char)(imm)>0x2 ? 34 : 82) - (char)(imm), \ 1559 ((char)(imm)&0xF0) ? 19 : ((char)(imm)>0x3 ? 35 : 83) - (char)(imm), \ 1560 ((char)(imm)&0xF0) ? 20 : ((char)(imm)>0x4 ? 36 : 84) - (char)(imm), \ 1561 ((char)(imm)&0xF0) ? 21 : ((char)(imm)>0x5 ? 37 : 85) - (char)(imm), \ 1562 ((char)(imm)&0xF0) ? 22 : ((char)(imm)>0x6 ? 38 : 86) - (char)(imm), \ 1563 ((char)(imm)&0xF0) ? 23 : ((char)(imm)>0x7 ? 39 : 87) - (char)(imm), \ 1564 ((char)(imm)&0xF0) ? 24 : ((char)(imm)>0x8 ? 40 : 88) - (char)(imm), \ 1565 ((char)(imm)&0xF0) ? 25 : ((char)(imm)>0x9 ? 41 : 89) - (char)(imm), \ 1566 ((char)(imm)&0xF0) ? 26 : ((char)(imm)>0xA ? 42 : 90) - (char)(imm), \ 1567 ((char)(imm)&0xF0) ? 27 : ((char)(imm)>0xB ? 43 : 91) - (char)(imm), \ 1568 ((char)(imm)&0xF0) ? 28 : ((char)(imm)>0xC ? 44 : 92) - (char)(imm), \ 1569 ((char)(imm)&0xF0) ? 29 : ((char)(imm)>0xD ? 45 : 93) - (char)(imm), \ 1570 ((char)(imm)&0xF0) ? 30 : ((char)(imm)>0xE ? 46 : 94) - (char)(imm), \ 1571 ((char)(imm)&0xF0) ? 31 : ((char)(imm)>0xF ? 47 : 95) - (char)(imm), \ 1572 ((char)(imm)&0xF0) ? 32 : ((char)(imm)>0x0 ? 48 : 96) - (char)(imm), \ 1573 ((char)(imm)&0xF0) ? 33 : ((char)(imm)>0x1 ? 49 : 97) - (char)(imm), \ 1574 ((char)(imm)&0xF0) ? 34 : ((char)(imm)>0x2 ? 50 : 98) - (char)(imm), \ 1575 ((char)(imm)&0xF0) ? 35 : ((char)(imm)>0x3 ? 51 : 99) - (char)(imm), \ 1576 ((char)(imm)&0xF0) ? 36 : ((char)(imm)>0x4 ? 52 : 100) - (char)(imm), \ 1577 ((char)(imm)&0xF0) ? 37 : ((char)(imm)>0x5 ? 53 : 101) - (char)(imm), \ 1578 ((char)(imm)&0xF0) ? 38 : ((char)(imm)>0x6 ? 54 : 102) - (char)(imm), \ 1579 ((char)(imm)&0xF0) ? 39 : ((char)(imm)>0x7 ? 55 : 103) - (char)(imm), \ 1580 ((char)(imm)&0xF0) ? 40 : ((char)(imm)>0x8 ? 56 : 104) - (char)(imm), \ 1581 ((char)(imm)&0xF0) ? 41 : ((char)(imm)>0x9 ? 57 : 105) - (char)(imm), \ 1582 ((char)(imm)&0xF0) ? 42 : ((char)(imm)>0xA ? 58 : 106) - (char)(imm), \ 1583 ((char)(imm)&0xF0) ? 43 : ((char)(imm)>0xB ? 59 : 107) - (char)(imm), \ 1584 ((char)(imm)&0xF0) ? 44 : ((char)(imm)>0xC ? 60 : 108) - (char)(imm), \ 1585 ((char)(imm)&0xF0) ? 45 : ((char)(imm)>0xD ? 61 : 109) - (char)(imm), \ 1586 ((char)(imm)&0xF0) ? 46 : ((char)(imm)>0xE ? 62 : 110) - (char)(imm), \ 1587 ((char)(imm)&0xF0) ? 47 : ((char)(imm)>0xF ? 63 : 111) - (char)(imm), \ 1588 ((char)(imm)&0xF0) ? 48 : ((char)(imm)>0x0 ? 64 : 112) - (char)(imm), \ 1589 ((char)(imm)&0xF0) ? 49 : ((char)(imm)>0x1 ? 65 : 113) - (char)(imm), \ 1590 ((char)(imm)&0xF0) ? 50 : ((char)(imm)>0x2 ? 66 : 114) - (char)(imm), \ 1591 ((char)(imm)&0xF0) ? 51 : ((char)(imm)>0x3 ? 67 : 115) - (char)(imm), \ 1592 ((char)(imm)&0xF0) ? 52 : ((char)(imm)>0x4 ? 68 : 116) - (char)(imm), \ 1593 ((char)(imm)&0xF0) ? 53 : ((char)(imm)>0x5 ? 69 : 117) - (char)(imm), \ 1594 ((char)(imm)&0xF0) ? 54 : ((char)(imm)>0x6 ? 70 : 118) - (char)(imm), \ 1595 ((char)(imm)&0xF0) ? 55 : ((char)(imm)>0x7 ? 71 : 119) - (char)(imm), \ 1596 ((char)(imm)&0xF0) ? 56 : ((char)(imm)>0x8 ? 72 : 120) - (char)(imm), \ 1597 ((char)(imm)&0xF0) ? 57 : ((char)(imm)>0x9 ? 73 : 121) - (char)(imm), \ 1598 ((char)(imm)&0xF0) ? 58 : ((char)(imm)>0xA ? 74 : 122) - (char)(imm), \ 1599 ((char)(imm)&0xF0) ? 59 : ((char)(imm)>0xB ? 75 : 123) - (char)(imm), \ 1600 ((char)(imm)&0xF0) ? 60 : ((char)(imm)>0xC ? 76 : 124) - (char)(imm), \ 1601 ((char)(imm)&0xF0) ? 61 : ((char)(imm)>0xD ? 77 : 125) - (char)(imm), \ 1602 ((char)(imm)&0xF0) ? 62 : ((char)(imm)>0xE ? 78 : 126) - (char)(imm), \ 1603 ((char)(imm)&0xF0) ? 63 : ((char)(imm)>0xF ? 79 : 127) - (char)(imm)); }) 1608 return (__m512i)__builtin_ia32_psrlv32hi((__v32hi)__A, (__v32hi)__B);
1614 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1622 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1630 return (__m512i)__builtin_ia32_psrav32hi((__v32hi)__A, (__v32hi)__B);
1636 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1644 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1652 return (__m512i)__builtin_ia32_psraw512((__v32hi) __A, (__v8hi) __B);
1658 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1666 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1674 return (__m512i)__builtin_ia32_psrawi512((__v32hi)__A, __B);
1680 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1688 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1696 return (__m512i)__builtin_ia32_psrlw512((__v32hi) __A, (__v8hi) __B);
1702 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1710 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1718 return (__m512i)__builtin_ia32_psrlwi512((__v32hi)__A, __B);
1724 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1732 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1737 #define _mm512_bsrli_epi128(a, imm) __extension__ ({ \ 1738 (__m512i)__builtin_shufflevector( \ 1739 (__v64qi)(__m512i)(a), \ 1740 (__v64qi)_mm512_setzero_si512(), \ 1741 ((char)(imm)&0xF0) ? 64 : (char)(imm) + ((char)(imm)>0xF ? 48 : 0), \ 1742 ((char)(imm)&0xF0) ? 65 : (char)(imm) + ((char)(imm)>0xE ? 49 : 1), \ 1743 ((char)(imm)&0xF0) ? 66 : (char)(imm) + ((char)(imm)>0xD ? 50 : 2), \ 1744 ((char)(imm)&0xF0) ? 67 : (char)(imm) + ((char)(imm)>0xC ? 51 : 3), \ 1745 ((char)(imm)&0xF0) ? 68 : (char)(imm) + ((char)(imm)>0xB ? 52 : 4), \ 1746 ((char)(imm)&0xF0) ? 69 : (char)(imm) + ((char)(imm)>0xA ? 53 : 5), \ 1747 ((char)(imm)&0xF0) ? 70 : (char)(imm) + ((char)(imm)>0x9 ? 54 : 6), \ 1748 ((char)(imm)&0xF0) ? 71 : (char)(imm) + ((char)(imm)>0x8 ? 55 : 7), \ 1749 ((char)(imm)&0xF0) ? 72 : (char)(imm) + ((char)(imm)>0x7 ? 56 : 8), \ 1750 ((char)(imm)&0xF0) ? 73 : (char)(imm) + ((char)(imm)>0x6 ? 57 : 9), \ 1751 ((char)(imm)&0xF0) ? 74 : (char)(imm) + ((char)(imm)>0x5 ? 58 : 10), \ 1752 ((char)(imm)&0xF0) ? 75 : (char)(imm) + ((char)(imm)>0x4 ? 59 : 11), \ 1753 ((char)(imm)&0xF0) ? 76 : (char)(imm) + ((char)(imm)>0x3 ? 60 : 12), \ 1754 ((char)(imm)&0xF0) ? 77 : (char)(imm) + ((char)(imm)>0x2 ? 61 : 13), \ 1755 ((char)(imm)&0xF0) ? 78 : (char)(imm) + ((char)(imm)>0x1 ? 62 : 14), \ 1756 ((char)(imm)&0xF0) ? 79 : (char)(imm) + ((char)(imm)>0x0 ? 63 : 15), \ 1757 ((char)(imm)&0xF0) ? 80 : (char)(imm) + ((char)(imm)>0xF ? 64 : 16), \ 1758 ((char)(imm)&0xF0) ? 81 : (char)(imm) + ((char)(imm)>0xE ? 65 : 17), \ 1759 ((char)(imm)&0xF0) ? 82 : (char)(imm) + ((char)(imm)>0xD ? 66 : 18), \ 1760 ((char)(imm)&0xF0) ? 83 : (char)(imm) + ((char)(imm)>0xC ? 67 : 19), \ 1761 ((char)(imm)&0xF0) ? 84 : (char)(imm) + ((char)(imm)>0xB ? 68 : 20), \ 1762 ((char)(imm)&0xF0) ? 85 : (char)(imm) + ((char)(imm)>0xA ? 69 : 21), \ 1763 ((char)(imm)&0xF0) ? 86 : (char)(imm) + ((char)(imm)>0x9 ? 70 : 22), \ 1764 ((char)(imm)&0xF0) ? 87 : (char)(imm) + ((char)(imm)>0x8 ? 71 : 23), \ 1765 ((char)(imm)&0xF0) ? 88 : (char)(imm) + ((char)(imm)>0x7 ? 72 : 24), \ 1766 ((char)(imm)&0xF0) ? 89 : (char)(imm) + ((char)(imm)>0x6 ? 73 : 25), \ 1767 ((char)(imm)&0xF0) ? 90 : (char)(imm) + ((char)(imm)>0x5 ? 74 : 26), \ 1768 ((char)(imm)&0xF0) ? 91 : (char)(imm) + ((char)(imm)>0x4 ? 75 : 27), \ 1769 ((char)(imm)&0xF0) ? 92 : (char)(imm) + ((char)(imm)>0x3 ? 76 : 28), \ 1770 ((char)(imm)&0xF0) ? 93 : (char)(imm) + ((char)(imm)>0x2 ? 77 : 29), \ 1771 ((char)(imm)&0xF0) ? 94 : (char)(imm) + ((char)(imm)>0x1 ? 78 : 30), \ 1772 ((char)(imm)&0xF0) ? 95 : (char)(imm) + ((char)(imm)>0x0 ? 79 : 31), \ 1773 ((char)(imm)&0xF0) ? 96 : (char)(imm) + ((char)(imm)>0xF ? 80 : 32), \ 1774 ((char)(imm)&0xF0) ? 97 : (char)(imm) + ((char)(imm)>0xE ? 81 : 33), \ 1775 ((char)(imm)&0xF0) ? 98 : (char)(imm) + ((char)(imm)>0xD ? 82 : 34), \ 1776 ((char)(imm)&0xF0) ? 99 : (char)(imm) + ((char)(imm)>0xC ? 83 : 35), \ 1777 ((char)(imm)&0xF0) ? 100 : (char)(imm) + ((char)(imm)>0xB ? 84 : 36), \ 1778 ((char)(imm)&0xF0) ? 101 : (char)(imm) + ((char)(imm)>0xA ? 85 : 37), \ 1779 ((char)(imm)&0xF0) ? 102 : (char)(imm) + ((char)(imm)>0x9 ? 86 : 38), \ 1780 ((char)(imm)&0xF0) ? 103 : (char)(imm) + ((char)(imm)>0x8 ? 87 : 39), \ 1781 ((char)(imm)&0xF0) ? 104 : (char)(imm) + ((char)(imm)>0x7 ? 88 : 40), \ 1782 ((char)(imm)&0xF0) ? 105 : (char)(imm) + ((char)(imm)>0x6 ? 89 : 41), \ 1783 ((char)(imm)&0xF0) ? 106 : (char)(imm) + ((char)(imm)>0x5 ? 90 : 42), \ 1784 ((char)(imm)&0xF0) ? 107 : (char)(imm) + ((char)(imm)>0x4 ? 91 : 43), \ 1785 ((char)(imm)&0xF0) ? 108 : (char)(imm) + ((char)(imm)>0x3 ? 92 : 44), \ 1786 ((char)(imm)&0xF0) ? 109 : (char)(imm) + ((char)(imm)>0x2 ? 93 : 45), \ 1787 ((char)(imm)&0xF0) ? 110 : (char)(imm) + ((char)(imm)>0x1 ? 94 : 46), \ 1788 ((char)(imm)&0xF0) ? 111 : (char)(imm) + ((char)(imm)>0x0 ? 95 : 47), \ 1789 ((char)(imm)&0xF0) ? 112 : (char)(imm) + ((char)(imm)>0xF ? 96 : 48), \ 1790 ((char)(imm)&0xF0) ? 113 : (char)(imm) + ((char)(imm)>0xE ? 97 : 49), \ 1791 ((char)(imm)&0xF0) ? 114 : (char)(imm) + ((char)(imm)>0xD ? 98 : 50), \ 1792 ((char)(imm)&0xF0) ? 115 : (char)(imm) + ((char)(imm)>0xC ? 99 : 51), \ 1793 ((char)(imm)&0xF0) ? 116 : (char)(imm) + ((char)(imm)>0xB ? 100 : 52), \ 1794 ((char)(imm)&0xF0) ? 117 : (char)(imm) + ((char)(imm)>0xA ? 101 : 53), \ 1795 ((char)(imm)&0xF0) ? 118 : (char)(imm) + ((char)(imm)>0x9 ? 102 : 54), \ 1796 ((char)(imm)&0xF0) ? 119 : (char)(imm) + ((char)(imm)>0x8 ? 103 : 55), \ 1797 ((char)(imm)&0xF0) ? 120 : (char)(imm) + ((char)(imm)>0x7 ? 104 : 56), \ 1798 ((char)(imm)&0xF0) ? 121 : (char)(imm) + ((char)(imm)>0x6 ? 105 : 57), \ 1799 ((char)(imm)&0xF0) ? 122 : (char)(imm) + ((char)(imm)>0x5 ? 106 : 58), \ 1800 ((char)(imm)&0xF0) ? 123 : (char)(imm) + ((char)(imm)>0x4 ? 107 : 59), \ 1801 ((char)(imm)&0xF0) ? 124 : (char)(imm) + ((char)(imm)>0x3 ? 108 : 60), \ 1802 ((char)(imm)&0xF0) ? 125 : (char)(imm) + ((char)(imm)>0x2 ? 109 : 61), \ 1803 ((char)(imm)&0xF0) ? 126 : (char)(imm) + ((char)(imm)>0x1 ? 110 : 62), \ 1804 ((char)(imm)&0xF0) ? 127 : (char)(imm) + ((char)(imm)>0x0 ? 111 : 63)); }) 1809 return (__m512i) __builtin_ia32_selectw_512 ((
__mmask32) __U,
1817 return (__m512i) __builtin_ia32_selectw_512 ((
__mmask32) __U,
1825 return (__m512i) __builtin_ia32_selectb_512 ((
__mmask64) __U,
1833 return (__m512i) __builtin_ia32_selectb_512 ((
__mmask64) __U,
1841 return (__m512i) __builtin_ia32_selectb_512(__M,
1849 return (__m512i) __builtin_ia32_selectb_512(__M,
1857 return (
__mmask64) (( __A & 0xFFFFFFFF) | ( __B << 32));
1863 return (
__mmask32) (( __A & 0xFFFF) | ( __B << 16));
1869 return (__m512i) __builtin_ia32_loaddquhi512_mask ((__v32hi *) __P,
1877 return (__m512i) __builtin_ia32_loaddquhi512_mask ((__v32hi *) __P,
1886 return (__m512i) __builtin_ia32_loaddquqi512_mask ((__v64qi *) __P,
1894 return (__m512i) __builtin_ia32_loaddquqi512_mask ((__v64qi *) __P,
1902 __builtin_ia32_storedquhi512_mask ((__v32hi *) __P,
1910 __builtin_ia32_storedquqi512_mask ((__v64qi *) __P,
1973 return (
__mmask64) __builtin_ia32_cvtb2mask512 ((__v64qi) __A);
1979 return (
__mmask32) __builtin_ia32_cvtw2mask512 ((__v32hi) __A);
1985 return (__m512i) __builtin_ia32_cvtmask2b512 (__A);
1991 return (__m512i) __builtin_ia32_cvtmask2w512 (__A);
1997 return (__m512i)__builtin_shufflevector((__v16qi) __A,
1999 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
2000 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
2001 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
2002 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0);
2008 return (__m512i)__builtin_ia32_selectb_512(__M,
2016 return (__m512i)__builtin_ia32_selectb_512(__M,
2024 return (__m512i) __builtin_ia32_selectw_512(__M,
2032 return (__m512i) __builtin_ia32_selectw_512(__M,
2040 return (__m512i)__builtin_shufflevector((__v8hi) __A,
2042 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
2043 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0);
2049 return (__m512i)__builtin_ia32_selectw_512(__M,
2057 return (__m512i)__builtin_ia32_selectw_512(__M,
2065 return (__m512i) __builtin_ia32_permvarhi512_mask ((__v32hi) __B,
2075 return (__m512i) __builtin_ia32_permvarhi512_mask ((__v32hi) __B,
2085 return (__m512i) __builtin_ia32_permvarhi512_mask ((__v32hi) __B,
2091 #define _mm512_alignr_epi8(A, B, N) __extension__ ({\ 2092 (__m512i)__builtin_ia32_palignr512_mask((__v64qi)(__m512i)(A), \ 2093 (__v64qi)(__m512i)(B), (int)(N), \ 2094 (__v64qi)_mm512_undefined_pd(), \ 2097 #define _mm512_mask_alignr_epi8(W, U, A, B, N) __extension__({\ 2098 (__m512i)__builtin_ia32_palignr512_mask((__v64qi)(__m512i)(A), \ 2099 (__v64qi)(__m512i)(B), (int)(N), \ 2100 (__v64qi)(__m512i)(W), \ 2103 #define _mm512_maskz_alignr_epi8(U, A, B, N) __extension__({\ 2104 (__m512i)__builtin_ia32_palignr512_mask((__v64qi)(__m512i)(A), \ 2105 (__v64qi)(__m512i)(B), (int)(N), \ 2106 (__v64qi)_mm512_setzero_si512(), \ 2109 #define _mm512_dbsad_epu8(A, B, imm) __extension__ ({\ 2110 (__m512i)__builtin_ia32_dbpsadbw512_mask((__v64qi)(__m512i)(A), \ 2111 (__v64qi)(__m512i)(B), (int)(imm), \ 2112 (__v32hi)_mm512_undefined_epi32(), \ 2115 #define _mm512_mask_dbsad_epu8(W, U, A, B, imm) ({\ 2116 (__m512i)__builtin_ia32_dbpsadbw512_mask((__v64qi)(__m512i)(A), \ 2117 (__v64qi)(__m512i)(B), (int)(imm), \ 2118 (__v32hi)(__m512i)(W), \ 2121 #define _mm512_maskz_dbsad_epu8(U, A, B, imm) ({\ 2122 (__m512i)__builtin_ia32_dbpsadbw512_mask((__v64qi)(__m512i)(A), \ 2123 (__v64qi)(__m512i)(B), (int)(imm), \ 2124 (__v32hi)_mm512_setzero_hi(), \ 2130 return (__m512i) __builtin_ia32_psadbw512 ((__v64qi) __A,
2136 #undef __DEFAULT_FN_ATTRS #define _mm512_cmpeq_epi16_mask(A, B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_min_epi16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask2_permutex2var_epi16(__m512i __A, __m512i __I, __mmask32 __U, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_unpacklo_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_mov_epi16(__mmask32 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_srli_epi16(__mmask32 __U, __m512i __A, int __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_permutexvar_epi16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
static __inline __m512i __DEFAULT_FN_ATTRS _mm512_setzero_qi(void)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_sll_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_max_epu8(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_mulhi_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_set1_epi8(__mmask64 __M, char __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_loadu_epi16(__m512i __W, __mmask32 __U, void const *__P)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_add_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm512_mask_cvtusepi16_epi8(__m256i __O, __mmask32 __M, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_mulhi_epu16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_srl_epi16(__mmask32 __U, __m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_sll_epi16(__m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_subs_epi8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_packs_epi16(__mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_unpackhi_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_movepi16_mask(__m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_subs_epu8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_srli_epi16(__m512i __A, int __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_adds_epi16(__m512i __A, __m512i __B)
#define _mm512_mask_cmpneq_epi8_mask(k, A, B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_srl_epi16(__m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_packus_epi16(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)
static __inline __m512i __DEFAULT_FN_ATTRS _mm512_set1_epi8(char __w)
#define _mm512_mask_cmpneq_epi16_mask(k, A, B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_shuffle_epi8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_avg_epu8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_max_epi8(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_max_epi8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_movm_epi8(__mmask64 __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_max_epu16(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_sub_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_and_epi32(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_adds_epu8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_adds_epi8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_shuffle_epi8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_unpacklo_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mullo_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_unpacklo_epi8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_abs_epi8(__mmask64 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_packs_epi32(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_mullo_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_sra_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_madd_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_slli_epi16(__m512i __A, int __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_movm_epi16(__mmask32 __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_srav_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_unpackhi_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_min_epu8(__mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_loadu_epi8(__m512i __W, __mmask64 __U, void const *__P)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_cvtepu8_epi16(__m256i __A)
static __inline__ void __DEFAULT_FN_ATTRS _mm512_mask_cvtsepi16_storeu_epi8(void *__P, __mmask32 __M, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_srai_epi16(__m512i __W, __mmask32 __U, __m512i __A, int __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_madd_epi16(__m512i __W, __mmask16 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_add_epi8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_mulhrs_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_unpackhi_epi8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_add_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_broadcastb_epi8(__m128i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_adds_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_cvtepi8_epi16(__mmask32 __U, __m256i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_mulhi_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline __m512i __DEFAULT_FN_ATTRS _mm512_setzero_hi(void)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_mulhi_epu16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_packus_epi32(__m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_mask_testn_epi16_mask(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_srlv_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_movepi8_mask(__m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_min_epi8(__m512i __A, __m512i __B)
static __inline__ void __DEFAULT_FN_ATTRS _mm512_mask_cvtusepi16_storeu_epi8(void *__P, __mmask32 __M, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mulhi_epu16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_shuffle_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_cvtepi8_epi16(__m256i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_adds_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_sllv_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_subs_epu16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_srlv_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_avg_epu8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_subs_epu16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm512_cvtsepi16_epi8(__m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_maddubs_epi16(__m512i __W, __mmask32 __U, __m512i __X, __m512i __Y)
#define _mm512_cmpneq_epi16_mask(A, B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_sllv_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_broadcastw_epi16(__m128i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_adds_epu8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_avg_epu8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_cvtepu8_epi16(__m512i __W, __mmask32 __U, __m256i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_avg_epu16(__m512i __A, __m512i __B)
#define _mm512_cmpeq_epi8_mask(A, B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_max_epu8(__mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_unpackhi_epi8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_max_epi8(__mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm512_mask_cvtsepi16_epi8(__m256i __O, __mmask32 __M, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_mov_epi16(__m512i __W, __mmask32 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_subs_epu16(__m512i __A, __m512i __B)
char __v64qi __attribute__((__vector_size__(64)))
static __inline__ void __DEFAULT_FN_ATTRS _mm512_mask_cvtepi16_storeu_epi8(void *__P, __mmask32 __M, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_undefined_epi32(void)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_subs_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_unpacklo_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm512_mask_cvtepi16_epi8(__m256i __O, __mmask32 __M, __m512i __A)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_mask_test_epi8_mask(__mmask64 __U, __m512i __A, __m512i __B)
#define __DEFAULT_FN_ATTRS
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_loadu_epi16(__mmask32 __U, void const *__P)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_abs_epi8(__m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_broadcastw_epi16(__m512i __O, __mmask32 __M, __m128i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_srai_epi16(__m512i __A, int __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_abs_epi16(__m512i __W, __mmask32 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_min_epi8(__mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_min_epu16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_sub_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
unsigned long long __mmask64
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_min_epu16(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_avg_epu16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
#define _mm512_cmpneq_epi8_mask(A, B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_max_epu16(__m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_mask_test_epi16_mask(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maddubs_epi16(__m512i __X, __m512i __Y)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_sra_epi16(__m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_subs_epu8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_sad_epu8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_madd_epi16(__mmask16 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_adds_epi8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_min_epu8(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)
static __inline __m512i __DEFAULT_FN_ATTRS _mm512_set1_epi16(short __w)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_packs_epi32(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_broadcastw_epi16(__mmask32 __M, __m128i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_packus_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_add_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_packs_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_packus_epi32(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ void __DEFAULT_FN_ATTRS _mm512_mask_storeu_epi8(void *__P, __mmask64 __U, __m512i __A)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_kunpackw(__mmask32 __A, __mmask32 __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_testn_epi16_mask(__m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_kunpackd(__mmask64 __A, __mmask64 __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_set1_epi16(__mmask32 __M, short __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_permutex2var_epi16(__m512i __A, __m512i __I, __m512i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm512_maskz_cvtepi16_epi8(__mmask32 __M, __m512i __A)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm512_maskz_cvtusepi16_epi8(__mmask32 __M, __m512i __A)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm512_cvtepi16_epi8(__m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_add_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_avg_epu16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_sub_epi8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_subs_epu8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_sra_epi16(__mmask32 __U, __m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_maddubs_epi16(__mmask32 __U, __m512i __X, __m512i __Y)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_unpacklo_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_test_epi8_mask(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_subs_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_min_epu16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_sub_epi8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm512_cvtusepi16_epi8(__m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_mov_epi8(__m512i __W, __mmask64 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_min_epu8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_max_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_min_epi16(__m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_test_epi16_mask(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_adds_epu8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm512_maskz_cvtsepi16_epi8(__mmask32 __M, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_set1_epi16(__m512i __O, __mmask32 __M, short __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_abs_epi16(__mmask32 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_sub_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_testn_epi8_mask(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mulhi_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_mov_epi8(__mmask64 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_adds_epu16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_loadu_epi8(__mmask64 __U, void const *__P)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_blend_epi8(__mmask64 __U, __m512i __A, __m512i __W)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_min_epi16(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_mullo_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_srl_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_sub_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_cvtepi8_epi16(__m512i __W, __mmask32 __U, __m256i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_mulhrs_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_permutex2var_epi16(__m512i __A, __mmask32 __U, __m512i __I, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_slli_epi16(__m512i __W, __mmask32 __U, __m512i __A, int __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_adds_epu16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_max_epi16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_broadcastb_epi8(__mmask64 __M, __m128i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_subs_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_permutex2var_epi16(__mmask32 __U, __m512i __A, __m512i __I, __m512i __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_undefined_si128(void)
Generates a 128-bit vector of [4 x i32] with unspecified content.
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_set1_epi8(__m512i __O, __mmask64 __M, char __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_permutexvar_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_sll_epi16(__mmask32 __U, __m512i __A, __m128i __B)
static __inline __m512i __DEFAULT_FN_ATTRS _mm512_setzero_si512(void)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_srai_epi16(__mmask32 __U, __m512i __A, int __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_min_epi8(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_unpackhi_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_max_epu8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_srlv_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_sllv_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_adds_epu16(__m512i __A, __m512i __B)
static __inline __m256i __DEFAULT_FN_ATTRS _mm256_setzero_si256(void)
Constructs a 256-bit integer vector initialized to zero.
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_mask_testn_epi8_mask(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_adds_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_max_epi16(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_add_epi8(__m512i __A, __m512i __B)
#define _mm512_mask_cmpeq_epi8_mask(k, A, B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_cvtepu8_epi16(__mmask32 __U, __m256i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_unpacklo_epi8(__m512i __A, __m512i __B)
static __inline__ void __DEFAULT_FN_ATTRS _mm512_mask_storeu_epi16(void *__P, __mmask32 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_abs_epi8(__m512i __W, __mmask64 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_permutexvar_epi16(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_packus_epi32(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_srav_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
#define _mm512_mask_cmpeq_epi16_mask(k, A, B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_slli_epi16(__mmask32 __U, __m512i __A, int __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_packus_epi16(__mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_packs_epi16(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_unpackhi_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_abs_epi16(__m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_srav_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_packs_epi32(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_blend_epi16(__mmask32 __U, __m512i __A, __m512i __W)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_max_epu16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_srli_epi16(__m512i __W, __mmask32 __U, __m512i __A, int __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mulhrs_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_subs_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_subs_epi8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_broadcastb_epi8(__m512i __O, __mmask64 __M, __m128i __A)