Lines Matching refs:__

63     __ dci(0x441182b2);  // uhadd z18.b, p0/m, z18.b, z21.b
65 __ dci(0x441382f3); // uhsub z19.b, p0/m, z19.b, z23.b
67 __ dci(0x449383fb); // uhsub z27.s, p0/m, z27.s, z31.s
69 __ dci(0x441283fa); // shsub z26.b, p0/m, z26.b, z31.b
71 __ dci(0x44928372); // shsub z18.s, p0/m, z18.s, z27.s
73 __ dci(0x44d2827a); // shsub z26.d, p0/m, z26.d, z19.d
75 __ dci(0x4492823b); // shsub z27.s, p0/m, z27.s, z17.s
77 __ dci(0x44978239); // uhsubr z25.s, p0/m, z25.s, z17.s
79 __ dci(0x4493827d); // uhsub z29.s, p0/m, z29.s, z19.s
81 __ dci(0x449782f9); // uhsubr z25.s, p0/m, z25.s, z23.s
83 __ dci(0x44978231); // uhsubr z17.s, p0/m, z17.s, z17.s
85 __ dci(0x44578233); // uhsubr z19.h, p0/m, z19.h, z17.h
87 __ dci(0x44578312); // uhsubr z18.h, p0/m, z18.h, z24.h
89 __ dci(0x44578610); // uhsubr z16.h, p1/m, z16.h, z16.h
91 __ dci(0x44578618); // uhsubr z24.h, p1/m, z24.h, z16.h
93 __ dci(0x44168608); // shsubr z8.b, p1/m, z8.b, z16.b
95 __ dci(0x44128700); // shsub z0.b, p1/m, z0.b, z24.b
97 __ dci(0x44528f02); // shsub z2.h, p3/m, z2.h, z24.h
99 __ dci(0x44538f40); // uhsub z0.h, p3/m, z0.h, z26.h
101 __ dci(0x44538342); // uhsub z2.h, p0/m, z2.h, z26.h
103 __ dci(0x44538040); // uhsub z0.h, p0/m, z0.h, z2.h
105 __ dci(0x44568044); // shsubr z4.h, p0/m, z4.h, z2.h
107 __ dci(0x445688cc); // shsubr z12.h, p2/m, z12.h, z6.h
109 __ dci(0x44d288dc); // shsub z28.d, p2/m, z28.d, z6.d
111 __ dci(0x44d288d8); // shsub z24.d, p2/m, z24.d, z6.d
113 __ dci(0x44d088f0); // shadd z16.d, p2/m, z16.d, z7.d
115 __ dci(0x44d08cd2); // shadd z18.d, p3/m, z18.d, z6.d
117 __ dci(0x44d484d0); // srhadd z16.d, p1/m, z16.d, z6.d
119 __ dci(0x44d496d1); // srhadd z17.d, p5/m, z17.d, z22.d
121 __ dci(0x44d196d5); // uhadd z21.d, p5/m, z21.d, z22.d
123 __ dci(0x44d496dd); // srhadd z29.d, p5/m, z29.d, z22.d
125 __ dci(0x4494969c); // srhadd z28.s, p5/m, z28.s, z20.s
127 __ dci(0x4494968c); // srhadd z12.s, p5/m, z12.s, z20.s
129 __ dci(0x4415968d); // urhadd z13.b, p5/m, z13.b, z20.b
131 __ dci(0x44119e8c); // uhadd z12.b, p7/m, z12.b, z20.b
133 __ dci(0x4491968d); // uhadd z13.s, p5/m, z13.s, z20.s
135 __ dci(0x44118685); // uhadd z5.b, p1/m, z5.b, z20.b
137 __ dci(0x44138e8d); // uhsub z13.b, p3/m, z13.b, z20.b
139 __ dci(0x44139e0c); // uhsub z12.b, p7/m, z12.b, z16.b
141 __ dci(0x44128e0d); // shsub z13.b, p3/m, z13.b, z16.b
143 __ dci(0x44129a1d); // shsub z29.b, p6/m, z29.b, z16.b
145 __ dci(0x44129a19); // shsub z25.b, p6/m, z25.b, z16.b
147 __ dci(0x44129249); // shsub z9.b, p4/m, z9.b, z18.b
149 __ dci(0x44129248); // shsub z8.b, p4/m, z8.b, z18.b
151 __ dci(0x44169269); // shsubr z9.b, p4/m, z9.b, z19.b
153 __ dci(0x44168661); // shsubr z1.b, p1/m, z1.b, z19.b
155 __ dci(0x44168420); // shsubr z0.b, p1/m, z0.b, z1.b
157 __ dci(0x44168428); // shsubr z8.b, p1/m, z8.b, z1.b
159 __ dci(0x44148409); // srhadd z9.b, p1/m, z9.b, z0.b
161 __ dci(0x44148641); // srhadd z1.b, p1/m, z1.b, z18.b
167 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
168 __ Ldr(w0, MemOperand(x0));
207 __ dci(0x4509f07f); // sri z31.b, z3.b, #7
209 __ dci(0x454bf07e); // sri z30.s, z3.s, #21
211 __ dci(0x450bf17a); // sri z26.b, z11.b, #5
213 __ dci(0x450ef17b); // sri z27.b, z11.b, #2
215 __ dci(0x458ef1f9); // sri z25.d, z15.d, #50
217 __ dci(0x459ff1fb); // sri z27.d, z15.d, #33
219 __ dci(0x459ff5df); // sli z31.d, z14.d, #31
221 __ dci(0x45d7f5cf); // sli z15.d, z14.d, #55
223 __ dci(0x4593f5ce); // sli z14.d, z14.d, #19
225 __ dci(0x4593f1fe); // sri z30.d, z15.d, #45
227 __ dci(0x4581f1ff); // sri z31.d, z15.d, #63
229 __ dci(0x45c1f1bd); // sri z29.d, z13.d, #31
231 __ dci(0x45c1f03c); // sri z28.d, z1.d, #31
233 __ dci(0x45c1f4b4); // sli z20.d, z5.d, #33
235 __ dci(0x45c1f5f0); // sli z16.d, z15.d, #33
237 __ dci(0x45c7f5f2); // sli z18.d, z15.d, #39
239 __ dci(0x45c7f5e2); // sli z2.d, z15.d, #39
241 __ dci(0x45c7f1a0); // sri z0.d, z13.d, #25
243 __ dci(0x4597f1b0); // sri z16.d, z13.d, #41
245 __ dci(0x4593f5b1); // sli z17.d, z13.d, #19
247 __ dci(0x4591f5f0); // sli z16.d, z15.d, #17
249 __ dci(0x4581f5d2); // sli z18.d, z14.d, #1
251 __ dci(0x4541f5d6); // sli z22.s, z14.s, #1
253 __ dci(0x4551f1d4); // sri z20.s, z14.s, #15
255 __ dci(0x4553f150); // sri z16.s, z10.s, #13
257 __ dci(0x4557f171); // sri z17.s, z11.s, #9
259 __ dci(0x4513f175); // sri z21.h, z11.h, #13
261 __ dci(0x4551f177); // sri z23.s, z11.s, #15
263 __ dci(0x4551f17f); // sri z31.s, z11.s, #15
265 __ dci(0x4551f16f); // sri z15.s, z11.s, #15
267 __ dci(0x4550f067); // sri z7.s, z3.s, #16
269 __ dci(0x4550f077); // sri z23.s, z3.s, #16
271 __ dci(0x4551f0f5); // sri z21.s, z7.s, #15
273 __ dci(0x4551f09d); // sri z29.s, z4.s, #15
275 __ dci(0x4552f08d); // sri z13.s, z4.s, #14
277 __ dci(0x4512f01d); // sri z29.h, z0.h, #14
279 __ dci(0x4552f419); // sli z25.s, z0.s, #18
281 __ dci(0x4542f49b); // sli z27.s, z4.s, #2
283 __ dci(0x454af09a); // sri z26.s, z4.s, #22
285 __ dci(0x45caf0d8); // sri z24.d, z6.d, #22
287 __ dci(0x45c2f2dc); // sri z28.d, z22.d, #30
289 __ dci(0x45caf25d); // sri z29.d, z18.d, #22
291 __ dci(0x45caf0dc); // sri z28.d, z6.d, #22
293 __ dci(0x458af1cc); // sri z12.d, z14.d, #54
295 __ dci(0x4586f1cd); // sri z13.d, z14.d, #58
297 __ dci(0x458ef0cc); // sri z12.d, z6.d, #50
299 __ dci(0x458ef00d); // sri z13.d, z0.d, #50
301 __ dci(0x450ef05d); // sri z29.b, z2.b, #2
303 __ dci(0x450cf00d); // sri z13.b, z0.b, #4
305 __ dci(0x450cf00c); // sri z12.b, z0.b, #4
311 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
312 __ Ldr(w0, MemOperand(x0));
351 __ dci(0x04cc9074); // srshr z20.d, p4/m, z20.d, #29
353 __ dci(0x04cc9236); // srshr z22.d, p4/m, z22.d, #15
355 __ dci(0x04cd927e); // urshr z30.d, p4/m, z30.d, #13
357 __ dci(0x04cd9e76); // urshr z22.d, p7/m, z22.d, #13
359 __ dci(0x04cd9a57); // urshr z23.d, p6/m, z23.d, #14
361 __ dci(0x044d9247); // urshr z7.s, p4/m, z7.s, #14
363 __ dci(0x044d9245); // urshr z5.s, p4/m, z5.s, #14
365 __ dci(0x044d9241); // urshr z1.s, p4/m, z1.s, #14
367 __ dci(0x044d8200); // urshr z0.s, p0/m, z0.s, #16
369 __ dci(0x044d8330); // urshr z16.s, p0/m, z16.s, #7
371 __ dci(0x044d8340); // urshr z0.s, p0/m, z0.s, #6
373 __ dci(0x044d8104); // urshr z4.s, p0/m, z4.s, #24
375 __ dci(0x044d8526); // urshr z6.s, p1/m, z6.s, #23
377 __ dci(0x04cd8502); // urshr z2.d, p1/m, z2.d, #24
379 __ dci(0x048d9506); // urshr z6.d, p5/m, z6.d, #56
381 __ dci(0x048d9504); // urshr z4.d, p5/m, z4.d, #56
383 __ dci(0x048d8705); // urshr z5.d, p1/m, z5.d, #40
385 __ dci(0x048d9307); // urshr z7.d, p4/m, z7.d, #40
387 __ dci(0x048c9323); // srshr z3.d, p4/m, z3.d, #39
389 __ dci(0x048c8721); // srshr z1.d, p1/m, z1.d, #39
391 __ dci(0x04cc8f20); // srshr z0.d, p3/m, z0.d, #7
393 __ dci(0x04cc87b0); // srshr z16.d, p1/m, z16.d, #3
395 __ dci(0x04cc8778); // srshr z24.d, p1/m, z24.d, #5
397 __ dci(0x048c8730); // srshr z16.d, p1/m, z16.d, #39
399 __ dci(0x040c8534); // srshr z20.b, p1/m, z20.b, #7
401 __ dci(0x040c957c); // srshr z28.b, p5/m, z28.b, #5
403 __ dci(0x048c9554); // srshr z20.d, p5/m, z20.d, #54
405 __ dci(0x048c8156); // srshr z22.d, p0/m, z22.d, #54
407 __ dci(0x040c8957); // srshr z23.b, p2/m, z23.b, #6
409 __ dci(0x040c8bd5); // srshr z21.h, p2/m, z21.h, #2
411 __ dci(0x040c8354); // srshr z20.h, p0/m, z20.h, #6
413 __ dci(0x040c931c); // srshr z28.h, p4/m, z28.h, #8
415 __ dci(0x040c9798); // srshr z24.h, p5/m, z24.h, #4
417 __ dci(0x044c97ba); // srshr z26.s, p5/m, z26.s, #3
419 __ dci(0x040c9faa); // srshr z10.h, p7/m, z10.h, #3
421 __ dci(0x044d9fae); // urshr z14.s, p7/m, z14.s, #3
423 __ dci(0x044d8f8f); // urshr z15.s, p3/m, z15.s, #4
425 __ dci(0x044d8f87); // urshr z7.s, p3/m, z7.s, #4
427 __ dci(0x044d9d97); // urshr z23.s, p7/m, z23.s, #20
429 __ dci(0x040d9593); // urshr z19.b, p5/m, z19.b, #4
431 __ dci(0x040d959b); // urshr z27.b, p5/m, z27.b, #4
433 __ dci(0x044c959a); // srshr z26.s, p5/m, z26.s, #20
435 __ dci(0x044d9492); // urshr z18.s, p5/m, z18.s, #28
437 __ dci(0x044c8493); // srshr z19.s, p1/m, z19.s, #28
439 __ dci(0x044c8cc3); // srshr z3.s, p3/m, z3.s, #26
441 __ dci(0x044c8c0b); // srshr z11.s, p3/m, z11.s, #32
443 __ dci(0x044c8c6f); // srshr z15.s, p3/m, z15.s, #29
445 __ dci(0x044c9c2e); // srshr z14.s, p7/m, z14.s, #31
447 __ dci(0x04cc943e); // srshr z30.d, p5/m, z30.d, #31
449 __ dci(0x04cd953f); // urshr z31.d, p5/m, z31.d, #23
455 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
456 __ Ldr(w0, MemOperand(x0));
495 __ dci(0x044f86aa); // sqshlu z10.s, p1/m, z10.s, #21
497 __ dci(0x044f8482); // sqshlu z2.s, p1/m, z2.s, #4
499 __ dci(0x048f8480); // sqshlu z0.d, p1/m, z0.d, #4
501 __ dci(0x04cf8c82); // sqshlu z2.d, p3/m, z2.d, #36
503 __ dci(0x044f8892); // sqshlu z18.s, p2/m, z18.s, #4
505 __ dci(0x04cf8996); // sqshlu z22.d, p2/m, z22.d, #44
507 __ dci(0x04cf9194); // sqshlu z20.d, p4/m, z20.d, #44
509 __ dci(0x04cf9b9c); // sqshlu z28.d, p6/m, z28.d, #60
511 __ dci(0x04c79f8c); // uqshl z12.d, p7/m, z12.d, #60
513 __ dci(0x04469f88); // sqshl z8.s, p7/m, z8.s, #28
515 __ dci(0x04469f8a); // sqshl z10.s, p7/m, z10.s, #28
517 __ dci(0x04469a8e); // sqshl z14.s, p6/m, z14.s, #20
519 __ dci(0x04c69a1e); // sqshl z30.d, p6/m, z30.d, #48
521 __ dci(0x04c68a9a); // sqshl z26.d, p2/m, z26.d, #52
523 __ dci(0x04469a8a); // sqshl z10.s, p6/m, z10.s, #20
525 __ dci(0x04c68a88); // sqshl z8.d, p2/m, z8.d, #52
527 __ dci(0x04469a89); // sqshl z9.s, p6/m, z9.s, #20
529 __ dci(0x04479b81); // uqshl z1.s, p6/m, z1.s, #28
531 __ dci(0x044f9f91); // sqshlu z17.s, p7/m, z17.s, #28
533 __ dci(0x04479e90); // uqshl z16.s, p7/m, z16.s, #20
535 __ dci(0x044f9f94); // sqshlu z20.s, p7/m, z20.s, #28
537 __ dci(0x04479795); // uqshl z21.s, p5/m, z21.s, #28
539 __ dci(0x04479754); // uqshl z20.s, p5/m, z20.s, #26
541 __ dci(0x04479750); // uqshl z16.s, p5/m, z16.s, #26
543 __ dci(0x04479740); // uqshl z0.s, p5/m, z0.s, #26
545 __ dci(0x04079544); // uqshl z4.b, p5/m, z4.b, #2
547 __ dci(0x04c79546); // uqshl z6.d, p5/m, z6.d, #42
549 __ dci(0x04c78504); // uqshl z4.d, p1/m, z4.d, #40
551 __ dci(0x04879500); // uqshl z0.d, p5/m, z0.d, #8
553 __ dci(0x04879908); // uqshl z8.d, p6/m, z8.d, #8
555 __ dci(0x04879318); // uqshl z24.d, p4/m, z24.d, #24
557 __ dci(0x0487931a); // uqshl z26.d, p4/m, z26.d, #24
559 __ dci(0x0486938a); // sqshl z10.d, p4/m, z10.d, #28
561 __ dci(0x04069188); // sqshl z8.b, p4/m, z8.b, #4
563 __ dci(0x04469389); // sqshl z9.s, p4/m, z9.s, #28
565 __ dci(0x0447918b); // uqshl z11.s, p4/m, z11.s, #12
567 __ dci(0x0447913b); // uqshl z27.s, p4/m, z27.s, #9
569 __ dci(0x0447915f); // uqshl z31.s, p4/m, z31.s, #10
571 __ dci(0x0406915d); // sqshl z29.b, p4/m, z29.b, #2
573 __ dci(0x0486911f); // sqshl z31.d, p4/m, z31.d, #8
575 __ dci(0x0486911d); // sqshl z29.d, p4/m, z29.d, #8
577 __ dci(0x04869b1f); // sqshl z31.d, p6/m, z31.d, #24
579 __ dci(0x04069317); // sqshl z23.h, p4/m, z23.h, #8
581 __ dci(0x0447931f); // uqshl z31.s, p4/m, z31.s, #24
583 __ dci(0x04479b9e); // uqshl z30.s, p6/m, z30.s, #28
585 __ dci(0x04479adf); // uqshl z31.s, p6/m, z31.s, #22
587 __ dci(0x04479adb); // uqshl z27.s, p6/m, z27.s, #22
589 __ dci(0x04079a99); // uqshl z25.h, p6/m, z25.h, #4
591 __ dci(0x04079a89); // uqshl z9.h, p6/m, z9.h, #4
593 __ dci(0x04879acb); // uqshl z11.d, p6/m, z11.d, #22
599 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
600 __ Ldr(w0, MemOperand(x0));
639 __ dci(0x44cb84cb); // uqrshl z11.d, p1/m, z11.d, z6.d
641 __ dci(0x444b85db); // uqrshl z27.h, p1/m, z27.h, z14.h
643 __ dci(0x444b874b); // uqrshl z11.h, p1/m, z11.h, z26.h
645 __ dci(0x444b87fb); // uqrshl z27.h, p1/m, z27.h, z31.h
647 __ dci(0x444b87f3); // uqrshl z19.h, p1/m, z19.h, z31.h
649 __ dci(0x444385f1); // urshl z17.h, p1/m, z17.h, z15.h
651 __ dci(0x444795f3); // urshlr z19.h, p5/m, z19.h, z15.h
653 __ dci(0x44479552); // urshlr z18.h, p5/m, z18.h, z10.h
655 __ dci(0x44c79502); // urshlr z2.d, p5/m, z2.d, z8.d
657 __ dci(0x44879406); // urshlr z6.s, p5/m, z6.s, z0.s
659 __ dci(0x44079436); // urshlr z22.b, p5/m, z22.b, z1.b
661 __ dci(0x44078c34); // urshlr z20.b, p3/m, z20.b, z1.b
663 __ dci(0x440f843c); // uqrshlr z28.b, p1/m, z28.b, z1.b
665 __ dci(0x440f8cbe); // uqrshlr z30.b, p3/m, z30.b, z5.b
667 __ dci(0x44078eba); // urshlr z26.b, p3/m, z26.b, z21.b
669 __ dci(0x44078ebe); // urshlr z30.b, p3/m, z30.b, z21.b
671 __ dci(0x440f86b6); // uqrshlr z22.b, p1/m, z22.b, z21.b
673 __ dci(0x444b86b7); // uqrshl z23.h, p1/m, z23.h, z21.h
675 __ dci(0x440b84a7); // uqrshl z7.b, p1/m, z7.b, z5.b
677 __ dci(0x440b8085); // uqrshl z5.b, p0/m, z5.b, z4.b
679 __ dci(0x440b8687); // uqrshl z7.b, p1/m, z7.b, z20.b
681 __ dci(0x440986cf); // uqshl z15.b, p1/m, z15.b, z22.b
683 __ dci(0x440b87ce); // uqrshl z14.b, p1/m, z14.b, z30.b
685 __ dci(0x440b838c); // uqrshl z12.b, p0/m, z12.b, z28.b
687 __ dci(0x440b839c); // uqrshl z28.b, p0/m, z28.b, z28.b
689 __ dci(0x444b8314); // uqrshl z20.h, p0/m, z20.h, z24.h
691 __ dci(0x44498b1c); // uqshl z28.h, p2/m, z28.h, z24.h
693 __ dci(0x44498b0c); // uqshl z12.h, p2/m, z12.h, z24.h
695 __ dci(0x44438b0e); // urshl z14.h, p2/m, z14.h, z24.h
697 __ dci(0x44438986); // urshl z6.h, p2/m, z6.h, z12.h
699 __ dci(0x444389e4); // urshl z4.h, p2/m, z4.h, z15.h
701 __ dci(0x444391f4); // urshl z20.h, p4/m, z20.h, z15.h
703 __ dci(0x444391f6); // urshl z22.h, p4/m, z22.h, z15.h
705 __ dci(0x44c39177); // urshl z23.d, p4/m, z23.d, z11.d
707 __ dci(0x44c79573); // urshlr z19.d, p5/m, z19.d, z11.d
709 __ dci(0x04c79d63); // uqshl z3.d, p7/m, z3.d, #43
711 __ dci(0x04c78c67); // uqshl z7.d, p3/m, z7.d, #35
713 __ dci(0x04878c43); // uqshl z3.d, p3/m, z3.d, #2
715 __ dci(0x44878c0b); // urshlr z11.s, p3/m, z11.s, z0.s
717 __ dci(0x44878c03); // urshlr z3.s, p3/m, z3.s, z0.s
719 __ dci(0x44878d42); // urshlr z2.s, p3/m, z2.s, z10.s
721 __ dci(0x44878d4a); // urshlr z10.s, p3/m, z10.s, z10.s
723 __ dci(0x44879948); // urshlr z8.s, p6/m, z8.s, z10.s
725 __ dci(0x44879949); // urshlr z9.s, p6/m, z9.s, z10.s
727 __ dci(0x44879bcb); // urshlr z11.s, p6/m, z11.s, z30.s
729 __ dci(0x04879b4f); // uqshl z15.d, p6/m, z15.d, #26
731 __ dci(0x44879bdf); // urshlr z31.s, p6/m, z31.s, z30.s
733 __ dci(0x4487935e); // urshlr z30.s, p4/m, z30.s, z26.s
735 __ dci(0x440f9356); // uqrshlr z22.b, p4/m, z22.b, z26.b
737 __ dci(0x440f93f7); // uqrshlr z23.b, p4/m, z23.b, z31.b
739 __ dci(0x448793f5); // urshlr z21.s, p4/m, z21.s, z31.s
741 __ dci(0x448383fd); // urshl z29.s, p0/m, z29.s, z31.s
743 __ dci(0x448b82f9); // uqrshl z25.s, p0/m, z25.s, z23.s
745 __ dci(0x448f82b8); // uqrshlr z24.s, p0/m, z24.s, z21.s
747 __ dci(0x448f82bc); // uqrshlr z28.s, p0/m, z28.s, z21.s
749 __ dci(0x448f83fe); // uqrshlr z30.s, p0/m, z30.s, z31.s
751 __ dci(0x448d83ae); // uqshlr z14.s, p0/m, z14.s, z29.s
753 __ dci(0x448d83aa); // uqshlr z10.s, p0/m, z10.s, z29.s
755 __ dci(0x448993ae); // uqshl z14.s, p4/m, z14.s, z29.s
757 __ dci(0x448993a6); // uqshl z6.s, p4/m, z6.s, z29.s
759 __ dci(0x44c991a4); // uqshl z4.d, p4/m, z4.d, z13.d
761 __ dci(0x44c991a5); // uqshl z5.d, p4/m, z5.d, z13.d
763 __ dci(0x44c991a1); // uqshl z1.d, p4/m, z1.d, z13.d
765 __ dci(0x444b91a0); // uqrshl z0.h, p4/m, z0.h, z13.h
767 __ dci(0x444b91a1); // uqrshl z1.h, p4/m, z1.h, z13.h
769 __ dci(0x440391a3); // urshl z3.b, p4/m, z3.b, z13.b
771 __ dci(0x448393a7); // urshl z7.s, p4/m, z7.s, z29.s
773 __ dci(0x448393af); // urshl z15.s, p4/m, z15.s, z29.s
775 __ dci(0x448393ab); // urshl z11.s, p4/m, z11.s, z29.s
777 __ dci(0x448f93af); // uqrshlr z15.s, p4/m, z15.s, z29.s
779 __ dci(0x448f93ae); // uqrshlr z14.s, p4/m, z14.s, z29.s
781 __ dci(0x048793aa); // uqshl z10.d, p4/m, z10.d, #29
783 __ dci(0x04c79388); // uqshl z8.d, p4/m, z8.d, #60
785 __ dci(0x04c79380); // uqshl z0.d, p4/m, z0.d, #60
787 __ dci(0x04878390); // uqshl z16.d, p0/m, z16.d, #28
789 __ dci(0x44878794); // urshlr z20.s, p1/m, z20.s, z28.s
791 __ dci(0x04878384); // uqshl z4.d, p0/m, z4.d, #28
793 __ dci(0x048787ac); // uqshl z12.d, p1/m, z12.d, #29
795 __ dci(0x04c786ae); // uqshl z14.d, p1/m, z14.d, #53
797 __ dci(0x04c786be); // uqshl z30.d, p1/m, z30.d, #53
799 __ dci(0x44c782b6); // urshlr z22.d, p0/m, z22.d, z21.d
801 __ dci(0x44c78a3e); // urshlr z30.d, p2/m, z30.d, z17.d
803 __ dci(0x04c78b3a); // uqshl z26.d, p2/m, z26.d, #57
805 __ dci(0x04c78832); // uqshl z18.d, p2/m, z18.d, #33
807 __ dci(0x44cf8833); // uqrshlr z19.d, p2/m, z19.d, z1.d
809 __ dci(0x44cf9811); // uqrshlr z17.d, p6/m, z17.d, z0.d
811 __ dci(0x44cf9c41); // uqrshlr z1.d, p7/m, z1.d, z2.d
813 __ dci(0x444f8c45); // uqrshlr z5.h, p3/m, z5.h, z2.h
815 __ dci(0x44cf844d); // uqrshlr z13.d, p1/m, z13.d, z2.d
817 __ dci(0x44c7841d); // urshlr z29.d, p1/m, z29.d, z0.d
819 __ dci(0x44c7805f); // urshlr z31.d, p0/m, z31.d, z2.d
821 __ dci(0x44cf807b); // uqrshlr z27.d, p0/m, z27.d, z3.d
823 __ dci(0x44c780eb); // urshlr z11.d, p0/m, z11.d, z7.d
825 __ dci(0x44c794e3); // urshlr z3.d, p5/m, z3.d, z7.d
827 __ dci(0x04c795eb); // uqshl z11.d, p5/m, z11.d, #47
829 __ dci(0x04c795e9); // uqshl z9.d, p5/m, z9.d, #47
831 __ dci(0x04c795f9); // uqshl z25.d, p5/m, z25.d, #47
833 __ dci(0x04c795fb); // uqshl z27.d, p5/m, z27.d, #47
835 __ dci(0x04c799f3); // uqshl z19.d, p6/m, z19.d, #47
837 __ dci(0x04c79997); // uqshl z23.d, p6/m, z23.d, #44
843 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
844 __ Ldr(w0, MemOperand(x0));
883 __ dci(0x048687c6); // sqshl z6.d, p1/m, z6.d, #30
885 __ dci(0x048687c4); // sqshl z4.d, p1/m, z4.d, #30
887 __ dci(0x04868385); // sqshl z5.d, p0/m, z5.d, #28
889 __ dci(0x0486838d); // sqshl z13.d, p0/m, z13.d, #28
891 __ dci(0x048681a9); // sqshl z9.d, p0/m, z9.d, #13
893 __ dci(0x04068139); // sqshl z25.b, p0/m, z25.b, #1
895 __ dci(0x440681b8); // srshlr z24.b, p0/m, z24.b, z13.b
897 __ dci(0x4406803a); // srshlr z26.b, p0/m, z26.b, z1.b
899 __ dci(0x4406808a); // srshlr z10.b, p0/m, z10.b, z4.b
901 __ dci(0x440688da); // srshlr z26.b, p2/m, z26.b, z6.b
903 __ dci(0x448680db); // srshlr z27.s, p0/m, z27.s, z6.s
905 __ dci(0x440684d3); // srshlr z19.b, p1/m, z19.b, z6.b
907 __ dci(0x448694c3); // srshlr z3.s, p5/m, z3.s, z6.s
909 __ dci(0x448e9cc7); // sqrshlr z7.s, p7/m, z7.s, z6.s
911 __ dci(0x448e9ef7); // sqrshlr z23.s, p7/m, z23.s, z23.s
913 __ dci(0x448e9673); // sqrshlr z19.s, p5/m, z19.s, z19.s
915 __ dci(0x448a8663); // sqrshl z3.s, p1/m, z3.s, z19.s
917 __ dci(0x440a8e6b); // sqrshl z11.b, p3/m, z11.b, z19.b
919 __ dci(0x44028eef); // srshl z15.b, p3/m, z15.b, z23.b
921 __ dci(0x44028e8b); // srshl z11.b, p3/m, z11.b, z20.b
923 __ dci(0x44828f8f); // srshl z15.s, p3/m, z15.s, z28.s
925 __ dci(0x44828f87); // srshl z7.s, p3/m, z7.s, z28.s
927 __ dci(0x44828a97); // srshl z23.s, p2/m, z23.s, z20.s
929 __ dci(0x44828a93); // srshl z19.s, p2/m, z19.s, z20.s
931 __ dci(0x44868a11); // srshlr z17.s, p2/m, z17.s, z16.s
933 __ dci(0x44c68a90); // srshlr z16.d, p2/m, z16.d, z20.d
935 __ dci(0x44c68a80); // srshlr z0.d, p2/m, z0.d, z20.d
937 __ dci(0x44868a02); // srshlr z2.s, p2/m, z2.s, z16.s
939 __ dci(0x44868a12); // srshlr z18.s, p2/m, z18.s, z16.s
941 __ dci(0x4486921a); // srshlr z26.s, p4/m, z26.s, z16.s
943 __ dci(0x4486909e); // srshlr z30.s, p4/m, z30.s, z4.s
945 __ dci(0x448c9096); // sqshlr z22.s, p4/m, z22.s, z4.s
947 __ dci(0x448890b4); // sqshl z20.s, p4/m, z20.s, z5.s
949 __ dci(0x448884bc); // sqshl z28.s, p1/m, z28.s, z5.s
951 __ dci(0x44c88434); // sqshl z20.d, p1/m, z20.d, z1.d
953 __ dci(0x44cc8536); // sqshlr z22.d, p1/m, z22.d, z9.d
955 __ dci(0x448c8517); // sqshlr z23.s, p1/m, z23.s, z8.s
957 __ dci(0x448c8133); // sqshlr z19.s, p0/m, z19.s, z9.s
959 __ dci(0x448c8b23); // sqshlr z3.s, p2/m, z3.s, z25.s
961 __ dci(0x448c8b21); // sqshlr z1.s, p2/m, z1.s, z25.s
963 __ dci(0x448c8b29); // sqshlr z9.s, p2/m, z9.s, z25.s
965 __ dci(0x448c8b2b); // sqshlr z11.s, p2/m, z11.s, z25.s
967 __ dci(0x448c8b89); // sqshlr z9.s, p2/m, z9.s, z28.s
969 __ dci(0x448c9bcb); // sqshlr z11.s, p6/m, z11.s, z30.s
971 __ dci(0x44869bca); // srshlr z10.s, p6/m, z10.s, z30.s
973 __ dci(0x04869b8e); // sqshl z14.d, p6/m, z14.d, #28
975 __ dci(0x44869bca); // srshlr z10.s, p6/m, z10.s, z30.s
977 __ dci(0x44869ae2); // srshlr z2.s, p6/m, z2.s, z23.s
979 __ dci(0x44869a46); // srshlr z6.s, p6/m, z6.s, z18.s
981 __ dci(0x44869a47); // srshlr z7.s, p6/m, z7.s, z18.s
983 __ dci(0x4486920f); // srshlr z15.s, p4/m, z15.s, z16.s
985 __ dci(0x44869a87); // srshlr z7.s, p6/m, z7.s, z20.s
987 __ dci(0x44469a86); // srshlr z6.h, p6/m, z6.h, z20.h
989 __ dci(0x44029a82); // srshl z2.b, p6/m, z2.b, z20.b
991 __ dci(0x44069aa0); // srshlr z0.b, p6/m, z0.b, z21.b
993 __ dci(0x444692b0); // srshlr z16.h, p4/m, z16.h, z21.h
995 __ dci(0x44468ab2); // srshlr z18.h, p2/m, z18.h, z21.h
997 __ dci(0x444698b6); // srshlr z22.h, p6/m, z22.h, z5.h
999 __ dci(0x44469934); // srshlr z20.h, p6/m, z20.h, z9.h
1001 __ dci(0x0406993c); // sqshl z28.b, p6/m, z28.b, #1
1003 __ dci(0x4406912c); // srshlr z12.b, p4/m, z12.b, z9.b
1005 __ dci(0x440291ae); // srshl z14.b, p4/m, z14.b, z13.b
1007 __ dci(0x44829126); // srshl z6.s, p4/m, z6.s, z9.s
1009 __ dci(0x448a8127); // sqrshl z7.s, p0/m, z7.s, z9.s
1011 __ dci(0x448e8165); // sqrshlr z5.s, p0/m, z5.s, z11.s
1013 __ dci(0x44869161); // srshlr z1.s, p4/m, z1.s, z11.s
1015 __ dci(0x44829120); // srshl z0.s, p4/m, z0.s, z9.s
1017 __ dci(0x44829124); // srshl z4.s, p4/m, z4.s, z9.s
1019 __ dci(0x4482912c); // srshl z12.s, p4/m, z12.s, z9.s
1021 __ dci(0x44829128); // srshl z8.s, p4/m, z8.s, z9.s
1023 __ dci(0x44c69120); // srshlr z0.d, p4/m, z0.d, z9.d
1025 __ dci(0x44ce9168); // sqrshlr z8.d, p4/m, z8.d, z11.d
1027 __ dci(0x448e9069); // sqrshlr z9.s, p4/m, z9.s, z3.s
1029 __ dci(0x448e8461); // sqrshlr z1.s, p1/m, z1.s, z3.s
1031 __ dci(0x448e8460); // sqrshlr z0.s, p1/m, z0.s, z3.s
1033 __ dci(0x448a8428); // sqrshl z8.s, p1/m, z8.s, z1.s
1035 __ dci(0x44ca8409); // sqrshl z9.d, p1/m, z9.d, z0.d
1037 __ dci(0x44c68408); // srshlr z8.d, p1/m, z8.d, z0.d
1039 __ dci(0x44c6840a); // srshlr z10.d, p1/m, z10.d, z0.d
1041 __ dci(0x44cc840e); // sqshlr z14.d, p1/m, z14.d, z0.d
1043 __ dci(0x44cc8e1e); // sqshlr z30.d, p3/m, z30.d, z16.d
1045 __ dci(0x44c68e1a); // srshlr z26.d, p3/m, z26.d, z16.d
1047 __ dci(0x44c28a0a); // srshl z10.d, p2/m, z10.d, z16.d
1049 __ dci(0x44c68e0e); // srshlr z14.d, p3/m, z14.d, z16.d
1051 __ dci(0x44c6881e); // srshlr z30.d, p2/m, z30.d, z0.d
1053 __ dci(0x44869816); // srshlr z22.s, p6/m, z22.s, z0.s
1055 __ dci(0x44029817); // srshl z23.b, p6/m, z23.b, z0.b
1057 __ dci(0x4402993f); // srshl z31.b, p6/m, z31.b, z9.b
1059 __ dci(0x4406991e); // srshlr z30.b, p6/m, z30.b, z8.b
1061 __ dci(0x44068d1f); // srshlr z31.b, p3/m, z31.b, z8.b
1063 __ dci(0x44068d1d); // srshlr z29.b, p3/m, z29.b, z8.b
1065 __ dci(0x44468d2d); // srshlr z13.h, p3/m, z13.h, z9.h
1067 __ dci(0x4446850f); // srshlr z15.h, p1/m, z15.h, z8.h
1069 __ dci(0x4446910e); // srshlr z14.h, p4/m, z14.h, z8.h
1071 __ dci(0x4446940f); // srshlr z15.h, p5/m, z15.h, z0.h
1073 __ dci(0x44468487); // srshlr z7.h, p1/m, z7.h, z4.h
1075 __ dci(0x444694b7); // srshlr z23.h, p5/m, z23.h, z5.h
1077 __ dci(0x44469c93); // srshlr z19.h, p7/m, z19.h, z4.h
1079 __ dci(0x44069e92); // srshlr z18.b, p7/m, z18.b, z20.b
1081 __ dci(0x44469693); // srshlr z19.h, p5/m, z19.h, z20.h
1087 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
1088 __ Ldr(w0, MemOperand(x0));
1127 __ dci(0x450ce41d); // usra z29.b, z0.b, #4
1129 __ dci(0x450ce635); // usra z21.b, z17.b, #4
1131 __ dci(0x45cce637); // usra z23.d, z17.d, #20
1133 __ dci(0x458cee35); // ursra z21.d, z17.d, #52
1135 __ dci(0x450eee25); // ursra z5.b, z17.b, #2
1137 __ dci(0x458eef21); // ursra z1.d, z25.d, #50
1139 __ dci(0x458fef65); // ursra z5.d, z27.d, #49
1141 __ dci(0x459fef41); // ursra z1.d, z26.d, #33
1143 __ dci(0x459fe549); // usra z9.d, z10.d, #33
1145 __ dci(0x459de561); // usra z1.d, z11.d, #35
1147 __ dci(0x451ce565); // usra z5.h, z11.h, #4
1149 __ dci(0x4519e564); // usra z4.h, z11.h, #7
1151 __ dci(0x4589e56c); // usra z12.d, z11.d, #55
1153 __ dci(0x4589e56e); // usra z14.d, z11.d, #55
1155 __ dci(0x4589e56c); // usra z12.d, z11.d, #55
1157 __ dci(0x458bed64); // ursra z4.d, z11.d, #53
1159 __ dci(0x45dbed65); // ursra z5.d, z11.d, #5
1161 __ dci(0x455bedf5); // ursra z21.s, z15.s, #5
1163 __ dci(0x450bedfd); // ursra z29.b, z15.b, #5
1165 __ dci(0x4549edf9); // ursra z25.s, z15.s, #23
1167 __ dci(0x4549ede9); // ursra z9.s, z15.s, #23
1169 __ dci(0x4549ed59); // ursra z25.s, z10.s, #23
1171 __ dci(0x4549ed5d); // ursra z29.s, z10.s, #23
1173 __ dci(0x45cded59); // ursra z25.d, z10.d, #19
1175 __ dci(0x45d9ed58); // ursra z24.d, z10.d, #7
1177 __ dci(0x45d8ec50); // ursra z16.d, z2.d, #8
1179 __ dci(0x45c8ec60); // ursra z0.d, z3.d, #24
1181 __ dci(0x45c0ed61); // ursra z1.d, z11.d, #32
1183 __ dci(0x45c8ec65); // ursra z5.d, z3.d, #24
1185 __ dci(0x45c0e464); // usra z4.d, z3.d, #32
1187 __ dci(0x45c0e4a5); // usra z5.d, z5.d, #32
1189 __ dci(0x45c0e4a1); // usra z1.d, z5.d, #32
1191 __ dci(0x45c0e4b1); // usra z17.d, z5.d, #32
1193 __ dci(0x45c2ecb3); // ursra z19.d, z5.d, #30
1195 __ dci(0x45c0ece3); // ursra z3.d, z7.d, #32
1197 __ dci(0x45caece7); // ursra z7.d, z7.d, #22
1199 __ dci(0x458aeee3); // ursra z3.d, z23.d, #54
1201 __ dci(0x454aeee1); // ursra z1.s, z23.s, #22
1203 __ dci(0x4508eee9); // ursra z9.b, z23.b, #8
1205 __ dci(0x4518ece1); // ursra z1.h, z7.h, #8
1207 __ dci(0x451cede0); // ursra z0.h, z15.h, #4
1209 __ dci(0x4598edf0); // ursra z16.d, z15.d, #40
1211 __ dci(0x451cede0); // ursra z0.h, z15.h, #4
1213 __ dci(0x459cefe8); // ursra z8.d, z31.d, #36
1215 __ dci(0x459ce5f8); // usra z24.d, z15.d, #36
1217 __ dci(0x458cedfa); // ursra z26.d, z15.d, #52
1219 __ dci(0x458cedfe); // ursra z30.d, z15.d, #52
1221 __ dci(0x450cedb6); // ursra z22.b, z13.b, #4
1223 __ dci(0x450cedb4); // ursra z20.b, z13.b, #4
1225 __ dci(0x458eeda4); // ursra z4.d, z13.d, #50
1231 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
1232 __ Ldr(w0, MemOperand(x0));
1271 __ dci(0x450ce01d); // ssra z29.b, z0.b, #4
1273 __ dci(0x450ce235); // ssra z21.b, z17.b, #4
1275 __ dci(0x45cce237); // ssra z23.d, z17.d, #20
1277 __ dci(0x458cea35); // srsra z21.d, z17.d, #52
1279 __ dci(0x450eea25); // srsra z5.b, z17.b, #2
1281 __ dci(0x458eeb21); // srsra z1.d, z25.d, #50
1283 __ dci(0x458feb65); // srsra z5.d, z27.d, #49
1285 __ dci(0x459feb41); // srsra z1.d, z26.d, #33
1287 __ dci(0x459fe149); // ssra z9.d, z10.d, #33
1289 __ dci(0x459de161); // ssra z1.d, z11.d, #35
1291 __ dci(0x451ce165); // ssra z5.h, z11.h, #4
1293 __ dci(0x4519e164); // ssra z4.h, z11.h, #7
1295 __ dci(0x4589e16c); // ssra z12.d, z11.d, #55
1297 __ dci(0x4589e16e); // ssra z14.d, z11.d, #55
1299 __ dci(0x4589e16c); // ssra z12.d, z11.d, #55
1301 __ dci(0x458be964); // srsra z4.d, z11.d, #53
1303 __ dci(0x45dbe965); // srsra z5.d, z11.d, #5
1305 __ dci(0x455be9f5); // srsra z21.s, z15.s, #5
1307 __ dci(0x450be9fd); // srsra z29.b, z15.b, #5
1309 __ dci(0x4549e9f9); // srsra z25.s, z15.s, #23
1311 __ dci(0x4549e9e9); // srsra z9.s, z15.s, #23
1313 __ dci(0x4549e959); // srsra z25.s, z10.s, #23
1315 __ dci(0x4549e95d); // srsra z29.s, z10.s, #23
1317 __ dci(0x45cde959); // srsra z25.d, z10.d, #19
1319 __ dci(0x45d9e958); // srsra z24.d, z10.d, #7
1321 __ dci(0x45d8e850); // srsra z16.d, z2.d, #8
1323 __ dci(0x45c8e860); // srsra z0.d, z3.d, #24
1325 __ dci(0x45c0e961); // srsra z1.d, z11.d, #32
1327 __ dci(0x45c8e865); // srsra z5.d, z3.d, #24
1329 __ dci(0x45c0e064); // ssra z4.d, z3.d, #32
1331 __ dci(0x45c0e0a5); // ssra z5.d, z5.d, #32
1333 __ dci(0x45c0e0a1); // ssra z1.d, z5.d, #32
1335 __ dci(0x45c0e0b1); // ssra z17.d, z5.d, #32
1337 __ dci(0x45c2e8b3); // srsra z19.d, z5.d, #30
1339 __ dci(0x45c0e8e3); // srsra z3.d, z7.d, #32
1341 __ dci(0x45cae8e7); // srsra z7.d, z7.d, #22
1343 __ dci(0x458aeae3); // srsra z3.d, z23.d, #54
1345 __ dci(0x454aeae1); // srsra z1.s, z23.s, #22
1347 __ dci(0x455ae8e9); // srsra z9.s, z7.s, #6
1349 __ dci(0x455ee9e8); // srsra z8.s, z15.s, #2
1351 __ dci(0x45dae9f8); // srsra z24.d, z15.d, #6
1353 __ dci(0x455ee9e8); // srsra z8.s, z15.s, #2
1355 __ dci(0x45deebe0); // srsra z0.d, z31.d, #2
1357 __ dci(0x45dee1f0); // ssra z16.d, z15.d, #2
1359 __ dci(0x45cee9f2); // srsra z18.d, z15.d, #18
1361 __ dci(0x45cee9f6); // srsra z22.d, z15.d, #18
1363 __ dci(0x454ee9be); // srsra z30.s, z13.s, #18
1365 __ dci(0x454ee9bc); // srsra z28.s, z13.s, #18
1367 __ dci(0x45cce9ac); // srsra z12.d, z13.d, #20
1369 __ dci(0x45cde93c); // srsra z28.d, z9.d, #19
1375 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
1376 __ Ldr(w0, MemOperand(x0));
1415 __ dci(0x44df9df9); // uqsubr z25.d, p7/m, z25.d, z15.d
1417 __ dci(0x445f9db1); // uqsubr z17.h, p7/m, z17.h, z13.h
1419 __ dci(0x441f99a1); // uqsubr z1.b, p6/m, z1.b, z13.b
1421 __ dci(0x441d9ba0); // usqadd z0.b, p6/m, z0.b, z29.b
1423 __ dci(0x441d9ba8); // usqadd z8.b, p6/m, z8.b, z29.b
1425 __ dci(0x441d9bb8); // usqadd z24.b, p6/m, z24.b, z29.b
1427 __ dci(0x441d8b30); // usqadd z16.b, p2/m, z16.b, z25.b
1429 __ dci(0x441d8a14); // usqadd z20.b, p2/m, z20.b, z16.b
1431 __ dci(0x449d8215); // usqadd z21.s, p0/m, z21.s, z16.s
1433 __ dci(0x449d8205); // usqadd z5.s, p0/m, z5.s, z16.s
1435 __ dci(0x449d8201); // usqadd z1.s, p0/m, z1.s, z16.s
1437 __ dci(0x449c8a09); // suqadd z9.s, p2/m, z9.s, z16.s
1439 __ dci(0x44dd8a0d); // usqadd z13.d, p2/m, z13.d, z16.d
1441 __ dci(0x44d98a2c); // uqadd z12.d, p2/m, z12.d, z17.d
1443 __ dci(0x44598a0d); // uqadd z13.h, p2/m, z13.h, z16.h
1445 __ dci(0x44d99a05); // uqadd z5.d, p6/m, z5.d, z16.d
1447 __ dci(0x44d99004); // uqadd z4.d, p4/m, z4.d, z0.d
1449 __ dci(0x44d98020); // uqadd z0.d, p0/m, z0.d, z1.d
1451 __ dci(0x44d980e1); // uqadd z1.d, p0/m, z1.d, z7.d
1453 __ dci(0x44d981c0); // uqadd z0.d, p0/m, z0.d, z14.d
1455 __ dci(0x44d98161); // uqadd z1.d, p0/m, z1.d, z11.d
1457 __ dci(0x44d98031); // uqadd z17.d, p0/m, z17.d, z1.d
1459 __ dci(0x44d98039); // uqadd z25.d, p0/m, z25.d, z1.d
1461 __ dci(0x44d98029); // uqadd z9.d, p0/m, z9.d, z1.d
1463 __ dci(0x44d8800d); // sqadd z13.d, p0/m, z13.d, z0.d
1465 __ dci(0x44d8828f); // sqadd z15.d, p0/m, z15.d, z20.d
1467 __ dci(0x44d8829f); // sqadd z31.d, p0/m, z31.d, z20.d
1469 __ dci(0x44d88e8f); // sqadd z15.d, p3/m, z15.d, z20.d
1471 __ dci(0x44d88e8b); // sqadd z11.d, p3/m, z11.d, z20.d
1473 __ dci(0x44d88e8f); // sqadd z15.d, p3/m, z15.d, z20.d
1475 __ dci(0x44d8968e); // sqadd z14.d, p5/m, z14.d, z20.d
1477 __ dci(0x44d886ca); // sqadd z10.d, p1/m, z10.d, z22.d
1479 __ dci(0x44dc87ce); // suqadd z14.d, p1/m, z14.d, z30.d
1481 __ dci(0x44de8fcf); // sqsubr z15.d, p3/m, z15.d, z30.d
1483 __ dci(0x449e9fcd); // sqsubr z13.s, p7/m, z13.s, z30.s
1485 __ dci(0x445e9fcf); // sqsubr z15.h, p7/m, z15.h, z30.h
1487 __ dci(0x441e9ece); // sqsubr z14.b, p7/m, z14.b, z22.b
1489 __ dci(0x441e8cde); // sqsubr z30.b, p3/m, z30.b, z6.b
1491 __ dci(0x441e88fa); // sqsubr z26.b, p2/m, z26.b, z7.b
1493 __ dci(0x441f98f8); // uqsubr z24.b, p6/m, z24.b, z7.b
1495 __ dci(0x441f98fc); // uqsubr z28.b, p6/m, z28.b, z7.b
1497 __ dci(0x441b9afe); // uqsub z30.b, p6/m, z30.b, z23.b
1499 __ dci(0x441b9afc); // uqsub z28.b, p6/m, z28.b, z23.b
1501 __ dci(0x449b9a74); // uqsub z20.s, p6/m, z20.s, z19.s
1503 __ dci(0x449a9b75); // sqsub z21.s, p6/m, z21.s, z27.s
1505 __ dci(0x449a9b7d); // sqsub z29.s, p6/m, z29.s, z27.s
1507 __ dci(0x445a9b79); // sqsub z25.h, p6/m, z25.h, z27.h
1509 __ dci(0x445a9b7d); // sqsub z29.h, p6/m, z29.h, z27.h
1511 __ dci(0x445e9b5f); // sqsubr z31.h, p6/m, z31.h, z26.h
1513 __ dci(0x441e8b5b); // sqsubr z27.b, p2/m, z27.b, z26.b
1519 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
1520 __ Ldr(w0, MemOperand(x0));
1559 __ dci(0x4414b214); // smaxp z20.b, p4/m, z20.b, z16.b
1561 __ dci(0x4414ba5c); // smaxp z28.b, p6/m, z28.b, z18.b
1563 __ dci(0x4454ba0c); // smaxp z12.h, p6/m, z12.h, z16.h
1565 __ dci(0x4454ba64); // smaxp z4.h, p6/m, z4.h, z19.h
1567 __ dci(0x44d4bb65); // smaxp z5.d, p6/m, z5.d, z27.d
1569 __ dci(0x4456bb64); // sminp z4.h, p6/m, z4.h, z27.h
1571 __ dci(0x4455bb74); // umaxp z20.h, p6/m, z20.h, z27.h
1573 __ dci(0x4451bb35); // addp z21.h, p6/m, z21.h, z25.h
1575 __ dci(0x4451ab71); // addp z17.h, p2/m, z17.h, z27.h
1577 __ dci(0x4451ba75); // addp z21.h, p6/m, z21.h, z19.h
1579 __ dci(0x4451b225); // addp z5.h, p4/m, z5.h, z17.h
1581 __ dci(0x4455b627); // umaxp z7.h, p5/m, z7.h, z17.h
1583 __ dci(0x4415b426); // umaxp z6.b, p5/m, z6.b, z1.b
1585 __ dci(0x4415b224); // umaxp z4.b, p4/m, z4.b, z17.b
1587 __ dci(0x4455b02c); // umaxp z12.h, p4/m, z12.h, z1.h
1589 __ dci(0x4455a12d); // umaxp z13.h, p0/m, z13.h, z9.h
1591 __ dci(0x4455b33d); // umaxp z29.h, p4/m, z29.h, z25.h
1593 __ dci(0x4455b7b9); // umaxp z25.h, p5/m, z25.h, z29.h
1595 __ dci(0x4454b6b8); // smaxp z24.h, p5/m, z24.h, z21.h
1597 __ dci(0x44d4b4bc); // smaxp z28.d, p5/m, z28.d, z5.d
1599 __ dci(0x44d4b4bd); // smaxp z29.d, p5/m, z29.d, z5.d
1601 __ dci(0x44d4b5ed); // smaxp z13.d, p5/m, z13.d, z15.d
1603 __ dci(0x4455b5fd); // umaxp z29.h, p5/m, z29.h, z15.h
1605 __ dci(0x4415b57f); // umaxp z31.b, p5/m, z31.b, z11.b
1607 __ dci(0x4411b5fe); // addp z30.b, p5/m, z30.b, z15.b
1609 __ dci(0x4411a576); // addp z22.b, p1/m, z22.b, z11.b
1611 __ dci(0x4455a566); // umaxp z6.h, p1/m, z6.h, z11.h
1613 __ dci(0x4455adf6); // umaxp z22.h, p3/m, z22.h, z15.h
1615 __ dci(0x4454acfe); // smaxp z30.h, p3/m, z30.h, z7.h
1617 __ dci(0x4454acff); // smaxp z31.h, p3/m, z31.h, z7.h
1619 __ dci(0x44d4a8fb); // smaxp z27.d, p2/m, z27.d, z7.d
1621 __ dci(0x4456a8f3); // sminp z19.h, p2/m, z19.h, z7.h
1623 __ dci(0x4457a8b1); // uminp z17.h, p2/m, z17.h, z5.h
1625 __ dci(0x4457a8b5); // uminp z21.h, p2/m, z21.h, z5.h
1627 __ dci(0x4456a8f7); // sminp z23.h, p2/m, z23.h, z7.h
1629 __ dci(0x4456a89f); // sminp z31.h, p2/m, z31.h, z4.h
1631 __ dci(0x4456aa0f); // sminp z15.h, p2/m, z15.h, z16.h
1633 __ dci(0x4456b807); // sminp z7.h, p6/m, z7.h, z0.h
1635 __ dci(0x4456bc26); // sminp z6.h, p7/m, z6.h, z1.h
1637 __ dci(0x4456beae); // sminp z14.h, p7/m, z14.h, z21.h
1639 __ dci(0x4416b6ac); // sminp z12.b, p5/m, z12.b, z21.b
1641 __ dci(0x4416b6bc); // sminp z28.b, p5/m, z28.b, z21.b
1643 __ dci(0x4417b694); // uminp z20.b, p5/m, z20.b, z20.b
1645 __ dci(0x4417b684); // uminp z4.b, p5/m, z4.b, z20.b
1647 __ dci(0x4415b6a0); // umaxp z0.b, p5/m, z0.b, z21.b
1649 __ dci(0x4415a690); // umaxp z16.b, p1/m, z16.b, z20.b
1651 __ dci(0x4415b614); // umaxp z20.b, p5/m, z20.b, z16.b
1653 __ dci(0x4415b675); // umaxp z21.b, p5/m, z21.b, z19.b
1655 __ dci(0x4415a63d); // umaxp z29.b, p1/m, z29.b, z17.b
1657 __ dci(0x4415a63c); // umaxp z28.b, p1/m, z28.b, z17.b
1659 __ dci(0x4455a61d); // umaxp z29.h, p1/m, z29.h, z16.h
1661 __ dci(0x4451ae1f); // addp z31.h, p3/m, z31.h, z16.h
1663 __ dci(0x4451ae1b); // addp z27.h, p3/m, z27.h, z16.h
1665 __ dci(0x4451bc0b); // addp z11.h, p7/m, z11.h, z0.h
1667 __ dci(0x4455bc4f); // umaxp z15.h, p7/m, z15.h, z2.h
1669 __ dci(0x4455bf47); // umaxp z7.h, p7/m, z7.h, z26.h
1671 __ dci(0x44d5b743); // umaxp z3.d, p5/m, z3.d, z26.d
1673 __ dci(0x44d5b7e2); // umaxp z2.d, p5/m, z2.d, z31.d
1675 __ dci(0x44d5b7e0); // umaxp z0.d, p5/m, z0.d, z31.d
1677 __ dci(0x44d5b670); // umaxp z16.d, p5/m, z16.d, z19.d
1679 __ dci(0x44d1b272); // addp z18.d, p4/m, z18.d, z19.d
1681 __ dci(0x44d1be76); // addp z22.d, p7/m, z22.d, z19.d
1683 __ dci(0x44d1b772); // addp z18.d, p5/m, z18.d, z27.d
1685 __ dci(0x44d1b162); // addp z2.d, p4/m, z2.d, z11.d
1691 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
1692 __ Ldr(w0, MemOperand(x0));
1731 __ dci(0x45284000); // sqxtnb z0.b, z0.h
1733 __ dci(0x45284228); // sqxtnb z8.b, z17.h
1735 __ dci(0x45284820); // uqxtnb z0.b, z1.h
1737 __ dci(0x45304821); // uqxtnb z1.h, z1.s
1739 __ dci(0x45304823); // uqxtnb z3.h, z1.s
1741 __ dci(0x45604822); // uqxtnb z2.s, z1.d
1743 __ dci(0x45604d26); // uqxtnt z6.s, z9.d
1745 __ dci(0x45304d2e); // uqxtnt z14.h, z9.s
1747 __ dci(0x45304d3e); // uqxtnt z30.h, z9.s
1749 __ dci(0x453049bc); // uqxtnb z28.h, z13.s
1751 __ dci(0x453049b8); // uqxtnb z24.h, z13.s
1753 __ dci(0x45304979); // uqxtnb z25.h, z11.s
1755 __ dci(0x4530497d); // uqxtnb z29.h, z11.s
1757 __ dci(0x4530496d); // uqxtnb z13.h, z11.s
1759 __ dci(0x45304565); // sqxtnt z5.h, z11.s
1761 __ dci(0x45304f75); // uqxtnt z21.h, z27.s
1763 __ dci(0x45304f71); // uqxtnt z17.h, z27.s
1765 __ dci(0x45304f73); // uqxtnt z19.h, z27.s
1767 __ dci(0x45284f72); // uqxtnt z18.b, z27.h
1769 __ dci(0x45284f7a); // uqxtnt z26.b, z27.h
1771 __ dci(0x45284fca); // uqxtnt z10.b, z30.h
1773 __ dci(0x45284b8b); // uqxtnb z11.b, z28.h
1775 __ dci(0x45284bef); // uqxtnb z15.b, z31.h
1777 __ dci(0x45284fae); // uqxtnt z14.b, z29.h
1779 __ dci(0x45284fac); // uqxtnt z12.b, z29.h
1781 __ dci(0x45284eed); // uqxtnt z13.b, z23.h
1783 __ dci(0x45284ee9); // uqxtnt z9.b, z23.h
1785 __ dci(0x45284ef9); // uqxtnt z25.b, z23.h
1787 __ dci(0x45284cd1); // uqxtnt z17.b, z6.h
1789 __ dci(0x45284cd5); // uqxtnt z21.b, z6.h
1791 __ dci(0x45284ad4); // uqxtnb z20.b, z22.h
1793 __ dci(0x45604adc); // uqxtnb z28.s, z22.d
1795 __ dci(0x45604ade); // uqxtnb z30.s, z22.d
1797 __ dci(0x456040dc); // sqxtnb z28.s, z6.d
1799 __ dci(0x456048f4); // uqxtnb z20.s, z7.d
1801 __ dci(0x45604c75); // uqxtnt z21.s, z3.d
1803 __ dci(0x45604cb1); // uqxtnt z17.s, z5.d
1805 __ dci(0x45604e33); // uqxtnt z19.s, z17.d
1807 __ dci(0x45604e23); // uqxtnt z3.s, z17.d
1809 __ dci(0x45604cab); // uqxtnt z11.s, z5.d
1811 __ dci(0x45604caa); // uqxtnt z10.s, z5.d
1813 __ dci(0x45604efa); // uqxtnt z26.s, z23.d
1815 __ dci(0x456046db); // sqxtnt z27.s, z22.d
1817 __ dci(0x456046da); // sqxtnt z26.s, z22.d
1819 __ dci(0x4560424a); // sqxtnb z10.s, z18.d
1821 __ dci(0x45604a08); // uqxtnb z8.s, z16.d
1823 __ dci(0x45304a00); // uqxtnb z0.h, z16.s
1825 __ dci(0x45304828); // uqxtnb z8.h, z1.s
1827 __ dci(0x4530422c); // sqxtnb z12.h, z17.s
1829 __ dci(0x45305324); // sqxtunb z4.h, z25.s
1831 __ dci(0x45305325); // sqxtunb z5.h, z25.s
1833 __ dci(0x45305321); // sqxtunb z1.h, z25.s
1835 __ dci(0x453057a9); // sqxtunt z9.h, z29.s
1837 __ dci(0x453043b9); // sqxtnb z25.h, z29.s
1839 __ dci(0x453043bb); // sqxtnb z27.h, z29.s
1841 __ dci(0x4530431a); // sqxtnb z26.h, z24.s
1843 __ dci(0x45304312); // sqxtnb z18.h, z24.s
1845 __ dci(0x4530491a); // uqxtnb z26.h, z8.s
1847 __ dci(0x4530413b); // sqxtnb z27.h, z9.s
1849 __ dci(0x4530482b); // uqxtnb z11.h, z1.s
1851 __ dci(0x4530483b); // uqxtnb z27.h, z1.s
1853 __ dci(0x45304979); // uqxtnb z25.h, z11.s
1855 __ dci(0x453049d1); // uqxtnb z17.h, z14.s
1857 __ dci(0x456049d3); // uqxtnb z19.s, z14.d
1863 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
1864 __ Ldr(w0, MemOperand(x0));
1903 __ dci(0x451892b8); // eorbt z24.b, z21.b, z24.b
1905 __ dci(0x455893ba); // eorbt z26.h, z29.h, z24.h
1907 __ dci(0x455892f8); // eorbt z24.h, z23.h, z24.h
1909 __ dci(0x455092bc); // eorbt z28.h, z21.h, z16.h
1911 __ dci(0x455893be); // eorbt z30.h, z29.h, z24.h
1913 __ dci(0x4558922e); // eorbt z14.h, z17.h, z24.h
1915 __ dci(0x45d892aa); // eorbt z10.d, z21.d, z24.d
1917 __ dci(0x454892a8); // eorbt z8.h, z21.h, z8.h
1919 __ dci(0x45c890ac); // eorbt z12.d, z5.d, z8.d
1921 __ dci(0x45c990ed); // eorbt z13.d, z7.d, z9.d
1923 __ dci(0x45c892fd); // eorbt z29.d, z23.d, z8.d
1925 __ dci(0x45c892f9); // eorbt z25.d, z23.d, z8.d
1927 __ dci(0x45c892f8); // eorbt z24.d, z23.d, z8.d
1929 __ dci(0x45c892e8); // eorbt z8.d, z23.d, z8.d
1931 __ dci(0x454a92ea); // eorbt z10.h, z23.h, z10.h
1933 __ dci(0x454092e2); // eorbt z2.h, z23.h, z0.h
1935 __ dci(0x454092f2); // eorbt z18.h, z23.h, z0.h
1937 __ dci(0x4550927a); // eorbt z26.h, z19.h, z16.h
1939 __ dci(0x4551923b); // eorbt z27.h, z17.h, z17.h
1941 __ dci(0x45d3923f); // eorbt z31.d, z17.d, z19.d
1943 __ dci(0x4553921d); // eorbt z29.h, z16.h, z19.h
1945 __ dci(0x4553932d); // eorbt z13.h, z25.h, z19.h
1947 __ dci(0x4513912c); // eorbt z12.b, z9.b, z19.b
1949 __ dci(0x4551912d); // eorbt z13.h, z9.h, z17.h
1951 __ dci(0x45119029); // eorbt z9.b, z1.b, z17.b
1953 __ dci(0x45149028); // eorbt z8.b, z1.b, z20.b
1955 __ dci(0x459490aa); // eorbt z10.s, z5.s, z20.s
1957 __ dci(0x458590a8); // eorbt z8.s, z5.s, z5.s
1959 __ dci(0x4585948c); // eortb z12.s, z4.s, z5.s
1961 __ dci(0x45cd949c); // eortb z28.d, z4.d, z13.d
1963 __ dci(0x4589949d); // eortb z29.s, z4.s, z9.s
1965 __ dci(0x458990ad); // eorbt z13.s, z5.s, z9.s
1967 __ dci(0x459b90ac); // eorbt z12.s, z5.s, z27.s
1969 __ dci(0x45db90ee); // eorbt z14.d, z7.d, z27.d
1971 __ dci(0x45db916f); // eorbt z15.d, z11.d, z27.d
1973 __ dci(0x45db95e7); // eortb z7.d, z15.d, z27.d
1975 __ dci(0x45db94a3); // eortb z3.d, z5.d, z27.d
1977 __ dci(0x45dd94a1); // eortb z1.d, z5.d, z29.d
1979 __ dci(0x45dd94b1); // eortb z17.d, z5.d, z29.d
1981 __ dci(0x45dd90f3); // eorbt z19.d, z7.d, z29.d
1983 __ dci(0x458d90e3); // eorbt z3.s, z7.s, z13.s
1985 __ dci(0x458994e2); // eortb z2.s, z7.s, z9.s
1987 __ dci(0x458b94a3); // eortb z3.s, z5.s, z11.s
1989 __ dci(0x459b9481); // eortb z1.s, z4.s, z27.s
1991 __ dci(0x455b9485); // eortb z5.h, z4.h, z27.h
1993 __ dci(0x454b9087); // eorbt z7.h, z4.h, z11.h
1995 __ dci(0x45499003); // eorbt z3.h, z0.h, z9.h
1997 __ dci(0x454d9022); // eorbt z2.h, z1.h, z13.h
1999 __ dci(0x45099026); // eorbt z6.b, z1.b, z9.b
2001 __ dci(0x454b9024); // eorbt z4.h, z1.h, z11.h
2007 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
2008 __ Ldr(w0, MemOperand(x0));
2047 __ dci(0x44d9721a); // sqrdmlah z26.d, z16.d, z25.d
2049 __ dci(0x44dd761b); // sqrdmlsh z27.d, z16.d, z29.d
2051 __ dci(0x44d4760b); // sqrdmlsh z11.d, z16.d, z20.d
2053 __ dci(0x44947709); // sqrdmlsh z9.s, z24.s, z20.s
2055 __ dci(0x4494770b); // sqrdmlsh z11.s, z24.s, z20.s
2057 __ dci(0x44d4773b); // sqrdmlsh z27.d, z25.d, z20.d
2059 __ dci(0x44dc7639); // sqrdmlsh z25.d, z17.d, z28.d
2061 __ dci(0x44dc763b); // sqrdmlsh z27.d, z17.d, z28.d
2063 __ dci(0x44d4743f); // sqrdmlsh z31.d, z1.d, z20.d
2065 __ dci(0x449c742f); // sqrdmlsh z15.s, z1.s, z28.s
2067 __ dci(0x449c7487); // sqrdmlsh z7.s, z4.s, z28.s
2069 __ dci(0x449c7485); // sqrdmlsh z5.s, z4.s, z28.s
2071 __ dci(0x448e7481); // sqrdmlsh z1.s, z4.s, z14.s
2073 __ dci(0x448e7480); // sqrdmlsh z0.s, z4.s, z14.s
2075 __ dci(0x449c7488); // sqrdmlsh z8.s, z4.s, z28.s
2077 __ dci(0x441c758a); // sqrdmlsh z10.b, z12.b, z28.b
2079 __ dci(0x441475ae); // sqrdmlsh z14.b, z13.b, z20.b
2081 __ dci(0x440075ac); // sqrdmlsh z12.b, z13.b, z0.b
2083 __ dci(0x440171bc); // sqrdmlah z28.b, z13.b, z1.b
2085 __ dci(0x440171b8); // sqrdmlah z24.b, z13.b, z1.b
2087 __ dci(0x441971b9); // sqrdmlah z25.b, z13.b, z25.b
2089 __ dci(0x440970bb); // sqrdmlah z27.b, z5.b, z9.b
2091 __ dci(0x441870ba); // sqrdmlah z26.b, z5.b, z24.b
2093 __ dci(0x441270b8); // sqrdmlah z24.b, z5.b, z18.b
2095 __ dci(0x44927090); // sqrdmlah z16.s, z4.s, z18.s
2097 __ dci(0x44937292); // sqrdmlah z18.s, z20.s, z19.s
2099 __ dci(0x4491721a); // sqrdmlah z26.s, z16.s, z17.s
2101 __ dci(0x44d3721b); // sqrdmlah z27.d, z16.d, z19.d
2103 __ dci(0x44d372ab); // sqrdmlah z11.d, z21.d, z19.d
2105 __ dci(0x44d372a3); // sqrdmlah z3.d, z21.d, z19.d
2107 __ dci(0x445376a1); // sqrdmlsh z1.h, z21.h, z19.h
2109 __ dci(0x44527685); // sqrdmlsh z5.h, z20.h, z18.h
2111 __ dci(0x44127495); // sqrdmlsh z21.b, z4.b, z18.b
2113 __ dci(0x44127794); // sqrdmlsh z20.b, z28.b, z18.b
2115 __ dci(0x44527695); // sqrdmlsh z21.h, z20.h, z18.h
2117 __ dci(0x445274dd); // sqrdmlsh z29.h, z6.h, z18.h
2119 __ dci(0x445774df); // sqrdmlsh z31.h, z6.h, z23.h
2121 __ dci(0x445775fe); // sqrdmlsh z30.h, z15.h, z23.h
2123 __ dci(0x445175ff); // sqrdmlsh z31.h, z15.h, z17.h
2125 __ dci(0x44517557); // sqrdmlsh z23.h, z10.h, z17.h
2131 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
2132 __ Ldr(w0, MemOperand(x0));
2171 __ dci(0x4445b4e3); // uadalp z3.h, p5/m, z7.b
2173 __ dci(0x4445b4e1); // uadalp z1.h, p5/m, z7.b
2175 __ dci(0x4445bc65); // uadalp z5.h, p7/m, z3.b
2177 __ dci(0x4445be35); // uadalp z21.h, p7/m, z17.b
2179 __ dci(0x4445be9d); // uadalp z29.h, p7/m, z20.b
2181 __ dci(0x4444bc9c); // sadalp z28.h, p7/m, z4.b
2183 __ dci(0x4444bc9d); // sadalp z29.h, p7/m, z4.b
2185 __ dci(0x4444ba99); // sadalp z25.h, p6/m, z20.b
2187 __ dci(0x44c4ba09); // sadalp z9.d, p6/m, z16.s
2189 __ dci(0x44c4ba01); // sadalp z1.d, p6/m, z16.s
2191 __ dci(0x44c4ba11); // sadalp z17.d, p6/m, z16.s
2193 __ dci(0x4484bb15); // sadalp z21.s, p6/m, z24.h
2195 __ dci(0x4484b957); // sadalp z23.s, p6/m, z10.h
2197 __ dci(0x4484b953); // sadalp z19.s, p6/m, z10.h
2199 __ dci(0x4484b943); // sadalp z3.s, p6/m, z10.h
2201 __ dci(0x4484b102); // sadalp z2.s, p4/m, z8.h
2203 __ dci(0x4484bd06); // sadalp z6.s, p7/m, z8.h
2205 __ dci(0x4484bdc2); // sadalp z2.s, p7/m, z14.h
2207 __ dci(0x4485b5c6); // uadalp z6.s, p5/m, z14.h
2209 __ dci(0x4485b5c2); // uadalp z2.s, p5/m, z14.h
2211 __ dci(0x4485b5ca); // uadalp z10.s, p5/m, z14.h
2213 __ dci(0x4485b15a); // uadalp z26.s, p4/m, z10.h
2215 __ dci(0x44c5b95e); // uadalp z30.d, p6/m, z10.s
2217 __ dci(0x44c5a14e); // uadalp z14.d, p0/m, z10.s
2219 __ dci(0x4445a1c6); // uadalp z6.h, p0/m, z14.b
2221 __ dci(0x4445a1ce); // uadalp z14.h, p0/m, z14.b
2223 __ dci(0x4444a9de); // sadalp z30.h, p2/m, z14.b
2225 __ dci(0x4444adff); // sadalp z31.h, p3/m, z15.b
2227 __ dci(0x4444bdb7); // sadalp z23.h, p7/m, z13.b
2229 __ dci(0x4444bda7); // sadalp z7.h, p7/m, z13.b
2231 __ dci(0x4445bd25); // uadalp z5.h, p7/m, z9.b
2233 __ dci(0x4485bd35); // uadalp z21.s, p7/m, z9.h
2235 __ dci(0x4485bc17); // uadalp z23.s, p7/m, z0.h
2237 __ dci(0x4485bc15); // uadalp z21.s, p7/m, z0.h
2239 __ dci(0x4485be91); // uadalp z17.s, p7/m, z20.h
2241 __ dci(0x4485be53); // uadalp z19.s, p7/m, z18.h
2243 __ dci(0x4485aa52); // uadalp z18.s, p2/m, z18.h
2245 __ dci(0x4485ae13); // uadalp z19.s, p3/m, z16.h
2247 __ dci(0x4485b617); // uadalp z23.s, p5/m, z16.h
2249 __ dci(0x4485bc13); // uadalp z19.s, p7/m, z0.h
2255 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
2256 __ Ldr(w0, MemOperand(x0));
2295 __ dci(0x04a56309); // mul z9.s, z24.s, z5.s
2297 __ dci(0x04a56148); // mul z8.s, z10.s, z5.s
2299 __ dci(0x04a161d8); // mul z24.s, z14.s, z1.s
2301 __ dci(0x04a16179); // mul z25.s, z11.s, z1.s
2303 __ dci(0x04b36171); // mul z17.s, z11.s, z19.s
2305 __ dci(0x04fb6170); // mul z16.d, z11.d, z27.d
2307 __ dci(0x04fb6171); // mul z17.d, z11.d, z27.d
2309 __ dci(0x04fb6350); // mul z16.d, z26.d, z27.d
2311 __ dci(0x04eb6372); // mul z18.d, z27.d, z11.d
2313 __ dci(0x04eb6376); // mul z22.d, z27.d, z11.d
2315 __ dci(0x04ed637e); // mul z30.d, z27.d, z13.d
2317 __ dci(0x04e8637f); // mul z31.d, z27.d, z8.d
2319 __ dci(0x04a86337); // mul z23.s, z25.s, z8.s
2321 __ dci(0x04a86336); // mul z22.s, z25.s, z8.s
2323 __ dci(0x04ac63be); // mul z30.s, z29.s, z12.s
2325 __ dci(0x04ac63d6); // mul z22.s, z30.s, z12.s
2327 __ dci(0x042c67d2); // pmul z18.b, z30.b, z12.b
2329 __ dci(0x042c65f3); // pmul z19.b, z15.b, z12.b
2331 __ dci(0x042e65d2); // pmul z18.b, z14.b, z14.b
2333 __ dci(0x042f6550); // pmul z16.b, z10.b, z15.b
2335 __ dci(0x042e6754); // pmul z20.b, z26.b, z14.b
2337 __ dci(0x042e6750); // pmul z16.b, z26.b, z14.b
2339 __ dci(0x042e6600); // pmul z0.b, z16.b, z14.b
2341 __ dci(0x042e6602); // pmul z2.b, z16.b, z14.b
2343 __ dci(0x043f6600); // pmul z0.b, z16.b, z31.b
2345 __ dci(0x042b6608); // pmul z8.b, z16.b, z11.b
2347 __ dci(0x042a6700); // pmul z0.b, z24.b, z10.b
2349 __ dci(0x042a6710); // pmul z16.b, z24.b, z10.b
2351 __ dci(0x042a6714); // pmul z20.b, z24.b, z10.b
2353 __ dci(0x042a6716); // pmul z22.b, z24.b, z10.b
2359 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
2360 __ Ldr(w0, MemOperand(x0));
2399 __ dci(0x04e46c3b); // umulh z27.d, z1.d, z4.d
2401 __ dci(0x04ac6c3a); // umulh z26.s, z1.s, z12.s
2403 __ dci(0x04a86e32); // umulh z18.s, z17.s, z8.s
2405 __ dci(0x04a86a7a); // smulh z26.s, z19.s, z8.s
2407 __ dci(0x04e86b7b); // smulh z27.d, z27.d, z8.d
2409 __ dci(0x04ee6b73); // smulh z19.d, z27.d, z14.d
2411 __ dci(0x04ec6f7b); // umulh z27.d, z27.d, z12.d
2413 __ dci(0x04ac6f3a); // umulh z26.s, z25.s, z12.s
2415 __ dci(0x04ac6f32); // umulh z18.s, z25.s, z12.s
2417 __ dci(0x042e6f3a); // umulh z26.b, z25.b, z14.b
2419 __ dci(0x042a6b2a); // smulh z10.b, z25.b, z10.b
2421 __ dci(0x042a6b2b); // smulh z11.b, z25.b, z10.b
2423 __ dci(0x043a6b03); // smulh z3.b, z24.b, z26.b
2425 __ dci(0x047a690b); // smulh z11.h, z8.h, z26.h
2427 __ dci(0x047a690a); // smulh z10.h, z8.h, z26.h
2429 __ dci(0x0479690e); // smulh z14.h, z8.h, z25.h
2431 __ dci(0x046d690c); // smulh z12.h, z8.h, z13.h
2433 __ dci(0x042f690e); // smulh z14.b, z8.b, z15.b
2435 __ dci(0x042f69ac); // smulh z12.b, z13.b, z15.b
2437 __ dci(0x042f696e); // smulh z14.b, z11.b, z15.b
2439 __ dci(0x042e6b6a); // smulh z10.b, z27.b, z14.b
2441 __ dci(0x042e6b6e); // smulh z14.b, z27.b, z14.b
2443 __ dci(0x04366b6f); // smulh z15.b, z27.b, z22.b
2445 __ dci(0x04766f7f); // umulh z31.h, z27.h, z22.h
2447 __ dci(0x04746fef); // umulh z15.h, z31.h, z20.h
2449 __ dci(0x04706dee); // umulh z14.h, z15.h, z16.h
2451 __ dci(0x04706c7e); // umulh z30.h, z3.h, z16.h
2453 __ dci(0x04306c2e); // umulh z14.b, z1.b, z16.b
2455 __ dci(0x04b06e2a); // umulh z10.s, z17.s, z16.s
2457 __ dci(0x04b56e2e); // umulh z14.s, z17.s, z21.s
2463 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
2464 __ Ldr(w0, MemOperand(x0));
2503 __ dci(0x459289bd); // ssublbt z29.s, z13.h, z18.h
2505 __ dci(0x459289bf); // ssublbt z31.s, z13.h, z18.h
2507 __ dci(0x45d689be); // ssublbt z30.d, z13.s, z22.s
2509 __ dci(0x45d68916); // ssublbt z22.d, z8.s, z22.s
2511 __ dci(0x45968957); // ssublbt z23.s, z10.h, z22.h
2513 __ dci(0x45968a55); // ssublbt z21.s, z18.h, z22.h
2515 __ dci(0x45868251); // saddlbt z17.s, z18.h, z6.h
2517 __ dci(0x45868230); // saddlbt z16.s, z17.h, z6.h
2519 __ dci(0x45868231); // saddlbt z17.s, z17.h, z6.h
2521 __ dci(0x458c8235); // saddlbt z21.s, z17.h, z12.h
2523 __ dci(0x458c8231); // saddlbt z17.s, z17.h, z12.h
2525 __ dci(0x459c8021); // saddlbt z1.s, z1.h, z28.h
2527 __ dci(0x458c8009); // saddlbt z9.s, z0.h, z12.h
2529 __ dci(0x459e800b); // saddlbt z11.s, z0.h, z30.h
2531 __ dci(0x45928003); // saddlbt z3.s, z0.h, z18.h
2533 __ dci(0x45d28207); // saddlbt z7.d, z16.s, z18.s
2535 __ dci(0x45da8225); // saddlbt z5.d, z17.s, z26.s
2537 __ dci(0x45da830d); // saddlbt z13.d, z24.s, z26.s
2539 __ dci(0x45cb8309); // saddlbt z9.d, z24.s, z11.s
2541 __ dci(0x45ca8119); // saddlbt z25.d, z8.s, z10.s
2543 __ dci(0x45ce831d); // saddlbt z29.d, z24.s, z14.s
2545 __ dci(0x45ce8135); // saddlbt z21.d, z9.s, z14.s
2547 __ dci(0x458e8331); // saddlbt z17.s, z25.h, z14.h
2549 __ dci(0x458e8030); // saddlbt z16.s, z1.h, z14.h
2551 __ dci(0x458e8271); // saddlbt z17.s, z19.h, z14.h
2553 __ dci(0x458a82e1); // saddlbt z1.s, z23.h, z10.h
2555 __ dci(0x458a8240); // saddlbt z0.s, z18.h, z10.h
2557 __ dci(0x458a8e50); // ssubltb z16.s, z18.h, z10.h
2559 __ dci(0x45988e58); // ssubltb z24.s, z18.h, z24.h
2561 __ dci(0x45d08e59); // ssubltb z25.d, z18.s, z16.s
2563 __ dci(0x45d08e58); // ssubltb z24.d, z18.s, z16.s
2565 __ dci(0x45d08259); // saddlbt z25.d, z18.s, z16.s
2567 __ dci(0x45d08b51); // ssublbt z17.d, z26.s, z16.s
2569 __ dci(0x45d08970); // ssublbt z16.d, z11.s, z16.s
2571 __ dci(0x45d28d74); // ssubltb z20.d, z11.s, z18.s
2573 __ dci(0x45c28d56); // ssubltb z22.d, z10.s, z2.s
2575 __ dci(0x45c28d52); // ssubltb z18.d, z10.s, z2.s
2577 __ dci(0x45c48d5a); // ssubltb z26.d, z10.s, z4.s
2579 __ dci(0x45c18d5b); // ssubltb z27.d, z10.s, z1.s
2581 __ dci(0x45818d13); // ssubltb z19.s, z8.h, z1.h
2583 __ dci(0x45818d12); // ssubltb z18.s, z8.h, z1.h
2585 __ dci(0x45858d9a); // ssubltb z26.s, z12.h, z5.h
2587 __ dci(0x45858df2); // ssubltb z18.s, z15.h, z5.h
2589 __ dci(0x45c58d62); // ssubltb z2.d, z11.s, z5.s
2591 __ dci(0x45c58b72); // ssublbt z18.d, z27.s, z5.s
2593 __ dci(0x45858a76); // ssublbt z22.s, z19.h, z5.h
2595 __ dci(0x45878877); // ssublbt z23.s, z3.h, z7.h
2597 __ dci(0x458f8073); // saddlbt z19.s, z3.h, z15.h
2599 __ dci(0x45878051); // saddlbt z17.s, z2.h, z7.h
2601 __ dci(0x45838841); // ssublbt z1.s, z2.h, z3.h
2607 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
2608 __ Ldr(w0, MemOperand(x0));
2647 __ dci(0x4448b23a); // sqabs z26.h, p4/m, z17.h
2649 __ dci(0x4448b23e); // sqabs z30.h, p4/m, z17.h
2651 __ dci(0x4448a21c); // sqabs z28.h, p0/m, z16.h
2653 __ dci(0x4408a298); // sqabs z24.b, p0/m, z20.b
2655 __ dci(0x4408a0dc); // sqabs z28.b, p0/m, z6.b
2657 __ dci(0x4408a0de); // sqabs z30.b, p0/m, z6.b
2659 __ dci(0x4408a19c); // sqabs z28.b, p0/m, z12.b
2661 __ dci(0x4408a3d4); // sqabs z20.b, p0/m, z30.b
2663 __ dci(0x4489a3dc); // sqneg z28.s, p0/m, z30.s
2665 __ dci(0x4409a1d4); // sqneg z20.b, p0/m, z14.b
2667 __ dci(0x4408a3d0); // sqabs z16.b, p0/m, z30.b
2669 __ dci(0x44c8a3d8); // sqabs z24.d, p0/m, z30.d
2671 __ dci(0x44c8b3fa); // sqabs z26.d, p4/m, z31.d
2673 __ dci(0x44c8a2fb); // sqabs z27.d, p0/m, z23.d
2675 __ dci(0x44c8a2f9); // sqabs z25.d, p0/m, z23.d
2677 __ dci(0x4488a2db); // sqabs z27.s, p0/m, z22.s
2679 __ dci(0x4488a2df); // sqabs z31.s, p0/m, z22.s
2681 __ dci(0x4488a2cf); // sqabs z15.s, p0/m, z22.s
2683 __ dci(0x4488a04b); // sqabs z11.s, p0/m, z2.s
2685 __ dci(0x4488a02f); // sqabs z15.s, p0/m, z1.s
2687 __ dci(0x4489a06d); // sqneg z13.s, p0/m, z3.s
2689 __ dci(0x4489a449); // sqneg z9.s, p1/m, z2.s
2691 __ dci(0x4489a50b); // sqneg z11.s, p1/m, z8.s
2693 __ dci(0x4488a71b); // sqabs z27.s, p1/m, z24.s
2695 __ dci(0x4408a519); // sqabs z25.b, p1/m, z8.b
2697 __ dci(0x4408a158); // sqabs z24.b, p0/m, z10.b
2699 __ dci(0x4488a168); // sqabs z8.s, p0/m, z11.s
2701 __ dci(0x44c9a16c); // sqneg z12.d, p0/m, z11.d
2703 __ dci(0x44c9a17c); // sqneg z28.d, p0/m, z11.d
2705 __ dci(0x44c9a878); // sqneg z24.d, p2/m, z3.d
2707 __ dci(0x44c9a8d9); // sqneg z25.d, p2/m, z6.d
2709 __ dci(0x44c9b85b); // sqneg z27.d, p6/m, z2.d
2711 __ dci(0x4449b87f); // sqneg z31.h, p6/m, z3.h
2713 __ dci(0x4449b81d); // sqneg z29.h, p6/m, z0.h
2715 __ dci(0x4449a895); // sqneg z21.h, p2/m, z4.h
2717 __ dci(0x4449a825); // sqneg z5.h, p2/m, z1.h
2719 __ dci(0x4449a821); // sqneg z1.h, p2/m, z1.h
2721 __ dci(0x4449a820); // sqneg z0.h, p2/m, z1.h
2723 __ dci(0x4449a822); // sqneg z2.h, p2/m, z1.h
2725 __ dci(0x4449ae23); // sqneg z3.h, p3/m, z17.h
2727 __ dci(0x4449af73); // sqneg z19.h, p3/m, z27.h
2729 __ dci(0x4449af77); // sqneg z23.h, p3/m, z27.h
2731 __ dci(0x4489af67); // sqneg z7.s, p3/m, z27.s
2733 __ dci(0x4489ad25); // sqneg z5.s, p3/m, z9.s
2735 __ dci(0x4409ad07); // sqneg z7.b, p3/m, z8.b
2737 __ dci(0x4489ad85); // sqneg z5.s, p3/m, z12.s
2739 __ dci(0x44c9a984); // sqneg z4.d, p2/m, z12.d
2741 __ dci(0x44c9a926); // sqneg z6.d, p2/m, z9.d
2743 __ dci(0x4449ab2e); // sqneg z14.h, p2/m, z25.h
2745 __ dci(0x4449ab3e); // sqneg z30.h, p2/m, z25.h
2751 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
2752 __ Ldr(w0, MemOperand(x0));
2791 __ dci(0x4481bee8); // ursqrte z8.s, p7/m, z23.s
2793 __ dci(0x4480bea9); // urecpe z9.s, p7/m, z21.s
2795 __ dci(0x4481bfab); // ursqrte z11.s, p7/m, z29.s
2797 __ dci(0x4481b9a3); // ursqrte z3.s, p6/m, z13.s
2799 __ dci(0x4481aba2); // ursqrte z2.s, p2/m, z29.s
2801 __ dci(0x4480abe6); // urecpe z6.s, p2/m, z31.s
2803 __ dci(0x4480afa2); // urecpe z2.s, p3/m, z29.s
2805 __ dci(0x4480ae23); // urecpe z3.s, p3/m, z17.s
2807 __ dci(0x4481aa27); // ursqrte z7.s, p2/m, z17.s
2809 __ dci(0x4481a325); // ursqrte z5.s, p0/m, z25.s
2811 __ dci(0x4481a321); // ursqrte z1.s, p0/m, z25.s
2813 __ dci(0x4481ab05); // ursqrte z5.s, p2/m, z24.s
2815 __ dci(0x4481a995); // ursqrte z21.s, p2/m, z12.s
2817 __ dci(0x4481bb91); // ursqrte z17.s, p6/m, z28.s
2819 __ dci(0x4481b199); // ursqrte z25.s, p4/m, z12.s
2821 __ dci(0x4481a989); // ursqrte z9.s, p2/m, z12.s
2823 __ dci(0x4481b18b); // ursqrte z11.s, p4/m, z12.s
2825 __ dci(0x4480b089); // urecpe z9.s, p4/m, z4.s
2827 __ dci(0x4480b2c1); // urecpe z1.s, p4/m, z22.s
2829 __ dci(0x4480aad1); // urecpe z17.s, p2/m, z22.s
2835 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
2836 __ Ldr(w0, MemOperand(x0));
2875 __ dci(0x45573eac); // uabdlt z12.h, z21.b, z23.b
2877 __ dci(0x45573c84); // uabdlt z4.h, z4.b, z23.b
2879 __ dci(0x45571d8c); // usublt z12.h, z12.b, z23.b
2881 __ dci(0x45971d8e); // usublt z14.s, z12.h, z23.h
2883 __ dci(0x45d7158c); // ssublt z12.d, z12.s, z23.s
2885 __ dci(0x4557119c); // ssublb z28.h, z12.b, z23.b
2887 __ dci(0x45d5118c); // ssublb z12.d, z12.s, z21.s
2889 __ dci(0x45551088); // ssublb z8.h, z4.b, z21.b
2891 __ dci(0x455410cc); // ssublb z12.h, z6.b, z20.b
2893 __ dci(0x454414c8); // ssublt z8.h, z6.b, z4.b
2895 __ dci(0x454510c9); // ssublb z9.h, z6.b, z5.b
2897 __ dci(0x455510ed); // ssublb z13.h, z7.b, z21.b
2899 __ dci(0x455508ef); // uaddlb z15.h, z7.b, z21.b
2901 __ dci(0x455502e7); // saddlb z7.h, z23.b, z21.b
2903 __ dci(0x455d06f7); // saddlt z23.h, z23.b, z29.b
2905 __ dci(0x455f06df); // saddlt z31.h, z22.b, z31.b
2907 __ dci(0x45de06db); // saddlt z27.d, z22.s, z30.s
2909 __ dci(0x45c606da); // saddlt z26.d, z22.s, z6.s
2911 __ dci(0x45c306db); // saddlt z27.d, z22.s, z3.s
2913 __ dci(0x455306d3); // saddlt z19.h, z22.b, z19.b
2915 __ dci(0x455306d1); // saddlt z17.h, z22.b, z19.b
2917 __ dci(0x455306d3); // saddlt z19.h, z22.b, z19.b
2919 __ dci(0x45510edb); // uaddlt z27.h, z22.b, z17.b
2921 __ dci(0x45510bdf); // uaddlb z31.h, z30.b, z17.b
2923 __ dci(0x45d10b4f); // uaddlb z15.d, z26.s, z17.s
2925 __ dci(0x45810b47); // uaddlb z7.s, z26.h, z1.h
2927 __ dci(0x45811bc3); // usublb z3.s, z30.h, z1.h
2929 __ dci(0x45891b82); // usublb z2.s, z28.h, z9.h
2931 __ dci(0x4589398a); // uabdlb z10.s, z12.h, z9.h
2933 __ dci(0x458919ab); // usublb z11.s, z13.h, z9.h
2935 __ dci(0x45cb19af); // usublb z15.d, z13.s, z11.s
2937 __ dci(0x45cb19bf); // usublb z31.d, z13.s, z11.s
2939 __ dci(0x45cb190f); // usublb z15.d, z8.s, z11.s
2941 __ dci(0x45cb1d8d); // usublt z13.d, z12.s, z11.s
2943 __ dci(0x45cb1d89); // usublt z9.d, z12.s, z11.s
2945 __ dci(0x454b0d8b); // uaddlt z11.h, z12.b, z11.b
2947 __ dci(0x45cb1d8a); // usublt z10.d, z12.s, z11.s
2949 __ dci(0x454f1d8e); // usublt z14.h, z12.b, z15.b
2951 __ dci(0x455b1d8f); // usublt z15.h, z12.b, z27.b
2953 __ dci(0x455a1c87); // usublt z7.h, z4.b, z26.b
2955 __ dci(0x454a1cb7); // usublt z23.h, z5.b, z10.b
2957 __ dci(0x454218a7); // usublb z7.h, z5.b, z2.b
2959 __ dci(0x454a19a6); // usublb z6.h, z13.b, z10.b
2961 __ dci(0x454a3da2); // uabdlt z2.h, z13.b, z10.b
2963 __ dci(0x45423ca6); // uabdlt z6.h, z5.b, z2.b
2965 __ dci(0x454a34a7); // sabdlt z7.h, z5.b, z10.b
2967 __ dci(0x454a3466); // sabdlt z6.h, z3.b, z10.b
2969 __ dci(0x454b146e); // ssublt z14.h, z3.b, z11.b
2971 __ dci(0x454b146a); // ssublt z10.h, z3.b, z11.b
2973 __ dci(0x454b147a); // ssublt z26.h, z3.b, z11.b
2979 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
2980 __ Ldr(w0, MemOperand(x0));
3019 __ dci(0x45494683); // saddwt z3.h, z20.h, z9.b
3021 __ dci(0x45494687); // saddwt z7.h, z20.h, z9.b
3023 __ dci(0x454b46d7); // saddwt z23.h, z22.h, z11.b
3025 __ dci(0x455b56d5); // ssubwt z21.h, z22.h, z27.b
3027 __ dci(0x455b567d); // ssubwt z29.h, z19.h, z27.b
3029 __ dci(0x455b506d); // ssubwb z13.h, z3.h, z27.b
3031 __ dci(0x4559502f); // ssubwb z15.h, z1.h, z25.b
3033 __ dci(0x45d95427); // ssubwt z7.d, z1.d, z25.s
3035 __ dci(0x45d95426); // ssubwt z6.d, z1.d, z25.s
3037 __ dci(0x45db5c36); // usubwt z22.d, z1.d, z27.s
3039 __ dci(0x45d95d37); // usubwt z23.d, z9.d, z25.s
3041 __ dci(0x45d55d27); // usubwt z7.d, z9.d, z21.s
3043 __ dci(0x45d44d25); // uaddwt z5.d, z9.d, z20.s
3045 __ dci(0x45dc4927); // uaddwb z7.d, z9.d, z28.s
3047 __ dci(0x455c490f); // uaddwb z15.h, z8.h, z28.b
3049 __ dci(0x455c490b); // uaddwb z11.h, z8.h, z28.b
3051 __ dci(0x45584923); // uaddwb z3.h, z9.h, z24.b
3053 __ dci(0x45584922); // uaddwb z2.h, z9.h, z24.b
3055 __ dci(0x45584940); // uaddwb z0.h, z10.h, z24.b
3057 __ dci(0x45da4944); // uaddwb z4.d, z10.d, z26.s
3059 __ dci(0x45524945); // uaddwb z5.h, z10.h, z18.b
3061 __ dci(0x4540494d); // uaddwb z13.h, z10.h, z0.b
3063 __ dci(0x45c04909); // uaddwb z9.d, z8.d, z0.s
3065 __ dci(0x45c8498d); // uaddwb z13.d, z12.d, z8.s
3067 __ dci(0x45c0418f); // saddwb z15.d, z12.d, z0.s
3069 __ dci(0x45d84187); // saddwb z7.d, z12.d, z24.s
3071 __ dci(0x45dc5197); // ssubwb z23.d, z12.d, z28.s
3073 __ dci(0x45dc5d93); // usubwt z19.d, z12.d, z28.s
3075 __ dci(0x45dd5592); // ssubwt z18.d, z12.d, z29.s
3077 __ dci(0x45dd5550); // ssubwt z16.d, z10.d, z29.s
3079 __ dci(0x45cd55d4); // ssubwt z20.d, z14.d, z13.s
3081 __ dci(0x45dd5dd5); // usubwt z21.d, z14.d, z29.s
3083 __ dci(0x45dd5dc5); // usubwt z5.d, z14.d, z29.s
3085 __ dci(0x454d5dd5); // usubwt z21.h, z14.h, z13.b
3087 __ dci(0x454d4dfd); // uaddwt z29.h, z15.h, z13.b
3089 __ dci(0x45494fed); // uaddwt z13.h, z31.h, z9.b
3091 __ dci(0x45cb4fef); // uaddwt z15.d, z31.d, z11.s
3093 __ dci(0x454b47ff); // saddwt z31.h, z31.h, z11.b
3095 __ dci(0x454747f7); // saddwt z23.h, z31.h, z7.b
3097 __ dci(0x45c743f6); // saddwb z22.d, z31.d, z7.s
3099 __ dci(0x45c74b66); // uaddwb z6.d, z27.d, z7.s
3101 __ dci(0x45474be4); // uaddwb z4.h, z31.h, z7.b
3103 __ dci(0x454349e0); // uaddwb z0.h, z15.h, z3.b
3105 __ dci(0x454359c1); // usubwb z1.h, z14.h, z3.b
3107 __ dci(0x45535983); // usubwb z3.h, z12.h, z19.b
3109 __ dci(0x45535981); // usubwb z1.h, z12.h, z19.b
3111 __ dci(0x45535a83); // usubwb z3.h, z20.h, z19.b
3113 __ dci(0x45d35e81); // usubwt z1.d, z20.d, z19.s
3115 __ dci(0x45d25ec9); // usubwt z9.d, z22.d, z18.s
3117 __ dci(0x45d35e88); // usubwt z8.d, z20.d, z19.s
3123 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
3124 __ Ldr(w0, MemOperand(x0));
3163 __ dci(0x4518aafc); // ushllb z28.s, z23.h, #8
3165 __ dci(0x4518afec); // ushllt z12.s, z31.h, #8
3167 __ dci(0x4518adc4); // ushllt z4.s, z14.h, #8
3169 __ dci(0x4518a1c5); // sshllb z5.s, z14.h, #8
3171 __ dci(0x4508a9cd); // ushllb z13.h, z14.b, #0
3173 __ dci(0x4508ad9d); // ushllt z29.h, z12.b, #0
3175 __ dci(0x4508a795); // sshllt z21.h, z28.b, #0
3177 __ dci(0x450caf94); // ushllt z20.h, z28.b, #4
3179 __ dci(0x4508afd6); // ushllt z22.h, z30.b, #0
3181 __ dci(0x4509aed7); // ushllt z23.h, z22.b, #1
3183 __ dci(0x4508ae55); // ushllt z21.h, z18.b, #0
3185 __ dci(0x450cac51); // ushllt z17.h, z2.b, #4
3187 __ dci(0x450ca870); // ushllb z16.h, z3.b, #4
3189 __ dci(0x450ca031); // sshllb z17.h, z1.b, #4
3191 __ dci(0x450aa030); // sshllb z16.h, z1.b, #2
3193 __ dci(0x450aa031); // sshllb z17.h, z1.b, #2
3195 __ dci(0x450ba233); // sshllb z19.h, z17.b, #3
3197 __ dci(0x4509a263); // sshllb z3.h, z19.b, #1
3199 __ dci(0x450da673); // sshllt z19.h, z19.b, #5
3201 __ dci(0x451da477); // sshllt z23.s, z3.h, #13
3203 __ dci(0x451da5f6); // sshllt z22.s, z15.h, #13
3205 __ dci(0x450da5b4); // sshllt z20.h, z13.b, #5
3207 __ dci(0x450da5d5); // sshllt z21.h, z14.b, #5
3209 __ dci(0x450fa4d7); // sshllt z23.h, z6.b, #7
3211 __ dci(0x451ba4df); // sshllt z31.s, z6.h, #11
3213 __ dci(0x451ba4db); // sshllt z27.s, z6.h, #11
3215 __ dci(0x451ba4bf); // sshllt z31.s, z5.h, #11
3217 __ dci(0x451aa49b); // sshllt z27.s, z4.h, #10
3219 __ dci(0x451aa49f); // sshllt z31.s, z4.h, #10
3221 __ dci(0x451aa89b); // ushllb z27.s, z4.h, #10
3223 __ dci(0x4518aa9f); // ushllb z31.s, z20.h, #8
3225 __ dci(0x451aaab7); // ushllb z23.s, z21.h, #10
3227 __ dci(0x4508aaa7); // ushllb z7.h, z21.b, #0
3229 __ dci(0x4508ae2f); // ushllt z15.h, z17.b, #0
3231 __ dci(0x4509ac27); // ushllt z7.h, z1.b, #1
3233 __ dci(0x450dae25); // ushllt z5.h, z17.b, #5
3235 __ dci(0x4509aea7); // ushllt z7.h, z21.b, #1
3237 __ dci(0x4509adb7); // ushllt z23.h, z13.b, #1
3239 __ dci(0x4549ade7); // ushllt z7.d, z15.s, #9
3241 __ dci(0x4549adf7); // ushllt z23.d, z15.s, #9
3243 __ dci(0x4548aff6); // ushllt z22.d, z31.s, #8
3245 __ dci(0x4548affe); // ushllt z30.d, z31.s, #8
3247 __ dci(0x4548adda); // ushllt z26.d, z14.s, #8
3249 __ dci(0x4544add2); // ushllt z18.d, z14.s, #4
3251 __ dci(0x454cad42); // ushllt z2.d, z10.s, #12
3253 __ dci(0x450dad40); // ushllt z0.h, z10.b, #5
3255 __ dci(0x4515ad50); // ushllt z16.s, z10.h, #5
3257 __ dci(0x4557ad51); // ushllt z17.d, z10.s, #23
3259 __ dci(0x4557ad41); // ushllt z1.d, z10.s, #23
3261 __ dci(0x4557ad40); // ushllt z0.d, z10.s, #23
3267 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
3268 __ Ldr(w0, MemOperand(x0));
3307 __ dci(0x456b1458); // shrnt z24.s, z2.d, #21
3309 __ dci(0x456b145c); // shrnt z28.s, z2.d, #21
3311 __ dci(0x45291454); // shrnt z20.b, z2.h, #7
3313 __ dci(0x4539141c); // shrnt z28.h, z0.s, #7
3315 __ dci(0x453914b8); // shrnt z24.h, z5.s, #7
3317 __ dci(0x453b14f9); // shrnt z25.h, z7.s, #5
3319 __ dci(0x453315fd); // shrnt z29.h, z15.s, #13
3321 __ dci(0x45331d75); // rshrnt z21.h, z11.s, #13
3323 __ dci(0x45331945); // rshrnb z5.h, z10.s, #13
3325 __ dci(0x45331941); // rshrnb z1.h, z10.s, #13
3327 __ dci(0x45331949); // rshrnb z9.h, z10.s, #13
3329 __ dci(0x453b1979); // rshrnb z25.h, z11.s, #5
3331 __ dci(0x453b11f1); // shrnb z17.h, z15.s, #5
3333 __ dci(0x453711f9); // shrnb z25.h, z15.s, #9
3335 __ dci(0x453315f8); // shrnt z24.h, z15.s, #13
3337 __ dci(0x453319f0); // rshrnb z16.h, z15.s, #13
3339 __ dci(0x453b1972); // rshrnb z18.h, z11.s, #5
3341 __ dci(0x453b1962); // rshrnb z2.h, z11.s, #5
3343 __ dci(0x453b1c60); // rshrnt z0.h, z3.s, #5
3345 __ dci(0x45331c44); // rshrnt z4.h, z2.s, #13
3347 __ dci(0x45371c0c); // rshrnt z12.h, z0.s, #9
3349 __ dci(0x45331d08); // rshrnt z8.h, z8.s, #13
3351 __ dci(0x45331c98); // rshrnt z24.h, z4.s, #13
3353 __ dci(0x45731e99); // rshrnt z25.s, z20.d, #13
3355 __ dci(0x457b1a98); // rshrnb z24.s, z20.d, #5
3357 __ dci(0x452b1a9c); // rshrnb z28.b, z20.h, #5
3359 __ dci(0x452b1818); // rshrnb z24.b, z0.h, #5
3361 __ dci(0x452b181a); // rshrnb z26.b, z0.h, #5
3363 __ dci(0x452b181b); // rshrnb z27.b, z0.h, #5
3365 __ dci(0x45291a1a); // rshrnb z26.b, z16.h, #7
3367 __ dci(0x45681a12); // rshrnb z18.s, z16.d, #24
3369 __ dci(0x45681290); // shrnb z16.s, z20.d, #24
3371 __ dci(0x45281091); // shrnb z17.b, z4.h, #8
3373 __ dci(0x45281401); // shrnt z1.b, z0.h, #8
3375 __ dci(0x45281c83); // rshrnt z3.b, z4.h, #8
3377 __ dci(0x45281c93); // rshrnt z19.b, z4.h, #8
3379 __ dci(0x45681cb7); // rshrnt z23.s, z5.d, #24
3381 __ dci(0x45291cb6); // rshrnt z22.b, z5.h, #7
3383 __ dci(0x45391eb2); // rshrnt z18.h, z21.s, #7
3385 __ dci(0x45281ea2); // rshrnt z2.b, z21.h, #8
3387 __ dci(0x452c1fa0); // rshrnt z0.b, z29.h, #4
3389 __ dci(0x456c1ba2); // rshrnb z2.s, z29.d, #20
3391 __ dci(0x45641ab2); // rshrnb z18.s, z21.d, #28
3393 __ dci(0x456c12ba); // shrnb z26.s, z21.d, #20
3395 __ dci(0x452812b8); // shrnb z24.b, z21.h, #8
3397 __ dci(0x4568123a); // shrnb z26.s, z17.d, #24
3399 __ dci(0x456c1338); // shrnb z24.s, z25.d, #20
3401 __ dci(0x456813b9); // shrnb z25.s, z29.d, #24
3403 __ dci(0x456812e9); // shrnb z9.s, z23.d, #24
3405 __ dci(0x456812e1); // shrnb z1.s, z23.d, #24
3411 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
3412 __ Ldr(w0, MemOperand(x0));
3451 __ dci(0x457a3207); // uqshrnb z7.s, z16.d, #6
3453 __ dci(0x457a3206); // uqshrnb z6.s, z16.d, #6
3455 __ dci(0x457a3204); // uqshrnb z4.s, z16.d, #6
3457 __ dci(0x457e3a14); // uqrshrnb z20.s, z16.d, #2
3459 __ dci(0x457b3a15); // uqrshrnb z21.s, z16.d, #5
3461 __ dci(0x457b3ab7); // uqrshrnb z23.s, z21.d, #5
3463 __ dci(0x457b3ab6); // uqrshrnb z22.s, z21.d, #5
3465 __ dci(0x457f3af7); // uqrshrnb z23.s, z23.d, #1
3467 __ dci(0x457b38ff); // uqrshrnb z31.s, z7.d, #5
3469 __ dci(0x453338fe); // uqrshrnb z30.h, z7.s, #13
3471 __ dci(0x453338ee); // uqrshrnb z14.h, z7.s, #13
3473 __ dci(0x453b386a); // uqrshrnb z10.h, z3.s, #5
3475 __ dci(0x452f386e); // uqrshrnb z14.b, z3.h, #1
3477 __ dci(0x452f3aea); // uqrshrnb z10.b, z23.h, #1
3479 __ dci(0x452f38ba); // uqrshrnb z26.b, z5.h, #1
3481 __ dci(0x452f3878); // uqrshrnb z24.b, z3.h, #1
3483 __ dci(0x453f385c); // uqrshrnb z28.h, z2.s, #1
3485 __ dci(0x453f397d); // uqrshrnb z29.h, z11.s, #1
3487 __ dci(0x457d397c); // uqrshrnb z28.s, z11.d, #3
3489 __ dci(0x457f3878); // uqrshrnb z24.s, z3.d, #1
3491 __ dci(0x457b3c7a); // uqrshrnt z26.s, z3.d, #5
3493 __ dci(0x45633c72); // uqrshrnt z18.s, z3.d, #29
3495 __ dci(0x45613d76); // uqrshrnt z22.s, z11.d, #31
3497 __ dci(0x45693972); // uqrshrnb z18.s, z11.d, #23
3499 __ dci(0x45693d53); // uqrshrnt z19.s, z10.d, #23
3501 __ dci(0x45713d51); // uqrshrnt z17.s, z10.d, #15
3503 __ dci(0x45713d99); // uqrshrnt z25.s, z12.d, #15
3505 __ dci(0x45753f9d); // uqrshrnt z29.s, z28.d, #11
3507 __ dci(0x45753f8d); // uqrshrnt z13.s, z28.d, #11
3509 __ dci(0x45753685); // uqshrnt z5.s, z20.d, #11
3511 __ dci(0x457d3784); // uqshrnt z4.s, z28.d, #3
3513 __ dci(0x453c3785); // uqshrnt z5.h, z28.s, #4
3515 __ dci(0x453837a4); // uqshrnt z4.h, z29.s, #8
3517 __ dci(0x457a37a6); // uqshrnt z6.s, z29.d, #6
3519 __ dci(0x453a37e4); // uqshrnt z4.h, z31.s, #6
3521 __ dci(0x453f37ec); // uqshrnt z12.h, z31.s, #1
3523 __ dci(0x457f37dc); // uqshrnt z28.s, z30.d, #1
3525 __ dci(0x45773fde); // uqrshrnt z30.s, z30.d, #9
3527 __ dci(0x45653fda); // uqrshrnt z26.s, z30.d, #27
3529 __ dci(0x45613ffb); // uqrshrnt z27.s, z31.d, #31
3531 __ dci(0x45613feb); // uqrshrnt z11.s, z31.d, #31
3533 __ dci(0x45653fca); // uqrshrnt z10.s, z30.d, #27
3535 __ dci(0x45753fe8); // uqrshrnt z8.s, z31.d, #11
3537 __ dci(0x457537ca); // uqshrnt z10.s, z30.d, #11
3539 __ dci(0x457d35ce); // uqshrnt z14.s, z14.d, #3
3541 __ dci(0x452d35de); // uqshrnt z30.b, z14.h, #3
3543 __ dci(0x452d314e); // uqshrnb z14.b, z10.h, #3
3545 __ dci(0x453d304f); // uqshrnb z15.h, z2.s, #3
3547 __ dci(0x453d386e); // uqrshrnb z14.h, z3.s, #3
3549 __ dci(0x453538ec); // uqrshrnb z12.h, z7.s, #11
3555 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
3556 __ Ldr(w0, MemOperand(x0));
3595 __ dci(0x456c0875); // sqrshrunb z21.s, z3.d, #20
3597 __ dci(0x456c0877); // sqrshrunb z23.s, z3.d, #20
3599 __ dci(0x456c0876); // sqrshrunb z22.s, z3.d, #20
3601 __ dci(0x456e0c77); // sqrshrunt z23.s, z3.d, #18
3603 __ dci(0x456e0a73); // sqrshrunb z19.s, z19.d, #18
3605 __ dci(0x456c0e72); // sqrshrunt z18.s, z19.d, #20
3607 __ dci(0x456c2c62); // sqrshrnt z2.s, z3.d, #20
3609 __ dci(0x456c24f2); // sqshrnt z18.s, z7.d, #20
3611 __ dci(0x456c2570); // sqshrnt z16.s, z11.d, #20
3613 __ dci(0x456e2478); // sqshrnt z24.s, z3.d, #18
3615 __ dci(0x456e2c30); // sqrshrnt z16.s, z1.d, #18
3617 __ dci(0x456e2d78); // sqrshrnt z24.s, z11.d, #18
3619 __ dci(0x456f2970); // sqrshrnb z16.s, z11.d, #17
3621 __ dci(0x456b2938); // sqrshrnb z24.s, z9.d, #21
3623 __ dci(0x45692979); // sqrshrnb z25.s, z11.d, #23
3625 __ dci(0x4563297d); // sqrshrnb z29.s, z11.d, #29
3627 __ dci(0x45632975); // sqrshrnb z21.s, z11.d, #29
3629 __ dci(0x456309f1); // sqrshrunb z17.s, z15.d, #29
3631 __ dci(0x457308f3); // sqrshrunb z19.s, z7.d, #13
3633 __ dci(0x457329fb); // sqrshrnb z27.s, z15.d, #13
3635 __ dci(0x457721f3); // sqshrnb z19.s, z15.d, #9
3637 __ dci(0x45732171); // sqshrnb z17.s, z11.d, #13
3639 __ dci(0x45722070); // sqshrnb z16.s, z3.d, #14
3641 __ dci(0x456a2078); // sqshrnb z24.s, z3.d, #22
3643 __ dci(0x452a287c); // sqrshrnb z28.b, z3.h, #6
3645 __ dci(0x45282c78); // sqrshrnt z24.b, z3.h, #8
3647 __ dci(0x45602c68); // sqrshrnt z8.s, z3.d, #32
3649 __ dci(0x45602678); // sqshrnt z24.s, z19.d, #32
3651 __ dci(0x45682e70); // sqrshrnt z16.s, z19.d, #24
3653 __ dci(0x45682260); // sqshrnb z0.s, z19.d, #24
3655 __ dci(0x45682642); // sqshrnt z2.s, z18.d, #24
3657 __ dci(0x45680606); // sqshrunt z6.s, z16.d, #24
3659 __ dci(0x45680282); // sqshrunb z2.s, z20.d, #24
3661 __ dci(0x45680283); // sqshrunb z3.s, z20.d, #24
3663 __ dci(0x4568238b); // sqshrnb z11.s, z28.d, #24
3665 __ dci(0x45682383); // sqshrnb z3.s, z28.d, #24
3667 __ dci(0x45682682); // sqshrnt z2.s, z20.d, #24
3669 __ dci(0x45782e8a); // sqrshrnt z10.s, z20.d, #8
3671 __ dci(0x45780eba); // sqrshrunt z26.s, z21.d, #8
3673 __ dci(0x45700e32); // sqrshrunt z18.s, z17.d, #16
3675 __ dci(0x45700e42); // sqrshrunt z2.s, z18.d, #16
3677 __ dci(0x45782e52); // sqrshrnt z18.s, z18.d, #8
3679 __ dci(0x45782e42); // sqrshrnt z2.s, z18.d, #8
3681 __ dci(0x45742e46); // sqrshrnt z6.s, z18.d, #12
3683 __ dci(0x45642ec7); // sqrshrnt z7.s, z22.d, #28
3685 __ dci(0x45642a97); // sqrshrnb z23.s, z20.d, #28
3687 __ dci(0x45640b87); // sqrshrunb z7.s, z28.d, #28
3689 __ dci(0x45640f0f); // sqrshrunt z15.s, z24.d, #28
3691 __ dci(0x45600e0e); // sqrshrunt z14.s, z16.d, #32
3693 __ dci(0x45620a0f); // sqrshrunb z15.s, z16.d, #30
3699 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
3700 __ Ldr(w0, MemOperand(x0));
3739 __ dci(0x45c2ca3e); // uabalb z30.d, z17.s, z2.s
3741 __ dci(0x45caca7f); // uabalb z31.d, z19.s, z10.s
3743 __ dci(0x455aca7e); // uabalb z30.h, z19.b, z26.b
3745 __ dci(0x45daca5f); // uabalb z31.d, z18.s, z26.s
3747 __ dci(0x45d8ca1d); // uabalb z29.d, z16.s, z24.s
3749 __ dci(0x45d8ce95); // uabalt z21.d, z20.s, z24.s
3751 __ dci(0x4598ce14); // uabalt z20.s, z16.h, z24.h
3753 __ dci(0x4598ce04); // uabalt z4.s, z16.h, z24.h
3755 __ dci(0x45d8ce40); // uabalt z0.d, z18.s, z24.s
3757 __ dci(0x45daca44); // uabalb z4.d, z18.s, z26.s
3759 __ dci(0x45dace00); // uabalt z0.d, z16.s, z26.s
3761 __ dci(0x459ece04); // uabalt z4.s, z16.h, z30.h
3763 __ dci(0x458ece80); // uabalt z0.s, z20.h, z14.h
3765 __ dci(0x458ec482); // sabalt z2.s, z4.h, z14.h
3767 __ dci(0x45cec4a3); // sabalt z3.d, z5.s, z14.s
3769 __ dci(0x45cec8a1); // uabalb z1.d, z5.s, z14.s
3771 __ dci(0x458ec0a9); // sabalb z9.s, z5.h, z14.h
3773 __ dci(0x45c6c0ab); // sabalb z11.d, z5.s, z6.s
3775 __ dci(0x4544c0a9); // sabalb z9.h, z5.b, z4.b
3777 __ dci(0x4550c0a1); // sabalb z1.h, z5.b, z16.b
3779 __ dci(0x4550c0b1); // sabalb z17.h, z5.b, z16.b
3781 __ dci(0x4552c095); // sabalb z21.h, z4.b, z18.b
3783 __ dci(0x4543c094); // sabalb z20.h, z4.b, z3.b
3785 __ dci(0x4543c095); // sabalb z21.h, z4.b, z3.b
3787 __ dci(0x4543c385); // sabalb z5.h, z28.b, z3.b
3789 __ dci(0x4543c38d); // sabalb z13.h, z28.b, z3.b
3791 __ dci(0x45c3c19d); // sabalb z29.d, z12.s, z3.s
3793 __ dci(0x45d3c595); // sabalt z21.d, z12.s, z19.s
3795 __ dci(0x45d2c185); // sabalb z5.d, z12.s, z18.s
3797 __ dci(0x45d2c0b5); // sabalb z21.d, z5.s, z18.s
3799 __ dci(0x45d2c0bd); // sabalb z29.d, z5.s, z18.s
3801 __ dci(0x45d2cab9); // uabalb z25.d, z21.s, z18.s
3803 __ dci(0x45d0ca9b); // uabalb z27.d, z20.s, z16.s
3805 __ dci(0x45d0ca39); // uabalb z25.d, z17.s, z16.s
3807 __ dci(0x45d0ca3d); // uabalb z29.d, z17.s, z16.s
3809 __ dci(0x4550ce3c); // uabalt z28.h, z17.b, z16.b
3811 __ dci(0x4559ce38); // uabalt z24.h, z17.b, z25.b
3813 __ dci(0x455bcf39); // uabalt z25.h, z25.b, z27.b
3815 __ dci(0x455bceb1); // uabalt z17.h, z21.b, z27.b
3817 __ dci(0x455bceb3); // uabalt z19.h, z21.b, z27.b
3819 __ dci(0x455bceb1); // uabalt z17.h, z21.b, z27.b
3821 __ dci(0x4559ce21); // uabalt z1.h, z17.b, z25.b
3823 __ dci(0x45d9ce05); // uabalt z5.d, z16.s, z25.s
3825 __ dci(0x45dbc604); // sabalt z4.d, z16.s, z27.s
3827 __ dci(0x45d3c634); // sabalt z20.d, z17.s, z19.s
3829 __ dci(0x45dbc235); // sabalb z21.d, z17.s, z27.s
3831 __ dci(0x45dbc07d); // sabalb z29.d, z3.s, z27.s
3833 __ dci(0x459bc87c); // uabalb z28.s, z3.h, z27.h
3835 __ dci(0x459bc878); // uabalb z24.s, z3.h, z27.h
3837 __ dci(0x4593cc79); // uabalt z25.s, z3.h, z19.h
3843 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
3844 __ Ldr(w0, MemOperand(x0));
3883 __ dci(0x4548d4a1); // adclt z1.d, z5.d, z8.d
3885 __ dci(0x4588d4a5); // sbclt z5.s, z5.s, z8.s
3887 __ dci(0x4589d421); // sbclt z1.s, z1.s, z9.s
3889 __ dci(0x45d9d423); // sbclt z3.d, z1.d, z25.d
3891 __ dci(0x45dfd433); // sbclt z19.d, z1.d, z31.d
3893 __ dci(0x4597d437); // sbclt z23.s, z1.s, z23.s
3895 __ dci(0x4597d436); // sbclt z22.s, z1.s, z23.s
3897 __ dci(0x4587d537); // sbclt z23.s, z9.s, z7.s
3899 __ dci(0x4586d727); // sbclt z7.s, z25.s, z6.s
3901 __ dci(0x45c6d625); // sbclt z5.d, z17.d, z6.d
3903 __ dci(0x45c2d6b5); // sbclt z21.d, z21.d, z2.d
3905 __ dci(0x4546d6b7); // adclt z23.d, z21.d, z6.d
3907 __ dci(0x45c7d6a7); // sbclt z7.d, z21.d, z7.d
3909 __ dci(0x4547d4a5); // adclt z5.d, z5.d, z7.d
3911 __ dci(0x4517d4a1); // adclt z1.s, z5.s, z23.s
3913 __ dci(0x4507d5a5); // adclt z5.s, z13.s, z7.s
3915 __ dci(0x4507d5ad); // adclt z13.s, z13.s, z7.s
3917 __ dci(0x4507d0ac); // adclb z12.s, z5.s, z7.s
3919 __ dci(0x450ed0ad); // adclb z13.s, z5.s, z14.s
3921 __ dci(0x458ad0a9); // sbclb z9.s, z5.s, z10.s
3923 __ dci(0x4582d2ad); // sbclb z13.s, z21.s, z2.s
3925 __ dci(0x4502d3af); // adclb z15.s, z29.s, z2.s
3927 __ dci(0x450ad32b); // adclb z11.s, z25.s, z10.s
3929 __ dci(0x4582d329); // sbclb z9.s, z25.s, z2.s
3931 __ dci(0x4592d22b); // sbclb z11.s, z17.s, z18.s
3933 __ dci(0x459ad2a3); // sbclb z3.s, z21.s, z26.s
3935 __ dci(0x451ad233); // adclb z19.s, z17.s, z26.s
3937 __ dci(0x450bd232); // adclb z18.s, z17.s, z11.s
3939 __ dci(0x450ad2b6); // adclb z22.s, z21.s, z10.s
3941 __ dci(0x4582d2b4); // sbclb z20.s, z21.s, z2.s
3943 __ dci(0x4582d6e4); // sbclt z4.s, z23.s, z2.s
3945 __ dci(0x4500d6f4); // adclt z20.s, z23.s, z0.s
3947 __ dci(0x4501d2e4); // adclb z4.s, z23.s, z1.s
3949 __ dci(0x4501d1f4); // adclb z20.s, z15.s, z1.s
3951 __ dci(0x4503d1b0); // adclb z16.s, z13.s, z3.s
3953 __ dci(0x4501d198); // adclb z24.s, z12.s, z1.s
3955 __ dci(0x4501d3da); // adclb z26.s, z30.s, z1.s
3957 __ dci(0x4501d6de); // adclt z30.s, z22.s, z1.s
3959 __ dci(0x4503d2dc); // adclb z28.s, z22.s, z3.s
3961 __ dci(0x4502d6d8); // adclt z24.s, z22.s, z2.s
3963 __ dci(0x4502d6d0); // adclt z16.s, z22.s, z2.s
3965 __ dci(0x4502d280); // adclb z0.s, z20.s, z2.s
3967 __ dci(0x458ad284); // sbclb z4.s, z20.s, z10.s
3969 __ dci(0x458ad6d4); // sbclt z20.s, z22.s, z10.s
3971 __ dci(0x458ad6dc); // sbclt z28.s, z22.s, z10.s
3973 __ dci(0x458bd7cc); // sbclt z12.s, z30.s, z11.s
3975 __ dci(0x45dbd7ce); // sbclt z14.d, z30.d, z27.d
3977 __ dci(0x45dfd75e); // sbclt z30.d, z26.d, z31.d
3979 __ dci(0x45ddd7ce); // sbclt z14.d, z30.d, z29.d
3981 __ dci(0x45ddd7cf); // sbclt z15.d, z30.d, z29.d
3987 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
3988 __ Ldr(w0, MemOperand(x0));
4027 __ dci(0x45fd7464); // subhnt z4.s, z3.d, z29.d
4029 __ dci(0x45fc7c66); // rsubhnt z6.s, z3.d, z28.d
4031 __ dci(0x45fc7c6e); // rsubhnt z14.s, z3.d, z28.d
4033 __ dci(0x45f46c7e); // raddhnt z30.s, z3.d, z20.d
4035 __ dci(0x45f06e7c); // raddhnt z28.s, z19.d, z16.d
4037 __ dci(0x45b06a6c); // raddhnb z12.h, z19.s, z16.s
4039 __ dci(0x45b96a64); // raddhnb z4.h, z19.s, z25.s
4041 __ dci(0x45b96820); // raddhnb z0.h, z1.s, z25.s
4043 __ dci(0x45b96a01); // raddhnb z1.h, z16.s, z25.s
4045 __ dci(0x45b96900); // raddhnb z0.h, z8.s, z25.s
4047 __ dci(0x45a97904); // rsubhnb z4.h, z8.s, z9.s
4049 __ dci(0x45a9790c); // rsubhnb z12.h, z8.s, z9.s
4051 __ dci(0x45e97988); // rsubhnb z8.s, z12.d, z9.d
4053 __ dci(0x45f97909); // rsubhnb z9.s, z8.d, z25.d
4055 __ dci(0x45ff790d); // rsubhnb z13.s, z8.d, z31.d
4057 __ dci(0x45ff6d05); // raddhnt z5.s, z8.d, z31.d
4059 __ dci(0x45ff6dc1); // raddhnt z1.s, z14.d, z31.d
4061 __ dci(0x45ff79d1); // rsubhnb z17.s, z14.d, z31.d
4063 __ dci(0x457f7dd0); // rsubhnt z16.b, z14.h, z31.h
4065 __ dci(0x457f75f1); // subhnt z17.b, z15.h, z31.h
4067 __ dci(0x457f75f3); // subhnt z19.b, z15.h, z31.h
4069 __ dci(0x456d75fb); // subhnt z27.b, z15.h, z13.h
4071 __ dci(0x45ed7dff); // rsubhnt z31.s, z15.d, z13.d
4073 __ dci(0x45e17dfe); // rsubhnt z30.s, z15.d, z1.d
4075 __ dci(0x45e17df6); // rsubhnt z22.s, z15.d, z1.d
4077 __ dci(0x45e37d72); // rsubhnt z18.s, z11.d, z3.d
4079 __ dci(0x45737d62); // rsubhnt z2.b, z11.h, z19.h
4081 __ dci(0x45726d6a); // raddhnt z10.b, z11.h, z18.h
4083 __ dci(0x45726f5a); // raddhnt z26.b, z26.h, z18.h
4085 __ dci(0x45706f18); // raddhnt z24.b, z24.h, z16.h
4087 __ dci(0x45706f08); // raddhnt z8.b, z24.h, z16.h
4089 __ dci(0x45706f09); // raddhnt z9.b, z24.h, z16.h
4091 __ dci(0x45786b08); // raddhnb z8.b, z24.h, z24.h
4093 __ dci(0x45786b0c); // raddhnb z12.b, z24.h, z24.h
4095 __ dci(0x457a6308); // addhnb z8.b, z24.h, z26.h
4097 __ dci(0x45fb6318); // addhnb z24.s, z24.d, z27.d
4099 __ dci(0x45b96319); // addhnb z25.h, z24.s, z25.s
4101 __ dci(0x45bb621d); // addhnb z29.h, z16.s, z27.s
4103 __ dci(0x45b3625f); // addhnb z31.h, z18.s, z19.s
4105 __ dci(0x45b3631b); // addhnb z27.h, z24.s, z19.s
4107 __ dci(0x45bb6213); // addhnb z19.h, z16.s, z27.s
4109 __ dci(0x45bf7217); // subhnb z23.h, z16.s, z31.s
4111 __ dci(0x45b67213); // subhnb z19.h, z16.s, z22.s
4113 __ dci(0x45b66223); // addhnb z3.h, z17.s, z22.s
4115 __ dci(0x45f66a27); // raddhnb z7.s, z17.d, z22.d
4117 __ dci(0x45f76825); // raddhnb z5.s, z1.d, z23.d
4119 __ dci(0x45f668a1); // raddhnb z1.s, z5.d, z22.d
4121 __ dci(0x45f469b1); // raddhnb z17.s, z13.d, z20.d
4123 __ dci(0x45f469b3); // raddhnb z19.s, z13.d, z20.d
4125 __ dci(0x45f169b7); // raddhnb z23.s, z13.d, z17.d
4131 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
4132 __ Ldr(w0, MemOperand(x0));
4171 __ dci(0x4500dc43); // cadd z3.b, z3.b, z2.b, #270
4173 __ dci(0x4540dc13); // cadd z19.h, z19.h, z0.h, #270
4175 __ dci(0x4541d81b); // sqcadd z27.h, z27.h, z0.h, #90
4177 __ dci(0x45c1d853); // sqcadd z19.d, z19.d, z2.d, #90
4179 __ dci(0x4541d8c3); // sqcadd z3.h, z3.h, z6.h, #90
4181 __ dci(0x4541d8d3); // sqcadd z19.h, z19.h, z6.h, #90
4183 __ dci(0x4541d811); // sqcadd z17.h, z17.h, z0.h, #90
4185 __ dci(0x4540da10); // cadd z16.h, z16.h, z16.h, #90
4187 __ dci(0x4540da18); // cadd z24.h, z24.h, z16.h, #90
4189 __ dci(0x4540de5a); // cadd z26.h, z26.h, z18.h, #270
4191 __ dci(0x4540de4a); // cadd z10.h, z10.h, z18.h, #270
4193 __ dci(0x4500decb); // cadd z11.b, z11.b, z22.b, #270
4195 __ dci(0x4500da83); // cadd z3.b, z3.b, z20.b, #90
4197 __ dci(0x4500dc8b); // cadd z11.b, z11.b, z4.b, #270
4199 __ dci(0x4500dc8f); // cadd z15.b, z15.b, z4.b, #270
4201 __ dci(0x4500d99f); // cadd z31.b, z31.b, z12.b, #90
4203 __ dci(0x4540d91e); // cadd z30.h, z30.h, z8.h, #90
4205 __ dci(0x4541d81a); // sqcadd z26.h, z26.h, z0.h, #90
4207 __ dci(0x4501d83b); // sqcadd z27.b, z27.b, z1.b, #90
4209 __ dci(0x45c1d83f); // sqcadd z31.d, z31.d, z1.d, #90
4211 __ dci(0x45c1d83e); // sqcadd z30.d, z30.d, z1.d, #90
4213 __ dci(0x45c1d83c); // sqcadd z28.d, z28.d, z1.d, #90
4215 __ dci(0x4581da3e); // sqcadd z30.s, z30.s, z17.s, #90
4217 __ dci(0x45c1d83f); // sqcadd z31.d, z31.d, z1.d, #90
4219 __ dci(0x4581da3e); // sqcadd z30.s, z30.s, z17.s, #90
4221 __ dci(0x4501d83f); // sqcadd z31.b, z31.b, z1.b, #90
4223 __ dci(0x4501dcbb); // sqcadd z27.b, z27.b, z5.b, #270
4225 __ dci(0x4501dfba); // sqcadd z26.b, z26.b, z29.b, #270
4227 __ dci(0x4581dfea); // sqcadd z10.s, z10.s, z31.s, #270
4229 __ dci(0x4581db7a); // sqcadd z26.s, z26.s, z27.s, #90
4231 __ dci(0x4581db1b); // sqcadd z27.s, z27.s, z24.s, #90
4233 __ dci(0x4581da93); // sqcadd z19.s, z19.s, z20.s, #90
4235 __ dci(0x45c1db92); // sqcadd z18.d, z18.d, z28.d, #90
4237 __ dci(0x45c1db93); // sqcadd z19.d, z19.d, z28.d, #90
4239 __ dci(0x45c1daa3); // sqcadd z3.d, z3.d, z21.d, #90
4241 __ dci(0x4581dba7); // sqcadd z7.s, z7.s, z29.s, #90
4243 __ dci(0x45c1daaf); // sqcadd z15.d, z15.d, z21.d, #90
4245 __ dci(0x45c1daae); // sqcadd z14.d, z14.d, z21.d, #90
4247 __ dci(0x4541dae6); // sqcadd z6.h, z6.h, z23.h, #90
4249 __ dci(0x4541daee); // sqcadd z14.h, z14.h, z23.h, #90
4251 __ dci(0x4501dabe); // sqcadd z30.b, z30.b, z21.b, #90
4253 __ dci(0x4501deff); // sqcadd z31.b, z31.b, z23.b, #270
4255 __ dci(0x4501defd); // sqcadd z29.b, z29.b, z23.b, #270
4257 __ dci(0x4501def5); // sqcadd z21.b, z21.b, z23.b, #270
4259 __ dci(0x4501def4); // sqcadd z20.b, z20.b, z23.b, #270
4261 __ dci(0x4501dee4); // sqcadd z4.b, z4.b, z23.b, #270
4263 __ dci(0x4501dee6); // sqcadd z6.b, z6.b, z23.b, #270
4265 __ dci(0x4501dfc2); // sqcadd z2.b, z2.b, z30.b, #270
4267 __ dci(0x4500df92); // cadd z18.b, z18.b, z28.b, #270
4269 __ dci(0x4500de13); // cadd z19.b, z19.b, z16.b, #270
4275 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
4276 __ Ldr(w0, MemOperand(x0));
4316 __ dci(0x455fbb1a); // bgrp z26.h, z24.h, z31.h
4318 __ dci(0x451fbb58); // bgrp z24.b, z26.b, z31.b
4320 __ dci(0x4517bb19); // bgrp z25.b, z24.b, z23.b
4322 __ dci(0x4517bb18); // bgrp z24.b, z24.b, z23.b
4324 __ dci(0x4517ba5c); // bgrp z28.b, z18.b, z23.b
4326 __ dci(0x4517ba38); // bgrp z24.b, z17.b, z23.b
4328 __ dci(0x4517ba3c); // bgrp z28.b, z17.b, z23.b
4330 __ dci(0x4515ba6c); // bgrp z12.b, z19.b, z21.b
4332 __ dci(0x4515bac4); // bgrp z4.b, z22.b, z21.b
4334 __ dci(0x4517ba86); // bgrp z6.b, z20.b, z23.b
4336 __ dci(0x4517ba87); // bgrp z7.b, z20.b, z23.b
4338 __ dci(0x4515b297); // bext z23.b, z20.b, z21.b
4340 __ dci(0x4517b396); // bext z22.b, z28.b, z23.b
4342 __ dci(0x451bb386); // bext z6.b, z28.b, z27.b
4344 __ dci(0x4513b784); // bdep z4.b, z28.b, z19.b
4346 __ dci(0x4593b7ac); // bdep z12.s, z29.s, z19.s
4348 __ dci(0x4593b7a8); // bdep z8.s, z29.s, z19.s
4350 __ dci(0x4597b780); // bdep z0.s, z28.s, z23.s
4352 __ dci(0x4597b781); // bdep z1.s, z28.s, z23.s
4354 __ dci(0x4597b7e3); // bdep z3.s, z31.s, z23.s
4356 __ dci(0x45dfb7e1); // bdep z1.d, z31.d, z31.d
4358 __ dci(0x455db7e5); // bdep z5.h, z31.h, z29.h
4360 __ dci(0x45d5b7e4); // bdep z4.d, z31.d, z21.d
4362 __ dci(0x45c7b7ec); // bdep z12.d, z31.d, z7.d
4364 __ dci(0x4547b7a8); // bdep z8.h, z29.h, z7.h
4366 __ dci(0x454fb72c); // bdep z12.h, z25.h, z15.h
4368 __ dci(0x4557b724); // bdep z4.h, z25.h, z23.h
4370 __ dci(0x4557bb20); // bgrp z0.h, z25.h, z23.h
4372 __ dci(0x4556b321); // bext z1.h, z25.h, z22.h
4374 __ dci(0x4556b3e3); // bext z3.h, z31.h, z22.h
4376 __ dci(0x4546b367); // bext z7.h, z27.h, z6.h
4378 __ dci(0x4556bb66); // bgrp z6.h, z27.h, z22.h
4380 __ dci(0x4556bb76); // bgrp z22.h, z27.h, z22.h
4382 __ dci(0x45c6bb66); // bgrp z6.d, z27.d, z6.d
4384 __ dci(0x45c2b976); // bgrp z22.d, z11.d, z2.d
4386 __ dci(0x4540b974); // bgrp z20.h, z11.h, z0.h
4388 __ dci(0x45c0b164); // bext z4.d, z11.d, z0.d
4390 __ dci(0x45ccb16c); // bext z12.d, z11.d, z12.d
4392 __ dci(0x458cb368); // bext z8.s, z27.s, z12.s
4394 __ dci(0x450cb769); // bdep z9.b, z27.b, z12.b
4396 __ dci(0x458cb7eb); // bdep z11.s, z31.s, z12.s
4398 __ dci(0x4588b5ef); // bdep z15.s, z15.s, z8.s
4400 __ dci(0x4598b5ad); // bdep z13.s, z13.s, z24.s
4402 __ dci(0x4598b5af); // bdep z15.s, z13.s, z24.s
4404 __ dci(0x4598b6ad); // bdep z13.s, z21.s, z24.s
4406 __ dci(0x4518b2af); // bext z15.b, z21.b, z24.b
4408 __ dci(0x4519b2e7); // bext z7.b, z23.b, z25.b
4410 __ dci(0x4518b2a6); // bext z6.b, z21.b, z24.b
4412 __ dci(0x4518b2a7); // bext z7.b, z21.b, z24.b
4414 __ dci(0x4519b6a5); // bdep z5.b, z21.b, z25.b
4420 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
4421 __ Ldr(w0, MemOperand(x0));
4460 __ dci(0x455a7bc2); // umullb z2.h, z30.b, z26.b
4462 __ dci(0x454a7b92); // umullb z18.h, z28.b, z10.b
4464 __ dci(0x45427bda); // umullb z26.h, z30.b, z2.b
4466 __ dci(0x45c67bde); // umullb z30.d, z30.s, z6.s
4468 __ dci(0x45467b56); // umullb z22.h, z26.b, z6.b
4470 __ dci(0x45427f54); // umullt z20.h, z26.b, z2.b
4472 __ dci(0x45427fe4); // umullt z4.h, z31.b, z2.b
4474 __ dci(0x45567fe5); // umullt z5.h, z31.b, z22.b
4476 __ dci(0x45467df5); // umullt z21.h, z15.b, z6.b
4478 __ dci(0x454279f1); // umullb z17.h, z15.b, z2.b
4480 __ dci(0x454078f5); // umullb z21.h, z7.b, z0.b
4482 __ dci(0x454070d4); // smullb z20.h, z6.b, z0.b
4484 __ dci(0x45407016); // smullb z22.h, z0.b, z0.b
4486 __ dci(0x45487086); // smullb z6.h, z4.b, z8.b
4488 __ dci(0x454070c7); // smullb z7.h, z6.b, z0.b
4490 __ dci(0x45407846); // umullb z6.h, z2.b, z0.b
4492 __ dci(0x45417a56); // umullb z22.h, z18.b, z1.b
4494 __ dci(0x45417877); // umullb z23.h, z3.b, z1.b
4496 __ dci(0x45417807); // umullb z7.h, z0.b, z1.b
4498 __ dci(0x454178a3); // umullb z3.h, z5.b, z1.b
4500 __ dci(0x45437cab); // umullt z11.h, z5.b, z3.b
4502 __ dci(0x454b7c3b); // umullt z27.h, z1.b, z11.b
4504 __ dci(0x454b7a3a); // umullb z26.h, z17.b, z11.b
4506 __ dci(0x454b72b2); // smullb z18.h, z21.b, z11.b
4508 __ dci(0x454b7622); // smullt z2.h, z17.b, z11.b
4510 __ dci(0x454b76ea); // smullt z10.h, z23.b, z11.b
4512 __ dci(0x454b74ab); // smullt z11.h, z5.b, z11.b
4514 __ dci(0x454d74bb); // smullt z27.h, z5.b, z13.b
4516 __ dci(0x454d740b); // smullt z11.h, z0.b, z13.b
4518 __ dci(0x454d7403); // smullt z3.h, z0.b, z13.b
4520 __ dci(0x45557413); // smullt z19.h, z0.b, z21.b
4522 __ dci(0x45557531); // smullt z17.h, z9.b, z21.b
4524 __ dci(0x455574b9); // smullt z25.h, z5.b, z21.b
4526 __ dci(0x455571b1); // smullb z17.h, z13.b, z21.b
4528 __ dci(0x455573e1); // smullb z1.h, z31.b, z21.b
4530 __ dci(0x455473c9); // smullb z9.h, z30.b, z20.b
4532 __ dci(0x455473cb); // smullb z11.h, z30.b, z20.b
4534 __ dci(0x455473a9); // smullb z9.h, z29.b, z20.b
4536 __ dci(0x455473a8); // smullb z8.h, z29.b, z20.b
4538 __ dci(0x455473b8); // smullb z24.h, z29.b, z20.b
4540 __ dci(0x455673fa); // smullb z26.h, z31.b, z22.b
4542 __ dci(0x455e77ea); // smullt z10.h, z31.b, z30.b
4544 __ dci(0x455677da); // smullt z26.h, z30.b, z22.b
4546 __ dci(0x454673d8); // smullb z24.h, z30.b, z6.b
4548 __ dci(0x45c67359); // smullb z25.d, z26.s, z6.s
4550 __ dci(0x45c47751); // smullt z17.d, z26.s, z4.s
4552 __ dci(0x45d67741); // smullt z1.d, z26.s, z22.s
4554 __ dci(0x45d67b45); // umullb z5.d, z26.s, z22.s
4556 __ dci(0x45867b47); // umullb z7.s, z26.h, z6.h
4558 __ dci(0x45867b45); // umullb z5.s, z26.h, z6.h
4564 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
4565 __ Ldr(w0, MemOperand(x0));
4604 __ dci(0x45936164); // sqdmullb z4.s, z11.h, z19.h
4606 __ dci(0x459161f4); // sqdmullb z20.s, z15.h, z17.h
4608 __ dci(0x459563f5); // sqdmullb z21.s, z31.h, z21.h
4610 __ dci(0x45956265); // sqdmullb z5.s, z19.h, z21.h
4612 __ dci(0x45d56235); // sqdmullb z21.d, z17.s, z21.s
4614 __ dci(0x45556031); // sqdmullb z17.h, z1.b, z21.b
4616 __ dci(0x45506035); // sqdmullb z21.h, z1.b, z16.b
4618 __ dci(0x45506334); // sqdmullb z20.h, z25.b, z16.b
4620 __ dci(0x45486336); // sqdmullb z22.h, z25.b, z8.b
4622 __ dci(0x45486334); // sqdmullb z20.h, z25.b, z8.b
4624 __ dci(0x45496b35); // pmullb z21.h, z25.b, z9.b
4626 __ dci(0x45496b37); // pmullb z23.h, z25.b, z9.b
4628 __ dci(0x45496fb3); // pmullt z19.h, z29.b, z9.b
4630 __ dci(0x45596f3b); // pmullt z27.h, z25.b, z25.b
4632 __ dci(0x455d6f13); // pmullt z19.h, z24.b, z29.b
4634 __ dci(0x455d6fb2); // pmullt z18.h, z29.b, z29.b
4636 __ dci(0x455c6bb0); // pmullb z16.h, z29.b, z28.b
4638 __ dci(0x45546bf8); // pmullb z24.h, z31.b, z20.b
4640 __ dci(0x45546bf9); // pmullb z25.h, z31.b, z20.b
4642 __ dci(0x45546bfb); // pmullb z27.h, z31.b, z20.b
4644 __ dci(0x454469eb); // pmullb z11.h, z15.b, z4.b
4646 __ dci(0x455069fb); // pmullb z27.h, z15.b, z16.b
4648 __ dci(0x45546dfa); // pmullt z26.h, z15.b, z20.b
4650 __ dci(0x45546df8); // pmullt z24.h, z15.b, z20.b
4652 __ dci(0x45576dfc); // pmullt z28.h, z15.b, z23.b
4654 __ dci(0x45d76d6c); // pmullt z12.d, z11.s, z23.s
4656 __ dci(0x455f6d68); // pmullt z8.h, z11.b, z31.b
4658 __ dci(0x45596d6a); // pmullt z10.h, z11.b, z25.b
4660 __ dci(0x45596d7a); // pmullt z26.h, z11.b, z25.b
4662 __ dci(0x45596532); // sqdmullt z18.h, z9.b, z25.b
4664 __ dci(0x45596536); // sqdmullt z22.h, z9.b, z25.b
4666 __ dci(0x45d16537); // sqdmullt z23.d, z9.s, z17.s
4668 __ dci(0x45c16515); // sqdmullt z21.d, z8.s, z1.s
4670 __ dci(0x45456517); // sqdmullt z23.h, z8.b, z5.b
4672 __ dci(0x45556555); // sqdmullt z21.h, z10.b, z21.b
4674 __ dci(0x45c56554); // sqdmullt z20.d, z10.s, z5.s
4676 __ dci(0x45cd6456); // sqdmullt z22.d, z2.s, z13.s
4678 __ dci(0x45c96406); // sqdmullt z6.d, z0.s, z9.s
4680 __ dci(0x45d96482); // sqdmullt z2.d, z4.s, z25.s
4682 __ dci(0x45dd6406); // sqdmullt z6.d, z0.s, z29.s
4684 __ dci(0x45596404); // sqdmullt z4.h, z0.b, z25.b
4686 __ dci(0x454b6414); // sqdmullt z20.h, z0.b, z11.b
4688 __ dci(0x454a601c); // sqdmullb z28.h, z0.b, z10.b
4690 __ dci(0x4542641d); // sqdmullt z29.h, z0.b, z2.b
4692 __ dci(0x4552643c); // sqdmullt z28.h, z1.b, z18.b
4694 __ dci(0x4552673d); // sqdmullt z29.h, z25.b, z18.b
4696 __ dci(0x45d6673f); // sqdmullt z31.d, z25.s, z22.s
4698 __ dci(0x45d2633d); // sqdmullb z29.d, z25.s, z18.s
4700 __ dci(0x455a6339); // sqdmullb z25.h, z25.b, z26.b
4702 __ dci(0x45526738); // sqdmullt z24.h, z25.b, z18.b
4708 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
4709 __ Ldr(w0, MemOperand(x0));
4748 __ dci(0x44eae5a9); // sqdmullt z9.d, z13.s, z10.s[#0]
4750 __ dci(0x44eae9a1); // sqdmullb z1.d, z13.s, z10.s[#1]
4752 __ dci(0x44eae9a5); // sqdmullb z5.d, z13.s, z10.s[#1]
4754 __ dci(0x44e2edad); // sqdmullt z13.d, z13.s, z2.s[#1]
4756 __ dci(0x44e6e9ac); // sqdmullb z12.d, z13.s, z6.s[#1]
4758 __ dci(0x44e4ebae); // sqdmullb z14.d, z29.s, z4.s[#1]
4760 __ dci(0x44e4ebaf); // sqdmullb z15.d, z29.s, z4.s[#1]
4762 __ dci(0x44a5ebad); // sqdmullb z13.s, z29.h, z5.h[#1]
4764 __ dci(0x44a5e9fd); // sqdmullb z29.s, z15.h, z5.h[#1]
4766 __ dci(0x44e5e8fc); // sqdmullb z28.d, z7.s, z5.s[#1]
4768 __ dci(0x44ede9ec); // sqdmullb z12.d, z15.s, z13.s[#1]
4770 __ dci(0x44ede9fc); // sqdmullb z28.d, z15.s, z13.s[#1]
4772 __ dci(0x44fce9f4); // sqdmullb z20.d, z15.s, z12.s[#3]
4774 __ dci(0x44e4e9f6); // sqdmullb z22.d, z15.s, z4.s[#1]
4776 __ dci(0x44f4e9d2); // sqdmullb z18.d, z14.s, z4.s[#3]
4778 __ dci(0x44f5e9e2); // sqdmullb z2.d, z15.s, z5.s[#3]
4780 __ dci(0x44f5ebb2); // sqdmullb z18.d, z29.s, z5.s[#3]
4782 __ dci(0x44b5efba); // sqdmullt z26.s, z29.h, z5.h[#5]
4784 __ dci(0x44b5ef78); // sqdmullt z24.s, z27.h, z5.h[#5]
4786 __ dci(0x44f5eb70); // sqdmullb z16.d, z27.s, z5.s[#3]
4788 __ dci(0x44e5ebf4); // sqdmullb z20.d, z31.s, z5.s[#1]
4790 __ dci(0x44e5efbc); // sqdmullt z28.d, z29.s, z5.s[#1]
4792 __ dci(0x44e1ebbd); // sqdmullb z29.d, z29.s, z1.s[#1]
4794 __ dci(0x44f1ebed); // sqdmullb z13.d, z31.s, z1.s[#3]
4796 __ dci(0x44f5efe5); // sqdmullt z5.d, z31.s, z5.s[#3]
4798 __ dci(0x44fdeee7); // sqdmullt z7.d, z23.s, z13.s[#3]
4800 __ dci(0x44fdee25); // sqdmullt z5.d, z17.s, z13.s[#3]
4802 __ dci(0x44f5ea27); // sqdmullb z7.d, z17.s, z5.s[#3]
4804 __ dci(0x44f1e225); // sqdmullb z5.d, z17.s, z1.s[#2]
4806 __ dci(0x44e1ea21); // sqdmullb z1.d, z17.s, z1.s[#1]
4812 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
4813 __ Ldr(w0, MemOperand(x0));
4852 __ dci(0x04293719); // xar z25.b, z25.b, z24.b, #7
4854 __ dci(0x04293531); // xar z17.b, z17.b, z9.b, #7
4856 __ dci(0x04e93533); // xar z19.d, z19.d, z9.d, #23
4858 __ dci(0x046b3523); // xar z3.s, z3.s, z9.s, #21
4860 __ dci(0x04eb3427); // xar z7.d, z7.d, z1.d, #21
4862 __ dci(0x04ea3463); // xar z3.d, z3.d, z3.d, #22
4864 __ dci(0x04fa3447); // xar z7.d, z7.d, z2.d, #6
4866 __ dci(0x04f8346f); // xar z15.d, z15.d, z3.d, #8
4868 __ dci(0x0479346b); // xar z11.s, z11.s, z3.s, #7
4870 __ dci(0x0461346a); // xar z10.s, z10.s, z3.s, #31
4872 __ dci(0x0464346b); // xar z11.s, z11.s, z3.s, #28
4874 __ dci(0x04643469); // xar z9.s, z9.s, z3.s, #28
4876 __ dci(0x0464346b); // xar z11.s, z11.s, z3.s, #28
4878 __ dci(0x0434346a); // xar z10.h, z10.h, z3.h, #12
4880 __ dci(0x04b434fa); // xar z26.d, z26.d, z7.d, #44
4882 __ dci(0x04e434f2); // xar z18.d, z18.d, z7.d, #28
4884 __ dci(0x04ec34b3); // xar z19.d, z19.d, z5.d, #20
4886 __ dci(0x04ae34b7); // xar z23.d, z23.d, z5.d, #50
4888 __ dci(0x04ae34a7); // xar z7.d, z7.d, z5.d, #50
4890 __ dci(0x04ae3417); // xar z23.d, z23.d, z0.d, #50
4896 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
4897 __ Ldr(w0, MemOperand(x0));
4936 __ dci(0x45e8c2f9); // histcnt z25.d, p0/z, z23.d, z8.d
4938 __ dci(0x45e8c1f1); // histcnt z17.d, p0/z, z15.d, z8.d
4940 __ dci(0x45e8c3a1); // histcnt z1.d, p0/z, z29.d, z8.d
4942 __ dci(0x45e8c3a9); // histcnt z9.d, p0/z, z29.d, z8.d
4944 __ dci(0x45e8c0a8); // histcnt z8.d, p0/z, z5.d, z8.d
4946 __ dci(0x45e8d0f8); // histcnt z24.d, p4/z, z7.d, z8.d
4948 __ dci(0x45e8d0fa); // histcnt z26.d, p4/z, z7.d, z8.d
4950 __ dci(0x45aad0fb); // histcnt z27.s, p4/z, z7.s, z10.s
4952 __ dci(0x45aad2df); // histcnt z31.s, p4/z, z22.s, z10.s
4954 __ dci(0x45aad2dd); // histcnt z29.s, p4/z, z22.s, z10.s
4956 __ dci(0x45abd2f5); // histcnt z21.s, p4/z, z23.s, z11.s
4958 __ dci(0x45aad0f7); // histcnt z23.s, p4/z, z7.s, z10.s
4960 __ dci(0x45aad1b3); // histcnt z19.s, p4/z, z13.s, z10.s
4962 __ dci(0x45a8d1f2); // histcnt z18.s, p4/z, z15.s, z8.s
4964 __ dci(0x45a0d0f6); // histcnt z22.s, p4/z, z7.s, z0.s
4966 __ dci(0x45a0d87e); // histcnt z30.s, p6/z, z3.s, z0.s
4968 __ dci(0x45a0dc4e); // histcnt z14.s, p7/z, z2.s, z0.s
4970 __ dci(0x45a0dc4a); // histcnt z10.s, p7/z, z2.s, z0.s
4972 __ dci(0x45b0cc4b); // histcnt z11.s, p3/z, z2.s, z16.s
4974 __ dci(0x45b0cc43); // histcnt z3.s, p3/z, z2.s, z16.s
4976 __ dci(0x45b8cc73); // histcnt z19.s, p3/z, z3.s, z24.s
4978 __ dci(0x45b8d877); // histcnt z23.s, p6/z, z3.s, z24.s
4980 __ dci(0x45b8d47f); // histcnt z31.s, p5/z, z3.s, z24.s
4982 __ dci(0x45b8d46f); // histcnt z15.s, p5/z, z3.s, z24.s
4984 __ dci(0x45b8d16d); // histcnt z13.s, p4/z, z11.s, z24.s
4986 __ dci(0x45bcd125); // histcnt z5.s, p4/z, z9.s, z28.s
4988 __ dci(0x45b8d021); // histcnt z1.s, p4/z, z1.s, z24.s
4990 __ dci(0x45f8d220); // histcnt z0.d, p4/z, z17.d, z24.d
4992 __ dci(0x45f0d621); // histcnt z1.d, p5/z, z17.d, z16.d
4994 __ dci(0x45a0d625); // histcnt z5.s, p5/z, z17.s, z0.s
4996 __ dci(0x45a0d4a1); // histcnt z1.s, p5/z, z5.s, z0.s
4998 __ dci(0x45a0d4a3); // histcnt z3.s, p5/z, z5.s, z0.s
5000 __ dci(0x45a0d4a2); // histcnt z2.s, p5/z, z5.s, z0.s
5002 __ dci(0x45a2d6a3); // histcnt z3.s, p5/z, z21.s, z2.s
5004 __ dci(0x45a2de21); // histcnt z1.s, p7/z, z17.s, z2.s
5006 __ dci(0x45e2dc20); // histcnt z0.d, p7/z, z1.d, z2.d
5008 __ dci(0x45e2d8b0); // histcnt z16.d, p6/z, z5.d, z2.d
5010 __ dci(0x45eed8b8); // histcnt z24.d, p6/z, z5.d, z14.d
5012 __ dci(0x45eed8a8); // histcnt z8.d, p6/z, z5.d, z14.d
5014 __ dci(0x45aed88c); // histcnt z12.s, p6/z, z4.s, z14.s
5016 __ dci(0x45efd88d); // histcnt z13.d, p6/z, z4.d, z15.d
5018 __ dci(0x45ffc88f); // histcnt z15.d, p2/z, z4.d, z31.d
5020 __ dci(0x45fbc98d); // histcnt z13.d, p2/z, z12.d, z27.d
5022 __ dci(0x45bbcd8f); // histcnt z15.s, p3/z, z12.s, z27.s
5024 __ dci(0x45b3cc9f); // histcnt z31.s, p3/z, z4.s, z19.s
5026 __ dci(0x45bbc497); // histcnt z23.s, p1/z, z4.s, z27.s
5028 __ dci(0x45fbc415); // histcnt z21.d, p1/z, z0.d, z27.d
5030 __ dci(0x45ffc517); // histcnt z23.d, p1/z, z8.d, z31.d
5032 __ dci(0x45fbc596); // histcnt z22.d, p1/z, z12.d, z27.d
5034 __ dci(0x45fbc4c6); // histcnt z6.d, p1/z, z6.d, z27.d
5036 __ dci(0x45fbc4ce); // histcnt z14.d, p1/z, z6.d, z27.d
5038 __ dci(0x45fad4ca); // histcnt z10.d, p5/z, z6.d, z26.d
5040 __ dci(0x45ead45a); // histcnt z26.d, p5/z, z2.d, z10.d
5042 __ dci(0x45aad4ca); // histcnt z10.s, p5/z, z6.s, z10.s
5044 __ dci(0x45aed0ce); // histcnt z14.s, p4/z, z6.s, z14.s
5046 __ dci(0x45aec4c6); // histcnt z6.s, p1/z, z6.s, z14.s
5048 __ dci(0x45abc4c7); // histcnt z7.s, p1/z, z6.s, z11.s
5050 __ dci(0x45abc4cf); // histcnt z15.s, p1/z, z6.s, z11.s
5052 __ dci(0x45a9c44e); // histcnt z14.s, p1/z, z2.s, z9.s
5054 __ dci(0x45b9c46f); // histcnt z15.s, p1/z, z3.s, z25.s
5056 __ dci(0x45b9c46e); // histcnt z14.s, p1/z, z3.s, z25.s
5058 __ dci(0x45b1c67e); // histcnt z30.s, p1/z, z19.s, z17.s
5060 __ dci(0x45b5c63a); // histcnt z26.s, p1/z, z17.s, z21.s
5062 __ dci(0x45a5c72a); // histcnt z10.s, p1/z, z25.s, z5.s
5064 __ dci(0x45a1c77a); // histcnt z26.s, p1/z, z27.s, z1.s
5066 __ dci(0x45a1c77b); // histcnt z27.s, p1/z, z27.s, z1.s
5068 __ dci(0x45a1c773); // histcnt z19.s, p1/z, z27.s, z1.s
5070 __ dci(0x45e9c777); // histcnt z23.d, p1/z, z27.d, z9.d
5072 __ dci(0x45ebc67f); // histcnt z31.d, p1/z, z19.d, z11.d
5074 __ dci(0x45ebc37b); // histcnt z27.d, p0/z, z27.d, z11.d
5076 __ dci(0x45abd373); // histcnt z19.s, p4/z, z27.s, z11.s
5078 __ dci(0x45fbd363); // histcnt z3.d, p4/z, z27.d, z27.d
5080 __ dci(0x45ffc36b); // histcnt z11.d, p0/z, z27.d, z31.d
5082 __ dci(0x45ffc3ca); // histcnt z10.d, p0/z, z30.d, z31.d
5084 __ dci(0x45efc2ce); // histcnt z14.d, p0/z, z22.d, z15.d
5086 __ dci(0x45adc2c6); // histcnt z6.s, p0/z, z22.s, z13.s
5088 __ dci(0x45adc2c4); // histcnt z4.s, p0/z, z22.s, z13.s
5090 __ dci(0x45a7c2d4); // histcnt z20.s, p0/z, z22.s, z7.s
5092 __ dci(0x45a6c0c4); // histcnt z4.s, p0/z, z6.s, z6.s
5094 __ dci(0x45a7c2c0); // histcnt z0.s, p0/z, z22.s, z7.s
5096 __ dci(0x45a7d6c1); // histcnt z1.s, p5/z, z22.s, z7.s
5098 __ dci(0x45afd7c5); // histcnt z5.s, p5/z, z30.s, z15.s
5100 __ dci(0x45add3d5); // histcnt z21.s, p4/z, z30.s, z13.s
5102 __ dci(0x45add3d4); // histcnt z20.s, p4/z, z30.s, z13.s
5104 __ dci(0x45bcd3dc); // histcnt z28.s, p4/z, z30.s, z28.s
5106 __ dci(0x45bcd3cc); // histcnt z12.s, p4/z, z30.s, z28.s
5108 __ dci(0x45bcd15c); // histcnt z28.s, p4/z, z10.s, z28.s
5110 __ dci(0x45b5d154); // histcnt z20.s, p4/z, z10.s, z21.s
5112 __ dci(0x45b5d156); // histcnt z22.s, p4/z, z10.s, z21.s
5114 __ dci(0x45b3d157); // histcnt z23.s, p4/z, z10.s, z19.s
5116 __ dci(0x45b3d156); // histcnt z22.s, p4/z, z10.s, z19.s
5118 __ dci(0x45b3c554); // histcnt z20.s, p1/z, z10.s, z19.s
5120 __ dci(0x45bbd55c); // histcnt z28.s, p5/z, z10.s, z27.s
5122 __ dci(0x45abd57e); // histcnt z30.s, p5/z, z11.s, z11.s
5124 __ dci(0x45abcd7a); // histcnt z26.s, p3/z, z11.s, z11.s
5126 __ dci(0x45bbc57b); // histcnt z27.s, p1/z, z11.s, z27.s
5128 __ dci(0x45bfcd73); // histcnt z19.s, p3/z, z11.s, z31.s
5130 __ dci(0x45bfc863); // histcnt z3.s, p2/z, z3.s, z31.s
5132 __ dci(0x45b7cc62); // histcnt z2.s, p3/z, z3.s, z23.s
5134 __ dci(0x45b6cce3); // histcnt z3.s, p3/z, z7.s, z22.s
5140 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
5141 __ Ldr(w0, MemOperand(x0));
5180 __ dci(0x4524a228); // histseg z8.b, z17.b, z4.b
5182 __ dci(0x452ca20c); // histseg z12.b, z16.b, z12.b
5184 __ dci(0x453ca288); // histseg z8.b, z20.b, z28.b
5186 __ dci(0x4538a380); // histseg z0.b, z28.b, z24.b
5188 __ dci(0x452aa388); // histseg z8.b, z28.b, z10.b
5190 __ dci(0x452aa38c); // histseg z12.b, z28.b, z10.b
5192 __ dci(0x4532a384); // histseg z4.b, z28.b, z18.b
5194 __ dci(0x4537a380); // histseg z0.b, z28.b, z23.b
5196 __ dci(0x4535a3a8); // histseg z8.b, z29.b, z21.b
5198 __ dci(0x4535a3ac); // histseg z12.b, z29.b, z21.b
5200 __ dci(0x4535a3ae); // histseg z14.b, z29.b, z21.b
5202 __ dci(0x4525a39e); // histseg z30.b, z28.b, z5.b
5204 __ dci(0x4525a38e); // histseg z14.b, z28.b, z5.b
5206 __ dci(0x452da3c6); // histseg z6.b, z30.b, z13.b
5208 __ dci(0x452da187); // histseg z7.b, z12.b, z13.b
5210 __ dci(0x4525a1a6); // histseg z6.b, z13.b, z5.b
5212 __ dci(0x4527a18e); // histseg z14.b, z12.b, z7.b
5214 __ dci(0x4521a18c); // histseg z12.b, z12.b, z1.b
5216 __ dci(0x4524a18d); // histseg z13.b, z12.b, z4.b
5218 __ dci(0x4524a125); // histseg z5.b, z9.b, z4.b
5220 __ dci(0x4522a127); // histseg z7.b, z9.b, z2.b
5222 __ dci(0x4532a117); // histseg z23.b, z8.b, z18.b
5224 __ dci(0x4533a15f); // histseg z31.b, z10.b, z19.b
5226 __ dci(0x4533a14f); // histseg z15.b, z10.b, z19.b
5228 __ dci(0x4533a0ce); // histseg z14.b, z6.b, z19.b
5230 __ dci(0x453ba1cc); // histseg z12.b, z14.b, z27.b
5232 __ dci(0x453ba0fc); // histseg z28.b, z7.b, z27.b
5234 __ dci(0x452ba2f4); // histseg z20.b, z23.b, z11.b
5236 __ dci(0x453ba2c4); // histseg z4.b, z22.b, z27.b
5238 __ dci(0x453ba2cc); // histseg z12.b, z22.b, z27.b
5240 __ dci(0x453ba1c8); // histseg z8.b, z14.b, z27.b
5242 __ dci(0x4529a1c9); // histseg z9.b, z14.b, z9.b
5244 __ dci(0x4529a1a8); // histseg z8.b, z13.b, z9.b
5246 __ dci(0x4521a198); // histseg z24.b, z12.b, z1.b
5248 __ dci(0x4529a1ba); // histseg z26.b, z13.b, z9.b
5250 __ dci(0x452fa1bb); // histseg z27.b, z13.b, z15.b
5252 __ dci(0x452fa0ff); // histseg z31.b, z7.b, z15.b
5254 __ dci(0x4527a0de); // histseg z30.b, z6.b, z7.b
5256 __ dci(0x4525a1d6); // histseg z22.b, z14.b, z5.b
5258 __ dci(0x4525a1d7); // histseg z23.b, z14.b, z5.b
5260 __ dci(0x4521a3df); // histseg z31.b, z30.b, z1.b
5262 __ dci(0x4521a197); // histseg z23.b, z12.b, z1.b
5264 __ dci(0x4521a187); // histseg z7.b, z12.b, z1.b
5266 __ dci(0x4535a186); // histseg z6.b, z12.b, z21.b
5268 __ dci(0x4535a196); // histseg z22.b, z12.b, z21.b
5270 __ dci(0x4525a097); // histseg z23.b, z4.b, z5.b
5272 __ dci(0x4525a095); // histseg z21.b, z4.b, z5.b
5274 __ dci(0x452da017); // histseg z23.b, z0.b, z13.b
5276 __ dci(0x452da295); // histseg z21.b, z20.b, z13.b
5278 __ dci(0x453da39d); // histseg z29.b, z28.b, z29.b
5280 __ dci(0x453da39c); // histseg z28.b, z28.b, z29.b
5282 __ dci(0x4535a29e); // histseg z30.b, z20.b, z21.b
5284 __ dci(0x4535a0bf); // histseg z31.b, z5.b, z21.b
5286 __ dci(0x4535a0bb); // histseg z27.b, z5.b, z21.b
5288 __ dci(0x4537a2b3); // histseg z19.b, z21.b, z23.b
5290 __ dci(0x4525a2b1); // histseg z17.b, z21.b, z5.b
5292 __ dci(0x4525a2b5); // histseg z21.b, z21.b, z5.b
5294 __ dci(0x4525a0fd); // histseg z29.b, z7.b, z5.b
5296 __ dci(0x4524a079); // histseg z25.b, z3.b, z4.b
5298 __ dci(0x4524a0d8); // histseg z24.b, z6.b, z4.b
5300 __ dci(0x452ca09c); // histseg z28.b, z4.b, z12.b
5302 __ dci(0x453ca018); // histseg z24.b, z0.b, z28.b
5304 __ dci(0x4539a008); // histseg z8.b, z0.b, z25.b
5306 __ dci(0x4539a00c); // histseg z12.b, z0.b, z25.b
5308 __ dci(0x4531a048); // histseg z8.b, z2.b, z17.b
5310 __ dci(0x4530a0ca); // histseg z10.b, z6.b, z16.b
5312 __ dci(0x4520a0ee); // histseg z14.b, z7.b, z0.b
5314 __ dci(0x4520a1de); // histseg z30.b, z14.b, z0.b
5316 __ dci(0x4520a38e); // histseg z14.b, z28.b, z0.b
5318 __ dci(0x4528a30f); // histseg z15.b, z24.b, z8.b
5320 __ dci(0x4538a39f); // histseg z31.b, z28.b, z24.b
5322 __ dci(0x4538a39b); // histseg z27.b, z28.b, z24.b
5324 __ dci(0x4538a093); // histseg z19.b, z4.b, z24.b
5326 __ dci(0x453aa0a3); // histseg z3.b, z5.b, z26.b
5328 __ dci(0x453aa0ab); // histseg z11.b, z5.b, z26.b
5330 __ dci(0x452ea0bb); // histseg z27.b, z5.b, z14.b
5332 __ dci(0x452fa1bf); // histseg z31.b, z13.b, z15.b
5334 __ dci(0x452fa1be); // histseg z30.b, z13.b, z15.b
5336 __ dci(0x452fa3f6); // histseg z22.b, z31.b, z15.b
5338 __ dci(0x452fa3f4); // histseg z20.b, z31.b, z15.b
5340 __ dci(0x453fa3b0); // histseg z16.b, z29.b, z31.b
5342 __ dci(0x453fa3b8); // histseg z24.b, z29.b, z31.b
5344 __ dci(0x453fa228); // histseg z8.b, z17.b, z31.b
5346 __ dci(0x4536a22a); // histseg z10.b, z17.b, z22.b
5348 __ dci(0x4530a23a); // histseg z26.b, z17.b, z16.b
5350 __ dci(0x4522a23e); // histseg z30.b, z17.b, z2.b
5352 __ dci(0x4524a23c); // histseg z28.b, z17.b, z4.b
5354 __ dci(0x4527a238); // histseg z24.b, z17.b, z7.b
5356 __ dci(0x4525a210); // histseg z16.b, z16.b, z5.b
5358 __ dci(0x4525a200); // histseg z0.b, z16.b, z5.b
5360 __ dci(0x4520a202); // histseg z2.b, z16.b, z0.b
5362 __ dci(0x4521a303); // histseg z3.b, z24.b, z1.b
5364 __ dci(0x4520a201); // histseg z1.b, z16.b, z0.b
5366 __ dci(0x4528a223); // histseg z3.b, z17.b, z8.b
5368 __ dci(0x4528a367); // histseg z7.b, z27.b, z8.b
5370 __ dci(0x452ca3e6); // histseg z6.b, z31.b, z12.b
5372 __ dci(0x452ea3c4); // histseg z4.b, z30.b, z14.b
5374 __ dci(0x452da3c6); // histseg z6.b, z30.b, z13.b
5376 __ dci(0x452da0c4); // histseg z4.b, z6.b, z13.b
5378 __ dci(0x4529a0ec); // histseg z12.b, z7.b, z9.b
5384 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
5385 __ Ldr(w0, MemOperand(x0));
5424 __ dci(0x05212a38); // tbl z24.b, {z17.b, z18.b}, z1.b
5426 __ dci(0x05212810); // tbl z16.b, {z0.b, z1.b}, z1.b
5428 __ dci(0x05e12812); // tbl z18.d, {z0.d, z1.d}, z1.d
5430 __ dci(0x05632802); // tbl z2.h, {z0.h, z1.h}, z3.h
5432 __ dci(0x05e32906); // tbl z6.d, {z8.d, z9.d}, z3.d
5434 __ dci(0x05e22942); // tbl z2.d, {z10.d, z11.d}, z2.d
5436 __ dci(0x05f22d46); // tbx z6.d, z10.d, z18.d
5438 __ dci(0x05f32947); // tbl z7.d, {z10.d, z11.d}, z19.d
5440 __ dci(0x05e32963); // tbl z3.d, {z11.d, z12.d}, z3.d
5442 __ dci(0x05e33161); // tbl z1.d, {z11.d}, z3.d
5444 __ dci(0x05e13149); // tbl z9.d, {z10.d}, z1.d
5446 __ dci(0x0560314d); // tbl z13.h, {z10.h}, z0.h
5448 __ dci(0x0578314c); // tbl z12.h, {z10.h}, z24.h
5450 __ dci(0x05e83144); // tbl z4.d, {z10.d}, z8.d
5452 __ dci(0x05e83146); // tbl z6.d, {z10.d}, z8.d
5454 __ dci(0x05b83147); // tbl z7.s, {z10.s}, z24.s
5456 __ dci(0x053831d7); // tbl z23.b, {z14.b}, z24.b
5458 __ dci(0x056831df); // tbl z31.h, {z14.h}, z8.h
5460 __ dci(0x0560319e); // tbl z30.h, {z12.h}, z0.h
5462 __ dci(0x0522319a); // tbl z26.b, {z12.b}, z2.b
5464 __ dci(0x0522318a); // tbl z10.b, {z12.b}, z2.b
5466 __ dci(0x0522318e); // tbl z14.b, {z12.b}, z2.b
5468 __ dci(0x05a6318a); // tbl z10.s, {z12.s}, z6.s
5470 __ dci(0x05b2318b); // tbl z11.s, {z12.s}, z18.s
5472 __ dci(0x05a231bb); // tbl z27.s, {z13.s}, z2.s
5474 __ dci(0x05a231ab); // tbl z11.s, {z13.s}, z2.s
5476 __ dci(0x05a831af); // tbl z15.s, {z13.s}, z8.s
5478 __ dci(0x05ea31a7); // tbl z7.d, {z13.d}, z10.d
5480 __ dci(0x05fa33af); // tbl z15.d, {z29.d}, z26.d
5482 __ dci(0x05fe32ae); // tbl z14.d, {z21.d}, z30.d
5484 __ dci(0x057a32be); // tbl z30.h, {z21.h}, z26.h
5486 __ dci(0x05fe32ae); // tbl z14.d, {z21.d}, z30.d
5488 __ dci(0x05fe32aa); // tbl z10.d, {z21.d}, z30.d
5490 __ dci(0x057e32e2); // tbl z2.h, {z23.h}, z30.h
5492 __ dci(0x057e32e0); // tbl z0.h, {z23.h}, z30.h
5494 __ dci(0x057f3270); // tbl z16.h, {z19.h}, z31.h
5496 __ dci(0x05673271); // tbl z17.h, {z19.h}, z7.h
5498 __ dci(0x05e73379); // tbl z25.d, {z27.d}, z7.d
5500 __ dci(0x05e3333d); // tbl z29.d, {z25.d}, z3.d
5502 __ dci(0x05e33335); // tbl z21.d, {z25.d}, z3.d
5504 __ dci(0x05f33137); // tbl z23.d, {z9.d}, z19.d
5506 __ dci(0x05b33336); // tbl z22.s, {z25.s}, z19.s
5508 __ dci(0x05b1323e); // tbl z30.s, {z17.s}, z17.s
5510 __ dci(0x05b0303c); // tbl z28.s, {z1.s}, z16.s
5512 __ dci(0x05b0308c); // tbl z12.s, {z4.s}, z16.s
5514 __ dci(0x05b030e8); // tbl z8.s, {z7.s}, z16.s
5516 __ dci(0x05a030b8); // tbl z24.s, {z5.s}, z0.s
5518 __ dci(0x05e830b0); // tbl z16.d, {z5.d}, z8.d
5520 __ dci(0x05e830b2); // tbl z18.d, {z5.d}, z8.d
5522 __ dci(0x05e931b3); // tbl z19.d, {z13.d}, z9.d
5528 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
5529 __ Ldr(w0, MemOperand(x0));
5568 __ dci(0x4488104f); // cdot z15.s, z2.b, z8.b, #0
5570 __ dci(0x448a106e); // cdot z14.s, z3.b, z10.b, #0
5572 __ dci(0x448a1246); // cdot z6.s, z18.b, z10.b, #0
5574 __ dci(0x448e12ce); // cdot z14.s, z22.b, z14.b, #0
5576 __ dci(0x448412cf); // cdot z15.s, z22.b, z4.b, #0
5578 __ dci(0x448412c7); // cdot z7.s, z22.b, z4.b, #0
5580 __ dci(0x44c41257); // cdot z23.d, z18.h, z4.h, #0
5582 __ dci(0x448412d5); // cdot z21.s, z22.b, z4.b, #0
5584 __ dci(0x448712d7); // cdot z23.s, z22.b, z7.b, #0
5586 __ dci(0x44831295); // cdot z21.s, z20.b, z3.b, #0
5588 __ dci(0x44821385); // cdot z5.s, z28.b, z2.b, #0
5590 __ dci(0x44c213c1); // cdot z1.d, z30.h, z2.h, #0
5592 __ dci(0x44c61340); // cdot z0.d, z26.h, z6.h, #0
5594 __ dci(0x44c413d0); // cdot z16.d, z30.h, z4.h, #0
5596 __ dci(0x44cc12d8); // cdot z24.d, z22.h, z12.h, #0
5598 __ dci(0x448c1ac8); // cdot z8.s, z22.b, z12.b, #180
5600 __ dci(0x448c12ec); // cdot z12.s, z23.b, z12.b, #0
5602 __ dci(0x448812ad); // cdot z13.s, z21.b, z8.b, #0
5604 __ dci(0x44881689); // cdot z9.s, z20.b, z8.b, #90
5606 __ dci(0x4498128b); // cdot z11.s, z20.b, z24.b, #0
5608 __ dci(0x4498129b); // cdot z27.s, z20.b, z24.b, #0
5610 __ dci(0x449a12bf); // cdot z31.s, z21.b, z26.b, #0
5612 __ dci(0x44da10af); // cdot z15.d, z5.h, z26.h, #0
5614 __ dci(0x44da10ae); // cdot z14.d, z5.h, z26.h, #0
5616 __ dci(0x44db12be); // cdot z30.d, z21.h, z27.h, #0
5618 __ dci(0x449b12ee); // cdot z14.s, z23.b, z27.b, #0
5620 __ dci(0x449b12ef); // cdot z15.s, z23.b, z27.b, #0
5622 __ dci(0x449b14ee); // cdot z14.s, z7.b, z27.b, #90
5624 __ dci(0x449b1cac); // cdot z12.s, z5.b, z27.b, #270
5626 __ dci(0x449b1aae); // cdot z14.s, z21.b, z27.b, #180
5628 __ dci(0x449a1aec); // cdot z12.s, z23.b, z26.b, #180
5630 __ dci(0x44981ace); // cdot z14.s, z22.b, z24.b, #180
5632 __ dci(0x44901a86); // cdot z6.s, z20.b, z16.b, #180
5634 __ dci(0x44981b8e); // cdot z14.s, z28.b, z24.b, #180
5636 __ dci(0x44891b8a); // cdot z10.s, z28.b, z9.b, #180
5638 __ dci(0x4499138b); // cdot z11.s, z28.b, z25.b, #0
5640 __ dci(0x4498119b); // cdot z27.s, z12.b, z24.b, #0
5642 __ dci(0x449c199a); // cdot z26.s, z12.b, z28.b, #180
5644 __ dci(0x44901992); // cdot z18.s, z12.b, z16.b, #180
5646 __ dci(0x44901a90); // cdot z16.s, z20.b, z16.b, #180
5648 __ dci(0x44911ac0); // cdot z0.s, z22.b, z17.b, #180
5650 __ dci(0x44951bc1); // cdot z1.s, z30.b, z21.b, #180
5652 __ dci(0x44851b40); // cdot z0.s, z26.b, z5.b, #180
5654 __ dci(0x44851a70); // cdot z16.s, z19.b, z5.b, #180
5656 __ dci(0x44861a74); // cdot z20.s, z19.b, z6.b, #180
5658 __ dci(0x44921a76); // cdot z22.s, z19.b, z18.b, #180
5660 __ dci(0x44921246); // cdot z6.s, z18.b, z18.b, #0
5662 __ dci(0x44981247); // cdot z7.s, z18.b, z24.b, #0
5664 __ dci(0x44981746); // cdot z6.s, z26.b, z24.b, #90
5666 __ dci(0x449816c4); // cdot z4.s, z22.b, z24.b, #90
5672 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
5673 __ Ldr(w0, MemOperand(x0));
5712 __ dci(0x04793f99); // bsl1n z25.d, z25.d, z25.d, z28.d
5714 __ dci(0x04b93f9b); // bsl2n z27.d, z27.d, z25.d, z28.d
5716 __ dci(0x04b93f93); // bsl2n z19.d, z19.d, z25.d, z28.d
5718 __ dci(0x04b93dbb); // bsl2n z27.d, z27.d, z25.d, z13.d
5720 __ dci(0x04b53db9); // bsl2n z25.d, z25.d, z21.d, z13.d
5722 __ dci(0x04bd3d29); // bsl2n z9.d, z9.d, z29.d, z9.d
5724 __ dci(0x04ad3d0d); // bsl2n z13.d, z13.d, z13.d, z8.d
5726 __ dci(0x04a53d4f); // bsl2n z15.d, z15.d, z5.d, z10.d
5728 __ dci(0x04653d47); // bsl1n z7.d, z7.d, z5.d, z10.d
5730 __ dci(0x04613dc6); // bsl1n z6.d, z6.d, z1.d, z14.d
5732 __ dci(0x04673dc7); // bsl1n z7.d, z7.d, z7.d, z14.d
5734 __ dci(0x04673dc5); // bsl1n z5.d, z5.d, z7.d, z14.d
5736 __ dci(0x04e73cc1); // nbsl z1.d, z1.d, z7.d, z6.d
5738 __ dci(0x04773cc5); // bsl1n z5.d, z5.d, z23.d, z6.d
5740 __ dci(0x04773ac1); // bcax z1.d, z1.d, z23.d, z22.d
5742 __ dci(0x04773ac3); // bcax z3.d, z3.d, z23.d, z22.d
5744 __ dci(0x047739c7); // bcax z7.d, z7.d, z23.d, z14.d
5746 __ dci(0x047439c5); // bcax z5.d, z5.d, z20.d, z14.d
5748 __ dci(0x04743841); // bcax z1.d, z1.d, z20.d, z2.d
5750 __ dci(0x04753811); // bcax z17.d, z17.d, z21.d, z0.d
5752 __ dci(0x04753815); // bcax z21.d, z21.d, z21.d, z0.d
5754 __ dci(0x04713917); // bcax z23.d, z23.d, z17.d, z8.d
5756 __ dci(0x04793987); // bcax z7.d, z7.d, z25.d, z12.d
5758 __ dci(0x04693885); // bcax z5.d, z5.d, z9.d, z4.d
5760 __ dci(0x046838d5); // bcax z21.d, z21.d, z8.d, z6.d
5762 __ dci(0x046838d4); // bcax z20.d, z20.d, z8.d, z6.d
5764 __ dci(0x043838d6); // eor3 z22.d, z22.d, z24.d, z6.d
5766 __ dci(0x043c39de); // eor3 z30.d, z30.d, z28.d, z14.d
5768 __ dci(0x047c38ce); // bcax z14.d, z14.d, z28.d, z6.d
5770 __ dci(0x047c38cf); // bcax z15.d, z15.d, z28.d, z6.d
5772 __ dci(0x043c384e); // eor3 z14.d, z14.d, z28.d, z2.d
5774 __ dci(0x0474385e); // bcax z30.d, z30.d, z20.d, z2.d
5776 __ dci(0x047c3a4e); // bcax z14.d, z14.d, z28.d, z18.d
5778 __ dci(0x047c3c4f); // bsl1n z15.d, z15.d, z28.d, z2.d
5780 __ dci(0x047d3d4b); // bsl1n z11.d, z11.d, z29.d, z10.d
5782 __ dci(0x04793c49); // bsl1n z9.d, z9.d, z25.d, z2.d
5784 __ dci(0x04793c99); // bsl1n z25.d, z25.d, z25.d, z4.d
5786 __ dci(0x04613c91); // bsl1n z17.d, z17.d, z1.d, z4.d
5788 __ dci(0x04233c90); // bsl z16.d, z16.d, z3.d, z4.d
5790 __ dci(0x04233c80); // bsl z0.d, z0.d, z3.d, z4.d
5792 __ dci(0x04223ca4); // bsl z4.d, z4.d, z2.d, z5.d
5794 __ dci(0x04223ca5); // bsl z5.d, z5.d, z2.d, z5.d
5796 __ dci(0x04a03ca1); // bsl2n z1.d, z1.d, z0.d, z5.d
5798 __ dci(0x04a03cb1); // bsl2n z17.d, z17.d, z0.d, z5.d
5800 __ dci(0x04a13cf9); // bsl2n z25.d, z25.d, z1.d, z7.d
5802 __ dci(0x04a13cfd); // bsl2n z29.d, z29.d, z1.d, z7.d
5804 __ dci(0x04a13ced); // bsl2n z13.d, z13.d, z1.d, z7.d
5806 __ dci(0x04b93ce9); // bsl2n z9.d, z9.d, z25.d, z7.d
5808 __ dci(0x04b93dcb); // bsl2n z11.d, z11.d, z25.d, z14.d
5810 __ dci(0x04b83d4f); // bsl2n z15.d, z15.d, z24.d, z10.d
5816 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
5817 __ Ldr(w0, MemOperand(x0));
5856 __ dci(0x257109e3); // whilehs p3.h, w15, w17
5858 __ dci(0x257709f3); // whilehi p3.h, w15, w23
5860 __ dci(0x25f509f7); // whilehi p7.d, w15, w21
5862 __ dci(0x257508f5); // whilehi p5.h, w7, w21
5864 __ dci(0x257100f1); // whilegt p1.h, w7, w17
5866 __ dci(0x253108f0); // whilehi p0.b, w7, w17
5868 __ dci(0x253108f1); // whilehi p1.b, w7, w17
5870 __ dci(0x257508f9); // whilehi p9.h, w7, w21
5872 __ dci(0x25750858); // whilehi p8.h, w2, w21
5874 __ dci(0x25770a50); // whilehi p0.h, w18, w23
5876 __ dci(0x25751a52); // whilehi p2.h, x18, x21
5878 __ dci(0x25711a7a); // whilehi p10.h, x19, x17
5880 __ dci(0x25391a78); // whilehi p8.b, x19, x25
5882 __ dci(0x25290a70); // whilehi p0.b, w19, w9
5884 __ dci(0x25290a78); // whilehi p8.b, w19, w9
5886 __ dci(0x25a90b68); // whilehs p8.s, w27, w9
5888 __ dci(0x25a903e9); // whilege p9.s, wzr, w9
5890 __ dci(0x25a909ed); // whilehs p13.s, w15, w9
5892 __ dci(0x25a909ef); // whilehs p15.s, w15, w9
5894 __ dci(0x25a909eb); // whilehs p11.s, w15, w9
5896 __ dci(0x25b909c9); // whilehs p9.s, w14, w25
5898 __ dci(0x25bd098d); // whilehs p13.s, w12, w29
5900 __ dci(0x25b90909); // whilehs p9.s, w8, w25
5902 __ dci(0x25fb090b); // whilehs p11.d, w8, w27
5904 __ dci(0x25fb090a); // whilehs p10.d, w8, w27
5906 __ dci(0x25eb0b02); // whilehs p2.d, w24, w11
5908 __ dci(0x25eb0bc3); // whilehs p3.d, w30, w11
5910 __ dci(0x25e30acb); // whilehs p11.d, w22, w3
5912 __ dci(0x25eb08c9); // whilehs p9.d, w6, w11
5914 __ dci(0x25a308c1); // whilehs p1.s, w6, w3
5916 __ dci(0x25a108e5); // whilehs p5.s, w7, w1
5918 __ dci(0x25a009e4); // whilehs p4.s, w15, w0
5920 __ dci(0x25a009ec); // whilehs p12.s, w15, w0
5922 __ dci(0x25a019ae); // whilehs p14.s, x13, x0
5924 __ dci(0x25e018af); // whilehs p15.d, x5, x0
5926 __ dci(0x25e918ad); // whilehs p13.d, x5, x9
5928 __ dci(0x25eb188c); // whilehs p12.d, x4, x11
5930 __ dci(0x25eb188e); // whilehs p14.d, x4, x11
5932 __ dci(0x25e21886); // whilehs p6.d, x4, x2
5934 __ dci(0x25a21084); // whilege p4.s, x4, x2
5936 __ dci(0x25b31085); // whilege p5.s, x4, x19
5938 __ dci(0x25a3100d); // whilege p13.s, x0, x3
5940 __ dci(0x252b101d); // whilegt p13.b, x0, x11
5942 __ dci(0x253b1095); // whilegt p5.b, x4, x27
5944 __ dci(0x253b1091); // whilegt p1.b, x4, x27
5946 __ dci(0x253f10d5); // whilegt p5.b, x6, xzr
5948 __ dci(0x252f11d4); // whilegt p4.b, x14, x15
5950 __ dci(0x25af01d5); // whilegt p5.s, w14, w15
5952 __ dci(0x25eb01c5); // whilege p5.d, w14, w11
5954 __ dci(0x25fb0144); // whilege p4.d, w10, w27
5960 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
5961 __ Ldr(w0, MemOperand(x0));
6000 __ dci(0x44bb4ef6); // cdot z22.s, z23.b, z3.b[3], #270
6002 __ dci(0x44b94ff7); // cdot z23.s, z31.b, z1.b[3], #270
6004 __ dci(0x44b94dd5); // cdot z21.s, z14.b, z1.b[3], #270
6006 __ dci(0x44bd45d7); // cdot z23.s, z14.b, z5.b[3], #90
6008 __ dci(0x44fc45df); // cdot z31.d, z14.h, z12.h[1], #90
6010 __ dci(0x44f441db); // cdot z27.d, z14.h, z4.h[1], #0
6012 __ dci(0x44f44dd3); // cdot z19.d, z14.h, z4.h[1], #270
6014 __ dci(0x44b44d83); // cdot z3.s, z12.b, z4.b[2], #270
6016 __ dci(0x44ac4d82); // cdot z2.s, z12.b, z4.b[1], #270
6018 __ dci(0x44a84f8a); // cdot z10.s, z28.b, z0.b[1], #270
6020 __ dci(0x44a84d08); // cdot z8.s, z8.b, z0.b[1], #270
6022 __ dci(0x44ba4d09); // cdot z9.s, z8.b, z2.b[3], #270
6024 __ dci(0x44ea4d0d); // cdot z13.d, z8.h, z10.h[0], #270
6026 __ dci(0x44eb491d); // cdot z29.d, z8.h, z11.h[0], #180
6028 __ dci(0x44e9499f); // cdot z31.d, z12.h, z9.h[0], #180
6030 __ dci(0x44e84b9d); // cdot z29.d, z28.h, z8.h[0], #180
6032 __ dci(0x44e84b99); // cdot z25.d, z28.h, z8.h[0], #180
6034 __ dci(0x44f84a9d); // cdot z29.d, z20.h, z8.h[1], #180
6036 __ dci(0x44f84a99); // cdot z25.d, z20.h, z8.h[1], #180
6038 __ dci(0x44e84a09); // cdot z9.d, z16.h, z8.h[0], #180
6040 __ dci(0x44e84a19); // cdot z25.d, z16.h, z8.h[0], #180
6042 __ dci(0x44e04b1b); // cdot z27.d, z24.h, z0.h[0], #180
6044 __ dci(0x44e04a2b); // cdot z11.d, z17.h, z0.h[0], #180
6046 __ dci(0x44e04b0f); // cdot z15.d, z24.h, z0.h[0], #180
6048 __ dci(0x44e04b1f); // cdot z31.d, z24.h, z0.h[0], #180
6050 __ dci(0x44e84b4f); // cdot z15.d, z26.h, z8.h[0], #180
6052 __ dci(0x44ee4b4e); // cdot z14.d, z26.h, z14.h[0], #180
6054 __ dci(0x44ae4b7e); // cdot z30.s, z27.b, z6.b[1], #180
6056 __ dci(0x44a6497f); // cdot z31.s, z11.b, z6.b[0], #180
6058 __ dci(0x44a64df7); // cdot z23.s, z15.b, z6.b[0], #270
6060 __ dci(0x44a64c73); // cdot z19.s, z3.b, z6.b[0], #270
6062 __ dci(0x44a64de3); // cdot z3.s, z15.b, z6.b[0], #270
6064 __ dci(0x44a749e2); // cdot z2.s, z15.b, z7.b[0], #180
6066 __ dci(0x44a740e0); // cdot z0.s, z7.b, z7.b[0], #0
6068 __ dci(0x44a344e2); // cdot z2.s, z7.b, z3.b[0], #90
6070 __ dci(0x44a34ca3); // cdot z3.s, z5.b, z3.b[0], #270
6072 __ dci(0x44e14cb3); // cdot z19.d, z5.h, z1.h[0], #270
6074 __ dci(0x44e14d31); // cdot z17.d, z9.h, z1.h[0], #270
6076 __ dci(0x44f14d01); // cdot z1.d, z8.h, z1.h[1], #270
6078 __ dci(0x44f14551); // cdot z17.d, z10.h, z1.h[1], #90
6080 __ dci(0x44f345d5); // cdot z21.d, z14.h, z3.h[1], #90
6082 __ dci(0x44f34574); // cdot z20.d, z11.h, z3.h[1], #90
6084 __ dci(0x44f34576); // cdot z22.d, z11.h, z3.h[1], #90
6086 __ dci(0x44f34f77); // cdot z23.d, z27.h, z3.h[1], #270
6088 __ dci(0x44f24f5f); // cdot z31.d, z26.h, z2.h[1], #270
6090 __ dci(0x44fa4fcf); // cdot z15.d, z30.h, z10.h[1], #270
6092 __ dci(0x44ba4f4e); // cdot z14.s, z26.b, z2.b[3], #270
6094 __ dci(0x44ba470c); // cdot z12.s, z24.b, z2.b[3], #90
6096 __ dci(0x44b2479c); // cdot z28.s, z28.b, z2.b[2], #90
6098 __ dci(0x44b24fbd); // cdot z29.s, z29.b, z2.b[2], #270
6104 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
6105 __ Ldr(w0, MemOperand(x0));
6144 __ dci(0x05ed89a7); // splice z7.d, p2, {z13.d, z14.d}
6146 __ dci(0x05ed81e5); // splice z5.d, p0, {z15.d, z16.d}
6148 __ dci(0x05ed8375); // splice z21.d, p0, {z27.d, z28.d}
6150 __ dci(0x05ed9174); // splice z20.d, p4, {z11.d, z12.d}
6152 __ dci(0x056d91f6); // splice z22.h, p4, {z15.h, z16.h}
6154 __ dci(0x056d92f2); // splice z18.h, p4, {z23.h, z24.h}
6156 __ dci(0x056d96a2); // splice z2.h, p5, {z21.h, z22.h}
6158 __ dci(0x056d9fa6); // splice z6.h, p7, {z29.h, z30.h}
6160 __ dci(0x056d9be4); // splice z4.h, p6, {z31.h, z0.h}
6162 __ dci(0x056d97ec); // splice z12.h, p5, {z31.h, z0.h}
6164 __ dci(0x056d979c); // splice z28.h, p5, {z28.h, z29.h}
6166 __ dci(0x056d9794); // splice z20.h, p5, {z28.h, z29.h}
6168 __ dci(0x052d9f96); // splice z22.b, p7, {z28.b, z29.b}
6170 __ dci(0x056d8f9e); // splice z30.h, p3, {z28.h, z29.h}
6172 __ dci(0x056d9fd6); // splice z22.h, p7, {z30.h, z31.h}
6174 __ dci(0x056d8dd7); // splice z23.h, p3, {z14.h, z15.h}
6176 __ dci(0x05ad8ddf); // splice z31.s, p3, {z14.s, z15.s}
6178 __ dci(0x05ad8ddd); // splice z29.s, p3, {z14.s, z15.s}
6180 __ dci(0x05ad8d7c); // splice z28.s, p3, {z11.s, z12.s}
6182 __ dci(0x05ad8d74); // splice z20.s, p3, {z11.s, z12.s}
6184 __ dci(0x05ad8d64); // splice z4.s, p3, {z11.s, z12.s}
6186 __ dci(0x05ed8c6c); // splice z12.d, p3, {z3.d, z4.d}
6188 __ dci(0x05ed8cad); // splice z13.d, p3, {z5.d, z6.d}
6190 __ dci(0x056d8dbd); // splice z29.h, p3, {z13.h, z14.h}
6192 __ dci(0x056d8f2d); // splice z13.h, p3, {z25.h, z26.h}
6194 __ dci(0x056d8f9d); // splice z29.h, p3, {z28.h, z29.h}
6196 __ dci(0x056d8f95); // splice z21.h, p3, {z28.h, z29.h}
6198 __ dci(0x056d8f34); // splice z20.h, p3, {z25.h, z26.h}
6200 __ dci(0x05ed8f64); // splice z4.d, p3, {z27.d, z28.d}
6202 __ dci(0x05ad8e60); // splice z0.s, p3, {z19.s, z20.s}
6204 __ dci(0x052d8e50); // splice z16.b, p3, {z18.b, z19.b}
6206 __ dci(0x052d9652); // splice z18.b, p5, {z18.b, z19.b}
6208 __ dci(0x052d9ed0); // splice z16.b, p7, {z22.b, z23.b}
6210 __ dci(0x052d9ed4); // splice z20.b, p7, {z22.b, z23.b}
6212 __ dci(0x056d9cc4); // splice z4.h, p7, {z6.h, z7.h}
6214 __ dci(0x056d98e6); // splice z6.h, p6, {z7.h, z8.h}
6216 __ dci(0x056d9ee4); // splice z4.h, p7, {z23.h, z24.h}
6218 __ dci(0x056d9ef4); // splice z20.h, p7, {z23.h, z24.h}
6220 __ dci(0x056d9ab6); // splice z22.h, p6, {z21.h, z22.h}
6222 __ dci(0x056d9294); // splice z20.h, p4, {z20.h, z21.h}
6224 __ dci(0x056d9284); // splice z4.h, p4, {z20.h, z21.h}
6226 __ dci(0x052d920c); // splice z12.b, p4, {z16.b, z17.b}
6228 __ dci(0x052d921c); // splice z28.b, p4, {z16.b, z17.b}
6230 __ dci(0x052d9094); // splice z20.b, p4, {z4.b, z5.b}
6232 __ dci(0x052d90f6); // splice z22.b, p4, {z7.b, z8.b}
6234 __ dci(0x052d88e6); // splice z6.b, p2, {z7.b, z8.b}
6236 __ dci(0x052d88e4); // splice z4.b, p2, {z7.b, z8.b}
6238 __ dci(0x05ad8865); // splice z5.s, p2, {z3.s, z4.s}
6240 __ dci(0x05ad9961); // splice z1.s, p6, {z11.s, z12.s}
6242 __ dci(0x05ed9945); // splice z5.d, p6, {z10.d, z11.d}
6248 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
6249 __ Ldr(w0, MemOperand(x0));
6288 __ dci(0x25ac3026); // whilewr p6.s, x1, x12
6290 __ dci(0x25ac3024); // whilewr p4.s, x1, x12
6292 __ dci(0x25af3020); // whilewr p0.s, x1, x15
6294 __ dci(0x25ef3222); // whilewr p2.d, x17, x15
6296 __ dci(0x25eb320a); // whilewr p10.d, x16, x11
6298 __ dci(0x25e33308); // whilewr p8.d, x24, x3
6300 __ dci(0x25ea3309); // whilewr p9.d, x24, x10
6302 __ dci(0x25aa3101); // whilewr p1.s, x8, x10
6304 __ dci(0x252b3100); // whilewr p0.b, x8, x11
6306 __ dci(0x252a3008); // whilewr p8.b, x0, x10
6308 __ dci(0x2528304c); // whilewr p12.b, x2, x8
6310 __ dci(0x25203004); // whilewr p4.b, x0, x0
6312 __ dci(0x25303105); // whilewr p5.b, x8, x16
6314 __ dci(0x25b4310d); // whilewr p13.s, x8, x20
6316 __ dci(0x25ac310c); // whilewr p12.s, x8, x12
6318 __ dci(0x25ac310e); // whilewr p14.s, x8, x12
6320 __ dci(0x252c330a); // whilewr p10.b, x24, x12
6322 __ dci(0x252f330b); // whilewr p11.b, x24, x15
6324 __ dci(0x256e330f); // whilewr p15.h, x24, x14
6326 __ dci(0x252e334d); // whilewr p13.b, x26, x14
6328 __ dci(0x252e3349); // whilewr p9.b, x26, x14
6330 __ dci(0x253e33c1); // whilewr p1.b, x30, x30
6332 __ dci(0x252e33e3); // whilewr p3.b, xzr, x14
6334 __ dci(0x25ae33cb); // whilewr p11.s, x30, x14
6336 __ dci(0x25ae33ca); // whilewr p10.s, x30, x14
6338 __ dci(0x25ea33da); // whilerw p10.d, x30, x10
6340 __ dci(0x25ae33d8); // whilerw p8.s, x30, x14
6342 __ dci(0x25ae32f9); // whilerw p9.s, x23, x14
6344 __ dci(0x25ee32d8); // whilerw p8.d, x22, x14
6346 __ dci(0x25ec3299); // whilerw p9.d, x20, x12
6348 __ dci(0x25ec329d); // whilerw p13.d, x20, x12
6350 __ dci(0x25e8321c); // whilerw p12.d, x16, x8
6352 __ dci(0x2568301d); // whilerw p13.h, x0, x8
6354 __ dci(0x2528320d); // whilewr p13.b, x16, x8
6356 __ dci(0x25a8323d); // whilerw p13.s, x17, x8
6358 __ dci(0x25a8323f); // whilerw p15.s, x17, x8
6360 __ dci(0x25e8303d); // whilerw p13.d, x1, x8
6362 __ dci(0x25e83175); // whilerw p5.d, x11, x8
6364 __ dci(0x256a3174); // whilerw p4.h, x11, x10
6366 __ dci(0x256a317c); // whilerw p12.h, x11, x10
6368 __ dci(0x256a33f8); // whilerw p8.h, xzr, x10
6370 __ dci(0x256a33f0); // whilerw p0.h, xzr, x10
6372 __ dci(0x25e833e0); // whilewr p0.d, xzr, x8
6374 __ dci(0x25ec32e8); // whilewr p8.d, x23, x12
6376 __ dci(0x25ed326c); // whilewr p12.d, x19, x13
6378 __ dci(0x256d32ed); // whilewr p13.h, x23, x13
6380 __ dci(0x252d30e9); // whilewr p9.b, x7, x13
6382 __ dci(0x252531eb); // whilewr p11.b, x15, x5
6384 __ dci(0x252733ef); // whilewr p15.b, xzr, x7
6386 __ dci(0x25253367); // whilewr p7.b, x27, x5
6392 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
6393 __ Ldr(w0, MemOperand(x0));
6432 __ dci(0x4468fb6e); // mul z14.h, z27.h, z0.h[5]
6434 __ dci(0x4468f93e); // mul z30.h, z9.h, z0.h[5]
6436 __ dci(0x4428f976); // mul z22.h, z11.h, z0.h[1]
6438 __ dci(0x4428fa77); // mul z23.h, z19.h, z0.h[1]
6440 __ dci(0x4429fb67); // mul z7.h, z27.h, z1.h[1]
6442 __ dci(0x4429fb63); // mul z3.h, z27.h, z1.h[1]
6444 __ dci(0x4428fb53); // mul z19.h, z26.h, z0.h[1]
6446 __ dci(0x4429fbd1); // mul z17.h, z30.h, z1.h[1]
6448 __ dci(0x442afbd9); // mul z25.h, z30.h, z2.h[1]
6450 __ dci(0x442afa5b); // mul z27.h, z18.h, z2.h[1]
6452 __ dci(0x44abfa4b); // mul z11.s, z18.s, z3.s[1]
6454 __ dci(0x44abfa4f); // mul z15.s, z18.s, z3.s[1]
6456 __ dci(0x44a9f84e); // mul z14.s, z2.s, z1.s[1]
6458 __ dci(0x44e9fa46); // mul z6.d, z18.d, z9.d[0]
6460 __ dci(0x44e9fa8e); // mul z14.d, z20.d, z9.d[0]
6462 __ dci(0x44f1fa8f); // mul z15.d, z20.d, z1.d[1]
6464 __ dci(0x4471fa07); // mul z7.h, z16.h, z1.h[6]
6466 __ dci(0x4470fa43); // mul z3.h, z18.h, z0.h[6]
6468 __ dci(0x4474fb47); // mul z7.h, z26.h, z4.h[6]
6470 __ dci(0x4476fa57); // mul z23.h, z18.h, z6.h[6]
6472 __ dci(0x447cfa53); // mul z19.h, z18.h, z4.h[7]
6474 __ dci(0x447dfb52); // mul z18.h, z26.h, z5.h[7]
6476 __ dci(0x4477fb56); // mul z22.h, z26.h, z7.h[6]
6478 __ dci(0x4476fb77); // mul z23.h, z27.h, z6.h[6]
6480 __ dci(0x4467fb7f); // mul z31.h, z27.h, z7.h[4]
6482 __ dci(0x446ffa77); // mul z23.h, z19.h, z7.h[5]
6484 __ dci(0x442bfa76); // mul z22.h, z19.h, z3.h[1]
6486 __ dci(0x442bfa7e); // mul z30.h, z19.h, z3.h[1]
6488 __ dci(0x442afa2e); // mul z14.h, z17.h, z2.h[1]
6490 __ dci(0x442afa26); // mul z6.h, z17.h, z2.h[1]
6492 __ dci(0x442afb6e); // mul z14.h, z27.h, z2.h[1]
6494 __ dci(0x44aefb66); // mul z6.s, z27.s, z6.s[1]
6496 __ dci(0x44aefba4); // mul z4.s, z29.s, z6.s[1]
6498 __ dci(0x44aefbb4); // mul z20.s, z29.s, z6.s[1]
6500 __ dci(0x44acfbf0); // mul z16.s, z31.s, z4.s[1]
6502 __ dci(0x44a4fb60); // mul z0.s, z27.s, z4.s[0]
6504 __ dci(0x44a5fb30); // mul z16.s, z25.s, z5.s[0]
6506 __ dci(0x4425f938); // mul z24.h, z9.h, z5.h[0]
6508 __ dci(0x442df830); // mul z16.h, z1.h, z5.h[1]
6510 __ dci(0x4427f832); // mul z18.h, z1.h, z7.h[0]
6512 __ dci(0x442ef822); // mul z2.h, z1.h, z6.h[1]
6514 __ dci(0x442af803); // mul z3.h, z0.h, z2.h[1]
6516 __ dci(0x442af801); // mul z1.h, z0.h, z2.h[1]
6518 __ dci(0x442bf900); // mul z0.h, z8.h, z3.h[1]
6520 __ dci(0x442bf881); // mul z1.h, z4.h, z3.h[1]
6522 __ dci(0x4427f885); // mul z5.h, z4.h, z7.h[0]
6524 __ dci(0x4425f8ad); // mul z13.h, z5.h, z5.h[0]
6526 __ dci(0x4420f8a5); // mul z5.h, z5.h, z0.h[0]
6528 __ dci(0x4431f8a4); // mul z4.h, z5.h, z1.h[2]
6530 __ dci(0x4425f8a0); // mul z0.h, z5.h, z5.h[0]
6536 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
6537 __ Ldr(w0, MemOperand(x0));
6576 __ dci(0x44200800); // mla z0.h, z0.h, z0.h[0]
6578 __ dci(0x44200a28); // mla z8.h, z17.h, z0.h[0]
6580 __ dci(0x44e00a2a); // mla z10.d, z17.d, z0.d[0]
6582 __ dci(0x44600e3a); // mls z26.h, z17.h, z0.h[4]
6584 __ dci(0x44e20e2a); // mls z10.d, z17.d, z2.d[0]
6586 __ dci(0x44620f2e); // mls z14.h, z25.h, z2.h[4]
6588 __ dci(0x44630f6a); // mls z10.h, z27.h, z3.h[4]
6590 __ dci(0x44730b6e); // mla z14.h, z27.h, z3.h[6]
6592 __ dci(0x44720f6f); // mls z15.h, z27.h, z2.h[6]
6594 __ dci(0x44620f4b); // mls z11.h, z26.h, z2.h[4]
6596 __ dci(0x446a0b5b); // mla z27.h, z26.h, z2.h[5]
6598 __ dci(0x44680b73); // mla z19.h, z27.h, z0.h[5]
6600 __ dci(0x44e90b77); // mla z23.d, z27.d, z9.d[0]
6602 __ dci(0x44f10b76); // mla z22.d, z27.d, z1.d[1]
6604 __ dci(0x44f40b77); // mla z23.d, z27.d, z4.d[1]
6606 __ dci(0x44640b7f); // mla z31.h, z27.h, z4.h[4]
6608 __ dci(0x44640b7d); // mla z29.h, z27.h, z4.h[4]
6610 __ dci(0x44640b7f); // mla z31.h, z27.h, z4.h[4]
6612 __ dci(0x44340b7e); // mla z30.h, z27.h, z4.h[2]
6614 __ dci(0x44340e7a); // mls z26.h, z19.h, z4.h[2]
6616 __ dci(0x44b40eea); // mls z10.s, z23.s, z4.s[2]
6618 __ dci(0x44e40ee2); // mls z2.d, z23.d, z4.d[0]
6620 __ dci(0x44ec0ea3); // mls z3.d, z21.d, z12.d[0]
6622 __ dci(0x44ae0ea7); // mls z7.s, z21.s, z6.s[1]
6624 __ dci(0x44ae0eb7); // mls z23.s, z21.s, z6.s[1]
6626 __ dci(0x44ae0e07); // mls z7.s, z16.s, z6.s[1]
6628 __ dci(0x44ae0a85); // mla z5.s, z20.s, z6.s[1]
6630 __ dci(0x44ae0a81); // mla z1.s, z20.s, z6.s[1]
6632 __ dci(0x442a0a85); // mla z5.h, z20.h, z2.h[1]
6634 __ dci(0x443e0a84); // mla z4.h, z20.h, z6.h[3]
6636 __ dci(0x443f0b8c); // mla z12.h, z28.h, z7.h[3]
6638 __ dci(0x442f0bbc); // mla z28.h, z29.h, z7.h[1]
6640 __ dci(0x44270fac); // mls z12.h, z29.h, z7.h[0]
6642 __ dci(0x442f0ead); // mls z13.h, z21.h, z7.h[1]
6644 __ dci(0x44270fa9); // mls z9.h, z29.h, z7.h[0]
6646 __ dci(0x44270f68); // mls z8.h, z27.h, z7.h[0]
6648 __ dci(0x44270f6c); // mls z12.h, z27.h, z7.h[0]
6650 __ dci(0x44270f7c); // mls z28.h, z27.h, z7.h[0]
6652 __ dci(0x44250f2c); // mls z12.h, z25.h, z5.h[0]
6654 __ dci(0x442f0f28); // mls z8.h, z25.h, z7.h[1]
6656 __ dci(0x446f0d2c); // mls z12.h, z9.h, z7.h[5]
6658 __ dci(0x44af0d2e); // mls z14.s, z9.s, z7.s[1]
6660 __ dci(0x44ed0d26); // mls z6.d, z9.d, z13.d[0]
6662 __ dci(0x44fd0f2e); // mls z14.d, z25.d, z13.d[1]
6664 __ dci(0x44f90e2f); // mls z15.d, z17.d, z9.d[1]
6666 __ dci(0x447d0e3f); // mls z31.h, z17.h, z5.h[7]
6668 __ dci(0x44f90e2f); // mls z15.d, z17.d, z9.d[1]
6670 __ dci(0x44790c27); // mls z7.h, z1.h, z1.h[7]
6672 __ dci(0x44790c23); // mls z3.h, z1.h, z1.h[7]
6674 __ dci(0x44f90c6b); // mls z11.d, z3.d, z9.d[1]
6680 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
6681 __ Ldr(w0, MemOperand(x0));
6720 __ dci(0x44935abe); // umlslb z30.s, z21.h, z19.h
6722 __ dci(0x449358fa); // umlslb z26.s, z7.h, z19.h
6724 __ dci(0x44935adb); // umlslb z27.s, z22.h, z19.h
6726 __ dci(0x449359da); // umlslb z26.s, z14.h, z19.h
6728 __ dci(0x448349de); // umlalb z30.s, z14.h, z3.h
6730 __ dci(0x448349d6); // umlalb z22.s, z14.h, z3.h
6732 __ dci(0x44c34952); // umlalb z18.d, z10.s, z3.s
6734 __ dci(0x44d349d3); // umlalb z19.d, z14.s, z19.s
6736 __ dci(0x44d549d7); // umlalb z23.d, z14.s, z21.s
6738 __ dci(0x44d55ddf); // umlslt z31.d, z14.s, z21.s
6740 __ dci(0x44d55d1b); // umlslt z27.d, z8.s, z21.s
6742 __ dci(0x44d5490b); // umlalb z11.d, z8.s, z21.s
6744 __ dci(0x44554d0a); // umlalt z10.h, z8.b, z21.b
6746 __ dci(0x4455452b); // smlalt z11.h, z9.b, z21.b
6748 __ dci(0x44554529); // smlalt z9.h, z9.b, z21.b
6750 __ dci(0x44474521); // smlalt z1.h, z9.b, z7.b
6752 __ dci(0x44c74d25); // umlalt z5.d, z9.s, z7.s
6754 __ dci(0x44cb4d24); // umlalt z4.d, z9.s, z11.s
6756 __ dci(0x44cb4d2c); // umlalt z12.d, z9.s, z11.s
6758 __ dci(0x44c94da8); // umlalt z8.d, z13.s, z9.s
6760 __ dci(0x44594db8); // umlalt z24.h, z13.b, z25.b
6762 __ dci(0x44585db0); // umlslt z16.h, z13.b, z24.b
6764 __ dci(0x44585f80); // umlslt z0.h, z28.b, z24.b
6766 __ dci(0x445a5fc2); // umlslt z2.h, z30.b, z26.b
6768 __ dci(0x445a5fd2); // umlslt z18.h, z30.b, z26.b
6770 __ dci(0x445a5fd3); // umlslt z19.h, z30.b, z26.b
6772 __ dci(0x44525bd2); // umlslb z18.h, z30.b, z18.b
6774 __ dci(0x44525bd6); // umlslb z22.h, z30.b, z18.b
6776 __ dci(0x445053d2); // smlslb z18.h, z30.b, z16.b
6778 __ dci(0x44d153c2); // smlslb z2.d, z30.s, z17.s
6780 __ dci(0x449353c3); // smlslb z3.s, z30.h, z19.h
6782 __ dci(0x449152c7); // smlslb z7.s, z22.h, z17.h
6784 __ dci(0x44995285); // smlslb z5.s, z20.h, z25.h
6786 __ dci(0x449953c1); // smlslb z1.s, z30.h, z25.h
6788 __ dci(0x449152c9); // smlslb z9.s, z22.h, z17.h
6790 __ dci(0x449542cd); // smlalb z13.s, z22.h, z21.h
6792 __ dci(0x449c42c9); // smlalb z9.s, z22.h, z28.h
6794 __ dci(0x449c52f9); // smlslb z25.s, z23.h, z28.h
6796 __ dci(0x44dc5afd); // umlslb z29.d, z23.s, z28.s
6798 __ dci(0x44dd58ff); // umlslb z31.d, z7.s, z29.s
6800 __ dci(0x44dc587b); // umlslb z27.d, z3.s, z28.s
6802 __ dci(0x44de596b); // umlslb z11.d, z11.s, z30.s
6804 __ dci(0x44de5969); // umlslb z9.d, z11.s, z30.s
6806 __ dci(0x44db596d); // umlslb z13.d, z11.s, z27.s
6808 __ dci(0x44db5d5d); // umlslt z29.d, z10.s, z27.s
6810 __ dci(0x449b555f); // smlslt z31.s, z10.h, z27.h
6812 __ dci(0x449b555d); // smlslt z29.s, z10.h, z27.h
6814 __ dci(0x44d35559); // smlslt z25.d, z10.s, z19.s
6816 __ dci(0x44d355f8); // smlslt z24.d, z15.s, z19.s
6818 __ dci(0x44d356f9); // smlslt z25.d, z23.s, z19.s
6824 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
6825 __ Ldr(w0, MemOperand(x0));
6864 __ dci(0x44dd2f34); // cmla z20.d, z25.d, z29.d, #270
6866 __ dci(0x44dd2f3c); // cmla z28.d, z25.d, z29.d, #270
6868 __ dci(0x44dc2734); // cmla z20.d, z25.d, z28.d, #90
6870 __ dci(0x44dc2e36); // cmla z22.d, z17.d, z28.d, #270
6872 __ dci(0x44dd2f34); // cmla z20.d, z25.d, z29.d, #270
6874 __ dci(0x44dc2fb5); // cmla z21.d, z29.d, z28.d, #270
6876 __ dci(0x44dc2fbd); // cmla z29.d, z29.d, z28.d, #270
6878 __ dci(0x44dc2e3c); // cmla z28.d, z17.d, z28.d, #270
6880 __ dci(0x44dc2e34); // cmla z20.d, z17.d, z28.d, #270
6882 __ dci(0x44d42c30); // cmla z16.d, z1.d, z20.d, #270
6884 __ dci(0x44c42c60); // cmla z0.d, z3.d, z4.d, #270
6886 __ dci(0x44842464); // cmla z4.s, z3.s, z4.s, #90
6888 __ dci(0x44842d60); // cmla z0.s, z11.s, z4.s, #270
6890 __ dci(0x44042562); // cmla z2.b, z11.b, z4.b, #90
6892 __ dci(0x44042420); // cmla z0.b, z1.b, z4.b, #90
6894 __ dci(0x44062401); // cmla z1.b, z0.b, z6.b, #90
6896 __ dci(0x44042449); // cmla z9.b, z2.b, z4.b, #90
6898 __ dci(0x44052059); // cmla z25.b, z2.b, z5.b, #0
6900 __ dci(0x4415305d); // sqrdcmlah z29.b, z2.b, z21.b, #0
6902 __ dci(0x44153819); // sqrdcmlah z25.b, z0.b, z21.b, #180
6904 __ dci(0x4405391b); // sqrdcmlah z27.b, z8.b, z5.b, #180
6906 __ dci(0x4405314b); // sqrdcmlah z11.b, z10.b, z5.b, #0
6908 __ dci(0x4407316a); // sqrdcmlah z10.b, z11.b, z7.b, #0
6910 __ dci(0x4407347a); // sqrdcmlah z26.b, z3.b, z7.b, #90
6912 __ dci(0x4413347e); // sqrdcmlah z30.b, z3.b, z19.b, #90
6914 __ dci(0x4443347f); // sqrdcmlah z31.h, z3.h, z3.h, #90
6916 __ dci(0x444b307e); // sqrdcmlah z30.h, z3.h, z11.h, #0
6918 __ dci(0x444b301f); // sqrdcmlah z31.h, z0.h, z11.h, #0
6920 __ dci(0x4409300f); // sqrdcmlah z15.b, z0.b, z9.b, #0
6922 __ dci(0x440c300e); // sqrdcmlah z14.b, z0.b, z12.b, #0
6924 __ dci(0x4404310c); // sqrdcmlah z12.b, z8.b, z4.b, #0
6926 __ dci(0x4415310d); // sqrdcmlah z13.b, z8.b, z21.b, #0
6928 __ dci(0x4414350f); // sqrdcmlah z15.b, z8.b, z20.b, #90
6930 __ dci(0x4454354d); // sqrdcmlah z13.h, z10.h, z20.h, #90
6932 __ dci(0x444435c5); // sqrdcmlah z5.h, z14.h, z4.h, #90
6934 __ dci(0x444c34c7); // sqrdcmlah z7.h, z6.h, z12.h, #90
6936 __ dci(0x444836c6); // sqrdcmlah z6.h, z22.h, z8.h, #90
6938 __ dci(0x444836d6); // sqrdcmlah z22.h, z22.h, z8.h, #90
6940 __ dci(0x44403694); // sqrdcmlah z20.h, z20.h, z0.h, #90
6942 __ dci(0x4449369c); // sqrdcmlah z28.h, z20.h, z9.h, #90
6948 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
6949 __ Ldr(w0, MemOperand(x0));
6988 __ dci(0x44fd7d52); // sqrdcmlah z18.s, z10.s, z13.s[1], #270
6990 __ dci(0x44fd7c13); // sqrdcmlah z19.s, z0.s, z13.s[1], #270
6992 __ dci(0x44f97e11); // sqrdcmlah z17.s, z16.s, z9.s[1], #270
6994 __ dci(0x44e97615); // sqrdcmlah z21.s, z16.s, z9.s[0], #90
6996 __ dci(0x44e97614); // sqrdcmlah z20.s, z16.s, z9.s[0], #90
6998 __ dci(0x44e17635); // sqrdcmlah z21.s, z17.s, z1.s[0], #90
7000 __ dci(0x44e17634); // sqrdcmlah z20.s, z17.s, z1.s[0], #90
7002 __ dci(0x44f07635); // sqrdcmlah z21.s, z17.s, z0.s[1], #90
7004 __ dci(0x44f07465); // sqrdcmlah z5.s, z3.s, z0.s[1], #90
7006 __ dci(0x44f87675); // sqrdcmlah z21.s, z19.s, z8.s[1], #90
7008 __ dci(0x44b87e7d); // sqrdcmlah z29.h, z19.h, z0.h[3], #270
7010 __ dci(0x44b876f9); // sqrdcmlah z25.h, z23.h, z0.h[3], #90
7012 __ dci(0x44f874fb); // sqrdcmlah z27.s, z7.s, z8.s[1], #90
7014 __ dci(0x44f070fa); // sqrdcmlah z26.s, z7.s, z0.s[1], #0
7016 __ dci(0x44f07038); // sqrdcmlah z24.s, z1.s, z0.s[1], #0
7018 __ dci(0x44b17030); // sqrdcmlah z16.h, z1.h, z1.h[2], #0
7020 __ dci(0x44b17032); // sqrdcmlah z18.h, z1.h, z1.h[2], #0
7022 __ dci(0x44b07430); // sqrdcmlah z16.h, z1.h, z0.h[2], #90
7024 __ dci(0x44b07438); // sqrdcmlah z24.h, z1.h, z0.h[2], #90
7026 __ dci(0x44b0743a); // sqrdcmlah z26.h, z1.h, z0.h[2], #90
7032 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
7033 __ Ldr(w0, MemOperand(x0));
7072 __ dci(0x44db629b); // sqdmlalb z27.d, z20.s, z27.s
7074 __ dci(0x44db631f); // sqdmlalb z31.d, z24.s, z27.s
7076 __ dci(0x44da6b1d); // sqdmlslb z29.d, z24.s, z26.s
7078 __ dci(0x44da6a35); // sqdmlslb z21.d, z17.s, z26.s
7080 __ dci(0x444a6a3d); // sqdmlslb z29.h, z17.b, z10.b
7082 __ dci(0x444a6a39); // sqdmlslb z25.h, z17.b, z10.b
7084 __ dci(0x445a6829); // sqdmlslb z9.h, z1.b, z26.b
7086 __ dci(0x445a6b28); // sqdmlslb z8.h, z25.b, z26.b
7088 __ dci(0x44da6b69); // sqdmlslb z9.d, z27.s, z26.s
7090 __ dci(0x44da616d); // sqdmlalb z13.d, z11.s, z26.s
7092 __ dci(0x4458616f); // sqdmlalb z15.h, z11.b, z24.b
7094 __ dci(0x4449617f); // sqdmlalb z31.h, z11.b, z9.b
7096 __ dci(0x4459614f); // sqdmlalb z15.h, z10.b, z25.b
7098 __ dci(0x4458654d); // sqdmlalt z13.h, z10.b, z24.b
7100 __ dci(0x44586d05); // sqdmlslt z5.h, z8.b, z24.b
7102 __ dci(0x44506d84); // sqdmlslt z4.h, z12.b, z16.b
7104 __ dci(0x44506fc6); // sqdmlslt z6.h, z30.b, z16.b
7106 __ dci(0x44566fc4); // sqdmlslt z4.h, z30.b, z22.b
7108 __ dci(0x44566f0c); // sqdmlslt z12.h, z24.b, z22.b
7110 __ dci(0x44566f0e); // sqdmlslt z14.h, z24.b, z22.b
7112 __ dci(0x44566746); // sqdmlalt z6.h, z26.b, z22.b
7114 __ dci(0x445767c4); // sqdmlalt z4.h, z30.b, z23.b
7116 __ dci(0x44d667c0); // sqdmlalt z0.d, z30.s, z22.s
7118 __ dci(0x44566742); // sqdmlalt z2.h, z26.b, z22.b
7120 __ dci(0x44c6674a); // sqdmlalt z10.d, z26.s, z6.s
7122 __ dci(0x44c66742); // sqdmlalt z2.d, z26.s, z6.s
7124 __ dci(0x44ce6706); // sqdmlalt z6.d, z24.s, z14.s
7126 __ dci(0x44ce670e); // sqdmlalt z14.d, z24.s, z14.s
7128 __ dci(0x44de6746); // sqdmlalt z6.d, z26.s, z30.s
7130 __ dci(0x44dc6342); // sqdmlalb z2.d, z26.s, z28.s
7132 __ dci(0x44d46366); // sqdmlalb z6.d, z27.s, z20.s
7134 __ dci(0x44d5626e); // sqdmlalb z14.d, z19.s, z21.s
7136 __ dci(0x44d5646f); // sqdmlalt z15.d, z3.s, z21.s
7138 __ dci(0x44d36467); // sqdmlalt z7.d, z3.s, z19.s
7140 __ dci(0x44d360ef); // sqdmlalb z15.d, z7.s, z19.s
7142 __ dci(0x44d3646b); // sqdmlalt z11.d, z3.s, z19.s
7144 __ dci(0x4492646f); // sqdmlalt z15.s, z3.h, z18.h
7146 __ dci(0x4492647f); // sqdmlalt z31.s, z3.h, z18.h
7148 __ dci(0x4494647d); // sqdmlalt z29.s, z3.h, z20.h
7150 __ dci(0x4484666d); // sqdmlalt z13.s, z19.h, z4.h
7156 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
7157 __ Ldr(w0, MemOperand(x0));
7196 __ dci(0x449e0ac6); // sqdmlalbt z6.s, z22.h, z30.h
7198 __ dci(0x449c0ae4); // sqdmlalbt z4.s, z23.h, z28.h
7200 __ dci(0x449c0ae6); // sqdmlalbt z6.s, z23.h, z28.h
7202 __ dci(0x449e0aae); // sqdmlalbt z14.s, z21.h, z30.h
7204 __ dci(0x449e0aaf); // sqdmlalbt z15.s, z21.h, z30.h
7206 __ dci(0x449c0a2b); // sqdmlalbt z11.s, z17.h, z28.h
7208 __ dci(0x449e0829); // sqdmlalbt z9.s, z1.h, z30.h
7210 __ dci(0x449e0c61); // sqdmlslbt z1.s, z3.h, z30.h
7212 __ dci(0x449e0c60); // sqdmlslbt z0.s, z3.h, z30.h
7214 __ dci(0x449e0c70); // sqdmlslbt z16.s, z3.h, z30.h
7216 __ dci(0x449f0cf4); // sqdmlslbt z20.s, z7.h, z31.h
7218 __ dci(0x449f08b5); // sqdmlalbt z21.s, z5.h, z31.h
7220 __ dci(0x449f08a5); // sqdmlalbt z5.s, z5.h, z31.h
7222 __ dci(0x448e08b5); // sqdmlalbt z21.s, z5.h, z14.h
7224 __ dci(0x448c08e5); // sqdmlalbt z5.s, z7.h, z12.h
7226 __ dci(0x448c08e1); // sqdmlalbt z1.s, z7.h, z12.h
7228 __ dci(0x448c0971); // sqdmlalbt z17.s, z11.h, z12.h
7230 __ dci(0x448f0975); // sqdmlalbt z21.s, z11.h, z15.h
7232 __ dci(0x448f0977); // sqdmlalbt z23.s, z11.h, z15.h
7234 __ dci(0x449f093f); // sqdmlalbt z31.s, z9.h, z31.h
7236 __ dci(0x449f09f7); // sqdmlalbt z23.s, z15.h, z31.h
7238 __ dci(0x449f0987); // sqdmlalbt z7.s, z12.h, z31.h
7240 __ dci(0x449f0a83); // sqdmlalbt z3.s, z20.h, z31.h
7242 __ dci(0x449b0ac1); // sqdmlalbt z1.s, z22.h, z27.h
7244 __ dci(0x449b0aa9); // sqdmlalbt z9.s, z21.h, z27.h
7246 __ dci(0x449b0ab9); // sqdmlalbt z25.s, z21.h, z27.h
7248 __ dci(0x44d30aa9); // sqdmlalbt z9.d, z21.s, z19.s
7250 __ dci(0x44d30aab); // sqdmlalbt z11.d, z21.s, z19.s
7252 __ dci(0x44d70baf); // sqdmlalbt z15.d, z29.s, z23.s
7254 __ dci(0x44d70ba7); // sqdmlalbt z7.d, z29.s, z23.s
7260 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
7261 __ Ldr(w0, MemOperand(x0));
7300 __ dci(0x44f52e3d); // sqdmlalt z29.d, z17.s, z5.s[3]
7302 __ dci(0x44f52e3c); // sqdmlalt z28.d, z17.s, z5.s[3]
7304 __ dci(0x44f72c3d); // sqdmlalt z29.d, z1.s, z7.s[3]
7306 __ dci(0x44b62c35); // sqdmlalt z21.s, z1.h, z6.h[5]
7308 __ dci(0x44b624b7); // sqdmlalt z23.s, z5.h, z6.h[4]
7310 __ dci(0x44f626b6); // sqdmlalt z22.d, z21.s, z6.s[2]
7312 __ dci(0x44f62226); // sqdmlalb z6.d, z17.s, z6.s[2]
7314 __ dci(0x44fa222e); // sqdmlalb z14.d, z17.s, z10.s[2]
7316 __ dci(0x44fa2aac); // sqdmlalb z12.d, z21.s, z10.s[3]
7318 __ dci(0x44fa2abc); // sqdmlalb z28.d, z21.s, z10.s[3]
7320 __ dci(0x44fa2aac); // sqdmlalb z12.d, z21.s, z10.s[3]
7322 __ dci(0x44ba2a88); // sqdmlalb z8.s, z20.h, z2.h[7]
7324 __ dci(0x44fb2a89); // sqdmlalb z9.d, z20.s, z11.s[3]
7326 __ dci(0x44f32ab9); // sqdmlalb z25.d, z21.s, z3.s[3]
7328 __ dci(0x44e328bd); // sqdmlalb z29.d, z5.s, z3.s[1]
7330 __ dci(0x44f228ad); // sqdmlalb z13.d, z5.s, z2.s[3]
7332 __ dci(0x44e238af); // sqdmlslb z15.d, z5.s, z2.s[1]
7334 __ dci(0x44e639ad); // sqdmlslb z13.d, z13.s, z6.s[1]
7336 __ dci(0x44a63daf); // sqdmlslt z15.s, z13.h, z6.h[1]
7338 __ dci(0x44ae3cbf); // sqdmlslt z31.s, z5.h, z6.h[3]
7340 __ dci(0x44a634b7); // sqdmlslt z23.s, z5.h, z6.h[0]
7342 __ dci(0x44e234b5); // sqdmlslt z21.d, z5.s, z2.s[0]
7344 __ dci(0x44a23437); // sqdmlslt z23.s, z1.h, z2.h[0]
7346 __ dci(0x44a63535); // sqdmlslt z21.s, z9.h, z6.h[0]
7348 __ dci(0x44a235b4); // sqdmlslt z20.s, z13.h, z2.h[0]
7350 __ dci(0x44a234e4); // sqdmlslt z4.s, z7.h, z2.h[0]
7352 __ dci(0x44a234ec); // sqdmlslt z12.s, z7.h, z2.h[0]
7354 __ dci(0x44a324e8); // sqdmlalt z8.s, z7.h, z3.h[0]
7356 __ dci(0x44a334c9); // sqdmlslt z9.s, z6.h, z3.h[0]
7358 __ dci(0x44a324f9); // sqdmlalt z25.s, z7.h, z3.h[0]
7360 __ dci(0x44a224d8); // sqdmlalt z24.s, z6.h, z2.h[0]
7362 __ dci(0x44b22448); // sqdmlalt z8.s, z2.h, z2.h[4]
7364 __ dci(0x44f224d8); // sqdmlalt z24.d, z6.s, z2.s[2]
7366 __ dci(0x44f220f9); // sqdmlalb z25.d, z7.s, z2.s[2]
7368 __ dci(0x44f020a9); // sqdmlalb z9.d, z5.s, z0.s[2]
7370 __ dci(0x44f424ad); // sqdmlalt z13.d, z5.s, z4.s[2]
7372 __ dci(0x44f430a5); // sqdmlslb z5.d, z5.s, z4.s[2]
7374 __ dci(0x44f130a4); // sqdmlslb z4.d, z5.s, z1.s[2]
7376 __ dci(0x44f130ac); // sqdmlslb z12.d, z5.s, z1.s[2]
7378 __ dci(0x44f3302d); // sqdmlslb z13.d, z1.s, z3.s[2]
7380 __ dci(0x44e3300c); // sqdmlslb z12.d, z0.s, z3.s[0]
7382 __ dci(0x44e3300d); // sqdmlslb z13.d, z0.s, z3.s[0]
7384 __ dci(0x44eb321d); // sqdmlslb z29.d, z16.s, z11.s[0]
7386 __ dci(0x44ef3259); // sqdmlslb z25.d, z18.s, z15.s[0]
7388 __ dci(0x44ff3349); // sqdmlslb z9.d, z26.s, z15.s[2]
7390 __ dci(0x44fb3319); // sqdmlslb z25.d, z24.s, z11.s[2]
7392 __ dci(0x44bb3b18); // sqdmlslb z24.s, z24.h, z3.h[7]
7394 __ dci(0x44bb3b19); // sqdmlslb z25.s, z24.h, z3.h[7]
7396 __ dci(0x44bb3b11); // sqdmlslb z17.s, z24.h, z3.h[7]
7398 __ dci(0x44f33b15); // sqdmlslb z21.d, z24.s, z3.s[3]
7404 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
7405 __ Ldr(w0, MemOperand(x0));
7444 __ dci(0x64bfa635); // fmlslt z21.s, z17.h, z31.h
7446 __ dci(0x64bf867d); // fmlalt z29.s, z19.h, z31.h
7448 __ dci(0x64af877c); // fmlalt z28.s, z27.h, z15.h
7450 __ dci(0x64af8774); // fmlalt z20.s, z27.h, z15.h
7452 __ dci(0x64be877c); // fmlalt z28.s, z27.h, z30.h
7454 __ dci(0x64bd876c); // fmlalt z12.s, z27.h, z29.h
7456 __ dci(0x64bf8728); // fmlalt z8.s, z25.h, z31.h
7458 __ dci(0x64bf836a); // fmlalb z10.s, z27.h, z31.h
7460 __ dci(0x64bf87eb); // fmlalt z11.s, z31.h, z31.h
7462 __ dci(0x64bf87e9); // fmlalt z9.s, z31.h, z31.h
7464 __ dci(0x64b78779); // fmlalt z25.s, z27.h, z23.h
7466 __ dci(0x64b1877b); // fmlalt z27.s, z27.h, z17.h
7468 __ dci(0x64b1871f); // fmlalt z31.s, z24.h, z17.h
7470 __ dci(0x64b5878f); // fmlalt z15.s, z28.h, z21.h
7472 __ dci(0x64b4870d); // fmlalt z13.s, z24.h, z20.h
7474 __ dci(0x64b48709); // fmlalt z9.s, z24.h, z20.h
7476 __ dci(0x64b48779); // fmlalt z25.s, z27.h, z20.h
7478 __ dci(0x64bc8671); // fmlalt z17.s, z19.h, z28.h
7480 __ dci(0x64b98673); // fmlalt z19.s, z19.h, z25.h
7482 __ dci(0x64b18623); // fmlalt z3.s, z17.h, z17.h
7484 __ dci(0x64b18642); // fmlalt z2.s, z18.h, z17.h
7486 __ dci(0x64b1a6c0); // fmlslt z0.s, z22.h, z17.h
7488 __ dci(0x64b086c4); // fmlalt z4.s, z22.h, z16.h
7490 __ dci(0x64b28645); // fmlalt z5.s, z18.h, z18.h
7492 __ dci(0x64b28264); // fmlalb z4.s, z19.h, z18.h
7494 __ dci(0x64b28765); // fmlalt z5.s, z27.h, z18.h
7496 __ dci(0x64ba8561); // fmlalt z1.s, z11.h, z26.h
7498 __ dci(0x64aa8543); // fmlalt z3.s, z10.h, z10.h
7500 __ dci(0x64ae8141); // fmlalb z1.s, z10.h, z14.h
7502 __ dci(0x64ae80c3); // fmlalb z3.s, z6.h, z14.h
7508 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
7509 __ Ldr(w0, MemOperand(x0));
7548 __ dci(0x44ea8d67); // smlalt z7.d, z11.s, z10.s[1]
7550 __ dci(0x44ea9d2f); // umlalt z15.d, z9.s, z10.s[1]
7552 __ dci(0x44ea9d2d); // umlalt z13.d, z9.s, z10.s[1]
7554 __ dci(0x44eb992f); // umlalb z15.d, z9.s, z11.s[1]
7556 __ dci(0x44ab99ae); // umlalb z14.s, z13.h, z3.h[3]
7558 __ dci(0x44ad99be); // umlalb z30.s, z13.h, z5.h[3]
7560 __ dci(0x44ad99ba); // umlalb z26.s, z13.h, z5.h[3]
7562 __ dci(0x44adb9f2); // umlslb z18.s, z15.h, z5.h[3]
7564 __ dci(0x44bda9f3); // smlslb z19.s, z15.h, z5.h[7]
7566 __ dci(0x44b9a1fb); // smlslb z27.s, z15.h, z1.h[6]
7568 __ dci(0x44b8a1b3); // smlslb z19.s, z13.h, z0.h[6]
7570 __ dci(0x44bc81b1); // smlalb z17.s, z13.h, z4.h[6]
7572 __ dci(0x44bc82b0); // smlalb z16.s, z21.h, z4.h[6]
7574 __ dci(0x44ac92b8); // umlalb z24.s, z21.h, z4.h[2]
7576 __ dci(0x44a4923a); // umlalb z26.s, z17.h, z4.h[0]
7578 __ dci(0x44b49a3e); // umlalb z30.s, z17.h, z4.h[5]
7580 __ dci(0x44b69a1c); // umlalb z28.s, z16.h, z6.h[5]
7582 __ dci(0x44b6b218); // umlslb z24.s, z16.h, z6.h[4]
7584 __ dci(0x44b2b25a); // umlslb z26.s, z18.h, z2.h[4]
7586 __ dci(0x44b2ba0a); // umlslb z10.s, z16.h, z2.h[5]
7588 __ dci(0x44b29b08); // umlalb z8.s, z24.h, z2.h[5]
7590 __ dci(0x44b29b00); // umlalb z0.s, z24.h, z2.h[5]
7592 __ dci(0x44b29e08); // umlalt z8.s, z16.h, z2.h[5]
7594 __ dci(0x44b29eaa); // umlalt z10.s, z21.h, z2.h[5]
7596 __ dci(0x44b2be2e); // umlslt z14.s, z17.h, z2.h[5]
7598 __ dci(0x44b2be3e); // umlslt z30.s, z17.h, z2.h[5]
7600 __ dci(0x44f2be7a); // umlslt z26.d, z19.s, z2.s[3]
7602 __ dci(0x44f2ae4a); // smlslt z10.d, z18.s, z2.s[3]
7604 __ dci(0x44faae6e); // smlslt z14.d, z19.s, z10.s[3]
7606 __ dci(0x44faae6f); // smlslt z15.d, z19.s, z10.s[3]
7608 __ dci(0x44faae67); // smlslt z7.d, z19.s, z10.s[3]
7610 __ dci(0x44fa8e57); // smlalt z23.d, z18.s, z10.s[3]
7612 __ dci(0x44fa8c67); // smlalt z7.d, z3.s, z10.s[3]
7614 __ dci(0x44eaac66); // smlslt z6.d, z3.s, z10.s[1]
7616 __ dci(0x44eaa456); // smlslt z22.d, z2.s, z10.s[0]
7618 __ dci(0x44aea45e); // smlslt z30.s, z2.h, z6.h[2]
7620 __ dci(0x44aaa64e); // smlslt z14.s, z18.h, z2.h[2]
7622 __ dci(0x44baa75e); // smlslt z30.s, z26.h, z2.h[6]
7624 __ dci(0x44baa75a); // smlslt z26.s, z26.h, z2.h[6]
7626 __ dci(0x44eaa75b); // smlslt z27.d, z26.s, z10.s[0]
7628 __ dci(0x44eabf5f); // umlslt z31.d, z26.s, z10.s[1]
7630 __ dci(0x44ebbd57); // umlslt z23.d, z10.s, z11.s[1]
7632 __ dci(0x44abbf55); // umlslt z21.s, z26.h, z3.h[3]
7634 __ dci(0x44abab5d); // smlslb z29.s, z26.h, z3.h[3]
7636 __ dci(0x44abab5c); // smlslb z28.s, z26.h, z3.h[3]
7638 __ dci(0x44abaf78); // smlslt z24.s, z27.h, z3.h[3]
7640 __ dci(0x44aaa77c); // smlslt z28.s, z27.h, z2.h[2]
7642 __ dci(0x44aaa178); // smlslb z24.s, z11.h, z2.h[2]
7644 __ dci(0x44aa81fa); // smlalb z26.s, z15.h, z2.h[2]
7646 __ dci(0x44aa8198); // smlalb z24.s, z12.h, z2.h[2]
7652 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
7653 __ Ldr(w0, MemOperand(x0));
7692 __ dci(0x44f1d492); // umullt z18.d, z4.s, z1.s[2]
7694 __ dci(0x44fdd490); // umullt z16.d, z4.s, z13.s[2]
7696 __ dci(0x44fdc080); // smullb z0.d, z4.s, z13.s[2]
7698 __ dci(0x44fdc081); // smullb z1.d, z4.s, z13.s[2]
7700 __ dci(0x44fcc000); // smullb z0.d, z0.s, z12.s[2]
7702 __ dci(0x44ffc001); // smullb z1.d, z0.s, z15.s[2]
7704 __ dci(0x44ffc0c9); // smullb z9.d, z6.s, z15.s[2]
7706 __ dci(0x44f7d0c8); // umullb z8.d, z6.s, z7.s[2]
7708 __ dci(0x44b7d080); // umullb z0.s, z4.h, z7.h[4]
7710 __ dci(0x44f7d290); // umullb z16.d, z20.s, z7.s[2]
7712 __ dci(0x44f6da92); // umullb z18.d, z20.s, z6.s[3]
7714 __ dci(0x44fed296); // umullb z22.d, z20.s, z14.s[2]
7716 __ dci(0x44f6c292); // smullb z18.d, z20.s, z6.s[2]
7718 __ dci(0x44e6c2a2); // smullb z2.d, z21.s, z6.s[0]
7720 __ dci(0x44e6c323); // smullb z3.d, z25.s, z6.s[0]
7722 __ dci(0x44e6c333); // smullb z19.d, z25.s, z6.s[0]
7724 __ dci(0x44e7c377); // smullb z23.d, z27.s, z7.s[0]
7726 __ dci(0x44e7d3ff); // umullb z31.d, z31.s, z7.s[0]
7728 __ dci(0x44e7d3fe); // umullb z30.d, z31.s, z7.s[0]
7730 __ dci(0x44e7c3da); // smullb z26.d, z30.s, z7.s[0]
7732 __ dci(0x44e7c2fe); // smullb z30.d, z23.s, z7.s[0]
7734 __ dci(0x44e3c3f6); // smullb z22.d, z31.s, z3.s[0]
7736 __ dci(0x44f3c2f2); // smullb z18.d, z23.s, z3.s[2]
7738 __ dci(0x44f3c2e2); // smullb z2.d, z23.s, z3.s[2]
7740 __ dci(0x44f3c06a); // smullb z10.d, z3.s, z3.s[2]
7742 __ dci(0x44f3c06b); // smullb z11.d, z3.s, z3.s[2]
7744 __ dci(0x44f3c449); // smullt z9.d, z2.s, z3.s[2]
7746 __ dci(0x44f3ccc8); // smullt z8.d, z6.s, z3.s[3]
7748 __ dci(0x44f9ccd8); // smullt z24.d, z6.s, z9.s[3]
7750 __ dci(0x44ffccdc); // smullt z28.d, z6.s, z15.s[3]
7752 __ dci(0x44fecc58); // smullt z24.d, z2.s, z14.s[3]
7754 __ dci(0x44bfcc48); // smullt z8.s, z2.h, z7.h[7]
7756 __ dci(0x44b7c84a); // smullb z10.s, z2.h, z7.h[5]
7758 __ dci(0x44a5c84e); // smullb z14.s, z2.h, z5.h[1]
7760 __ dci(0x44adca46); // smullb z6.s, z18.h, z5.h[3]
7762 __ dci(0x44add847); // umullb z7.s, z2.h, z5.h[3]
7764 __ dci(0x44bdd04f); // umullb z15.s, z2.h, z5.h[6]
7766 __ dci(0x44bdc007); // smullb z7.s, z0.h, z5.h[6]
7768 __ dci(0x44bdc005); // smullb z5.s, z0.h, z5.h[6]
7770 __ dci(0x44bdc0b5); // smullb z21.s, z5.h, z5.h[6]
7772 __ dci(0x44bcc094); // smullb z20.s, z4.h, z4.h[6]
7774 __ dci(0x44bcc09c); // smullb z28.s, z4.h, z4.h[6]
7776 __ dci(0x44acc88c); // smullb z12.s, z4.h, z4.h[3]
7778 __ dci(0x44aac884); // smullb z4.s, z4.h, z2.h[3]
7780 __ dci(0x44a8c8ac); // smullb z12.s, z5.h, z0.h[3]
7782 __ dci(0x44a8cea4); // smullt z4.s, z21.h, z0.h[3]
7784 __ dci(0x44a8daa5); // umullb z5.s, z21.h, z0.h[3]
7786 __ dci(0x44b8dae4); // umullb z4.s, z23.h, z0.h[7]
7788 __ dci(0x44b9da6c); // umullb z12.s, z19.h, z1.h[7]
7790 __ dci(0x44b9da64); // umullb z4.s, z19.h, z1.h[7]
7796 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
7797 __ Ldr(w0, MemOperand(x0));
7836 __ dci(0x046c711a); // sqdmulh z26.h, z8.h, z12.h
7838 __ dci(0x047c7138); // sqdmulh z24.h, z9.h, z28.h
7840 __ dci(0x04fc7539); // sqrdmulh z25.d, z9.d, z28.d
7842 __ dci(0x04fc7029); // sqdmulh z9.d, z1.d, z28.d
7844 __ dci(0x04ac702d); // sqdmulh z13.s, z1.s, z12.s
7846 __ dci(0x04a4742c); // sqrdmulh z12.s, z1.s, z4.s
7848 __ dci(0x04a574ad); // sqrdmulh z13.s, z5.s, z5.s
7850 __ dci(0x04a574a9); // sqrdmulh z9.s, z5.s, z5.s
7852 __ dci(0x04e574e8); // sqrdmulh z8.d, z7.d, z5.d
7854 __ dci(0x04e570ca); // sqdmulh z10.d, z6.d, z5.d
7856 __ dci(0x04e670cb); // sqdmulh z11.d, z6.d, z6.d
7858 __ dci(0x04f6708f); // sqdmulh z15.d, z4.d, z22.d
7860 __ dci(0x04f67087); // sqdmulh z7.d, z4.d, z22.d
7862 __ dci(0x04f77185); // sqdmulh z5.d, z12.d, z23.d
7864 __ dci(0x04f67104); // sqdmulh z4.d, z8.d, z22.d
7866 __ dci(0x04f6710c); // sqdmulh z12.d, z8.d, z22.d
7868 __ dci(0x04f6708d); // sqdmulh z13.d, z4.d, z22.d
7870 __ dci(0x04f67085); // sqdmulh z5.d, z4.d, z22.d
7872 __ dci(0x04fe7281); // sqdmulh z1.d, z20.d, z30.d
7874 __ dci(0x04ee72d1); // sqdmulh z17.d, z22.d, z14.d
7876 __ dci(0x04ee7393); // sqdmulh z19.d, z28.d, z14.d
7878 __ dci(0x04ec73b2); // sqdmulh z18.d, z29.d, z12.d
7880 __ dci(0x04ee73fa); // sqdmulh z26.d, z31.d, z14.d
7882 __ dci(0x04ef77ea); // sqrdmulh z10.d, z31.d, z15.d
7884 __ dci(0x04ff76e8); // sqrdmulh z8.d, z23.d, z31.d
7886 __ dci(0x04fd76c9); // sqrdmulh z9.d, z22.d, z29.d
7888 __ dci(0x04fd73d9); // sqdmulh z25.d, z30.d, z29.d
7890 __ dci(0x04e973dd); // sqdmulh z29.d, z30.d, z9.d
7892 __ dci(0x04b973dc); // sqdmulh z28.s, z30.s, z25.s
7894 __ dci(0x04b177dd); // sqrdmulh z29.s, z30.s, z17.s
7896 __ dci(0x04b177bc); // sqrdmulh z28.s, z29.s, z17.s
7898 __ dci(0x04f377ac); // sqrdmulh z12.d, z29.d, z19.d
7900 __ dci(0x04f677ad); // sqrdmulh z13.d, z29.d, z22.d
7902 __ dci(0x04fe76af); // sqrdmulh z15.d, z21.d, z30.d
7904 __ dci(0x04ef76ae); // sqrdmulh z14.d, z21.d, z15.d
7906 __ dci(0x04ee72ac); // sqdmulh z12.d, z21.d, z14.d
7908 __ dci(0x04ae72ee); // sqdmulh z14.s, z23.s, z14.s
7910 __ dci(0x04be7266); // sqdmulh z6.s, z19.s, z30.s
7912 __ dci(0x04b67364); // sqdmulh z4.s, z27.s, z22.s
7914 __ dci(0x04b27165); // sqdmulh z5.s, z11.s, z18.s
7916 __ dci(0x04b27175); // sqdmulh z21.s, z11.s, z18.s
7918 __ dci(0x04ba7137); // sqdmulh z23.s, z9.s, z26.s
7920 __ dci(0x04b3713f); // sqdmulh z31.s, z9.s, z19.s
7922 __ dci(0x04b37017); // sqdmulh z23.s, z0.s, z19.s
7924 __ dci(0x04b37615); // sqrdmulh z21.s, z16.s, z19.s
7926 __ dci(0x04b37491); // sqrdmulh z17.s, z4.s, z19.s
7928 __ dci(0x04b37481); // sqrdmulh z1.s, z4.s, z19.s
7930 __ dci(0x04b37489); // sqrdmulh z9.s, z4.s, z19.s
7932 __ dci(0x04b5748d); // sqrdmulh z13.s, z4.s, z21.s
7934 __ dci(0x043d748f); // sqrdmulh z15.b, z4.b, z29.b
7940 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
7941 __ Ldr(w0, MemOperand(x0));
7980 __ dci(0x44e867e6); // cmla z6.s, z31.s, z8.s[0], #90
7982 __ dci(0x44e86de4); // cmla z4.s, z15.s, z8.s[0], #270
7984 __ dci(0x44e86be5); // cmla z5.s, z31.s, z8.s[0], #180
7986 __ dci(0x44eb6bf5); // cmla z21.s, z31.s, z11.s[0], #180
7988 __ dci(0x44eb6b31); // cmla z17.s, z25.s, z11.s[0], #180
7990 __ dci(0x44eb6135); // cmla z21.s, z9.s, z11.s[0], #0
7992 __ dci(0x44e9633d); // cmla z29.s, z25.s, z9.s[0], #0
7994 __ dci(0x44f96379); // cmla z25.s, z27.s, z9.s[1], #0
7996 __ dci(0x44fd6349); // cmla z9.s, z26.s, z13.s[1], #0
7998 __ dci(0x44f76341); // cmla z1.s, z26.s, z7.s[1], #0
8000 __ dci(0x44f36305); // cmla z5.s, z24.s, z3.s[1], #0
8002 __ dci(0x44f76381); // cmla z1.s, z28.s, z7.s[1], #0
8004 __ dci(0x44f763e3); // cmla z3.s, z31.s, z7.s[1], #0
8006 __ dci(0x44b763cb); // cmla z11.h, z30.h, z7.h[2], #0
8008 __ dci(0x44a763e9); // cmla z9.h, z31.h, z7.h[0], #0
8010 __ dci(0x44a762ab); // cmla z11.h, z21.h, z7.h[0], #0
8012 __ dci(0x44a66aaf); // cmla z15.h, z21.h, z6.h[0], #180
8014 __ dci(0x44a66aa7); // cmla z7.h, z21.h, z6.h[0], #180
8016 __ dci(0x44a663a5); // cmla z5.h, z29.h, z6.h[0], #0
8018 __ dci(0x44a66bed); // cmla z13.h, z31.h, z6.h[0], #180
8020 __ dci(0x44f66be9); // cmla z9.s, z31.s, z6.s[1], #180
8022 __ dci(0x44b66bd9); // cmla z25.h, z30.h, z6.h[2], #180
8024 __ dci(0x44b66bd8); // cmla z24.h, z30.h, z6.h[2], #180
8026 __ dci(0x44b66b7c); // cmla z28.h, z27.h, z6.h[2], #180
8028 __ dci(0x44b6617e); // cmla z30.h, z11.h, z6.h[2], #0
8030 __ dci(0x44b7697c); // cmla z28.h, z11.h, z7.h[2], #180
8032 __ dci(0x44b3692c); // cmla z12.h, z9.h, z3.h[2], #180
8034 __ dci(0x44a1692e); // cmla z14.h, z9.h, z1.h[0], #180
8036 __ dci(0x44b169af); // cmla z15.h, z13.h, z1.h[2], #180
8038 __ dci(0x44b165a7); // cmla z7.h, z13.h, z1.h[2], #90
8040 __ dci(0x44b165a5); // cmla z5.h, z13.h, z1.h[2], #90
8042 __ dci(0x44f161a1); // cmla z1.s, z13.s, z1.s[1], #0
8044 __ dci(0x44f261a0); // cmla z0.s, z13.s, z2.s[1], #0
8046 __ dci(0x44b361b0); // cmla z16.h, z13.h, z3.h[2], #0
8048 __ dci(0x44b36092); // cmla z18.h, z4.h, z3.h[2], #0
8050 __ dci(0x44b36202); // cmla z2.h, z16.h, z3.h[2], #0
8052 __ dci(0x44b36a20); // cmla z0.h, z17.h, z3.h[2], #180
8054 __ dci(0x44b26a10); // cmla z16.h, z16.h, z2.h[2], #180
8056 __ dci(0x44b26a18); // cmla z24.h, z16.h, z2.h[2], #180
8058 __ dci(0x44b06a28); // cmla z8.h, z17.h, z0.h[2], #180
8060 __ dci(0x44b06a2a); // cmla z10.h, z17.h, z0.h[2], #180
8062 __ dci(0x44b0620b); // cmla z11.h, z16.h, z0.h[2], #0
8064 __ dci(0x44b06209); // cmla z9.h, z16.h, z0.h[2], #0
8066 __ dci(0x44f06a0d); // cmla z13.s, z16.s, z0.s[1], #180
8068 __ dci(0x44f06b2c); // cmla z12.s, z25.s, z0.s[1], #180
8070 __ dci(0x44f1692d); // cmla z13.s, z9.s, z1.s[1], #180
8072 __ dci(0x44b36925); // cmla z5.h, z9.h, z3.h[2], #180
8074 __ dci(0x44b36921); // cmla z1.h, z9.h, z3.h[2], #180
8076 __ dci(0x44b36d69); // cmla z9.h, z11.h, z3.h[2], #270
8078 __ dci(0x44bb6d28); // cmla z8.h, z9.h, z3.h[3], #270
8084 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
8085 __ Ldr(w0, MemOperand(x0));
8124 __ dci(0x651cb31e); // flogb z30.s, p4/m, z24.s
8126 __ dci(0x651cb3ae); // flogb z14.s, p4/m, z29.s
8128 __ dci(0x651cb3be); // flogb z30.s, p4/m, z29.s
8130 __ dci(0x651ea3bc); // flogb z28.d, p0/m, z29.d
8132 __ dci(0x651ea3cc); // flogb z12.d, p0/m, z30.d
8134 __ dci(0x651ea3dc); // flogb z28.d, p0/m, z30.d
8136 __ dci(0x651ea3d4); // flogb z20.d, p0/m, z30.d
8138 __ dci(0x651ea3d5); // flogb z21.d, p0/m, z30.d
8140 __ dci(0x651ca394); // flogb z20.s, p0/m, z28.s
8142 __ dci(0x651ca396); // flogb z22.s, p0/m, z28.s
8144 __ dci(0x651ca1d7); // flogb z23.s, p0/m, z14.s
8146 __ dci(0x651ca947); // flogb z7.s, p2/m, z10.s
8148 __ dci(0x651ca805); // flogb z5.s, p2/m, z0.s
8150 __ dci(0x651ea841); // flogb z1.d, p2/m, z2.d
8152 __ dci(0x651ea843); // flogb z3.d, p2/m, z2.d
8154 __ dci(0x651caa4b); // flogb z11.s, p2/m, z18.s
8156 __ dci(0x651cab6f); // flogb z15.s, p2/m, z27.s
8158 __ dci(0x651ca86b); // flogb z11.s, p2/m, z3.s
8160 __ dci(0x651ca47b); // flogb z27.s, p1/m, z3.s
8162 __ dci(0x651ca47f); // flogb z31.s, p1/m, z3.s
8164 __ dci(0x651ca477); // flogb z23.s, p1/m, z3.s
8166 __ dci(0x651ca035); // flogb z21.s, p0/m, z1.s
8168 __ dci(0x651ca2a5); // flogb z5.s, p0/m, z21.s
8170 __ dci(0x651caa2d); // flogb z13.s, p2/m, z17.s
8172 __ dci(0x651caa3d); // flogb z29.s, p2/m, z17.s
8174 __ dci(0x651eaa7f); // flogb z31.d, p2/m, z19.d
8176 __ dci(0x651ebb7e); // flogb z30.d, p6/m, z27.d
8178 __ dci(0x651ebb76); // flogb z22.d, p6/m, z27.d
8180 __ dci(0x651ebb72); // flogb z18.d, p6/m, z27.d
8182 __ dci(0x651eb276); // flogb z22.d, p4/m, z19.d
8184 __ dci(0x651eb652); // flogb z18.d, p5/m, z18.d
8186 __ dci(0x651cbe42); // flogb z2.s, p7/m, z18.s
8188 __ dci(0x651cb852); // flogb z18.s, p6/m, z2.s
8190 __ dci(0x651eb956); // flogb z22.d, p6/m, z10.d
8192 __ dci(0x651eb11e); // flogb z30.d, p4/m, z8.d
8194 __ dci(0x651ab016); // flogb z22.h, p4/m, z0.h
8196 __ dci(0x651ab014); // flogb z20.h, p4/m, z0.h
8198 __ dci(0x651aa81c); // flogb z28.h, p2/m, z0.h
8200 __ dci(0x651aa80c); // flogb z12.h, p2/m, z0.h
8202 __ dci(0x651aa808); // flogb z8.h, p2/m, z0.h
8204 __ dci(0x651aa20a); // flogb z10.h, p0/m, z16.h
8206 __ dci(0x651ab24e); // flogb z14.h, p4/m, z18.h
8208 __ dci(0x651ab36f); // flogb z15.h, p4/m, z27.h
8210 __ dci(0x651ab36b); // flogb z11.h, p4/m, z27.h
8212 __ dci(0x651abb29); // flogb z9.h, p6/m, z25.h
8214 __ dci(0x651abb2d); // flogb z13.h, p6/m, z25.h
8216 __ dci(0x651aba0c); // flogb z12.h, p6/m, z16.h
8218 __ dci(0x651cba1c); // flogb z28.s, p6/m, z16.s
8220 __ dci(0x651cba1d); // flogb z29.s, p6/m, z16.s
8222 __ dci(0x651cba15); // flogb z21.s, p6/m, z16.s
8228 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
8229 __ Ldr(w0, MemOperand(x0));
8268 __ dci(0x64d591aa); // fminnmp z10.d, p4/m, z10.d, z13.d
8270 __ dci(0x64d59dab); // fminnmp z11.d, p7/m, z11.d, z13.d
8272 __ dci(0x64d59d7b); // fminnmp z27.d, p7/m, z27.d, z11.d
8274 __ dci(0x64d59c2b); // fminnmp z11.d, p7/m, z11.d, z1.d
8276 __ dci(0x64d59f23); // fminnmp z3.d, p7/m, z3.d, z25.d
8278 __ dci(0x64d59f22); // fminnmp z2.d, p7/m, z2.d, z25.d
8280 __ dci(0x64d49fa0); // fmaxnmp z0.d, p7/m, z0.d, z29.d
8282 __ dci(0x64d49fa8); // fmaxnmp z8.d, p7/m, z8.d, z29.d
8284 __ dci(0x64d49fa9); // fmaxnmp z9.d, p7/m, z9.d, z29.d
8286 __ dci(0x64d68fb9); // fmaxp z25.d, p3/m, z25.d, z29.d
8288 __ dci(0x64d68fb8); // fmaxp z24.d, p3/m, z24.d, z29.d
8290 __ dci(0x64d49fba); // fmaxnmp z26.d, p7/m, z26.d, z29.d
8292 __ dci(0x649497b2); // fmaxnmp z18.s, p5/m, z18.s, z29.s
8294 __ dci(0x649096b6); // faddp z22.s, p5/m, z22.s, z21.s
8296 __ dci(0x64909237); // faddp z23.s, p4/m, z23.s, z17.s
8298 __ dci(0x64d09027); // faddp z7.d, p4/m, z7.d, z1.d
8300 __ dci(0x64509006); // faddp z6.h, p4/m, z6.h, z0.h
8302 __ dci(0x64d0940e); // faddp z14.d, p5/m, z14.d, z0.d
8304 __ dci(0x64d09c4f); // faddp z15.d, p7/m, z15.d, z2.d
8306 __ dci(0x64d09c5f); // faddp z31.d, p7/m, z31.d, z2.d
8308 __ dci(0x64d09c57); // faddp z23.d, p7/m, z23.d, z2.d
8310 __ dci(0x64d09c56); // faddp z22.d, p7/m, z22.d, z2.d
8312 __ dci(0x64d08e5e); // faddp z30.d, p3/m, z30.d, z18.d
8314 __ dci(0x64d0845c); // faddp z28.d, p1/m, z28.d, z2.d
8316 __ dci(0x64d0845d); // faddp z29.d, p1/m, z29.d, z2.d
8318 __ dci(0x64d08e4d); // faddp z13.d, p3/m, z13.d, z18.d
8320 __ dci(0x64908645); // faddp z5.s, p1/m, z5.s, z18.s
8322 __ dci(0x64908a4d); // faddp z13.s, p2/m, z13.s, z18.s
8324 __ dci(0x64d08245); // faddp z5.d, p0/m, z5.d, z18.d
8326 __ dci(0x64909255); // faddp z21.s, p4/m, z21.s, z18.s
8328 __ dci(0x649096c5); // faddp z5.s, p5/m, z5.s, z22.s
8330 __ dci(0x649492c1); // fmaxnmp z1.s, p4/m, z1.s, z22.s
8332 __ dci(0x649096d1); // faddp z17.s, p5/m, z17.s, z22.s
8334 __ dci(0x649096d5); // faddp z21.s, p5/m, z21.s, z22.s
8336 __ dci(0x649096d4); // faddp z20.s, p5/m, z20.s, z22.s
8338 __ dci(0x649093d0); // faddp z16.s, p4/m, z16.s, z30.s
8340 __ dci(0x64909318); // faddp z24.s, p4/m, z24.s, z24.s
8342 __ dci(0x64909008); // faddp z8.s, p4/m, z8.s, z0.s
8344 __ dci(0x64969000); // fmaxp z0.s, p4/m, z0.s, z0.s
8346 __ dci(0x64569004); // fmaxp z4.h, p4/m, z4.h, z0.h
8348 __ dci(0x64569000); // fmaxp z0.h, p4/m, z0.h, z0.h
8350 __ dci(0x64569001); // fmaxp z1.h, p4/m, z1.h, z0.h
8352 __ dci(0x64569605); // fmaxp z5.h, p5/m, z5.h, z16.h
8354 __ dci(0x64579624); // fminp z4.h, p5/m, z4.h, z17.h
8356 __ dci(0x6457962c); // fminp z12.h, p5/m, z12.h, z17.h
8358 __ dci(0x64d5963c); // fminnmp z28.d, p5/m, z28.d, z17.d
8360 __ dci(0x64d7943e); // fminp z30.d, p5/m, z30.d, z1.d
8362 __ dci(0x6457953a); // fminp z26.h, p5/m, z26.h, z9.h
8364 __ dci(0x6457952a); // fminp z10.h, p5/m, z10.h, z9.h
8366 __ dci(0x64579d7a); // fminp z26.h, p7/m, z26.h, z11.h
8372 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
8373 __ Ldr(w0, MemOperand(x0));
8412 __ dci(0x64a94f15); // fmlalt z21.s, z24.h, z1.h[3]
8414 __ dci(0x64ab4f9d); // fmlalt z29.s, z28.h, z3.h[3]
8416 __ dci(0x64a74f9c); // fmlalt z28.s, z28.h, z7.h[1]
8418 __ dci(0x64a74dde); // fmlalt z30.s, z14.h, z7.h[1]
8420 __ dci(0x64a74cee); // fmlalt z14.s, z7.h, z7.h[1]
8422 __ dci(0x64a648ef); // fmlalb z15.s, z7.h, z6.h[1]
8424 __ dci(0x64a648ee); // fmlalb z14.s, z7.h, z6.h[1]
8426 __ dci(0x64b649ea); // fmlalb z10.s, z15.h, z6.h[5]
8428 __ dci(0x64b649ee); // fmlalb z14.s, z15.h, z6.h[5]
8430 __ dci(0x64b649e6); // fmlalb z6.s, z15.h, z6.h[5]
8432 __ dci(0x64b64ba2); // fmlalb z2.s, z29.h, z6.h[5]
8434 __ dci(0x64b46baa); // fmlslb z10.s, z29.h, z4.h[5]
8436 __ dci(0x64b46dab); // fmlslt z11.s, z13.h, z4.h[5]
8438 __ dci(0x64b467bb); // fmlslt z27.s, z29.h, z4.h[4]
8440 __ dci(0x64b665b3); // fmlslt z19.s, z13.h, z6.h[4]
8442 __ dci(0x64b663bb); // fmlslb z27.s, z29.h, z6.h[4]
8444 __ dci(0x64a662bf); // fmlslb z31.s, z21.h, z6.h[0]
8446 __ dci(0x64a7623e); // fmlslb z30.s, z17.h, z7.h[0]
8448 __ dci(0x64a7462e); // fmlalt z14.s, z17.h, z7.h[0]
8450 __ dci(0x64a6662f); // fmlslt z15.s, z17.h, z6.h[0]
8452 __ dci(0x64a666ed); // fmlslt z13.s, z23.h, z6.h[0]
8454 __ dci(0x64a26eec); // fmlslt z12.s, z23.h, z2.h[1]
8456 __ dci(0x64a26cbc); // fmlslt z28.s, z5.h, z2.h[1]
8458 __ dci(0x64a26cb4); // fmlslt z20.s, z5.h, z2.h[1]
8460 __ dci(0x64a26cbc); // fmlslt z28.s, z5.h, z2.h[1]
8462 __ dci(0x64a26cd8); // fmlslt z24.s, z6.h, z2.h[1]
8464 __ dci(0x64a26c1a); // fmlslt z26.s, z0.h, z2.h[1]
8466 __ dci(0x64a24d1e); // fmlalt z30.s, z8.h, z2.h[1]
8468 __ dci(0x64a24d1c); // fmlalt z28.s, z8.h, z2.h[1]
8470 __ dci(0x64a24d1e); // fmlalt z30.s, z8.h, z2.h[1]
8472 __ dci(0x64a0490e); // fmlalb z14.s, z8.h, z0.h[1]
8474 __ dci(0x64a0490c); // fmlalb z12.s, z8.h, z0.h[1]
8476 __ dci(0x64b04b04); // fmlalb z4.s, z24.h, z0.h[5]
8478 __ dci(0x64b04b06); // fmlalb z6.s, z24.h, z0.h[5]
8480 __ dci(0x64b04b07); // fmlalb z7.s, z24.h, z0.h[5]
8482 __ dci(0x64b84b26); // fmlalb z6.s, z25.h, z0.h[7]
8484 __ dci(0x64ba4f27); // fmlalt z7.s, z25.h, z2.h[7]
8486 __ dci(0x64ba4923); // fmlalb z3.s, z9.h, z2.h[7]
8488 __ dci(0x64b84d22); // fmlalt z2.s, z9.h, z0.h[7]
8490 __ dci(0x64b84d23); // fmlalt z3.s, z9.h, z0.h[7]
8492 __ dci(0x64bc4527); // fmlalt z7.s, z9.h, z4.h[6]
8494 __ dci(0x64bc6737); // fmlslt z23.s, z25.h, z4.h[6]
8496 __ dci(0x64bc6fa7); // fmlslt z7.s, z29.h, z4.h[7]
8498 __ dci(0x64bc6e25); // fmlslt z5.s, z17.h, z4.h[7]
8500 __ dci(0x64be6f2d); // fmlslt z13.s, z25.h, z6.h[7]
8502 __ dci(0x64be6765); // fmlslt z5.s, z27.h, z6.h[6]
8504 __ dci(0x64be662d); // fmlslt z13.s, z17.h, z6.h[6]
8506 __ dci(0x64bf6225); // fmlslb z5.s, z17.h, z7.h[6]
8508 __ dci(0x64bb626d); // fmlslb z13.s, z19.h, z3.h[6]
8510 __ dci(0x64b9622c); // fmlslb z12.s, z17.h, z1.h[6]
8516 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
8517 __ Ldr(w0, MemOperand(x0));
8556 __ dci(0x640ab3ee); // fcvtxnt z14.s, p4/m, z31.d
8558 __ dci(0x64caa9e0); // fcvtnt z0.s, p2/m, z15.d
8560 __ dci(0x64cab83d); // fcvtnt z29.s, p6/m, z1.d
8562 __ dci(0x650aad62); // fcvtx z2.s, p3/m, z11.d
8564 __ dci(0x64cbb42b); // fcvtlt z11.d, p5/m, z1.s
8566 __ dci(0x6488ba54); // fcvtnt z20.h, p6/m, z18.s
8568 __ dci(0x64cbb730); // fcvtlt z16.d, p5/m, z25.s
8570 __ dci(0x640aa5e4); // fcvtxnt z4.s, p1/m, z15.d
8572 __ dci(0x650aa715); // fcvtx z21.s, p1/m, z24.d
8574 __ dci(0x64cabe86); // fcvtnt z6.s, p7/m, z20.d
8576 __ dci(0x64cba075); // fcvtlt z21.d, p0/m, z3.s
8578 __ dci(0x6488b3c5); // fcvtnt z5.h, p4/m, z30.s
8580 __ dci(0x6489b24a); // fcvtlt z10.s, p4/m, z18.h
8582 __ dci(0x64cbb514); // fcvtlt z20.d, p5/m, z8.s
8584 __ dci(0x650ab090); // fcvtx z16.s, p4/m, z4.d
8586 __ dci(0x64cbb2d3); // fcvtlt z19.d, p4/m, z22.s
8588 __ dci(0x64cbb093); // fcvtlt z19.d, p4/m, z4.s
8590 __ dci(0x6488b9b8); // fcvtnt z24.h, p6/m, z13.s
8592 __ dci(0x650aa64d); // fcvtx z13.s, p1/m, z18.d
8594 __ dci(0x6488b2d7); // fcvtnt z23.h, p4/m, z22.s
8596 __ dci(0x650ab36d); // fcvtx z13.s, p4/m, z27.d
8598 __ dci(0x650aba2c); // fcvtx z12.s, p6/m, z17.d
8600 __ dci(0x650aa377); // fcvtx z23.s, p0/m, z27.d
8602 __ dci(0x6489a3a5); // fcvtlt z5.s, p0/m, z29.h
8604 __ dci(0x64cabeb9); // fcvtnt z25.s, p7/m, z21.d
8606 __ dci(0x6489b4c2); // fcvtlt z2.s, p5/m, z6.h
8608 __ dci(0x64cba246); // fcvtlt z6.d, p0/m, z18.s
8610 __ dci(0x650ab2a6); // fcvtx z6.s, p4/m, z21.d
8612 __ dci(0x64cbb239); // fcvtlt z25.d, p4/m, z17.s
8614 __ dci(0x64cabdd9); // fcvtnt z25.s, p7/m, z14.d
8616 __ dci(0x650ab75a); // fcvtx z26.s, p5/m, z26.d
8618 __ dci(0x650aa08b); // fcvtx z11.s, p0/m, z4.d
8620 __ dci(0x640aafd3); // fcvtxnt z19.s, p3/m, z30.d
8622 __ dci(0x64caaf3a); // fcvtnt z26.s, p3/m, z25.d
8624 __ dci(0x640abda1); // fcvtxnt z1.s, p7/m, z13.d
8626 __ dci(0x6489a6f9); // fcvtlt z25.s, p1/m, z23.h
8628 __ dci(0x6489b38d); // fcvtlt z13.s, p4/m, z28.h
8630 __ dci(0x650aaf63); // fcvtx z3.s, p3/m, z27.d
8632 __ dci(0x6488bfa4); // fcvtnt z4.h, p7/m, z29.s
8634 __ dci(0x6489a6ee); // fcvtlt z14.s, p1/m, z23.h
8636 __ dci(0x64cabbf8); // fcvtnt z24.s, p6/m, z31.d
8638 __ dci(0x6489bc7f); // fcvtlt z31.s, p7/m, z3.h
8640 __ dci(0x64caaf1f); // fcvtnt z31.s, p3/m, z24.d
8642 __ dci(0x650aac71); // fcvtx z17.s, p3/m, z3.d
8644 __ dci(0x650aa1df); // fcvtx z31.s, p0/m, z14.d
8646 __ dci(0x650aaf9f); // fcvtx z31.s, p3/m, z28.d
8648 __ dci(0x640abff9); // fcvtxnt z25.s, p7/m, z31.d
8650 __ dci(0x6489b8e5); // fcvtlt z5.s, p6/m, z7.h
8652 __ dci(0x640aa1a1); // fcvtxnt z1.s, p0/m, z13.d
8654 __ dci(0x6488bf41); // fcvtnt z1.h, p7/m, z26.s
8660 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
8661 __ Ldr(w0, MemOperand(x0));
8700 __ dci(0x442b1100); // sqrdmlah z0.h, z8.h, z3.h[1]
8702 __ dci(0x44211108); // sqrdmlah z8.h, z8.h, z1.h[0]
8704 __ dci(0x4421110c); // sqrdmlah z12.h, z8.h, z1.h[0]
8706 __ dci(0x44291188); // sqrdmlah z8.h, z12.h, z1.h[1]
8708 __ dci(0x442811a9); // sqrdmlah z9.h, z13.h, z0.h[1]
8710 __ dci(0x442c11eb); // sqrdmlah z11.h, z15.h, z4.h[1]
8712 __ dci(0x442c11e3); // sqrdmlah z3.h, z15.h, z4.h[1]
8714 __ dci(0x442413e1); // sqrdmlah z1.h, z31.h, z4.h[0]
8716 __ dci(0x44a413a0); // sqrdmlah z0.s, z29.s, z4.s[0]
8718 __ dci(0x44241321); // sqrdmlah z1.h, z25.h, z4.h[0]
8720 __ dci(0x44a413a5); // sqrdmlah z5.s, z29.s, z4.s[0]
8722 __ dci(0x44e41327); // sqrdmlah z7.d, z25.d, z4.d[0]
8724 __ dci(0x44e4132f); // sqrdmlah z15.d, z25.d, z4.d[0]
8726 __ dci(0x44e5130b); // sqrdmlah z11.d, z24.d, z5.d[0]
8728 __ dci(0x44e3130a); // sqrdmlah z10.d, z24.d, z3.d[0]
8730 __ dci(0x44e3131a); // sqrdmlah z26.d, z24.d, z3.d[0]
8732 __ dci(0x4463135e); // sqrdmlah z30.h, z26.h, z3.h[4]
8734 __ dci(0x44e7135c); // sqrdmlah z28.d, z26.d, z7.d[0]
8736 __ dci(0x44e7134c); // sqrdmlah z12.d, z26.d, z7.d[0]
8738 __ dci(0x44e51144); // sqrdmlah z4.d, z10.d, z5.d[0]
8740 __ dci(0x44e411c0); // sqrdmlah z0.d, z14.d, z4.d[0]
8742 __ dci(0x44ec15c4); // sqrdmlsh z4.d, z14.d, z12.d[0]
8744 __ dci(0x44ec14e0); // sqrdmlsh z0.d, z7.d, z12.d[0]
8746 __ dci(0x44ee16f0); // sqrdmlsh z16.d, z23.d, z14.d[0]
8748 __ dci(0x44ea16d4); // sqrdmlsh z20.d, z22.d, z10.d[0]
8750 __ dci(0x44ea16d0); // sqrdmlsh z16.d, z22.d, z10.d[0]
8752 __ dci(0x44ea16d1); // sqrdmlsh z17.d, z22.d, z10.d[0]
8754 __ dci(0x44ab16d3); // sqrdmlsh z19.s, z22.s, z3.s[1]
8756 __ dci(0x44aa17d1); // sqrdmlsh z17.s, z30.s, z2.s[1]
8758 __ dci(0x44aa1650); // sqrdmlsh z16.s, z18.s, z2.s[1]
8760 __ dci(0x44aa1632); // sqrdmlsh z18.s, z17.s, z2.s[1]
8762 __ dci(0x44aa1710); // sqrdmlsh z16.s, z24.s, z2.s[1]
8764 __ dci(0x44aa1711); // sqrdmlsh z17.s, z24.s, z2.s[1]
8766 __ dci(0x44a91715); // sqrdmlsh z21.s, z24.s, z1.s[1]
8768 __ dci(0x44a91697); // sqrdmlsh z23.s, z20.s, z1.s[1]
8770 __ dci(0x44a91696); // sqrdmlsh z22.s, z20.s, z1.s[1]
8772 __ dci(0x44a816de); // sqrdmlsh z30.s, z22.s, z0.s[1]
8774 __ dci(0x44ab16dc); // sqrdmlsh z28.s, z22.s, z3.s[1]
8776 __ dci(0x44af165d); // sqrdmlsh z29.s, z18.s, z7.s[1]
8778 __ dci(0x44af16f5); // sqrdmlsh z21.s, z23.s, z7.s[1]
8784 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
8785 __ Ldr(w0, MemOperand(x0));
8824 __ dci(0x447bf609); // sqrdmulh z9.h, z16.h, z3.h[7]
8826 __ dci(0x447bf601); // sqrdmulh z1.h, z16.h, z3.h[7]
8828 __ dci(0x447bf600); // sqrdmulh z0.h, z16.h, z3.h[7]
8830 __ dci(0x446bf710); // sqrdmulh z16.h, z24.h, z3.h[5]
8832 __ dci(0x446af612); // sqrdmulh z18.h, z16.h, z2.h[5]
8834 __ dci(0x442af636); // sqrdmulh z22.h, z17.h, z2.h[1]
8836 __ dci(0x442af626); // sqrdmulh z6.h, z17.h, z2.h[1]
8838 __ dci(0x442af624); // sqrdmulh z4.h, z17.h, z2.h[1]
8840 __ dci(0x4420f625); // sqrdmulh z5.h, z17.h, z0.h[0]
8842 __ dci(0x4460f604); // sqrdmulh z4.h, z16.h, z0.h[4]
8844 __ dci(0x4460f605); // sqrdmulh z5.h, z16.h, z0.h[4]
8846 __ dci(0x4420f641); // sqrdmulh z1.h, z18.h, z0.h[0]
8848 __ dci(0x4424f669); // sqrdmulh z9.h, z19.h, z4.h[0]
8850 __ dci(0x4460f668); // sqrdmulh z8.h, z19.h, z0.h[4]
8852 __ dci(0x4462f6f8); // sqrdmulh z24.h, z23.h, z2.h[4]
8854 __ dci(0x4462f6f0); // sqrdmulh z16.h, z23.h, z2.h[4]
8856 __ dci(0x4472f6d1); // sqrdmulh z17.h, z22.h, z2.h[6]
8858 __ dci(0x4472f250); // sqdmulh z16.h, z18.h, z2.h[6]
8860 __ dci(0x44b2f254); // sqdmulh z20.s, z18.s, z2.s[2]
8862 __ dci(0x44e2f250); // sqdmulh z16.d, z18.d, z2.d[0]
8864 __ dci(0x44e4f251); // sqdmulh z17.d, z18.d, z4.d[0]
8866 __ dci(0x44e0f650); // sqrdmulh z16.d, z18.d, z0.d[0]
8868 __ dci(0x44f8f640); // sqrdmulh z0.d, z18.d, z8.d[1]
8870 __ dci(0x44f9f742); // sqrdmulh z2.d, z26.d, z9.d[1]
8872 __ dci(0x44f9f7e6); // sqrdmulh z6.d, z31.d, z9.d[1]
8874 __ dci(0x44fdf7ae); // sqrdmulh z14.d, z29.d, z13.d[1]
8876 __ dci(0x44fdf7af); // sqrdmulh z15.d, z29.d, z13.d[1]
8878 __ dci(0x44f9f7ed); // sqrdmulh z13.d, z31.d, z9.d[1]
8880 __ dci(0x44f9f7e5); // sqrdmulh z5.d, z31.d, z9.d[1]
8882 __ dci(0x44f5f7e4); // sqrdmulh z4.d, z31.d, z5.d[1]
8884 __ dci(0x44e5f3e0); // sqdmulh z0.d, z31.d, z5.d[0]
8886 __ dci(0x44e4f364); // sqdmulh z4.d, z27.d, z4.d[0]
8888 __ dci(0x44edf366); // sqdmulh z6.d, z27.d, z13.d[0]
8890 __ dci(0x44adf322); // sqdmulh z2.s, z25.s, z5.s[1]
8892 __ dci(0x44adf263); // sqdmulh z3.s, z19.s, z5.s[1]
8894 __ dci(0x44bdf22b); // sqdmulh z11.s, z17.s, z5.s[3]
8896 __ dci(0x44adf62a); // sqrdmulh z10.s, z17.s, z5.s[1]
8898 __ dci(0x44adf622); // sqrdmulh z2.s, z17.s, z5.s[1]
8900 __ dci(0x44abf632); // sqrdmulh z18.s, z17.s, z3.s[1]
8902 __ dci(0x44a9f6ba); // sqrdmulh z26.s, z21.s, z1.s[1]
8904 __ dci(0x44a9f6aa); // sqrdmulh z10.s, z21.s, z1.s[1]
8906 __ dci(0x44b1f6ab); // sqrdmulh z11.s, z21.s, z1.s[2]
8908 __ dci(0x44b1f0bb); // sqdmulh z27.s, z5.s, z1.s[2]
8910 __ dci(0x4439f0bf); // sqdmulh z31.h, z5.h, z1.h[3]
8912 __ dci(0x4433f0be); // sqdmulh z30.h, z5.h, z3.h[2]
8914 __ dci(0x4433f0d6); // sqdmulh z22.h, z6.h, z3.h[2]
8916 __ dci(0x4437f2d7); // sqdmulh z23.h, z22.h, z7.h[2]
8918 __ dci(0x4426f2d6); // sqdmulh z22.h, z22.h, z6.h[0]
8920 __ dci(0x44a6f0de); // sqdmulh z30.s, z6.s, z6.s[0]
8922 __ dci(0x44a4f04e); // sqdmulh z14.s, z2.s, z4.s[0]
8928 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
8929 __ Ldr(w0, MemOperand(x0));
8968 __ dci(0x056a1008); // ext z8.b, {z0.b, z1.b}, #84
8970 __ dci(0x05601418); // ext z24.b, {z0.b, z1.b}, #5
8972 __ dci(0x05601708); // ext z8.b, {z24.b, z25.b}, #5
8974 __ dci(0x05601d0c); // ext z12.b, {z8.b, z9.b}, #7
8976 __ dci(0x05600c1c); // ext z28.b, {z0.b, z1.b}, #3
8978 __ dci(0x05600c58); // ext z24.b, {z2.b, z3.b}, #3
8980 __ dci(0x05600410); // ext z16.b, {z0.b, z1.b}, #1
8982 __ dci(0x05600438); // ext z24.b, {z1.b, z2.b}, #1
8984 __ dci(0x0560067a); // ext z26.b, {z19.b, z20.b}, #1
8986 __ dci(0x05601478); // ext z24.b, {z3.b, z4.b}, #5
8988 __ dci(0x0560117c); // ext z28.b, {z11.b, z12.b}, #4
8990 __ dci(0x0560157e); // ext z30.b, {z11.b, z12.b}, #5
8992 __ dci(0x05601c7a); // ext z26.b, {z3.b, z4.b}, #7
8994 __ dci(0x0560187e); // ext z30.b, {z3.b, z4.b}, #6
8996 __ dci(0x05601876); // ext z22.b, {z3.b, z4.b}, #6
8998 __ dci(0x05601c26); // ext z6.b, {z1.b, z2.b}, #7
9000 __ dci(0x05601c2e); // ext z14.b, {z1.b, z2.b}, #7
9002 __ dci(0x05601d3e); // ext z30.b, {z9.b, z10.b}, #7
9004 __ dci(0x05601dae); // ext z14.b, {z13.b, z14.b}, #7
9006 __ dci(0x056015ef); // ext z15.b, {z15.b, z16.b}, #5
9008 __ dci(0x0560157f); // ext z31.b, {z11.b, z12.b}, #5
9010 __ dci(0x0560157e); // ext z30.b, {z11.b, z12.b}, #5
9012 __ dci(0x0560156e); // ext z14.b, {z11.b, z12.b}, #5
9014 __ dci(0x05601566); // ext z6.b, {z11.b, z12.b}, #5
9016 __ dci(0x056017e4); // ext z4.b, {z31.b, z0.b}, #5
9018 __ dci(0x05601f74); // ext z20.b, {z27.b, z28.b}, #7
9020 __ dci(0x05601f44); // ext z4.b, {z26.b, z27.b}, #7
9022 __ dci(0x05601e45); // ext z5.b, {z18.b, z19.b}, #7
9024 __ dci(0x05601255); // ext z21.b, {z18.b, z19.b}, #4
9026 __ dci(0x05701a51); // ext z17.b, {z18.b, z19.b}, #134
9028 __ dci(0x05701ad3); // ext z19.b, {z22.b, z23.b}, #134
9030 __ dci(0x05701ad1); // ext z17.b, {z22.b, z23.b}, #134
9032 __ dci(0x05701b41); // ext z1.b, {z26.b, z27.b}, #134
9034 __ dci(0x05701b40); // ext z0.b, {z26.b, z27.b}, #134
9036 __ dci(0x05701bd0); // ext z16.b, {z30.b, z31.b}, #134
9038 __ dci(0x057013d8); // ext z24.b, {z30.b, z31.b}, #132
9040 __ dci(0x05701259); // ext z25.b, {z18.b, z19.b}, #132
9042 __ dci(0x0570125d); // ext z29.b, {z18.b, z19.b}, #132
9044 __ dci(0x05700215); // ext z21.b, {z16.b, z17.b}, #128
9046 __ dci(0x0560021d); // ext z29.b, {z16.b, z17.b}, #0
9048 __ dci(0x0570121c); // ext z28.b, {z16.b, z17.b}, #132
9050 __ dci(0x0570030c); // ext z12.b, {z24.b, z25.b}, #128
9052 __ dci(0x05700b88); // ext z8.b, {z28.b, z29.b}, #130
9054 __ dci(0x05600b0c); // ext z12.b, {z24.b, z25.b}, #2
9056 __ dci(0x05600f1c); // ext z28.b, {z24.b, z25.b}, #3
9058 __ dci(0x05600e14); // ext z20.b, {z16.b, z17.b}, #3
9060 __ dci(0x05600604); // ext z4.b, {z16.b, z17.b}, #1
9062 __ dci(0x05600406); // ext z6.b, {z0.b, z1.b}, #1
9064 __ dci(0x05600056); // ext z22.b, {z2.b, z3.b}, #0
9066 __ dci(0x05600052); // ext z18.b, {z2.b, z3.b}, #0
9068 __ dci(0x056000d6); // ext z22.b, {z6.b, z7.b}, #0
9070 __ dci(0x057008de); // ext z30.b, {z6.b, z7.b}, #130
9072 __ dci(0x0570085a); // ext z26.b, {z2.b, z3.b}, #130
9074 __ dci(0x057009d2); // ext z18.b, {z14.b, z15.b}, #130
9076 __ dci(0x057008fa); // ext z26.b, {z7.b, z8.b}, #130
9078 __ dci(0x057008f2); // ext z18.b, {z7.b, z8.b}, #130
9080 __ dci(0x057002f3); // ext z19.b, {z23.b, z24.b}, #128
9082 __ dci(0x057006a3); // ext z3.b, {z21.b, z22.b}, #129
9084 __ dci(0x05700687); // ext z7.b, {z20.b, z21.b}, #129
9086 __ dci(0x056006b7); // ext z23.b, {z21.b, z22.b}, #1
9092 __ Mov(x0, reinterpret_cast<uint64_t>(&state));
9093 __ Ldr(w0, MemOperand(x0));