/*------------------------------------------------------------------------- * Vulkan Conformance Tests * ------------------------ * * Copyright (c) 2015 Google Inc. * Copyright (c) 2016 The Khronos Group Inc. * * Licensed under the Apache License, Version 2.0 (the "License"); * you may not use this file except in compliance with the License. * You may obtain a copy of the License at * * http://www.apache.org/licenses/LICENSE-2.0 * * Unless required by applicable law or agreed to in writing, software * distributed under the License is distributed on an "AS IS" BASIS, * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. * See the License for the specific language governing permissions and * limitations under the License. * *//*! * \file * \brief SPIR-V Assembly Tests for Instructions (special opcode/operand) *//*--------------------------------------------------------------------*/ #include "vktSpvAsmInstructionTests.hpp" #include "vktAmberTestCase.hpp" #include "tcuCommandLine.hpp" #include "tcuFormatUtil.hpp" #include "tcuFloat.hpp" #include "tcuFloatFormat.hpp" #include "tcuRGBA.hpp" #include "tcuStringTemplate.hpp" #include "tcuTestLog.hpp" #include "tcuVectorUtil.hpp" #include "tcuInterval.hpp" #include "vkDefs.hpp" #include "vkDeviceUtil.hpp" #include "vkMemUtil.hpp" #include "vkPlatform.hpp" #include "vkPrograms.hpp" #include "vkQueryUtil.hpp" #include "vkRef.hpp" #include "vkRefUtil.hpp" #include "vkStrUtil.hpp" #include "vkTypeUtil.hpp" #include "deStringUtil.hpp" #include "deUniquePtr.hpp" #include "deMath.h" #include "deRandom.hpp" #include "tcuStringTemplate.hpp" #include "vktSpvAsmCrossStageInterfaceTests.hpp" #include "vktSpvAsm8bitStorageTests.hpp" #include "vktSpvAsm16bitStorageTests.hpp" #include "vktSpvAsmUboMatrixPaddingTests.hpp" #include "vktSpvAsmConditionalBranchTests.hpp" #include "vktSpvAsmIndexingTests.hpp" #include "vktSpvAsmImageSamplerTests.hpp" #include "vktSpvAsmComputeShaderCase.hpp" #include "vktSpvAsmComputeShaderTestUtil.hpp" #include "vktSpvAsmFloatControlsTests.hpp" #include "vktSpvAsmFromHlslTests.hpp" #include "vktSpvAsmEmptyStructTests.hpp" #include "vktSpvAsmGraphicsShaderTestUtil.hpp" #include "vktSpvAsmVariablePointersTests.hpp" #include "vktSpvAsmVariableInitTests.hpp" #include "vktSpvAsmPointerParameterTests.hpp" #include "vktSpvAsmSpirvVersion1p4Tests.hpp" #include "vktSpvAsmSpirvVersionTests.hpp" #include "vktTestCaseUtil.hpp" #include "vktSpvAsmLoopDepLenTests.hpp" #include "vktSpvAsmLoopDepInfTests.hpp" #include "vktSpvAsmCompositeInsertTests.hpp" #include "vktSpvAsmVaryingNameTests.hpp" #include "vktSpvAsmWorkgroupMemoryTests.hpp" #include "vktSpvAsmSignedIntCompareTests.hpp" #include "vktSpvAsmSignedOpTests.hpp" #include "vktSpvAsmPtrAccessChainTests.hpp" #include "vktSpvAsmVectorShuffleTests.hpp" #include "vktSpvAsmFloatControlsExtensionlessTests.hpp" #include "vktSpvAsmNonSemanticInfoTests.hpp" #include "vktSpvAsm64bitCompareTests.hpp" #include "vktSpvAsmTrinaryMinMaxTests.hpp" #include "vktSpvAsmTerminateInvocationTests.hpp" #ifndef CTS_USES_VULKANSC #include "vktSpvAsmIntegerDotProductTests.hpp" #endif // CTS_USES_VULKANSC #include "vktSpvAsmPhysicalStorageBufferPointerTests.hpp" #include #include #include #include #include #include #include #include namespace vkt { namespace SpirVAssembly { namespace { using namespace vk; using std::map; using std::string; using std::vector; using tcu::IVec3; using tcu::IVec4; using tcu::RGBA; using tcu::TestLog; using tcu::TestStatus; using tcu::Vec4; using de::UniquePtr; using tcu::StringTemplate; using tcu::Vec4; const bool TEST_WITH_NAN = true; const bool TEST_WITHOUT_NAN = false; const string loadScalarF16FromUint = "%ld_arg_${var} = OpFunction %f16 None %f16_i32_fn\n" "%ld_arg_${var}_param = OpFunctionParameter %i32\n" "%ld_arg_${var}_entry = OpLabel\n" "%ld_arg_${var}_conv = OpBitcast %u32 %ld_arg_${var}_param\n" "%ld_arg_${var}_div = OpUDiv %u32 %ld_arg_${var}_conv %c_u32_2\n" "%ld_arg_${var}_and_low = OpBitwiseAnd %u32 %ld_arg_${var}_param %c_u32_1\n" "%ld_arg_${var}_gep = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_div\n" "%ld_arg_${var}_ld = OpLoad %u32 %ld_arg_${var}_gep\n" "%ld_arg_${var}_unpack = OpBitcast %v2f16 %ld_arg_${var}_ld\n" "%ld_arg_${var}_ex = OpVectorExtractDynamic %f16 %ld_arg_${var}_unpack %ld_arg_${var}_and_low\n" "OpReturnValue %ld_arg_${var}_ex\n" "OpFunctionEnd\n"; const string loadV2F16FromUint = "%ld_arg_${var} = OpFunction %v2f16 None %v2f16_i32_fn\n" "%ld_arg_${var}_param = OpFunctionParameter %i32\n" "%ld_arg_${var}_entry = OpLabel\n" "%ld_arg_${var}_gep = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param\n" "%ld_arg_${var}_ld = OpLoad %u32 %ld_arg_${var}_gep\n" "%ld_arg_${var}_cast = OpBitcast %v2f16 %ld_arg_${var}_ld\n" "OpReturnValue %ld_arg_${var}_cast\n" "OpFunctionEnd\n"; const string loadV3F16FromUints = // Since we allocate a vec4 worth of values, this case is almost the // same as that case. "%ld_arg_${var} = OpFunction %v3f16 None %v3f16_i32_fn\n" "%ld_arg_${var}_param = OpFunctionParameter %i32\n" "%ld_arg_${var}_entry = OpLabel\n" "%ld_arg_${var}_gep0 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_0\n" "%ld_arg_${var}_ld0 = OpLoad %u32 %ld_arg_${var}_gep0\n" "%ld_arg_${var}_bc0 = OpBitcast %v2f16 %ld_arg_${var}_ld0\n" "%ld_arg_${var}_gep1 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_1\n" "%ld_arg_${var}_ld1 = OpLoad %u32 %ld_arg_${var}_gep1\n" "%ld_arg_${var}_bc1 = OpBitcast %v2f16 %ld_arg_${var}_ld1\n" "%ld_arg_${var}_shuffle = OpVectorShuffle %v3f16 %ld_arg_${var}_bc0 %ld_arg_${var}_bc1 0 1 2\n" "OpReturnValue %ld_arg_${var}_shuffle\n" "OpFunctionEnd\n"; const string loadV4F16FromUints = "%ld_arg_${var} = OpFunction %v4f16 None %v4f16_i32_fn\n" "%ld_arg_${var}_param = OpFunctionParameter %i32\n" "%ld_arg_${var}_entry = OpLabel\n" "%ld_arg_${var}_gep0 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_0\n" "%ld_arg_${var}_ld0 = OpLoad %u32 %ld_arg_${var}_gep0\n" "%ld_arg_${var}_bc0 = OpBitcast %v2f16 %ld_arg_${var}_ld0\n" "%ld_arg_${var}_gep1 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_1\n" "%ld_arg_${var}_ld1 = OpLoad %u32 %ld_arg_${var}_gep1\n" "%ld_arg_${var}_bc1 = OpBitcast %v2f16 %ld_arg_${var}_ld1\n" "%ld_arg_${var}_shuffle = OpVectorShuffle %v4f16 %ld_arg_${var}_bc0 %ld_arg_${var}_bc1 0 1 2 3\n" "OpReturnValue %ld_arg_${var}_shuffle\n" "OpFunctionEnd\n"; const string loadM2x2F16FromUints = "%ld_arg_${var} = OpFunction %m2x2f16 None %m2x2f16_i32_fn\n" "%ld_arg_${var}_param = OpFunctionParameter %i32\n" "%ld_arg_${var}_entry = OpLabel\n" "%ld_arg_${var}_gep0 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_0\n" "%ld_arg_${var}_ld0 = OpLoad %u32 %ld_arg_${var}_gep0\n" "%ld_arg_${var}_bc0 = OpBitcast %v2f16 %ld_arg_${var}_ld0\n" "%ld_arg_${var}_gep1 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_1\n" "%ld_arg_${var}_ld1 = OpLoad %u32 %ld_arg_${var}_gep1\n" "%ld_arg_${var}_bc1 = OpBitcast %v2f16 %ld_arg_${var}_ld1\n" "%ld_arg_${var}_cons = OpCompositeConstruct %m2x2f16 %ld_arg_${var}_bc0 %ld_arg_${var}_bc1\n" "OpReturnValue %ld_arg_${var}_cons\n" "OpFunctionEnd\n"; const string loadM2x3F16FromUints = "%ld_arg_${var} = OpFunction %m2x3f16 None %m2x3f16_i32_fn\n" "%ld_arg_${var}_param = OpFunctionParameter %i32\n" "%ld_arg_${var}_entry = OpLabel\n" "%ld_arg_${var}_gep00 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_0\n" "%ld_arg_${var}_gep01 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_1\n" "%ld_arg_${var}_gep10 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_2\n" "%ld_arg_${var}_gep11 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_3\n" "%ld_arg_${var}_ld00 = OpLoad %u32 %ld_arg_${var}_gep00\n" "%ld_arg_${var}_ld01 = OpLoad %u32 %ld_arg_${var}_gep01\n" "%ld_arg_${var}_ld10 = OpLoad %u32 %ld_arg_${var}_gep10\n" "%ld_arg_${var}_ld11 = OpLoad %u32 %ld_arg_${var}_gep11\n" "%ld_arg_${var}_bc00 = OpBitcast %v2f16 %ld_arg_${var}_ld00\n" "%ld_arg_${var}_bc01 = OpBitcast %v2f16 %ld_arg_${var}_ld01\n" "%ld_arg_${var}_bc10 = OpBitcast %v2f16 %ld_arg_${var}_ld10\n" "%ld_arg_${var}_bc11 = OpBitcast %v2f16 %ld_arg_${var}_ld11\n" "%ld_arg_${var}_vec0 = OpVectorShuffle %v3f16 %ld_arg_${var}_bc00 %ld_arg_${var}_bc01 0 1 2\n" "%ld_arg_${var}_vec1 = OpVectorShuffle %v3f16 %ld_arg_${var}_bc10 %ld_arg_${var}_bc11 0 1 2\n" "%ld_arg_${var}_mat = OpCompositeConstruct %m2x3f16 %ld_arg_${var}_vec0 %ld_arg_${var}_vec1\n" "OpReturnValue %ld_arg_${var}_mat\n" "OpFunctionEnd\n"; const string loadM2x4F16FromUints = "%ld_arg_${var} = OpFunction %m2x4f16 None %m2x4f16_i32_fn\n" "%ld_arg_${var}_param = OpFunctionParameter %i32\n" "%ld_arg_${var}_entry = OpLabel\n" "%ld_arg_${var}_gep00 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_0\n" "%ld_arg_${var}_gep01 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_1\n" "%ld_arg_${var}_gep10 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_2\n" "%ld_arg_${var}_gep11 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_3\n" "%ld_arg_${var}_ld00 = OpLoad %u32 %ld_arg_${var}_gep00\n" "%ld_arg_${var}_ld01 = OpLoad %u32 %ld_arg_${var}_gep01\n" "%ld_arg_${var}_ld10 = OpLoad %u32 %ld_arg_${var}_gep10\n" "%ld_arg_${var}_ld11 = OpLoad %u32 %ld_arg_${var}_gep11\n" "%ld_arg_${var}_bc00 = OpBitcast %v2f16 %ld_arg_${var}_ld00\n" "%ld_arg_${var}_bc01 = OpBitcast %v2f16 %ld_arg_${var}_ld01\n" "%ld_arg_${var}_bc10 = OpBitcast %v2f16 %ld_arg_${var}_ld10\n" "%ld_arg_${var}_bc11 = OpBitcast %v2f16 %ld_arg_${var}_ld11\n" "%ld_arg_${var}_vec0 = OpVectorShuffle %v4f16 %ld_arg_${var}_bc00 %ld_arg_${var}_bc01 0 1 2 3\n" "%ld_arg_${var}_vec1 = OpVectorShuffle %v4f16 %ld_arg_${var}_bc10 %ld_arg_${var}_bc11 0 1 2 3\n" "%ld_arg_${var}_mat = OpCompositeConstruct %m2x4f16 %ld_arg_${var}_vec0 %ld_arg_${var}_vec1\n" "OpReturnValue %ld_arg_${var}_mat\n" "OpFunctionEnd\n"; const string loadM3x2F16FromUints = "%ld_arg_${var} = OpFunction %m3x2f16 None %m3x2f16_i32_fn\n" "%ld_arg_${var}_param = OpFunctionParameter %i32\n" "%ld_arg_${var}_entry = OpLabel\n" "%ld_arg_${var}_gep0 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_0\n" "%ld_arg_${var}_gep1 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_1\n" "%ld_arg_${var}_gep2 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_2\n" "%ld_arg_${var}_ld0 = OpLoad %u32 %ld_arg_${var}_gep0\n" "%ld_arg_${var}_ld1 = OpLoad %u32 %ld_arg_${var}_gep1\n" "%ld_arg_${var}_ld2 = OpLoad %u32 %ld_arg_${var}_gep2\n" "%ld_arg_${var}_bc0 = OpBitcast %v2f16 %ld_arg_${var}_ld0\n" "%ld_arg_${var}_bc1 = OpBitcast %v2f16 %ld_arg_${var}_ld1\n" "%ld_arg_${var}_bc2 = OpBitcast %v2f16 %ld_arg_${var}_ld2\n" "%ld_arg_${var}_mat = OpCompositeConstruct %m3x2f16 %ld_arg_${var}_bc0 %ld_arg_${var}_bc1 %ld_arg_${var}_bc2\n" "OpReturnValue %ld_arg_${var}_mat\n" "OpFunctionEnd\n"; const string loadM3x3F16FromUints = "%ld_arg_${var} = OpFunction %m3x3f16 None %m3x3f16_i32_fn\n" "%ld_arg_${var}_param = OpFunctionParameter %i32\n" "%ld_arg_${var}_entry = OpLabel\n" "%ld_arg_${var}_gep00 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_0\n" "%ld_arg_${var}_gep01 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_1\n" "%ld_arg_${var}_gep10 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_2\n" "%ld_arg_${var}_gep11 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_3\n" "%ld_arg_${var}_gep20 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_4\n" "%ld_arg_${var}_gep21 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_5\n" "%ld_arg_${var}_ld00 = OpLoad %u32 %ld_arg_${var}_gep00\n" "%ld_arg_${var}_ld01 = OpLoad %u32 %ld_arg_${var}_gep01\n" "%ld_arg_${var}_ld10 = OpLoad %u32 %ld_arg_${var}_gep10\n" "%ld_arg_${var}_ld11 = OpLoad %u32 %ld_arg_${var}_gep11\n" "%ld_arg_${var}_ld20 = OpLoad %u32 %ld_arg_${var}_gep20\n" "%ld_arg_${var}_ld21 = OpLoad %u32 %ld_arg_${var}_gep21\n" "%ld_arg_${var}_bc00 = OpBitcast %v2f16 %ld_arg_${var}_ld00\n" "%ld_arg_${var}_bc01 = OpBitcast %v2f16 %ld_arg_${var}_ld01\n" "%ld_arg_${var}_bc10 = OpBitcast %v2f16 %ld_arg_${var}_ld10\n" "%ld_arg_${var}_bc11 = OpBitcast %v2f16 %ld_arg_${var}_ld11\n" "%ld_arg_${var}_bc20 = OpBitcast %v2f16 %ld_arg_${var}_ld20\n" "%ld_arg_${var}_bc21 = OpBitcast %v2f16 %ld_arg_${var}_ld21\n" "%ld_arg_${var}_vec0 = OpVectorShuffle %v3f16 %ld_arg_${var}_bc00 %ld_arg_${var}_bc01 0 1 2\n" "%ld_arg_${var}_vec1 = OpVectorShuffle %v3f16 %ld_arg_${var}_bc10 %ld_arg_${var}_bc11 0 1 2\n" "%ld_arg_${var}_vec2 = OpVectorShuffle %v3f16 %ld_arg_${var}_bc20 %ld_arg_${var}_bc21 0 1 2\n" "%ld_arg_${var}_mat = OpCompositeConstruct %m3x3f16 %ld_arg_${var}_vec0 %ld_arg_${var}_vec1 %ld_arg_${var}_vec2\n" "OpReturnValue %ld_arg_${var}_mat\n" "OpFunctionEnd\n"; const string loadM3x4F16FromUints = "%ld_arg_${var} = OpFunction %m3x4f16 None %m3x4f16_i32_fn\n" "%ld_arg_${var}_param = OpFunctionParameter %i32\n" "%ld_arg_${var}_entry = OpLabel\n" "%ld_arg_${var}_gep00 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_0\n" "%ld_arg_${var}_gep01 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_1\n" "%ld_arg_${var}_gep10 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_2\n" "%ld_arg_${var}_gep11 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_3\n" "%ld_arg_${var}_gep20 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_4\n" "%ld_arg_${var}_gep21 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_5\n" "%ld_arg_${var}_ld00 = OpLoad %u32 %ld_arg_${var}_gep00\n" "%ld_arg_${var}_ld01 = OpLoad %u32 %ld_arg_${var}_gep01\n" "%ld_arg_${var}_ld10 = OpLoad %u32 %ld_arg_${var}_gep10\n" "%ld_arg_${var}_ld11 = OpLoad %u32 %ld_arg_${var}_gep11\n" "%ld_arg_${var}_ld20 = OpLoad %u32 %ld_arg_${var}_gep20\n" "%ld_arg_${var}_ld21 = OpLoad %u32 %ld_arg_${var}_gep21\n" "%ld_arg_${var}_bc00 = OpBitcast %v2f16 %ld_arg_${var}_ld00\n" "%ld_arg_${var}_bc01 = OpBitcast %v2f16 %ld_arg_${var}_ld01\n" "%ld_arg_${var}_bc10 = OpBitcast %v2f16 %ld_arg_${var}_ld10\n" "%ld_arg_${var}_bc11 = OpBitcast %v2f16 %ld_arg_${var}_ld11\n" "%ld_arg_${var}_bc20 = OpBitcast %v2f16 %ld_arg_${var}_ld20\n" "%ld_arg_${var}_bc21 = OpBitcast %v2f16 %ld_arg_${var}_ld21\n" "%ld_arg_${var}_vec0 = OpVectorShuffle %v4f16 %ld_arg_${var}_bc00 %ld_arg_${var}_bc01 0 1 2 3\n" "%ld_arg_${var}_vec1 = OpVectorShuffle %v4f16 %ld_arg_${var}_bc10 %ld_arg_${var}_bc11 0 1 2 3\n" "%ld_arg_${var}_vec2 = OpVectorShuffle %v4f16 %ld_arg_${var}_bc20 %ld_arg_${var}_bc21 0 1 2 3\n" "%ld_arg_${var}_mat = OpCompositeConstruct %m3x4f16 %ld_arg_${var}_vec0 %ld_arg_${var}_vec1 %ld_arg_${var}_vec2\n" "OpReturnValue %ld_arg_${var}_mat\n" "OpFunctionEnd\n"; const string loadM4x2F16FromUints = "%ld_arg_${var} = OpFunction %m4x2f16 None %m4x2f16_i32_fn\n" "%ld_arg_${var}_param = OpFunctionParameter %i32\n" "%ld_arg_${var}_entry = OpLabel\n" "%ld_arg_${var}_gep0 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_0\n" "%ld_arg_${var}_gep1 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_1\n" "%ld_arg_${var}_gep2 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_2\n" "%ld_arg_${var}_gep3 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_3\n" "%ld_arg_${var}_ld0 = OpLoad %u32 %ld_arg_${var}_gep0\n" "%ld_arg_${var}_ld1 = OpLoad %u32 %ld_arg_${var}_gep1\n" "%ld_arg_${var}_ld2 = OpLoad %u32 %ld_arg_${var}_gep2\n" "%ld_arg_${var}_ld3 = OpLoad %u32 %ld_arg_${var}_gep3\n" "%ld_arg_${var}_bc0 = OpBitcast %v2f16 %ld_arg_${var}_ld0\n" "%ld_arg_${var}_bc1 = OpBitcast %v2f16 %ld_arg_${var}_ld1\n" "%ld_arg_${var}_bc2 = OpBitcast %v2f16 %ld_arg_${var}_ld2\n" "%ld_arg_${var}_bc3 = OpBitcast %v2f16 %ld_arg_${var}_ld3\n" "%ld_arg_${var}_mat = OpCompositeConstruct %m4x2f16 %ld_arg_${var}_bc0 %ld_arg_${var}_bc1 %ld_arg_${var}_bc2 %ld_arg_${var}_bc3\n" "OpReturnValue %ld_arg_${var}_mat\n" "OpFunctionEnd\n"; const string loadM4x3F16FromUints = "%ld_arg_${var} = OpFunction %m4x3f16 None %m4x3f16_i32_fn\n" "%ld_arg_${var}_param = OpFunctionParameter %i32\n" "%ld_arg_${var}_entry = OpLabel\n" "%ld_arg_${var}_gep00 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_0\n" "%ld_arg_${var}_gep01 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_1\n" "%ld_arg_${var}_gep10 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_2\n" "%ld_arg_${var}_gep11 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_3\n" "%ld_arg_${var}_gep20 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_4\n" "%ld_arg_${var}_gep21 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_5\n" "%ld_arg_${var}_gep30 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_6\n" "%ld_arg_${var}_gep31 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_7\n" "%ld_arg_${var}_ld00 = OpLoad %u32 %ld_arg_${var}_gep00\n" "%ld_arg_${var}_ld01 = OpLoad %u32 %ld_arg_${var}_gep01\n" "%ld_arg_${var}_ld10 = OpLoad %u32 %ld_arg_${var}_gep10\n" "%ld_arg_${var}_ld11 = OpLoad %u32 %ld_arg_${var}_gep11\n" "%ld_arg_${var}_ld20 = OpLoad %u32 %ld_arg_${var}_gep20\n" "%ld_arg_${var}_ld21 = OpLoad %u32 %ld_arg_${var}_gep21\n" "%ld_arg_${var}_ld30 = OpLoad %u32 %ld_arg_${var}_gep30\n" "%ld_arg_${var}_ld31 = OpLoad %u32 %ld_arg_${var}_gep31\n" "%ld_arg_${var}_bc00 = OpBitcast %v2f16 %ld_arg_${var}_ld00\n" "%ld_arg_${var}_bc01 = OpBitcast %v2f16 %ld_arg_${var}_ld01\n" "%ld_arg_${var}_bc10 = OpBitcast %v2f16 %ld_arg_${var}_ld10\n" "%ld_arg_${var}_bc11 = OpBitcast %v2f16 %ld_arg_${var}_ld11\n" "%ld_arg_${var}_bc20 = OpBitcast %v2f16 %ld_arg_${var}_ld20\n" "%ld_arg_${var}_bc21 = OpBitcast %v2f16 %ld_arg_${var}_ld21\n" "%ld_arg_${var}_bc30 = OpBitcast %v2f16 %ld_arg_${var}_ld30\n" "%ld_arg_${var}_bc31 = OpBitcast %v2f16 %ld_arg_${var}_ld31\n" "%ld_arg_${var}_vec0 = OpVectorShuffle %v3f16 %ld_arg_${var}_bc00 %ld_arg_${var}_bc01 0 1 2\n" "%ld_arg_${var}_vec1 = OpVectorShuffle %v3f16 %ld_arg_${var}_bc10 %ld_arg_${var}_bc11 0 1 2\n" "%ld_arg_${var}_vec2 = OpVectorShuffle %v3f16 %ld_arg_${var}_bc20 %ld_arg_${var}_bc21 0 1 2\n" "%ld_arg_${var}_vec3 = OpVectorShuffle %v3f16 %ld_arg_${var}_bc30 %ld_arg_${var}_bc31 0 1 2\n" "%ld_arg_${var}_mat = OpCompositeConstruct %m4x3f16 %ld_arg_${var}_vec0 %ld_arg_${var}_vec1 %ld_arg_${var}_vec2 %ld_arg_${var}_vec3\n" "OpReturnValue %ld_arg_${var}_mat\n" "OpFunctionEnd\n"; const string loadM4x4F16FromUints = "%ld_arg_${var} = OpFunction %m4x4f16 None %m4x4f16_i32_fn\n" "%ld_arg_${var}_param = OpFunctionParameter %i32\n" "%ld_arg_${var}_entry = OpLabel\n" "%ld_arg_${var}_gep00 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_0\n" "%ld_arg_${var}_gep01 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_1\n" "%ld_arg_${var}_gep10 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_2\n" "%ld_arg_${var}_gep11 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_3\n" "%ld_arg_${var}_gep20 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_4\n" "%ld_arg_${var}_gep21 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_5\n" "%ld_arg_${var}_gep30 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_6\n" "%ld_arg_${var}_gep31 = OpAccessChain %up_u32 %${var} %c_u32_0 %ld_arg_${var}_param %c_u32_7\n" "%ld_arg_${var}_ld00 = OpLoad %u32 %ld_arg_${var}_gep00\n" "%ld_arg_${var}_ld01 = OpLoad %u32 %ld_arg_${var}_gep01\n" "%ld_arg_${var}_ld10 = OpLoad %u32 %ld_arg_${var}_gep10\n" "%ld_arg_${var}_ld11 = OpLoad %u32 %ld_arg_${var}_gep11\n" "%ld_arg_${var}_ld20 = OpLoad %u32 %ld_arg_${var}_gep20\n" "%ld_arg_${var}_ld21 = OpLoad %u32 %ld_arg_${var}_gep21\n" "%ld_arg_${var}_ld30 = OpLoad %u32 %ld_arg_${var}_gep30\n" "%ld_arg_${var}_ld31 = OpLoad %u32 %ld_arg_${var}_gep31\n" "%ld_arg_${var}_bc00 = OpBitcast %v2f16 %ld_arg_${var}_ld00\n" "%ld_arg_${var}_bc01 = OpBitcast %v2f16 %ld_arg_${var}_ld01\n" "%ld_arg_${var}_bc10 = OpBitcast %v2f16 %ld_arg_${var}_ld10\n" "%ld_arg_${var}_bc11 = OpBitcast %v2f16 %ld_arg_${var}_ld11\n" "%ld_arg_${var}_bc20 = OpBitcast %v2f16 %ld_arg_${var}_ld20\n" "%ld_arg_${var}_bc21 = OpBitcast %v2f16 %ld_arg_${var}_ld21\n" "%ld_arg_${var}_bc30 = OpBitcast %v2f16 %ld_arg_${var}_ld30\n" "%ld_arg_${var}_bc31 = OpBitcast %v2f16 %ld_arg_${var}_ld31\n" "%ld_arg_${var}_vec0 = OpVectorShuffle %v4f16 %ld_arg_${var}_bc00 %ld_arg_${var}_bc01 0 1 2 3\n" "%ld_arg_${var}_vec1 = OpVectorShuffle %v4f16 %ld_arg_${var}_bc10 %ld_arg_${var}_bc11 0 1 2 3\n" "%ld_arg_${var}_vec2 = OpVectorShuffle %v4f16 %ld_arg_${var}_bc20 %ld_arg_${var}_bc21 0 1 2 3\n" "%ld_arg_${var}_vec3 = OpVectorShuffle %v4f16 %ld_arg_${var}_bc30 %ld_arg_${var}_bc31 0 1 2 3\n" "%ld_arg_${var}_mat = OpCompositeConstruct %m4x4f16 %ld_arg_${var}_vec0 %ld_arg_${var}_vec1 %ld_arg_${var}_vec2 %ld_arg_${var}_vec3\n" "OpReturnValue %ld_arg_${var}_mat\n" "OpFunctionEnd\n"; const string storeScalarF16AsUint = // This version is sensitive to the initial value in the output buffer. // The infrastructure sets all output buffer bits to one before invoking // the shader so this version uses an atomic and to generate the correct // zeroes. "%st_fn_${var} = OpFunction %void None %void_f16_i32_fn\n" "%st_fn_${var}_param1 = OpFunctionParameter %f16\n" "%st_fn_${var}_param2 = OpFunctionParameter %i32\n" "%st_fn_${var}_entry = OpLabel\n" "%st_fn_${var}_and_low = OpBitwiseAnd %u32 %st_fn_${var}_param2 %c_u32_1\n" "%st_fn_${var}_zero_vec = OpBitcast %v2f16 %c_u32_0\n" "%st_fn_${var}_insert = OpVectorInsertDynamic %v2f16 %st_fn_${var}_zero_vec %st_fn_${var}_param1 %st_fn_${var}_and_low\n" "%st_fn_${var}_odd = OpIEqual %bool %st_fn_${var}_and_low %c_u32_1\n" // Or 16 bits of ones into the half that was not populated with the result. "%st_fn_${var}_sel = OpSelect %u32 %st_fn_${var}_odd %c_u32_low_ones %c_u32_high_ones\n" "%st_fn_${var}_cast = OpBitcast %u32 %st_fn_${var}_insert\n" "%st_fn_${var}_or = OpBitwiseOr %u32 %st_fn_${var}_cast %st_fn_${var}_sel\n" "%st_fn_${var}_conv = OpBitcast %u32 %st_fn_${var}_param2\n" "%st_fn_${var}_div = OpUDiv %u32 %st_fn_${var}_conv %c_u32_2\n" "%st_fn_${var}_gep = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_div\n" "%st_fn_${var}_and = OpAtomicAnd %u32 %st_fn_${var}_gep %c_u32_1 %c_u32_0 %st_fn_${var}_or\n" "OpReturn\n" "OpFunctionEnd\n"; const string storeV2F16AsUint = "%st_fn_${var} = OpFunction %void None %void_v2f16_i32_fn\n" "%st_fn_${var}_param1 = OpFunctionParameter %v2f16\n" "%st_fn_${var}_param2 = OpFunctionParameter %i32\n" "%st_fn_${var}_entry = OpLabel\n" "%st_fn_${var}_cast = OpBitcast %u32 %st_fn_${var}_param1\n" "%st_fn_${var}_gep = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2\n" "OpStore %st_fn_${var}_gep %st_fn_${var}_cast\n" "OpReturn\n" "OpFunctionEnd\n"; const string storeV3F16AsUints = // Since we allocate a vec4 worth of values, this case can be treated // almost the same as a vec4 case. We will store some extra data that // should not be compared. "%st_fn_${var} = OpFunction %void None %void_v3f16_i32_fn\n" "%st_fn_${var}_param1 = OpFunctionParameter %v3f16\n" "%st_fn_${var}_param2 = OpFunctionParameter %i32\n" "%st_fn_${var}_entry = OpLabel\n" "%st_fn_${var}_shuffle0 = OpVectorShuffle %v2f16 %st_fn_${var}_param1 %st_fn_${var}_param1 0 1\n" "%st_fn_${var}_shuffle1 = OpVectorShuffle %v2f16 %st_fn_${var}_param1 %st_fn_${var}_param1 2 3\n" "%st_fn_${var}_bc0 = OpBitcast %u32 %st_fn_${var}_shuffle0\n" "%st_fn_${var}_bc1 = OpBitcast %u32 %st_fn_${var}_shuffle1\n" "%st_fn_${var}_gep0 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_0\n" "%st_fn_${var}_gep1 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_1\n" "OpStore %st_fn_${var}_gep0 %st_fn_${var}_bc0\n" "OpStore %st_fn_${var}_gep1 %st_fn_${var}_bc1\n" "OpReturn\n" "OpFunctionEnd\n"; const string storeV4F16AsUints = "%st_fn_${var} = OpFunction %void None %void_v4f16_i32_fn\n" "%st_fn_${var}_param1 = OpFunctionParameter %v4f16\n" "%st_fn_${var}_param2 = OpFunctionParameter %i32\n" "%st_fn_${var}_entry = OpLabel\n" "%st_fn_${var}_shuffle0 = OpVectorShuffle %v2f16 %st_fn_${var}_param1 %st_fn_${var}_param1 0 1\n" "%st_fn_${var}_shuffle1 = OpVectorShuffle %v2f16 %st_fn_${var}_param1 %st_fn_${var}_param1 2 3\n" "%st_fn_${var}_bc0 = OpBitcast %u32 %st_fn_${var}_shuffle0\n" "%st_fn_${var}_bc1 = OpBitcast %u32 %st_fn_${var}_shuffle1\n" "%st_fn_${var}_gep0 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_0\n" "%st_fn_${var}_gep1 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_1\n" "OpStore %st_fn_${var}_gep0 %st_fn_${var}_bc0\n" "OpStore %st_fn_${var}_gep1 %st_fn_${var}_bc1\n" "OpReturn\n" "OpFunctionEnd\n"; const string storeM2x2F16AsUints = "%st_fn_${var} = OpFunction %void None %void_m2x2f16_i32_fn\n" "%st_fn_${var}_param1 = OpFunctionParameter %m2x2f16\n" "%st_fn_${var}_param2 = OpFunctionParameter %i32\n" "%st_fn_${var}_entry = OpLabel\n" "%st_fn_${var}_ex0 = OpCompositeExtract %v2f16 %st_fn_${var}_param1 0\n" "%st_fn_${var}_ex1 = OpCompositeExtract %v2f16 %st_fn_${var}_param1 1\n" "%st_fn_${var}_bc0 = OpBitcast %u32 %st_fn_${var}_ex0\n" "%st_fn_${var}_bc1 = OpBitcast %u32 %st_fn_${var}_ex1\n" "%st_fn_${var}_gep0 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_0\n" "%st_fn_${var}_gep1 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_1\n" "OpStore %st_fn_${var}_gep0 %st_fn_${var}_bc0\n" "OpStore %st_fn_${var}_gep1 %st_fn_${var}_bc1\n" "OpReturn\n" "OpFunctionEnd\n"; const string storeM2x3F16AsUints = // In the extracted elements for 01 and 11 the second element doesn't // matter. "%st_fn_${var} = OpFunction %void None %void_m2x3f16_i32_fn\n" "%st_fn_${var}_param1 = OpFunctionParameter %m2x3f16\n" "%st_fn_${var}_param2 = OpFunctionParameter %i32\n" "%st_fn_${var}_entry = OpLabel\n" "%st_fn_${var}_ex0 = OpCompositeExtract %v3f16 %st_fn_${var}_param1 0\n" "%st_fn_${var}_ex1 = OpCompositeExtract %v3f16 %st_fn_${var}_param1 1\n" "%st_fn_${var}_ele00 = OpVectorShuffle %v2f16 %st_fn_${var}_ex0 %st_fn_${var}_ex0 0 1\n" "%st_fn_${var}_ele01 = OpVectorShuffle %v2f16 %st_fn_${var}_ex0 %st_fn_${var}_ex0 2 3\n" "%st_fn_${var}_ele10 = OpVectorShuffle %v2f16 %st_fn_${var}_ex1 %st_fn_${var}_ex1 0 1\n" "%st_fn_${var}_ele11 = OpVectorShuffle %v2f16 %st_fn_${var}_ex1 %st_fn_${var}_ex1 2 3\n" "%st_fn_${var}_bc00 = OpBitcast %u32 %st_fn_${var}_ele00\n" "%st_fn_${var}_bc01 = OpBitcast %u32 %st_fn_${var}_ele01\n" "%st_fn_${var}_bc10 = OpBitcast %u32 %st_fn_${var}_ele10\n" "%st_fn_${var}_bc11 = OpBitcast %u32 %st_fn_${var}_ele11\n" "%st_fn_${var}_gep00 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_0\n" "%st_fn_${var}_gep01 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_1\n" "%st_fn_${var}_gep10 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_2\n" "%st_fn_${var}_gep11 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_3\n" "OpStore %st_fn_${var}_gep00 %st_fn_${var}_bc00\n" "OpStore %st_fn_${var}_gep01 %st_fn_${var}_bc01\n" "OpStore %st_fn_${var}_gep10 %st_fn_${var}_bc10\n" "OpStore %st_fn_${var}_gep11 %st_fn_${var}_bc11\n" "OpReturn\n" "OpFunctionEnd\n"; const string storeM2x4F16AsUints = "%st_fn_${var} = OpFunction %void None %void_m2x4f16_i32_fn\n" "%st_fn_${var}_param1 = OpFunctionParameter %m2x4f16\n" "%st_fn_${var}_param2 = OpFunctionParameter %i32\n" "%st_fn_${var}_entry = OpLabel\n" "%st_fn_${var}_ex0 = OpCompositeExtract %v4f16 %st_fn_${var}_param1 0\n" "%st_fn_${var}_ex1 = OpCompositeExtract %v4f16 %st_fn_${var}_param1 1\n" "%st_fn_${var}_ele00 = OpVectorShuffle %v2f16 %st_fn_${var}_ex0 %st_fn_${var}_ex0 0 1\n" "%st_fn_${var}_ele01 = OpVectorShuffle %v2f16 %st_fn_${var}_ex0 %st_fn_${var}_ex0 2 3\n" "%st_fn_${var}_ele10 = OpVectorShuffle %v2f16 %st_fn_${var}_ex1 %st_fn_${var}_ex1 0 1\n" "%st_fn_${var}_ele11 = OpVectorShuffle %v2f16 %st_fn_${var}_ex1 %st_fn_${var}_ex1 2 3\n" "%st_fn_${var}_bc00 = OpBitcast %u32 %st_fn_${var}_ele00\n" "%st_fn_${var}_bc01 = OpBitcast %u32 %st_fn_${var}_ele01\n" "%st_fn_${var}_bc10 = OpBitcast %u32 %st_fn_${var}_ele10\n" "%st_fn_${var}_bc11 = OpBitcast %u32 %st_fn_${var}_ele11\n" "%st_fn_${var}_gep00 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_0\n" "%st_fn_${var}_gep01 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_1\n" "%st_fn_${var}_gep10 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_2\n" "%st_fn_${var}_gep11 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_3\n" "OpStore %st_fn_${var}_gep00 %st_fn_${var}_bc00\n" "OpStore %st_fn_${var}_gep01 %st_fn_${var}_bc01\n" "OpStore %st_fn_${var}_gep10 %st_fn_${var}_bc10\n" "OpStore %st_fn_${var}_gep11 %st_fn_${var}_bc11\n" "OpReturn\n" "OpFunctionEnd\n"; const string storeM3x2F16AsUints = "%st_fn_${var} = OpFunction %void None %void_m3x2f16_i32_fn\n" "%st_fn_${var}_param1 = OpFunctionParameter %m3x2f16\n" "%st_fn_${var}_param2 = OpFunctionParameter %i32\n" "%st_fn_${var}_entry = OpLabel\n" "%st_fn_${var}_ex0 = OpCompositeExtract %v2f16 %st_fn_${var}_param1 0\n" "%st_fn_${var}_ex1 = OpCompositeExtract %v2f16 %st_fn_${var}_param1 1\n" "%st_fn_${var}_ex2 = OpCompositeExtract %v2f16 %st_fn_${var}_param1 2\n" "%st_fn_${var}_bc0 = OpBitcast %u32 %st_fn_${var}_ex0\n" "%st_fn_${var}_bc1 = OpBitcast %u32 %st_fn_${var}_ex1\n" "%st_fn_${var}_bc2 = OpBitcast %u32 %st_fn_${var}_ex2\n" "%st_fn_${var}_gep0 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_0\n" "%st_fn_${var}_gep1 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_1\n" "%st_fn_${var}_gep2 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_2\n" "OpStore %st_fn_${var}_gep0 %st_fn_${var}_bc0\n" "OpStore %st_fn_${var}_gep1 %st_fn_${var}_bc1\n" "OpStore %st_fn_${var}_gep2 %st_fn_${var}_bc2\n" "OpReturn\n" "OpFunctionEnd\n"; const string storeM3x3F16AsUints = // The second element of the each broken down vec3 doesn't matter. "%st_fn_${var} = OpFunction %void None %void_m3x3f16_i32_fn\n" "%st_fn_${var}_param1 = OpFunctionParameter %m3x3f16\n" "%st_fn_${var}_param2 = OpFunctionParameter %i32\n" "%st_fn_${var}_entry = OpLabel\n" "%st_fn_${var}_ex0 = OpCompositeExtract %v3f16 %st_fn_${var}_param1 0\n" "%st_fn_${var}_ex1 = OpCompositeExtract %v3f16 %st_fn_${var}_param1 1\n" "%st_fn_${var}_ex2 = OpCompositeExtract %v3f16 %st_fn_${var}_param1 2\n" "%st_fn_${var}_ele00 = OpVectorShuffle %v2f16 %st_fn_${var}_ex0 %st_fn_${var}_ex0 0 1\n" "%st_fn_${var}_ele01 = OpVectorShuffle %v2f16 %st_fn_${var}_ex0 %st_fn_${var}_ex0 2 3\n" "%st_fn_${var}_ele10 = OpVectorShuffle %v2f16 %st_fn_${var}_ex1 %st_fn_${var}_ex1 0 1\n" "%st_fn_${var}_ele11 = OpVectorShuffle %v2f16 %st_fn_${var}_ex1 %st_fn_${var}_ex1 2 3\n" "%st_fn_${var}_ele20 = OpVectorShuffle %v2f16 %st_fn_${var}_ex2 %st_fn_${var}_ex2 0 1\n" "%st_fn_${var}_ele21 = OpVectorShuffle %v2f16 %st_fn_${var}_ex2 %st_fn_${var}_ex2 2 3\n" "%st_fn_${var}_bc00 = OpBitcast %u32 %st_fn_${var}_ele00\n" "%st_fn_${var}_bc01 = OpBitcast %u32 %st_fn_${var}_ele01\n" "%st_fn_${var}_bc10 = OpBitcast %u32 %st_fn_${var}_ele10\n" "%st_fn_${var}_bc11 = OpBitcast %u32 %st_fn_${var}_ele11\n" "%st_fn_${var}_bc20 = OpBitcast %u32 %st_fn_${var}_ele20\n" "%st_fn_${var}_bc21 = OpBitcast %u32 %st_fn_${var}_ele21\n" "%st_fn_${var}_gep00 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_0\n" "%st_fn_${var}_gep01 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_1\n" "%st_fn_${var}_gep10 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_2\n" "%st_fn_${var}_gep11 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_3\n" "%st_fn_${var}_gep20 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_4\n" "%st_fn_${var}_gep21 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_5\n" "OpStore %st_fn_${var}_gep00 %st_fn_${var}_bc00\n" "OpStore %st_fn_${var}_gep01 %st_fn_${var}_bc01\n" "OpStore %st_fn_${var}_gep10 %st_fn_${var}_bc10\n" "OpStore %st_fn_${var}_gep11 %st_fn_${var}_bc11\n" "OpStore %st_fn_${var}_gep20 %st_fn_${var}_bc20\n" "OpStore %st_fn_${var}_gep21 %st_fn_${var}_bc21\n" "OpReturn\n" "OpFunctionEnd\n"; const string storeM3x4F16AsUints = "%st_fn_${var} = OpFunction %void None %void_m3x4f16_i32_fn\n" "%st_fn_${var}_param1 = OpFunctionParameter %m3x4f16\n" "%st_fn_${var}_param2 = OpFunctionParameter %i32\n" "%st_fn_${var}_entry = OpLabel\n" "%st_fn_${var}_ex0 = OpCompositeExtract %v4f16 %st_fn_${var}_param1 0\n" "%st_fn_${var}_ex1 = OpCompositeExtract %v4f16 %st_fn_${var}_param1 1\n" "%st_fn_${var}_ex2 = OpCompositeExtract %v4f16 %st_fn_${var}_param1 2\n" "%st_fn_${var}_ele00 = OpVectorShuffle %v2f16 %st_fn_${var}_ex0 %st_fn_${var}_ex0 0 1\n" "%st_fn_${var}_ele01 = OpVectorShuffle %v2f16 %st_fn_${var}_ex0 %st_fn_${var}_ex0 2 3\n" "%st_fn_${var}_ele10 = OpVectorShuffle %v2f16 %st_fn_${var}_ex1 %st_fn_${var}_ex1 0 1\n" "%st_fn_${var}_ele11 = OpVectorShuffle %v2f16 %st_fn_${var}_ex1 %st_fn_${var}_ex1 2 3\n" "%st_fn_${var}_ele20 = OpVectorShuffle %v2f16 %st_fn_${var}_ex2 %st_fn_${var}_ex2 0 1\n" "%st_fn_${var}_ele21 = OpVectorShuffle %v2f16 %st_fn_${var}_ex2 %st_fn_${var}_ex2 2 3\n" "%st_fn_${var}_bc00 = OpBitcast %u32 %st_fn_${var}_ele00\n" "%st_fn_${var}_bc01 = OpBitcast %u32 %st_fn_${var}_ele01\n" "%st_fn_${var}_bc10 = OpBitcast %u32 %st_fn_${var}_ele10\n" "%st_fn_${var}_bc11 = OpBitcast %u32 %st_fn_${var}_ele11\n" "%st_fn_${var}_bc20 = OpBitcast %u32 %st_fn_${var}_ele20\n" "%st_fn_${var}_bc21 = OpBitcast %u32 %st_fn_${var}_ele21\n" "%st_fn_${var}_gep00 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_0\n" "%st_fn_${var}_gep01 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_1\n" "%st_fn_${var}_gep10 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_2\n" "%st_fn_${var}_gep11 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_3\n" "%st_fn_${var}_gep20 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_4\n" "%st_fn_${var}_gep21 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_5\n" "OpStore %st_fn_${var}_gep00 %st_fn_${var}_bc00\n" "OpStore %st_fn_${var}_gep01 %st_fn_${var}_bc01\n" "OpStore %st_fn_${var}_gep10 %st_fn_${var}_bc10\n" "OpStore %st_fn_${var}_gep11 %st_fn_${var}_bc11\n" "OpStore %st_fn_${var}_gep20 %st_fn_${var}_bc20\n" "OpStore %st_fn_${var}_gep21 %st_fn_${var}_bc21\n" "OpReturn\n" "OpFunctionEnd\n"; const string storeM4x2F16AsUints = "%st_fn_${var} = OpFunction %void None %void_m4x2f16_i32_fn\n" "%st_fn_${var}_param1 = OpFunctionParameter %m4x2f16\n" "%st_fn_${var}_param2 = OpFunctionParameter %i32\n" "%st_fn_${var}_entry = OpLabel\n" "%st_fn_${var}_ex0 = OpCompositeExtract %v2f16 %st_fn_${var}_param1 0\n" "%st_fn_${var}_ex1 = OpCompositeExtract %v2f16 %st_fn_${var}_param1 1\n" "%st_fn_${var}_ex2 = OpCompositeExtract %v2f16 %st_fn_${var}_param1 2\n" "%st_fn_${var}_ex3 = OpCompositeExtract %v2f16 %st_fn_${var}_param1 3\n" "%st_fn_${var}_bc0 = OpBitcast %u32 %st_fn_${var}_ex0\n" "%st_fn_${var}_bc1 = OpBitcast %u32 %st_fn_${var}_ex1\n" "%st_fn_${var}_bc2 = OpBitcast %u32 %st_fn_${var}_ex2\n" "%st_fn_${var}_bc3 = OpBitcast %u32 %st_fn_${var}_ex3\n" "%st_fn_${var}_gep0 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_0\n" "%st_fn_${var}_gep1 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_1\n" "%st_fn_${var}_gep2 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_2\n" "%st_fn_${var}_gep3 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_3\n" "OpStore %st_fn_${var}_gep0 %st_fn_${var}_bc0\n" "OpStore %st_fn_${var}_gep1 %st_fn_${var}_bc1\n" "OpStore %st_fn_${var}_gep2 %st_fn_${var}_bc2\n" "OpStore %st_fn_${var}_gep3 %st_fn_${var}_bc3\n" "OpReturn\n" "OpFunctionEnd\n"; const string storeM4x3F16AsUints = // The last element of each decomposed vec3 doesn't matter. "%st_fn_${var} = OpFunction %void None %void_m4x3f16_i32_fn\n" "%st_fn_${var}_param1 = OpFunctionParameter %m4x3f16\n" "%st_fn_${var}_param2 = OpFunctionParameter %i32\n" "%st_fn_${var}_entry = OpLabel\n" "%st_fn_${var}_ex0 = OpCompositeExtract %v3f16 %st_fn_${var}_param1 0\n" "%st_fn_${var}_ex1 = OpCompositeExtract %v3f16 %st_fn_${var}_param1 1\n" "%st_fn_${var}_ex2 = OpCompositeExtract %v3f16 %st_fn_${var}_param1 2\n" "%st_fn_${var}_ex3 = OpCompositeExtract %v3f16 %st_fn_${var}_param1 3\n" "%st_fn_${var}_ele00 = OpVectorShuffle %v2f16 %st_fn_${var}_ex0 %st_fn_${var}_ex0 0 1\n" "%st_fn_${var}_ele01 = OpVectorShuffle %v2f16 %st_fn_${var}_ex0 %st_fn_${var}_ex0 2 3\n" "%st_fn_${var}_ele10 = OpVectorShuffle %v2f16 %st_fn_${var}_ex1 %st_fn_${var}_ex1 0 1\n" "%st_fn_${var}_ele11 = OpVectorShuffle %v2f16 %st_fn_${var}_ex1 %st_fn_${var}_ex1 2 3\n" "%st_fn_${var}_ele20 = OpVectorShuffle %v2f16 %st_fn_${var}_ex2 %st_fn_${var}_ex2 0 1\n" "%st_fn_${var}_ele21 = OpVectorShuffle %v2f16 %st_fn_${var}_ex2 %st_fn_${var}_ex2 2 3\n" "%st_fn_${var}_ele30 = OpVectorShuffle %v2f16 %st_fn_${var}_ex3 %st_fn_${var}_ex3 0 1\n" "%st_fn_${var}_ele31 = OpVectorShuffle %v2f16 %st_fn_${var}_ex3 %st_fn_${var}_ex3 2 3\n" "%st_fn_${var}_bc00 = OpBitcast %u32 %st_fn_${var}_ele00\n" "%st_fn_${var}_bc01 = OpBitcast %u32 %st_fn_${var}_ele01\n" "%st_fn_${var}_bc10 = OpBitcast %u32 %st_fn_${var}_ele10\n" "%st_fn_${var}_bc11 = OpBitcast %u32 %st_fn_${var}_ele11\n" "%st_fn_${var}_bc20 = OpBitcast %u32 %st_fn_${var}_ele20\n" "%st_fn_${var}_bc21 = OpBitcast %u32 %st_fn_${var}_ele21\n" "%st_fn_${var}_bc30 = OpBitcast %u32 %st_fn_${var}_ele30\n" "%st_fn_${var}_bc31 = OpBitcast %u32 %st_fn_${var}_ele31\n" "%st_fn_${var}_gep00 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_0\n" "%st_fn_${var}_gep01 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_1\n" "%st_fn_${var}_gep10 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_2\n" "%st_fn_${var}_gep11 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_3\n" "%st_fn_${var}_gep20 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_4\n" "%st_fn_${var}_gep21 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_5\n" "%st_fn_${var}_gep30 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_6\n" "%st_fn_${var}_gep31 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_7\n" "OpStore %st_fn_${var}_gep00 %st_fn_${var}_bc00\n" "OpStore %st_fn_${var}_gep01 %st_fn_${var}_bc01\n" "OpStore %st_fn_${var}_gep10 %st_fn_${var}_bc10\n" "OpStore %st_fn_${var}_gep11 %st_fn_${var}_bc11\n" "OpStore %st_fn_${var}_gep20 %st_fn_${var}_bc20\n" "OpStore %st_fn_${var}_gep21 %st_fn_${var}_bc21\n" "OpStore %st_fn_${var}_gep30 %st_fn_${var}_bc30\n" "OpStore %st_fn_${var}_gep31 %st_fn_${var}_bc31\n" "OpReturn\n" "OpFunctionEnd\n"; const string storeM4x4F16AsUints = "%st_fn_${var} = OpFunction %void None %void_m4x4f16_i32_fn\n" "%st_fn_${var}_param1 = OpFunctionParameter %m4x4f16\n" "%st_fn_${var}_param2 = OpFunctionParameter %i32\n" "%st_fn_${var}_entry = OpLabel\n" "%st_fn_${var}_ex0 = OpCompositeExtract %v4f16 %st_fn_${var}_param1 0\n" "%st_fn_${var}_ex1 = OpCompositeExtract %v4f16 %st_fn_${var}_param1 1\n" "%st_fn_${var}_ex2 = OpCompositeExtract %v4f16 %st_fn_${var}_param1 2\n" "%st_fn_${var}_ex3 = OpCompositeExtract %v4f16 %st_fn_${var}_param1 3\n" "%st_fn_${var}_ele00 = OpVectorShuffle %v2f16 %st_fn_${var}_ex0 %st_fn_${var}_ex0 0 1\n" "%st_fn_${var}_ele01 = OpVectorShuffle %v2f16 %st_fn_${var}_ex0 %st_fn_${var}_ex0 2 3\n" "%st_fn_${var}_ele10 = OpVectorShuffle %v2f16 %st_fn_${var}_ex1 %st_fn_${var}_ex1 0 1\n" "%st_fn_${var}_ele11 = OpVectorShuffle %v2f16 %st_fn_${var}_ex1 %st_fn_${var}_ex1 2 3\n" "%st_fn_${var}_ele20 = OpVectorShuffle %v2f16 %st_fn_${var}_ex2 %st_fn_${var}_ex2 0 1\n" "%st_fn_${var}_ele21 = OpVectorShuffle %v2f16 %st_fn_${var}_ex2 %st_fn_${var}_ex2 2 3\n" "%st_fn_${var}_ele30 = OpVectorShuffle %v2f16 %st_fn_${var}_ex3 %st_fn_${var}_ex3 0 1\n" "%st_fn_${var}_ele31 = OpVectorShuffle %v2f16 %st_fn_${var}_ex3 %st_fn_${var}_ex3 2 3\n" "%st_fn_${var}_bc00 = OpBitcast %u32 %st_fn_${var}_ele00\n" "%st_fn_${var}_bc01 = OpBitcast %u32 %st_fn_${var}_ele01\n" "%st_fn_${var}_bc10 = OpBitcast %u32 %st_fn_${var}_ele10\n" "%st_fn_${var}_bc11 = OpBitcast %u32 %st_fn_${var}_ele11\n" "%st_fn_${var}_bc20 = OpBitcast %u32 %st_fn_${var}_ele20\n" "%st_fn_${var}_bc21 = OpBitcast %u32 %st_fn_${var}_ele21\n" "%st_fn_${var}_bc30 = OpBitcast %u32 %st_fn_${var}_ele30\n" "%st_fn_${var}_bc31 = OpBitcast %u32 %st_fn_${var}_ele31\n" "%st_fn_${var}_gep00 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_0\n" "%st_fn_${var}_gep01 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_1\n" "%st_fn_${var}_gep10 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_2\n" "%st_fn_${var}_gep11 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_3\n" "%st_fn_${var}_gep20 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_4\n" "%st_fn_${var}_gep21 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_5\n" "%st_fn_${var}_gep30 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_6\n" "%st_fn_${var}_gep31 = OpAccessChain %up_u32 %${var} %c_u32_0 %st_fn_${var}_param2 %c_u32_7\n" "OpStore %st_fn_${var}_gep00 %st_fn_${var}_bc00\n" "OpStore %st_fn_${var}_gep01 %st_fn_${var}_bc01\n" "OpStore %st_fn_${var}_gep10 %st_fn_${var}_bc10\n" "OpStore %st_fn_${var}_gep11 %st_fn_${var}_bc11\n" "OpStore %st_fn_${var}_gep20 %st_fn_${var}_bc20\n" "OpStore %st_fn_${var}_gep21 %st_fn_${var}_bc21\n" "OpStore %st_fn_${var}_gep30 %st_fn_${var}_bc30\n" "OpStore %st_fn_${var}_gep31 %st_fn_${var}_bc31\n" "OpReturn\n" "OpFunctionEnd\n"; template static void fillRandomScalars (de::Random& rnd, T minValue, T maxValue, void* dst, int numValues, int offset = 0) { T* const typedPtr = (T*)dst; for (int ndx = 0; ndx < numValues; ndx++) typedPtr[offset + ndx] = de::randomScalar(rnd, minValue, maxValue); } // Filter is a function that returns true if a value should pass, false otherwise. template static void fillRandomScalars (de::Random& rnd, T minValue, T maxValue, void* dst, int numValues, FilterT filter, int offset = 0) { T* const typedPtr = (T*)dst; T value; for (int ndx = 0; ndx < numValues; ndx++) { do value = de::randomScalar(rnd, minValue, maxValue); while (!filter(value)); typedPtr[offset + ndx] = value; } } // Gets a 64-bit integer with a more logarithmic distribution deInt64 randomInt64LogDistributed (de::Random& rnd) { deInt64 val = rnd.getUint64(); val &= (1ull << rnd.getInt(1, 63)) - 1; if (rnd.getBool()) val = -val; return val; } static void fillRandomInt64sLogDistributed (de::Random& rnd, vector& dst, int numValues) { for (int ndx = 0; ndx < numValues; ndx++) dst[ndx] = randomInt64LogDistributed(rnd); } template static void fillRandomInt64sLogDistributed (de::Random& rnd, vector& dst, int numValues, FilterT filter) { for (int ndx = 0; ndx < numValues; ndx++) { deInt64 value; do { value = randomInt64LogDistributed(rnd); } while (!filter(value)); dst[ndx] = value; } } inline bool filterNonNegative (const deInt64 value) { return value >= 0; } inline bool filterPositive (const deInt64 value) { return value > 0; } inline bool filterNotZero (const deInt64 value) { return value != 0; } static void floorAll (vector& values) { for (size_t i = 0; i < values.size(); i++) values[i] = deFloatFloor(values[i]); } static void floorAll (vector& values) { for (size_t i = 0; i < values.size(); i++) values[i] = floor(values[i]); } struct CaseParameter { const char* name; string param; CaseParameter (const char* case_, const string& param_) : name(case_), param(param_) {} }; // Assembly code used for testing LocalSize, OpNop, OpConstant{Null|Composite}, Op[No]Line, OpSource[Continued], OpSourceExtension, OpUndef is based on GLSL source code: // // #version 430 // // layout(std140, set = 0, binding = 0) readonly buffer Input { // float elements[]; // } input_data; // layout(std140, set = 0, binding = 1) writeonly buffer Output { // float elements[]; // } output_data; // // layout (local_size_x = 1, local_size_y = 1, local_size_z = 1) in; // // void main() { // uint x = gl_GlobalInvocationID.x; // output_data.elements[x] = -input_data.elements[x]; // } static string getAsmForLocalSizeTest(bool useLiteralLocalSize, bool useLiteralLocalSizeId, bool useSpecConstantWorkgroupSize, IVec3 workGroupSize, deUint32 ndx) { std::ostringstream out; out << "OpCapability Shader\n" "OpMemoryModel Logical GLSL450\n"; if (useLiteralLocalSizeId) { out << "OpEntryPoint GLCompute %main \"main\" %id %indata %outdata\n" "OpExecutionModeId %main LocalSizeId %const_0 %const_1 %const_2\n"; } else { out << "OpEntryPoint GLCompute %main \"main\" %id\n"; if (useLiteralLocalSize) { out << "OpExecutionMode %main LocalSize " << workGroupSize.x() << " " << workGroupSize.y() << " " << workGroupSize.z() << "\n"; } } out << "OpSource GLSL 430\n" "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n"; if (useSpecConstantWorkgroupSize) { out << "OpDecorate %spec_0 SpecId 100\n" "OpDecorate %spec_1 SpecId 101\n" "OpDecorate %spec_2 SpecId 102\n" "OpDecorate %gl_WorkGroupSize BuiltIn WorkgroupSize\n"; } if (useLiteralLocalSizeId) { out << getComputeAsmInputOutputBufferTraits("Block") << getComputeAsmCommonTypes("StorageBuffer") << getComputeAsmInputOutputBuffer("StorageBuffer") << "%const_0 = OpConstant %u32 " << workGroupSize.x() << "\n" "%const_1 = OpConstant %u32 " << workGroupSize.y() << "\n" "%const_2 = OpConstant %u32 " << workGroupSize.z() << "\n"; } else { out << getComputeAsmInputOutputBufferTraits() << getComputeAsmCommonTypes() << getComputeAsmInputOutputBuffer(); } out << "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0 \n"; if (useSpecConstantWorkgroupSize) { out << "%spec_0 = OpSpecConstant %u32 "<< workGroupSize.x() << "\n" "%spec_1 = OpSpecConstant %u32 "<< workGroupSize.y() << "\n" "%spec_2 = OpSpecConstant %u32 "<< workGroupSize.z() << "\n" "%gl_WorkGroupSize = OpSpecConstantComposite %uvec3 %spec_0 %spec_1 %spec_2\n"; } out << "%main = OpFunction %void None %voidf\n" "%label = OpLabel\n" "%idval = OpLoad %uvec3 %id\n" "%ndx = OpCompositeExtract %u32 %idval " << ndx << "\n" "%inloc = OpAccessChain %f32ptr %indata %zero %ndx\n" "%inval = OpLoad %f32 %inloc\n" "%neg = OpFNegate %f32 %inval\n" "%outloc = OpAccessChain %f32ptr %outdata %zero %ndx\n" " OpStore %outloc %neg\n" " OpReturn\n" " OpFunctionEnd\n"; return out.str(); } tcu::TestCaseGroup* createLocalSizeGroup(tcu::TestContext& testCtx, bool useLocalSizeId) { const char* groupName[]{ "localsize", "localsize_id" }; de::MovePtr group (new tcu::TestCaseGroup(testCtx, groupName[useLocalSizeId], "")); ComputeShaderSpec spec; de::Random rnd (deStringHash(group->getName())); const deUint32 numElements = 64u; vector positiveFloats (numElements, 0); vector negativeFloats (numElements, 0); fillRandomScalars(rnd, 1.f, 100.f, &positiveFloats[0], numElements); for (size_t ndx = 0; ndx < numElements; ++ndx) negativeFloats[ndx] = -positiveFloats[ndx]; spec.inputs.push_back(BufferSp(new Float32Buffer(positiveFloats))); spec.outputs.push_back(BufferSp(new Float32Buffer(negativeFloats))); if (useLocalSizeId) { spec.spirvVersion = SPIRV_VERSION_1_5; spec.extensions.push_back("VK_KHR_maintenance4"); } spec.numWorkGroups = IVec3(numElements, 1, 1); spec.assembly = getAsmForLocalSizeTest(true, useLocalSizeId, false, IVec3(1, 1, 1), 0u); group->addChild(new SpvAsmComputeShaderCase(testCtx, "literal_localsize", spec)); spec.assembly = getAsmForLocalSizeTest(true, useLocalSizeId, true, IVec3(1, 1, 1), 0u); group->addChild(new SpvAsmComputeShaderCase(testCtx, "literal_and_specid_localsize", spec)); if (!useLocalSizeId) // dont repeat this test when useLocalSizeId is true { spec.assembly = getAsmForLocalSizeTest(false, false, true, IVec3(1, 1, 1), 0u); group->addChild(new SpvAsmComputeShaderCase(testCtx, "specid_localsize", spec)); } spec.numWorkGroups = IVec3(1, 1, 1); spec.assembly = getAsmForLocalSizeTest(true, useLocalSizeId, false, IVec3(numElements, 1, 1), 0u); group->addChild(new SpvAsmComputeShaderCase(testCtx, "literal_localsize_x", spec)); spec.assembly = getAsmForLocalSizeTest(true, useLocalSizeId, true, IVec3(numElements, 1, 1), 0u); group->addChild(new SpvAsmComputeShaderCase(testCtx, "literal_and_specid_localsize_x", spec)); if (!useLocalSizeId) // dont repeat this test when useLocalSizeId is true { spec.assembly = getAsmForLocalSizeTest(false, false, true, IVec3(numElements, 1, 1), 0u); group->addChild(new SpvAsmComputeShaderCase(testCtx, "specid_localsize_x", spec)); } spec.assembly = getAsmForLocalSizeTest(true, useLocalSizeId, false, IVec3(1, numElements, 1), 1u); group->addChild(new SpvAsmComputeShaderCase(testCtx, "literal_localsize_y", spec)); spec.assembly = getAsmForLocalSizeTest(true, useLocalSizeId, true, IVec3(1, numElements, 1), 1u); group->addChild(new SpvAsmComputeShaderCase(testCtx, "literal_and_specid_localsize_y", spec)); if (!useLocalSizeId) // dont repeat this test when useLocalSizeId is true { spec.assembly = getAsmForLocalSizeTest(false, false, true, IVec3(1, numElements, 1), 1u); group->addChild(new SpvAsmComputeShaderCase(testCtx, "specid_localsize_y", spec)); } spec.assembly = getAsmForLocalSizeTest(true, useLocalSizeId, false, IVec3(1, 1, numElements), 2u); group->addChild(new SpvAsmComputeShaderCase(testCtx, "literal_localsize_z", spec)); spec.assembly = getAsmForLocalSizeTest(true, useLocalSizeId, true, IVec3(1, 1, numElements), 2u); group->addChild(new SpvAsmComputeShaderCase(testCtx, "literal_and_specid_localsize_z", spec)); if (!useLocalSizeId) // dont repeat this test when useLocalSizeId is true { spec.assembly = getAsmForLocalSizeTest(false, false, true, IVec3(1, 1, numElements), 2u); group->addChild(new SpvAsmComputeShaderCase(testCtx, "specid_localsize_z", spec)); } return group.release(); } tcu::TestCaseGroup* createOpNopGroup (tcu::TestContext& testCtx) { // Test the OpNop instruction de::MovePtr group (new tcu::TestCaseGroup(testCtx, "opnop")); ComputeShaderSpec spec; de::Random rnd (deStringHash(group->getName())); const int numElements = 100; vector positiveFloats (numElements, 0); vector negativeFloats (numElements, 0); fillRandomScalars(rnd, 1.f, 100.f, &positiveFloats[0], numElements); for (size_t ndx = 0; ndx < numElements; ++ndx) negativeFloats[ndx] = -positiveFloats[ndx]; spec.assembly = string(getComputeAsmShaderPreamble()) + "OpSource GLSL 430\n" "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" + string(getComputeAsmInputOutputBufferTraits()) + string(getComputeAsmCommonTypes()) + string(getComputeAsmInputOutputBuffer()) + "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%main = OpFunction %void None %voidf\n" "%label = OpLabel\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" " OpNop\n" // Inside a function body "%inloc = OpAccessChain %f32ptr %indata %zero %x\n" "%inval = OpLoad %f32 %inloc\n" "%neg = OpFNegate %f32 %inval\n" "%outloc = OpAccessChain %f32ptr %outdata %zero %x\n" " OpStore %outloc %neg\n" " OpReturn\n" " OpFunctionEnd\n"; spec.inputs.push_back(BufferSp(new Float32Buffer(positiveFloats))); spec.outputs.push_back(BufferSp(new Float32Buffer(negativeFloats))); spec.numWorkGroups = IVec3(numElements, 1, 1); // OpNop appearing at different places group->addChild(new SpvAsmComputeShaderCase(testCtx, "all", spec)); return group.release(); } tcu::TestCaseGroup* createUnusedVariableComputeTests (tcu::TestContext& testCtx) { // Compute shaders with unused variables de::MovePtr group (new tcu::TestCaseGroup(testCtx, "unused_variables")); de::Random rnd (deStringHash(group->getName())); const int numElements = 100; vector positiveFloats (numElements, 0); vector negativeFloats (numElements, 0); fillRandomScalars(rnd, 1.f, 100.f, &positiveFloats[0], numElements); for (size_t ndx = 0; ndx < numElements; ++ndx) negativeFloats[ndx] = -positiveFloats[ndx]; const VariableLocation testLocations[] = { // Set Binding { 0, 5 }, { 5, 5 }, }; for (size_t locationNdx = 0; locationNdx < DE_LENGTH_OF_ARRAY(testLocations); ++locationNdx) { const VariableLocation& location = testLocations[locationNdx]; // Unused variable. { ComputeShaderSpec spec; spec.assembly = string(getComputeAsmShaderPreamble()) + "OpDecorate %id BuiltIn GlobalInvocationId\n" + getUnusedDecorations(location) + string(getComputeAsmInputOutputBufferTraits()) + string(getComputeAsmCommonTypes()) + getUnusedTypesAndConstants() + string(getComputeAsmInputOutputBuffer()) + getUnusedBuffer() + "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%main = OpFunction %void None %voidf\n" "%label = OpLabel\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc = OpAccessChain %f32ptr %indata %zero %x\n" "%inval = OpLoad %f32 %inloc\n" "%neg = OpFNegate %f32 %inval\n" "%outloc = OpAccessChain %f32ptr %outdata %zero %x\n" " OpStore %outloc %neg\n" " OpReturn\n" " OpFunctionEnd\n"; spec.inputs.push_back(BufferSp(new Float32Buffer(positiveFloats))); spec.outputs.push_back(BufferSp(new Float32Buffer(negativeFloats))); spec.numWorkGroups = IVec3(numElements, 1, 1); std::string testName = "variable_" + location.toString(); group->addChild(new SpvAsmComputeShaderCase(testCtx, testName.c_str(), spec)); } // Unused function. { ComputeShaderSpec spec; spec.assembly = string(getComputeAsmShaderPreamble("", "", "", getUnusedEntryPoint())) + "OpDecorate %id BuiltIn GlobalInvocationId\n" + getUnusedDecorations(location) + string(getComputeAsmInputOutputBufferTraits()) + string(getComputeAsmCommonTypes()) + getUnusedTypesAndConstants() + "%c_i32_0 = OpConstant %i32 0\n" "%c_i32_1 = OpConstant %i32 1\n" + string(getComputeAsmInputOutputBuffer()) + getUnusedBuffer() + "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%main = OpFunction %void None %voidf\n" "%label = OpLabel\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc = OpAccessChain %f32ptr %indata %zero %x\n" "%inval = OpLoad %f32 %inloc\n" "%neg = OpFNegate %f32 %inval\n" "%outloc = OpAccessChain %f32ptr %outdata %zero %x\n" " OpStore %outloc %neg\n" " OpReturn\n" " OpFunctionEnd\n" + getUnusedFunctionBody(); spec.inputs.push_back(BufferSp(new Float32Buffer(positiveFloats))); spec.outputs.push_back(BufferSp(new Float32Buffer(negativeFloats))); spec.numWorkGroups = IVec3(numElements, 1, 1); std::string testName = "function_" + location.toString(); group->addChild(new SpvAsmComputeShaderCase(testCtx, testName.c_str(),spec)); } } return group.release(); } template bool compareFUnord (const std::vector& inputs, const vector& outputAllocs, const std::vector& expectedOutputs, TestLog& log) { if (outputAllocs.size() != 1) return false; vector input1Bytes; vector input2Bytes; vector expectedBytes; inputs[0].getBytes(input1Bytes); inputs[1].getBytes(input2Bytes); expectedOutputs[0].getBytes(expectedBytes); const deInt32* const expectedOutputAsInt = reinterpret_cast(&expectedBytes.front()); const deInt32* const outputAsInt = static_cast(outputAllocs[0]->getHostPtr()); const float* const input1AsFloat = reinterpret_cast(&input1Bytes.front()); const float* const input2AsFloat = reinterpret_cast(&input2Bytes.front()); bool returnValue = true; for (size_t idx = 0; idx < expectedBytes.size() / sizeof(deInt32); ++idx) { if (!nanSupported && (tcu::Float32(input1AsFloat[idx]).isNaN() || tcu::Float32(input2AsFloat[idx]).isNaN())) continue; if (outputAsInt[idx] != expectedOutputAsInt[idx]) { log << TestLog::Message << "ERROR: Sub-case failed. inputs: " << input1AsFloat[idx] << "," << input2AsFloat[idx] << " output: " << outputAsInt[idx]<< " expected output: " << expectedOutputAsInt[idx] << TestLog::EndMessage; returnValue = false; } } return returnValue; } typedef VkBool32 (*compareFuncType) (float, float); struct OpFUnordCase { const char* name; const char* opCode; compareFuncType compareFunc; OpFUnordCase (const char* _name, const char* _opCode, compareFuncType _compareFunc) : name (_name) , opCode (_opCode) , compareFunc (_compareFunc) {} }; #define ADD_OPFUNORD_CASE(NAME, OPCODE, OPERATOR) \ do { \ struct compare_##NAME { static VkBool32 compare(float x, float y) { return (x OPERATOR y) ? VK_TRUE : VK_FALSE; } }; \ cases.push_back(OpFUnordCase(#NAME, OPCODE, compare_##NAME::compare)); \ } while (deGetFalse()) tcu::TestCaseGroup* createOpFUnordGroup (tcu::TestContext& testCtx, const bool testWithNan) { const string nan = testWithNan ? "_nan" : ""; const string groupName = "opfunord" + nan; de::MovePtr group (new tcu::TestCaseGroup(testCtx, groupName.c_str(), "Test the OpFUnord* opcodes")); de::Random rnd (deStringHash(group->getName())); const int numElements = 100; vector cases; string extensions = testWithNan ? "OpExtension \"SPV_KHR_float_controls\"\n" : ""; string capabilities = testWithNan ? "OpCapability SignedZeroInfNanPreserve\n" : ""; string exeModes = testWithNan ? "OpExecutionMode %main SignedZeroInfNanPreserve 32\n" : ""; const StringTemplate shaderTemplate ( string(getComputeAsmShaderPreamble(capabilities, extensions, exeModes)) + "OpSource GLSL 430\n" "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" "OpDecorate %buf BufferBlock\n" "OpDecorate %buf2 BufferBlock\n" "OpDecorate %indata1 DescriptorSet 0\n" "OpDecorate %indata1 Binding 0\n" "OpDecorate %indata2 DescriptorSet 0\n" "OpDecorate %indata2 Binding 1\n" "OpDecorate %outdata DescriptorSet 0\n" "OpDecorate %outdata Binding 2\n" "OpDecorate %f32arr ArrayStride 4\n" "OpDecorate %i32arr ArrayStride 4\n" "OpMemberDecorate %buf 0 Offset 0\n" "OpMemberDecorate %buf2 0 Offset 0\n" + string(getComputeAsmCommonTypes()) + "%buf = OpTypeStruct %f32arr\n" "%bufptr = OpTypePointer Uniform %buf\n" "%indata1 = OpVariable %bufptr Uniform\n" "%indata2 = OpVariable %bufptr Uniform\n" "%buf2 = OpTypeStruct %i32arr\n" "%buf2ptr = OpTypePointer Uniform %buf2\n" "%outdata = OpVariable %buf2ptr Uniform\n" "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%consti1 = OpConstant %i32 1\n" "%constf1 = OpConstant %f32 1.0\n" "%main = OpFunction %void None %voidf\n" "%label = OpLabel\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc1 = OpAccessChain %f32ptr %indata1 %zero %x\n" "%inval1 = OpLoad %f32 %inloc1\n" "%inloc2 = OpAccessChain %f32ptr %indata2 %zero %x\n" "%inval2 = OpLoad %f32 %inloc2\n" "%outloc = OpAccessChain %i32ptr %outdata %zero %x\n" "%result = ${OPCODE} %bool %inval1 %inval2\n" "%int_res = OpSelect %i32 %result %consti1 %zero\n" " OpStore %outloc %int_res\n" " OpReturn\n" " OpFunctionEnd\n"); ADD_OPFUNORD_CASE(equal, "OpFUnordEqual", ==); ADD_OPFUNORD_CASE(less, "OpFUnordLessThan", <); ADD_OPFUNORD_CASE(lessequal, "OpFUnordLessThanEqual", <=); ADD_OPFUNORD_CASE(greater, "OpFUnordGreaterThan", >); ADD_OPFUNORD_CASE(greaterequal, "OpFUnordGreaterThanEqual", >=); ADD_OPFUNORD_CASE(notequal, "OpFUnordNotEqual", !=); for (size_t caseNdx = 0; caseNdx < cases.size(); ++caseNdx) { map specializations; ComputeShaderSpec spec; const float NaN = std::numeric_limits::quiet_NaN(); vector inputFloats1 (numElements, 0); vector inputFloats2 (numElements, 0); vector expectedInts (numElements, 0); specializations["OPCODE"] = cases[caseNdx].opCode; spec.assembly = shaderTemplate.specialize(specializations); fillRandomScalars(rnd, 1.f, 100.f, &inputFloats1[0], numElements); for (size_t ndx = 0; ndx < numElements; ++ndx) { switch (ndx % 6) { case 0: inputFloats2[ndx] = inputFloats1[ndx] + 1.0f; break; case 1: inputFloats2[ndx] = inputFloats1[ndx] - 1.0f; break; case 2: inputFloats2[ndx] = inputFloats1[ndx]; break; case 3: inputFloats2[ndx] = NaN; break; case 4: inputFloats2[ndx] = inputFloats1[ndx]; inputFloats1[ndx] = NaN; break; case 5: inputFloats2[ndx] = NaN; inputFloats1[ndx] = NaN; break; } expectedInts[ndx] = tcu::Float32(inputFloats1[ndx]).isNaN() || tcu::Float32(inputFloats2[ndx]).isNaN() || cases[caseNdx].compareFunc(inputFloats1[ndx], inputFloats2[ndx]); } spec.inputs.push_back(BufferSp(new Float32Buffer(inputFloats1))); spec.inputs.push_back(BufferSp(new Float32Buffer(inputFloats2))); spec.outputs.push_back(BufferSp(new Int32Buffer(expectedInts))); spec.numWorkGroups = IVec3(numElements, 1, 1); spec.verifyIO = testWithNan ? &compareFUnord : &compareFUnord; if (testWithNan) { spec.extensions.push_back("VK_KHR_shader_float_controls"); spec.requestedVulkanFeatures.floatControlsProperties.shaderSignedZeroInfNanPreserveFloat32 = DE_TRUE; } group->addChild(new SpvAsmComputeShaderCase(testCtx, cases[caseNdx].name, spec)); } return group.release(); } struct OpAtomicCase { const char* name; const char* assembly; const char* retValAssembly; OpAtomicType opAtomic; deInt32 numOutputElements; OpAtomicCase(const char* _name, const char* _assembly, const char* _retValAssembly, OpAtomicType _opAtomic, deInt32 _numOutputElements) : name (_name) , assembly (_assembly) , retValAssembly (_retValAssembly) , opAtomic (_opAtomic) , numOutputElements (_numOutputElements) {} }; tcu::TestCaseGroup* createOpAtomicGroup (tcu::TestContext& testCtx, bool useStorageBuffer, int numElements = 65535, bool verifyReturnValues = false, bool volatileAtomic = false) { std::string groupName ("opatomic"); if (useStorageBuffer) groupName += "_storage_buffer"; if (verifyReturnValues) groupName += "_return_values"; if (volatileAtomic) groupName += "_volatile"; de::MovePtr group (new tcu::TestCaseGroup(testCtx, groupName.c_str(), "Test the OpAtomic* opcodes")); vector cases; const StringTemplate shaderTemplate ( string("OpCapability Shader\n") + (volatileAtomic ? "OpCapability VulkanMemoryModelKHR\n" : "") + (useStorageBuffer ? "OpExtension \"SPV_KHR_storage_buffer_storage_class\"\n" : "") + (volatileAtomic ? "OpExtension \"SPV_KHR_vulkan_memory_model\"\n" : "") + (volatileAtomic ? "OpMemoryModel Logical VulkanKHR\n" : "OpMemoryModel Logical GLSL450\n") + "OpEntryPoint GLCompute %main \"main\" %id\n" "OpExecutionMode %main LocalSize 1 1 1\n" + "OpSource GLSL 430\n" "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" "OpDecorate %buf ${BLOCK_DECORATION}\n" "OpDecorate %indata DescriptorSet 0\n" "OpDecorate %indata Binding 0\n" "OpDecorate %i32arr ArrayStride 4\n" "OpMemberDecorate %buf 0 Offset 0\n" "OpDecorate %sumbuf ${BLOCK_DECORATION}\n" "OpDecorate %sum DescriptorSet 0\n" "OpDecorate %sum Binding 1\n" "OpMemberDecorate %sumbuf 0 Offset 0\n" "${RETVAL_BUF_DECORATE}" + getComputeAsmCommonTypes("${BLOCK_POINTER_TYPE}") + "%buf = OpTypeStruct %i32arr\n" "%bufptr = OpTypePointer ${BLOCK_POINTER_TYPE} %buf\n" "%indata = OpVariable %bufptr ${BLOCK_POINTER_TYPE}\n" "%sumbuf = OpTypeStruct %i32arr\n" "%sumbufptr = OpTypePointer ${BLOCK_POINTER_TYPE} %sumbuf\n" "%sum = OpVariable %sumbufptr ${BLOCK_POINTER_TYPE}\n" "${RETVAL_BUF_DECL}" "%id = OpVariable %uvec3ptr Input\n" "%minusone = OpConstant %i32 -1\n" "%zero = OpConstant %i32 0\n" "%one = OpConstant %u32 1\n" "%two = OpConstant %i32 2\n" "%five = OpConstant %i32 5\n" "%volbit = OpConstant %i32 32768\n" "%main = OpFunction %void None %voidf\n" "%label = OpLabel\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc = OpAccessChain %i32ptr %indata %zero %x\n" "%inval = OpLoad %i32 %inloc\n" "%outloc = OpAccessChain %i32ptr %sum %zero ${INDEX}\n" "${INSTRUCTION}" "${RETVAL_ASSEMBLY}" " OpReturn\n" " OpFunctionEnd\n"); #define ADD_OPATOMIC_CASE(NAME, ASSEMBLY, RETVAL_ASSEMBLY, OPATOMIC, NUM_OUTPUT_ELEMENTS) \ do { \ cases.push_back(OpAtomicCase(#NAME, ASSEMBLY, RETVAL_ASSEMBLY, OPATOMIC, NUM_OUTPUT_ELEMENTS)); \ } while (deGetFalse()) #define ADD_OPATOMIC_CASE_1(NAME, ASSEMBLY, RETVAL_ASSEMBLY, OPATOMIC) ADD_OPATOMIC_CASE(NAME, ASSEMBLY, RETVAL_ASSEMBLY, OPATOMIC, 1) #define ADD_OPATOMIC_CASE_N(NAME, ASSEMBLY, RETVAL_ASSEMBLY, OPATOMIC) ADD_OPATOMIC_CASE(NAME, ASSEMBLY, RETVAL_ASSEMBLY, OPATOMIC, numElements) ADD_OPATOMIC_CASE_1(iadd, "%retv = OpAtomicIAdd %i32 %outloc ${SCOPE} ${SEMANTICS} %inval\n", " OpStore %retloc %retv\n", OPATOMIC_IADD ); ADD_OPATOMIC_CASE_1(isub, "%retv = OpAtomicISub %i32 %outloc ${SCOPE} ${SEMANTICS} %inval\n", " OpStore %retloc %retv\n", OPATOMIC_ISUB ); ADD_OPATOMIC_CASE_1(iinc, "%retv = OpAtomicIIncrement %i32 %outloc ${SCOPE} ${SEMANTICS}\n", " OpStore %retloc %retv\n", OPATOMIC_IINC ); ADD_OPATOMIC_CASE_1(idec, "%retv = OpAtomicIDecrement %i32 %outloc ${SCOPE} ${SEMANTICS}\n", " OpStore %retloc %retv\n", OPATOMIC_IDEC ); if (!verifyReturnValues) { ADD_OPATOMIC_CASE_N(load, "%inval2 = OpAtomicLoad %i32 %inloc ${SCOPE} ${SEMANTICS}\n" " OpStore %outloc %inval2\n", "", OPATOMIC_LOAD ); ADD_OPATOMIC_CASE_N(store, " OpAtomicStore %outloc ${SCOPE} ${SEMANTICS} %inval\n", "", OPATOMIC_STORE ); } ADD_OPATOMIC_CASE_N(compex, "%even = OpSMod %i32 %inval %two\n" " OpStore %outloc %even\n" "%retv = OpAtomicCompareExchange %i32 %outloc ${SCOPE} ${SEMANTICS} ${SEMANTICS} %minusone %zero\n", " OpStore %retloc %retv\n", OPATOMIC_COMPEX ); #undef ADD_OPATOMIC_CASE #undef ADD_OPATOMIC_CASE_1 #undef ADD_OPATOMIC_CASE_N for (size_t caseNdx = 0; caseNdx < cases.size(); ++caseNdx) { map specializations; ComputeShaderSpec spec; vector inputInts (numElements, 0); vector expected (cases[caseNdx].numOutputElements, -1); if (volatileAtomic) { spec.extensions.push_back("VK_KHR_vulkan_memory_model"); spec.requestedVulkanFeatures.extVulkanMemoryModel.vulkanMemoryModel = true; // volatile, queuefamily scope specializations["SEMANTICS"] = "%volbit"; specializations["SCOPE"] = "%five"; } else { // non-volatile, device scope specializations["SEMANTICS"] = "%zero"; specializations["SCOPE"] = "%one"; } specializations["INDEX"] = (cases[caseNdx].numOutputElements == 1) ? "%zero" : "%x"; specializations["INSTRUCTION"] = cases[caseNdx].assembly; specializations["BLOCK_DECORATION"] = useStorageBuffer ? "Block" : "BufferBlock"; specializations["BLOCK_POINTER_TYPE"] = useStorageBuffer ? "StorageBuffer" : "Uniform"; if (verifyReturnValues) { const StringTemplate blockDecoration ( "\n" "OpDecorate %retbuf ${BLOCK_DECORATION}\n" "OpDecorate %ret DescriptorSet 0\n" "OpDecorate %ret Binding 2\n" "OpMemberDecorate %retbuf 0 Offset 0\n\n"); const StringTemplate blockDeclaration ( "\n" "%retbuf = OpTypeStruct %i32arr\n" "%retbufptr = OpTypePointer ${BLOCK_POINTER_TYPE} %retbuf\n" "%ret = OpVariable %retbufptr ${BLOCK_POINTER_TYPE}\n\n"); specializations["RETVAL_ASSEMBLY"] = "%retloc = OpAccessChain %i32ptr %ret %zero %x\n" + std::string(cases[caseNdx].retValAssembly); specializations["RETVAL_BUF_DECORATE"] = blockDecoration.specialize(specializations); specializations["RETVAL_BUF_DECL"] = blockDeclaration.specialize(specializations); } else { specializations["RETVAL_ASSEMBLY"] = ""; specializations["RETVAL_BUF_DECORATE"] = ""; specializations["RETVAL_BUF_DECL"] = ""; } spec.assembly = shaderTemplate.specialize(specializations); // Specialize one more time, to catch things that were in a template parameter const StringTemplate assemblyTemplate(spec.assembly); spec.assembly = assemblyTemplate.specialize(specializations); if (useStorageBuffer) spec.extensions.push_back("VK_KHR_storage_buffer_storage_class"); spec.inputs.push_back(BufferSp(new OpAtomicBuffer(numElements, cases[caseNdx].numOutputElements, cases[caseNdx].opAtomic, BUFFERTYPE_INPUT))); spec.outputs.push_back(BufferSp(new OpAtomicBuffer(numElements, cases[caseNdx].numOutputElements, cases[caseNdx].opAtomic, BUFFERTYPE_EXPECTED))); if (verifyReturnValues) spec.outputs.push_back(BufferSp(new OpAtomicBuffer(numElements, cases[caseNdx].numOutputElements, cases[caseNdx].opAtomic, BUFFERTYPE_ATOMIC_RET))); spec.numWorkGroups = IVec3(numElements, 1, 1); if (verifyReturnValues) { switch (cases[caseNdx].opAtomic) { case OPATOMIC_IADD: spec.verifyIO = OpAtomicBuffer::compareWithRetvals; break; case OPATOMIC_ISUB: spec.verifyIO = OpAtomicBuffer::compareWithRetvals; break; case OPATOMIC_IINC: spec.verifyIO = OpAtomicBuffer::compareWithRetvals; break; case OPATOMIC_IDEC: spec.verifyIO = OpAtomicBuffer::compareWithRetvals; break; case OPATOMIC_COMPEX: spec.verifyIO = OpAtomicBuffer::compareWithRetvals; break; default: DE_FATAL("Unsupported OpAtomic type for return value verification"); } } group->addChild(new SpvAsmComputeShaderCase(testCtx, cases[caseNdx].name, spec)); } return group.release(); } tcu::TestCaseGroup* createOpLineGroup (tcu::TestContext& testCtx) { de::MovePtr group (new tcu::TestCaseGroup(testCtx, "opline", "Test the OpLine instruction")); ComputeShaderSpec spec; de::Random rnd (deStringHash(group->getName())); const int numElements = 100; vector positiveFloats (numElements, 0); vector negativeFloats (numElements, 0); fillRandomScalars(rnd, 1.f, 100.f, &positiveFloats[0], numElements); for (size_t ndx = 0; ndx < numElements; ++ndx) negativeFloats[ndx] = -positiveFloats[ndx]; spec.assembly = string(getComputeAsmShaderPreamble()) + "%fname1 = OpString \"negateInputs.comp\"\n" "%fname2 = OpString \"negateInputs\"\n" "OpSource GLSL 430\n" "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" + string(getComputeAsmInputOutputBufferTraits()) + "OpLine %fname1 0 0\n" // At the earliest possible position + string(getComputeAsmCommonTypes()) + string(getComputeAsmInputOutputBuffer()) + "OpLine %fname1 0 1\n" // Multiple OpLines in sequence "OpLine %fname2 1 0\n" // Different filenames "OpLine %fname1 1000 100000\n" "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "OpLine %fname1 1 1\n" // Before a function "%main = OpFunction %void None %voidf\n" "%label = OpLabel\n" "OpLine %fname1 1 1\n" // In a function "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc = OpAccessChain %f32ptr %indata %zero %x\n" "%inval = OpLoad %f32 %inloc\n" "%neg = OpFNegate %f32 %inval\n" "%outloc = OpAccessChain %f32ptr %outdata %zero %x\n" " OpStore %outloc %neg\n" " OpReturn\n" " OpFunctionEnd\n"; spec.inputs.push_back(BufferSp(new Float32Buffer(positiveFloats))); spec.outputs.push_back(BufferSp(new Float32Buffer(negativeFloats))); spec.numWorkGroups = IVec3(numElements, 1, 1); group->addChild(new SpvAsmComputeShaderCase(testCtx, "all", spec)); return group.release(); } bool veryfiBinaryShader (const ProgramBinary& binary) { const size_t paternCount = 3u; bool paternsCheck[paternCount] = { false, false, false }; const string patersns[paternCount] = { "VULKAN CTS", "Negative values", "Date: 2017/09/21" }; size_t paternNdx = 0u; for (size_t ndx = 0u; ndx < binary.getSize(); ++ndx) { if (false == paternsCheck[paternNdx] && patersns[paternNdx][0] == static_cast(binary.getBinary()[ndx]) && deMemoryEqual((const char*)&binary.getBinary()[ndx], &patersns[paternNdx][0], patersns[paternNdx].length())) { paternsCheck[paternNdx]= true; paternNdx++; if (paternNdx == paternCount) break; } } for (size_t ndx = 0u; ndx < paternCount; ++ndx) { if (!paternsCheck[ndx]) return false; } return true; } tcu::TestCaseGroup* createOpModuleProcessedGroup (tcu::TestContext& testCtx) { de::MovePtr group (new tcu::TestCaseGroup(testCtx, "opmoduleprocessed", "Test the OpModuleProcessed instruction")); ComputeShaderSpec spec; de::Random rnd (deStringHash(group->getName())); const int numElements = 10; vector positiveFloats (numElements, 0); vector negativeFloats (numElements, 0); fillRandomScalars(rnd, 1.f, 100.f, &positiveFloats[0], numElements); for (size_t ndx = 0; ndx < numElements; ++ndx) negativeFloats[ndx] = -positiveFloats[ndx]; spec.assembly = string(getComputeAsmShaderPreamble()) + "%fname = OpString \"negateInputs.comp\"\n" "OpSource GLSL 430\n" "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpModuleProcessed \"VULKAN CTS\"\n" //OpModuleProcessed; "OpModuleProcessed \"Negative values\"\n" "OpModuleProcessed \"Date: 2017/09/21\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" + string(getComputeAsmInputOutputBufferTraits()) + string(getComputeAsmCommonTypes()) + string(getComputeAsmInputOutputBuffer()) + "OpLine %fname 0 1\n" "OpLine %fname 1000 1\n" "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%main = OpFunction %void None %voidf\n" "%label = OpLabel\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc = OpAccessChain %f32ptr %indata %zero %x\n" "%inval = OpLoad %f32 %inloc\n" "%neg = OpFNegate %f32 %inval\n" "%outloc = OpAccessChain %f32ptr %outdata %zero %x\n" " OpStore %outloc %neg\n" " OpReturn\n" " OpFunctionEnd\n"; spec.inputs.push_back(BufferSp(new Float32Buffer(positiveFloats))); spec.outputs.push_back(BufferSp(new Float32Buffer(negativeFloats))); spec.numWorkGroups = IVec3(numElements, 1, 1); spec.verifyBinary = veryfiBinaryShader; spec.spirvVersion = SPIRV_VERSION_1_3; group->addChild(new SpvAsmComputeShaderCase(testCtx, "all", spec)); return group.release(); } tcu::TestCaseGroup* createOpNoLineGroup (tcu::TestContext& testCtx) { de::MovePtr group (new tcu::TestCaseGroup(testCtx, "opnoline", "Test the OpNoLine instruction")); ComputeShaderSpec spec; de::Random rnd (deStringHash(group->getName())); const int numElements = 100; vector positiveFloats (numElements, 0); vector negativeFloats (numElements, 0); fillRandomScalars(rnd, 1.f, 100.f, &positiveFloats[0], numElements); for (size_t ndx = 0; ndx < numElements; ++ndx) negativeFloats[ndx] = -positiveFloats[ndx]; spec.assembly = string(getComputeAsmShaderPreamble()) + "%fname = OpString \"negateInputs.comp\"\n" "OpSource GLSL 430\n" "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" + string(getComputeAsmInputOutputBufferTraits()) + "OpNoLine\n" // At the earliest possible position, without preceding OpLine + string(getComputeAsmCommonTypes()) + string(getComputeAsmInputOutputBuffer()) + "OpLine %fname 0 1\n" "OpNoLine\n" // Immediately following a preceding OpLine "OpLine %fname 1000 1\n" "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "OpNoLine\n" // Contents after the previous OpLine "%main = OpFunction %void None %voidf\n" "%label = OpLabel\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "OpNoLine\n" // Multiple OpNoLine "OpNoLine\n" "OpNoLine\n" "%inloc = OpAccessChain %f32ptr %indata %zero %x\n" "%inval = OpLoad %f32 %inloc\n" "%neg = OpFNegate %f32 %inval\n" "%outloc = OpAccessChain %f32ptr %outdata %zero %x\n" " OpStore %outloc %neg\n" " OpReturn\n" " OpFunctionEnd\n"; spec.inputs.push_back(BufferSp(new Float32Buffer(positiveFloats))); spec.outputs.push_back(BufferSp(new Float32Buffer(negativeFloats))); spec.numWorkGroups = IVec3(numElements, 1, 1); group->addChild(new SpvAsmComputeShaderCase(testCtx, "all", spec)); return group.release(); } // Compare instruction for the contraction compute case. // Returns true if the output is what is expected from the test case. bool compareNoContractCase(const std::vector&, const vector& outputAllocs, const std::vector& expectedOutputs, TestLog&) { if (outputAllocs.size() != 1) return false; // Only size is needed because we are not comparing the exact values. size_t byteSize = expectedOutputs[0].getByteSize(); const float* outputAsFloat = static_cast(outputAllocs[0]->getHostPtr()); for(size_t i = 0; i < byteSize / sizeof(float); ++i) { if (outputAsFloat[i] != 0.f && outputAsFloat[i] != -ldexp(1, -24)) { return false; } } return true; } tcu::TestCaseGroup* createNoContractionGroup (tcu::TestContext& testCtx) { de::MovePtr group (new tcu::TestCaseGroup(testCtx, "nocontraction", "Test the NoContraction decoration")); vector cases; const int numElements = 100; vector inputFloats1 (numElements, 0); vector inputFloats2 (numElements, 0); vector outputFloats (numElements, 0); const StringTemplate shaderTemplate ( string(getComputeAsmShaderPreamble()) + "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" "${DECORATION}\n" "OpDecorate %buf BufferBlock\n" "OpDecorate %indata1 DescriptorSet 0\n" "OpDecorate %indata1 Binding 0\n" "OpDecorate %indata2 DescriptorSet 0\n" "OpDecorate %indata2 Binding 1\n" "OpDecorate %outdata DescriptorSet 0\n" "OpDecorate %outdata Binding 2\n" "OpDecorate %f32arr ArrayStride 4\n" "OpMemberDecorate %buf 0 Offset 0\n" + string(getComputeAsmCommonTypes()) + "%buf = OpTypeStruct %f32arr\n" "%bufptr = OpTypePointer Uniform %buf\n" "%indata1 = OpVariable %bufptr Uniform\n" "%indata2 = OpVariable %bufptr Uniform\n" "%outdata = OpVariable %bufptr Uniform\n" "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%c_f_m1 = OpConstant %f32 -1.\n" "%main = OpFunction %void None %voidf\n" "%label = OpLabel\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc1 = OpAccessChain %f32ptr %indata1 %zero %x\n" "%inval1 = OpLoad %f32 %inloc1\n" "%inloc2 = OpAccessChain %f32ptr %indata2 %zero %x\n" "%inval2 = OpLoad %f32 %inloc2\n" "%mul = OpFMul %f32 %inval1 %inval2\n" "%add = OpFAdd %f32 %mul %c_f_m1\n" "%outloc = OpAccessChain %f32ptr %outdata %zero %x\n" " OpStore %outloc %add\n" " OpReturn\n" " OpFunctionEnd\n"); cases.push_back(CaseParameter("multiplication", "OpDecorate %mul NoContraction")); cases.push_back(CaseParameter("addition", "OpDecorate %add NoContraction")); cases.push_back(CaseParameter("both", "OpDecorate %mul NoContraction\nOpDecorate %add NoContraction")); for (size_t ndx = 0; ndx < numElements; ++ndx) { inputFloats1[ndx] = 1.f + std::ldexp(1.f, -23); // 1 + 2^-23. inputFloats2[ndx] = 1.f - std::ldexp(1.f, -23); // 1 - 2^-23. // Result for (1 + 2^-23) * (1 - 2^-23) - 1. With NoContraction, the multiplication will be // conducted separately and the result is rounded to 1, or 0x1.fffffcp-1 // So the final result will be 0.f or 0x1p-24. // If the operation is combined into a precise fused multiply-add, then the result would be // 2^-46 (0xa8800000). outputFloats[ndx] = 0.f; } for (size_t caseNdx = 0; caseNdx < cases.size(); ++caseNdx) { map specializations; ComputeShaderSpec spec; specializations["DECORATION"] = cases[caseNdx].param; spec.assembly = shaderTemplate.specialize(specializations); spec.inputs.push_back(BufferSp(new Float32Buffer(inputFloats1))); spec.inputs.push_back(BufferSp(new Float32Buffer(inputFloats2))); spec.outputs.push_back(BufferSp(new Float32Buffer(outputFloats))); spec.numWorkGroups = IVec3(numElements, 1, 1); // Check against the two possible answers based on rounding mode. spec.verifyIO = &compareNoContractCase; group->addChild(new SpvAsmComputeShaderCase(testCtx, cases[caseNdx].name, spec)); } return group.release(); } bool compareFRem(const std::vector&, const vector& outputAllocs, const std::vector& expectedOutputs, TestLog&) { if (outputAllocs.size() != 1) return false; vector expectedBytes; expectedOutputs[0].getBytes(expectedBytes); const float* expectedOutputAsFloat = reinterpret_cast(&expectedBytes.front()); const float* outputAsFloat = static_cast(outputAllocs[0]->getHostPtr()); for (size_t idx = 0; idx < expectedBytes.size() / sizeof(float); ++idx) { const float f0 = expectedOutputAsFloat[idx]; const float f1 = outputAsFloat[idx]; // \todo relative error needs to be fairly high because FRem may be implemented as // (roughly) frac(a/b)*b, so LSB errors can be magnified. But this should be fine for now. if (deFloatAbs((f1 - f0) / f0) > 0.02) return false; } return true; } tcu::TestCaseGroup* createOpFRemGroup (tcu::TestContext& testCtx) { de::MovePtr group (new tcu::TestCaseGroup(testCtx, "opfrem", "Test the OpFRem instruction")); ComputeShaderSpec spec; de::Random rnd (deStringHash(group->getName())); const int numElements = 200; vector inputFloats1 (numElements, 0); vector inputFloats2 (numElements, 0); vector outputFloats (numElements, 0); fillRandomScalars(rnd, -10000.f, 10000.f, &inputFloats1[0], numElements); fillRandomScalars(rnd, -100.f, 100.f, &inputFloats2[0], numElements); for (size_t ndx = 0; ndx < numElements; ++ndx) { // Guard against divisors near zero. if (std::fabs(inputFloats2[ndx]) < 1e-3) inputFloats2[ndx] = 8.f; // The return value of std::fmod() has the same sign as its first operand, which is how OpFRem spec'd. outputFloats[ndx] = std::fmod(inputFloats1[ndx], inputFloats2[ndx]); } spec.assembly = string(getComputeAsmShaderPreamble()) + "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" "OpDecorate %buf BufferBlock\n" "OpDecorate %indata1 DescriptorSet 0\n" "OpDecorate %indata1 Binding 0\n" "OpDecorate %indata2 DescriptorSet 0\n" "OpDecorate %indata2 Binding 1\n" "OpDecorate %outdata DescriptorSet 0\n" "OpDecorate %outdata Binding 2\n" "OpDecorate %f32arr ArrayStride 4\n" "OpMemberDecorate %buf 0 Offset 0\n" + string(getComputeAsmCommonTypes()) + "%buf = OpTypeStruct %f32arr\n" "%bufptr = OpTypePointer Uniform %buf\n" "%indata1 = OpVariable %bufptr Uniform\n" "%indata2 = OpVariable %bufptr Uniform\n" "%outdata = OpVariable %bufptr Uniform\n" "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%main = OpFunction %void None %voidf\n" "%label = OpLabel\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc1 = OpAccessChain %f32ptr %indata1 %zero %x\n" "%inval1 = OpLoad %f32 %inloc1\n" "%inloc2 = OpAccessChain %f32ptr %indata2 %zero %x\n" "%inval2 = OpLoad %f32 %inloc2\n" "%rem = OpFRem %f32 %inval1 %inval2\n" "%outloc = OpAccessChain %f32ptr %outdata %zero %x\n" " OpStore %outloc %rem\n" " OpReturn\n" " OpFunctionEnd\n"; spec.inputs.push_back(BufferSp(new Float32Buffer(inputFloats1))); spec.inputs.push_back(BufferSp(new Float32Buffer(inputFloats2))); spec.outputs.push_back(BufferSp(new Float32Buffer(outputFloats))); spec.numWorkGroups = IVec3(numElements, 1, 1); spec.verifyIO = &compareFRem; group->addChild(new SpvAsmComputeShaderCase(testCtx, "all", spec)); return group.release(); } bool compareNMin (const std::vector&, const vector& outputAllocs, const std::vector& expectedOutputs, TestLog&) { if (outputAllocs.size() != 1) return false; const BufferSp& expectedOutput (expectedOutputs[0].getBuffer()); std::vector data; expectedOutput->getBytes(data); const float* const expectedOutputAsFloat = reinterpret_cast(&data.front()); const float* const outputAsFloat = static_cast(outputAllocs[0]->getHostPtr()); for (size_t idx = 0; idx < expectedOutput->getByteSize() / sizeof(float); ++idx) { const float f0 = expectedOutputAsFloat[idx]; const float f1 = outputAsFloat[idx]; // For NMin, we accept NaN as output if both inputs were NaN. // Otherwise the NaN is the wrong choise, as on architectures that // do not handle NaN, those are huge values. if (!(tcu::Float32(f1).isNaN() && tcu::Float32(f0).isNaN()) && deFloatAbs(f1 - f0) > 0.00001f) return false; } return true; } tcu::TestCaseGroup* createOpNMinGroup (tcu::TestContext& testCtx) { de::MovePtr group (new tcu::TestCaseGroup(testCtx, "opnmin", "Test the OpNMin instruction")); ComputeShaderSpec spec; de::Random rnd (deStringHash(group->getName())); const int numElements = 200; vector inputFloats1 (numElements, 0); vector inputFloats2 (numElements, 0); vector outputFloats (numElements, 0); fillRandomScalars(rnd, -10000.f, 10000.f, &inputFloats1[0], numElements); fillRandomScalars(rnd, -10000.f, 10000.f, &inputFloats2[0], numElements); // Make the first case a full-NAN case. inputFloats1[0] = TCU_NAN; inputFloats2[0] = TCU_NAN; for (size_t ndx = 0; ndx < numElements; ++ndx) { // By default, pick the smallest outputFloats[ndx] = std::min(inputFloats1[ndx], inputFloats2[ndx]); // Make half of the cases NaN cases if ((ndx & 1) == 0) { // Alternate between the NaN operand if ((ndx & 2) == 0) { outputFloats[ndx] = inputFloats2[ndx]; inputFloats1[ndx] = TCU_NAN; } else { outputFloats[ndx] = inputFloats1[ndx]; inputFloats2[ndx] = TCU_NAN; } } } spec.assembly = "OpCapability Shader\n" "%std450 = OpExtInstImport \"GLSL.std.450\"\n" "OpMemoryModel Logical GLSL450\n" "OpEntryPoint GLCompute %main \"main\" %id\n" "OpExecutionMode %main LocalSize 1 1 1\n" "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" "OpDecorate %buf BufferBlock\n" "OpDecorate %indata1 DescriptorSet 0\n" "OpDecorate %indata1 Binding 0\n" "OpDecorate %indata2 DescriptorSet 0\n" "OpDecorate %indata2 Binding 1\n" "OpDecorate %outdata DescriptorSet 0\n" "OpDecorate %outdata Binding 2\n" "OpDecorate %f32arr ArrayStride 4\n" "OpMemberDecorate %buf 0 Offset 0\n" + string(getComputeAsmCommonTypes()) + "%buf = OpTypeStruct %f32arr\n" "%bufptr = OpTypePointer Uniform %buf\n" "%indata1 = OpVariable %bufptr Uniform\n" "%indata2 = OpVariable %bufptr Uniform\n" "%outdata = OpVariable %bufptr Uniform\n" "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%main = OpFunction %void None %voidf\n" "%label = OpLabel\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc1 = OpAccessChain %f32ptr %indata1 %zero %x\n" "%inval1 = OpLoad %f32 %inloc1\n" "%inloc2 = OpAccessChain %f32ptr %indata2 %zero %x\n" "%inval2 = OpLoad %f32 %inloc2\n" "%rem = OpExtInst %f32 %std450 NMin %inval1 %inval2\n" "%outloc = OpAccessChain %f32ptr %outdata %zero %x\n" " OpStore %outloc %rem\n" " OpReturn\n" " OpFunctionEnd\n"; spec.inputs.push_back(BufferSp(new Float32Buffer(inputFloats1))); spec.inputs.push_back(BufferSp(new Float32Buffer(inputFloats2))); spec.outputs.push_back(BufferSp(new Float32Buffer(outputFloats))); spec.numWorkGroups = IVec3(numElements, 1, 1); spec.verifyIO = &compareNMin; group->addChild(new SpvAsmComputeShaderCase(testCtx, "all", spec)); return group.release(); } bool compareNMax (const std::vector&, const vector& outputAllocs, const std::vector& expectedOutputs, TestLog&) { if (outputAllocs.size() != 1) return false; const BufferSp& expectedOutput = expectedOutputs[0].getBuffer(); std::vector data; expectedOutput->getBytes(data); const float* const expectedOutputAsFloat = reinterpret_cast(&data.front()); const float* const outputAsFloat = static_cast(outputAllocs[0]->getHostPtr()); for (size_t idx = 0; idx < expectedOutput->getByteSize() / sizeof(float); ++idx) { const float f0 = expectedOutputAsFloat[idx]; const float f1 = outputAsFloat[idx]; // For NMax, NaN is considered acceptable result, since in // architectures that do not handle NaNs, those are huge values. if (!tcu::Float32(f1).isNaN() && deFloatAbs(f1 - f0) > 0.00001f) return false; } return true; } tcu::TestCaseGroup* createOpNMaxGroup (tcu::TestContext& testCtx) { de::MovePtr group(new tcu::TestCaseGroup(testCtx, "opnmax", "Test the OpNMax instruction")); ComputeShaderSpec spec; de::Random rnd (deStringHash(group->getName())); const int numElements = 200; vector inputFloats1 (numElements, 0); vector inputFloats2 (numElements, 0); vector outputFloats (numElements, 0); fillRandomScalars(rnd, -10000.f, 10000.f, &inputFloats1[0], numElements); fillRandomScalars(rnd, -10000.f, 10000.f, &inputFloats2[0], numElements); // Make the first case a full-NAN case. inputFloats1[0] = TCU_NAN; inputFloats2[0] = TCU_NAN; for (size_t ndx = 0; ndx < numElements; ++ndx) { // By default, pick the biggest outputFloats[ndx] = std::max(inputFloats1[ndx], inputFloats2[ndx]); // Make half of the cases NaN cases if ((ndx & 1) == 0) { // Alternate between the NaN operand if ((ndx & 2) == 0) { outputFloats[ndx] = inputFloats2[ndx]; inputFloats1[ndx] = TCU_NAN; } else { outputFloats[ndx] = inputFloats1[ndx]; inputFloats2[ndx] = TCU_NAN; } } } spec.assembly = "OpCapability Shader\n" "%std450 = OpExtInstImport \"GLSL.std.450\"\n" "OpMemoryModel Logical GLSL450\n" "OpEntryPoint GLCompute %main \"main\" %id\n" "OpExecutionMode %main LocalSize 1 1 1\n" "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" "OpDecorate %buf BufferBlock\n" "OpDecorate %indata1 DescriptorSet 0\n" "OpDecorate %indata1 Binding 0\n" "OpDecorate %indata2 DescriptorSet 0\n" "OpDecorate %indata2 Binding 1\n" "OpDecorate %outdata DescriptorSet 0\n" "OpDecorate %outdata Binding 2\n" "OpDecorate %f32arr ArrayStride 4\n" "OpMemberDecorate %buf 0 Offset 0\n" + string(getComputeAsmCommonTypes()) + "%buf = OpTypeStruct %f32arr\n" "%bufptr = OpTypePointer Uniform %buf\n" "%indata1 = OpVariable %bufptr Uniform\n" "%indata2 = OpVariable %bufptr Uniform\n" "%outdata = OpVariable %bufptr Uniform\n" "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%main = OpFunction %void None %voidf\n" "%label = OpLabel\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc1 = OpAccessChain %f32ptr %indata1 %zero %x\n" "%inval1 = OpLoad %f32 %inloc1\n" "%inloc2 = OpAccessChain %f32ptr %indata2 %zero %x\n" "%inval2 = OpLoad %f32 %inloc2\n" "%rem = OpExtInst %f32 %std450 NMax %inval1 %inval2\n" "%outloc = OpAccessChain %f32ptr %outdata %zero %x\n" " OpStore %outloc %rem\n" " OpReturn\n" " OpFunctionEnd\n"; spec.inputs.push_back(BufferSp(new Float32Buffer(inputFloats1))); spec.inputs.push_back(BufferSp(new Float32Buffer(inputFloats2))); spec.outputs.push_back(BufferSp(new Float32Buffer(outputFloats))); spec.numWorkGroups = IVec3(numElements, 1, 1); spec.verifyIO = &compareNMax; group->addChild(new SpvAsmComputeShaderCase(testCtx, "all", spec)); return group.release(); } bool compareNClamp (const std::vector&, const vector& outputAllocs, const std::vector& expectedOutputs, TestLog&) { if (outputAllocs.size() != 1) return false; const BufferSp& expectedOutput = expectedOutputs[0].getBuffer(); std::vector data; expectedOutput->getBytes(data); const float* const expectedOutputAsFloat = reinterpret_cast(&data.front()); const float* const outputAsFloat = static_cast(outputAllocs[0]->getHostPtr()); for (size_t idx = 0; idx < expectedOutput->getByteSize() / sizeof(float) / 2; ++idx) { const float e0 = expectedOutputAsFloat[idx * 2]; const float e1 = expectedOutputAsFloat[idx * 2 + 1]; const float res = outputAsFloat[idx]; // For NClamp, we have two possible outcomes based on // whether NaNs are handled or not. // If either min or max value is NaN, the result is undefined, // so this test doesn't stress those. If the clamped value is // NaN, and NaNs are handled, the result is min; if NaNs are not // handled, they are big values that result in max. // If all three parameters are NaN, the result should be NaN. if (!((tcu::Float32(e0).isNaN() && tcu::Float32(res).isNaN()) || (deFloatAbs(e0 - res) < 0.00001f) || (deFloatAbs(e1 - res) < 0.00001f))) return false; } return true; } tcu::TestCaseGroup* createOpNClampGroup (tcu::TestContext& testCtx) { de::MovePtr group (new tcu::TestCaseGroup(testCtx, "opnclamp", "Test the OpNClamp instruction")); ComputeShaderSpec spec; de::Random rnd (deStringHash(group->getName())); const int numElements = 200; vector inputFloats1 (numElements, 0); vector inputFloats2 (numElements, 0); vector inputFloats3 (numElements, 0); vector outputFloats (numElements * 2, 0); fillRandomScalars(rnd, -10000.f, 10000.f, &inputFloats1[0], numElements); fillRandomScalars(rnd, -10000.f, 10000.f, &inputFloats2[0], numElements); fillRandomScalars(rnd, -10000.f, 10000.f, &inputFloats3[0], numElements); for (size_t ndx = 0; ndx < numElements; ++ndx) { // Results are only defined if max value is bigger than min value. if (inputFloats2[ndx] > inputFloats3[ndx]) { float t = inputFloats2[ndx]; inputFloats2[ndx] = inputFloats3[ndx]; inputFloats3[ndx] = t; } // By default, do the clamp, setting both possible answers float defaultRes = std::min(std::max(inputFloats1[ndx], inputFloats2[ndx]), inputFloats3[ndx]); float maxResA = std::max(inputFloats1[ndx], inputFloats2[ndx]); float maxResB = maxResA; // Alternate between the NaN cases if (ndx & 1) { inputFloats1[ndx] = TCU_NAN; // If NaN is handled, the result should be same as the clamp minimum. // If NaN is not handled, the result should clamp to the clamp maximum. maxResA = inputFloats2[ndx]; maxResB = inputFloats3[ndx]; } else { // Not a NaN case - only one legal result. maxResA = defaultRes; maxResB = defaultRes; } outputFloats[ndx * 2] = maxResA; outputFloats[ndx * 2 + 1] = maxResB; } // Make the first case a full-NAN case. inputFloats1[0] = TCU_NAN; inputFloats2[0] = TCU_NAN; inputFloats3[0] = TCU_NAN; outputFloats[0] = TCU_NAN; outputFloats[1] = TCU_NAN; spec.assembly = "OpCapability Shader\n" "%std450 = OpExtInstImport \"GLSL.std.450\"\n" "OpMemoryModel Logical GLSL450\n" "OpEntryPoint GLCompute %main \"main\" %id\n" "OpExecutionMode %main LocalSize 1 1 1\n" "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" "OpDecorate %buf BufferBlock\n" "OpDecorate %indata1 DescriptorSet 0\n" "OpDecorate %indata1 Binding 0\n" "OpDecorate %indata2 DescriptorSet 0\n" "OpDecorate %indata2 Binding 1\n" "OpDecorate %indata3 DescriptorSet 0\n" "OpDecorate %indata3 Binding 2\n" "OpDecorate %outdata DescriptorSet 0\n" "OpDecorate %outdata Binding 3\n" "OpDecorate %f32arr ArrayStride 4\n" "OpMemberDecorate %buf 0 Offset 0\n" + string(getComputeAsmCommonTypes()) + "%buf = OpTypeStruct %f32arr\n" "%bufptr = OpTypePointer Uniform %buf\n" "%indata1 = OpVariable %bufptr Uniform\n" "%indata2 = OpVariable %bufptr Uniform\n" "%indata3 = OpVariable %bufptr Uniform\n" "%outdata = OpVariable %bufptr Uniform\n" "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%main = OpFunction %void None %voidf\n" "%label = OpLabel\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc1 = OpAccessChain %f32ptr %indata1 %zero %x\n" "%inval1 = OpLoad %f32 %inloc1\n" "%inloc2 = OpAccessChain %f32ptr %indata2 %zero %x\n" "%inval2 = OpLoad %f32 %inloc2\n" "%inloc3 = OpAccessChain %f32ptr %indata3 %zero %x\n" "%inval3 = OpLoad %f32 %inloc3\n" "%rem = OpExtInst %f32 %std450 NClamp %inval1 %inval2 %inval3\n" "%outloc = OpAccessChain %f32ptr %outdata %zero %x\n" " OpStore %outloc %rem\n" " OpReturn\n" " OpFunctionEnd\n"; spec.inputs.push_back(BufferSp(new Float32Buffer(inputFloats1))); spec.inputs.push_back(BufferSp(new Float32Buffer(inputFloats2))); spec.inputs.push_back(BufferSp(new Float32Buffer(inputFloats3))); spec.outputs.push_back(BufferSp(new Float32Buffer(outputFloats))); spec.numWorkGroups = IVec3(numElements, 1, 1); spec.verifyIO = &compareNClamp; group->addChild(new SpvAsmComputeShaderCase(testCtx, "all", spec)); return group.release(); } tcu::TestCaseGroup* createOpSRemComputeGroup (tcu::TestContext& testCtx, qpTestResult negFailResult) { de::MovePtr group (new tcu::TestCaseGroup(testCtx, "opsrem", "Test the OpSRem instruction")); de::Random rnd (deStringHash(group->getName())); const int numElements = 200; const struct CaseParams { const char* name; const char* failMessage; // customized status message qpTestResult failResult; // override status on failure int op1Min, op1Max; // operand ranges int op2Min, op2Max; } cases[] = { { "positive", "Output doesn't match with expected", QP_TEST_RESULT_FAIL, 0, 65536, 0, 100 }, { "all", "Inconsistent results, but within specification", negFailResult, -65536, 65536, -100, 100 }, // see below }; // If either operand is negative the result is undefined. Some implementations may still return correct values. for (int caseNdx = 0; caseNdx < DE_LENGTH_OF_ARRAY(cases); ++caseNdx) { const CaseParams& params = cases[caseNdx]; ComputeShaderSpec spec; vector inputInts1 (numElements, 0); vector inputInts2 (numElements, 0); vector outputInts (numElements, 0); fillRandomScalars(rnd, params.op1Min, params.op1Max, &inputInts1[0], numElements); fillRandomScalars(rnd, params.op2Min, params.op2Max, &inputInts2[0], numElements, filterNotZero); for (int ndx = 0; ndx < numElements; ++ndx) { // The return value of std::fmod() has the same sign as its first operand, which is how OpFRem spec'd. outputInts[ndx] = inputInts1[ndx] % inputInts2[ndx]; } spec.assembly = string(getComputeAsmShaderPreamble()) + "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" "OpDecorate %buf BufferBlock\n" "OpDecorate %indata1 DescriptorSet 0\n" "OpDecorate %indata1 Binding 0\n" "OpDecorate %indata2 DescriptorSet 0\n" "OpDecorate %indata2 Binding 1\n" "OpDecorate %outdata DescriptorSet 0\n" "OpDecorate %outdata Binding 2\n" "OpDecorate %i32arr ArrayStride 4\n" "OpMemberDecorate %buf 0 Offset 0\n" + string(getComputeAsmCommonTypes()) + "%buf = OpTypeStruct %i32arr\n" "%bufptr = OpTypePointer Uniform %buf\n" "%indata1 = OpVariable %bufptr Uniform\n" "%indata2 = OpVariable %bufptr Uniform\n" "%outdata = OpVariable %bufptr Uniform\n" "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%main = OpFunction %void None %voidf\n" "%label = OpLabel\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc1 = OpAccessChain %i32ptr %indata1 %zero %x\n" "%inval1 = OpLoad %i32 %inloc1\n" "%inloc2 = OpAccessChain %i32ptr %indata2 %zero %x\n" "%inval2 = OpLoad %i32 %inloc2\n" "%rem = OpSRem %i32 %inval1 %inval2\n" "%outloc = OpAccessChain %i32ptr %outdata %zero %x\n" " OpStore %outloc %rem\n" " OpReturn\n" " OpFunctionEnd\n"; spec.inputs.push_back (BufferSp(new Int32Buffer(inputInts1))); spec.inputs.push_back (BufferSp(new Int32Buffer(inputInts2))); spec.outputs.push_back (BufferSp(new Int32Buffer(outputInts))); spec.numWorkGroups = IVec3(numElements, 1, 1); spec.failResult = params.failResult; spec.failMessage = params.failMessage; group->addChild(new SpvAsmComputeShaderCase(testCtx, params.name, spec)); } return group.release(); } tcu::TestCaseGroup* createOpSRemComputeGroup64 (tcu::TestContext& testCtx, qpTestResult negFailResult) { de::MovePtr group (new tcu::TestCaseGroup(testCtx, "opsrem64", "Test the 64-bit OpSRem instruction")); de::Random rnd (deStringHash(group->getName())); const int numElements = 200; const struct CaseParams { const char* name; const char* failMessage; // customized status message qpTestResult failResult; // override status on failure bool positive; } cases[] = { { "positive", "Output doesn't match with expected", QP_TEST_RESULT_FAIL, true }, { "all", "Inconsistent results, but within specification", negFailResult, false }, // see below }; // If either operand is negative the result is undefined. Some implementations may still return correct values. for (int caseNdx = 0; caseNdx < DE_LENGTH_OF_ARRAY(cases); ++caseNdx) { const CaseParams& params = cases[caseNdx]; ComputeShaderSpec spec; vector inputInts1 (numElements, 0); vector inputInts2 (numElements, 0); vector outputInts (numElements, 0); if (params.positive) { fillRandomInt64sLogDistributed(rnd, inputInts1, numElements, filterNonNegative); fillRandomInt64sLogDistributed(rnd, inputInts2, numElements, filterPositive); } else { fillRandomInt64sLogDistributed(rnd, inputInts1, numElements); fillRandomInt64sLogDistributed(rnd, inputInts2, numElements, filterNotZero); } for (int ndx = 0; ndx < numElements; ++ndx) { // The return value of std::fmod() has the same sign as its first operand, which is how OpFRem spec'd. outputInts[ndx] = inputInts1[ndx] % inputInts2[ndx]; } spec.assembly = "OpCapability Int64\n" + string(getComputeAsmShaderPreamble()) + "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" "OpDecorate %buf BufferBlock\n" "OpDecorate %indata1 DescriptorSet 0\n" "OpDecorate %indata1 Binding 0\n" "OpDecorate %indata2 DescriptorSet 0\n" "OpDecorate %indata2 Binding 1\n" "OpDecorate %outdata DescriptorSet 0\n" "OpDecorate %outdata Binding 2\n" "OpDecorate %i64arr ArrayStride 8\n" "OpMemberDecorate %buf 0 Offset 0\n" + string(getComputeAsmCommonTypes()) + string(getComputeAsmCommonInt64Types()) + "%buf = OpTypeStruct %i64arr\n" "%bufptr = OpTypePointer Uniform %buf\n" "%indata1 = OpVariable %bufptr Uniform\n" "%indata2 = OpVariable %bufptr Uniform\n" "%outdata = OpVariable %bufptr Uniform\n" "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i64 0\n" "%main = OpFunction %void None %voidf\n" "%label = OpLabel\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc1 = OpAccessChain %i64ptr %indata1 %zero %x\n" "%inval1 = OpLoad %i64 %inloc1\n" "%inloc2 = OpAccessChain %i64ptr %indata2 %zero %x\n" "%inval2 = OpLoad %i64 %inloc2\n" "%rem = OpSRem %i64 %inval1 %inval2\n" "%outloc = OpAccessChain %i64ptr %outdata %zero %x\n" " OpStore %outloc %rem\n" " OpReturn\n" " OpFunctionEnd\n"; spec.inputs.push_back (BufferSp(new Int64Buffer(inputInts1))); spec.inputs.push_back (BufferSp(new Int64Buffer(inputInts2))); spec.outputs.push_back (BufferSp(new Int64Buffer(outputInts))); spec.numWorkGroups = IVec3(numElements, 1, 1); spec.failResult = params.failResult; spec.failMessage = params.failMessage; spec.requestedVulkanFeatures.coreFeatures.shaderInt64 = VK_TRUE; group->addChild(new SpvAsmComputeShaderCase(testCtx, params.name, spec)); } return group.release(); } tcu::TestCaseGroup* createOpSModComputeGroup (tcu::TestContext& testCtx, qpTestResult negFailResult) { de::MovePtr group (new tcu::TestCaseGroup(testCtx, "opsmod", "Test the OpSMod instruction")); de::Random rnd (deStringHash(group->getName())); const int numElements = 200; const struct CaseParams { const char* name; const char* failMessage; // customized status message qpTestResult failResult; // override status on failure int op1Min, op1Max; // operand ranges int op2Min, op2Max; } cases[] = { { "positive", "Output doesn't match with expected", QP_TEST_RESULT_FAIL, 0, 65536, 0, 100 }, { "all", "Inconsistent results, but within specification", negFailResult, -65536, 65536, -100, 100 }, // see below }; // If either operand is negative the result is undefined. Some implementations may still return correct values. for (int caseNdx = 0; caseNdx < DE_LENGTH_OF_ARRAY(cases); ++caseNdx) { const CaseParams& params = cases[caseNdx]; ComputeShaderSpec spec; vector inputInts1 (numElements, 0); vector inputInts2 (numElements, 0); vector outputInts (numElements, 0); fillRandomScalars(rnd, params.op1Min, params.op1Max, &inputInts1[0], numElements); fillRandomScalars(rnd, params.op2Min, params.op2Max, &inputInts2[0], numElements, filterNotZero); for (int ndx = 0; ndx < numElements; ++ndx) { deInt32 rem = inputInts1[ndx] % inputInts2[ndx]; if (rem == 0) { outputInts[ndx] = 0; } else if ((inputInts1[ndx] >= 0) == (inputInts2[ndx] >= 0)) { // They have the same sign outputInts[ndx] = rem; } else { // They have opposite sign. The remainder operation takes the // sign inputInts1[ndx] but OpSMod is supposed to take ths sign // of inputInts2[ndx]. Adding inputInts2[ndx] will ensure that // the result has the correct sign and that it is still // congruent to inputInts1[ndx] modulo inputInts2[ndx] // // See also http://mathforum.org/library/drmath/view/52343.html outputInts[ndx] = rem + inputInts2[ndx]; } } spec.assembly = string(getComputeAsmShaderPreamble()) + "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" "OpDecorate %buf BufferBlock\n" "OpDecorate %indata1 DescriptorSet 0\n" "OpDecorate %indata1 Binding 0\n" "OpDecorate %indata2 DescriptorSet 0\n" "OpDecorate %indata2 Binding 1\n" "OpDecorate %outdata DescriptorSet 0\n" "OpDecorate %outdata Binding 2\n" "OpDecorate %i32arr ArrayStride 4\n" "OpMemberDecorate %buf 0 Offset 0\n" + string(getComputeAsmCommonTypes()) + "%buf = OpTypeStruct %i32arr\n" "%bufptr = OpTypePointer Uniform %buf\n" "%indata1 = OpVariable %bufptr Uniform\n" "%indata2 = OpVariable %bufptr Uniform\n" "%outdata = OpVariable %bufptr Uniform\n" "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%main = OpFunction %void None %voidf\n" "%label = OpLabel\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc1 = OpAccessChain %i32ptr %indata1 %zero %x\n" "%inval1 = OpLoad %i32 %inloc1\n" "%inloc2 = OpAccessChain %i32ptr %indata2 %zero %x\n" "%inval2 = OpLoad %i32 %inloc2\n" "%rem = OpSMod %i32 %inval1 %inval2\n" "%outloc = OpAccessChain %i32ptr %outdata %zero %x\n" " OpStore %outloc %rem\n" " OpReturn\n" " OpFunctionEnd\n"; spec.inputs.push_back (BufferSp(new Int32Buffer(inputInts1))); spec.inputs.push_back (BufferSp(new Int32Buffer(inputInts2))); spec.outputs.push_back (BufferSp(new Int32Buffer(outputInts))); spec.numWorkGroups = IVec3(numElements, 1, 1); spec.failResult = params.failResult; spec.failMessage = params.failMessage; group->addChild(new SpvAsmComputeShaderCase(testCtx, params.name, spec)); } return group.release(); } tcu::TestCaseGroup* createOpSModComputeGroup64 (tcu::TestContext& testCtx, qpTestResult negFailResult) { de::MovePtr group (new tcu::TestCaseGroup(testCtx, "opsmod64", "Test the OpSMod instruction")); de::Random rnd (deStringHash(group->getName())); const int numElements = 200; const struct CaseParams { const char* name; const char* failMessage; // customized status message qpTestResult failResult; // override status on failure bool positive; } cases[] = { { "positive", "Output doesn't match with expected", QP_TEST_RESULT_FAIL, true }, { "all", "Inconsistent results, but within specification", negFailResult, false }, // see below }; // If either operand is negative the result is undefined. Some implementations may still return correct values. for (int caseNdx = 0; caseNdx < DE_LENGTH_OF_ARRAY(cases); ++caseNdx) { const CaseParams& params = cases[caseNdx]; ComputeShaderSpec spec; vector inputInts1 (numElements, 0); vector inputInts2 (numElements, 0); vector outputInts (numElements, 0); if (params.positive) { fillRandomInt64sLogDistributed(rnd, inputInts1, numElements, filterNonNegative); fillRandomInt64sLogDistributed(rnd, inputInts2, numElements, filterPositive); } else { fillRandomInt64sLogDistributed(rnd, inputInts1, numElements); fillRandomInt64sLogDistributed(rnd, inputInts2, numElements, filterNotZero); } for (int ndx = 0; ndx < numElements; ++ndx) { deInt64 rem = inputInts1[ndx] % inputInts2[ndx]; if (rem == 0) { outputInts[ndx] = 0; } else if ((inputInts1[ndx] >= 0) == (inputInts2[ndx] >= 0)) { // They have the same sign outputInts[ndx] = rem; } else { // They have opposite sign. The remainder operation takes the // sign inputInts1[ndx] but OpSMod is supposed to take ths sign // of inputInts2[ndx]. Adding inputInts2[ndx] will ensure that // the result has the correct sign and that it is still // congruent to inputInts1[ndx] modulo inputInts2[ndx] // // See also http://mathforum.org/library/drmath/view/52343.html outputInts[ndx] = rem + inputInts2[ndx]; } } spec.assembly = "OpCapability Int64\n" + string(getComputeAsmShaderPreamble()) + "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" "OpDecorate %buf BufferBlock\n" "OpDecorate %indata1 DescriptorSet 0\n" "OpDecorate %indata1 Binding 0\n" "OpDecorate %indata2 DescriptorSet 0\n" "OpDecorate %indata2 Binding 1\n" "OpDecorate %outdata DescriptorSet 0\n" "OpDecorate %outdata Binding 2\n" "OpDecorate %i64arr ArrayStride 8\n" "OpMemberDecorate %buf 0 Offset 0\n" + string(getComputeAsmCommonTypes()) + string(getComputeAsmCommonInt64Types()) + "%buf = OpTypeStruct %i64arr\n" "%bufptr = OpTypePointer Uniform %buf\n" "%indata1 = OpVariable %bufptr Uniform\n" "%indata2 = OpVariable %bufptr Uniform\n" "%outdata = OpVariable %bufptr Uniform\n" "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i64 0\n" "%main = OpFunction %void None %voidf\n" "%label = OpLabel\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc1 = OpAccessChain %i64ptr %indata1 %zero %x\n" "%inval1 = OpLoad %i64 %inloc1\n" "%inloc2 = OpAccessChain %i64ptr %indata2 %zero %x\n" "%inval2 = OpLoad %i64 %inloc2\n" "%rem = OpSMod %i64 %inval1 %inval2\n" "%outloc = OpAccessChain %i64ptr %outdata %zero %x\n" " OpStore %outloc %rem\n" " OpReturn\n" " OpFunctionEnd\n"; spec.inputs.push_back (BufferSp(new Int64Buffer(inputInts1))); spec.inputs.push_back (BufferSp(new Int64Buffer(inputInts2))); spec.outputs.push_back (BufferSp(new Int64Buffer(outputInts))); spec.numWorkGroups = IVec3(numElements, 1, 1); spec.failResult = params.failResult; spec.failMessage = params.failMessage; spec.requestedVulkanFeatures.coreFeatures.shaderInt64 = VK_TRUE; group->addChild(new SpvAsmComputeShaderCase(testCtx, params.name, spec)); } return group.release(); } // Copy contents in the input buffer to the output buffer. tcu::TestCaseGroup* createOpCopyMemoryGroup (tcu::TestContext& testCtx) { de::MovePtr group (new tcu::TestCaseGroup(testCtx, "opcopymemory", "Test the OpCopyMemory instruction")); de::Random rnd (deStringHash(group->getName())); const int numElements = 100; // The following case adds vec4(0., 0.5, 1.5, 2.5) to each of the elements in the input buffer and writes output to the output buffer. ComputeShaderSpec spec1; vector inputFloats1 (numElements); vector outputFloats1 (numElements); fillRandomScalars(rnd, -200.f, 200.f, &inputFloats1[0], numElements * 4); // CPU might not use the same rounding mode as the GPU. Use whole numbers to avoid rounding differences. floorAll(inputFloats1); for (size_t ndx = 0; ndx < numElements; ++ndx) outputFloats1[ndx] = inputFloats1[ndx] + Vec4(0.f, 0.5f, 1.5f, 2.5f); spec1.assembly = string(getComputeAsmShaderPreamble()) + "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" "OpDecorate %vec4arr ArrayStride 16\n" + string(getComputeAsmInputOutputBufferTraits()) + string(getComputeAsmCommonTypes()) + "%vec4 = OpTypeVector %f32 4\n" "%vec4ptr_u = OpTypePointer Uniform %vec4\n" "%vec4ptr_f = OpTypePointer Function %vec4\n" "%vec4arr = OpTypeRuntimeArray %vec4\n" "%buf = OpTypeStruct %vec4arr\n" "%bufptr = OpTypePointer Uniform %buf\n" "%indata = OpVariable %bufptr Uniform\n" "%outdata = OpVariable %bufptr Uniform\n" "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%c_f_0 = OpConstant %f32 0.\n" "%c_f_0_5 = OpConstant %f32 0.5\n" "%c_f_1_5 = OpConstant %f32 1.5\n" "%c_f_2_5 = OpConstant %f32 2.5\n" "%c_vec4 = OpConstantComposite %vec4 %c_f_0 %c_f_0_5 %c_f_1_5 %c_f_2_5\n" "%main = OpFunction %void None %voidf\n" "%label = OpLabel\n" "%v_vec4 = OpVariable %vec4ptr_f Function\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc = OpAccessChain %vec4ptr_u %indata %zero %x\n" "%outloc = OpAccessChain %vec4ptr_u %outdata %zero %x\n" " OpCopyMemory %v_vec4 %inloc\n" "%v_vec4_val = OpLoad %vec4 %v_vec4\n" "%add = OpFAdd %vec4 %v_vec4_val %c_vec4\n" " OpStore %outloc %add\n" " OpReturn\n" " OpFunctionEnd\n"; spec1.inputs.push_back(BufferSp(new Vec4Buffer(inputFloats1))); spec1.outputs.push_back(BufferSp(new Vec4Buffer(outputFloats1))); spec1.numWorkGroups = IVec3(numElements, 1, 1); group->addChild(new SpvAsmComputeShaderCase(testCtx, "vector", spec1)); // The following case copies a float[100] variable from the input buffer to the output buffer. ComputeShaderSpec spec2; vector inputFloats2 (numElements); vector outputFloats2 (numElements); fillRandomScalars(rnd, -200.f, 200.f, &inputFloats2[0], numElements); for (size_t ndx = 0; ndx < numElements; ++ndx) outputFloats2[ndx] = inputFloats2[ndx]; spec2.assembly = string(getComputeAsmShaderPreamble()) + "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" "OpDecorate %f32arr100 ArrayStride 4\n" + string(getComputeAsmInputOutputBufferTraits()) + string(getComputeAsmCommonTypes()) + "%hundred = OpConstant %u32 100\n" "%f32arr100 = OpTypeArray %f32 %hundred\n" "%f32arr100ptr_f = OpTypePointer Function %f32arr100\n" "%f32arr100ptr_u = OpTypePointer Uniform %f32arr100\n" "%buf = OpTypeStruct %f32arr100\n" "%bufptr = OpTypePointer Uniform %buf\n" "%indata = OpVariable %bufptr Uniform\n" "%outdata = OpVariable %bufptr Uniform\n" "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%main = OpFunction %void None %voidf\n" "%label = OpLabel\n" "%var = OpVariable %f32arr100ptr_f Function\n" "%inarr = OpAccessChain %f32arr100ptr_u %indata %zero\n" "%outarr = OpAccessChain %f32arr100ptr_u %outdata %zero\n" " OpCopyMemory %var %inarr\n" " OpCopyMemory %outarr %var\n" " OpReturn\n" " OpFunctionEnd\n"; spec2.inputs.push_back(BufferSp(new Float32Buffer(inputFloats2))); spec2.outputs.push_back(BufferSp(new Float32Buffer(outputFloats2))); spec2.numWorkGroups = IVec3(1, 1, 1); group->addChild(new SpvAsmComputeShaderCase(testCtx, "array", spec2)); // The following case copies a struct{vec4, vec4, vec4, vec4} variable from the input buffer to the output buffer. ComputeShaderSpec spec3; vector inputFloats3 (16); vector outputFloats3 (16); fillRandomScalars(rnd, -200.f, 200.f, &inputFloats3[0], 16); for (size_t ndx = 0; ndx < 16; ++ndx) outputFloats3[ndx] = inputFloats3[ndx]; spec3.assembly = string(getComputeAsmShaderPreamble()) + "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" //"OpMemberDecorate %buf 0 Offset 0\n" - exists in getComputeAsmInputOutputBufferTraits "OpMemberDecorate %buf 1 Offset 16\n" "OpMemberDecorate %buf 2 Offset 32\n" "OpMemberDecorate %buf 3 Offset 48\n" + string(getComputeAsmInputOutputBufferTraits()) + string(getComputeAsmCommonTypes()) + "%vec4 = OpTypeVector %f32 4\n" "%buf = OpTypeStruct %vec4 %vec4 %vec4 %vec4\n" "%bufptr = OpTypePointer Uniform %buf\n" "%indata = OpVariable %bufptr Uniform\n" "%outdata = OpVariable %bufptr Uniform\n" "%vec4stptr = OpTypePointer Function %buf\n" "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%main = OpFunction %void None %voidf\n" "%label = OpLabel\n" "%var = OpVariable %vec4stptr Function\n" " OpCopyMemory %var %indata\n" " OpCopyMemory %outdata %var\n" " OpReturn\n" " OpFunctionEnd\n"; spec3.inputs.push_back(BufferSp(new Float32Buffer(inputFloats3))); spec3.outputs.push_back(BufferSp(new Float32Buffer(outputFloats3))); spec3.numWorkGroups = IVec3(1, 1, 1); group->addChild(new SpvAsmComputeShaderCase(testCtx, "struct", spec3)); // The following case negates multiple float variables from the input buffer and stores the results to the output buffer. ComputeShaderSpec spec4; vector inputFloats4 (numElements); vector outputFloats4 (numElements); fillRandomScalars(rnd, -200.f, 200.f, &inputFloats4[0], numElements); for (size_t ndx = 0; ndx < numElements; ++ndx) outputFloats4[ndx] = -inputFloats4[ndx]; spec4.assembly = string(getComputeAsmShaderPreamble()) + "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" + string(getComputeAsmInputOutputBufferTraits()) + string(getComputeAsmCommonTypes()) + string(getComputeAsmInputOutputBuffer()) + "%f32ptr_f = OpTypePointer Function %f32\n" "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%main = OpFunction %void None %voidf\n" "%label = OpLabel\n" "%var = OpVariable %f32ptr_f Function\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc = OpAccessChain %f32ptr %indata %zero %x\n" "%outloc = OpAccessChain %f32ptr %outdata %zero %x\n" " OpCopyMemory %var %inloc\n" "%val = OpLoad %f32 %var\n" "%neg = OpFNegate %f32 %val\n" " OpStore %outloc %neg\n" " OpReturn\n" " OpFunctionEnd\n"; spec4.inputs.push_back(BufferSp(new Float32Buffer(inputFloats4))); spec4.outputs.push_back(BufferSp(new Float32Buffer(outputFloats4))); spec4.numWorkGroups = IVec3(numElements, 1, 1); group->addChild(new SpvAsmComputeShaderCase(testCtx, "float", spec4)); return group.release(); } tcu::TestCaseGroup* createOpCopyObjectGroup (tcu::TestContext& testCtx) { de::MovePtr group (new tcu::TestCaseGroup(testCtx, "opcopyobject", "Test the OpCopyObject instruction")); ComputeShaderSpec spec; de::Random rnd (deStringHash(group->getName())); const int numElements = 100; vector inputFloats (numElements, 0); vector outputFloats (numElements, 0); fillRandomScalars(rnd, -200.f, 200.f, &inputFloats[0], numElements); // CPU might not use the same rounding mode as the GPU. Use whole numbers to avoid rounding differences. floorAll(inputFloats); for (size_t ndx = 0; ndx < numElements; ++ndx) outputFloats[ndx] = inputFloats[ndx] + 7.5f; spec.assembly = string(getComputeAsmShaderPreamble()) + "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" + string(getComputeAsmInputOutputBufferTraits()) + string(getComputeAsmCommonTypes()) + "%fmat = OpTypeMatrix %fvec3 3\n" "%three = OpConstant %u32 3\n" "%farr = OpTypeArray %f32 %three\n" "%fst = OpTypeStruct %f32 %f32\n" + string(getComputeAsmInputOutputBuffer()) + "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%c_f = OpConstant %f32 1.5\n" "%c_fvec3 = OpConstantComposite %fvec3 %c_f %c_f %c_f\n" "%c_fmat = OpConstantComposite %fmat %c_fvec3 %c_fvec3 %c_fvec3\n" "%c_farr = OpConstantComposite %farr %c_f %c_f %c_f\n" "%c_fst = OpConstantComposite %fst %c_f %c_f\n" "%main = OpFunction %void None %voidf\n" "%label = OpLabel\n" "%c_f_copy = OpCopyObject %f32 %c_f\n" "%c_fvec3_copy = OpCopyObject %fvec3 %c_fvec3\n" "%c_fmat_copy = OpCopyObject %fmat %c_fmat\n" "%c_farr_copy = OpCopyObject %farr %c_farr\n" "%c_fst_copy = OpCopyObject %fst %c_fst\n" "%fvec3_elem = OpCompositeExtract %f32 %c_fvec3_copy 0\n" "%fmat_elem = OpCompositeExtract %f32 %c_fmat_copy 1 2\n" "%farr_elem = OpCompositeExtract %f32 %c_farr_copy 2\n" "%fst_elem = OpCompositeExtract %f32 %c_fst_copy 1\n" // Add up. 1.5 * 5 = 7.5. "%add1 = OpFAdd %f32 %c_f_copy %fvec3_elem\n" "%add2 = OpFAdd %f32 %add1 %fmat_elem\n" "%add3 = OpFAdd %f32 %add2 %farr_elem\n" "%add4 = OpFAdd %f32 %add3 %fst_elem\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc = OpAccessChain %f32ptr %indata %zero %x\n" "%outloc = OpAccessChain %f32ptr %outdata %zero %x\n" "%inval = OpLoad %f32 %inloc\n" "%add = OpFAdd %f32 %add4 %inval\n" " OpStore %outloc %add\n" " OpReturn\n" " OpFunctionEnd\n"; spec.inputs.push_back(BufferSp(new Float32Buffer(inputFloats))); spec.outputs.push_back(BufferSp(new Float32Buffer(outputFloats))); spec.numWorkGroups = IVec3(numElements, 1, 1); group->addChild(new SpvAsmComputeShaderCase(testCtx, "spotcheck", spec)); return group.release(); } // Assembly code used for testing OpUnreachable is based on GLSL source code: // // #version 430 // // layout(std140, set = 0, binding = 0) readonly buffer Input { // float elements[]; // } input_data; // layout(std140, set = 0, binding = 1) writeonly buffer Output { // float elements[]; // } output_data; // // void not_called_func() { // // place OpUnreachable here // } // // uint modulo4(uint val) { // switch (val % uint(4)) { // case 0: return 3; // case 1: return 2; // case 2: return 1; // case 3: return 0; // default: return 100; // place OpUnreachable here // } // } // // uint const5() { // return 5; // // place OpUnreachable here // } // // void main() { // uint x = gl_GlobalInvocationID.x; // if (const5() > modulo4(1000)) { // output_data.elements[x] = -input_data.elements[x]; // } else { // // place OpUnreachable here // output_data.elements[x] = input_data.elements[x]; // } // } void addOpUnreachableAmberTests(tcu::TestCaseGroup& group, tcu::TestContext& testCtx) { #ifndef CTS_USES_VULKANSC static const char dataDir[] = "spirv_assembly/instruction/compute/unreachable"; struct Case { string name; string desc; }; static const Case cases[] = { { "unreachable-switch-merge-in-loop", "Test containing an unreachable switch merge block inside an infinite loop" }, }; for (int i = 0; i < DE_LENGTH_OF_ARRAY(cases); ++i) { const string fileName = cases[i].name + ".amber"; group.addChild(cts_amber::createAmberTestCase(testCtx, cases[i].name.c_str(), cases[i].desc.c_str(), dataDir, fileName)); } #else DE_UNREF(group); DE_UNREF(testCtx); #endif } void addOpSwitchAmberTests(tcu::TestCaseGroup& group, tcu::TestContext& testCtx) { #ifndef CTS_USES_VULKANSC static const char dataDir[] = "spirv_assembly/instruction/compute/switch"; struct Case { string name; string desc; }; static const Case cases[] = { { "switch-case-to-merge-block", "Test switch containing a case that jumps directly to the merge block" }, }; for (int i = 0; i < DE_LENGTH_OF_ARRAY(cases); ++i) { const string fileName = cases[i].name + ".amber"; group.addChild(cts_amber::createAmberTestCase(testCtx, cases[i].name.c_str(), cases[i].desc.c_str(), dataDir, fileName)); } #else DE_UNREF(group); DE_UNREF(testCtx); #endif } #ifndef CTS_USES_VULKANSC tcu::TestCaseGroup* createOpArrayLengthComputeGroup (tcu::TestContext& testCtx) { de::MovePtr group (new tcu::TestCaseGroup(testCtx, "oparraylength", "Test the OpArrayLength instruction")); static const char dataDir[] = "spirv_assembly/instruction/compute/arraylength"; struct Case { string name; string desc; }; static const Case cases[] = { { "array-stride-larger-than-element-size", "Test using an unsized array with stride larger than the element size" } }; for (int i = 0; i < DE_LENGTH_OF_ARRAY(cases); ++i) { const string fileName = cases[i].name + ".amber"; group->addChild(cts_amber::createAmberTestCase(testCtx, cases[i].name.c_str(), cases[i].desc.c_str(), dataDir, fileName)); } return group.release(); } #endif tcu::TestCaseGroup* createOpUnreachableGroup (tcu::TestContext& testCtx) { de::MovePtr group (new tcu::TestCaseGroup(testCtx, "opunreachable", "Test the OpUnreachable instruction")); ComputeShaderSpec spec; de::Random rnd (deStringHash(group->getName())); const int numElements = 100; vector positiveFloats (numElements, 0); vector negativeFloats (numElements, 0); fillRandomScalars(rnd, 1.f, 100.f, &positiveFloats[0], numElements); for (size_t ndx = 0; ndx < numElements; ++ndx) negativeFloats[ndx] = -positiveFloats[ndx]; spec.assembly = string(getComputeAsmShaderPreamble()) + "OpSource GLSL 430\n" "OpName %main \"main\"\n" "OpName %func_not_called_func \"not_called_func(\"\n" "OpName %func_modulo4 \"modulo4(u1;\"\n" "OpName %func_const5 \"const5(\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" + string(getComputeAsmInputOutputBufferTraits()) + string(getComputeAsmCommonTypes()) + "%u32ptr = OpTypePointer Function %u32\n" "%uintfuint = OpTypeFunction %u32 %u32ptr\n" "%unitf = OpTypeFunction %u32\n" "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %u32 0\n" "%one = OpConstant %u32 1\n" "%two = OpConstant %u32 2\n" "%three = OpConstant %u32 3\n" "%four = OpConstant %u32 4\n" "%five = OpConstant %u32 5\n" "%hundred = OpConstant %u32 100\n" "%thousand = OpConstant %u32 1000\n" + string(getComputeAsmInputOutputBuffer()) + // Main() "%main = OpFunction %void None %voidf\n" "%main_entry = OpLabel\n" "%v_thousand = OpVariable %u32ptr Function %thousand\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc = OpAccessChain %f32ptr %indata %zero %x\n" "%inval = OpLoad %f32 %inloc\n" "%outloc = OpAccessChain %f32ptr %outdata %zero %x\n" "%ret_const5 = OpFunctionCall %u32 %func_const5\n" "%ret_modulo4 = OpFunctionCall %u32 %func_modulo4 %v_thousand\n" "%cmp_gt = OpUGreaterThan %bool %ret_const5 %ret_modulo4\n" " OpSelectionMerge %if_end None\n" " OpBranchConditional %cmp_gt %if_true %if_false\n" "%if_true = OpLabel\n" "%negate = OpFNegate %f32 %inval\n" " OpStore %outloc %negate\n" " OpBranch %if_end\n" "%if_false = OpLabel\n" " OpUnreachable\n" // Unreachable else branch for if statement "%if_end = OpLabel\n" " OpReturn\n" " OpFunctionEnd\n" // not_called_function() "%func_not_called_func = OpFunction %void None %voidf\n" "%not_called_func_entry = OpLabel\n" " OpUnreachable\n" // Unreachable entry block in not called static function " OpFunctionEnd\n" // modulo4() "%func_modulo4 = OpFunction %u32 None %uintfuint\n" "%valptr = OpFunctionParameter %u32ptr\n" "%modulo4_entry = OpLabel\n" "%val = OpLoad %u32 %valptr\n" "%modulo = OpUMod %u32 %val %four\n" " OpSelectionMerge %switch_merge None\n" " OpSwitch %modulo %default 0 %case0 1 %case1 2 %case2 3 %case3\n" "%case0 = OpLabel\n" " OpReturnValue %three\n" "%case1 = OpLabel\n" " OpReturnValue %two\n" "%case2 = OpLabel\n" " OpReturnValue %one\n" "%case3 = OpLabel\n" " OpReturnValue %zero\n" "%default = OpLabel\n" " OpUnreachable\n" // Unreachable default case for switch statement "%switch_merge = OpLabel\n" " OpUnreachable\n" // Unreachable merge block for switch statement " OpFunctionEnd\n" // const5() "%func_const5 = OpFunction %u32 None %unitf\n" "%const5_entry = OpLabel\n" " OpReturnValue %five\n" "%unreachable = OpLabel\n" " OpUnreachable\n" // Unreachable block in function " OpFunctionEnd\n"; spec.inputs.push_back(BufferSp(new Float32Buffer(positiveFloats))); spec.outputs.push_back(BufferSp(new Float32Buffer(negativeFloats))); spec.numWorkGroups = IVec3(numElements, 1, 1); group->addChild(new SpvAsmComputeShaderCase(testCtx, "all", spec)); addOpUnreachableAmberTests(*group, testCtx); return group.release(); } // Assembly code used for testing decoration group is based on GLSL source code: // // #version 430 // // layout(std140, set = 0, binding = 0) readonly buffer Input0 { // float elements[]; // } input_data0; // layout(std140, set = 0, binding = 1) readonly buffer Input1 { // float elements[]; // } input_data1; // layout(std140, set = 0, binding = 2) readonly buffer Input2 { // float elements[]; // } input_data2; // layout(std140, set = 0, binding = 3) readonly buffer Input3 { // float elements[]; // } input_data3; // layout(std140, set = 0, binding = 4) readonly buffer Input4 { // float elements[]; // } input_data4; // layout(std140, set = 0, binding = 5) writeonly buffer Output { // float elements[]; // } output_data; // // void main() { // uint x = gl_GlobalInvocationID.x; // output_data.elements[x] = input_data0.elements[x] + input_data1.elements[x] + input_data2.elements[x] + input_data3.elements[x] + input_data4.elements[x]; // } tcu::TestCaseGroup* createDecorationGroupGroup (tcu::TestContext& testCtx) { de::MovePtr group (new tcu::TestCaseGroup(testCtx, "decoration_group", "Test the OpDecorationGroup & OpGroupDecorate instruction")); ComputeShaderSpec spec; de::Random rnd (deStringHash(group->getName())); const int numElements = 100; vector inputFloats0 (numElements, 0); vector inputFloats1 (numElements, 0); vector inputFloats2 (numElements, 0); vector inputFloats3 (numElements, 0); vector inputFloats4 (numElements, 0); vector outputFloats (numElements, 0); fillRandomScalars(rnd, -300.f, 300.f, &inputFloats0[0], numElements); fillRandomScalars(rnd, -300.f, 300.f, &inputFloats1[0], numElements); fillRandomScalars(rnd, -300.f, 300.f, &inputFloats2[0], numElements); fillRandomScalars(rnd, -300.f, 300.f, &inputFloats3[0], numElements); fillRandomScalars(rnd, -300.f, 300.f, &inputFloats4[0], numElements); // CPU might not use the same rounding mode as the GPU. Use whole numbers to avoid rounding differences. floorAll(inputFloats0); floorAll(inputFloats1); floorAll(inputFloats2); floorAll(inputFloats3); floorAll(inputFloats4); for (size_t ndx = 0; ndx < numElements; ++ndx) outputFloats[ndx] = inputFloats0[ndx] + inputFloats1[ndx] + inputFloats2[ndx] + inputFloats3[ndx] + inputFloats4[ndx]; spec.assembly = string(getComputeAsmShaderPreamble()) + "OpSource GLSL 430\n" "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" // Not using group decoration on variable. "OpDecorate %id BuiltIn GlobalInvocationId\n" // Not using group decoration on type. "OpDecorate %f32arr ArrayStride 4\n" "OpDecorate %groups BufferBlock\n" "OpDecorate %groupm Offset 0\n" "%groups = OpDecorationGroup\n" "%groupm = OpDecorationGroup\n" // Group decoration on multiple structs. "OpGroupDecorate %groups %outbuf %inbuf0 %inbuf1 %inbuf2 %inbuf3 %inbuf4\n" // Group decoration on multiple struct members. "OpGroupMemberDecorate %groupm %outbuf 0 %inbuf0 0 %inbuf1 0 %inbuf2 0 %inbuf3 0 %inbuf4 0\n" "OpDecorate %group1 DescriptorSet 0\n" "OpDecorate %group3 DescriptorSet 0\n" "OpDecorate %group3 NonWritable\n" "OpDecorate %group3 Restrict\n" "%group0 = OpDecorationGroup\n" "%group1 = OpDecorationGroup\n" "%group3 = OpDecorationGroup\n" // Applying the same decoration group multiple times. "OpGroupDecorate %group1 %outdata\n" "OpGroupDecorate %group1 %outdata\n" "OpGroupDecorate %group1 %outdata\n" "OpDecorate %outdata DescriptorSet 0\n" "OpDecorate %outdata Binding 5\n" // Applying decoration group containing nothing. "OpGroupDecorate %group0 %indata0\n" "OpDecorate %indata0 DescriptorSet 0\n" "OpDecorate %indata0 Binding 0\n" // Applying decoration group containing one decoration. "OpGroupDecorate %group1 %indata1\n" "OpDecorate %indata1 Binding 1\n" // Applying decoration group containing multiple decorations. "OpGroupDecorate %group3 %indata2 %indata3\n" "OpDecorate %indata2 Binding 2\n" "OpDecorate %indata3 Binding 3\n" // Applying multiple decoration groups (with overlapping). "OpGroupDecorate %group0 %indata4\n" "OpGroupDecorate %group1 %indata4\n" "OpGroupDecorate %group3 %indata4\n" "OpDecorate %indata4 Binding 4\n" + string(getComputeAsmCommonTypes()) + "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%outbuf = OpTypeStruct %f32arr\n" "%outbufptr = OpTypePointer Uniform %outbuf\n" "%outdata = OpVariable %outbufptr Uniform\n" "%inbuf0 = OpTypeStruct %f32arr\n" "%inbuf0ptr = OpTypePointer Uniform %inbuf0\n" "%indata0 = OpVariable %inbuf0ptr Uniform\n" "%inbuf1 = OpTypeStruct %f32arr\n" "%inbuf1ptr = OpTypePointer Uniform %inbuf1\n" "%indata1 = OpVariable %inbuf1ptr Uniform\n" "%inbuf2 = OpTypeStruct %f32arr\n" "%inbuf2ptr = OpTypePointer Uniform %inbuf2\n" "%indata2 = OpVariable %inbuf2ptr Uniform\n" "%inbuf3 = OpTypeStruct %f32arr\n" "%inbuf3ptr = OpTypePointer Uniform %inbuf3\n" "%indata3 = OpVariable %inbuf3ptr Uniform\n" "%inbuf4 = OpTypeStruct %f32arr\n" "%inbufptr = OpTypePointer Uniform %inbuf4\n" "%indata4 = OpVariable %inbufptr Uniform\n" "%main = OpFunction %void None %voidf\n" "%label = OpLabel\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc0 = OpAccessChain %f32ptr %indata0 %zero %x\n" "%inloc1 = OpAccessChain %f32ptr %indata1 %zero %x\n" "%inloc2 = OpAccessChain %f32ptr %indata2 %zero %x\n" "%inloc3 = OpAccessChain %f32ptr %indata3 %zero %x\n" "%inloc4 = OpAccessChain %f32ptr %indata4 %zero %x\n" "%outloc = OpAccessChain %f32ptr %outdata %zero %x\n" "%inval0 = OpLoad %f32 %inloc0\n" "%inval1 = OpLoad %f32 %inloc1\n" "%inval2 = OpLoad %f32 %inloc2\n" "%inval3 = OpLoad %f32 %inloc3\n" "%inval4 = OpLoad %f32 %inloc4\n" "%add0 = OpFAdd %f32 %inval0 %inval1\n" "%add1 = OpFAdd %f32 %add0 %inval2\n" "%add2 = OpFAdd %f32 %add1 %inval3\n" "%add = OpFAdd %f32 %add2 %inval4\n" " OpStore %outloc %add\n" " OpReturn\n" " OpFunctionEnd\n"; spec.inputs.push_back(BufferSp(new Float32Buffer(inputFloats0))); spec.inputs.push_back(BufferSp(new Float32Buffer(inputFloats1))); spec.inputs.push_back(BufferSp(new Float32Buffer(inputFloats2))); spec.inputs.push_back(BufferSp(new Float32Buffer(inputFloats3))); spec.inputs.push_back(BufferSp(new Float32Buffer(inputFloats4))); spec.outputs.push_back(BufferSp(new Float32Buffer(outputFloats))); spec.numWorkGroups = IVec3(numElements, 1, 1); group->addChild(new SpvAsmComputeShaderCase(testCtx, "all", spec)); return group.release(); } enum SpecConstantType { SC_INT8, SC_UINT8, SC_INT16, SC_UINT16, SC_INT32, SC_UINT32, SC_INT64, SC_UINT64, SC_FLOAT16, SC_FLOAT32, SC_FLOAT64, }; struct SpecConstantValue { SpecConstantType type; union ValueUnion { deInt8 i8; deUint8 u8; deInt16 i16; deUint16 u16; deInt32 i32; deUint32 u32; deInt64 i64; deUint64 u64; tcu::Float16 f16; tcu::Float32 f32; tcu::Float64 f64; ValueUnion (deInt8 v) : i8(v) {} ValueUnion (deUint8 v) : u8(v) {} ValueUnion (deInt16 v) : i16(v) {} ValueUnion (deUint16 v) : u16(v) {} ValueUnion (deInt32 v) : i32(v) {} ValueUnion (deUint32 v) : u32(v) {} ValueUnion (deInt64 v) : i64(v) {} ValueUnion (deUint64 v) : u64(v) {} ValueUnion (tcu::Float16 v) : f16(v) {} ValueUnion (tcu::Float32 v) : f32(v) {} ValueUnion (tcu::Float64 v) : f64(v) {} } value; SpecConstantValue (deInt8 v) : type(SC_INT8) , value(v) {} SpecConstantValue (deUint8 v) : type(SC_UINT8) , value(v) {} SpecConstantValue (deInt16 v) : type(SC_INT16) , value(v) {} SpecConstantValue (deUint16 v) : type(SC_UINT16) , value(v) {} SpecConstantValue (deInt32 v) : type(SC_INT32) , value(v) {} SpecConstantValue (deUint32 v) : type(SC_UINT32) , value(v) {} SpecConstantValue (deInt64 v) : type(SC_INT64) , value(v) {} SpecConstantValue (deUint64 v) : type(SC_UINT64) , value(v) {} SpecConstantValue (tcu::Float16 v) : type(SC_FLOAT16) , value(v) {} SpecConstantValue (tcu::Float32 v) : type(SC_FLOAT32) , value(v) {} SpecConstantValue (tcu::Float64 v) : type(SC_FLOAT64) , value(v) {} void appendTo(vkt::SpirVAssembly::SpecConstants& specConstants) { switch (type) { case SC_INT8: specConstants.append(value.i8); break; case SC_UINT8: specConstants.append(value.u8); break; case SC_INT16: specConstants.append(value.i16); break; case SC_UINT16: specConstants.append(value.u16); break; case SC_INT32: specConstants.append(value.i32); break; case SC_UINT32: specConstants.append(value.u32); break; case SC_INT64: specConstants.append(value.i64); break; case SC_UINT64: specConstants.append(value.u64); break; case SC_FLOAT16: specConstants.append(value.f16); break; case SC_FLOAT32: specConstants.append(value.f32); break; case SC_FLOAT64: specConstants.append(value.f64); break; default: DE_ASSERT(false); } } }; enum CaseFlagBits { FLAG_NONE = 0, FLAG_CONVERT = 1, FLAG_I8 = (1<<1), FLAG_I16 = (1<<2), FLAG_I64 = (1<<3), FLAG_F16 = (1<<4), FLAG_F64 = (1<<5), }; using CaseFlags = deUint32; struct SpecConstantTwoValCase { const std::string caseName; const std::string scDefinition0; const std::string scDefinition1; const std::string scResultType; const std::string scOperation; SpecConstantValue scActualValue0; SpecConstantValue scActualValue1; const std::string resultOperation; vector expectedOutput; CaseFlags caseFlags; SpecConstantTwoValCase (const std::string& name, const std::string& definition0, const std::string& definition1, const std::string& resultType, const std::string& operation, SpecConstantValue value0, SpecConstantValue value1, const std::string& resultOp, const vector& output, CaseFlags flags = FLAG_NONE) : caseName (name) , scDefinition0 (definition0) , scDefinition1 (definition1) , scResultType (resultType) , scOperation (operation) , scActualValue0 (value0) , scActualValue1 (value1) , resultOperation (resultOp) , expectedOutput (output) , caseFlags (flags) {} }; std::string getSpecConstantOpStructConstantsAndTypes () { return "%zero = OpConstant %i32 0\n" "%one = OpConstant %i32 1\n" "%two = OpConstant %i32 2\n" "%three = OpConstant %i32 3\n" "%iarr3 = OpTypeArray %i32 %three\n" "%imat3 = OpTypeArray %iarr3 %three\n" "%struct = OpTypeStruct %imat3\n" ; } std::string getSpecConstantOpStructComposites () { return "%iarr3_0 = OpConstantComposite %iarr3 %zero %zero %zero\n" "%imat3_0 = OpConstantComposite %imat3 %iarr3_0 %iarr3_0 %iarr3_0\n" "%struct_0 = OpConstantComposite %struct %imat3_0\n" ; } std::string getSpecConstantOpStructConstBlock () { return "%iarr3_a = OpSpecConstantOp %iarr3 CompositeInsert %sc_0 %iarr3_0 0\n" // Compose (sc_0, sc_1, sc_2) "%iarr3_b = OpSpecConstantOp %iarr3 CompositeInsert %sc_1 %iarr3_a 1\n" "%iarr3_c = OpSpecConstantOp %iarr3 CompositeInsert %sc_2 %iarr3_b 2\n" "%iarr3_d = OpSpecConstantOp %iarr3 CompositeInsert %sc_1 %iarr3_0 0\n" // Compose (sc_1, sc_2, sc_0) "%iarr3_e = OpSpecConstantOp %iarr3 CompositeInsert %sc_2 %iarr3_d 1\n" "%iarr3_f = OpSpecConstantOp %iarr3 CompositeInsert %sc_0 %iarr3_e 2\n" "%iarr3_g = OpSpecConstantOp %iarr3 CompositeInsert %sc_2 %iarr3_0 0\n" // Compose (sc_2, sc_0, sc_1) "%iarr3_h = OpSpecConstantOp %iarr3 CompositeInsert %sc_0 %iarr3_g 1\n" "%iarr3_i = OpSpecConstantOp %iarr3 CompositeInsert %sc_1 %iarr3_h 2\n" "%imat3_a = OpSpecConstantOp %imat3 CompositeInsert %iarr3_c %imat3_0 0\n" // Matrix with the 3 previous arrays. "%imat3_b = OpSpecConstantOp %imat3 CompositeInsert %iarr3_f %imat3_a 1\n" "%imat3_c = OpSpecConstantOp %imat3 CompositeInsert %iarr3_i %imat3_b 2\n" "%struct_a = OpSpecConstantOp %struct CompositeInsert %imat3_c %struct_0 0\n" // Save it in the struct. "%comp_0_0 = OpSpecConstantOp %i32 CompositeExtract %struct_a 0 0 0\n" // Extract some component pairs to compare them. "%comp_1_0 = OpSpecConstantOp %i32 CompositeExtract %struct_a 0 1 0\n" "%comp_0_1 = OpSpecConstantOp %i32 CompositeExtract %struct_a 0 0 1\n" "%comp_2_2 = OpSpecConstantOp %i32 CompositeExtract %struct_a 0 2 2\n" "%comp_2_0 = OpSpecConstantOp %i32 CompositeExtract %struct_a 0 2 0\n" "%comp_1_1 = OpSpecConstantOp %i32 CompositeExtract %struct_a 0 1 1\n" "%cmpres_0 = OpSpecConstantOp %bool IEqual %comp_0_0 %comp_1_0\n" // Must be false. "%cmpres_1 = OpSpecConstantOp %bool IEqual %comp_0_1 %comp_2_2\n" // Must be true. "%cmpres_2 = OpSpecConstantOp %bool IEqual %comp_2_0 %comp_1_1\n" // Must be true. "%mustbe_0 = OpSpecConstantOp %i32 Select %cmpres_0 %one %zero\n" // Must select 0 "%mustbe_1 = OpSpecConstantOp %i32 Select %cmpres_1 %one %zero\n" // Must select 1 "%mustbe_2 = OpSpecConstantOp %i32 Select %cmpres_2 %two %one\n" // Must select 2 ; } std::string getSpecConstantOpStructInstructions () { return // Multiply final result with (1-mustbezero)*(mustbeone)*(mustbetwo-1). If everything goes right, the factor should be 1 and // the final result should not be altered. "%subf_a = OpISub %i32 %one %mustbe_0\n" "%subf_b = OpIMul %i32 %subf_a %mustbe_1\n" "%subf_c = OpISub %i32 %mustbe_2 %one\n" "%factor = OpIMul %i32 %subf_b %subf_c\n" "%sc_final = OpIMul %i32 %factor %sc_factor\n" ; } tcu::TestCaseGroup* createSpecConstantGroup (tcu::TestContext& testCtx) { de::MovePtr group (new tcu::TestCaseGroup(testCtx, "opspecconstantop", "Test the OpSpecConstantOp instruction")); vector cases; de::Random rnd (deStringHash(group->getName())); const int numElements = 100; vector inputInts (numElements, 0); vector outputInts1 (numElements, 0); vector outputInts2 (numElements, 0); vector outputInts3 (numElements, 0); vector outputInts4 (numElements, 0); vector outputInts5 (numElements, 0); const StringTemplate shaderTemplate ( "${CAPABILITIES:opt}" + string(getComputeAsmShaderPreamble()) + "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" "OpDecorate %sc_0 SpecId 0\n" "OpDecorate %sc_1 SpecId 1\n" "OpDecorate %i32arr ArrayStride 4\n" + string(getComputeAsmInputOutputBufferTraits()) + string(getComputeAsmCommonTypes()) + "${OPTYPE_DEFINITIONS:opt}" "%buf = OpTypeStruct %i32arr\n" "%bufptr = OpTypePointer Uniform %buf\n" "%indata = OpVariable %bufptr Uniform\n" "%outdata = OpVariable %bufptr Uniform\n" "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%sc_0 = OpSpecConstant${SC_DEF0}\n" "%sc_1 = OpSpecConstant${SC_DEF1}\n" "%sc_final = OpSpecConstantOp ${SC_RESULT_TYPE} ${SC_OP}\n" "%main = OpFunction %void None %voidf\n" "%label = OpLabel\n" "${TYPE_CONVERT:opt}" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc = OpAccessChain %i32ptr %indata %zero %x\n" "%inval = OpLoad %i32 %inloc\n" "%final = ${GEN_RESULT}\n" "%outloc = OpAccessChain %i32ptr %outdata %zero %x\n" " OpStore %outloc %final\n" " OpReturn\n" " OpFunctionEnd\n"); fillRandomScalars(rnd, -65536, 65536, &inputInts[0], numElements); for (size_t ndx = 0; ndx < numElements; ++ndx) { outputInts1[ndx] = inputInts[ndx] + 42; outputInts2[ndx] = inputInts[ndx]; outputInts3[ndx] = inputInts[ndx] - 11200; outputInts4[ndx] = inputInts[ndx] + 1; outputInts5[ndx] = inputInts[ndx] - 42; } const char addScToInput[] = "OpIAdd %i32 %inval %sc_final"; const char addSc32ToInput[] = "OpIAdd %i32 %inval %sc_final32"; const char selectTrueUsingSc[] = "OpSelect %i32 %sc_final %inval %zero"; const char selectFalseUsingSc[] = "OpSelect %i32 %sc_final %zero %inval"; cases.push_back(SpecConstantTwoValCase("iadd", " %i32 0", " %i32 0", "%i32", "IAdd %sc_0 %sc_1", 62, -20, addScToInput, outputInts1)); cases.push_back(SpecConstantTwoValCase("isub", " %i32 0", " %i32 0", "%i32", "ISub %sc_0 %sc_1", 100, 58, addScToInput, outputInts1)); cases.push_back(SpecConstantTwoValCase("imul", " %i32 0", " %i32 0", "%i32", "IMul %sc_0 %sc_1", -2, -21, addScToInput, outputInts1)); cases.push_back(SpecConstantTwoValCase("sdiv", " %i32 0", " %i32 0", "%i32", "SDiv %sc_0 %sc_1", -126, -3, addScToInput, outputInts1)); cases.push_back(SpecConstantTwoValCase("udiv", " %i32 0", " %i32 0", "%i32", "UDiv %sc_0 %sc_1", 126, 3, addScToInput, outputInts1)); cases.push_back(SpecConstantTwoValCase("srem", " %i32 0", " %i32 0", "%i32", "SRem %sc_0 %sc_1", 7, 3, addScToInput, outputInts4)); cases.push_back(SpecConstantTwoValCase("smod", " %i32 0", " %i32 0", "%i32", "SMod %sc_0 %sc_1", 7, 3, addScToInput, outputInts4)); cases.push_back(SpecConstantTwoValCase("umod", " %i32 0", " %i32 0", "%i32", "UMod %sc_0 %sc_1", 342, 50, addScToInput, outputInts1)); cases.push_back(SpecConstantTwoValCase("bitwiseand", " %i32 0", " %i32 0", "%i32", "BitwiseAnd %sc_0 %sc_1", 42, 63, addScToInput, outputInts1)); cases.push_back(SpecConstantTwoValCase("bitwiseor", " %i32 0", " %i32 0", "%i32", "BitwiseOr %sc_0 %sc_1", 34, 8, addScToInput, outputInts1)); cases.push_back(SpecConstantTwoValCase("bitwisexor", " %i32 0", " %i32 0", "%i32", "BitwiseXor %sc_0 %sc_1", 18, 56, addScToInput, outputInts1)); cases.push_back(SpecConstantTwoValCase("shiftrightlogical", " %i32 0", " %i32 0", "%i32", "ShiftRightLogical %sc_0 %sc_1", 168, 2, addScToInput, outputInts1)); cases.push_back(SpecConstantTwoValCase("shiftrightarithmetic", " %i32 0", " %i32 0", "%i32", "ShiftRightArithmetic %sc_0 %sc_1", -168, 2, addScToInput, outputInts5)); cases.push_back(SpecConstantTwoValCase("shiftleftlogical", " %i32 0", " %i32 0", "%i32", "ShiftLeftLogical %sc_0 %sc_1", 21, 1, addScToInput, outputInts1)); // Shifts for other integer sizes. cases.push_back(SpecConstantTwoValCase("shiftrightlogical_i64", " %i64 0", " %i64 0", "%i64", "ShiftRightLogical %sc_0 %sc_1", deInt64{168}, deInt64{2}, addSc32ToInput, outputInts1, (FLAG_I64 | FLAG_CONVERT))); cases.push_back(SpecConstantTwoValCase("shiftrightarithmetic_i64", " %i64 0", " %i64 0", "%i64", "ShiftRightArithmetic %sc_0 %sc_1", deInt64{-168}, deInt64{2}, addSc32ToInput, outputInts5, (FLAG_I64 | FLAG_CONVERT))); cases.push_back(SpecConstantTwoValCase("shiftleftlogical_i64", " %i64 0", " %i64 0", "%i64", "ShiftLeftLogical %sc_0 %sc_1", deInt64{21}, deInt64{1}, addSc32ToInput, outputInts1, (FLAG_I64 | FLAG_CONVERT))); cases.push_back(SpecConstantTwoValCase("shiftrightlogical_i16", " %i16 0", " %i16 0", "%i16", "ShiftRightLogical %sc_0 %sc_1", deInt16{168}, deInt16{2}, addSc32ToInput, outputInts1, (FLAG_I16 | FLAG_CONVERT))); cases.push_back(SpecConstantTwoValCase("shiftrightarithmetic_i16", " %i16 0", " %i16 0", "%i16", "ShiftRightArithmetic %sc_0 %sc_1", deInt16{-168}, deInt16{2}, addSc32ToInput, outputInts5, (FLAG_I16 | FLAG_CONVERT))); cases.push_back(SpecConstantTwoValCase("shiftleftlogical_i16", " %i16 0", " %i16 0", "%i16", "ShiftLeftLogical %sc_0 %sc_1", deInt16{21}, deInt16{1}, addSc32ToInput, outputInts1, (FLAG_I16 | FLAG_CONVERT))); cases.push_back(SpecConstantTwoValCase("shiftrightlogical_i8", " %i8 0", " %i8 0", "%i8", "ShiftRightLogical %sc_0 %sc_1", deInt8{84}, deInt8{1}, addSc32ToInput, outputInts1, (FLAG_I8 | FLAG_CONVERT))); cases.push_back(SpecConstantTwoValCase("shiftrightarithmetic_i8", " %i8 0", " %i8 0", "%i8", "ShiftRightArithmetic %sc_0 %sc_1", deInt8{-84}, deInt8{1}, addSc32ToInput, outputInts5, (FLAG_I8 | FLAG_CONVERT))); cases.push_back(SpecConstantTwoValCase("shiftleftlogical_i8", " %i8 0", " %i8 0", "%i8", "ShiftLeftLogical %sc_0 %sc_1", deInt8{21}, deInt8{1}, addSc32ToInput, outputInts1, (FLAG_I8 | FLAG_CONVERT))); // Shifts for other integer sizes but only in the shift amount. cases.push_back(SpecConstantTwoValCase("shiftrightlogical_s_i64", " %i32 0", " %i64 0", "%i32", "ShiftRightLogical %sc_0 %sc_1", 168, deInt64{2}, addScToInput, outputInts1, (FLAG_I64))); cases.push_back(SpecConstantTwoValCase("shiftrightarithmetic_s_i64"," %i32 0", " %i64 0", "%i32", "ShiftRightArithmetic %sc_0 %sc_1", -168, deInt64{2}, addScToInput, outputInts5, (FLAG_I64))); cases.push_back(SpecConstantTwoValCase("shiftleftlogical_s_i64", " %i32 0", " %i64 0", "%i32", "ShiftLeftLogical %sc_0 %sc_1", 21, deInt64{1}, addScToInput, outputInts1, (FLAG_I64))); cases.push_back(SpecConstantTwoValCase("shiftrightlogical_s_i16", " %i32 0", " %i16 0", "%i32", "ShiftRightLogical %sc_0 %sc_1", 168, deInt16{2}, addScToInput, outputInts1, (FLAG_I16))); cases.push_back(SpecConstantTwoValCase("shiftrightarithmetic_s_i16"," %i32 0", " %i16 0", "%i32", "ShiftRightArithmetic %sc_0 %sc_1", -168, deInt16{2}, addScToInput, outputInts5, (FLAG_I16))); cases.push_back(SpecConstantTwoValCase("shiftleftlogical_s_i16", " %i32 0", " %i16 0", "%i32", "ShiftLeftLogical %sc_0 %sc_1", 21, deInt16{1}, addScToInput, outputInts1, (FLAG_I16))); cases.push_back(SpecConstantTwoValCase("shiftrightlogical_s_i8", " %i32 0", " %i8 0", "%i32", "ShiftRightLogical %sc_0 %sc_1", 84, deInt8{1}, addScToInput, outputInts1, (FLAG_I8))); cases.push_back(SpecConstantTwoValCase("shiftrightarithmetic_s_i8", " %i32 0", " %i8 0", "%i32", "ShiftRightArithmetic %sc_0 %sc_1", -84, deInt8{1}, addScToInput, outputInts5, (FLAG_I8))); cases.push_back(SpecConstantTwoValCase("shiftleftlogical_s_i8", " %i32 0", " %i8 0", "%i32", "ShiftLeftLogical %sc_0 %sc_1", 21, deInt8{1}, addScToInput, outputInts1, (FLAG_I8))); cases.push_back(SpecConstantTwoValCase("slessthan", " %i32 0", " %i32 0", "%bool", "SLessThan %sc_0 %sc_1", -20, -10, selectTrueUsingSc, outputInts2)); cases.push_back(SpecConstantTwoValCase("ulessthan", " %i32 0", " %i32 0", "%bool", "ULessThan %sc_0 %sc_1", 10, 20, selectTrueUsingSc, outputInts2)); cases.push_back(SpecConstantTwoValCase("sgreaterthan", " %i32 0", " %i32 0", "%bool", "SGreaterThan %sc_0 %sc_1", -1000, 50, selectFalseUsingSc, outputInts2)); cases.push_back(SpecConstantTwoValCase("ugreaterthan", " %i32 0", " %i32 0", "%bool", "UGreaterThan %sc_0 %sc_1", 10, 5, selectTrueUsingSc, outputInts2)); cases.push_back(SpecConstantTwoValCase("slessthanequal", " %i32 0", " %i32 0", "%bool", "SLessThanEqual %sc_0 %sc_1", -10, -10, selectTrueUsingSc, outputInts2)); cases.push_back(SpecConstantTwoValCase("ulessthanequal", " %i32 0", " %i32 0", "%bool", "ULessThanEqual %sc_0 %sc_1", 50, 100, selectTrueUsingSc, outputInts2)); cases.push_back(SpecConstantTwoValCase("sgreaterthanequal", " %i32 0", " %i32 0", "%bool", "SGreaterThanEqual %sc_0 %sc_1", -1000, 50, selectFalseUsingSc, outputInts2)); cases.push_back(SpecConstantTwoValCase("ugreaterthanequal", " %i32 0", " %i32 0", "%bool", "UGreaterThanEqual %sc_0 %sc_1", 10, 10, selectTrueUsingSc, outputInts2)); cases.push_back(SpecConstantTwoValCase("iequal", " %i32 0", " %i32 0", "%bool", "IEqual %sc_0 %sc_1", 42, 24, selectFalseUsingSc, outputInts2)); cases.push_back(SpecConstantTwoValCase("inotequal", " %i32 0", " %i32 0", "%bool", "INotEqual %sc_0 %sc_1", 42, 24, selectTrueUsingSc, outputInts2)); cases.push_back(SpecConstantTwoValCase("logicaland", "True %bool", "True %bool", "%bool", "LogicalAnd %sc_0 %sc_1", 0, 1, selectFalseUsingSc, outputInts2)); cases.push_back(SpecConstantTwoValCase("logicalor", "False %bool", "False %bool", "%bool", "LogicalOr %sc_0 %sc_1", 1, 0, selectTrueUsingSc, outputInts2)); cases.push_back(SpecConstantTwoValCase("logicalequal", "True %bool", "True %bool", "%bool", "LogicalEqual %sc_0 %sc_1", 0, 1, selectFalseUsingSc, outputInts2)); cases.push_back(SpecConstantTwoValCase("logicalnotequal", "False %bool", "False %bool", "%bool", "LogicalNotEqual %sc_0 %sc_1", 1, 0, selectTrueUsingSc, outputInts2)); cases.push_back(SpecConstantTwoValCase("snegate", " %i32 0", " %i32 0", "%i32", "SNegate %sc_0", -42, 0, addScToInput, outputInts1)); cases.push_back(SpecConstantTwoValCase("not", " %i32 0", " %i32 0", "%i32", "Not %sc_0", -43, 0, addScToInput, outputInts1)); cases.push_back(SpecConstantTwoValCase("logicalnot", "False %bool", "False %bool", "%bool", "LogicalNot %sc_0", 1, 0, selectFalseUsingSc, outputInts2)); cases.push_back(SpecConstantTwoValCase("select", "False %bool", " %i32 0", "%i32", "Select %sc_0 %sc_1 %zero", 1, 42, addScToInput, outputInts1)); cases.push_back(SpecConstantTwoValCase("sconvert", " %i32 0", " %i32 0", "%i16", "SConvert %sc_0", -11200, 0, addSc32ToInput, outputInts3, (FLAG_I16 | FLAG_CONVERT))); cases.push_back(SpecConstantTwoValCase("fconvert", " %f32 0", " %f32 0", "%f64", "FConvert %sc_0", tcu::Float32{-11200.0}, tcu::Float32{0.0}, addSc32ToInput, outputInts3, (FLAG_F64 | FLAG_CONVERT))); cases.push_back(SpecConstantTwoValCase("fconvert16", " %f16 0", " %f16 0", "%f32", "FConvert %sc_0", tcu::Float16{1.0}, tcu::Float16{0.0}, addSc32ToInput, outputInts4, (FLAG_F16 | FLAG_CONVERT))); for (size_t caseNdx = 0; caseNdx < cases.size(); ++caseNdx) { map specializations; ComputeShaderSpec spec; specializations["SC_DEF0"] = cases[caseNdx].scDefinition0; specializations["SC_DEF1"] = cases[caseNdx].scDefinition1; specializations["SC_RESULT_TYPE"] = cases[caseNdx].scResultType; specializations["SC_OP"] = cases[caseNdx].scOperation; specializations["GEN_RESULT"] = cases[caseNdx].resultOperation; // Special SPIR-V code when using 16-bit integers. if (cases[caseNdx].caseFlags & FLAG_I16) { spec.requestedVulkanFeatures.coreFeatures.shaderInt16 = VK_TRUE; specializations["CAPABILITIES"] += "OpCapability Int16\n"; // Adds 16-bit integer capability specializations["OPTYPE_DEFINITIONS"] += "%i16 = OpTypeInt 16 1\n"; // Adds 16-bit integer type if (cases[caseNdx].caseFlags & FLAG_CONVERT) specializations["TYPE_CONVERT"] += "%sc_final32 = OpSConvert %i32 %sc_final\n"; // Converts 16-bit integer to 32-bit integer } // Special SPIR-V code when using 64-bit integers. if (cases[caseNdx].caseFlags & FLAG_I64) { spec.requestedVulkanFeatures.coreFeatures.shaderInt64 = VK_TRUE; specializations["CAPABILITIES"] += "OpCapability Int64\n"; // Adds 64-bit integer capability specializations["OPTYPE_DEFINITIONS"] += "%i64 = OpTypeInt 64 1\n"; // Adds 64-bit integer type if (cases[caseNdx].caseFlags & FLAG_CONVERT) specializations["TYPE_CONVERT"] += "%sc_final32 = OpSConvert %i32 %sc_final\n"; // Converts 64-bit integer to 32-bit integer } // Special SPIR-V code when using 64-bit floats. if (cases[caseNdx].caseFlags & FLAG_F64) { spec.requestedVulkanFeatures.coreFeatures.shaderFloat64 = VK_TRUE; specializations["CAPABILITIES"] += "OpCapability Float64\n"; // Adds 64-bit float capability specializations["OPTYPE_DEFINITIONS"] += "%f64 = OpTypeFloat 64\n"; // Adds 64-bit float type if (cases[caseNdx].caseFlags & FLAG_CONVERT) specializations["TYPE_CONVERT"] += "%sc_final32 = OpConvertFToS %i32 %sc_final\n"; // Converts 64-bit float to 32-bit integer } // Extension needed for float16 and int8. if (cases[caseNdx].caseFlags & (FLAG_F16 | FLAG_I8)) spec.extensions.push_back("VK_KHR_shader_float16_int8"); // Special SPIR-V code when using 16-bit floats. if (cases[caseNdx].caseFlags & FLAG_F16) { spec.requestedVulkanFeatures.extFloat16Int8.shaderFloat16 = true; specializations["CAPABILITIES"] += "OpCapability Float16\n"; // Adds 16-bit float capability specializations["OPTYPE_DEFINITIONS"] += "%f16 = OpTypeFloat 16\n"; // Adds 16-bit float type if (cases[caseNdx].caseFlags & FLAG_CONVERT) specializations["TYPE_CONVERT"] += "%sc_final32 = OpConvertFToS %i32 %sc_final\n"; // Converts 16-bit float to 32-bit integer } // Special SPIR-V code when using 8-bit integers. if (cases[caseNdx].caseFlags & FLAG_I8) { spec.requestedVulkanFeatures.extFloat16Int8.shaderInt8 = true; specializations["CAPABILITIES"] += "OpCapability Int8\n"; // Adds 8-bit integer capability specializations["OPTYPE_DEFINITIONS"] += "%i8 = OpTypeInt 8 1\n"; // Adds 8-bit integer type if (cases[caseNdx].caseFlags & FLAG_CONVERT) specializations["TYPE_CONVERT"] += "%sc_final32 = OpSConvert %i32 %sc_final\n"; // Converts 8-bit integer to 32-bit integer } spec.assembly = shaderTemplate.specialize(specializations); spec.inputs.push_back(BufferSp(new Int32Buffer(inputInts))); spec.outputs.push_back(BufferSp(new Int32Buffer(cases[caseNdx].expectedOutput))); spec.numWorkGroups = IVec3(numElements, 1, 1); cases[caseNdx].scActualValue0.appendTo(spec.specConstants); cases[caseNdx].scActualValue1.appendTo(spec.specConstants); group->addChild(new SpvAsmComputeShaderCase(testCtx, cases[caseNdx].caseName.c_str(), spec)); } ComputeShaderSpec spec; spec.assembly = string(getComputeAsmShaderPreamble()) + "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" "OpDecorate %sc_0 SpecId 0\n" "OpDecorate %sc_1 SpecId 1\n" "OpDecorate %sc_2 SpecId 2\n" "OpDecorate %i32arr ArrayStride 4\n" + string(getComputeAsmInputOutputBufferTraits()) + string(getComputeAsmCommonTypes()) + "%ivec3 = OpTypeVector %i32 3\n" + getSpecConstantOpStructConstantsAndTypes() + "%buf = OpTypeStruct %i32arr\n" "%bufptr = OpTypePointer Uniform %buf\n" "%indata = OpVariable %bufptr Uniform\n" "%outdata = OpVariable %bufptr Uniform\n" "%id = OpVariable %uvec3ptr Input\n" "%ivec3_0 = OpConstantComposite %ivec3 %zero %zero %zero\n" "%vec3_undef = OpUndef %ivec3\n" + getSpecConstantOpStructComposites () + "%sc_0 = OpSpecConstant %i32 0\n" "%sc_1 = OpSpecConstant %i32 0\n" "%sc_2 = OpSpecConstant %i32 0\n" + getSpecConstantOpStructConstBlock () + "%sc_vec3_0 = OpSpecConstantOp %ivec3 CompositeInsert %sc_0 %ivec3_0 0\n" // (sc_0, 0, 0) "%sc_vec3_1 = OpSpecConstantOp %ivec3 CompositeInsert %sc_1 %ivec3_0 1\n" // (0, sc_1, 0) "%sc_vec3_2 = OpSpecConstantOp %ivec3 CompositeInsert %sc_2 %ivec3_0 2\n" // (0, 0, sc_2) "%sc_vec3_0_s = OpSpecConstantOp %ivec3 VectorShuffle %sc_vec3_0 %vec3_undef 0 0xFFFFFFFF 2\n" // (sc_0, ???, 0) "%sc_vec3_1_s = OpSpecConstantOp %ivec3 VectorShuffle %sc_vec3_1 %vec3_undef 0xFFFFFFFF 1 0\n" // (???, sc_1, 0) "%sc_vec3_2_s = OpSpecConstantOp %ivec3 VectorShuffle %vec3_undef %sc_vec3_2 5 0xFFFFFFFF 5\n" // (sc_2, ???, sc_2) "%sc_vec3_01 = OpSpecConstantOp %ivec3 VectorShuffle %sc_vec3_0_s %sc_vec3_1_s 1 0 4\n" // (0, sc_0, sc_1) "%sc_vec3_012 = OpSpecConstantOp %ivec3 VectorShuffle %sc_vec3_01 %sc_vec3_2_s 5 1 2\n" // (sc_2, sc_0, sc_1) "%sc_ext_0 = OpSpecConstantOp %i32 CompositeExtract %sc_vec3_012 0\n" // sc_2 "%sc_ext_1 = OpSpecConstantOp %i32 CompositeExtract %sc_vec3_012 1\n" // sc_0 "%sc_ext_2 = OpSpecConstantOp %i32 CompositeExtract %sc_vec3_012 2\n" // sc_1 "%sc_sub = OpSpecConstantOp %i32 ISub %sc_ext_0 %sc_ext_1\n" // (sc_2 - sc_0) "%sc_factor = OpSpecConstantOp %i32 IMul %sc_sub %sc_ext_2\n" // (sc_2 - sc_0) * sc_1 "%main = OpFunction %void None %voidf\n" "%label = OpLabel\n" + getSpecConstantOpStructInstructions() + "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc = OpAccessChain %i32ptr %indata %zero %x\n" "%inval = OpLoad %i32 %inloc\n" "%final = OpIAdd %i32 %inval %sc_final\n" "%outloc = OpAccessChain %i32ptr %outdata %zero %x\n" " OpStore %outloc %final\n" " OpReturn\n" " OpFunctionEnd\n"; spec.inputs.push_back(BufferSp(new Int32Buffer(inputInts))); spec.outputs.push_back(BufferSp(new Int32Buffer(outputInts3))); spec.numWorkGroups = IVec3(numElements, 1, 1); spec.specConstants.append(123); spec.specConstants.append(56); spec.specConstants.append(-77); group->addChild(new SpvAsmComputeShaderCase(testCtx, "vector_related", spec)); return group.release(); } void createOpPhiVartypeTests (de::MovePtr& group, tcu::TestContext& testCtx) { ComputeShaderSpec specInt; ComputeShaderSpec specFloat; ComputeShaderSpec specFloat16; ComputeShaderSpec specVec3; ComputeShaderSpec specMat4; ComputeShaderSpec specArray; ComputeShaderSpec specStruct; de::Random rnd (deStringHash(group->getName())); const int numElements = 100; vector inputFloats (numElements, 0); vector outputFloats (numElements, 0); vector inputUints (numElements, 0); vector outputUints (numElements, 0); fillRandomScalars(rnd, -300.f, 300.f, &inputFloats[0], numElements); // CPU might not use the same rounding mode as the GPU. Use whole numbers to avoid rounding differences. floorAll(inputFloats); for (size_t ndx = 0; ndx < numElements; ++ndx) { // Just check if the value is positive or not outputFloats[ndx] = (inputFloats[ndx] > 0) ? 1.0f : -1.0f; } for (size_t ndx = 0; ndx < numElements; ++ndx) { inputUints[ndx] = tcu::Float16(inputFloats[ndx]).bits(); outputUints[ndx] = tcu::Float16(outputFloats[ndx]).bits(); } // All of the tests are of the form: // // testtype r // // if (inputdata > 0) // r = 1 // else // r = -1 // // return (float)r specFloat.assembly = string(getComputeAsmShaderPreamble()) + "OpSource GLSL 430\n" "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" + string(getComputeAsmInputOutputBufferTraits()) + string(getComputeAsmCommonTypes()) + string(getComputeAsmInputOutputBuffer()) + "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%float_0 = OpConstant %f32 0.0\n" "%float_1 = OpConstant %f32 1.0\n" "%float_n1 = OpConstant %f32 -1.0\n" "%main = OpFunction %void None %voidf\n" "%entry = OpLabel\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc = OpAccessChain %f32ptr %indata %zero %x\n" "%inval = OpLoad %f32 %inloc\n" "%comp = OpFOrdGreaterThan %bool %inval %float_0\n" " OpSelectionMerge %cm None\n" " OpBranchConditional %comp %tb %fb\n" "%tb = OpLabel\n" " OpBranch %cm\n" "%fb = OpLabel\n" " OpBranch %cm\n" "%cm = OpLabel\n" "%res = OpPhi %f32 %float_1 %tb %float_n1 %fb\n" "%outloc = OpAccessChain %f32ptr %outdata %zero %x\n" " OpStore %outloc %res\n" " OpReturn\n" " OpFunctionEnd\n"; specFloat.inputs.push_back(BufferSp(new Float32Buffer(inputFloats))); specFloat.outputs.push_back(BufferSp(new Float32Buffer(outputFloats))); specFloat.numWorkGroups = IVec3(numElements, 1, 1); specFloat16.assembly = "OpCapability Shader\n" "OpCapability Float16\n" "OpMemoryModel Logical GLSL450\n" "OpEntryPoint GLCompute %main \"main\" %id\n" "OpExecutionMode %main LocalSize 1 1 1\n" "OpSource GLSL 430\n" "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" "OpDecorate %buf BufferBlock\n" "OpDecorate %indata DescriptorSet 0\n" "OpDecorate %indata Binding 0\n" "OpDecorate %outdata DescriptorSet 0\n" "OpDecorate %outdata Binding 1\n" "OpDecorate %u32arr ArrayStride 4\n" "OpMemberDecorate %buf 0 Offset 0\n" + string(getComputeAsmCommonTypes()) + "%f16 = OpTypeFloat 16\n" "%f16vec2 = OpTypeVector %f16 2\n" "%fvec2 = OpTypeVector %f32 2\n" "%u32ptr = OpTypePointer Uniform %u32\n" "%u32arr = OpTypeRuntimeArray %u32\n" "%f16_0 = OpConstant %f16 0.0\n" "%buf = OpTypeStruct %u32arr\n" "%bufptr = OpTypePointer Uniform %buf\n" "%indata = OpVariable %bufptr Uniform\n" "%outdata = OpVariable %bufptr Uniform\n" "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%float_0 = OpConstant %f32 0.0\n" "%float_1 = OpConstant %f32 1.0\n" "%float_n1 = OpConstant %f32 -1.0\n" "%main = OpFunction %void None %voidf\n" "%entry = OpLabel\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc = OpAccessChain %u32ptr %indata %zero %x\n" "%inval = OpLoad %u32 %inloc\n" "%f16_vec2_inval = OpBitcast %f16vec2 %inval\n" "%f16_inval = OpCompositeExtract %f16 %f16_vec2_inval 0\n" "%f32_inval = OpFConvert %f32 %f16_inval\n" "%comp = OpFOrdGreaterThan %bool %f32_inval %float_0\n" " OpSelectionMerge %cm None\n" " OpBranchConditional %comp %tb %fb\n" "%tb = OpLabel\n" " OpBranch %cm\n" "%fb = OpLabel\n" " OpBranch %cm\n" "%cm = OpLabel\n" "%res = OpPhi %f32 %float_1 %tb %float_n1 %fb\n" "%f16_res = OpFConvert %f16 %res\n" "%f16vec2_res = OpCompositeConstruct %f16vec2 %f16_res %f16_0\n" "%u32_res = OpBitcast %u32 %f16vec2_res\n" "%outloc = OpAccessChain %u32ptr %outdata %zero %x\n" " OpStore %outloc %u32_res\n" " OpReturn\n" " OpFunctionEnd\n"; specFloat16.inputs.push_back(BufferSp(new Uint32Buffer(inputUints))); specFloat16.outputs.push_back(BufferSp(new Uint32Buffer(outputUints))); specFloat16.numWorkGroups = IVec3(numElements, 1, 1); specFloat16.requestedVulkanFeatures.extFloat16Int8.shaderFloat16 = true; specMat4.assembly = string(getComputeAsmShaderPreamble()) + "OpSource GLSL 430\n" "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" + string(getComputeAsmInputOutputBufferTraits()) + string(getComputeAsmCommonTypes()) + string(getComputeAsmInputOutputBuffer()) + "%id = OpVariable %uvec3ptr Input\n" "%v4f32 = OpTypeVector %f32 4\n" "%mat4v4f32 = OpTypeMatrix %v4f32 4\n" "%zero = OpConstant %i32 0\n" "%float_0 = OpConstant %f32 0.0\n" "%float_1 = OpConstant %f32 1.0\n" "%float_n1 = OpConstant %f32 -1.0\n" "%m11 = OpConstantComposite %v4f32 %float_1 %float_0 %float_0 %float_0\n" "%m12 = OpConstantComposite %v4f32 %float_0 %float_1 %float_0 %float_0\n" "%m13 = OpConstantComposite %v4f32 %float_0 %float_0 %float_1 %float_0\n" "%m14 = OpConstantComposite %v4f32 %float_0 %float_0 %float_0 %float_1\n" "%m1 = OpConstantComposite %mat4v4f32 %m11 %m12 %m13 %m14\n" "%m21 = OpConstantComposite %v4f32 %float_n1 %float_0 %float_0 %float_0\n" "%m22 = OpConstantComposite %v4f32 %float_0 %float_n1 %float_0 %float_0\n" "%m23 = OpConstantComposite %v4f32 %float_0 %float_0 %float_n1 %float_0\n" "%m24 = OpConstantComposite %v4f32 %float_0 %float_0 %float_0 %float_n1\n" "%m2 = OpConstantComposite %mat4v4f32 %m21 %m22 %m23 %m24\n" "%main = OpFunction %void None %voidf\n" "%entry = OpLabel\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc = OpAccessChain %f32ptr %indata %zero %x\n" "%inval = OpLoad %f32 %inloc\n" "%comp = OpFOrdGreaterThan %bool %inval %float_0\n" " OpSelectionMerge %cm None\n" " OpBranchConditional %comp %tb %fb\n" "%tb = OpLabel\n" " OpBranch %cm\n" "%fb = OpLabel\n" " OpBranch %cm\n" "%cm = OpLabel\n" "%mres = OpPhi %mat4v4f32 %m1 %tb %m2 %fb\n" "%res = OpCompositeExtract %f32 %mres 2 2\n" "%outloc = OpAccessChain %f32ptr %outdata %zero %x\n" " OpStore %outloc %res\n" " OpReturn\n" " OpFunctionEnd\n"; specMat4.inputs.push_back(BufferSp(new Float32Buffer(inputFloats))); specMat4.outputs.push_back(BufferSp(new Float32Buffer(outputFloats))); specMat4.numWorkGroups = IVec3(numElements, 1, 1); specVec3.assembly = string(getComputeAsmShaderPreamble()) + "OpSource GLSL 430\n" "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" + string(getComputeAsmInputOutputBufferTraits()) + string(getComputeAsmCommonTypes()) + string(getComputeAsmInputOutputBuffer()) + "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%float_0 = OpConstant %f32 0.0\n" "%float_1 = OpConstant %f32 1.0\n" "%float_n1 = OpConstant %f32 -1.0\n" "%v1 = OpConstantComposite %fvec3 %float_1 %float_1 %float_1\n" "%v2 = OpConstantComposite %fvec3 %float_n1 %float_n1 %float_n1\n" "%main = OpFunction %void None %voidf\n" "%entry = OpLabel\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc = OpAccessChain %f32ptr %indata %zero %x\n" "%inval = OpLoad %f32 %inloc\n" "%comp = OpFOrdGreaterThan %bool %inval %float_0\n" " OpSelectionMerge %cm None\n" " OpBranchConditional %comp %tb %fb\n" "%tb = OpLabel\n" " OpBranch %cm\n" "%fb = OpLabel\n" " OpBranch %cm\n" "%cm = OpLabel\n" "%vres = OpPhi %fvec3 %v1 %tb %v2 %fb\n" "%res = OpCompositeExtract %f32 %vres 2\n" "%outloc = OpAccessChain %f32ptr %outdata %zero %x\n" " OpStore %outloc %res\n" " OpReturn\n" " OpFunctionEnd\n"; specVec3.inputs.push_back(BufferSp(new Float32Buffer(inputFloats))); specVec3.outputs.push_back(BufferSp(new Float32Buffer(outputFloats))); specVec3.numWorkGroups = IVec3(numElements, 1, 1); specInt.assembly = string(getComputeAsmShaderPreamble()) + "OpSource GLSL 430\n" "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" + string(getComputeAsmInputOutputBufferTraits()) + string(getComputeAsmCommonTypes()) + string(getComputeAsmInputOutputBuffer()) + "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%float_0 = OpConstant %f32 0.0\n" "%i1 = OpConstant %i32 1\n" "%i2 = OpConstant %i32 -1\n" "%main = OpFunction %void None %voidf\n" "%entry = OpLabel\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc = OpAccessChain %f32ptr %indata %zero %x\n" "%inval = OpLoad %f32 %inloc\n" "%comp = OpFOrdGreaterThan %bool %inval %float_0\n" " OpSelectionMerge %cm None\n" " OpBranchConditional %comp %tb %fb\n" "%tb = OpLabel\n" " OpBranch %cm\n" "%fb = OpLabel\n" " OpBranch %cm\n" "%cm = OpLabel\n" "%ires = OpPhi %i32 %i1 %tb %i2 %fb\n" "%res = OpConvertSToF %f32 %ires\n" "%outloc = OpAccessChain %f32ptr %outdata %zero %x\n" " OpStore %outloc %res\n" " OpReturn\n" " OpFunctionEnd\n"; specInt.inputs.push_back(BufferSp(new Float32Buffer(inputFloats))); specInt.outputs.push_back(BufferSp(new Float32Buffer(outputFloats))); specInt.numWorkGroups = IVec3(numElements, 1, 1); specArray.assembly = string(getComputeAsmShaderPreamble()) + "OpSource GLSL 430\n" "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" + string(getComputeAsmInputOutputBufferTraits()) + string(getComputeAsmCommonTypes()) + string(getComputeAsmInputOutputBuffer()) + "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%u7 = OpConstant %u32 7\n" "%float_0 = OpConstant %f32 0.0\n" "%float_1 = OpConstant %f32 1.0\n" "%float_n1 = OpConstant %f32 -1.0\n" "%f32a7 = OpTypeArray %f32 %u7\n" "%a1 = OpConstantComposite %f32a7 %float_1 %float_1 %float_1 %float_1 %float_1 %float_1 %float_1\n" "%a2 = OpConstantComposite %f32a7 %float_n1 %float_n1 %float_n1 %float_n1 %float_n1 %float_n1 %float_n1\n" "%main = OpFunction %void None %voidf\n" "%entry = OpLabel\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc = OpAccessChain %f32ptr %indata %zero %x\n" "%inval = OpLoad %f32 %inloc\n" "%comp = OpFOrdGreaterThan %bool %inval %float_0\n" " OpSelectionMerge %cm None\n" " OpBranchConditional %comp %tb %fb\n" "%tb = OpLabel\n" " OpBranch %cm\n" "%fb = OpLabel\n" " OpBranch %cm\n" "%cm = OpLabel\n" "%ares = OpPhi %f32a7 %a1 %tb %a2 %fb\n" "%res = OpCompositeExtract %f32 %ares 5\n" "%outloc = OpAccessChain %f32ptr %outdata %zero %x\n" " OpStore %outloc %res\n" " OpReturn\n" " OpFunctionEnd\n"; specArray.inputs.push_back(BufferSp(new Float32Buffer(inputFloats))); specArray.outputs.push_back(BufferSp(new Float32Buffer(outputFloats))); specArray.numWorkGroups = IVec3(numElements, 1, 1); specStruct.assembly = string(getComputeAsmShaderPreamble()) + "OpSource GLSL 430\n" "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" + string(getComputeAsmInputOutputBufferTraits()) + string(getComputeAsmCommonTypes()) + string(getComputeAsmInputOutputBuffer()) + "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%float_0 = OpConstant %f32 0.0\n" "%float_1 = OpConstant %f32 1.0\n" "%float_n1 = OpConstant %f32 -1.0\n" "%v2f32 = OpTypeVector %f32 2\n" "%Data2 = OpTypeStruct %f32 %v2f32\n" "%Data = OpTypeStruct %Data2 %f32\n" "%in1a = OpConstantComposite %v2f32 %float_1 %float_1\n" "%in1b = OpConstantComposite %Data2 %float_1 %in1a\n" "%s1 = OpConstantComposite %Data %in1b %float_1\n" "%in2a = OpConstantComposite %v2f32 %float_n1 %float_n1\n" "%in2b = OpConstantComposite %Data2 %float_n1 %in2a\n" "%s2 = OpConstantComposite %Data %in2b %float_n1\n" "%main = OpFunction %void None %voidf\n" "%entry = OpLabel\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc = OpAccessChain %f32ptr %indata %zero %x\n" "%inval = OpLoad %f32 %inloc\n" "%comp = OpFOrdGreaterThan %bool %inval %float_0\n" " OpSelectionMerge %cm None\n" " OpBranchConditional %comp %tb %fb\n" "%tb = OpLabel\n" " OpBranch %cm\n" "%fb = OpLabel\n" " OpBranch %cm\n" "%cm = OpLabel\n" "%sres = OpPhi %Data %s1 %tb %s2 %fb\n" "%res = OpCompositeExtract %f32 %sres 0 0\n" "%outloc = OpAccessChain %f32ptr %outdata %zero %x\n" " OpStore %outloc %res\n" " OpReturn\n" " OpFunctionEnd\n"; specStruct.inputs.push_back(BufferSp(new Float32Buffer(inputFloats))); specStruct.outputs.push_back(BufferSp(new Float32Buffer(outputFloats))); specStruct.numWorkGroups = IVec3(numElements, 1, 1); group->addChild(new SpvAsmComputeShaderCase(testCtx, "vartype_int", specInt)); group->addChild(new SpvAsmComputeShaderCase(testCtx, "vartype_float", specFloat)); group->addChild(new SpvAsmComputeShaderCase(testCtx, "vartype_float16", specFloat16)); group->addChild(new SpvAsmComputeShaderCase(testCtx, "vartype_vec3", specVec3)); group->addChild(new SpvAsmComputeShaderCase(testCtx, "vartype_mat4", specMat4)); group->addChild(new SpvAsmComputeShaderCase(testCtx, "vartype_array", specArray)); group->addChild(new SpvAsmComputeShaderCase(testCtx, "vartype_struct", specStruct)); } string generateConstantDefinitions (int count) { std::ostringstream r; for (int i = 0; i < count; i++) r << "%cf" << (i * 10 + 5) << " = OpConstant %f32 " <<(i * 10 + 5) << ".0\n"; r << "\n"; return r.str(); } string generateSwitchCases (int count) { std::ostringstream r; for (int i = 0; i < count; i++) r << " " << i << " %case" << i; r << "\n"; return r.str(); } string generateSwitchTargets (int count) { std::ostringstream r; for (int i = 0; i < count; i++) r << "%case" << i << " = OpLabel\n OpBranch %phi\n"; r << "\n"; return r.str(); } string generateOpPhiParams (int count) { std::ostringstream r; for (int i = 0; i < count; i++) r << " %cf" << (i * 10 + 5) << " %case" << i; r << "\n"; return r.str(); } string generateIntWidth (int value) { std::ostringstream r; r << value; return r.str(); } // Expand input string by injecting "ABC" between the input // string characters. The acc/add/treshold parameters are used // to skip some of the injections to make the result less // uniform (and a lot shorter). string expandOpPhiCase5 (const string& s, int &acc, int add, int treshold) { std::ostringstream res; const char* p = s.c_str(); while (*p) { res << *p; acc += add; if (acc > treshold) { acc -= treshold; res << "ABC"; } p++; } return res.str(); } // Calculate expected result based on the code string float calcOpPhiCase5 (float val, const string& s) { const char* p = s.c_str(); float x[8]; bool b[8]; const float tv[8] = { 0.5f, 1.5f, 3.5f, 7.5f, 15.5f, 31.5f, 63.5f, 127.5f }; const float v = deFloatAbs(val); float res = 0; int depth = -1; int skip = 0; for (int i = 7; i >= 0; --i) x[i] = std::fmod((float)v, (float)(2 << i)); for (int i = 7; i >= 0; --i) b[i] = x[i] > tv[i]; while (*p) { if (*p == 'A') { depth++; if (skip == 0 && b[depth]) { res++; } else skip++; } if (*p == 'B') { if (skip) skip--; if (b[depth] || skip) skip++; } if (*p == 'C') { depth--; if (skip) skip--; } p++; } return res; } // In the code string, the letters represent the following: // // A: // if (certain bit is set) // { // result++; // // B: // } else { // // C: // } // // examples: // AABCBC leads to if(){r++;if(){r++;}else{}}else{} // ABABCC leads to if(){r++;}else{if(){r++;}else{}} // ABCABC leads to if(){r++;}else{}if(){r++;}else{} // // Code generation gets a bit complicated due to the else-branches, // which do not generate new values. Thus, the generator needs to // keep track of the previous variable change seen by the else // branch. string generateOpPhiCase5 (const string& s) { std::stack idStack; std::stack value; std::stack valueLabel; std::stack mergeLeft; std::stack mergeRight; std::ostringstream res; const char* p = s.c_str(); int depth = -1; int currId = 0; int iter = 0; idStack.push(-1); value.push("%f32_0"); valueLabel.push("%f32_0 %entry"); while (*p) { if (*p == 'A') { depth++; currId = iter; idStack.push(currId); res << "\tOpSelectionMerge %m" << currId << " None\n"; res << "\tOpBranchConditional %b" << depth << " %t" << currId << " %f" << currId << "\n"; res << "%t" << currId << " = OpLabel\n"; res << "%rt" << currId << " = OpFAdd %f32 " << value.top() << " %f32_1\n"; std::ostringstream tag; tag << "%rt" << currId; value.push(tag.str()); tag << " %t" << currId; valueLabel.push(tag.str()); } if (*p == 'B') { mergeLeft.push(valueLabel.top()); value.pop(); valueLabel.pop(); res << "\tOpBranch %m" << currId << "\n"; res << "%f" << currId << " = OpLabel\n"; std::ostringstream tag; tag << value.top() << " %f" << currId; valueLabel.pop(); valueLabel.push(tag.str()); } if (*p == 'C') { mergeRight.push(valueLabel.top()); res << "\tOpBranch %m" << currId << "\n"; res << "%m" << currId << " = OpLabel\n"; if (*(p + 1) == 0) res << "%res"; // last result goes to %res else res << "%rm" << currId; res << " = OpPhi %f32 " << mergeLeft.top() << " " << mergeRight.top() << "\n"; std::ostringstream tag; tag << "%rm" << currId; value.pop(); value.push(tag.str()); tag << " %m" << currId; valueLabel.pop(); valueLabel.push(tag.str()); mergeLeft.pop(); mergeRight.pop(); depth--; idStack.pop(); currId = idStack.top(); } p++; iter++; } return res.str(); } tcu::TestCaseGroup* createOpPhiGroup (tcu::TestContext& testCtx) { de::MovePtr group (new tcu::TestCaseGroup(testCtx, "opphi", "Test the OpPhi instruction")); ComputeShaderSpec spec1; ComputeShaderSpec spec2; ComputeShaderSpec spec3; ComputeShaderSpec spec4; ComputeShaderSpec spec5; de::Random rnd (deStringHash(group->getName())); const int numElements = 100; vector inputFloats (numElements, 0); vector outputFloats1 (numElements, 0); vector outputFloats2 (numElements, 0); vector outputFloats3 (numElements, 0); vector outputFloats4 (numElements, 0); vector outputFloats5 (numElements, 0); std::string codestring = "ABC"; const int test4Width = 512; // Build case 5 code string. Each iteration makes the hierarchy more complicated. // 9 iterations with (7, 24) parameters makes the hierarchy 8 deep with about 1500 lines of // shader code. for (int i = 0, acc = 0; i < 9; i++) codestring = expandOpPhiCase5(codestring, acc, 7, 24); fillRandomScalars(rnd, -300.f, 300.f, &inputFloats[0], numElements); // CPU might not use the same rounding mode as the GPU. Use whole numbers to avoid rounding differences. floorAll(inputFloats); for (size_t ndx = 0; ndx < numElements; ++ndx) { switch (ndx % 3) { case 0: outputFloats1[ndx] = inputFloats[ndx] + 5.5f; break; case 1: outputFloats1[ndx] = inputFloats[ndx] + 20.5f; break; case 2: outputFloats1[ndx] = inputFloats[ndx] + 1.75f; break; default: break; } outputFloats2[ndx] = inputFloats[ndx] + 6.5f * 3; outputFloats3[ndx] = 8.5f - inputFloats[ndx]; int index4 = (int)deFloor(deAbs((float)ndx * inputFloats[ndx])); outputFloats4[ndx] = (float)(index4 % test4Width) * 10.0f + 5.0f; outputFloats5[ndx] = calcOpPhiCase5(inputFloats[ndx], codestring); } spec1.assembly = string(getComputeAsmShaderPreamble()) + "OpSource GLSL 430\n" "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" + string(getComputeAsmInputOutputBufferTraits()) + string(getComputeAsmCommonTypes()) + string(getComputeAsmInputOutputBuffer()) + "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%three = OpConstant %u32 3\n" "%constf5p5 = OpConstant %f32 5.5\n" "%constf20p5 = OpConstant %f32 20.5\n" "%constf1p75 = OpConstant %f32 1.75\n" "%constf8p5 = OpConstant %f32 8.5\n" "%constf6p5 = OpConstant %f32 6.5\n" "%main = OpFunction %void None %voidf\n" "%entry = OpLabel\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%selector = OpUMod %u32 %x %three\n" " OpSelectionMerge %phi None\n" " OpSwitch %selector %default 0 %case0 1 %case1 2 %case2\n" // Case 1 before OpPhi. "%case1 = OpLabel\n" " OpBranch %phi\n" "%default = OpLabel\n" " OpUnreachable\n" "%phi = OpLabel\n" "%operand = OpPhi %f32 %constf1p75 %case2 %constf20p5 %case1 %constf5p5 %case0\n" // not in the order of blocks "%inloc = OpAccessChain %f32ptr %indata %zero %x\n" "%inval = OpLoad %f32 %inloc\n" "%add = OpFAdd %f32 %inval %operand\n" "%outloc = OpAccessChain %f32ptr %outdata %zero %x\n" " OpStore %outloc %add\n" " OpReturn\n" // Case 0 after OpPhi. "%case0 = OpLabel\n" " OpBranch %phi\n" // Case 2 after OpPhi. "%case2 = OpLabel\n" " OpBranch %phi\n" " OpFunctionEnd\n"; spec1.inputs.push_back(BufferSp(new Float32Buffer(inputFloats))); spec1.outputs.push_back(BufferSp(new Float32Buffer(outputFloats1))); spec1.numWorkGroups = IVec3(numElements, 1, 1); group->addChild(new SpvAsmComputeShaderCase(testCtx, "block", spec1)); spec2.assembly = string(getComputeAsmShaderPreamble()) + "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" + string(getComputeAsmInputOutputBufferTraits()) + string(getComputeAsmCommonTypes()) + string(getComputeAsmInputOutputBuffer()) + "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%one = OpConstant %i32 1\n" "%three = OpConstant %i32 3\n" "%constf6p5 = OpConstant %f32 6.5\n" "%main = OpFunction %void None %voidf\n" "%entry = OpLabel\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc = OpAccessChain %f32ptr %indata %zero %x\n" "%outloc = OpAccessChain %f32ptr %outdata %zero %x\n" "%inval = OpLoad %f32 %inloc\n" " OpBranch %phi\n" "%phi = OpLabel\n" "%step = OpPhi %i32 %zero %entry %step_next %phi\n" "%accum = OpPhi %f32 %inval %entry %accum_next %phi\n" "%step_next = OpIAdd %i32 %step %one\n" "%accum_next = OpFAdd %f32 %accum %constf6p5\n" "%still_loop = OpSLessThan %bool %step %three\n" " OpLoopMerge %exit %phi None\n" " OpBranchConditional %still_loop %phi %exit\n" "%exit = OpLabel\n" " OpStore %outloc %accum\n" " OpReturn\n" " OpFunctionEnd\n"; spec2.inputs.push_back(BufferSp(new Float32Buffer(inputFloats))); spec2.outputs.push_back(BufferSp(new Float32Buffer(outputFloats2))); spec2.numWorkGroups = IVec3(numElements, 1, 1); group->addChild(new SpvAsmComputeShaderCase(testCtx, "induction", spec2)); spec3.assembly = string(getComputeAsmShaderPreamble()) + "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" + string(getComputeAsmInputOutputBufferTraits()) + string(getComputeAsmCommonTypes()) + string(getComputeAsmInputOutputBuffer()) + "%f32ptr_f = OpTypePointer Function %f32\n" "%id = OpVariable %uvec3ptr Input\n" "%true = OpConstantTrue %bool\n" "%false = OpConstantFalse %bool\n" "%zero = OpConstant %i32 0\n" "%constf8p5 = OpConstant %f32 8.5\n" "%main = OpFunction %void None %voidf\n" "%entry = OpLabel\n" "%b = OpVariable %f32ptr_f Function %constf8p5\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc = OpAccessChain %f32ptr %indata %zero %x\n" "%outloc = OpAccessChain %f32ptr %outdata %zero %x\n" "%a_init = OpLoad %f32 %inloc\n" "%b_init = OpLoad %f32 %b\n" " OpBranch %phi\n" "%phi = OpLabel\n" "%still_loop = OpPhi %bool %true %entry %false %phi\n" "%a_next = OpPhi %f32 %a_init %entry %b_next %phi\n" "%b_next = OpPhi %f32 %b_init %entry %a_next %phi\n" " OpLoopMerge %exit %phi None\n" " OpBranchConditional %still_loop %phi %exit\n" "%exit = OpLabel\n" "%sub = OpFSub %f32 %a_next %b_next\n" " OpStore %outloc %sub\n" " OpReturn\n" " OpFunctionEnd\n"; spec3.inputs.push_back(BufferSp(new Float32Buffer(inputFloats))); spec3.outputs.push_back(BufferSp(new Float32Buffer(outputFloats3))); spec3.numWorkGroups = IVec3(numElements, 1, 1); group->addChild(new SpvAsmComputeShaderCase(testCtx, "swap", spec3)); spec4.assembly = "OpCapability Shader\n" "%ext = OpExtInstImport \"GLSL.std.450\"\n" "OpMemoryModel Logical GLSL450\n" "OpEntryPoint GLCompute %main \"main\" %id\n" "OpExecutionMode %main LocalSize 1 1 1\n" "OpSource GLSL 430\n" "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" + string(getComputeAsmInputOutputBufferTraits()) + string(getComputeAsmCommonTypes()) + string(getComputeAsmInputOutputBuffer()) + "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%cimod = OpConstant %u32 " + generateIntWidth(test4Width) + "\n" + generateConstantDefinitions(test4Width) + "%main = OpFunction %void None %voidf\n" "%entry = OpLabel\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc = OpAccessChain %f32ptr %indata %zero %x\n" "%inval = OpLoad %f32 %inloc\n" "%xf = OpConvertUToF %f32 %x\n" "%xm = OpFMul %f32 %xf %inval\n" "%xa = OpExtInst %f32 %ext FAbs %xm\n" "%xi = OpConvertFToU %u32 %xa\n" "%selector = OpUMod %u32 %xi %cimod\n" " OpSelectionMerge %phi None\n" " OpSwitch %selector %default " + generateSwitchCases(test4Width) + "%default = OpLabel\n" " OpUnreachable\n" + generateSwitchTargets(test4Width) + "%phi = OpLabel\n" "%result = OpPhi %f32" + generateOpPhiParams(test4Width) + "%outloc = OpAccessChain %f32ptr %outdata %zero %x\n" " OpStore %outloc %result\n" " OpReturn\n" " OpFunctionEnd\n"; spec4.inputs.push_back(BufferSp(new Float32Buffer(inputFloats))); spec4.outputs.push_back(BufferSp(new Float32Buffer(outputFloats4))); spec4.numWorkGroups = IVec3(numElements, 1, 1); group->addChild(new SpvAsmComputeShaderCase(testCtx, "wide", spec4)); spec5.assembly = "OpCapability Shader\n" "%ext = OpExtInstImport \"GLSL.std.450\"\n" "OpMemoryModel Logical GLSL450\n" "OpEntryPoint GLCompute %main \"main\" %id\n" "OpExecutionMode %main LocalSize 1 1 1\n" "%code = OpString \"" + codestring + "\"\n" "OpSource GLSL 430\n" "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" + string(getComputeAsmInputOutputBufferTraits()) + string(getComputeAsmCommonTypes()) + string(getComputeAsmInputOutputBuffer()) + "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%f32_0 = OpConstant %f32 0.0\n" "%f32_0_5 = OpConstant %f32 0.5\n" "%f32_1 = OpConstant %f32 1.0\n" "%f32_1_5 = OpConstant %f32 1.5\n" "%f32_2 = OpConstant %f32 2.0\n" "%f32_3_5 = OpConstant %f32 3.5\n" "%f32_4 = OpConstant %f32 4.0\n" "%f32_7_5 = OpConstant %f32 7.5\n" "%f32_8 = OpConstant %f32 8.0\n" "%f32_15_5 = OpConstant %f32 15.5\n" "%f32_16 = OpConstant %f32 16.0\n" "%f32_31_5 = OpConstant %f32 31.5\n" "%f32_32 = OpConstant %f32 32.0\n" "%f32_63_5 = OpConstant %f32 63.5\n" "%f32_64 = OpConstant %f32 64.0\n" "%f32_127_5 = OpConstant %f32 127.5\n" "%f32_128 = OpConstant %f32 128.0\n" "%f32_256 = OpConstant %f32 256.0\n" "%main = OpFunction %void None %voidf\n" "%entry = OpLabel\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc = OpAccessChain %f32ptr %indata %zero %x\n" "%inval = OpLoad %f32 %inloc\n" "%xabs = OpExtInst %f32 %ext FAbs %inval\n" "%x8 = OpFMod %f32 %xabs %f32_256\n" "%x7 = OpFMod %f32 %xabs %f32_128\n" "%x6 = OpFMod %f32 %xabs %f32_64\n" "%x5 = OpFMod %f32 %xabs %f32_32\n" "%x4 = OpFMod %f32 %xabs %f32_16\n" "%x3 = OpFMod %f32 %xabs %f32_8\n" "%x2 = OpFMod %f32 %xabs %f32_4\n" "%x1 = OpFMod %f32 %xabs %f32_2\n" "%b7 = OpFOrdGreaterThanEqual %bool %x8 %f32_127_5\n" "%b6 = OpFOrdGreaterThanEqual %bool %x7 %f32_63_5\n" "%b5 = OpFOrdGreaterThanEqual %bool %x6 %f32_31_5\n" "%b4 = OpFOrdGreaterThanEqual %bool %x5 %f32_15_5\n" "%b3 = OpFOrdGreaterThanEqual %bool %x4 %f32_7_5\n" "%b2 = OpFOrdGreaterThanEqual %bool %x3 %f32_3_5\n" "%b1 = OpFOrdGreaterThanEqual %bool %x2 %f32_1_5\n" "%b0 = OpFOrdGreaterThanEqual %bool %x1 %f32_0_5\n" + generateOpPhiCase5(codestring) + "%outloc = OpAccessChain %f32ptr %outdata %zero %x\n" " OpStore %outloc %res\n" " OpReturn\n" " OpFunctionEnd\n"; spec5.inputs.push_back(BufferSp(new Float32Buffer(inputFloats))); spec5.outputs.push_back(BufferSp(new Float32Buffer(outputFloats5))); spec5.numWorkGroups = IVec3(numElements, 1, 1); group->addChild(new SpvAsmComputeShaderCase(testCtx, "nested", spec5)); createOpPhiVartypeTests(group, testCtx); return group.release(); } // Assembly code used for testing block order is based on GLSL source code: // // #version 430 // // layout(std140, set = 0, binding = 0) readonly buffer Input { // float elements[]; // } input_data; // layout(std140, set = 0, binding = 1) writeonly buffer Output { // float elements[]; // } output_data; // // void main() { // uint x = gl_GlobalInvocationID.x; // output_data.elements[x] = input_data.elements[x]; // if (x > uint(50)) { // switch (x % uint(3)) { // case 0: output_data.elements[x] += 1.5f; break; // case 1: output_data.elements[x] += 42.f; break; // case 2: output_data.elements[x] -= 27.f; break; // default: break; // } // } else { // output_data.elements[x] = -input_data.elements[x]; // } // } tcu::TestCaseGroup* createBlockOrderGroup (tcu::TestContext& testCtx) { de::MovePtr group (new tcu::TestCaseGroup(testCtx, "block_order", "Test block orders")); ComputeShaderSpec spec; de::Random rnd (deStringHash(group->getName())); const int numElements = 100; vector inputFloats (numElements, 0); vector outputFloats (numElements, 0); fillRandomScalars(rnd, -100.f, 100.f, &inputFloats[0], numElements); // CPU might not use the same rounding mode as the GPU. Use whole numbers to avoid rounding differences. floorAll(inputFloats); for (size_t ndx = 0; ndx <= 50; ++ndx) outputFloats[ndx] = -inputFloats[ndx]; for (size_t ndx = 51; ndx < numElements; ++ndx) { switch (ndx % 3) { case 0: outputFloats[ndx] = inputFloats[ndx] + 1.5f; break; case 1: outputFloats[ndx] = inputFloats[ndx] + 42.f; break; case 2: outputFloats[ndx] = inputFloats[ndx] - 27.f; break; default: break; } } spec.assembly = string(getComputeAsmShaderPreamble()) + "OpSource GLSL 430\n" "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" + string(getComputeAsmInputOutputBufferTraits()) + string(getComputeAsmCommonTypes()) + "%u32ptr = OpTypePointer Function %u32\n" "%u32ptr_input = OpTypePointer Input %u32\n" + string(getComputeAsmInputOutputBuffer()) + "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%const3 = OpConstant %u32 3\n" "%const50 = OpConstant %u32 50\n" "%constf1p5 = OpConstant %f32 1.5\n" "%constf27 = OpConstant %f32 27.0\n" "%constf42 = OpConstant %f32 42.0\n" "%main = OpFunction %void None %voidf\n" // entry block. "%entry = OpLabel\n" // Create a temporary variable to hold the value of gl_GlobalInvocationID.x. "%xvar = OpVariable %u32ptr Function\n" "%xptr = OpAccessChain %u32ptr_input %id %zero\n" "%x = OpLoad %u32 %xptr\n" " OpStore %xvar %x\n" "%cmp = OpUGreaterThan %bool %x %const50\n" " OpSelectionMerge %if_merge None\n" " OpBranchConditional %cmp %if_true %if_false\n" // False branch for if-statement: placed in the middle of switch cases and before true branch. "%if_false = OpLabel\n" "%x_f = OpLoad %u32 %xvar\n" "%inloc_f = OpAccessChain %f32ptr %indata %zero %x_f\n" "%inval_f = OpLoad %f32 %inloc_f\n" "%negate = OpFNegate %f32 %inval_f\n" "%outloc_f = OpAccessChain %f32ptr %outdata %zero %x_f\n" " OpStore %outloc_f %negate\n" " OpBranch %if_merge\n" // Merge block for if-statement: placed in the middle of true and false branch. "%if_merge = OpLabel\n" " OpReturn\n" // True branch for if-statement: placed in the middle of swtich cases and after the false branch. "%if_true = OpLabel\n" "%xval_t = OpLoad %u32 %xvar\n" "%mod = OpUMod %u32 %xval_t %const3\n" " OpSelectionMerge %switch_merge None\n" " OpSwitch %mod %default 0 %case0 1 %case1 2 %case2\n" // Merge block for switch-statement: placed before the case // bodies. But it must follow OpSwitch which dominates it. "%switch_merge = OpLabel\n" " OpBranch %if_merge\n" // Case 1 for switch-statement: placed before case 0. // It must follow the OpSwitch that dominates it. "%case1 = OpLabel\n" "%x_1 = OpLoad %u32 %xvar\n" "%inloc_1 = OpAccessChain %f32ptr %indata %zero %x_1\n" "%inval_1 = OpLoad %f32 %inloc_1\n" "%addf42 = OpFAdd %f32 %inval_1 %constf42\n" "%outloc_1 = OpAccessChain %f32ptr %outdata %zero %x_1\n" " OpStore %outloc_1 %addf42\n" " OpBranch %switch_merge\n" // Case 2 for switch-statement. "%case2 = OpLabel\n" "%x_2 = OpLoad %u32 %xvar\n" "%inloc_2 = OpAccessChain %f32ptr %indata %zero %x_2\n" "%inval_2 = OpLoad %f32 %inloc_2\n" "%subf27 = OpFSub %f32 %inval_2 %constf27\n" "%outloc_2 = OpAccessChain %f32ptr %outdata %zero %x_2\n" " OpStore %outloc_2 %subf27\n" " OpBranch %switch_merge\n" // Default case for switch-statement: placed in the middle of normal cases. "%default = OpLabel\n" " OpBranch %switch_merge\n" // Case 0 for switch-statement: out of order. "%case0 = OpLabel\n" "%x_0 = OpLoad %u32 %xvar\n" "%inloc_0 = OpAccessChain %f32ptr %indata %zero %x_0\n" "%inval_0 = OpLoad %f32 %inloc_0\n" "%addf1p5 = OpFAdd %f32 %inval_0 %constf1p5\n" "%outloc_0 = OpAccessChain %f32ptr %outdata %zero %x_0\n" " OpStore %outloc_0 %addf1p5\n" " OpBranch %switch_merge\n" " OpFunctionEnd\n"; spec.inputs.push_back(BufferSp(new Float32Buffer(inputFloats))); spec.outputs.push_back(BufferSp(new Float32Buffer(outputFloats))); spec.numWorkGroups = IVec3(numElements, 1, 1); group->addChild(new SpvAsmComputeShaderCase(testCtx, "all", spec)); return group.release(); } tcu::TestCaseGroup* createMultipleShaderGroup (tcu::TestContext& testCtx) { de::MovePtr group (new tcu::TestCaseGroup(testCtx, "multiple_shaders", "Test multiple shaders in the same module")); ComputeShaderSpec spec1; ComputeShaderSpec spec2; de::Random rnd (deStringHash(group->getName())); const int numElements = 100; vector inputFloats (numElements, 0); vector outputFloats1 (numElements, 0); vector outputFloats2 (numElements, 0); fillRandomScalars(rnd, -500.f, 500.f, &inputFloats[0], numElements); for (size_t ndx = 0; ndx < numElements; ++ndx) { outputFloats1[ndx] = inputFloats[ndx] + inputFloats[ndx]; outputFloats2[ndx] = -inputFloats[ndx]; } const string assembly( "OpCapability Shader\n" "OpMemoryModel Logical GLSL450\n" "OpEntryPoint GLCompute %comp_main1 \"entrypoint1\" %id\n" "OpEntryPoint GLCompute %comp_main2 \"entrypoint2\" %id\n" // A module cannot have two OpEntryPoint instructions with the same Execution Model and the same Name string. "OpEntryPoint Vertex %vert_main \"entrypoint2\" %vert_builtins %vertexIndex %instanceIndex\n" "OpExecutionMode %comp_main1 LocalSize 1 1 1\n" "OpExecutionMode %comp_main2 LocalSize 1 1 1\n" "OpName %comp_main1 \"entrypoint1\"\n" "OpName %comp_main2 \"entrypoint2\"\n" "OpName %vert_main \"entrypoint2\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpName %vert_builtin_st \"gl_PerVertex\"\n" "OpName %vertexIndex \"gl_VertexIndex\"\n" "OpName %instanceIndex \"gl_InstanceIndex\"\n" "OpMemberName %vert_builtin_st 0 \"gl_Position\"\n" "OpMemberName %vert_builtin_st 1 \"gl_PointSize\"\n" "OpMemberName %vert_builtin_st 2 \"gl_ClipDistance\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" "OpDecorate %vertexIndex BuiltIn VertexIndex\n" "OpDecorate %instanceIndex BuiltIn InstanceIndex\n" "OpDecorate %vert_builtin_st Block\n" "OpMemberDecorate %vert_builtin_st 0 BuiltIn Position\n" "OpMemberDecorate %vert_builtin_st 1 BuiltIn PointSize\n" "OpMemberDecorate %vert_builtin_st 2 BuiltIn ClipDistance\n" + string(getComputeAsmInputOutputBufferTraits()) + string(getComputeAsmCommonTypes()) + string(getComputeAsmInputOutputBuffer()) + "%zero = OpConstant %i32 0\n" "%one = OpConstant %u32 1\n" "%c_f32_1 = OpConstant %f32 1\n" "%i32inputptr = OpTypePointer Input %i32\n" "%vec4 = OpTypeVector %f32 4\n" "%vec4ptr = OpTypePointer Output %vec4\n" "%f32arr1 = OpTypeArray %f32 %one\n" "%vert_builtin_st = OpTypeStruct %vec4 %f32 %f32arr1\n" "%vert_builtin_st_ptr = OpTypePointer Output %vert_builtin_st\n" "%vert_builtins = OpVariable %vert_builtin_st_ptr Output\n" "%id = OpVariable %uvec3ptr Input\n" "%vertexIndex = OpVariable %i32inputptr Input\n" "%instanceIndex = OpVariable %i32inputptr Input\n" "%c_vec4_1 = OpConstantComposite %vec4 %c_f32_1 %c_f32_1 %c_f32_1 %c_f32_1\n" // gl_Position = vec4(1.); "%vert_main = OpFunction %void None %voidf\n" "%vert_entry = OpLabel\n" "%position = OpAccessChain %vec4ptr %vert_builtins %zero\n" " OpStore %position %c_vec4_1\n" " OpReturn\n" " OpFunctionEnd\n" // Double inputs. "%comp_main1 = OpFunction %void None %voidf\n" "%comp1_entry = OpLabel\n" "%idval1 = OpLoad %uvec3 %id\n" "%x1 = OpCompositeExtract %u32 %idval1 0\n" "%inloc1 = OpAccessChain %f32ptr %indata %zero %x1\n" "%inval1 = OpLoad %f32 %inloc1\n" "%add = OpFAdd %f32 %inval1 %inval1\n" "%outloc1 = OpAccessChain %f32ptr %outdata %zero %x1\n" " OpStore %outloc1 %add\n" " OpReturn\n" " OpFunctionEnd\n" // Negate inputs. "%comp_main2 = OpFunction %void None %voidf\n" "%comp2_entry = OpLabel\n" "%idval2 = OpLoad %uvec3 %id\n" "%x2 = OpCompositeExtract %u32 %idval2 0\n" "%inloc2 = OpAccessChain %f32ptr %indata %zero %x2\n" "%inval2 = OpLoad %f32 %inloc2\n" "%neg = OpFNegate %f32 %inval2\n" "%outloc2 = OpAccessChain %f32ptr %outdata %zero %x2\n" " OpStore %outloc2 %neg\n" " OpReturn\n" " OpFunctionEnd\n"); spec1.assembly = assembly; spec1.inputs.push_back(BufferSp(new Float32Buffer(inputFloats))); spec1.outputs.push_back(BufferSp(new Float32Buffer(outputFloats1))); spec1.numWorkGroups = IVec3(numElements, 1, 1); spec1.entryPoint = "entrypoint1"; spec2.assembly = assembly; spec2.inputs.push_back(BufferSp(new Float32Buffer(inputFloats))); spec2.outputs.push_back(BufferSp(new Float32Buffer(outputFloats2))); spec2.numWorkGroups = IVec3(numElements, 1, 1); spec2.entryPoint = "entrypoint2"; group->addChild(new SpvAsmComputeShaderCase(testCtx, "shader1", spec1)); group->addChild(new SpvAsmComputeShaderCase(testCtx, "shader2", spec2)); return group.release(); } inline std::string makeLongUTF8String (size_t num4ByteChars) { // An example of a longest valid UTF-8 character. Be explicit about the // character type because Microsoft compilers can otherwise interpret the // character string as being over wide (16-bit) characters. Ideally, we // would just use a C++11 UTF-8 string literal, but we want to support older // Microsoft compilers. const std::basic_string earthAfrica("\xF0\x9F\x8C\x8D"); std::string longString; longString.reserve(num4ByteChars * 4); for (size_t count = 0; count < num4ByteChars; count++) { longString += earthAfrica; } return longString; } tcu::TestCaseGroup* createOpSourceGroup (tcu::TestContext& testCtx) { de::MovePtr group (new tcu::TestCaseGroup(testCtx, "opsource", "Tests the OpSource & OpSourceContinued instruction")); vector cases; de::Random rnd (deStringHash(group->getName())); const int numElements = 100; vector positiveFloats (numElements, 0); vector negativeFloats (numElements, 0); const StringTemplate shaderTemplate ( "OpCapability Shader\n" "OpMemoryModel Logical GLSL450\n" "OpEntryPoint GLCompute %main \"main\" %id\n" "OpExecutionMode %main LocalSize 1 1 1\n" "${SOURCE}\n" "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" + string(getComputeAsmInputOutputBufferTraits()) + string(getComputeAsmCommonTypes()) + string(getComputeAsmInputOutputBuffer()) + "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%main = OpFunction %void None %voidf\n" "%label = OpLabel\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc = OpAccessChain %f32ptr %indata %zero %x\n" "%inval = OpLoad %f32 %inloc\n" "%neg = OpFNegate %f32 %inval\n" "%outloc = OpAccessChain %f32ptr %outdata %zero %x\n" " OpStore %outloc %neg\n" " OpReturn\n" " OpFunctionEnd\n"); cases.push_back(CaseParameter("unknown_source", "OpSource Unknown 0")); cases.push_back(CaseParameter("wrong_source", "OpSource OpenCL_C 210")); cases.push_back(CaseParameter("normal_filename", "%fname = OpString \"filename\"\n" "OpSource GLSL 430 %fname")); cases.push_back(CaseParameter("empty_filename", "%fname = OpString \"\"\n" "OpSource GLSL 430 %fname")); cases.push_back(CaseParameter("normal_source_code", "%fname = OpString \"filename\"\n" "OpSource GLSL 430 %fname \"#version 430\nvoid main() {}\"")); cases.push_back(CaseParameter("empty_source_code", "%fname = OpString \"filename\"\n" "OpSource GLSL 430 %fname \"\"")); cases.push_back(CaseParameter("long_source_code", "%fname = OpString \"filename\"\n" "OpSource GLSL 430 %fname \"" + makeLongUTF8String(65530) + "ccc\"")); // word count: 65535 cases.push_back(CaseParameter("utf8_source_code", "%fname = OpString \"filename\"\n" "OpSource GLSL 430 %fname \"\xE2\x98\x82\xE2\x98\x85\"")); // umbrella & black star symbol cases.push_back(CaseParameter("normal_sourcecontinued", "%fname = OpString \"filename\"\n" "OpSource GLSL 430 %fname \"#version 430\nvo\"\n" "OpSourceContinued \"id main() {}\"")); cases.push_back(CaseParameter("empty_sourcecontinued", "%fname = OpString \"filename\"\n" "OpSource GLSL 430 %fname \"#version 430\nvoid main() {}\"\n" "OpSourceContinued \"\"")); cases.push_back(CaseParameter("long_sourcecontinued", "%fname = OpString \"filename\"\n" "OpSource GLSL 430 %fname \"#version 430\nvoid main() {}\"\n" "OpSourceContinued \"" + makeLongUTF8String(65533) + "ccc\"")); // word count: 65535 cases.push_back(CaseParameter("utf8_sourcecontinued", "%fname = OpString \"filename\"\n" "OpSource GLSL 430 %fname \"#version 430\nvoid main() {}\"\n" "OpSourceContinued \"\xE2\x98\x8E\xE2\x9A\x91\"")); // white telephone & black flag symbol cases.push_back(CaseParameter("multi_sourcecontinued", "%fname = OpString \"filename\"\n" "OpSource GLSL 430 %fname \"#version 430\n\"\n" "OpSourceContinued \"void\"\n" "OpSourceContinued \"main()\"\n" "OpSourceContinued \"{}\"")); cases.push_back(CaseParameter("empty_source_before_sourcecontinued", "%fname = OpString \"filename\"\n" "OpSource GLSL 430 %fname \"\"\n" "OpSourceContinued \"#version 430\nvoid main() {}\"")); fillRandomScalars(rnd, 1.f, 100.f, &positiveFloats[0], numElements); for (size_t ndx = 0; ndx < numElements; ++ndx) negativeFloats[ndx] = -positiveFloats[ndx]; for (size_t caseNdx = 0; caseNdx < cases.size(); ++caseNdx) { map specializations; ComputeShaderSpec spec; specializations["SOURCE"] = cases[caseNdx].param; spec.assembly = shaderTemplate.specialize(specializations); spec.inputs.push_back(BufferSp(new Float32Buffer(positiveFloats))); spec.outputs.push_back(BufferSp(new Float32Buffer(negativeFloats))); spec.numWorkGroups = IVec3(numElements, 1, 1); group->addChild(new SpvAsmComputeShaderCase(testCtx, cases[caseNdx].name, spec)); } return group.release(); } tcu::TestCaseGroup* createOpSourceExtensionGroup (tcu::TestContext& testCtx) { de::MovePtr group (new tcu::TestCaseGroup(testCtx, "opsourceextension", "Tests the OpSource instruction")); vector cases; de::Random rnd (deStringHash(group->getName())); const int numElements = 100; vector inputFloats (numElements, 0); vector outputFloats (numElements, 0); const StringTemplate shaderTemplate ( string(getComputeAsmShaderPreamble()) + "OpSourceExtension \"${EXTENSION}\"\n" "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" + string(getComputeAsmInputOutputBufferTraits()) + string(getComputeAsmCommonTypes()) + string(getComputeAsmInputOutputBuffer()) + "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%main = OpFunction %void None %voidf\n" "%label = OpLabel\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc = OpAccessChain %f32ptr %indata %zero %x\n" "%inval = OpLoad %f32 %inloc\n" "%neg = OpFNegate %f32 %inval\n" "%outloc = OpAccessChain %f32ptr %outdata %zero %x\n" " OpStore %outloc %neg\n" " OpReturn\n" " OpFunctionEnd\n"); cases.push_back(CaseParameter("empty_extension", "")); cases.push_back(CaseParameter("real_extension", "GL_ARB_texture_rectangle")); cases.push_back(CaseParameter("fake_extension", "GL_ARB_im_the_ultimate_extension")); cases.push_back(CaseParameter("utf8_extension", "GL_ARB_\xE2\x98\x82\xE2\x98\x85")); cases.push_back(CaseParameter("long_extension", makeLongUTF8String(65533) + "ccc")); // word count: 65535 fillRandomScalars(rnd, -200.f, 200.f, &inputFloats[0], numElements); for (size_t ndx = 0; ndx < numElements; ++ndx) outputFloats[ndx] = -inputFloats[ndx]; for (size_t caseNdx = 0; caseNdx < cases.size(); ++caseNdx) { map specializations; ComputeShaderSpec spec; specializations["EXTENSION"] = cases[caseNdx].param; spec.assembly = shaderTemplate.specialize(specializations); spec.inputs.push_back(BufferSp(new Float32Buffer(inputFloats))); spec.outputs.push_back(BufferSp(new Float32Buffer(outputFloats))); spec.numWorkGroups = IVec3(numElements, 1, 1); group->addChild(new SpvAsmComputeShaderCase(testCtx, cases[caseNdx].name, spec)); } return group.release(); } // Checks that a compute shader can generate a constant null value of various types, without exercising a computation on it. tcu::TestCaseGroup* createOpConstantNullGroup (tcu::TestContext& testCtx) { de::MovePtr group (new tcu::TestCaseGroup(testCtx, "opconstantnull", "Tests the OpConstantNull instruction")); vector cases; de::Random rnd (deStringHash(group->getName())); const int numElements = 100; vector positiveFloats (numElements, 0); vector negativeFloats (numElements, 0); const StringTemplate shaderTemplate ( string(getComputeAsmShaderPreamble()) + "OpSource GLSL 430\n" "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" + string(getComputeAsmInputOutputBufferTraits()) + string(getComputeAsmCommonTypes()) + "%uvec2 = OpTypeVector %u32 2\n" "%bvec3 = OpTypeVector %bool 3\n" "%fvec4 = OpTypeVector %f32 4\n" "%fmat33 = OpTypeMatrix %fvec3 3\n" "%const100 = OpConstant %u32 100\n" "%uarr100 = OpTypeArray %i32 %const100\n" "%struct = OpTypeStruct %f32 %i32 %u32\n" "%pointer = OpTypePointer Function %i32\n" + string(getComputeAsmInputOutputBuffer()) + "%null = OpConstantNull ${TYPE}\n" "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%main = OpFunction %void None %voidf\n" "%label = OpLabel\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc = OpAccessChain %f32ptr %indata %zero %x\n" "%inval = OpLoad %f32 %inloc\n" "%neg = OpFNegate %f32 %inval\n" "%outloc = OpAccessChain %f32ptr %outdata %zero %x\n" " OpStore %outloc %neg\n" " OpReturn\n" " OpFunctionEnd\n"); cases.push_back(CaseParameter("bool", "%bool")); cases.push_back(CaseParameter("sint32", "%i32")); cases.push_back(CaseParameter("uint32", "%u32")); cases.push_back(CaseParameter("float32", "%f32")); cases.push_back(CaseParameter("vec4float32", "%fvec4")); cases.push_back(CaseParameter("vec3bool", "%bvec3")); cases.push_back(CaseParameter("vec2uint32", "%uvec2")); cases.push_back(CaseParameter("matrix", "%fmat33")); cases.push_back(CaseParameter("array", "%uarr100")); cases.push_back(CaseParameter("struct", "%struct")); cases.push_back(CaseParameter("pointer", "%pointer")); fillRandomScalars(rnd, 1.f, 100.f, &positiveFloats[0], numElements); for (size_t ndx = 0; ndx < numElements; ++ndx) negativeFloats[ndx] = -positiveFloats[ndx]; for (size_t caseNdx = 0; caseNdx < cases.size(); ++caseNdx) { map specializations; ComputeShaderSpec spec; specializations["TYPE"] = cases[caseNdx].param; spec.assembly = shaderTemplate.specialize(specializations); spec.inputs.push_back(BufferSp(new Float32Buffer(positiveFloats))); spec.outputs.push_back(BufferSp(new Float32Buffer(negativeFloats))); spec.numWorkGroups = IVec3(numElements, 1, 1); group->addChild(new SpvAsmComputeShaderCase(testCtx, cases[caseNdx].name, spec)); } return group.release(); } // Checks that a compute shader can generate a constant composite value of various types, without exercising a computation on it. tcu::TestCaseGroup* createOpConstantCompositeGroup (tcu::TestContext& testCtx) { de::MovePtr group (new tcu::TestCaseGroup(testCtx, "opconstantcomposite", "Tests the OpConstantComposite instruction")); vector cases; de::Random rnd (deStringHash(group->getName())); const int numElements = 100; vector positiveFloats (numElements, 0); vector negativeFloats (numElements, 0); const StringTemplate shaderTemplate ( string(getComputeAsmShaderPreamble()) + "OpSource GLSL 430\n" "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" + string(getComputeAsmInputOutputBufferTraits()) + string(getComputeAsmCommonTypes()) + string(getComputeAsmInputOutputBuffer()) + "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "${CONSTANT}\n" "%main = OpFunction %void None %voidf\n" "%label = OpLabel\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc = OpAccessChain %f32ptr %indata %zero %x\n" "%inval = OpLoad %f32 %inloc\n" "%neg = OpFNegate %f32 %inval\n" "%outloc = OpAccessChain %f32ptr %outdata %zero %x\n" " OpStore %outloc %neg\n" " OpReturn\n" " OpFunctionEnd\n"); cases.push_back(CaseParameter("vector", "%five = OpConstant %i32 5\n" "%ivec3 = OpTypeVector %i32 3\n" "%const = OpConstantComposite %ivec3 %five %zero %five")); cases.push_back(CaseParameter("matrix", "%m3fvec3 = OpTypeMatrix %fvec3 3\n" "%ten = OpConstant %f32 10.\n" "%fzero = OpConstant %f32 0.\n" "%vec = OpConstantComposite %fvec3 %ten %fzero %ten\n" "%mat = OpConstantComposite %m3fvec3 %vec %vec %vec")); cases.push_back(CaseParameter("struct", "%m2vec3 = OpTypeMatrix %fvec3 2\n" "%struct = OpTypeStruct %i32 %f32 %fvec3 %m2vec3\n" "%fzero = OpConstant %f32 0.\n" "%one = OpConstant %f32 1.\n" "%point5 = OpConstant %f32 0.5\n" "%vec = OpConstantComposite %fvec3 %one %one %fzero\n" "%mat = OpConstantComposite %m2vec3 %vec %vec\n" "%const = OpConstantComposite %struct %zero %point5 %vec %mat")); cases.push_back(CaseParameter("nested_struct", "%st1 = OpTypeStruct %u32 %f32\n" "%st2 = OpTypeStruct %i32 %i32\n" "%struct = OpTypeStruct %st1 %st2\n" "%point5 = OpConstant %f32 0.5\n" "%one = OpConstant %u32 1\n" "%ten = OpConstant %i32 10\n" "%st1val = OpConstantComposite %st1 %one %point5\n" "%st2val = OpConstantComposite %st2 %ten %ten\n" "%const = OpConstantComposite %struct %st1val %st2val")); fillRandomScalars(rnd, 1.f, 100.f, &positiveFloats[0], numElements); for (size_t ndx = 0; ndx < numElements; ++ndx) negativeFloats[ndx] = -positiveFloats[ndx]; for (size_t caseNdx = 0; caseNdx < cases.size(); ++caseNdx) { map specializations; ComputeShaderSpec spec; specializations["CONSTANT"] = cases[caseNdx].param; spec.assembly = shaderTemplate.specialize(specializations); spec.inputs.push_back(BufferSp(new Float32Buffer(positiveFloats))); spec.outputs.push_back(BufferSp(new Float32Buffer(negativeFloats))); spec.numWorkGroups = IVec3(numElements, 1, 1); group->addChild(new SpvAsmComputeShaderCase(testCtx, cases[caseNdx].name, spec)); } return group.release(); } // Creates a floating point number with the given exponent, and significand // bits set. It can only create normalized numbers. Only the least significant // 24 bits of the significand will be examined. The final bit of the // significand will also be ignored. This allows alignment to be written // similarly to C99 hex-floats. // For example if you wanted to write 0x1.7f34p-12 you would call // constructNormalizedFloat(-12, 0x7f3400) float constructNormalizedFloat (deInt32 exponent, deUint32 significand) { float f = 1.0f; for (deInt32 idx = 0; idx < 23; ++idx) { f += ((significand & 0x800000) == 0) ? 0.f : std::ldexp(1.0f, -(idx + 1)); significand <<= 1; } return std::ldexp(f, exponent); } // Compare instruction for the OpQuantizeF16 compute exact case. // Returns true if the output is what is expected from the test case. bool compareOpQuantizeF16ComputeExactCase (const std::vector&, const vector& outputAllocs, const std::vector& expectedOutputs, TestLog&) { assert(outputAllocs.size() == 1); // Only size is needed because we cannot compare Nans. size_t byteSize = expectedOutputs[0].getByteSize(); const float* outputAsFloat = static_cast(outputAllocs[0]->getHostPtr()); if (byteSize != 4*sizeof(float)) { return false; } if (*outputAsFloat != constructNormalizedFloat(8, 0x304000) && *outputAsFloat != constructNormalizedFloat(8, 0x300000)) { return false; } outputAsFloat++; if (*outputAsFloat != -constructNormalizedFloat(-7, 0x600000) && *outputAsFloat != -constructNormalizedFloat(-7, 0x604000)) { return false; } outputAsFloat++; if (*outputAsFloat != constructNormalizedFloat(2, 0x01C000) && *outputAsFloat != constructNormalizedFloat(2, 0x020000)) { return false; } outputAsFloat++; if (*outputAsFloat != constructNormalizedFloat(1, 0xFFC000) && *outputAsFloat != constructNormalizedFloat(2, 0x000000)) { return false; } return true; } // Checks that every output from a test-case is a float NaN. bool compareNan (const std::vector&, const vector& outputAllocs, const std::vector& expectedOutputs, TestLog&) { assert (outputAllocs.size() == 1); // Only size is needed because we cannot compare Nans. size_t byteSize = expectedOutputs[0].getByteSize(); const float* const output_as_float = static_cast(outputAllocs[0]->getHostPtr()); for (size_t idx = 0; idx < byteSize / sizeof(float); ++idx) { if (!deFloatIsNaN(output_as_float[idx])) { return false; } } return true; } // Checks that every output from a test-case is either +0.0f or -0.0f bool compareZeros (const std::vector&, const vector& outputAllocs, const std::vector& expectedOutputs, TestLog&) { assert (outputAllocs.size() == 1); // Only size is needed because all the results are supposed to be zero. size_t byteSize = expectedOutputs[0].getByteSize(); const float* const output_as_float = static_cast(outputAllocs[0]->getHostPtr()); for (size_t idx = 0; idx < byteSize / sizeof(float); ++idx) { if (output_as_float[idx] != 0) return false; } return true; } // Checks that a compute shader can generate a constant composite value of various types, without exercising a computation on it. tcu::TestCaseGroup* createOpQuantizeToF16Group (tcu::TestContext& testCtx) { de::MovePtr group (new tcu::TestCaseGroup(testCtx, "opquantize", "Tests the OpQuantizeToF16 instruction")); const std::string shader ( string(getComputeAsmShaderPreamble()) + "OpSource GLSL 430\n" "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" + string(getComputeAsmInputOutputBufferTraits()) + string(getComputeAsmCommonTypes()) + string(getComputeAsmInputOutputBuffer()) + "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%main = OpFunction %void None %voidf\n" "%label = OpLabel\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc = OpAccessChain %f32ptr %indata %zero %x\n" "%inval = OpLoad %f32 %inloc\n" "%quant = OpQuantizeToF16 %f32 %inval\n" "%outloc = OpAccessChain %f32ptr %outdata %zero %x\n" " OpStore %outloc %quant\n" " OpReturn\n" " OpFunctionEnd\n"); { ComputeShaderSpec spec; const deUint32 numElements = 100; vector infinities; vector results; infinities.reserve(numElements); results.reserve(numElements); for (size_t idx = 0; idx < numElements; ++idx) { switch(idx % 4) { case 0: infinities.push_back(std::numeric_limits::infinity()); results.push_back(std::numeric_limits::infinity()); break; case 1: infinities.push_back(-std::numeric_limits::infinity()); results.push_back(-std::numeric_limits::infinity()); break; case 2: infinities.push_back(std::ldexp(1.0f, 16)); results.push_back(std::numeric_limits::infinity()); break; case 3: infinities.push_back(std::ldexp(-1.0f, 32)); results.push_back(-std::numeric_limits::infinity()); break; } } spec.assembly = shader; spec.inputs.push_back(BufferSp(new Float32Buffer(infinities))); spec.outputs.push_back(BufferSp(new Float32Buffer(results))); spec.numWorkGroups = IVec3(numElements, 1, 1); group->addChild(new SpvAsmComputeShaderCase( testCtx, "infinities", spec)); } { ComputeShaderSpec spec; vector nans; const deUint32 numElements = 100; nans.reserve(numElements); for (size_t idx = 0; idx < numElements; ++idx) { if (idx % 2 == 0) { nans.push_back(std::numeric_limits::quiet_NaN()); } else { nans.push_back(-std::numeric_limits::quiet_NaN()); } } spec.assembly = shader; spec.inputs.push_back(BufferSp(new Float32Buffer(nans))); spec.outputs.push_back(BufferSp(new Float32Buffer(nans))); spec.numWorkGroups = IVec3(numElements, 1, 1); spec.verifyIO = &compareNan; group->addChild(new SpvAsmComputeShaderCase( testCtx, "propagated_nans", spec)); } { ComputeShaderSpec spec; vector small; vector zeros; const deUint32 numElements = 100; small.reserve(numElements); zeros.reserve(numElements); for (size_t idx = 0; idx < numElements; ++idx) { switch(idx % 6) { case 0: small.push_back(0.f); break; case 1: small.push_back(-0.f); break; case 2: small.push_back(std::ldexp(1.0f, -16)); break; case 3: small.push_back(std::ldexp(-1.0f, -32)); break; case 4: small.push_back(std::ldexp(1.0f, -127)); break; case 5: small.push_back(-std::ldexp(1.0f, -128)); break; } } spec.assembly = shader; spec.inputs.push_back(BufferSp(new Float32Buffer(small))); // Only the size of outputs[0] will be used, actual expected values aren't needed. spec.outputs.push_back(BufferSp(new Float32Buffer(small))); spec.numWorkGroups = IVec3(numElements, 1, 1); spec.verifyIO = &compareZeros; group->addChild(new SpvAsmComputeShaderCase( testCtx, "flush_to_zero", spec)); } { ComputeShaderSpec spec; vector exact; const deUint32 numElements = 200; exact.reserve(numElements); for (size_t idx = 0; idx < numElements; ++idx) exact.push_back(static_cast(static_cast(idx) - 100)); spec.assembly = shader; spec.inputs.push_back(BufferSp(new Float32Buffer(exact))); spec.outputs.push_back(BufferSp(new Float32Buffer(exact))); spec.numWorkGroups = IVec3(numElements, 1, 1); group->addChild(new SpvAsmComputeShaderCase( testCtx, "exact", spec)); } { ComputeShaderSpec spec; vector inputs; const deUint32 numElements = 4; inputs.push_back(constructNormalizedFloat(8, 0x300300)); inputs.push_back(-constructNormalizedFloat(-7, 0x600800)); inputs.push_back(constructNormalizedFloat(2, 0x01E000)); inputs.push_back(constructNormalizedFloat(1, 0xFFE000)); spec.assembly = shader; spec.verifyIO = &compareOpQuantizeF16ComputeExactCase; spec.inputs.push_back(BufferSp(new Float32Buffer(inputs))); spec.outputs.push_back(BufferSp(new Float32Buffer(inputs))); spec.numWorkGroups = IVec3(numElements, 1, 1); group->addChild(new SpvAsmComputeShaderCase( testCtx, "rounded", spec)); } return group.release(); } tcu::TestCaseGroup* createSpecConstantOpQuantizeToF16Group (tcu::TestContext& testCtx) { de::MovePtr group (new tcu::TestCaseGroup(testCtx, "opspecconstantop_opquantize", "Tests the OpQuantizeToF16 opcode for the OpSpecConstantOp instruction")); const std::string shader ( string(getComputeAsmShaderPreamble()) + "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" "OpDecorate %sc_0 SpecId 0\n" "OpDecorate %sc_1 SpecId 1\n" "OpDecorate %sc_2 SpecId 2\n" "OpDecorate %sc_3 SpecId 3\n" "OpDecorate %sc_4 SpecId 4\n" "OpDecorate %sc_5 SpecId 5\n" + string(getComputeAsmInputOutputBufferTraits()) + string(getComputeAsmCommonTypes()) + string(getComputeAsmInputOutputBuffer()) + "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%c_u32_6 = OpConstant %u32 6\n" "%sc_0 = OpSpecConstant %f32 0.\n" "%sc_1 = OpSpecConstant %f32 0.\n" "%sc_2 = OpSpecConstant %f32 0.\n" "%sc_3 = OpSpecConstant %f32 0.\n" "%sc_4 = OpSpecConstant %f32 0.\n" "%sc_5 = OpSpecConstant %f32 0.\n" "%sc_0_quant = OpSpecConstantOp %f32 QuantizeToF16 %sc_0\n" "%sc_1_quant = OpSpecConstantOp %f32 QuantizeToF16 %sc_1\n" "%sc_2_quant = OpSpecConstantOp %f32 QuantizeToF16 %sc_2\n" "%sc_3_quant = OpSpecConstantOp %f32 QuantizeToF16 %sc_3\n" "%sc_4_quant = OpSpecConstantOp %f32 QuantizeToF16 %sc_4\n" "%sc_5_quant = OpSpecConstantOp %f32 QuantizeToF16 %sc_5\n" "%main = OpFunction %void None %voidf\n" "%label = OpLabel\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%outloc = OpAccessChain %f32ptr %outdata %zero %x\n" "%selector = OpUMod %u32 %x %c_u32_6\n" " OpSelectionMerge %exit None\n" " OpSwitch %selector %exit 0 %case0 1 %case1 2 %case2 3 %case3 4 %case4 5 %case5\n" "%case0 = OpLabel\n" " OpStore %outloc %sc_0_quant\n" " OpBranch %exit\n" "%case1 = OpLabel\n" " OpStore %outloc %sc_1_quant\n" " OpBranch %exit\n" "%case2 = OpLabel\n" " OpStore %outloc %sc_2_quant\n" " OpBranch %exit\n" "%case3 = OpLabel\n" " OpStore %outloc %sc_3_quant\n" " OpBranch %exit\n" "%case4 = OpLabel\n" " OpStore %outloc %sc_4_quant\n" " OpBranch %exit\n" "%case5 = OpLabel\n" " OpStore %outloc %sc_5_quant\n" " OpBranch %exit\n" "%exit = OpLabel\n" " OpReturn\n" " OpFunctionEnd\n"); { ComputeShaderSpec spec; const deUint8 numCases = 4; vector inputs (numCases, 0.f); vector outputs; spec.assembly = shader; spec.numWorkGroups = IVec3(numCases, 1, 1); spec.specConstants.append(bitwiseCast(std::numeric_limits::infinity())); spec.specConstants.append(bitwiseCast(-std::numeric_limits::infinity())); spec.specConstants.append(bitwiseCast(std::ldexp(1.0f, 16))); spec.specConstants.append(bitwiseCast(std::ldexp(-1.0f, 32))); outputs.push_back(std::numeric_limits::infinity()); outputs.push_back(-std::numeric_limits::infinity()); outputs.push_back(std::numeric_limits::infinity()); outputs.push_back(-std::numeric_limits::infinity()); spec.inputs.push_back(BufferSp(new Float32Buffer(inputs))); spec.outputs.push_back(BufferSp(new Float32Buffer(outputs))); group->addChild(new SpvAsmComputeShaderCase( testCtx, "infinities", spec)); } { ComputeShaderSpec spec; const deUint8 numCases = 2; vector inputs (numCases, 0.f); vector outputs; spec.assembly = shader; spec.numWorkGroups = IVec3(numCases, 1, 1); spec.verifyIO = &compareNan; outputs.push_back(std::numeric_limits::quiet_NaN()); outputs.push_back(-std::numeric_limits::quiet_NaN()); for (deUint8 idx = 0; idx < numCases; ++idx) spec.specConstants.append(bitwiseCast(outputs[idx])); spec.inputs.push_back(BufferSp(new Float32Buffer(inputs))); spec.outputs.push_back(BufferSp(new Float32Buffer(outputs))); group->addChild(new SpvAsmComputeShaderCase( testCtx, "propagated_nans", spec)); } { ComputeShaderSpec spec; const deUint8 numCases = 6; vector inputs (numCases, 0.f); vector outputs; spec.assembly = shader; spec.numWorkGroups = IVec3(numCases, 1, 1); spec.specConstants.append(bitwiseCast(0.f)); spec.specConstants.append(bitwiseCast(-0.f)); spec.specConstants.append(bitwiseCast(std::ldexp(1.0f, -16))); spec.specConstants.append(bitwiseCast(std::ldexp(-1.0f, -32))); spec.specConstants.append(bitwiseCast(std::ldexp(1.0f, -127))); spec.specConstants.append(bitwiseCast(-std::ldexp(1.0f, -128))); spec.verifyIO = &compareZeros; spec.inputs.push_back(BufferSp(new Float32Buffer(inputs))); // Only the size of outputs[0] will be used, actual expected values aren't needed. spec.outputs.push_back(BufferSp(new Float32Buffer(inputs))); group->addChild(new SpvAsmComputeShaderCase( testCtx, "flush_to_zero", spec)); } { ComputeShaderSpec spec; const deUint8 numCases = 6; vector inputs (numCases, 0.f); vector outputs; spec.assembly = shader; spec.numWorkGroups = IVec3(numCases, 1, 1); for (deUint8 idx = 0; idx < 6; ++idx) { const float f = static_cast(idx * 10 - 30) / 4.f; spec.specConstants.append(bitwiseCast(f)); outputs.push_back(f); } spec.inputs.push_back(BufferSp(new Float32Buffer(inputs))); spec.outputs.push_back(BufferSp(new Float32Buffer(outputs))); group->addChild(new SpvAsmComputeShaderCase( testCtx, "exact", spec)); } { ComputeShaderSpec spec; const deUint8 numCases = 4; vector inputs (numCases, 0.f); vector outputs; spec.assembly = shader; spec.numWorkGroups = IVec3(numCases, 1, 1); spec.verifyIO = &compareOpQuantizeF16ComputeExactCase; outputs.push_back(constructNormalizedFloat(8, 0x300300)); outputs.push_back(-constructNormalizedFloat(-7, 0x600800)); outputs.push_back(constructNormalizedFloat(2, 0x01E000)); outputs.push_back(constructNormalizedFloat(1, 0xFFE000)); for (deUint8 idx = 0; idx < numCases; ++idx) spec.specConstants.append(bitwiseCast(outputs[idx])); spec.inputs.push_back(BufferSp(new Float32Buffer(inputs))); spec.outputs.push_back(BufferSp(new Float32Buffer(outputs))); group->addChild(new SpvAsmComputeShaderCase( testCtx, "rounded", spec)); } return group.release(); } // Checks that constant null/composite values can be used in computation. tcu::TestCaseGroup* createOpConstantUsageGroup (tcu::TestContext& testCtx) { de::MovePtr group (new tcu::TestCaseGroup(testCtx, "opconstantnullcomposite", "Spotcheck the OpConstantNull & OpConstantComposite instruction")); ComputeShaderSpec spec; de::Random rnd (deStringHash(group->getName())); const int numElements = 100; vector positiveFloats (numElements, 0); vector negativeFloats (numElements, 0); fillRandomScalars(rnd, 1.f, 100.f, &positiveFloats[0], numElements); for (size_t ndx = 0; ndx < numElements; ++ndx) negativeFloats[ndx] = -positiveFloats[ndx]; spec.assembly = "OpCapability Shader\n" "%std450 = OpExtInstImport \"GLSL.std.450\"\n" "OpMemoryModel Logical GLSL450\n" "OpEntryPoint GLCompute %main \"main\" %id\n" "OpExecutionMode %main LocalSize 1 1 1\n" "OpSource GLSL 430\n" "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" + string(getComputeAsmInputOutputBufferTraits()) + string(getComputeAsmCommonTypes()) + "%fmat = OpTypeMatrix %fvec3 3\n" "%ten = OpConstant %u32 10\n" "%f32arr10 = OpTypeArray %f32 %ten\n" "%fst = OpTypeStruct %f32 %f32\n" + string(getComputeAsmInputOutputBuffer()) + "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" // Create a bunch of null values "%unull = OpConstantNull %u32\n" "%fnull = OpConstantNull %f32\n" "%vnull = OpConstantNull %fvec3\n" "%mnull = OpConstantNull %fmat\n" "%anull = OpConstantNull %f32arr10\n" "%snull = OpConstantComposite %fst %fnull %fnull\n" "%main = OpFunction %void None %voidf\n" "%label = OpLabel\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc = OpAccessChain %f32ptr %indata %zero %x\n" "%inval = OpLoad %f32 %inloc\n" "%neg = OpFNegate %f32 %inval\n" // Get the abs() of (a certain element of) those null values "%unull_cov = OpConvertUToF %f32 %unull\n" "%unull_abs = OpExtInst %f32 %std450 FAbs %unull_cov\n" "%fnull_abs = OpExtInst %f32 %std450 FAbs %fnull\n" "%vnull_0 = OpCompositeExtract %f32 %vnull 0\n" "%vnull_abs = OpExtInst %f32 %std450 FAbs %vnull_0\n" "%mnull_12 = OpCompositeExtract %f32 %mnull 1 2\n" "%mnull_abs = OpExtInst %f32 %std450 FAbs %mnull_12\n" "%anull_3 = OpCompositeExtract %f32 %anull 3\n" "%anull_abs = OpExtInst %f32 %std450 FAbs %anull_3\n" "%snull_1 = OpCompositeExtract %f32 %snull 1\n" "%snull_abs = OpExtInst %f32 %std450 FAbs %snull_1\n" // Add them all "%add1 = OpFAdd %f32 %neg %unull_abs\n" "%add2 = OpFAdd %f32 %add1 %fnull_abs\n" "%add3 = OpFAdd %f32 %add2 %vnull_abs\n" "%add4 = OpFAdd %f32 %add3 %mnull_abs\n" "%add5 = OpFAdd %f32 %add4 %anull_abs\n" "%final = OpFAdd %f32 %add5 %snull_abs\n" "%outloc = OpAccessChain %f32ptr %outdata %zero %x\n" " OpStore %outloc %final\n" // write to output " OpReturn\n" " OpFunctionEnd\n"; spec.inputs.push_back(BufferSp(new Float32Buffer(positiveFloats))); spec.outputs.push_back(BufferSp(new Float32Buffer(negativeFloats))); spec.numWorkGroups = IVec3(numElements, 1, 1); group->addChild(new SpvAsmComputeShaderCase(testCtx, "spotcheck", spec)); return group.release(); } // Assembly code used for testing loop control is based on GLSL source code: // #version 430 // // layout(std140, set = 0, binding = 0) readonly buffer Input { // float elements[]; // } input_data; // layout(std140, set = 0, binding = 1) writeonly buffer Output { // float elements[]; // } output_data; // // void main() { // uint x = gl_GlobalInvocationID.x; // output_data.elements[x] = input_data.elements[x]; // for (uint i = 0; i < 4; ++i) // output_data.elements[x] += 1.f; // } tcu::TestCaseGroup* createLoopControlGroup (tcu::TestContext& testCtx) { de::MovePtr group (new tcu::TestCaseGroup(testCtx, "loop_control", "Tests loop control cases")); vector cases; de::Random rnd (deStringHash(group->getName())); const int numElements = 100; vector inputFloats (numElements, 0); vector outputFloats (numElements, 0); const StringTemplate shaderTemplate ( string(getComputeAsmShaderPreamble()) + "OpSource GLSL 430\n" "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" + string(getComputeAsmInputOutputBufferTraits()) + string(getComputeAsmCommonTypes()) + string(getComputeAsmInputOutputBuffer()) + "%u32ptr = OpTypePointer Function %u32\n" "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%uzero = OpConstant %u32 0\n" "%one = OpConstant %i32 1\n" "%constf1 = OpConstant %f32 1.0\n" "%four = OpConstant %u32 4\n" "%main = OpFunction %void None %voidf\n" "%entry = OpLabel\n" "%i = OpVariable %u32ptr Function\n" " OpStore %i %uzero\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc = OpAccessChain %f32ptr %indata %zero %x\n" "%inval = OpLoad %f32 %inloc\n" "%outloc = OpAccessChain %f32ptr %outdata %zero %x\n" " OpStore %outloc %inval\n" " OpBranch %loop_entry\n" "%loop_entry = OpLabel\n" "%i_val = OpLoad %u32 %i\n" "%cmp_lt = OpULessThan %bool %i_val %four\n" " OpLoopMerge %loop_merge %loop_body ${CONTROL}\n" " OpBranchConditional %cmp_lt %loop_body %loop_merge\n" "%loop_body = OpLabel\n" "%outval = OpLoad %f32 %outloc\n" "%addf1 = OpFAdd %f32 %outval %constf1\n" " OpStore %outloc %addf1\n" "%new_i = OpIAdd %u32 %i_val %one\n" " OpStore %i %new_i\n" " OpBranch %loop_entry\n" "%loop_merge = OpLabel\n" " OpReturn\n" " OpFunctionEnd\n"); cases.push_back(CaseParameter("none", "None")); cases.push_back(CaseParameter("unroll", "Unroll")); cases.push_back(CaseParameter("dont_unroll", "DontUnroll")); fillRandomScalars(rnd, -100.f, 100.f, &inputFloats[0], numElements); for (size_t ndx = 0; ndx < numElements; ++ndx) outputFloats[ndx] = inputFloats[ndx] + 4.f; for (size_t caseNdx = 0; caseNdx < cases.size(); ++caseNdx) { map specializations; ComputeShaderSpec spec; specializations["CONTROL"] = cases[caseNdx].param; spec.assembly = shaderTemplate.specialize(specializations); spec.inputs.push_back(BufferSp(new Float32Buffer(inputFloats))); spec.outputs.push_back(BufferSp(new Float32Buffer(outputFloats))); spec.numWorkGroups = IVec3(numElements, 1, 1); group->addChild(new SpvAsmComputeShaderCase(testCtx, cases[caseNdx].name, spec)); } group->addChild(new SpvAsmLoopControlDependencyLengthCase(testCtx, "dependency_length")); group->addChild(new SpvAsmLoopControlDependencyInfiniteCase(testCtx, "dependency_infinite")); return group.release(); } // Assembly code used for testing selection control is based on GLSL source code: // #version 430 // // layout(std140, set = 0, binding = 0) readonly buffer Input { // float elements[]; // } input_data; // layout(std140, set = 0, binding = 1) writeonly buffer Output { // float elements[]; // } output_data; // // void main() { // uint x = gl_GlobalInvocationID.x; // float val = input_data.elements[x]; // if (val > 10.f) // output_data.elements[x] = val + 1.f; // else // output_data.elements[x] = val - 1.f; // } tcu::TestCaseGroup* createSelectionControlGroup (tcu::TestContext& testCtx) { de::MovePtr group (new tcu::TestCaseGroup(testCtx, "selection_control", "Tests selection control cases")); vector cases; de::Random rnd (deStringHash(group->getName())); const int numElements = 100; vector inputFloats (numElements, 0); vector outputFloats (numElements, 0); const StringTemplate shaderTemplate ( string(getComputeAsmShaderPreamble()) + "OpSource GLSL 430\n" "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" + string(getComputeAsmInputOutputBufferTraits()) + string(getComputeAsmCommonTypes()) + string(getComputeAsmInputOutputBuffer()) + "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%constf1 = OpConstant %f32 1.0\n" "%constf10 = OpConstant %f32 10.0\n" "%main = OpFunction %void None %voidf\n" "%entry = OpLabel\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc = OpAccessChain %f32ptr %indata %zero %x\n" "%inval = OpLoad %f32 %inloc\n" "%outloc = OpAccessChain %f32ptr %outdata %zero %x\n" "%cmp_gt = OpFOrdGreaterThan %bool %inval %constf10\n" " OpSelectionMerge %if_end ${CONTROL}\n" " OpBranchConditional %cmp_gt %if_true %if_false\n" "%if_true = OpLabel\n" "%addf1 = OpFAdd %f32 %inval %constf1\n" " OpStore %outloc %addf1\n" " OpBranch %if_end\n" "%if_false = OpLabel\n" "%subf1 = OpFSub %f32 %inval %constf1\n" " OpStore %outloc %subf1\n" " OpBranch %if_end\n" "%if_end = OpLabel\n" " OpReturn\n" " OpFunctionEnd\n"); cases.push_back(CaseParameter("none", "None")); cases.push_back(CaseParameter("flatten", "Flatten")); cases.push_back(CaseParameter("dont_flatten", "DontFlatten")); cases.push_back(CaseParameter("flatten_dont_flatten", "DontFlatten|Flatten")); fillRandomScalars(rnd, -100.f, 100.f, &inputFloats[0], numElements); // CPU might not use the same rounding mode as the GPU. Use whole numbers to avoid rounding differences. floorAll(inputFloats); for (size_t ndx = 0; ndx < numElements; ++ndx) outputFloats[ndx] = inputFloats[ndx] + (inputFloats[ndx] > 10.f ? 1.f : -1.f); for (size_t caseNdx = 0; caseNdx < cases.size(); ++caseNdx) { map specializations; ComputeShaderSpec spec; specializations["CONTROL"] = cases[caseNdx].param; spec.assembly = shaderTemplate.specialize(specializations); spec.inputs.push_back(BufferSp(new Float32Buffer(inputFloats))); spec.outputs.push_back(BufferSp(new Float32Buffer(outputFloats))); spec.numWorkGroups = IVec3(numElements, 1, 1); group->addChild(new SpvAsmComputeShaderCase(testCtx, cases[caseNdx].name, spec)); } return group.release(); } void getOpNameAbuseCases (vector &abuseCases) { // Generate a long name. std::string longname; longname.resize(65535, 'k'); // max string literal, spir-v 2.17 // Some bad names, abusing utf-8 encoding. This may also cause problems // with the logs. // 1. Various illegal code points in utf-8 std::string utf8illegal = "Illegal bytes in UTF-8: " "\xc0 \xc1 \xf5 \xf6 \xf7 \xf8 \xf9 \xfa \xfb \xfc \xfd \xfe \xff" "illegal surrogates: \xed\xad\xbf \xed\xbe\x80"; // 2. Zero encoded as overlong, not exactly legal but often supported to differentiate from terminating zero std::string utf8nul = "UTF-8 encoded nul \xC0\x80 (should not end name)"; // 3. Some overlong encodings std::string utf8overlong = "UTF-8 overlong \xF0\x82\x82\xAC \xfc\x83\xbf\xbf\xbf\xbf \xf8\x87\xbf\xbf\xbf " "\xf0\x8f\xbf\xbf"; // 4. Internet "zalgo" meme "bleeding text" std::string utf8zalgo = "\x56\xcc\xb5\xcc\x85\xcc\x94\xcc\x88\xcd\x8a\xcc\x91\xcc\x88\xcd\x91\xcc\x83\xcd\x82" "\xcc\x83\xcd\x90\xcc\x8a\xcc\x92\xcc\x92\xcd\x8b\xcc\x94\xcd\x9d\xcc\x98\xcc\xab\xcc" "\xae\xcc\xa9\xcc\xad\xcc\x97\xcc\xb0\x75\xcc\xb6\xcc\xbe\xcc\x80\xcc\x82\xcc\x84\xcd" "\x84\xcc\x90\xcd\x86\xcc\x9a\xcd\x84\xcc\x9b\xcd\x86\xcd\x92\xcc\x9a\xcd\x99\xcd\x99" "\xcc\xbb\xcc\x98\xcd\x8e\xcd\x88\xcd\x9a\xcc\xa6\xcc\x9c\xcc\xab\xcc\x99\xcd\x94\xcd" "\x99\xcd\x95\xcc\xa5\xcc\xab\xcd\x89\x6c\xcc\xb8\xcc\x8e\xcc\x8b\xcc\x8b\xcc\x9a\xcc" "\x8e\xcd\x9d\xcc\x80\xcc\xa1\xcc\xad\xcd\x9c\xcc\xba\xcc\x96\xcc\xb3\xcc\xa2\xcd\x8e" "\xcc\xa2\xcd\x96\x6b\xcc\xb8\xcc\x84\xcd\x81\xcc\xbf\xcc\x8d\xcc\x89\xcc\x85\xcc\x92" "\xcc\x84\xcc\x90\xcd\x81\xcc\x93\xcd\x90\xcd\x92\xcd\x9d\xcc\x84\xcd\x98\xcd\x9d\xcd" "\xa0\xcd\x91\xcc\x94\xcc\xb9\xcd\x93\xcc\xa5\xcd\x87\xcc\xad\xcc\xa7\xcd\x96\xcd\x99" "\xcc\x9d\xcc\xbc\xcd\x96\xcd\x93\xcc\x9d\xcc\x99\xcc\xa8\xcc\xb1\xcd\x85\xcc\xba\xcc" "\xa7\x61\xcc\xb8\xcc\x8e\xcc\x81\xcd\x90\xcd\x84\xcd\x8c\xcc\x8c\xcc\x85\xcd\x86\xcc" "\x84\xcd\x84\xcc\x90\xcc\x84\xcc\x8d\xcd\x99\xcd\x8d\xcc\xb0\xcc\xa3\xcc\xa6\xcd\x89" "\xcd\x8d\xcd\x87\xcc\x98\xcd\x8d\xcc\xa4\xcd\x9a\xcd\x8e\xcc\xab\xcc\xb9\xcc\xac\xcc" "\xa2\xcd\x87\xcc\xa0\xcc\xb3\xcd\x89\xcc\xb9\xcc\xa7\xcc\xa6\xcd\x89\xcd\x95\x6e\xcc" "\xb8\xcd\x8a\xcc\x8a\xcd\x82\xcc\x9b\xcd\x81\xcd\x90\xcc\x85\xcc\x9b\xcd\x80\xcd\x91" "\xcd\x9b\xcc\x81\xcd\x81\xcc\x9a\xcc\xb3\xcd\x9c\xcc\x9e\xcc\x9d\xcd\x99\xcc\xa2\xcd" "\x93\xcd\x96\xcc\x97\xff"; // General name abuses abuseCases.push_back(CaseParameter("_has_very_long_name", longname)); abuseCases.push_back(CaseParameter("_utf8_illegal", utf8illegal)); abuseCases.push_back(CaseParameter("_utf8_nul", utf8nul)); abuseCases.push_back(CaseParameter("_utf8_overlong", utf8overlong)); abuseCases.push_back(CaseParameter("_utf8_zalgo", utf8zalgo)); // GL keywords abuseCases.push_back(CaseParameter("_is_gl_Position", "gl_Position")); abuseCases.push_back(CaseParameter("_is_gl_InstanceID", "gl_InstanceID")); abuseCases.push_back(CaseParameter("_is_gl_PrimitiveID", "gl_PrimitiveID")); abuseCases.push_back(CaseParameter("_is_gl_TessCoord", "gl_TessCoord")); abuseCases.push_back(CaseParameter("_is_gl_PerVertex", "gl_PerVertex")); abuseCases.push_back(CaseParameter("_is_gl_InvocationID", "gl_InvocationID")); abuseCases.push_back(CaseParameter("_is_gl_PointSize", "gl_PointSize")); abuseCases.push_back(CaseParameter("_is_gl_PointCoord", "gl_PointCoord")); abuseCases.push_back(CaseParameter("_is_gl_Layer", "gl_Layer")); abuseCases.push_back(CaseParameter("_is_gl_FragDepth", "gl_FragDepth")); abuseCases.push_back(CaseParameter("_is_gl_NumWorkGroups", "gl_NumWorkGroups")); abuseCases.push_back(CaseParameter("_is_gl_WorkGroupID", "gl_WorkGroupID")); abuseCases.push_back(CaseParameter("_is_gl_LocalInvocationID", "gl_LocalInvocationID")); abuseCases.push_back(CaseParameter("_is_gl_GlobalInvocationID", "gl_GlobalInvocationID")); abuseCases.push_back(CaseParameter("_is_gl_MaxVertexAttribs", "gl_MaxVertexAttribs")); abuseCases.push_back(CaseParameter("_is_gl_MaxViewports", "gl_MaxViewports")); abuseCases.push_back(CaseParameter("_is_gl_MaxComputeWorkGroupCount", "gl_MaxComputeWorkGroupCount")); abuseCases.push_back(CaseParameter("_is_mat3", "mat3")); abuseCases.push_back(CaseParameter("_is_volatile", "volatile")); abuseCases.push_back(CaseParameter("_is_inout", "inout")); abuseCases.push_back(CaseParameter("_is_isampler3d", "isampler3d")); } tcu::TestCaseGroup* createOpNameGroup (tcu::TestContext& testCtx) { de::MovePtr group (new tcu::TestCaseGroup(testCtx, "opname", "Tests OpName cases")); de::MovePtr entryMainGroup (new tcu::TestCaseGroup(testCtx, "entry_main", "OpName tests with entry main")); de::MovePtr entryNotGroup (new tcu::TestCaseGroup(testCtx, "entry_rdc", "OpName tests with entry rdc")); de::MovePtr abuseGroup (new tcu::TestCaseGroup(testCtx, "abuse", "OpName abuse tests")); vector cases; vector abuseCases; vector testFunc; de::Random rnd (deStringHash(group->getName())); const int numElements = 128; vector inputFloats (numElements, 0); vector outputFloats (numElements, 0); getOpNameAbuseCases(abuseCases); fillRandomScalars(rnd, -100.0f, 100.0f, &inputFloats[0], numElements); for(size_t ndx = 0; ndx < numElements; ++ndx) outputFloats[ndx] = -inputFloats[ndx]; const string commonShaderHeader = "OpCapability Shader\n" "OpMemoryModel Logical GLSL450\n" "OpEntryPoint GLCompute %main \"main\" %id\n" "OpExecutionMode %main LocalSize 1 1 1\n"; const string commonShaderFooter = "OpDecorate %id BuiltIn GlobalInvocationId\n" + string(getComputeAsmInputOutputBufferTraits()) + string(getComputeAsmCommonTypes()) + string(getComputeAsmInputOutputBuffer()) + "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%func = OpFunction %void None %voidf\n" "%5 = OpLabel\n" " OpReturn\n" " OpFunctionEnd\n" "%main = OpFunction %void None %voidf\n" "%entry = OpLabel\n" "%7 = OpFunctionCall %void %func\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc = OpAccessChain %f32ptr %indata %zero %x\n" "%inval = OpLoad %f32 %inloc\n" "%neg = OpFNegate %f32 %inval\n" "%outloc = OpAccessChain %f32ptr %outdata %zero %x\n" " OpStore %outloc %neg\n" " OpReturn\n" " OpFunctionEnd\n"; const StringTemplate shaderTemplate ( "OpCapability Shader\n" "OpMemoryModel Logical GLSL450\n" "OpEntryPoint GLCompute %main \"${ENTRY}\" %id\n" "OpExecutionMode %main LocalSize 1 1 1\n" "OpName %${ID} \"${NAME}\"\n" + commonShaderFooter); const std::string multipleNames = commonShaderHeader + "OpName %main \"to_be\"\n" "OpName %id \"or_not\"\n" "OpName %main \"to_be\"\n" "OpName %main \"makes_no\"\n" "OpName %func \"difference\"\n" "OpName %5 \"to_me\"\n" + commonShaderFooter; { ComputeShaderSpec spec; spec.assembly = multipleNames; spec.numWorkGroups = IVec3(numElements, 1, 1); spec.inputs.push_back(BufferSp(new Float32Buffer(inputFloats))); spec.outputs.push_back(BufferSp(new Float32Buffer(outputFloats))); abuseGroup->addChild(new SpvAsmComputeShaderCase(testCtx, "main_has_multiple_names", spec)); } const std::string everythingNamed = commonShaderHeader + "OpName %main \"name1\"\n" "OpName %id \"name2\"\n" "OpName %zero \"name3\"\n" "OpName %entry \"name4\"\n" "OpName %func \"name5\"\n" "OpName %5 \"name6\"\n" "OpName %7 \"name7\"\n" "OpName %idval \"name8\"\n" "OpName %inloc \"name9\"\n" "OpName %inval \"name10\"\n" "OpName %neg \"name11\"\n" "OpName %outloc \"name12\"\n"+ commonShaderFooter; { ComputeShaderSpec spec; spec.assembly = everythingNamed; spec.numWorkGroups = IVec3(numElements, 1, 1); spec.inputs.push_back(BufferSp(new Float32Buffer(inputFloats))); spec.outputs.push_back(BufferSp(new Float32Buffer(outputFloats))); abuseGroup->addChild(new SpvAsmComputeShaderCase(testCtx, "everything_named", spec)); } const std::string everythingNamedTheSame = commonShaderHeader + "OpName %main \"the_same\"\n" "OpName %id \"the_same\"\n" "OpName %zero \"the_same\"\n" "OpName %entry \"the_same\"\n" "OpName %func \"the_same\"\n" "OpName %5 \"the_same\"\n" "OpName %7 \"the_same\"\n" "OpName %idval \"the_same\"\n" "OpName %inloc \"the_same\"\n" "OpName %inval \"the_same\"\n" "OpName %neg \"the_same\"\n" "OpName %outloc \"the_same\"\n"+ commonShaderFooter; { ComputeShaderSpec spec; spec.assembly = everythingNamedTheSame; spec.numWorkGroups = IVec3(numElements, 1, 1); spec.inputs.push_back(BufferSp(new Float32Buffer(inputFloats))); spec.outputs.push_back(BufferSp(new Float32Buffer(outputFloats))); abuseGroup->addChild(new SpvAsmComputeShaderCase(testCtx, "everything_named_the_same", spec)); } // main_is_... for (size_t ndx = 0; ndx < abuseCases.size(); ++ndx) { map specializations; ComputeShaderSpec spec; specializations["ENTRY"] = "main"; specializations["ID"] = "main"; specializations["NAME"] = abuseCases[ndx].param; spec.assembly = shaderTemplate.specialize(specializations); spec.numWorkGroups = IVec3(numElements, 1, 1); spec.inputs.push_back(BufferSp(new Float32Buffer(inputFloats))); spec.outputs.push_back(BufferSp(new Float32Buffer(outputFloats))); abuseGroup->addChild(new SpvAsmComputeShaderCase(testCtx, (std::string("main") + abuseCases[ndx].name).c_str(), spec)); } // x_is_.... for (size_t ndx = 0; ndx < abuseCases.size(); ++ndx) { map specializations; ComputeShaderSpec spec; specializations["ENTRY"] = "main"; specializations["ID"] = "x"; specializations["NAME"] = abuseCases[ndx].param; spec.assembly = shaderTemplate.specialize(specializations); spec.numWorkGroups = IVec3(numElements, 1, 1); spec.inputs.push_back(BufferSp(new Float32Buffer(inputFloats))); spec.outputs.push_back(BufferSp(new Float32Buffer(outputFloats))); abuseGroup->addChild(new SpvAsmComputeShaderCase(testCtx, (std::string("x") + abuseCases[ndx].name).c_str(), spec)); } cases.push_back(CaseParameter("_is_main", "main")); cases.push_back(CaseParameter("_is_not_main", "not_main")); testFunc.push_back("main"); testFunc.push_back("func"); for(size_t fNdx = 0; fNdx < testFunc.size(); ++fNdx) { for(size_t ndx = 0; ndx < cases.size(); ++ndx) { map specializations; ComputeShaderSpec spec; specializations["ENTRY"] = "main"; specializations["ID"] = testFunc[fNdx]; specializations["NAME"] = cases[ndx].param; spec.assembly = shaderTemplate.specialize(specializations); spec.numWorkGroups = IVec3(numElements, 1, 1); spec.inputs.push_back(BufferSp(new Float32Buffer(inputFloats))); spec.outputs.push_back(BufferSp(new Float32Buffer(outputFloats))); entryMainGroup->addChild(new SpvAsmComputeShaderCase(testCtx, (testFunc[fNdx] + cases[ndx].name).c_str(), spec)); } } cases.push_back(CaseParameter("_is_entry", "rdc")); for(size_t fNdx = 0; fNdx < testFunc.size(); ++fNdx) { for(size_t ndx = 0; ndx < cases.size(); ++ndx) { map specializations; ComputeShaderSpec spec; specializations["ENTRY"] = "rdc"; specializations["ID"] = testFunc[fNdx]; specializations["NAME"] = cases[ndx].param; spec.assembly = shaderTemplate.specialize(specializations); spec.numWorkGroups = IVec3(numElements, 1, 1); spec.entryPoint = "rdc"; spec.inputs.push_back(BufferSp(new Float32Buffer(inputFloats))); spec.outputs.push_back(BufferSp(new Float32Buffer(outputFloats))); entryNotGroup->addChild(new SpvAsmComputeShaderCase(testCtx, (testFunc[fNdx] + cases[ndx].name).c_str(), spec)); } } group->addChild(entryMainGroup.release()); group->addChild(entryNotGroup.release()); group->addChild(abuseGroup.release()); return group.release(); } tcu::TestCaseGroup* createOpMemberNameGroup (tcu::TestContext& testCtx) { de::MovePtr group(new tcu::TestCaseGroup(testCtx, "opmembername", "Tests OpMemberName cases")); de::MovePtr abuseGroup(new tcu::TestCaseGroup(testCtx, "abuse", "OpMemberName abuse tests")); vector abuseCases; vector testFunc; de::Random rnd(deStringHash(group->getName())); const int numElements = 128; vector inputFloats(numElements, 0); vector outputFloats(numElements, 0); getOpNameAbuseCases(abuseCases); fillRandomScalars(rnd, -100.0f, 100.0f, &inputFloats[0], numElements); for (size_t ndx = 0; ndx < numElements; ++ndx) outputFloats[ndx] = -inputFloats[ndx]; const string commonShaderHeader = "OpCapability Shader\n" "OpMemoryModel Logical GLSL450\n" "OpEntryPoint GLCompute %main \"main\" %id\n" "OpExecutionMode %main LocalSize 1 1 1\n"; const string commonShaderFooter = "OpDecorate %id BuiltIn GlobalInvocationId\n" + string(getComputeAsmInputOutputBufferTraits()) + string(getComputeAsmCommonTypes()) + string(getComputeAsmInputOutputBuffer()) + "%u3str = OpTypeStruct %u32 %u32 %u32\n" "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%main = OpFunction %void None %voidf\n" "%entry = OpLabel\n" "%idval = OpLoad %uvec3 %id\n" "%x0 = OpCompositeExtract %u32 %idval 0\n" "%idstr = OpCompositeConstruct %u3str %x0 %x0 %x0\n" "%x = OpCompositeExtract %u32 %idstr 0\n" "%inloc = OpAccessChain %f32ptr %indata %zero %x\n" "%inval = OpLoad %f32 %inloc\n" "%neg = OpFNegate %f32 %inval\n" "%outloc = OpAccessChain %f32ptr %outdata %zero %x\n" " OpStore %outloc %neg\n" " OpReturn\n" " OpFunctionEnd\n"; const StringTemplate shaderTemplate( commonShaderHeader + "OpMemberName %u3str 0 \"${NAME}\"\n" + commonShaderFooter); const std::string multipleNames = commonShaderHeader + "OpMemberName %u3str 0 \"to_be\"\n" "OpMemberName %u3str 1 \"or_not\"\n" "OpMemberName %u3str 0 \"to_be\"\n" "OpMemberName %u3str 2 \"makes_no\"\n" "OpMemberName %u3str 0 \"difference\"\n" "OpMemberName %u3str 0 \"to_me\"\n" + commonShaderFooter; { ComputeShaderSpec spec; spec.assembly = multipleNames; spec.numWorkGroups = IVec3(numElements, 1, 1); spec.inputs.push_back(BufferSp(new Float32Buffer(inputFloats))); spec.outputs.push_back(BufferSp(new Float32Buffer(outputFloats))); abuseGroup->addChild(new SpvAsmComputeShaderCase(testCtx, "u3str_x_has_multiple_names", spec)); } const std::string everythingNamedTheSame = commonShaderHeader + "OpMemberName %u3str 0 \"the_same\"\n" "OpMemberName %u3str 1 \"the_same\"\n" "OpMemberName %u3str 2 \"the_same\"\n" + commonShaderFooter; { ComputeShaderSpec spec; spec.assembly = everythingNamedTheSame; spec.numWorkGroups = IVec3(numElements, 1, 1); spec.inputs.push_back(BufferSp(new Float32Buffer(inputFloats))); spec.outputs.push_back(BufferSp(new Float32Buffer(outputFloats))); abuseGroup->addChild(new SpvAsmComputeShaderCase(testCtx, "everything_named_the_same", spec)); } // u3str_x_is_.... for (size_t ndx = 0; ndx < abuseCases.size(); ++ndx) { map specializations; ComputeShaderSpec spec; specializations["NAME"] = abuseCases[ndx].param; spec.assembly = shaderTemplate.specialize(specializations); spec.numWorkGroups = IVec3(numElements, 1, 1); spec.inputs.push_back(BufferSp(new Float32Buffer(inputFloats))); spec.outputs.push_back(BufferSp(new Float32Buffer(outputFloats))); abuseGroup->addChild(new SpvAsmComputeShaderCase(testCtx, (std::string("u3str_x") + abuseCases[ndx].name).c_str(), spec)); } group->addChild(abuseGroup.release()); return group.release(); } // Assembly code used for testing function control is based on GLSL source code: // // #version 430 // // layout(std140, set = 0, binding = 0) readonly buffer Input { // float elements[]; // } input_data; // layout(std140, set = 0, binding = 1) writeonly buffer Output { // float elements[]; // } output_data; // // float const10() { return 10.f; } // // void main() { // uint x = gl_GlobalInvocationID.x; // output_data.elements[x] = input_data.elements[x] + const10(); // } tcu::TestCaseGroup* createFunctionControlGroup (tcu::TestContext& testCtx) { de::MovePtr group (new tcu::TestCaseGroup(testCtx, "function_control", "Tests function control cases")); vector cases; de::Random rnd (deStringHash(group->getName())); const int numElements = 100; vector inputFloats (numElements, 0); vector outputFloats (numElements, 0); const StringTemplate shaderTemplate ( string(getComputeAsmShaderPreamble()) + "OpSource GLSL 430\n" "OpName %main \"main\"\n" "OpName %func_const10 \"const10(\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" + string(getComputeAsmInputOutputBufferTraits()) + string(getComputeAsmCommonTypes()) + string(getComputeAsmInputOutputBuffer()) + "%f32f = OpTypeFunction %f32\n" "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%constf10 = OpConstant %f32 10.0\n" "%main = OpFunction %void None %voidf\n" "%entry = OpLabel\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc = OpAccessChain %f32ptr %indata %zero %x\n" "%inval = OpLoad %f32 %inloc\n" "%ret_10 = OpFunctionCall %f32 %func_const10\n" "%fadd = OpFAdd %f32 %inval %ret_10\n" "%outloc = OpAccessChain %f32ptr %outdata %zero %x\n" " OpStore %outloc %fadd\n" " OpReturn\n" " OpFunctionEnd\n" "%func_const10 = OpFunction %f32 ${CONTROL} %f32f\n" "%label = OpLabel\n" " OpReturnValue %constf10\n" " OpFunctionEnd\n"); cases.push_back(CaseParameter("none", "None")); cases.push_back(CaseParameter("inline", "Inline")); cases.push_back(CaseParameter("dont_inline", "DontInline")); cases.push_back(CaseParameter("pure", "Pure")); cases.push_back(CaseParameter("const", "Const")); cases.push_back(CaseParameter("inline_pure", "Inline|Pure")); cases.push_back(CaseParameter("const_dont_inline", "Const|DontInline")); cases.push_back(CaseParameter("inline_dont_inline", "Inline|DontInline")); cases.push_back(CaseParameter("pure_inline_dont_inline", "Pure|Inline|DontInline")); fillRandomScalars(rnd, -100.f, 100.f, &inputFloats[0], numElements); // CPU might not use the same rounding mode as the GPU. Use whole numbers to avoid rounding differences. floorAll(inputFloats); for (size_t ndx = 0; ndx < numElements; ++ndx) outputFloats[ndx] = inputFloats[ndx] + 10.f; for (size_t caseNdx = 0; caseNdx < cases.size(); ++caseNdx) { map specializations; ComputeShaderSpec spec; specializations["CONTROL"] = cases[caseNdx].param; spec.assembly = shaderTemplate.specialize(specializations); spec.inputs.push_back(BufferSp(new Float32Buffer(inputFloats))); spec.outputs.push_back(BufferSp(new Float32Buffer(outputFloats))); spec.numWorkGroups = IVec3(numElements, 1, 1); group->addChild(new SpvAsmComputeShaderCase(testCtx, cases[caseNdx].name, spec)); } return group.release(); } tcu::TestCaseGroup* createMemoryAccessGroup (tcu::TestContext& testCtx) { de::MovePtr group (new tcu::TestCaseGroup(testCtx, "memory_access", "Tests memory access cases")); vector cases; de::Random rnd (deStringHash(group->getName())); const int numElements = 100; vector inputFloats (numElements, 0); vector outputFloats (numElements, 0); const StringTemplate shaderTemplate ( string(getComputeAsmShaderPreamble()) + "OpSource GLSL 430\n" "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" + string(getComputeAsmInputOutputBufferTraits()) + string(getComputeAsmCommonTypes()) + string(getComputeAsmInputOutputBuffer()) + "%f32ptr_f = OpTypePointer Function %f32\n" "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%four = OpConstant %i32 4\n" "%main = OpFunction %void None %voidf\n" "%label = OpLabel\n" "%copy = OpVariable %f32ptr_f Function\n" "%idval = OpLoad %uvec3 %id ${ACCESS}\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc = OpAccessChain %f32ptr %indata %zero %x\n" "%outloc = OpAccessChain %f32ptr %outdata %zero %x\n" " OpCopyMemory %copy %inloc ${ACCESS}\n" "%val1 = OpLoad %f32 %copy\n" "%val2 = OpLoad %f32 %inloc\n" "%add = OpFAdd %f32 %val1 %val2\n" " OpStore %outloc %add ${ACCESS}\n" " OpReturn\n" " OpFunctionEnd\n"); cases.push_back(CaseParameter("null", "")); cases.push_back(CaseParameter("none", "None")); cases.push_back(CaseParameter("volatile", "Volatile")); cases.push_back(CaseParameter("aligned", "Aligned 4")); cases.push_back(CaseParameter("nontemporal", "Nontemporal")); cases.push_back(CaseParameter("aligned_nontemporal", "Aligned|Nontemporal 4")); cases.push_back(CaseParameter("aligned_volatile", "Volatile|Aligned 4")); fillRandomScalars(rnd, -100.f, 100.f, &inputFloats[0], numElements); for (size_t ndx = 0; ndx < numElements; ++ndx) outputFloats[ndx] = inputFloats[ndx] + inputFloats[ndx]; for (size_t caseNdx = 0; caseNdx < cases.size(); ++caseNdx) { map specializations; ComputeShaderSpec spec; specializations["ACCESS"] = cases[caseNdx].param; spec.assembly = shaderTemplate.specialize(specializations); spec.inputs.push_back(BufferSp(new Float32Buffer(inputFloats))); spec.outputs.push_back(BufferSp(new Float32Buffer(outputFloats))); spec.numWorkGroups = IVec3(numElements, 1, 1); group->addChild(new SpvAsmComputeShaderCase(testCtx, cases[caseNdx].name, spec)); } return group.release(); } // Checks that we can get undefined values for various types, without exercising a computation with it. tcu::TestCaseGroup* createOpUndefGroup (tcu::TestContext& testCtx) { de::MovePtr group (new tcu::TestCaseGroup(testCtx, "opundef", "Tests the OpUndef instruction")); vector cases; de::Random rnd (deStringHash(group->getName())); const int numElements = 100; vector positiveFloats (numElements, 0); vector negativeFloats (numElements, 0); const StringTemplate shaderTemplate ( string(getComputeAsmShaderPreamble()) + "OpSource GLSL 430\n" "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" + string(getComputeAsmInputOutputBufferTraits()) + string(getComputeAsmCommonTypes()) + "%uvec2 = OpTypeVector %u32 2\n" "%fvec4 = OpTypeVector %f32 4\n" "%fmat33 = OpTypeMatrix %fvec3 3\n" "%image = OpTypeImage %f32 2D 0 0 0 1 Unknown\n" "%sampler = OpTypeSampler\n" "%simage = OpTypeSampledImage %image\n" "%const100 = OpConstant %u32 100\n" "%uarr100 = OpTypeArray %i32 %const100\n" "%struct = OpTypeStruct %f32 %i32 %u32\n" "%pointer = OpTypePointer Function %i32\n" + string(getComputeAsmInputOutputBuffer()) + "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%main = OpFunction %void None %voidf\n" "%label = OpLabel\n" "%undef = OpUndef ${TYPE}\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc = OpAccessChain %f32ptr %indata %zero %x\n" "%inval = OpLoad %f32 %inloc\n" "%neg = OpFNegate %f32 %inval\n" "%outloc = OpAccessChain %f32ptr %outdata %zero %x\n" " OpStore %outloc %neg\n" " OpReturn\n" " OpFunctionEnd\n"); cases.push_back(CaseParameter("bool", "%bool")); cases.push_back(CaseParameter("sint32", "%i32")); cases.push_back(CaseParameter("uint32", "%u32")); cases.push_back(CaseParameter("float32", "%f32")); cases.push_back(CaseParameter("vec4float32", "%fvec4")); cases.push_back(CaseParameter("vec2uint32", "%uvec2")); cases.push_back(CaseParameter("matrix", "%fmat33")); cases.push_back(CaseParameter("image", "%image")); cases.push_back(CaseParameter("sampler", "%sampler")); cases.push_back(CaseParameter("sampledimage", "%simage")); cases.push_back(CaseParameter("array", "%uarr100")); cases.push_back(CaseParameter("runtimearray", "%f32arr")); cases.push_back(CaseParameter("struct", "%struct")); cases.push_back(CaseParameter("pointer", "%pointer")); fillRandomScalars(rnd, 1.f, 100.f, &positiveFloats[0], numElements); for (size_t ndx = 0; ndx < numElements; ++ndx) negativeFloats[ndx] = -positiveFloats[ndx]; for (size_t caseNdx = 0; caseNdx < cases.size(); ++caseNdx) { map specializations; ComputeShaderSpec spec; specializations["TYPE"] = cases[caseNdx].param; spec.assembly = shaderTemplate.specialize(specializations); spec.inputs.push_back(BufferSp(new Float32Buffer(positiveFloats))); spec.outputs.push_back(BufferSp(new Float32Buffer(negativeFloats))); spec.numWorkGroups = IVec3(numElements, 1, 1); group->addChild(new SpvAsmComputeShaderCase(testCtx, cases[caseNdx].name, spec)); } // OpUndef with constants. #ifndef CTS_USES_VULKANSC { static const char data_dir[] = "spirv_assembly/instruction/compute/undef"; static const struct { const std::string name; const std::string desc; } amberCases[] = { { "undefined_constant_composite", "OpUndef value in OpConstantComposite" }, { "undefined_spec_constant_composite", "OpUndef value in OpSpecConstantComposite" }, }; for (int i = 0; i < DE_LENGTH_OF_ARRAY(amberCases); ++i) { cts_amber::AmberTestCase *testCase = cts_amber::createAmberTestCase(testCtx, amberCases[i].name.c_str(), amberCases[i].desc.c_str(), data_dir, amberCases[i].name + ".amber"); group->addChild(testCase); } } #endif return group.release(); } // Checks that a compute shader can generate a constant composite value of various types, without exercising a computation on it. tcu::TestCaseGroup* createFloat16OpConstantCompositeGroup (tcu::TestContext& testCtx) { de::MovePtr group (new tcu::TestCaseGroup(testCtx, "opconstantcomposite", "Tests the OpConstantComposite instruction")); vector cases; de::Random rnd (deStringHash(group->getName())); const int numElements = 100; vector positiveFloats (numElements, 0); vector negativeFloats (numElements, 0); const StringTemplate shaderTemplate ( "OpCapability Shader\n" "OpCapability Float16\n" "OpMemoryModel Logical GLSL450\n" "OpEntryPoint GLCompute %main \"main\" %id\n" "OpExecutionMode %main LocalSize 1 1 1\n" "OpSource GLSL 430\n" "OpName %main \"main\"\n" "OpName %id \"gl_GlobalInvocationID\"\n" "OpDecorate %id BuiltIn GlobalInvocationId\n" + string(getComputeAsmInputOutputBufferTraits()) + string(getComputeAsmCommonTypes()) + string(getComputeAsmInputOutputBuffer()) + "%id = OpVariable %uvec3ptr Input\n" "%zero = OpConstant %i32 0\n" "%f16 = OpTypeFloat 16\n" "%c_f16_0 = OpConstant %f16 0.0\n" "%c_f16_0_5 = OpConstant %f16 0.5\n" "%c_f16_1 = OpConstant %f16 1.0\n" "%v2f16 = OpTypeVector %f16 2\n" "%v3f16 = OpTypeVector %f16 3\n" "%v4f16 = OpTypeVector %f16 4\n" "${CONSTANT}\n" "%main = OpFunction %void None %voidf\n" "%label = OpLabel\n" "%idval = OpLoad %uvec3 %id\n" "%x = OpCompositeExtract %u32 %idval 0\n" "%inloc = OpAccessChain %f32ptr %indata %zero %x\n" "%inval = OpLoad %f32 %inloc\n" "%neg = OpFNegate %f32 %inval\n" "%outloc = OpAccessChain %f32ptr %outdata %zero %x\n" " OpStore %outloc %neg\n" " OpReturn\n" " OpFunctionEnd\n"); cases.push_back(CaseParameter("vector", "%const = OpConstantComposite %v3f16 %c_f16_0 %c_f16_0_5 %c_f16_1\n")); cases.push_back(CaseParameter("matrix", "%m3v3f16 = OpTypeMatrix %v3f16 3\n" "%vec = OpConstantComposite %v3f16 %c_f16_0 %c_f16_0_5 %c_f16_1\n" "%mat = OpConstantComposite %m3v3f16 %vec %vec %vec")); cases.push_back(CaseParameter("struct", "%m2v3f16 = OpTypeMatrix %v3f16 2\n" "%struct = OpTypeStruct %i32 %f16 %v3f16 %m2v3f16\n" "%vec = OpConstantComposite %v3f16 %c_f16_0 %c_f16_0_5 %c_f16_1\n" "%mat = OpConstantComposite %m2v3f16 %vec %vec\n" "%const = OpConstantComposite %struct %zero %c_f16_0_5 %vec %mat\n")); cases.push_back(CaseParameter("nested_struct", "%st1 = OpTypeStruct %i32 %f16\n" "%st2 = OpTypeStruct %i32 %i32\n" "%struct = OpTypeStruct %st1 %st2\n" "%st1val = OpConstantComposite %st1 %zero %c_f16_0_5\n" "%st2val = OpConstantComposite %st2 %zero %zero\n" "%const = OpConstantComposite %struct %st1val %st2val")); fillRandomScalars(rnd, 1.f, 100.f, &positiveFloats[0], numElements); for (size_t ndx = 0; ndx < numElements; ++ndx) negativeFloats[ndx] = -positiveFloats[ndx]; for (size_t caseNdx = 0; caseNdx < cases.size(); ++caseNdx) { map specializations; ComputeShaderSpec spec; specializations["CONSTANT"] = cases[caseNdx].param; spec.assembly = shaderTemplate.specialize(specializations); spec.inputs.push_back(BufferSp(new Float32Buffer(positiveFloats))); spec.outputs.push_back(BufferSp(new Float32Buffer(negativeFloats))); spec.numWorkGroups = IVec3(numElements, 1, 1); spec.extensions.push_back("VK_KHR_shader_float16_int8"); spec.requestedVulkanFeatures.extFloat16Int8.shaderFloat16 = true; group->addChild(new SpvAsmComputeShaderCase(testCtx, cases[caseNdx].name, spec)); } return group.release(); } const vector squarize(const vector& inData, const deUint32 argNo) { const size_t inDataLength = inData.size(); vector result; result.reserve(inDataLength * inDataLength); if (argNo == 0) { for (size_t numIdx = 0; numIdx < inDataLength; ++numIdx) result.insert(result.end(), inData.begin(), inData.end()); } if (argNo == 1) { for (size_t numIdx = 0; numIdx < inDataLength; ++numIdx) { const vector tmp(inDataLength, inData[numIdx]); result.insert(result.end(), tmp.begin(), tmp.end()); } } return result; } const vector squarizeVector(const vector& inData, const deUint32 argNo) { vector vec; vector result; // Create vectors. vec will contain each possible pair from inData { const size_t inDataLength = inData.size(); DE_ASSERT(inDataLength <= 64); vec.reserve(2 * inDataLength * inDataLength); for (size_t numIdxX = 0; numIdxX < inDataLength; ++numIdxX) for (size_t numIdxY = 0; numIdxY < inDataLength; ++numIdxY) { vec.push_back(inData[numIdxX]); vec.push_back(inData[numIdxY]); } } // Create vector pairs. result will contain each possible pair from vec { const size_t coordsPerVector = 2; const size_t vectorsCount = vec.size() / coordsPerVector; result.reserve(coordsPerVector * vectorsCount * vectorsCount); if (argNo == 0) { for (size_t numIdxX = 0; numIdxX < vectorsCount; ++numIdxX) for (size_t numIdxY = 0; numIdxY < vectorsCount; ++numIdxY) { for (size_t coordNdx = 0; coordNdx < coordsPerVector; ++coordNdx) result.push_back(vec[coordsPerVector * numIdxY + coordNdx]); } } if (argNo == 1) { for (size_t numIdxX = 0; numIdxX < vectorsCount; ++numIdxX) for (size_t numIdxY = 0; numIdxY < vectorsCount; ++numIdxY) { for (size_t coordNdx = 0; coordNdx < coordsPerVector; ++coordNdx) result.push_back(vec[coordsPerVector * numIdxX + coordNdx]); } } } return result; } struct fp16isNan { bool operator()(const tcu::Float16 in1, const tcu::Float16) { return in1.isNaN(); } }; struct fp16isInf { bool operator()(const tcu::Float16 in1, const tcu::Float16) { return in1.isInf(); } }; struct fp16isEqual { bool operator()(const tcu::Float16 in1, const tcu::Float16 in2) { return in1.asFloat() == in2.asFloat(); } }; struct fp16isUnequal { bool operator()(const tcu::Float16 in1, const tcu::Float16 in2) { return in1.asFloat() != in2.asFloat(); } }; struct fp16isLess { bool operator()(const tcu::Float16 in1, const tcu::Float16 in2) { return in1.asFloat() < in2.asFloat(); } }; struct fp16isGreater { bool operator()(const tcu::Float16 in1, const tcu::Float16 in2) { return in1.asFloat() > in2.asFloat(); } }; struct fp16isLessOrEqual { bool operator()(const tcu::Float16 in1, const tcu::Float16 in2) { return in1.asFloat() <= in2.asFloat(); } }; struct fp16isGreaterOrEqual { bool operator()(const tcu::Float16 in1, const tcu::Float16 in2) { return in1.asFloat() >= in2.asFloat(); } }; template bool compareFP16Logical (const std::vector& inputs, const vector& outputAllocs, const std::vector&, TestLog& log) { if (inputs.size() != 2 || outputAllocs.size() != 1) return false; vector input1Bytes; vector input2Bytes; inputs[0].getBytes(input1Bytes); inputs[1].getBytes(input2Bytes); const deUint32 denormModesCount = 2; const deFloat16 float16one = tcu::Float16(1.0f).bits(); const deFloat16 float16zero = tcu::Float16(0.0f).bits(); const tcu::Float16 zero = tcu::Float16::zero(1); const deFloat16* const outputAsFP16 = static_cast(outputAllocs[0]->getHostPtr()); const deFloat16* const input1AsFP16 = reinterpret_cast(&input1Bytes.front()); const deFloat16* const input2AsFP16 = reinterpret_cast(&input2Bytes.front()); deUint32 successfulRuns = denormModesCount; std::string results[denormModesCount]; TestedLogicalFunction testedLogicalFunction; for (deUint32 denormMode = 0; denormMode < denormModesCount; denormMode++) { const bool flushToZero = (denormMode == 1); for (size_t idx = 0; idx < input1Bytes.size() / sizeof(deFloat16); ++idx) { const tcu::Float16 f1pre = tcu::Float16(input1AsFP16[idx]); const tcu::Float16 f2pre = tcu::Float16(input2AsFP16[idx]); const tcu::Float16 f1 = (flushToZero && f1pre.isDenorm()) ? zero : f1pre; const tcu::Float16 f2 = (flushToZero && f2pre.isDenorm()) ? zero : f2pre; deFloat16 expectedOutput = float16zero; if (onlyTestFunc) { if (testedLogicalFunction(f1, f2)) expectedOutput = float16one; } else { const bool f1nan = f1.isNaN(); const bool f2nan = f2.isNaN(); // Skip NaN floats if not supported by implementation if (!nanSupported && (f1nan || f2nan)) continue; if (unationModeAnd) { const bool ordered = !f1nan && !f2nan; if (ordered && testedLogicalFunction(f1, f2)) expectedOutput = float16one; } else { const bool unordered = f1nan || f2nan; if (unordered || testedLogicalFunction(f1, f2)) expectedOutput = float16one; } } if (outputAsFP16[idx] != expectedOutput) { std::ostringstream str; str << "ERROR: Sub-case #" << idx << " flushToZero:" << flushToZero << std::hex << " failed, inputs: 0x" << f1.bits() << ";0x" << f2.bits() << " output: 0x" << outputAsFP16[idx] << " expected output: 0x" << expectedOutput; results[denormMode] = str.str(); successfulRuns--; break; } } } if (successfulRuns == 0) for (deUint32 denormMode = 0; denormMode < denormModesCount; denormMode++) log << TestLog::Message << results[denormMode] << TestLog::EndMessage; return successfulRuns > 0; } } // anonymous tcu::TestCaseGroup* createOpSourceTests (tcu::TestContext& testCtx) { struct NameCodePair { string name, code; }; RGBA defaultColors[4]; de::MovePtr opSourceTests (new tcu::TestCaseGroup(testCtx, "opsource", "OpSource instruction")); const std::string opsourceGLSLWithFile = "%opsrcfile = OpString \"foo.vert\"\nOpSource GLSL 450 %opsrcfile "; map fragments = passthruFragments(); const NameCodePair tests[] = { {"unknown", "OpSource Unknown 321"}, {"essl", "OpSource ESSL 310"}, {"glsl", "OpSource GLSL 450"}, {"opencl_cpp", "OpSource OpenCL_CPP 120"}, {"opencl_c", "OpSource OpenCL_C 120"}, {"multiple", "OpSource GLSL 450\nOpSource GLSL 450"}, {"file", opsourceGLSLWithFile}, {"source", opsourceGLSLWithFile + "\"void main(){}\""}, // Longest possible source string: SPIR-V limits instructions to 65535 // words, of which the first 4 are opsourceGLSLWithFile; the rest will // contain 65530 UTF8 characters (one word each) plus one last word // containing 3 ASCII characters and \0. {"longsource", opsourceGLSLWithFile + '"' + makeLongUTF8String(65530) + "ccc" + '"'} }; getDefaultColors(defaultColors); for (size_t testNdx = 0; testNdx < sizeof(tests) / sizeof(NameCodePair); ++testNdx) { fragments["debug"] = tests[testNdx].code; createTestsForAllStages(tests[testNdx].name, defaultColors, defaultColors, fragments, opSourceTests.get()); } return opSourceTests.release(); } tcu::TestCaseGroup* createOpSourceContinuedTests (tcu::TestContext& testCtx) { struct NameCodePair { string name, code; }; RGBA defaultColors[4]; de::MovePtr opSourceTests (new tcu::TestCaseGroup(testCtx, "opsourcecontinued", "OpSourceContinued instruction")); map fragments = passthruFragments(); const std::string opsource = "%opsrcfile = OpString \"foo.vert\"\nOpSource GLSL 450 %opsrcfile \"void main(){}\"\n"; const NameCodePair tests[] = { {"empty", opsource + "OpSourceContinued \"\""}, {"short", opsource + "OpSourceContinued \"abcde\""}, {"multiple", opsource + "OpSourceContinued \"abcde\"\nOpSourceContinued \"fghij\""}, // Longest possible source string: SPIR-V limits instructions to 65535 // words, of which the first one is OpSourceContinued/length; the rest // will contain 65533 UTF8 characters (one word each) plus one last word // containing 3 ASCII characters and \0. {"long", opsource + "OpSourceContinued \"" + makeLongUTF8String(65533) + "ccc\""} }; getDefaultColors(defaultColors); for (size_t testNdx = 0; testNdx < sizeof(tests) / sizeof(NameCodePair); ++testNdx) { fragments["debug"] = tests[testNdx].code; createTestsForAllStages(tests[testNdx].name, defaultColors, defaultColors, fragments, opSourceTests.get()); } return opSourceTests.release(); } tcu::TestCaseGroup* createOpNoLineTests(tcu::TestContext& testCtx) { RGBA defaultColors[4]; de::MovePtr opLineTests (new tcu::TestCaseGroup(testCtx, "opnoline", "OpNoLine instruction")); map fragments; getDefaultColors(defaultColors); fragments["debug"] = "%name = OpString \"name\"\n"; fragments["pre_main"] = "OpNoLine\n" "OpNoLine\n" "OpLine %name 1 1\n" "OpNoLine\n" "OpLine %name 1 1\n" "OpLine %name 1 1\n" "%second_function = OpFunction %v4f32 None %v4f32_v4f32_function\n" "OpNoLine\n" "OpLine %name 1 1\n" "OpNoLine\n" "OpLine %name 1 1\n" "OpLine %name 1 1\n" "%second_param1 = OpFunctionParameter %v4f32\n" "OpNoLine\n" "OpNoLine\n" "%label_secondfunction = OpLabel\n" "OpNoLine\n" "OpReturnValue %second_param1\n" "OpFunctionEnd\n" "OpNoLine\n" "OpNoLine\n"; fragments["testfun"] = // A %test_code function that returns its argument unchanged. "OpNoLine\n" "OpNoLine\n" "OpLine %name 1 1\n" "%test_code = OpFunction %v4f32 None %v4f32_v4f32_function\n" "OpNoLine\n" "%param1 = OpFunctionParameter %v4f32\n" "OpNoLine\n" "OpNoLine\n" "%label_testfun = OpLabel\n" "OpNoLine\n" "%val1 = OpFunctionCall %v4f32 %second_function %param1\n" "OpReturnValue %val1\n" "OpFunctionEnd\n" "OpLine %name 1 1\n" "OpNoLine\n"; createTestsForAllStages("opnoline", defaultColors, defaultColors, fragments, opLineTests.get()); return opLineTests.release(); } tcu::TestCaseGroup* createOpModuleProcessedTests(tcu::TestContext& testCtx) { RGBA defaultColors[4]; de::MovePtr opModuleProcessedTests (new tcu::TestCaseGroup(testCtx, "opmoduleprocessed", "OpModuleProcessed instruction")); map fragments; std::vector noExtensions; GraphicsResources resources; getDefaultColors(defaultColors); resources.verifyBinary = veryfiBinaryShader; resources.spirvVersion = SPIRV_VERSION_1_3; fragments["moduleprocessed"] = "OpModuleProcessed \"VULKAN CTS\"\n" "OpModuleProcessed \"Negative values\"\n" "OpModuleProcessed \"Date: 2017/09/21\"\n"; fragments["pre_main"] = "%second_function = OpFunction %v4f32 None %v4f32_v4f32_function\n" "%second_param1 = OpFunctionParameter %v4f32\n" "%label_secondfunction = OpLabel\n" "OpReturnValue %second_param1\n" "OpFunctionEnd\n"; fragments["testfun"] = // A %test_code function that returns its argument unchanged. "%test_code = OpFunction %v4f32 None %v4f32_v4f32_function\n" "%param1 = OpFunctionParameter %v4f32\n" "%label_testfun = OpLabel\n" "%val1 = OpFunctionCall %v4f32 %second_function %param1\n" "OpReturnValue %val1\n" "OpFunctionEnd\n"; createTestsForAllStages ("opmoduleprocessed", defaultColors, defaultColors, fragments, resources, noExtensions, opModuleProcessedTests.get()); return opModuleProcessedTests.release(); } tcu::TestCaseGroup* createOpLineTests(tcu::TestContext& testCtx) { RGBA defaultColors[4]; de::MovePtr opLineTests (new tcu::TestCaseGroup(testCtx, "opline", "OpLine instruction")); map fragments; std::vector > problemStrings; problemStrings.push_back(std::make_pair("empty_name", "")); problemStrings.push_back(std::make_pair("short_name", "short_name")); problemStrings.push_back(std::make_pair("long_name", makeLongUTF8String(65530) + "ccc")); getDefaultColors(defaultColors); fragments["debug"] = "%other_name = OpString \"other_name\"\n"; fragments["pre_main"] = "OpLine %file_name 32 0\n" "OpLine %file_name 32 32\n" "OpLine %file_name 32 40\n" "OpLine %other_name 32 40\n" "OpLine %other_name 0 100\n" "OpLine %other_name 0 4294967295\n" "OpLine %other_name 4294967295 0\n" "OpLine %other_name 32 40\n" "OpLine %file_name 0 0\n" "%second_function = OpFunction %v4f32 None %v4f32_v4f32_function\n" "OpLine %file_name 1 0\n" "%second_param1 = OpFunctionParameter %v4f32\n" "OpLine %file_name 1 3\n" "OpLine %file_name 1 2\n" "%label_secondfunction = OpLabel\n" "OpLine %file_name 0 2\n" "OpReturnValue %second_param1\n" "OpFunctionEnd\n" "OpLine %file_name 0 2\n" "OpLine %file_name 0 2\n"; fragments["testfun"] = // A %test_code function that returns its argument unchanged. "OpLine %file_name 1 0\n" "%test_code = OpFunction %v4f32 None %v4f32_v4f32_function\n" "OpLine %file_name 16 330\n" "%param1 = OpFunctionParameter %v4f32\n" "OpLine %file_name 14 442\n" "%label_testfun = OpLabel\n" "OpLine %file_name 11 1024\n" "%val1 = OpFunctionCall %v4f32 %second_function %param1\n" "OpLine %file_name 2 97\n" "OpReturnValue %val1\n" "OpFunctionEnd\n" "OpLine %file_name 5 32\n"; for (size_t i = 0; i < problemStrings.size(); ++i) { map testFragments = fragments; testFragments["debug"] += "%file_name = OpString \"" + problemStrings[i].second + "\"\n"; createTestsForAllStages(string("opline") + "_" + problemStrings[i].first, defaultColors, defaultColors, testFragments, opLineTests.get()); } return opLineTests.release(); } tcu::TestCaseGroup* createOpConstantNullTests(tcu::TestContext& testCtx) { de::MovePtr opConstantNullTests (new tcu::TestCaseGroup(testCtx, "opconstantnull", "OpConstantNull instruction")); RGBA colors[4]; const char functionStart[] = "%test_code = OpFunction %v4f32 None %v4f32_v4f32_function\n" "%param1 = OpFunctionParameter %v4f32\n" "%lbl = OpLabel\n"; const char functionEnd[] = "OpReturnValue %transformed_param\n" "OpFunctionEnd\n"; struct NameConstantsCode { string name; string constants; string code; }; NameConstantsCode tests[] = { { "vec4", "%cnull = OpConstantNull %v4f32\n", "%transformed_param = OpFAdd %v4f32 %param1 %cnull\n" }, { "float", "%cnull = OpConstantNull %f32\n", "%vp = OpVariable %fp_v4f32 Function\n" "%v = OpLoad %v4f32 %vp\n" "%v0 = OpVectorInsertDynamic %v4f32 %v %cnull %c_i32_0\n" "%v1 = OpVectorInsertDynamic %v4f32 %v0 %cnull %c_i32_1\n" "%v2 = OpVectorInsertDynamic %v4f32 %v1 %cnull %c_i32_2\n" "%v3 = OpVectorInsertDynamic %v4f32 %v2 %cnull %c_i32_3\n" "%transformed_param = OpFAdd %v4f32 %param1 %v3\n" }, { "bool", "%cnull = OpConstantNull %bool\n", "%v = OpVariable %fp_v4f32 Function\n" " OpStore %v %param1\n" " OpSelectionMerge %false_label None\n" " OpBranchConditional %cnull %true_label %false_label\n" "%true_label = OpLabel\n" " OpStore %v %c_v4f32_0_5_0_5_0_5_0_5\n" " OpBranch %false_label\n" "%false_label = OpLabel\n" "%transformed_param = OpLoad %v4f32 %v\n" }, { "i32", "%cnull = OpConstantNull %i32\n", "%v = OpVariable %fp_v4f32 Function %c_v4f32_0_5_0_5_0_5_0_5\n" "%b = OpIEqual %bool %cnull %c_i32_0\n" " OpSelectionMerge %false_label None\n" " OpBranchConditional %b %true_label %false_label\n" "%true_label = OpLabel\n" " OpStore %v %param1\n" " OpBranch %false_label\n" "%false_label = OpLabel\n" "%transformed_param = OpLoad %v4f32 %v\n" }, { "struct", "%stype = OpTypeStruct %f32 %v4f32\n" "%fp_stype = OpTypePointer Function %stype\n" "%cnull = OpConstantNull %stype\n", "%v = OpVariable %fp_stype Function %cnull\n" "%f = OpAccessChain %fp_v4f32 %v %c_i32_1\n" "%f_val = OpLoad %v4f32 %f\n" "%transformed_param = OpFAdd %v4f32 %param1 %f_val\n" }, { "array", "%a4_v4f32 = OpTypeArray %v4f32 %c_u32_4\n" "%fp_a4_v4f32 = OpTypePointer Function %a4_v4f32\n" "%cnull = OpConstantNull %a4_v4f32\n", "%v = OpVariable %fp_a4_v4f32 Function %cnull\n" "%f = OpAccessChain %fp_v4f32 %v %c_u32_0\n" "%f1 = OpAccessChain %fp_v4f32 %v %c_u32_1\n" "%f2 = OpAccessChain %fp_v4f32 %v %c_u32_2\n" "%f3 = OpAccessChain %fp_v4f32 %v %c_u32_3\n" "%f_val = OpLoad %v4f32 %f\n" "%f1_val = OpLoad %v4f32 %f1\n" "%f2_val = OpLoad %v4f32 %f2\n" "%f3_val = OpLoad %v4f32 %f3\n" "%t0 = OpFAdd %v4f32 %param1 %f_val\n" "%t1 = OpFAdd %v4f32 %t0 %f1_val\n" "%t2 = OpFAdd %v4f32 %t1 %f2_val\n" "%transformed_param = OpFAdd %v4f32 %t2 %f3_val\n" }, { "matrix", "%mat4x4_f32 = OpTypeMatrix %v4f32 4\n" "%cnull = OpConstantNull %mat4x4_f32\n", // Our null matrix * any vector should result in a zero vector. "%v = OpVectorTimesMatrix %v4f32 %param1 %cnull\n" "%transformed_param = OpFAdd %v4f32 %param1 %v\n" } }; getHalfColorsFullAlpha(colors); for (size_t testNdx = 0; testNdx < sizeof(tests) / sizeof(NameConstantsCode); ++testNdx) { map fragments; fragments["pre_main"] = tests[testNdx].constants; fragments["testfun"] = string(functionStart) + tests[testNdx].code + functionEnd; createTestsForAllStages(tests[testNdx].name, colors, colors, fragments, opConstantNullTests.get()); } return opConstantNullTests.release(); } tcu::TestCaseGroup* createOpConstantCompositeTests(tcu::TestContext& testCtx) { de::MovePtr opConstantCompositeTests (new tcu::TestCaseGroup(testCtx, "opconstantcomposite", "OpConstantComposite instruction")); RGBA inputColors[4]; RGBA outputColors[4]; const char functionStart[] = "%test_code = OpFunction %v4f32 None %v4f32_v4f32_function\n" "%param1 = OpFunctionParameter %v4f32\n" "%lbl = OpLabel\n"; const char functionEnd[] = "OpReturnValue %transformed_param\n" "OpFunctionEnd\n"; struct NameConstantsCode { string name; string constants; string code; }; NameConstantsCode tests[] = { { "vec4", "%cval = OpConstantComposite %v4f32 %c_f32_0_5 %c_f32_0_5 %c_f32_0_5 %c_f32_0\n", "%transformed_param = OpFAdd %v4f32 %param1 %cval\n" }, { "struct", "%stype = OpTypeStruct %v4f32 %f32\n" "%fp_stype = OpTypePointer Function %stype\n" "%f32_n_1 = OpConstant %f32 -1.0\n" "%f32_1_5 = OpConstant %f32 !0x3fc00000\n" // +1.5 "%cvec = OpConstantComposite %v4f32 %f32_1_5 %f32_1_5 %f32_1_5 %c_f32_1\n" "%cval = OpConstantComposite %stype %cvec %f32_n_1\n", "%v = OpVariable %fp_stype Function %cval\n" "%vec_ptr = OpAccessChain %fp_v4f32 %v %c_u32_0\n" "%f32_ptr = OpAccessChain %fp_f32 %v %c_u32_1\n" "%vec_val = OpLoad %v4f32 %vec_ptr\n" "%f32_val = OpLoad %f32 %f32_ptr\n" "%tmp1 = OpVectorTimesScalar %v4f32 %c_v4f32_1_1_1_1 %f32_val\n" // vec4(-1) "%tmp2 = OpFAdd %v4f32 %tmp1 %param1\n" // param1 + vec4(-1) "%transformed_param = OpFAdd %v4f32 %tmp2 %vec_val\n" // param1 + vec4(-1) + vec4(1.5, 1.5, 1.5, 1.0) }, { // [1|0|0|0.5] [x] = x + 0.5 // [0|1|0|0.5] [y] = y + 0.5 // [0|0|1|0.5] [z] = z + 0.5 // [0|0|0|1 ] [1] = 1 "matrix", "%mat4x4_f32 = OpTypeMatrix %v4f32 4\n" "%v4f32_1_0_0_0 = OpConstantComposite %v4f32 %c_f32_1 %c_f32_0 %c_f32_0 %c_f32_0\n" "%v4f32_0_1_0_0 = OpConstantComposite %v4f32 %c_f32_0 %c_f32_1 %c_f32_0 %c_f32_0\n" "%v4f32_0_0_1_0 = OpConstantComposite %v4f32 %c_f32_0 %c_f32_0 %c_f32_1 %c_f32_0\n" "%v4f32_0_5_0_5_0_5_1 = OpConstantComposite %v4f32 %c_f32_0_5 %c_f32_0_5 %c_f32_0_5 %c_f32_1\n" "%cval = OpConstantComposite %mat4x4_f32 %v4f32_1_0_0_0 %v4f32_0_1_0_0 %v4f32_0_0_1_0 %v4f32_0_5_0_5_0_5_1\n", "%transformed_param = OpMatrixTimesVector %v4f32 %cval %param1\n" }, { "array", "%c_v4f32_1_1_1_0 = OpConstantComposite %v4f32 %c_f32_1 %c_f32_1 %c_f32_1 %c_f32_0\n" "%fp_a4f32 = OpTypePointer Function %a4f32\n" "%f32_n_1 = OpConstant %f32 -1.0\n" "%f32_1_5 = OpConstant %f32 !0x3fc00000\n" // +1.5 "%carr = OpConstantComposite %a4f32 %c_f32_0 %f32_n_1 %f32_1_5 %c_f32_0\n", "%v = OpVariable %fp_a4f32 Function %carr\n" "%f = OpAccessChain %fp_f32 %v %c_u32_0\n" "%f1 = OpAccessChain %fp_f32 %v %c_u32_1\n" "%f2 = OpAccessChain %fp_f32 %v %c_u32_2\n" "%f3 = OpAccessChain %fp_f32 %v %c_u32_3\n" "%f_val = OpLoad %f32 %f\n" "%f1_val = OpLoad %f32 %f1\n" "%f2_val = OpLoad %f32 %f2\n" "%f3_val = OpLoad %f32 %f3\n" "%ftot1 = OpFAdd %f32 %f_val %f1_val\n" "%ftot2 = OpFAdd %f32 %ftot1 %f2_val\n" "%ftot3 = OpFAdd %f32 %ftot2 %f3_val\n" // 0 - 1 + 1.5 + 0 "%add_vec = OpVectorTimesScalar %v4f32 %c_v4f32_1_1_1_0 %ftot3\n" "%transformed_param = OpFAdd %v4f32 %param1 %add_vec\n" }, { // // [ // { // 0.0, // [ 1.0, 1.0, 1.0, 1.0] // }, // { // 1.0, // [ 0.0, 0.5, 0.0, 0.0] // }, // ^^^ // { // 0.0, // [ 1.0, 1.0, 1.0, 1.0] // } // ] "array_of_struct_of_array", "%c_v4f32_1_1_1_0 = OpConstantComposite %v4f32 %c_f32_1 %c_f32_1 %c_f32_1 %c_f32_0\n" "%fp_a4f32 = OpTypePointer Function %a4f32\n" "%stype = OpTypeStruct %f32 %a4f32\n" "%a3stype = OpTypeArray %stype %c_u32_3\n" "%fp_a3stype = OpTypePointer Function %a3stype\n" "%ca4f32_0 = OpConstantComposite %a4f32 %c_f32_0 %c_f32_0_5 %c_f32_0 %c_f32_0\n" "%ca4f32_1 = OpConstantComposite %a4f32 %c_f32_1 %c_f32_1 %c_f32_1 %c_f32_1\n" "%cstype1 = OpConstantComposite %stype %c_f32_0 %ca4f32_1\n" "%cstype2 = OpConstantComposite %stype %c_f32_1 %ca4f32_0\n" "%carr = OpConstantComposite %a3stype %cstype1 %cstype2 %cstype1", "%v = OpVariable %fp_a3stype Function %carr\n" "%f = OpAccessChain %fp_f32 %v %c_u32_1 %c_u32_1 %c_u32_1\n" "%f_l = OpLoad %f32 %f\n" "%add_vec = OpVectorTimesScalar %v4f32 %c_v4f32_1_1_1_0 %f_l\n" "%transformed_param = OpFAdd %v4f32 %param1 %add_vec\n" } }; getHalfColorsFullAlpha(inputColors); outputColors[0] = RGBA(255, 255, 255, 255); outputColors[1] = RGBA(255, 127, 127, 255); outputColors[2] = RGBA(127, 255, 127, 255); outputColors[3] = RGBA(127, 127, 255, 255); for (size_t testNdx = 0; testNdx < sizeof(tests) / sizeof(NameConstantsCode); ++testNdx) { map fragments; fragments["pre_main"] = tests[testNdx].constants; fragments["testfun"] = string(functionStart) + tests[testNdx].code + functionEnd; createTestsForAllStages(tests[testNdx].name, inputColors, outputColors, fragments, opConstantCompositeTests.get()); } return opConstantCompositeTests.release(); } tcu::TestCaseGroup* createSelectionBlockOrderTests(tcu::TestContext& testCtx) { de::MovePtr group (new tcu::TestCaseGroup(testCtx, "selection_block_order", "Out-of-order blocks for selection")); RGBA inputColors[4]; RGBA outputColors[4]; map fragments; // vec4 test_code(vec4 param) { // vec4 result = param; // for (int i = 0; i < 4; ++i) { // if (i == 0) result[i] = 0.; // else result[i] = 1. - result[i]; // } // return result; // } const char function[] = "%test_code = OpFunction %v4f32 None %v4f32_v4f32_function\n" "%param1 = OpFunctionParameter %v4f32\n" "%lbl = OpLabel\n" "%iptr = OpVariable %fp_i32 Function\n" "%result = OpVariable %fp_v4f32 Function\n" " OpStore %iptr %c_i32_0\n" " OpStore %result %param1\n" " OpBranch %loop\n" // Loop entry block. "%loop = OpLabel\n" "%ival = OpLoad %i32 %iptr\n" "%lt_4 = OpSLessThan %bool %ival %c_i32_4\n" " OpLoopMerge %exit %if_entry None\n" " OpBranchConditional %lt_4 %if_entry %exit\n" // Merge block for loop. "%exit = OpLabel\n" "%ret = OpLoad %v4f32 %result\n" " OpReturnValue %ret\n" // If-statement entry block. "%if_entry = OpLabel\n" "%loc = OpAccessChain %fp_f32 %result %ival\n" "%eq_0 = OpIEqual %bool %ival %c_i32_0\n" " OpSelectionMerge %if_exit None\n" " OpBranchConditional %eq_0 %if_true %if_false\n" // False branch for if-statement. "%if_false = OpLabel\n" "%val = OpLoad %f32 %loc\n" "%sub = OpFSub %f32 %c_f32_1 %val\n" " OpStore %loc %sub\n" " OpBranch %if_exit\n" // Merge block for if-statement. "%if_exit = OpLabel\n" "%ival_next = OpIAdd %i32 %ival %c_i32_1\n" " OpStore %iptr %ival_next\n" " OpBranch %loop\n" // True branch for if-statement. "%if_true = OpLabel\n" " OpStore %loc %c_f32_0\n" " OpBranch %if_exit\n" " OpFunctionEnd\n"; fragments["testfun"] = function; inputColors[0] = RGBA(127, 127, 127, 0); inputColors[1] = RGBA(127, 0, 0, 0); inputColors[2] = RGBA(0, 127, 0, 0); inputColors[3] = RGBA(0, 0, 127, 0); outputColors[0] = RGBA(0, 128, 128, 255); outputColors[1] = RGBA(0, 255, 255, 255); outputColors[2] = RGBA(0, 128, 255, 255); outputColors[3] = RGBA(0, 255, 128, 255); createTestsForAllStages("out_of_order", inputColors, outputColors, fragments, group.get()); return group.release(); } tcu::TestCaseGroup* createSwitchBlockOrderTests(tcu::TestContext& testCtx) { de::MovePtr group (new tcu::TestCaseGroup(testCtx, "switch_block_order", "Out-of-order blocks for switch")); RGBA inputColors[4]; RGBA outputColors[4]; map fragments; const char typesAndConstants[] = "%c_f32_p2 = OpConstant %f32 0.2\n" "%c_f32_p4 = OpConstant %f32 0.4\n" "%c_f32_p6 = OpConstant %f32 0.6\n" "%c_f32_p8 = OpConstant %f32 0.8\n"; // vec4 test_code(vec4 param) { // vec4 result = param; // for (int i = 0; i < 4; ++i) { // switch (i) { // case 0: result[i] += .2; break; // case 1: result[i] += .6; break; // case 2: result[i] += .4; break; // case 3: result[i] += .8; break; // default: break; // unreachable // } // } // return result; // } const char function[] = "%test_code = OpFunction %v4f32 None %v4f32_v4f32_function\n" "%param1 = OpFunctionParameter %v4f32\n" "%lbl = OpLabel\n" "%iptr = OpVariable %fp_i32 Function\n" "%result = OpVariable %fp_v4f32 Function\n" " OpStore %iptr %c_i32_0\n" " OpStore %result %param1\n" " OpBranch %loop\n" // Loop entry block. "%loop = OpLabel\n" "%ival = OpLoad %i32 %iptr\n" "%lt_4 = OpSLessThan %bool %ival %c_i32_4\n" " OpLoopMerge %exit %cont None\n" " OpBranchConditional %lt_4 %switch_entry %exit\n" // Merge block for loop. "%exit = OpLabel\n" "%ret = OpLoad %v4f32 %result\n" " OpReturnValue %ret\n" // Switch-statement entry block. "%switch_entry = OpLabel\n" "%loc = OpAccessChain %fp_f32 %result %ival\n" "%val = OpLoad %f32 %loc\n" " OpSelectionMerge %switch_exit None\n" " OpSwitch %ival %switch_default 0 %case0 1 %case1 2 %case2 3 %case3\n" "%case2 = OpLabel\n" "%addp4 = OpFAdd %f32 %val %c_f32_p4\n" " OpStore %loc %addp4\n" " OpBranch %switch_exit\n" "%switch_default = OpLabel\n" " OpUnreachable\n" "%case3 = OpLabel\n" "%addp8 = OpFAdd %f32 %val %c_f32_p8\n" " OpStore %loc %addp8\n" " OpBranch %switch_exit\n" "%case0 = OpLabel\n" "%addp2 = OpFAdd %f32 %val %c_f32_p2\n" " OpStore %loc %addp2\n" " OpBranch %switch_exit\n" // Merge block for switch-statement. "%switch_exit = OpLabel\n" "%ival_next = OpIAdd %i32 %ival %c_i32_1\n" " OpStore %iptr %ival_next\n" " OpBranch %cont\n" "%cont = OpLabel\n" " OpBranch %loop\n" "%case1 = OpLabel\n" "%addp6 = OpFAdd %f32 %val %c_f32_p6\n" " OpStore %loc %addp6\n" " OpBranch %switch_exit\n" " OpFunctionEnd\n"; fragments["pre_main"] = typesAndConstants; fragments["testfun"] = function; inputColors[0] = RGBA(127, 27, 127, 51); inputColors[1] = RGBA(127, 0, 0, 51); inputColors[2] = RGBA(0, 27, 0, 51); inputColors[3] = RGBA(0, 0, 127, 51); outputColors[0] = RGBA(178, 180, 229, 255); outputColors[1] = RGBA(178, 153, 102, 255); outputColors[2] = RGBA(51, 180, 102, 255); outputColors[3] = RGBA(51, 153, 229, 255); createTestsForAllStages("out_of_order", inputColors, outputColors, fragments, group.get()); addOpSwitchAmberTests(*group, testCtx); return group.release(); } tcu::TestCaseGroup* createDecorationGroupTests(tcu::TestContext& testCtx) { de::MovePtr group (new tcu::TestCaseGroup(testCtx, "decoration_group", "Decoration group tests")); RGBA inputColors[4]; RGBA outputColors[4]; map fragments; const char decorations[] = "OpDecorate %array_group ArrayStride 4\n" "OpDecorate %struct_member_group Offset 0\n" "%array_group = OpDecorationGroup\n" "%struct_member_group = OpDecorationGroup\n" "OpDecorate %group1 RelaxedPrecision\n" "OpDecorate %group3 RelaxedPrecision\n" "OpDecorate %group3 Flat\n" "OpDecorate %group3 Restrict\n" "%group0 = OpDecorationGroup\n" "%group1 = OpDecorationGroup\n" "%group3 = OpDecorationGroup\n"; const char typesAndConstants[] = "%a3f32 = OpTypeArray %f32 %c_u32_3\n" "%struct1 = OpTypeStruct %a3f32\n" "%struct2 = OpTypeStruct %a3f32\n" "%fp_struct1 = OpTypePointer Function %struct1\n" "%fp_struct2 = OpTypePointer Function %struct2\n" "%c_f32_2 = OpConstant %f32 2.\n" "%c_f32_n2 = OpConstant %f32 -2.\n" "%c_a3f32_1 = OpConstantComposite %a3f32 %c_f32_1 %c_f32_2 %c_f32_1\n" "%c_a3f32_2 = OpConstantComposite %a3f32 %c_f32_n1 %c_f32_n2 %c_f32_n1\n" "%c_struct1 = OpConstantComposite %struct1 %c_a3f32_1\n" "%c_struct2 = OpConstantComposite %struct2 %c_a3f32_2\n"; const char function[] = "%test_code = OpFunction %v4f32 None %v4f32_v4f32_function\n" "%param = OpFunctionParameter %v4f32\n" "%entry = OpLabel\n" "%result = OpVariable %fp_v4f32 Function\n" "%v_struct1 = OpVariable %fp_struct1 Function\n" "%v_struct2 = OpVariable %fp_struct2 Function\n" " OpStore %result %param\n" " OpStore %v_struct1 %c_struct1\n" " OpStore %v_struct2 %c_struct2\n" "%ptr1 = OpAccessChain %fp_f32 %v_struct1 %c_i32_0 %c_i32_2\n" "%val1 = OpLoad %f32 %ptr1\n" "%ptr2 = OpAccessChain %fp_f32 %v_struct2 %c_i32_0 %c_i32_2\n" "%val2 = OpLoad %f32 %ptr2\n" "%addvalues = OpFAdd %f32 %val1 %val2\n" "%ptr = OpAccessChain %fp_f32 %result %c_i32_1\n" "%val = OpLoad %f32 %ptr\n" "%addresult = OpFAdd %f32 %addvalues %val\n" " OpStore %ptr %addresult\n" "%ret = OpLoad %v4f32 %result\n" " OpReturnValue %ret\n" " OpFunctionEnd\n"; struct CaseNameDecoration { string name; string decoration; }; CaseNameDecoration tests[] = { { "same_decoration_group_on_multiple_types", "OpGroupMemberDecorate %struct_member_group %struct1 0 %struct2 0\n" }, { "empty_decoration_group", "OpGroupDecorate %group0 %a3f32\n" "OpGroupDecorate %group0 %result\n" }, { "one_element_decoration_group", "OpGroupDecorate %array_group %a3f32\n" }, { "multiple_elements_decoration_group", "OpGroupDecorate %group3 %v_struct1\n" }, { "multiple_decoration_groups_on_same_variable", "OpGroupDecorate %group0 %v_struct2\n" "OpGroupDecorate %group1 %v_struct2\n" "OpGroupDecorate %group3 %v_struct2\n" }, { "same_decoration_group_multiple_times", "OpGroupDecorate %group1 %addvalues\n" "OpGroupDecorate %group1 %addvalues\n" "OpGroupDecorate %group1 %addvalues\n" }, }; getHalfColorsFullAlpha(inputColors); getHalfColorsFullAlpha(outputColors); for (size_t idx = 0; idx < (sizeof(tests) / sizeof(tests[0])); ++idx) { fragments["decoration"] = decorations + tests[idx].decoration; fragments["pre_main"] = typesAndConstants; fragments["testfun"] = function; createTestsForAllStages(tests[idx].name, inputColors, outputColors, fragments, group.get()); } return group.release(); } struct SpecConstantTwoValGraphicsCase { const std::string caseName; const std::string scDefinition0; const std::string scDefinition1; const std::string scResultType; const std::string scOperation; SpecConstantValue scActualValue0; SpecConstantValue scActualValue1; const std::string resultOperation; RGBA expectedColors[4]; CaseFlags caseFlags; SpecConstantTwoValGraphicsCase (const std::string& name, const std::string& definition0, const std::string& definition1, const std::string& resultType, const std::string& operation, const SpecConstantValue& value0, const SpecConstantValue& value1, const std::string& resultOp, const RGBA (&output)[4], CaseFlags flags = FLAG_NONE) : caseName (name) , scDefinition0 (definition0) , scDefinition1 (definition1) , scResultType (resultType) , scOperation (operation) , scActualValue0 (value0) , scActualValue1 (value1) , resultOperation (resultOp) , caseFlags (flags) { expectedColors[0] = output[0]; expectedColors[1] = output[1]; expectedColors[2] = output[2]; expectedColors[3] = output[3]; } }; tcu::TestCaseGroup* createSpecConstantTests (tcu::TestContext& testCtx) { de::MovePtr group (new tcu::TestCaseGroup(testCtx, "opspecconstantop", "Test the OpSpecConstantOp instruction")); vector cases; RGBA inputColors[4]; RGBA outputColors0[4]; RGBA outputColors1[4]; RGBA outputColors2[4]; const char decorations1[] = "OpDecorate %sc_0 SpecId 0\n" "OpDecorate %sc_1 SpecId 1\n"; const char typesAndConstants1[] = "${OPTYPE_DEFINITIONS:opt}" "%sc_0 = OpSpecConstant${SC_DEF0}\n" "%sc_1 = OpSpecConstant${SC_DEF1}\n" "%sc_op = OpSpecConstantOp ${SC_RESULT_TYPE} ${SC_OP}\n"; const char function1[] = "%test_code = OpFunction %v4f32 None %v4f32_v4f32_function\n" "%param = OpFunctionParameter %v4f32\n" "%label = OpLabel\n" "%result = OpVariable %fp_v4f32 Function\n" "${TYPE_CONVERT:opt}" " OpStore %result %param\n" "%gen = ${GEN_RESULT}\n" "%index = OpIAdd %i32 %gen %c_i32_1\n" "%loc = OpAccessChain %fp_f32 %result %index\n" "%val = OpLoad %f32 %loc\n" "%add = OpFAdd %f32 %val %c_f32_0_5\n" " OpStore %loc %add\n" "%ret = OpLoad %v4f32 %result\n" " OpReturnValue %ret\n" " OpFunctionEnd\n"; inputColors[0] = RGBA(127, 127, 127, 255); inputColors[1] = RGBA(127, 0, 0, 255); inputColors[2] = RGBA(0, 127, 0, 255); inputColors[3] = RGBA(0, 0, 127, 255); // Derived from inputColors[x] by adding 128 to inputColors[x][0]. outputColors0[0] = RGBA(255, 127, 127, 255); outputColors0[1] = RGBA(255, 0, 0, 255); outputColors0[2] = RGBA(128, 127, 0, 255); outputColors0[3] = RGBA(128, 0, 127, 255); // Derived from inputColors[x] by adding 128 to inputColors[x][1]. outputColors1[0] = RGBA(127, 255, 127, 255); outputColors1[1] = RGBA(127, 128, 0, 255); outputColors1[2] = RGBA(0, 255, 0, 255); outputColors1[3] = RGBA(0, 128, 127, 255); // Derived from inputColors[x] by adding 128 to inputColors[x][2]. outputColors2[0] = RGBA(127, 127, 255, 255); outputColors2[1] = RGBA(127, 0, 128, 255); outputColors2[2] = RGBA(0, 127, 128, 255); outputColors2[3] = RGBA(0, 0, 255, 255); const char addZeroToSc[] = "OpIAdd %i32 %c_i32_0 %sc_op"; const char addZeroToSc32[] = "OpIAdd %i32 %c_i32_0 %sc_op32"; const char selectTrueUsingSc[] = "OpSelect %i32 %sc_op %c_i32_1 %c_i32_0"; const char selectFalseUsingSc[] = "OpSelect %i32 %sc_op %c_i32_0 %c_i32_1"; cases.push_back(SpecConstantTwoValGraphicsCase("iadd", " %i32 0", " %i32 0", "%i32", "IAdd %sc_0 %sc_1", 19, -20, addZeroToSc, outputColors0)); cases.push_back(SpecConstantTwoValGraphicsCase("isub", " %i32 0", " %i32 0", "%i32", "ISub %sc_0 %sc_1", 19, 20, addZeroToSc, outputColors0)); cases.push_back(SpecConstantTwoValGraphicsCase("imul", " %i32 0", " %i32 0", "%i32", "IMul %sc_0 %sc_1", -1, -1, addZeroToSc, outputColors2)); cases.push_back(SpecConstantTwoValGraphicsCase("sdiv", " %i32 0", " %i32 0", "%i32", "SDiv %sc_0 %sc_1", -126, 126, addZeroToSc, outputColors0)); cases.push_back(SpecConstantTwoValGraphicsCase("udiv", " %i32 0", " %i32 0", "%i32", "UDiv %sc_0 %sc_1", 126, 126, addZeroToSc, outputColors2)); cases.push_back(SpecConstantTwoValGraphicsCase("srem", " %i32 0", " %i32 0", "%i32", "SRem %sc_0 %sc_1", 3, 2, addZeroToSc, outputColors2)); cases.push_back(SpecConstantTwoValGraphicsCase("smod", " %i32 0", " %i32 0", "%i32", "SMod %sc_0 %sc_1", 3, 2, addZeroToSc, outputColors2)); cases.push_back(SpecConstantTwoValGraphicsCase("umod", " %i32 0", " %i32 0", "%i32", "UMod %sc_0 %sc_1", 1001, 500, addZeroToSc, outputColors2)); cases.push_back(SpecConstantTwoValGraphicsCase("bitwiseand", " %i32 0", " %i32 0", "%i32", "BitwiseAnd %sc_0 %sc_1", 0x33, 0x0d, addZeroToSc, outputColors2)); cases.push_back(SpecConstantTwoValGraphicsCase("bitwiseor", " %i32 0", " %i32 0", "%i32", "BitwiseOr %sc_0 %sc_1", 0, 1, addZeroToSc, outputColors2)); cases.push_back(SpecConstantTwoValGraphicsCase("bitwisexor", " %i32 0", " %i32 0", "%i32", "BitwiseXor %sc_0 %sc_1", 0x2e, 0x2f, addZeroToSc, outputColors2)); cases.push_back(SpecConstantTwoValGraphicsCase("shiftrightlogical", " %i32 0", " %i32 0", "%i32", "ShiftRightLogical %sc_0 %sc_1", 2, 1, addZeroToSc, outputColors2)); cases.push_back(SpecConstantTwoValGraphicsCase("shiftrightarithmetic", " %i32 0", " %i32 0", "%i32", "ShiftRightArithmetic %sc_0 %sc_1", -4, 2, addZeroToSc, outputColors0)); cases.push_back(SpecConstantTwoValGraphicsCase("shiftleftlogical", " %i32 0", " %i32 0", "%i32", "ShiftLeftLogical %sc_0 %sc_1", 1, 0, addZeroToSc, outputColors2)); // Shifts for other integer sizes. cases.push_back(SpecConstantTwoValGraphicsCase("shiftrightlogical_i64", " %i64 0", " %i64 0", "%i64", "ShiftRightLogical %sc_0 %sc_1", deInt64{2}, deInt64{1}, addZeroToSc32, outputColors2, (FLAG_I64 | FLAG_CONVERT))); cases.push_back(SpecConstantTwoValGraphicsCase("shiftrightarithmetic_i64", " %i64 0", " %i64 0", "%i64", "ShiftRightArithmetic %sc_0 %sc_1", deInt64{-4}, deInt64{2}, addZeroToSc32, outputColors0, (FLAG_I64 | FLAG_CONVERT))); cases.push_back(SpecConstantTwoValGraphicsCase("shiftleftlogical_i64", " %i64 0", " %i64 0", "%i64", "ShiftLeftLogical %sc_0 %sc_1", deInt64{1}, deInt64{0}, addZeroToSc32, outputColors2, (FLAG_I64 | FLAG_CONVERT))); cases.push_back(SpecConstantTwoValGraphicsCase("shiftrightlogical_i16", " %i16 0", " %i16 0", "%i16", "ShiftRightLogical %sc_0 %sc_1", deInt16{2}, deInt16{1}, addZeroToSc32, outputColors2, (FLAG_I16 | FLAG_CONVERT))); cases.push_back(SpecConstantTwoValGraphicsCase("shiftrightarithmetic_i16", " %i16 0", " %i16 0", "%i16", "ShiftRightArithmetic %sc_0 %sc_1", deInt16{-4}, deInt16{2}, addZeroToSc32, outputColors0, (FLAG_I16 | FLAG_CONVERT))); cases.push_back(SpecConstantTwoValGraphicsCase("shiftleftlogical_i16", " %i16 0", " %i16 0", "%i16", "ShiftLeftLogical %sc_0 %sc_1", deInt16{1}, deInt16{0}, addZeroToSc32, outputColors2, (FLAG_I16 | FLAG_CONVERT))); cases.push_back(SpecConstantTwoValGraphicsCase("shiftrightlogical_i8", " %i8 0", " %i8 0", "%i8", "ShiftRightLogical %sc_0 %sc_1", deInt8{2}, deInt8{1}, addZeroToSc32, outputColors2, (FLAG_I8 | FLAG_CONVERT))); cases.push_back(SpecConstantTwoValGraphicsCase("shiftrightarithmetic_i8", " %i8 0", " %i8 0", "%i8", "ShiftRightArithmetic %sc_0 %sc_1", deInt8{-4}, deInt8{2}, addZeroToSc32, outputColors0, (FLAG_I8 | FLAG_CONVERT))); cases.push_back(SpecConstantTwoValGraphicsCase("shiftleftlogical_i8", " %i8 0", " %i8 0", "%i8", "ShiftLeftLogical %sc_0 %sc_1", deInt8{1}, deInt8{0}, addZeroToSc32, outputColors2, (FLAG_I8 | FLAG_CONVERT))); // Shifts for other integer sizes but only in the shift amount. cases.push_back(SpecConstantTwoValGraphicsCase("shiftrightlogical_s_i64", " %i32 0", " %i64 0", "%i32", "ShiftRightLogical %sc_0 %sc_1", 2, deInt64{1}, addZeroToSc, outputColors2, (FLAG_I64))); cases.push_back(SpecConstantTwoValGraphicsCase("shiftrightarithmetic_s_i64", " %i32 0", " %i64 0", "%i32", "ShiftRightArithmetic %sc_0 %sc_1", -4, deInt64{2}, addZeroToSc, outputColors0, (FLAG_I64))); cases.push_back(SpecConstantTwoValGraphicsCase("shiftleftlogical_s_i64", " %i32 0", " %i64 0", "%i32", "ShiftLeftLogical %sc_0 %sc_1", 1, deInt64{0}, addZeroToSc, outputColors2, (FLAG_I64))); cases.push_back(SpecConstantTwoValGraphicsCase("shiftrightlogical_s_i16", " %i32 0", " %i16 0", "%i32", "ShiftRightLogical %sc_0 %sc_1", 2, deInt16{1}, addZeroToSc, outputColors2, (FLAG_I16))); cases.push_back(SpecConstantTwoValGraphicsCase("shiftrightarithmetic_s_i16", " %i32 0", " %i16 0", "%i32", "ShiftRightArithmetic %sc_0 %sc_1", -4, deInt16{2}, addZeroToSc, outputColors0, (FLAG_I16))); cases.push_back(SpecConstantTwoValGraphicsCase("shiftleftlogical_s_i16", " %i32 0", " %i16 0", "%i32", "ShiftLeftLogical %sc_0 %sc_1", 1, deInt16{0}, addZeroToSc, outputColors2, (FLAG_I16))); cases.push_back(SpecConstantTwoValGraphicsCase("shiftrightlogical_s_i8", " %i32 0", " %i8 0", "%i32", "ShiftRightLogical %sc_0 %sc_1", 2, deInt8{1}, addZeroToSc, outputColors2, (FLAG_I8))); cases.push_back(SpecConstantTwoValGraphicsCase("shiftrightarithmetic_s_i8", " %i32 0", " %i8 0", "%i32", "ShiftRightArithmetic %sc_0 %sc_1", -4, deInt8{2}, addZeroToSc, outputColors0, (FLAG_I8))); cases.push_back(SpecConstantTwoValGraphicsCase("shiftleftlogical_s_i8", " %i32 0", " %i8 0", "%i32", "ShiftLeftLogical %sc_0 %sc_1", 1, deInt8{0}, addZeroToSc, outputColors2, (FLAG_I8))); cases.push_back(SpecConstantTwoValGraphicsCase("slessthan", " %i32 0", " %i32 0", "%bool", "SLessThan %sc_0 %sc_1", -20, -10, selectTrueUsingSc, outputColors2)); cases.push_back(SpecConstantTwoValGraphicsCase("ulessthan", " %i32 0", " %i32 0", "%bool", "ULessThan %sc_0 %sc_1", 10, 20, selectTrueUsingSc, outputColors2)); cases.push_back(SpecConstantTwoValGraphicsCase("sgreaterthan", " %i32 0", " %i32 0", "%bool", "SGreaterThan %sc_0 %sc_1", -1000, 50, selectFalseUsingSc, outputColors2)); cases.push_back(SpecConstantTwoValGraphicsCase("ugreaterthan", " %i32 0", " %i32 0", "%bool", "UGreaterThan %sc_0 %sc_1", 10, 5, selectTrueUsingSc, outputColors2)); cases.push_back(SpecConstantTwoValGraphicsCase("slessthanequal", " %i32 0", " %i32 0", "%bool", "SLessThanEqual %sc_0 %sc_1", -10, -10, selectTrueUsingSc, outputColors2)); cases.push_back(SpecConstantTwoValGraphicsCase("ulessthanequal", " %i32 0", " %i32 0", "%bool", "ULessThanEqual %sc_0 %sc_1", 50, 100, selectTrueUsingSc, outputColors2)); cases.push_back(SpecConstantTwoValGraphicsCase("sgreaterthanequal", " %i32 0", " %i32 0", "%bool", "SGreaterThanEqual %sc_0 %sc_1", -1000, 50, selectFalseUsingSc, outputColors2)); cases.push_back(SpecConstantTwoValGraphicsCase("ugreaterthanequal", " %i32 0", " %i32 0", "%bool", "UGreaterThanEqual %sc_0 %sc_1", 10, 10, selectTrueUsingSc, outputColors2)); cases.push_back(SpecConstantTwoValGraphicsCase("iequal", " %i32 0", " %i32 0", "%bool", "IEqual %sc_0 %sc_1", 42, 24, selectFalseUsingSc, outputColors2)); cases.push_back(SpecConstantTwoValGraphicsCase("inotequal", " %i32 0", " %i32 0", "%bool", "INotEqual %sc_0 %sc_1", 42, 24, selectTrueUsingSc, outputColors2)); cases.push_back(SpecConstantTwoValGraphicsCase("logicaland", "True %bool", "True %bool", "%bool", "LogicalAnd %sc_0 %sc_1", 0, 1, selectFalseUsingSc, outputColors2)); cases.push_back(SpecConstantTwoValGraphicsCase("logicalor", "False %bool", "False %bool", "%bool", "LogicalOr %sc_0 %sc_1", 1, 0, selectTrueUsingSc, outputColors2)); cases.push_back(SpecConstantTwoValGraphicsCase("logicalequal", "True %bool", "True %bool", "%bool", "LogicalEqual %sc_0 %sc_1", 0, 1, selectFalseUsingSc, outputColors2)); cases.push_back(SpecConstantTwoValGraphicsCase("logicalnotequal", "False %bool", "False %bool", "%bool", "LogicalNotEqual %sc_0 %sc_1", 1, 0, selectTrueUsingSc, outputColors2)); cases.push_back(SpecConstantTwoValGraphicsCase("snegate", " %i32 0", " %i32 0", "%i32", "SNegate %sc_0", -1, 0, addZeroToSc, outputColors2)); cases.push_back(SpecConstantTwoValGraphicsCase("not", " %i32 0", " %i32 0", "%i32", "Not %sc_0", -2, 0, addZeroToSc, outputColors2)); cases.push_back(SpecConstantTwoValGraphicsCase("logicalnot", "False %bool", "False %bool", "%bool", "LogicalNot %sc_0", 1, 0, selectFalseUsingSc, outputColors2)); cases.push_back(SpecConstantTwoValGraphicsCase("select", "False %bool", " %i32 0", "%i32", "Select %sc_0 %sc_1 %c_i32_0", 1, 1, addZeroToSc, outputColors2)); cases.push_back(SpecConstantTwoValGraphicsCase("sconvert", " %i32 0", " %i32 0", "%i16", "SConvert %sc_0", -1, 0, addZeroToSc32, outputColors0, (FLAG_I16 | FLAG_CONVERT))); cases.push_back(SpecConstantTwoValGraphicsCase("fconvert", " %f32 0", " %f32 0", "%f64", "FConvert %sc_0", tcu::Float32(-1.0), tcu::Float32(0.0), addZeroToSc32, outputColors0, (FLAG_F64 | FLAG_CONVERT))); cases.push_back(SpecConstantTwoValGraphicsCase("fconvert16", " %f16 0", " %f16 0", "%f32", "FConvert %sc_0", tcu::Float16(-1.0), tcu::Float16(0.0), addZeroToSc32, outputColors0, (FLAG_F16 | FLAG_CONVERT))); // \todo[2015-12-1 antiagainst] OpQuantizeToF16 for (size_t caseNdx = 0; caseNdx < cases.size(); ++caseNdx) { map specializations; map fragments; SpecConstants specConstants; PushConstants noPushConstants; GraphicsResources noResources; GraphicsInterfaces noInterfaces; vector extensions; VulkanFeatures requiredFeatures; // Special SPIR-V code when using 16-bit integers. if (cases[caseNdx].caseFlags & FLAG_I16) { requiredFeatures.coreFeatures.shaderInt16 = VK_TRUE; fragments["capability"] += "OpCapability Int16\n"; // Adds 16-bit integer capability specializations["OPTYPE_DEFINITIONS"] += "%i16 = OpTypeInt 16 1\n"; // Adds 16-bit integer type if (cases[caseNdx].caseFlags & FLAG_CONVERT) specializations["TYPE_CONVERT"] += "%sc_op32 = OpSConvert %i32 %sc_op\n"; // Converts 16-bit integer to 32-bit integer } // Special SPIR-V code when using 64-bit integers. if (cases[caseNdx].caseFlags & FLAG_I64) { requiredFeatures.coreFeatures.shaderInt64 = VK_TRUE; fragments["capability"] += "OpCapability Int64\n"; // Adds 64-bit integer capability specializations["OPTYPE_DEFINITIONS"] += "%i64 = OpTypeInt 64 1\n"; // Adds 64-bit integer type if (cases[caseNdx].caseFlags & FLAG_CONVERT) specializations["TYPE_CONVERT"] += "%sc_op32 = OpSConvert %i32 %sc_op\n"; // Converts 64-bit integer to 32-bit integer } // Special SPIR-V code when using 64-bit floats. if (cases[caseNdx].caseFlags & FLAG_F64) { requiredFeatures.coreFeatures.shaderFloat64 = VK_TRUE; fragments["capability"] += "OpCapability Float64\n"; // Adds 64-bit float capability specializations["OPTYPE_DEFINITIONS"] += "%f64 = OpTypeFloat 64\n"; // Adds 64-bit float type if (cases[caseNdx].caseFlags & FLAG_CONVERT) specializations["TYPE_CONVERT"] += "%sc_op32 = OpConvertFToS %i32 %sc_op\n"; // Converts 64-bit float to 32-bit integer } // Extension needed for float16 and int8. if (cases[caseNdx].caseFlags & (FLAG_F16 | FLAG_I8)) extensions.push_back("VK_KHR_shader_float16_int8"); // Special SPIR-V code when using 16-bit floats. if (cases[caseNdx].caseFlags & FLAG_F16) { requiredFeatures.extFloat16Int8.shaderFloat16 = true; fragments["capability"] += "OpCapability Float16\n"; // Adds 16-bit float capability specializations["OPTYPE_DEFINITIONS"] += "%f16 = OpTypeFloat 16\n"; // Adds 16-bit float type if (cases[caseNdx].caseFlags & FLAG_CONVERT) specializations["TYPE_CONVERT"] += "%sc_op32 = OpConvertFToS %i32 %sc_op\n"; // Converts 16-bit float to 32-bit integer } // Special SPIR-V code when using 8-bit integers. if (cases[caseNdx].caseFlags & FLAG_I8) { requiredFeatures.extFloat16Int8.shaderInt8 = true; fragments["capability"] += "OpCapability Int8\n"; // Adds 8-bit integer capability specializations["OPTYPE_DEFINITIONS"] += "%i8 = OpTypeInt 8 1\n"; // Adds 8-bit integer type if (cases[caseNdx].caseFlags & FLAG_CONVERT) specializations["TYPE_CONVERT"] += "%sc_op32 = OpSConvert %i32 %sc_op\n"; // Converts 8-bit integer to 32-bit integer } specializations["SC_DEF0"] = cases[caseNdx].scDefinition0; specializations["SC_DEF1"] = cases[caseNdx].scDefinition1; specializations["SC_RESULT_TYPE"] = cases[caseNdx].scResultType; specializations["SC_OP"] = cases[caseNdx].scOperation; specializations["GEN_RESULT"] = cases[caseNdx].resultOperation; fragments["decoration"] = tcu::StringTemplate(decorations1).specialize(specializations); fragments["pre_main"] = tcu::StringTemplate(typesAndConstants1).specialize(specializations); fragments["testfun"] = tcu::StringTemplate(function1).specialize(specializations); cases[caseNdx].scActualValue0.appendTo(specConstants); cases[caseNdx].scActualValue1.appendTo(specConstants); createTestsForAllStages( cases[caseNdx].caseName, inputColors, cases[caseNdx].expectedColors, fragments, specConstants, noPushConstants, noResources, noInterfaces, extensions, requiredFeatures, group.get()); } const char decorations2[] = "OpDecorate %sc_0 SpecId 0\n" "OpDecorate %sc_1 SpecId 1\n" "OpDecorate %sc_2 SpecId 2\n"; const std::string typesAndConstants2 = "%vec3_0 = OpConstantComposite %v3i32 %c_i32_0 %c_i32_0 %c_i32_0\n" "%vec3_undef = OpUndef %v3i32\n" + getSpecConstantOpStructConstantsAndTypes() + getSpecConstantOpStructComposites() + "%sc_0 = OpSpecConstant %i32 0\n" "%sc_1 = OpSpecConstant %i32 0\n" "%sc_2 = OpSpecConstant %i32 0\n" + getSpecConstantOpStructConstBlock() + "%sc_vec3_0 = OpSpecConstantOp %v3i32 CompositeInsert %sc_0 %vec3_0 0\n" // (sc_0, 0, 0) "%sc_vec3_1 = OpSpecConstantOp %v3i32 CompositeInsert %sc_1 %vec3_0 1\n" // (0, sc_1, 0) "%sc_vec3_2 = OpSpecConstantOp %v3i32 CompositeInsert %sc_2 %vec3_0 2\n" // (0, 0, sc_2) "%sc_vec3_0_s = OpSpecConstantOp %v3i32 VectorShuffle %sc_vec3_0 %vec3_undef 0 0xFFFFFFFF 2\n" // (sc_0, ???, 0) "%sc_vec3_1_s = OpSpecConstantOp %v3i32 VectorShuffle %sc_vec3_1 %vec3_undef 0xFFFFFFFF 1 0\n" // (???, sc_1, 0) "%sc_vec3_2_s = OpSpecConstantOp %v3i32 VectorShuffle %vec3_undef %sc_vec3_2 5 0xFFFFFFFF 5\n" // (sc_2, ???, sc_2) "%sc_vec3_01 = OpSpecConstantOp %v3i32 VectorShuffle %sc_vec3_0_s %sc_vec3_1_s 1 0 4\n" // (0, sc_0, sc_1) "%sc_vec3_012 = OpSpecConstantOp %v3i32 VectorShuffle %sc_vec3_01 %sc_vec3_2_s 5 1 2\n" // (sc_2, sc_0, sc_1) "%sc_ext_0 = OpSpecConstantOp %i32 CompositeExtract %sc_vec3_012 0\n" // sc_2 "%sc_ext_1 = OpSpecConstantOp %i32 CompositeExtract %sc_vec3_012 1\n" // sc_0 "%sc_ext_2 = OpSpecConstantOp %i32 CompositeExtract %sc_vec3_012 2\n" // sc_1 "%sc_sub = OpSpecConstantOp %i32 ISub %sc_ext_0 %sc_ext_1\n" // (sc_2 - sc_0) "%sc_factor = OpSpecConstantOp %i32 IMul %sc_sub %sc_ext_2\n"; // (sc_2 - sc_0) * sc_1 const std::string function2 = "%test_code = OpFunction %v4f32 None %v4f32_v4f32_function\n" "%param = OpFunctionParameter %v4f32\n" "%label = OpLabel\n" "%result = OpVariable %fp_v4f32 Function\n" + getSpecConstantOpStructInstructions() + " OpStore %result %param\n" "%loc = OpAccessChain %fp_f32 %result %sc_final\n" "%val = OpLoad %f32 %loc\n" "%add = OpFAdd %f32 %val %c_f32_0_5\n" " OpStore %loc %add\n" "%ret = OpLoad %v4f32 %result\n" " OpReturnValue %ret\n" " OpFunctionEnd\n"; map fragments; SpecConstants specConstants; fragments["decoration"] = decorations2; fragments["pre_main"] = typesAndConstants2; fragments["testfun"] = function2; specConstants.append(56789); specConstants.append(-2); specConstants.append(56788); createTestsForAllStages("vector_related", inputColors, outputColors2, fragments, specConstants, group.get()); return group.release(); } tcu::TestCaseGroup* createOpPhiTests(tcu::TestContext& testCtx) { de::MovePtr group (new tcu::TestCaseGroup(testCtx, "opphi", "Test the OpPhi instruction")); RGBA inputColors[4]; RGBA outputColors1[4]; RGBA outputColors2[4]; RGBA outputColors3[4]; RGBA outputColors4[4]; map fragments1; map fragments2; map