astc-encoder/Source/astcenc_mathlib.h

cc1dc7a3Sopenharmony_ci// SPDX-License-Identifier: Apache-2.0
cc1dc7a3Sopenharmony_ci// ----------------------------------------------------------------------------
cc1dc7a3Sopenharmony_ci// Copyright 2011-2024 Arm Limited
cc1dc7a3Sopenharmony_ci//
cc1dc7a3Sopenharmony_ci// Licensed under the Apache License, Version 2.0 (the "License"); you may not
cc1dc7a3Sopenharmony_ci// use this file except in compliance with the License. You may obtain a copy
cc1dc7a3Sopenharmony_ci// of the License at:
cc1dc7a3Sopenharmony_ci//
cc1dc7a3Sopenharmony_ci//     http://www.apache.org/licenses/LICENSE-2.0
cc1dc7a3Sopenharmony_ci//
cc1dc7a3Sopenharmony_ci// Unless required by applicable law or agreed to in writing, software
cc1dc7a3Sopenharmony_ci// distributed under the License is distributed on an "AS IS" BASIS, WITHOUT
cc1dc7a3Sopenharmony_ci// WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. See the
cc1dc7a3Sopenharmony_ci// License for the specific language governing permissions and limitations
cc1dc7a3Sopenharmony_ci// under the License.
cc1dc7a3Sopenharmony_ci// ----------------------------------------------------------------------------
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci/*
cc1dc7a3Sopenharmony_ci * This module implements a variety of mathematical data types and library
cc1dc7a3Sopenharmony_ci * functions used by the codec.
cc1dc7a3Sopenharmony_ci */
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci#ifndef ASTC_MATHLIB_H_INCLUDED
cc1dc7a3Sopenharmony_ci#define ASTC_MATHLIB_H_INCLUDED
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci#include <cassert>
cc1dc7a3Sopenharmony_ci#include <cstdint>
cc1dc7a3Sopenharmony_ci#include <cmath>
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci#ifndef ASTCENC_POPCNT
cc1dc7a3Sopenharmony_ci  #if defined(__POPCNT__)
cc1dc7a3Sopenharmony_ci    #define ASTCENC_POPCNT 1
cc1dc7a3Sopenharmony_ci  #else
cc1dc7a3Sopenharmony_ci    #define ASTCENC_POPCNT 0
cc1dc7a3Sopenharmony_ci  #endif
cc1dc7a3Sopenharmony_ci#endif
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci#ifndef ASTCENC_F16C
cc1dc7a3Sopenharmony_ci  #if defined(__F16C__)
cc1dc7a3Sopenharmony_ci    #define ASTCENC_F16C 1
cc1dc7a3Sopenharmony_ci  #else
cc1dc7a3Sopenharmony_ci    #define ASTCENC_F16C 0
cc1dc7a3Sopenharmony_ci  #endif
cc1dc7a3Sopenharmony_ci#endif
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci#ifndef ASTCENC_SSE
cc1dc7a3Sopenharmony_ci  #if defined(__SSE4_2__)
cc1dc7a3Sopenharmony_ci    #define ASTCENC_SSE 42
cc1dc7a3Sopenharmony_ci  #elif defined(__SSE4_1__)
cc1dc7a3Sopenharmony_ci    #define ASTCENC_SSE 41
cc1dc7a3Sopenharmony_ci  #elif defined(__SSE2__)
cc1dc7a3Sopenharmony_ci    #define ASTCENC_SSE 20
cc1dc7a3Sopenharmony_ci  #else
cc1dc7a3Sopenharmony_ci    #define ASTCENC_SSE 0
cc1dc7a3Sopenharmony_ci  #endif
cc1dc7a3Sopenharmony_ci#endif
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci#ifndef ASTCENC_AVX
cc1dc7a3Sopenharmony_ci  #if defined(__AVX2__)
cc1dc7a3Sopenharmony_ci    #define ASTCENC_AVX 2
cc1dc7a3Sopenharmony_ci  #elif defined(__AVX__)
cc1dc7a3Sopenharmony_ci    #define ASTCENC_AVX 1
cc1dc7a3Sopenharmony_ci  #else
cc1dc7a3Sopenharmony_ci    #define ASTCENC_AVX 0
cc1dc7a3Sopenharmony_ci  #endif
cc1dc7a3Sopenharmony_ci#endif
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci#ifndef ASTCENC_NEON
cc1dc7a3Sopenharmony_ci  #if defined(__aarch64__)
cc1dc7a3Sopenharmony_ci    #define ASTCENC_NEON 1
cc1dc7a3Sopenharmony_ci  #else
cc1dc7a3Sopenharmony_ci    #define ASTCENC_NEON 0
cc1dc7a3Sopenharmony_ci  #endif
cc1dc7a3Sopenharmony_ci#endif
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci// Force vector-sized SIMD alignment
cc1dc7a3Sopenharmony_ci#if ASTCENC_AVX
cc1dc7a3Sopenharmony_ci  #define ASTCENC_VECALIGN 32
cc1dc7a3Sopenharmony_ci#elif ASTCENC_SSE || ASTCENC_NEON
cc1dc7a3Sopenharmony_ci  #define ASTCENC_VECALIGN 16
cc1dc7a3Sopenharmony_ci// Use default alignment for non-SIMD builds
cc1dc7a3Sopenharmony_ci#else
cc1dc7a3Sopenharmony_ci  #define ASTCENC_VECALIGN 0
cc1dc7a3Sopenharmony_ci#endif
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci// C++11 states that alignas(0) should be ignored but GCC doesn't do
cc1dc7a3Sopenharmony_ci// this on some versions, so workaround and avoid emitting alignas(0)
cc1dc7a3Sopenharmony_ci#if ASTCENC_VECALIGN > 0
cc1dc7a3Sopenharmony_ci	#define ASTCENC_ALIGNAS alignas(ASTCENC_VECALIGN)
cc1dc7a3Sopenharmony_ci#else
cc1dc7a3Sopenharmony_ci	#define ASTCENC_ALIGNAS
cc1dc7a3Sopenharmony_ci#endif
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci#if ASTCENC_SSE != 0 || ASTCENC_AVX != 0 || ASTCENC_POPCNT != 0
cc1dc7a3Sopenharmony_ci	#include <immintrin.h>
cc1dc7a3Sopenharmony_ci#endif
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci/* ============================================================================
cc1dc7a3Sopenharmony_ci  Fast math library; note that many of the higher-order functions in this set
cc1dc7a3Sopenharmony_ci  use approximations which are less accurate, but faster, than <cmath> standard
cc1dc7a3Sopenharmony_ci  library equivalents.
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci  Note: Many of these are not necessarily faster than simple C versions when
cc1dc7a3Sopenharmony_ci  used on a single scalar value, but are included for testing purposes as most
cc1dc7a3Sopenharmony_ci  have an option based on SSE intrinsics and therefore provide an obvious route
cc1dc7a3Sopenharmony_ci  to future vectorization.
cc1dc7a3Sopenharmony_ci============================================================================ */
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci// Union for manipulation of float bit patterns
cc1dc7a3Sopenharmony_citypedef union
cc1dc7a3Sopenharmony_ci{
cc1dc7a3Sopenharmony_ci	uint32_t u;
cc1dc7a3Sopenharmony_ci	int32_t s;
cc1dc7a3Sopenharmony_ci	float f;
cc1dc7a3Sopenharmony_ci} if32;
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci// These are namespaced to avoid colliding with C standard library functions.
cc1dc7a3Sopenharmony_cinamespace astc
cc1dc7a3Sopenharmony_ci{
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_cistatic const float PI          = 3.14159265358979323846f;
cc1dc7a3Sopenharmony_cistatic const float PI_OVER_TWO = 1.57079632679489661923f;
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci/**
cc1dc7a3Sopenharmony_ci * @brief SP float absolute value.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * @param v   The value to make absolute.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * @return The absolute value.
cc1dc7a3Sopenharmony_ci */
cc1dc7a3Sopenharmony_cistatic inline float fabs(float v)
cc1dc7a3Sopenharmony_ci{
cc1dc7a3Sopenharmony_ci	return std::fabs(v);
cc1dc7a3Sopenharmony_ci}
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci/**
cc1dc7a3Sopenharmony_ci * @brief Test if a float value is a nan.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * @param v    The value test.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * @return Zero is not a NaN, non-zero otherwise.
cc1dc7a3Sopenharmony_ci */
cc1dc7a3Sopenharmony_cistatic inline bool isnan(float v)
cc1dc7a3Sopenharmony_ci{
cc1dc7a3Sopenharmony_ci	return v != v;
cc1dc7a3Sopenharmony_ci}
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci/**
cc1dc7a3Sopenharmony_ci * @brief Return the minimum of two values.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * For floats, NaNs are turned into @c q.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * @param p   The first value to compare.
cc1dc7a3Sopenharmony_ci * @param q   The second value to compare.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * @return The smallest value.
cc1dc7a3Sopenharmony_ci */
cc1dc7a3Sopenharmony_citemplate<typename T>
cc1dc7a3Sopenharmony_cistatic inline T min(T p, T q)
cc1dc7a3Sopenharmony_ci{
cc1dc7a3Sopenharmony_ci	return p < q ? p : q;
cc1dc7a3Sopenharmony_ci}
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci/**
cc1dc7a3Sopenharmony_ci * @brief Return the minimum of three values.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * For floats, NaNs are turned into @c r.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * @param p   The first value to compare.
cc1dc7a3Sopenharmony_ci * @param q   The second value to compare.
cc1dc7a3Sopenharmony_ci * @param r   The third value to compare.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * @return The smallest value.
cc1dc7a3Sopenharmony_ci */
cc1dc7a3Sopenharmony_citemplate<typename T>
cc1dc7a3Sopenharmony_cistatic inline T min(T p, T q, T r)
cc1dc7a3Sopenharmony_ci{
cc1dc7a3Sopenharmony_ci	return min(min(p, q), r);
cc1dc7a3Sopenharmony_ci}
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci/**
cc1dc7a3Sopenharmony_ci * @brief Return the minimum of four values.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * For floats, NaNs are turned into @c s.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * @param p   The first value to compare.
cc1dc7a3Sopenharmony_ci * @param q   The second value to compare.
cc1dc7a3Sopenharmony_ci * @param r   The third value to compare.
cc1dc7a3Sopenharmony_ci * @param s   The fourth value to compare.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * @return The smallest value.
cc1dc7a3Sopenharmony_ci */
cc1dc7a3Sopenharmony_citemplate<typename T>
cc1dc7a3Sopenharmony_cistatic inline T min(T p, T q, T r, T s)
cc1dc7a3Sopenharmony_ci{
cc1dc7a3Sopenharmony_ci	return min(min(p, q), min(r, s));
cc1dc7a3Sopenharmony_ci}
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci/**
cc1dc7a3Sopenharmony_ci * @brief Return the maximum of two values.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * For floats, NaNs are turned into @c q.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * @param p   The first value to compare.
cc1dc7a3Sopenharmony_ci * @param q   The second value to compare.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * @return The largest value.
cc1dc7a3Sopenharmony_ci */
cc1dc7a3Sopenharmony_citemplate<typename T>
cc1dc7a3Sopenharmony_cistatic inline T max(T p, T q)
cc1dc7a3Sopenharmony_ci{
cc1dc7a3Sopenharmony_ci	return p > q ? p : q;
cc1dc7a3Sopenharmony_ci}
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci/**
cc1dc7a3Sopenharmony_ci * @brief Return the maximum of three values.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * For floats, NaNs are turned into @c r.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * @param p   The first value to compare.
cc1dc7a3Sopenharmony_ci * @param q   The second value to compare.
cc1dc7a3Sopenharmony_ci * @param r   The third value to compare.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * @return The largest value.
cc1dc7a3Sopenharmony_ci */
cc1dc7a3Sopenharmony_citemplate<typename T>
cc1dc7a3Sopenharmony_cistatic inline T max(T p, T q, T r)
cc1dc7a3Sopenharmony_ci{
cc1dc7a3Sopenharmony_ci	return max(max(p, q), r);
cc1dc7a3Sopenharmony_ci}
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci/**
cc1dc7a3Sopenharmony_ci * @brief Return the maximum of four values.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * For floats, NaNs are turned into @c s.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * @param p   The first value to compare.
cc1dc7a3Sopenharmony_ci * @param q   The second value to compare.
cc1dc7a3Sopenharmony_ci * @param r   The third value to compare.
cc1dc7a3Sopenharmony_ci * @param s   The fourth value to compare.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * @return The largest value.
cc1dc7a3Sopenharmony_ci */
cc1dc7a3Sopenharmony_citemplate<typename T>
cc1dc7a3Sopenharmony_cistatic inline T max(T p, T q, T r, T s)
cc1dc7a3Sopenharmony_ci{
cc1dc7a3Sopenharmony_ci	return max(max(p, q), max(r, s));
cc1dc7a3Sopenharmony_ci}
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci/**
cc1dc7a3Sopenharmony_ci * @brief Clamp a value value between @c mn and @c mx.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * For floats, NaNs are turned into @c mn.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * @param v      The value to clamp.
cc1dc7a3Sopenharmony_ci * @param mn     The min value (inclusive).
cc1dc7a3Sopenharmony_ci * @param mx     The max value (inclusive).
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * @return The clamped value.
cc1dc7a3Sopenharmony_ci */
cc1dc7a3Sopenharmony_citemplate<typename T>
cc1dc7a3Sopenharmony_ciinline T clamp(T v, T mn, T mx)
cc1dc7a3Sopenharmony_ci{
cc1dc7a3Sopenharmony_ci	// Do not reorder; correct NaN handling relies on the fact that comparison
cc1dc7a3Sopenharmony_ci	// with NaN returns false and will fall-though to the "min" value.
cc1dc7a3Sopenharmony_ci	if (v > mx) return mx;
cc1dc7a3Sopenharmony_ci	if (v > mn) return v;
cc1dc7a3Sopenharmony_ci	return mn;
cc1dc7a3Sopenharmony_ci}
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci/**
cc1dc7a3Sopenharmony_ci * @brief Clamp a float value between 0.0f and 1.0f.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * NaNs are turned into 0.0f.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * @param v   The value to clamp.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * @return The clamped value.
cc1dc7a3Sopenharmony_ci */
cc1dc7a3Sopenharmony_cistatic inline float clamp1f(float v)
cc1dc7a3Sopenharmony_ci{
cc1dc7a3Sopenharmony_ci	return astc::clamp(v, 0.0f, 1.0f);
cc1dc7a3Sopenharmony_ci}
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci/**
cc1dc7a3Sopenharmony_ci * @brief Clamp a float value between 0.0f and 255.0f.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * NaNs are turned into 0.0f.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * @param v  The value to clamp.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * @return The clamped value.
cc1dc7a3Sopenharmony_ci */
cc1dc7a3Sopenharmony_cistatic inline float clamp255f(float v)
cc1dc7a3Sopenharmony_ci{
cc1dc7a3Sopenharmony_ci	return astc::clamp(v, 0.0f, 255.0f);
cc1dc7a3Sopenharmony_ci}
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci/**
cc1dc7a3Sopenharmony_ci * @brief SP float round-down.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * @param v   The value to round.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * @return The rounded value.
cc1dc7a3Sopenharmony_ci */
cc1dc7a3Sopenharmony_cistatic inline float flt_rd(float v)
cc1dc7a3Sopenharmony_ci{
cc1dc7a3Sopenharmony_ci	return std::floor(v);
cc1dc7a3Sopenharmony_ci}
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci/**
cc1dc7a3Sopenharmony_ci * @brief SP float round-to-nearest and convert to integer.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * @param v   The value to round.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * @return The rounded value.
cc1dc7a3Sopenharmony_ci */
cc1dc7a3Sopenharmony_cistatic inline int flt2int_rtn(float v)
cc1dc7a3Sopenharmony_ci{
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci	return static_cast<int>(v + 0.5f);
cc1dc7a3Sopenharmony_ci}
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci/**
cc1dc7a3Sopenharmony_ci * @brief SP float round down and convert to integer.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * @param v   The value to round.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * @return The rounded value.
cc1dc7a3Sopenharmony_ci */
cc1dc7a3Sopenharmony_cistatic inline int flt2int_rd(float v)
cc1dc7a3Sopenharmony_ci{
cc1dc7a3Sopenharmony_ci	return static_cast<int>(v);
cc1dc7a3Sopenharmony_ci}
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci/**
cc1dc7a3Sopenharmony_ci * @brief SP float bit-interpreted as an integer.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * @param v   The value to bitcast.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * @return The converted value.
cc1dc7a3Sopenharmony_ci */
cc1dc7a3Sopenharmony_cistatic inline int float_as_int(float v)
cc1dc7a3Sopenharmony_ci{
cc1dc7a3Sopenharmony_ci	union { int a; float b; } u;
cc1dc7a3Sopenharmony_ci	u.b = v;
cc1dc7a3Sopenharmony_ci	return u.a;
cc1dc7a3Sopenharmony_ci}
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci/**
cc1dc7a3Sopenharmony_ci * @brief Integer bit-interpreted as an SP float.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * @param v   The value to bitcast.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * @return The converted value.
cc1dc7a3Sopenharmony_ci */
cc1dc7a3Sopenharmony_cistatic inline float int_as_float(int v)
cc1dc7a3Sopenharmony_ci{
cc1dc7a3Sopenharmony_ci	union { int a; float b; } u;
cc1dc7a3Sopenharmony_ci	u.a = v;
cc1dc7a3Sopenharmony_ci	return u.b;
cc1dc7a3Sopenharmony_ci}
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci/**
cc1dc7a3Sopenharmony_ci * @brief Fast approximation of 1.0 / sqrt(val).
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * @param v   The input value.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * @return The approximated result.
cc1dc7a3Sopenharmony_ci */
cc1dc7a3Sopenharmony_cistatic inline float rsqrt(float v)
cc1dc7a3Sopenharmony_ci{
cc1dc7a3Sopenharmony_ci	return 1.0f / std::sqrt(v);
cc1dc7a3Sopenharmony_ci}
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci/**
cc1dc7a3Sopenharmony_ci * @brief Fast approximation of sqrt(val).
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * @param v   The input value.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * @return The approximated result.
cc1dc7a3Sopenharmony_ci */
cc1dc7a3Sopenharmony_cistatic inline float sqrt(float v)
cc1dc7a3Sopenharmony_ci{
cc1dc7a3Sopenharmony_ci	return std::sqrt(v);
cc1dc7a3Sopenharmony_ci}
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci/**
cc1dc7a3Sopenharmony_ci * @brief Extract mantissa and exponent of a float value.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * @param      v      The input value.
cc1dc7a3Sopenharmony_ci * @param[out] expo   The output exponent.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * @return The mantissa.
cc1dc7a3Sopenharmony_ci */
cc1dc7a3Sopenharmony_cistatic inline float frexp(float v, int* expo)
cc1dc7a3Sopenharmony_ci{
cc1dc7a3Sopenharmony_ci	if32 p;
cc1dc7a3Sopenharmony_ci	p.f = v;
cc1dc7a3Sopenharmony_ci	*expo = ((p.u >> 23) & 0xFF) - 126;
cc1dc7a3Sopenharmony_ci	p.u = (p.u & 0x807fffff) | 0x3f000000;
cc1dc7a3Sopenharmony_ci	return p.f;
cc1dc7a3Sopenharmony_ci}
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci/**
cc1dc7a3Sopenharmony_ci * @brief Initialize the seed structure for a random number generator.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * Important note: For the purposes of ASTC we want sets of random numbers to
cc1dc7a3Sopenharmony_ci * use the codec, but we want the same seed value across instances and threads
cc1dc7a3Sopenharmony_ci * to ensure that image output is stable across compressor runs and across
cc1dc7a3Sopenharmony_ci * platforms. Every PRNG created by this call will therefore return the same
cc1dc7a3Sopenharmony_ci * sequence of values ...
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * @param state The state structure to initialize.
cc1dc7a3Sopenharmony_ci */
cc1dc7a3Sopenharmony_civoid rand_init(uint64_t state[2]);
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci/**
cc1dc7a3Sopenharmony_ci * @brief Return the next random number from the generator.
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * This RNG is an implementation of the "xoroshoro-128+ 1.0" PRNG, based on the
cc1dc7a3Sopenharmony_ci * public-domain implementation given by David Blackman & Sebastiano Vigna at
cc1dc7a3Sopenharmony_ci * http://vigna.di.unimi.it/xorshift/xoroshiro128plus.c
cc1dc7a3Sopenharmony_ci *
cc1dc7a3Sopenharmony_ci * @param state The state structure to use/update.
cc1dc7a3Sopenharmony_ci */
cc1dc7a3Sopenharmony_ciuint64_t rand(uint64_t state[2]);
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci}
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci/* ============================================================================
cc1dc7a3Sopenharmony_ci  Softfloat library with fp32 and fp16 conversion functionality.
cc1dc7a3Sopenharmony_ci============================================================================ */
cc1dc7a3Sopenharmony_ci#if (ASTCENC_F16C == 0) && (ASTCENC_NEON == 0)
cc1dc7a3Sopenharmony_ci	/* narrowing float->float conversions */
cc1dc7a3Sopenharmony_ci	uint16_t float_to_sf16(float val);
cc1dc7a3Sopenharmony_ci	float sf16_to_float(uint16_t val);
cc1dc7a3Sopenharmony_ci#endif
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci/*********************************
cc1dc7a3Sopenharmony_ci  Vector library
cc1dc7a3Sopenharmony_ci*********************************/
cc1dc7a3Sopenharmony_ci#include "astcenc_vecmathlib.h"
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci/*********************************
cc1dc7a3Sopenharmony_ci  Declaration of line types
cc1dc7a3Sopenharmony_ci*********************************/
cc1dc7a3Sopenharmony_ci// parametric line, 2D: The line is given by line = a + b * t.
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_cistruct line2
cc1dc7a3Sopenharmony_ci{
cc1dc7a3Sopenharmony_ci	vfloat4 a;
cc1dc7a3Sopenharmony_ci	vfloat4 b;
cc1dc7a3Sopenharmony_ci};
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci// parametric line, 3D
cc1dc7a3Sopenharmony_cistruct line3
cc1dc7a3Sopenharmony_ci{
cc1dc7a3Sopenharmony_ci	vfloat4 a;
cc1dc7a3Sopenharmony_ci	vfloat4 b;
cc1dc7a3Sopenharmony_ci};
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_cistruct line4
cc1dc7a3Sopenharmony_ci{
cc1dc7a3Sopenharmony_ci	vfloat4 a;
cc1dc7a3Sopenharmony_ci	vfloat4 b;
cc1dc7a3Sopenharmony_ci};
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_cistruct processed_line2
cc1dc7a3Sopenharmony_ci{
cc1dc7a3Sopenharmony_ci	vfloat4 amod;
cc1dc7a3Sopenharmony_ci	vfloat4 bs;
cc1dc7a3Sopenharmony_ci};
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_cistruct processed_line3
cc1dc7a3Sopenharmony_ci{
cc1dc7a3Sopenharmony_ci	vfloat4 amod;
cc1dc7a3Sopenharmony_ci	vfloat4 bs;
cc1dc7a3Sopenharmony_ci};
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_cistruct processed_line4
cc1dc7a3Sopenharmony_ci{
cc1dc7a3Sopenharmony_ci	vfloat4 amod;
cc1dc7a3Sopenharmony_ci	vfloat4 bs;
cc1dc7a3Sopenharmony_ci};
cc1dc7a3Sopenharmony_ci
cc1dc7a3Sopenharmony_ci#endif