parisc/math-emu/sfsqrt.c

62306a36Sopenharmony_ci// SPDX-License-Identifier: GPL-2.0-or-later
62306a36Sopenharmony_ci/*
62306a36Sopenharmony_ci * Linux/PA-RISC Project (http://www.parisc-linux.org/)
62306a36Sopenharmony_ci *
62306a36Sopenharmony_ci * Floating-point emulation code
62306a36Sopenharmony_ci *  Copyright (C) 2001 Hewlett-Packard (Paul Bame) <bame@debian.org>
62306a36Sopenharmony_ci */
62306a36Sopenharmony_ci/*
62306a36Sopenharmony_ci * BEGIN_DESC
62306a36Sopenharmony_ci *
62306a36Sopenharmony_ci *  File:
62306a36Sopenharmony_ci *	@(#)	pa/spmath/sfsqrt.c		$Revision: 1.1 $
62306a36Sopenharmony_ci *
62306a36Sopenharmony_ci *  Purpose:
62306a36Sopenharmony_ci *	Single Floating-point Square Root
62306a36Sopenharmony_ci *
62306a36Sopenharmony_ci *  External Interfaces:
62306a36Sopenharmony_ci *	sgl_fsqrt(srcptr,nullptr,dstptr,status)
62306a36Sopenharmony_ci *
62306a36Sopenharmony_ci *  Internal Interfaces:
62306a36Sopenharmony_ci *
62306a36Sopenharmony_ci *  Theory:
62306a36Sopenharmony_ci *	<<please update with a overview of the operation of this file>>
62306a36Sopenharmony_ci *
62306a36Sopenharmony_ci * END_DESC
62306a36Sopenharmony_ci*/
62306a36Sopenharmony_ci
62306a36Sopenharmony_ci
62306a36Sopenharmony_ci#include "float.h"
62306a36Sopenharmony_ci#include "sgl_float.h"
62306a36Sopenharmony_ci
62306a36Sopenharmony_ci/*
62306a36Sopenharmony_ci *  Single Floating-point Square Root
62306a36Sopenharmony_ci */
62306a36Sopenharmony_ci
62306a36Sopenharmony_ci/*ARGSUSED*/
62306a36Sopenharmony_ciunsigned int
62306a36Sopenharmony_cisgl_fsqrt(
62306a36Sopenharmony_ci    sgl_floating_point *srcptr,
62306a36Sopenharmony_ci    unsigned int *nullptr,
62306a36Sopenharmony_ci    sgl_floating_point *dstptr,
62306a36Sopenharmony_ci    unsigned int *status)
62306a36Sopenharmony_ci{
62306a36Sopenharmony_ci	register unsigned int src, result;
62306a36Sopenharmony_ci	register int src_exponent;
62306a36Sopenharmony_ci	register unsigned int newbit, sum;
62306a36Sopenharmony_ci	register boolean guardbit = FALSE, even_exponent;
62306a36Sopenharmony_ci
62306a36Sopenharmony_ci	src = *srcptr;
62306a36Sopenharmony_ci        /*
62306a36Sopenharmony_ci         * check source operand for NaN or infinity
62306a36Sopenharmony_ci         */
62306a36Sopenharmony_ci        if ((src_exponent = Sgl_exponent(src)) == SGL_INFINITY_EXPONENT) {
62306a36Sopenharmony_ci                /*
62306a36Sopenharmony_ci                 * is signaling NaN?
62306a36Sopenharmony_ci                 */
62306a36Sopenharmony_ci                if (Sgl_isone_signaling(src)) {
62306a36Sopenharmony_ci                        /* trap if INVALIDTRAP enabled */
62306a36Sopenharmony_ci                        if (Is_invalidtrap_enabled()) return(INVALIDEXCEPTION);
62306a36Sopenharmony_ci                        /* make NaN quiet */
62306a36Sopenharmony_ci                        Set_invalidflag();
62306a36Sopenharmony_ci                        Sgl_set_quiet(src);
62306a36Sopenharmony_ci                }
62306a36Sopenharmony_ci                /*
62306a36Sopenharmony_ci                 * Return quiet NaN or positive infinity.
62306a36Sopenharmony_ci		 *  Fall through to negative test if negative infinity.
62306a36Sopenharmony_ci                 */
62306a36Sopenharmony_ci		if (Sgl_iszero_sign(src) || Sgl_isnotzero_mantissa(src)) {
62306a36Sopenharmony_ci                	*dstptr = src;
62306a36Sopenharmony_ci                	return(NOEXCEPTION);
62306a36Sopenharmony_ci		}
62306a36Sopenharmony_ci        }
62306a36Sopenharmony_ci
62306a36Sopenharmony_ci        /*
62306a36Sopenharmony_ci         * check for zero source operand
62306a36Sopenharmony_ci         */
62306a36Sopenharmony_ci	if (Sgl_iszero_exponentmantissa(src)) {
62306a36Sopenharmony_ci		*dstptr = src;
62306a36Sopenharmony_ci		return(NOEXCEPTION);
62306a36Sopenharmony_ci	}
62306a36Sopenharmony_ci
62306a36Sopenharmony_ci        /*
62306a36Sopenharmony_ci         * check for negative source operand
62306a36Sopenharmony_ci         */
62306a36Sopenharmony_ci	if (Sgl_isone_sign(src)) {
62306a36Sopenharmony_ci		/* trap if INVALIDTRAP enabled */
62306a36Sopenharmony_ci		if (Is_invalidtrap_enabled()) return(INVALIDEXCEPTION);
62306a36Sopenharmony_ci		/* make NaN quiet */
62306a36Sopenharmony_ci		Set_invalidflag();
62306a36Sopenharmony_ci		Sgl_makequietnan(src);
62306a36Sopenharmony_ci		*dstptr = src;
62306a36Sopenharmony_ci		return(NOEXCEPTION);
62306a36Sopenharmony_ci	}
62306a36Sopenharmony_ci
62306a36Sopenharmony_ci	/*
62306a36Sopenharmony_ci	 * Generate result
62306a36Sopenharmony_ci	 */
62306a36Sopenharmony_ci	if (src_exponent > 0) {
62306a36Sopenharmony_ci		even_exponent = Sgl_hidden(src);
62306a36Sopenharmony_ci		Sgl_clear_signexponent_set_hidden(src);
62306a36Sopenharmony_ci	}
62306a36Sopenharmony_ci	else {
62306a36Sopenharmony_ci		/* normalize operand */
62306a36Sopenharmony_ci		Sgl_clear_signexponent(src);
62306a36Sopenharmony_ci		src_exponent++;
62306a36Sopenharmony_ci		Sgl_normalize(src,src_exponent);
62306a36Sopenharmony_ci		even_exponent = src_exponent & 1;
62306a36Sopenharmony_ci	}
62306a36Sopenharmony_ci	if (even_exponent) {
62306a36Sopenharmony_ci		/* exponent is even */
62306a36Sopenharmony_ci		/* Add comment here.  Explain why odd exponent needs correction */
62306a36Sopenharmony_ci		Sgl_leftshiftby1(src);
62306a36Sopenharmony_ci	}
62306a36Sopenharmony_ci	/*
62306a36Sopenharmony_ci	 * Add comment here.  Explain following algorithm.
62306a36Sopenharmony_ci	 *
62306a36Sopenharmony_ci	 * Trust me, it works.
62306a36Sopenharmony_ci	 *
62306a36Sopenharmony_ci	 */
62306a36Sopenharmony_ci	Sgl_setzero(result);
62306a36Sopenharmony_ci	newbit = 1 << SGL_P;
62306a36Sopenharmony_ci	while (newbit && Sgl_isnotzero(src)) {
62306a36Sopenharmony_ci		Sgl_addition(result,newbit,sum);
62306a36Sopenharmony_ci		if(sum <= Sgl_all(src)) {
62306a36Sopenharmony_ci			/* update result */
62306a36Sopenharmony_ci			Sgl_addition(result,(newbit<<1),result);
62306a36Sopenharmony_ci			Sgl_subtract(src,sum,src);
62306a36Sopenharmony_ci		}
62306a36Sopenharmony_ci		Sgl_rightshiftby1(newbit);
62306a36Sopenharmony_ci		Sgl_leftshiftby1(src);
62306a36Sopenharmony_ci	}
62306a36Sopenharmony_ci	/* correct exponent for pre-shift */
62306a36Sopenharmony_ci	if (even_exponent) {
62306a36Sopenharmony_ci		Sgl_rightshiftby1(result);
62306a36Sopenharmony_ci	}
62306a36Sopenharmony_ci
62306a36Sopenharmony_ci	/* check for inexact */
62306a36Sopenharmony_ci	if (Sgl_isnotzero(src)) {
62306a36Sopenharmony_ci		if (!even_exponent && Sgl_islessthan(result,src))
62306a36Sopenharmony_ci			Sgl_increment(result);
62306a36Sopenharmony_ci		guardbit = Sgl_lowmantissa(result);
62306a36Sopenharmony_ci		Sgl_rightshiftby1(result);
62306a36Sopenharmony_ci
62306a36Sopenharmony_ci		/*  now round result  */
62306a36Sopenharmony_ci		switch (Rounding_mode()) {
62306a36Sopenharmony_ci		case ROUNDPLUS:
62306a36Sopenharmony_ci		     Sgl_increment(result);
62306a36Sopenharmony_ci		     break;
62306a36Sopenharmony_ci		case ROUNDNEAREST:
62306a36Sopenharmony_ci		     /* stickybit is always true, so guardbit
62306a36Sopenharmony_ci		      * is enough to determine rounding */
62306a36Sopenharmony_ci		     if (guardbit) {
62306a36Sopenharmony_ci			Sgl_increment(result);
62306a36Sopenharmony_ci		     }
62306a36Sopenharmony_ci		     break;
62306a36Sopenharmony_ci		}
62306a36Sopenharmony_ci		/* increment result exponent by 1 if mantissa overflowed */
62306a36Sopenharmony_ci		if (Sgl_isone_hiddenoverflow(result)) src_exponent+=2;
62306a36Sopenharmony_ci
62306a36Sopenharmony_ci		if (Is_inexacttrap_enabled()) {
62306a36Sopenharmony_ci			Sgl_set_exponent(result,
62306a36Sopenharmony_ci			 ((src_exponent-SGL_BIAS)>>1)+SGL_BIAS);
62306a36Sopenharmony_ci			*dstptr = result;
62306a36Sopenharmony_ci			return(INEXACTEXCEPTION);
62306a36Sopenharmony_ci		}
62306a36Sopenharmony_ci		else Set_inexactflag();
62306a36Sopenharmony_ci	}
62306a36Sopenharmony_ci	else {
62306a36Sopenharmony_ci		Sgl_rightshiftby1(result);
62306a36Sopenharmony_ci	}
62306a36Sopenharmony_ci	Sgl_set_exponent(result,((src_exponent-SGL_BIAS)>>1)+SGL_BIAS);
62306a36Sopenharmony_ci	*dstptr = result;
62306a36Sopenharmony_ci	return(NOEXCEPTION);
62306a36Sopenharmony_ci}