libmpdec/literature/mulmod-64.txt

7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci(* Copyright (c) 2011-2020 Stefan Krah. All rights reserved. *)
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci==========================================================================
7db96d56Sopenharmony_ci                Calculate (a * b) % p using special primes
7db96d56Sopenharmony_ci==========================================================================
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ciA description of the algorithm can be found in the apfloat manual by
7db96d56Sopenharmony_ciTommila [1].
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ciDefinitions:
7db96d56Sopenharmony_ci------------
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ciIn the whole document, "==" stands for "is congruent with".
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ciResult of a * b in terms of high/low words:
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci   (1) hi * 2**64 + lo = a * b
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ciSpecial primes:
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci   (2) p = 2**64 - z + 1, where z = 2**n
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ciSingle step modular reduction:
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci   (3) R(hi, lo) = hi * z - hi + lo
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ciStrategy:
7db96d56Sopenharmony_ci---------
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci   a) Set (hi, lo) to the result of a * b.
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci   b) Set (hi', lo') to the result of R(hi, lo).
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci   c) Repeat step b) until 0 <= hi' * 2**64 + lo' < 2*p.
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci   d) If the result is less than p, return lo'. Otherwise return lo' - p.
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ciThe reduction step b) preserves congruence:
7db96d56Sopenharmony_ci-------------------------------------------
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci    hi * 2**64 + lo == hi * z - hi + lo   (mod p)
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci    Proof:
7db96d56Sopenharmony_ci    ~~~~~~
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci       hi * 2**64 + lo = (2**64 - z + 1) * hi + z * hi - hi + lo
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci                       = p * hi               + z * hi - hi + lo
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci                       == z * hi - hi + lo   (mod p)
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ciMaximum numbers of step b):
7db96d56Sopenharmony_ci---------------------------
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci# To avoid unnecessary formalism, define:
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_cidef R(hi, lo, z):
7db96d56Sopenharmony_ci     return divmod(hi * z - hi + lo, 2**64)
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci# For simplicity, assume hi=2**64-1, lo=2**64-1 after the
7db96d56Sopenharmony_ci# initial multiplication a * b. This is of course impossible
7db96d56Sopenharmony_ci# but certainly covers all cases.
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci# Then, for p1:
7db96d56Sopenharmony_cihi=2**64-1; lo=2**64-1; z=2**32
7db96d56Sopenharmony_cip1 = 2**64 - z + 1
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_cihi, lo = R(hi, lo, z)    # First reduction
7db96d56Sopenharmony_cihi, lo = R(hi, lo, z)    # Second reduction
7db96d56Sopenharmony_cihi * 2**64 + lo < 2 * p1 # True
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci# For p2:
7db96d56Sopenharmony_cihi=2**64-1; lo=2**64-1; z=2**34
7db96d56Sopenharmony_cip2 = 2**64 - z + 1
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_cihi, lo = R(hi, lo, z)    # First reduction
7db96d56Sopenharmony_cihi, lo = R(hi, lo, z)    # Second reduction
7db96d56Sopenharmony_cihi, lo = R(hi, lo, z)    # Third reduction
7db96d56Sopenharmony_cihi * 2**64 + lo < 2 * p2 # True
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci# For p3:
7db96d56Sopenharmony_cihi=2**64-1; lo=2**64-1; z=2**40
7db96d56Sopenharmony_cip3 = 2**64 - z + 1
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_cihi, lo = R(hi, lo, z)    # First reduction
7db96d56Sopenharmony_cihi, lo = R(hi, lo, z)    # Second reduction
7db96d56Sopenharmony_cihi, lo = R(hi, lo, z)    # Third reduction
7db96d56Sopenharmony_cihi * 2**64 + lo < 2 * p3 # True
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ciStep d) preserves congruence and yields a result < p:
7db96d56Sopenharmony_ci-----------------------------------------------------
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci   Case hi = 0:
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci       Case lo < p: trivial.
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci       Case lo >= p:
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci          lo == lo - p   (mod p)             # result is congruent
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci          p <= lo < 2*p  ->  0 <= lo - p < p # result is in the correct range
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci   Case hi = 1:
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci       p < 2**64 /\ 2**64 + lo < 2*p  ->  lo < p  # lo is always less than p
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci       2**64 + lo == 2**64 + (lo - p)   (mod p)   # result is congruent
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci                  = lo - p   # exactly the same value as the previous RHS
7db96d56Sopenharmony_ci                             # in uint64_t arithmetic.
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci       p < 2**64 + lo < 2*p  ->  0 < 2**64 + (lo - p) < p  # correct range
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci[1]  http://www.apfloat.org/apfloat/2.40/apfloat.pdf
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci