libmpdec/literature/bignum.txt

7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ciBignum support (Fast Number Theoretic Transform or FNT):
7db96d56Sopenharmony_ci========================================================
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ciBignum arithmetic in libmpdec uses the scheme for fast convolution
7db96d56Sopenharmony_ciof integer sequences from:
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ciJ. M. Pollard: The fast Fourier transform in a finite field
7db96d56Sopenharmony_cihttp://www.ams.org/journals/mcom/1971-25-114/S0025-5718-1971-0301966-0/home.html
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ciThe transform in a finite field can be used for convolution in the same
7db96d56Sopenharmony_ciway as the Fourier Transform. The main advantages of the Number Theoretic
7db96d56Sopenharmony_ciTransform are that it is both exact and very memory efficient.
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ciConvolution in pseudo-code:
7db96d56Sopenharmony_ci~~~~~~~~~~~~~~~~~~~~~~~~~~~
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci  fnt_convolute(a, b):
7db96d56Sopenharmony_ci    x = fnt(a)                          # forward transform of a
7db96d56Sopenharmony_ci    y = fnt(b)                          # forward transform of b
7db96d56Sopenharmony_ci    z = pairwise multiply x[i] and y[i]
7db96d56Sopenharmony_ci    result = inv_fnt(z)                 # backward transform of z.
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ciExtending the maximum transform length (Chinese Remainder Theorem):
7db96d56Sopenharmony_ci-------------------------------------------------------------------
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ciThe maximum transform length is quite limited when using a single
7db96d56Sopenharmony_ciprime field. However, it is possible to use multiple primes and
7db96d56Sopenharmony_cirecover the result using the Chinese Remainder Theorem.
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ciMultiplication in pseudo-code:
7db96d56Sopenharmony_ci~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci  _mpd_fntmul(u, v):
7db96d56Sopenharmony_ci    c1 = fnt_convolute(u, v, P1)  # convolute modulo prime1
7db96d56Sopenharmony_ci    c2 = fnt_convolute(u, v, P2)  # convolute modulo prime2
7db96d56Sopenharmony_ci    c3 = fnt_convolute(u, v, P3)  # convolute modulo prime3
7db96d56Sopenharmony_ci    result = crt3(c1, c2, c3)     # Chinese Remainder Theorem
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ciOptimized transform functions:
7db96d56Sopenharmony_ci------------------------------
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ciThere are three different fnt() functions:
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci   std_fnt: "standard" decimation in frequency transform for array lengths
7db96d56Sopenharmony_ci            of 2**n. Performs well up to 1024 words.
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci   sixstep: Cache-friendly algorithm for array lengths of 2**n. Outperforms
7db96d56Sopenharmony_ci            std_fnt for large arrays.
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci   fourstep: Algorithm for array lengths of 3 * 2**n. Also cache friendly
7db96d56Sopenharmony_ci             in large parts.
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ciList of bignum-only files:
7db96d56Sopenharmony_ci--------------------------
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ciFunctions from these files are only used in _mpd_fntmul().
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci  umodarith.h    -> fast low level routines for unsigned modular arithmetic
7db96d56Sopenharmony_ci  numbertheory.c -> routines for setting up the FNT
7db96d56Sopenharmony_ci  difradix2.c    -> decimation in frequency transform, used as the
7db96d56Sopenharmony_ci                    "base case" by the following three files:
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci      fnt.c          -> standard transform for smaller arrays
7db96d56Sopenharmony_ci      sixstep.c      -> transform large arrays of length 2**n
7db96d56Sopenharmony_ci      fourstep.c     -> transform arrays of length 3 * 2**n
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci  convolute.c    -> do the actual fast convolution, using one of
7db96d56Sopenharmony_ci                    the three transform functions.
7db96d56Sopenharmony_ci  transpose.c    -> transpositions needed for the sixstep algorithm.
7db96d56Sopenharmony_ci  crt.c          -> Chinese Remainder Theorem: use information from three
7db96d56Sopenharmony_ci                    transforms modulo three different primes to get the
7db96d56Sopenharmony_ci                    final result.
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci
7db96d56Sopenharmony_ci