~louis/ubuntu/trusty/clamav/lp799623_fix

~louis/ubuntu/trusty/clamav/lp799623_fix_logrotate

Viewing changes to libclamav/tomsfastmath/mont/fp_montgomery_reduce.c

Committer: Package Import Robot
Author(s): Scott Kitterman
Date: 2014-02-01 11:06:17 UTC
mfrom: (0.35.37 sid)
Revision ID: package-import@ubuntu.com-20140201110617-33h2xxk09dep0ui4

Tags: 0.98.1+dfsg-1ubuntu1

* Merge from Debian unstable.  Remaining changes:
  - Drop build-dep on electric-fence (in Universe)
  - Add apparmor profiles for clamd and freshclam along with maintainer
    script changes
  - Add autopkgtest

files added:
clamd/fan-syscalllib.h

clamd/fan.c

clamd/fan.h

configure.ac

debian/split-tarball.sh

docs/html/img6.png

docs/html/node63.html

docs/html/node64.html

docs/html/node65.html

docs/html/node66.html

docs/html/node67.html

docs/html/node68.html

etc/clamav-milter.conf.sample

etc/clamd.conf.sample

etc/freshclam.conf.sample

freshclam/freshclamcodes.h

libclamav/7z/7z.h

libclamav/7z/7zAlloc.c

libclamav/7z/7zAlloc.h

libclamav/7z/7zBuf2.c

libclamav/7z/7zCrcOpt.c

libclamav/7z/7zDec.c

libclamav/7z/7zIn.c

libclamav/7z/7zVersion.h

libclamav/7z/Alloc.h

libclamav/7z/BraIA64.c

libclamav/7z/CpuArch.c

libclamav/7z/Delta.c

libclamav/7z/Delta.h

libclamav/7z/Lzma2Dec.c

libclamav/7z/Lzma2Dec.h

libclamav/7z/Ppmd.h

libclamav/7z/Ppmd7.c

libclamav/7z/Ppmd7.h

libclamav/7z/Ppmd7Dec.c

libclamav/7z/RotateDefs.h

libclamav/7z/Sha256.h

libclamav/7z/Xz.c

libclamav/7z/Xz.h

libclamav/7z/XzCrc64.c

libclamav/7z/XzCrc64.h

libclamav/7z/XzDec.c

libclamav/7z/XzIn.c

libclamav/7z_iface.c

libclamav/7z_iface.h

libclamav/adc.c

libclamav/adc.h

libclamav/asn1.c

libclamav/asn1.h

libclamav/bignum_fast.h

libclamav/c++/llvm30_compat.h

libclamav/crtmgr.c

libclamav/crtmgr.h

libclamav/dmg.c

libclamav/dmg.h

libclamav/hfsplus.c

libclamav/hfsplus.h

libclamav/iso9660.c

libclamav/iso9660.h

libclamav/jpeg.c

libclamav/jpeg.h

libclamav/png.c

libclamav/png.h

libclamav/rijndael.c

libclamav/rijndael.h

libclamav/sf_base64decode.c

libclamav/sf_base64decode.h

libclamav/swf.c

libclamav/swf.h

libclamav/tomsfastmath

libclamav/tomsfastmath/addsub

libclamav/tomsfastmath/addsub/fp_add.c

libclamav/tomsfastmath/addsub/fp_add_d.c

libclamav/tomsfastmath/addsub/fp_addmod.c

libclamav/tomsfastmath/addsub/fp_cmp.c

libclamav/tomsfastmath/addsub/fp_cmp_d.c

libclamav/tomsfastmath/addsub/fp_cmp_mag.c

libclamav/tomsfastmath/addsub/fp_sub.c

libclamav/tomsfastmath/addsub/fp_sub_d.c

libclamav/tomsfastmath/addsub/fp_submod.c

libclamav/tomsfastmath/addsub/s_fp_add.c

libclamav/tomsfastmath/addsub/s_fp_sub.c

libclamav/tomsfastmath/bin

libclamav/tomsfastmath/bin/fp_radix_size.c

libclamav/tomsfastmath/bin/fp_read_radix.c

libclamav/tomsfastmath/bin/fp_read_signed_bin.c

libclamav/tomsfastmath/bin/fp_read_unsigned_bin.c

libclamav/tomsfastmath/bin/fp_reverse.c

libclamav/tomsfastmath/bin/fp_s_rmap.c

libclamav/tomsfastmath/bin/fp_signed_bin_size.c

libclamav/tomsfastmath/bin/fp_to_signed_bin.c

libclamav/tomsfastmath/bin/fp_to_unsigned_bin.c

libclamav/tomsfastmath/bin/fp_toradix.c

libclamav/tomsfastmath/bin/fp_toradix_n.c

libclamav/tomsfastmath/bin/fp_unsigned_bin_size.c

libclamav/tomsfastmath/bit

libclamav/tomsfastmath/bit/fp_cnt_lsb.c

libclamav/tomsfastmath/bit/fp_count_bits.c

libclamav/tomsfastmath/bit/fp_div_2.c

libclamav/tomsfastmath/bit/fp_div_2d.c

libclamav/tomsfastmath/bit/fp_lshd.c

libclamav/tomsfastmath/bit/fp_mod_2d.c

libclamav/tomsfastmath/bit/fp_rshd.c

libclamav/tomsfastmath/divide

libclamav/tomsfastmath/divide/fp_div.c

libclamav/tomsfastmath/divide/fp_div_d.c

libclamav/tomsfastmath/divide/fp_mod.c

libclamav/tomsfastmath/divide/fp_mod_d.c

libclamav/tomsfastmath/exptmod

libclamav/tomsfastmath/exptmod/fp_2expt.c

libclamav/tomsfastmath/exptmod/fp_exptmod.c

libclamav/tomsfastmath/misc

libclamav/tomsfastmath/misc/fp_ident.c

libclamav/tomsfastmath/misc/fp_set.c

libclamav/tomsfastmath/mont

libclamav/tomsfastmath/mont/fp_montgomery_calc_normalization.c

libclamav/tomsfastmath/mont/fp_montgomery_reduce.c

libclamav/tomsfastmath/mont/fp_montgomery_setup.c

libclamav/tomsfastmath/mul

libclamav/tomsfastmath/mul/fp_mul.c

libclamav/tomsfastmath/mul/fp_mul_2.c

libclamav/tomsfastmath/mul/fp_mul_2d.c

libclamav/tomsfastmath/mul/fp_mul_comba.c

libclamav/tomsfastmath/mul/fp_mul_comba_12.c

libclamav/tomsfastmath/mul/fp_mul_comba_17.c

libclamav/tomsfastmath/mul/fp_mul_comba_20.c

libclamav/tomsfastmath/mul/fp_mul_comba_24.c

libclamav/tomsfastmath/mul/fp_mul_comba_28.c

libclamav/tomsfastmath/mul/fp_mul_comba_3.c

libclamav/tomsfastmath/mul/fp_mul_comba_32.c

libclamav/tomsfastmath/mul/fp_mul_comba_4.c

libclamav/tomsfastmath/mul/fp_mul_comba_48.c

libclamav/tomsfastmath/mul/fp_mul_comba_6.c

libclamav/tomsfastmath/mul/fp_mul_comba_64.c

libclamav/tomsfastmath/mul/fp_mul_comba_7.c

libclamav/tomsfastmath/mul/fp_mul_comba_8.c

libclamav/tomsfastmath/mul/fp_mul_comba_9.c

libclamav/tomsfastmath/mul/fp_mul_comba_small_set.c

libclamav/tomsfastmath/mul/fp_mul_d.c

libclamav/tomsfastmath/mul/fp_mulmod.c

libclamav/tomsfastmath/numtheory

libclamav/tomsfastmath/numtheory/fp_invmod.c

libclamav/tomsfastmath/sqr

libclamav/tomsfastmath/sqr/fp_sqr.c

libclamav/tomsfastmath/sqr/fp_sqr_comba.c

libclamav/tomsfastmath/sqr/fp_sqr_comba_12.c

libclamav/tomsfastmath/sqr/fp_sqr_comba_17.c

libclamav/tomsfastmath/sqr/fp_sqr_comba_20.c

libclamav/tomsfastmath/sqr/fp_sqr_comba_24.c

libclamav/tomsfastmath/sqr/fp_sqr_comba_28.c

libclamav/tomsfastmath/sqr/fp_sqr_comba_3.c

libclamav/tomsfastmath/sqr/fp_sqr_comba_32.c

libclamav/tomsfastmath/sqr/fp_sqr_comba_4.c

libclamav/tomsfastmath/sqr/fp_sqr_comba_48.c

libclamav/tomsfastmath/sqr/fp_sqr_comba_6.c

libclamav/tomsfastmath/sqr/fp_sqr_comba_64.c

libclamav/tomsfastmath/sqr/fp_sqr_comba_7.c

libclamav/tomsfastmath/sqr/fp_sqr_comba_8.c

libclamav/tomsfastmath/sqr/fp_sqr_comba_9.c

libclamav/tomsfastmath/sqr/fp_sqr_comba_generic.c

libclamav/tomsfastmath/sqr/fp_sqr_comba_small_set.c

libclamav/tomsfastmath/sqr/fp_sqrmod.c

libclamav/xar.c

libclamav/xar.h

libclamav/xz_iface.c

libclamav/xz_iface.h

libclamunrar

shared/Makefile.am

shared/Makefile.in

test/.split/split.clam.isoaa

test/.split/split.clam.isoab

test/.split/split.clamjol.isoaa

test/.split/split.clamjol.isoab

unit_tests/input/clamav.hdb

files removed:
clamd/clamuko.c

clamd/clamuko.h

clamd/clamukofs.c

clamd/clamukofs.h

clamd/dazuko_xp.h

clamd/dazukofs.c

clamd/dazukofs.h

clamd/dazukoio.c

clamd/dazukoio.h

clamd/dazukoio_compat12.c

clamd/dazukoio_compat12.h

clamd/dazukoio_xp.h

configure.in

contrib

contrib/split-tarball.sh

docs/html/crossref.png

etc/clamav-milter.conf

etc/clamd.conf

etc/freshclam.conf

libclamav/7z.c

libclamav/7z.h

libclamav/7z/Archive

libclamav/7z/Archive/7z

libclamav/7z/Archive/7z/7zDecode.c

libclamav/7z/Archive/7z/7zDecode.h

libclamav/7z/Archive/7z/7zExtract.c

libclamav/7z/Archive/7z/7zExtract.h

libclamav/7z/Archive/7z/7zHeader.c

libclamav/7z/Archive/7z/7zHeader.h

libclamav/7z/Archive/7z/7zIn.c

libclamav/7z/Archive/7z/7zIn.h

libclamav/7z/Archive/7z/7zItem.c

libclamav/7z/Archive/7z/7zItem.h

libclamav/bignum.c

libclamav/bignum_class.h

files modified:
AUTHORS

ChangeLog

Makefile.in

NEWS

README

UPGRADE

aclocal.m4

clamav-config.h.in

clamav-milter/Makefile.am

clamav-milter/Makefile.in

clamav-milter/clamav-milter.c

clamav-milter/clamfi.c

clamav-milter/clamfi.h

clamav-milter/connpool.c

clamav-milter/netcode.c

clamav-milter/whitelist.c

clambc/Makefile.am

clambc/Makefile.in

clambc/bcrun.c

clamconf/Makefile.am

clamconf/Makefile.in

clamconf/clamconf.c

clamd/Makefile.am

clamd/Makefile.in

clamd/clamd.c

clamd/localserver.c

clamd/others.c

clamd/others.h

clamd/scanner.c

clamd/scanner.h

clamd/server-th.c

clamd/session.c

clamd/tcpserver.c

clamd/thrmgr.c

clamdscan/Makefile.am

clamdscan/Makefile.in

clamdscan/clamdscan.c

clamdscan/client.c

clamdscan/proto.c

clamdtop/Makefile.am

clamdtop/Makefile.in

clamdtop/clamdtop.c

clamscan/Makefile.am

clamscan/Makefile.in

clamscan/clamscan.c

clamscan/global.h

clamscan/manager.c

config/ltmain.sh *

configure

database/Makefile.in

debian/changelog

debian/clamav-base.examples

debian/clamav-base.postrm

debian/clamav-freshclam.examples

debian/clamav-milter.examples

debian/control

debian/libclamav6.lintian-overrides

debian/rules

docs/Makefile.in

docs/clamdoc.pdf

docs/clamdoc.tex

docs/html/clam.png

docs/html/clamdoc.css

docs/html/clamdoc.html

docs/html/footnode.html

docs/html/img2.png

docs/html/img3.png

docs/html/img4.png

docs/html/img5.png

docs/html/index.html

docs/html/node1.html

docs/html/node10.html

docs/html/node11.html

docs/html/node12.html

docs/html/node13.html

docs/html/node14.html

docs/html/node15.html

docs/html/node16.html

docs/html/node17.html

docs/html/node18.html

docs/html/node19.html

docs/html/node2.html

docs/html/node20.html

docs/html/node21.html

docs/html/node22.html

docs/html/node23.html

docs/html/node24.html

docs/html/node25.html

docs/html/node26.html

docs/html/node27.html

docs/html/node28.html

docs/html/node29.html

docs/html/node3.html

docs/html/node30.html

docs/html/node31.html

docs/html/node32.html

docs/html/node33.html

docs/html/node34.html

docs/html/node35.html

docs/html/node36.html

docs/html/node37.html

docs/html/node38.html

docs/html/node39.html

docs/html/node4.html

docs/html/node40.html

docs/html/node41.html

docs/html/node42.html

docs/html/node43.html

docs/html/node44.html

docs/html/node45.html

docs/html/node46.html

docs/html/node47.html

docs/html/node48.html

docs/html/node49.html

docs/html/node5.html

docs/html/node50.html

docs/html/node51.html

docs/html/node52.html

docs/html/node53.html

docs/html/node54.html

docs/html/node55.html

docs/html/node56.html

docs/html/node57.html

docs/html/node58.html

docs/html/node59.html

docs/html/node6.html

docs/html/node60.html

docs/html/node61.html

docs/html/node62.html

docs/html/node7.html

docs/html/node8.html

docs/html/node9.html

docs/man/clamav-milter.conf.5.in

docs/man/clamd.8.in

docs/man/clamdscan.1.in

docs/man/clamscan.1.in

docs/man/freshclam.1.in

docs/man/freshclam.conf.5.in

docs/man/sigtool.1.in

docs/signatures.pdf

docs/signatures.tex

etc/Makefile.am

etc/Makefile.in

freshclam/Makefile.am

freshclam/Makefile.in

freshclam/dns.c

freshclam/dns.h

freshclam/execute.c

freshclam/execute.h

freshclam/freshclam.c

freshclam/manager.c

freshclam/manager.h

freshclam/mirman.c

freshclam/mirman.h

freshclam/nonblock.c

freshclam/nonblock.h

freshclam/notify.c

freshclam/notify.h

libclamav/7z/7zBuf.h

libclamav/7z/7zCrc.c

libclamav/7z/7zCrc.h

libclamav/7z/7zFile.c

libclamav/7z/7zFile.h

libclamav/7z/7zStream.c

libclamav/7z/Bcj2.h

libclamav/7z/Bra.c

libclamav/7z/Bra.h

libclamav/7z/CpuArch.h

libclamav/7z/LzmaDec.c

libclamav/7z/LzmaDec.h

libclamav/7z/Types.h

libclamav/Makefile.am

libclamav/Makefile.in

libclamav/autoit.c

libclamav/bignum.h

libclamav/binhex.c

libclamav/blob.c

libclamav/bytecode.c

libclamav/bytecode.h

libclamav/bytecode_api.c

libclamav/bytecode_api.h

libclamav/bytecode_api_decl.c

libclamav/bytecode_api_impl.h

libclamav/bytecode_detect.c

libclamav/bytecode_vm.c

libclamav/c++/ClamBCRTChecks.cpp

libclamav/c++/Makefile.am

libclamav/c++/Makefile.in

libclamav/c++/PointerTracking.cpp

libclamav/c++/PointerTracking.h

libclamav/c++/aclocal.m4

libclamav/c++/bytecode2llvm.cpp

libclamav/c++/clamavcxx-config.h.in

libclamav/c++/config/ltmain.sh *

libclamav/c++/configure

libclamav/c++/configure.ac

libclamav/c++/llvm/lib/System/RWMutex.cpp

libclamav/c++/m4/libtool.m4

libclamav/c++/m4/ltoptions.m4

libclamav/c++/m4/ltversion.m4

libclamav/c++/m4/lt~obsolete.m4

libclamav/cab.c

libclamav/cab.h

libclamav/cache.c

libclamav/cache.h

libclamav/chmunpack.c

libclamav/chmunpack.h

libclamav/clamav.h

libclamav/cltypes.h

libclamav/cpio.c

libclamav/cpio.h

libclamav/cvd.c

libclamav/cvd.h

libclamav/dconf.c

libclamav/dconf.h

libclamav/default.h

libclamav/dlp.c

libclamav/elf.c

libclamav/elf.h

libclamav/entconv.c

libclamav/events.c

libclamav/events.h

libclamav/filetypes.c

libclamav/filetypes.h

libclamav/filetypes_int.h

libclamav/fmap.c

libclamav/fmap.h

libclamav/fsg.c

libclamav/fsg.h

libclamav/hashtab.c

libclamav/htmlnorm.c

libclamav/htmlnorm.h

libclamav/is_tar.c

libclamav/is_tar.h

libclamav/ishield.c

libclamav/libclamav.map

libclamav/line.c

libclamav/lzma_iface.c

libclamav/macho.c

libclamav/matcher-ac.c

libclamav/matcher-hash.c

libclamav/matcher-hash.h

libclamav/matcher.c

libclamav/matcher.h

libclamav/mbox.c

libclamav/mbox.h

libclamav/message.c

libclamav/mew.c

libclamav/mew.h

libclamav/mpool.c

libclamav/msexpand.c

libclamav/msexpand.h

libclamav/mspack.c

libclamav/mspack.h

libclamav/nsis/nulsft.c

libclamav/nsis/nulsft.h

libclamav/ole2_extract.c

libclamav/ole2_extract.h

libclamav/others.c

libclamav/others.h

libclamav/others_common.c

libclamav/packlibs.c

libclamav/packlibs.h

libclamav/pdf.c

libclamav/pe.c

libclamav/pe.h

libclamav/pe_icons.c

libclamav/phish_domaincheck_db.c

libclamav/phish_whitelist.c

libclamav/phishcheck.c

libclamav/readdb.c

libclamav/readdb.h

libclamav/regex/regcomp.c

libclamav/regex_list.c

libclamav/regex_suffix.c

libclamav/rtf.c

libclamav/rtf.h

libclamav/scanners.c

libclamav/scanners.h

libclamav/sis.c

libclamav/sis.h

libclamav/special.c

libclamav/special.h

libclamav/spin.c

libclamav/str.c

libclamav/str.h

libclamav/table.c

libclamav/text.c

libclamav/textdet.c

libclamav/tnef.c

libclamav/tnef.h

libclamav/unarj.c

libclamav/unarj.h

libclamav/unsp.c

libclamav/unsp.h

libclamav/untar.c

libclamav/untar.h

libclamav/unzip.c

libclamav/upx.c

libclamav/upx.h

libclamav/vba_extract.c

libclamav/version.h

libclamav/wwunpack.c

libclamunrar_iface/Makefile.am

libclamunrar_iface/unrar_iface.c

libltdl/Makefile.am

libltdl/Makefile.in

libltdl/README

libltdl/libltdl/lt_dlloader.h

libltdl/libltdl/lt_system.h

libltdl/libltdl/slist.h

libltdl/loaders/loadlibrary.c

libltdl/lt_dlloader.c

libltdl/ltdl.c

libltdl/ltdl.h

libltdl/slist.c

m4/acinclude.m4

m4/argz.m4

m4/libtool.m4

m4/ltdl.m4

m4/ltoptions.m4

m4/ltversion.m4

m4/lt~obsolete.m4

m4/resolv.m4

platform.h.in

shared/actions.c

shared/getopt.c

shared/optparser.c

shared/output.c

shared/output.h

shared/tar.c

sigtool/Makefile.am

sigtool/Makefile.in

sigtool/sigtool.c

sigtool/vba.c

test/Makefile.am

test/Makefile.in

unit_tests/Makefile.am

unit_tests/Makefile.in

unit_tests/check_bytecode.c

unit_tests/check_clamav.c

unit_tests/check_clamd.c

unit_tests/check_disasm.c

unit_tests/check_htmlnorm.c

unit_tests/check_jsnorm.c

unit_tests/check_str.c

unit_tests/valgrind.supp

Show diffs side-by-side

added added

removed removed

libclamav/tomsfastmath/mont/fp_montgomery_reduce.c

/* TomsFastMath, a fast ISO C bignum library.

* This project is meant to fill in where LibTomMath

* falls short. That is speed ;-)

* This project is public domain and free for all purposes.

* Tom St Denis, tomstdenis@gmail.com

#include "bignum_fast.h"

/******************************************************************/

#if defined(TFM_X86) && !defined(TFM_SSE2)

/* x86-32 code */

#define MONT_START

#define MONT_FINI

#define LOOP_END

#define LOOP_START \

mu = c[x] * mp

#define INNERMUL \

asm( \

"movl %5,%%eax \n\t" \

"mull %4 \n\t" \

"addl %1,%%eax \n\t" \

"adcl $0,%%edx \n\t" \

"addl %%eax,%0 \n\t" \

"adcl $0,%%edx \n\t" \

"movl %%edx,%1 \n\t" \

:"=g"(_c[LO]), "=r"(cy) \

:"0"(_c[LO]), "1"(cy), "g"(mu), "g"(*tmpm++) \

: "%eax", "%edx", "cc")

#define PROPCARRY \

asm( \

"addl %1,%0 \n\t" \

"setb %%al \n\t" \

"movzbl %%al,%1 \n\t" \

:"=g"(_c[LO]), "=r"(cy) \

:"0"(_c[LO]), "1"(cy) \

: "%eax", "cc")

/******************************************************************/

#elif defined(TFM_X86_64)

/* x86-64 code */

#define MONT_START

#define MONT_FINI

#define LOOP_END

#define LOOP_START \

mu = c[x] * mp

#define INNERMUL \

asm( \

"movq %5,%%rax \n\t" \

"mulq %4 \n\t" \

"addq %1,%%rax \n\t" \

"adcq $0,%%rdx \n\t" \

"addq %%rax,%0 \n\t" \

"adcq $0,%%rdx \n\t" \

"movq %%rdx,%1 \n\t" \

:"=g"(_c[LO]), "=r"(cy) \

:"0"(_c[LO]), "1"(cy), "r"(mu), "r"(*tmpm++) \

: "%rax", "%rdx", "cc")

#define INNERMUL8 \

asm( \

"movq 0(%5),%%rax \n\t" \

"movq 0(%2),%%r10 \n\t" \

"movq 0x8(%5),%%r11 \n\t" \

"mulq %4 \n\t" \

"addq %%r10,%%rax \n\t" \

"adcq $0,%%rdx \n\t" \

"movq 0x8(%2),%%r10 \n\t" \

"addq %3,%%rax \n\t" \

"adcq $0,%%rdx \n\t" \

"movq %%rax,0(%0) \n\t" \

"movq %%rdx,%1 \n\t" \

"movq %%r11,%%rax \n\t" \

"movq 0x10(%5),%%r11 \n\t" \

"mulq %4 \n\t" \

"addq %%r10,%%rax \n\t" \

"adcq $0,%%rdx \n\t" \

"movq 0x10(%2),%%r10 \n\t" \

"addq %3,%%rax \n\t" \

"adcq $0,%%rdx \n\t" \

"movq %%rax,0x8(%0) \n\t" \

"movq %%rdx,%1 \n\t" \

"movq %%r11,%%rax \n\t" \

"movq 0x18(%5),%%r11 \n\t" \

"mulq %4 \n\t" \

"addq %%r10,%%rax \n\t" \

"adcq $0,%%rdx \n\t" \

"movq 0x18(%2),%%r10 \n\t" \

"addq %3,%%rax \n\t" \

"adcq $0,%%rdx \n\t" \

100

"movq %%rax,0x10(%0) \n\t" \

101

"movq %%rdx,%1 \n\t" \

102

103

"movq %%r11,%%rax \n\t" \

104

"movq 0x20(%5),%%r11 \n\t" \

105

"mulq %4 \n\t" \

106

"addq %%r10,%%rax \n\t" \

107

"adcq $0,%%rdx \n\t" \

108

"movq 0x20(%2),%%r10 \n\t" \

109

"addq %3,%%rax \n\t" \

110

"adcq $0,%%rdx \n\t" \

111

"movq %%rax,0x18(%0) \n\t" \

112

"movq %%rdx,%1 \n\t" \

113

114

"movq %%r11,%%rax \n\t" \

115

"movq 0x28(%5),%%r11 \n\t" \

116

"mulq %4 \n\t" \

117

"addq %%r10,%%rax \n\t" \

118

"adcq $0,%%rdx \n\t" \

119

"movq 0x28(%2),%%r10 \n\t" \

120

"addq %3,%%rax \n\t" \

121

"adcq $0,%%rdx \n\t" \

122

"movq %%rax,0x20(%0) \n\t" \

123

"movq %%rdx,%1 \n\t" \

124

125

"movq %%r11,%%rax \n\t" \

126

"movq 0x30(%5),%%r11 \n\t" \

127

"mulq %4 \n\t" \

128

"addq %%r10,%%rax \n\t" \

129

"adcq $0,%%rdx \n\t" \

130

"movq 0x30(%2),%%r10 \n\t" \

131

"addq %3,%%rax \n\t" \

132

"adcq $0,%%rdx \n\t" \

133

"movq %%rax,0x28(%0) \n\t" \

134

"movq %%rdx,%1 \n\t" \

135

136

"movq %%r11,%%rax \n\t" \

137

"movq 0x38(%5),%%r11 \n\t" \

138

"mulq %4 \n\t" \

139

"addq %%r10,%%rax \n\t" \

140

"adcq $0,%%rdx \n\t" \

141

"movq 0x38(%2),%%r10 \n\t" \

142

"addq %3,%%rax \n\t" \

143

"adcq $0,%%rdx \n\t" \

144

"movq %%rax,0x30(%0) \n\t" \

145

"movq %%rdx,%1 \n\t" \

146

147

"movq %%r11,%%rax \n\t" \

148

"mulq %4 \n\t" \

149

"addq %%r10,%%rax \n\t" \

150

"adcq $0,%%rdx \n\t" \

151

"addq %3,%%rax \n\t" \

152

"adcq $0,%%rdx \n\t" \

153

"movq %%rax,0x38(%0) \n\t" \

154

"movq %%rdx,%1 \n\t" \

155

156

:"=r"(_c), "=r"(cy) \

157

: "0"(_c), "1"(cy), "g"(mu), "r"(tmpm)\

158

: "%rax", "%rdx", "%r10", "%r11", "cc")

159

160

161

#define PROPCARRY \

162

asm( \

163

"addq %1,%0 \n\t" \

164

"setb %%al \n\t" \

165

"movzbq %%al,%1 \n\t" \

166

:"=g"(_c[LO]), "=r"(cy) \

167

:"0"(_c[LO]), "1"(cy) \

168

: "%rax", "cc")

169

170

/******************************************************************/

171

#elif defined(TFM_SSE2)

172

/* SSE2 code (assumes 32-bit fp_digits) */

173

/* XMM register assignments:

174

* xmm0 *tmpm++, then Mu * (*tmpm++)

175

* xmm1 c[x], then Mu

176

* xmm2 mp

177

* xmm3 cy

178

* xmm4 _c[LO]

179

180

181

#define MONT_START \

182

asm("movd %0,%%mm2"::"g"(mp))

183

184

#define MONT_FINI \

185

asm("emms")

186

187

#define LOOP_START \

188

asm( \

189

"movd %0,%%mm1 \n\t" \

190

"pxor %%mm3,%%mm3 \n\t" \

191

"pmuludq %%mm2,%%mm1 \n\t" \

192

:: "g"(c[x]))

193

194

/* pmuludq on mmx registers does a 32x32->64 multiply. */

195

#define INNERMUL \

196

asm( \

197

"movd %1,%%mm4 \n\t" \

198

"movd %2,%%mm0 \n\t" \

199

"paddq %%mm4,%%mm3 \n\t" \

200

"pmuludq %%mm1,%%mm0 \n\t" \

201

"paddq %%mm0,%%mm3 \n\t" \

202

"movd %%mm3,%0 \n\t" \

203

"psrlq $32, %%mm3 \n\t" \

204

:"=g"(_c[LO]) : "0"(_c[LO]), "g"(*tmpm++) );

205

206

#define INNERMUL8 \

207

asm( \

208

"movd 0(%1),%%mm4 \n\t" \

209

"movd 0(%2),%%mm0 \n\t" \

210

"paddq %%mm4,%%mm3 \n\t" \

211

"pmuludq %%mm1,%%mm0 \n\t" \

212

"movd 4(%2),%%mm5 \n\t" \

213

"paddq %%mm0,%%mm3 \n\t" \

214

"movd 4(%1),%%mm6 \n\t" \

215

"movd %%mm3,0(%0) \n\t" \

216

"psrlq $32, %%mm3 \n\t" \

217

218

"paddq %%mm6,%%mm3 \n\t" \

219

"pmuludq %%mm1,%%mm5 \n\t" \

220

"movd 8(%2),%%mm6 \n\t" \

221

"paddq %%mm5,%%mm3 \n\t" \

222

"movd 8(%1),%%mm7 \n\t" \

223

"movd %%mm3,4(%0) \n\t" \

224

"psrlq $32, %%mm3 \n\t" \

225

226

"paddq %%mm7,%%mm3 \n\t" \

227

"pmuludq %%mm1,%%mm6 \n\t" \

228

"movd 12(%2),%%mm7 \n\t" \

229

"paddq %%mm6,%%mm3 \n\t" \

230

"movd 12(%1),%%mm5 \n\t" \

231

"movd %%mm3,8(%0) \n\t" \

232

"psrlq $32, %%mm3 \n\t" \

233

234

"paddq %%mm5,%%mm3 \n\t" \

235

"pmuludq %%mm1,%%mm7 \n\t" \

236

"movd 16(%2),%%mm5 \n\t" \

237

"paddq %%mm7,%%mm3 \n\t" \

238

"movd 16(%1),%%mm6 \n\t" \

239

"movd %%mm3,12(%0) \n\t" \

240

"psrlq $32, %%mm3 \n\t" \

241

242

"paddq %%mm6,%%mm3 \n\t" \

243

"pmuludq %%mm1,%%mm5 \n\t" \

244

"movd 20(%2),%%mm6 \n\t" \

245

"paddq %%mm5,%%mm3 \n\t" \

246

"movd 20(%1),%%mm7 \n\t" \

247

"movd %%mm3,16(%0) \n\t" \

248

"psrlq $32, %%mm3 \n\t" \

249

250

"paddq %%mm7,%%mm3 \n\t" \

251

"pmuludq %%mm1,%%mm6 \n\t" \

252

"movd 24(%2),%%mm7 \n\t" \

253

"paddq %%mm6,%%mm3 \n\t" \

254

"movd 24(%1),%%mm5 \n\t" \

255

"movd %%mm3,20(%0) \n\t" \

256

"psrlq $32, %%mm3 \n\t" \

257

258

"paddq %%mm5,%%mm3 \n\t" \

259

"pmuludq %%mm1,%%mm7 \n\t" \

260

"movd 28(%2),%%mm5 \n\t" \

261

"paddq %%mm7,%%mm3 \n\t" \

262

"movd 28(%1),%%mm6 \n\t" \

263

"movd %%mm3,24(%0) \n\t" \

264

"psrlq $32, %%mm3 \n\t" \

265

266

"paddq %%mm6,%%mm3 \n\t" \

267

"pmuludq %%mm1,%%mm5 \n\t" \

268

"paddq %%mm5,%%mm3 \n\t" \

269

"movd %%mm3,28(%0) \n\t" \

270

"psrlq $32, %%mm3 \n\t" \

271

:"=r"(_c) : "0"(_c), "g"(tmpm) );

272

273

#define LOOP_END \

274

asm( "movd %%mm3,%0 \n" :"=r"(cy))

275

276

#define PROPCARRY \

277

asm( \

278

"addl %1,%0 \n\t" \

279

"setb %%al \n\t" \

280

"movzbl %%al,%1 \n\t" \

281

:"=g"(_c[LO]), "=r"(cy) \

282

:"0"(_c[LO]), "1"(cy) \

283

: "%eax", "cc")

284

285

/******************************************************************/

286

#elif defined(TFM_ARM)

287

/* ARMv4 code */

288

289

#define MONT_START

290

#define MONT_FINI

291

#define LOOP_END

292

#define LOOP_START \

293

mu = c[x] * mp

294

295

#define INNERMUL \

296

asm( \

297

" LDR r0,%1 \n\t" \

298

" ADDS r0,r0,%0 \n\t" \

299

" MOVCS %0,#1 \n\t" \

300

" MOVCC %0,#0 \n\t" \

301

" UMLAL r0,%0,%3,%4 \n\t" \

302

" STR r0,%1 \n\t" \

303

:"=r"(cy),"=m"(_c[0]):"0"(cy),"r"(mu),"r"(*tmpm++),"1"(_c[0]):"r0","cc");

304

305

#define PROPCARRY \

306

asm( \

307

" LDR r0,%1 \n\t" \

308

" ADDS r0,r0,%0 \n\t" \

309

" STR r0,%1 \n\t" \

310

" MOVCS %0,#1 \n\t" \

311

" MOVCC %0,#0 \n\t" \

312

:"=r"(cy),"=m"(_c[0]):"0"(cy),"1"(_c[0]):"r0","cc");

313

314

/******************************************************************/

315

#elif defined(TFM_PPC32)

316

317

/* PPC32 */

318

#define MONT_START

319

#define MONT_FINI

320

#define LOOP_END

321

#define LOOP_START \

322

mu = c[x] * mp

323

324

#define INNERMUL \

325

asm( \

326

" mullw 16,%3,%4 \n\t" \

327

" mulhwu 17,%3,%4 \n\t" \

328

" addc 16,16,%0 \n\t" \

329

" addze 17,17 \n\t" \

330

" lwz 18,%1 \n\t" \

331

" addc 16,16,18 \n\t" \

332

" addze %0,17 \n\t" \

333

" stw 16,%1 \n\t" \

334

:"=r"(cy),"=m"(_c[0]):"0"(cy),"r"(mu),"r"(tmpm[0]),"1"(_c[0]):"16", "17", "18","cc"); ++tmpm;

335

336

#define PROPCARRY \

337

asm( \

338

" lwz 16,%1 \n\t" \

339

" addc 16,16,%0 \n\t" \

340

" stw 16,%1 \n\t" \

341

" xor %0,%0,%0 \n\t" \

342

" addze %0,%0 \n\t" \

343

:"=r"(cy),"=m"(_c[0]):"0"(cy),"1"(_c[0]):"16","cc");

344

345

/******************************************************************/

346

#elif defined(TFM_PPC64)

347

348

/* PPC64 */

349

#define MONT_START

350

#define MONT_FINI

351

#define LOOP_END

352

#define LOOP_START \

353

mu = c[x] * mp

354

355

#define INNERMUL \

356

asm( \

357

" mulld r16,%3,%4 \n\t" \

358

" mulhdu r17,%3,%4 \n\t" \

359

" addc r16,16,%0 \n\t" \

360

" addze r17,r17 \n\t" \

361

" ldx r18,0,%1 \n\t" \

362

" addc r16,r16,r18 \n\t" \

363

" addze %0,r17 \n\t" \

364

" sdx r16,0,%1 \n\t" \

365

:"=r"(cy),"=m"(_c[0]):"0"(cy),"r"(mu),"r"(tmpm[0]),"1"(_c[0]):"r16", "r17", "r18","cc"); ++tmpm;

366

367

#define PROPCARRY \

368

asm( \

369

" ldx r16,0,%1 \n\t" \

370

" addc r16,r16,%0 \n\t" \

371

" sdx r16,0,%1 \n\t" \

372

" xor %0,%0,%0 \n\t" \

373

" addze %0,%0 \n\t" \

374

:"=r"(cy),"=m"(_c[0]):"0"(cy),"1"(_c[0]):"r16","cc");

375

376

/******************************************************************/

377

#elif defined(TFM_AVR32)

378

379

/* AVR32 */

380

#define MONT_START

381

#define MONT_FINI

382

#define LOOP_END

383

#define LOOP_START \

384

mu = c[x] * mp

385

386

#define INNERMUL \

387

asm( \

388

" ld.w r2,%1 \n\t" \

389

" add r2,%0 \n\t" \

390

" eor r3,r3 \n\t" \

391

" acr r3 \n\t" \

392

" macu.d r2,%3,%4 \n\t" \

393

" st.w %1,r2 \n\t" \

394

" mov %0,r3 \n\t" \

395

:"=r"(cy),"=r"(_c):"0"(cy),"r"(mu),"r"(*tmpm++),"1"(_c):"r2","r3");

396

397

#define PROPCARRY \

398

asm( \

399

" ld.w r2,%1 \n\t" \

400

" add r2,%0 \n\t" \

401

" st.w %1,r2 \n\t" \

402

" eor %0,%0 \n\t" \

403

" acr %0 \n\t" \

404

:"=r"(cy),"=r"(&_c[0]):"0"(cy),"1"(&_c[0]):"r2","cc");

405

406

/******************************************************************/

407

#elif defined(TFM_MIPS)

408

409

/* MIPS */

410

#define MONT_START

411

#define MONT_FINI

412

#define LOOP_END

413

#define LOOP_START \

414

mu = c[x] * mp

415

416

#define INNERMUL \

417

asm( \

418

" multu %3,%4 \n\t" \

419

" mflo $12 \n\t" \

420

" mfhi $13 \n\t" \

421

" addu $12,$12,%0 \n\t" \

422

" sltu $10,$12,%0 \n\t" \

423

" addu $13,$13,$10 \n\t" \

424

" lw $10,%1 \n\t" \

425

" addu $12,$12,$10 \n\t" \

426

" sltu $10,$12,$10 \n\t" \

427

" addu %0,$13,$10 \n\t" \

428

" sw $12,%1 \n\t" \

429

:"=r"(cy),"=m"(_c[0]):"0"(cy),"r"(mu),"r"(tmpm[0]),"1"(_c[0]):"$10","$12","$13"); ++tmpm;

430

431

#define PROPCARRY \

432

asm( \

433

" lw $10,%1 \n\t" \

434

" addu $10,$10,%0 \n\t" \

435

" sw $10,%1 \n\t" \

436

" sltu %0,$10,%0 \n\t" \

437

:"=r"(cy),"=m"(_c[0]):"0"(cy),"1"(_c[0]):"$10");

438

439

/******************************************************************/

440

#else

441

442

/* ISO C code */

443

#define MONT_START

444

#define MONT_FINI

445

#define LOOP_END

446

#define LOOP_START \

447

mu = c[x] * mp

448

449

#define INNERMUL \

450

do { fp_word t; \

451

_c[0] = t = ((fp_word)_c[0] + (fp_word)cy) + \

452

(((fp_word)mu) * ((fp_word)*tmpm++)); \

453

cy = (t >> DIGIT_BIT); \

454

} while (0)

455

456

#define PROPCARRY \

457

do { fp_digit t = _c[0] += cy; cy = (t < cy); } while (0)

458

459

#endif

460

/******************************************************************/

461

462

463

#define LO 0

464

465

#ifdef TFM_SMALL_MONT_SET

466

#include "fp_mont_small.i"

467

#endif

468

469

/* computes x/R == x (mod N) via Montgomery Reduction */

470

void fp_montgomery_reduce(fp_int *a, fp_int *m, fp_digit mp)

471

{

472

fp_digit c[FP_SIZE], *_c, *tmpm, mu;

473

int oldused, x, y, pa;

474

475

/* bail if too large */

476

if (m->used > (FP_SIZE/2)) {

477

return;

478

}

479

480

#ifdef TFM_SMALL_MONT_SET

481

if (m->used <= 16) {

482

fp_montgomery_reduce_small(a, m, mp);

483

return;

484

}

485

#endif

486

487

#if defined(USE_MEMSET)

488

/* now zero the buff */

489

memset(c, 0, sizeof c);

490

#endif

491

pa = m->used;

492

493

/* copy the input */

494

oldused = a->used;

495

for (x = 0; x < oldused; x++) {

496

c[x] = a->dp[x];

497

}

498

#if !defined(USE_MEMSET)

499

for (; x < 2*pa+1; x++) {

500

c[x] = 0;

501

}

502

#endif

503

MONT_START;

504

505

for (x = 0; x < pa; x++) {

506

fp_digit cy = 0;

507

/* get Mu for this round */

508

LOOP_START;

509

_c = c + x;

510

tmpm = m->dp;

511

y = 0;

512

#if (defined(TFM_SSE2) || defined(TFM_X86_64))

513

for (; y < (pa & ~7); y += 8) {

514

INNERMUL8;

515

_c += 8;

516

tmpm += 8;

517

}

518

#endif

519

520

for (; y < pa; y++) {

521

INNERMUL;

522

++_c;

523

}

524

LOOP_END;

525

while (cy) {

526

PROPCARRY;

527

++_c;

528

}

529

}

530

531

/* now copy out */

532

_c = c + pa;

533

tmpm = a->dp;

534

for (x = 0; x < pa+1; x++) {

535

*tmpm++ = *_c++;

536

}

537

538

for (; x < oldused; x++) {

539

*tmpm++ = 0;

540

}

541

542

MONT_FINI;

543

544

a->used = pa+1;

545

fp_clamp(a);

546

547

/* if A >= m then A = A - m */

548

if (fp_cmp_mag (a, m) != FP_LT) {

549

s_fp_sub (a, m, a);

550

}

551

}

552

553

554

/* $Source: /cvs/libtom/tomsfastmath/src/mont/fp_montgomery_reduce.c,v $ */

555

/* $Revision: 1.2 $ */

556

/* $Date: 2007/03/14 23:47:42 $ */

Older »