~ubuntu-branches/ubuntu/precise/openssl098/precise

« back to all changes in this revision

Viewing changes to crypto/bn/asm/ia64.S

Committer: Bazaar Package Importer
Author(s): Kurt Roeckx
Date: 2011-03-23 19:50:31 UTC
Revision ID: james.westby@ubuntu.com-20110323195031-6h9crj4bymhhr8b8

Tags: upstream-0.9.8o

Import upstream version 0.9.8o

files added:

CHANGES

CHANGES.SSLeay

Configure

INSTALL

INSTALL.DJGPP

INSTALL.MacOS

INSTALL.NW

INSTALL.OS2

INSTALL.VMS

INSTALL.W32

INSTALL.W64

INSTALL.WCE

LICENSE

MacOS

MacOS/GUSI_Init.cpp

MacOS/GetHTTPS.src

MacOS/GetHTTPS.src/CPStringUtils.cpp

MacOS/GetHTTPS.src/CPStringUtils.hpp

MacOS/GetHTTPS.src/ErrorHandling.cpp

MacOS/GetHTTPS.src/ErrorHandling.hpp

MacOS/GetHTTPS.src/GetHTTPS.cpp

MacOS/GetHTTPS.src/MacSocket.cpp

MacOS/GetHTTPS.src/MacSocket.h

MacOS/OpenSSL.mcp.hqx

MacOS/Randomizer.cpp

MacOS/Randomizer.h

MacOS/TODO

MacOS/_MWERKS_GUSI_prefix.h

MacOS/_MWERKS_prefix.h

MacOS/buildinf.h

MacOS/mklinks.as.hqx

MacOS/opensslconf.h

Makefile

Makefile.org

Makefile.shared

NEWS

Netware

Netware/build.bat

Netware/cpy_tests.bat

Netware/do_tests.pl

Netware/globals.txt

Netware/readme.txt

Netware/set_env.bat

PROBLEMS

README

README.ASN1

README.ENGINE

VMS/TODO

VMS/VMSify-conf.pl

VMS/WISHLIST.TXT

VMS/install.com

VMS/mkshared.com

VMS/multinet_shr.opt

VMS/openssl_utils.com

VMS/socketshr_shr.opt

VMS/tcpip_shr_decc.opt

VMS/test-includes.com

VMS/ucx_shr_decc.opt

VMS/ucx_shr_decc_log.opt

VMS/ucx_shr_vaxc.opt

apps

apps/CA.com

apps/CA.pl

apps/CA.pl.in

apps/CA.sh

apps/Makefile

apps/app_rand.c

apps/apps.c

apps/apps.h

apps/asn1pars.c

apps/ca-cert.srl

apps/ca-key.pem

apps/ca-req.pem

apps/ca.c

apps/cert.pem

apps/ciphers.c

apps/client.pem

apps/cms.c

apps/crl.c

apps/crl2p7.c

apps/demoCA

apps/demoCA/cacert.pem

apps/demoCA/index.txt

apps/demoCA/private

apps/demoCA/private/cakey.pem

apps/demoCA/serial

apps/dgst.c

apps/dh.c

apps/dh1024.pem

apps/dh2048.pem

apps/dh4096.pem

apps/dh512.pem

apps/dhparam.c

apps/dsa-ca.pem

apps/dsa-pca.pem

apps/dsa.c

apps/dsa1024.pem

apps/dsa512.pem

apps/dsap.pem

apps/dsaparam.c

apps/ec.c

apps/ecparam.c

apps/enc.c

apps/engine.c

apps/errstr.c

apps/gendh.c

apps/gendsa.c

apps/genrsa.c

apps/install.com

apps/makeapps.com

apps/md4.c

apps/nseq.c

apps/ocsp.c

apps/oid.cnf

apps/openssl-vms.cnf

apps/openssl.c

apps/openssl.cnf

apps/passwd.c

apps/pca-cert.srl

apps/pca-key.pem

apps/pca-req.pem

apps/pkcs12.c

apps/pkcs7.c

apps/pkcs8.c

apps/prime.c

apps/privkey.pem

apps/progs.h

apps/progs.pl

apps/rand.c

apps/req.c

apps/req.pem

apps/rsa.c

apps/rsa8192.pem

apps/rsautl.c

apps/s1024key.pem

apps/s1024req.pem

apps/s512-key.pem

apps/s512-req.pem

apps/s_apps.h

apps/s_cb.c

apps/s_client.c

apps/s_server.c

apps/s_socket.c

apps/s_time.c

apps/server.pem

apps/server.srl

apps/server2.pem

apps/sess_id.c

apps/set

apps/set/set-g-ca.pem

apps/set/set-m-ca.pem

apps/set/set_b_ca.pem

apps/set/set_c_ca.pem

apps/set/set_d_ct.pem

apps/set/set_root.pem

apps/smime.c

apps/speed.c

apps/spkac.c

apps/testCA.pem

apps/testdsa.h

apps/testrsa.h

apps/timeouts.h

apps/verify.c

apps/version.c

apps/winrand.c

apps/x509.c

bugs

bugs/MS

bugs/SSLv3

bugs/alpha.c

bugs/dggccbug.c

bugs/sgiccbug.c

bugs/sslref.dif

bugs/stream.c

bugs/ultrixcc.c

certs

certs/README.RootCerts

certs/demo

certs/demo/ca-cert.pem

certs/demo/dsa-ca.pem

certs/demo/dsa-pca.pem

certs/demo/pca-cert.pem

certs/expired

certs/expired/ICE.crl

config

crypto

crypto/LPdir_nyi.c

crypto/LPdir_unix.c

crypto/LPdir_vms.c

crypto/LPdir_win.c

crypto/LPdir_win32.c

crypto/LPdir_wince.c

crypto/Makefile

crypto/aes

crypto/aes/Makefile

crypto/aes/README

crypto/aes/aes.h

crypto/aes/aes_cbc.c

crypto/aes/aes_cfb.c

crypto/aes/aes_core.c

crypto/aes/aes_ctr.c

crypto/aes/aes_ecb.c

crypto/aes/aes_ige.c

crypto/aes/aes_locl.h

crypto/aes/aes_misc.c

crypto/aes/aes_ofb.c

crypto/aes/aes_wrap.c

crypto/aes/asm

crypto/aes/asm/aes-586.pl

crypto/aes/asm/aes-ia64.S

crypto/aes/asm/aes-x86_64.pl

crypto/asn1

crypto/asn1/Makefile

crypto/asn1/a_bitstr.c

crypto/asn1/a_bool.c

crypto/asn1/a_bytes.c

crypto/asn1/a_d2i_fp.c

crypto/asn1/a_digest.c

crypto/asn1/a_dup.c

crypto/asn1/a_enum.c

crypto/asn1/a_gentm.c

crypto/asn1/a_hdr.c

crypto/asn1/a_i2d_fp.c

crypto/asn1/a_int.c

crypto/asn1/a_mbstr.c

crypto/asn1/a_meth.c

crypto/asn1/a_object.c

crypto/asn1/a_octet.c

crypto/asn1/a_print.c

crypto/asn1/a_set.c

crypto/asn1/a_sign.c

crypto/asn1/a_strex.c

crypto/asn1/a_strnid.c

crypto/asn1/a_time.c

crypto/asn1/a_type.c

crypto/asn1/a_utctm.c

crypto/asn1/a_utf8.c

crypto/asn1/a_verify.c

crypto/asn1/asn1.h

crypto/asn1/asn1_err.c

crypto/asn1/asn1_gen.c

crypto/asn1/asn1_lib.c

crypto/asn1/asn1_mac.h

crypto/asn1/asn1_par.c

crypto/asn1/asn1t.h

crypto/asn1/asn_mime.c

crypto/asn1/asn_moid.c

crypto/asn1/asn_pack.c

crypto/asn1/charmap.h

crypto/asn1/charmap.pl

crypto/asn1/d2i_pr.c

crypto/asn1/d2i_pu.c

crypto/asn1/evp_asn1.c

crypto/asn1/f_enum.c

crypto/asn1/f_int.c

crypto/asn1/f_string.c

crypto/asn1/i2d_pr.c

crypto/asn1/i2d_pu.c

crypto/asn1/n_pkey.c

crypto/asn1/nsseq.c

crypto/asn1/p5_pbe.c

crypto/asn1/p5_pbev2.c

crypto/asn1/p8_key.c

crypto/asn1/p8_pkey.c

crypto/asn1/t_bitst.c

crypto/asn1/t_crl.c

crypto/asn1/t_pkey.c

crypto/asn1/t_req.c

crypto/asn1/t_spki.c

crypto/asn1/t_x509.c

crypto/asn1/t_x509a.c

crypto/asn1/tasn_dec.c

crypto/asn1/tasn_enc.c

crypto/asn1/tasn_fre.c

crypto/asn1/tasn_new.c

crypto/asn1/tasn_prn.c

crypto/asn1/tasn_typ.c

crypto/asn1/tasn_utl.c

crypto/asn1/x_algor.c

crypto/asn1/x_attrib.c

crypto/asn1/x_bignum.c

crypto/asn1/x_crl.c

crypto/asn1/x_exten.c

crypto/asn1/x_info.c

crypto/asn1/x_long.c

crypto/asn1/x_name.c

crypto/asn1/x_pkey.c

crypto/asn1/x_pubkey.c

crypto/asn1/x_req.c

crypto/asn1/x_sig.c

crypto/asn1/x_spki.c

crypto/asn1/x_val.c

crypto/asn1/x_x509.c

crypto/asn1/x_x509a.c

crypto/bf

crypto/bf/COPYRIGHT

crypto/bf/INSTALL

crypto/bf/Makefile

crypto/bf/README

crypto/bf/VERSION

crypto/bf/asm

crypto/bf/asm/bf-586.pl

crypto/bf/asm/bf-686.pl

crypto/bf/asm/readme

crypto/bf/bf_cbc.c

crypto/bf/bf_cfb64.c

crypto/bf/bf_ecb.c

crypto/bf/bf_enc.c

crypto/bf/bf_locl.h

crypto/bf/bf_ofb64.c

crypto/bf/bf_opts.c

crypto/bf/bf_pi.h

crypto/bf/bf_skey.c

crypto/bf/bfs.cpp

crypto/bf/bfspeed.c

crypto/bf/bftest.c

crypto/bf/blowfish.h

crypto/bio

crypto/bio/Makefile

crypto/bio/b_dump.c

crypto/bio/b_print.c

crypto/bio/b_sock.c

crypto/bio/bf_buff.c

crypto/bio/bf_lbuf.c

crypto/bio/bf_nbio.c

crypto/bio/bf_null.c

crypto/bio/bio.h

crypto/bio/bio_cb.c

crypto/bio/bio_err.c

crypto/bio/bio_lcl.h

crypto/bio/bio_lib.c

crypto/bio/bss_acpt.c

crypto/bio/bss_bio.c

crypto/bio/bss_conn.c

crypto/bio/bss_dgram.c

crypto/bio/bss_fd.c

crypto/bio/bss_file.c

crypto/bio/bss_log.c

crypto/bio/bss_mem.c

crypto/bio/bss_null.c

crypto/bio/bss_rtcp.c

crypto/bio/bss_sock.c

crypto/bn

crypto/bn/Makefile

crypto/bn/asm

crypto/bn/asm/README

crypto/bn/asm/bn-586.pl

crypto/bn/asm/co-586.pl

crypto/bn/asm/ia64.S

crypto/bn/asm/mips3.s

crypto/bn/asm/mo-586.pl

crypto/bn/asm/pa-risc2.s

crypto/bn/asm/pa-risc2W.s

crypto/bn/asm/ppc.pl

crypto/bn/asm/sparcv8.S

crypto/bn/asm/sparcv8plus.S

crypto/bn/asm/vms.mar

crypto/bn/asm/x86

crypto/bn/asm/x86.pl

crypto/bn/asm/x86/add.pl

crypto/bn/asm/x86/comba.pl

crypto/bn/asm/x86/div.pl

crypto/bn/asm/x86/f

crypto/bn/asm/x86/mul.pl

crypto/bn/asm/x86/mul_add.pl

crypto/bn/asm/x86/sqr.pl

crypto/bn/asm/x86/sub.pl

crypto/bn/asm/x86_64-gcc.c

crypto/bn/asm/x86_64-mont.pl

crypto/bn/bn.h

crypto/bn/bn.mul

crypto/bn/bn_add.c

crypto/bn/bn_asm.c

crypto/bn/bn_blind.c

crypto/bn/bn_const.c

crypto/bn/bn_ctx.c

crypto/bn/bn_depr.c

crypto/bn/bn_div.c

crypto/bn/bn_err.c

crypto/bn/bn_exp.c

crypto/bn/bn_exp2.c

crypto/bn/bn_gcd.c

crypto/bn/bn_gf2m.c

crypto/bn/bn_kron.c

crypto/bn/bn_lcl.h

crypto/bn/bn_lib.c

crypto/bn/bn_mod.c

crypto/bn/bn_mont.c

crypto/bn/bn_mpi.c

crypto/bn/bn_mul.c

crypto/bn/bn_nist.c

crypto/bn/bn_opt.c

crypto/bn/bn_prime.c

crypto/bn/bn_prime.h

crypto/bn/bn_prime.pl

crypto/bn/bn_print.c

crypto/bn/bn_rand.c

crypto/bn/bn_recp.c

crypto/bn/bn_shift.c

crypto/bn/bn_sqr.c

crypto/bn/bn_sqrt.c

crypto/bn/bn_word.c

crypto/bn/bn_x931p.c

crypto/bn/bnspeed.c

crypto/bn/bntest.c

crypto/bn/divtest.c

crypto/bn/exp.c

crypto/bn/expspeed.c

crypto/bn/exptest.c

crypto/bn/todo

crypto/bn/vms-helper.c

crypto/buffer

crypto/buffer/Makefile

crypto/buffer/buf_err.c

crypto/buffer/buf_str.c

crypto/buffer/buffer.c

crypto/buffer/buffer.h

crypto/camellia

crypto/camellia/Makefile

crypto/camellia/camellia.c

crypto/camellia/camellia.h

crypto/camellia/cmll_cbc.c

crypto/camellia/cmll_cfb.c

crypto/camellia/cmll_ctr.c

crypto/camellia/cmll_ecb.c

crypto/camellia/cmll_locl.h

crypto/camellia/cmll_misc.c

crypto/camellia/cmll_ofb.c

crypto/cast

crypto/cast/Makefile

crypto/cast/asm

crypto/cast/asm/cast-586.pl

crypto/cast/asm/readme

crypto/cast/c_cfb64.c

crypto/cast/c_ecb.c

crypto/cast/c_enc.c

crypto/cast/c_ofb64.c

crypto/cast/c_skey.c

crypto/cast/cast.h

crypto/cast/cast_lcl.h

crypto/cast/cast_s.h

crypto/cast/cast_spd.c

crypto/cast/castopts.c

crypto/cast/casts.cpp

crypto/cast/casttest.c

crypto/cms

crypto/cms/Makefile

crypto/cms/cms.h

crypto/cms/cms_asn1.c

crypto/cms/cms_att.c

crypto/cms/cms_cd.c

crypto/cms/cms_dd.c

crypto/cms/cms_enc.c

crypto/cms/cms_env.c

crypto/cms/cms_err.c

crypto/cms/cms_ess.c

crypto/cms/cms_io.c

crypto/cms/cms_lcl.h

crypto/cms/cms_lib.c

crypto/cms/cms_sd.c

crypto/cms/cms_smime.c

crypto/comp

crypto/comp/Makefile

crypto/comp/c_rle.c

crypto/comp/c_zlib.c

crypto/comp/comp.h

crypto/comp/comp_err.c

crypto/comp/comp_lib.c

crypto/conf

crypto/conf/Makefile

crypto/conf/README

crypto/conf/cnf_save.c

crypto/conf/conf.h

crypto/conf/conf_api.c

crypto/conf/conf_api.h

crypto/conf/conf_def.c

crypto/conf/conf_def.h

crypto/conf/conf_err.c

crypto/conf/conf_lib.c

crypto/conf/conf_mall.c

crypto/conf/conf_mod.c

crypto/conf/conf_sap.c

crypto/conf/keysets.pl

crypto/conf/ssleay.cnf

crypto/conf/test.c

crypto/cpt_err.c

crypto/cryptlib.c

crypto/cryptlib.h

crypto/crypto-lib.com

crypto/crypto.h

crypto/cversion.c

crypto/des

crypto/des/COPYRIGHT

crypto/des/DES.pm

crypto/des/DES.xs

crypto/des/FILES0

crypto/des/INSTALL

crypto/des/Imakefile

crypto/des/KERBEROS

crypto/des/Makefile

crypto/des/README

crypto/des/VERSION

crypto/des/asm

crypto/des/asm/crypt586.pl

crypto/des/asm/des-586.pl

crypto/des/asm/des686.pl

crypto/des/asm/des_enc.m4

crypto/des/asm/desboth.pl

crypto/des/asm/readme

crypto/des/cbc3_enc.c

crypto/des/cbc_cksm.c

crypto/des/cbc_enc.c

crypto/des/cfb64ede.c

crypto/des/cfb64enc.c

crypto/des/cfb_enc.c

crypto/des/des-lib.com

crypto/des/des.c

crypto/des/des.h

crypto/des/des.pod

crypto/des/des3s.cpp

crypto/des/des_enc.c

crypto/des/des_lib.c

crypto/des/des_locl.h

crypto/des/des_old.c

crypto/des/des_old.h

crypto/des/des_old2.c

crypto/des/des_opts.c

crypto/des/des_ver.h

crypto/des/dess.cpp

crypto/des/destest.c

crypto/des/ecb3_enc.c

crypto/des/ecb_enc.c

crypto/des/ede_cbcm_enc.c

crypto/des/enc_read.c

crypto/des/enc_writ.c

crypto/des/fcrypt.c

crypto/des/fcrypt_b.c

crypto/des/makefile.bc

crypto/des/ncbc_enc.c

crypto/des/ofb64ede.c

crypto/des/ofb64enc.c

crypto/des/ofb_enc.c

crypto/des/options.txt

crypto/des/pcbc_enc.c

crypto/des/qud_cksm.c

crypto/des/rand_key.c

crypto/des/read2pwd.c

crypto/des/read_pwd.c

crypto/des/rpc_des.h

crypto/des/rpc_enc.c

crypto/des/rpw.c

crypto/des/set_key.c

crypto/des/speed.c

crypto/des/spr.h

crypto/des/str2key.c

crypto/des/t

crypto/des/t/test

crypto/des/times

crypto/des/times/486-50.sol

crypto/des/times/586-100.lnx

crypto/des/times/686-200.fre

crypto/des/times/aix.cc

crypto/des/times/alpha.cc

crypto/des/times/hpux.cc

crypto/des/times/sparc.gcc

crypto/des/times/usparc.cc

crypto/des/typemap

crypto/des/xcbc_enc.c

crypto/dh

crypto/dh/Makefile

crypto/dh/dh.h

crypto/dh/dh1024.pem

crypto/dh/dh192.pem

crypto/dh/dh2048.pem

crypto/dh/dh4096.pem

crypto/dh/dh512.pem

crypto/dh/dh_asn1.c

crypto/dh/dh_check.c

crypto/dh/dh_depr.c

crypto/dh/dh_err.c

crypto/dh/dh_gen.c

crypto/dh/dh_key.c

crypto/dh/dh_lib.c

crypto/dh/dhtest.c

crypto/dh/example

crypto/dh/generate

crypto/dh/p1024.c

crypto/dh/p192.c

crypto/dh/p512.c

crypto/dsa

crypto/dsa/Makefile

crypto/dsa/README

crypto/dsa/dsa.h

crypto/dsa/dsa_asn1.c

crypto/dsa/dsa_depr.c

crypto/dsa/dsa_err.c

crypto/dsa/dsa_gen.c

crypto/dsa/dsa_key.c

crypto/dsa/dsa_lib.c

crypto/dsa/dsa_ossl.c

crypto/dsa/dsa_sign.c

crypto/dsa/dsa_utl.c

crypto/dsa/dsa_vrf.c

crypto/dsa/dsagen.c

crypto/dsa/dsatest.c

crypto/dsa/fips186a.txt

crypto/dso

crypto/dso/Makefile

crypto/dso/README

crypto/dso/dso.h

crypto/dso/dso_dl.c

crypto/dso/dso_dlfcn.c

crypto/dso/dso_err.c

crypto/dso/dso_lib.c

crypto/dso/dso_null.c

crypto/dso/dso_openssl.c

crypto/dso/dso_vms.c

crypto/dso/dso_win32.c

crypto/dyn_lck.c

crypto/ebcdic.c

crypto/ebcdic.h

crypto/ec

crypto/ec/Makefile

crypto/ec/ec.h

crypto/ec/ec2_mult.c

crypto/ec/ec2_smpl.c

crypto/ec/ec2_smpt.c

crypto/ec/ec_asn1.c

crypto/ec/ec_check.c

crypto/ec/ec_curve.c

crypto/ec/ec_cvt.c

crypto/ec/ec_err.c

crypto/ec/ec_key.c

crypto/ec/ec_lcl.h

crypto/ec/ec_lib.c

crypto/ec/ec_mult.c

crypto/ec/ec_print.c

crypto/ec/ecp_mont.c

crypto/ec/ecp_nist.c

crypto/ec/ecp_smpl.c

crypto/ec/ectest.c

crypto/ecdh

crypto/ecdh/Makefile

crypto/ecdh/ecdh.h

crypto/ecdh/ecdhtest.c

crypto/ecdh/ech_err.c

crypto/ecdh/ech_key.c

crypto/ecdh/ech_lib.c

crypto/ecdh/ech_locl.h

crypto/ecdh/ech_ossl.c

crypto/ecdsa

crypto/ecdsa/Makefile

crypto/ecdsa/ecdsa.h

crypto/ecdsa/ecdsatest.c

crypto/ecdsa/ecs_asn1.c

crypto/ecdsa/ecs_err.c

crypto/ecdsa/ecs_lib.c

crypto/ecdsa/ecs_locl.h

crypto/ecdsa/ecs_ossl.c

crypto/ecdsa/ecs_sign.c

crypto/ecdsa/ecs_vrf.c

crypto/engine

crypto/engine/Makefile

crypto/engine/README

crypto/engine/eng_all.c

crypto/engine/eng_cnf.c

crypto/engine/eng_cryptodev.c

crypto/engine/eng_ctrl.c

crypto/engine/eng_dyn.c

crypto/engine/eng_err.c

crypto/engine/eng_fat.c

crypto/engine/eng_init.c

crypto/engine/eng_int.h

crypto/engine/eng_lib.c

crypto/engine/eng_list.c

crypto/engine/eng_openssl.c

crypto/engine/eng_padlock.c

crypto/engine/eng_pkey.c

crypto/engine/eng_table.c

crypto/engine/engine.h

crypto/engine/enginetest.c

crypto/engine/tb_cipher.c

crypto/engine/tb_dh.c

crypto/engine/tb_digest.c

crypto/engine/tb_dsa.c

crypto/engine/tb_ecdh.c

crypto/engine/tb_ecdsa.c

crypto/engine/tb_rand.c

crypto/engine/tb_rsa.c

crypto/engine/tb_store.c

crypto/err

crypto/err/Makefile

crypto/err/err.c

crypto/err/err.h

crypto/err/err_all.c

crypto/err/err_bio.c

crypto/err/err_def.c

crypto/err/err_prn.c

crypto/err/err_str.c

crypto/err/openssl.ec

crypto/evp

crypto/evp/Makefile

crypto/evp/bio_b64.c

crypto/evp/bio_enc.c

crypto/evp/bio_md.c

crypto/evp/bio_ok.c

crypto/evp/c_all.c

crypto/evp/c_allc.c

crypto/evp/c_alld.c

crypto/evp/dig_eng.c

crypto/evp/digest.c

crypto/evp/e_aes.c

crypto/evp/e_bf.c

crypto/evp/e_camellia.c

crypto/evp/e_cast.c

crypto/evp/e_des.c

crypto/evp/e_des3.c

crypto/evp/e_dsa.c

crypto/evp/e_idea.c

crypto/evp/e_null.c

crypto/evp/e_old.c

crypto/evp/e_rc2.c

crypto/evp/e_rc4.c

crypto/evp/e_rc5.c

crypto/evp/e_seed.c

crypto/evp/e_xcbc_d.c

crypto/evp/enc_min.c

crypto/evp/encode.c

crypto/evp/evp.h

crypto/evp/evp_acnf.c

crypto/evp/evp_cnf.c

crypto/evp/evp_enc.c

crypto/evp/evp_err.c

crypto/evp/evp_key.c

crypto/evp/evp_lib.c

crypto/evp/evp_locl.h

crypto/evp/evp_pbe.c

crypto/evp/evp_pkey.c

crypto/evp/evp_test.c

crypto/evp/evptests.txt

crypto/evp/m_dss.c

crypto/evp/m_dss1.c

crypto/evp/m_ecdsa.c

crypto/evp/m_md2.c

crypto/evp/m_md4.c

crypto/evp/m_md5.c

crypto/evp/m_mdc2.c

crypto/evp/m_null.c

crypto/evp/m_ripemd.c

crypto/evp/m_sha.c

crypto/evp/m_sha1.c

crypto/evp/names.c

crypto/evp/openbsd_hw.c

crypto/evp/p5_crpt.c

crypto/evp/p5_crpt2.c

crypto/evp/p_dec.c

crypto/evp/p_enc.c

crypto/evp/p_lib.c

crypto/evp/p_open.c

crypto/evp/p_seal.c

crypto/evp/p_sign.c

crypto/evp/p_verify.c

crypto/ex_data.c

crypto/fips_err.c

crypto/fips_err.h

crypto/hmac

crypto/hmac/Makefile

crypto/hmac/hmac.c

crypto/hmac/hmac.h

crypto/hmac/hmactest.c

crypto/ia64cpuid.S

crypto/idea

crypto/idea/Makefile

crypto/idea/i_cbc.c

crypto/idea/i_cfb64.c

crypto/idea/i_ecb.c

crypto/idea/i_ofb64.c

crypto/idea/i_skey.c

crypto/idea/idea.h

crypto/idea/idea_lcl.h

crypto/idea/idea_spd.c

crypto/idea/ideatest.c

crypto/idea/version

crypto/install.com

crypto/jpake

crypto/jpake/Makefile

crypto/jpake/jpake.c

crypto/jpake/jpake.h

crypto/jpake/jpake_err.c

crypto/jpake/jpaketest.c

crypto/krb5

crypto/krb5/Makefile

crypto/krb5/krb5_asn.c

crypto/krb5/krb5_asn.h

crypto/lhash

crypto/lhash/Makefile

crypto/lhash/lh_stats.c

crypto/lhash/lh_test.c

crypto/lhash/lhash.c

crypto/lhash/lhash.h

crypto/lhash/num.pl

crypto/md2

crypto/md2/Makefile

crypto/md2/md2.c

crypto/md2/md2.h

crypto/md2/md2_dgst.c

crypto/md2/md2_one.c

crypto/md2/md2test.c

crypto/md32_common.h

crypto/md4

crypto/md4/Makefile

crypto/md4/md4.c

crypto/md4/md4.h

crypto/md4/md4_dgst.c

crypto/md4/md4_locl.h

crypto/md4/md4_one.c

crypto/md4/md4s.cpp

crypto/md4/md4test.c

crypto/md5

crypto/md5/Makefile

crypto/md5/asm

crypto/md5/asm/md5-586.pl

crypto/md5/asm/md5-x86_64.pl

crypto/md5/md5.c

crypto/md5/md5.h

crypto/md5/md5_dgst.c

crypto/md5/md5_locl.h

crypto/md5/md5_one.c

crypto/md5/md5s.cpp

crypto/md5/md5test.c

crypto/mdc2

crypto/mdc2/Makefile

crypto/mdc2/mdc2.h

crypto/mdc2/mdc2_one.c

crypto/mdc2/mdc2dgst.c

crypto/mdc2/mdc2test.c

crypto/mem.c

crypto/mem_clr.c

crypto/mem_dbg.c

crypto/o_dir.c

crypto/o_dir.h

crypto/o_dir_test.c

crypto/o_init.c

crypto/o_str.c

crypto/o_str.h

crypto/o_time.c

crypto/o_time.h

crypto/objects

crypto/objects/Makefile

crypto/objects/o_names.c

crypto/objects/obj_dat.c

crypto/objects/obj_dat.h

crypto/objects/obj_dat.pl

crypto/objects/obj_err.c

crypto/objects/obj_lib.c

crypto/objects/obj_mac.h

crypto/objects/obj_mac.num

crypto/objects/objects.README

crypto/objects/objects.h

crypto/objects/objects.pl

crypto/objects/objects.txt

crypto/ocsp

crypto/ocsp/Makefile

crypto/ocsp/ocsp.h

crypto/ocsp/ocsp_asn.c

crypto/ocsp/ocsp_cl.c

crypto/ocsp/ocsp_err.c

crypto/ocsp/ocsp_ext.c

crypto/ocsp/ocsp_ht.c

crypto/ocsp/ocsp_lib.c

crypto/ocsp/ocsp_prn.c

crypto/ocsp/ocsp_srv.c

crypto/ocsp/ocsp_vfy.c

crypto/opensslconf.h

crypto/opensslconf.h.in

crypto/opensslv.h

crypto/ossl_typ.h

crypto/pem

crypto/pem/Makefile

crypto/pem/message

crypto/pem/pem.h

crypto/pem/pem2.h

crypto/pem/pem_all.c

crypto/pem/pem_err.c

crypto/pem/pem_info.c

crypto/pem/pem_lib.c

crypto/pem/pem_oth.c

crypto/pem/pem_pk8.c

crypto/pem/pem_pkey.c

crypto/pem/pem_seal.c

crypto/pem/pem_sign.c

crypto/pem/pem_x509.c

crypto/pem/pem_xaux.c

crypto/pem/pkcs7.lis

crypto/perlasm

crypto/perlasm/cbc.pl

crypto/perlasm/readme

crypto/perlasm/x86_64-xlate.pl

crypto/perlasm/x86asm.pl

crypto/perlasm/x86ms.pl

crypto/perlasm/x86nasm.pl

crypto/perlasm/x86unix.pl

crypto/pkcs12

crypto/pkcs12/Makefile

crypto/pkcs12/p12_add.c

crypto/pkcs12/p12_asn.c

crypto/pkcs12/p12_attr.c

crypto/pkcs12/p12_crpt.c

crypto/pkcs12/p12_crt.c

crypto/pkcs12/p12_decr.c

crypto/pkcs12/p12_init.c

crypto/pkcs12/p12_key.c

crypto/pkcs12/p12_kiss.c

crypto/pkcs12/p12_mutl.c

crypto/pkcs12/p12_npas.c

crypto/pkcs12/p12_p8d.c

crypto/pkcs12/p12_p8e.c

crypto/pkcs12/p12_utl.c

crypto/pkcs12/pk12err.c

crypto/pkcs12/pkcs12.h

crypto/pkcs7

crypto/pkcs7/Makefile

crypto/pkcs7/bio_ber.c

crypto/pkcs7/dec.c

crypto/pkcs7/des.pem

crypto/pkcs7/doc

crypto/pkcs7/enc.c

crypto/pkcs7/es1.pem

crypto/pkcs7/example.c

crypto/pkcs7/example.h

crypto/pkcs7/info.pem

crypto/pkcs7/infokey.pem

crypto/pkcs7/p7

crypto/pkcs7/p7/a1

crypto/pkcs7/p7/a2

crypto/pkcs7/p7/cert.p7c

crypto/pkcs7/p7/smime.p7m

crypto/pkcs7/p7/smime.p7s

crypto/pkcs7/pk7_asn1.c

crypto/pkcs7/pk7_attr.c

crypto/pkcs7/pk7_dgst.c

crypto/pkcs7/pk7_doit.c

crypto/pkcs7/pk7_enc.c

crypto/pkcs7/pk7_lib.c

crypto/pkcs7/pk7_mime.c

crypto/pkcs7/pk7_smime.c

crypto/pkcs7/pkcs7.h

crypto/pkcs7/pkcs7err.c

crypto/pkcs7/server.pem

crypto/pkcs7/sign.c

crypto/pkcs7/t

crypto/pkcs7/t/3des.pem

crypto/pkcs7/t/3dess.pem

crypto/pkcs7/t/c.pem

crypto/pkcs7/t/ff

crypto/pkcs7/t/msie-e

crypto/pkcs7/t/msie-e.pem

crypto/pkcs7/t/msie-enc-01

crypto/pkcs7/t/msie-enc-01.pem

crypto/pkcs7/t/msie-enc-02

crypto/pkcs7/t/msie-enc-02.pem

crypto/pkcs7/t/msie-s-a-e

crypto/pkcs7/t/msie-s-a-e.pem

crypto/pkcs7/t/nav-smime

crypto/pkcs7/t/s.pem

crypto/pkcs7/t/server.pem

crypto/pkcs7/verify.c

crypto/pqueue

crypto/pqueue/Makefile

crypto/pqueue/pq_compat.h

crypto/pqueue/pq_test.c

crypto/pqueue/pqueue.c

crypto/pqueue/pqueue.h

crypto/rand

crypto/rand/Makefile

crypto/rand/md_rand.c

crypto/rand/rand.h

crypto/rand/rand_egd.c

crypto/rand/rand_eng.c

crypto/rand/rand_err.c

crypto/rand/rand_lcl.h

crypto/rand/rand_lib.c

crypto/rand/rand_nw.c

crypto/rand/rand_os2.c

crypto/rand/rand_unix.c

crypto/rand/rand_vms.c

crypto/rand/rand_win.c

crypto/rand/randfile.c

crypto/rand/randtest.c

crypto/rc2

crypto/rc2/Makefile

crypto/rc2/rc2.h

crypto/rc2/rc2_cbc.c

crypto/rc2/rc2_ecb.c

crypto/rc2/rc2_locl.h

crypto/rc2/rc2_skey.c

crypto/rc2/rc2cfb64.c

crypto/rc2/rc2ofb64.c

crypto/rc2/rc2speed.c

crypto/rc2/rc2test.c

crypto/rc2/rrc2.doc

crypto/rc2/tab.c

crypto/rc2/version

crypto/rc4

crypto/rc4/Makefile

crypto/rc4/asm

crypto/rc4/asm/rc4-586.pl

crypto/rc4/asm/rc4-ia64.S

crypto/rc4/asm/rc4-x86_64.pl

crypto/rc4/rc4.c

crypto/rc4/rc4.h

crypto/rc4/rc4_enc.c

crypto/rc4/rc4_fblk.c

crypto/rc4/rc4_locl.h

crypto/rc4/rc4_skey.c

crypto/rc4/rc4s.cpp

crypto/rc4/rc4speed.c

crypto/rc4/rc4test.c

crypto/rc4/rrc4.doc

crypto/rc5

crypto/rc5/Makefile

crypto/rc5/asm

crypto/rc5/asm/rc5-586.pl

crypto/rc5/rc5.h

crypto/rc5/rc5_ecb.c

crypto/rc5/rc5_enc.c

crypto/rc5/rc5_locl.h

crypto/rc5/rc5_skey.c

crypto/rc5/rc5cfb64.c

crypto/rc5/rc5ofb64.c

crypto/rc5/rc5s.cpp

crypto/rc5/rc5speed.c

crypto/rc5/rc5test.c

crypto/ripemd

crypto/ripemd/Makefile

crypto/ripemd/README

crypto/ripemd/asm

crypto/ripemd/asm/rips.cpp

crypto/ripemd/asm/rmd-586.pl

crypto/ripemd/ripemd.h

crypto/ripemd/rmd160.c

crypto/ripemd/rmd_dgst.c

crypto/ripemd/rmd_locl.h

crypto/ripemd/rmd_one.c

crypto/ripemd/rmdconst.h

crypto/ripemd/rmdtest.c

crypto/rsa

crypto/rsa/Makefile

crypto/rsa/rsa.h

crypto/rsa/rsa_asn1.c

crypto/rsa/rsa_chk.c

crypto/rsa/rsa_depr.c

crypto/rsa/rsa_eay.c

crypto/rsa/rsa_eng.c

crypto/rsa/rsa_err.c

crypto/rsa/rsa_gen.c

crypto/rsa/rsa_lib.c

crypto/rsa/rsa_none.c

crypto/rsa/rsa_null.c

crypto/rsa/rsa_oaep.c

crypto/rsa/rsa_pk1.c

crypto/rsa/rsa_pss.c

crypto/rsa/rsa_saos.c

crypto/rsa/rsa_sign.c

crypto/rsa/rsa_ssl.c

crypto/rsa/rsa_test.c

crypto/rsa/rsa_x931.c

crypto/rsa/rsa_x931g.c

crypto/seed

crypto/seed/Makefile

crypto/seed/seed.c

crypto/seed/seed.h

crypto/seed/seed_cbc.c

crypto/seed/seed_cfb.c

crypto/seed/seed_ecb.c

crypto/seed/seed_locl.h

crypto/seed/seed_ofb.c

crypto/sha

crypto/sha/Makefile

crypto/sha/asm

crypto/sha/asm/README

crypto/sha/asm/sha1-586.pl

crypto/sha/asm/sha1-ia64.pl

crypto/sha/asm/sha1-x86_64.pl

crypto/sha/asm/sha512-ia64.pl

crypto/sha/asm/sha512-sse2.pl

crypto/sha/asm/sha512-x86_64.pl

crypto/sha/sha.c

crypto/sha/sha.h

crypto/sha/sha1.c

crypto/sha/sha1_one.c

crypto/sha/sha1dgst.c

crypto/sha/sha1s.cpp

crypto/sha/sha1test.c

crypto/sha/sha256.c

crypto/sha/sha256t.c

crypto/sha/sha512.c

crypto/sha/sha512t.c

crypto/sha/sha_dgst.c

crypto/sha/sha_locl.h

crypto/sha/sha_one.c

crypto/sha/shatest.c

crypto/sparccpuid.S

crypto/stack

crypto/stack/Makefile

crypto/stack/safestack.h

crypto/stack/stack.c

crypto/stack/stack.h

crypto/store

crypto/store/Makefile

crypto/store/README

crypto/store/store.h

crypto/store/str_err.c

crypto/store/str_lib.c

crypto/store/str_locl.h

crypto/store/str_mem.c

crypto/store/str_meth.c

crypto/symhacks.h

crypto/threads

crypto/threads/README

crypto/threads/mttest.c

crypto/threads/netware.bat

crypto/threads/profile.sh

crypto/threads/ptest.bat

crypto/threads/pthread.sh

crypto/threads/pthread2.sh

crypto/threads/pthreads-vms.com

crypto/threads/purify.sh

crypto/threads/solaris.sh

crypto/threads/th-lock.c

crypto/threads/win32.bat

crypto/tmdiff.c

crypto/tmdiff.h

crypto/txt_db

crypto/txt_db/Makefile

crypto/txt_db/txt_db.c

crypto/txt_db/txt_db.h

crypto/ui

crypto/ui/Makefile

crypto/ui/ui.h

crypto/ui/ui_compat.c

crypto/ui/ui_compat.h

crypto/ui/ui_err.c

crypto/ui/ui_lib.c

crypto/ui/ui_locl.h

crypto/ui/ui_openssl.c

crypto/ui/ui_util.c

crypto/uid.c

crypto/x509

crypto/x509/Makefile

crypto/x509/by_dir.c

crypto/x509/by_file.c

crypto/x509/x509.h

crypto/x509/x509_att.c

crypto/x509/x509_cmp.c

crypto/x509/x509_d2.c

crypto/x509/x509_def.c

crypto/x509/x509_err.c

crypto/x509/x509_ext.c

crypto/x509/x509_lu.c

crypto/x509/x509_obj.c

crypto/x509/x509_r2x.c

crypto/x509/x509_req.c

crypto/x509/x509_set.c

crypto/x509/x509_trs.c

crypto/x509/x509_txt.c

crypto/x509/x509_v3.c

crypto/x509/x509_vfy.c

crypto/x509/x509_vfy.h

crypto/x509/x509_vpm.c

crypto/x509/x509cset.c

crypto/x509/x509name.c

crypto/x509/x509rset.c

crypto/x509/x509spki.c

crypto/x509/x509type.c

crypto/x509/x_all.c

crypto/x509v3

crypto/x509v3/Makefile

crypto/x509v3/ext_dat.h

crypto/x509v3/pcy_cache.c

crypto/x509v3/pcy_data.c

crypto/x509v3/pcy_int.h

crypto/x509v3/pcy_lib.c

crypto/x509v3/pcy_map.c

crypto/x509v3/pcy_node.c

crypto/x509v3/pcy_tree.c

crypto/x509v3/tabtest.c

crypto/x509v3/v3_addr.c

crypto/x509v3/v3_akey.c

crypto/x509v3/v3_akeya.c

crypto/x509v3/v3_alt.c

crypto/x509v3/v3_asid.c

crypto/x509v3/v3_bcons.c

crypto/x509v3/v3_bitst.c

crypto/x509v3/v3_conf.c

crypto/x509v3/v3_cpols.c

crypto/x509v3/v3_crld.c

crypto/x509v3/v3_enum.c

crypto/x509v3/v3_extku.c

crypto/x509v3/v3_genn.c

crypto/x509v3/v3_ia5.c

crypto/x509v3/v3_info.c

crypto/x509v3/v3_int.c

crypto/x509v3/v3_lib.c

crypto/x509v3/v3_ncons.c

crypto/x509v3/v3_ocsp.c

crypto/x509v3/v3_pci.c

crypto/x509v3/v3_pcia.c

crypto/x509v3/v3_pcons.c

crypto/x509v3/v3_pku.c

crypto/x509v3/v3_pmaps.c

crypto/x509v3/v3_prn.c

crypto/x509v3/v3_purp.c

crypto/x509v3/v3_skey.c

crypto/x509v3/v3_sxnet.c

crypto/x509v3/v3_utl.c

crypto/x509v3/v3conf.c

crypto/x509v3/v3err.c

crypto/x509v3/v3prin.c

crypto/x509v3/x509v3.h

crypto/x86_64cpuid.pl

crypto/x86cpuid.pl

demos

demos/README

demos/asn1

demos/asn1/README.ASN1

demos/asn1/ocsp.c

demos/b64.c

demos/b64.pl

demos/bio

demos/bio/Makefile

demos/bio/README

demos/bio/saccept.c

demos/bio/sconnect.c

demos/bio/server.pem

demos/easy_tls

demos/easy_tls/Makefile

demos/easy_tls/README

demos/easy_tls/cacerts.pem

demos/easy_tls/cert.pem

demos/easy_tls/easy-tls.c

demos/easy_tls/easy-tls.h

demos/easy_tls/test.c

demos/easy_tls/test.h

demos/eay

demos/eay/Makefile

demos/eay/base64.c

demos/eay/conn.c

demos/eay/loadrsa.c

demos/engines

demos/engines/cluster_labs

demos/engines/cluster_labs/Makefile

demos/engines/cluster_labs/cluster_labs.h

demos/engines/cluster_labs/hw_cluster_labs.c

demos/engines/cluster_labs/hw_cluster_labs.ec

demos/engines/cluster_labs/hw_cluster_labs_err.c

demos/engines/cluster_labs/hw_cluster_labs_err.h

demos/engines/ibmca

demos/engines/ibmca/Makefile

demos/engines/ibmca/hw_ibmca.c

demos/engines/ibmca/hw_ibmca.ec

demos/engines/ibmca/hw_ibmca_err.c

demos/engines/ibmca/hw_ibmca_err.h

demos/engines/ibmca/ica_openssl_api.h

demos/engines/rsaref

demos/engines/rsaref/Makefile

demos/engines/rsaref/README

demos/engines/rsaref/build.com

demos/engines/rsaref/rsaref.c

demos/engines/rsaref/rsaref.ec

demos/engines/rsaref/rsaref_err.c

demos/engines/rsaref/rsaref_err.h

demos/engines/zencod

demos/engines/zencod/Makefile

demos/engines/zencod/hw_zencod.c

demos/engines/zencod/hw_zencod.ec

demos/engines/zencod/hw_zencod.h

demos/engines/zencod/hw_zencod_err.c

demos/engines/zencod/hw_zencod_err.h

demos/jpake

demos/jpake/Makefile

demos/jpake/jpakedemo.c

demos/maurice

demos/maurice/Makefile

demos/maurice/README

demos/maurice/cert.pem

demos/maurice/example1.c

demos/maurice/example2.c

demos/maurice/example3.c

demos/maurice/example4.c

demos/maurice/loadkeys.c

demos/maurice/loadkeys.h

demos/maurice/privkey.pem

demos/pkcs12

demos/pkcs12/README

demos/pkcs12/pkread.c

demos/pkcs12/pkwrite.c

demos/prime

demos/prime/Makefile

demos/prime/prime.c

demos/privkey.pem

demos/selfsign.c

demos/sign

demos/sign/Makefile

demos/sign/cert.pem

demos/sign/key.pem

demos/sign/sig.txt

demos/sign/sign.c

demos/sign/sign.txt

demos/spkigen.c

demos/ssl

demos/ssl/cli.cpp

demos/ssl/inetdsrv.cpp

demos/ssl/serv.cpp

demos/ssltest-ecc

demos/ssltest-ecc/ECC-RSAcertgen.sh

demos/ssltest-ecc/ECCcertgen.sh

demos/ssltest-ecc/README

demos/ssltest-ecc/RSAcertgen.sh

demos/ssltest-ecc/ssltest.sh

demos/state_machine

demos/state_machine/Makefile

demos/state_machine/state_machine.c

demos/tunala

demos/tunala/A-client.pem

demos/tunala/A-server.pem

demos/tunala/CA.pem

demos/tunala/INSTALL

demos/tunala/Makefile

demos/tunala/Makefile.am

demos/tunala/README

demos/tunala/autogunk.sh

demos/tunala/autoungunk.sh

demos/tunala/breakage.c

demos/tunala/buffer.c

demos/tunala/cb.c

demos/tunala/configure.in

demos/tunala/ip.c

demos/tunala/sm.c

demos/tunala/test.sh

demos/tunala/tunala.c

demos/tunala/tunala.h

demos/x509

demos/x509/README

demos/x509/mkcert.c

demos/x509/mkreq.c

doc/HOWTO

doc/HOWTO/certificates.txt

doc/HOWTO/keys.txt

doc/HOWTO/proxy_certificates.txt

doc/README

doc/apps

doc/apps/CA.pl.pod

doc/apps/asn1parse.pod

doc/apps/ca.pod

doc/apps/ciphers.pod

doc/apps/config.pod

doc/apps/crl.pod

doc/apps/crl2pkcs7.pod

doc/apps/dgst.pod

doc/apps/dhparam.pod

doc/apps/dsa.pod

doc/apps/dsaparam.pod

doc/apps/ec.pod

doc/apps/ecparam.pod

doc/apps/enc.pod

doc/apps/errstr.pod

doc/apps/gendsa.pod

doc/apps/genrsa.pod

doc/apps/nseq.pod

doc/apps/ocsp.pod

doc/apps/openssl.pod

doc/apps/passwd.pod

doc/apps/pkcs12.pod

doc/apps/pkcs7.pod

doc/apps/pkcs8.pod

doc/apps/rand.pod

doc/apps/req.pod

doc/apps/rsa.pod

doc/apps/rsautl.pod

doc/apps/s_client.pod

doc/apps/s_server.pod

doc/apps/s_time.pod

doc/apps/sess_id.pod

doc/apps/smime.pod

doc/apps/speed.pod

doc/apps/spkac.pod

doc/apps/verify.pod

doc/apps/version.pod

doc/apps/x509.pod

doc/apps/x509v3_config.pod

doc/c-indentation.el

doc/crypto

doc/crypto/ASN1_OBJECT_new.pod

doc/crypto/ASN1_STRING_length.pod

doc/crypto/ASN1_STRING_new.pod

doc/crypto/ASN1_STRING_print_ex.pod

doc/crypto/ASN1_generate_nconf.pod

doc/crypto/BIO_ctrl.pod

doc/crypto/BIO_f_base64.pod

doc/crypto/BIO_f_buffer.pod

doc/crypto/BIO_f_cipher.pod

doc/crypto/BIO_f_md.pod

doc/crypto/BIO_f_null.pod

doc/crypto/BIO_f_ssl.pod

doc/crypto/BIO_find_type.pod

doc/crypto/BIO_new.pod

doc/crypto/BIO_push.pod

doc/crypto/BIO_read.pod

doc/crypto/BIO_s_accept.pod

doc/crypto/BIO_s_bio.pod

doc/crypto/BIO_s_connect.pod

doc/crypto/BIO_s_fd.pod

doc/crypto/BIO_s_file.pod

doc/crypto/BIO_s_mem.pod

doc/crypto/BIO_s_null.pod

doc/crypto/BIO_s_socket.pod

doc/crypto/BIO_set_callback.pod

doc/crypto/BIO_should_retry.pod

doc/crypto/BN_BLINDING_new.pod

doc/crypto/BN_CTX_new.pod

doc/crypto/BN_CTX_start.pod

doc/crypto/BN_add.pod

doc/crypto/BN_add_word.pod

doc/crypto/BN_bn2bin.pod

doc/crypto/BN_cmp.pod

doc/crypto/BN_copy.pod

doc/crypto/BN_generate_prime.pod

doc/crypto/BN_mod_inverse.pod

doc/crypto/BN_mod_mul_montgomery.pod

doc/crypto/BN_mod_mul_reciprocal.pod

doc/crypto/BN_new.pod

doc/crypto/BN_num_bytes.pod

doc/crypto/BN_rand.pod

doc/crypto/BN_set_bit.pod

doc/crypto/BN_swap.pod

doc/crypto/BN_zero.pod

doc/crypto/CONF_modules_free.pod

doc/crypto/CONF_modules_load_file.pod

doc/crypto/CRYPTO_set_ex_data.pod

doc/crypto/DH_generate_key.pod

doc/crypto/DH_generate_parameters.pod

doc/crypto/DH_get_ex_new_index.pod

doc/crypto/DH_new.pod

doc/crypto/DH_set_method.pod

doc/crypto/DH_size.pod

doc/crypto/DSA_SIG_new.pod

doc/crypto/DSA_do_sign.pod

doc/crypto/DSA_dup_DH.pod

doc/crypto/DSA_generate_key.pod

doc/crypto/DSA_generate_parameters.pod

doc/crypto/DSA_get_ex_new_index.pod

doc/crypto/DSA_new.pod

doc/crypto/DSA_set_method.pod

doc/crypto/DSA_sign.pod

doc/crypto/DSA_size.pod

doc/crypto/ERR_GET_LIB.pod

doc/crypto/ERR_clear_error.pod

doc/crypto/ERR_error_string.pod

doc/crypto/ERR_get_error.pod

doc/crypto/ERR_load_crypto_strings.pod

doc/crypto/ERR_load_strings.pod

doc/crypto/ERR_print_errors.pod

doc/crypto/ERR_put_error.pod

doc/crypto/ERR_remove_state.pod

doc/crypto/ERR_set_mark.pod

doc/crypto/EVP_BytesToKey.pod

doc/crypto/EVP_DigestInit.pod

doc/crypto/EVP_EncryptInit.pod

doc/crypto/EVP_OpenInit.pod

doc/crypto/EVP_PKEY_new.pod

doc/crypto/EVP_PKEY_set1_RSA.pod

doc/crypto/EVP_SealInit.pod

doc/crypto/EVP_SignInit.pod

doc/crypto/EVP_VerifyInit.pod

doc/crypto/OBJ_nid2obj.pod

doc/crypto/OPENSSL_Applink.pod

doc/crypto/OPENSSL_VERSION_NUMBER.pod

doc/crypto/OPENSSL_config.pod

doc/crypto/OPENSSL_ia32cap.pod

doc/crypto/OPENSSL_load_builtin_modules.pod

doc/crypto/OpenSSL_add_all_algorithms.pod

doc/crypto/PKCS12_create.pod

doc/crypto/PKCS12_parse.pod

doc/crypto/PKCS7_decrypt.pod

doc/crypto/PKCS7_encrypt.pod

doc/crypto/PKCS7_sign.pod

doc/crypto/PKCS7_verify.pod

doc/crypto/RAND_add.pod

doc/crypto/RAND_bytes.pod

doc/crypto/RAND_cleanup.pod

doc/crypto/RAND_egd.pod

doc/crypto/RAND_load_file.pod

doc/crypto/RAND_set_rand_method.pod

doc/crypto/RSA_blinding_on.pod

doc/crypto/RSA_check_key.pod

doc/crypto/RSA_generate_key.pod

doc/crypto/RSA_get_ex_new_index.pod

doc/crypto/RSA_new.pod

doc/crypto/RSA_padding_add_PKCS1_type_1.pod

doc/crypto/RSA_print.pod

doc/crypto/RSA_private_encrypt.pod

doc/crypto/RSA_public_encrypt.pod

doc/crypto/RSA_set_method.pod

doc/crypto/RSA_sign.pod

doc/crypto/RSA_sign_ASN1_OCTET_STRING.pod

doc/crypto/RSA_size.pod

doc/crypto/SMIME_read_PKCS7.pod

doc/crypto/SMIME_write_PKCS7.pod

doc/crypto/X509_NAME_ENTRY_get_object.pod

doc/crypto/X509_NAME_add_entry_by_txt.pod

doc/crypto/X509_NAME_get_index_by_NID.pod

doc/crypto/X509_NAME_print_ex.pod

doc/crypto/X509_new.pod

doc/crypto/bio.pod

doc/crypto/blowfish.pod

doc/crypto/bn.pod

doc/crypto/bn_internal.pod

doc/crypto/buffer.pod

doc/crypto/crypto.pod

doc/crypto/d2i_ASN1_OBJECT.pod

doc/crypto/d2i_DHparams.pod

doc/crypto/d2i_DSAPublicKey.pod

doc/crypto/d2i_PKCS8PrivateKey.pod

doc/crypto/d2i_RSAPublicKey.pod

doc/crypto/d2i_X509.pod

doc/crypto/d2i_X509_ALGOR.pod

doc/crypto/d2i_X509_CRL.pod

doc/crypto/d2i_X509_NAME.pod

doc/crypto/d2i_X509_REQ.pod

doc/crypto/d2i_X509_SIG.pod

doc/crypto/des.pod

doc/crypto/des_modes.pod

doc/crypto/dh.pod

doc/crypto/dsa.pod

doc/crypto/ecdsa.pod

doc/crypto/engine.pod

doc/crypto/err.pod

doc/crypto/evp.pod

doc/crypto/hmac.pod

doc/crypto/lh_stats.pod

doc/crypto/lhash.pod

doc/crypto/md5.pod

doc/crypto/mdc2.pod

doc/crypto/pem.pod

doc/crypto/rand.pod

doc/crypto/rc4.pod

doc/crypto/ripemd.pod

doc/crypto/rsa.pod

doc/crypto/sha.pod

doc/crypto/threads.pod

doc/crypto/ui.pod

doc/crypto/ui_compat.pod

doc/crypto/x509.pod

doc/fingerprints.txt

doc/openssl-shared.txt

doc/openssl.txt

doc/openssl_button.gif

doc/openssl_button.html

doc/ssl

doc/ssl/SSL_CIPHER_get_name.pod

doc/ssl/SSL_COMP_add_compression_method.pod

doc/ssl/SSL_CTX_add_extra_chain_cert.pod

doc/ssl/SSL_CTX_add_session.pod

doc/ssl/SSL_CTX_ctrl.pod

doc/ssl/SSL_CTX_flush_sessions.pod

doc/ssl/SSL_CTX_free.pod

doc/ssl/SSL_CTX_get_ex_new_index.pod

doc/ssl/SSL_CTX_get_verify_mode.pod

doc/ssl/SSL_CTX_load_verify_locations.pod

doc/ssl/SSL_CTX_new.pod

doc/ssl/SSL_CTX_sess_number.pod

doc/ssl/SSL_CTX_sess_set_cache_size.pod

doc/ssl/SSL_CTX_sess_set_get_cb.pod

doc/ssl/SSL_CTX_sessions.pod

doc/ssl/SSL_CTX_set_cert_store.pod

doc/ssl/SSL_CTX_set_cert_verify_callback.pod

doc/ssl/SSL_CTX_set_cipher_list.pod

doc/ssl/SSL_CTX_set_client_CA_list.pod

doc/ssl/SSL_CTX_set_client_cert_cb.pod

doc/ssl/SSL_CTX_set_default_passwd_cb.pod

doc/ssl/SSL_CTX_set_generate_session_id.pod

doc/ssl/SSL_CTX_set_info_callback.pod

doc/ssl/SSL_CTX_set_max_cert_list.pod

doc/ssl/SSL_CTX_set_mode.pod

doc/ssl/SSL_CTX_set_msg_callback.pod

doc/ssl/SSL_CTX_set_options.pod

doc/ssl/SSL_CTX_set_quiet_shutdown.pod

doc/ssl/SSL_CTX_set_session_cache_mode.pod

doc/ssl/SSL_CTX_set_session_id_context.pod

doc/ssl/SSL_CTX_set_ssl_version.pod

doc/ssl/SSL_CTX_set_timeout.pod

doc/ssl/SSL_CTX_set_tmp_dh_callback.pod

doc/ssl/SSL_CTX_set_tmp_rsa_callback.pod

doc/ssl/SSL_CTX_set_verify.pod

doc/ssl/SSL_CTX_use_certificate.pod

doc/ssl/SSL_SESSION_free.pod

doc/ssl/SSL_SESSION_get_ex_new_index.pod

doc/ssl/SSL_SESSION_get_time.pod

doc/ssl/SSL_accept.pod

doc/ssl/SSL_alert_type_string.pod

doc/ssl/SSL_clear.pod

doc/ssl/SSL_connect.pod

doc/ssl/SSL_do_handshake.pod

doc/ssl/SSL_free.pod

doc/ssl/SSL_get_SSL_CTX.pod

doc/ssl/SSL_get_ciphers.pod

doc/ssl/SSL_get_client_CA_list.pod

doc/ssl/SSL_get_current_cipher.pod

doc/ssl/SSL_get_default_timeout.pod

doc/ssl/SSL_get_error.pod

doc/ssl/SSL_get_ex_data_X509_STORE_CTX_idx.pod

doc/ssl/SSL_get_ex_new_index.pod

doc/ssl/SSL_get_fd.pod

doc/ssl/SSL_get_peer_cert_chain.pod

doc/ssl/SSL_get_peer_certificate.pod

doc/ssl/SSL_get_rbio.pod

doc/ssl/SSL_get_session.pod

doc/ssl/SSL_get_verify_result.pod

doc/ssl/SSL_get_version.pod

doc/ssl/SSL_library_init.pod

doc/ssl/SSL_load_client_CA_file.pod

doc/ssl/SSL_new.pod

doc/ssl/SSL_pending.pod

doc/ssl/SSL_read.pod

doc/ssl/SSL_rstate_string.pod

doc/ssl/SSL_session_reused.pod

doc/ssl/SSL_set_bio.pod

doc/ssl/SSL_set_connect_state.pod

doc/ssl/SSL_set_fd.pod

doc/ssl/SSL_set_session.pod

doc/ssl/SSL_set_shutdown.pod

doc/ssl/SSL_set_verify_result.pod

doc/ssl/SSL_shutdown.pod

doc/ssl/SSL_state_string.pod

doc/ssl/SSL_want.pod

doc/ssl/SSL_write.pod

doc/ssl/d2i_SSL_SESSION.pod

doc/ssl/ssl.pod

doc/ssleay.txt

doc/standards.txt

e_os.h

e_os2.h

engines

engines/Makefile

engines/alpha.opt

engines/e_4758cca.c

engines/e_4758cca.ec

engines/e_4758cca_err.c

engines/e_4758cca_err.h

engines/e_aep.c

engines/e_aep.ec

engines/e_aep_err.c

engines/e_aep_err.h

engines/e_atalla.c

engines/e_atalla.ec

engines/e_atalla_err.c

engines/e_atalla_err.h

engines/e_capi.c

engines/e_capi.ec

engines/e_capi_err.c

engines/e_capi_err.h

engines/e_chil.c

engines/e_chil.ec

engines/e_chil_err.c

engines/e_chil_err.h

engines/e_cswift.c

engines/e_cswift.ec

engines/e_cswift_err.c

engines/e_cswift_err.h

engines/e_gmp.c

engines/e_gmp.ec

engines/e_gmp_err.c

engines/e_gmp_err.h

engines/e_nuron.c

engines/e_nuron.ec

engines/e_nuron_err.c

engines/e_nuron_err.h

engines/e_sureware.c

engines/e_sureware.ec

engines/e_sureware_err.c

engines/e_sureware_err.h

engines/e_ubsec.c

engines/e_ubsec.ec

engines/e_ubsec_err.c

engines/e_ubsec_err.h

engines/engine_vector.mar

engines/ia64.opt

engines/makeengines.com

engines/vax.opt

engines/vendor_defns

engines/vendor_defns/aep.h

engines/vendor_defns/atalla.h

engines/vendor_defns/cswift.h

engines/vendor_defns/hw_4758_cca.h

engines/vendor_defns/hw_ubsec.h

engines/vendor_defns/hwcryptohook.h

engines/vendor_defns/sureware.h

fips

fips/Makefile

fips/aes

fips/aes/Makefile

fips/aes/fips_aes_selftest.c

fips/aes/fips_aesavs.c

fips/des

fips/des/Makefile

fips/des/fips_des_selftest.c

fips/des/fips_desmovs.c

fips/dh

fips/dh/Makefile

fips/dh/dh_gen.c

fips/dh/fips_dh_check.c

fips/dh/fips_dh_gen.c

fips/dh/fips_dh_key.c

fips/dh/fips_dh_lib.c

fips/dsa

fips/dsa/Makefile

fips/dsa/fips_dsa_gen.c

fips/dsa/fips_dsa_key.c

fips/dsa/fips_dsa_lib.c

fips/dsa/fips_dsa_ossl.c

fips/dsa/fips_dsa_selftest.c

fips/dsa/fips_dsa_sign.c

fips/dsa/fips_dsatest.c

fips/dsa/fips_dssvs.c

fips/fips-lib.com

fips/fips-nodiff.txt

fips/fips.c

fips/fips.h

fips/fips_canister.c

fips/fips_locl.h

fips/fips_premain.c

fips/fips_premain.c.sha1

fips/fips_test_suite.c

fips/fips_utl.h

fips/fipsalgtest.pl

fips/fipsld

fips/fipstests.bat

fips/fipstests.sh

fips/hmac

fips/hmac/Makefile

fips/hmac/fips_hmac.c

fips/hmac/fips_hmac_selftest.c

fips/hmac/fips_hmactest.c

fips/install.com

fips/mkfipsscr.pl

fips/openssl_fips_fingerprint

fips/rand

fips/rand/Makefile

fips/rand/fips_rand.c

fips/rand/fips_rand.h

fips/rand/fips_rand_selftest.c

fips/rand/fips_randtest.c

fips/rand/fips_rngvs.c

fips/rsa

fips/rsa/Makefile

fips/rsa/fips_rsa_eay.c

fips/rsa/fips_rsa_gen.c

fips/rsa/fips_rsa_lib.c

fips/rsa/fips_rsa_selftest.c

fips/rsa/fips_rsa_sign.c

fips/rsa/fips_rsa_x931g.c

fips/rsa/fips_rsagtest.c

fips/rsa/fips_rsastest.c

fips/rsa/fips_rsavtest.c

fips/sha

fips/sha/Makefile

fips/sha/fips_sha1_selftest.c

fips/sha/fips_shatest.c

fips/sha/fips_standalone_sha1.c

include

include/openssl

include/openssl/aes.h

include/openssl/asn1.h

include/openssl/asn1_mac.h

include/openssl/asn1t.h

include/openssl/bio.h

include/openssl/blowfish.h

include/openssl/bn.h

include/openssl/buffer.h

include/openssl/cast.h

include/openssl/comp.h

include/openssl/conf.h

include/openssl/conf_api.h

include/openssl/crypto.h

include/openssl/des.h

include/openssl/des_old.h

include/openssl/dh.h

include/openssl/dsa.h

include/openssl/dso.h

include/openssl/dtls1.h

include/openssl/e_os2.h

include/openssl/ebcdic.h

include/openssl/ec.h

include/openssl/ecdh.h

include/openssl/ecdsa.h

include/openssl/engine.h

include/openssl/err.h

include/openssl/evp.h

include/openssl/fips.h

include/openssl/fips_rand.h

include/openssl/hmac.h

include/openssl/idea.h

include/openssl/krb5_asn.h

include/openssl/kssl.h

include/openssl/lhash.h

include/openssl/md2.h

include/openssl/md4.h

include/openssl/md5.h

include/openssl/obj_mac.h

include/openssl/objects.h

include/openssl/ocsp.h

include/openssl/opensslconf.h

include/openssl/opensslv.h

include/openssl/ossl_typ.h

include/openssl/pem.h

include/openssl/pem2.h

include/openssl/pkcs12.h

include/openssl/pkcs7.h

include/openssl/pq_compat.h

include/openssl/pqueue.h

include/openssl/rand.h

include/openssl/rc2.h

include/openssl/rc4.h

include/openssl/ripemd.h

include/openssl/rsa.h

include/openssl/safestack.h

include/openssl/sha.h

include/openssl/ssl.h

include/openssl/ssl2.h

include/openssl/ssl23.h

include/openssl/ssl3.h

include/openssl/stack.h

include/openssl/store.h

include/openssl/symhacks.h

include/openssl/tls1.h

include/openssl/tmdiff.h

include/openssl/txt_db.h

include/openssl/ui.h

include/openssl/ui_compat.h

include/openssl/x509.h

include/openssl/x509_vfy.h

include/openssl/x509v3.h

install.com

makevms.com

ms/.rnd

ms/32all.bat

ms/README

ms/applink.c

ms/bcb4.bat

ms/certCA.srl

ms/certCA.ss

ms/certU.ss

ms/cmp.pl

ms/do_fips.bat

ms/do_masm.bat

ms/do_ms.bat

ms/do_nasm.bat

ms/do_nt.bat

ms/do_win64a.bat

ms/do_win64i.bat

ms/keyCA.ss

ms/keyU.ss

ms/mingw32.bat

ms/mw.bat

ms/req2CA.ss

ms/reqCA.ss

ms/reqU.ss

ms/segrenam.pl

ms/speed32.bat

ms/tenc.bat

ms/tencce.bat

ms/test.bat

ms/testce.bat

ms/testce2.bat

ms/testenc.bat

ms/testencce.bat

ms/testpem.bat

ms/testpemce.bat

ms/testss.bat

ms/testssce.bat

ms/tlhelp32.h

ms/tpem.bat

ms/tpemce.bat

ms/uplink.c

ms/uplink.h

ms/uplink.pl

ms/x86asm.bat

openssl.doxy

openssl.spec

os2/OS2-EMX.cmd

os2/backwardify.pl

perl

shlib

shlib/Makefile.hpux10-cc

shlib/README

shlib/hpux10-cc.sh

shlib/irix.sh

shlib/sco5-shared-gcc.sh

shlib/sco5-shared-installed

shlib/sco5-shared.sh

shlib/solaris-sc4.sh

shlib/solaris.sh

shlib/sun.sh

shlib/svr5-shared-gcc.sh

shlib/svr5-shared-installed

shlib/svr5-shared.sh

shlib/win32.bat

shlib/win32dll.bat

ssl/Makefile

ssl/bio_ssl.c

ssl/d1_both.c

ssl/d1_clnt.c

ssl/d1_enc.c

ssl/d1_lib.c

ssl/d1_meth.c

ssl/d1_pkt.c

ssl/d1_srvr.c

ssl/dtls1.h

ssl/install.com

ssl/kssl.c

ssl/kssl.h

ssl/kssl_lcl.h

ssl/s23_clnt.c

ssl/s23_lib.c

ssl/s23_meth.c

ssl/s23_pkt.c

ssl/s23_srvr.c

ssl/s2_clnt.c

ssl/s2_enc.c

ssl/s2_lib.c

ssl/s2_meth.c

ssl/s2_pkt.c

ssl/s2_srvr.c

ssl/s3_both.c

ssl/s3_clnt.c

ssl/s3_enc.c

ssl/s3_lib.c

ssl/s3_meth.c

ssl/s3_pkt.c

ssl/s3_srvr.c

ssl/ssl-lib.com

ssl/ssl.h

ssl/ssl2.h

ssl/ssl23.h

ssl/ssl3.h

ssl/ssl_algs.c

ssl/ssl_asn1.c

ssl/ssl_cert.c

ssl/ssl_ciph.c

ssl/ssl_err.c

ssl/ssl_err2.c

ssl/ssl_lib.c

ssl/ssl_locl.h

ssl/ssl_rsa.c

ssl/ssl_sess.c

ssl/ssl_stat.c

ssl/ssl_task.c

ssl/ssl_txt.c

ssl/ssltest.c

ssl/t1_clnt.c

ssl/t1_enc.c

ssl/t1_lib.c

ssl/t1_meth.c

ssl/t1_reneg.c

ssl/t1_srvr.c

ssl/tls1.h

test

test/CAss.cnf

test/CAssdh.cnf

test/CAssdsa.cnf

test/CAssrsa.cnf

test/Makefile

test/P1ss.cnf

test/P2ss.cnf

test/SHAmix.r

test/SHAmix.x

test/Sssdsa.cnf

test/Sssrsa.cnf

test/Uss.cnf

test/VMSca-response.1

test/VMSca-response.2

test/bctest

test/bftest.c

test/bntest.c

test/casttest.c

test/cms-examples.pl

test/cms-test.pl

test/destest.c

test/dhtest.c

test/dsatest.c

test/dummytest.c

test/ecdhtest.c

test/ecdsatest.c

test/ectest.c

test/enginetest.c

test/evp_test.c

test/evptests.txt

test/exptest.c

test/fips_aesavs.c

test/fips_desmovs.c

test/fips_dsatest.c

test/fips_dssvs.c

test/fips_hmactest.c

test/fips_randtest.c

test/fips_rngvs.c

test/fips_rsagtest.c

test/fips_rsastest.c

test/fips_rsavtest.c

test/fips_shatest.c

test/fips_test_suite.c

test/hmactest.c

test/ideatest.c

test/igetest.c

test/jpaketest.c

test/maketests.com

test/md2test.c

test/md4test.c

test/md5test.c

test/mdc2test.c

test/methtest.c

test/pkcs7-1.pem

test/pkcs7.pem

test/r160test.c

test/randtest.c

test/rc2test.c

test/rc4test.c

test/rc5test.c

test/rmdtest.c

test/rsa_test.c

test/sha1test.c

test/sha256t.c

test/sha512t.c

test/shatest.c

test/smcont.txt

test/smime-certs

test/smime-certs/smdsa1.pem

test/smime-certs/smdsa2.pem

test/smime-certs/smdsa3.pem

test/smime-certs/smdsap.pem

test/smime-certs/smroot.pem

test/smime-certs/smrsa1.pem

test/smime-certs/smrsa2.pem

test/smime-certs/smrsa3.pem

test/ssltest.c

test/tcrl

test/tcrl.com

test/test.cnf

test/testca

test/testca.com

test/testcrl.pem

test/testenc

test/testenc.com

test/testfipsssl

test/testgen

test/testgen.com

test/testp7.pem

test/testreq2.pem

test/testrsa.pem

test/tests.com

test/testsid.pem

test/testss

test/testss.com

test/testssl

test/testssl.com

test/testsslproxy

test/testx509.pem

test/times

test/tpkcs7

test/tpkcs7.com

test/tpkcs7d

test/tpkcs7d.com

test/treq

test/treq.com

test/trsa

test/trsa.com

test/tsid

test/tsid.com

test/tverify.com

test/tx509

test/tx509.com

test/v3-cert1.pem

test/v3-cert2.pem

times

times/090

times/090/586-100.nt

times/091

times/091/486-50.nt

times/091/586-100.lnx

times/091/68000.bsd

times/091/686-200.lnx

times/091/alpha064.osf

times/091/alpha164.lnx

times/091/alpha164.osf

times/091/mips-rel.pl

times/091/r10000.irx

times/091/r3000.ult

times/091/r4400.irx

times/100.lnx

times/100.nt

times/200.lnx

times/486-66.dos

times/486-66.nt

times/486-66.w31

times/5.lnx

times/586-085i.nt

times/586-100.LN3

times/586-100.NT2

times/586-100.dos

times/586-100.ln4

times/586-100.lnx

times/586-100.nt

times/586-100.ntx

times/586-100.w31

times/586-1002.lnx

times/586p-100.lnx

times/686-200.bsd

times/686-200.lnx

times/686-200.nt

times/L1

times/R10000.t

times/R4400.t

times/aix.t

times/aixold.t

times/alpha.t

times/alpha400.t

times/cyrix100.lnx

times/dgux-x86.t

times/dgux.t

times/hpux-acc.t

times/hpux-kr.t

times/hpux.t

times/p2.w95

times/pent2.t

times/readme

times/s586-100.lnx

times/s586-100.nt

times/sgi.t

times/sparc.t

times/sparc2

times/sparcLX.t

times/usparc.t

times/x86

times/x86/bfs.cpp

times/x86/casts.cpp

times/x86/des3s.cpp

times/x86/dess.cpp

times/x86/md4s.cpp

times/x86/md5s.cpp

times/x86/rc4s.cpp

times/x86/sha1s.cpp

tools

tools/Makefile

tools/c89.sh

tools/c_hash

tools/c_info

tools/c_issuer

tools/c_name

tools/c_rehash

tools/c_rehash.in

util

util/FreeBSD.sh

util/add_cr.pl

util/arx.pl

util/bat.sh

util/ck_errf.pl

util/clean-depend.pl

util/copy.pl

util/cygwin.sh

util/deleof.pl

util/dirname.pl

util/do_ms.sh

util/domd

util/err-ins.pl

util/extract-names.pl

util/extract-section.pl

util/files.pl

util/fipslink.pl

util/fixNT.sh

util/install.sh

util/libeay.num

util/mk1mf.pl

util/mkcerts.sh

util/mkdef.pl

util/mkdir-p.pl

util/mkerr.pl

util/mkfiles.pl

util/mklink.pl

util/mksdef.pl

util/mkstack.pl

util/opensslwrap.sh

util/perlpath.pl

util/pl

util/pl/BC-32.pl

util/pl/Mingw32.pl

util/pl/OS2-EMX.pl

util/pl/VC-32.pl

util/pl/linux.pl

util/pl/netware.pl

util/pl/ultrix.pl

util/pl/unix.pl

util/pod2man.pl

util/pod2mantest

util/pod2mantest.pod

util/point.sh

util/selftest.pl

util/shlib_wrap.sh

util/sp-diff.pl

util/speed.sh

util/src-dep.pl

util/ssleay.num

util/tab_num.pl

util/x86asm.sh

Show diffs side-by-side

added added

removed removed

crypto/bn/asm/ia64.S

.explicit

.text

.ident "ia64.S, Version 2.1"

.ident "IA-64 ISA artwork by Andy Polyakov <appro@fy.chalmers.se>"

// ====================================================================

// Written by Andy Polyakov <appro@fy.chalmers.se> for the OpenSSL

// project.

// Rights for redistribution and usage in source and binary forms are

// granted according to the OpenSSL license. Warranty of any kind is

// disclaimed.

// ====================================================================

// Version 2.x is Itanium2 re-tune. Few words about how Itanum2 is

// different from Itanium to this module viewpoint. Most notably, is it

// "wider" than Itanium? Can you experience loop scalability as

// discussed in commentary sections? Not really:-( Itanium2 has 6

// integer ALU ports, i.e. it's 2 ports wider, but it's not enough to

// spin twice as fast, as I need 8 IALU ports. Amount of floating point

// ports is the same, i.e. 2, while I need 4. In other words, to this

// module Itanium2 remains effectively as "wide" as Itanium. Yet it's

// essentially different in respect to this module, and a re-tune was

// required. Well, because some intruction latencies has changed. Most

// noticeably those intensively used:

// Itanium Itanium2

// ldf8 9 6 L2 hit

// ld8 2 1 L1 hit

// getf 2 5

// xma[->getf] 7[+1] 4[+0]

// add[->st8] 1[+1] 1[+0]

// What does it mean? You might ratiocinate that the original code

// should run just faster... Because sum of latencies is smaller...

// Wrong! Note that getf latency increased. This means that if a loop is

// scheduled for lower latency (as they were), then it will suffer from

// stall condition and the code will therefore turn anti-scalable, e.g.

// original bn_mul_words spun at 5*n or 2.5 times slower than expected

// on Itanium2! What to do? Reschedule loops for Itanium2? But then

// Itanium would exhibit anti-scalability. So I've chosen to reschedule

// for worst latency for every instruction aiming for best *all-round*

// performance.

// Q. How much faster does it get?

// A. Here is the output from 'openssl speed rsa dsa' for vanilla

// 0.9.6a compiled with gcc version 2.96 20000731 (Red Hat

// Linux 7.1 2.96-81):

// sign verify sign/s verify/s

// rsa 512 bits 0.0036s 0.0003s 275.3 2999.2

// rsa 1024 bits 0.0203s 0.0011s 49.3 894.1

// rsa 2048 bits 0.1331s 0.0040s 7.5 250.9

// rsa 4096 bits 0.9270s 0.0147s 1.1 68.1

// sign verify sign/s verify/s

// dsa 512 bits 0.0035s 0.0043s 288.3 234.8

// dsa 1024 bits 0.0111s 0.0135s 90.0 74.2

// And here is similar output but for this assembler

// implementation:-)

// sign verify sign/s verify/s

// rsa 512 bits 0.0021s 0.0001s 549.4 9638.5

// rsa 1024 bits 0.0055s 0.0002s 183.8 4481.1

// rsa 2048 bits 0.0244s 0.0006s 41.4 1726.3

// rsa 4096 bits 0.1295s 0.0018s 7.7 561.5

// sign verify sign/s verify/s

// dsa 512 bits 0.0012s 0.0013s 891.9 756.6

// dsa 1024 bits 0.0023s 0.0028s 440.4 376.2

// Yes, you may argue that it's not fair comparison as it's

// possible to craft the C implementation with BN_UMULT_HIGH

// inline assembler macro. But of course! Here is the output

// with the macro:

// sign verify sign/s verify/s

// rsa 512 bits 0.0020s 0.0002s 495.0 6561.0

// rsa 1024 bits 0.0086s 0.0004s 116.2 2235.7

// rsa 2048 bits 0.0519s 0.0015s 19.3 667.3

// rsa 4096 bits 0.3464s 0.0053s 2.9 187.7

// sign verify sign/s verify/s

// dsa 512 bits 0.0016s 0.0020s 613.1 510.5

// dsa 1024 bits 0.0045s 0.0054s 221.0 183.9

// My code is still way faster, huh:-) And I believe that even

// higher performance can be achieved. Note that as keys get

// longer, performance gain is larger. Why? According to the

// profiler there is another player in the field, namely

// BN_from_montgomery consuming larger and larger portion of CPU

// time as keysize decreases. I therefore consider putting effort

// to assembler implementation of the following routine:

// void bn_mul_add_mont (BN_ULONG *rp,BN_ULONG *np,int nl,BN_ULONG n0)

// {

// int i,j;

// BN_ULONG v;

// for (i=0; i<nl; i++)

100

// {

101

// v=bn_mul_add_words(rp,np,nl,(rp[0]*n0)&BN_MASK2);

102

// nrp++;

103

// rp++;

104

// if (((nrp[-1]+=v)&BN_MASK2) < v)

105

// for (j=0; ((++nrp[j])&BN_MASK2) == 0; j++) ;

106

// }

107

// }

108

109

// It might as well be beneficial to implement even combaX

110

// variants, as it appears as it can literally unleash the

111

// performance (see comment section to bn_mul_comba8 below).

112

113

// And finally for your reference the output for 0.9.6a compiled

114

// with SGIcc version 0.01.0-12 (keep in mind that for the moment

115

// of this writing it's not possible to convince SGIcc to use

116

// BN_UMULT_HIGH inline assembler macro, yet the code is fast,

117

// i.e. for a compiler generated one:-):

118

119

// sign verify sign/s verify/s

120

// rsa 512 bits 0.0022s 0.0002s 452.7 5894.3

121

// rsa 1024 bits 0.0097s 0.0005s 102.7 2002.9

122

// rsa 2048 bits 0.0578s 0.0017s 17.3 600.2

123

// rsa 4096 bits 0.3838s 0.0061s 2.6 164.5

124

// sign verify sign/s verify/s

125

// dsa 512 bits 0.0018s 0.0022s 547.3 459.6

126

// dsa 1024 bits 0.0051s 0.0062s 196.6 161.3

127

128

// Oh! Benchmarks were performed on 733MHz Lion-class Itanium

129

// system running Redhat Linux 7.1 (very special thanks to Ray

130

// McCaffity of Williams Communications for providing an account).

131

132

// Q. What's the heck with 'rum 1<<5' at the end of every function?

133

// A. Well, by clearing the "upper FP registers written" bit of the

134

// User Mask I want to excuse the kernel from preserving upper

135

// (f32-f128) FP register bank over process context switch, thus

136

// minimizing bus bandwidth consumption during the switch (i.e.

137

// after PKI opration completes and the program is off doing

138

// something else like bulk symmetric encryption). Having said

139

// this, I also want to point out that it might be good idea

140

// to compile the whole toolkit (as well as majority of the

141

// programs for that matter) with -mfixed-range=f32-f127 command

142

// line option. No, it doesn't prevent the compiler from writing

143

// to upper bank, but at least discourages to do so. If you don't

144

// like the idea you have the option to compile the module with

145

// -Drum=nop.m in command line.

146

147

148

#if defined(_HPUX_SOURCE) && !defined(_LP64)

149

#define ADDP addp4

150

#else

151

#define ADDP add

152

#endif

153

154

#if 1

155

156

// bn_[add|sub]_words routines.

157

158

// Loops are spinning in 2*(n+5) ticks on Itanuim (provided that the

159

// data reside in L1 cache, i.e. 2 ticks away). It's possible to

160

// compress the epilogue and get down to 2*n+6, but at the cost of

161

// scalability (the neat feature of this implementation is that it

162

// shall automagically spin in n+5 on "wider" IA-64 implementations:-)

163

// I consider that the epilogue is short enough as it is to trade tiny

164

// performance loss on Itanium for scalability.

165

166

// BN_ULONG bn_add_words(BN_ULONG *rp, BN_ULONG *ap, BN_ULONG *bp,int num)

167

168

.global bn_add_words#

169

.proc bn_add_words#

170

.align 64

171

.skip 32 // makes the loop body aligned at 64-byte boundary

172

bn_add_words:

173

.prologue

174

.save ar.pfs,r2

175

{ .mii; alloc r2=ar.pfs,4,12,0,16

176

cmp4.le p6,p0=r35,r0 };;

177

{ .mfb; mov r8=r0 // return value

178

(p6) br.ret.spnt.many b0 };;

179

180

{ .mib; sub r10=r35,r0,1

181

.save ar.lc,r3

182

mov r3=ar.lc

183

brp.loop.imp .L_bn_add_words_ctop,.L_bn_add_words_cend-16

184

}

185

{ .mib; ADDP r14=0,r32 // rp

186

.save pr,r9

187

mov r9=pr };;

188

.body

189

{ .mii; ADDP r15=0,r33 // ap

190

mov ar.lc=r10

191

mov ar.ec=6 }

192

{ .mib; ADDP r16=0,r34 // bp

193

mov pr.rot=1<<16 };;

194

195

.L_bn_add_words_ctop:

196

{ .mii; (p16) ld8 r32=[r16],8 // b=*(bp++)

197

(p18) add r39=r37,r34

198

(p19) cmp.ltu.unc p56,p0=r40,r38 }

199

{ .mfb; (p0) nop.m 0x0

200

(p0) nop.f 0x0

201

(p0) nop.b 0x0 }

202

{ .mii; (p16) ld8 r35=[r15],8 // a=*(ap++)

203

(p58) cmp.eq.or p57,p0=-1,r41 // (p20)

204

(p58) add r41=1,r41 } // (p20)

205

{ .mfb; (p21) st8 [r14]=r42,8 // *(rp++)=r

206

(p0) nop.f 0x0

207

br.ctop.sptk .L_bn_add_words_ctop };;

208

.L_bn_add_words_cend:

209

210

{ .mii;

211

(p59) add r8=1,r8 // return value

212

mov pr=r9,0x1ffff

213

mov ar.lc=r3 }

214

{ .mbb; nop.b 0x0

215

br.ret.sptk.many b0 };;

216

.endp bn_add_words#

217

218

219

// BN_ULONG bn_sub_words(BN_ULONG *rp, BN_ULONG *ap, BN_ULONG *bp,int num)

220

221

.global bn_sub_words#

222

.proc bn_sub_words#

223

.align 64

224

.skip 32 // makes the loop body aligned at 64-byte boundary

225

bn_sub_words:

226

.prologue

227

.save ar.pfs,r2

228

{ .mii; alloc r2=ar.pfs,4,12,0,16

229

cmp4.le p6,p0=r35,r0 };;

230

{ .mfb; mov r8=r0 // return value

231

(p6) br.ret.spnt.many b0 };;

232

233

{ .mib; sub r10=r35,r0,1

234

.save ar.lc,r3

235

mov r3=ar.lc

236

brp.loop.imp .L_bn_sub_words_ctop,.L_bn_sub_words_cend-16

237

}

238

{ .mib; ADDP r14=0,r32 // rp

239

.save pr,r9

240

mov r9=pr };;

241

.body

242

{ .mii; ADDP r15=0,r33 // ap

243

mov ar.lc=r10

244

mov ar.ec=6 }

245

{ .mib; ADDP r16=0,r34 // bp

246

mov pr.rot=1<<16 };;

247

248

.L_bn_sub_words_ctop:

249

{ .mii; (p16) ld8 r32=[r16],8 // b=*(bp++)

250

(p18) sub r39=r37,r34

251

(p19) cmp.gtu.unc p56,p0=r40,r38 }

252

{ .mfb; (p0) nop.m 0x0

253

(p0) nop.f 0x0

254

(p0) nop.b 0x0 }

255

{ .mii; (p16) ld8 r35=[r15],8 // a=*(ap++)

256

(p58) cmp.eq.or p57,p0=0,r41 // (p20)

257

(p58) add r41=-1,r41 } // (p20)

258

{ .mbb; (p21) st8 [r14]=r42,8 // *(rp++)=r

259

(p0) nop.b 0x0

260

br.ctop.sptk .L_bn_sub_words_ctop };;

261

.L_bn_sub_words_cend:

262

263

{ .mii;

264

(p59) add r8=1,r8 // return value

265

mov pr=r9,0x1ffff

266

mov ar.lc=r3 }

267

{ .mbb; nop.b 0x0

268

br.ret.sptk.many b0 };;

269

.endp bn_sub_words#

270

#endif

271

272

#if 0

273

#define XMA_TEMPTATION

274

#endif

275

276

#if 1

277

278

// BN_ULONG bn_mul_words(BN_ULONG *rp, BN_ULONG *ap, int num, BN_ULONG w)

279

280

.global bn_mul_words#

281

.proc bn_mul_words#

282

.align 64

283

.skip 32 // makes the loop body aligned at 64-byte boundary

284

bn_mul_words:

285

.prologue

286

.save ar.pfs,r2

287

#ifdef XMA_TEMPTATION

288

{ .mfi; alloc r2=ar.pfs,4,0,0,0 };;

289

#else

290

{ .mfi; alloc r2=ar.pfs,4,12,0,16 };;

291

#endif

292

{ .mib; mov r8=r0 // return value

293

cmp4.le p6,p0=r34,r0

294

(p6) br.ret.spnt.many b0 };;

295

296

{ .mii; sub r10=r34,r0,1

297

.save ar.lc,r3

298

mov r3=ar.lc

299

.save pr,r9

300

mov r9=pr };;

301

302

.body

303

{ .mib; setf.sig f8=r35 // w

304

mov pr.rot=0x800001<<16

305

// ------^----- serves as (p50) at first (p27)

306

brp.loop.imp .L_bn_mul_words_ctop,.L_bn_mul_words_cend-16

307

}

308

309

#ifndef XMA_TEMPTATION

310

311

{ .mmi; ADDP r14=0,r32 // rp

312

ADDP r15=0,r33 // ap

313

mov ar.lc=r10 }

314

{ .mmi; mov r40=0 // serves as r35 at first (p27)

315

mov ar.ec=13 };;

316

317

// This loop spins in 2*(n+12) ticks. It's scheduled for data in Itanium

318

// L2 cache (i.e. 9 ticks away) as floating point load/store instructions

319

// bypass L1 cache and L2 latency is actually best-case scenario for

320

// ldf8. The loop is not scalable and shall run in 2*(n+12) even on

321

// "wider" IA-64 implementations. It's a trade-off here. n+24 loop

322

// would give us ~5% in *overall* performance improvement on "wider"

323

// IA-64, but would hurt Itanium for about same because of longer

324

// epilogue. As it's a matter of few percents in either case I've

325

// chosen to trade the scalability for development time (you can see

326

// this very instruction sequence in bn_mul_add_words loop which in

327

// turn is scalable).

328

.L_bn_mul_words_ctop:

329

{ .mfi; (p25) getf.sig r36=f52 // low

330

(p21) xmpy.lu f48=f37,f8

331

(p28) cmp.ltu p54,p50=r41,r39 }

332

{ .mfi; (p16) ldf8 f32=[r15],8

333

(p21) xmpy.hu f40=f37,f8

334

(p0) nop.i 0x0 };;

335

{ .mii; (p25) getf.sig r32=f44 // high

336

.pred.rel "mutex",p50,p54

337

(p50) add r40=r38,r35 // (p27)

338

(p54) add r40=r38,r35,1 } // (p27)

339

{ .mfb; (p28) st8 [r14]=r41,8

340

(p0) nop.f 0x0

341

br.ctop.sptk .L_bn_mul_words_ctop };;

342

.L_bn_mul_words_cend:

343

344

{ .mii; nop.m 0x0

345

.pred.rel "mutex",p51,p55

346

(p51) add r8=r36,r0

347

(p55) add r8=r36,r0,1 }

348

{ .mfb; nop.m 0x0

349

nop.f 0x0

350

nop.b 0x0 }

351

352

#else // XMA_TEMPTATION

353

354

setf.sig f37=r0 // serves as carry at (p18) tick

355

mov ar.lc=r10

356

mov ar.ec=5;;

357

358

// Most of you examining this code very likely wonder why in the name

359

// of Intel the following loop is commented out? Indeed, it looks so

360

// neat that you find it hard to believe that it's something wrong

361

// with it, right? The catch is that every iteration depends on the

362

// result from previous one and the latter isn't available instantly.

363

// The loop therefore spins at the latency of xma minus 1, or in other

364

// words at 6*(n+4) ticks:-( Compare to the "production" loop above

365

// that runs in 2*(n+11) where the low latency problem is worked around

366

// by moving the dependency to one-tick latent interger ALU. Note that

367

// "distance" between ldf8 and xma is not latency of ldf8, but the

368

// *difference* between xma and ldf8 latencies.

369

.L_bn_mul_words_ctop:

370

{ .mfi; (p16) ldf8 f32=[r33],8

371

(p18) xma.hu f38=f34,f8,f39 }

372

{ .mfb; (p20) stf8 [r32]=f37,8

373

(p18) xma.lu f35=f34,f8,f39

374

br.ctop.sptk .L_bn_mul_words_ctop };;

375

.L_bn_mul_words_cend:

376

377

getf.sig r8=f41 // the return value

378

379

#endif // XMA_TEMPTATION

380

381

{ .mii; nop.m 0x0

382

mov pr=r9,0x1ffff

383

mov ar.lc=r3 }

384

{ .mfb; rum 1<<5 // clear um.mfh

385

nop.f 0x0

386

br.ret.sptk.many b0 };;

387

.endp bn_mul_words#

388

#endif

389

390

#if 1

391

392

// BN_ULONG bn_mul_add_words(BN_ULONG *rp, BN_ULONG *ap, int num, BN_ULONG w)

393

394

.global bn_mul_add_words#

395

.proc bn_mul_add_words#

396

.align 64

397

.skip 48 // makes the loop body aligned at 64-byte boundary

398

bn_mul_add_words:

399

.prologue

400

.save ar.pfs,r2

401

{ .mmi; alloc r2=ar.pfs,4,4,0,8

402

cmp4.le p6,p0=r34,r0

403

.save ar.lc,r3

404

mov r3=ar.lc };;

405

{ .mib; mov r8=r0 // return value

406

sub r10=r34,r0,1

407

(p6) br.ret.spnt.many b0 };;

408

409

{ .mib; setf.sig f8=r35 // w

410

.save pr,r9

411

mov r9=pr

412

brp.loop.imp .L_bn_mul_add_words_ctop,.L_bn_mul_add_words_cend-16

413

}

414

.body

415

{ .mmi; ADDP r14=0,r32 // rp

416

ADDP r15=0,r33 // ap

417

mov ar.lc=r10 }

418

{ .mii; ADDP r16=0,r32 // rp copy

419

mov pr.rot=0x2001<<16

420

// ------^----- serves as (p40) at first (p27)

421

mov ar.ec=11 };;

422

423

// This loop spins in 3*(n+10) ticks on Itanium and in 2*(n+10) on

424

// Itanium 2. Yes, unlike previous versions it scales:-) Previous

425

// version was peforming *all* additions in IALU and was starving

426

// for those even on Itanium 2. In this version one addition is

427

// moved to FPU and is folded with multiplication. This is at cost

428

// of propogating the result from previous call to this subroutine

429

// to L2 cache... In other words negligible even for shorter keys.

430

// *Overall* performance improvement [over previous version] varies

431

// from 11 to 22 percent depending on key length.

432

.L_bn_mul_add_words_ctop:

433

.pred.rel "mutex",p40,p42

434

{ .mfi; (p23) getf.sig r36=f45 // low

435

(p20) xma.lu f42=f36,f8,f50 // low

436

(p40) add r39=r39,r35 } // (p27)

437

{ .mfi; (p16) ldf8 f32=[r15],8 // *(ap++)

438

(p20) xma.hu f36=f36,f8,f50 // high

439

(p42) add r39=r39,r35,1 };; // (p27)

440

{ .mmi; (p24) getf.sig r32=f40 // high

441

(p16) ldf8 f46=[r16],8 // *(rp1++)

442

(p40) cmp.ltu p41,p39=r39,r35 } // (p27)

443

{ .mib; (p26) st8 [r14]=r39,8 // *(rp2++)

444

(p42) cmp.leu p41,p39=r39,r35 // (p27)

445

br.ctop.sptk .L_bn_mul_add_words_ctop};;

446

.L_bn_mul_add_words_cend:

447

448

{ .mmi; .pred.rel "mutex",p40,p42

449

(p40) add r8=r35,r0

450

(p42) add r8=r35,r0,1

451

mov pr=r9,0x1ffff }

452

{ .mib; rum 1<<5 // clear um.mfh

453

mov ar.lc=r3

454

br.ret.sptk.many b0 };;

455

.endp bn_mul_add_words#

456

#endif

457

458

#if 1

459

460

// void bn_sqr_words(BN_ULONG *rp, BN_ULONG *ap, int num)

461

462

.global bn_sqr_words#

463

.proc bn_sqr_words#

464

.align 64

465

.skip 32 // makes the loop body aligned at 64-byte boundary

466

bn_sqr_words:

467

.prologue

468

.save ar.pfs,r2

469

{ .mii; alloc r2=ar.pfs,3,0,0,0

470

sxt4 r34=r34 };;

471

{ .mii; cmp.le p6,p0=r34,r0

472

mov r8=r0 } // return value

473

{ .mfb; ADDP r32=0,r32

474

nop.f 0x0

475

(p6) br.ret.spnt.many b0 };;

476

477

{ .mii; sub r10=r34,r0,1

478

.save ar.lc,r3

479

mov r3=ar.lc

480

.save pr,r9

481

mov r9=pr };;

482

483

.body

484

{ .mib; ADDP r33=0,r33

485

mov pr.rot=1<<16

486

brp.loop.imp .L_bn_sqr_words_ctop,.L_bn_sqr_words_cend-16

487

}

488

{ .mii; add r34=8,r32

489

mov ar.lc=r10

490

mov ar.ec=18 };;

491

492

// 2*(n+17) on Itanium, (n+17) on "wider" IA-64 implementations. It's

493

// possible to compress the epilogue (I'm getting tired to write this

494

// comment over and over) and get down to 2*n+16 at the cost of

495

// scalability. The decision will very likely be reconsidered after the

496

// benchmark program is profiled. I.e. if perfomance gain on Itanium

497

// will appear larger than loss on "wider" IA-64, then the loop should

498

// be explicitely split and the epilogue compressed.

499

.L_bn_sqr_words_ctop:

500

{ .mfi; (p16) ldf8 f32=[r33],8

501

(p25) xmpy.lu f42=f41,f41

502

(p0) nop.i 0x0 }

503

{ .mib; (p33) stf8 [r32]=f50,16

504

(p0) nop.i 0x0

505

(p0) nop.b 0x0 }

506

{ .mfi; (p0) nop.m 0x0

507

(p25) xmpy.hu f52=f41,f41

508

(p0) nop.i 0x0 }

509

{ .mib; (p33) stf8 [r34]=f60,16

510

(p0) nop.i 0x0

511

br.ctop.sptk .L_bn_sqr_words_ctop };;

512

.L_bn_sqr_words_cend:

513

514

{ .mii; nop.m 0x0

515

mov pr=r9,0x1ffff

516

mov ar.lc=r3 }

517

{ .mfb; rum 1<<5 // clear um.mfh

518

nop.f 0x0

519

br.ret.sptk.many b0 };;

520

.endp bn_sqr_words#

521

#endif

522

523

#if 1

524

// Apparently we win nothing by implementing special bn_sqr_comba8.

525

// Yes, it is possible to reduce the number of multiplications by

526

// almost factor of two, but then the amount of additions would

527

// increase by factor of two (as we would have to perform those

528

// otherwise performed by xma ourselves). Normally we would trade

529

// anyway as multiplications are way more expensive, but not this

530

// time... Multiplication kernel is fully pipelined and as we drain

531

// one 128-bit multiplication result per clock cycle multiplications

532

// are effectively as inexpensive as additions. Special implementation

533

// might become of interest for "wider" IA-64 implementation as you'll

534

// be able to get through the multiplication phase faster (there won't

535

// be any stall issues as discussed in the commentary section below and

536

// you therefore will be able to employ all 4 FP units)... But these

537

// Itanium days it's simply too hard to justify the effort so I just

538

// drop down to bn_mul_comba8 code:-)

539

540

// void bn_sqr_comba8(BN_ULONG *r, BN_ULONG *a)

541

542

.global bn_sqr_comba8#

543

.proc bn_sqr_comba8#

544

.align 64

545

bn_sqr_comba8:

546

.prologue

547

.save ar.pfs,r2

548

#if defined(_HPUX_SOURCE) && !defined(_LP64)

549

{ .mii; alloc r2=ar.pfs,2,1,0,0

550

addp4 r33=0,r33

551

addp4 r32=0,r32 };;

552

{ .mii;

553

#else

554

{ .mii; alloc r2=ar.pfs,2,1,0,0

555

#endif

556

mov r34=r33

557

add r14=8,r33 };;

558

.body

559

{ .mii; add r17=8,r34

560

add r15=16,r33

561

add r18=16,r34 }

562

{ .mfb; add r16=24,r33

563

br .L_cheat_entry_point8 };;

564

.endp bn_sqr_comba8#

565

#endif

566

567

#if 1

568

// I've estimated this routine to run in ~120 ticks, but in reality

569

// (i.e. according to ar.itc) it takes ~160 ticks. Are those extra

570

// cycles consumed for instructions fetch? Or did I misinterpret some

571

// clause in Itanium �-architecture manual? Comments are welcomed and

572

// highly appreciated.

573

574

// On Itanium 2 it takes ~190 ticks. This is because of stalls on

575

// result from getf.sig. I do nothing about it at this point for

576

// reasons depicted below.

577

578

// However! It should be noted that even 160 ticks is darn good result

579

// as it's over 10 (yes, ten, spelled as t-e-n) times faster than the

580

// C version (compiled with gcc with inline assembler). I really

581

// kicked compiler's butt here, didn't I? Yeah! This brings us to the

582

// following statement. It's damn shame that this routine isn't called

583

// very often nowadays! According to the profiler most CPU time is

584

// consumed by bn_mul_add_words called from BN_from_montgomery. In

585

// order to estimate what we're missing, I've compared the performance

586

// of this routine against "traditional" implementation, i.e. against

587

// following routine:

588

589

// void bn_mul_comba8(BN_ULONG *r, BN_ULONG *a, BN_ULONG *b)

590

// { r[ 8]=bn_mul_words( &(r[0]),a,8,b[0]);

591

// r[ 9]=bn_mul_add_words(&(r[1]),a,8,b[1]);

592

// r[10]=bn_mul_add_words(&(r[2]),a,8,b[2]);

593

// r[11]=bn_mul_add_words(&(r[3]),a,8,b[3]);

594

// r[12]=bn_mul_add_words(&(r[4]),a,8,b[4]);

595

// r[13]=bn_mul_add_words(&(r[5]),a,8,b[5]);

596

// r[14]=bn_mul_add_words(&(r[6]),a,8,b[6]);

597

// r[15]=bn_mul_add_words(&(r[7]),a,8,b[7]);

598

// }

599

600

// The one below is over 8 times faster than the one above:-( Even

601

// more reasons to "combafy" bn_mul_add_mont...

602

603

// And yes, this routine really made me wish there were an optimizing

604

// assembler! It also feels like it deserves a dedication.

605

606

// To my wife for being there and to my kids...

607

608

// void bn_mul_comba8(BN_ULONG *r, BN_ULONG *a, BN_ULONG *b)

609

610

#define carry1 r14

611

#define carry2 r15

612

#define carry3 r34

613

.global bn_mul_comba8#

614

.proc bn_mul_comba8#

615

.align 64

616

bn_mul_comba8:

617

.prologue

618

.save ar.pfs,r2

619

#if defined(_HPUX_SOURCE) && !defined(_LP64)

620

{ .mii; alloc r2=ar.pfs,3,0,0,0

621

addp4 r33=0,r33

622

addp4 r34=0,r34 };;

623

{ .mii; addp4 r32=0,r32

624

#else

625

{ .mii; alloc r2=ar.pfs,3,0,0,0

626

#endif

627

add r14=8,r33

628

add r17=8,r34 }

629

.body

630

{ .mii; add r15=16,r33

631

add r18=16,r34

632

add r16=24,r33 }

633

.L_cheat_entry_point8:

634

{ .mmi; add r19=24,r34

635

636

ldf8 f32=[r33],32 };;

637

638

{ .mmi; ldf8 f120=[r34],32

639

ldf8 f121=[r17],32 }

640

{ .mmi; ldf8 f122=[r18],32

641

ldf8 f123=[r19],32 };;

642

{ .mmi; ldf8 f124=[r34]

643

ldf8 f125=[r17] }

644

{ .mmi; ldf8 f126=[r18]

645

ldf8 f127=[r19] }

646

647

{ .mmi; ldf8 f33=[r14],32

648

ldf8 f34=[r15],32 }

649

{ .mmi; ldf8 f35=[r16],32;;

650

ldf8 f36=[r33] }

651

{ .mmi; ldf8 f37=[r14]

652

ldf8 f38=[r15] }

653

{ .mfi; ldf8 f39=[r16]

654

// -------\ Entering multiplier's heaven /-------

655

// ------------\ /------------

656

// -----------------\ /-----------------

657

// ----------------------\/----------------------

658

xma.hu f41=f32,f120,f0 }

659

{ .mfi; xma.lu f40=f32,f120,f0 };; // (*)

660

{ .mfi; xma.hu f51=f32,f121,f0 }

661

{ .mfi; xma.lu f50=f32,f121,f0 };;

662

{ .mfi; xma.hu f61=f32,f122,f0 }

663

{ .mfi; xma.lu f60=f32,f122,f0 };;

664

{ .mfi; xma.hu f71=f32,f123,f0 }

665

{ .mfi; xma.lu f70=f32,f123,f0 };;

666

{ .mfi; xma.hu f81=f32,f124,f0 }

667

{ .mfi; xma.lu f80=f32,f124,f0 };;

668

{ .mfi; xma.hu f91=f32,f125,f0 }

669

{ .mfi; xma.lu f90=f32,f125,f0 };;

670

{ .mfi; xma.hu f101=f32,f126,f0 }

671

{ .mfi; xma.lu f100=f32,f126,f0 };;

672

{ .mfi; xma.hu f111=f32,f127,f0 }

673

{ .mfi; xma.lu f110=f32,f127,f0 };;//

674

// (*) You can argue that splitting at every second bundle would

675

// prevent "wider" IA-64 implementations from achieving the peak

676

// performance. Well, not really... The catch is that if you

677

// intend to keep 4 FP units busy by splitting at every fourth

678

// bundle and thus perform these 16 multiplications in 4 ticks,

679

// the first bundle *below* would stall because the result from

680

// the first xma bundle *above* won't be available for another 3

681

// ticks (if not more, being an optimist, I assume that "wider"

682

// implementation will have same latency:-). This stall will hold

683

// you back and the performance would be as if every second bundle

684

// were split *anyway*...

685

{ .mfi; getf.sig r16=f40

686

xma.hu f42=f33,f120,f41

687

add r33=8,r32 }

688

{ .mfi; xma.lu f41=f33,f120,f41 };;

689

{ .mfi; getf.sig r24=f50

690

xma.hu f52=f33,f121,f51 }

691

{ .mfi; xma.lu f51=f33,f121,f51 };;

692

{ .mfi; st8 [r32]=r16,16

693

xma.hu f62=f33,f122,f61 }

694

{ .mfi; xma.lu f61=f33,f122,f61 };;

695

{ .mfi; xma.hu f72=f33,f123,f71 }

696

{ .mfi; xma.lu f71=f33,f123,f71 };;

697

{ .mfi; xma.hu f82=f33,f124,f81 }

698

{ .mfi; xma.lu f81=f33,f124,f81 };;

699

{ .mfi; xma.hu f92=f33,f125,f91 }

700

{ .mfi; xma.lu f91=f33,f125,f91 };;

701

{ .mfi; xma.hu f102=f33,f126,f101 }

702

{ .mfi; xma.lu f101=f33,f126,f101 };;

703

{ .mfi; xma.hu f112=f33,f127,f111 }

704

{ .mfi; xma.lu f111=f33,f127,f111 };;//

705

//-------------------------------------------------//

706

{ .mfi; getf.sig r25=f41

707

xma.hu f43=f34,f120,f42 }

708

{ .mfi; xma.lu f42=f34,f120,f42 };;

709

{ .mfi; getf.sig r16=f60

710

xma.hu f53=f34,f121,f52 }

711

{ .mfi; xma.lu f52=f34,f121,f52 };;

712

{ .mfi; getf.sig r17=f51

713

xma.hu f63=f34,f122,f62

714

add r25=r25,r24 }

715

{ .mfi; xma.lu f62=f34,f122,f62

716

mov carry1=0 };;

717

{ .mfi; cmp.ltu p6,p0=r25,r24

718

xma.hu f73=f34,f123,f72 }

719

{ .mfi; xma.lu f72=f34,f123,f72 };;

720

{ .mfi; st8 [r33]=r25,16

721

xma.hu f83=f34,f124,f82

722

(p6) add carry1=1,carry1 }

723

{ .mfi; xma.lu f82=f34,f124,f82 };;

724

{ .mfi; xma.hu f93=f34,f125,f92 }

725

{ .mfi; xma.lu f92=f34,f125,f92 };;

726

{ .mfi; xma.hu f103=f34,f126,f102 }

727

{ .mfi; xma.lu f102=f34,f126,f102 };;

728

{ .mfi; xma.hu f113=f34,f127,f112 }

729

{ .mfi; xma.lu f112=f34,f127,f112 };;//

730

//-------------------------------------------------//

731

{ .mfi; getf.sig r18=f42

732

xma.hu f44=f35,f120,f43

733

add r17=r17,r16 }

734

{ .mfi; xma.lu f43=f35,f120,f43 };;

735

{ .mfi; getf.sig r24=f70

736

xma.hu f54=f35,f121,f53 }

737

{ .mfi; mov carry2=0

738

xma.lu f53=f35,f121,f53 };;

739

{ .mfi; getf.sig r25=f61

740

xma.hu f64=f35,f122,f63

741

cmp.ltu p7,p0=r17,r16 }

742

{ .mfi; add r18=r18,r17

743

xma.lu f63=f35,f122,f63 };;

744

{ .mfi; getf.sig r26=f52

745

xma.hu f74=f35,f123,f73

746

(p7) add carry2=1,carry2 }

747

{ .mfi; cmp.ltu p7,p0=r18,r17

748

xma.lu f73=f35,f123,f73

749

add r18=r18,carry1 };;

750

{ .mfi;

751

xma.hu f84=f35,f124,f83

752

(p7) add carry2=1,carry2 }

753

{ .mfi; cmp.ltu p7,p0=r18,carry1

754

xma.lu f83=f35,f124,f83 };;

755

{ .mfi; st8 [r32]=r18,16

756

xma.hu f94=f35,f125,f93

757

(p7) add carry2=1,carry2 }

758

{ .mfi; xma.lu f93=f35,f125,f93 };;

759

{ .mfi; xma.hu f104=f35,f126,f103 }

760

{ .mfi; xma.lu f103=f35,f126,f103 };;

761

{ .mfi; xma.hu f114=f35,f127,f113 }

762

{ .mfi; mov carry1=0

763

xma.lu f113=f35,f127,f113

764

add r25=r25,r24 };;//

765

//-------------------------------------------------//

766

{ .mfi; getf.sig r27=f43

767

xma.hu f45=f36,f120,f44

768

cmp.ltu p6,p0=r25,r24 }

769

{ .mfi; xma.lu f44=f36,f120,f44

770

add r26=r26,r25 };;

771

{ .mfi; getf.sig r16=f80

772

xma.hu f55=f36,f121,f54

773

(p6) add carry1=1,carry1 }

774

{ .mfi; xma.lu f54=f36,f121,f54 };;

775

{ .mfi; getf.sig r17=f71

776

xma.hu f65=f36,f122,f64

777

cmp.ltu p6,p0=r26,r25 }

778

{ .mfi; xma.lu f64=f36,f122,f64

779

add r27=r27,r26 };;

780

{ .mfi; getf.sig r18=f62

781

xma.hu f75=f36,f123,f74

782

(p6) add carry1=1,carry1 }

783

{ .mfi; cmp.ltu p6,p0=r27,r26

784

xma.lu f74=f36,f123,f74

785

add r27=r27,carry2 };;

786

{ .mfi; getf.sig r19=f53

787

xma.hu f85=f36,f124,f84

788

(p6) add carry1=1,carry1 }

789

{ .mfi; xma.lu f84=f36,f124,f84

790

cmp.ltu p6,p0=r27,carry2 };;

791

{ .mfi; st8 [r33]=r27,16

792

xma.hu f95=f36,f125,f94

793

(p6) add carry1=1,carry1 }

794

{ .mfi; xma.lu f94=f36,f125,f94 };;

795

{ .mfi; xma.hu f105=f36,f126,f104 }

796

{ .mfi; mov carry2=0

797

xma.lu f104=f36,f126,f104

798

add r17=r17,r16 };;

799

{ .mfi; xma.hu f115=f36,f127,f114

800

cmp.ltu p7,p0=r17,r16 }

801

{ .mfi; xma.lu f114=f36,f127,f114

802

add r18=r18,r17 };;//

803

//-------------------------------------------------//

804

{ .mfi; getf.sig r20=f44

805

xma.hu f46=f37,f120,f45

806

(p7) add carry2=1,carry2 }

807

{ .mfi; cmp.ltu p7,p0=r18,r17

808

xma.lu f45=f37,f120,f45

809

add r19=r19,r18 };;

810

{ .mfi; getf.sig r24=f90

811

xma.hu f56=f37,f121,f55 }

812

{ .mfi; xma.lu f55=f37,f121,f55 };;

813

{ .mfi; getf.sig r25=f81

814

xma.hu f66=f37,f122,f65

815

(p7) add carry2=1,carry2 }

816

{ .mfi; cmp.ltu p7,p0=r19,r18

817

xma.lu f65=f37,f122,f65

818

add r20=r20,r19 };;

819

{ .mfi; getf.sig r26=f72

820

xma.hu f76=f37,f123,f75

821

(p7) add carry2=1,carry2 }

822

{ .mfi; cmp.ltu p7,p0=r20,r19

823

xma.lu f75=f37,f123,f75

824

add r20=r20,carry1 };;

825

{ .mfi; getf.sig r27=f63

826

xma.hu f86=f37,f124,f85

827

(p7) add carry2=1,carry2 }

828

{ .mfi; xma.lu f85=f37,f124,f85

829

cmp.ltu p7,p0=r20,carry1 };;

830

{ .mfi; getf.sig r28=f54

831

xma.hu f96=f37,f125,f95

832

(p7) add carry2=1,carry2 }

833

{ .mfi; st8 [r32]=r20,16

834

xma.lu f95=f37,f125,f95 };;

835

{ .mfi; xma.hu f106=f37,f126,f105 }

836

{ .mfi; mov carry1=0

837

xma.lu f105=f37,f126,f105

838

add r25=r25,r24 };;

839

{ .mfi; xma.hu f116=f37,f127,f115

840

cmp.ltu p6,p0=r25,r24 }

841

{ .mfi; xma.lu f115=f37,f127,f115

842

add r26=r26,r25 };;//

843

//-------------------------------------------------//

844

{ .mfi; getf.sig r29=f45

845

xma.hu f47=f38,f120,f46

846

(p6) add carry1=1,carry1 }

847

{ .mfi; cmp.ltu p6,p0=r26,r25

848

xma.lu f46=f38,f120,f46

849

add r27=r27,r26 };;

850

{ .mfi; getf.sig r16=f100

851

xma.hu f57=f38,f121,f56

852

(p6) add carry1=1,carry1 }

853

{ .mfi; cmp.ltu p6,p0=r27,r26

854

xma.lu f56=f38,f121,f56

855

add r28=r28,r27 };;

856

{ .mfi; getf.sig r17=f91

857

xma.hu f67=f38,f122,f66

858

(p6) add carry1=1,carry1 }

859

{ .mfi; cmp.ltu p6,p0=r28,r27

860

xma.lu f66=f38,f122,f66

861

add r29=r29,r28 };;

862

{ .mfi; getf.sig r18=f82

863

xma.hu f77=f38,f123,f76

864

(p6) add carry1=1,carry1 }

865

{ .mfi; cmp.ltu p6,p0=r29,r28

866

xma.lu f76=f38,f123,f76

867

add r29=r29,carry2 };;

868

{ .mfi; getf.sig r19=f73

869

xma.hu f87=f38,f124,f86

870

(p6) add carry1=1,carry1 }

871

{ .mfi; xma.lu f86=f38,f124,f86

872

cmp.ltu p6,p0=r29,carry2 };;

873

{ .mfi; getf.sig r20=f64

874

xma.hu f97=f38,f125,f96

875

(p6) add carry1=1,carry1 }

876

{ .mfi; st8 [r33]=r29,16

877

xma.lu f96=f38,f125,f96 };;

878

{ .mfi; getf.sig r21=f55

879

xma.hu f107=f38,f126,f106 }

880

{ .mfi; mov carry2=0

881

xma.lu f106=f38,f126,f106

882

add r17=r17,r16 };;

883

{ .mfi; xma.hu f117=f38,f127,f116

884

cmp.ltu p7,p0=r17,r16 }

885

{ .mfi; xma.lu f116=f38,f127,f116

886

add r18=r18,r17 };;//

887

//-------------------------------------------------//

888

{ .mfi; getf.sig r22=f46

889

xma.hu f48=f39,f120,f47

890

(p7) add carry2=1,carry2 }

891

{ .mfi; cmp.ltu p7,p0=r18,r17

892

xma.lu f47=f39,f120,f47

893

add r19=r19,r18 };;

894

{ .mfi; getf.sig r24=f110

895

xma.hu f58=f39,f121,f57

896

(p7) add carry2=1,carry2 }

897

{ .mfi; cmp.ltu p7,p0=r19,r18

898

xma.lu f57=f39,f121,f57

899

add r20=r20,r19 };;

900

{ .mfi; getf.sig r25=f101

901

xma.hu f68=f39,f122,f67

902

(p7) add carry2=1,carry2 }

903

{ .mfi; cmp.ltu p7,p0=r20,r19

904

xma.lu f67=f39,f122,f67

905

add r21=r21,r20 };;

906

{ .mfi; getf.sig r26=f92

907

xma.hu f78=f39,f123,f77

908

(p7) add carry2=1,carry2 }

909

{ .mfi; cmp.ltu p7,p0=r21,r20

910

xma.lu f77=f39,f123,f77

911

add r22=r22,r21 };;

912

{ .mfi; getf.sig r27=f83

913

xma.hu f88=f39,f124,f87

914

(p7) add carry2=1,carry2 }

915

{ .mfi; cmp.ltu p7,p0=r22,r21

916

xma.lu f87=f39,f124,f87

917

add r22=r22,carry1 };;

918

{ .mfi; getf.sig r28=f74

919

xma.hu f98=f39,f125,f97

920

(p7) add carry2=1,carry2 }

921

{ .mfi; xma.lu f97=f39,f125,f97

922

cmp.ltu p7,p0=r22,carry1 };;

923

{ .mfi; getf.sig r29=f65

924

xma.hu f108=f39,f126,f107

925

(p7) add carry2=1,carry2 }

926

{ .mfi; st8 [r32]=r22,16

927

xma.lu f107=f39,f126,f107 };;

928

{ .mfi; getf.sig r30=f56

929

xma.hu f118=f39,f127,f117 }

930

{ .mfi; xma.lu f117=f39,f127,f117 };;//

931

//-------------------------------------------------//

932

// Leaving muliplier's heaven... Quite a ride, huh?

933

934

{ .mii; getf.sig r31=f47

935

add r25=r25,r24

936

mov carry1=0 };;

937

{ .mii; getf.sig r16=f111

938

cmp.ltu p6,p0=r25,r24

939

add r26=r26,r25 };;

940

{ .mfb; getf.sig r17=f102 }

941

{ .mii;

942

(p6) add carry1=1,carry1

943

cmp.ltu p6,p0=r26,r25

944

add r27=r27,r26 };;

945

{ .mfb; nop.m 0x0 }

946

{ .mii;

947

(p6) add carry1=1,carry1

948

cmp.ltu p6,p0=r27,r26

949

add r28=r28,r27 };;

950

{ .mii; getf.sig r18=f93

951

add r17=r17,r16

952

mov carry3=0 }

953

{ .mii;

954

(p6) add carry1=1,carry1

955

cmp.ltu p6,p0=r28,r27

956

add r29=r29,r28 };;

957

{ .mii; getf.sig r19=f84

958

cmp.ltu p7,p0=r17,r16 }

959

{ .mii;

960

(p6) add carry1=1,carry1

961

cmp.ltu p6,p0=r29,r28

962

add r30=r30,r29 };;

963

{ .mii; getf.sig r20=f75

964

add r18=r18,r17 }

965

{ .mii;

966

(p6) add carry1=1,carry1

967

cmp.ltu p6,p0=r30,r29

968

add r31=r31,r30 };;

969

{ .mfb; getf.sig r21=f66 }

970

{ .mii; (p7) add carry3=1,carry3

971

cmp.ltu p7,p0=r18,r17

972

add r19=r19,r18 }

973

{ .mfb; nop.m 0x0 }

974

{ .mii;

975

(p6) add carry1=1,carry1

976

cmp.ltu p6,p0=r31,r30

977

add r31=r31,carry2 };;

978

{ .mfb; getf.sig r22=f57 }

979

{ .mii; (p7) add carry3=1,carry3

980

cmp.ltu p7,p0=r19,r18

981

add r20=r20,r19 }

982

{ .mfb; nop.m 0x0 }

983

{ .mii;

984

(p6) add carry1=1,carry1

985

cmp.ltu p6,p0=r31,carry2 };;

986

{ .mfb; getf.sig r23=f48 }

987

{ .mii; (p7) add carry3=1,carry3

988

cmp.ltu p7,p0=r20,r19

989

add r21=r21,r20 }

990

{ .mii;

991

(p6) add carry1=1,carry1 }

992

{ .mfb; st8 [r33]=r31,16 };;

993

994

{ .mfb; getf.sig r24=f112 }

995

{ .mii; (p7) add carry3=1,carry3

996

cmp.ltu p7,p0=r21,r20

997

add r22=r22,r21 };;

998

{ .mfb; getf.sig r25=f103 }

999

{ .mii; (p7) add carry3=1,carry3

1000

cmp.ltu p7,p0=r22,r21

1001

add r23=r23,r22 };;

1002

{ .mfb; getf.sig r26=f94 }

1003

{ .mii; (p7) add carry3=1,carry3

1004

cmp.ltu p7,p0=r23,r22

1005

add r23=r23,carry1 };;

1006

{ .mfb; getf.sig r27=f85 }

1007

{ .mii; (p7) add carry3=1,carry3

1008

cmp.ltu p7,p8=r23,carry1};;

1009

{ .mii; getf.sig r28=f76

1010

add r25=r25,r24

1011

mov carry1=0 }

1012

{ .mii; st8 [r32]=r23,16

1013

(p7) add carry2=1,carry3

1014

(p8) add carry2=0,carry3 };;

1015

1016

{ .mfb; nop.m 0x0 }

1017

{ .mii; getf.sig r29=f67

1018

cmp.ltu p6,p0=r25,r24

1019

add r26=r26,r25 };;

1020

{ .mfb; getf.sig r30=f58 }

1021

{ .mii;

1022

(p6) add carry1=1,carry1

1023

cmp.ltu p6,p0=r26,r25

1024

add r27=r27,r26 };;

1025

{ .mfb; getf.sig r16=f113 }

1026

{ .mii;

1027

(p6) add carry1=1,carry1

1028

cmp.ltu p6,p0=r27,r26

1029

add r28=r28,r27 };;

1030

{ .mfb; getf.sig r17=f104 }

1031

{ .mii;

1032

(p6) add carry1=1,carry1

1033

cmp.ltu p6,p0=r28,r27

1034

add r29=r29,r28 };;

1035

{ .mfb; getf.sig r18=f95 }

1036

{ .mii;

1037

(p6) add carry1=1,carry1

1038

cmp.ltu p6,p0=r29,r28

1039

add r30=r30,r29 };;

1040

{ .mii; getf.sig r19=f86

1041

add r17=r17,r16

1042

mov carry3=0 }

1043

{ .mii;

1044

(p6) add carry1=1,carry1

1045

cmp.ltu p6,p0=r30,r29

1046

add r30=r30,carry2 };;

1047

{ .mii; getf.sig r20=f77

1048

cmp.ltu p7,p0=r17,r16

1049

add r18=r18,r17 }

1050

{ .mii;

1051

(p6) add carry1=1,carry1

1052

cmp.ltu p6,p0=r30,carry2 };;

1053

{ .mfb; getf.sig r21=f68 }

1054

{ .mii; st8 [r33]=r30,16

1055

(p6) add carry1=1,carry1 };;

1056

1057

{ .mfb; getf.sig r24=f114 }

1058

{ .mii; (p7) add carry3=1,carry3

1059

cmp.ltu p7,p0=r18,r17

1060

add r19=r19,r18 };;

1061

{ .mfb; getf.sig r25=f105 }

1062

{ .mii; (p7) add carry3=1,carry3

1063

cmp.ltu p7,p0=r19,r18

1064

add r20=r20,r19 };;

1065

{ .mfb; getf.sig r26=f96 }

1066

{ .mii; (p7) add carry3=1,carry3

1067

cmp.ltu p7,p0=r20,r19

1068

add r21=r21,r20 };;

1069

{ .mfb; getf.sig r27=f87 }

1070

{ .mii; (p7) add carry3=1,carry3

1071

cmp.ltu p7,p0=r21,r20

1072

add r21=r21,carry1 };;

1073

{ .mib; getf.sig r28=f78

1074

add r25=r25,r24 }

1075

{ .mib; (p7) add carry3=1,carry3

1076

cmp.ltu p7,p8=r21,carry1};;

1077

{ .mii; st8 [r32]=r21,16

1078

(p7) add carry2=1,carry3

1079

(p8) add carry2=0,carry3 }

1080

1081

{ .mii; mov carry1=0

1082

cmp.ltu p6,p0=r25,r24

1083

add r26=r26,r25 };;

1084

{ .mfb; getf.sig r16=f115 }

1085

{ .mii;

1086

(p6) add carry1=1,carry1

1087

cmp.ltu p6,p0=r26,r25

1088

add r27=r27,r26 };;

1089

{ .mfb; getf.sig r17=f106 }

1090

{ .mii;

1091

(p6) add carry1=1,carry1

1092

cmp.ltu p6,p0=r27,r26

1093

add r28=r28,r27 };;

1094

{ .mfb; getf.sig r18=f97 }

1095

{ .mii;

1096

(p6) add carry1=1,carry1

1097

cmp.ltu p6,p0=r28,r27

1098

add r28=r28,carry2 };;

1099

{ .mib; getf.sig r19=f88

1100

add r17=r17,r16 }

1101

{ .mib;

1102

(p6) add carry1=1,carry1

1103

cmp.ltu p6,p0=r28,carry2 };;

1104

{ .mii; st8 [r33]=r28,16

1105

(p6) add carry1=1,carry1 }

1106

1107

{ .mii; mov carry2=0

1108

cmp.ltu p7,p0=r17,r16

1109

add r18=r18,r17 };;

1110

{ .mfb; getf.sig r24=f116 }

1111

{ .mii; (p7) add carry2=1,carry2

1112

cmp.ltu p7,p0=r18,r17

1113

add r19=r19,r18 };;

1114

{ .mfb; getf.sig r25=f107 }

1115

{ .mii; (p7) add carry2=1,carry2

1116

cmp.ltu p7,p0=r19,r18

1117

add r19=r19,carry1 };;

1118

{ .mfb; getf.sig r26=f98 }

1119

{ .mii; (p7) add carry2=1,carry2

1120

cmp.ltu p7,p0=r19,carry1};;

1121

{ .mii; st8 [r32]=r19,16

1122

(p7) add carry2=1,carry2 }

1123

1124

{ .mfb; add r25=r25,r24 };;

1125

1126

{ .mfb; getf.sig r16=f117 }

1127

{ .mii; mov carry1=0

1128

cmp.ltu p6,p0=r25,r24

1129

add r26=r26,r25 };;

1130

{ .mfb; getf.sig r17=f108 }

1131

{ .mii;

1132

(p6) add carry1=1,carry1

1133

cmp.ltu p6,p0=r26,r25

1134

add r26=r26,carry2 };;

1135

{ .mfb; nop.m 0x0 }

1136

{ .mii;

1137

(p6) add carry1=1,carry1

1138

cmp.ltu p6,p0=r26,carry2 };;

1139

{ .mii; st8 [r33]=r26,16

1140

(p6) add carry1=1,carry1 }

1141

1142

{ .mfb; add r17=r17,r16 };;

1143

{ .mfb; getf.sig r24=f118 }

1144

{ .mii; mov carry2=0

1145

cmp.ltu p7,p0=r17,r16

1146

add r17=r17,carry1 };;

1147

{ .mii; (p7) add carry2=1,carry2

1148

cmp.ltu p7,p0=r17,carry1};;

1149

{ .mii; st8 [r32]=r17

1150

(p7) add carry2=1,carry2 };;

1151

{ .mfb; add r24=r24,carry2 };;

1152

{ .mib; st8 [r33]=r24 }

1153

1154

{ .mib; rum 1<<5 // clear um.mfh

1155

br.ret.sptk.many b0 };;

1156

.endp bn_mul_comba8#

1157

#undef carry3

1158

#undef carry2

1159

#undef carry1

1160

#endif

1161

1162

#if 1

1163

// It's possible to make it faster (see comment to bn_sqr_comba8), but

1164

// I reckon it doesn't worth the effort. Basically because the routine

1165

// (actually both of them) practically never called... So I just play

1166

// same trick as with bn_sqr_comba8.

1167

1168

// void bn_sqr_comba4(BN_ULONG *r, BN_ULONG *a)

1169

1170

.global bn_sqr_comba4#

1171

.proc bn_sqr_comba4#

1172

.align 64

1173

bn_sqr_comba4:

1174

.prologue

1175

.save ar.pfs,r2

1176

#if defined(_HPUX_SOURCE) && !defined(_LP64)

1177

{ .mii; alloc r2=ar.pfs,2,1,0,0

1178

addp4 r32=0,r32

1179

addp4 r33=0,r33 };;

1180

{ .mii;

1181

#else

1182

{ .mii; alloc r2=ar.pfs,2,1,0,0

1183

#endif

1184

mov r34=r33

1185

add r14=8,r33 };;

1186

.body

1187

{ .mii; add r17=8,r34

1188

add r15=16,r33

1189

add r18=16,r34 }

1190

{ .mfb; add r16=24,r33

1191

br .L_cheat_entry_point4 };;

1192

.endp bn_sqr_comba4#

1193

#endif

1194

1195

#if 1

1196

// Runs in ~115 cycles and ~4.5 times faster than C. Well, whatever...

1197

1198

// void bn_mul_comba4(BN_ULONG *r, BN_ULONG *a, BN_ULONG *b)

1199

1200

#define carry1 r14

1201

#define carry2 r15

1202

.global bn_mul_comba4#

1203

.proc bn_mul_comba4#

1204

.align 64

1205

bn_mul_comba4:

1206

.prologue

1207

.save ar.pfs,r2

1208

#if defined(_HPUX_SOURCE) && !defined(_LP64)

1209

{ .mii; alloc r2=ar.pfs,3,0,0,0

1210

addp4 r33=0,r33

1211

addp4 r34=0,r34 };;

1212

{ .mii; addp4 r32=0,r32

1213

#else

1214

{ .mii; alloc r2=ar.pfs,3,0,0,0

1215

#endif

1216

add r14=8,r33

1217

add r17=8,r34 }

1218

.body

1219

{ .mii; add r15=16,r33

1220

add r18=16,r34

1221

add r16=24,r33 };;

1222

.L_cheat_entry_point4:

1223

{ .mmi; add r19=24,r34

1224

1225

ldf8 f32=[r33] }

1226

1227

{ .mmi; ldf8 f120=[r34]

1228

ldf8 f121=[r17] };;

1229

{ .mmi; ldf8 f122=[r18]

1230

ldf8 f123=[r19] }

1231

1232

{ .mmi; ldf8 f33=[r14]

1233

ldf8 f34=[r15] }

1234

{ .mfi; ldf8 f35=[r16]

1235

1236

xma.hu f41=f32,f120,f0 }

1237

{ .mfi; xma.lu f40=f32,f120,f0 };;

1238

{ .mfi; xma.hu f51=f32,f121,f0 }

1239

{ .mfi; xma.lu f50=f32,f121,f0 };;

1240

{ .mfi; xma.hu f61=f32,f122,f0 }

1241

{ .mfi; xma.lu f60=f32,f122,f0 };;

1242

{ .mfi; xma.hu f71=f32,f123,f0 }

1243

{ .mfi; xma.lu f70=f32,f123,f0 };;//

1244

// Major stall takes place here, and 3 more places below. Result from

1245

// first xma is not available for another 3 ticks.

1246

{ .mfi; getf.sig r16=f40

1247

xma.hu f42=f33,f120,f41

1248

add r33=8,r32 }

1249

{ .mfi; xma.lu f41=f33,f120,f41 };;

1250

{ .mfi; getf.sig r24=f50

1251

xma.hu f52=f33,f121,f51 }

1252

{ .mfi; xma.lu f51=f33,f121,f51 };;

1253

{ .mfi; st8 [r32]=r16,16

1254

xma.hu f62=f33,f122,f61 }

1255

{ .mfi; xma.lu f61=f33,f122,f61 };;

1256

{ .mfi; xma.hu f72=f33,f123,f71 }

1257

{ .mfi; xma.lu f71=f33,f123,f71 };;//

1258

//-------------------------------------------------//

1259

{ .mfi; getf.sig r25=f41

1260

xma.hu f43=f34,f120,f42 }

1261

{ .mfi; xma.lu f42=f34,f120,f42 };;

1262

{ .mfi; getf.sig r16=f60

1263

xma.hu f53=f34,f121,f52 }

1264

{ .mfi; xma.lu f52=f34,f121,f52 };;

1265

{ .mfi; getf.sig r17=f51

1266

xma.hu f63=f34,f122,f62

1267

add r25=r25,r24 }

1268

{ .mfi; mov carry1=0

1269

xma.lu f62=f34,f122,f62 };;

1270

{ .mfi; st8 [r33]=r25,16

1271

xma.hu f73=f34,f123,f72

1272

cmp.ltu p6,p0=r25,r24 }

1273

{ .mfi; xma.lu f72=f34,f123,f72 };;//

1274

//-------------------------------------------------//

1275

{ .mfi; getf.sig r18=f42

1276

xma.hu f44=f35,f120,f43

1277

(p6) add carry1=1,carry1 }

1278

{ .mfi; add r17=r17,r16

1279

xma.lu f43=f35,f120,f43

1280

mov carry2=0 };;

1281

{ .mfi; getf.sig r24=f70

1282

xma.hu f54=f35,f121,f53

1283

cmp.ltu p7,p0=r17,r16 }

1284

{ .mfi; xma.lu f53=f35,f121,f53 };;

1285

{ .mfi; getf.sig r25=f61

1286

xma.hu f64=f35,f122,f63

1287

add r18=r18,r17 }

1288

{ .mfi; xma.lu f63=f35,f122,f63

1289

(p7) add carry2=1,carry2 };;

1290

{ .mfi; getf.sig r26=f52

1291

xma.hu f74=f35,f123,f73

1292

cmp.ltu p7,p0=r18,r17 }

1293

{ .mfi; xma.lu f73=f35,f123,f73

1294

add r18=r18,carry1 };;

1295

//-------------------------------------------------//

1296

{ .mii; st8 [r32]=r18,16

1297

(p7) add carry2=1,carry2

1298

cmp.ltu p7,p0=r18,carry1 };;

1299

1300

{ .mfi; getf.sig r27=f43 // last major stall

1301

(p7) add carry2=1,carry2 };;

1302

{ .mii; getf.sig r16=f71

1303

add r25=r25,r24

1304

mov carry1=0 };;

1305

{ .mii; getf.sig r17=f62

1306

cmp.ltu p6,p0=r25,r24

1307

add r26=r26,r25 };;

1308

{ .mii;

1309

(p6) add carry1=1,carry1

1310

cmp.ltu p6,p0=r26,r25

1311

add r27=r27,r26 };;

1312

{ .mii;

1313

(p6) add carry1=1,carry1

1314

cmp.ltu p6,p0=r27,r26

1315

add r27=r27,carry2 };;

1316

{ .mii; getf.sig r18=f53

1317

(p6) add carry1=1,carry1

1318

cmp.ltu p6,p0=r27,carry2 };;

1319

{ .mfi; st8 [r33]=r27,16

1320

(p6) add carry1=1,carry1 }

1321

1322

{ .mii; getf.sig r19=f44

1323

add r17=r17,r16

1324

mov carry2=0 };;

1325

{ .mii; getf.sig r24=f72

1326

cmp.ltu p7,p0=r17,r16

1327

add r18=r18,r17 };;

1328

{ .mii; (p7) add carry2=1,carry2

1329

cmp.ltu p7,p0=r18,r17

1330

add r19=r19,r18 };;

1331

{ .mii; (p7) add carry2=1,carry2

1332

cmp.ltu p7,p0=r19,r18

1333

add r19=r19,carry1 };;

1334

{ .mii; getf.sig r25=f63

1335

(p7) add carry2=1,carry2

1336

cmp.ltu p7,p0=r19,carry1};;

1337

{ .mii; st8 [r32]=r19,16

1338

(p7) add carry2=1,carry2 }

1339

1340

{ .mii; getf.sig r26=f54

1341

add r25=r25,r24

1342

mov carry1=0 };;

1343

{ .mii; getf.sig r16=f73

1344

cmp.ltu p6,p0=r25,r24

1345

add r26=r26,r25 };;

1346

{ .mii;

1347

(p6) add carry1=1,carry1

1348

cmp.ltu p6,p0=r26,r25

1349

add r26=r26,carry2 };;

1350

{ .mii; getf.sig r17=f64

1351

(p6) add carry1=1,carry1

1352

cmp.ltu p6,p0=r26,carry2 };;

1353

{ .mii; st8 [r33]=r26,16

1354

(p6) add carry1=1,carry1 }

1355

1356

{ .mii; getf.sig r24=f74

1357

add r17=r17,r16

1358

mov carry2=0 };;

1359

{ .mii; cmp.ltu p7,p0=r17,r16

1360

add r17=r17,carry1 };;

1361

1362

{ .mii; (p7) add carry2=1,carry2

1363

cmp.ltu p7,p0=r17,carry1};;

1364

{ .mii; st8 [r32]=r17,16

1365

(p7) add carry2=1,carry2 };;

1366

1367

{ .mii; add r24=r24,carry2 };;

1368

{ .mii; st8 [r33]=r24 }

1369

1370

{ .mib; rum 1<<5 // clear um.mfh

1371

br.ret.sptk.many b0 };;

1372

.endp bn_mul_comba4#

1373

#undef carry2

1374

#undef carry1

1375

#endif

1376

1377

#if 1

1378

1379

// BN_ULONG bn_div_words(BN_ULONG h, BN_ULONG l, BN_ULONG d)

1380

1381

// In the nutshell it's a port of my MIPS III/IV implementation.

1382

1383

#define AT r14

1384

#define H r16

1385

#define HH r20

1386

#define L r17

1387

#define D r18

1388

#define DH r22

1389

#define I r21

1390

1391

#if 0

1392

// Some preprocessors (most notably HP-UX) appear to be allergic to

1393

// macros enclosed to parenthesis [as these three were].

1394

#define cont p16

1395

#define break p0 // p20

1396

#define equ p24

1397

#else

1398

cont=p16

1399

break=p0

1400

equ=p24

1401

#endif

1402

1403

.global abort#

1404

.global bn_div_words#

1405

.proc bn_div_words#

1406

.align 64

1407

bn_div_words:

1408

.prologue

1409

.save ar.pfs,r2

1410

{ .mii; alloc r2=ar.pfs,3,5,0,8

1411

.save b0,r3

1412

mov r3=b0

1413

.save pr,r10

1414

mov r10=pr };;

1415

{ .mmb; cmp.eq p6,p0=r34,r0

1416

mov r8=-1

1417

(p6) br.ret.spnt.many b0 };;

1418

1419

.body

1420

{ .mii; mov H=r32 // save h

1421

mov ar.ec=0 // don't rotate at exit

1422

mov pr.rot=0 }

1423

{ .mii; mov L=r33 // save l

1424

mov r36=r0 };;

1425

1426

.L_divw_shift: // -vv- note signed comparison

1427

{ .mfi; (p0) cmp.lt p16,p0=r0,r34 // d

1428

(p0) shladd r33=r34,1,r0 }

1429

{ .mfb; (p0) add r35=1,r36

1430

(p0) nop.f 0x0

1431

(p16) br.wtop.dpnt .L_divw_shift };;

1432

1433

{ .mii; mov D=r34

1434

shr.u DH=r34,32

1435

sub r35=64,r36 };;

1436

{ .mii; setf.sig f7=DH

1437

shr.u AT=H,r35

1438

mov I=r36 };;

1439

{ .mib; cmp.ne p6,p0=r0,AT

1440

shl H=H,r36

1441

(p6) br.call.spnt.clr b0=abort };; // overflow, die...

1442

1443

{ .mfi; fcvt.xuf.s1 f7=f7

1444

shr.u AT=L,r35 };;

1445

{ .mii; shl L=L,r36

1446

or H=H,AT };;

1447

1448

{ .mii; nop.m 0x0

1449

cmp.leu p6,p0=D,H;;

1450

(p6) sub H=H,D }

1451

1452

{ .mlx; setf.sig f14=D

1453

movl AT=0xffffffff };;

1454

///////////////////////////////////////////////////////////

1455

{ .mii; setf.sig f6=H

1456

shr.u HH=H,32;;

1457

cmp.eq p6,p7=HH,DH };;

1458

{ .mfb;

1459

(p6) setf.sig f8=AT

1460

(p7) fcvt.xuf.s1 f6=f6

1461

(p7) br.call.sptk b6=.L_udiv64_32_b6 };;

1462

1463

{ .mfi; getf.sig r33=f8 // q

1464

xmpy.lu f9=f8,f14 }

1465

{ .mfi; xmpy.hu f10=f8,f14

1466

shrp H=H,L,32 };;

1467

1468

{ .mmi; getf.sig r35=f9 // tl

1469

getf.sig r31=f10 };; // th

1470

1471

.L_divw_1st_iter:

1472

{ .mii; (p0) add r32=-1,r33

1473

(p0) cmp.eq equ,cont=HH,r31 };;

1474

{ .mii; (p0) cmp.ltu p8,p0=r35,D

1475

(p0) sub r34=r35,D

1476

(equ) cmp.leu break,cont=r35,H };;

1477

{ .mib; (cont) cmp.leu cont,break=HH,r31

1478

(p8) add r31=-1,r31

1479

(cont) br.wtop.spnt .L_divw_1st_iter };;

1480

///////////////////////////////////////////////////////////

1481

{ .mii; sub H=H,r35

1482

shl r8=r33,32

1483

shl L=L,32 };;

1484

///////////////////////////////////////////////////////////

1485

{ .mii; setf.sig f6=H

1486

shr.u HH=H,32;;

1487

cmp.eq p6,p7=HH,DH };;

1488

{ .mfb;

1489

(p6) setf.sig f8=AT

1490

(p7) fcvt.xuf.s1 f6=f6

1491

(p7) br.call.sptk b6=.L_udiv64_32_b6 };;

1492

1493

{ .mfi; getf.sig r33=f8 // q

1494

xmpy.lu f9=f8,f14 }

1495

{ .mfi; xmpy.hu f10=f8,f14

1496

shrp H=H,L,32 };;

1497

1498

{ .mmi; getf.sig r35=f9 // tl

1499

getf.sig r31=f10 };; // th

1500

1501

.L_divw_2nd_iter:

1502

{ .mii; (p0) add r32=-1,r33

1503

(p0) cmp.eq equ,cont=HH,r31 };;

1504

{ .mii; (p0) cmp.ltu p8,p0=r35,D

1505

(p0) sub r34=r35,D

1506

(equ) cmp.leu break,cont=r35,H };;

1507

{ .mib; (cont) cmp.leu cont,break=HH,r31

1508

(p8) add r31=-1,r31

1509

(cont) br.wtop.spnt .L_divw_2nd_iter };;

1510

///////////////////////////////////////////////////////////

1511

{ .mii; sub H=H,r35

1512

or r8=r8,r33

1513

mov ar.pfs=r2 };;

1514

{ .mii; shr.u r9=H,I // remainder if anybody wants it

1515

mov pr=r10,0x1ffff }

1516

{ .mfb; br.ret.sptk.many b0 };;

1517

1518

// Unsigned 64 by 32 (well, by 64 for the moment) bit integer division

1519

// procedure.

1520

1521

// inputs: f6 = (double)a, f7 = (double)b

1522

// output: f8 = (int)(a/b)

1523

// clobbered: f8,f9,f10,f11,pred

1524

pred=p15

1525

// One can argue that this snippet is copyrighted to Intel

1526

// Corporation, as it's essentially identical to one of those

1527

// found in "Divide, Square Root and Remainder" section at

1528

// http://www.intel.com/software/products/opensource/libraries/num.htm.

1529

// Yes, I admit that the referred code was used as template,

1530

// but after I realized that there hardly is any other instruction

1531

// sequence which would perform this operation. I mean I figure that

1532

// any independent attempt to implement high-performance division

1533

// will result in code virtually identical to the Intel code. It

1534

// should be noted though that below division kernel is 1 cycle

1535

// faster than Intel one (note commented splits:-), not to mention

1536

// original prologue (rather lack of one) and epilogue.

1537

.align 32

1538

.skip 16

1539

.L_udiv64_32_b6:

1540

frcpa.s1 f8,pred=f6,f7;; // [0] y0 = 1 / b

1541

1542

(pred) fnma.s1 f9=f7,f8,f1 // [5] e0 = 1 - b * y0

1543

(pred) fmpy.s1 f10=f6,f8;; // [5] q0 = a * y0

1544

(pred) fmpy.s1 f11=f9,f9 // [10] e1 = e0 * e0

1545

(pred) fma.s1 f10=f9,f10,f10;; // [10] q1 = q0 + e0 * q0

1546

(pred) fma.s1 f8=f9,f8,f8 //;; // [15] y1 = y0 + e0 * y0

1547

(pred) fma.s1 f9=f11,f10,f10;; // [15] q2 = q1 + e1 * q1

1548

(pred) fma.s1 f8=f11,f8,f8 //;; // [20] y2 = y1 + e1 * y1

1549

(pred) fnma.s1 f10=f7,f9,f6;; // [20] r2 = a - b * q2

1550

(pred) fma.s1 f8=f10,f8,f9;; // [25] q3 = q2 + r2 * y2

1551

1552

fcvt.fxu.trunc.s1 f8=f8 // [30] q = trunc(q3)

1553

br.ret.sptk.many b6;;

1554

.endp bn_div_words#

1555

#endif

Older »