~ubuntu-branches/ubuntu/vivid/atlas/vivid

« back to all changes in this revision

Viewing changes to src/blas/gemm/GOTO/gemm_EV5_k.S

Committer: Bazaar Package Importer
Author(s): Camm Maguire
Date: 2002-04-13 10:07:52 UTC
Revision ID: james.westby@ubuntu.com-20020413100752-va9zm0rd4gpurdkq

Tags: upstream-3.2.1ln

Import upstream version 3.2.1ln

files added:

CONFIG

CONFIG/3DNow.txt

CONFIG/ARCHS

CONFIG/ARCHS/21164.tgz

CONFIG/ARCHS/21164GOTO.tgz

CONFIG/ARCHS/21264.tgz

CONFIG/ARCHS/21264GOTO.tgz

CONFIG/ARCHS/ATHLON.tgz

CONFIG/ARCHS/ATHLON3DNow2.tgz

CONFIG/ARCHS/CreateDef.sh

CONFIG/ARCHS/CreateDirs.sh

CONFIG/ARCHS/CreateShar.sh

CONFIG/ARCHS/CreateTar.sh

CONFIG/ARCHS/HP9735.tgz

CONFIG/ARCHS/IA64Itan.tgz

CONFIG/ARCHS/KillDirs.sh

CONFIG/ARCHS/Makefile

CONFIG/ARCHS/NewFiles.tgz

CONFIG/ARCHS/P4SSE1.tgz

CONFIG/ARCHS/P5MMX.tgz

CONFIG/ARCHS/PII.tgz

CONFIG/ARCHS/PIII.tgz

CONFIG/ARCHS/PIIISSE.tgz

CONFIG/ARCHS/POWER.tgz

CONFIG/ARCHS/POWER2Thin.tgz

CONFIG/ARCHS/POWER3.tgz

CONFIG/ARCHS/PPC604.tgz

CONFIG/ARCHS/PPC604e.tgz

CONFIG/ARCHS/PPCG4.tgz

CONFIG/ARCHS/PPRO.tgz

CONFIG/ARCHS/SGIIP28.tgz

CONFIG/ARCHS/SGIIP30.tgz

CONFIG/ARCHS/SunUS2.tgz

CONFIG/ARCHS/SunUS5.tgz

CONFIG/ARCHS/UpdateDir.sh

CONFIG/ARCHS/negfloat.c

CONFIG/ARCHS/negres.c

CONFIG/ARCHS/negres.sh

CONFIG/ARCHS/negres2.c

CONFIG/ARCHS/tmp.tgz

CONFIG/CCmake.txt

CONFIG/Makefile

CONFIG/NoSearch.txt

CONFIG/SolErr.c

CONFIG/SolErr.txt

CONFIG/arch.txt

CONFIG/archinfo_aix.c

CONFIG/archinfo_hpux.c

CONFIG/blas.txt

CONFIG/blaslink.f

CONFIG/ccomp-alpha.txt

CONFIG/ccomp-alpha_newgcc.txt

CONFIG/ccomp-alpha_nogcc.txt

CONFIG/ccomp.txt

CONFIG/cf2cint.c

CONFIG/cf2cstr.c

CONFIG/cname.c

CONFIG/errata.txt

CONFIG/error.txt

CONFIG/f77exp.txt

CONFIG/f77make.txt

CONFIG/ff2cint.f

CONFIG/ff2cstr.f

CONFIG/fname.f

CONFIG/goodbye.txt

CONFIG/gotogemm.txt

CONFIG/init.txt

CONFIG/l2size.txt

CONFIG/l2sizemax.txt

CONFIG/ncpu.txt

CONFIG/nfsdelay.txt

CONFIG/probe_3DNow1.c

CONFIG/probe_3DNow2.c

CONFIG/probe_SSE1.c

CONFIG/pthread.txt

CONFIG/tst.c

CONFIG/tst.f

CONFIG/winf77.c

CONFIG/winf77.txt

CONFIG/xcomp-err.txt

CONFIG/xcomp.txt

INSTALL.txt

Make.top

Makefile

README

bin/atlas_install.c

bin/atlas_tee.c

bin/atlas_waitfile.c

bin/dlp1000.f

bin/ftime00.c

bin/gemmtst.c

bin/l1blastst.c

bin/l2blastst.c

bin/l3blastst.c

bin/llttst.c

bin/lutst.c

bin/printblk.c

config.c

doc/AtlasCredits.txt

doc/ChangeLog.txt

doc/DirStruct.txt

doc/INDEX.txt

doc/LAPACK.txt

doc/TestTime.txt

doc/TroubleShoot.txt

doc/Windows.txt

doc/atlas_contrib.ps

doc/atlas_over.ps

doc/cblas.ps

doc/fblasqr.ps

include

include/atlas_aux.h

include/atlas_cblascalias.h

include/atlas_cblasdalias.h

include/atlas_cblassalias.h

include/atlas_cblastypealias.h

include/atlas_cblaszalias.h

include/atlas_enum.h

include/atlas_f77.h

include/atlas_f77blas.h

include/atlas_f77wrap.h

include/atlas_fopen.h

include/atlas_kern3.h

include/atlas_kernel2.h

include/atlas_kernel3.h

include/atlas_lapack.h

include/atlas_level1.h

include/atlas_level2.h

include/atlas_level3.h

include/atlas_lvl2.h

include/atlas_lvl3.h

include/atlas_misc.h

include/atlas_mv.h

include/atlas_ptalias1.h

include/atlas_ptalias2.h

include/atlas_ptalias3.h

include/atlas_ptlevel1.h

include/atlas_ptlevel2.h

include/atlas_ptlevel3.h

include/atlas_ptlvl1.h

include/atlas_ptlvl2.h

include/atlas_ptlvl3.h

include/atlas_ptmisc.h

include/atlas_r1.h

include/atlas_rblas.h

include/atlas_rblas3.h

include/atlas_refalias1.h

include/atlas_refalias2.h

include/atlas_refalias3.h

include/atlas_reflevel1.h

include/atlas_reflevel2.h

include/atlas_reflevel3.h

include/atlas_reflvl2.h

include/atlas_reflvl3.h

include/atlas_refmisc.h

include/atlas_tst.h

include/cblas.h

include/cblas_test.h

include/clapack.h

include/contrib

include/contrib/ATL_gemv_ger_SSE.h

include/contrib/Make.ext

include/contrib/OLD

include/contrib/OLD/ATL_gemv_SSE.h

include/contrib/OLD/camm_dpa.h0

include/contrib/OLD/camm_scale.h

include/contrib/SSE3Dnow.h

include/contrib/camm_arith.h

include/contrib/camm_arith2.h

include/contrib/camm_cga.h

include/contrib/camm_dpa.h

include/contrib/camm_ga.h

include/contrib/camm_maa.h

include/contrib/camm_scale.h

include/contrib/camm_util.h

include/contrib/camm_zga.h

include/f77wrap_lapack.h

interfaces

interfaces/blas

interfaces/blas/C

interfaces/blas/C/src

interfaces/blas/C/src/cblas_caxpy.c

interfaces/blas/C/src/cblas_ccopy.c

interfaces/blas/C/src/cblas_cdotc.c

interfaces/blas/C/src/cblas_cdotu.c

interfaces/blas/C/src/cblas_cgbmv.c

interfaces/blas/C/src/cblas_cgemm.c

interfaces/blas/C/src/cblas_cgemv.c

interfaces/blas/C/src/cblas_cgerc.c

interfaces/blas/C/src/cblas_cgeru.c

interfaces/blas/C/src/cblas_chbmv.c

interfaces/blas/C/src/cblas_chemm.c

interfaces/blas/C/src/cblas_chemv.c

interfaces/blas/C/src/cblas_cher.c

interfaces/blas/C/src/cblas_cher2.c

interfaces/blas/C/src/cblas_cher2k.c

interfaces/blas/C/src/cblas_cherk.c

interfaces/blas/C/src/cblas_chpmv.c

interfaces/blas/C/src/cblas_chpr.c

interfaces/blas/C/src/cblas_chpr2.c

interfaces/blas/C/src/cblas_crotg.c

interfaces/blas/C/src/cblas_cscal.c

interfaces/blas/C/src/cblas_csrot.c

interfaces/blas/C/src/cblas_csscal.c

interfaces/blas/C/src/cblas_cswap.c

interfaces/blas/C/src/cblas_csymm.c

interfaces/blas/C/src/cblas_csyr2k.c

interfaces/blas/C/src/cblas_csyrk.c

interfaces/blas/C/src/cblas_ctbmv.c

interfaces/blas/C/src/cblas_ctbsv.c

interfaces/blas/C/src/cblas_ctpmv.c

interfaces/blas/C/src/cblas_ctpsv.c

interfaces/blas/C/src/cblas_ctrmm.c

interfaces/blas/C/src/cblas_ctrmv.c

interfaces/blas/C/src/cblas_ctrsm.c

interfaces/blas/C/src/cblas_ctrsv.c

interfaces/blas/C/src/cblas_dasum.c

interfaces/blas/C/src/cblas_daxpy.c

interfaces/blas/C/src/cblas_dcopy.c

interfaces/blas/C/src/cblas_ddot.c

interfaces/blas/C/src/cblas_dgbmv.c

interfaces/blas/C/src/cblas_dgemm.c

interfaces/blas/C/src/cblas_dgemv.c

interfaces/blas/C/src/cblas_dger.c

interfaces/blas/C/src/cblas_dnrm2.c

interfaces/blas/C/src/cblas_drot.c

interfaces/blas/C/src/cblas_drotg.c

interfaces/blas/C/src/cblas_drotm.c

interfaces/blas/C/src/cblas_drotmg.c

interfaces/blas/C/src/cblas_dsbmv.c

interfaces/blas/C/src/cblas_dscal.c

interfaces/blas/C/src/cblas_dsdot.c

interfaces/blas/C/src/cblas_dspmv.c

interfaces/blas/C/src/cblas_dspr.c

interfaces/blas/C/src/cblas_dspr2.c

interfaces/blas/C/src/cblas_dswap.c

interfaces/blas/C/src/cblas_dsymm.c

interfaces/blas/C/src/cblas_dsymv.c

interfaces/blas/C/src/cblas_dsyr.c

interfaces/blas/C/src/cblas_dsyr2.c

interfaces/blas/C/src/cblas_dsyr2k.c

interfaces/blas/C/src/cblas_dsyrk.c

interfaces/blas/C/src/cblas_dtbmv.c

interfaces/blas/C/src/cblas_dtbsv.c

interfaces/blas/C/src/cblas_dtpmv.c

interfaces/blas/C/src/cblas_dtpsv.c

interfaces/blas/C/src/cblas_dtrmm.c

interfaces/blas/C/src/cblas_dtrmv.c

interfaces/blas/C/src/cblas_dtrsm.c

interfaces/blas/C/src/cblas_dtrsv.c

interfaces/blas/C/src/cblas_dzasum.c

interfaces/blas/C/src/cblas_dznrm2.c

interfaces/blas/C/src/cblas_errprn.c

interfaces/blas/C/src/cblas_icamax.c

interfaces/blas/C/src/cblas_idamax.c

interfaces/blas/C/src/cblas_isamax.c

interfaces/blas/C/src/cblas_izamax.c

interfaces/blas/C/src/cblas_sasum.c

interfaces/blas/C/src/cblas_saxpy.c

interfaces/blas/C/src/cblas_scasum.c

interfaces/blas/C/src/cblas_scnrm2.c

interfaces/blas/C/src/cblas_scopy.c

interfaces/blas/C/src/cblas_sdot.c

interfaces/blas/C/src/cblas_sdsdot.c

interfaces/blas/C/src/cblas_sgbmv.c

interfaces/blas/C/src/cblas_sgemm.c

interfaces/blas/C/src/cblas_sgemv.c

interfaces/blas/C/src/cblas_sger.c

interfaces/blas/C/src/cblas_snrm2.c

interfaces/blas/C/src/cblas_srot.c

interfaces/blas/C/src/cblas_srotg.c

interfaces/blas/C/src/cblas_srotm.c

interfaces/blas/C/src/cblas_srotmg.c

interfaces/blas/C/src/cblas_ssbmv.c

interfaces/blas/C/src/cblas_sscal.c

interfaces/blas/C/src/cblas_sspmv.c

interfaces/blas/C/src/cblas_sspr.c

interfaces/blas/C/src/cblas_sspr2.c

interfaces/blas/C/src/cblas_sswap.c

interfaces/blas/C/src/cblas_ssymm.c

interfaces/blas/C/src/cblas_ssymv.c

interfaces/blas/C/src/cblas_ssyr.c

interfaces/blas/C/src/cblas_ssyr2.c

interfaces/blas/C/src/cblas_ssyr2k.c

interfaces/blas/C/src/cblas_ssyrk.c

interfaces/blas/C/src/cblas_stbmv.c

interfaces/blas/C/src/cblas_stbsv.c

interfaces/blas/C/src/cblas_stpmv.c

interfaces/blas/C/src/cblas_stpsv.c

interfaces/blas/C/src/cblas_strmm.c

interfaces/blas/C/src/cblas_strmv.c

interfaces/blas/C/src/cblas_strsm.c

interfaces/blas/C/src/cblas_strsv.c

interfaces/blas/C/src/cblas_xerbla.c

interfaces/blas/C/src/cblas_zaxpy.c

interfaces/blas/C/src/cblas_zcopy.c

interfaces/blas/C/src/cblas_zdotc.c

interfaces/blas/C/src/cblas_zdotu.c

interfaces/blas/C/src/cblas_zdrot.c

interfaces/blas/C/src/cblas_zdscal.c

interfaces/blas/C/src/cblas_zgbmv.c

interfaces/blas/C/src/cblas_zgemm.c

interfaces/blas/C/src/cblas_zgemv.c

interfaces/blas/C/src/cblas_zgerc.c

interfaces/blas/C/src/cblas_zgeru.c

interfaces/blas/C/src/cblas_zhbmv.c

interfaces/blas/C/src/cblas_zhemm.c

interfaces/blas/C/src/cblas_zhemv.c

interfaces/blas/C/src/cblas_zher.c

interfaces/blas/C/src/cblas_zher2.c

interfaces/blas/C/src/cblas_zher2k.c

interfaces/blas/C/src/cblas_zherk.c

interfaces/blas/C/src/cblas_zhpmv.c

interfaces/blas/C/src/cblas_zhpr.c

interfaces/blas/C/src/cblas_zhpr2.c

interfaces/blas/C/src/cblas_zrotg.c

interfaces/blas/C/src/cblas_zscal.c

interfaces/blas/C/src/cblas_zswap.c

interfaces/blas/C/src/cblas_zsymm.c

interfaces/blas/C/src/cblas_zsyr2k.c

interfaces/blas/C/src/cblas_zsyrk.c

interfaces/blas/C/src/cblas_ztbmv.c

interfaces/blas/C/src/cblas_ztbsv.c

interfaces/blas/C/src/cblas_ztpmv.c

interfaces/blas/C/src/cblas_ztpsv.c

interfaces/blas/C/src/cblas_ztrmm.c

interfaces/blas/C/src/cblas_ztrmv.c

interfaces/blas/C/src/cblas_ztrsm.c

interfaces/blas/C/src/cblas_ztrsv.c

interfaces/blas/C/testing

interfaces/blas/C/testing/auxiliary.c

interfaces/blas/C/testing/c_c2chke.c

interfaces/blas/C/testing/c_c3chke.c

interfaces/blas/C/testing/c_cblas1.c

interfaces/blas/C/testing/c_cblas2.c

interfaces/blas/C/testing/c_cblas3.c

interfaces/blas/C/testing/c_cblat1.f

interfaces/blas/C/testing/c_cblat2.dat

interfaces/blas/C/testing/c_cblat2.f

interfaces/blas/C/testing/c_cblat3.dat

interfaces/blas/C/testing/c_cblat3.f

interfaces/blas/C/testing/c_d2chke.c

interfaces/blas/C/testing/c_d3chke.c

interfaces/blas/C/testing/c_dblas1.c

interfaces/blas/C/testing/c_dblas2.c

interfaces/blas/C/testing/c_dblas3.c

interfaces/blas/C/testing/c_dblat1.f

interfaces/blas/C/testing/c_dblat2.dat

interfaces/blas/C/testing/c_dblat2.f

interfaces/blas/C/testing/c_dblat3.dat

interfaces/blas/C/testing/c_dblat3.f

interfaces/blas/C/testing/c_s2chke.c

interfaces/blas/C/testing/c_s3chke.c

interfaces/blas/C/testing/c_sblas1.c

interfaces/blas/C/testing/c_sblas2.c

interfaces/blas/C/testing/c_sblas3.c

interfaces/blas/C/testing/c_sblat1.f

interfaces/blas/C/testing/c_sblat2.dat

interfaces/blas/C/testing/c_sblat2.f

interfaces/blas/C/testing/c_sblat3.dat

interfaces/blas/C/testing/c_sblat3.f

interfaces/blas/C/testing/c_xerbla.c

interfaces/blas/C/testing/c_z2chke.c

interfaces/blas/C/testing/c_z3chke.c

interfaces/blas/C/testing/c_zblas1.c

interfaces/blas/C/testing/c_zblas2.c

interfaces/blas/C/testing/c_zblas3.c

interfaces/blas/C/testing/c_zblat1.f

interfaces/blas/C/testing/c_zblat2.dat

interfaces/blas/C/testing/c_zblat2.f

interfaces/blas/C/testing/c_zblat3.dat

interfaces/blas/C/testing/c_zblat3.f

interfaces/blas/F77

interfaces/blas/F77/src

interfaces/blas/F77/src/caxpy.f

interfaces/blas/F77/src/ccopy.f

interfaces/blas/F77/src/cdotc.f

interfaces/blas/F77/src/cdotu.f

interfaces/blas/F77/src/cgbmv.f

interfaces/blas/F77/src/cgemm.f

interfaces/blas/F77/src/cgemv.f

interfaces/blas/F77/src/cgerc.f

interfaces/blas/F77/src/cgeru.f

interfaces/blas/F77/src/chbmv.f

interfaces/blas/F77/src/chemm.f

interfaces/blas/F77/src/chemv.f

interfaces/blas/F77/src/cher.f

interfaces/blas/F77/src/cher2.f

interfaces/blas/F77/src/cher2k.f

interfaces/blas/F77/src/cherk.f

interfaces/blas/F77/src/chpmv.f

interfaces/blas/F77/src/chpr.f

interfaces/blas/F77/src/chpr2.f

interfaces/blas/F77/src/crotg.f

interfaces/blas/F77/src/cscal.f

interfaces/blas/F77/src/csrot.f

interfaces/blas/F77/src/csscal.f

interfaces/blas/F77/src/cswap.f

interfaces/blas/F77/src/csymm.f

interfaces/blas/F77/src/csyr2k.f

interfaces/blas/F77/src/csyrk.f

interfaces/blas/F77/src/ctbmv.f

interfaces/blas/F77/src/ctbsv.f

interfaces/blas/F77/src/ctpmv.f

interfaces/blas/F77/src/ctpsv.f

interfaces/blas/F77/src/ctrmm.f

interfaces/blas/F77/src/ctrmv.f

interfaces/blas/F77/src/ctrsm.f

interfaces/blas/F77/src/ctrsv.f

interfaces/blas/F77/src/dasum.f

interfaces/blas/F77/src/daxpy.f

interfaces/blas/F77/src/dcabs1.f

interfaces/blas/F77/src/dcopy.f

interfaces/blas/F77/src/ddot.f

interfaces/blas/F77/src/dgbmv.f

interfaces/blas/F77/src/dgemm.f

interfaces/blas/F77/src/dgemv.f

interfaces/blas/F77/src/dger.f

interfaces/blas/F77/src/dnrm2.f

interfaces/blas/F77/src/drot.f

interfaces/blas/F77/src/drotg.f

interfaces/blas/F77/src/drotm.f

interfaces/blas/F77/src/drotmg.f

interfaces/blas/F77/src/dsbmv.f

interfaces/blas/F77/src/dscal.f

interfaces/blas/F77/src/dsdot.f

interfaces/blas/F77/src/dspmv.f

interfaces/blas/F77/src/dspr.f

interfaces/blas/F77/src/dspr2.f

interfaces/blas/F77/src/dswap.f

interfaces/blas/F77/src/dsymm.f

interfaces/blas/F77/src/dsymv.f

interfaces/blas/F77/src/dsyr.f

interfaces/blas/F77/src/dsyr2.f

interfaces/blas/F77/src/dsyr2k.f

interfaces/blas/F77/src/dsyrk.f

interfaces/blas/F77/src/dtbmv.f

interfaces/blas/F77/src/dtbsv.f

interfaces/blas/F77/src/dtpmv.f

interfaces/blas/F77/src/dtpsv.f

interfaces/blas/F77/src/dtrmm.f

interfaces/blas/F77/src/dtrmv.f

interfaces/blas/F77/src/dtrsm.f

interfaces/blas/F77/src/dtrsv.f

interfaces/blas/F77/src/dzasum.f

interfaces/blas/F77/src/dznrm2.f

interfaces/blas/F77/src/f77wrap

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_amax.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_asum.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_axpy.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_copy.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_dot.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_dotc.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_dotu.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_dsdot.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_gbmv.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_gemm.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_gemv.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_ger.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_gerc.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_geru.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_hbmv.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_hemm.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_hemv.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_her.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_her2.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_her2k.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_herk.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_hpmv.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_hpr.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_hpr2.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_nrm2.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_rot.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_rotg.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_rotm.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_rotmg.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_rscal.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_sbmv.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_scal.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_sdsdot.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_spmv.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_spr.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_spr2.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_swap.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_symm.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_symv.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_syr.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_syr2.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_syr2k.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_syrk.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_tbmv.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_tbsv.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_tpmv.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_tpsv.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_trmm.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_trmv.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_trsm.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_trsv.c

interfaces/blas/F77/src/icamax.f

interfaces/blas/F77/src/idamax.f

interfaces/blas/F77/src/isamax.f

interfaces/blas/F77/src/izamax.f

interfaces/blas/F77/src/lsame.f

interfaces/blas/F77/src/sasum.f

interfaces/blas/F77/src/saxpy.f

interfaces/blas/F77/src/scasum.f

interfaces/blas/F77/src/scnrm2.f

interfaces/blas/F77/src/scopy.f

interfaces/blas/F77/src/sdot.f

interfaces/blas/F77/src/sdsdot.f

interfaces/blas/F77/src/sgbmv.f

interfaces/blas/F77/src/sgemm.f

interfaces/blas/F77/src/sgemv.f

interfaces/blas/F77/src/sger.f

interfaces/blas/F77/src/snrm2.f

interfaces/blas/F77/src/srot.f

interfaces/blas/F77/src/srotg.f

interfaces/blas/F77/src/srotm.f

interfaces/blas/F77/src/srotmg.f

interfaces/blas/F77/src/ssbmv.f

interfaces/blas/F77/src/sscal.f

interfaces/blas/F77/src/sspmv.f

interfaces/blas/F77/src/sspr.f

interfaces/blas/F77/src/sspr2.f

interfaces/blas/F77/src/sswap.f

interfaces/blas/F77/src/ssymm.f

interfaces/blas/F77/src/ssymv.f

interfaces/blas/F77/src/ssyr.f

interfaces/blas/F77/src/ssyr2.f

interfaces/blas/F77/src/ssyr2k.f

interfaces/blas/F77/src/ssyrk.f

interfaces/blas/F77/src/stbmv.f

interfaces/blas/F77/src/stbsv.f

interfaces/blas/F77/src/stpmv.f

interfaces/blas/F77/src/stpsv.f

interfaces/blas/F77/src/strmm.f

interfaces/blas/F77/src/strmv.f

interfaces/blas/F77/src/strsm.f

interfaces/blas/F77/src/strsv.f

interfaces/blas/F77/src/xerbla.f

interfaces/blas/F77/src/zaxpy.f

interfaces/blas/F77/src/zcopy.f

interfaces/blas/F77/src/zdotc.f

interfaces/blas/F77/src/zdotu.f

interfaces/blas/F77/src/zdrot.f

interfaces/blas/F77/src/zdscal.f

interfaces/blas/F77/src/zgbmv.f

interfaces/blas/F77/src/zgemm.f

interfaces/blas/F77/src/zgemv.f

interfaces/blas/F77/src/zgerc.f

interfaces/blas/F77/src/zgeru.f

interfaces/blas/F77/src/zhbmv.f

interfaces/blas/F77/src/zhemm.f

interfaces/blas/F77/src/zhemv.f

interfaces/blas/F77/src/zher.f

interfaces/blas/F77/src/zher2.f

interfaces/blas/F77/src/zher2k.f

interfaces/blas/F77/src/zherk.f

interfaces/blas/F77/src/zhpmv.f

interfaces/blas/F77/src/zhpr.f

interfaces/blas/F77/src/zhpr2.f

interfaces/blas/F77/src/zrotg.f

interfaces/blas/F77/src/zscal.f

interfaces/blas/F77/src/zswap.f

interfaces/blas/F77/src/zsymm.f

interfaces/blas/F77/src/zsyr2k.f

interfaces/blas/F77/src/zsyrk.f

interfaces/blas/F77/src/ztbmv.f

interfaces/blas/F77/src/ztbsv.f

interfaces/blas/F77/src/ztpmv.f

interfaces/blas/F77/src/ztpsv.f

interfaces/blas/F77/src/ztrmm.f

interfaces/blas/F77/src/ztrmv.f

interfaces/blas/F77/src/ztrsm.f

interfaces/blas/F77/src/ztrsv.f

interfaces/blas/F77/testing

interfaces/blas/F77/testing/cblat1.f

interfaces/blas/F77/testing/cblat2.dat

interfaces/blas/F77/testing/cblat2.f

interfaces/blas/F77/testing/cblat3.dat

interfaces/blas/F77/testing/cblat3.f

interfaces/blas/F77/testing/dblat1.f

interfaces/blas/F77/testing/dblat2.dat

interfaces/blas/F77/testing/dblat2.f

interfaces/blas/F77/testing/dblat3.dat

interfaces/blas/F77/testing/dblat3.f

interfaces/blas/F77/testing/sblat1.f

interfaces/blas/F77/testing/sblat2.dat

interfaces/blas/F77/testing/sblat2.f

interfaces/blas/F77/testing/sblat3.dat

interfaces/blas/F77/testing/sblat3.f

interfaces/blas/F77/testing/zblat1.f

interfaces/blas/F77/testing/zblat2.dat

interfaces/blas/F77/testing/zblat2.f

interfaces/blas/F77/testing/zblat3.dat

interfaces/blas/F77/testing/zblat3.f

interfaces/lapack

interfaces/lapack/C

interfaces/lapack/C/src

interfaces/lapack/C/src/clapack_cgesv.c

interfaces/lapack/C/src/clapack_cgetrf.c

interfaces/lapack/C/src/clapack_cgetrs.c

interfaces/lapack/C/src/clapack_cposv.c

interfaces/lapack/C/src/clapack_cpotrf.c

interfaces/lapack/C/src/clapack_cpotrs.c

interfaces/lapack/C/src/clapack_dgesv.c

interfaces/lapack/C/src/clapack_dgetrf.c

interfaces/lapack/C/src/clapack_dgetrs.c

interfaces/lapack/C/src/clapack_dposv.c

interfaces/lapack/C/src/clapack_dpotrf.c

interfaces/lapack/C/src/clapack_dpotrs.c

interfaces/lapack/C/src/clapack_sgesv.c

interfaces/lapack/C/src/clapack_sgetrf.c

interfaces/lapack/C/src/clapack_sgetrs.c

interfaces/lapack/C/src/clapack_sposv.c

interfaces/lapack/C/src/clapack_spotrf.c

interfaces/lapack/C/src/clapack_spotrs.c

interfaces/lapack/C/src/clapack_zgesv.c

interfaces/lapack/C/src/clapack_zgetrf.c

interfaces/lapack/C/src/clapack_zgetrs.c

interfaces/lapack/C/src/clapack_zposv.c

interfaces/lapack/C/src/clapack_zpotrf.c

interfaces/lapack/C/src/clapack_zpotrs.c

interfaces/lapack/F77

interfaces/lapack/F77/src

interfaces/lapack/F77/src/cgesv.f

interfaces/lapack/F77/src/cgetrf.f

interfaces/lapack/F77/src/cgetrs.f

interfaces/lapack/F77/src/cposv.f

interfaces/lapack/F77/src/cpotrf.f

interfaces/lapack/F77/src/cpotrs.f

interfaces/lapack/F77/src/dgesv.f

interfaces/lapack/F77/src/dgetrf.f

interfaces/lapack/F77/src/dgetrs.f

interfaces/lapack/F77/src/dposv.f

interfaces/lapack/F77/src/dpotrf.f

interfaces/lapack/F77/src/dpotrs.f

interfaces/lapack/F77/src/f77wrap

interfaces/lapack/F77/src/f77wrap/ATL_f77wrap_gesv.c

interfaces/lapack/F77/src/f77wrap/ATL_f77wrap_getnb.c

interfaces/lapack/F77/src/f77wrap/ATL_f77wrap_getrf.c

interfaces/lapack/F77/src/f77wrap/ATL_f77wrap_getrs.c

interfaces/lapack/F77/src/f77wrap/ATL_f77wrap_posv.c

interfaces/lapack/F77/src/f77wrap/ATL_f77wrap_potrf.c

interfaces/lapack/F77/src/f77wrap/ATL_f77wrap_potrs.c

interfaces/lapack/F77/src/ilaenv.f

interfaces/lapack/F77/src/sgesv.f

interfaces/lapack/F77/src/sgetrf.f

interfaces/lapack/F77/src/sgetrs.f

interfaces/lapack/F77/src/sposv.f

interfaces/lapack/F77/src/spotrf.f

interfaces/lapack/F77/src/spotrs.f

interfaces/lapack/F77/src/zgesv.f

interfaces/lapack/F77/src/zgetrf.f

interfaces/lapack/F77/src/zgetrs.f

interfaces/lapack/F77/src/zposv.f

interfaces/lapack/F77/src/zpotrf.f

interfaces/lapack/F77/src/zpotrs.f

lib/.empty

makes

makes/ATLrun.Linux_PIIISSE1

makes/ATLrun.sh

makes/Make-ant.ext

makes/Make.Clp

makes/Make.Clptst

makes/Make.Flp

makes/Make.Flptst

makes/Make.aux

makes/Make.bin

makes/Make.cblas

makes/Make.cblastst

makes/Make.ext

makes/Make.f77blas

makes/Make.f77blastst

makes/Make.gemmbased

makes/Make.goto

makes/Make.l1ptblas

makes/Make.l1ref

makes/Make.l1src

makes/Make.l1src-cplx

makes/Make.l1src-real

makes/Make.l1tune

makes/Make.l2

makes/Make.l2aux

makes/Make.l2kern

makes/Make.l2ptblas

makes/Make.l2ref

makes/Make.l2ref0

makes/Make.l2src

makes/Make.l3

makes/Make.l3aux

makes/Make.l3kern

makes/Make.l3ptblas

makes/Make.l3ref

makes/Make.l3tune

makes/Make.lpsrc

makes/Make.miptblas

makes/Make.mmsrc

makes/Make.mmtune

makes/Make.mvsrc

makes/Make.mvtune

makes/Make.r1src

makes/Make.r1tune

makes/Make.sysinfo

makes/Make.tstsrc

makes/OLD

makes/OLD/Make.l1ref

makes/OLD/Make.l2ref

makes/OLD/Make.l3ref

makes/atlas_pthreads.h

makes/c_cblat3.in

makes/c_dblat3.in

makes/c_sblat3.in

makes/c_zblat3.in

src/auxil

src/auxil/ATL_axpby.c

src/auxil/ATL_axpy.c

src/auxil/ATL_copy.c

src/auxil/ATL_cplxinvert.c

src/auxil/ATL_flushcache.c

src/auxil/ATL_geadd.c

src/auxil/ATL_gecopy.c

src/auxil/ATL_gemove.c

src/auxil/ATL_gescal.c

src/auxil/ATL_gezero.c

src/auxil/ATL_hescal.c

src/auxil/ATL_lcm.c

src/auxil/ATL_move.c

src/auxil/ATL_ptflushcache.c

src/auxil/ATL_scal.c

src/auxil/ATL_set.c

src/auxil/ATL_trscal.c

src/auxil/ATL_xerbla.c

src/auxil/ATL_zero.c

src/auxil/kernel

src/auxil/kernel/ATL_axpby.c

src/auxil/kernel/ATL_axpy_x1_y1.c

src/auxil/kernel/ATL_caxpy_x1_y1.c

src/auxil/kernel/ATL_geadd.c

src/auxil/kernel/ATL_gemove.c

src/auxil/kernel/ATL_gescal.c

src/blas

src/blas/gemm

src/blas/gemm/ATL_AgemmXX.c

src/blas/gemm/ATL_CNBmm_b0.c

src/blas/gemm/ATL_CNBmm_b1.c

src/blas/gemm/ATL_CNBmm_bX.c

src/blas/gemm/ATL_GetNB.c

src/blas/gemm/ATL_GetNCNB.c

src/blas/gemm/ATL_IBJBmm.c

src/blas/gemm/ATL_IBNBmm.c

src/blas/gemm/ATL_MBJBmm.c

src/blas/gemm/ATL_NCmmIJK.c

src/blas/gemm/ATL_NCmmIJK_c.c

src/blas/gemm/ATL_NCmmJIK.c

src/blas/gemm/ATL_NCmmJIK_c.c

src/blas/gemm/ATL_cNCmmIJK.c

src/blas/gemm/ATL_cNCmmIJK_c.c

src/blas/gemm/ATL_cNCmmJIK.c

src/blas/gemm/ATL_cNCmmJIK_c.c

src/blas/gemm/ATL_ccol2blk.c

src/blas/gemm/ATL_cmmIJK.c

src/blas/gemm/ATL_cmmJIK.c

src/blas/gemm/ATL_col2blk.c

src/blas/gemm/ATL_crow2blkT.c

src/blas/gemm/ATL_gemm.c

src/blas/gemm/ATL_gemmXX.c

src/blas/gemm/ATL_mmIJK.c

src/blas/gemm/ATL_mmJIK.c

src/blas/gemm/ATL_mm_tMK.c

src/blas/gemm/ATL_putblk.c

src/blas/gemm/ATL_row2blkT.c

src/blas/gemm/GOTO

src/blas/gemm/GOTO/ATLU_usergemm.c

src/blas/gemm/GOTO/COPYING.LIB

src/blas/gemm/GOTO/README

src/blas/gemm/GOTO/common.h

src/blas/gemm/GOTO/gemm_EV5_k.S

src/blas/gemm/GOTO/gemm_EV6_k.S

src/blas/gemm/GOTO/gemm_k.S

src/blas/gemm/GOTO/libgemm-20000228.tar.bz2

src/blas/gemm/GOTO/version.h

src/blas/gemm/GOTO/zgemm_k.S

src/blas/gemm/UMMEXAMPLE

src/blas/gemm/UMMEXAMPLE/ATLU_usergemm.c

src/blas/gemm/UMMEXAMPLE/Makefile

src/blas/gemv

src/blas/gemv/ATL_gemv.c

src/blas/ger

src/blas/ger/ATL_ger.c

src/blas/level1

src/blas/level1/ATL_asum.c

src/blas/level1/ATL_dot.c

src/blas/level1/ATL_dotc.c

src/blas/level1/ATL_dotu.c

src/blas/level1/ATL_dsdot.c

src/blas/level1/ATL_iamax.c

src/blas/level1/ATL_nrm2.c

src/blas/level1/ATL_rot.c

src/blas/level1/ATL_rotg.c

src/blas/level1/ATL_rotm.c

src/blas/level1/ATL_rotmg.c

src/blas/level1/ATL_sdsdot.c

src/blas/level1/ATL_swap.c

src/blas/level2

src/blas/level2/ATL_gbmv.c

src/blas/level2/ATL_gpmv.c

src/blas/level2/ATL_gpr.c

src/blas/level2/ATL_gprc.c

src/blas/level2/ATL_gpru.c

src/blas/level2/ATL_hbmv.c

src/blas/level2/ATL_hemv.c

src/blas/level2/ATL_her.c

src/blas/level2/ATL_her2.c

src/blas/level2/ATL_hpmv.c

src/blas/level2/ATL_hpr.c

src/blas/level2/ATL_hpr2.c

src/blas/level2/ATL_sbmv.c

src/blas/level2/ATL_spmv.c

src/blas/level2/ATL_spr.c

src/blas/level2/ATL_spr2.c

src/blas/level2/ATL_symv.c

src/blas/level2/ATL_syr.c

src/blas/level2/ATL_syr2.c

src/blas/level2/ATL_tbmv.c

src/blas/level2/ATL_tbsv.c

src/blas/level2/ATL_tpmv.c

src/blas/level2/ATL_tpsv.c

src/blas/level2/ATL_trmv.c

src/blas/level2/ATL_trsv.c

src/blas/level2/kernel

src/blas/level2/kernel/ATL_gpmv_a1_x1_y1.c

src/blas/level2/kernel/ATL_hbmvL.c

src/blas/level2/kernel/ATL_hbmvU.c

src/blas/level2/kernel/ATL_hemvL.c

src/blas/level2/kernel/ATL_hemvU.c

src/blas/level2/kernel/ATL_her2L.c

src/blas/level2/kernel/ATL_her2U.c

src/blas/level2/kernel/ATL_herL.c

src/blas/level2/kernel/ATL_herU.c

src/blas/level2/kernel/ATL_hpmvL.c

src/blas/level2/kernel/ATL_hpmvU.c

src/blas/level2/kernel/ATL_hpr2L.c

src/blas/level2/kernel/ATL_hpr2U.c

src/blas/level2/kernel/ATL_hprL.c

src/blas/level2/kernel/ATL_hprU.c

src/blas/level2/kernel/ATL_sbmvL.c

src/blas/level2/kernel/ATL_sbmvU.c

src/blas/level2/kernel/ATL_spmvL.c

src/blas/level2/kernel/ATL_spmvU.c

src/blas/level2/kernel/ATL_spr2L.c

src/blas/level2/kernel/ATL_spr2U.c

src/blas/level2/kernel/ATL_sprL.c

src/blas/level2/kernel/ATL_sprU.c

src/blas/level2/kernel/ATL_symvL.c

src/blas/level2/kernel/ATL_symvU.c

src/blas/level2/kernel/ATL_syr2L.c

src/blas/level2/kernel/ATL_syr2U.c

src/blas/level2/kernel/ATL_syrL.c

src/blas/level2/kernel/ATL_syrU.c

src/blas/level2/kernel/ATL_tbmvLC.c

src/blas/level2/kernel/ATL_tbmvLCN.c

src/blas/level2/kernel/ATL_tbmvLCU.c

src/blas/level2/kernel/ATL_tbmvLH.c

src/blas/level2/kernel/ATL_tbmvLHN.c

src/blas/level2/kernel/ATL_tbmvLHU.c

src/blas/level2/kernel/ATL_tbmvLN.c

src/blas/level2/kernel/ATL_tbmvLNN.c

src/blas/level2/kernel/ATL_tbmvLNU.c

src/blas/level2/kernel/ATL_tbmvLT.c

src/blas/level2/kernel/ATL_tbmvLTN.c

src/blas/level2/kernel/ATL_tbmvLTU.c

src/blas/level2/kernel/ATL_tbmvUC.c

src/blas/level2/kernel/ATL_tbmvUCN.c

src/blas/level2/kernel/ATL_tbmvUCU.c

src/blas/level2/kernel/ATL_tbmvUH.c

src/blas/level2/kernel/ATL_tbmvUHN.c

src/blas/level2/kernel/ATL_tbmvUHU.c

src/blas/level2/kernel/ATL_tbmvUN.c

src/blas/level2/kernel/ATL_tbmvUNN.c

src/blas/level2/kernel/ATL_tbmvUNU.c

src/blas/level2/kernel/ATL_tbmvUT.c

src/blas/level2/kernel/ATL_tbmvUTN.c

src/blas/level2/kernel/ATL_tbmvUTU.c

src/blas/level2/kernel/ATL_tbsvLC.c

src/blas/level2/kernel/ATL_tbsvLCN.c

src/blas/level2/kernel/ATL_tbsvLCU.c

src/blas/level2/kernel/ATL_tbsvLH.c

src/blas/level2/kernel/ATL_tbsvLHN.c

src/blas/level2/kernel/ATL_tbsvLHU.c

src/blas/level2/kernel/ATL_tbsvLN.c

src/blas/level2/kernel/ATL_tbsvLNN.c

src/blas/level2/kernel/ATL_tbsvLNU.c

src/blas/level2/kernel/ATL_tbsvLT.c

src/blas/level2/kernel/ATL_tbsvLTN.c

src/blas/level2/kernel/ATL_tbsvLTU.c

src/blas/level2/kernel/ATL_tbsvUC.c

src/blas/level2/kernel/ATL_tbsvUCN.c

src/blas/level2/kernel/ATL_tbsvUCU.c

src/blas/level2/kernel/ATL_tbsvUH.c

src/blas/level2/kernel/ATL_tbsvUHN.c

src/blas/level2/kernel/ATL_tbsvUHU.c

src/blas/level2/kernel/ATL_tbsvUN.c

src/blas/level2/kernel/ATL_tbsvUNN.c

src/blas/level2/kernel/ATL_tbsvUNU.c

src/blas/level2/kernel/ATL_tbsvUT.c

src/blas/level2/kernel/ATL_tbsvUTN.c

src/blas/level2/kernel/ATL_tbsvUTU.c

src/blas/level2/kernel/ATL_tpmvLC.c

src/blas/level2/kernel/ATL_tpmvLCN.c

src/blas/level2/kernel/ATL_tpmvLCU.c

src/blas/level2/kernel/ATL_tpmvLH.c

src/blas/level2/kernel/ATL_tpmvLHN.c

src/blas/level2/kernel/ATL_tpmvLHU.c

src/blas/level2/kernel/ATL_tpmvLN.c

src/blas/level2/kernel/ATL_tpmvLNN.c

src/blas/level2/kernel/ATL_tpmvLNU.c

src/blas/level2/kernel/ATL_tpmvLT.c

src/blas/level2/kernel/ATL_tpmvLTN.c

src/blas/level2/kernel/ATL_tpmvLTU.c

src/blas/level2/kernel/ATL_tpmvUC.c

src/blas/level2/kernel/ATL_tpmvUCN.c

src/blas/level2/kernel/ATL_tpmvUCU.c

src/blas/level2/kernel/ATL_tpmvUH.c

src/blas/level2/kernel/ATL_tpmvUHN.c

src/blas/level2/kernel/ATL_tpmvUHU.c

src/blas/level2/kernel/ATL_tpmvUN.c

src/blas/level2/kernel/ATL_tpmvUNN.c

src/blas/level2/kernel/ATL_tpmvUNU.c

src/blas/level2/kernel/ATL_tpmvUT.c

src/blas/level2/kernel/ATL_tpmvUTN.c

src/blas/level2/kernel/ATL_tpmvUTU.c

src/blas/level2/kernel/ATL_tpsvLC.c

src/blas/level2/kernel/ATL_tpsvLCN.c

src/blas/level2/kernel/ATL_tpsvLCU.c

src/blas/level2/kernel/ATL_tpsvLH.c

src/blas/level2/kernel/ATL_tpsvLHN.c

src/blas/level2/kernel/ATL_tpsvLHU.c

src/blas/level2/kernel/ATL_tpsvLN.c

src/blas/level2/kernel/ATL_tpsvLNN.c

src/blas/level2/kernel/ATL_tpsvLNU.c

src/blas/level2/kernel/ATL_tpsvLT.c

src/blas/level2/kernel/ATL_tpsvLTN.c

src/blas/level2/kernel/ATL_tpsvLTU.c

src/blas/level2/kernel/ATL_tpsvUC.c

src/blas/level2/kernel/ATL_tpsvUCN.c

src/blas/level2/kernel/ATL_tpsvUCU.c

src/blas/level2/kernel/ATL_tpsvUH.c

src/blas/level2/kernel/ATL_tpsvUHN.c

src/blas/level2/kernel/ATL_tpsvUHU.c

src/blas/level2/kernel/ATL_tpsvUN.c

src/blas/level2/kernel/ATL_tpsvUNN.c

src/blas/level2/kernel/ATL_tpsvUNU.c

src/blas/level2/kernel/ATL_tpsvUT.c

src/blas/level2/kernel/ATL_tpsvUTN.c

src/blas/level2/kernel/ATL_tpsvUTU.c

src/blas/level2/kernel/ATL_trmvLC.c

src/blas/level2/kernel/ATL_trmvLCN.c

src/blas/level2/kernel/ATL_trmvLCU.c

src/blas/level2/kernel/ATL_trmvLH.c

src/blas/level2/kernel/ATL_trmvLHN.c

src/blas/level2/kernel/ATL_trmvLHU.c

src/blas/level2/kernel/ATL_trmvLN.c

src/blas/level2/kernel/ATL_trmvLNN.c

src/blas/level2/kernel/ATL_trmvLNU.c

src/blas/level2/kernel/ATL_trmvLT.c

src/blas/level2/kernel/ATL_trmvLTN.c

src/blas/level2/kernel/ATL_trmvLTU.c

src/blas/level2/kernel/ATL_trmvUC.c

src/blas/level2/kernel/ATL_trmvUCN.c

src/blas/level2/kernel/ATL_trmvUCU.c

src/blas/level2/kernel/ATL_trmvUH.c

src/blas/level2/kernel/ATL_trmvUHN.c

src/blas/level2/kernel/ATL_trmvUHU.c

src/blas/level2/kernel/ATL_trmvUN.c

src/blas/level2/kernel/ATL_trmvUNN.c

src/blas/level2/kernel/ATL_trmvUNU.c

src/blas/level2/kernel/ATL_trmvUT.c

src/blas/level2/kernel/ATL_trmvUTN.c

src/blas/level2/kernel/ATL_trmvUTU.c

src/blas/level2/kernel/ATL_trsvLC.c

src/blas/level2/kernel/ATL_trsvLCN.c

src/blas/level2/kernel/ATL_trsvLCU.c

src/blas/level2/kernel/ATL_trsvLH.c

src/blas/level2/kernel/ATL_trsvLHN.c

src/blas/level2/kernel/ATL_trsvLHU.c

src/blas/level2/kernel/ATL_trsvLN.c

src/blas/level2/kernel/ATL_trsvLNN.c

src/blas/level2/kernel/ATL_trsvLNU.c

src/blas/level2/kernel/ATL_trsvLT.c

src/blas/level2/kernel/ATL_trsvLTN.c

src/blas/level2/kernel/ATL_trsvLTU.c

src/blas/level2/kernel/ATL_trsvUC.c

src/blas/level2/kernel/ATL_trsvUCN.c

src/blas/level2/kernel/ATL_trsvUCU.c

src/blas/level2/kernel/ATL_trsvUH.c

src/blas/level2/kernel/ATL_trsvUHN.c

src/blas/level2/kernel/ATL_trsvUHU.c

src/blas/level2/kernel/ATL_trsvUN.c

src/blas/level2/kernel/ATL_trsvUNN.c

src/blas/level2/kernel/ATL_trsvUNU.c

src/blas/level2/kernel/ATL_trsvUT.c

src/blas/level2/kernel/ATL_trsvUTN.c

src/blas/level2/kernel/ATL_trsvUTU.c

src/blas/level3

src/blas/level3/ATL_hemm.c

src/blas/level3/ATL_her2k.c

src/blas/level3/ATL_herk.c

src/blas/level3/ATL_symm.c

src/blas/level3/ATL_syr2k.c

src/blas/level3/ATL_syrk.c

src/blas/level3/ATL_trmm.c

src/blas/level3/ATL_trsm.c

src/blas/level3/kernel

src/blas/level3/kernel/ATL_hemmL.c

src/blas/level3/kernel/ATL_hemmR.c

src/blas/level3/kernel/ATL_her2k.c

src/blas/level3/kernel/ATL_herk_N.c

src/blas/level3/kernel/ATL_herk_T.c

src/blas/level3/kernel/ATL_sycopyL.c

src/blas/level3/kernel/ATL_sycopyU.c

src/blas/level3/kernel/ATL_symmL.c

src/blas/level3/kernel/ATL_symmR.c

src/blas/level3/kernel/ATL_syr2k_N.c

src/blas/level3/kernel/ATL_syr2k_T.c

src/blas/level3/kernel/ATL_syr2k_putL.c

src/blas/level3/kernel/ATL_syr2k_putU.c

src/blas/level3/kernel/ATL_syrk_N.c

src/blas/level3/kernel/ATL_syrk_T.c

src/blas/level3/kernel/ATL_trcopyL2L.c

src/blas/level3/kernel/ATL_trcopyL2U.c

src/blas/level3/kernel/ATL_trcopyU2L.c

src/blas/level3/kernel/ATL_trcopyU2U.c

src/blas/level3/kernel/ATL_trinvert.c

src/blas/level3/kernel/ATL_trmmL.c

src/blas/level3/kernel/ATL_trmmR.c

src/blas/level3/kernel/ATL_trmv_scal.c

src/blas/level3/kernel/ATL_trputL.c

src/blas/level3/kernel/ATL_trputU.c

src/blas/level3/kernel/ATL_trsmKL.c

src/blas/level3/kernel/ATL_trsmKR.c

src/blas/level3/kernel/ATL_trsmL.c

src/blas/level3/kernel/ATL_trsmR.c

src/blas/level3/rblas

src/blas/level3/rblas/ATL_gemmRB.c

src/blas/level3/rblas/ATL_rhemmLL.c

src/blas/level3/rblas/ATL_rhemmLU.c

src/blas/level3/rblas/ATL_rhemmRL.c

src/blas/level3/rblas/ATL_rhemmRU.c

src/blas/level3/rblas/ATL_rher2kLC.c

src/blas/level3/rblas/ATL_rher2kLN.c

src/blas/level3/rblas/ATL_rher2kUC.c

src/blas/level3/rblas/ATL_rher2kUN.c

src/blas/level3/rblas/ATL_rherkLC.c

src/blas/level3/rblas/ATL_rherkLN.c

src/blas/level3/rblas/ATL_rherkUC.c

src/blas/level3/rblas/ATL_rherkUN.c

src/blas/level3/rblas/ATL_rsymmLL.c

src/blas/level3/rblas/ATL_rsymmLU.c

src/blas/level3/rblas/ATL_rsymmRL.c

src/blas/level3/rblas/ATL_rsymmRU.c

src/blas/level3/rblas/ATL_rsyr2kLN.c

src/blas/level3/rblas/ATL_rsyr2kLT.c

src/blas/level3/rblas/ATL_rsyr2kUN.c

src/blas/level3/rblas/ATL_rsyr2kUT.c

src/blas/level3/rblas/ATL_rsyrkLN.c

src/blas/level3/rblas/ATL_rsyrkLT.c

src/blas/level3/rblas/ATL_rsyrkUN.c

src/blas/level3/rblas/ATL_rsyrkUT.c

src/blas/level3/rblas/ATL_rtrmmLLC.c

src/blas/level3/rblas/ATL_rtrmmLLN.c

src/blas/level3/rblas/ATL_rtrmmLLT.c

src/blas/level3/rblas/ATL_rtrmmLUC.c

src/blas/level3/rblas/ATL_rtrmmLUN.c

src/blas/level3/rblas/ATL_rtrmmLUT.c

src/blas/level3/rblas/ATL_rtrmmRLC.c

src/blas/level3/rblas/ATL_rtrmmRLN.c

src/blas/level3/rblas/ATL_rtrmmRLT.c

src/blas/level3/rblas/ATL_rtrmmRUC.c

src/blas/level3/rblas/ATL_rtrmmRUN.c

src/blas/level3/rblas/ATL_rtrmmRUT.c

src/blas/level3/rblas/ATL_rtrsmLLC.c

src/blas/level3/rblas/ATL_rtrsmLLN.c

src/blas/level3/rblas/ATL_rtrsmLLT.c

src/blas/level3/rblas/ATL_rtrsmLUC.c

src/blas/level3/rblas/ATL_rtrsmLUN.c

src/blas/level3/rblas/ATL_rtrsmLUT.c

src/blas/level3/rblas/ATL_rtrsmRLC.c

src/blas/level3/rblas/ATL_rtrsmRLN.c

src/blas/level3/rblas/ATL_rtrsmRLT.c

src/blas/level3/rblas/ATL_rtrsmRUC.c

src/blas/level3/rblas/ATL_rtrsmRUN.c

src/blas/level3/rblas/ATL_rtrsmRUT.c

src/blas/reference

src/blas/reference/level1

src/blas/reference/level1/ATL_crefaxpy.c

src/blas/reference/level1/ATL_crefcopy.c

src/blas/reference/level1/ATL_crefdotc_sub.c

src/blas/reference/level1/ATL_crefdotu_sub.c

src/blas/reference/level1/ATL_crefrotg.c

src/blas/reference/level1/ATL_crefscal.c

src/blas/reference/level1/ATL_crefswap.c

src/blas/reference/level1/ATL_csrefrot.c

src/blas/reference/level1/ATL_csrefscal.c

src/blas/reference/level1/ATL_drefasum.c

src/blas/reference/level1/ATL_drefaxpy.c

src/blas/reference/level1/ATL_drefcopy.c

src/blas/reference/level1/ATL_drefdot.c

src/blas/reference/level1/ATL_drefnrm2.c

src/blas/reference/level1/ATL_drefrot.c

src/blas/reference/level1/ATL_drefrotg.c

src/blas/reference/level1/ATL_drefrotm.c

src/blas/reference/level1/ATL_drefrotmg.c

src/blas/reference/level1/ATL_drefscal.c

src/blas/reference/level1/ATL_drefswap.c

src/blas/reference/level1/ATL_dsrefdot.c

src/blas/reference/level1/ATL_dzrefasum.c

src/blas/reference/level1/ATL_dzrefnrm2.c

src/blas/reference/level1/ATL_icrefamax.c

src/blas/reference/level1/ATL_idrefamax.c

src/blas/reference/level1/ATL_isrefamax.c

src/blas/reference/level1/ATL_izrefamax.c

src/blas/reference/level1/ATL_screfasum.c

src/blas/reference/level1/ATL_screfnrm2.c

src/blas/reference/level1/ATL_sdsrefdot.c

src/blas/reference/level1/ATL_srefasum.c

src/blas/reference/level1/ATL_srefaxpy.c

src/blas/reference/level1/ATL_srefcopy.c

src/blas/reference/level1/ATL_srefdot.c

src/blas/reference/level1/ATL_srefnrm2.c

src/blas/reference/level1/ATL_srefrot.c

src/blas/reference/level1/ATL_srefrotg.c

src/blas/reference/level1/ATL_srefrotm.c

src/blas/reference/level1/ATL_srefrotmg.c

src/blas/reference/level1/ATL_srefscal.c

src/blas/reference/level1/ATL_srefswap.c

src/blas/reference/level1/ATL_zdrefrot.c

src/blas/reference/level1/ATL_zdrefscal.c

src/blas/reference/level1/ATL_zrefaxpy.c

src/blas/reference/level1/ATL_zrefcopy.c

src/blas/reference/level1/ATL_zrefdotc_sub.c

src/blas/reference/level1/ATL_zrefdotu_sub.c

src/blas/reference/level1/ATL_zrefrotg.c

src/blas/reference/level1/ATL_zrefscal.c

src/blas/reference/level1/ATL_zrefswap.c

src/blas/reference/level2

src/blas/reference/level2/ATL_crefgbmv.c

src/blas/reference/level2/ATL_crefgbmvC.c

src/blas/reference/level2/ATL_crefgbmvH.c

src/blas/reference/level2/ATL_crefgbmvN.c

src/blas/reference/level2/ATL_crefgbmvT.c

src/blas/reference/level2/ATL_crefgemv.c

src/blas/reference/level2/ATL_crefgemvC.c

src/blas/reference/level2/ATL_crefgemvH.c

src/blas/reference/level2/ATL_crefgemvN.c

src/blas/reference/level2/ATL_crefgemvT.c

src/blas/reference/level2/ATL_crefgerc.c

src/blas/reference/level2/ATL_crefgeru.c

src/blas/reference/level2/ATL_crefgpmv.c

src/blas/reference/level2/ATL_crefgpmvLC.c

src/blas/reference/level2/ATL_crefgpmvLH.c

src/blas/reference/level2/ATL_crefgpmvLN.c

src/blas/reference/level2/ATL_crefgpmvLT.c

src/blas/reference/level2/ATL_crefgpmvUC.c

src/blas/reference/level2/ATL_crefgpmvUH.c

src/blas/reference/level2/ATL_crefgpmvUN.c

src/blas/reference/level2/ATL_crefgpmvUT.c

src/blas/reference/level2/ATL_crefgprc.c

src/blas/reference/level2/ATL_crefgpru.c

src/blas/reference/level2/ATL_crefhbmv.c

src/blas/reference/level2/ATL_crefhbmvL.c

src/blas/reference/level2/ATL_crefhbmvU.c

src/blas/reference/level2/ATL_crefhemv.c

src/blas/reference/level2/ATL_crefhemvL.c

src/blas/reference/level2/ATL_crefhemvU.c

src/blas/reference/level2/ATL_crefher.c

src/blas/reference/level2/ATL_crefher2.c

src/blas/reference/level2/ATL_crefher2L.c

src/blas/reference/level2/ATL_crefher2U.c

src/blas/reference/level2/ATL_crefherL.c

src/blas/reference/level2/ATL_crefherU.c

src/blas/reference/level2/ATL_crefhpmv.c

src/blas/reference/level2/ATL_crefhpmvL.c

src/blas/reference/level2/ATL_crefhpmvU.c

src/blas/reference/level2/ATL_crefhpr.c

src/blas/reference/level2/ATL_crefhpr2.c

src/blas/reference/level2/ATL_crefhpr2L.c

src/blas/reference/level2/ATL_crefhpr2U.c

src/blas/reference/level2/ATL_crefhprL.c

src/blas/reference/level2/ATL_crefhprU.c

src/blas/reference/level2/ATL_creftbmv.c

src/blas/reference/level2/ATL_creftbmvLCN.c

src/blas/reference/level2/ATL_creftbmvLCU.c

src/blas/reference/level2/ATL_creftbmvLHN.c

src/blas/reference/level2/ATL_creftbmvLHU.c

src/blas/reference/level2/ATL_creftbmvLNN.c

src/blas/reference/level2/ATL_creftbmvLNU.c

src/blas/reference/level2/ATL_creftbmvLTN.c

src/blas/reference/level2/ATL_creftbmvLTU.c

src/blas/reference/level2/ATL_creftbmvUCN.c

src/blas/reference/level2/ATL_creftbmvUCU.c

src/blas/reference/level2/ATL_creftbmvUHN.c

src/blas/reference/level2/ATL_creftbmvUHU.c

src/blas/reference/level2/ATL_creftbmvUNN.c

src/blas/reference/level2/ATL_creftbmvUNU.c

src/blas/reference/level2/ATL_creftbmvUTN.c

src/blas/reference/level2/ATL_creftbmvUTU.c

src/blas/reference/level2/ATL_creftbsv.c

src/blas/reference/level2/ATL_creftbsvLCN.c

src/blas/reference/level2/ATL_creftbsvLCU.c

src/blas/reference/level2/ATL_creftbsvLHN.c

src/blas/reference/level2/ATL_creftbsvLHU.c

src/blas/reference/level2/ATL_creftbsvLNN.c

src/blas/reference/level2/ATL_creftbsvLNU.c

src/blas/reference/level2/ATL_creftbsvLTN.c

src/blas/reference/level2/ATL_creftbsvLTU.c

src/blas/reference/level2/ATL_creftbsvUCN.c

src/blas/reference/level2/ATL_creftbsvUCU.c

src/blas/reference/level2/ATL_creftbsvUHN.c

src/blas/reference/level2/ATL_creftbsvUHU.c

src/blas/reference/level2/ATL_creftbsvUNN.c

src/blas/reference/level2/ATL_creftbsvUNU.c

src/blas/reference/level2/ATL_creftbsvUTN.c

src/blas/reference/level2/ATL_creftbsvUTU.c

src/blas/reference/level2/ATL_creftpmv.c

src/blas/reference/level2/ATL_creftpmvLCN.c

src/blas/reference/level2/ATL_creftpmvLCU.c

src/blas/reference/level2/ATL_creftpmvLHN.c

src/blas/reference/level2/ATL_creftpmvLHU.c

src/blas/reference/level2/ATL_creftpmvLNN.c

src/blas/reference/level2/ATL_creftpmvLNU.c

src/blas/reference/level2/ATL_creftpmvLTN.c

src/blas/reference/level2/ATL_creftpmvLTU.c

src/blas/reference/level2/ATL_creftpmvUCN.c

src/blas/reference/level2/ATL_creftpmvUCU.c

src/blas/reference/level2/ATL_creftpmvUHN.c

src/blas/reference/level2/ATL_creftpmvUHU.c

src/blas/reference/level2/ATL_creftpmvUNN.c

src/blas/reference/level2/ATL_creftpmvUNU.c

src/blas/reference/level2/ATL_creftpmvUTN.c

src/blas/reference/level2/ATL_creftpmvUTU.c

src/blas/reference/level2/ATL_creftpsv.c

src/blas/reference/level2/ATL_creftpsvLCN.c

src/blas/reference/level2/ATL_creftpsvLCU.c

src/blas/reference/level2/ATL_creftpsvLHN.c

src/blas/reference/level2/ATL_creftpsvLHU.c

src/blas/reference/level2/ATL_creftpsvLNN.c

src/blas/reference/level2/ATL_creftpsvLNU.c

src/blas/reference/level2/ATL_creftpsvLTN.c

src/blas/reference/level2/ATL_creftpsvLTU.c

src/blas/reference/level2/ATL_creftpsvUCN.c

src/blas/reference/level2/ATL_creftpsvUCU.c

src/blas/reference/level2/ATL_creftpsvUHN.c

src/blas/reference/level2/ATL_creftpsvUHU.c

src/blas/reference/level2/ATL_creftpsvUNN.c

src/blas/reference/level2/ATL_creftpsvUNU.c

src/blas/reference/level2/ATL_creftpsvUTN.c

src/blas/reference/level2/ATL_creftpsvUTU.c

src/blas/reference/level2/ATL_creftrmv.c

src/blas/reference/level2/ATL_creftrmvLCN.c

src/blas/reference/level2/ATL_creftrmvLCU.c

src/blas/reference/level2/ATL_creftrmvLHN.c

src/blas/reference/level2/ATL_creftrmvLHU.c

src/blas/reference/level2/ATL_creftrmvLNN.c

src/blas/reference/level2/ATL_creftrmvLNU.c

src/blas/reference/level2/ATL_creftrmvLTN.c

src/blas/reference/level2/ATL_creftrmvLTU.c

src/blas/reference/level2/ATL_creftrmvUCN.c

src/blas/reference/level2/ATL_creftrmvUCU.c

src/blas/reference/level2/ATL_creftrmvUHN.c

src/blas/reference/level2/ATL_creftrmvUHU.c

src/blas/reference/level2/ATL_creftrmvUNN.c

src/blas/reference/level2/ATL_creftrmvUNU.c

src/blas/reference/level2/ATL_creftrmvUTN.c

src/blas/reference/level2/ATL_creftrmvUTU.c

src/blas/reference/level2/ATL_creftrsv.c

src/blas/reference/level2/ATL_creftrsvLCN.c

src/blas/reference/level2/ATL_creftrsvLCU.c

src/blas/reference/level2/ATL_creftrsvLHN.c

src/blas/reference/level2/ATL_creftrsvLHU.c

src/blas/reference/level2/ATL_creftrsvLNN.c

src/blas/reference/level2/ATL_creftrsvLNU.c

src/blas/reference/level2/ATL_creftrsvLTN.c

src/blas/reference/level2/ATL_creftrsvLTU.c

src/blas/reference/level2/ATL_creftrsvUCN.c

src/blas/reference/level2/ATL_creftrsvUCU.c

src/blas/reference/level2/ATL_creftrsvUHN.c

src/blas/reference/level2/ATL_creftrsvUHU.c

src/blas/reference/level2/ATL_creftrsvUNN.c

src/blas/reference/level2/ATL_creftrsvUNU.c

src/blas/reference/level2/ATL_creftrsvUTN.c

src/blas/reference/level2/ATL_creftrsvUTU.c

src/blas/reference/level2/ATL_drefgbmv.c

src/blas/reference/level2/ATL_drefgbmvN.c

src/blas/reference/level2/ATL_drefgbmvT.c

src/blas/reference/level2/ATL_drefgemv.c

src/blas/reference/level2/ATL_drefgemvN.c

src/blas/reference/level2/ATL_drefgemvT.c

src/blas/reference/level2/ATL_drefger.c

src/blas/reference/level2/ATL_drefgpmv.c

src/blas/reference/level2/ATL_drefgpmvLN.c

src/blas/reference/level2/ATL_drefgpmvLT.c

src/blas/reference/level2/ATL_drefgpmvUN.c

src/blas/reference/level2/ATL_drefgpmvUT.c

src/blas/reference/level2/ATL_drefgpr.c

src/blas/reference/level2/ATL_drefsbmv.c

src/blas/reference/level2/ATL_drefsbmvL.c

src/blas/reference/level2/ATL_drefsbmvU.c

src/blas/reference/level2/ATL_drefspmv.c

src/blas/reference/level2/ATL_drefspmvL.c

src/blas/reference/level2/ATL_drefspmvU.c

src/blas/reference/level2/ATL_drefspr.c

src/blas/reference/level2/ATL_drefspr2.c

src/blas/reference/level2/ATL_drefspr2L.c

src/blas/reference/level2/ATL_drefspr2U.c

src/blas/reference/level2/ATL_drefsprL.c

src/blas/reference/level2/ATL_drefsprU.c

src/blas/reference/level2/ATL_drefsymv.c

src/blas/reference/level2/ATL_drefsymvL.c

src/blas/reference/level2/ATL_drefsymvU.c

src/blas/reference/level2/ATL_drefsyr.c

src/blas/reference/level2/ATL_drefsyr2.c

src/blas/reference/level2/ATL_drefsyr2L.c

src/blas/reference/level2/ATL_drefsyr2U.c

src/blas/reference/level2/ATL_drefsyrL.c

src/blas/reference/level2/ATL_drefsyrU.c

src/blas/reference/level2/ATL_dreftbmv.c

src/blas/reference/level2/ATL_dreftbmvLNN.c

src/blas/reference/level2/ATL_dreftbmvLNU.c

src/blas/reference/level2/ATL_dreftbmvLTN.c

src/blas/reference/level2/ATL_dreftbmvLTU.c

src/blas/reference/level2/ATL_dreftbmvUNN.c

src/blas/reference/level2/ATL_dreftbmvUNU.c

src/blas/reference/level2/ATL_dreftbmvUTN.c

src/blas/reference/level2/ATL_dreftbmvUTU.c

src/blas/reference/level2/ATL_dreftbsv.c

src/blas/reference/level2/ATL_dreftbsvLNN.c

src/blas/reference/level2/ATL_dreftbsvLNU.c

src/blas/reference/level2/ATL_dreftbsvLTN.c

src/blas/reference/level2/ATL_dreftbsvLTU.c

src/blas/reference/level2/ATL_dreftbsvUNN.c

src/blas/reference/level2/ATL_dreftbsvUNU.c

src/blas/reference/level2/ATL_dreftbsvUTN.c

src/blas/reference/level2/ATL_dreftbsvUTU.c

src/blas/reference/level2/ATL_dreftpmv.c

src/blas/reference/level2/ATL_dreftpmvLNN.c

src/blas/reference/level2/ATL_dreftpmvLNU.c

src/blas/reference/level2/ATL_dreftpmvLTN.c

src/blas/reference/level2/ATL_dreftpmvLTU.c

src/blas/reference/level2/ATL_dreftpmvUNN.c

src/blas/reference/level2/ATL_dreftpmvUNU.c

src/blas/reference/level2/ATL_dreftpmvUTN.c

src/blas/reference/level2/ATL_dreftpmvUTU.c

src/blas/reference/level2/ATL_dreftpsv.c

src/blas/reference/level2/ATL_dreftpsvLNN.c

src/blas/reference/level2/ATL_dreftpsvLNU.c

src/blas/reference/level2/ATL_dreftpsvLTN.c

src/blas/reference/level2/ATL_dreftpsvLTU.c

src/blas/reference/level2/ATL_dreftpsvUNN.c

src/blas/reference/level2/ATL_dreftpsvUNU.c

src/blas/reference/level2/ATL_dreftpsvUTN.c

src/blas/reference/level2/ATL_dreftpsvUTU.c

src/blas/reference/level2/ATL_dreftrmv.c

src/blas/reference/level2/ATL_dreftrmvLNN.c

src/blas/reference/level2/ATL_dreftrmvLNU.c

src/blas/reference/level2/ATL_dreftrmvLTN.c

src/blas/reference/level2/ATL_dreftrmvLTU.c

src/blas/reference/level2/ATL_dreftrmvUNN.c

src/blas/reference/level2/ATL_dreftrmvUNU.c

src/blas/reference/level2/ATL_dreftrmvUTN.c

src/blas/reference/level2/ATL_dreftrmvUTU.c

src/blas/reference/level2/ATL_dreftrsv.c

src/blas/reference/level2/ATL_dreftrsvLNN.c

src/blas/reference/level2/ATL_dreftrsvLNU.c

src/blas/reference/level2/ATL_dreftrsvLTN.c

src/blas/reference/level2/ATL_dreftrsvLTU.c

src/blas/reference/level2/ATL_dreftrsvUNN.c

src/blas/reference/level2/ATL_dreftrsvUNU.c

src/blas/reference/level2/ATL_dreftrsvUTN.c

src/blas/reference/level2/ATL_dreftrsvUTU.c

src/blas/reference/level2/ATL_srefgbmv.c

src/blas/reference/level2/ATL_srefgbmvN.c

src/blas/reference/level2/ATL_srefgbmvT.c

src/blas/reference/level2/ATL_srefgemv.c

src/blas/reference/level2/ATL_srefgemvN.c

src/blas/reference/level2/ATL_srefgemvT.c

src/blas/reference/level2/ATL_srefger.c

src/blas/reference/level2/ATL_srefgpmv.c

src/blas/reference/level2/ATL_srefgpmvLN.c

src/blas/reference/level2/ATL_srefgpmvLT.c

src/blas/reference/level2/ATL_srefgpmvUN.c

src/blas/reference/level2/ATL_srefgpmvUT.c

src/blas/reference/level2/ATL_srefgpr.c

src/blas/reference/level2/ATL_srefsbmv.c

src/blas/reference/level2/ATL_srefsbmvL.c

src/blas/reference/level2/ATL_srefsbmvU.c

src/blas/reference/level2/ATL_srefspmv.c

src/blas/reference/level2/ATL_srefspmvL.c

src/blas/reference/level2/ATL_srefspmvU.c

src/blas/reference/level2/ATL_srefspr.c

src/blas/reference/level2/ATL_srefspr2.c

src/blas/reference/level2/ATL_srefspr2L.c

src/blas/reference/level2/ATL_srefspr2U.c

src/blas/reference/level2/ATL_srefsprL.c

src/blas/reference/level2/ATL_srefsprU.c

src/blas/reference/level2/ATL_srefsymv.c

src/blas/reference/level2/ATL_srefsymvL.c

src/blas/reference/level2/ATL_srefsymvU.c

src/blas/reference/level2/ATL_srefsyr.c

src/blas/reference/level2/ATL_srefsyr2.c

src/blas/reference/level2/ATL_srefsyr2L.c

src/blas/reference/level2/ATL_srefsyr2U.c

src/blas/reference/level2/ATL_srefsyrL.c

src/blas/reference/level2/ATL_srefsyrU.c

src/blas/reference/level2/ATL_sreftbmv.c

src/blas/reference/level2/ATL_sreftbmvLNN.c

src/blas/reference/level2/ATL_sreftbmvLNU.c

src/blas/reference/level2/ATL_sreftbmvLTN.c

src/blas/reference/level2/ATL_sreftbmvLTU.c

src/blas/reference/level2/ATL_sreftbmvUNN.c

src/blas/reference/level2/ATL_sreftbmvUNU.c

src/blas/reference/level2/ATL_sreftbmvUTN.c

src/blas/reference/level2/ATL_sreftbmvUTU.c

src/blas/reference/level2/ATL_sreftbsv.c

src/blas/reference/level2/ATL_sreftbsvLNN.c

src/blas/reference/level2/ATL_sreftbsvLNU.c

src/blas/reference/level2/ATL_sreftbsvLTN.c

src/blas/reference/level2/ATL_sreftbsvLTU.c

src/blas/reference/level2/ATL_sreftbsvUNN.c

src/blas/reference/level2/ATL_sreftbsvUNU.c

src/blas/reference/level2/ATL_sreftbsvUTN.c

src/blas/reference/level2/ATL_sreftbsvUTU.c

src/blas/reference/level2/ATL_sreftpmv.c

src/blas/reference/level2/ATL_sreftpmvLNN.c

src/blas/reference/level2/ATL_sreftpmvLNU.c

src/blas/reference/level2/ATL_sreftpmvLTN.c

src/blas/reference/level2/ATL_sreftpmvLTU.c

src/blas/reference/level2/ATL_sreftpmvUNN.c

src/blas/reference/level2/ATL_sreftpmvUNU.c

src/blas/reference/level2/ATL_sreftpmvUTN.c

src/blas/reference/level2/ATL_sreftpmvUTU.c

src/blas/reference/level2/ATL_sreftpsv.c

src/blas/reference/level2/ATL_sreftpsvLNN.c

src/blas/reference/level2/ATL_sreftpsvLNU.c

src/blas/reference/level2/ATL_sreftpsvLTN.c

src/blas/reference/level2/ATL_sreftpsvLTU.c

src/blas/reference/level2/ATL_sreftpsvUNN.c

src/blas/reference/level2/ATL_sreftpsvUNU.c

src/blas/reference/level2/ATL_sreftpsvUTN.c

src/blas/reference/level2/ATL_sreftpsvUTU.c

src/blas/reference/level2/ATL_sreftrmv.c

src/blas/reference/level2/ATL_sreftrmvLNN.c

src/blas/reference/level2/ATL_sreftrmvLNU.c

src/blas/reference/level2/ATL_sreftrmvLTN.c

src/blas/reference/level2/ATL_sreftrmvLTU.c

src/blas/reference/level2/ATL_sreftrmvUNN.c

src/blas/reference/level2/ATL_sreftrmvUNU.c

src/blas/reference/level2/ATL_sreftrmvUTN.c

src/blas/reference/level2/ATL_sreftrmvUTU.c

src/blas/reference/level2/ATL_sreftrsv.c

src/blas/reference/level2/ATL_sreftrsvLNN.c

src/blas/reference/level2/ATL_sreftrsvLNU.c

src/blas/reference/level2/ATL_sreftrsvLTN.c

src/blas/reference/level2/ATL_sreftrsvLTU.c

src/blas/reference/level2/ATL_sreftrsvUNN.c

src/blas/reference/level2/ATL_sreftrsvUNU.c

src/blas/reference/level2/ATL_sreftrsvUTN.c

src/blas/reference/level2/ATL_sreftrsvUTU.c

src/blas/reference/level2/ATL_zrefgbmv.c

src/blas/reference/level2/ATL_zrefgbmvC.c

src/blas/reference/level2/ATL_zrefgbmvH.c

src/blas/reference/level2/ATL_zrefgbmvN.c

src/blas/reference/level2/ATL_zrefgbmvT.c

src/blas/reference/level2/ATL_zrefgemv.c

src/blas/reference/level2/ATL_zrefgemvC.c

src/blas/reference/level2/ATL_zrefgemvH.c

src/blas/reference/level2/ATL_zrefgemvN.c

src/blas/reference/level2/ATL_zrefgemvT.c

src/blas/reference/level2/ATL_zrefgerc.c

src/blas/reference/level2/ATL_zrefgeru.c

src/blas/reference/level2/ATL_zrefgpmv.c

src/blas/reference/level2/ATL_zrefgpmvLC.c

src/blas/reference/level2/ATL_zrefgpmvLH.c

src/blas/reference/level2/ATL_zrefgpmvLN.c

src/blas/reference/level2/ATL_zrefgpmvLT.c

src/blas/reference/level2/ATL_zrefgpmvUC.c

src/blas/reference/level2/ATL_zrefgpmvUH.c

src/blas/reference/level2/ATL_zrefgpmvUN.c

src/blas/reference/level2/ATL_zrefgpmvUT.c

src/blas/reference/level2/ATL_zrefgprc.c

src/blas/reference/level2/ATL_zrefgpru.c

src/blas/reference/level2/ATL_zrefhbmv.c

src/blas/reference/level2/ATL_zrefhbmvL.c

src/blas/reference/level2/ATL_zrefhbmvU.c

src/blas/reference/level2/ATL_zrefhemv.c

src/blas/reference/level2/ATL_zrefhemvL.c

src/blas/reference/level2/ATL_zrefhemvU.c

src/blas/reference/level2/ATL_zrefher.c

src/blas/reference/level2/ATL_zrefher2.c

src/blas/reference/level2/ATL_zrefher2L.c

src/blas/reference/level2/ATL_zrefher2U.c

src/blas/reference/level2/ATL_zrefherL.c

src/blas/reference/level2/ATL_zrefherU.c

src/blas/reference/level2/ATL_zrefhpmv.c

src/blas/reference/level2/ATL_zrefhpmvL.c

src/blas/reference/level2/ATL_zrefhpmvU.c

src/blas/reference/level2/ATL_zrefhpr.c

src/blas/reference/level2/ATL_zrefhpr2.c

src/blas/reference/level2/ATL_zrefhpr2L.c

src/blas/reference/level2/ATL_zrefhpr2U.c

src/blas/reference/level2/ATL_zrefhprL.c

src/blas/reference/level2/ATL_zrefhprU.c

src/blas/reference/level2/ATL_zreftbmv.c

src/blas/reference/level2/ATL_zreftbmvLCN.c

src/blas/reference/level2/ATL_zreftbmvLCU.c

src/blas/reference/level2/ATL_zreftbmvLHN.c

src/blas/reference/level2/ATL_zreftbmvLHU.c

src/blas/reference/level2/ATL_zreftbmvLNN.c

src/blas/reference/level2/ATL_zreftbmvLNU.c

src/blas/reference/level2/ATL_zreftbmvLTN.c

src/blas/reference/level2/ATL_zreftbmvLTU.c

src/blas/reference/level2/ATL_zreftbmvUCN.c

src/blas/reference/level2/ATL_zreftbmvUCU.c

src/blas/reference/level2/ATL_zreftbmvUHN.c

src/blas/reference/level2/ATL_zreftbmvUHU.c

src/blas/reference/level2/ATL_zreftbmvUNN.c

src/blas/reference/level2/ATL_zreftbmvUNU.c

src/blas/reference/level2/ATL_zreftbmvUTN.c

src/blas/reference/level2/ATL_zreftbmvUTU.c

src/blas/reference/level2/ATL_zreftbsv.c

src/blas/reference/level2/ATL_zreftbsvLCN.c

src/blas/reference/level2/ATL_zreftbsvLCU.c

src/blas/reference/level2/ATL_zreftbsvLHN.c

src/blas/reference/level2/ATL_zreftbsvLHU.c

src/blas/reference/level2/ATL_zreftbsvLNN.c

src/blas/reference/level2/ATL_zreftbsvLNU.c

src/blas/reference/level2/ATL_zreftbsvLTN.c

src/blas/reference/level2/ATL_zreftbsvLTU.c

src/blas/reference/level2/ATL_zreftbsvUCN.c

src/blas/reference/level2/ATL_zreftbsvUCU.c

src/blas/reference/level2/ATL_zreftbsvUHN.c

src/blas/reference/level2/ATL_zreftbsvUHU.c

src/blas/reference/level2/ATL_zreftbsvUNN.c

src/blas/reference/level2/ATL_zreftbsvUNU.c

src/blas/reference/level2/ATL_zreftbsvUTN.c

src/blas/reference/level2/ATL_zreftbsvUTU.c

src/blas/reference/level2/ATL_zreftpmv.c

src/blas/reference/level2/ATL_zreftpmvLCN.c

src/blas/reference/level2/ATL_zreftpmvLCU.c

src/blas/reference/level2/ATL_zreftpmvLHN.c

src/blas/reference/level2/ATL_zreftpmvLHU.c

src/blas/reference/level2/ATL_zreftpmvLNN.c

src/blas/reference/level2/ATL_zreftpmvLNU.c

src/blas/reference/level2/ATL_zreftpmvLTN.c

src/blas/reference/level2/ATL_zreftpmvLTU.c

src/blas/reference/level2/ATL_zreftpmvUCN.c

src/blas/reference/level2/ATL_zreftpmvUCU.c

src/blas/reference/level2/ATL_zreftpmvUHN.c

src/blas/reference/level2/ATL_zreftpmvUHU.c

src/blas/reference/level2/ATL_zreftpmvUNN.c

src/blas/reference/level2/ATL_zreftpmvUNU.c

src/blas/reference/level2/ATL_zreftpmvUTN.c

src/blas/reference/level2/ATL_zreftpmvUTU.c

src/blas/reference/level2/ATL_zreftpsv.c

src/blas/reference/level2/ATL_zreftpsvLCN.c

src/blas/reference/level2/ATL_zreftpsvLCU.c

src/blas/reference/level2/ATL_zreftpsvLHN.c

src/blas/reference/level2/ATL_zreftpsvLHU.c

src/blas/reference/level2/ATL_zreftpsvLNN.c

src/blas/reference/level2/ATL_zreftpsvLNU.c

src/blas/reference/level2/ATL_zreftpsvLTN.c

src/blas/reference/level2/ATL_zreftpsvLTU.c

src/blas/reference/level2/ATL_zreftpsvUCN.c

src/blas/reference/level2/ATL_zreftpsvUCU.c

src/blas/reference/level2/ATL_zreftpsvUHN.c

src/blas/reference/level2/ATL_zreftpsvUHU.c

src/blas/reference/level2/ATL_zreftpsvUNN.c

src/blas/reference/level2/ATL_zreftpsvUNU.c

src/blas/reference/level2/ATL_zreftpsvUTN.c

src/blas/reference/level2/ATL_zreftpsvUTU.c

src/blas/reference/level2/ATL_zreftrmv.c

src/blas/reference/level2/ATL_zreftrmvLCN.c

src/blas/reference/level2/ATL_zreftrmvLCU.c

src/blas/reference/level2/ATL_zreftrmvLHN.c

src/blas/reference/level2/ATL_zreftrmvLHU.c

src/blas/reference/level2/ATL_zreftrmvLNN.c

src/blas/reference/level2/ATL_zreftrmvLNU.c

src/blas/reference/level2/ATL_zreftrmvLTN.c

src/blas/reference/level2/ATL_zreftrmvLTU.c

src/blas/reference/level2/ATL_zreftrmvUCN.c

src/blas/reference/level2/ATL_zreftrmvUCU.c

src/blas/reference/level2/ATL_zreftrmvUHN.c

src/blas/reference/level2/ATL_zreftrmvUHU.c

src/blas/reference/level2/ATL_zreftrmvUNN.c

src/blas/reference/level2/ATL_zreftrmvUNU.c

src/blas/reference/level2/ATL_zreftrmvUTN.c

src/blas/reference/level2/ATL_zreftrmvUTU.c

src/blas/reference/level2/ATL_zreftrsv.c

src/blas/reference/level2/ATL_zreftrsvLCN.c

src/blas/reference/level2/ATL_zreftrsvLCU.c

src/blas/reference/level2/ATL_zreftrsvLHN.c

src/blas/reference/level2/ATL_zreftrsvLHU.c

src/blas/reference/level2/ATL_zreftrsvLNN.c

src/blas/reference/level2/ATL_zreftrsvLNU.c

src/blas/reference/level2/ATL_zreftrsvLTN.c

src/blas/reference/level2/ATL_zreftrsvLTU.c

src/blas/reference/level2/ATL_zreftrsvUCN.c

src/blas/reference/level2/ATL_zreftrsvUCU.c

src/blas/reference/level2/ATL_zreftrsvUHN.c

src/blas/reference/level2/ATL_zreftrsvUHU.c

src/blas/reference/level2/ATL_zreftrsvUNN.c

src/blas/reference/level2/ATL_zreftrsvUNU.c

src/blas/reference/level2/ATL_zreftrsvUTN.c

src/blas/reference/level2/ATL_zreftrsvUTU.c

src/blas/reference/level3

src/blas/reference/level3/ATL_crefgemm.c

src/blas/reference/level3/ATL_crefgemmCC.c

src/blas/reference/level3/ATL_crefgemmCN.c

src/blas/reference/level3/ATL_crefgemmCT.c

src/blas/reference/level3/ATL_crefgemmNC.c

src/blas/reference/level3/ATL_crefgemmNN.c

src/blas/reference/level3/ATL_crefgemmNT.c

src/blas/reference/level3/ATL_crefgemmTC.c

src/blas/reference/level3/ATL_crefgemmTN.c

src/blas/reference/level3/ATL_crefgemmTT.c

src/blas/reference/level3/ATL_crefhemm.c

src/blas/reference/level3/ATL_crefhemmLL.c

src/blas/reference/level3/ATL_crefhemmLU.c

src/blas/reference/level3/ATL_crefhemmRL.c

src/blas/reference/level3/ATL_crefhemmRU.c

src/blas/reference/level3/ATL_crefher2k.c

src/blas/reference/level3/ATL_crefher2kLC.c

src/blas/reference/level3/ATL_crefher2kLN.c

src/blas/reference/level3/ATL_crefher2kUC.c

src/blas/reference/level3/ATL_crefher2kUN.c

src/blas/reference/level3/ATL_crefherk.c

src/blas/reference/level3/ATL_crefherkLC.c

src/blas/reference/level3/ATL_crefherkLN.c

src/blas/reference/level3/ATL_crefherkUC.c

src/blas/reference/level3/ATL_crefherkUN.c

src/blas/reference/level3/ATL_crefsymm.c

src/blas/reference/level3/ATL_crefsymmLL.c

src/blas/reference/level3/ATL_crefsymmLU.c

src/blas/reference/level3/ATL_crefsymmRL.c

src/blas/reference/level3/ATL_crefsymmRU.c

src/blas/reference/level3/ATL_crefsyr2k.c

src/blas/reference/level3/ATL_crefsyr2kLN.c

src/blas/reference/level3/ATL_crefsyr2kLT.c

src/blas/reference/level3/ATL_crefsyr2kUN.c

src/blas/reference/level3/ATL_crefsyr2kUT.c

src/blas/reference/level3/ATL_crefsyrk.c

src/blas/reference/level3/ATL_crefsyrkLN.c

src/blas/reference/level3/ATL_crefsyrkLT.c

src/blas/reference/level3/ATL_crefsyrkUN.c

src/blas/reference/level3/ATL_crefsyrkUT.c

src/blas/reference/level3/ATL_creftrmm.c

src/blas/reference/level3/ATL_creftrmmLLCN.c

src/blas/reference/level3/ATL_creftrmmLLCU.c

src/blas/reference/level3/ATL_creftrmmLLNN.c

src/blas/reference/level3/ATL_creftrmmLLNU.c

src/blas/reference/level3/ATL_creftrmmLLTN.c

src/blas/reference/level3/ATL_creftrmmLLTU.c

src/blas/reference/level3/ATL_creftrmmLUCN.c

src/blas/reference/level3/ATL_creftrmmLUCU.c

src/blas/reference/level3/ATL_creftrmmLUNN.c

src/blas/reference/level3/ATL_creftrmmLUNU.c

src/blas/reference/level3/ATL_creftrmmLUTN.c

src/blas/reference/level3/ATL_creftrmmLUTU.c

src/blas/reference/level3/ATL_creftrmmRLCN.c

src/blas/reference/level3/ATL_creftrmmRLCU.c

src/blas/reference/level3/ATL_creftrmmRLNN.c

src/blas/reference/level3/ATL_creftrmmRLNU.c

src/blas/reference/level3/ATL_creftrmmRLTN.c

src/blas/reference/level3/ATL_creftrmmRLTU.c

src/blas/reference/level3/ATL_creftrmmRUCN.c

src/blas/reference/level3/ATL_creftrmmRUCU.c

src/blas/reference/level3/ATL_creftrmmRUNN.c

src/blas/reference/level3/ATL_creftrmmRUNU.c

src/blas/reference/level3/ATL_creftrmmRUTN.c

src/blas/reference/level3/ATL_creftrmmRUTU.c

src/blas/reference/level3/ATL_creftrsm.c

src/blas/reference/level3/ATL_creftrsmLLCN.c

src/blas/reference/level3/ATL_creftrsmLLCU.c

src/blas/reference/level3/ATL_creftrsmLLNN.c

src/blas/reference/level3/ATL_creftrsmLLNU.c

src/blas/reference/level3/ATL_creftrsmLLTN.c

src/blas/reference/level3/ATL_creftrsmLLTU.c

src/blas/reference/level3/ATL_creftrsmLUCN.c

src/blas/reference/level3/ATL_creftrsmLUCU.c

src/blas/reference/level3/ATL_creftrsmLUNN.c

src/blas/reference/level3/ATL_creftrsmLUNU.c

src/blas/reference/level3/ATL_creftrsmLUTN.c

src/blas/reference/level3/ATL_creftrsmLUTU.c

src/blas/reference/level3/ATL_creftrsmRLCN.c

src/blas/reference/level3/ATL_creftrsmRLCU.c

src/blas/reference/level3/ATL_creftrsmRLNN.c

src/blas/reference/level3/ATL_creftrsmRLNU.c

src/blas/reference/level3/ATL_creftrsmRLTN.c

src/blas/reference/level3/ATL_creftrsmRLTU.c

src/blas/reference/level3/ATL_creftrsmRUCN.c

src/blas/reference/level3/ATL_creftrsmRUCU.c

src/blas/reference/level3/ATL_creftrsmRUNN.c

src/blas/reference/level3/ATL_creftrsmRUNU.c

src/blas/reference/level3/ATL_creftrsmRUTN.c

src/blas/reference/level3/ATL_creftrsmRUTU.c

src/blas/reference/level3/ATL_drefgemm.c

src/blas/reference/level3/ATL_drefgemmNN.c

src/blas/reference/level3/ATL_drefgemmNT.c

src/blas/reference/level3/ATL_drefgemmTN.c

src/blas/reference/level3/ATL_drefgemmTT.c

src/blas/reference/level3/ATL_drefsymm.c

src/blas/reference/level3/ATL_drefsymmLL.c

src/blas/reference/level3/ATL_drefsymmLU.c

src/blas/reference/level3/ATL_drefsymmRL.c

src/blas/reference/level3/ATL_drefsymmRU.c

src/blas/reference/level3/ATL_drefsyr2k.c

src/blas/reference/level3/ATL_drefsyr2kLN.c

src/blas/reference/level3/ATL_drefsyr2kLT.c

src/blas/reference/level3/ATL_drefsyr2kUN.c

src/blas/reference/level3/ATL_drefsyr2kUT.c

src/blas/reference/level3/ATL_drefsyrk.c

src/blas/reference/level3/ATL_drefsyrkLN.c

src/blas/reference/level3/ATL_drefsyrkLT.c

src/blas/reference/level3/ATL_drefsyrkUN.c

src/blas/reference/level3/ATL_drefsyrkUT.c

src/blas/reference/level3/ATL_dreftrmm.c

src/blas/reference/level3/ATL_dreftrmmLLNN.c

src/blas/reference/level3/ATL_dreftrmmLLNU.c

src/blas/reference/level3/ATL_dreftrmmLLTN.c

src/blas/reference/level3/ATL_dreftrmmLLTU.c

src/blas/reference/level3/ATL_dreftrmmLUNN.c

src/blas/reference/level3/ATL_dreftrmmLUNU.c

src/blas/reference/level3/ATL_dreftrmmLUTN.c

src/blas/reference/level3/ATL_dreftrmmLUTU.c

src/blas/reference/level3/ATL_dreftrmmRLNN.c

src/blas/reference/level3/ATL_dreftrmmRLNU.c

src/blas/reference/level3/ATL_dreftrmmRLTN.c

src/blas/reference/level3/ATL_dreftrmmRLTU.c

src/blas/reference/level3/ATL_dreftrmmRUNN.c

src/blas/reference/level3/ATL_dreftrmmRUNU.c

src/blas/reference/level3/ATL_dreftrmmRUTN.c

src/blas/reference/level3/ATL_dreftrmmRUTU.c

src/blas/reference/level3/ATL_dreftrsm.c

src/blas/reference/level3/ATL_dreftrsmLLNN.c

src/blas/reference/level3/ATL_dreftrsmLLNU.c

src/blas/reference/level3/ATL_dreftrsmLLTN.c

src/blas/reference/level3/ATL_dreftrsmLLTU.c

src/blas/reference/level3/ATL_dreftrsmLUNN.c

src/blas/reference/level3/ATL_dreftrsmLUNU.c

src/blas/reference/level3/ATL_dreftrsmLUTN.c

src/blas/reference/level3/ATL_dreftrsmLUTU.c

src/blas/reference/level3/ATL_dreftrsmRLNN.c

src/blas/reference/level3/ATL_dreftrsmRLNU.c

src/blas/reference/level3/ATL_dreftrsmRLTN.c

src/blas/reference/level3/ATL_dreftrsmRLTU.c

src/blas/reference/level3/ATL_dreftrsmRUNN.c

src/blas/reference/level3/ATL_dreftrsmRUNU.c

src/blas/reference/level3/ATL_dreftrsmRUTN.c

src/blas/reference/level3/ATL_dreftrsmRUTU.c

src/blas/reference/level3/ATL_srefgemm.c

src/blas/reference/level3/ATL_srefgemmNN.c

src/blas/reference/level3/ATL_srefgemmNT.c

src/blas/reference/level3/ATL_srefgemmTN.c

src/blas/reference/level3/ATL_srefgemmTT.c

src/blas/reference/level3/ATL_srefsymm.c

src/blas/reference/level3/ATL_srefsymmLL.c

src/blas/reference/level3/ATL_srefsymmLU.c

src/blas/reference/level3/ATL_srefsymmRL.c

src/blas/reference/level3/ATL_srefsymmRU.c

src/blas/reference/level3/ATL_srefsyr2k.c

src/blas/reference/level3/ATL_srefsyr2kLN.c

src/blas/reference/level3/ATL_srefsyr2kLT.c

src/blas/reference/level3/ATL_srefsyr2kUN.c

src/blas/reference/level3/ATL_srefsyr2kUT.c

src/blas/reference/level3/ATL_srefsyrk.c

src/blas/reference/level3/ATL_srefsyrkLN.c

src/blas/reference/level3/ATL_srefsyrkLT.c

src/blas/reference/level3/ATL_srefsyrkUN.c

src/blas/reference/level3/ATL_srefsyrkUT.c

src/blas/reference/level3/ATL_sreftrmm.c

src/blas/reference/level3/ATL_sreftrmmLLNN.c

src/blas/reference/level3/ATL_sreftrmmLLNU.c

src/blas/reference/level3/ATL_sreftrmmLLTN.c

src/blas/reference/level3/ATL_sreftrmmLLTU.c

src/blas/reference/level3/ATL_sreftrmmLUNN.c

src/blas/reference/level3/ATL_sreftrmmLUNU.c

src/blas/reference/level3/ATL_sreftrmmLUTN.c

src/blas/reference/level3/ATL_sreftrmmLUTU.c

src/blas/reference/level3/ATL_sreftrmmRLNN.c

src/blas/reference/level3/ATL_sreftrmmRLNU.c

src/blas/reference/level3/ATL_sreftrmmRLTN.c

src/blas/reference/level3/ATL_sreftrmmRLTU.c

src/blas/reference/level3/ATL_sreftrmmRUNN.c

src/blas/reference/level3/ATL_sreftrmmRUNU.c

src/blas/reference/level3/ATL_sreftrmmRUTN.c

src/blas/reference/level3/ATL_sreftrmmRUTU.c

src/blas/reference/level3/ATL_sreftrsm.c

src/blas/reference/level3/ATL_sreftrsmLLNN.c

src/blas/reference/level3/ATL_sreftrsmLLNU.c

src/blas/reference/level3/ATL_sreftrsmLLTN.c

src/blas/reference/level3/ATL_sreftrsmLLTU.c

src/blas/reference/level3/ATL_sreftrsmLUNN.c

src/blas/reference/level3/ATL_sreftrsmLUNU.c

src/blas/reference/level3/ATL_sreftrsmLUTN.c

src/blas/reference/level3/ATL_sreftrsmLUTU.c

src/blas/reference/level3/ATL_sreftrsmRLNN.c

src/blas/reference/level3/ATL_sreftrsmRLNU.c

src/blas/reference/level3/ATL_sreftrsmRLTN.c

src/blas/reference/level3/ATL_sreftrsmRLTU.c

src/blas/reference/level3/ATL_sreftrsmRUNN.c

src/blas/reference/level3/ATL_sreftrsmRUNU.c

src/blas/reference/level3/ATL_sreftrsmRUTN.c

src/blas/reference/level3/ATL_sreftrsmRUTU.c

src/blas/reference/level3/ATL_zrefgemm.c

src/blas/reference/level3/ATL_zrefgemmCC.c

src/blas/reference/level3/ATL_zrefgemmCN.c

src/blas/reference/level3/ATL_zrefgemmCT.c

src/blas/reference/level3/ATL_zrefgemmNC.c

src/blas/reference/level3/ATL_zrefgemmNN.c

src/blas/reference/level3/ATL_zrefgemmNT.c

src/blas/reference/level3/ATL_zrefgemmTC.c

src/blas/reference/level3/ATL_zrefgemmTN.c

src/blas/reference/level3/ATL_zrefgemmTT.c

src/blas/reference/level3/ATL_zrefhemm.c

src/blas/reference/level3/ATL_zrefhemmLL.c

src/blas/reference/level3/ATL_zrefhemmLU.c

src/blas/reference/level3/ATL_zrefhemmRL.c

src/blas/reference/level3/ATL_zrefhemmRU.c

src/blas/reference/level3/ATL_zrefher2k.c

src/blas/reference/level3/ATL_zrefher2kLC.c

src/blas/reference/level3/ATL_zrefher2kLN.c

src/blas/reference/level3/ATL_zrefher2kUC.c

src/blas/reference/level3/ATL_zrefher2kUN.c

src/blas/reference/level3/ATL_zrefherk.c

src/blas/reference/level3/ATL_zrefherkLC.c

src/blas/reference/level3/ATL_zrefherkLN.c

src/blas/reference/level3/ATL_zrefherkUC.c

src/blas/reference/level3/ATL_zrefherkUN.c

src/blas/reference/level3/ATL_zrefsymm.c

src/blas/reference/level3/ATL_zrefsymmLL.c

src/blas/reference/level3/ATL_zrefsymmLU.c

src/blas/reference/level3/ATL_zrefsymmRL.c

src/blas/reference/level3/ATL_zrefsymmRU.c

src/blas/reference/level3/ATL_zrefsyr2k.c

src/blas/reference/level3/ATL_zrefsyr2kLN.c

src/blas/reference/level3/ATL_zrefsyr2kLT.c

src/blas/reference/level3/ATL_zrefsyr2kUN.c

src/blas/reference/level3/ATL_zrefsyr2kUT.c

src/blas/reference/level3/ATL_zrefsyrk.c

src/blas/reference/level3/ATL_zrefsyrkLN.c

src/blas/reference/level3/ATL_zrefsyrkLT.c

src/blas/reference/level3/ATL_zrefsyrkUN.c

src/blas/reference/level3/ATL_zrefsyrkUT.c

src/blas/reference/level3/ATL_zreftrmm.c

src/blas/reference/level3/ATL_zreftrmmLLCN.c

src/blas/reference/level3/ATL_zreftrmmLLCU.c

src/blas/reference/level3/ATL_zreftrmmLLNN.c

src/blas/reference/level3/ATL_zreftrmmLLNU.c

src/blas/reference/level3/ATL_zreftrmmLLTN.c

src/blas/reference/level3/ATL_zreftrmmLLTU.c

src/blas/reference/level3/ATL_zreftrmmLUCN.c

src/blas/reference/level3/ATL_zreftrmmLUCU.c

src/blas/reference/level3/ATL_zreftrmmLUNN.c

src/blas/reference/level3/ATL_zreftrmmLUNU.c

src/blas/reference/level3/ATL_zreftrmmLUTN.c

src/blas/reference/level3/ATL_zreftrmmLUTU.c

src/blas/reference/level3/ATL_zreftrmmRLCN.c

src/blas/reference/level3/ATL_zreftrmmRLCU.c

src/blas/reference/level3/ATL_zreftrmmRLNN.c

src/blas/reference/level3/ATL_zreftrmmRLNU.c

src/blas/reference/level3/ATL_zreftrmmRLTN.c

src/blas/reference/level3/ATL_zreftrmmRLTU.c

src/blas/reference/level3/ATL_zreftrmmRUCN.c

src/blas/reference/level3/ATL_zreftrmmRUCU.c

src/blas/reference/level3/ATL_zreftrmmRUNN.c

src/blas/reference/level3/ATL_zreftrmmRUNU.c

src/blas/reference/level3/ATL_zreftrmmRUTN.c

src/blas/reference/level3/ATL_zreftrmmRUTU.c

src/blas/reference/level3/ATL_zreftrsm.c

src/blas/reference/level3/ATL_zreftrsmLLCN.c

src/blas/reference/level3/ATL_zreftrsmLLCU.c

src/blas/reference/level3/ATL_zreftrsmLLNN.c

src/blas/reference/level3/ATL_zreftrsmLLNU.c

src/blas/reference/level3/ATL_zreftrsmLLTN.c

src/blas/reference/level3/ATL_zreftrsmLLTU.c

src/blas/reference/level3/ATL_zreftrsmLUCN.c

src/blas/reference/level3/ATL_zreftrsmLUCU.c

src/blas/reference/level3/ATL_zreftrsmLUNN.c

src/blas/reference/level3/ATL_zreftrsmLUNU.c

src/blas/reference/level3/ATL_zreftrsmLUTN.c

src/blas/reference/level3/ATL_zreftrsmLUTU.c

src/blas/reference/level3/ATL_zreftrsmRLCN.c

src/blas/reference/level3/ATL_zreftrsmRLCU.c

src/blas/reference/level3/ATL_zreftrsmRLNN.c

src/blas/reference/level3/ATL_zreftrsmRLNU.c

src/blas/reference/level3/ATL_zreftrsmRLTN.c

src/blas/reference/level3/ATL_zreftrsmRLTU.c

src/blas/reference/level3/ATL_zreftrsmRUCN.c

src/blas/reference/level3/ATL_zreftrsmRUCU.c

src/blas/reference/level3/ATL_zreftrsmRUNN.c

src/blas/reference/level3/ATL_zreftrsmRUNU.c

src/blas/reference/level3/ATL_zreftrsmRUTN.c

src/blas/reference/level3/ATL_zreftrsmRUTU.c

src/lapack

src/lapack/ATL_getrf.c

src/lapack/ATL_getrfC.c

src/lapack/ATL_getrfR.c

src/lapack/ATL_getrs.c

src/lapack/ATL_laswp.c

src/lapack/ATL_potrf.c

src/lapack/ATL_potrfL.c

src/lapack/ATL_potrfU.c

src/lapack/ATL_potrs.c

src/pthreads

src/pthreads/blas

src/pthreads/blas/level1

src/pthreads/blas/level1/README

src/pthreads/blas/level2

src/pthreads/blas/level2/README

src/pthreads/blas/level3

src/pthreads/blas/level3/ATL_Sgemm.c

src/pthreads/blas/level3/ATL_Ssymm.c

src/pthreads/blas/level3/ATL_Ssyr2k.c

src/pthreads/blas/level3/ATL_Ssyrk.c

src/pthreads/blas/level3/ATL_Strmm.c

src/pthreads/blas/level3/ATL_Strsm.c

src/pthreads/blas/level3/ATL_ptgemm.c

src/pthreads/blas/level3/ATL_pthemm.c

src/pthreads/blas/level3/ATL_pther2k.c

src/pthreads/blas/level3/ATL_ptherk.c

src/pthreads/blas/level3/ATL_ptl3settype.c

src/pthreads/blas/level3/ATL_ptsymm.c

src/pthreads/blas/level3/ATL_ptsyr2k.c

src/pthreads/blas/level3/ATL_ptsyrk.c

src/pthreads/blas/level3/ATL_pttrmm.c

src/pthreads/blas/level3/ATL_pttrsm.c

src/pthreads/misc

src/pthreads/misc/ATL_1dsplit.c

src/pthreads/misc/ATL_Sgeadd.c

src/pthreads/misc/ATL_Sgescal.c

src/pthreads/misc/ATL_Sgezero.c

src/pthreads/misc/ATL_Stzscal.c

src/pthreads/misc/ATL_apply_tree.c

src/pthreads/misc/ATL_create_tree.c

src/pthreads/misc/ATL_free_node.c

src/pthreads/misc/ATL_free_tree.c

src/pthreads/misc/ATL_gesplit.c

src/pthreads/misc/ATL_init_node.c

src/pthreads/misc/ATL_join_tree.c

src/pthreads/misc/ATL_print_node_id.c

src/pthreads/misc/ATL_ptgeadd.c

src/pthreads/misc/ATL_ptgescal.c

src/pthreads/misc/ATL_ptgezero.c

src/pthreads/misc/ATL_pthescal.c

src/pthreads/misc/ATL_pttrscal.c

src/pthreads/misc/ATL_signal_tree.c

src/pthreads/misc/ATL_thread_exit.c

src/pthreads/misc/ATL_thread_init.c

src/pthreads/misc/ATL_thread_tree.c

src/pthreads/misc/ATL_traverse_tree.c

src/pthreads/misc/ATL_tzsplit.c

src/pthreads/misc/ATL_wait_tree.c

src/testing

src/testing/ATL_cf77wrap.f

src/testing/ATL_df77wrap.f

src/testing/ATL_dsf77dot.c

src/testing/ATL_epsilon.c

src/testing/ATL_f77amax.c

src/testing/ATL_f77asum.c

src/testing/ATL_f77axpy.c

src/testing/ATL_f77copy.c

src/testing/ATL_f77dot.c

src/testing/ATL_f77dotc_sub.c

src/testing/ATL_f77dotu_sub.c

src/testing/ATL_f77gbmv.c

src/testing/ATL_f77gemm.c

src/testing/ATL_f77gemv.c

src/testing/ATL_f77ger.c

src/testing/ATL_f77gerc.c

src/testing/ATL_f77geru.c

src/testing/ATL_f77getrf.c

src/testing/ATL_f77hbmv.c

src/testing/ATL_f77hemm.c

src/testing/ATL_f77hemv.c

src/testing/ATL_f77her.c

src/testing/ATL_f77her2.c

src/testing/ATL_f77her2k.c

src/testing/ATL_f77herk.c

src/testing/ATL_f77hpmv.c

src/testing/ATL_f77hpr.c

src/testing/ATL_f77hpr2.c

src/testing/ATL_f77nrm2.c

src/testing/ATL_f77potrf.c

src/testing/ATL_f77rot.c

src/testing/ATL_f77rotg.c

src/testing/ATL_f77rotm.c

src/testing/ATL_f77rotmg.c

src/testing/ATL_f77rscal.c

src/testing/ATL_f77sbmv.c

src/testing/ATL_f77scal.c

src/testing/ATL_f77spmv.c

src/testing/ATL_f77spr.c

src/testing/ATL_f77spr2.c

src/testing/ATL_f77swap.c

src/testing/ATL_f77symm.c

src/testing/ATL_f77symv.c

src/testing/ATL_f77syr.c

src/testing/ATL_f77syr2.c

src/testing/ATL_f77syr2k.c

src/testing/ATL_f77syrk.c

src/testing/ATL_f77tbmv.c

src/testing/ATL_f77tbsv.c

src/testing/ATL_f77tpmv.c

src/testing/ATL_f77tpsv.c

src/testing/ATL_f77trmm.c

src/testing/ATL_f77trmv.c

src/testing/ATL_f77trsm.c

src/testing/ATL_f77trsv.c

src/testing/ATL_gbnrm1.c

src/testing/ATL_gediff.c

src/testing/ATL_gediffnrm1.c

src/testing/ATL_gegen.c

src/testing/ATL_genrm1.c

src/testing/ATL_geprint.c

src/testing/ATL_hbnrm.c

src/testing/ATL_henrm.c

src/testing/ATL_hpnrm.c

src/testing/ATL_infnrm.c

src/testing/ATL_rand.c

src/testing/ATL_sbnrm.c

src/testing/ATL_sdsf77dot.c

src/testing/ATL_sf77wrap.f

src/testing/ATL_spnrm.c

src/testing/ATL_synrm.c

src/testing/ATL_tbnrm1.c

src/testing/ATL_tpnrm1.c

src/testing/ATL_trgen.c

src/testing/ATL_trnrm1.c

src/testing/ATL_vdiff.c

src/testing/ATL_zf77wrap.f

tune

tune/blas

tune/blas/gemm

tune/blas/gemm/CASES

tune/blas/gemm/CASES/ATL_cmm1x1x1.c

tune/blas/gemm/CASES/ATL_mm1x1x1.c

tune/blas/gemm/CASES/ATL_mm1x1x1b.c

tune/blas/gemm/CASES/ATL_mm2x1x8.c

tune/blas/gemm/CASES/ATL_mm2x1x8a.c

tune/blas/gemm/CASES/ATL_mm4x4x2US.c

tune/blas/gemm/CASES/ATL_mm4x4x2US_MN.c

tune/blas/gemm/CASES/ATL_mm4x4x2US_NB.c

tune/blas/gemm/CASES/ATL_mm4x4x2_1_pref.c

tune/blas/gemm/CASES/ATL_mm4x4x2_1_prefCU.c

tune/blas/gemm/CASES/ATL_mm4x4x6_1p.c

tune/blas/gemm/CASES/ATL_mm6x8x2_1p.c

tune/blas/gemm/CASES/ATL_mm6x8x2_1pCU.c

tune/blas/gemm/CASES/ATL_mm7x8x2_1p.c

tune/blas/gemm/CASES/ATL_mm8x8x1_1.c

tune/blas/gemm/CASES/ATL_mmK.c

tune/blas/gemm/CASES/ATL_mmK8.c

tune/blas/gemm/CASES/ATL_mmK8a.c

tune/blas/gemm/CASES/ATL_mm_3dnow_100.c

tune/blas/gemm/CASES/ATL_mm_3dnow_100M.c

tune/blas/gemm/CASES/ATL_mm_3dnow_100N.c

tune/blas/gemm/CASES/ATL_mm_3dnow_10K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_12K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_14K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_16K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_18K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_20K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_22K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_24K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_26K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_28K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_2K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_30K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_32K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_34K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_36K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_38K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_40K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_42K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_44K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_46K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_48K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_4K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_50K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_52K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_54K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_56K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_58K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_60K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_62K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_64K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_66K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_68K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_6K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_70K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_72K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_74K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_76K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_78K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_80K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_82K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_84K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_86K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_88K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_8K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_90K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_92K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_94K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_96K.c

tune/blas/gemm/CASES/ATL_mm_3dnow_98K.c

tune/blas/gemm/CASES/ATL_mm_sse1_12K.c

tune/blas/gemm/CASES/ATL_mm_sse1_16K.c

tune/blas/gemm/CASES/ATL_mm_sse1_20K.c

tune/blas/gemm/CASES/ATL_mm_sse1_24K.c

tune/blas/gemm/CASES/ATL_mm_sse1_28K.c

tune/blas/gemm/CASES/ATL_mm_sse1_32K.c

tune/blas/gemm/CASES/ATL_mm_sse1_36K.c

tune/blas/gemm/CASES/ATL_mm_sse1_40K.c

tune/blas/gemm/CASES/ATL_mm_sse1_44K.c

tune/blas/gemm/CASES/ATL_mm_sse1_48K.c

tune/blas/gemm/CASES/ATL_mm_sse1_4K.c

tune/blas/gemm/CASES/ATL_mm_sse1_52K.c

tune/blas/gemm/CASES/ATL_mm_sse1_56.c

tune/blas/gemm/CASES/ATL_mm_sse1_56K.c

tune/blas/gemm/CASES/ATL_mm_sse1_56M.c

tune/blas/gemm/CASES/ATL_mm_sse1_56N.c

tune/blas/gemm/CASES/ATL_mm_sse1_60K.c

tune/blas/gemm/CASES/ATL_mm_sse1_60M.c

tune/blas/gemm/CASES/ATL_mm_sse1_60N.c

tune/blas/gemm/CASES/ATL_mm_sse1_64K.c

tune/blas/gemm/CASES/ATL_mm_sse1_64M.c

tune/blas/gemm/CASES/ATL_mm_sse1_64N.c

tune/blas/gemm/CASES/ATL_mm_sse1_8K.c

tune/blas/gemm/CASES/ATL_mm_sse1_M.c

tune/blas/gemm/CASES/ATL_mm_sse1_N.c

tune/blas/gemm/CASES/ATL_sgemm_SSE.c

tune/blas/gemm/CASES/ATL_sgemm_SSE_1x1xkb.c

tune/blas/gemm/CASES/ccases.0

tune/blas/gemm/CASES/ccases.3DN

tune/blas/gemm/CASES/ccases.SSE

tune/blas/gemm/CASES/ccases.flg

tune/blas/gemm/CASES/dcases.0

tune/blas/gemm/CASES/dcases.3DN

tune/blas/gemm/CASES/dcases.SSE

tune/blas/gemm/CASES/dcases.flg

tune/blas/gemm/CASES/scases.0

tune/blas/gemm/CASES/scases.3DN

tune/blas/gemm/CASES/scases.SSE

tune/blas/gemm/CASES/scases.flg

tune/blas/gemm/CASES/zcases.0

tune/blas/gemm/CASES/zcases.3DN

tune/blas/gemm/CASES/zcases.SSE

tune/blas/gemm/CASES/zcases.flg

tune/blas/gemm/emit_mm.c

tune/blas/gemm/fc.c

tune/blas/gemm/findCE.c

tune/blas/gemm/hcsearch.c

tune/blas/gemm/mmsearch.c

tune/blas/gemm/mmtst.c

tune/blas/gemm/tfc.c

tune/blas/gemm/ummsearch.c

tune/blas/gemm/usercomb.c

tune/blas/gemm/userflag.c

tune/blas/gemm/userindex.c

tune/blas/gemv

tune/blas/gemv/ATL_gemv.c

tune/blas/gemv/CASES

tune/blas/gemv/CASES/ATL_cgemvN_1x1_1.c

tune/blas/gemv/CASES/ATL_cgemvN_1x1_1a.c

tune/blas/gemv/CASES/ATL_cgemvN_2x2_0.c

tune/blas/gemv/CASES/ATL_cgemvN_4x2_1.c

tune/blas/gemv/CASES/ATL_cgemvN_mm.c

tune/blas/gemv/CASES/ATL_cgemvT_1x1_1.c

tune/blas/gemv/CASES/ATL_cgemvT_2x2_0.c

tune/blas/gemv/CASES/ATL_cgemvT_2x4_1.c

tune/blas/gemv/CASES/ATL_cgemvT_mm.c

tune/blas/gemv/CASES/ATL_dgemvN_1x1_1.c

tune/blas/gemv/CASES/ATL_dgemvT_1x1_1.c

tune/blas/gemv/CASES/ATL_dmv.c

tune/blas/gemv/CASES/ATL_gemvN_16x2_1.c

tune/blas/gemv/CASES/ATL_gemvN_16x4_1.c

tune/blas/gemv/CASES/ATL_gemvN_1x1_1.c

tune/blas/gemv/CASES/ATL_gemvN_1x1_1a.c

tune/blas/gemv/CASES/ATL_gemvN_32x4_1.c

tune/blas/gemv/CASES/ATL_gemvN_4x2_0.c

tune/blas/gemv/CASES/ATL_gemvN_4x4_1.c

tune/blas/gemv/CASES/ATL_gemvN_8x32_2.c

tune/blas/gemv/CASES/ATL_gemvN_8x4_1.c

tune/blas/gemv/CASES/ATL_gemvN_SSE.c

tune/blas/gemv/CASES/ATL_gemvN_dummy.c

tune/blas/gemv/CASES/ATL_gemvN_dummy2.c

tune/blas/gemv/CASES/ATL_gemvN_mm.c

tune/blas/gemv/CASES/ATL_gemvT_1x1_1.c

tune/blas/gemv/CASES/ATL_gemvT_2x16_1.c

tune/blas/gemv/CASES/ATL_gemvT_2x8_0.c

tune/blas/gemv/CASES/ATL_gemvT_4x16_1.c

tune/blas/gemv/CASES/ATL_gemvT_4x8_1.c

tune/blas/gemv/CASES/ATL_gemvT_SSE.c

tune/blas/gemv/CASES/ATL_gemvT_dummy.c

tune/blas/gemv/CASES/ATL_gemvT_dummy2.c

tune/blas/gemv/CASES/ATL_gemvT_mm.c

tune/blas/gemv/CASES/ATL_sgemvN_SSE.c

tune/blas/gemv/CASES/ATL_sgemvT_SSE.c

tune/blas/gemv/CASES/ATL_zgemvN_1x1_1.c

tune/blas/gemv/CASES/ccases.dsc

tune/blas/gemv/CASES/dcases.dsc

tune/blas/gemv/CASES/scases.dsc

tune/blas/gemv/CASES/zcases.dsc

tune/blas/gemv/emit_head.c

tune/blas/gemv/emit_rmvT.c

tune/blas/gemv/gemvtune.c

tune/blas/gemv/mvsearch.c

tune/blas/gemv/mvtest.c

tune/blas/ger

tune/blas/ger/ATL_ger.c

tune/blas/ger/CASES

tune/blas/ger/CASES/ATL_cger1_axpy.c

tune/blas/ger/CASES/ATL_cger1_dummy.c

tune/blas/ger/CASES/ATL_dger1_1x1_1.c

tune/blas/ger/CASES/ATL_ger1_1x4_0.c

tune/blas/ger/CASES/ATL_ger1_4x4_1.c

tune/blas/ger/CASES/ATL_ger1_8x4_0.c

tune/blas/ger/CASES/ATL_ger1_SSE.c

tune/blas/ger/CASES/ATL_ger1_axpy.c

tune/blas/ger/CASES/ATL_sger1_SSE.c

tune/blas/ger/CASES/ATL_zger1_1x1_1.c

tune/blas/ger/CASES/ccases.dsc

tune/blas/ger/CASES/dcases.dsc

tune/blas/ger/CASES/scases.dsc

tune/blas/ger/CASES/zcases.dsc

tune/blas/ger/emit_r1h.c

tune/blas/ger/ger1tune.c

tune/blas/ger/r1search.c

tune/blas/ger/r1test.c

tune/blas/level3

tune/blas/level3/tsmfc.c

tune/sysinfo

tune/sysinfo/ATL_cputime.c

tune/sysinfo/ATL_walltime.c

tune/sysinfo/GetSysSum.c

tune/sysinfo/L1CacheSize.c

tune/sysinfo/emit_typ.c

tune/sysinfo/findNT.c

tune/sysinfo/masearch.c

tune/sysinfo/time.c

Show diffs side-by-side

added added

removed removed

src/blas/gemm/GOTO/gemm_EV5_k.S

/* Fast GEMM routine for Alpha 21164(A) */

/* on Linux, Digital UNIX and NT */

/* by Kazushige Goto <goto@statabo.rim.or.jp> */

#ifndef P

#ifdef DGEMM

#define P 32

#define Q 208

#define R 200

#else

#define P 40

#define Q 208

#define R 208

#endif

/* Internal BLOCK Leading size.*/

#define LDA (Q<<2)

#define LDB (Q<<1)

/* Now starting Main program */

#ifdef NN

#define ROUTINE GEMM_NN

#endif

#ifdef NT

#define ROUTINE GEMM_NT

#endif

#ifdef TN

#define ROUTINE GEMM_TN

#endif

#ifdef TT

#define ROUTINE GEMM_TT

#endif

#define MATRIX_A ((P>>2)*LDA*SIZE)

#define MATRIX_B ((R>>1)*LDB*SIZE)

#define STACKSIZE 16*8

.set noreorder

.set noat

.text

.align 5

.globl ROUTINE

.ent ROUTINE

/* Initial Routine */

ROUTINE:

lda $30, -STACKSIZE($30) # prepare stack

/* save original register value */

stq $26, 0($30)

stq $9, 8($30)

stq $10, 16($30)

stq $11, 24($30)

stq $12, 32($30)

stq $13, 40($30)

stq $14, 48($30)

stq $15, 56($30)

stt $f2, 64($30)

stt $f3, 72($30)

stt $f4, 80($30)

stt $f5, 96($30)

stt $f6, 104($30)

stt $f7, 112($30)

stt $f8, 120($30)

.prologue 0

/* restore argument value */

ldq $9, 0+STACKSIZE($30) # B

ldl $19, 8+STACKSIZE($30) # ldb

ldq $13,16+STACKSIZE($30) # C

ldl $10,24+STACKSIZE($30) # ldc

ldq $28,32+STACKSIZE($30) # buffer

clr $3 # ls = 0

fmov $f19, $f3

clr $14 # js = 0

.align 5

$L5:

lda $0, Q

subl $18,$3,$7 # min_l = k - ls

cmple $7, $0, $1 # (min_l>Q)?

cmoveq $1, $0, $7 # if $1 then min_l = Q

.align 4

#if defined(NN) || (!defined(C_VERSION) && defined(TN)) \

|| (defined(C_VERSION) && defined(NT))

$L10:

#ifndef C_VERSION

mull $19,$14,$2 # js*ldb

subl $17,$14,$12 # min_j = n - js

#else

$L10:

100

mull $21,$14,$2 # js*ldb

101

subl $16,$14,$12 # min_j = n - js

102

#endif

103

104

lda $0, R

105

ldah $24, Address_H(MATRIX_A)($28) # a_offset = &sb[0][0]

106

cmple $12, $0, $1 # (min_j>R) ?

107

cmoveq $1, $0, $12 # if $1 then min_j = R

108

109

lda $24, Address_L(MATRIX_A)($24)

110

mull $10,$14,$25 # jsldc = js * ldc

111

112

mov $12, $27 # j = min_j

113

unop

114

unop

115

#ifndef C_VERSION

116

SXADDQ $2,$9,$0 # b_offset = b + js*ldb

117

#else

118

SXADDQ $2,$20,$0 # b_offset = b + js*ldb

119

#endif

120

.align 4

121

122

$L15:

123

mov $7, $5 # l = min_l

124

mov $24, $2 # a1_offset = a_offset

125

126

SXADDQ $3, $0, $4 # b1_offset = b_offset + ls

127

#ifndef C_VERSION

128

SXADDQ $19, $0, $0 # b_offset += ldb

129

#else

130

SXADDQ $21, $0, $0 # b_offset += ldb

131

#endif

132

133

SXADDQ $3, $0, $22 # c1_offset = b_offset + ls

134

#ifndef C_VERSION

135

SXADDQ $19, $0, $0 # b_offset += ldb

136

#else

137

SXADDQ $21, $0, $0 # b_offset += ldb

138

#endif

139

lda $24,LDB*SIZE($24) # a_offset += LDB

140

subl $27, 2, $27 # j--

141

.align 4

142

143

$L19:

144

LD $f10, 0*SIZE($4)

145

LD $f11, 1*SIZE($4)

146

LD $f12, 2*SIZE($4)

147

LD $f13, 3*SIZE($4)

148

149

LD $f23, 4*SIZE($4)

150

LD $f24, 5*SIZE($4)

151

LD $f25, 6*SIZE($4)

152

LD $f26, 7*SIZE($4)

153

154

LD $f14, 0*SIZE($22)

155

LD $f15, 1*SIZE($22)

156

LD $f21, 2*SIZE($22)

157

LD $f22, 3*SIZE($22)

158

159

LD $f27, 4*SIZE($22)

160

LD $f28, 5*SIZE($22)

161

LD $f29, 6*SIZE($22)

162

LD $f30, 7*SIZE($22)

163

164

lda $2, 16*SIZE($2) # a1_offset += 8

165

subl $5, 8, $5 # l -= 4

166

lda $4, 8*SIZE($4) # b1_offset += 4

167

lda $22, 8*SIZE($22) # c1_offset += 4

168

169

ST $f10, -16*SIZE($2)

170

ST $f14, -15*SIZE($2)

171

ST $f11, -14*SIZE($2)

172

ST $f15, -13*SIZE($2)

173

174

ST $f12, -12*SIZE($2)

175

ST $f21, -11*SIZE($2)

176

ST $f13, -10*SIZE($2)

177

ST $f22, -9*SIZE($2)

178

179

ST $f23, -8*SIZE($2)

180

ST $f27, -7*SIZE($2)

181

ST $f24, -6*SIZE($2)

182

ST $f28, -5*SIZE($2)

183

184

ST $f25, -4*SIZE($2)

185

ST $f29, -3*SIZE($2)

186

ST $f26, -2*SIZE($2)

187

ST $f30, -1*SIZE($2)

188

189

bgt $5, $L19 # if l>0 goto $L19

190

bgt $27, $L15 # if j>0 goto $L15

191

192

#else /* NT or TT */

193

194

$L10:

195

#ifndef C_VERSION

196

mull $19, $3, $2 # ls*ldb

197

subl $17,$14,$12 # min_j = n - js

198

#else

199

mull $21, $3, $2 # ls*ldb

200

subl $16,$14,$12 # min_j = n - js

201

#endif

202

203

lda $0, R

204

ldah $24, Address_H(MATRIX_A)($28) # a_offset = &sb[0][0]

205

cmple $12, $0, $1 # (min_j>R) ?

206

cmoveq $1, $0, $12 # if $1 then min_j = R

207

208

lda $24, Address_L(MATRIX_A)($24)

209

mull $10,$14,$25 # jsldc = js * ldc

210

211

mov $12, $27 # j = min_j

212

fnop

213

fnop

214

#ifndef C_VERSION

215

SXADDQ $2,$9,$0 # b_offset = b + ls*ldb

216

#else

217

SXADDQ $2,$20,$0 # b_offset = b + ls*ldb

218

#endif

219

.align 4

220

221

$L101:

222

mov $24, $2 # a1_offset = a_offset

223

mov $7, $5 # l = min_l

224

225

lda $24, LDB*SIZE($24) # a_offset += LDB

226

SXADDQ $14, $0, $4 # b1_offset = b_offset + js

227

lda $0, 2*SIZE($0) # b_offset += 2

228

.align 4

229

230

$L102:

231

#ifndef C_VERSION

232

LD $f10, 0*SIZE($4) # atemp1 = *(b1_offset+0)

233

LD $f11, 1*SIZE($4) # atemp2 = *(b1_offset+1)

234

SXADDQ $19, $4, $4 # b1_offset += ldb

235

236

LD $f12, 0*SIZE($4) # atemp3 = *(b1_offset+0)

237

LD $f13, 1*SIZE($4) # atemp4 = *(b1_offset+1)

238

SXADDQ $19, $4, $4 # b1_offset += ldb

239

#else

240

LD $f10, 0*SIZE($4) # atemp1 = *(b1_offset+0)

241

LD $f11, 1*SIZE($4) # atemp2 = *(b1_offset+1)

242

SXADDQ $21, $4, $4 # b1_offset += ldb

243

244

LD $f12, 0*SIZE($4) # atemp3 = *(b1_offset+0)

245

LD $f13, 1*SIZE($4) # atemp4 = *(b1_offset+1)

246

SXADDQ $21, $4, $4 # b1_offset += ldb

247

#endif

248

249

subl $5, 2, $5 # l--

250

ST $f10, 0*SIZE($2) # *(a1_offset+0) = atemp1

251

ST $f11, 1*SIZE($2) # *(a1_offset+1) = atemp2

252

ST $f12, 2*SIZE($2) # *(a1_offset+3) = atemp3

253

ST $f13, 3*SIZE($2) # *(a1_offset+4) = atemp4

254

255

lda $2, 4*SIZE($2) # a1_offset += 4

256

257

bgt $5, $L102 # if l>0 goto $102

258

259

subl $27, 2, $27 # l--

260

bgt $27, $L101

261

#endif

262

clr $11 # is = 0

263

.align 4

264

265

#if defined(NN) || (!defined(C_VERSION) && defined(NT)) \

266

|| (defined(C_VERSION) && defined(TN))

267

268

$L30:

269

#ifndef C_VERSION

270

mull $21,$3,$2 # lslda = lda * ls

271

subl $16,$11,$15 # min_i = m - is

272

#else

273

mull $19,$3,$2 # lslda = lda * ls

274

subl $17,$11,$15 # min_i = m - is

275

#endif

276

cmple $15,P, $1 # (min_i>P)?

277

cmoveq $1, P, $15 # if $1 then min_i = P

278

279

mov $28, $0 # b_offset = &sa[0][0]

280

mov $7, $5 # l = min_l

281

282

#ifndef C_VERSION

283

SXADDQ $2,$20,$24 # a_offset = a + lslda

284

#else

285

SXADDQ $2,$9, $24 # a_offset = a + lslda

286

#endif

287

.align 4

288

289

$L35:

290

SXADDQ $11, $24, $2 # a1_offset = a_offset + is

291

#ifndef C_VERSION

292

SXADDQ $21, $24, $24 # a_offset += lda

293

#else

294

SXADDQ $19, $24, $24 # a_offset += lda

295

#endif

296

297

SXADDQ $11, $24, $22 # a1_offset = a_offset + is

298

#ifndef C_VERSION

299

SXADDQ $21, $24, $24 # a_offset += lda

300

#else

301

SXADDQ $19, $24, $24 # a_offset += lda

302

#endif

303

304

mov $0, $4 # b1_offset = b_offset

305

subl $15, 8, $8 # i -= 8

306

307

lda $0, 8*SIZE($0) # b_offset += 4

308

subl $5, 2, $5 # l--

309

.align 4

310

311

LD $f10, 0*SIZE($2)

312

LD $f11, 1*SIZE($2)

313

LD $f23, 0*SIZE($22)

314

LD $f24, 1*SIZE($22)

315

316

LD $f12, 2*SIZE($2)

317

LD $f13, 3*SIZE($2)

318

LD $f25, 2*SIZE($22)

319

LD $f26, 3*SIZE($22)

320

321

LD $f14, 4*SIZE($2)

322

LD $f15, 5*SIZE($2)

323

LD $f27, 4*SIZE($22)

324

LD $f28, 5*SIZE($22)

325

326

LD $f21, 6*SIZE($2)

327

LD $f22, 7*SIZE($2)

328

LD $f29, 6*SIZE($22)

329

LD $f30, 7*SIZE($22)

330

ble $8,$L38 # if i>0 goto $L39

331

.align 4

332

333

$L39:

334

ST $f10, (0*LDA+0)*SIZE($4)

335

ST $f11, (0*LDA+1)*SIZE($4)

336

ST $f12, (0*LDA+2)*SIZE($4)

337

ST $f13, (0*LDA+3)*SIZE($4)

338

339

LD $f10, 8*SIZE($2)

340

LD $f11, 9*SIZE($2)

341

LD $f12, 10*SIZE($2)

342

LD $f13, 11*SIZE($2)

343

344

ST $f23, (0*LDA+4)*SIZE($4)

345

ST $f24, (0*LDA+5)*SIZE($4)

346

ST $f25, (0*LDA+6)*SIZE($4)

347

ST $f26, (0*LDA+7)*SIZE($4)

348

349

LD $f23, 8*SIZE($22)

350

LD $f24, 9*SIZE($22)

351

LD $f25, 10*SIZE($22)

352

LD $f26, 11*SIZE($22)

353

354

ST $f14, (LDA+0)*SIZE($4)

355

ST $f15, (LDA+1)*SIZE($4)

356

ST $f21, (LDA+2)*SIZE($4)

357

ST $f22, (LDA+3)*SIZE($4)

358

359

LD $f14, 12*SIZE($2)

360

LD $f15, 13*SIZE($2)

361

LD $f21, 14*SIZE($2)

362

LD $f22, 15*SIZE($2)

363

364

ST $f27, (LDA+4)*SIZE($4)

365

ST $f28, (LDA+5)*SIZE($4)

366

ST $f29, (LDA+6)*SIZE($4)

367

ST $f30, (LDA+7)*SIZE($4)

368

369

LD $f27, 12*SIZE($22)

370

LD $f28, 13*SIZE($22)

371

LD $f29, 14*SIZE($22)

372

LD $f30, 15*SIZE($22)

373

374

subl $8, 8, $8 # i -= 8

375

lda $22, 8*SIZE($22) # a1_offset += 4

376

lda $4, 2*LDA*SIZE($4) # b1_offset += LDA

377

lda $2, 8*SIZE($2) # a1_offset += 4

378

379

bgt $8,$L39 # if i>0 goto $L39

380

.align 4

381

$L38:

382

ST $f10, (0*LDA+0)*SIZE($4)

383

ST $f11, (0*LDA+1)*SIZE($4)

384

ST $f12, (0*LDA+2)*SIZE($4)

385

ST $f13, (0*LDA+3)*SIZE($4)

386

387

ST $f23, (0*LDA+4)*SIZE($4)

388

ST $f24, (0*LDA+5)*SIZE($4)

389

ST $f25, (0*LDA+6)*SIZE($4)

390

ST $f26, (0*LDA+7)*SIZE($4)

391

392

ST $f14, (LDA+0)*SIZE($4)

393

ST $f15, (LDA+1)*SIZE($4)

394

ST $f21, (LDA+2)*SIZE($4)

395

ST $f22, (LDA+3)*SIZE($4)

396

397

ST $f27, (LDA+4)*SIZE($4)

398

ST $f28, (LDA+5)*SIZE($4)

399

ST $f29, (LDA+6)*SIZE($4)

400

ST $f30, (LDA+7)*SIZE($4)

401

bgt $5, $L35 # if l>0 goto $L35

402

.align 4

403

404

#else /* TN or TT */

405

406

$L30:

407

408

#ifndef C_VERSION

409

mull $11, $21, $2 # is*lda

410

subl $16, $11, $15 # min_i = m - is

411

#else

412

mull $11, $19, $2 # is*lda

413

subl $17, $11, $15 # min_i = m - is

414

#endif

415

416

cmple $15,P, $1 # (min_i>P)?

417

cmoveq $1, P, $15 # if $1 then min_i = P

418

419

#ifndef C_VERSION

420

SXADDQ $2, $20, $6 # c_offset = a + is*lda

421

s4addq $21, 0, $1 # j = 4*lda

422

#else

423

SXADDQ $2, $9, $6 # c_offset = a + is*lda

424

s4addq $19, 0, $1 # j = 4*lda

425

#endif

426

427

mov $28, $0 # b_offset = &sa[0][0]

428

mov $15, $8 # i = min_i

429

.align 4

430

431

$L201:

432

mov $0, $4 # b1_offset = b_offset

433

lda $0, LDA*SIZE($0) # b_offset += LDA

434

435

SXADDQ $3, $6, $24 # a_offset = c_offset + ls

436

mov $7, $5 # l = min_l

437

.align 4

438

439

$L202:

440

mov $24, $2 # a1_offset = a_offset

441

lda $24, 4*SIZE($24) # a_offset += 4

442

443

LD $f10, 0*SIZE($2)

444

LD $f11, 1*SIZE($2)

445

LD $f12, 2*SIZE($2)

446

LD $f13, 3*SIZE($2)

447

448

#ifndef C_VERSION

449

SXADDQ $21, $2, $2 # a1_offset += lda

450

#else

451

SXADDQ $19, $2, $2 # a1_offset += lda

452

#endif

453

454

LD $f14, 0*SIZE($2)

455

LD $f15, 1*SIZE($2)

456

LD $f21, 2*SIZE($2)

457

LD $f22, 3*SIZE($2)

458

459

#ifndef C_VERSION

460

SXADDQ $21, $2, $2 # a1_offset += lda

461

#else

462

SXADDQ $19, $2, $2 # a1_offset += lda

463

#endif

464

465

LD $f23, 0*SIZE($2)

466

LD $f24, 1*SIZE($2)

467

LD $f25, 2*SIZE($2)

468

LD $f26, 3*SIZE($2)

469

470

#ifndef C_VERSION

471

SXADDQ $21, $2, $2 # a1_offset += lda

472

#else

473

SXADDQ $19, $2, $2 # a1_offset += lda

474

#endif

475

476

LD $f27, 0*SIZE($2)

477

LD $f28, 1*SIZE($2)

478

LD $f29, 2*SIZE($2)

479

LD $f30, 3*SIZE($2)

480

481

ST $f10, 0*SIZE($4) # atemp1

482

ST $f14, 1*SIZE($4) # atemp5

483

ST $f23, 2*SIZE($4) # ctemp1

484

ST $f27, 3*SIZE($4) # ctemp5

485

486

ST $f11, 4*SIZE($4) # atemp2

487

ST $f15, 5*SIZE($4) # atemp6

488

ST $f24, 6*SIZE($4) # ctemp2

489

ST $f28, 7*SIZE($4) # ctemp6

490

491

ST $f12, 8*SIZE($4) # atemp3

492

ST $f21, 9*SIZE($4) # atemp7

493

ST $f25, 10*SIZE($4) # ctemp3

494

ST $f29, 11*SIZE($4) # ctemp7

495

496

ST $f13, 12*SIZE($4) # atemp4

497

ST $f22, 13*SIZE($4) # atemp8

498

ST $f26, 14*SIZE($4) # ctemp4

499

ST $f30, 15*SIZE($4) # ctemp8

500

501

lda $4, 16*SIZE($4) # b1_offset += 16

502

503

subl $5, 4, $5 # l -= 4

504

bgt $5, $L202

505

506

subl $8, 4, $8 # i -= 4

507

SXADDQ $1, $6, $6 # c_offset += j

508

bgt $8, $L201

509

510

.align 4

511

#endif

512

513

$L33:

514

sra $12, 1, $27 # j = (min_j>>1)

515

ldah $26, Address_H(MATRIX_A)($28) # a_offset = &sb[0][0]

516

lda $26, Address_L(MATRIX_A)($26)

517

SXADDQ $25,$13,$6 # c_offset = c + jsldc;

518

519

unop

520

unop

521

unop

522

ble $27, $L48

523

.align 4

524

525

$L50:

526

mov $26, $0 # b_offset = b_orig

527

fclr $f11

528

lda $26, SIZE*LDB($26) # b_orig += LDB

529

fclr $f13

530

531

mov $28, $24 # a_offset = &sa[0][0]

532

fclr $f14

533

sra $15, 2, $8 # i = (min_i>>1)

534

fclr $f15

535

536

SXADDQ $11, $6, $22 # c1_offset = c_offset + is

537

fclr $f12

538

SXADDQ $10, $6, $6 # c_offset += ldc(2 times)

539

fclr $f25

540

541

SXADDQ $10, $6, $6 # c_offset += ldc

542

fclr $f26

543

fclr $f27

544

ble $8,$L52 # if j<=0 goto $L52

545

.align 4

546

547

$L54:

548

mov $24, $2 # a1_offset = a_offset

549

fclr $f28

550

sra $7, 2, $5 # l = (min_l>>2)

551

fclr $f29

552

553

mov $0, $4 # b1_offset = b_offset

554

fclr $f30

555

SXADDQ $10, $22, $23 # c2_offset = c1_offset + ldc

556

fclr $f21

557

558

lda $24, LDA*SIZE($24) # a_offset += LDA

559

LD $f5, 0*SIZE($22)

560

LD $f6, 0*SIZE($23)

561

ble $5, $L55 # if l<=0 goto $L55

562

563

LD $f1, 0*SIZE($4) # btemp1 = *(b1_offset+0)

564

LD $f10, 1*SIZE($4) # btemp2 = *(b1_offset+1)

565

LD $f24, 2*SIZE($4) # btemp3 = *(b1_offset+2)

566

LD $f23, 3*SIZE($4) # btemp4 = *(b1_offset+3)

567

568

LD $f22, 0*SIZE($2) # atemp1

569

LD $f20, 1*SIZE($2) # atemp2

570

LD $f18, 2*SIZE($2) # atemp3

571

LD $f16, 3*SIZE($2) # atemp4

572

573

LD $f17, 4*SIZE($2) # atemp5

574

LD $f0, 5*SIZE($2) # atemp6

575

LD $f19, 6*SIZE($2) # atemp7

576

LD $f2, 7*SIZE($2) # atemp8

577

578

lda $2, 8*SIZE($2) # a1_offset += 8

579

subl $5, 1, $5 # l--

580

addq $4, 4*SIZE, $4 # b1_offset += 2

581

ble $5, $L57 # if l<=0 goto $L57

582

.align 4

583

584

585

Main Loop.

586

This loop is very important and affects calculating speed directry.

587

Each load waits 12 clocks which is enough to load from 2nd cache.

588

And one loop takes 33 clocks(multiply and add = 32 clock plus jump

589

latency = 1 clock). If you have 21164A with 600MHz machine, it'll

590

take 1163.6 MFlops in this loop. This is theoretical value, but it's

591

pretty fast, isn't it?

592

593

594

$L58:

595

/* 1 */

596

addt $f28,$f11,$f28

597

#ifdef DGEMM

598

ldt $f31, 32*SIZE($4) # prefetch

599

#else

600

ldt $f31, 36*SIZE($4) # prefetch

601

#endif

602

mult $f1,$f22,$f11

603

#ifdef DGEMM

604

ldt $f31, 44*SIZE($2) # prefetch

605

#else

606

nop

607

#endif

608

609

/* 2 */

610

addt $f29,$f13,$f29

611

mult $f1,$f20,$f13

612

/* 3 */

613

addt $f30,$f14,$f30

614

mult $f1,$f18,$f14

615

616

/* 4 */

617

addt $f21,$f15,$f21

618

subl $5,1,$5

619

mult $f1,$f16,$f15

620

LD $f1, 0*SIZE($4)

621

622

/* 5 */

623

addt $f12,$f11,$f12

624

nop

625

mult $f10,$f22,$f11

626

LD $f22, 0*SIZE($2)

627

628

/* 6 */

629

addt $f25,$f13,$f25

630

nop

631

mult $f10,$f20,$f13

632

LD $f20, 1*SIZE($2)

633

634

/* 7 */

635

addt $f26,$f14,$f26

636

nop

637

mult $f10,$f18,$f14

638

LD $f18, 2*SIZE($2)

639

640

/* 8 */

641

addt $f27,$f15,$f27

642

nop

643

mult $f10,$f16,$f15

644

LD $f16, 3*SIZE($2)

645

646

/* 9 */

647

addt $f28,$f11,$f28

648

nop

649

mult $f24,$f17,$f11

650

LD $f7, 1*SIZE($4)

651

652

/* 10 */

653

addt $f29,$f13,$f29

654

mult $f24,$f0,$f13

655

/* 11 */

656

addt $f30,$f14,$f30

657

mult $f24,$f19,$f14

658

659

/* 12 */

660

addt $f21,$f15,$f21

661

nop

662

mult $f24,$f2,$f15

663

LD $f8, 2*SIZE($4)

664

665

/* 13 */

666

addt $f12,$f11,$f12

667

nop

668

mult $f23,$f17,$f11

669

LD $f17, 4*SIZE($2)

670

671

/* 14 */

672

addt $f25,$f13,$f25

673

nop

674

mult $f23,$f0,$f13

675

LD $f0, 5*SIZE($2)

676

677

/* 15 */

678

addt $f26,$f14,$f26

679

nop

680

mult $f23,$f19,$f14

681

LD $f19, 6*SIZE($2)

682

683

/* 16 */

684

addt $f27,$f15,$f27

685

LD $f4, 3*SIZE($4) # modified

686

mult $f23,$f2,$f15

687

LD $f2, 7*SIZE($2)

688

689

/* 17 */

690

addt $f28,$f11,$f28

691

nop

692

mult $f1,$f22,$f11

693

nop

694

695

/* 18 */

696

addt $f29,$f13,$f29

697

nop

698

mult $f1,$f20,$f13

699

#ifdef DGEMM

700

LD $f31, 48*SIZE($2)

701

#else

702

nop

703

#endif

704

705

/* 19 */

706

addt $f30,$f14,$f30

707

nop

708

mult $f1,$f18,$f14

709

lda $2, 16*SIZE($2) # a1_offset += 16

710

711

/* 20 */

712

addt $f21,$f15,$f21

713

nop

714

mult $f1,$f16,$f15

715

LD $f1, 4*SIZE($4)

716

717

/* 21 */

718

addt $f12, $f11, $f12

719

nop

720

mult $f7, $f22, $f11

721

LD $f22, -8*SIZE($2)

722

723

/* 22 */

724

addt $f25,$f13,$f25

725

nop

726

mult $f7, $f20, $f13

727

LD $f20, -7*SIZE($2)

728

729

/* 23 */

730

addt $f26,$f14,$f26

731

nop

732

mult $f7, $f18, $f14

733

LD $f18, -6*SIZE($2)

734

735

/* 24 */

736

addt $f27,$f15,$f27

737

nop

738

mult $f7, $f16, $f15

739

LD $f16, -5*SIZE($2)

740

741

/* 25 */

742

addt $f28,$f11,$f28

743

nop

744

mult $f8,$f17,$f11

745

LD $f10, 5*SIZE($4) # modifiled

746

747

/* 26 */

748

addt $f29,$f13,$f29

749

nop

750

mult $f8,$f0,$f13

751

lda $4, 8*SIZE($4)

752

753

/* 27 */

754

addt $f30,$f14,$f30

755

nop

756

mult $f8,$f19,$f14

757

LD $f24, -2*SIZE($4)

758

759

/* 28 */

760

addt $f21,$f15,$f21

761

nop

762

mult $f8,$f2,$f15

763

LD $f23, -1*SIZE($4)

764

765

/* 29 */

766

addt $f12,$f11,$f12

767

nop

768

mult $f4,$f17,$f11

769

LD $f17, -4*SIZE($2)

770

771

/* 30 */

772

addt $f25,$f13,$f25

773

nop

774

mult $f4,$f0,$f13

775

LD $f0, -3*SIZE($2)

776

777

/* 31 */

778

addt $f26,$f14,$f26

779

nop

780

mult $f4,$f19,$f14

781

LD $f19, -2*SIZE($2)

782

783

/* 32 */

784

addt $f27,$f15,$f27

785

mult $f4,$f2,$f15

786

LD $f2, -1*SIZE($2)

787

bgt $5,$L58

788

.align 4

789

790

$L57:

791

addt $f28,$f11,$f28

792

lds $f31, 8*SIZE($22) # prefetch(modify intent)

793

mult $f1,$f22,$f11

794

#ifdef DGEMM

795

lds $f31, 12*SIZE($23) # prefetch(modify intent)

796

#else

797

unop

798

#endif

799

800

addt $f29,$f13,$f29

801

mult $f1,$f20,$f13

802

addt $f30,$f14,$f30

803

mult $f1,$f18,$f14

804

805

addt $f21,$f15,$f21

806

unop

807

mult $f1,$f16,$f15

808

LD $f1, 0*SIZE($4)

809

810

addt $f12,$f11,$f12

811

unop

812

mult $f10,$f22,$f11

813

LD $f22, 0*SIZE($2)

814

815

addt $f25,$f13,$f25

816

unop

817

mult $f10,$f20,$f13

818

LD $f20, 1*SIZE($2)

819

820

addt $f26,$f14,$f26

821

unop

822

mult $f10,$f18,$f14

823

LD $f18, 2*SIZE($2)

824

825

addt $f27,$f15,$f27

826

unop

827

mult $f10,$f16,$f15

828

LD $f16, 3*SIZE($2)

829

830

addt $f28,$f11,$f28

831

lda $2, 4*SIZE($2) # a1_offset += 4

832

mult $f24,$f17,$f11

833

LD $f7, 1*SIZE($4)

834

835

addt $f29,$f13,$f29

836

mult $f24,$f0,$f13

837

addt $f30,$f14,$f30

838

mult $f24,$f19,$f14

839

840

addt $f21,$f15,$f21

841

unop

842

mult $f24,$f2,$f15

843

LD $f24, 2*SIZE($4)

844

845

addt $f12,$f11,$f12

846

unop

847

mult $f23,$f17,$f11

848

LD $f17, 0*SIZE($2)

849

850

addt $f25,$f13,$f25

851

unop

852

mult $f23,$f0,$f13

853

LD $f0, 1*SIZE($2)

854

855

addt $f26,$f14,$f26

856

unop

857

mult $f23,$f19,$f14

858

LD $f19, 2*SIZE($2)

859

860

addt $f27,$f15,$f27

861

unop

862

mult $f23,$f2,$f15

863

LD $f2, 3*SIZE($2)

864

865

addt $f28,$f11,$f28

866

LD $f4, 3*SIZE($4)

867

mult $f1,$f22,$f11

868

lda $2, 4*SIZE($2) # a1_offset += 4

869

870

addt $f29,$f13,$f29

871

addq $4, 4*SIZE, $4

872

mult $f1,$f20,$f13

873

unop

874

875

addt $f30,$f14,$f30

876

mult $f1,$f18,$f14

877

addt $f21,$f15,$f21

878

mult $f1,$f16,$f15

879

880

addt $f12, $f11, $f12

881

mult $f7, $f22, $f11

882

addt $f25, $f13, $f25

883

mult $f7, $f20, $f13

884

885

addt $f26,$f14,$f26

886

mult $f7, $f18,$f14

887

addt $f27,$f15,$f27

888

mult $f7, $f16,$f15

889

890

addt $f28,$f11,$f28

891

mult $f24,$f17,$f11

892

addt $f29,$f13,$f29

893

mult $f24,$f0,$f13

894

895

addt $f30,$f14,$f30

896

mult $f24,$f19,$f14

897

addt $f21,$f15,$f21

898

mult $f24,$f2,$f15

899

900

addt $f12, $f11, $f12

901

mult $f4, $f17, $f11

902

addt $f25, $f13, $f25

903

mult $f4, $f0, $f13

904

905

addt $f26, $f14, $f26

906

mult $f4, $f19, $f14

907

addt $f27, $f15, $f27

908

mult $f4, $f2, $f15

909

.align 4

910

911

$L55:

912

and $7,3,$5 # l = (min_l&3)

913

beq $5,$L60 # if l<=0 goto $L60

914

915

LD $f22, 0*SIZE($2) # atemp1

916

LD $f1, 0*SIZE($4) # btemp1

917

918

LD $f20, 1*SIZE($2) # atemp2

919

LD $f10, 1*SIZE($4) # btemp2

920

LD $f18, 2*SIZE($2) # atemp3

921

LD $f16, 3*SIZE($2) # atemp4

922

923

lda $2, 4*SIZE($2) # a1_offset += 4

924

subl $5, 1, $5 # l--

925

lda $4, 2*SIZE($4) # b1_offset += 2

926

ble $5,$L62 # if l<=0 goto $L62

927

.align 4

928

929

$L63:

930

addt $f28,$f11,$f28

931

#ifdef DGEMM

932

LD $f31, 8*8($4)

933

#else

934

unop

935

#endif

936

mult $f1,$f22,$f11

937

unop

938

939

addt $f29,$f13,$f29

940

mult $f1,$f20,$f13

941

addt $f30,$f14,$f30

942

mult $f1,$f18,$f14

943

944

addt $f21,$f15,$f21

945

lda $2, 4*SIZE($2) # a1_offset += 4

946

mult $f1,$f16,$f15

947

LD $f1, 0*SIZE($4)

948

949

addt $f12,$f11,$f12

950

lda $4, 2*SIZE($4) # b1_offset += 2

951

mult $f10,$f22,$f11

952

LD $f22, -4*SIZE($2)

953

954

addt $f25,$f13,$f25

955

subl $5,1,$5 # l--

956

mult $f10,$f20,$f13

957

LD $f20, -3*SIZE($2)

958

959

addt $f26,$f14,$f26

960

unop

961

mult $f10,$f18,$f14

962

LD $f18, -2*SIZE($2)

963

964

addt $f27,$f15,$f27

965

mult $f10,$f16,$f15

966

LD $f10, -1*SIZE($4)

967

LD $f16, -1*SIZE($2)

968

969

bgt $5,$L63 # if l>0 goto $L63

970

unop

971

unop

972

unop

973

.align 4

974

975

$L62:

976

addt $f28,$f11,$f28

977

mult $f1,$f22,$f11

978

addt $f29,$f13,$f29

979

mult $f1,$f20,$f13

980

981

addt $f30,$f14,$f30

982

mult $f1,$f18,$f14

983

addt $f21,$f15,$f21

984

mult $f1,$f16,$f15

985

986

addt $f12,$f11,$f12

987

mult $f10,$f22,$f11

988

addt $f25,$f13,$f25

989

mult $f10,$f20,$f13

990

991

addt $f26,$f14,$f26

992

mult $f10,$f18,$f14

993

addt $f27,$f15,$f27

994

mult $f10,$f16,$f15

995

.align 4

996

997

$L60:

998

addt $f28,$f11,$f28

999

LD $f20, 1*SIZE($22) # atemp2 = *(c1_offset+1)

1000

mult $f3,$f12,$f11

1001

LD $f18, 2*SIZE($22) # atemp3 = *(c1_offset+2)

1002

1003

addt $f29,$f13,$f29

1004

LD $f16, 3*SIZE($22) # atemp4 = *(c1_offset+3)

1005

mult $f3,$f25,$f13

1006

LD $f0, 1*SIZE($23) # atemp6 = *(c2_offset+1)

1007

1008

addt $f30,$f14,$f30

1009

LD $f19, 2*SIZE($23) # atemp7 = *(c2_offset+2)

1010

mult $f3,$f26,$f14

1011

LD $f2, 3*SIZE($23) # atemp8 = *(c2_offset+3)

1012

1013

addt $f21,$f15,$f21

1014

unop

1015

mult $f3,$f27,$f15

1016

unop

1017

1018

addt $f5,$f11,$f12

1019

addq $22, 4*SIZE, $22 # c1_offset += 4

1020

mult $f3,$f28,$f11

1021

subl $8,1,$8 # i--

1022

1023

addt $f20, $f13, $f25

1024

mult $f3, $f29, $f13

1025

addt $f18, $f14, $f26

1026

mult $f3, $f30, $f14

1027

1028

addt $f16,$f15,$f27

1029

mult $f3,$f21,$f15

1030

addt $f6,$f11,$f28

1031

ST $f12, -4*SIZE($22) # *(c1_offset+0) = ctemp1

1032

1033

addt $f0,$f13,$f29

1034

unop

1035

ST $f25, -3*SIZE($22) # *(c1_offset+1) = ctemp2

1036

fclr $f11

1037

1038

addt $f19,$f14,$f30

1039

unop

1040

ST $f26, -2*SIZE($22) # *(c1_offset+2) = ctemp3

1041

fclr $f13

1042

1043

addt $f2,$f15,$f21

1044

unop

1045

ST $f27, -1*SIZE($22) # *(c1_offset+3) = ctemp4

1046

fclr $f14

1047

1048

ST $f28, 0*SIZE($23) # *(c2_offset+0) = ctemp5

1049

fclr $f15

1050

unop

1051

fclr $f12

1052

1053

ST $f29, 1*SIZE($23) # *(c2_offset+1) = ctemp6

1054

fclr $f25

1055

unop

1056

fclr $f26

1057

1058

ST $f30, 2*SIZE($23) # *(c2_offset+2) = ctemp7

1059

fclr $f27

1060

ST $f21, 3*SIZE($23) # *(c2_offset+3) = ctemp8

1061

bgt $8,$L54 # if i>0 goto $L54

1062

.align 4

1063

1064

$L52:

1065

and $15,3,$8 # i = (min_i&3)

1066

beq $8,$L49 # if i<0 goto $L49

1067

unop

1068

unop

1069

.align 4

1070

1071

$L69:

1072

mov $24, $2 # a1_offset = a_offset

1073

addq $24, SIZE, $24 # a_offset ++

1074

mov $0, $4 # b1_offset = b_offset

1075

SXADDQ $10, $22, $23 # c2_offset = c1_offset + ldc

1076

1077

fclr $f12 # ctemp1 = ZERO

1078

mov $7, $5 # l = min_l

1079

fclr $f28 # ctemp5 = ZERO

1080

ble $7,$L71 # if l<=0 goto $L71

1081

.align 4

1082

1083

$L73:

1084

LD $f22, 0($2) # atemp1

1085

lda $2, 4*SIZE($2) # a1_offset += 4

1086

1087

LD $f1, 0*SIZE($4) # btemp1 = *(b1_offset+0)

1088

LD $f10, 1*SIZE($4) # btemp2 = *(b1_offset+2)

1089

1090

mult $f1, $f22,$f11 # temp1 = btemp1 * atemp1

1091

mult $f10,$f22,$f13 # temp2 = btemp2 * atemp1

1092

lda $4, 2*SIZE($4) # b1_offset ++

1093

subl $5,1,$5 # l--

1094

1095

addt $f12,$f11,$f12 # ctemp1 = ctemp1 + temp1

1096

addt $f28,$f13,$f28 # ctemp5 = ctemp5 + temp2

1097

bgt $5,$L73 # if l>0 goto $L73

1098

unop

1099

.align 4

1100

1101

$L71:

1102

mult $f3,$f12,$f11 # temp1 = alpha*ctemp1

1103

mult $f3,$f28,$f13 # temp2 = alpha*ctemp2

1104

LD $f22, 0*SIZE($22) # atemp1 = *c1_offset

1105

LD $f17, 0*SIZE($23) # atemp5 = *c2_offset

1106

1107

addt $f22,$f11,$f12 # ctemp1 = atemp1 + temp1

1108

addt $f17,$f13,$f28 # ctemp2 = atemp5 + temp2

1109

subl $8,1,$8 # i--

1110

ST $f12, 0*SIZE($22) # *c1_offset = ctemp1

1111

1112

ST $f28, 0*SIZE($23) # *c2_offset = ctemp2

1113

addq $22, SIZE, $22 # c1_offset ++

1114

bgt $8,$L69 # if i>0 goto $L69

1115

unop

1116

.align 4

1117

1118

$L49:

1119

subl $27,1,$27 # j --

1120

bgt $27,$L50 # if j>0 goto $L50

1121

unop

1122

unop

1123

.align 4

1124

1125

$L48:

1126

blbc $12,$L29 # if (!min_j&1) goto $L29

1127

fclr $f11

1128

sra $15,2,$8 # i = (min_i>>2)

1129

fclr $f13

1130

1131

mov $26, $0 # b_offset = b_orig

1132

fclr $f14

1133

mov $28, $24 # a_offset = &sa[0][0]

1134

fclr $f15

1135

1136

SXADDQ $11, $6, $22 # c1_offset = c_offset + is

1137

ble $8,$L79 # if i<0 goto $L79

1138

unop

1139

unop

1140

.align 4

1141

1142

$L81:

1143

mov $24, $2 # a1_offset = a_offset

1144

fclr $f12

1145

sra $7, 2, $5 # l = (min_l>>2)

1146

fclr $f25

1147

1148

mov $0, $4 # b1_offset = b_offset

1149

fclr $f26

1150

lda $24, LDA*SIZE($24) # a_offset += LDA

1151

fclr $f27

1152

1153

unop

1154

ble $5,$L82

1155

1156

LD $f1, 0*SIZE($4) # btemp1

1157

LD $f10, 2*SIZE($4) # btemp2

1158

1159

LD $f22, 0*SIZE($2) # atemp1

1160

LD $f20, 1*SIZE($2) # atemp2

1161

LD $f18, 2*SIZE($2) # atemp3

1162

LD $f16, 3*SIZE($2) # atemp4

1163

LD $f17, 4*SIZE($2) # atemp5

1164

LD $f0, 5*SIZE($2) # atemp6

1165

LD $f19, 6*SIZE($2) # atemp7

1166

LD $f2, 7*SIZE($2) # atemp8

1167

1168

lda $2, 8*SIZE($2) # a1_offset += 8

1169

1170

subl $5, 1, $5 # l--

1171

lda $4, 4*SIZE($4) # b1_offset += 4

1172

ble $5, $L84 # if l<= 0 goto $L84

1173

.align 4

1174

$L85:

1175

addt $f12,$f11,$f12

1176

unop

1177

mult $f1,$f22,$f11

1178

LD $f22, 0*SIZE($2) # atemp1

1179

1180

addt $f25,$f13,$f25

1181

unop

1182

mult $f1,$f20,$f13

1183

LD $f20, 1*SIZE($2) # atemp2

1184

1185

addt $f26,$f14,$f26

1186

unop

1187

mult $f1,$f18,$f14

1188

LD $f18, 2*SIZE($2) # atemp3

1189

1190

addt $f27,$f15,$f27

1191

unop

1192

mult $f1,$f16,$f15

1193

LD $f1, 0*SIZE($4) # btemp1

1194

1195

addt $f12,$f11,$f12

1196

LD $f16, 3*SIZE($2) # atemp4

1197

mult $f10,$f17,$f11

1198

LD $f17, 4*SIZE($2) # atemp5

1199

1200

addt $f25,$f13,$f25

1201

unop

1202

mult $f10,$f0,$f13

1203

LD $f0, 5*SIZE($2) # atemp6

1204

1205

addt $f26,$f14,$f26

1206

unop

1207

mult $f10,$f19,$f14

1208

LD $f19, 6*SIZE($2) # atemp7

1209

1210

addt $f27,$f15,$f27

1211

unop

1212

mult $f10,$f2,$f15

1213

LD $f10, 2*SIZE($4) # btemp2

1214

1215

addt $f12,$f11,$f12

1216

LD $f2, 7*SIZE($2) # atemp8

1217

mult $f1,$f22,$f11

1218

LD $f22, 8*SIZE($2) # atemp1

1219

1220

addt $f25,$f13,$f25

1221

unop

1222

mult $f1,$f20,$f13

1223

LD $f20, 9*SIZE($2) # atemp2

1224

1225

addt $f26,$f14,$f26

1226

unop

1227

mult $f1,$f18,$f14

1228

LD $f18, 10*SIZE($2) # atemp3

1229

1230

addt $f27,$f15,$f27

1231

lda $2, 16*SIZE($2) # a1_offset += 16

1232

mult $f1,$f16,$f15

1233

LD $f1, 4*SIZE($4) # btemp1

1234

1235

addt $f12,$f11,$f12

1236

LD $f16, -5*SIZE($2) # atemp4

1237

mult $f10,$f17,$f11

1238

LD $f17, -4*SIZE($2) # atemp5

1239

1240

addt $f25,$f13,$f25

1241

unop

1242

mult $f10,$f0,$f13

1243

LD $f0, -3*SIZE($2) # atemp6

1244

1245

addt $f26,$f14,$f26

1246

unop

1247

mult $f10,$f19,$f14

1248

LD $f19, -2*SIZE($2) # atemp7

1249

1250

addt $f27,$f15,$f27

1251

unop

1252

mult $f10,$f2,$f15

1253

LD $f10, 6*SIZE($4) # btemp2

1254

1255

LD $f2, -1*SIZE($2) # atemp8

1256

subl $5, 1, $5 # l--

1257

lda $4, 8*SIZE($4) # b1_offset += 8

1258

bgt $5,$L85 # if l>0 goto $L85

1259

1260

$L84:

1261

addt $f12,$f11,$f12

1262

unop

1263

mult $f1,$f22,$f11

1264

LD $f22, 0*SIZE($2) # atemp1

1265

1266

addt $f25,$f13,$f25

1267

unop

1268

mult $f1,$f20,$f13

1269

LD $f20, 1*SIZE($2) # atemp2

1270

1271

addt $f26,$f14,$f26

1272

unop

1273

mult $f1,$f18,$f14

1274

LD $f18, 2*SIZE($2) # atemp3

1275

1276

addt $f27,$f15,$f27

1277

unop

1278

mult $f1,$f16,$f15

1279

LD $f1, 0*SIZE($4) # btemp1

1280

1281

addt $f12,$f11,$f12

1282

LD $f16, 3*SIZE($2) # atemp4

1283

mult $f10,$f17,$f11

1284

LD $f17, 4*SIZE($2) # atemp5

1285

1286

addt $f25,$f13,$f25

1287

unop

1288

mult $f10,$f0,$f13

1289

LD $f0, 5*SIZE($2) # atemp6

1290

1291

addt $f26,$f14,$f26

1292

unop

1293

mult $f10,$f19,$f14

1294

LD $f19, 6*SIZE($2) # atemp7

1295

1296

addt $f27,$f15,$f27

1297

lda $2, 8*SIZE($2) # a1_offset += 8

1298

mult $f10, $f2, $f15

1299

LD $f10, 2*SIZE($4) # b2_offset

1300

1301

addt $f12,$f11,$f12

1302

LD $f2, -1*SIZE($2) # atemp8

1303

mult $f1,$f22,$f11

1304

lda $4, 4*SIZE($4) # b1_offset ++

1305

1306

addt $f25,$f13,$f25

1307

mult $f1,$f20,$f13

1308

addt $f26,$f14,$f26

1309

mult $f1,$f18,$f14

1310

1311

addt $f27,$f15,$f27

1312

mult $f1,$f16,$f15

1313

addt $f12,$f11,$f12

1314

mult $f10,$f17,$f11

1315

1316

addt $f25,$f13,$f25

1317

mult $f10,$f0,$f13

1318

addt $f26,$f14,$f26

1319

mult $f10,$f19,$f14

1320

1321

addt $f27,$f15,$f27

1322

unop

1323

mult $f10,$f2,$f15

1324

unop

1325

.align 4

1326

1327

$L82:

1328

and $7, 3, $5 # l = (min_l&3)

1329

beq $5, $L87 # if l<=0 goto $L87

1330

1331

LD $f22, 0*SIZE($2) # atemp1

1332

LD $f1, 0*SIZE($4) # b1_offset

1333

1334

LD $f20, 1*SIZE($2) # atemp2

1335

LD $f18, 2*SIZE($2) # atemp3

1336

LD $f16, 3*SIZE($2) # atemp4

1337

lda $2, 4*SIZE($2) # a1_offset += 4

1338

1339

subl $5, 1, $5 # l--

1340

lda $4, 2*SIZE($4) # b1_offset += 2

1341

1342

ble $5,$L89 # if l<=0 goto $L89

1343

unop

1344

.align 4

1345

1346

$L90:

1347

addt $f12,$f11,$f12

1348

unop

1349

mult $f1,$f22,$f11

1350

LD $f22, 0*SIZE($2) # atemp1

1351

1352

addt $f25,$f13,$f25

1353

unop

1354

mult $f1,$f20,$f13

1355

LD $f20, 1*SIZE($2) # atemp2

1356

1357

addt $f26,$f14,$f26

1358

unop

1359

mult $f1,$f18,$f14

1360

LD $f18, 2*SIZE($2) # atemp3

1361

1362

addt $f27,$f15,$f27

1363

lda $2, 4*SIZE($2) # a1_offset += 4

1364

mult $f1,$f16,$f15

1365

LD $f1, 0*SIZE($4) # btemp1

1366

1367

LD $f16, -1*SIZE($2) # atemp4

1368

subl $5, 1, $5 # l--

1369

lda $4, 2*SIZE($4) # b1_offset += 2

1370

bgt $5, $L90 # if l>0 goto $L90

1371

.align 4

1372

1373

$L89:

1374

addt $f12,$f11,$f12

1375

mult $f1,$f22,$f11

1376

addt $f25,$f13,$f25

1377

mult $f1,$f20,$f13

1378

1379

addt $f26,$f14,$f26

1380

mult $f1,$f18,$f14

1381

addt $f27,$f15,$f27

1382

mult $f1,$f16,$f15

1383

.align 4

1384

1385

$L87:

1386

addt $f12,$f11,$f12

1387

LD $f22, 0*SIZE($22)

1388

addt $f25,$f13,$f25

1389

LD $f20, 1*SIZE($22)

1390

1391

addt $f26,$f14,$f26

1392

LD $f18, 2*SIZE($22)

1393

addt $f27,$f15,$f27

1394

LD $f16, 3*SIZE($22)

1395

1396

mult $f3,$f12,$f11

1397

mult $f3,$f25,$f13

1398

mult $f3,$f26,$f14

1399

mult $f3,$f27,$f15

1400

1401

addt $f22,$f11,$f12

1402

addt $f20,$f13,$f25

1403

addt $f18,$f14,$f26

1404

addt $f16,$f15,$f27

1405

1406

ST $f12, 0*SIZE($22)

1407

fclr $f11

1408

ST $f25, 1*SIZE($22)

1409

fclr $f13

1410

ST $f26, 2*SIZE($22)

1411

fclr $f14

1412

ST $f27, 3*SIZE($22)

1413

fclr $f15

1414

1415

subl $8, 1, $8 # i--

1416

addq $22, 4*SIZE, $22 # c1_offset += 4

1417

bgt $8, $L81

1418

unop

1419

.align 4

1420

1421

$L79:

1422

and $15,3,$8 # i = (min_i&3)

1423

beq $8,$L29 # if i<=0 goto $L29

1424

unop

1425

unop

1426

.align 4

1427

1428

$L96:

1429

mov $24, $2 # a1_offset = a_offset

1430

fclr $f12

1431

addq $24, SIZE, $24 # a_offset ++

1432

fclr $f11

1433

1434

mov $0, $4 # b1_offset = b_offset

1435

mov $7, $5 # l = min_l

1436

ble $7,$L98 # if l<=0 goto $L98

1437

unop

1438

.align 4

1439

1440

$L100:

1441

LD $f22, 0*SIZE($2) # atemp1

1442

LD $f1, 0*SIZE($4) # btemp1

1443

1444

lda $2, 4*SIZE($2) # a1_offset += 4

1445

lda $4, 2*SIZE($4) # b1_offset += 2

1446

1447

addt $f12,$f11,$f12

1448

subl $5,1,$5 # l--

1449

mult $f1,$f22,$f11

1450

bgt $5,$L100 # if l>0 goto $L100

1451

.align 4

1452

1453

$L98:

1454

addt $f12,$f11,$f12 # ctemp1 += temp1

1455

mult $f3,$f12,$f11 # temp1 = alpha*ctemp1

1456

LD $f22, 0*SIZE($22) # atemp1 = *c1_offset

1457

addt $f22,$f11,$f12 # ctemp1 = atemp1 + temp1

1458

1459

subl $8,1,$8 # i--

1460

ST $f12, 0*SIZE($22) # *c1_offset = ctemp1

1461

addq $22, SIZE, $22 # c1_offset ++

1462

bgt $8,$L96 # if i>0 goto $L98

1463

.align 4

1464

1465

$L29:

1466

lda $11, P($11) # is += P

1467

nop

1468

#ifndef C_VERSION

1469

cmplt $11,$16,$1 # is < m ?

1470

#else

1471

cmplt $11,$17,$1 # is < m ?

1472

#endif

1473

bne $1,$L30

1474

.align 4

1475

1476

$L9:

1477

lda $14, R($14) # js += R

1478

nop

1479

#ifndef C_VERSION

1480

cmplt $14,$17,$1 # js < n ?

1481

#else

1482

cmplt $14,$16,$1 # js < n ?

1483

#endif

1484

bne $1,$L10

1485

.align 4

1486

1487

$L4:

1488

lda $3, Q($3) # ls += Q

1489

clr $14 # js = 0

1490

cmplt $3,$18,$1 # ls < k ??

1491

bne $1,$L5

1492

.align 4

1493

1494

$L3:

1495

ldq $26, 0($30)

1496

ldq $9, 8($30)

1497

ldq $10,16($30)

1498

ldq $11,24($30)

1499

ldq $12,32($30)

1500

ldq $13,40($30)

1501

ldq $14,48($30)

1502

ldq $15,56($30)

1503

ldt $f2,64($30)

1504

ldt $f3,72($30)

1505

ldt $f4,80($30)

1506

ldt $f5,96($30)

1507

ldt $f6,104($30)

1508

ldt $f7,112($30)

1509

ldt $f8,120($30)

1510

1511

lda $30, STACKSIZE($30)

1512

clr $0

1513

1514

ret $31,($26),1

1515

.ident VERSION

1516

.end ROUTINE

1517

1518

/* Finish !! */

Older »