~ubuntu-branches/ubuntu/vivid/atlas/vivid

« back to all changes in this revision

Viewing changes to tune/blas/gemm/CASES/ATL_dmm2x2x2_sse2.c

Committer: Bazaar Package Importer
Author(s): Sylvestre Ledru
Date: 2009-09-17 23:31:54 UTC
mto: (2.2.1 experimental)
mto: This revision was merged to the branch mainline in revision 10.
Revision ID: james.westby@ubuntu.com-20090917233154-9esw88ub02twbuab

Tags: upstream-3.8.3

Import upstream version 3.8.3

files added:
CONFIG/ARCHS/AMD64K10h32SSE3.tgz

CONFIG/ARCHS/AMD64K10h64SSE3.tgz

CONFIG/ARCHS/Core232SSE3.tgz

CONFIG/ARCHS/Core264SSE3.tgz

CONFIG/ARCHS/Corei764SSE3.tgz

CONFIG/ARCHS/HAMMER32SSE3.tgz

CONFIG/ARCHS/HAMMER64SSE3.tgz

CONFIG/ARCHS/IA64Itan264.tgz

CONFIG/ARCHS/MIPSICE932.tgz

CONFIG/ARCHS/MIPSICE964.tgz

CONFIG/ARCHS/MIPSR1xK64.tgz

CONFIG/ARCHS/Make.ext

CONFIG/ARCHS/P432SSE2.tgz

CONFIG/ARCHS/P4E32SSE3.tgz

CONFIG/ARCHS/P4E64SSE3.tgz

CONFIG/ARCHS/PIII32SSE1.tgz

CONFIG/ARCHS/POWER432.tgz

CONFIG/ARCHS/POWER464.tgz

CONFIG/ARCHS/POWER564.tgz

CONFIG/ARCHS/PPCG432AltiVec.tgz

CONFIG/ARCHS/PPCG532AltiVec.tgz

CONFIG/ARCHS/PPCG564AltiVec.tgz

CONFIG/ARCHS/USIII32.tgz

CONFIG/ARCHS/USIII64.tgz

CONFIG/ARCHS/USIV32.tgz

CONFIG/ARCHS/USIV64.tgz

CONFIG/Make.ext

CONFIG/include

CONFIG/include/Make.ext

CONFIG/include/atlas_asm.h

CONFIG/include/atlconf.h

CONFIG/include/atlconf_misc.h

CONFIG/src

CONFIG/src/ATLrun.sh

CONFIG/src/CompMake.txt

CONFIG/src/Make.ext

CONFIG/src/Makefile

CONFIG/src/SpewMakeInc.c

CONFIG/src/atlbench.c

CONFIG/src/atlcomp.txt

CONFIG/src/atlconf_misc.c

CONFIG/src/backend

CONFIG/src/backend/Make.ext

CONFIG/src/backend/archinfo_aix.c

CONFIG/src/backend/archinfo_freebsd.c

CONFIG/src/backend/archinfo_irix.c

CONFIG/src/backend/archinfo_linux.c

CONFIG/src/backend/archinfo_sunos.c

CONFIG/src/backend/archinfo_x86.c

CONFIG/src/backend/c2cmaster.c

CONFIG/src/backend/c2cslave.c

CONFIG/src/backend/comptestC.c

CONFIG/src/backend/comptestF.f

CONFIG/src/backend/cpuid.S

CONFIG/src/backend/f2cintC.c

CONFIG/src/backend/f2cintF.f

CONFIG/src/backend/f2cnameC.c

CONFIG/src/backend/f2cnameF.f

CONFIG/src/backend/f2cstrC.c

CONFIG/src/backend/f2cstrF.f

CONFIG/src/backend/flibchkC.c

CONFIG/src/backend/flibchkF.f

CONFIG/src/backend/probe_3DNow.S

CONFIG/src/backend/probe_AltiVec.S

CONFIG/src/backend/probe_SSE1.S

CONFIG/src/backend/probe_SSE2.S

CONFIG/src/backend/probe_SSE3.S

CONFIG/src/backend/probe_dSSE3.c

CONFIG/src/backend/probe_dvec.c

CONFIG/src/backend/probe_gas_mips.S

CONFIG/src/backend/probe_gas_parisc.S

CONFIG/src/backend/probe_gas_ppc.S

CONFIG/src/backend/probe_gas_sparc.S

CONFIG/src/backend/probe_gas_x8632.S

CONFIG/src/backend/probe_gas_x8664.S

CONFIG/src/backend/probe_svec.c

CONFIG/src/backend/probe_this_asm.c

CONFIG/src/config.c

CONFIG/src/print_enums.c

CONFIG/src/probe_OS.c

CONFIG/src/probe_arch.c

CONFIG/src/probe_asm.c

CONFIG/src/probe_comp.c

CONFIG/src/probe_f2c.c

CONFIG/src/probe_pmake.c

CONFIG/src/probe_vec.c

CONFIG/src/wincc.c

CONFIG/src/winf77.c

TexDoc

TexDoc/ChangeLog

TexDoc/Makefile

TexDoc/ReleaseNotes

TexDoc/atlas.bib

TexDoc/atlas_contrib.tex

TexDoc/atlas_devel.tex

TexDoc/atlas_install.tex

TexDoc/cblasqref.tex

TexDoc/f77blasqref.tex

TexDoc/lapackqref.tex

TexDoc/make.bas

configure

doc/BootSequence.txt

include/atlas_asm.h

lib/qr.c

makes/atlas_trsmNB.h

src/auxil/ATL_gemoveT.c

src/auxil/ATL_hereflect.c

src/auxil/ATL_syreflect.c

src/blas/gemm/ATL_cmmJITcp.c

src/blas/gemm/ATL_cmmJKI.c

src/blas/gemm/ATL_gereal2cplx.c

src/blas/gemm/ATL_mmBPP.c

src/blas/gemm/ATL_mmJITcp.c

src/blas/gemm/ATL_mmJKI.c

src/blas/gemm/ATL_mmK.c

src/testing/ATL_f77gels.c

src/testing/ATL_f77gesv.c

src/testing/ATL_f77posv.c

tune/blas/gemm/CASES/ATL_dmm2x2x128_sse2.c

tune/blas/gemm/CASES/ATL_dmm2x2x2_sse2.c

tune/blas/gemm/CASES/ATL_dmm4x1x44_4_sse2.c

tune/blas/gemm/CASES/ATL_dmm4x1x90_x87.c

tune/blas/gemm/CASES/ATL_dmm4x2x128_sse2.c

tune/blas/gemm/CASES/ATL_dmm4x4x16_hppa.c

tune/blas/gemm/CASES/ATL_dmm4x4x2_mips.c

tune/blas/gemm/CASES/ATL_dmm4x4x32_ppc.c

tune/blas/gemm/CASES/ATL_dmm4x4x80_ppc.c

tune/blas/gemm/CASES/ATL_dmm4x4xUR2_mips.c

tune/blas/gemm/CASES/ATL_dmm4x4xUR3_mips.c

tune/blas/gemm/CASES/ATL_dmm4x4xURx_mips.c

tune/blas/gemm/CASES/ATL_dmm6x1x60_sse2_32.c

tune/blas/gemm/CASES/ATL_dmm8x1x120_L1pf.c

tune/blas/gemm/CASES/ATL_dmm8x1x120_sse2.c

tune/blas/gemm/CASES/ATL_smm10x1x120_sse.c

tune/blas/gemm/CASES/ATL_smm2x2x256_sse.c

tune/blas/gemm/CASES/ATL_smm4x1x256_sse.c

tune/blas/gemm/CASES/ATL_smm4x1x60_4_sse2.c

tune/blas/gemm/CASES/ATL_smm4x4x128_av.c

tune/blas/gemm/CASES/ATL_smm4x4x16_hppa.c

tune/blas/gemm/CASES/ATL_smm4x4xURx_mips.c

tune/blas/gemm/CASES/ATL_smm6x1x120_sse.c

tune/blas/gemm/CASES/ATL_smm6x1x80_sse.c

tune/blas/level1/AXPY/caxpy_sse3.c

tune/blas/level1/AXPY/daxpy_sse2.c

tune/blas/level1/AXPY/saxpy_sse.c

tune/blas/level1/AXPY/zaxpy_sse3.c

tune/blas/level1/NRM2/cnrm2_x87_x0.c

tune/blas/level1/NRM2/nrm2_x87_x0.c

tune/blas/level1/NRM2/nrm2_x87_x1.c

tune/blas/level3/ATL_trsm.c

tune/blas/level3/gen_trsmnb.c

tune/blas/level3/invtrsm.c

files removed:
CONFIG/3DNow.txt

CONFIG/ARCHS/21164.tgz

CONFIG/ARCHS/21164GOTO.tgz

CONFIG/ARCHS/21264.tgz

CONFIG/ARCHS/21264GOTO.tgz

CONFIG/ARCHS/ATHLON.tgz

CONFIG/ARCHS/ATHLON3DNow2.tgz

CONFIG/ARCHS/ATHLONSSE1.tgz

CONFIG/ARCHS/HP9735.tgz

CONFIG/ARCHS/IA64Itan.tgz

CONFIG/ARCHS/IA64Itan2.tgz

CONFIG/ARCHS/P4SSE1.tgz

CONFIG/ARCHS/P4SSE2.tgz

CONFIG/ARCHS/P5MMX.tgz

CONFIG/ARCHS/PII.tgz

CONFIG/ARCHS/PIII.tgz

CONFIG/ARCHS/PIIISSE1.tgz

CONFIG/ARCHS/POWER.tgz

CONFIG/ARCHS/POWER2Thin.tgz

CONFIG/ARCHS/POWER3.tgz

CONFIG/ARCHS/POWER4.tgz

CONFIG/ARCHS/PPC604.tgz

CONFIG/ARCHS/PPC604e.tgz

CONFIG/ARCHS/PPCG4.tgz

CONFIG/ARCHS/PPCG4AltiVec.tgz

CONFIG/ARCHS/PPRO.tgz

CONFIG/ARCHS/SGIIP28.tgz

CONFIG/ARCHS/SGIIP30.tgz

CONFIG/ARCHS/SunUS2.tgz

CONFIG/ARCHS/SunUS5.tgz

CONFIG/ARCHS/SunUSIII.tgz

CONFIG/CCmake.txt

CONFIG/Makefile

CONFIG/NoSearch.txt

CONFIG/SolErr.c

CONFIG/SolErr.txt

CONFIG/UseCCDef.txt

CONFIG/UseCCFlagsDef.txt

CONFIG/arch.txt

CONFIG/archinfo_aix.c

CONFIG/archinfo_hpux.c

CONFIG/blas.txt

CONFIG/blaslink.f

CONFIG/ccomp-alpha.txt

CONFIG/ccomp-alpha_newgcc.txt

CONFIG/ccomp-alpha_nogcc.txt

CONFIG/ccomp.txt

CONFIG/cf2cint.c

CONFIG/cf2cstr.c

CONFIG/cname.c

CONFIG/config_flags.txt

CONFIG/errata.txt

CONFIG/error.txt

CONFIG/f77exp.txt

CONFIG/f77make.txt

CONFIG/ff2cint.f

CONFIG/ff2cstr.f

CONFIG/fname.f

CONFIG/gcc33ppc.txt

CONFIG/gcc3US.txt

CONFIG/gcc3evX.txt

CONFIG/gcc3ia64.txt

CONFIG/gcc3x86.txt

CONFIG/goodbye.txt

CONFIG/gotogemm.txt

CONFIG/init.txt

CONFIG/l1def.txt

CONFIG/l2size.txt

CONFIG/l2sizemax.txt

CONFIG/ncpu.txt

CONFIG/nfsdelay.txt

CONFIG/probe_3DNow1.c

CONFIG/probe_3DNow2.c

CONFIG/probe_AltiVec.c

CONFIG/probe_SSE1.c

CONFIG/probe_SSE2.c

CONFIG/probe_as_osx_ppc.s

CONFIG/probe_asm.c

CONFIG/probe_gas_linux_ppc.s

CONFIG/probe_gas_sparc.s

CONFIG/probe_gas_x8632.s

CONFIG/probe_gas_x8664.s

CONFIG/pthread.txt

CONFIG/tst.c

CONFIG/tst.f

CONFIG/wincc.c

CONFIG/wincomp.txt

CONFIG/winf77.c

CONFIG/xcomp-err.txt

CONFIG/xcomp.txt

Makefile

config.c

doc/atlas_contrib.ps

doc/atlas_devel.ps

doc/atlas_over.ps

doc/cblas.ps

doc/cblasqref.ps

doc/f77blasqref.ps

doc/lapackqref.ps

makes/Make.goto

src/blas/gemm/GOTO

src/blas/gemm/GOTO/ATLU_usergemm.c

src/blas/gemm/GOTO/COPYING.LIB

src/blas/gemm/GOTO/README

src/blas/gemm/GOTO/common.h

src/blas/gemm/GOTO/gemm_EV5_k.S

src/blas/gemm/GOTO/gemm_EV6_k.S

src/blas/gemm/GOTO/gemm_k.S

src/blas/gemm/GOTO/libgemm-20000228.tar.bz2

src/blas/gemm/GOTO/version.h

src/blas/gemm/GOTO/zgemm_k.S

files modified:
CONFIG/ARCHS/BOZOL1.tgz

CONFIG/ARCHS/CreateDef.sh

CONFIG/ARCHS/HAMMER32SSE2.tgz

CONFIG/ARCHS/HAMMER64SSE2.tgz

CONFIG/ARCHS/Makefile

INSTALL.txt

Make.top

README

bin/atlas_install.c

bin/atlas_tee.c

bin/ccobj.c

bin/gemmtst.c

bin/gpmmtst.c

bin/invtst.c

bin/l1blastst.c

bin/l2blastst.c

bin/llttst.c

bin/lutst.c

bin/printblk.c

bin/slvtst.c

bin/substr.c

bin/trtritst.c

bin/uumtst.c

doc/AtlasCredits.txt

doc/ChangeLog

doc/DirStruct.txt

doc/INDEX.txt

doc/LibReadme.txt

doc/TestTime.txt

doc/TroubleShoot.txt

doc/Windows.txt

include/atlas_aux.h

include/atlas_enum.h

include/atlas_f77.h

include/atlas_f77wrap.h

include/atlas_kern3.h

include/atlas_kernel2.h

include/atlas_kernel3.h

include/atlas_lapack.h

include/atlas_level1.h

include/atlas_level2.h

include/atlas_level3.h

include/atlas_lvl2.h

include/atlas_lvl3.h

include/atlas_misc.h

include/atlas_mv.h

include/atlas_pkblas.h

include/atlas_prefetch.h

include/atlas_ptlevel3.h

include/atlas_ptlvl3.h

include/atlas_ptmisc.h

include/atlas_r1.h

include/atlas_rblas3.h

include/atlas_reflevel1.h

include/atlas_reflevel2.h

include/atlas_reflevel3.h

include/atlas_reflvl2.h

include/atlas_reflvl3.h

include/atlas_refmisc.h

include/atlas_tst.h

include/clapack.h

include/contrib/Make.ext

include/contrib/SSE3Dnow.h

include/f77wrap_lapack.h

interfaces/blas/C/src/catlas_caxpby.c

interfaces/blas/C/src/catlas_cset.c

interfaces/blas/C/src/catlas_daxpby.c

interfaces/blas/C/src/catlas_dset.c

interfaces/blas/C/src/catlas_saxpby.c

interfaces/blas/C/src/catlas_sset.c

interfaces/blas/C/src/catlas_zaxpby.c

interfaces/blas/C/src/catlas_zset.c

interfaces/blas/C/src/cblas_caxpy.c

interfaces/blas/C/src/cblas_ccopy.c

interfaces/blas/C/src/cblas_cdotc.c

interfaces/blas/C/src/cblas_cdotu.c

interfaces/blas/C/src/cblas_cgbmv.c

interfaces/blas/C/src/cblas_cgemm.c

interfaces/blas/C/src/cblas_cgemv.c

interfaces/blas/C/src/cblas_cgerc.c

interfaces/blas/C/src/cblas_cgeru.c

interfaces/blas/C/src/cblas_chbmv.c

interfaces/blas/C/src/cblas_chemm.c

interfaces/blas/C/src/cblas_chemv.c

interfaces/blas/C/src/cblas_cher.c

interfaces/blas/C/src/cblas_cher2.c

interfaces/blas/C/src/cblas_cher2k.c

interfaces/blas/C/src/cblas_cherk.c

interfaces/blas/C/src/cblas_chpmv.c

interfaces/blas/C/src/cblas_chpr.c

interfaces/blas/C/src/cblas_chpr2.c

interfaces/blas/C/src/cblas_crotg.c

interfaces/blas/C/src/cblas_cscal.c

interfaces/blas/C/src/cblas_csrot.c

interfaces/blas/C/src/cblas_csscal.c

interfaces/blas/C/src/cblas_cswap.c

interfaces/blas/C/src/cblas_csymm.c

interfaces/blas/C/src/cblas_csyr2k.c

interfaces/blas/C/src/cblas_csyrk.c

interfaces/blas/C/src/cblas_ctbmv.c

interfaces/blas/C/src/cblas_ctbsv.c

interfaces/blas/C/src/cblas_ctpmv.c

interfaces/blas/C/src/cblas_ctpsv.c

interfaces/blas/C/src/cblas_ctrmm.c

interfaces/blas/C/src/cblas_ctrmv.c

interfaces/blas/C/src/cblas_ctrsm.c

interfaces/blas/C/src/cblas_ctrsv.c

interfaces/blas/C/src/cblas_dasum.c

interfaces/blas/C/src/cblas_daxpy.c

interfaces/blas/C/src/cblas_dcopy.c

interfaces/blas/C/src/cblas_ddot.c

interfaces/blas/C/src/cblas_dgbmv.c

interfaces/blas/C/src/cblas_dgemm.c

interfaces/blas/C/src/cblas_dgemv.c

interfaces/blas/C/src/cblas_dger.c

interfaces/blas/C/src/cblas_dnrm2.c

interfaces/blas/C/src/cblas_drot.c

interfaces/blas/C/src/cblas_drotg.c

interfaces/blas/C/src/cblas_drotm.c

interfaces/blas/C/src/cblas_drotmg.c

interfaces/blas/C/src/cblas_dsbmv.c

interfaces/blas/C/src/cblas_dscal.c

interfaces/blas/C/src/cblas_dsdot.c

interfaces/blas/C/src/cblas_dspmv.c

interfaces/blas/C/src/cblas_dspr.c

interfaces/blas/C/src/cblas_dspr2.c

interfaces/blas/C/src/cblas_dswap.c

interfaces/blas/C/src/cblas_dsymm.c

interfaces/blas/C/src/cblas_dsymv.c

interfaces/blas/C/src/cblas_dsyr.c

interfaces/blas/C/src/cblas_dsyr2.c

interfaces/blas/C/src/cblas_dsyr2k.c

interfaces/blas/C/src/cblas_dsyrk.c

interfaces/blas/C/src/cblas_dtbmv.c

interfaces/blas/C/src/cblas_dtbsv.c

interfaces/blas/C/src/cblas_dtpmv.c

interfaces/blas/C/src/cblas_dtpsv.c

interfaces/blas/C/src/cblas_dtrmm.c

interfaces/blas/C/src/cblas_dtrmv.c

interfaces/blas/C/src/cblas_dtrsm.c

interfaces/blas/C/src/cblas_dtrsv.c

interfaces/blas/C/src/cblas_dzasum.c

interfaces/blas/C/src/cblas_dznrm2.c

interfaces/blas/C/src/cblas_errprn.c

interfaces/blas/C/src/cblas_icamax.c

interfaces/blas/C/src/cblas_idamax.c

interfaces/blas/C/src/cblas_isamax.c

interfaces/blas/C/src/cblas_izamax.c

interfaces/blas/C/src/cblas_sasum.c

interfaces/blas/C/src/cblas_saxpy.c

interfaces/blas/C/src/cblas_scasum.c

interfaces/blas/C/src/cblas_scnrm2.c

interfaces/blas/C/src/cblas_scopy.c

interfaces/blas/C/src/cblas_sdot.c

interfaces/blas/C/src/cblas_sdsdot.c

interfaces/blas/C/src/cblas_sgbmv.c

interfaces/blas/C/src/cblas_sgemm.c

interfaces/blas/C/src/cblas_sgemv.c

interfaces/blas/C/src/cblas_sger.c

interfaces/blas/C/src/cblas_snrm2.c

interfaces/blas/C/src/cblas_srot.c

interfaces/blas/C/src/cblas_srotg.c

interfaces/blas/C/src/cblas_srotm.c

interfaces/blas/C/src/cblas_srotmg.c

interfaces/blas/C/src/cblas_ssbmv.c

interfaces/blas/C/src/cblas_sscal.c

interfaces/blas/C/src/cblas_sspmv.c

interfaces/blas/C/src/cblas_sspr.c

interfaces/blas/C/src/cblas_sspr2.c

interfaces/blas/C/src/cblas_sswap.c

interfaces/blas/C/src/cblas_ssymm.c

interfaces/blas/C/src/cblas_ssymv.c

interfaces/blas/C/src/cblas_ssyr.c

interfaces/blas/C/src/cblas_ssyr2.c

interfaces/blas/C/src/cblas_ssyr2k.c

interfaces/blas/C/src/cblas_ssyrk.c

interfaces/blas/C/src/cblas_stbmv.c

interfaces/blas/C/src/cblas_stbsv.c

interfaces/blas/C/src/cblas_stpmv.c

interfaces/blas/C/src/cblas_stpsv.c

interfaces/blas/C/src/cblas_strmm.c

interfaces/blas/C/src/cblas_strmv.c

interfaces/blas/C/src/cblas_strsm.c

interfaces/blas/C/src/cblas_strsv.c

interfaces/blas/C/src/cblas_xerbla.c

interfaces/blas/C/src/cblas_zaxpy.c

interfaces/blas/C/src/cblas_zcopy.c

interfaces/blas/C/src/cblas_zdotc.c

interfaces/blas/C/src/cblas_zdotu.c

interfaces/blas/C/src/cblas_zdrot.c

interfaces/blas/C/src/cblas_zdscal.c

interfaces/blas/C/src/cblas_zgbmv.c

interfaces/blas/C/src/cblas_zgemm.c

interfaces/blas/C/src/cblas_zgemv.c

interfaces/blas/C/src/cblas_zgerc.c

interfaces/blas/C/src/cblas_zgeru.c

interfaces/blas/C/src/cblas_zhbmv.c

interfaces/blas/C/src/cblas_zhemm.c

interfaces/blas/C/src/cblas_zhemv.c

interfaces/blas/C/src/cblas_zher.c

interfaces/blas/C/src/cblas_zher2.c

interfaces/blas/C/src/cblas_zher2k.c

interfaces/blas/C/src/cblas_zherk.c

interfaces/blas/C/src/cblas_zhpmv.c

interfaces/blas/C/src/cblas_zhpr.c

interfaces/blas/C/src/cblas_zhpr2.c

interfaces/blas/C/src/cblas_zrotg.c

interfaces/blas/C/src/cblas_zscal.c

interfaces/blas/C/src/cblas_zswap.c

interfaces/blas/C/src/cblas_zsymm.c

interfaces/blas/C/src/cblas_zsyr2k.c

interfaces/blas/C/src/cblas_zsyrk.c

interfaces/blas/C/src/cblas_ztbmv.c

interfaces/blas/C/src/cblas_ztbsv.c

interfaces/blas/C/src/cblas_ztpmv.c

interfaces/blas/C/src/cblas_ztpsv.c

interfaces/blas/C/src/cblas_ztrmm.c

interfaces/blas/C/src/cblas_ztrmv.c

interfaces/blas/C/src/cblas_ztrsm.c

interfaces/blas/C/src/cblas_ztrsv.c

interfaces/blas/C/testing/axpbytst.c

interfaces/blas/C/testing/settst.c

interfaces/blas/F77/src/caxpy.f

interfaces/blas/F77/src/ccopy.f

interfaces/blas/F77/src/cdotc.f

interfaces/blas/F77/src/cdotu.f

interfaces/blas/F77/src/cgbmv.f

interfaces/blas/F77/src/cgemm.f

interfaces/blas/F77/src/cgemv.f

interfaces/blas/F77/src/cgerc.f

interfaces/blas/F77/src/cgeru.f

interfaces/blas/F77/src/chbmv.f

interfaces/blas/F77/src/chemm.f

interfaces/blas/F77/src/chemv.f

interfaces/blas/F77/src/cher.f

interfaces/blas/F77/src/cher2.f

interfaces/blas/F77/src/cher2k.f

interfaces/blas/F77/src/cherk.f

interfaces/blas/F77/src/chpmv.f

interfaces/blas/F77/src/chpr.f

interfaces/blas/F77/src/chpr2.f

interfaces/blas/F77/src/crotg.f

interfaces/blas/F77/src/cscal.f

interfaces/blas/F77/src/csrot.f

interfaces/blas/F77/src/csscal.f

interfaces/blas/F77/src/cswap.f

interfaces/blas/F77/src/csymm.f

interfaces/blas/F77/src/csyr2k.f

interfaces/blas/F77/src/csyrk.f

interfaces/blas/F77/src/ctbmv.f

interfaces/blas/F77/src/ctbsv.f

interfaces/blas/F77/src/ctpmv.f

interfaces/blas/F77/src/ctpsv.f

interfaces/blas/F77/src/ctrmm.f

interfaces/blas/F77/src/ctrmv.f

interfaces/blas/F77/src/ctrsm.f

interfaces/blas/F77/src/ctrsv.f

interfaces/blas/F77/src/dasum.f

interfaces/blas/F77/src/daxpy.f

interfaces/blas/F77/src/dcabs1.f

interfaces/blas/F77/src/dcopy.f

interfaces/blas/F77/src/ddot.f

interfaces/blas/F77/src/dgbmv.f

interfaces/blas/F77/src/dgemm.f

interfaces/blas/F77/src/dgemv.f

interfaces/blas/F77/src/dger.f

interfaces/blas/F77/src/dnrm2.f

interfaces/blas/F77/src/drot.f

interfaces/blas/F77/src/drotg.f

interfaces/blas/F77/src/drotm.f

interfaces/blas/F77/src/drotmg.f

interfaces/blas/F77/src/dsbmv.f

interfaces/blas/F77/src/dscal.f

interfaces/blas/F77/src/dsdot.f

interfaces/blas/F77/src/dspmv.f

interfaces/blas/F77/src/dspr.f

interfaces/blas/F77/src/dspr2.f

interfaces/blas/F77/src/dswap.f

interfaces/blas/F77/src/dsymm.f

interfaces/blas/F77/src/dsymv.f

interfaces/blas/F77/src/dsyr.f

interfaces/blas/F77/src/dsyr2.f

interfaces/blas/F77/src/dsyr2k.f

interfaces/blas/F77/src/dsyrk.f

interfaces/blas/F77/src/dtbmv.f

interfaces/blas/F77/src/dtbsv.f

interfaces/blas/F77/src/dtpmv.f

interfaces/blas/F77/src/dtpsv.f

interfaces/blas/F77/src/dtrmm.f

interfaces/blas/F77/src/dtrmv.f

interfaces/blas/F77/src/dtrsm.f

interfaces/blas/F77/src/dtrsv.f

interfaces/blas/F77/src/dzasum.f

interfaces/blas/F77/src/dznrm2.f

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_amax.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_asum.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_axpy.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_copy.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_dot.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_dotc.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_dotu.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_dsdot.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_gbmv.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_gemm.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_gemv.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_ger.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_gerc.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_geru.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_hbmv.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_hemm.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_hemv.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_her.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_her2.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_her2k.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_herk.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_hpmv.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_hpr.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_hpr2.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_nrm2.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_rot.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_rotg.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_rotm.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_rotmg.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_rscal.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_sbmv.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_scal.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_sdsdot.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_spmv.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_spr.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_spr2.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_swap.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_symm.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_symv.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_syr.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_syr2.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_syr2k.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_syrk.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_tbmv.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_tbsv.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_tpmv.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_tpsv.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_trmm.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_trmv.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_trsm.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_trsv.c

interfaces/blas/F77/src/f77wrap/fatlas_axpby.c

interfaces/blas/F77/src/f77wrap/fatlas_set.c

interfaces/blas/F77/src/icamax.f

interfaces/blas/F77/src/idamax.f

interfaces/blas/F77/src/isamax.f

interfaces/blas/F77/src/izamax.f

interfaces/blas/F77/src/lsame.f

interfaces/blas/F77/src/sasum.f

interfaces/blas/F77/src/saxpy.f

interfaces/blas/F77/src/scasum.f

interfaces/blas/F77/src/scnrm2.f

interfaces/blas/F77/src/scopy.f

interfaces/blas/F77/src/sdot.f

interfaces/blas/F77/src/sdsdot.f

interfaces/blas/F77/src/sgbmv.f

interfaces/blas/F77/src/sgemm.f

interfaces/blas/F77/src/sgemv.f

interfaces/blas/F77/src/sger.f

interfaces/blas/F77/src/snrm2.f

interfaces/blas/F77/src/srot.f

interfaces/blas/F77/src/srotg.f

interfaces/blas/F77/src/srotm.f

interfaces/blas/F77/src/srotmg.f

interfaces/blas/F77/src/ssbmv.f

interfaces/blas/F77/src/sscal.f

interfaces/blas/F77/src/sspmv.f

interfaces/blas/F77/src/sspr.f

interfaces/blas/F77/src/sspr2.f

interfaces/blas/F77/src/sswap.f

interfaces/blas/F77/src/ssymm.f

interfaces/blas/F77/src/ssymv.f

interfaces/blas/F77/src/ssyr.f

interfaces/blas/F77/src/ssyr2.f

interfaces/blas/F77/src/ssyr2k.f

interfaces/blas/F77/src/ssyrk.f

interfaces/blas/F77/src/stbmv.f

interfaces/blas/F77/src/stbsv.f

interfaces/blas/F77/src/stpmv.f

interfaces/blas/F77/src/stpsv.f

interfaces/blas/F77/src/strmm.f

interfaces/blas/F77/src/strmv.f

interfaces/blas/F77/src/strsm.f

interfaces/blas/F77/src/strsv.f

interfaces/blas/F77/src/xerbla.f

interfaces/blas/F77/src/zaxpy.f

interfaces/blas/F77/src/zcopy.f

interfaces/blas/F77/src/zdotc.f

interfaces/blas/F77/src/zdotu.f

interfaces/blas/F77/src/zdrot.f

interfaces/blas/F77/src/zdscal.f

interfaces/blas/F77/src/zgbmv.f

interfaces/blas/F77/src/zgemm.f

interfaces/blas/F77/src/zgemv.f

interfaces/blas/F77/src/zgerc.f

interfaces/blas/F77/src/zgeru.f

interfaces/blas/F77/src/zhbmv.f

interfaces/blas/F77/src/zhemm.f

interfaces/blas/F77/src/zhemv.f

interfaces/blas/F77/src/zher.f

interfaces/blas/F77/src/zher2.f

interfaces/blas/F77/src/zher2k.f

interfaces/blas/F77/src/zherk.f

interfaces/blas/F77/src/zhpmv.f

interfaces/blas/F77/src/zhpr.f

interfaces/blas/F77/src/zhpr2.f

interfaces/blas/F77/src/zrotg.f

interfaces/blas/F77/src/zscal.f

interfaces/blas/F77/src/zswap.f

interfaces/blas/F77/src/zsymm.f

interfaces/blas/F77/src/zsyr2k.f

interfaces/blas/F77/src/zsyrk.f

interfaces/blas/F77/src/ztbmv.f

interfaces/blas/F77/src/ztbsv.f

interfaces/blas/F77/src/ztpmv.f

interfaces/blas/F77/src/ztpsv.f

interfaces/blas/F77/src/ztrmm.f

interfaces/blas/F77/src/ztrmv.f

interfaces/blas/F77/src/ztrsm.f

interfaces/blas/F77/src/ztrsv.f

interfaces/blas/F77/testing/axpbytst.c

interfaces/blas/F77/testing/settst.c

interfaces/lapack/C/src/clapack_cgesv.c

interfaces/lapack/C/src/clapack_cgetrf.c

interfaces/lapack/C/src/clapack_cgetri.c

interfaces/lapack/C/src/clapack_cgetrs.c

interfaces/lapack/C/src/clapack_clauum.c

interfaces/lapack/C/src/clapack_cposv.c

interfaces/lapack/C/src/clapack_cpotrf.c

interfaces/lapack/C/src/clapack_cpotri.c

interfaces/lapack/C/src/clapack_cpotrs.c

interfaces/lapack/C/src/clapack_ctrtri.c

interfaces/lapack/C/src/clapack_dgesv.c

interfaces/lapack/C/src/clapack_dgetrf.c

interfaces/lapack/C/src/clapack_dgetri.c

interfaces/lapack/C/src/clapack_dgetrs.c

interfaces/lapack/C/src/clapack_dlauum.c

interfaces/lapack/C/src/clapack_dposv.c

interfaces/lapack/C/src/clapack_dpotrf.c

interfaces/lapack/C/src/clapack_dpotri.c

interfaces/lapack/C/src/clapack_dpotrs.c

interfaces/lapack/C/src/clapack_dtrtri.c

interfaces/lapack/C/src/clapack_sgesv.c

interfaces/lapack/C/src/clapack_sgetrf.c

interfaces/lapack/C/src/clapack_sgetri.c

interfaces/lapack/C/src/clapack_sgetrs.c

interfaces/lapack/C/src/clapack_slauum.c

interfaces/lapack/C/src/clapack_sposv.c

interfaces/lapack/C/src/clapack_spotrf.c

interfaces/lapack/C/src/clapack_spotri.c

interfaces/lapack/C/src/clapack_spotrs.c

interfaces/lapack/C/src/clapack_strtri.c

interfaces/lapack/C/src/clapack_zgesv.c

interfaces/lapack/C/src/clapack_zgetrf.c

interfaces/lapack/C/src/clapack_zgetri.c

interfaces/lapack/C/src/clapack_zgetrs.c

interfaces/lapack/C/src/clapack_zlauum.c

interfaces/lapack/C/src/clapack_zposv.c

interfaces/lapack/C/src/clapack_zpotrf.c

interfaces/lapack/C/src/clapack_zpotri.c

interfaces/lapack/C/src/clapack_zpotrs.c

interfaces/lapack/C/src/clapack_ztrtri.c

interfaces/lapack/F77/src/f77wrap/ATL_f77wrap_gesv.c

interfaces/lapack/F77/src/f77wrap/ATL_f77wrap_getnb.c

interfaces/lapack/F77/src/f77wrap/ATL_f77wrap_getrf.c

interfaces/lapack/F77/src/f77wrap/ATL_f77wrap_getri.c

interfaces/lapack/F77/src/f77wrap/ATL_f77wrap_getrs.c

interfaces/lapack/F77/src/f77wrap/ATL_f77wrap_lauum.c

interfaces/lapack/F77/src/f77wrap/ATL_f77wrap_posv.c

interfaces/lapack/F77/src/f77wrap/ATL_f77wrap_potrf.c

interfaces/lapack/F77/src/f77wrap/ATL_f77wrap_potri.c

interfaces/lapack/F77/src/f77wrap/ATL_f77wrap_potrs.c

interfaces/lapack/F77/src/f77wrap/ATL_f77wrap_trtri.c

interfaces/lapack/F77/src/ilaenv.f

lib/Make.ext

makes/Make.Clp

makes/Make.Flp

makes/Make.aux

makes/Make.bin

makes/Make.cblas

makes/Make.cblastst

makes/Make.ext

makes/Make.f77blas

makes/Make.f77blastst

makes/Make.gpmm

makes/Make.l1ref

makes/Make.l1src

makes/Make.l1tune

makes/Make.l2

makes/Make.l2aux

makes/Make.l2kern

makes/Make.l2ref

makes/Make.l2src

makes/Make.l3

makes/Make.l3aux

makes/Make.l3kern

makes/Make.l3ptblas

makes/Make.l3ref

makes/Make.l3tune

makes/Make.lib

makes/Make.lpsrc

makes/Make.miptblas

makes/Make.mmsrc

makes/Make.mmtune

makes/Make.mvsrc

makes/Make.mvtune

makes/Make.pkl3

makes/Make.r1src

makes/Make.r1tune

makes/Make.sprk

makes/Make.sysinfo

makes/Make.tstsrc

src/auxil/ATL_axpby.c

src/auxil/ATL_axpy.c

src/auxil/ATL_buildinfo.c

src/auxil/ATL_copy.c

src/auxil/ATL_cplxinvert.c

src/auxil/ATL_flushcache.c

src/auxil/ATL_geadd.c

src/auxil/ATL_gecopy.c

src/auxil/ATL_gemove.c

src/auxil/ATL_gescal.c

src/auxil/ATL_gezero.c

src/auxil/ATL_hescal.c

src/auxil/ATL_lcm.c

src/auxil/ATL_move.c

src/auxil/ATL_ptflushcache.c

src/auxil/ATL_scal.c

src/auxil/ATL_set.c

src/auxil/ATL_trscal.c

src/auxil/ATL_xerbla.c

src/auxil/ATL_zero.c

src/auxil/kernel/ATL_axpby.c

src/auxil/kernel/ATL_axpy_x1_y1.c

src/auxil/kernel/ATL_caxpy_x1_y1.c

src/auxil/kernel/ATL_geadd.c

src/auxil/kernel/ATL_gemove.c

src/auxil/kernel/ATL_gescal.c

src/blas/gemm/ATL_AgemmXX.c

src/blas/gemm/ATL_CNBmm_b0.c

src/blas/gemm/ATL_CNBmm_b1.c

src/blas/gemm/ATL_CNBmm_bX.c

src/blas/gemm/ATL_GetNB.c

src/blas/gemm/ATL_GetNCNB.c

src/blas/gemm/ATL_IBJBmm.c

src/blas/gemm/ATL_IBNBmm.c

src/blas/gemm/ATL_MBJBmm.c

src/blas/gemm/ATL_NCmmIJK.c

src/blas/gemm/ATL_NCmmIJK_c.c

src/blas/gemm/ATL_NCmmJIK.c

src/blas/gemm/ATL_NCmmJIK_c.c

src/blas/gemm/ATL_asrc2blk_NB.c

src/blas/gemm/ATL_cNCmmIJK.c

src/blas/gemm/ATL_cNCmmIJK_c.c

src/blas/gemm/ATL_cNCmmJIK.c

src/blas/gemm/ATL_cNCmmJIK_c.c

src/blas/gemm/ATL_ccol2blk.c

src/blas/gemm/ATL_cmmIJK.c

src/blas/gemm/ATL_cmmJIK.c

src/blas/gemm/ATL_col2blk.c

src/blas/gemm/ATL_crow2blkT.c

src/blas/gemm/ATL_gemm.c

src/blas/gemm/ATL_gemmXX.c

src/blas/gemm/ATL_mmIJK.c

src/blas/gemm/ATL_mmJIK.c

src/blas/gemm/ATL_putblk.c

src/blas/gemm/ATL_row2blkT.c

src/blas/gemm/UMMEXAMPLE/ATLU_usergemm.c

src/blas/gemm/UMMEXAMPLE/Makefile

src/blas/gemv/ATL_gemv.c

src/blas/ger/ATL_ger.c

src/blas/level1/ATL_dsdot.c

src/blas/level1/ATL_rot.c

src/blas/level1/ATL_rotg.c

src/blas/level1/ATL_rotm.c

src/blas/level1/ATL_rotmg.c

src/blas/level1/ATL_sdsdot.c

src/blas/level2/ATL_gbmv.c

src/blas/level2/ATL_gpmv.c

src/blas/level2/ATL_gpr.c

src/blas/level2/ATL_gprc.c

src/blas/level2/ATL_gpru.c

src/blas/level2/ATL_hbmv.c

src/blas/level2/ATL_hemv.c

src/blas/level2/ATL_her.c

src/blas/level2/ATL_her2.c

src/blas/level2/ATL_hpmv.c

src/blas/level2/ATL_hpr.c

src/blas/level2/ATL_hpr2.c

src/blas/level2/ATL_sbmv.c

src/blas/level2/ATL_spmv.c

src/blas/level2/ATL_spr.c

src/blas/level2/ATL_spr2.c

src/blas/level2/ATL_symv.c

src/blas/level2/ATL_syr.c

src/blas/level2/ATL_syr2.c

src/blas/level2/ATL_tbmv.c

src/blas/level2/ATL_tbsv.c

src/blas/level2/ATL_tpmv.c

src/blas/level2/ATL_tpsv.c

src/blas/level2/ATL_trmv.c

src/blas/level2/ATL_trsv.c

src/blas/level2/kernel/ATL_hbmvL.c

src/blas/level2/kernel/ATL_hbmvU.c

src/blas/level2/kernel/ATL_hemvL.c

src/blas/level2/kernel/ATL_hemvU.c

src/blas/level2/kernel/ATL_her2L.c

src/blas/level2/kernel/ATL_her2U.c

src/blas/level2/kernel/ATL_herL.c

src/blas/level2/kernel/ATL_herU.c

src/blas/level2/kernel/ATL_hpmvL.c

src/blas/level2/kernel/ATL_hpmvU.c

src/blas/level2/kernel/ATL_hpr2L.c

src/blas/level2/kernel/ATL_hpr2U.c

src/blas/level2/kernel/ATL_hprL.c

src/blas/level2/kernel/ATL_hprU.c

src/blas/level2/kernel/ATL_sbmvL.c

src/blas/level2/kernel/ATL_sbmvU.c

src/blas/level2/kernel/ATL_spmvL.c

src/blas/level2/kernel/ATL_spmvU.c

src/blas/level2/kernel/ATL_spr2L.c

src/blas/level2/kernel/ATL_spr2U.c

src/blas/level2/kernel/ATL_sprL.c

src/blas/level2/kernel/ATL_sprU.c

src/blas/level2/kernel/ATL_symvL.c

src/blas/level2/kernel/ATL_symvU.c

src/blas/level2/kernel/ATL_syr2L.c

src/blas/level2/kernel/ATL_syr2U.c

src/blas/level2/kernel/ATL_syrL.c

src/blas/level2/kernel/ATL_syrU.c

src/blas/level2/kernel/ATL_tbmvLC.c

src/blas/level2/kernel/ATL_tbmvLCN.c

src/blas/level2/kernel/ATL_tbmvLCU.c

src/blas/level2/kernel/ATL_tbmvLH.c

src/blas/level2/kernel/ATL_tbmvLHN.c

src/blas/level2/kernel/ATL_tbmvLHU.c

src/blas/level2/kernel/ATL_tbmvLN.c

src/blas/level2/kernel/ATL_tbmvLNN.c

src/blas/level2/kernel/ATL_tbmvLNU.c

src/blas/level2/kernel/ATL_tbmvLT.c

src/blas/level2/kernel/ATL_tbmvLTN.c

src/blas/level2/kernel/ATL_tbmvLTU.c

src/blas/level2/kernel/ATL_tbmvUC.c

src/blas/level2/kernel/ATL_tbmvUCN.c

src/blas/level2/kernel/ATL_tbmvUCU.c

src/blas/level2/kernel/ATL_tbmvUH.c

src/blas/level2/kernel/ATL_tbmvUHN.c

src/blas/level2/kernel/ATL_tbmvUHU.c

src/blas/level2/kernel/ATL_tbmvUN.c

src/blas/level2/kernel/ATL_tbmvUNN.c

src/blas/level2/kernel/ATL_tbmvUNU.c

src/blas/level2/kernel/ATL_tbmvUT.c

src/blas/level2/kernel/ATL_tbmvUTN.c

src/blas/level2/kernel/ATL_tbmvUTU.c

src/blas/level2/kernel/ATL_tbsvLC.c

src/blas/level2/kernel/ATL_tbsvLCN.c

src/blas/level2/kernel/ATL_tbsvLCU.c

src/blas/level2/kernel/ATL_tbsvLH.c

src/blas/level2/kernel/ATL_tbsvLHN.c

src/blas/level2/kernel/ATL_tbsvLHU.c

src/blas/level2/kernel/ATL_tbsvLN.c

src/blas/level2/kernel/ATL_tbsvLNN.c

src/blas/level2/kernel/ATL_tbsvLNU.c

src/blas/level2/kernel/ATL_tbsvLT.c

src/blas/level2/kernel/ATL_tbsvLTN.c

src/blas/level2/kernel/ATL_tbsvLTU.c

src/blas/level2/kernel/ATL_tbsvUC.c

src/blas/level2/kernel/ATL_tbsvUCN.c

src/blas/level2/kernel/ATL_tbsvUCU.c

src/blas/level2/kernel/ATL_tbsvUH.c

src/blas/level2/kernel/ATL_tbsvUHN.c

src/blas/level2/kernel/ATL_tbsvUHU.c

src/blas/level2/kernel/ATL_tbsvUN.c

src/blas/level2/kernel/ATL_tbsvUNN.c

src/blas/level2/kernel/ATL_tbsvUNU.c

src/blas/level2/kernel/ATL_tbsvUT.c

src/blas/level2/kernel/ATL_tbsvUTN.c

src/blas/level2/kernel/ATL_tbsvUTU.c

src/blas/level2/kernel/ATL_tpmvLC.c

src/blas/level2/kernel/ATL_tpmvLCN.c

src/blas/level2/kernel/ATL_tpmvLCU.c

src/blas/level2/kernel/ATL_tpmvLH.c

src/blas/level2/kernel/ATL_tpmvLHN.c

src/blas/level2/kernel/ATL_tpmvLHU.c

src/blas/level2/kernel/ATL_tpmvLN.c

src/blas/level2/kernel/ATL_tpmvLNN.c

src/blas/level2/kernel/ATL_tpmvLNU.c

src/blas/level2/kernel/ATL_tpmvLT.c

src/blas/level2/kernel/ATL_tpmvLTN.c

src/blas/level2/kernel/ATL_tpmvLTU.c

src/blas/level2/kernel/ATL_tpmvUC.c

src/blas/level2/kernel/ATL_tpmvUCN.c

src/blas/level2/kernel/ATL_tpmvUCU.c

src/blas/level2/kernel/ATL_tpmvUH.c

src/blas/level2/kernel/ATL_tpmvUHN.c

src/blas/level2/kernel/ATL_tpmvUHU.c

src/blas/level2/kernel/ATL_tpmvUN.c

src/blas/level2/kernel/ATL_tpmvUNN.c

src/blas/level2/kernel/ATL_tpmvUNU.c

src/blas/level2/kernel/ATL_tpmvUT.c

src/blas/level2/kernel/ATL_tpmvUTN.c

src/blas/level2/kernel/ATL_tpmvUTU.c

src/blas/level2/kernel/ATL_tpsvLC.c

src/blas/level2/kernel/ATL_tpsvLCN.c

src/blas/level2/kernel/ATL_tpsvLCU.c

src/blas/level2/kernel/ATL_tpsvLH.c

src/blas/level2/kernel/ATL_tpsvLHN.c

src/blas/level2/kernel/ATL_tpsvLHU.c

src/blas/level2/kernel/ATL_tpsvLN.c

src/blas/level2/kernel/ATL_tpsvLNN.c

src/blas/level2/kernel/ATL_tpsvLNU.c

src/blas/level2/kernel/ATL_tpsvLT.c

src/blas/level2/kernel/ATL_tpsvLTN.c

src/blas/level2/kernel/ATL_tpsvLTU.c

src/blas/level2/kernel/ATL_tpsvUC.c

src/blas/level2/kernel/ATL_tpsvUCN.c

src/blas/level2/kernel/ATL_tpsvUCU.c

src/blas/level2/kernel/ATL_tpsvUH.c

src/blas/level2/kernel/ATL_tpsvUHN.c

src/blas/level2/kernel/ATL_tpsvUHU.c

src/blas/level2/kernel/ATL_tpsvUN.c

src/blas/level2/kernel/ATL_tpsvUNN.c

src/blas/level2/kernel/ATL_tpsvUNU.c

src/blas/level2/kernel/ATL_tpsvUT.c

src/blas/level2/kernel/ATL_tpsvUTN.c

src/blas/level2/kernel/ATL_tpsvUTU.c

src/blas/level2/kernel/ATL_trmvLC.c

src/blas/level2/kernel/ATL_trmvLCN.c

src/blas/level2/kernel/ATL_trmvLCU.c

src/blas/level2/kernel/ATL_trmvLH.c

src/blas/level2/kernel/ATL_trmvLHN.c

src/blas/level2/kernel/ATL_trmvLHU.c

src/blas/level2/kernel/ATL_trmvLN.c

src/blas/level2/kernel/ATL_trmvLNN.c

src/blas/level2/kernel/ATL_trmvLNU.c

src/blas/level2/kernel/ATL_trmvLT.c

src/blas/level2/kernel/ATL_trmvLTN.c

src/blas/level2/kernel/ATL_trmvLTU.c

src/blas/level2/kernel/ATL_trmvUC.c

src/blas/level2/kernel/ATL_trmvUCN.c

src/blas/level2/kernel/ATL_trmvUCU.c

src/blas/level2/kernel/ATL_trmvUH.c

src/blas/level2/kernel/ATL_trmvUHN.c

src/blas/level2/kernel/ATL_trmvUHU.c

src/blas/level2/kernel/ATL_trmvUN.c

src/blas/level2/kernel/ATL_trmvUNN.c

src/blas/level2/kernel/ATL_trmvUNU.c

src/blas/level2/kernel/ATL_trmvUT.c

src/blas/level2/kernel/ATL_trmvUTN.c

src/blas/level2/kernel/ATL_trmvUTU.c

src/blas/level2/kernel/ATL_trsvLC.c

src/blas/level2/kernel/ATL_trsvLCN.c

src/blas/level2/kernel/ATL_trsvLCU.c

src/blas/level2/kernel/ATL_trsvLH.c

src/blas/level2/kernel/ATL_trsvLHN.c

src/blas/level2/kernel/ATL_trsvLHU.c

src/blas/level2/kernel/ATL_trsvLN.c

src/blas/level2/kernel/ATL_trsvLNN.c

src/blas/level2/kernel/ATL_trsvLNU.c

src/blas/level2/kernel/ATL_trsvLT.c

src/blas/level2/kernel/ATL_trsvLTN.c

src/blas/level2/kernel/ATL_trsvLTU.c

src/blas/level2/kernel/ATL_trsvUC.c

src/blas/level2/kernel/ATL_trsvUCN.c

src/blas/level2/kernel/ATL_trsvUCU.c

src/blas/level2/kernel/ATL_trsvUH.c

src/blas/level2/kernel/ATL_trsvUHN.c

src/blas/level2/kernel/ATL_trsvUHU.c

src/blas/level2/kernel/ATL_trsvUN.c

src/blas/level2/kernel/ATL_trsvUNN.c

src/blas/level2/kernel/ATL_trsvUNU.c

src/blas/level2/kernel/ATL_trsvUT.c

src/blas/level2/kernel/ATL_trsvUTN.c

src/blas/level2/kernel/ATL_trsvUTU.c

src/blas/level3/ATL_hemm.c

src/blas/level3/ATL_her2k.c

src/blas/level3/ATL_herk.c

src/blas/level3/ATL_symm.c

src/blas/level3/ATL_syr2k.c

src/blas/level3/ATL_syrk.c

src/blas/level3/ATL_trmm.c

src/blas/level3/ATL_trsm.c

src/blas/level3/kernel/ATL_CtrsmK.c

src/blas/level3/kernel/ATL_hemmL.c

src/blas/level3/kernel/ATL_hemmR.c

src/blas/level3/kernel/ATL_her2k.c

src/blas/level3/kernel/ATL_herk_N.c

src/blas/level3/kernel/ATL_herk_T.c

src/blas/level3/kernel/ATL_sycopyL.c

src/blas/level3/kernel/ATL_sycopyU.c

src/blas/level3/kernel/ATL_symmL.c

src/blas/level3/kernel/ATL_symmR.c

src/blas/level3/kernel/ATL_syr2k_N.c

src/blas/level3/kernel/ATL_syr2k_T.c

src/blas/level3/kernel/ATL_syr2k_putL.c

src/blas/level3/kernel/ATL_syr2k_putU.c

src/blas/level3/kernel/ATL_syrk_N.c

src/blas/level3/kernel/ATL_syrk_T.c

src/blas/level3/kernel/ATL_trcopyL2L.c

src/blas/level3/kernel/ATL_trcopyL2U.c

src/blas/level3/kernel/ATL_trcopyU2L.c

src/blas/level3/kernel/ATL_trcopyU2U.c

src/blas/level3/kernel/ATL_trinvert.c

src/blas/level3/kernel/ATL_trmmL.c

src/blas/level3/kernel/ATL_trmmR.c

src/blas/level3/kernel/ATL_trmv_scal.c

src/blas/level3/kernel/ATL_trputL.c

src/blas/level3/kernel/ATL_trputU.c

src/blas/level3/kernel/ATL_trsmKL.c

src/blas/level3/kernel/ATL_trsmKR.c

src/blas/level3/kernel/ATL_trsmL.c

src/blas/level3/kernel/ATL_trsmR.c

src/blas/level3/rblas/ATL_gemmRB.c

src/blas/level3/rblas/ATL_rhemmLL.c

src/blas/level3/rblas/ATL_rhemmLU.c

src/blas/level3/rblas/ATL_rhemmRL.c

src/blas/level3/rblas/ATL_rhemmRU.c

src/blas/level3/rblas/ATL_rher2kLC.c

src/blas/level3/rblas/ATL_rher2kLN.c

src/blas/level3/rblas/ATL_rher2kUC.c

src/blas/level3/rblas/ATL_rher2kUN.c

src/blas/level3/rblas/ATL_rherkLC.c

src/blas/level3/rblas/ATL_rherkLN.c

src/blas/level3/rblas/ATL_rherkUC.c

src/blas/level3/rblas/ATL_rherkUN.c

src/blas/level3/rblas/ATL_rsymmLL.c

src/blas/level3/rblas/ATL_rsymmLU.c

src/blas/level3/rblas/ATL_rsymmRL.c

src/blas/level3/rblas/ATL_rsymmRU.c

src/blas/level3/rblas/ATL_rsyr2kLN.c

src/blas/level3/rblas/ATL_rsyr2kLT.c

src/blas/level3/rblas/ATL_rsyr2kUN.c

src/blas/level3/rblas/ATL_rsyr2kUT.c

src/blas/level3/rblas/ATL_rsyrkLN.c

src/blas/level3/rblas/ATL_rsyrkLT.c

src/blas/level3/rblas/ATL_rsyrkUN.c

src/blas/level3/rblas/ATL_rsyrkUT.c

src/blas/level3/rblas/ATL_rtrmmLLC.c

src/blas/level3/rblas/ATL_rtrmmLLN.c

src/blas/level3/rblas/ATL_rtrmmLLT.c

src/blas/level3/rblas/ATL_rtrmmLUC.c

src/blas/level3/rblas/ATL_rtrmmLUN.c

src/blas/level3/rblas/ATL_rtrmmLUT.c

src/blas/level3/rblas/ATL_rtrmmRLC.c

src/blas/level3/rblas/ATL_rtrmmRLN.c

src/blas/level3/rblas/ATL_rtrmmRLT.c

src/blas/level3/rblas/ATL_rtrmmRUC.c

src/blas/level3/rblas/ATL_rtrmmRUN.c

src/blas/level3/rblas/ATL_rtrmmRUT.c

src/blas/level3/rblas/ATL_rtrsmLLC.c

src/blas/level3/rblas/ATL_rtrsmLLN.c

src/blas/level3/rblas/ATL_rtrsmLLT.c

src/blas/level3/rblas/ATL_rtrsmLUC.c

src/blas/level3/rblas/ATL_rtrsmLUN.c

src/blas/level3/rblas/ATL_rtrsmLUT.c

src/blas/level3/rblas/ATL_rtrsmRLC.c

src/blas/level3/rblas/ATL_rtrsmRLN.c

src/blas/level3/rblas/ATL_rtrsmRLT.c

src/blas/level3/rblas/ATL_rtrsmRUC.c

src/blas/level3/rblas/ATL_rtrsmRUN.c

src/blas/level3/rblas/ATL_rtrsmRUT.c

src/blas/pklevel3/gpmm/ATL_cpcol2blk.c

src/blas/pklevel3/gpmm/ATL_cpmmJIK.c

src/blas/pklevel3/gpmm/ATL_cpputblk.c

src/blas/pklevel3/gpmm/ATL_cprow2blkT.c

src/blas/pklevel3/gpmm/ATL_gpmm.c

src/blas/pklevel3/gpmm/ATL_pcol2blk.c

src/blas/pklevel3/gpmm/ATL_pmmJIK.c

src/blas/pklevel3/gpmm/ATL_pputblk.c

src/blas/pklevel3/gpmm/ATL_prankK.c

src/blas/pklevel3/gpmm/ATL_prow2blkT.c

src/blas/pklevel3/sprk/ATL_cpputblk_aX.c

src/blas/pklevel3/sprk/ATL_cprk_kmm.c

src/blas/pklevel3/sprk/ATL_hprk.c

src/blas/pklevel3/sprk/ATL_hprk_rK.c

src/blas/pklevel3/sprk/ATL_phk_kmm.c

src/blas/pklevel3/sprk/ATL_pputblk_aX.c

src/blas/pklevel3/sprk/ATL_prk_kmm.c

src/blas/pklevel3/sprk/ATL_sprk.c

src/blas/pklevel3/sprk/ATL_sprk_rK.c

src/blas/reference/level1/ATL_crefaxpy.c

src/blas/reference/level1/ATL_crefcopy.c

src/blas/reference/level1/ATL_crefdotc_sub.c

src/blas/reference/level1/ATL_crefdotu_sub.c

src/blas/reference/level1/ATL_crefrotg.c

src/blas/reference/level1/ATL_crefscal.c

src/blas/reference/level1/ATL_crefswap.c

src/blas/reference/level1/ATL_csrefrot.c

src/blas/reference/level1/ATL_csrefscal.c

src/blas/reference/level1/ATL_drefasum.c

src/blas/reference/level1/ATL_drefaxpy.c

src/blas/reference/level1/ATL_drefcopy.c

src/blas/reference/level1/ATL_drefdot.c

src/blas/reference/level1/ATL_drefnrm2.c

src/blas/reference/level1/ATL_drefrot.c

src/blas/reference/level1/ATL_drefrotg.c

src/blas/reference/level1/ATL_drefrotm.c

src/blas/reference/level1/ATL_drefrotmg.c

src/blas/reference/level1/ATL_drefscal.c

src/blas/reference/level1/ATL_drefswap.c

src/blas/reference/level1/ATL_dsrefdot.c

src/blas/reference/level1/ATL_dzrefasum.c

src/blas/reference/level1/ATL_dzrefnrm2.c

src/blas/reference/level1/ATL_icrefamax.c

src/blas/reference/level1/ATL_idrefamax.c

src/blas/reference/level1/ATL_isrefamax.c

src/blas/reference/level1/ATL_izrefamax.c

src/blas/reference/level1/ATL_screfasum.c

src/blas/reference/level1/ATL_screfnrm2.c

src/blas/reference/level1/ATL_sdsrefdot.c

src/blas/reference/level1/ATL_srefasum.c

src/blas/reference/level1/ATL_srefaxpy.c

src/blas/reference/level1/ATL_srefcopy.c

src/blas/reference/level1/ATL_srefdot.c

src/blas/reference/level1/ATL_srefnrm2.c

src/blas/reference/level1/ATL_srefrot.c

src/blas/reference/level1/ATL_srefrotg.c

src/blas/reference/level1/ATL_srefrotm.c

src/blas/reference/level1/ATL_srefrotmg.c

src/blas/reference/level1/ATL_srefscal.c

src/blas/reference/level1/ATL_srefswap.c

src/blas/reference/level1/ATL_zdrefrot.c

src/blas/reference/level1/ATL_zdrefscal.c

src/blas/reference/level1/ATL_zrefaxpy.c

src/blas/reference/level1/ATL_zrefcopy.c

src/blas/reference/level1/ATL_zrefdotc_sub.c

src/blas/reference/level1/ATL_zrefdotu_sub.c

src/blas/reference/level1/ATL_zrefrotg.c

src/blas/reference/level1/ATL_zrefscal.c

src/blas/reference/level1/ATL_zrefswap.c

src/blas/reference/level2/ATL_crefgbmv.c

src/blas/reference/level2/ATL_crefgbmvC.c

src/blas/reference/level2/ATL_crefgbmvH.c

src/blas/reference/level2/ATL_crefgbmvN.c

src/blas/reference/level2/ATL_crefgbmvT.c

src/blas/reference/level2/ATL_crefgemv.c

src/blas/reference/level2/ATL_crefgemvC.c

src/blas/reference/level2/ATL_crefgemvH.c

src/blas/reference/level2/ATL_crefgemvN.c

src/blas/reference/level2/ATL_crefgemvT.c

src/blas/reference/level2/ATL_crefgerc.c

src/blas/reference/level2/ATL_crefgeru.c

src/blas/reference/level2/ATL_crefgpmv.c

src/blas/reference/level2/ATL_crefgpmvLC.c

src/blas/reference/level2/ATL_crefgpmvLH.c

src/blas/reference/level2/ATL_crefgpmvLN.c

src/blas/reference/level2/ATL_crefgpmvLT.c

src/blas/reference/level2/ATL_crefgpmvUC.c

src/blas/reference/level2/ATL_crefgpmvUH.c

src/blas/reference/level2/ATL_crefgpmvUN.c

src/blas/reference/level2/ATL_crefgpmvUT.c

src/blas/reference/level2/ATL_crefgprc.c

src/blas/reference/level2/ATL_crefgpru.c

src/blas/reference/level2/ATL_crefhbmv.c

src/blas/reference/level2/ATL_crefhbmvL.c

src/blas/reference/level2/ATL_crefhbmvU.c

src/blas/reference/level2/ATL_crefhemv.c

src/blas/reference/level2/ATL_crefhemvL.c

src/blas/reference/level2/ATL_crefhemvU.c

src/blas/reference/level2/ATL_crefher.c

src/blas/reference/level2/ATL_crefher2.c

src/blas/reference/level2/ATL_crefher2L.c

src/blas/reference/level2/ATL_crefher2U.c

src/blas/reference/level2/ATL_crefherL.c

src/blas/reference/level2/ATL_crefherU.c

src/blas/reference/level2/ATL_crefhpmv.c

src/blas/reference/level2/ATL_crefhpmvL.c

src/blas/reference/level2/ATL_crefhpmvU.c

src/blas/reference/level2/ATL_crefhpr.c

src/blas/reference/level2/ATL_crefhpr2.c

src/blas/reference/level2/ATL_crefhpr2L.c

src/blas/reference/level2/ATL_crefhpr2U.c

src/blas/reference/level2/ATL_crefhprL.c

src/blas/reference/level2/ATL_crefhprU.c

src/blas/reference/level2/ATL_creftbmv.c

src/blas/reference/level2/ATL_creftbmvLCN.c

src/blas/reference/level2/ATL_creftbmvLCU.c

src/blas/reference/level2/ATL_creftbmvLHN.c

src/blas/reference/level2/ATL_creftbmvLHU.c

src/blas/reference/level2/ATL_creftbmvLNN.c

src/blas/reference/level2/ATL_creftbmvLNU.c

src/blas/reference/level2/ATL_creftbmvLTN.c

src/blas/reference/level2/ATL_creftbmvLTU.c

src/blas/reference/level2/ATL_creftbmvUCN.c

src/blas/reference/level2/ATL_creftbmvUCU.c

src/blas/reference/level2/ATL_creftbmvUHN.c

src/blas/reference/level2/ATL_creftbmvUHU.c

src/blas/reference/level2/ATL_creftbmvUNN.c

src/blas/reference/level2/ATL_creftbmvUNU.c

src/blas/reference/level2/ATL_creftbmvUTN.c

src/blas/reference/level2/ATL_creftbmvUTU.c

src/blas/reference/level2/ATL_creftbsv.c

src/blas/reference/level2/ATL_creftbsvLCN.c

src/blas/reference/level2/ATL_creftbsvLCU.c

src/blas/reference/level2/ATL_creftbsvLHN.c

src/blas/reference/level2/ATL_creftbsvLHU.c

src/blas/reference/level2/ATL_creftbsvLNN.c

src/blas/reference/level2/ATL_creftbsvLNU.c

src/blas/reference/level2/ATL_creftbsvLTN.c

src/blas/reference/level2/ATL_creftbsvLTU.c

src/blas/reference/level2/ATL_creftbsvUCN.c

src/blas/reference/level2/ATL_creftbsvUCU.c

src/blas/reference/level2/ATL_creftbsvUHN.c

src/blas/reference/level2/ATL_creftbsvUHU.c

src/blas/reference/level2/ATL_creftbsvUNN.c

src/blas/reference/level2/ATL_creftbsvUNU.c

src/blas/reference/level2/ATL_creftbsvUTN.c

src/blas/reference/level2/ATL_creftbsvUTU.c

src/blas/reference/level2/ATL_creftpmv.c

src/blas/reference/level2/ATL_creftpmvLCN.c

src/blas/reference/level2/ATL_creftpmvLCU.c

src/blas/reference/level2/ATL_creftpmvLHN.c

src/blas/reference/level2/ATL_creftpmvLHU.c

src/blas/reference/level2/ATL_creftpmvLNN.c

src/blas/reference/level2/ATL_creftpmvLNU.c

src/blas/reference/level2/ATL_creftpmvLTN.c

src/blas/reference/level2/ATL_creftpmvLTU.c

src/blas/reference/level2/ATL_creftpmvUCN.c

src/blas/reference/level2/ATL_creftpmvUCU.c

src/blas/reference/level2/ATL_creftpmvUHN.c

src/blas/reference/level2/ATL_creftpmvUHU.c

src/blas/reference/level2/ATL_creftpmvUNN.c

src/blas/reference/level2/ATL_creftpmvUNU.c

src/blas/reference/level2/ATL_creftpmvUTN.c

src/blas/reference/level2/ATL_creftpmvUTU.c

src/blas/reference/level2/ATL_creftpsv.c

src/blas/reference/level2/ATL_creftpsvLCN.c

src/blas/reference/level2/ATL_creftpsvLCU.c

src/blas/reference/level2/ATL_creftpsvLHN.c

src/blas/reference/level2/ATL_creftpsvLHU.c

src/blas/reference/level2/ATL_creftpsvLNN.c

src/blas/reference/level2/ATL_creftpsvLNU.c

src/blas/reference/level2/ATL_creftpsvLTN.c

src/blas/reference/level2/ATL_creftpsvLTU.c

src/blas/reference/level2/ATL_creftpsvUCN.c

src/blas/reference/level2/ATL_creftpsvUCU.c

src/blas/reference/level2/ATL_creftpsvUHN.c

src/blas/reference/level2/ATL_creftpsvUHU.c

src/blas/reference/level2/ATL_creftpsvUNN.c

src/blas/reference/level2/ATL_creftpsvUNU.c

src/blas/reference/level2/ATL_creftpsvUTN.c

src/blas/reference/level2/ATL_creftpsvUTU.c

src/blas/reference/level2/ATL_creftrmv.c

src/blas/reference/level2/ATL_creftrmvLCN.c

src/blas/reference/level2/ATL_creftrmvLCU.c

src/blas/reference/level2/ATL_creftrmvLHN.c

src/blas/reference/level2/ATL_creftrmvLHU.c

src/blas/reference/level2/ATL_creftrmvLNN.c

src/blas/reference/level2/ATL_creftrmvLNU.c

src/blas/reference/level2/ATL_creftrmvLTN.c

src/blas/reference/level2/ATL_creftrmvLTU.c

src/blas/reference/level2/ATL_creftrmvUCN.c

src/blas/reference/level2/ATL_creftrmvUCU.c

src/blas/reference/level2/ATL_creftrmvUHN.c

src/blas/reference/level2/ATL_creftrmvUHU.c

src/blas/reference/level2/ATL_creftrmvUNN.c

src/blas/reference/level2/ATL_creftrmvUNU.c

src/blas/reference/level2/ATL_creftrmvUTN.c

src/blas/reference/level2/ATL_creftrmvUTU.c

src/blas/reference/level2/ATL_creftrsv.c

src/blas/reference/level2/ATL_creftrsvLCN.c

src/blas/reference/level2/ATL_creftrsvLCU.c

src/blas/reference/level2/ATL_creftrsvLHN.c

src/blas/reference/level2/ATL_creftrsvLHU.c

src/blas/reference/level2/ATL_creftrsvLNN.c

src/blas/reference/level2/ATL_creftrsvLNU.c

src/blas/reference/level2/ATL_creftrsvLTN.c

src/blas/reference/level2/ATL_creftrsvLTU.c

src/blas/reference/level2/ATL_creftrsvUCN.c

src/blas/reference/level2/ATL_creftrsvUCU.c

src/blas/reference/level2/ATL_creftrsvUHN.c

src/blas/reference/level2/ATL_creftrsvUHU.c

src/blas/reference/level2/ATL_creftrsvUNN.c

src/blas/reference/level2/ATL_creftrsvUNU.c

src/blas/reference/level2/ATL_creftrsvUTN.c

src/blas/reference/level2/ATL_creftrsvUTU.c

src/blas/reference/level2/ATL_drefgbmv.c

src/blas/reference/level2/ATL_drefgbmvN.c

src/blas/reference/level2/ATL_drefgbmvT.c

src/blas/reference/level2/ATL_drefgemv.c

src/blas/reference/level2/ATL_drefgemvN.c

src/blas/reference/level2/ATL_drefgemvT.c

src/blas/reference/level2/ATL_drefger.c

src/blas/reference/level2/ATL_drefgpmv.c

src/blas/reference/level2/ATL_drefgpmvLN.c

src/blas/reference/level2/ATL_drefgpmvLT.c

src/blas/reference/level2/ATL_drefgpmvUN.c

src/blas/reference/level2/ATL_drefgpmvUT.c

src/blas/reference/level2/ATL_drefgpr.c

src/blas/reference/level2/ATL_drefsbmv.c

src/blas/reference/level2/ATL_drefsbmvL.c

src/blas/reference/level2/ATL_drefsbmvU.c

src/blas/reference/level2/ATL_drefspmv.c

src/blas/reference/level2/ATL_drefspmvL.c

src/blas/reference/level2/ATL_drefspmvU.c

src/blas/reference/level2/ATL_drefspr.c

src/blas/reference/level2/ATL_drefspr2.c

src/blas/reference/level2/ATL_drefspr2L.c

src/blas/reference/level2/ATL_drefspr2U.c

src/blas/reference/level2/ATL_drefsprL.c

src/blas/reference/level2/ATL_drefsprU.c

src/blas/reference/level2/ATL_drefsymv.c

src/blas/reference/level2/ATL_drefsymvL.c

src/blas/reference/level2/ATL_drefsymvU.c

src/blas/reference/level2/ATL_drefsyr.c

src/blas/reference/level2/ATL_drefsyr2.c

src/blas/reference/level2/ATL_drefsyr2L.c

src/blas/reference/level2/ATL_drefsyr2U.c

src/blas/reference/level2/ATL_drefsyrL.c

src/blas/reference/level2/ATL_drefsyrU.c

src/blas/reference/level2/ATL_dreftbmv.c

src/blas/reference/level2/ATL_dreftbmvLNN.c

src/blas/reference/level2/ATL_dreftbmvLNU.c

src/blas/reference/level2/ATL_dreftbmvLTN.c

src/blas/reference/level2/ATL_dreftbmvLTU.c

src/blas/reference/level2/ATL_dreftbmvUNN.c

src/blas/reference/level2/ATL_dreftbmvUNU.c

src/blas/reference/level2/ATL_dreftbmvUTN.c

src/blas/reference/level2/ATL_dreftbmvUTU.c

src/blas/reference/level2/ATL_dreftbsv.c

src/blas/reference/level2/ATL_dreftbsvLNN.c

src/blas/reference/level2/ATL_dreftbsvLNU.c

src/blas/reference/level2/ATL_dreftbsvLTN.c

src/blas/reference/level2/ATL_dreftbsvLTU.c

src/blas/reference/level2/ATL_dreftbsvUNN.c

src/blas/reference/level2/ATL_dreftbsvUNU.c

src/blas/reference/level2/ATL_dreftbsvUTN.c

src/blas/reference/level2/ATL_dreftbsvUTU.c

src/blas/reference/level2/ATL_dreftpmv.c

src/blas/reference/level2/ATL_dreftpmvLNN.c

src/blas/reference/level2/ATL_dreftpmvLNU.c

src/blas/reference/level2/ATL_dreftpmvLTN.c

src/blas/reference/level2/ATL_dreftpmvLTU.c

src/blas/reference/level2/ATL_dreftpmvUNN.c

src/blas/reference/level2/ATL_dreftpmvUNU.c

src/blas/reference/level2/ATL_dreftpmvUTN.c

src/blas/reference/level2/ATL_dreftpmvUTU.c

src/blas/reference/level2/ATL_dreftpsv.c

src/blas/reference/level2/ATL_dreftpsvLNN.c

src/blas/reference/level2/ATL_dreftpsvLNU.c

src/blas/reference/level2/ATL_dreftpsvLTN.c

src/blas/reference/level2/ATL_dreftpsvLTU.c

src/blas/reference/level2/ATL_dreftpsvUNN.c

src/blas/reference/level2/ATL_dreftpsvUNU.c

src/blas/reference/level2/ATL_dreftpsvUTN.c

src/blas/reference/level2/ATL_dreftpsvUTU.c

src/blas/reference/level2/ATL_dreftrmv.c

src/blas/reference/level2/ATL_dreftrmvLNN.c

src/blas/reference/level2/ATL_dreftrmvLNU.c

src/blas/reference/level2/ATL_dreftrmvLTN.c

src/blas/reference/level2/ATL_dreftrmvLTU.c

src/blas/reference/level2/ATL_dreftrmvUNN.c

src/blas/reference/level2/ATL_dreftrmvUNU.c

src/blas/reference/level2/ATL_dreftrmvUTN.c

src/blas/reference/level2/ATL_dreftrmvUTU.c

src/blas/reference/level2/ATL_dreftrsv.c

src/blas/reference/level2/ATL_dreftrsvLNN.c

src/blas/reference/level2/ATL_dreftrsvLNU.c

src/blas/reference/level2/ATL_dreftrsvLTN.c

src/blas/reference/level2/ATL_dreftrsvLTU.c

src/blas/reference/level2/ATL_dreftrsvUNN.c

src/blas/reference/level2/ATL_dreftrsvUNU.c

src/blas/reference/level2/ATL_dreftrsvUTN.c

src/blas/reference/level2/ATL_dreftrsvUTU.c

src/blas/reference/level2/ATL_srefgbmv.c

src/blas/reference/level2/ATL_srefgbmvN.c

src/blas/reference/level2/ATL_srefgbmvT.c

src/blas/reference/level2/ATL_srefgemv.c

src/blas/reference/level2/ATL_srefgemvN.c

src/blas/reference/level2/ATL_srefgemvT.c

src/blas/reference/level2/ATL_srefger.c

src/blas/reference/level2/ATL_srefgpmv.c

src/blas/reference/level2/ATL_srefgpmvLN.c

src/blas/reference/level2/ATL_srefgpmvLT.c

src/blas/reference/level2/ATL_srefgpmvUN.c

src/blas/reference/level2/ATL_srefgpmvUT.c

src/blas/reference/level2/ATL_srefgpr.c

src/blas/reference/level2/ATL_srefsbmv.c

src/blas/reference/level2/ATL_srefsbmvL.c

src/blas/reference/level2/ATL_srefsbmvU.c

src/blas/reference/level2/ATL_srefspmv.c

src/blas/reference/level2/ATL_srefspmvL.c

src/blas/reference/level2/ATL_srefspmvU.c

src/blas/reference/level2/ATL_srefspr.c

src/blas/reference/level2/ATL_srefspr2.c

src/blas/reference/level2/ATL_srefspr2L.c

src/blas/reference/level2/ATL_srefspr2U.c

src/blas/reference/level2/ATL_srefsprL.c

src/blas/reference/level2/ATL_srefsprU.c

src/blas/reference/level2/ATL_srefsymv.c

src/blas/reference/level2/ATL_srefsymvL.c

src/blas/reference/level2/ATL_srefsymvU.c

src/blas/reference/level2/ATL_srefsyr.c

src/blas/reference/level2/ATL_srefsyr2.c

src/blas/reference/level2/ATL_srefsyr2L.c

src/blas/reference/level2/ATL_srefsyr2U.c

src/blas/reference/level2/ATL_srefsyrL.c

src/blas/reference/level2/ATL_srefsyrU.c

src/blas/reference/level2/ATL_sreftbmv.c

src/blas/reference/level2/ATL_sreftbmvLNN.c

src/blas/reference/level2/ATL_sreftbmvLNU.c

src/blas/reference/level2/ATL_sreftbmvLTN.c

src/blas/reference/level2/ATL_sreftbmvLTU.c

src/blas/reference/level2/ATL_sreftbmvUNN.c

src/blas/reference/level2/ATL_sreftbmvUNU.c

src/blas/reference/level2/ATL_sreftbmvUTN.c

src/blas/reference/level2/ATL_sreftbmvUTU.c

src/blas/reference/level2/ATL_sreftbsv.c

src/blas/reference/level2/ATL_sreftbsvLNN.c

src/blas/reference/level2/ATL_sreftbsvLNU.c

src/blas/reference/level2/ATL_sreftbsvLTN.c

src/blas/reference/level2/ATL_sreftbsvLTU.c

src/blas/reference/level2/ATL_sreftbsvUNN.c

src/blas/reference/level2/ATL_sreftbsvUNU.c

src/blas/reference/level2/ATL_sreftbsvUTN.c

src/blas/reference/level2/ATL_sreftbsvUTU.c

src/blas/reference/level2/ATL_sreftpmv.c

src/blas/reference/level2/ATL_sreftpmvLNN.c

src/blas/reference/level2/ATL_sreftpmvLNU.c

src/blas/reference/level2/ATL_sreftpmvLTN.c

src/blas/reference/level2/ATL_sreftpmvLTU.c

src/blas/reference/level2/ATL_sreftpmvUNN.c

src/blas/reference/level2/ATL_sreftpmvUNU.c

src/blas/reference/level2/ATL_sreftpmvUTN.c

src/blas/reference/level2/ATL_sreftpmvUTU.c

src/blas/reference/level2/ATL_sreftpsv.c

src/blas/reference/level2/ATL_sreftpsvLNN.c

src/blas/reference/level2/ATL_sreftpsvLNU.c

src/blas/reference/level2/ATL_sreftpsvLTN.c

src/blas/reference/level2/ATL_sreftpsvLTU.c

src/blas/reference/level2/ATL_sreftpsvUNN.c

src/blas/reference/level2/ATL_sreftpsvUNU.c

src/blas/reference/level2/ATL_sreftpsvUTN.c

src/blas/reference/level2/ATL_sreftpsvUTU.c

src/blas/reference/level2/ATL_sreftrmv.c

src/blas/reference/level2/ATL_sreftrmvLNN.c

src/blas/reference/level2/ATL_sreftrmvLNU.c

src/blas/reference/level2/ATL_sreftrmvLTN.c

src/blas/reference/level2/ATL_sreftrmvLTU.c

src/blas/reference/level2/ATL_sreftrmvUNN.c

src/blas/reference/level2/ATL_sreftrmvUNU.c

src/blas/reference/level2/ATL_sreftrmvUTN.c

src/blas/reference/level2/ATL_sreftrmvUTU.c

src/blas/reference/level2/ATL_sreftrsv.c

src/blas/reference/level2/ATL_sreftrsvLNN.c

src/blas/reference/level2/ATL_sreftrsvLNU.c

src/blas/reference/level2/ATL_sreftrsvLTN.c

src/blas/reference/level2/ATL_sreftrsvLTU.c

src/blas/reference/level2/ATL_sreftrsvUNN.c

src/blas/reference/level2/ATL_sreftrsvUNU.c

src/blas/reference/level2/ATL_sreftrsvUTN.c

src/blas/reference/level2/ATL_sreftrsvUTU.c

src/blas/reference/level2/ATL_zrefgbmv.c

src/blas/reference/level2/ATL_zrefgbmvC.c

src/blas/reference/level2/ATL_zrefgbmvH.c

src/blas/reference/level2/ATL_zrefgbmvN.c

src/blas/reference/level2/ATL_zrefgbmvT.c

src/blas/reference/level2/ATL_zrefgemv.c

src/blas/reference/level2/ATL_zrefgemvC.c

src/blas/reference/level2/ATL_zrefgemvH.c

src/blas/reference/level2/ATL_zrefgemvN.c

src/blas/reference/level2/ATL_zrefgemvT.c

src/blas/reference/level2/ATL_zrefgerc.c

src/blas/reference/level2/ATL_zrefgeru.c

src/blas/reference/level2/ATL_zrefgpmv.c

src/blas/reference/level2/ATL_zrefgpmvLC.c

src/blas/reference/level2/ATL_zrefgpmvLH.c

src/blas/reference/level2/ATL_zrefgpmvLN.c

src/blas/reference/level2/ATL_zrefgpmvLT.c

src/blas/reference/level2/ATL_zrefgpmvUC.c

src/blas/reference/level2/ATL_zrefgpmvUH.c

src/blas/reference/level2/ATL_zrefgpmvUN.c

src/blas/reference/level2/ATL_zrefgpmvUT.c

src/blas/reference/level2/ATL_zrefgprc.c

src/blas/reference/level2/ATL_zrefgpru.c

src/blas/reference/level2/ATL_zrefhbmv.c

src/blas/reference/level2/ATL_zrefhbmvL.c

src/blas/reference/level2/ATL_zrefhbmvU.c

src/blas/reference/level2/ATL_zrefhemv.c

src/blas/reference/level2/ATL_zrefhemvL.c

src/blas/reference/level2/ATL_zrefhemvU.c

src/blas/reference/level2/ATL_zrefher.c

src/blas/reference/level2/ATL_zrefher2.c

src/blas/reference/level2/ATL_zrefher2L.c

src/blas/reference/level2/ATL_zrefher2U.c

src/blas/reference/level2/ATL_zrefherL.c

src/blas/reference/level2/ATL_zrefherU.c

src/blas/reference/level2/ATL_zrefhpmv.c

src/blas/reference/level2/ATL_zrefhpmvL.c

src/blas/reference/level2/ATL_zrefhpmvU.c

src/blas/reference/level2/ATL_zrefhpr.c

src/blas/reference/level2/ATL_zrefhpr2.c

src/blas/reference/level2/ATL_zrefhpr2L.c

src/blas/reference/level2/ATL_zrefhpr2U.c

src/blas/reference/level2/ATL_zrefhprL.c

src/blas/reference/level2/ATL_zrefhprU.c

src/blas/reference/level2/ATL_zreftbmv.c

src/blas/reference/level2/ATL_zreftbmvLCN.c

src/blas/reference/level2/ATL_zreftbmvLCU.c

src/blas/reference/level2/ATL_zreftbmvLHN.c

src/blas/reference/level2/ATL_zreftbmvLHU.c

src/blas/reference/level2/ATL_zreftbmvLNN.c

src/blas/reference/level2/ATL_zreftbmvLNU.c

src/blas/reference/level2/ATL_zreftbmvLTN.c

src/blas/reference/level2/ATL_zreftbmvLTU.c

src/blas/reference/level2/ATL_zreftbmvUCN.c

src/blas/reference/level2/ATL_zreftbmvUCU.c

src/blas/reference/level2/ATL_zreftbmvUHN.c

src/blas/reference/level2/ATL_zreftbmvUHU.c

src/blas/reference/level2/ATL_zreftbmvUNN.c

src/blas/reference/level2/ATL_zreftbmvUNU.c

src/blas/reference/level2/ATL_zreftbmvUTN.c

src/blas/reference/level2/ATL_zreftbmvUTU.c

src/blas/reference/level2/ATL_zreftbsv.c

src/blas/reference/level2/ATL_zreftbsvLCN.c

src/blas/reference/level2/ATL_zreftbsvLCU.c

src/blas/reference/level2/ATL_zreftbsvLHN.c

src/blas/reference/level2/ATL_zreftbsvLHU.c

src/blas/reference/level2/ATL_zreftbsvLNN.c

src/blas/reference/level2/ATL_zreftbsvLNU.c

src/blas/reference/level2/ATL_zreftbsvLTN.c

src/blas/reference/level2/ATL_zreftbsvLTU.c

src/blas/reference/level2/ATL_zreftbsvUCN.c

src/blas/reference/level2/ATL_zreftbsvUCU.c

src/blas/reference/level2/ATL_zreftbsvUHN.c

src/blas/reference/level2/ATL_zreftbsvUHU.c

src/blas/reference/level2/ATL_zreftbsvUNN.c

src/blas/reference/level2/ATL_zreftbsvUNU.c

src/blas/reference/level2/ATL_zreftbsvUTN.c

src/blas/reference/level2/ATL_zreftbsvUTU.c

src/blas/reference/level2/ATL_zreftpmv.c

src/blas/reference/level2/ATL_zreftpmvLCN.c

src/blas/reference/level2/ATL_zreftpmvLCU.c

src/blas/reference/level2/ATL_zreftpmvLHN.c

src/blas/reference/level2/ATL_zreftpmvLHU.c

src/blas/reference/level2/ATL_zreftpmvLNN.c

src/blas/reference/level2/ATL_zreftpmvLNU.c

src/blas/reference/level2/ATL_zreftpmvLTN.c

src/blas/reference/level2/ATL_zreftpmvLTU.c

src/blas/reference/level2/ATL_zreftpmvUCN.c

src/blas/reference/level2/ATL_zreftpmvUCU.c

src/blas/reference/level2/ATL_zreftpmvUHN.c

src/blas/reference/level2/ATL_zreftpmvUHU.c

src/blas/reference/level2/ATL_zreftpmvUNN.c

src/blas/reference/level2/ATL_zreftpmvUNU.c

src/blas/reference/level2/ATL_zreftpmvUTN.c

src/blas/reference/level2/ATL_zreftpmvUTU.c

src/blas/reference/level2/ATL_zreftpsv.c

src/blas/reference/level2/ATL_zreftpsvLCN.c

src/blas/reference/level2/ATL_zreftpsvLCU.c

src/blas/reference/level2/ATL_zreftpsvLHN.c

src/blas/reference/level2/ATL_zreftpsvLHU.c

src/blas/reference/level2/ATL_zreftpsvLNN.c

src/blas/reference/level2/ATL_zreftpsvLNU.c

src/blas/reference/level2/ATL_zreftpsvLTN.c

src/blas/reference/level2/ATL_zreftpsvLTU.c

src/blas/reference/level2/ATL_zreftpsvUCN.c

src/blas/reference/level2/ATL_zreftpsvUCU.c

src/blas/reference/level2/ATL_zreftpsvUHN.c

src/blas/reference/level2/ATL_zreftpsvUHU.c

src/blas/reference/level2/ATL_zreftpsvUNN.c

src/blas/reference/level2/ATL_zreftpsvUNU.c

src/blas/reference/level2/ATL_zreftpsvUTN.c

src/blas/reference/level2/ATL_zreftpsvUTU.c

src/blas/reference/level2/ATL_zreftrmv.c

src/blas/reference/level2/ATL_zreftrmvLCN.c

src/blas/reference/level2/ATL_zreftrmvLCU.c

src/blas/reference/level2/ATL_zreftrmvLHN.c

src/blas/reference/level2/ATL_zreftrmvLHU.c

src/blas/reference/level2/ATL_zreftrmvLNN.c

src/blas/reference/level2/ATL_zreftrmvLNU.c

src/blas/reference/level2/ATL_zreftrmvLTN.c

src/blas/reference/level2/ATL_zreftrmvLTU.c

src/blas/reference/level2/ATL_zreftrmvUCN.c

src/blas/reference/level2/ATL_zreftrmvUCU.c

src/blas/reference/level2/ATL_zreftrmvUHN.c

src/blas/reference/level2/ATL_zreftrmvUHU.c

src/blas/reference/level2/ATL_zreftrmvUNN.c

src/blas/reference/level2/ATL_zreftrmvUNU.c

src/blas/reference/level2/ATL_zreftrmvUTN.c

src/blas/reference/level2/ATL_zreftrmvUTU.c

src/blas/reference/level2/ATL_zreftrsv.c

src/blas/reference/level2/ATL_zreftrsvLCN.c

src/blas/reference/level2/ATL_zreftrsvLCU.c

src/blas/reference/level2/ATL_zreftrsvLHN.c

src/blas/reference/level2/ATL_zreftrsvLHU.c

src/blas/reference/level2/ATL_zreftrsvLNN.c

src/blas/reference/level2/ATL_zreftrsvLNU.c

src/blas/reference/level2/ATL_zreftrsvLTN.c

src/blas/reference/level2/ATL_zreftrsvLTU.c

src/blas/reference/level2/ATL_zreftrsvUCN.c

src/blas/reference/level2/ATL_zreftrsvUCU.c

src/blas/reference/level2/ATL_zreftrsvUHN.c

src/blas/reference/level2/ATL_zreftrsvUHU.c

src/blas/reference/level2/ATL_zreftrsvUNN.c

src/blas/reference/level2/ATL_zreftrsvUNU.c

src/blas/reference/level2/ATL_zreftrsvUTN.c

src/blas/reference/level2/ATL_zreftrsvUTU.c

src/blas/reference/level3/ATL_crefgemm.c

src/blas/reference/level3/ATL_crefgemmCC.c

src/blas/reference/level3/ATL_crefgemmCN.c

src/blas/reference/level3/ATL_crefgemmCT.c

src/blas/reference/level3/ATL_crefgemmNC.c

src/blas/reference/level3/ATL_crefgemmNN.c

src/blas/reference/level3/ATL_crefgemmNT.c

src/blas/reference/level3/ATL_crefgemmTC.c

src/blas/reference/level3/ATL_crefgemmTN.c

src/blas/reference/level3/ATL_crefgemmTT.c

src/blas/reference/level3/ATL_crefhemm.c

src/blas/reference/level3/ATL_crefhemmLL.c

src/blas/reference/level3/ATL_crefhemmLU.c

src/blas/reference/level3/ATL_crefhemmRL.c

src/blas/reference/level3/ATL_crefhemmRU.c

src/blas/reference/level3/ATL_crefher2k.c

src/blas/reference/level3/ATL_crefher2kLC.c

src/blas/reference/level3/ATL_crefher2kLN.c

src/blas/reference/level3/ATL_crefher2kUC.c

src/blas/reference/level3/ATL_crefher2kUN.c

src/blas/reference/level3/ATL_crefherk.c

src/blas/reference/level3/ATL_crefherkLC.c

src/blas/reference/level3/ATL_crefherkLN.c

src/blas/reference/level3/ATL_crefherkUC.c

src/blas/reference/level3/ATL_crefherkUN.c

src/blas/reference/level3/ATL_crefsymm.c

src/blas/reference/level3/ATL_crefsymmLL.c

src/blas/reference/level3/ATL_crefsymmLU.c

src/blas/reference/level3/ATL_crefsymmRL.c

src/blas/reference/level3/ATL_crefsymmRU.c

src/blas/reference/level3/ATL_crefsyr2k.c

src/blas/reference/level3/ATL_crefsyr2kLN.c

src/blas/reference/level3/ATL_crefsyr2kLT.c

src/blas/reference/level3/ATL_crefsyr2kUN.c

src/blas/reference/level3/ATL_crefsyr2kUT.c

src/blas/reference/level3/ATL_crefsyrk.c

src/blas/reference/level3/ATL_crefsyrkLN.c

src/blas/reference/level3/ATL_crefsyrkLT.c

src/blas/reference/level3/ATL_crefsyrkUN.c

src/blas/reference/level3/ATL_crefsyrkUT.c

src/blas/reference/level3/ATL_creftrmm.c

src/blas/reference/level3/ATL_creftrmmLLCN.c

src/blas/reference/level3/ATL_creftrmmLLCU.c

src/blas/reference/level3/ATL_creftrmmLLNN.c

src/blas/reference/level3/ATL_creftrmmLLNU.c

src/blas/reference/level3/ATL_creftrmmLLTN.c

src/blas/reference/level3/ATL_creftrmmLLTU.c

src/blas/reference/level3/ATL_creftrmmLUCN.c

src/blas/reference/level3/ATL_creftrmmLUCU.c

src/blas/reference/level3/ATL_creftrmmLUNN.c

src/blas/reference/level3/ATL_creftrmmLUNU.c

src/blas/reference/level3/ATL_creftrmmLUTN.c

src/blas/reference/level3/ATL_creftrmmLUTU.c

src/blas/reference/level3/ATL_creftrmmRLCN.c

src/blas/reference/level3/ATL_creftrmmRLCU.c

src/blas/reference/level3/ATL_creftrmmRLNN.c

src/blas/reference/level3/ATL_creftrmmRLNU.c

src/blas/reference/level3/ATL_creftrmmRLTN.c

src/blas/reference/level3/ATL_creftrmmRLTU.c

src/blas/reference/level3/ATL_creftrmmRUCN.c

src/blas/reference/level3/ATL_creftrmmRUCU.c

src/blas/reference/level3/ATL_creftrmmRUNN.c

src/blas/reference/level3/ATL_creftrmmRUNU.c

src/blas/reference/level3/ATL_creftrmmRUTN.c

src/blas/reference/level3/ATL_creftrmmRUTU.c

src/blas/reference/level3/ATL_creftrsm.c

src/blas/reference/level3/ATL_creftrsmLLCN.c

src/blas/reference/level3/ATL_creftrsmLLCU.c

src/blas/reference/level3/ATL_creftrsmLLNN.c

src/blas/reference/level3/ATL_creftrsmLLNU.c

src/blas/reference/level3/ATL_creftrsmLLTN.c

src/blas/reference/level3/ATL_creftrsmLLTU.c

src/blas/reference/level3/ATL_creftrsmLUCN.c

src/blas/reference/level3/ATL_creftrsmLUCU.c

src/blas/reference/level3/ATL_creftrsmLUNN.c

src/blas/reference/level3/ATL_creftrsmLUNU.c

src/blas/reference/level3/ATL_creftrsmLUTN.c

src/blas/reference/level3/ATL_creftrsmLUTU.c

src/blas/reference/level3/ATL_creftrsmRLCN.c

src/blas/reference/level3/ATL_creftrsmRLCU.c

src/blas/reference/level3/ATL_creftrsmRLNN.c

src/blas/reference/level3/ATL_creftrsmRLNU.c

src/blas/reference/level3/ATL_creftrsmRLTN.c

src/blas/reference/level3/ATL_creftrsmRLTU.c

src/blas/reference/level3/ATL_creftrsmRUCN.c

src/blas/reference/level3/ATL_creftrsmRUCU.c

src/blas/reference/level3/ATL_creftrsmRUNN.c

src/blas/reference/level3/ATL_creftrsmRUNU.c

src/blas/reference/level3/ATL_creftrsmRUTN.c

src/blas/reference/level3/ATL_creftrsmRUTU.c

src/blas/reference/level3/ATL_drefgemm.c

src/blas/reference/level3/ATL_drefgemmNN.c

src/blas/reference/level3/ATL_drefgemmNT.c

src/blas/reference/level3/ATL_drefgemmTN.c

src/blas/reference/level3/ATL_drefgemmTT.c

src/blas/reference/level3/ATL_drefsymm.c

src/blas/reference/level3/ATL_drefsymmLL.c

src/blas/reference/level3/ATL_drefsymmLU.c

src/blas/reference/level3/ATL_drefsymmRL.c

src/blas/reference/level3/ATL_drefsymmRU.c

src/blas/reference/level3/ATL_drefsyr2k.c

src/blas/reference/level3/ATL_drefsyr2kLN.c

src/blas/reference/level3/ATL_drefsyr2kLT.c

src/blas/reference/level3/ATL_drefsyr2kUN.c

src/blas/reference/level3/ATL_drefsyr2kUT.c

src/blas/reference/level3/ATL_drefsyrk.c

src/blas/reference/level3/ATL_drefsyrkLN.c

src/blas/reference/level3/ATL_drefsyrkLT.c

src/blas/reference/level3/ATL_drefsyrkUN.c

src/blas/reference/level3/ATL_drefsyrkUT.c

src/blas/reference/level3/ATL_dreftrmm.c

src/blas/reference/level3/ATL_dreftrmmLLNN.c

src/blas/reference/level3/ATL_dreftrmmLLNU.c

src/blas/reference/level3/ATL_dreftrmmLLTN.c

src/blas/reference/level3/ATL_dreftrmmLLTU.c

src/blas/reference/level3/ATL_dreftrmmLUNN.c

src/blas/reference/level3/ATL_dreftrmmLUNU.c

src/blas/reference/level3/ATL_dreftrmmLUTN.c

src/blas/reference/level3/ATL_dreftrmmLUTU.c

src/blas/reference/level3/ATL_dreftrmmRLNN.c

src/blas/reference/level3/ATL_dreftrmmRLNU.c

src/blas/reference/level3/ATL_dreftrmmRLTN.c

src/blas/reference/level3/ATL_dreftrmmRLTU.c

src/blas/reference/level3/ATL_dreftrmmRUNN.c

src/blas/reference/level3/ATL_dreftrmmRUNU.c

src/blas/reference/level3/ATL_dreftrmmRUTN.c

src/blas/reference/level3/ATL_dreftrmmRUTU.c

src/blas/reference/level3/ATL_dreftrsm.c

src/blas/reference/level3/ATL_dreftrsmLLNN.c

src/blas/reference/level3/ATL_dreftrsmLLNU.c

src/blas/reference/level3/ATL_dreftrsmLLTN.c

src/blas/reference/level3/ATL_dreftrsmLLTU.c

src/blas/reference/level3/ATL_dreftrsmLUNN.c

src/blas/reference/level3/ATL_dreftrsmLUNU.c

src/blas/reference/level3/ATL_dreftrsmLUTN.c

src/blas/reference/level3/ATL_dreftrsmLUTU.c

src/blas/reference/level3/ATL_dreftrsmRLNN.c

src/blas/reference/level3/ATL_dreftrsmRLNU.c

src/blas/reference/level3/ATL_dreftrsmRLTN.c

src/blas/reference/level3/ATL_dreftrsmRLTU.c

src/blas/reference/level3/ATL_dreftrsmRUNN.c

src/blas/reference/level3/ATL_dreftrsmRUNU.c

src/blas/reference/level3/ATL_dreftrsmRUTN.c

src/blas/reference/level3/ATL_dreftrsmRUTU.c

src/blas/reference/level3/ATL_srefgemm.c

src/blas/reference/level3/ATL_srefgemmNN.c

src/blas/reference/level3/ATL_srefgemmNT.c

src/blas/reference/level3/ATL_srefgemmTN.c

src/blas/reference/level3/ATL_srefgemmTT.c

src/blas/reference/level3/ATL_srefsymm.c

src/blas/reference/level3/ATL_srefsymmLL.c

src/blas/reference/level3/ATL_srefsymmLU.c

src/blas/reference/level3/ATL_srefsymmRL.c

src/blas/reference/level3/ATL_srefsymmRU.c

src/blas/reference/level3/ATL_srefsyr2k.c

src/blas/reference/level3/ATL_srefsyr2kLN.c

src/blas/reference/level3/ATL_srefsyr2kLT.c

src/blas/reference/level3/ATL_srefsyr2kUN.c

src/blas/reference/level3/ATL_srefsyr2kUT.c

src/blas/reference/level3/ATL_srefsyrk.c

src/blas/reference/level3/ATL_srefsyrkLN.c

src/blas/reference/level3/ATL_srefsyrkLT.c

src/blas/reference/level3/ATL_srefsyrkUN.c

src/blas/reference/level3/ATL_srefsyrkUT.c

src/blas/reference/level3/ATL_sreftrmm.c

src/blas/reference/level3/ATL_sreftrmmLLNN.c

src/blas/reference/level3/ATL_sreftrmmLLNU.c

src/blas/reference/level3/ATL_sreftrmmLLTN.c

src/blas/reference/level3/ATL_sreftrmmLLTU.c

src/blas/reference/level3/ATL_sreftrmmLUNN.c

src/blas/reference/level3/ATL_sreftrmmLUNU.c

src/blas/reference/level3/ATL_sreftrmmLUTN.c

src/blas/reference/level3/ATL_sreftrmmLUTU.c

src/blas/reference/level3/ATL_sreftrmmRLNN.c

src/blas/reference/level3/ATL_sreftrmmRLNU.c

src/blas/reference/level3/ATL_sreftrmmRLTN.c

src/blas/reference/level3/ATL_sreftrmmRLTU.c

src/blas/reference/level3/ATL_sreftrmmRUNN.c

src/blas/reference/level3/ATL_sreftrmmRUNU.c

src/blas/reference/level3/ATL_sreftrmmRUTN.c

src/blas/reference/level3/ATL_sreftrmmRUTU.c

src/blas/reference/level3/ATL_sreftrsm.c

src/blas/reference/level3/ATL_sreftrsmLLNN.c

src/blas/reference/level3/ATL_sreftrsmLLNU.c

src/blas/reference/level3/ATL_sreftrsmLLTN.c

src/blas/reference/level3/ATL_sreftrsmLLTU.c

src/blas/reference/level3/ATL_sreftrsmLUNN.c

src/blas/reference/level3/ATL_sreftrsmLUNU.c

src/blas/reference/level3/ATL_sreftrsmLUTN.c

src/blas/reference/level3/ATL_sreftrsmLUTU.c

src/blas/reference/level3/ATL_sreftrsmRLNN.c

src/blas/reference/level3/ATL_sreftrsmRLNU.c

src/blas/reference/level3/ATL_sreftrsmRLTN.c

src/blas/reference/level3/ATL_sreftrsmRLTU.c

src/blas/reference/level3/ATL_sreftrsmRUNN.c

src/blas/reference/level3/ATL_sreftrsmRUNU.c

src/blas/reference/level3/ATL_sreftrsmRUTN.c

src/blas/reference/level3/ATL_sreftrsmRUTU.c

src/blas/reference/level3/ATL_zrefgemm.c

src/blas/reference/level3/ATL_zrefgemmCC.c

src/blas/reference/level3/ATL_zrefgemmCN.c

src/blas/reference/level3/ATL_zrefgemmCT.c

src/blas/reference/level3/ATL_zrefgemmNC.c

src/blas/reference/level3/ATL_zrefgemmNN.c

src/blas/reference/level3/ATL_zrefgemmNT.c

src/blas/reference/level3/ATL_zrefgemmTC.c

src/blas/reference/level3/ATL_zrefgemmTN.c

src/blas/reference/level3/ATL_zrefgemmTT.c

src/blas/reference/level3/ATL_zrefhemm.c

src/blas/reference/level3/ATL_zrefhemmLL.c

src/blas/reference/level3/ATL_zrefhemmLU.c

src/blas/reference/level3/ATL_zrefhemmRL.c

src/blas/reference/level3/ATL_zrefhemmRU.c

src/blas/reference/level3/ATL_zrefher2k.c

src/blas/reference/level3/ATL_zrefher2kLC.c

src/blas/reference/level3/ATL_zrefher2kLN.c

src/blas/reference/level3/ATL_zrefher2kUC.c

src/blas/reference/level3/ATL_zrefher2kUN.c

src/blas/reference/level3/ATL_zrefherk.c

src/blas/reference/level3/ATL_zrefherkLC.c

src/blas/reference/level3/ATL_zrefherkLN.c

src/blas/reference/level3/ATL_zrefherkUC.c

src/blas/reference/level3/ATL_zrefherkUN.c

src/blas/reference/level3/ATL_zrefsymm.c

src/blas/reference/level3/ATL_zrefsymmLL.c

src/blas/reference/level3/ATL_zrefsymmLU.c

src/blas/reference/level3/ATL_zrefsymmRL.c

src/blas/reference/level3/ATL_zrefsymmRU.c

src/blas/reference/level3/ATL_zrefsyr2k.c

src/blas/reference/level3/ATL_zrefsyr2kLN.c

src/blas/reference/level3/ATL_zrefsyr2kLT.c

src/blas/reference/level3/ATL_zrefsyr2kUN.c

src/blas/reference/level3/ATL_zrefsyr2kUT.c

src/blas/reference/level3/ATL_zrefsyrk.c

src/blas/reference/level3/ATL_zrefsyrkLN.c

src/blas/reference/level3/ATL_zrefsyrkLT.c

src/blas/reference/level3/ATL_zrefsyrkUN.c

src/blas/reference/level3/ATL_zrefsyrkUT.c

src/blas/reference/level3/ATL_zreftrmm.c

src/blas/reference/level3/ATL_zreftrmmLLCN.c

src/blas/reference/level3/ATL_zreftrmmLLCU.c

src/blas/reference/level3/ATL_zreftrmmLLNN.c

src/blas/reference/level3/ATL_zreftrmmLLNU.c

src/blas/reference/level3/ATL_zreftrmmLLTN.c

src/blas/reference/level3/ATL_zreftrmmLLTU.c

src/blas/reference/level3/ATL_zreftrmmLUCN.c

src/blas/reference/level3/ATL_zreftrmmLUCU.c

src/blas/reference/level3/ATL_zreftrmmLUNN.c

src/blas/reference/level3/ATL_zreftrmmLUNU.c

src/blas/reference/level3/ATL_zreftrmmLUTN.c

src/blas/reference/level3/ATL_zreftrmmLUTU.c

src/blas/reference/level3/ATL_zreftrmmRLCN.c

src/blas/reference/level3/ATL_zreftrmmRLCU.c

src/blas/reference/level3/ATL_zreftrmmRLNN.c

src/blas/reference/level3/ATL_zreftrmmRLNU.c

src/blas/reference/level3/ATL_zreftrmmRLTN.c

src/blas/reference/level3/ATL_zreftrmmRLTU.c

src/blas/reference/level3/ATL_zreftrmmRUCN.c

src/blas/reference/level3/ATL_zreftrmmRUCU.c

src/blas/reference/level3/ATL_zreftrmmRUNN.c

src/blas/reference/level3/ATL_zreftrmmRUNU.c

src/blas/reference/level3/ATL_zreftrmmRUTN.c

src/blas/reference/level3/ATL_zreftrmmRUTU.c

src/blas/reference/level3/ATL_zreftrsm.c

src/blas/reference/level3/ATL_zreftrsmLLCN.c

src/blas/reference/level3/ATL_zreftrsmLLCU.c

src/blas/reference/level3/ATL_zreftrsmLLNN.c

src/blas/reference/level3/ATL_zreftrsmLLNU.c

src/blas/reference/level3/ATL_zreftrsmLLTN.c

src/blas/reference/level3/ATL_zreftrsmLLTU.c

src/blas/reference/level3/ATL_zreftrsmLUCN.c

src/blas/reference/level3/ATL_zreftrsmLUCU.c

src/blas/reference/level3/ATL_zreftrsmLUNN.c

src/blas/reference/level3/ATL_zreftrsmLUNU.c

src/blas/reference/level3/ATL_zreftrsmLUTN.c

src/blas/reference/level3/ATL_zreftrsmLUTU.c

src/blas/reference/level3/ATL_zreftrsmRLCN.c

src/blas/reference/level3/ATL_zreftrsmRLCU.c

src/blas/reference/level3/ATL_zreftrsmRLNN.c

src/blas/reference/level3/ATL_zreftrsmRLNU.c

src/blas/reference/level3/ATL_zreftrsmRLTN.c

src/blas/reference/level3/ATL_zreftrsmRLTU.c

src/blas/reference/level3/ATL_zreftrsmRUCN.c

src/blas/reference/level3/ATL_zreftrsmRUCU.c

src/blas/reference/level3/ATL_zreftrsmRUNN.c

src/blas/reference/level3/ATL_zreftrsmRUNU.c

src/blas/reference/level3/ATL_zreftrsmRUTN.c

src/blas/reference/level3/ATL_zreftrsmRUTU.c

src/lapack/ATL_getrf.c

src/lapack/ATL_getrfC.c

src/lapack/ATL_getrfR.c

src/lapack/ATL_getri.c

src/lapack/ATL_getriC.c

src/lapack/ATL_getriR.c

src/lapack/ATL_getrs.c

src/lapack/ATL_laswp.c

src/lapack/ATL_lauum.c

src/lapack/ATL_lauumL.c

src/lapack/ATL_lauumU.c

src/lapack/ATL_potrf.c

src/lapack/ATL_potrfL.c

src/lapack/ATL_potrfRL.c

src/lapack/ATL_potrfRU.c

src/lapack/ATL_potrfU.c

src/lapack/ATL_potrs.c

src/lapack/ATL_trtri.c

src/lapack/ATL_trtriCL.c

src/lapack/ATL_trtriCU.c

src/lapack/ATL_trtriRL.c

src/lapack/ATL_trtriRU.c

src/pthreads/blas/level3/ATL_Sgemm.c

src/pthreads/blas/level3/ATL_Ssymm.c

src/pthreads/blas/level3/ATL_Ssyr2k.c

src/pthreads/blas/level3/ATL_Ssyrk.c

src/pthreads/blas/level3/ATL_Strmm.c

src/pthreads/blas/level3/ATL_Strsm.c

src/pthreads/blas/level3/ATL_ptgemm.c

src/pthreads/blas/level3/ATL_pthemm.c

src/pthreads/blas/level3/ATL_pther2k.c

src/pthreads/blas/level3/ATL_ptherk.c

src/pthreads/blas/level3/ATL_ptl3settype.c

src/pthreads/blas/level3/ATL_ptsymm.c

src/pthreads/blas/level3/ATL_ptsyr2k.c

src/pthreads/blas/level3/ATL_ptsyrk.c

src/pthreads/blas/level3/ATL_pttrmm.c

src/pthreads/blas/level3/ATL_pttrsm.c

src/pthreads/misc/ATL_1dsplit.c

src/pthreads/misc/ATL_Sgeadd.c

src/pthreads/misc/ATL_Sgescal.c

src/pthreads/misc/ATL_Sgezero.c

src/pthreads/misc/ATL_Stzscal.c

src/pthreads/misc/ATL_apply_tree.c

src/pthreads/misc/ATL_create_tree.c

src/pthreads/misc/ATL_free_node.c

src/pthreads/misc/ATL_free_tree.c

src/pthreads/misc/ATL_init_node.c

src/pthreads/misc/ATL_join_tree.c

src/pthreads/misc/ATL_print_node_id.c

src/pthreads/misc/ATL_ptgeadd.c

src/pthreads/misc/ATL_ptgescal.c

src/pthreads/misc/ATL_ptgezero.c

src/pthreads/misc/ATL_pthescal.c

src/pthreads/misc/ATL_pttrscal.c

src/pthreads/misc/ATL_signal_tree.c

src/pthreads/misc/ATL_thread_exit.c

src/pthreads/misc/ATL_thread_init.c

src/pthreads/misc/ATL_thread_tree.c

src/pthreads/misc/ATL_traverse_tree.c

src/pthreads/misc/ATL_tzsplit.c

src/pthreads/misc/ATL_wait_tree.c

src/testing/ATL_dsf77dot.c

src/testing/ATL_epsilon.c

src/testing/ATL_f77amax.c

src/testing/ATL_f77asum.c

src/testing/ATL_f77axpy.c

src/testing/ATL_f77copy.c

src/testing/ATL_f77dot.c

src/testing/ATL_f77dotc_sub.c

src/testing/ATL_f77dotu_sub.c

src/testing/ATL_f77gbmv.c

src/testing/ATL_f77gemm.c

src/testing/ATL_f77gemv.c

src/testing/ATL_f77ger.c

src/testing/ATL_f77gerc.c

src/testing/ATL_f77geru.c

src/testing/ATL_f77getrf.c

src/testing/ATL_f77getri.c

src/testing/ATL_f77hbmv.c

src/testing/ATL_f77hemm.c

src/testing/ATL_f77hemv.c

src/testing/ATL_f77her.c

src/testing/ATL_f77her2.c

src/testing/ATL_f77her2k.c

src/testing/ATL_f77herk.c

src/testing/ATL_f77hpmv.c

src/testing/ATL_f77hpr.c

src/testing/ATL_f77hpr2.c

src/testing/ATL_f77lauum.c

src/testing/ATL_f77nrm2.c

src/testing/ATL_f77potrf.c

src/testing/ATL_f77rot.c

src/testing/ATL_f77rotg.c

src/testing/ATL_f77rotm.c

src/testing/ATL_f77rotmg.c

src/testing/ATL_f77rscal.c

src/testing/ATL_f77sbmv.c

src/testing/ATL_f77scal.c

src/testing/ATL_f77spmv.c

src/testing/ATL_f77spr.c

src/testing/ATL_f77spr2.c

src/testing/ATL_f77swap.c

src/testing/ATL_f77symm.c

src/testing/ATL_f77symv.c

src/testing/ATL_f77syr.c

src/testing/ATL_f77syr2.c

src/testing/ATL_f77syr2k.c

src/testing/ATL_f77syrk.c

src/testing/ATL_f77tbmv.c

src/testing/ATL_f77tbsv.c

src/testing/ATL_f77tpmv.c

src/testing/ATL_f77tpsv.c

src/testing/ATL_f77trmm.c

src/testing/ATL_f77trmv.c

src/testing/ATL_f77trsm.c

src/testing/ATL_f77trsv.c

src/testing/ATL_gbnrm1.c

src/testing/ATL_gediff.c

src/testing/ATL_gediffnrm1.c

src/testing/ATL_gegen.c

src/testing/ATL_genrm1.c

src/testing/ATL_geprint.c

src/testing/ATL_hbnrm.c

src/testing/ATL_hediffnrm.c

src/testing/ATL_henrm.c

src/testing/ATL_hpnrm.c

src/testing/ATL_infnrm.c

src/testing/ATL_rand.c

src/testing/ATL_sbnrm.c

src/testing/ATL_sdsf77dot.c

src/testing/ATL_spnrm.c

src/testing/ATL_synrm.c

src/testing/ATL_tbnrm1.c

src/testing/ATL_tpnrm1.c

src/testing/ATL_trgen.c

src/testing/ATL_trnrm1.c

src/testing/ATL_tstsqtran.c

src/testing/ATL_vdiff.c

tune/blas/gemm/CASES/ATL_dmm14x1x56_sse2pABC.c

tune/blas/gemm/CASES/ATL_dmm14x1x56_sse2pABC_K.c

tune/blas/gemm/CASES/ATL_dmm14x1x56_sse2pABC_MN.c

tune/blas/gemm/CASES/ATL_dmm1x14x56_sse2pABC.c

tune/blas/gemm/CASES/ATL_dmm1x6x72_sse2.c

tune/blas/gemm/CASES/ATL_dmm2x1x24_5pABC.c

tune/blas/gemm/CASES/ATL_dmm2x1x40_5pABC.c

tune/blas/gemm/CASES/ATL_dmm4x4x16r8_US.c

tune/blas/gemm/CASES/ATL_dmm4x4x2_US.c

tune/blas/gemm/CASES/ATL_dmm4x4x2pf_av.c

tune/blas/gemm/CASES/ATL_dmm4x4x8_US.c

tune/blas/gemm/CASES/ATL_dmm6x1x30_x87.c

tune/blas/gemm/CASES/ATL_dmm6x1x60_sse2.c

tune/blas/gemm/CASES/ATL_dmm6x1x60pABC.c

tune/blas/gemm/CASES/ATL_dmm6x1x72_sse2.c

tune/blas/gemm/CASES/ATL_dmm6x1x72_sse2_K.c

tune/blas/gemm/CASES/ATL_dmm_julian_gas_30.c

tune/blas/gemm/CASES/ATL_dmm_sse2_80.c

tune/blas/gemm/CASES/ATL_dmm_sse2_80M.c

tune/blas/gemm/CASES/ATL_dmm_sse2_80N.c

tune/blas/gemm/CASES/ATL_dmm_sse2_K.c

tune/blas/gemm/CASES/ATL_mm4x3x2p.c

tune/blas/gemm/CASES/ATL_mm4x3x8p.c

tune/blas/gemm/CASES/ATL_mm4x4x2US.c

tune/blas/gemm/CASES/ATL_mm4x4x2US_MN.c

tune/blas/gemm/CASES/ATL_mm4x4x2US_NB.c

tune/blas/gemm/CASES/ATL_mm4x4x2_1_pref.c

tune/blas/gemm/CASES/ATL_mm4x4x2_1_prefCU.c

tune/blas/gemm/CASES/ATL_mm4x4x2rp.c

tune/blas/gemm/CASES/ATL_mm4x4x4_av.c

tune/blas/gemm/CASES/ATL_mm4x4x56_av.c

tune/blas/gemm/CASES/ATL_mm4x4x8_av.c

tune/blas/gemm/CASES/ATL_mm4x4x8_bpfab.c

tune/blas/gemm/CASES/ATL_mm4x4x8_bpfabc.c

tune/blas/gemm/CASES/ATL_mm4x4x8p.c

tune/blas/gemm/CASES/ATL_mm6x8x8_1p.c

tune/blas/gemm/CASES/ATL_mm8x8x2.c

tune/blas/gemm/CASES/ATL_objdummy.c

tune/blas/gemm/CASES/ATL_smm14x1x84_sse.c

tune/blas/gemm/CASES/ATL_smm14x1x84_sseCU.c

tune/blas/gemm/CASES/ATL_smm4x4x16_US.c

tune/blas/gemm/CASES/ATL_smm4x4x16_av.c

tune/blas/gemm/CASES/ATL_smm4x4x2_US.c

tune/blas/gemm/CASES/ATL_smm4x4x4_av.c

tune/blas/gemm/CASES/ATL_smm4x4x72_US.c

tune/blas/gemm/CASES/ATL_smm6x1x60_sse.c

tune/blas/gemm/CASES/ATL_smm6x1x60_x87.c

tune/blas/gemm/CASES/ATL_smmMNCU_av.c

tune/blas/gemm/CASES/ATL_smm_3dnow_100.c

tune/blas/gemm/CASES/ATL_smm_3dnow_100M.c

tune/blas/gemm/CASES/ATL_smm_3dnow_100N.c

tune/blas/gemm/CASES/ATL_smm_3dnow_K.c

tune/blas/gemm/CASES/ATL_smm_sse1_56.c

tune/blas/gemm/CASES/ATL_smm_sse1_56M.c

tune/blas/gemm/CASES/ATL_smm_sse1_56N.c

tune/blas/gemm/CASES/ATL_smm_sse1_60.c

tune/blas/gemm/CASES/ATL_smm_sse1_60M.c

tune/blas/gemm/CASES/ATL_smm_sse1_60N.c

tune/blas/gemm/CASES/ATL_smm_sse1_64.c

tune/blas/gemm/CASES/ATL_smm_sse1_64M.c

tune/blas/gemm/CASES/ATL_smm_sse1_64N.c

tune/blas/gemm/CASES/ATL_smm_sse1_K.c

tune/blas/gemm/CASES/ATL_smm_sse2_112.c

tune/blas/gemm/CASES/ATL_smm_sse2_112M.c

tune/blas/gemm/CASES/ATL_smm_sse2_112N.c

tune/blas/gemm/CASES/ccases.SSE

tune/blas/gemm/CASES/ccases.flg

tune/blas/gemm/CASES/dcases.SSE

tune/blas/gemm/CASES/dcases.flg

tune/blas/gemm/CASES/objs/ATL_dJIK30x30x30TN30x30x0_a1.cfg

tune/blas/gemm/CASES/objs/ATL_dJIK30x30x30TN30x30x0_a1.mcr

tune/blas/gemm/CASES/objs/ATL_dJIK30x30x30TN30x30x0_a1_b0.asm

tune/blas/gemm/CASES/objs/ATL_dJIK30x30x30TN30x30x0_a1_b1.asm

tune/blas/gemm/CASES/objs/ATL_dJIK30x30x30TN30x30x0_a1_bX.asm

tune/blas/gemm/CASES/objs/ATL_sJIK48x48x48TN48x48x0_a1.cfg

tune/blas/gemm/CASES/objs/ATL_sJIK48x48x48TN48x48x0_a1.mcr

tune/blas/gemm/CASES/objs/ATL_sJIK48x48x48TN48x48x0_a1_b0.asm

tune/blas/gemm/CASES/objs/ATL_sJIK48x48x48TN48x48x0_a1_b1.asm

tune/blas/gemm/CASES/objs/ATL_sJIK48x48x48TN48x48x0_a1_bX.asm

tune/blas/gemm/CASES/objs/Make.ext

tune/blas/gemm/CASES/scases.SSE

tune/blas/gemm/CASES/scases.flg

tune/blas/gemm/CASES/zcases.SSE

tune/blas/gemm/CASES/zcases.flg

tune/blas/gemm/emit_mm.c

tune/blas/gemm/fc.c

tune/blas/gemm/findCE.c

tune/blas/gemm/hcsearch.c

tune/blas/gemm/mmsearch.c

tune/blas/gemm/mmtst.c

tune/blas/gemm/tfc.c

tune/blas/gemm/ummsearch.c

tune/blas/gemm/usercomb.c

tune/blas/gemm/userflag.c

tune/blas/gemm/userindex.c

tune/blas/gemv/ATL_gemv.c

tune/blas/gemv/ATL_symv.c

tune/blas/gemv/CASES/ATL_cgemvN_1x1_1.c

tune/blas/gemv/CASES/ATL_cgemvN_1x1_1a.c

tune/blas/gemv/CASES/ATL_cgemvN_2x2_0.c

tune/blas/gemv/CASES/ATL_cgemvN_4x2_1.c

tune/blas/gemv/CASES/ATL_cgemvN_mm.c

tune/blas/gemv/CASES/ATL_cgemvT_1x1_1.c

tune/blas/gemv/CASES/ATL_cgemvT_2x2_0.c

tune/blas/gemv/CASES/ATL_cgemvT_2x4_1.c

tune/blas/gemv/CASES/ATL_cgemvT_mm.c

tune/blas/gemv/CASES/ATL_gemvN_16x2_1.c

tune/blas/gemv/CASES/ATL_gemvN_16x4_1.c

tune/blas/gemv/CASES/ATL_gemvN_1x1_1.c

tune/blas/gemv/CASES/ATL_gemvN_1x1_1a.c

tune/blas/gemv/CASES/ATL_gemvN_32x4_1.c

tune/blas/gemv/CASES/ATL_gemvN_4x2_0.c

tune/blas/gemv/CASES/ATL_gemvN_4x4_1.c

tune/blas/gemv/CASES/ATL_gemvN_8x32_2.c

tune/blas/gemv/CASES/ATL_gemvN_8x4_1.c

tune/blas/gemv/CASES/ATL_gemvN_dummy.c

tune/blas/gemv/CASES/ATL_gemvN_dummy2.c

tune/blas/gemv/CASES/ATL_gemvN_mm.c

tune/blas/gemv/CASES/ATL_gemvT_1x1_1.c

tune/blas/gemv/CASES/ATL_gemvT_2x16_1.c

tune/blas/gemv/CASES/ATL_gemvT_2x8_0.c

tune/blas/gemv/CASES/ATL_gemvT_4x16_1.c

tune/blas/gemv/CASES/ATL_gemvT_4x8_1.c

tune/blas/gemv/CASES/ATL_gemvT_dummy.c

tune/blas/gemv/CASES/ATL_gemvT_dummy2.c

tune/blas/gemv/CASES/ATL_gemvT_mm.c

tune/blas/gemv/CASES/ATL_gemv_SSE.c

tune/blas/gemv/emit_head.c

tune/blas/gemv/emit_rmvT.c

tune/blas/gemv/gemvtune.c

tune/blas/gemv/mvsearch.c

tune/blas/gemv/mvtest.c

tune/blas/ger/ATL_ger.c

tune/blas/ger/CASES/ATL_cger1_2x1p.c

tune/blas/ger/CASES/ATL_cger1_axpy.c

tune/blas/ger/CASES/ATL_cger1_dummy.c

tune/blas/ger/CASES/ATL_ger1_1x4_0.c

tune/blas/ger/CASES/ATL_ger1_4x4_1.c

tune/blas/ger/CASES/ATL_ger1_8x4_0.c

tune/blas/ger/CASES/ATL_ger1_axpy.c

tune/blas/ger/emit_r1h.c

tune/blas/ger/ger1tune.c

tune/blas/ger/r1search.c

tune/blas/ger/r1test.c

tune/blas/level1/ASUM/asum_fabs1_x1.c

tune/blas/level1/ASUM/asum_mabs1_x1.c

tune/blas/level1/ASUM/asum_sse_x1.c

tune/blas/level1/AXPBY/axpby1_a1bXx1y1.c

tune/blas/level1/AXPY/axpy1_x0y0.c

tune/blas/level1/AXPY/axpy1_x1y1.c

tune/blas/level1/AXPY/ccases.dsc

tune/blas/level1/AXPY/dcases.dsc

tune/blas/level1/AXPY/scases.dsc

tune/blas/level1/AXPY/zcases.dsc

tune/blas/level1/COPY/copy1_x0y0.c

tune/blas/level1/COPY/copy_x86.c

tune/blas/level1/CPSC/cpsc1_x1y1.c

tune/blas/level1/DOT/dot1_x1y1.c

tune/blas/level1/DOT/dot_stub.c

tune/blas/level1/IAMAX/ciamax_abs1_x0.c

tune/blas/level1/IAMAX/ciamax_abs1_x1.c

tune/blas/level1/IAMAX/ciamax_abs2_x1.c

tune/blas/level1/IAMAX/iamax8_x86.c

tune/blas/level1/IAMAX/iamax_abs1_x0.c

tune/blas/level1/IAMAX/iamax_abs1_x1.c

tune/blas/level1/IAMAX/iamax_sse.c

tune/blas/level1/NRM2/ccases.dsc

tune/blas/level1/NRM2/dcases.dsc

tune/blas/level1/NRM2/nrm21_x0.c

tune/blas/level1/NRM2/nrm21_x1.c

tune/blas/level1/NRM2/nrm24p120_x1.c

tune/blas/level1/NRM2/nrm2_ssq1_x1.c

tune/blas/level1/NRM2/nrm2_ssqr1_x1.c

tune/blas/level1/NRM2/nrm2_ssqr4_x1.c

tune/blas/level1/NRM2/scases.dsc

tune/blas/level1/NRM2/zcases.dsc

tune/blas/level1/ROT/rot1_x1y1.c

tune/blas/level1/SCAL/scal1_x1.c

tune/blas/level1/SET/set1_x1.c

tune/blas/level1/SET/set_x86.c

tune/blas/level1/asumsrch.c

tune/blas/level1/asumtest.c

tune/blas/level1/asumtime.c

tune/blas/level1/axpbysrch.c

tune/blas/level1/axpbytest.c

tune/blas/level1/axpbytime.c

tune/blas/level1/axpysrch.c

tune/blas/level1/axpytest.c

tune/blas/level1/axpytime.c

tune/blas/level1/copysrch.c

tune/blas/level1/copytest.c

tune/blas/level1/copytime.c

tune/blas/level1/cpscsrch.c

tune/blas/level1/cpsctest.c

tune/blas/level1/cpsctime.c

tune/blas/level1/dotsrch.c

tune/blas/level1/dottest.c

tune/blas/level1/dottime.c

tune/blas/level1/iamaxsrch.c

tune/blas/level1/iamaxtest.c

tune/blas/level1/iamaxtime.c

tune/blas/level1/nrm2srch.c

tune/blas/level1/nrm2test.c

tune/blas/level1/nrm2time.c

tune/blas/level1/rotsrch.c

tune/blas/level1/rottest.c

tune/blas/level1/rottime.c

tune/blas/level1/scalsrch.c

tune/blas/level1/scaltest.c

tune/blas/level1/scaltime.c

tune/blas/level1/setsrch.c

tune/blas/level1/settest.c

tune/blas/level1/settime.c

tune/blas/level1/swapsrch.c

tune/blas/level1/swaptest.c

tune/blas/level1/swaptime.c

tune/blas/level3/tsmfc.c

tune/sysinfo/ATL_cputime.c

tune/sysinfo/ATL_walltime.c

tune/sysinfo/GetSysSum.c

tune/sysinfo/L1CacheSize.c

tune/sysinfo/emit_buildinfo.c

tune/sysinfo/emit_typ.c

tune/sysinfo/masearch.c

Show diffs side-by-side

added added

removed removed

tune/blas/gemm/CASES/ATL_dmm2x2x2_sse2.c

* Automatically Tuned Linear Algebra Software v3.8.3

* Redistribution and use in source and binary forms, with or without

* modification, are permitted provided that the following conditions

* are met:

* 1. Redistributions of source code must retain the above copyright

* notice, this list of conditions and the following disclaimer.

* 2. Redistributions in binary form must reproduce the above copyright

* notice, this list of conditions, and the following disclaimer in the

* documentation and/or other materials provided with the distribution.

* 3. The name of the ATLAS group or the names of its contributers may

* not be used to endorse or promote products derived from this

* software without specific written permission.

* THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS

* ``AS IS'' AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED

* TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR

* PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE ATLAS GROUP OR ITS CONTRIBUTORS

* BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR

* CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF

* SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS

* INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN

* CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE)

* ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE

* POSSIBILITY OF SUCH DAMAGE.

#include "atlas_asm.h"

#if !defined(ATL_GAS_x8664) && !defined(ATL_GAS_x8632)

#error "This kernel requires x86 assembly!"

#endif

#ifdef DCPLX

#define CMUL(arg_) 2*arg_

#define CSH 4

#else

#define CMUL(arg_) arg_

#define CSH 3

#endif

#ifdef ATL_GAS_x8632

#define movq movl

#define addq addl

#define subq subl

#define shrq shrl

#define testq testl

#define rsp esp

#ifdef BETAX

#define BETAOFF 0

#define BETASZ 16

#else

#define BETASZ 0

#endif

#define FSIZE 16*4+BETASZ

#define KOFF FSIZE-4

#define ldcOFF KOFF-4

#define iAmOFF ldcOFF-4

#define PFAOFF iAmOFF-4

#define PFBOFF PFAOFF-4

#define IOFF PFBOFF-4

#define MOFF IOFF-4

#define iAnOFF MOFF-4

#define iBnOFF iAnOFF-4

#define iCnOFF iBnOFF-4

#define JOFF iCnOFF-4

#endif

*Integer register usage shown by these defines

#ifdef ATL_GAS_x8632

#define pA0 %ecx

#define pA1 %eax

#define pB0 %ebx

#define pB1 %edi

#define pC0 %esi

#define itmp %edx

#define KK %ebp

#define incAm iAmOFF(%esp)

#define incAn iAnOFF(%esp)

#define incBn iBnOFF(%esp)

#define incCn iCnOFF(%esp)

#define MM IOFF(%esp)

#define NN JOFF(%esp)

#define MM0 MOFF(%esp)

#define PFA PFAOFF(%esp)

#define PFB PFBOFF(%esp)

#define ldc ldcOFF(%esp)

#define KK0 KOFF(%esp)

#else

#define pA0 %rcx

#define pA1 %rbx

#define pB0 %rbp

#define pB1 %rax

#define pC0 %rdi

#define KK %rdx

#define PFB %rsi

100

#define PFA %r8

101

#define ldc %r9

102

#define KK0 %r10

103

#define incAm %r11

104

#define incAn %r12

105

#define incBn %r13

106

#define MM %r14

107

#define NN %r15

108

#define incCn iCOFF(%rsp)

109

#define MM0 iIOFF(%rsp)

110

#define itmp ldc

111

#endif

112

#define rA0 %xmm0

113

#define rA1 %xmm1

114

#define ra0 %xmm2

115

#define rB0 %xmm3

116

#define rC00 %xmm4

117

#define rC10 %xmm5

118

#define rC01 %xmm6

119

#define rC11 %xmm7

120

#ifdef ATL_GAS_x8664

121

#define BETA %xmm8

122

#define rC0 %xmm9

123

#define rC1 %xmm10

124

#endif

125

126

* Define some macros for instruction selection

127

* VZERO: xorpd, xorps, pxor

128

* MOVAB: movapd,movaps or movupd/movups

129

130

#define VZERO(reg_) xorps reg_, reg_

131

#define MOVAB movaps

132

#define MOVAPD movaps

133

#define MOVUPD movups

134

#define PFAINC -64

135

#define PFBINC 32

136

#if 1

137

#define pref2(mem) prefetcht1 mem

138

#define prefB(mem) prefetcht0 mem

139

#define prefC(mem) prefetcht0 mem

140

#else

141

#define pref2(mem)

142

#define prefB(mem)

143

#define prefC(mem)

144

#endif

145

146

%rdi/4 %rsi/8 %rdx/12 %xmm0/16

147

void ATL_USERMM(const int M, const int N, const int K, const TYPE alpha,

148

%rcx/24 %r8/28 %r9/32 8/36

149

const TYPE *A, const int lda, const TYPE *B, const int ldb,

150

%xmm1/40 16/48 24/52

151

const TYPE beta, TYPE *C, const int ldc)

152

153

.text

154

.global ATL_asmdecor(ATL_USERMM)

155

ALIGN16

156

ATL_asmdecor(ATL_USERMM):

157

158

* Save callee-saved iregs

159

160

#ifdef ATL_GAS_x8632

161

movl %esp, %eax /* save original stack ptr */

162

sub $FSIZE, %esp /* allocate stack space */

163

andw $0xFFF0, %sp /* SP now 16-byte aligned */

164

movl %ebp, BETASZ(%esp)

165

movl %ebx, BETASZ+4(%esp)

166

movl %esi, BETASZ+8(%esp)

167

movl %edi, BETASZ+12(%esp)

168

movl %eax, BETASZ+16(%esp) /* original SP saved to new stack */

169

#else

170

movq %rbp, -8(%rsp)

171

movq %rbx, -16(%rsp)

172

movq %r12, -24(%rsp)

173

movq %r13, -32(%rsp)

174

movq %r14, -40(%rsp)

175

movq %r15, -48(%rsp)

176

#define iCOFF -56

177

#define iIOFF -64

178

#endif

179

180

181

* Setup input parameters

182

* For x8632 %eax has old stack ptr; eax is pA1, so set this up late

183

184

#ifdef ATL_GAS_x8632

185

movl 4(%eax), itmp

186

movl itmp, MM0

187

movl 8(%eax), itmp

188

movl itmp, NN

189

movl 12(%eax), KK /* load K */

190

movl 24(%eax), pA0

191

movl 32(%eax), pB0

192

movl 36(%eax), itmp /* itmp = ldb */

193

lea (pB0, itmp, 8), pB1 /* pB1 = pB0 + ldb*sizeof */

194

shl $4, itmp /* itmp = 2*sizeof*ldb */

195

movl itmp, incBn /* incBn = 2*sizeof*ldb */

196

add pB0, itmp

197

movl itmp, PFB

198

#ifdef BETAX

199

movsd 40(%eax), rB0 /* load beta */

200

unpcklpd rB0, rB0 /* rB0 = {beta, beta} */

201

MOVAPD rB0, BETAOFF(%esp) /* store BETA to BETAOFF */

202

#endif

203

movl 48(%eax), pC0

204

movl 52(%eax), itmp /* itmp = ldc */

205

shl $CSH, itmp /* itmp = ldc*sizeof */

206

movl itmp, ldcOFF(%esp) /* ldc = ldc*sizeof */

207

shr $CSH-1, itmp /* itmp = 2*ldc */

208

sub MM0, itmp /* itmp = 2*ldc - M */

209

shl $CSH, itmp /* itmp = (2*ldc-M)*sizeof */

210

movl itmp, incCn /* incCn = (2*ldc-M)*sizeof */

211

movl 28(%eax), itmp /* itmp = lda */

212

lea (pA0, itmp,8), pA1 /* just overwrote old SP in EAX */

213

shl $4, itmp /* itmp = 2*sizeof*lda */

214

movl itmp, incAm /* incAm = 2*sizeof*lda */

215

216

217

* pfA = A + 2*lda*M; incAn = lda*M

218

219

movl MM0, itmp /* itmp = M */

220

imull incAm, itmp /* itmp = 2*lda*M */

221

lea PFAINC(pA0, itmp), itmp /* pfA = pA0 + 2*lda*M - PFAINC */

222

movl itmp, PFA /* pfA = 2*lda*M + pA0 - PFAINC */

223

sub pA0, itmp /* itmp = 2*lda*M - PFAINC*/

224

sub $PFAINC, itmp /* itmp = 2*lda*M */

225

shr $1, itmp /* itmp = lda*M */

226

movl itmp, incAn /* incAn = lda*M */

227

#else

228

229

* Get parameters moves to correct registers

230

231

movq %rdi, MM

232

movq %rsi, NN

233

movq %r8, pA1 /* pA1 = lda */

234

movq %r9, pB0 /* pB0 = B */

235

movslq 8(%rsp), pB1 /* pB1 = ldb */

236

unpcklpd %xmm1, %xmm1 /* xmm1 = {beta, beta} */

237

MOVAPD %xmm1, BETA

238

movq 16(%rsp), pC0 /* pC0 = C */

239

movslq 24(%rsp), ldc /* ldc = ldc */

240

241

* ===================================================

242

* Compute rest of needed variables using these inputs

243

* ===================================================

244

245

shl $3, pB1 /* pB1 = ldb*sizeof */

246

lea (pB1, pB1), incBn /* incBn = 2*ldb*sizeof */

247

add pB0, pB1 /* pB1 = pB0 + ldb*sizeof */

248

lea (ldc,ldc), PFA /* PFA = 2*ldc */

249

sub MM, PFA /* PFA = 2*ldc - M */

250

shl $CSH, PFA /* PFA = (2*ldc-M)*sizeof */

251

movq PFA, incCn /* incCn = (2*ldc-M)*sizeof */

252

shl $CSH, ldc /* ldc *= sizeof */

253

shl $3, pA1 /* pA1 = lda * sizeof */

254

lea (pA1, pA1), incAm /* incAm = 2*lda*sizeof */

255

mov MM, PFA /* PFA = M */

256

imulq pA1, PFA /* PFA = M * lda*sizeof */

257

movq PFA, incAn /* incAn = M*lda*sizeof */

258

lea PFAINC(pA0,PFA,2),PFA /* PFA = pA0+2*M*lda*sizeof - PFAINC */

259

add pA0, pA1 /* pA1 = pA0 + lda*sizeof */

260

mov pB0, PFB /* PBF = pB0 */

261

add incBn, PFB /* PFB = pB0 + 2*ldb*sizeof */

262

movq MM, MM0 /* MM0 = MM */

263

#endif

264

sub $2, KK /* must stop K it early to drain advance load */

265

jz K_IS_2

266

267

* Have pA/B point to end of column, so we can run loop backwards

268

269

lea (pA0, KK, 8), pA0 /* pA0 += K */

270

lea (pB0, KK, 8), pB0 /* pB0 += K */

271

lea (pA1, KK, 8), pA1 /* pA1 += K */

272

lea (pB1, KK, 8), pB1 /* pB1 += K */

273

neg KK /* KK = -K */

274

add $2, KK

275

jz K_IS_4

276

movq KK, KK0

277

#ifdef ATL_GAS_x8632

278

movl MM0, itmp

279

movl itmp, MM

280

#else

281

movq MM, MM0

282

#endif

283

#ifndef DCPLX

284

test $15, pC0

285

jnz UNALIGNED_C

286

testq $15, ldc

287

jnz UNALIGNED_C

288

289

ALIGN16

290

MNLOOP:

291

292

* Peel 1st iteration of K to avoid need to zero rCxx

293

294

MOVAB -16(pB0,KK,8), rA0

295

MOVAB -16(pA0,KK,8), rC00

296

MOVAPD rC00, rC01

297

mulpd rA0, rC00

298

#ifdef ATL_GAS_x8632

299

movq PFB, itmp

300

#else

301

#ifndef BETA0

302

#ifdef DCPLX

303

movsd (pC0), rC0

304

movhpd 16(pC0), rC0

305

#else

306

MOVAPD (pC0), rC0

307

#endif

308

#else

309

prefB((PFB))

310

#endif

311

#endif

312

MOVAB -16(pA1,KK,8), rC10

313

MOVAPD rC10, rC11

314

mulpd rA0, rC10

315

#ifdef ATL_GAS_x8632

316

prefB((itmp))

317

#else

318

#ifndef BETA0

319

#ifdef DCPLX

320

movsd (pC0,ldc), rC1

321

movhpd 16(pC0,ldc), rC1

322

#else

323

MOVAPD (pC0,ldc), rC1

324

#endif

325

#else

326

add $PFBINC, PFB

327

#endif

328

#endif

329

MOVAB -16(pB1,KK,8), rA0

330

mulpd rA0, rC01

331

MOVAB (pB0,KK,8), rB0

332

mulpd rA0, rC11

333

#if !defined(ATL_GAS_x8632) && !defined(BETA0)

334

prefB((PFB))

335

#endif

336

ALIGN16

337

KLOOP:

338

MOVAB (pA0,KK,8), rA0

339

MOVAPD rA0, ra0

340

mulpd rB0, rA0

341

addpd rA0, rC00

342

MOVAB (pA1,KK,8), rA1

343

mulpd rA1, rB0

344

addpd rB0, rC10

345

MOVAB (pB1,KK,8), rB0

346

mulpd rB0, ra0

347

mulpd rB0, rA1

348

MOVAB 16(pB0,KK,8), rB0

349

add $2, KK

350

addpd ra0, rC01

351

addpd rA1, rC11

352

jnz KLOOP

353

354

* Peel last iteration to stop forward fetch of B

355

356

MOVAB (pA0), rA0

357

#ifdef ATL_GAS_x8632

358

add $PFBINC, itmp

359

#elif defined(BETAX)

360

mulpd BETA, rC0

361

#endif

362

MOVAPD rA0, ra0

363

mulpd rB0, rA0

364

#ifdef ATL_GAS_x8632

365

movl itmp, PFB

366

#else

367

pref2((PFA))

368

#endif

369

addpd rA0, rC00

370

MOVAB (pA1), rA1

371

mulpd rA1, rB0

372

#ifdef ATL_GAS_x8632

373

movq PFA, itmp

374

#elif defined(BETAX)

375

mulpd BETA, rC1

376

#endif

377

addpd rB0, rC10

378

MOVAB (pB1), rB0

379

mulpd rB0, ra0

380

#ifdef ATL_GAS_x8632

381

prefetcht1 (itmp)

382

#elif !defined(BETA0)

383

add $PFBINC, PFB

384

#endif

385

mulpd rB0, rA1

386

#ifdef ATL_GAS_x8632

387

add $PFAINC, itmp

388

#else

389

add $PFAINC, PFA

390

#endif

391

addpd ra0, rC01

392

#ifdef ATL_GAS_x8632

393

movl itmp, PFA

394

#endif

395

addpd rA1, rC11

396

397

#ifndef ATL_SSE3

398

MOVAPD rC00, rA0 /* rA0 = c00a c00b */

399

MOVAPD rC01, rB0 /* rB0 = c01a c01b */

400

unpcklpd rC10, rC00 /* rC00 = c00a c10a */

401

unpcklpd rC11, rC01 /* rC01 = c01a c11a */

402

unpckhpd rC10, rA0 /* rA0 = c00b c10b */

403

unpckhpd rC11, rB0 /* rB0 = c01b c11b */

404

addpd rA0, rC00 /* rC00 = c00ab c10ab */

405

addpd rB0, rC01 /* rC01 = c01ab c11ab */

406

#endif

407

#ifdef ATL_GAS_x8632

408

movl ldcOFF(%esp), itmp

409

#ifdef ATL_SSE3

410

haddpd rC10, rC00

411

#endif

412

#ifdef BETAX

413

MOVAPD BETAOFF(%esp), rB0

414

MOVAPD (pC0), rA0

415

mulpd rB0, rA0

416

addpd rA0, rC00

417

#endif

418

#ifdef BETA1

419

addpd (pC0), rC00

420

#endif

421

#ifdef ATL_SSE3

422

haddpd rC11, rC01

423

#endif

424

#ifdef BETAX

425

MOVAPD (pC0,itmp), rA1

426

mulpd rB0, rA1

427

addpd rA1, rC01

428

#endif

429

#ifdef BETA1

430

addpd (pC0,itmp), rC01

431

#endif

432

#else

433

#ifdef ATL_SSE3

434

haddpd rC10, rC00

435

#endif

436

#ifndef BETA0

437

addpd rC0, rC00

438

#endif

439

#ifdef ATL_SSE3

440

haddpd rC11, rC01

441

#endif

442

#ifndef BETA0

443

addpd rC1, rC01

444

#endif

445

#endif

446

add $2*CMUL(8), pC0

447

addq incAm, pA0 /* pA0 += lda*sizeof*2 */

448

addq incAm, pA1 /* pA1 += lda*sizeof*2 */

449

subq $2, MM

450

movq KK0, KK

451

#ifdef DCPLX

452

movlpd rC00, -32(pC0)

453

movhpd rC00, -16(pC0)

454

movlpd rC01, -32(pC0,itmp)

455

movhpd rC01, -16(pC0,itmp)

456

#else

457

MOVAPD rC00, -2*CMUL(8)(pC0)

458

MOVAPD rC01, -2*CMUL(8)(pC0,itmp)

459

#endif

460

jnz MNLOOP

461

462

#ifdef ATL_GAS_x8632

463

movl MM0, itmp

464

movl itmp, MM

465

#else

466

movq MM0, MM

467

#endif

468

movq KK0, KK

469

subq incAn, pA0

470

subq incAn, pA1

471

addq incCn, pC0

472

addq incBn, pB0

473

addq incBn, pB1

474

subq $2, NN

475

jnz MNLOOP

476

#ifdef ATL_GAS_x8632

477

movl BETASZ(%esp), %ebp

478

movl BETASZ+4(%esp), %ebx

479

movl BETASZ+8(%esp), %esi

480

movl BETASZ+12(%esp), %edi

481

movl BETASZ+16(%esp), %esp /* restore saved original SP */

482

#else

483

movq -8(%rsp), %rbp

484

movq -16(%rsp), %rbx

485

movq -24(%rsp), %r12

486

movq -32(%rsp), %r13

487

movq -40(%rsp), %r14

488

movq -48(%rsp), %r15

489

#endif

490

ret

491

#endif /* end of ifndef DCPLX -- CPLX must use unaligned loads to C */

492

ALIGN16

493

494

* Code specialized for when C or ldc is not aligned to 16-byte boundary, so

495

* we must use unaligned loads. This is a big cost on Core2 systems

496

497

UNALIGNED_C:

498

499

* Peel 1st iteration of K to avoid need to zero rCxx

500

501

MOVAB -16(pB0,KK,8), rA0

502

MOVAB -16(pA0,KK,8), rC00

503

MOVAPD rC00, rC01

504

mulpd rA0, rC00

505

#ifdef ATL_GAS_x8632

506

movq PFB, itmp

507

#else

508

#ifndef BETA0

509

#ifdef DCPLX

510

movsd (pC0), rC0

511

movhpd 16(pC0), rC0

512

#else

513

MOVUPD (pC0), rC0

514

#endif

515

#else

516

prefB((PFB))

517

#endif

518

#endif

519

MOVAB -16(pA1,KK,8), rC10

520

MOVAPD rC10, rC11

521

mulpd rA0, rC10

522

#ifdef ATL_GAS_x8632

523

prefB((itmp))

524

#else

525

#ifndef BETA0

526

#ifdef DCPLX

527

movsd (pC0,ldc), rC1

528

movhpd 16(pC0,ldc), rC1

529

#else

530

MOVUPD (pC0,ldc), rC1

531

#endif

532

#else

533

add $PFBINC, PFB

534

#endif

535

#endif

536

MOVAB -16(pB1,KK,8), rA0

537

mulpd rA0, rC01

538

MOVAB (pB0,KK,8), rB0

539

mulpd rA0, rC11

540

#if !defined(ATL_GAS_x8632) && !defined(BETA0)

541

prefB((PFB))

542

#endif

543

ALIGN16

544

UKLOOP:

545

MOVAB (pA0,KK,8), rA0

546

MOVAPD rA0, ra0

547

mulpd rB0, rA0

548

addpd rA0, rC00

549

MOVAB (pA1,KK,8), rA1

550

mulpd rA1, rB0

551

addpd rB0, rC10

552

MOVAB (pB1,KK,8), rB0

553

mulpd rB0, ra0

554

mulpd rB0, rA1

555

MOVAB 16(pB0,KK,8), rB0

556

add $2, KK

557

addpd ra0, rC01

558

addpd rA1, rC11

559

jnz UKLOOP

560

561

* Peel last iteration to stop forward fetch of B

562

563

MOVAB (pA0), rA0

564

#ifdef ATL_GAS_x8632

565

add $PFBINC, itmp

566

#elif defined(BETAX)

567

mulpd BETA, rC0

568

#endif

569

MOVAPD rA0, ra0

570

mulpd rB0, rA0

571

#ifdef ATL_GAS_x8632

572

movl itmp, PFB

573

#else

574

pref2((PFA))

575

#endif

576

addpd rA0, rC00

577

MOVAB (pA1), rA1

578

mulpd rA1, rB0

579

#ifdef ATL_GAS_x8632

580

movq PFA, itmp

581

#elif defined(BETAX)

582

mulpd BETA, rC1

583

#endif

584

addpd rB0, rC10

585

MOVAB (pB1), rB0

586

mulpd rB0, ra0

587

#ifdef ATL_GAS_x8632

588

prefetcht1 (itmp)

589

#elif !defined(BETA0)

590

add $PFBINC, PFB

591

#endif

592

mulpd rB0, rA1

593

#ifdef ATL_GAS_x8632

594

add $PFAINC, itmp

595

#else

596

add $PFAINC, PFA

597

#endif

598

addpd ra0, rC01

599

#ifdef ATL_GAS_x8632

600

movl itmp, PFA

601

#endif

602

addpd rA1, rC11

603

604

#ifndef ATL_SSE3

605

MOVAPD rC00, rA0 /* rA0 = c00a c00b */

606

MOVAPD rC01, rB0 /* rB0 = c01a c01b */

607

unpcklpd rC10, rC00 /* rC00 = c00a c10a */

608

unpcklpd rC11, rC01 /* rC01 = c01a c11a */

609

unpckhpd rC10, rA0 /* rA0 = c00b c10b */

610

unpckhpd rC11, rB0 /* rB0 = c01b c11b */

611

addpd rA0, rC00 /* rC00 = c00ab c10ab */

612

addpd rB0, rC01 /* rC01 = c01ab c11ab */

613

#endif

614

#ifdef ATL_GAS_x8632

615

movl ldcOFF(%esp), itmp

616

#ifdef DCPLX

617

#ifdef ATL_SSE3

618

haddpd rC10, rC00

619

#endif

620

#ifndef BETA0

621

#ifdef BETAX

622

movapd BETAOFF(%esp), rB0

623

#endif

624

movsd (pC0), rA0

625

movhpd 16(pC0), rA0

626

#ifdef BETAX

627

mulpd rB0, rA0

628

#endif

629

addpd rA0, rC00

630

#endif

631

#ifdef ATL_SSE3

632

haddpd rC11, rC01

633

#endif

634

#ifndef BETA0

635

movsd (pC0,itmp), rA1

636

movhpd 16(pC0,itmp), rA1

637

#ifdef BETAX

638

mulpd rB0, rA1

639

#endif

640

addpd rA1, rC01

641

#endif

642

#else

643

#ifdef ATL_SSE3

644

haddpd rC10, rC00

645

#endif

646

#ifdef BETAX

647

MOVAPD BETAOFF(%esp), rB0

648

MOVUPD (pC0), rA0

649

mulpd rB0, rA0

650

addpd rA0, rC00

651

#endif

652

#ifdef BETA1

653

MOVUPD (pC0), rA0

654

addpd rA0, rC00

655

#endif

656

#ifdef ATL_SSE3

657

haddpd rC11, rC01

658

#endif

659

#ifdef BETAX

660

MOVUPD (pC0,itmp), rA1

661

mulpd rB0, rA1

662

addpd rA1, rC01

663

#endif

664

#ifdef BETA1

665

MOVUPD (pC0, itmp), rA1

666

addpd rA1, rC01

667

#endif

668

#endif

669

#else

670

#ifdef ATL_SSE3

671

haddpd rC10, rC00

672

#endif

673

#ifndef BETA0

674

addpd rC0, rC00

675

#endif

676

#ifdef ATL_SSE3

677

haddpd rC11, rC01

678

#endif

679

#ifndef BETA0

680

addpd rC1, rC01

681

#endif

682

#endif

683

add $2*CMUL(8), pC0

684

addq incAm, pA0 /* pA0 += lda*sizeof*2 */

685

addq incAm, pA1 /* pA1 += lda*sizeof*2 */

686

subq $2, MM

687

movq KK0, KK

688

#ifdef DCPLX

689

movlpd rC00, -32(pC0)

690

movhpd rC00, -16(pC0)

691

movlpd rC01, -32(pC0,itmp)

692

movhpd rC01, -16(pC0,itmp)

693

#else

694

MOVUPD rC00, -2*CMUL(8)(pC0)

695

MOVUPD rC01, -2*CMUL(8)(pC0,itmp)

696

#endif

697

jnz UNALIGNED_C

698

699

#ifdef ATL_GAS_x8632

700

movl MM0, itmp

701

movl itmp, MM

702

#else

703

movq MM0, MM

704

#endif

705

movq KK0, KK

706

subq incAn, pA0

707

subq incAn, pA1

708

addq incCn, pC0

709

addq incBn, pB0

710

addq incBn, pB1

711

subq $2, NN

712

jnz UNALIGNED_C

713

#ifdef ATL_GAS_x8632

714

movl BETASZ(%esp), %ebp

715

movl BETASZ+4(%esp), %ebx

716

movl BETASZ+8(%esp), %esi

717

movl BETASZ+12(%esp), %edi

718

movl BETASZ+16(%esp), %esp /* restore saved original SP */

719

#else

720

movq -8(%rsp), %rbp

721

movq -16(%rsp), %rbx

722

movq -24(%rsp), %r12

723

movq -32(%rsp), %r13

724

movq -40(%rsp), %r14

725

movq -48(%rsp), %r15

726

#endif

727

ret

728

729

* Code specialized for K == 2; pA0 & pAB pt to start of arrays

730

* Assume C unaligned so we don't have to write this cleanup case twice.

731

* This assumption costs you major perf. if you care about this case

732

* (since load/store of C dominant cost when K=2). This code is more for

733

* correctness than perf. as presently written.

734

735

K_IS_2:

736

#ifdef ATL_GAS_x8632

737

movq ldc, itmp

738

#endif

739

movq MM0, KK /* KK is now M-loop counter */

740

ALIGN16

741

MNLOOP_K2:

742

#ifdef BETA0

743

MOVAB (pB0), rA0

744

MOVAB (pA0), rC00

745

MOVAPD rC00, rC01

746

mulpd rA0, rC00

747

MOVAB (pA1), rC10

748

MOVAPD rC10, rC11

749

mulpd rA0, rC10

750

MOVAB (pB1), rA0

751

mulpd rA0, rC01

752

mulpd rA0, rC11

753

#else

754

movsd (pC0), rC00

755

movsd CMUL(8)(pC0), rC10

756

movsd (pC0,itmp), rC01

757

movsd CMUL(8)(pC0,itmp), rC11

758

#ifdef BETAX

759

#ifdef ATL_GAS_x8632

760

MOVAPD BETAOFF(%esp), rA1

761

mulpd rA1, rC00

762

mulpd rA1, rC10

763

mulpd rA1, rC01

764

mulpd rA1, rC11

765

#else

766

mulpd BETA, rC00

767

mulpd BETA, rC10

768

mulpd BETA, rC01

769

mulpd BETA, rC11

770

#endif

771

#endif

772

MOVAB (pA0), rA0

773

MOVAB (pB0), rB0

774

MOVAPD rA0, ra0

775

mulpd rB0, rA0

776

addpd rA0, rC00

777

MOVAB (pA1), rA1

778

mulpd rA1, rB0

779

addpd rB0, rC10

780

MOVAB (pB1), rB0

781

mulpd rB0, ra0

782

mulpd rB0, rA1

783

addpd ra0, rC01

784

addpd rA1, rC11

785

#endif

786

add $2*CMUL(8), pC0

787

#ifndef ATL_SSE3

788

MOVAPD rC00, rA0 /* rA0 = c00a c00b */

789

MOVAPD rC01, rB0 /* rB0 = c01a c01b */

790

unpcklpd rC10, rC00 /* rC00 = c00a c10a */

791

unpcklpd rC11, rC01 /* rC01 = c01a c11a */

792

unpckhpd rC10, rA0 /* rA0 = c00b c10b */

793

unpckhpd rC11, rB0 /* rB0 = c01b c11b */

794

addpd rA0, rC00 /* rC00 = c00ab c10ab */

795

addpd rB0, rC01 /* rC01 = c01ab c11ab */

796

#endif

797

#ifdef ATL_SSE3

798

haddpd rC10, rC00

799

#endif

800

addq incAm, pA0

801

#ifdef ATL_SSE3

802

haddpd rC11, rC01

803

#endif

804

addq incAm, pA1

805

sub $2, KK

806

#ifdef DCPLX

807

movlpd rC00, -32(pC0)

808

movhpd rC00, -16(pC0)

809

movlpd rC01, -32(pC0,itmp)

810

movhpd rC01, -16(pC0,itmp)

811

#else

812

MOVUPD rC00, -2*8(pC0)

813

MOVUPD rC01, -2*8(pC0,itmp)

814

#endif

815

jnz MNLOOP_K2 /* end of M-loop */

816

817

subq incAn, pA0

818

subq incAn, pA1

819

addq incCn, pC0

820

addq incBn, pB0

821

addq incBn, pB1

822

subq $2, NN

823

mov MM0, KK

824

jnz MNLOOP_K2

825

#ifdef ATL_GAS_x8632

826

movl BETASZ(%esp), %ebp

827

movl BETASZ+4(%esp), %ebx

828

movl BETASZ+8(%esp), %esi

829

movl BETASZ+12(%esp), %edi

830

movl BETASZ+16(%esp), %esp /* restore saved original SP */

831

#else

832

movq -8(%rsp), %rbp

833

movq -16(%rsp), %rbx

834

movq -24(%rsp), %r12

835

movq -32(%rsp), %r13

836

movq -40(%rsp), %r14

837

movq -48(%rsp), %r15

838

#endif

839

ret

840

841

* Code specialized for K == 4; pA0 & pAB pt to start of arrays + 16

842

* Assume C unaligned so we don't have to write this cleanup case twice.

843

* This assumption costs you major perf. if you care about this case

844

* (since load/store of C dominant cost when K=4). This code is more for

845

* correctness than perf. as presently written.

846

847

K_IS_4:

848

#ifdef ATL_GAS_x8632

849

movq ldc, itmp

850

#endif

851

movq MM0, KK /* KK is now M-loop counter */

852

ALIGN16

853

MNLOOP_K4:

854

#ifdef BETA0

855

MOVAB -16(pB0), rA0

856

MOVAB -16(pA0), rC00

857

MOVAPD rC00, rC01

858

mulpd rA0, rC00

859

MOVAB -16(pA1), rC10

860

MOVAPD rC10, rC11

861

mulpd rA0, rC10

862

MOVAB -16(pB1), rA0

863

mulpd rA0, rC01

864

MOVAB (pB0), rB0

865

mulpd rA0, rC11

866

#else

867

movsd (pC0), rC00

868

movsd CMUL(8)(pC0), rC10

869

movsd (pC0,itmp), rC01

870

movsd CMUL(8)(pC0,itmp), rC11

871

#ifdef BETAX

872

#ifdef ATL_GAS_x8632

873

MOVAPD BETAOFF(%esp), rA1

874

mulpd rA1, rC00

875

mulpd rA1, rC10

876

mulpd rA1, rC01

877

mulpd rA1, rC11

878

#else

879

mulpd BETA, rC00

880

mulpd BETA, rC10

881

mulpd BETA, rC01

882

mulpd BETA, rC11

883

#endif

884

#endif

885

MOVAB -16(pA0), rA0

886

MOVAB -16(pB0), rB0

887

MOVAPD rA0, ra0

888

mulpd rB0, rA0

889

addpd rA0, rC00

890

MOVAB -16(pA1), rA1

891

mulpd rA1, rB0

892

addpd rB0, rC10

893

MOVAB -16(pB1), rB0

894

mulpd rB0, ra0

895

mulpd rB0, rA1

896

MOVAB (pB0), rB0

897

addpd ra0, rC01

898

addpd rA1, rC11

899

#endif

900

MOVAB (pA0), rA0

901

MOVAPD rA0, ra0

902

mulpd rB0, rA0

903

addpd rA0, rC00

904

MOVAB (pA1), rA1

905

mulpd rA1, rB0

906

addpd rB0, rC10

907

MOVAB (pB1), rB0

908

mulpd rB0, ra0

909

mulpd rB0, rA1

910

addpd ra0, rC01

911

addpd rA1, rC11

912

add $2*CMUL(8), pC0

913

#ifndef ATL_SSE3

914

MOVAPD rC00, rA0 /* rA0 = c00a c00b */

915

MOVAPD rC01, rB0 /* rB0 = c01a c01b */

916

unpcklpd rC10, rC00 /* rC00 = c00a c10a */

917

unpcklpd rC11, rC01 /* rC01 = c01a c11a */

918

unpckhpd rC10, rA0 /* rA0 = c00b c10b */

919

unpckhpd rC11, rB0 /* rB0 = c01b c11b */

920

addpd rA0, rC00 /* rC00 = c00ab c10ab */

921

addpd rB0, rC01 /* rC01 = c01ab c11ab */

922

#endif

923

#ifdef ATL_SSE3

924

haddpd rC10, rC00

925

#endif

926

addq incAm, pA0

927

#ifdef ATL_SSE3

928

haddpd rC11, rC01

929

#endif

930

addq incAm, pA1

931

sub $2, KK

932

#ifdef DCPLX

933

movlpd rC00, -32(pC0)

934

movhpd rC00, -16(pC0)

935

movlpd rC01, -32(pC0,itmp)

936

movhpd rC01, -16(pC0,itmp)

937

#else

938

MOVUPD rC00, -2*CMUL(8)(pC0)

939

MOVUPD rC01, -2*CMUL(8)(pC0,itmp)

940

#endif

941

jnz MNLOOP_K4 /* end of M-loop */

942

943

subq incAn, pA0

944

subq incAn, pA1

945

addq incCn, pC0

946

addq incBn, pB0

947

addq incBn, pB1

948

subq $2, NN

949

movq MM0, KK

950

jnz MNLOOP_K4

951

#ifdef ATL_GAS_x8632

952

movl BETASZ(%esp), %ebp

953

movl BETASZ+4(%esp), %ebx

954

movl BETASZ+8(%esp), %esi

955

movl BETASZ+12(%esp), %edi

956

movl BETASZ+16(%esp), %esp /* restore saved original SP */

957

#else

958

movq -8(%rsp), %rbp

959

movq -16(%rsp), %rbx

960

movq -24(%rsp), %r12

961

movq -32(%rsp), %r13

962

movq -40(%rsp), %r14

963

movq -48(%rsp), %r15

964

#endif

965

ret

Older »