~ubuntu-branches/ubuntu/vivid/atlas/vivid

« back to all changes in this revision

Viewing changes to tune/blas/gemv/MVTCASES/ATL_sgemvT_8x4_neon.S

Committer: Package Import Robot
Author(s): Sébastien Villemot
Date: 2013-06-11 15:58:16 UTC
mfrom: (1.1.3 upstream)
mto: (2.2.21 experimental)
mto: This revision was merged to the branch mainline in revision 26.
Revision ID: package-import@ubuntu.com-20130611155816-b72z8f621tuhbzn0

Tags: upstream-3.10.1

Import upstream version 3.10.1

files added:
CONFIG/ARCHS/AMD64K10h32SSE3.tar.bz2

CONFIG/ARCHS/AMD64K10h64SSE3.tar.bz2

CONFIG/ARCHS/AMDDOZER32AVXFMA4.tar.bz2

CONFIG/ARCHS/AMDDOZER64AVXFMA4.tar.bz2

CONFIG/ARCHS/ARMv732.tar.bz2

CONFIG/ARCHS/ARMv732NEON.tar.bz2

CONFIG/ARCHS/BOZOL1.tar.bz2

CONFIG/ARCHS/Core232SSE3.tar.bz2

CONFIG/ARCHS/Core264SSE3.tar.bz2

CONFIG/ARCHS/CoreDuo32SSE3.tar.bz2

CONFIG/ARCHS/Corei132SSE3.tar.bz2

CONFIG/ARCHS/Corei164SSE3.tar.bz2

CONFIG/ARCHS/Corei232AVX.tar.bz2

CONFIG/ARCHS/Corei264AVX.tar.bz2

CONFIG/ARCHS/Corei264SSE3.tar.bz2

CONFIG/ARCHS/HAMMER64SSE3.tar.bz2

CONFIG/ARCHS/IA64Itan264.tar.bz2

CONFIG/ARCHS/IBMz1032.tar.bz2

CONFIG/ARCHS/IBMz1064.tar.bz2

CONFIG/ARCHS/IBMz19632.tar.bz2

CONFIG/ARCHS/IBMz19664.tar.bz2

CONFIG/ARCHS/K7323DNow.tar.bz2

CONFIG/ARCHS/MIPSICE932.tar.bz2

CONFIG/ARCHS/MIPSICE964.tar.bz2

CONFIG/ARCHS/MIPSR1xK64.tar.bz2

CONFIG/ARCHS/P432SSE2.tar.bz2

CONFIG/ARCHS/P4E32SSE3.tar.bz2

CONFIG/ARCHS/P4E64SSE3.tar.bz2

CONFIG/ARCHS/PIII32SSE1.tar.bz2

CONFIG/ARCHS/POWER432.tar.bz2

CONFIG/ARCHS/POWER464.tar.bz2

CONFIG/ARCHS/POWER564.tar.bz2

CONFIG/ARCHS/POWER764VSX.tar.bz2

CONFIG/ARCHS/PPCG432AltiVec.tar.bz2

CONFIG/ARCHS/PPCG532AltiVec.tar.bz2

CONFIG/ARCHS/PPCG564AltiVec.tar.bz2

CONFIG/ARCHS/PPRO32.tar.bz2

CONFIG/ARCHS/USIII32.tar.bz2

CONFIG/ARCHS/USIII64.tar.bz2

CONFIG/ARCHS/USIV32.tar.bz2

CONFIG/ARCHS/USIV64.tar.bz2

CONFIG/ARCHS/UST232.tar.bz2

CONFIG/ARCHS/UST264.tar.bz2

CONFIG/ARCHS/atlas_test1.1.3.tar.bz2

CONFIG/ARCHS/lapack_test.tar.bz2

CONFIG/ARCHS/negmmfile.c

CONFIG/ARCHS/negmvfile.c

CONFIG/ARCHS/negr1file.c

CONFIG/ARCHS/x86SSE132SSE1.tar.bz2

CONFIG/ARCHS/x86SSE232SSE2.tar.bz2

CONFIG/ARCHS/x86x8732.tar.bz2

CONFIG/include/atlas_sys.h

CONFIG/src/IsGcc.c

CONFIG/src/backend/archinfo_sfu.c

CONFIG/src/backend/archinfo_win.c

CONFIG/src/backend/probe_AVX.S

CONFIG/src/backend/probe_AVXFMA4.S

CONFIG/src/backend/probe_AVXMAC.S

CONFIG/src/backend/probe_NEON.S

CONFIG/src/backend/probe_VSX.S

CONFIG/src/backend/probe_aff_BINDP.c

CONFIG/src/backend/probe_aff_CPUSET.c

CONFIG/src/backend/probe_aff_PBIND.c

CONFIG/src/backend/probe_aff_PLPA.c

CONFIG/src/backend/probe_aff_RUNON.c

CONFIG/src/backend/probe_aff_SCHED.c

CONFIG/src/backend/probe_aff_SETAFFNP.c

CONFIG/src/backend/probe_aff_SETPROCNP.c

CONFIG/src/backend/probe_aff_WIN.c

CONFIG/src/backend/probe_aff_WIN64.c

CONFIG/src/backend/probe_dAVX.c

CONFIG/src/backend/probe_gas_arm.S

CONFIG/src/backend/probe_gas_s390.S

CONFIG/src/gcc3p.c

CONFIG/src/gnuccw.c

CONFIG/src/gnuf90w.c

CONFIG/src/mgwcmp.c

CONFIG/src/probe_aff.c

EXtest

EXtest/mvntest.c

EXtest/mvttest.c

EXtest/r1test.c

EXtest/r2test.c

bin/dlamchtest.f

bin/extract.c

bin/l2peak.sh

bin/lanbtst.c

bin/latime.c

bin/ormtst.c

bin/qrtst.c

bin/slamchtest.f

bin/stattime.c

bin/sum2csv.sh

include/C_lapack.h

include/atlas_C2Flapack.h

include/atlas_genparse.h

include/atlas_gentesttime.h

include/atlas_lamch.h

include/atlas_mmparse.h

include/atlas_mmtesttime.h

include/atlas_mvparse.h

include/atlas_mvtesttime.h

include/atlas_pca.h

include/atlas_ptalias_lapack.h

include/atlas_qrrmeth.h

include/atlas_r1parse.h

include/atlas_r1testtime.h

include/atlas_r2.h

include/atlas_r2testtime.h

include/atlas_sys.h

include/atlas_threads.h

include/atlas_tlapack.h

include/atlas_tlevel3.h

include/atlas_tlvl2.h

include/atlas_tlvl3.h

include/atlas_tvec.h

interfaces/blas/C/src/cblas_cger2c.c

interfaces/blas/C/src/cblas_cger2u.c

interfaces/blas/C/src/cblas_dger2.c

interfaces/blas/C/src/cblas_sger2.c

interfaces/blas/C/src/cblas_zger2c.c

interfaces/blas/C/src/cblas_zger2u.c

interfaces/blas/F77/src/cger2c.f

interfaces/blas/F77/src/cger2u.f

interfaces/blas/F77/src/dger2.f

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_ger2.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_ger2c.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_ger2u.c

interfaces/blas/F77/src/sger2.f

interfaces/blas/F77/src/zger2c.f

interfaces/blas/F77/src/zger2u.f

interfaces/lapack/C/src/clapack_cgelqf.c

interfaces/lapack/C/src/clapack_cgels.c

interfaces/lapack/C/src/clapack_cgeqlf.c

interfaces/lapack/C/src/clapack_cgeqrf.c

interfaces/lapack/C/src/clapack_cgerqf.c

interfaces/lapack/C/src/clapack_dgelqf.c

interfaces/lapack/C/src/clapack_dgels.c

interfaces/lapack/C/src/clapack_dgeqlf.c

interfaces/lapack/C/src/clapack_dgeqrf.c

interfaces/lapack/C/src/clapack_dgerqf.c

interfaces/lapack/C/src/clapack_dlamch.c

interfaces/lapack/C/src/clapack_ilaenv.c

interfaces/lapack/C/src/clapack_sgelqf.c

interfaces/lapack/C/src/clapack_sgels.c

interfaces/lapack/C/src/clapack_sgeqlf.c

interfaces/lapack/C/src/clapack_sgeqrf.c

interfaces/lapack/C/src/clapack_sgerqf.c

interfaces/lapack/C/src/clapack_slamch.c

interfaces/lapack/C/src/clapack_zgelqf.c

interfaces/lapack/C/src/clapack_zgels.c

interfaces/lapack/C/src/clapack_zgeqlf.c

interfaces/lapack/C/src/clapack_zgeqrf.c

interfaces/lapack/C/src/clapack_zgerqf.c

interfaces/lapack/C2F

interfaces/lapack/C2F/src

interfaces/lapack/C2F/src/ATL_C2Fgels.c

interfaces/lapack/C2F/src/ATL_C2Formlq.c

interfaces/lapack/C2F/src/ATL_C2Formql.c

interfaces/lapack/C2F/src/ATL_C2Formqr.c

interfaces/lapack/C2F/src/ATL_C2Formrq.c

interfaces/lapack/C2F/src/ATL_C2Funmlq.c

interfaces/lapack/C2F/src/ATL_C2Funmql.c

interfaces/lapack/C2F/src/ATL_C2Funmqr.c

interfaces/lapack/C2F/src/ATL_C2Funmrq.c

interfaces/lapack/F77/src/cgelqf.f

interfaces/lapack/F77/src/cgels.f

interfaces/lapack/F77/src/cgeqlf.f

interfaces/lapack/F77/src/cgeqrf.f

interfaces/lapack/F77/src/cgerqf.f

interfaces/lapack/F77/src/clarfb.f

interfaces/lapack/F77/src/clarft.f

interfaces/lapack/F77/src/dgelqf.f

interfaces/lapack/F77/src/dgels.f

interfaces/lapack/F77/src/dgeqlf.f

interfaces/lapack/F77/src/dgeqrf.f

interfaces/lapack/F77/src/dgerqf.f

interfaces/lapack/F77/src/dlamc3.f

interfaces/lapack/F77/src/dlarfb.f

interfaces/lapack/F77/src/dlarft.f

interfaces/lapack/F77/src/f77wrap/ATL_f77wrap_gelqf.c

interfaces/lapack/F77/src/f77wrap/ATL_f77wrap_gels.c

interfaces/lapack/F77/src/f77wrap/ATL_f77wrap_geqlf.c

interfaces/lapack/F77/src/f77wrap/ATL_f77wrap_geqrf.c

interfaces/lapack/F77/src/f77wrap/ATL_f77wrap_gerqf.c

interfaces/lapack/F77/src/f77wrap/ATL_f77wrap_ilaenv.c

interfaces/lapack/F77/src/f77wrap/ATL_f77wrap_larfb.c

interfaces/lapack/F77/src/f77wrap/ATL_f77wrap_larft.c

interfaces/lapack/F77/src/lamch.c

interfaces/lapack/F77/src/sgelqf.f

interfaces/lapack/F77/src/sgels.f

interfaces/lapack/F77/src/sgeqlf.f

interfaces/lapack/F77/src/sgeqrf.f

interfaces/lapack/F77/src/sgerqf.f

interfaces/lapack/F77/src/slamc3.f

interfaces/lapack/F77/src/slarfb.f

interfaces/lapack/F77/src/slarft.f

interfaces/lapack/F77/src/zgelqf.f

interfaces/lapack/F77/src/zgels.f

interfaces/lapack/F77/src/zgeqlf.f

interfaces/lapack/F77/src/zgeqrf.f

interfaces/lapack/F77/src/zgerqf.f

interfaces/lapack/F77/src/zlarfb.f

interfaces/lapack/F77/src/zlarft.f

makes/Make.C2Flp

makes/Make.EXtst

makes/Make.dummy

makes/Make.f77refblas

makes/Make.l2thr

makes/Make.l3thr

makes/Make.lathr

makes/Make.latune

makes/Make.plinc

makes/Make.res_chart

makes/Make.res_new

makes/Make.res_raw

makes/Make.res_tvec

makes/Make.thr

makes/Make.ttune

results

results/atl2tvec.c

results/cattvecs.c

results/mergetvecs.c

results/perctvecs.c

results/reducetvec.c

results/report.base

results/stattime.c

results/tvec2plp.c

src/auxil/ATL_cplxdivide.c

src/auxil/ATL_flushCacheByAddr.c

src/auxil/ATL_geApBt_NB.c

src/auxil/ATL_gecollapse.c

src/auxil/ATL_gemaxnrm.c

src/auxil/ATL_geset.c

src/auxil/ATL_geswapT.c

src/auxil/ATL_sqtrans.c

src/auxil/ATL_syApAt.c

src/auxil/ATL_syApAt_NB.c

src/auxil/ATL_tradd.c

src/auxil/ATL_trcollapse.c

src/auxil/ATL_trsetL.c

src/auxil/ATL_trsetU.c

src/blas/f77reference

src/blas/f77reference/README

src/blas/f77reference/caxpy.f

src/blas/f77reference/ccopy.f

src/blas/f77reference/cdotc.f

src/blas/f77reference/cdotu.f

src/blas/f77reference/cgbmv.f

src/blas/f77reference/cgemm.f

src/blas/f77reference/cgemv.f

src/blas/f77reference/cgerc.f

src/blas/f77reference/cgeru.f

src/blas/f77reference/chbmv.f

src/blas/f77reference/chemm.f

src/blas/f77reference/chemv.f

src/blas/f77reference/cher.f

src/blas/f77reference/cher2.f

src/blas/f77reference/cher2k.f

src/blas/f77reference/cherk.f

src/blas/f77reference/chpmv.f

src/blas/f77reference/chpr.f

src/blas/f77reference/chpr2.f

src/blas/f77reference/crotg.f

src/blas/f77reference/cscal.f

src/blas/f77reference/csrot.f

src/blas/f77reference/csscal.f

src/blas/f77reference/cswap.f

src/blas/f77reference/csymm.f

src/blas/f77reference/csyr2k.f

src/blas/f77reference/csyrk.f

src/blas/f77reference/ctbmv.f

src/blas/f77reference/ctbsv.f

src/blas/f77reference/ctpmv.f

src/blas/f77reference/ctpsv.f

src/blas/f77reference/ctrmm.f

src/blas/f77reference/ctrmv.f

src/blas/f77reference/ctrsm.f

src/blas/f77reference/ctrsv.f

src/blas/f77reference/dasum.f

src/blas/f77reference/daxpy.f

src/blas/f77reference/dcabs1.f

src/blas/f77reference/dcopy.f

src/blas/f77reference/ddot.f

src/blas/f77reference/dgbmv.f

src/blas/f77reference/dgemm.f

src/blas/f77reference/dgemv.f

src/blas/f77reference/dger.f

src/blas/f77reference/dnrm2.f

src/blas/f77reference/drot.f

src/blas/f77reference/drotg.f

src/blas/f77reference/drotm.f

src/blas/f77reference/drotmg.f

src/blas/f77reference/dsbmv.f

src/blas/f77reference/dscal.f

src/blas/f77reference/dsdot.f

src/blas/f77reference/dspmv.f

src/blas/f77reference/dspr.f

src/blas/f77reference/dspr2.f

src/blas/f77reference/dswap.f

src/blas/f77reference/dsymm.f

src/blas/f77reference/dsymv.f

src/blas/f77reference/dsyr.f

src/blas/f77reference/dsyr2.f

src/blas/f77reference/dsyr2k.f

src/blas/f77reference/dsyrk.f

src/blas/f77reference/dtbmv.f

src/blas/f77reference/dtbsv.f

src/blas/f77reference/dtpmv.f

src/blas/f77reference/dtpsv.f

src/blas/f77reference/dtrmm.f

src/blas/f77reference/dtrmv.f

src/blas/f77reference/dtrsm.f

src/blas/f77reference/dtrsv.f

src/blas/f77reference/dzasum.f

src/blas/f77reference/dznrm2.f

src/blas/f77reference/icamax.f

src/blas/f77reference/idamax.f

src/blas/f77reference/isamax.f

src/blas/f77reference/izamax.f

src/blas/f77reference/lsame.f

src/blas/f77reference/sasum.f

src/blas/f77reference/saxpy.f

src/blas/f77reference/scabs1.f

src/blas/f77reference/scasum.f

src/blas/f77reference/scnrm2.f

src/blas/f77reference/scopy.f

src/blas/f77reference/sdot.f

src/blas/f77reference/sdsdot.f

src/blas/f77reference/sgbmv.f

src/blas/f77reference/sgemm.f

src/blas/f77reference/sgemv.f

src/blas/f77reference/sger.f

src/blas/f77reference/snrm2.f

src/blas/f77reference/srot.f

src/blas/f77reference/srotg.f

src/blas/f77reference/srotm.f

src/blas/f77reference/srotmg.f

src/blas/f77reference/ssbmv.f

src/blas/f77reference/sscal.f

src/blas/f77reference/sspmv.f

src/blas/f77reference/sspr.f

src/blas/f77reference/sspr2.f

src/blas/f77reference/sswap.f

src/blas/f77reference/ssymm.f

src/blas/f77reference/ssymv.f

src/blas/f77reference/ssyr.f

src/blas/f77reference/ssyr2.f

src/blas/f77reference/ssyr2k.f

src/blas/f77reference/ssyrk.f

src/blas/f77reference/stbmv.f

src/blas/f77reference/stbsv.f

src/blas/f77reference/stpmv.f

src/blas/f77reference/stpsv.f

src/blas/f77reference/strmm.f

src/blas/f77reference/strmv.f

src/blas/f77reference/strsm.f

src/blas/f77reference/strsv.f

src/blas/f77reference/xerbla.f

src/blas/f77reference/zaxpy.f

src/blas/f77reference/zcopy.f

src/blas/f77reference/zdotc.f

src/blas/f77reference/zdotu.f

src/blas/f77reference/zdrot.f

src/blas/f77reference/zdscal.f

src/blas/f77reference/zgbmv.f

src/blas/f77reference/zgemm.f

src/blas/f77reference/zgemv.f

src/blas/f77reference/zgerc.f

src/blas/f77reference/zgeru.f

src/blas/f77reference/zhbmv.f

src/blas/f77reference/zhemm.f

src/blas/f77reference/zhemv.f

src/blas/f77reference/zher.f

src/blas/f77reference/zher2.f

src/blas/f77reference/zher2k.f

src/blas/f77reference/zherk.f

src/blas/f77reference/zhpmv.f

src/blas/f77reference/zhpr.f

src/blas/f77reference/zhpr2.f

src/blas/f77reference/zrotg.f

src/blas/f77reference/zscal.f

src/blas/f77reference/zswap.f

src/blas/f77reference/zsymm.f

src/blas/f77reference/zsyr2k.f

src/blas/f77reference/zsyrk.f

src/blas/f77reference/ztbmv.f

src/blas/f77reference/ztbsv.f

src/blas/f77reference/ztpmv.f

src/blas/f77reference/ztpsv.f

src/blas/f77reference/ztrmm.f

src/blas/f77reference/ztrmv.f

src/blas/f77reference/ztrsm.f

src/blas/f77reference/ztrsv.f

src/blas/gemv/ATL_gemvCN.c

src/blas/gemv/ATL_gemvCT.c

src/blas/gemv/ATL_gemvN.c

src/blas/gemv/ATL_gemvT.c

src/blas/gemv/ATL_mvnk_Mlt16.c

src/blas/gemv/ATL_mvnk_smallN.c

src/blas/gemv/ATL_mvtk_Mlt16.c

src/blas/gemv/ATL_mvtk_smallN.c

src/blas/ger/ATL_ger2.c

src/blas/ger/ATL_ger2k_Mlt16.c

src/blas/ger/ATL_ger2k_Nlt8.c

src/blas/ger/ATL_gerk_Mlt16.c

src/blas/ger/ATL_gerk_axpy.c

src/blas/level2/ATL_L2AIsOverlapped.c

src/blas/level3/kernel/ATL_ctrsmKL_rk2.c

src/blas/level3/kernel/ATL_ctrsmKR_rk2.c

src/blas/level3/kernel/ATL_trsmKL_rk4.c

src/blas/level3/kernel/ATL_trsmKR_rk4.c

src/lapack/ATL_gelq2.c

src/lapack/ATL_gelqf.c

src/lapack/ATL_gelqr.c

src/lapack/ATL_gels.c

src/lapack/ATL_geql2.c

src/lapack/ATL_geqlf.c

src/lapack/ATL_geqlr.c

src/lapack/ATL_geqr2.c

src/lapack/ATL_geqrf.c

src/lapack/ATL_geqrr.c

src/lapack/ATL_gerq2.c

src/lapack/ATL_gerqf.c

src/lapack/ATL_gerqr.c

src/lapack/ATL_getf2.c

src/lapack/ATL_ilaenv.c

src/lapack/ATL_lacgv.c

src/lapack/ATL_ladiv.c

src/lapack/ATL_lamch.c

src/lapack/ATL_lapy2.c

src/lapack/ATL_lapy3.c

src/lapack/ATL_larf.c

src/lapack/ATL_larfb.c

src/lapack/ATL_larfg.c

src/lapack/ATL_larft.c

src/lapack/ATL_lascl.c

src/lapack/ATL_ormlq.c

src/lapack/ATL_ormql.c

src/lapack/ATL_ormqr.c

src/lapack/ATL_ormrq.c

src/lapack/ATL_trtrs.c

src/testing/ATL_f77gelqf.c

src/testing/ATL_f77geqlf.c

src/testing/ATL_f77geqrf.c

src/testing/ATL_f77gerqf.c

src/threads

src/threads/ATL_DecAtomicCount_amd64.S

src/threads/ATL_DecAtomicCount_ia32.S

src/threads/ATL_DecAtomicCount_mips.S

src/threads/ATL_DecAtomicCount_mut.c

src/threads/ATL_DecAtomicCount_ppc.S

src/threads/ATL_DecAtomicCount_sparc.S

src/threads/ATL_DecAtomicCount_win64.S

src/threads/ATL_DecGlobalAtomicCount.c

src/threads/ATL_FreeAtomicCount_arch.c

src/threads/ATL_FreeAtomicCount_mut.c

src/threads/ATL_FreeGlobalAtomicCount.c

src/threads/ATL_GetAtomicCount.c

src/threads/ATL_GetGlobalAtomicCount.c

src/threads/ATL_ResetAtomicCount_amd64.S

src/threads/ATL_ResetAtomicCount_ia32.S

src/threads/ATL_ResetAtomicCount_mips.S

src/threads/ATL_ResetAtomicCount_mut.c

src/threads/ATL_ResetAtomicCount_ppc.S

src/threads/ATL_ResetAtomicCount_sparc.S

src/threads/ATL_ResetAtomicCount_win64.S

src/threads/ATL_ResetGlobalAtomicCount.c

src/threads/ATL_SetAtomicCount_arch.c

src/threads/ATL_SetAtomicCount_mut.c

src/threads/ATL_SetGlobalAtomicCount.c

src/threads/ATL_dyntlaunch.c

src/threads/ATL_goparallel.c

src/threads/ATL_goparallel_prank.c

src/threads/ATL_lin0tlaunch.c

src/threads/ATL_log2tlaunch.c

src/threads/ATL_mutex_free.c

src/threads/ATL_mutex_init.c

src/threads/ATL_mutex_lock.c

src/threads/ATL_mutex_trylock.c

src/threads/ATL_mutex_unlock.c

src/threads/ATL_thread_exit.c

src/threads/ATL_thread_join.c

src/threads/ATL_thread_start.c

src/threads/ATL_thread_yield.c

src/threads/blas

src/threads/blas/level2

src/threads/blas/level2/ATL_tgemv.c

src/threads/blas/level2/ATL_tger.c

src/threads/blas/level3

src/threads/blas/level3/ATL_Xtgemm.c

src/threads/blas/level3/ATL_Xtsyr2k.c

src/threads/blas/level3/ATL_Xtsyrk.c

src/threads/blas/level3/ATL_tNumGemmThreads.c

src/threads/blas/level3/ATL_tgemm.c

src/threads/blas/level3/ATL_tgemm_K.c

src/threads/blas/level3/ATL_tgemm_M.c

src/threads/blas/level3/ATL_tgemm_N.c

src/threads/blas/level3/ATL_tgemm_bigMN_Kp.c

src/threads/blas/level3/ATL_tgemm_p.c

src/threads/blas/level3/ATL_tgemm_rec.c

src/threads/blas/level3/ATL_tgemm_rkK.c

src/threads/blas/level3/ATL_themm.c

src/threads/blas/level3/ATL_ther2k.c

src/threads/blas/level3/ATL_therk.c

src/threads/blas/level3/ATL_threadMM.c

src/threads/blas/level3/ATL_tsymm.c

src/threads/blas/level3/ATL_tsyr2k.c

src/threads/blas/level3/ATL_tsyrk.c

src/threads/blas/level3/ATL_ttrmm.c

src/threads/blas/level3/ATL_ttrsm.c

src/threads/lapack

src/threads/lapack/ATL_tgeql2.c

src/threads/lapack/ATL_tgeqr2.c

src/threads/lapack/ATL_tgetf2.c

tune/blas/gemm/CASES/ATL_cmm4x4x128_av.c

tune/blas/gemm/CASES/ATL_dmm2x4x256_fma4.c

tune/blas/gemm/CASES/ATL_dmm4x2x256_avx.c

tune/blas/gemm/CASES/ATL_dmm4x4x2pf_arm.c

tune/blas/gemm/CASES/ATL_smm2x4x256_fma4.c

tune/blas/gemm/CASES/ATL_smm4x2x256_avx.c

tune/blas/gemm/CASES/ATL_smm4x4x2dld_arm.c

tune/blas/gemm/CASES/ATL_smm4x4x2pf_arm.c

tune/blas/gemm/CASES/ATL_smm4x4x4_neon.c

tune/blas/gemm/CASES/ccases.vnb

tune/blas/gemm/CASES/dcases.vnb

tune/blas/gemm/CASES/scases.vnb

tune/blas/gemm/CASES/zcases.vnb

tune/blas/gemm/gmmsearch.c

tune/blas/gemm/mmcuncpsearch.c

tune/blas/gemm/mmflagsearch.c

tune/blas/gemm/mmgen_sse.c

tune/blas/gemm/mmksearch_sse.c

tune/blas/gemm/mmtime_pt.c

tune/blas/gemv/MVNCASES

tune/blas/gemv/MVNCASES/ATL_cgemvN_8x4_sse3.c

tune/blas/gemv/MVNCASES/ATL_cgemvN_axpy.c

tune/blas/gemv/MVNCASES/ATL_gemvN_axpy.c

tune/blas/gemv/MVNCASES/ATL_gemvN_v6x8_vsx.c

tune/blas/gemv/MVNCASES/ATL_mvnk_28x1_dot.c

tune/blas/gemv/MVNCASES/ATL_sgemvN_8x4_sse.c

tune/blas/gemv/MVNCASES/Make.ext

tune/blas/gemv/MVNCASES/cmvncases.idx

tune/blas/gemv/MVNCASES/dmvncases.idx

tune/blas/gemv/MVNCASES/smvncases.idx

tune/blas/gemv/MVNCASES/zmvncases.idx

tune/blas/gemv/MVTCASES

tune/blas/gemv/MVTCASES/ATL_cgemvT_8x4_avx.c

tune/blas/gemv/MVTCASES/ATL_cgemvT_8x4_sse3.c

tune/blas/gemv/MVTCASES/ATL_cgemvT_dot.c

tune/blas/gemv/MVTCASES/ATL_dgemvT_2x8_sse3.c

tune/blas/gemv/MVTCASES/ATL_gemvT_8xv3_vsx.c

tune/blas/gemv/MVTCASES/ATL_gemvT_dot.c

tune/blas/gemv/MVTCASES/ATL_sgemvT_8x4_neon.S

tune/blas/gemv/MVTCASES/ATL_sgemvT_8x4_sse.c

tune/blas/gemv/MVTCASES/Make.ext

tune/blas/gemv/MVTCASES/cmvtcases.idx

tune/blas/gemv/MVTCASES/dmvtcases.idx

tune/blas/gemv/MVTCASES/smvtcases.idx

tune/blas/gemv/MVTCASES/zmvtcases.idx

tune/blas/gemv/atlas-l2g.base

tune/blas/gemv/mvktime.c

tune/blas/gemv/mvnhgen.c

tune/blas/gemv/mvnksearch.c

tune/blas/gemv/mvnktest.c

tune/blas/gemv/mvntest.c

tune/blas/gemv/mvthgen.c

tune/blas/gemv/mvtksearch.c

tune/blas/gemv/mvtktest.c

tune/blas/gemv/mvttest.c

tune/blas/ger/R1CASES

tune/blas/ger/R1CASES/ATL_cgerk_2x1p.c

tune/blas/ger/R1CASES/ATL_cgerk_8x4_sse3.c

tune/blas/ger/R1CASES/ATL_cgerk_axpy.c

tune/blas/ger/R1CASES/ATL_dgerk_4x8_sse.c

tune/blas/ger/R1CASES/ATL_dgerk_8x1_Cw.c

tune/blas/ger/R1CASES/ATL_gerk_1x4_0.c

tune/blas/ger/R1CASES/ATL_gerk_4x4_1.c

tune/blas/ger/R1CASES/ATL_gerk_8x4_0.c

tune/blas/ger/R1CASES/ATL_gerk_axpy.c

tune/blas/ger/R1CASES/ATL_gerk_vx4_vsx.c

tune/blas/ger/R1CASES/ATL_sgerk_8x4_sse.c

tune/blas/ger/R1CASES/ATL_zgerk_1x4_sse3.c

tune/blas/ger/R1CASES/cr1cases.idx

tune/blas/ger/R1CASES/dr1cases.idx

tune/blas/ger/R1CASES/sr1cases.idx

tune/blas/ger/R1CASES/zr1cases.idx

tune/blas/ger/R2CASES

tune/blas/ger/R2CASES/ATL_cger2k_1x1_1.c

tune/blas/ger/R2CASES/ATL_dger2k_2x2_sse3.c

tune/blas/ger/R2CASES/ATL_ger2k_1x1_1.c

tune/blas/ger/R2CASES/ATL_sger2K_NEON.S

tune/blas/ger/R2CASES/ATL_sger2K_NEON_lda4.S

tune/blas/ger/R2CASES/ATL_zger2k_2x1_sse3.c

tune/blas/ger/R2CASES/ATL_zger2k_rk2_avx.c

tune/blas/ger/R2CASES/ATL_zger2k_rk2_sse3.c

tune/blas/ger/R2CASES/cr2cases.idx

tune/blas/ger/R2CASES/dr2cases.idx

tune/blas/ger/R2CASES/sr2cases.idx

tune/blas/ger/R2CASES/zr2cases.idx

tune/blas/ger/r1hgen.c

tune/blas/ger/r1ksearch.c

tune/blas/ger/r1ktest.c

tune/blas/ger/r1ktime.c

tune/blas/ger/r1sum2csv.c

tune/blas/ger/r2hgen.c

tune/blas/ger/r2ksearch.c

tune/blas/ger/r2ktest.c

tune/blas/ger/r2ktime.c

tune/blas/ger/s1nxtune.c

tune/blas/ger/s2nxtune.c

tune/blas/level1/AXPY/zaxpy_avx.c

tune/blas/level1/DOT/zdot1_x1y1_sse2.c

tune/blas/level1/IAMAX/ciamax_avx.c

tune/blas/level1/NRM2/nrm2_ssqmax1_x1.c

tune/lapack

tune/lapack/lanbsrch.c

tune/sysinfo/emit_lamch.c

tune/sysinfo/masrch.c

tune/sysinfo/matime.c

tune/threads

tune/threads/DoFlops_amd64.S

tune/threads/probe_nthr.c

tune/threads/test_count.c

tune/threads/tune_aff.c

tune/threads/tune_count.c

tune/threads/tune_spawn.c

tune/threads/tune_spawn_fp.c

files removed:
CONFIG/ARCHS/AMD64K10h32SSE3.tgz

CONFIG/ARCHS/AMD64K10h64SSE3.tgz

CONFIG/ARCHS/BOZOL1.tgz

CONFIG/ARCHS/Core232SSE3.tgz

CONFIG/ARCHS/Core264SSE3.tgz

CONFIG/ARCHS/Corei164SSE3.tgz

CONFIG/ARCHS/HAMMER32SSE2.tgz

CONFIG/ARCHS/HAMMER32SSE3.tgz

CONFIG/ARCHS/HAMMER64SSE2.tgz

CONFIG/ARCHS/HAMMER64SSE3.tgz

CONFIG/ARCHS/IA64Itan264.tgz

CONFIG/ARCHS/MIPSICE932.tgz

CONFIG/ARCHS/MIPSICE964.tgz

CONFIG/ARCHS/MIPSR1xK64.tgz

CONFIG/ARCHS/P432SSE2.tgz

CONFIG/ARCHS/P4E32SSE3.tgz

CONFIG/ARCHS/P4E64SSE3.tgz

CONFIG/ARCHS/PIII32SSE1.tgz

CONFIG/ARCHS/POWER432.tgz

CONFIG/ARCHS/POWER464.tgz

CONFIG/ARCHS/POWER564.tgz

CONFIG/ARCHS/POWER764.tgz

CONFIG/ARCHS/PPCG432AltiVec.tgz

CONFIG/ARCHS/PPCG532AltiVec.tgz

CONFIG/ARCHS/PPCG564AltiVec.tgz

CONFIG/ARCHS/USIII32.tgz

CONFIG/ARCHS/USIII64.tgz

CONFIG/ARCHS/USIV32.tgz

CONFIG/ARCHS/USIV64.tgz

makes/Make.l1ptblas

makes/Make.l2ptblas

makes/Make.l3ptblas

makes/Make.miptblas

src/blas/level2/kernel/ATL_hbmvL.c

src/blas/level2/kernel/ATL_hbmvU.c

src/blas/level2/kernel/ATL_hemvL.c

src/blas/level2/kernel/ATL_hemvU.c

src/blas/level2/kernel/ATL_her2L.c

src/blas/level2/kernel/ATL_her2U.c

src/blas/level2/kernel/ATL_herL.c

src/blas/level2/kernel/ATL_herU.c

src/blas/level2/kernel/ATL_hpmvL.c

src/blas/level2/kernel/ATL_hpmvU.c

src/blas/level2/kernel/ATL_hpr2L.c

src/blas/level2/kernel/ATL_hpr2U.c

src/blas/level2/kernel/ATL_hprL.c

src/blas/level2/kernel/ATL_hprU.c

src/blas/level2/kernel/ATL_sbmvL.c

src/blas/level2/kernel/ATL_sbmvU.c

src/blas/level2/kernel/ATL_spmvL.c

src/blas/level2/kernel/ATL_spmvU.c

src/blas/level2/kernel/ATL_spr2L.c

src/blas/level2/kernel/ATL_spr2U.c

src/blas/level2/kernel/ATL_sprL.c

src/blas/level2/kernel/ATL_sprU.c

src/blas/level2/kernel/ATL_symvL.c

src/blas/level2/kernel/ATL_symvU.c

src/blas/level2/kernel/ATL_syr2L.c

src/blas/level2/kernel/ATL_syr2U.c

src/blas/level2/kernel/ATL_syrL.c

src/blas/level2/kernel/ATL_syrU.c

src/blas/level2/kernel/ATL_tbmvLC.c

src/blas/level2/kernel/ATL_tbmvLCN.c

src/blas/level2/kernel/ATL_tbmvLCU.c

src/blas/level2/kernel/ATL_tbmvLH.c

src/blas/level2/kernel/ATL_tbmvLHN.c

src/blas/level2/kernel/ATL_tbmvLHU.c

src/blas/level2/kernel/ATL_tbmvLN.c

src/blas/level2/kernel/ATL_tbmvLNN.c

src/blas/level2/kernel/ATL_tbmvLNU.c

src/blas/level2/kernel/ATL_tbmvLT.c

src/blas/level2/kernel/ATL_tbmvLTN.c

src/blas/level2/kernel/ATL_tbmvLTU.c

src/blas/level2/kernel/ATL_tbmvUC.c

src/blas/level2/kernel/ATL_tbmvUCN.c

src/blas/level2/kernel/ATL_tbmvUCU.c

src/blas/level2/kernel/ATL_tbmvUH.c

src/blas/level2/kernel/ATL_tbmvUHN.c

src/blas/level2/kernel/ATL_tbmvUHU.c

src/blas/level2/kernel/ATL_tbmvUN.c

src/blas/level2/kernel/ATL_tbmvUNN.c

src/blas/level2/kernel/ATL_tbmvUNU.c

src/blas/level2/kernel/ATL_tbmvUT.c

src/blas/level2/kernel/ATL_tbmvUTN.c

src/blas/level2/kernel/ATL_tbmvUTU.c

src/blas/level2/kernel/ATL_tbsvLC.c

src/blas/level2/kernel/ATL_tbsvLCN.c

src/blas/level2/kernel/ATL_tbsvLCU.c

src/blas/level2/kernel/ATL_tbsvLH.c

src/blas/level2/kernel/ATL_tbsvLHN.c

src/blas/level2/kernel/ATL_tbsvLHU.c

src/blas/level2/kernel/ATL_tbsvLN.c

src/blas/level2/kernel/ATL_tbsvLNN.c

src/blas/level2/kernel/ATL_tbsvLNU.c

src/blas/level2/kernel/ATL_tbsvLT.c

src/blas/level2/kernel/ATL_tbsvLTN.c

src/blas/level2/kernel/ATL_tbsvLTU.c

src/blas/level2/kernel/ATL_tbsvUC.c

src/blas/level2/kernel/ATL_tbsvUCN.c

src/blas/level2/kernel/ATL_tbsvUCU.c

src/blas/level2/kernel/ATL_tbsvUH.c

src/blas/level2/kernel/ATL_tbsvUHN.c

src/blas/level2/kernel/ATL_tbsvUHU.c

src/blas/level2/kernel/ATL_tbsvUN.c

src/blas/level2/kernel/ATL_tbsvUNN.c

src/blas/level2/kernel/ATL_tbsvUNU.c

src/blas/level2/kernel/ATL_tbsvUT.c

src/blas/level2/kernel/ATL_tbsvUTN.c

src/blas/level2/kernel/ATL_tbsvUTU.c

src/blas/level2/kernel/ATL_tpmvLC.c

src/blas/level2/kernel/ATL_tpmvLCN.c

src/blas/level2/kernel/ATL_tpmvLCU.c

src/blas/level2/kernel/ATL_tpmvLH.c

src/blas/level2/kernel/ATL_tpmvLHN.c

src/blas/level2/kernel/ATL_tpmvLHU.c

src/blas/level2/kernel/ATL_tpmvLN.c

src/blas/level2/kernel/ATL_tpmvLNN.c

src/blas/level2/kernel/ATL_tpmvLNU.c

src/blas/level2/kernel/ATL_tpmvLT.c

src/blas/level2/kernel/ATL_tpmvLTN.c

src/blas/level2/kernel/ATL_tpmvLTU.c

src/blas/level2/kernel/ATL_tpmvUC.c

src/blas/level2/kernel/ATL_tpmvUCN.c

src/blas/level2/kernel/ATL_tpmvUCU.c

src/blas/level2/kernel/ATL_tpmvUH.c

src/blas/level2/kernel/ATL_tpmvUHN.c

src/blas/level2/kernel/ATL_tpmvUHU.c

src/blas/level2/kernel/ATL_tpmvUN.c

src/blas/level2/kernel/ATL_tpmvUNN.c

src/blas/level2/kernel/ATL_tpmvUNU.c

src/blas/level2/kernel/ATL_tpmvUT.c

src/blas/level2/kernel/ATL_tpmvUTN.c

src/blas/level2/kernel/ATL_tpmvUTU.c

src/blas/level2/kernel/ATL_tpsvLC.c

src/blas/level2/kernel/ATL_tpsvLCN.c

src/blas/level2/kernel/ATL_tpsvLCU.c

src/blas/level2/kernel/ATL_tpsvLH.c

src/blas/level2/kernel/ATL_tpsvLHN.c

src/blas/level2/kernel/ATL_tpsvLHU.c

src/blas/level2/kernel/ATL_tpsvLN.c

src/blas/level2/kernel/ATL_tpsvLNN.c

src/blas/level2/kernel/ATL_tpsvLNU.c

src/blas/level2/kernel/ATL_tpsvLT.c

src/blas/level2/kernel/ATL_tpsvLTN.c

src/blas/level2/kernel/ATL_tpsvLTU.c

src/blas/level2/kernel/ATL_tpsvUC.c

src/blas/level2/kernel/ATL_tpsvUCN.c

src/blas/level2/kernel/ATL_tpsvUCU.c

src/blas/level2/kernel/ATL_tpsvUH.c

src/blas/level2/kernel/ATL_tpsvUHN.c

src/blas/level2/kernel/ATL_tpsvUHU.c

src/blas/level2/kernel/ATL_tpsvUN.c

src/blas/level2/kernel/ATL_tpsvUNN.c

src/blas/level2/kernel/ATL_tpsvUNU.c

src/blas/level2/kernel/ATL_tpsvUT.c

src/blas/level2/kernel/ATL_tpsvUTN.c

src/blas/level2/kernel/ATL_tpsvUTU.c

src/blas/level2/kernel/ATL_trmvLC.c

src/blas/level2/kernel/ATL_trmvLCN.c

src/blas/level2/kernel/ATL_trmvLCU.c

src/blas/level2/kernel/ATL_trmvLH.c

src/blas/level2/kernel/ATL_trmvLHN.c

src/blas/level2/kernel/ATL_trmvLHU.c

src/blas/level2/kernel/ATL_trmvLN.c

src/blas/level2/kernel/ATL_trmvLNN.c

src/blas/level2/kernel/ATL_trmvLNU.c

src/blas/level2/kernel/ATL_trmvLT.c

src/blas/level2/kernel/ATL_trmvLTN.c

src/blas/level2/kernel/ATL_trmvLTU.c

src/blas/level2/kernel/ATL_trmvUC.c

src/blas/level2/kernel/ATL_trmvUCN.c

src/blas/level2/kernel/ATL_trmvUCU.c

src/blas/level2/kernel/ATL_trmvUH.c

src/blas/level2/kernel/ATL_trmvUHN.c

src/blas/level2/kernel/ATL_trmvUHU.c

src/blas/level2/kernel/ATL_trmvUNN.c

src/blas/level2/kernel/ATL_trmvUNU.c

src/blas/level2/kernel/ATL_trmvUT.c

src/blas/level2/kernel/ATL_trmvUTN.c

src/blas/level2/kernel/ATL_trmvUTU.c

src/blas/level2/kernel/ATL_trsvLC.c

src/blas/level2/kernel/ATL_trsvLCN.c

src/blas/level2/kernel/ATL_trsvLCU.c

src/blas/level2/kernel/ATL_trsvLH.c

src/blas/level2/kernel/ATL_trsvLHN.c

src/blas/level2/kernel/ATL_trsvLHU.c

src/blas/level2/kernel/ATL_trsvLN.c

src/blas/level2/kernel/ATL_trsvLNN.c

src/blas/level2/kernel/ATL_trsvLNU.c

src/blas/level2/kernel/ATL_trsvLT.c

src/blas/level2/kernel/ATL_trsvLTN.c

src/blas/level2/kernel/ATL_trsvLTU.c

src/blas/level2/kernel/ATL_trsvUC.c

src/blas/level2/kernel/ATL_trsvUCN.c

src/blas/level2/kernel/ATL_trsvUCU.c

src/blas/level2/kernel/ATL_trsvUH.c

src/blas/level2/kernel/ATL_trsvUHN.c

src/blas/level2/kernel/ATL_trsvUHU.c

src/blas/level2/kernel/ATL_trsvUN.c

src/blas/level2/kernel/ATL_trsvUNN.c

src/blas/level2/kernel/ATL_trsvUNU.c

src/blas/level2/kernel/ATL_trsvUT.c

src/blas/level2/kernel/ATL_trsvUTN.c

src/blas/level2/kernel/ATL_trsvUTU.c

src/pthreads

src/pthreads/blas

src/pthreads/blas/level1

src/pthreads/blas/level1/README

src/pthreads/blas/level2

src/pthreads/blas/level2/README

src/pthreads/blas/level3

src/pthreads/blas/level3/ATL_Sgemm.c

src/pthreads/blas/level3/ATL_Ssymm.c

src/pthreads/blas/level3/ATL_Ssyr2k.c

src/pthreads/blas/level3/ATL_Ssyrk.c

src/pthreads/blas/level3/ATL_Strmm.c

src/pthreads/blas/level3/ATL_Strsm.c

src/pthreads/blas/level3/ATL_ptgemm.c

src/pthreads/blas/level3/ATL_pthemm.c

src/pthreads/blas/level3/ATL_pther2k.c

src/pthreads/blas/level3/ATL_ptherk.c

src/pthreads/blas/level3/ATL_ptl3settype.c

src/pthreads/blas/level3/ATL_ptsymm.c

src/pthreads/blas/level3/ATL_ptsyr2k.c

src/pthreads/blas/level3/ATL_ptsyrk.c

src/pthreads/blas/level3/ATL_pttrmm.c

src/pthreads/blas/level3/ATL_pttrsm.c

src/pthreads/misc

src/pthreads/misc/ATL_1dsplit.c

src/pthreads/misc/ATL_Sgeadd.c

src/pthreads/misc/ATL_Sgescal.c

src/pthreads/misc/ATL_Sgezero.c

src/pthreads/misc/ATL_Stzscal.c

src/pthreads/misc/ATL_apply_tree.c

src/pthreads/misc/ATL_create_tree.c

src/pthreads/misc/ATL_free_node.c

src/pthreads/misc/ATL_free_tree.c

src/pthreads/misc/ATL_init_node.c

src/pthreads/misc/ATL_join_tree.c

src/pthreads/misc/ATL_print_node_id.c

src/pthreads/misc/ATL_ptgeadd.c

src/pthreads/misc/ATL_ptgescal.c

src/pthreads/misc/ATL_ptgezero.c

src/pthreads/misc/ATL_pthescal.c

src/pthreads/misc/ATL_pttrscal.c

src/pthreads/misc/ATL_signal_tree.c

src/pthreads/misc/ATL_thread_exit.c

src/pthreads/misc/ATL_thread_init.c

src/pthreads/misc/ATL_thread_tree.c

src/pthreads/misc/ATL_traverse_tree.c

src/pthreads/misc/ATL_tzsplit.c

src/pthreads/misc/ATL_wait_tree.c

tune/blas/gemv/ATL_gemv.c

tune/blas/gemv/ATL_symv.c

tune/blas/gemv/CASES

tune/blas/gemv/CASES/ATL_cgemvN_1x1_1.c

tune/blas/gemv/CASES/ATL_cgemvN_1x1_1a.c

tune/blas/gemv/CASES/ATL_cgemvN_2x2_0.c

tune/blas/gemv/CASES/ATL_cgemvN_4x2_1.c

tune/blas/gemv/CASES/ATL_cgemvN_mm.c

tune/blas/gemv/CASES/ATL_cgemvT_1x1_1.c

tune/blas/gemv/CASES/ATL_cgemvT_2x2_0.c

tune/blas/gemv/CASES/ATL_cgemvT_2x4_1.c

tune/blas/gemv/CASES/ATL_cgemvT_mm.c

tune/blas/gemv/CASES/ATL_gemvN_16x2_1.c

tune/blas/gemv/CASES/ATL_gemvN_16x4_1.c

tune/blas/gemv/CASES/ATL_gemvN_1x1_1.c

tune/blas/gemv/CASES/ATL_gemvN_1x1_1a.c

tune/blas/gemv/CASES/ATL_gemvN_32x4_1.c

tune/blas/gemv/CASES/ATL_gemvN_4x2_0.c

tune/blas/gemv/CASES/ATL_gemvN_4x4_1.c

tune/blas/gemv/CASES/ATL_gemvN_8x32_2.c

tune/blas/gemv/CASES/ATL_gemvN_8x4_1.c

tune/blas/gemv/CASES/ATL_gemvN_SSE.c

tune/blas/gemv/CASES/ATL_gemvN_dummy.c

tune/blas/gemv/CASES/ATL_gemvN_dummy2.c

tune/blas/gemv/CASES/ATL_gemvN_mm.c

tune/blas/gemv/CASES/ATL_gemvT_1x1_1.c

tune/blas/gemv/CASES/ATL_gemvT_2x16_1.c

tune/blas/gemv/CASES/ATL_gemvT_2x8_0.c

tune/blas/gemv/CASES/ATL_gemvT_4x16_1.c

tune/blas/gemv/CASES/ATL_gemvT_4x8_1.c

tune/blas/gemv/CASES/ATL_gemvT_SSE.c

tune/blas/gemv/CASES/ATL_gemvT_dummy.c

tune/blas/gemv/CASES/ATL_gemvT_dummy2.c

tune/blas/gemv/CASES/ATL_gemvT_mm.c

tune/blas/gemv/CASES/ATL_gemv_SSE.c

tune/blas/gemv/CASES/ccases.dsc

tune/blas/gemv/CASES/dcases.dsc

tune/blas/gemv/CASES/scases.dsc

tune/blas/gemv/CASES/zcases.dsc

tune/blas/gemv/emit_head.c

tune/blas/gemv/emit_rmvT.c

tune/blas/gemv/gemvtune.c

tune/blas/gemv/mvsearch.c

tune/blas/gemv/mvtest.c

tune/blas/ger/ATL_ger.c

tune/blas/ger/CASES

tune/blas/ger/CASES/ATL_cger1_2x1p.c

tune/blas/ger/CASES/ATL_cger1_axpy.c

tune/blas/ger/CASES/ATL_cger1_dummy.c

tune/blas/ger/CASES/ATL_ger1_1x4_0.c

tune/blas/ger/CASES/ATL_ger1_4x4_1.c

tune/blas/ger/CASES/ATL_ger1_8x4_0.c

tune/blas/ger/CASES/ATL_ger1_SSE.c

tune/blas/ger/CASES/ATL_ger1_axpy.c

tune/blas/ger/CASES/ccases.dsc

tune/blas/ger/CASES/dcases.dsc

tune/blas/ger/CASES/scases.dsc

tune/blas/ger/CASES/zcases.dsc

tune/blas/ger/emit_r1h.c

tune/blas/ger/ger1tune.c

tune/blas/ger/r1search.c

tune/blas/ger/r1test.c

tune/sysinfo/findNT.c

tune/sysinfo/masearch.c

files modified:
CONFIG/ARCHS/CreateDef.sh

CONFIG/ARCHS/CreateDirs.sh

CONFIG/ARCHS/CreateTar.sh

CONFIG/ARCHS/Make.ext

CONFIG/ARCHS/Makefile

CONFIG/ARCHS/negflt.c

CONFIG/Make.ext

CONFIG/include/Make.ext

CONFIG/include/atlas_asm.h

CONFIG/include/atlconf.h

CONFIG/include/atlconf_misc.h

CONFIG/src/Make.ext

CONFIG/src/Makefile

CONFIG/src/SpewMakeInc.c

CONFIG/src/atlbench.c

CONFIG/src/atlcomp.txt

CONFIG/src/atlconf_misc.c

CONFIG/src/backend/Make.ext

CONFIG/src/backend/archinfo_aix.c

CONFIG/src/backend/archinfo_freebsd.c

CONFIG/src/backend/archinfo_irix.c

CONFIG/src/backend/archinfo_linux.c

CONFIG/src/backend/archinfo_sunos.c

CONFIG/src/backend/archinfo_x86.c

CONFIG/src/backend/c2cmaster.c

CONFIG/src/backend/comptestC.c

CONFIG/src/backend/flibchkC.c

CONFIG/src/backend/probe_AltiVec.S

CONFIG/src/backend/probe_dSSE3.c

CONFIG/src/backend/probe_dvec.c

CONFIG/src/backend/probe_svec.c

CONFIG/src/backend/probe_this_asm.c

CONFIG/src/config.c

CONFIG/src/print_enums.c

CONFIG/src/probe_OS.c

CONFIG/src/probe_arch.c

CONFIG/src/probe_asm.c

CONFIG/src/probe_comp.c

CONFIG/src/probe_f2c.c

CONFIG/src/probe_pmake.c

CONFIG/src/probe_vec.c

CONFIG/src/wincc.c

CONFIG/src/winf77.c

INSTALL.txt

Make.top

bin/atlas_install.c

bin/atlas_tee.c

bin/atlas_waitfile.c

bin/ccobj.c

bin/gemmtst.c

bin/gpmmtst.c

bin/invtst.c

bin/l1blastst.c

bin/l2blastst.c

bin/l3blastst.c

bin/llttst.c

bin/lutst.c

bin/print_buildinfo.c

bin/printblk.c

bin/slvtst.c

bin/substr.c

bin/trtritst.c

bin/uumtst.c

configure

doc/AtlasCredits.txt

doc/BootSequence.txt

doc/ChangeLog

doc/LibReadme.txt

doc/TestTime.txt

doc/TroubleShoot.txt

doc/Windows.txt

include/atlas_altivec.h

include/atlas_asm.h

include/atlas_aux.h

include/atlas_cblascalias.h

include/atlas_cblasdalias.h

include/atlas_cblassalias.h

include/atlas_cblaszalias.h

include/atlas_enum.h

include/atlas_f77.h

include/atlas_f77wrap.h

include/atlas_kern3.h

include/atlas_kernel2.h

include/atlas_kernel3.h

include/atlas_lapack.h

include/atlas_level1.h

include/atlas_level2.h

include/atlas_level3.h

include/atlas_lvl2.h

include/atlas_lvl3.h

include/atlas_misc.h

include/atlas_mv.h

include/atlas_pkblas.h

include/atlas_prefetch.h

include/atlas_ptalias1.h

include/atlas_ptalias2.h

include/atlas_ptalias3.h

include/atlas_ptlevel3.h

include/atlas_ptlvl3.h

include/atlas_ptmisc.h

include/atlas_r1.h

include/atlas_rblas3.h

include/atlas_refalias1.h

include/atlas_refalias2.h

include/atlas_refalias3.h

include/atlas_reflevel1.h

include/atlas_reflevel2.h

include/atlas_reflevel3.h

include/atlas_reflvl2.h

include/atlas_reflvl3.h

include/atlas_refmisc.h

include/atlas_tst.h

include/cblas.h

include/clapack.h

include/contrib/ATL_gemv_ger_SSE.h

include/contrib/Make.ext

include/contrib/SSE3Dnow.h

include/contrib/camm_util.h

include/f77wrap_lapack.h

interfaces/blas/C/src/catlas_caxpby.c

interfaces/blas/C/src/catlas_cset.c

interfaces/blas/C/src/catlas_daxpby.c

interfaces/blas/C/src/catlas_dset.c

interfaces/blas/C/src/catlas_saxpby.c

interfaces/blas/C/src/catlas_sset.c

interfaces/blas/C/src/catlas_zaxpby.c

interfaces/blas/C/src/catlas_zset.c

interfaces/blas/C/src/cblas_caxpy.c

interfaces/blas/C/src/cblas_ccopy.c

interfaces/blas/C/src/cblas_cdotc.c

interfaces/blas/C/src/cblas_cdotu.c

interfaces/blas/C/src/cblas_cgbmv.c

interfaces/blas/C/src/cblas_cgemm.c

interfaces/blas/C/src/cblas_cgemv.c

interfaces/blas/C/src/cblas_cgerc.c

interfaces/blas/C/src/cblas_cgeru.c

interfaces/blas/C/src/cblas_chbmv.c

interfaces/blas/C/src/cblas_chemm.c

interfaces/blas/C/src/cblas_chemv.c

interfaces/blas/C/src/cblas_cher.c

interfaces/blas/C/src/cblas_cher2.c

interfaces/blas/C/src/cblas_cher2k.c

interfaces/blas/C/src/cblas_cherk.c

interfaces/blas/C/src/cblas_chpmv.c

interfaces/blas/C/src/cblas_chpr.c

interfaces/blas/C/src/cblas_chpr2.c

interfaces/blas/C/src/cblas_crotg.c

interfaces/blas/C/src/cblas_cscal.c

interfaces/blas/C/src/cblas_csrot.c

interfaces/blas/C/src/cblas_csscal.c

interfaces/blas/C/src/cblas_cswap.c

interfaces/blas/C/src/cblas_csymm.c

interfaces/blas/C/src/cblas_csyr2k.c

interfaces/blas/C/src/cblas_csyrk.c

interfaces/blas/C/src/cblas_ctbmv.c

interfaces/blas/C/src/cblas_ctbsv.c

interfaces/blas/C/src/cblas_ctpmv.c

interfaces/blas/C/src/cblas_ctpsv.c

interfaces/blas/C/src/cblas_ctrmm.c

interfaces/blas/C/src/cblas_ctrmv.c

interfaces/blas/C/src/cblas_ctrsm.c

interfaces/blas/C/src/cblas_ctrsv.c

interfaces/blas/C/src/cblas_dasum.c

interfaces/blas/C/src/cblas_daxpy.c

interfaces/blas/C/src/cblas_dcopy.c

interfaces/blas/C/src/cblas_ddot.c

interfaces/blas/C/src/cblas_dgbmv.c

interfaces/blas/C/src/cblas_dgemm.c

interfaces/blas/C/src/cblas_dgemv.c

interfaces/blas/C/src/cblas_dger.c

interfaces/blas/C/src/cblas_dnrm2.c

interfaces/blas/C/src/cblas_drot.c

interfaces/blas/C/src/cblas_drotg.c

interfaces/blas/C/src/cblas_drotm.c

interfaces/blas/C/src/cblas_drotmg.c

interfaces/blas/C/src/cblas_dsbmv.c

interfaces/blas/C/src/cblas_dscal.c

interfaces/blas/C/src/cblas_dsdot.c

interfaces/blas/C/src/cblas_dspmv.c

interfaces/blas/C/src/cblas_dspr.c

interfaces/blas/C/src/cblas_dspr2.c

interfaces/blas/C/src/cblas_dswap.c

interfaces/blas/C/src/cblas_dsymm.c

interfaces/blas/C/src/cblas_dsymv.c

interfaces/blas/C/src/cblas_dsyr.c

interfaces/blas/C/src/cblas_dsyr2.c

interfaces/blas/C/src/cblas_dsyr2k.c

interfaces/blas/C/src/cblas_dsyrk.c

interfaces/blas/C/src/cblas_dtbmv.c

interfaces/blas/C/src/cblas_dtbsv.c

interfaces/blas/C/src/cblas_dtpmv.c

interfaces/blas/C/src/cblas_dtpsv.c

interfaces/blas/C/src/cblas_dtrmm.c

interfaces/blas/C/src/cblas_dtrmv.c

interfaces/blas/C/src/cblas_dtrsm.c

interfaces/blas/C/src/cblas_dtrsv.c

interfaces/blas/C/src/cblas_dzasum.c

interfaces/blas/C/src/cblas_dznrm2.c

interfaces/blas/C/src/cblas_errprn.c

interfaces/blas/C/src/cblas_icamax.c

interfaces/blas/C/src/cblas_idamax.c

interfaces/blas/C/src/cblas_isamax.c

interfaces/blas/C/src/cblas_izamax.c

interfaces/blas/C/src/cblas_sasum.c

interfaces/blas/C/src/cblas_saxpy.c

interfaces/blas/C/src/cblas_scasum.c

interfaces/blas/C/src/cblas_scnrm2.c

interfaces/blas/C/src/cblas_scopy.c

interfaces/blas/C/src/cblas_sdot.c

interfaces/blas/C/src/cblas_sdsdot.c

interfaces/blas/C/src/cblas_sgbmv.c

interfaces/blas/C/src/cblas_sgemm.c

interfaces/blas/C/src/cblas_sgemv.c

interfaces/blas/C/src/cblas_sger.c

interfaces/blas/C/src/cblas_snrm2.c

interfaces/blas/C/src/cblas_srot.c

interfaces/blas/C/src/cblas_srotg.c

interfaces/blas/C/src/cblas_srotm.c

interfaces/blas/C/src/cblas_srotmg.c

interfaces/blas/C/src/cblas_ssbmv.c

interfaces/blas/C/src/cblas_sscal.c

interfaces/blas/C/src/cblas_sspmv.c

interfaces/blas/C/src/cblas_sspr.c

interfaces/blas/C/src/cblas_sspr2.c

interfaces/blas/C/src/cblas_sswap.c

interfaces/blas/C/src/cblas_ssymm.c

interfaces/blas/C/src/cblas_ssymv.c

interfaces/blas/C/src/cblas_ssyr.c

interfaces/blas/C/src/cblas_ssyr2.c

interfaces/blas/C/src/cblas_ssyr2k.c

interfaces/blas/C/src/cblas_ssyrk.c

interfaces/blas/C/src/cblas_stbmv.c

interfaces/blas/C/src/cblas_stbsv.c

interfaces/blas/C/src/cblas_stpmv.c

interfaces/blas/C/src/cblas_stpsv.c

interfaces/blas/C/src/cblas_strmm.c

interfaces/blas/C/src/cblas_strmv.c

interfaces/blas/C/src/cblas_strsm.c

interfaces/blas/C/src/cblas_strsv.c

interfaces/blas/C/src/cblas_xerbla.c

interfaces/blas/C/src/cblas_zaxpy.c

interfaces/blas/C/src/cblas_zcopy.c

interfaces/blas/C/src/cblas_zdotc.c

interfaces/blas/C/src/cblas_zdotu.c

interfaces/blas/C/src/cblas_zdrot.c

interfaces/blas/C/src/cblas_zdscal.c

interfaces/blas/C/src/cblas_zgbmv.c

interfaces/blas/C/src/cblas_zgemm.c

interfaces/blas/C/src/cblas_zgemv.c

interfaces/blas/C/src/cblas_zgerc.c

interfaces/blas/C/src/cblas_zgeru.c

interfaces/blas/C/src/cblas_zhbmv.c

interfaces/blas/C/src/cblas_zhemm.c

interfaces/blas/C/src/cblas_zhemv.c

interfaces/blas/C/src/cblas_zher.c

interfaces/blas/C/src/cblas_zher2.c

interfaces/blas/C/src/cblas_zher2k.c

interfaces/blas/C/src/cblas_zherk.c

interfaces/blas/C/src/cblas_zhpmv.c

interfaces/blas/C/src/cblas_zhpr.c

interfaces/blas/C/src/cblas_zhpr2.c

interfaces/blas/C/src/cblas_zrotg.c

interfaces/blas/C/src/cblas_zscal.c

interfaces/blas/C/src/cblas_zswap.c

interfaces/blas/C/src/cblas_zsymm.c

interfaces/blas/C/src/cblas_zsyr2k.c

interfaces/blas/C/src/cblas_zsyrk.c

interfaces/blas/C/src/cblas_ztbmv.c

interfaces/blas/C/src/cblas_ztbsv.c

interfaces/blas/C/src/cblas_ztpmv.c

interfaces/blas/C/src/cblas_ztpsv.c

interfaces/blas/C/src/cblas_ztrmm.c

interfaces/blas/C/src/cblas_ztrmv.c

interfaces/blas/C/src/cblas_ztrsm.c

interfaces/blas/C/src/cblas_ztrsv.c

interfaces/blas/C/testing/axpbytst.c

interfaces/blas/C/testing/c_cblat2.f

interfaces/blas/C/testing/c_cblat3.f

interfaces/blas/C/testing/c_dblat2.f

interfaces/blas/C/testing/c_dblat3.f

interfaces/blas/C/testing/c_sblat2.f

interfaces/blas/C/testing/c_sblat3.f

interfaces/blas/C/testing/c_zblat2.f

interfaces/blas/C/testing/c_zblat3.f

interfaces/blas/C/testing/settst.c

interfaces/blas/F77/src/caxpy.f

interfaces/blas/F77/src/ccopy.f

interfaces/blas/F77/src/cdotc.f

interfaces/blas/F77/src/cdotu.f

interfaces/blas/F77/src/cgbmv.f

interfaces/blas/F77/src/cgemm.f

interfaces/blas/F77/src/cgemv.f

interfaces/blas/F77/src/cgerc.f

interfaces/blas/F77/src/cgeru.f

interfaces/blas/F77/src/chbmv.f

interfaces/blas/F77/src/chemm.f

interfaces/blas/F77/src/chemv.f

interfaces/blas/F77/src/cher.f

interfaces/blas/F77/src/cher2.f

interfaces/blas/F77/src/cher2k.f

interfaces/blas/F77/src/cherk.f

interfaces/blas/F77/src/chpmv.f

interfaces/blas/F77/src/chpr.f

interfaces/blas/F77/src/chpr2.f

interfaces/blas/F77/src/crotg.f

interfaces/blas/F77/src/cscal.f

interfaces/blas/F77/src/csrot.f

interfaces/blas/F77/src/csscal.f

interfaces/blas/F77/src/cswap.f

interfaces/blas/F77/src/csymm.f

interfaces/blas/F77/src/csyr2k.f

interfaces/blas/F77/src/csyrk.f

interfaces/blas/F77/src/ctbmv.f

interfaces/blas/F77/src/ctbsv.f

interfaces/blas/F77/src/ctpmv.f

interfaces/blas/F77/src/ctpsv.f

interfaces/blas/F77/src/ctrmm.f

interfaces/blas/F77/src/ctrmv.f

interfaces/blas/F77/src/ctrsm.f

interfaces/blas/F77/src/ctrsv.f

interfaces/blas/F77/src/dasum.f

interfaces/blas/F77/src/daxpy.f

interfaces/blas/F77/src/dcabs1.f

interfaces/blas/F77/src/dcopy.f

interfaces/blas/F77/src/ddot.f

interfaces/blas/F77/src/dgbmv.f

interfaces/blas/F77/src/dgemm.f

interfaces/blas/F77/src/dgemv.f

interfaces/blas/F77/src/dger.f

interfaces/blas/F77/src/dnrm2.f

interfaces/blas/F77/src/drot.f

interfaces/blas/F77/src/drotg.f

interfaces/blas/F77/src/drotm.f

interfaces/blas/F77/src/drotmg.f

interfaces/blas/F77/src/dsbmv.f

interfaces/blas/F77/src/dscal.f

interfaces/blas/F77/src/dsdot.f

interfaces/blas/F77/src/dspmv.f

interfaces/blas/F77/src/dspr.f

interfaces/blas/F77/src/dspr2.f

interfaces/blas/F77/src/dswap.f

interfaces/blas/F77/src/dsymm.f

interfaces/blas/F77/src/dsymv.f

interfaces/blas/F77/src/dsyr.f

interfaces/blas/F77/src/dsyr2.f

interfaces/blas/F77/src/dsyr2k.f

interfaces/blas/F77/src/dsyrk.f

interfaces/blas/F77/src/dtbmv.f

interfaces/blas/F77/src/dtbsv.f

interfaces/blas/F77/src/dtpmv.f

interfaces/blas/F77/src/dtpsv.f

interfaces/blas/F77/src/dtrmm.f

interfaces/blas/F77/src/dtrmv.f

interfaces/blas/F77/src/dtrsm.f

interfaces/blas/F77/src/dtrsv.f

interfaces/blas/F77/src/dzasum.f

interfaces/blas/F77/src/dznrm2.f

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_amax.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_asum.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_axpy.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_copy.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_dot.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_dotc.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_dotu.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_dsdot.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_gbmv.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_gemm.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_gemv.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_ger.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_gerc.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_geru.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_hbmv.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_hemm.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_hemv.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_her.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_her2.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_her2k.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_herk.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_hpmv.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_hpr.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_hpr2.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_nrm2.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_rot.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_rotg.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_rotm.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_rotmg.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_rscal.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_sbmv.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_scal.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_sdsdot.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_spmv.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_spr.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_spr2.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_swap.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_symm.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_symv.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_syr.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_syr2.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_syr2k.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_syrk.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_tbmv.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_tbsv.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_tpmv.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_tpsv.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_trmm.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_trmv.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_trsm.c

interfaces/blas/F77/src/f77wrap/ATL_F77wrap_trsv.c

interfaces/blas/F77/src/f77wrap/fatlas_axpby.c

interfaces/blas/F77/src/f77wrap/fatlas_set.c

interfaces/blas/F77/src/icamax.f

interfaces/blas/F77/src/idamax.f

interfaces/blas/F77/src/isamax.f

interfaces/blas/F77/src/izamax.f

interfaces/blas/F77/src/lsame.f

interfaces/blas/F77/src/sasum.f

interfaces/blas/F77/src/saxpy.f

interfaces/blas/F77/src/scasum.f

interfaces/blas/F77/src/scnrm2.f

interfaces/blas/F77/src/scopy.f

interfaces/blas/F77/src/sdot.f

interfaces/blas/F77/src/sdsdot.f

interfaces/blas/F77/src/sgbmv.f

interfaces/blas/F77/src/sgemm.f

interfaces/blas/F77/src/sgemv.f

interfaces/blas/F77/src/sger.f

interfaces/blas/F77/src/snrm2.f

interfaces/blas/F77/src/srot.f

interfaces/blas/F77/src/srotg.f

interfaces/blas/F77/src/srotm.f

interfaces/blas/F77/src/srotmg.f

interfaces/blas/F77/src/ssbmv.f

interfaces/blas/F77/src/sscal.f

interfaces/blas/F77/src/sspmv.f

interfaces/blas/F77/src/sspr.f

interfaces/blas/F77/src/sspr2.f

interfaces/blas/F77/src/sswap.f

interfaces/blas/F77/src/ssymm.f

interfaces/blas/F77/src/ssymv.f

interfaces/blas/F77/src/ssyr.f

interfaces/blas/F77/src/ssyr2.f

interfaces/blas/F77/src/ssyr2k.f

interfaces/blas/F77/src/ssyrk.f

interfaces/blas/F77/src/stbmv.f

interfaces/blas/F77/src/stbsv.f

interfaces/blas/F77/src/stpmv.f

interfaces/blas/F77/src/stpsv.f

interfaces/blas/F77/src/strmm.f

interfaces/blas/F77/src/strmv.f

interfaces/blas/F77/src/strsm.f

interfaces/blas/F77/src/strsv.f

interfaces/blas/F77/src/xerbla.f

interfaces/blas/F77/src/zaxpy.f

interfaces/blas/F77/src/zcopy.f

interfaces/blas/F77/src/zdotc.f

interfaces/blas/F77/src/zdotu.f

interfaces/blas/F77/src/zdrot.f

interfaces/blas/F77/src/zdscal.f

interfaces/blas/F77/src/zgbmv.f

interfaces/blas/F77/src/zgemm.f

interfaces/blas/F77/src/zgemv.f

interfaces/blas/F77/src/zgerc.f

interfaces/blas/F77/src/zgeru.f

interfaces/blas/F77/src/zhbmv.f

interfaces/blas/F77/src/zhemm.f

interfaces/blas/F77/src/zhemv.f

interfaces/blas/F77/src/zher.f

interfaces/blas/F77/src/zher2.f

interfaces/blas/F77/src/zher2k.f

interfaces/blas/F77/src/zherk.f

interfaces/blas/F77/src/zhpmv.f

interfaces/blas/F77/src/zhpr.f

interfaces/blas/F77/src/zhpr2.f

interfaces/blas/F77/src/zrotg.f

interfaces/blas/F77/src/zscal.f

interfaces/blas/F77/src/zswap.f

interfaces/blas/F77/src/zsymm.f

interfaces/blas/F77/src/zsyr2k.f

interfaces/blas/F77/src/zsyrk.f

interfaces/blas/F77/src/ztbmv.f

interfaces/blas/F77/src/ztbsv.f

interfaces/blas/F77/src/ztpmv.f

interfaces/blas/F77/src/ztpsv.f

interfaces/blas/F77/src/ztrmm.f

interfaces/blas/F77/src/ztrmv.f

interfaces/blas/F77/src/ztrsm.f

interfaces/blas/F77/src/ztrsv.f

interfaces/blas/F77/testing/axpbytst.c

interfaces/blas/F77/testing/cblat2.f

interfaces/blas/F77/testing/cblat3.f

interfaces/blas/F77/testing/dblat2.f

interfaces/blas/F77/testing/dblat3.f

interfaces/blas/F77/testing/sblat2.f

interfaces/blas/F77/testing/sblat3.f

interfaces/blas/F77/testing/settst.c

interfaces/blas/F77/testing/zblat2.f

interfaces/blas/F77/testing/zblat3.f

interfaces/lapack/C/src/clapack_cgesv.c

interfaces/lapack/C/src/clapack_cgetrf.c

interfaces/lapack/C/src/clapack_cgetri.c

interfaces/lapack/C/src/clapack_cgetrs.c

interfaces/lapack/C/src/clapack_clauum.c

interfaces/lapack/C/src/clapack_cposv.c

interfaces/lapack/C/src/clapack_cpotrf.c

interfaces/lapack/C/src/clapack_cpotri.c

interfaces/lapack/C/src/clapack_cpotrs.c

interfaces/lapack/C/src/clapack_ctrtri.c

interfaces/lapack/C/src/clapack_dgesv.c

interfaces/lapack/C/src/clapack_dgetrf.c

interfaces/lapack/C/src/clapack_dgetri.c

interfaces/lapack/C/src/clapack_dgetrs.c

interfaces/lapack/C/src/clapack_dlauum.c

interfaces/lapack/C/src/clapack_dposv.c

interfaces/lapack/C/src/clapack_dpotrf.c

interfaces/lapack/C/src/clapack_dpotri.c

interfaces/lapack/C/src/clapack_dpotrs.c

interfaces/lapack/C/src/clapack_dtrtri.c

interfaces/lapack/C/src/clapack_sgesv.c

interfaces/lapack/C/src/clapack_sgetrf.c

interfaces/lapack/C/src/clapack_sgetri.c

interfaces/lapack/C/src/clapack_sgetrs.c

interfaces/lapack/C/src/clapack_slauum.c

interfaces/lapack/C/src/clapack_sposv.c

interfaces/lapack/C/src/clapack_spotrf.c

interfaces/lapack/C/src/clapack_spotri.c

interfaces/lapack/C/src/clapack_spotrs.c

interfaces/lapack/C/src/clapack_strtri.c

interfaces/lapack/C/src/clapack_zgesv.c

interfaces/lapack/C/src/clapack_zgetrf.c

interfaces/lapack/C/src/clapack_zgetri.c

interfaces/lapack/C/src/clapack_zgetrs.c

interfaces/lapack/C/src/clapack_zlauum.c

interfaces/lapack/C/src/clapack_zposv.c

interfaces/lapack/C/src/clapack_zpotrf.c

interfaces/lapack/C/src/clapack_zpotri.c

interfaces/lapack/C/src/clapack_zpotrs.c

interfaces/lapack/C/src/clapack_ztrtri.c

interfaces/lapack/F77/src/f77wrap/ATL_f77wrap_gesv.c

interfaces/lapack/F77/src/f77wrap/ATL_f77wrap_getnb.c

interfaces/lapack/F77/src/f77wrap/ATL_f77wrap_getrf.c

interfaces/lapack/F77/src/f77wrap/ATL_f77wrap_getri.c

interfaces/lapack/F77/src/f77wrap/ATL_f77wrap_getrs.c

interfaces/lapack/F77/src/f77wrap/ATL_f77wrap_lauum.c

interfaces/lapack/F77/src/f77wrap/ATL_f77wrap_posv.c

interfaces/lapack/F77/src/f77wrap/ATL_f77wrap_potrf.c

interfaces/lapack/F77/src/f77wrap/ATL_f77wrap_potri.c

interfaces/lapack/F77/src/f77wrap/ATL_f77wrap_potrs.c

interfaces/lapack/F77/src/f77wrap/ATL_f77wrap_trtri.c

interfaces/lapack/F77/src/ilaenv.f

lib/Make.ext

makes/Make.Clp

makes/Make.Flp

makes/Make.aux

makes/Make.bin

makes/Make.cblas

makes/Make.cblastst

makes/Make.ext

makes/Make.f77blas

makes/Make.f77blastst

makes/Make.l1tune

makes/Make.l2

makes/Make.l2aux

makes/Make.l3kern

makes/Make.l3tune

makes/Make.lib

makes/Make.lpsrc

makes/Make.mmsrc

makes/Make.mmtune

makes/Make.mvsrc

makes/Make.mvtune

makes/Make.r1src

makes/Make.r1tune

makes/Make.sysinfo

makes/Make.tstsrc

src/auxil/ATL_axpby.c

src/auxil/ATL_axpy.c

src/auxil/ATL_buildinfo.c

src/auxil/ATL_copy.c

src/auxil/ATL_cplxinvert.c

src/auxil/ATL_flushcache.c

src/auxil/ATL_geadd.c

src/auxil/ATL_gecopy.c

src/auxil/ATL_gemove.c

src/auxil/ATL_gemoveT.c

src/auxil/ATL_gescal.c

src/auxil/ATL_gezero.c

src/auxil/ATL_hereflect.c

src/auxil/ATL_hescal.c

src/auxil/ATL_lcm.c

src/auxil/ATL_move.c

src/auxil/ATL_ptflushcache.c

src/auxil/ATL_scal.c

src/auxil/ATL_set.c

src/auxil/ATL_syreflect.c

src/auxil/ATL_trscal.c

src/auxil/ATL_xerbla.c

src/auxil/ATL_zero.c

src/auxil/kernel/ATL_axpby.c

src/auxil/kernel/ATL_axpy_x1_y1.c

src/auxil/kernel/ATL_caxpy_x1_y1.c

src/auxil/kernel/ATL_geadd.c

src/auxil/kernel/ATL_gemove.c

src/auxil/kernel/ATL_gescal.c

src/blas/gemm/ATL_AgemmXX.c

src/blas/gemm/ATL_CNBmm_b0.c

src/blas/gemm/ATL_CNBmm_b1.c

src/blas/gemm/ATL_CNBmm_bX.c

src/blas/gemm/ATL_GetNB.c

src/blas/gemm/ATL_GetNCNB.c

src/blas/gemm/ATL_IBJBmm.c

src/blas/gemm/ATL_IBNBmm.c

src/blas/gemm/ATL_MBJBmm.c

src/blas/gemm/ATL_NCmmIJK.c

src/blas/gemm/ATL_NCmmIJK_c.c

src/blas/gemm/ATL_NCmmJIK.c

src/blas/gemm/ATL_NCmmJIK_c.c

src/blas/gemm/ATL_cNCmmIJK.c

src/blas/gemm/ATL_cNCmmIJK_c.c

src/blas/gemm/ATL_cNCmmJIK.c

src/blas/gemm/ATL_cNCmmJIK_c.c

src/blas/gemm/ATL_ccol2blk.c

src/blas/gemm/ATL_cmmIJK.c

src/blas/gemm/ATL_cmmJIK.c

src/blas/gemm/ATL_cmmJITcp.c

src/blas/gemm/ATL_cmmJKI.c

src/blas/gemm/ATL_col2blk.c

src/blas/gemm/ATL_crow2blkT.c

src/blas/gemm/ATL_gemm.c

src/blas/gemm/ATL_gemmXX.c

src/blas/gemm/ATL_gereal2cplx.c

src/blas/gemm/ATL_mmBPP.c

src/blas/gemm/ATL_mmIJK.c

src/blas/gemm/ATL_mmJIK.c

src/blas/gemm/ATL_mmJITcp.c

src/blas/gemm/ATL_mmJKI.c

src/blas/gemm/ATL_mmK.c

src/blas/gemm/ATL_putblk.c

src/blas/gemm/ATL_row2blkT.c

src/blas/gemm/UMMEXAMPLE/ATLU_usergemm.c

src/blas/gemm/UMMEXAMPLE/Makefile

src/blas/gemv/ATL_gemv.c

src/blas/ger/ATL_ger.c

src/blas/level1/ATL_dsdot.c

src/blas/level1/ATL_rot.c

src/blas/level1/ATL_rotg.c

src/blas/level1/ATL_rotm.c

src/blas/level1/ATL_rotmg.c

src/blas/level1/ATL_sdsdot.c

src/blas/level2/ATL_gbmv.c

src/blas/level2/ATL_gpmv.c

src/blas/level2/ATL_gpr.c

src/blas/level2/ATL_gprc.c

src/blas/level2/ATL_gpru.c

src/blas/level2/ATL_hbmv.c

src/blas/level2/ATL_hemv.c

src/blas/level2/ATL_her.c

src/blas/level2/ATL_her2.c

src/blas/level2/ATL_hpmv.c

src/blas/level2/ATL_hpr.c

src/blas/level2/ATL_hpr2.c

src/blas/level2/ATL_sbmv.c

src/blas/level2/ATL_spmv.c

src/blas/level2/ATL_spr.c

src/blas/level2/ATL_spr2.c

src/blas/level2/ATL_symv.c

src/blas/level2/ATL_syr.c

src/blas/level2/ATL_syr2.c

src/blas/level2/ATL_tbmv.c

src/blas/level2/ATL_tbsv.c

src/blas/level2/ATL_tpmv.c

src/blas/level2/ATL_tpsv.c

src/blas/level2/ATL_trmv.c

src/blas/level2/ATL_trsv.c

src/blas/level2/kernel/ATL_trmvUN.c

src/blas/level3/ATL_hemm.c

src/blas/level3/ATL_her2k.c

src/blas/level3/ATL_herk.c

src/blas/level3/ATL_symm.c

src/blas/level3/ATL_syr2k.c

src/blas/level3/ATL_syrk.c

src/blas/level3/ATL_trmm.c

src/blas/level3/ATL_trsm.c

src/blas/level3/kernel/ATL_CtrsmK.c

src/blas/level3/kernel/ATL_hemmL.c

src/blas/level3/kernel/ATL_hemmR.c

src/blas/level3/kernel/ATL_her2k.c

src/blas/level3/kernel/ATL_herk_N.c

src/blas/level3/kernel/ATL_herk_T.c

src/blas/level3/kernel/ATL_sycopyL.c

src/blas/level3/kernel/ATL_sycopyU.c

src/blas/level3/kernel/ATL_symmL.c

src/blas/level3/kernel/ATL_symmR.c

src/blas/level3/kernel/ATL_syr2k_N.c

src/blas/level3/kernel/ATL_syr2k_T.c

src/blas/level3/kernel/ATL_syr2k_putL.c

src/blas/level3/kernel/ATL_syr2k_putU.c

src/blas/level3/kernel/ATL_syrk_N.c

src/blas/level3/kernel/ATL_syrk_T.c

src/blas/level3/kernel/ATL_trcopyL2L.c

src/blas/level3/kernel/ATL_trcopyL2U.c

src/blas/level3/kernel/ATL_trcopyU2L.c

src/blas/level3/kernel/ATL_trcopyU2U.c

src/blas/level3/kernel/ATL_trinvert.c

src/blas/level3/kernel/ATL_trmmL.c

src/blas/level3/kernel/ATL_trmmR.c

src/blas/level3/kernel/ATL_trmv_scal.c

src/blas/level3/kernel/ATL_trputL.c

src/blas/level3/kernel/ATL_trputU.c

src/blas/level3/kernel/ATL_trsmKL.c

src/blas/level3/kernel/ATL_trsmKR.c

src/blas/level3/kernel/ATL_trsmL.c

src/blas/level3/kernel/ATL_trsmR.c

src/blas/level3/rblas/ATL_gemmRB.c

src/blas/level3/rblas/ATL_rhemmLL.c

src/blas/level3/rblas/ATL_rhemmLU.c

src/blas/level3/rblas/ATL_rhemmRL.c

src/blas/level3/rblas/ATL_rhemmRU.c

src/blas/level3/rblas/ATL_rher2kLC.c

src/blas/level3/rblas/ATL_rher2kLN.c

src/blas/level3/rblas/ATL_rher2kUC.c

src/blas/level3/rblas/ATL_rher2kUN.c

src/blas/level3/rblas/ATL_rherkLC.c

src/blas/level3/rblas/ATL_rherkLN.c

src/blas/level3/rblas/ATL_rherkUC.c

src/blas/level3/rblas/ATL_rherkUN.c

src/blas/level3/rblas/ATL_rsymmLL.c

src/blas/level3/rblas/ATL_rsymmLU.c

src/blas/level3/rblas/ATL_rsymmRL.c

src/blas/level3/rblas/ATL_rsymmRU.c

src/blas/level3/rblas/ATL_rsyr2kLN.c

src/blas/level3/rblas/ATL_rsyr2kLT.c

src/blas/level3/rblas/ATL_rsyr2kUN.c

src/blas/level3/rblas/ATL_rsyr2kUT.c

src/blas/level3/rblas/ATL_rsyrkLN.c

src/blas/level3/rblas/ATL_rsyrkLT.c

src/blas/level3/rblas/ATL_rsyrkUN.c

src/blas/level3/rblas/ATL_rsyrkUT.c

src/blas/level3/rblas/ATL_rtrmmLLC.c

src/blas/level3/rblas/ATL_rtrmmLLN.c

src/blas/level3/rblas/ATL_rtrmmLLT.c

src/blas/level3/rblas/ATL_rtrmmLUC.c

src/blas/level3/rblas/ATL_rtrmmLUN.c

src/blas/level3/rblas/ATL_rtrmmLUT.c

src/blas/level3/rblas/ATL_rtrmmRLC.c

src/blas/level3/rblas/ATL_rtrmmRLN.c

src/blas/level3/rblas/ATL_rtrmmRLT.c

src/blas/level3/rblas/ATL_rtrmmRUC.c

src/blas/level3/rblas/ATL_rtrmmRUN.c

src/blas/level3/rblas/ATL_rtrmmRUT.c

src/blas/level3/rblas/ATL_rtrsmLLC.c

src/blas/level3/rblas/ATL_rtrsmLLN.c

src/blas/level3/rblas/ATL_rtrsmLLT.c

src/blas/level3/rblas/ATL_rtrsmLUC.c

src/blas/level3/rblas/ATL_rtrsmLUN.c

src/blas/level3/rblas/ATL_rtrsmLUT.c

src/blas/level3/rblas/ATL_rtrsmRLC.c

src/blas/level3/rblas/ATL_rtrsmRLN.c

src/blas/level3/rblas/ATL_rtrsmRLT.c

src/blas/level3/rblas/ATL_rtrsmRUC.c

src/blas/level3/rblas/ATL_rtrsmRUN.c

src/blas/level3/rblas/ATL_rtrsmRUT.c

src/blas/pklevel3/gpmm/ATL_cpcol2blk.c

src/blas/pklevel3/gpmm/ATL_cpmmJIK.c

src/blas/pklevel3/gpmm/ATL_cpputblk.c

src/blas/pklevel3/gpmm/ATL_cprow2blkT.c

src/blas/pklevel3/gpmm/ATL_gpmm.c

src/blas/pklevel3/gpmm/ATL_pcol2blk.c

src/blas/pklevel3/gpmm/ATL_pmmJIK.c

src/blas/pklevel3/gpmm/ATL_pputblk.c

src/blas/pklevel3/gpmm/ATL_prankK.c

src/blas/pklevel3/gpmm/ATL_prow2blkT.c

src/blas/pklevel3/sprk/ATL_cpputblk_aX.c

src/blas/pklevel3/sprk/ATL_cprk_kmm.c

src/blas/pklevel3/sprk/ATL_hprk.c

src/blas/pklevel3/sprk/ATL_hprk_rK.c

src/blas/pklevel3/sprk/ATL_phk_kmm.c

src/blas/pklevel3/sprk/ATL_pputblk_aX.c

src/blas/pklevel3/sprk/ATL_prk_kmm.c

src/blas/pklevel3/sprk/ATL_sprk.c

src/blas/pklevel3/sprk/ATL_sprk_rK.c

src/blas/reference/level1/ATL_crefaxpy.c

src/blas/reference/level1/ATL_crefcopy.c

src/blas/reference/level1/ATL_crefdotc_sub.c

src/blas/reference/level1/ATL_crefdotu_sub.c

src/blas/reference/level1/ATL_crefrotg.c

src/blas/reference/level1/ATL_crefscal.c

src/blas/reference/level1/ATL_crefswap.c

src/blas/reference/level1/ATL_csrefrot.c

src/blas/reference/level1/ATL_csrefscal.c

src/blas/reference/level1/ATL_drefasum.c

src/blas/reference/level1/ATL_drefaxpy.c

src/blas/reference/level1/ATL_drefcopy.c

src/blas/reference/level1/ATL_drefdot.c

src/blas/reference/level1/ATL_drefnrm2.c

src/blas/reference/level1/ATL_drefrot.c

src/blas/reference/level1/ATL_drefrotg.c

src/blas/reference/level1/ATL_drefrotm.c

src/blas/reference/level1/ATL_drefrotmg.c

src/blas/reference/level1/ATL_drefscal.c

src/blas/reference/level1/ATL_drefswap.c

src/blas/reference/level1/ATL_dsrefdot.c

src/blas/reference/level1/ATL_dzrefasum.c

src/blas/reference/level1/ATL_dzrefnrm2.c

src/blas/reference/level1/ATL_icrefamax.c

src/blas/reference/level1/ATL_idrefamax.c

src/blas/reference/level1/ATL_isrefamax.c

src/blas/reference/level1/ATL_izrefamax.c

src/blas/reference/level1/ATL_screfasum.c

src/blas/reference/level1/ATL_screfnrm2.c

src/blas/reference/level1/ATL_sdsrefdot.c

src/blas/reference/level1/ATL_srefasum.c

src/blas/reference/level1/ATL_srefaxpy.c

src/blas/reference/level1/ATL_srefcopy.c

src/blas/reference/level1/ATL_srefdot.c

src/blas/reference/level1/ATL_srefnrm2.c

src/blas/reference/level1/ATL_srefrot.c

src/blas/reference/level1/ATL_srefrotg.c

src/blas/reference/level1/ATL_srefrotm.c

src/blas/reference/level1/ATL_srefrotmg.c

src/blas/reference/level1/ATL_srefscal.c

src/blas/reference/level1/ATL_srefswap.c

src/blas/reference/level1/ATL_zdrefrot.c

src/blas/reference/level1/ATL_zdrefscal.c

src/blas/reference/level1/ATL_zrefaxpy.c

src/blas/reference/level1/ATL_zrefcopy.c

src/blas/reference/level1/ATL_zrefdotc_sub.c

src/blas/reference/level1/ATL_zrefdotu_sub.c

src/blas/reference/level1/ATL_zrefrotg.c

src/blas/reference/level1/ATL_zrefscal.c

src/blas/reference/level1/ATL_zrefswap.c

src/blas/reference/level2/ATL_crefgbmv.c

src/blas/reference/level2/ATL_crefgbmvC.c

src/blas/reference/level2/ATL_crefgbmvH.c

src/blas/reference/level2/ATL_crefgbmvN.c

src/blas/reference/level2/ATL_crefgbmvT.c

src/blas/reference/level2/ATL_crefgemv.c

src/blas/reference/level2/ATL_crefgemvC.c

src/blas/reference/level2/ATL_crefgemvH.c

src/blas/reference/level2/ATL_crefgemvN.c

src/blas/reference/level2/ATL_crefgemvT.c

src/blas/reference/level2/ATL_crefgerc.c

src/blas/reference/level2/ATL_crefgeru.c

src/blas/reference/level2/ATL_crefgpmv.c

src/blas/reference/level2/ATL_crefgpmvLC.c

src/blas/reference/level2/ATL_crefgpmvLH.c

src/blas/reference/level2/ATL_crefgpmvLN.c

src/blas/reference/level2/ATL_crefgpmvLT.c

src/blas/reference/level2/ATL_crefgpmvUC.c

src/blas/reference/level2/ATL_crefgpmvUH.c

src/blas/reference/level2/ATL_crefgpmvUN.c

src/blas/reference/level2/ATL_crefgpmvUT.c

src/blas/reference/level2/ATL_crefgprc.c

src/blas/reference/level2/ATL_crefgpru.c

src/blas/reference/level2/ATL_crefhbmv.c

src/blas/reference/level2/ATL_crefhbmvL.c

src/blas/reference/level2/ATL_crefhbmvU.c

src/blas/reference/level2/ATL_crefhemv.c

src/blas/reference/level2/ATL_crefhemvL.c

src/blas/reference/level2/ATL_crefhemvU.c

src/blas/reference/level2/ATL_crefher.c

src/blas/reference/level2/ATL_crefher2.c

src/blas/reference/level2/ATL_crefher2L.c

src/blas/reference/level2/ATL_crefher2U.c

src/blas/reference/level2/ATL_crefherL.c

src/blas/reference/level2/ATL_crefherU.c

src/blas/reference/level2/ATL_crefhpmv.c

src/blas/reference/level2/ATL_crefhpmvL.c

src/blas/reference/level2/ATL_crefhpmvU.c

src/blas/reference/level2/ATL_crefhpr.c

src/blas/reference/level2/ATL_crefhpr2.c

src/blas/reference/level2/ATL_crefhpr2L.c

src/blas/reference/level2/ATL_crefhpr2U.c

src/blas/reference/level2/ATL_crefhprL.c

src/blas/reference/level2/ATL_crefhprU.c

src/blas/reference/level2/ATL_creftbmv.c

src/blas/reference/level2/ATL_creftbmvLCN.c

src/blas/reference/level2/ATL_creftbmvLCU.c

src/blas/reference/level2/ATL_creftbmvLHN.c

src/blas/reference/level2/ATL_creftbmvLHU.c

src/blas/reference/level2/ATL_creftbmvLNN.c

src/blas/reference/level2/ATL_creftbmvLNU.c

src/blas/reference/level2/ATL_creftbmvLTN.c

src/blas/reference/level2/ATL_creftbmvLTU.c

src/blas/reference/level2/ATL_creftbmvUCN.c

src/blas/reference/level2/ATL_creftbmvUCU.c

src/blas/reference/level2/ATL_creftbmvUHN.c

src/blas/reference/level2/ATL_creftbmvUHU.c

src/blas/reference/level2/ATL_creftbmvUNN.c

src/blas/reference/level2/ATL_creftbmvUNU.c

src/blas/reference/level2/ATL_creftbmvUTN.c

src/blas/reference/level2/ATL_creftbmvUTU.c

src/blas/reference/level2/ATL_creftbsv.c

src/blas/reference/level2/ATL_creftbsvLCN.c

src/blas/reference/level2/ATL_creftbsvLCU.c

src/blas/reference/level2/ATL_creftbsvLHN.c

src/blas/reference/level2/ATL_creftbsvLHU.c

src/blas/reference/level2/ATL_creftbsvLNN.c

src/blas/reference/level2/ATL_creftbsvLNU.c

src/blas/reference/level2/ATL_creftbsvLTN.c

src/blas/reference/level2/ATL_creftbsvLTU.c

src/blas/reference/level2/ATL_creftbsvUCN.c

src/blas/reference/level2/ATL_creftbsvUCU.c

src/blas/reference/level2/ATL_creftbsvUHN.c

src/blas/reference/level2/ATL_creftbsvUHU.c

src/blas/reference/level2/ATL_creftbsvUNN.c

src/blas/reference/level2/ATL_creftbsvUNU.c

src/blas/reference/level2/ATL_creftbsvUTN.c

src/blas/reference/level2/ATL_creftbsvUTU.c

src/blas/reference/level2/ATL_creftpmv.c

src/blas/reference/level2/ATL_creftpmvLCN.c

src/blas/reference/level2/ATL_creftpmvLCU.c

src/blas/reference/level2/ATL_creftpmvLHN.c

src/blas/reference/level2/ATL_creftpmvLHU.c

src/blas/reference/level2/ATL_creftpmvLNN.c

src/blas/reference/level2/ATL_creftpmvLNU.c

src/blas/reference/level2/ATL_creftpmvLTN.c

src/blas/reference/level2/ATL_creftpmvLTU.c

src/blas/reference/level2/ATL_creftpmvUCN.c

src/blas/reference/level2/ATL_creftpmvUCU.c

src/blas/reference/level2/ATL_creftpmvUHN.c

src/blas/reference/level2/ATL_creftpmvUHU.c

src/blas/reference/level2/ATL_creftpmvUNN.c

src/blas/reference/level2/ATL_creftpmvUNU.c

src/blas/reference/level2/ATL_creftpmvUTN.c

src/blas/reference/level2/ATL_creftpmvUTU.c

src/blas/reference/level2/ATL_creftpsv.c

src/blas/reference/level2/ATL_creftpsvLCN.c

src/blas/reference/level2/ATL_creftpsvLCU.c

src/blas/reference/level2/ATL_creftpsvLHN.c

src/blas/reference/level2/ATL_creftpsvLHU.c

src/blas/reference/level2/ATL_creftpsvLNN.c

src/blas/reference/level2/ATL_creftpsvLNU.c

src/blas/reference/level2/ATL_creftpsvLTN.c

src/blas/reference/level2/ATL_creftpsvLTU.c

src/blas/reference/level2/ATL_creftpsvUCN.c

src/blas/reference/level2/ATL_creftpsvUCU.c

src/blas/reference/level2/ATL_creftpsvUHN.c

src/blas/reference/level2/ATL_creftpsvUHU.c

src/blas/reference/level2/ATL_creftpsvUNN.c

src/blas/reference/level2/ATL_creftpsvUNU.c

src/blas/reference/level2/ATL_creftpsvUTN.c

src/blas/reference/level2/ATL_creftpsvUTU.c

src/blas/reference/level2/ATL_creftrmv.c

src/blas/reference/level2/ATL_creftrmvLCN.c

src/blas/reference/level2/ATL_creftrmvLCU.c

src/blas/reference/level2/ATL_creftrmvLHN.c

src/blas/reference/level2/ATL_creftrmvLHU.c

src/blas/reference/level2/ATL_creftrmvLNN.c

src/blas/reference/level2/ATL_creftrmvLNU.c

src/blas/reference/level2/ATL_creftrmvLTN.c

src/blas/reference/level2/ATL_creftrmvLTU.c

src/blas/reference/level2/ATL_creftrmvUCN.c

src/blas/reference/level2/ATL_creftrmvUCU.c

src/blas/reference/level2/ATL_creftrmvUHN.c

src/blas/reference/level2/ATL_creftrmvUHU.c

src/blas/reference/level2/ATL_creftrmvUNN.c

src/blas/reference/level2/ATL_creftrmvUNU.c

src/blas/reference/level2/ATL_creftrmvUTN.c

src/blas/reference/level2/ATL_creftrmvUTU.c

src/blas/reference/level2/ATL_creftrsv.c

src/blas/reference/level2/ATL_creftrsvLCN.c

src/blas/reference/level2/ATL_creftrsvLCU.c

src/blas/reference/level2/ATL_creftrsvLHN.c

src/blas/reference/level2/ATL_creftrsvLHU.c

src/blas/reference/level2/ATL_creftrsvLNN.c

src/blas/reference/level2/ATL_creftrsvLNU.c

src/blas/reference/level2/ATL_creftrsvLTN.c

src/blas/reference/level2/ATL_creftrsvLTU.c

src/blas/reference/level2/ATL_creftrsvUCN.c

src/blas/reference/level2/ATL_creftrsvUCU.c

src/blas/reference/level2/ATL_creftrsvUHN.c

src/blas/reference/level2/ATL_creftrsvUHU.c

src/blas/reference/level2/ATL_creftrsvUNN.c

src/blas/reference/level2/ATL_creftrsvUNU.c

src/blas/reference/level2/ATL_creftrsvUTN.c

src/blas/reference/level2/ATL_creftrsvUTU.c

src/blas/reference/level2/ATL_drefgbmv.c

src/blas/reference/level2/ATL_drefgbmvN.c

src/blas/reference/level2/ATL_drefgbmvT.c

src/blas/reference/level2/ATL_drefgemv.c

src/blas/reference/level2/ATL_drefgemvN.c

src/blas/reference/level2/ATL_drefgemvT.c

src/blas/reference/level2/ATL_drefger.c

src/blas/reference/level2/ATL_drefgpmv.c

src/blas/reference/level2/ATL_drefgpmvLN.c

src/blas/reference/level2/ATL_drefgpmvLT.c

src/blas/reference/level2/ATL_drefgpmvUN.c

src/blas/reference/level2/ATL_drefgpmvUT.c

src/blas/reference/level2/ATL_drefgpr.c

src/blas/reference/level2/ATL_drefsbmv.c

src/blas/reference/level2/ATL_drefsbmvL.c

src/blas/reference/level2/ATL_drefsbmvU.c

src/blas/reference/level2/ATL_drefspmv.c

src/blas/reference/level2/ATL_drefspmvL.c

src/blas/reference/level2/ATL_drefspmvU.c

src/blas/reference/level2/ATL_drefspr.c

src/blas/reference/level2/ATL_drefspr2.c

src/blas/reference/level2/ATL_drefspr2L.c

src/blas/reference/level2/ATL_drefspr2U.c

src/blas/reference/level2/ATL_drefsprL.c

src/blas/reference/level2/ATL_drefsprU.c

src/blas/reference/level2/ATL_drefsymv.c

src/blas/reference/level2/ATL_drefsymvL.c

src/blas/reference/level2/ATL_drefsymvU.c

src/blas/reference/level2/ATL_drefsyr.c

src/blas/reference/level2/ATL_drefsyr2.c

src/blas/reference/level2/ATL_drefsyr2L.c

src/blas/reference/level2/ATL_drefsyr2U.c

src/blas/reference/level2/ATL_drefsyrL.c

src/blas/reference/level2/ATL_drefsyrU.c

src/blas/reference/level2/ATL_dreftbmv.c

src/blas/reference/level2/ATL_dreftbmvLNN.c

src/blas/reference/level2/ATL_dreftbmvLNU.c

src/blas/reference/level2/ATL_dreftbmvLTN.c

src/blas/reference/level2/ATL_dreftbmvLTU.c

src/blas/reference/level2/ATL_dreftbmvUNN.c

src/blas/reference/level2/ATL_dreftbmvUNU.c

src/blas/reference/level2/ATL_dreftbmvUTN.c

src/blas/reference/level2/ATL_dreftbmvUTU.c

src/blas/reference/level2/ATL_dreftbsv.c

src/blas/reference/level2/ATL_dreftbsvLNN.c

src/blas/reference/level2/ATL_dreftbsvLNU.c

src/blas/reference/level2/ATL_dreftbsvLTN.c

src/blas/reference/level2/ATL_dreftbsvLTU.c

src/blas/reference/level2/ATL_dreftbsvUNN.c

src/blas/reference/level2/ATL_dreftbsvUNU.c

src/blas/reference/level2/ATL_dreftbsvUTN.c

src/blas/reference/level2/ATL_dreftbsvUTU.c

src/blas/reference/level2/ATL_dreftpmv.c

src/blas/reference/level2/ATL_dreftpmvLNN.c

src/blas/reference/level2/ATL_dreftpmvLNU.c

src/blas/reference/level2/ATL_dreftpmvLTN.c

src/blas/reference/level2/ATL_dreftpmvLTU.c

src/blas/reference/level2/ATL_dreftpmvUNN.c

src/blas/reference/level2/ATL_dreftpmvUNU.c

src/blas/reference/level2/ATL_dreftpmvUTN.c

src/blas/reference/level2/ATL_dreftpmvUTU.c

src/blas/reference/level2/ATL_dreftpsv.c

src/blas/reference/level2/ATL_dreftpsvLNN.c

src/blas/reference/level2/ATL_dreftpsvLNU.c

src/blas/reference/level2/ATL_dreftpsvLTN.c

src/blas/reference/level2/ATL_dreftpsvLTU.c

src/blas/reference/level2/ATL_dreftpsvUNN.c

src/blas/reference/level2/ATL_dreftpsvUNU.c

src/blas/reference/level2/ATL_dreftpsvUTN.c

src/blas/reference/level2/ATL_dreftpsvUTU.c

src/blas/reference/level2/ATL_dreftrmv.c

src/blas/reference/level2/ATL_dreftrmvLNN.c

src/blas/reference/level2/ATL_dreftrmvLNU.c

src/blas/reference/level2/ATL_dreftrmvLTN.c

src/blas/reference/level2/ATL_dreftrmvLTU.c

src/blas/reference/level2/ATL_dreftrmvUNN.c

src/blas/reference/level2/ATL_dreftrmvUNU.c

src/blas/reference/level2/ATL_dreftrmvUTN.c

src/blas/reference/level2/ATL_dreftrmvUTU.c

src/blas/reference/level2/ATL_dreftrsv.c

src/blas/reference/level2/ATL_dreftrsvLNN.c

src/blas/reference/level2/ATL_dreftrsvLNU.c

src/blas/reference/level2/ATL_dreftrsvLTN.c

src/blas/reference/level2/ATL_dreftrsvLTU.c

src/blas/reference/level2/ATL_dreftrsvUNN.c

src/blas/reference/level2/ATL_dreftrsvUNU.c

src/blas/reference/level2/ATL_dreftrsvUTN.c

src/blas/reference/level2/ATL_dreftrsvUTU.c

src/blas/reference/level2/ATL_srefgbmv.c

src/blas/reference/level2/ATL_srefgbmvN.c

src/blas/reference/level2/ATL_srefgbmvT.c

src/blas/reference/level2/ATL_srefgemv.c

src/blas/reference/level2/ATL_srefgemvN.c

src/blas/reference/level2/ATL_srefgemvT.c

src/blas/reference/level2/ATL_srefger.c

src/blas/reference/level2/ATL_srefgpmv.c

src/blas/reference/level2/ATL_srefgpmvLN.c

src/blas/reference/level2/ATL_srefgpmvLT.c

src/blas/reference/level2/ATL_srefgpmvUN.c

src/blas/reference/level2/ATL_srefgpmvUT.c

src/blas/reference/level2/ATL_srefgpr.c

src/blas/reference/level2/ATL_srefsbmv.c

src/blas/reference/level2/ATL_srefsbmvL.c

src/blas/reference/level2/ATL_srefsbmvU.c

src/blas/reference/level2/ATL_srefspmv.c

src/blas/reference/level2/ATL_srefspmvL.c

src/blas/reference/level2/ATL_srefspmvU.c

src/blas/reference/level2/ATL_srefspr.c

src/blas/reference/level2/ATL_srefspr2.c

src/blas/reference/level2/ATL_srefspr2L.c

src/blas/reference/level2/ATL_srefspr2U.c

src/blas/reference/level2/ATL_srefsprL.c

src/blas/reference/level2/ATL_srefsprU.c

src/blas/reference/level2/ATL_srefsymv.c

src/blas/reference/level2/ATL_srefsymvL.c

src/blas/reference/level2/ATL_srefsymvU.c

src/blas/reference/level2/ATL_srefsyr.c

src/blas/reference/level2/ATL_srefsyr2.c

src/blas/reference/level2/ATL_srefsyr2L.c

src/blas/reference/level2/ATL_srefsyr2U.c

src/blas/reference/level2/ATL_srefsyrL.c

src/blas/reference/level2/ATL_srefsyrU.c

src/blas/reference/level2/ATL_sreftbmv.c

src/blas/reference/level2/ATL_sreftbmvLNN.c

src/blas/reference/level2/ATL_sreftbmvLNU.c

src/blas/reference/level2/ATL_sreftbmvLTN.c

src/blas/reference/level2/ATL_sreftbmvLTU.c

src/blas/reference/level2/ATL_sreftbmvUNN.c

src/blas/reference/level2/ATL_sreftbmvUNU.c

src/blas/reference/level2/ATL_sreftbmvUTN.c

src/blas/reference/level2/ATL_sreftbmvUTU.c

src/blas/reference/level2/ATL_sreftbsv.c

src/blas/reference/level2/ATL_sreftbsvLNN.c

src/blas/reference/level2/ATL_sreftbsvLNU.c

src/blas/reference/level2/ATL_sreftbsvLTN.c

src/blas/reference/level2/ATL_sreftbsvLTU.c

src/blas/reference/level2/ATL_sreftbsvUNN.c

src/blas/reference/level2/ATL_sreftbsvUNU.c

src/blas/reference/level2/ATL_sreftbsvUTN.c

src/blas/reference/level2/ATL_sreftbsvUTU.c

src/blas/reference/level2/ATL_sreftpmv.c

src/blas/reference/level2/ATL_sreftpmvLNN.c

src/blas/reference/level2/ATL_sreftpmvLNU.c

src/blas/reference/level2/ATL_sreftpmvLTN.c

src/blas/reference/level2/ATL_sreftpmvLTU.c

src/blas/reference/level2/ATL_sreftpmvUNN.c

src/blas/reference/level2/ATL_sreftpmvUNU.c

src/blas/reference/level2/ATL_sreftpmvUTN.c

src/blas/reference/level2/ATL_sreftpmvUTU.c

src/blas/reference/level2/ATL_sreftpsv.c

src/blas/reference/level2/ATL_sreftpsvLNN.c

src/blas/reference/level2/ATL_sreftpsvLNU.c

src/blas/reference/level2/ATL_sreftpsvLTN.c

src/blas/reference/level2/ATL_sreftpsvLTU.c

src/blas/reference/level2/ATL_sreftpsvUNN.c

src/blas/reference/level2/ATL_sreftpsvUNU.c

src/blas/reference/level2/ATL_sreftpsvUTN.c

src/blas/reference/level2/ATL_sreftpsvUTU.c

src/blas/reference/level2/ATL_sreftrmv.c

src/blas/reference/level2/ATL_sreftrmvLNN.c

src/blas/reference/level2/ATL_sreftrmvLNU.c

src/blas/reference/level2/ATL_sreftrmvLTN.c

src/blas/reference/level2/ATL_sreftrmvLTU.c

src/blas/reference/level2/ATL_sreftrmvUNN.c

src/blas/reference/level2/ATL_sreftrmvUNU.c

src/blas/reference/level2/ATL_sreftrmvUTN.c

src/blas/reference/level2/ATL_sreftrmvUTU.c

src/blas/reference/level2/ATL_sreftrsv.c

src/blas/reference/level2/ATL_sreftrsvLNN.c

src/blas/reference/level2/ATL_sreftrsvLNU.c

src/blas/reference/level2/ATL_sreftrsvLTN.c

src/blas/reference/level2/ATL_sreftrsvLTU.c

src/blas/reference/level2/ATL_sreftrsvUNN.c

src/blas/reference/level2/ATL_sreftrsvUNU.c

src/blas/reference/level2/ATL_sreftrsvUTN.c

src/blas/reference/level2/ATL_sreftrsvUTU.c

src/blas/reference/level2/ATL_zrefgbmv.c

src/blas/reference/level2/ATL_zrefgbmvC.c

src/blas/reference/level2/ATL_zrefgbmvH.c

src/blas/reference/level2/ATL_zrefgbmvN.c

src/blas/reference/level2/ATL_zrefgbmvT.c

src/blas/reference/level2/ATL_zrefgemv.c

src/blas/reference/level2/ATL_zrefgemvC.c

src/blas/reference/level2/ATL_zrefgemvH.c

src/blas/reference/level2/ATL_zrefgemvN.c

src/blas/reference/level2/ATL_zrefgemvT.c

src/blas/reference/level2/ATL_zrefgerc.c

src/blas/reference/level2/ATL_zrefgeru.c

src/blas/reference/level2/ATL_zrefgpmv.c

src/blas/reference/level2/ATL_zrefgpmvLC.c

src/blas/reference/level2/ATL_zrefgpmvLH.c

src/blas/reference/level2/ATL_zrefgpmvLN.c

src/blas/reference/level2/ATL_zrefgpmvLT.c

src/blas/reference/level2/ATL_zrefgpmvUC.c

src/blas/reference/level2/ATL_zrefgpmvUH.c

src/blas/reference/level2/ATL_zrefgpmvUN.c

src/blas/reference/level2/ATL_zrefgpmvUT.c

src/blas/reference/level2/ATL_zrefgprc.c

src/blas/reference/level2/ATL_zrefgpru.c

src/blas/reference/level2/ATL_zrefhbmv.c

src/blas/reference/level2/ATL_zrefhbmvL.c

src/blas/reference/level2/ATL_zrefhbmvU.c

src/blas/reference/level2/ATL_zrefhemv.c

src/blas/reference/level2/ATL_zrefhemvL.c

src/blas/reference/level2/ATL_zrefhemvU.c

src/blas/reference/level2/ATL_zrefher.c

src/blas/reference/level2/ATL_zrefher2.c

src/blas/reference/level2/ATL_zrefher2L.c

src/blas/reference/level2/ATL_zrefher2U.c

src/blas/reference/level2/ATL_zrefherL.c

src/blas/reference/level2/ATL_zrefherU.c

src/blas/reference/level2/ATL_zrefhpmv.c

src/blas/reference/level2/ATL_zrefhpmvL.c

src/blas/reference/level2/ATL_zrefhpmvU.c

src/blas/reference/level2/ATL_zrefhpr.c

src/blas/reference/level2/ATL_zrefhpr2.c

src/blas/reference/level2/ATL_zrefhpr2L.c

src/blas/reference/level2/ATL_zrefhpr2U.c

src/blas/reference/level2/ATL_zrefhprL.c

src/blas/reference/level2/ATL_zrefhprU.c

src/blas/reference/level2/ATL_zreftbmv.c

src/blas/reference/level2/ATL_zreftbmvLCN.c

src/blas/reference/level2/ATL_zreftbmvLCU.c

src/blas/reference/level2/ATL_zreftbmvLHN.c

src/blas/reference/level2/ATL_zreftbmvLHU.c

src/blas/reference/level2/ATL_zreftbmvLNN.c

src/blas/reference/level2/ATL_zreftbmvLNU.c

src/blas/reference/level2/ATL_zreftbmvLTN.c

src/blas/reference/level2/ATL_zreftbmvLTU.c

src/blas/reference/level2/ATL_zreftbmvUCN.c

src/blas/reference/level2/ATL_zreftbmvUCU.c

src/blas/reference/level2/ATL_zreftbmvUHN.c

src/blas/reference/level2/ATL_zreftbmvUHU.c

src/blas/reference/level2/ATL_zreftbmvUNN.c

src/blas/reference/level2/ATL_zreftbmvUNU.c

src/blas/reference/level2/ATL_zreftbmvUTN.c

src/blas/reference/level2/ATL_zreftbmvUTU.c

src/blas/reference/level2/ATL_zreftbsv.c

src/blas/reference/level2/ATL_zreftbsvLCN.c

src/blas/reference/level2/ATL_zreftbsvLCU.c

src/blas/reference/level2/ATL_zreftbsvLHN.c

src/blas/reference/level2/ATL_zreftbsvLHU.c

src/blas/reference/level2/ATL_zreftbsvLNN.c

src/blas/reference/level2/ATL_zreftbsvLNU.c

src/blas/reference/level2/ATL_zreftbsvLTN.c

src/blas/reference/level2/ATL_zreftbsvLTU.c

src/blas/reference/level2/ATL_zreftbsvUCN.c

src/blas/reference/level2/ATL_zreftbsvUCU.c

src/blas/reference/level2/ATL_zreftbsvUHN.c

src/blas/reference/level2/ATL_zreftbsvUHU.c

src/blas/reference/level2/ATL_zreftbsvUNN.c

src/blas/reference/level2/ATL_zreftbsvUNU.c

src/blas/reference/level2/ATL_zreftbsvUTN.c

src/blas/reference/level2/ATL_zreftbsvUTU.c

src/blas/reference/level2/ATL_zreftpmv.c

src/blas/reference/level2/ATL_zreftpmvLCN.c

src/blas/reference/level2/ATL_zreftpmvLCU.c

src/blas/reference/level2/ATL_zreftpmvLHN.c

src/blas/reference/level2/ATL_zreftpmvLHU.c

src/blas/reference/level2/ATL_zreftpmvLNN.c

src/blas/reference/level2/ATL_zreftpmvLNU.c

src/blas/reference/level2/ATL_zreftpmvLTN.c

src/blas/reference/level2/ATL_zreftpmvLTU.c

src/blas/reference/level2/ATL_zreftpmvUCN.c

src/blas/reference/level2/ATL_zreftpmvUCU.c

src/blas/reference/level2/ATL_zreftpmvUHN.c

src/blas/reference/level2/ATL_zreftpmvUHU.c

src/blas/reference/level2/ATL_zreftpmvUNN.c

src/blas/reference/level2/ATL_zreftpmvUNU.c

src/blas/reference/level2/ATL_zreftpmvUTN.c

src/blas/reference/level2/ATL_zreftpmvUTU.c

src/blas/reference/level2/ATL_zreftpsv.c

src/blas/reference/level2/ATL_zreftpsvLCN.c

src/blas/reference/level2/ATL_zreftpsvLCU.c

src/blas/reference/level2/ATL_zreftpsvLHN.c

src/blas/reference/level2/ATL_zreftpsvLHU.c

src/blas/reference/level2/ATL_zreftpsvLNN.c

src/blas/reference/level2/ATL_zreftpsvLNU.c

src/blas/reference/level2/ATL_zreftpsvLTN.c

src/blas/reference/level2/ATL_zreftpsvLTU.c

src/blas/reference/level2/ATL_zreftpsvUCN.c

src/blas/reference/level2/ATL_zreftpsvUCU.c

src/blas/reference/level2/ATL_zreftpsvUHN.c

src/blas/reference/level2/ATL_zreftpsvUHU.c

src/blas/reference/level2/ATL_zreftpsvUNN.c

src/blas/reference/level2/ATL_zreftpsvUNU.c

src/blas/reference/level2/ATL_zreftpsvUTN.c

src/blas/reference/level2/ATL_zreftpsvUTU.c

src/blas/reference/level2/ATL_zreftrmv.c

src/blas/reference/level2/ATL_zreftrmvLCN.c

src/blas/reference/level2/ATL_zreftrmvLCU.c

src/blas/reference/level2/ATL_zreftrmvLHN.c

src/blas/reference/level2/ATL_zreftrmvLHU.c

src/blas/reference/level2/ATL_zreftrmvLNN.c

src/blas/reference/level2/ATL_zreftrmvLNU.c

src/blas/reference/level2/ATL_zreftrmvLTN.c

src/blas/reference/level2/ATL_zreftrmvLTU.c

src/blas/reference/level2/ATL_zreftrmvUCN.c

src/blas/reference/level2/ATL_zreftrmvUCU.c

src/blas/reference/level2/ATL_zreftrmvUHN.c

src/blas/reference/level2/ATL_zreftrmvUHU.c

src/blas/reference/level2/ATL_zreftrmvUNN.c

src/blas/reference/level2/ATL_zreftrmvUNU.c

src/blas/reference/level2/ATL_zreftrmvUTN.c

src/blas/reference/level2/ATL_zreftrmvUTU.c

src/blas/reference/level2/ATL_zreftrsv.c

src/blas/reference/level2/ATL_zreftrsvLCN.c

src/blas/reference/level2/ATL_zreftrsvLCU.c

src/blas/reference/level2/ATL_zreftrsvLHN.c

src/blas/reference/level2/ATL_zreftrsvLHU.c

src/blas/reference/level2/ATL_zreftrsvLNN.c

src/blas/reference/level2/ATL_zreftrsvLNU.c

src/blas/reference/level2/ATL_zreftrsvLTN.c

src/blas/reference/level2/ATL_zreftrsvLTU.c

src/blas/reference/level2/ATL_zreftrsvUCN.c

src/blas/reference/level2/ATL_zreftrsvUCU.c

src/blas/reference/level2/ATL_zreftrsvUHN.c

src/blas/reference/level2/ATL_zreftrsvUHU.c

src/blas/reference/level2/ATL_zreftrsvUNN.c

src/blas/reference/level2/ATL_zreftrsvUNU.c

src/blas/reference/level2/ATL_zreftrsvUTN.c

src/blas/reference/level2/ATL_zreftrsvUTU.c

src/blas/reference/level3/ATL_crefgemm.c

src/blas/reference/level3/ATL_crefgemmCC.c

src/blas/reference/level3/ATL_crefgemmCN.c

src/blas/reference/level3/ATL_crefgemmCT.c

src/blas/reference/level3/ATL_crefgemmNC.c

src/blas/reference/level3/ATL_crefgemmNN.c

src/blas/reference/level3/ATL_crefgemmNT.c

src/blas/reference/level3/ATL_crefgemmTC.c

src/blas/reference/level3/ATL_crefgemmTN.c

src/blas/reference/level3/ATL_crefgemmTT.c

src/blas/reference/level3/ATL_crefhemm.c

src/blas/reference/level3/ATL_crefhemmLL.c

src/blas/reference/level3/ATL_crefhemmLU.c

src/blas/reference/level3/ATL_crefhemmRL.c

src/blas/reference/level3/ATL_crefhemmRU.c

src/blas/reference/level3/ATL_crefher2k.c

src/blas/reference/level3/ATL_crefher2kLC.c

src/blas/reference/level3/ATL_crefher2kLN.c

src/blas/reference/level3/ATL_crefher2kUC.c

src/blas/reference/level3/ATL_crefher2kUN.c

src/blas/reference/level3/ATL_crefherk.c

src/blas/reference/level3/ATL_crefherkLC.c

src/blas/reference/level3/ATL_crefherkLN.c

src/blas/reference/level3/ATL_crefherkUC.c

src/blas/reference/level3/ATL_crefherkUN.c

src/blas/reference/level3/ATL_crefsymm.c

src/blas/reference/level3/ATL_crefsymmLL.c

src/blas/reference/level3/ATL_crefsymmLU.c

src/blas/reference/level3/ATL_crefsymmRL.c

src/blas/reference/level3/ATL_crefsymmRU.c

src/blas/reference/level3/ATL_crefsyr2k.c

src/blas/reference/level3/ATL_crefsyr2kLN.c

src/blas/reference/level3/ATL_crefsyr2kLT.c

src/blas/reference/level3/ATL_crefsyr2kUN.c

src/blas/reference/level3/ATL_crefsyr2kUT.c

src/blas/reference/level3/ATL_crefsyrk.c

src/blas/reference/level3/ATL_crefsyrkLN.c

src/blas/reference/level3/ATL_crefsyrkLT.c

src/blas/reference/level3/ATL_crefsyrkUN.c

src/blas/reference/level3/ATL_crefsyrkUT.c

src/blas/reference/level3/ATL_creftrmm.c

src/blas/reference/level3/ATL_creftrmmLLCN.c

src/blas/reference/level3/ATL_creftrmmLLCU.c

src/blas/reference/level3/ATL_creftrmmLLNN.c

src/blas/reference/level3/ATL_creftrmmLLNU.c

src/blas/reference/level3/ATL_creftrmmLLTN.c

src/blas/reference/level3/ATL_creftrmmLLTU.c

src/blas/reference/level3/ATL_creftrmmLUCN.c

src/blas/reference/level3/ATL_creftrmmLUCU.c

src/blas/reference/level3/ATL_creftrmmLUNN.c

src/blas/reference/level3/ATL_creftrmmLUNU.c

src/blas/reference/level3/ATL_creftrmmLUTN.c

src/blas/reference/level3/ATL_creftrmmLUTU.c

src/blas/reference/level3/ATL_creftrmmRLCN.c

src/blas/reference/level3/ATL_creftrmmRLCU.c

src/blas/reference/level3/ATL_creftrmmRLNN.c

src/blas/reference/level3/ATL_creftrmmRLNU.c

src/blas/reference/level3/ATL_creftrmmRLTN.c

src/blas/reference/level3/ATL_creftrmmRLTU.c

src/blas/reference/level3/ATL_creftrmmRUCN.c

src/blas/reference/level3/ATL_creftrmmRUCU.c

src/blas/reference/level3/ATL_creftrmmRUNN.c

src/blas/reference/level3/ATL_creftrmmRUNU.c

src/blas/reference/level3/ATL_creftrmmRUTN.c

src/blas/reference/level3/ATL_creftrmmRUTU.c

src/blas/reference/level3/ATL_creftrsm.c

src/blas/reference/level3/ATL_creftrsmLLCN.c

src/blas/reference/level3/ATL_creftrsmLLCU.c

src/blas/reference/level3/ATL_creftrsmLLNN.c

src/blas/reference/level3/ATL_creftrsmLLNU.c

src/blas/reference/level3/ATL_creftrsmLLTN.c

src/blas/reference/level3/ATL_creftrsmLLTU.c

src/blas/reference/level3/ATL_creftrsmLUCN.c

src/blas/reference/level3/ATL_creftrsmLUCU.c

src/blas/reference/level3/ATL_creftrsmLUNN.c

src/blas/reference/level3/ATL_creftrsmLUNU.c

src/blas/reference/level3/ATL_creftrsmLUTN.c

src/blas/reference/level3/ATL_creftrsmLUTU.c

src/blas/reference/level3/ATL_creftrsmRLCN.c

src/blas/reference/level3/ATL_creftrsmRLCU.c

src/blas/reference/level3/ATL_creftrsmRLNN.c

src/blas/reference/level3/ATL_creftrsmRLNU.c

src/blas/reference/level3/ATL_creftrsmRLTN.c

src/blas/reference/level3/ATL_creftrsmRLTU.c

src/blas/reference/level3/ATL_creftrsmRUCN.c

src/blas/reference/level3/ATL_creftrsmRUCU.c

src/blas/reference/level3/ATL_creftrsmRUNN.c

src/blas/reference/level3/ATL_creftrsmRUNU.c

src/blas/reference/level3/ATL_creftrsmRUTN.c

src/blas/reference/level3/ATL_creftrsmRUTU.c

src/blas/reference/level3/ATL_drefgemm.c

src/blas/reference/level3/ATL_drefgemmNN.c

src/blas/reference/level3/ATL_drefgemmNT.c

src/blas/reference/level3/ATL_drefgemmTN.c

src/blas/reference/level3/ATL_drefgemmTT.c

src/blas/reference/level3/ATL_drefsymm.c

src/blas/reference/level3/ATL_drefsymmLL.c

src/blas/reference/level3/ATL_drefsymmLU.c

src/blas/reference/level3/ATL_drefsymmRL.c

src/blas/reference/level3/ATL_drefsymmRU.c

src/blas/reference/level3/ATL_drefsyr2k.c

src/blas/reference/level3/ATL_drefsyr2kLN.c

src/blas/reference/level3/ATL_drefsyr2kLT.c

src/blas/reference/level3/ATL_drefsyr2kUN.c

src/blas/reference/level3/ATL_drefsyr2kUT.c

src/blas/reference/level3/ATL_drefsyrk.c

src/blas/reference/level3/ATL_drefsyrkLN.c

src/blas/reference/level3/ATL_drefsyrkLT.c

src/blas/reference/level3/ATL_drefsyrkUN.c

src/blas/reference/level3/ATL_drefsyrkUT.c

src/blas/reference/level3/ATL_dreftrmm.c

src/blas/reference/level3/ATL_dreftrmmLLNN.c

src/blas/reference/level3/ATL_dreftrmmLLNU.c

src/blas/reference/level3/ATL_dreftrmmLLTN.c

src/blas/reference/level3/ATL_dreftrmmLLTU.c

src/blas/reference/level3/ATL_dreftrmmLUNN.c

src/blas/reference/level3/ATL_dreftrmmLUNU.c

src/blas/reference/level3/ATL_dreftrmmLUTN.c

src/blas/reference/level3/ATL_dreftrmmLUTU.c

src/blas/reference/level3/ATL_dreftrmmRLNN.c

src/blas/reference/level3/ATL_dreftrmmRLNU.c

src/blas/reference/level3/ATL_dreftrmmRLTN.c

src/blas/reference/level3/ATL_dreftrmmRLTU.c

src/blas/reference/level3/ATL_dreftrmmRUNN.c

src/blas/reference/level3/ATL_dreftrmmRUNU.c

src/blas/reference/level3/ATL_dreftrmmRUTN.c

src/blas/reference/level3/ATL_dreftrmmRUTU.c

src/blas/reference/level3/ATL_dreftrsm.c

src/blas/reference/level3/ATL_dreftrsmLLNN.c

src/blas/reference/level3/ATL_dreftrsmLLNU.c

src/blas/reference/level3/ATL_dreftrsmLLTN.c

src/blas/reference/level3/ATL_dreftrsmLLTU.c

src/blas/reference/level3/ATL_dreftrsmLUNN.c

src/blas/reference/level3/ATL_dreftrsmLUNU.c

src/blas/reference/level3/ATL_dreftrsmLUTN.c

src/blas/reference/level3/ATL_dreftrsmLUTU.c

src/blas/reference/level3/ATL_dreftrsmRLNN.c

src/blas/reference/level3/ATL_dreftrsmRLNU.c

src/blas/reference/level3/ATL_dreftrsmRLTN.c

src/blas/reference/level3/ATL_dreftrsmRLTU.c

src/blas/reference/level3/ATL_dreftrsmRUNN.c

src/blas/reference/level3/ATL_dreftrsmRUNU.c

src/blas/reference/level3/ATL_dreftrsmRUTN.c

src/blas/reference/level3/ATL_dreftrsmRUTU.c

src/blas/reference/level3/ATL_srefgemm.c

src/blas/reference/level3/ATL_srefgemmNN.c

src/blas/reference/level3/ATL_srefgemmNT.c

src/blas/reference/level3/ATL_srefgemmTN.c

src/blas/reference/level3/ATL_srefgemmTT.c

src/blas/reference/level3/ATL_srefsymm.c

src/blas/reference/level3/ATL_srefsymmLL.c

src/blas/reference/level3/ATL_srefsymmLU.c

src/blas/reference/level3/ATL_srefsymmRL.c

src/blas/reference/level3/ATL_srefsymmRU.c

src/blas/reference/level3/ATL_srefsyr2k.c

src/blas/reference/level3/ATL_srefsyr2kLN.c

src/blas/reference/level3/ATL_srefsyr2kLT.c

src/blas/reference/level3/ATL_srefsyr2kUN.c

src/blas/reference/level3/ATL_srefsyr2kUT.c

src/blas/reference/level3/ATL_srefsyrk.c

src/blas/reference/level3/ATL_srefsyrkLN.c

src/blas/reference/level3/ATL_srefsyrkLT.c

src/blas/reference/level3/ATL_srefsyrkUN.c

src/blas/reference/level3/ATL_srefsyrkUT.c

src/blas/reference/level3/ATL_sreftrmm.c

src/blas/reference/level3/ATL_sreftrmmLLNN.c

src/blas/reference/level3/ATL_sreftrmmLLNU.c

src/blas/reference/level3/ATL_sreftrmmLLTN.c

src/blas/reference/level3/ATL_sreftrmmLLTU.c

src/blas/reference/level3/ATL_sreftrmmLUNN.c

src/blas/reference/level3/ATL_sreftrmmLUNU.c

src/blas/reference/level3/ATL_sreftrmmLUTN.c

src/blas/reference/level3/ATL_sreftrmmLUTU.c

src/blas/reference/level3/ATL_sreftrmmRLNN.c

src/blas/reference/level3/ATL_sreftrmmRLNU.c

src/blas/reference/level3/ATL_sreftrmmRLTN.c

src/blas/reference/level3/ATL_sreftrmmRLTU.c

src/blas/reference/level3/ATL_sreftrmmRUNN.c

src/blas/reference/level3/ATL_sreftrmmRUNU.c

src/blas/reference/level3/ATL_sreftrmmRUTN.c

src/blas/reference/level3/ATL_sreftrmmRUTU.c

src/blas/reference/level3/ATL_sreftrsm.c

src/blas/reference/level3/ATL_sreftrsmLLNN.c

src/blas/reference/level3/ATL_sreftrsmLLNU.c

src/blas/reference/level3/ATL_sreftrsmLLTN.c

src/blas/reference/level3/ATL_sreftrsmLLTU.c

src/blas/reference/level3/ATL_sreftrsmLUNN.c

src/blas/reference/level3/ATL_sreftrsmLUNU.c

src/blas/reference/level3/ATL_sreftrsmLUTN.c

src/blas/reference/level3/ATL_sreftrsmLUTU.c

src/blas/reference/level3/ATL_sreftrsmRLNN.c

src/blas/reference/level3/ATL_sreftrsmRLNU.c

src/blas/reference/level3/ATL_sreftrsmRLTN.c

src/blas/reference/level3/ATL_sreftrsmRLTU.c

src/blas/reference/level3/ATL_sreftrsmRUNN.c

src/blas/reference/level3/ATL_sreftrsmRUNU.c

src/blas/reference/level3/ATL_sreftrsmRUTN.c

src/blas/reference/level3/ATL_sreftrsmRUTU.c

src/blas/reference/level3/ATL_zrefgemm.c

src/blas/reference/level3/ATL_zrefgemmCC.c

src/blas/reference/level3/ATL_zrefgemmCN.c

src/blas/reference/level3/ATL_zrefgemmCT.c

src/blas/reference/level3/ATL_zrefgemmNC.c

src/blas/reference/level3/ATL_zrefgemmNN.c

src/blas/reference/level3/ATL_zrefgemmNT.c

src/blas/reference/level3/ATL_zrefgemmTC.c

src/blas/reference/level3/ATL_zrefgemmTN.c

src/blas/reference/level3/ATL_zrefgemmTT.c

src/blas/reference/level3/ATL_zrefhemm.c

src/blas/reference/level3/ATL_zrefhemmLL.c

src/blas/reference/level3/ATL_zrefhemmLU.c

src/blas/reference/level3/ATL_zrefhemmRL.c

src/blas/reference/level3/ATL_zrefhemmRU.c

src/blas/reference/level3/ATL_zrefher2k.c

src/blas/reference/level3/ATL_zrefher2kLC.c

src/blas/reference/level3/ATL_zrefher2kLN.c

src/blas/reference/level3/ATL_zrefher2kUC.c

src/blas/reference/level3/ATL_zrefher2kUN.c

src/blas/reference/level3/ATL_zrefherk.c

src/blas/reference/level3/ATL_zrefherkLC.c

src/blas/reference/level3/ATL_zrefherkLN.c

src/blas/reference/level3/ATL_zrefherkUC.c

src/blas/reference/level3/ATL_zrefherkUN.c

src/blas/reference/level3/ATL_zrefsymm.c

src/blas/reference/level3/ATL_zrefsymmLL.c

src/blas/reference/level3/ATL_zrefsymmLU.c

src/blas/reference/level3/ATL_zrefsymmRL.c

src/blas/reference/level3/ATL_zrefsymmRU.c

src/blas/reference/level3/ATL_zrefsyr2k.c

src/blas/reference/level3/ATL_zrefsyr2kLN.c

src/blas/reference/level3/ATL_zrefsyr2kLT.c

src/blas/reference/level3/ATL_zrefsyr2kUN.c

src/blas/reference/level3/ATL_zrefsyr2kUT.c

src/blas/reference/level3/ATL_zrefsyrk.c

src/blas/reference/level3/ATL_zrefsyrkLN.c

src/blas/reference/level3/ATL_zrefsyrkLT.c

src/blas/reference/level3/ATL_zrefsyrkUN.c

src/blas/reference/level3/ATL_zrefsyrkUT.c

src/blas/reference/level3/ATL_zreftrmm.c

src/blas/reference/level3/ATL_zreftrmmLLCN.c

src/blas/reference/level3/ATL_zreftrmmLLCU.c

src/blas/reference/level3/ATL_zreftrmmLLNN.c

src/blas/reference/level3/ATL_zreftrmmLLNU.c

src/blas/reference/level3/ATL_zreftrmmLLTN.c

src/blas/reference/level3/ATL_zreftrmmLLTU.c

src/blas/reference/level3/ATL_zreftrmmLUCN.c

src/blas/reference/level3/ATL_zreftrmmLUCU.c

src/blas/reference/level3/ATL_zreftrmmLUNN.c

src/blas/reference/level3/ATL_zreftrmmLUNU.c

src/blas/reference/level3/ATL_zreftrmmLUTN.c

src/blas/reference/level3/ATL_zreftrmmLUTU.c

src/blas/reference/level3/ATL_zreftrmmRLCN.c

src/blas/reference/level3/ATL_zreftrmmRLCU.c

src/blas/reference/level3/ATL_zreftrmmRLNN.c

src/blas/reference/level3/ATL_zreftrmmRLNU.c

src/blas/reference/level3/ATL_zreftrmmRLTN.c

src/blas/reference/level3/ATL_zreftrmmRLTU.c

src/blas/reference/level3/ATL_zreftrmmRUCN.c

src/blas/reference/level3/ATL_zreftrmmRUCU.c

src/blas/reference/level3/ATL_zreftrmmRUNN.c

src/blas/reference/level3/ATL_zreftrmmRUNU.c

src/blas/reference/level3/ATL_zreftrmmRUTN.c

src/blas/reference/level3/ATL_zreftrmmRUTU.c

src/blas/reference/level3/ATL_zreftrsm.c

src/blas/reference/level3/ATL_zreftrsmLLCN.c

src/blas/reference/level3/ATL_zreftrsmLLCU.c

src/blas/reference/level3/ATL_zreftrsmLLNN.c

src/blas/reference/level3/ATL_zreftrsmLLNU.c

src/blas/reference/level3/ATL_zreftrsmLLTN.c

src/blas/reference/level3/ATL_zreftrsmLLTU.c

src/blas/reference/level3/ATL_zreftrsmLUCN.c

src/blas/reference/level3/ATL_zreftrsmLUCU.c

src/blas/reference/level3/ATL_zreftrsmLUNN.c

src/blas/reference/level3/ATL_zreftrsmLUNU.c

src/blas/reference/level3/ATL_zreftrsmLUTN.c

src/blas/reference/level3/ATL_zreftrsmLUTU.c

src/blas/reference/level3/ATL_zreftrsmRLCN.c

src/blas/reference/level3/ATL_zreftrsmRLCU.c

src/blas/reference/level3/ATL_zreftrsmRLNN.c

src/blas/reference/level3/ATL_zreftrsmRLNU.c

src/blas/reference/level3/ATL_zreftrsmRLTN.c

src/blas/reference/level3/ATL_zreftrsmRLTU.c

src/blas/reference/level3/ATL_zreftrsmRUCN.c

src/blas/reference/level3/ATL_zreftrsmRUCU.c

src/blas/reference/level3/ATL_zreftrsmRUNN.c

src/blas/reference/level3/ATL_zreftrsmRUNU.c

src/blas/reference/level3/ATL_zreftrsmRUTN.c

src/blas/reference/level3/ATL_zreftrsmRUTU.c

src/lapack/ATL_getrf.c

src/lapack/ATL_getrfC.c

src/lapack/ATL_getrfR.c

src/lapack/ATL_getri.c

src/lapack/ATL_getriC.c

src/lapack/ATL_getriR.c

src/lapack/ATL_getrs.c

src/lapack/ATL_laswp.c

src/lapack/ATL_lauum.c

src/lapack/ATL_lauumL.c

src/lapack/ATL_lauumU.c

src/lapack/ATL_potrf.c

src/lapack/ATL_potrfL.c

src/lapack/ATL_potrfRL.c

src/lapack/ATL_potrfRU.c

src/lapack/ATL_potrfU.c

src/lapack/ATL_potrs.c

src/lapack/ATL_trtri.c

src/lapack/ATL_trtriCL.c

src/lapack/ATL_trtriCU.c

src/lapack/ATL_trtriRL.c

src/lapack/ATL_trtriRU.c

src/testing/ATL_dsf77dot.c

src/testing/ATL_epsilon.c

src/testing/ATL_f77amax.c

src/testing/ATL_f77asum.c

src/testing/ATL_f77axpy.c

src/testing/ATL_f77copy.c

src/testing/ATL_f77dot.c

src/testing/ATL_f77dotc_sub.c

src/testing/ATL_f77dotu_sub.c

src/testing/ATL_f77gbmv.c

src/testing/ATL_f77gels.c

src/testing/ATL_f77gemm.c

src/testing/ATL_f77gemv.c

src/testing/ATL_f77ger.c

src/testing/ATL_f77gerc.c

src/testing/ATL_f77geru.c

src/testing/ATL_f77gesv.c

src/testing/ATL_f77getrf.c

src/testing/ATL_f77getri.c

src/testing/ATL_f77hbmv.c

src/testing/ATL_f77hemm.c

src/testing/ATL_f77hemv.c

src/testing/ATL_f77her.c

src/testing/ATL_f77her2.c

src/testing/ATL_f77her2k.c

src/testing/ATL_f77herk.c

src/testing/ATL_f77hpmv.c

src/testing/ATL_f77hpr.c

src/testing/ATL_f77hpr2.c

src/testing/ATL_f77lauum.c

src/testing/ATL_f77nrm2.c

src/testing/ATL_f77posv.c

src/testing/ATL_f77potrf.c

src/testing/ATL_f77rot.c

src/testing/ATL_f77rotg.c

src/testing/ATL_f77rotm.c

src/testing/ATL_f77rotmg.c

src/testing/ATL_f77rscal.c

src/testing/ATL_f77sbmv.c

src/testing/ATL_f77scal.c

src/testing/ATL_f77spmv.c

src/testing/ATL_f77spr.c

src/testing/ATL_f77spr2.c

src/testing/ATL_f77swap.c

src/testing/ATL_f77symm.c

src/testing/ATL_f77symv.c

src/testing/ATL_f77syr.c

src/testing/ATL_f77syr2.c

src/testing/ATL_f77syr2k.c

src/testing/ATL_f77syrk.c

src/testing/ATL_f77tbmv.c

src/testing/ATL_f77tbsv.c

src/testing/ATL_f77tpmv.c

src/testing/ATL_f77tpsv.c

src/testing/ATL_f77trmm.c

src/testing/ATL_f77trmv.c

src/testing/ATL_f77trsm.c

src/testing/ATL_f77trsv.c

src/testing/ATL_gbnrm1.c

src/testing/ATL_gediff.c

src/testing/ATL_gediffnrm1.c

src/testing/ATL_gegen.c

src/testing/ATL_genrm1.c

src/testing/ATL_geprint.c

src/testing/ATL_hbnrm.c

src/testing/ATL_hediffnrm.c

src/testing/ATL_henrm.c

src/testing/ATL_hpnrm.c

src/testing/ATL_infnrm.c

src/testing/ATL_rand.c

src/testing/ATL_sbnrm.c

src/testing/ATL_sdsf77dot.c

src/testing/ATL_spnrm.c

src/testing/ATL_synrm.c

src/testing/ATL_tbnrm1.c

src/testing/ATL_tpnrm1.c

src/testing/ATL_trgen.c

src/testing/ATL_trnrm1.c

src/testing/ATL_tstsqtran.c

src/testing/ATL_vdiff.c

tune/blas/gemm/CASES/ATL_dmm14x1x56_sse2pABC.c

tune/blas/gemm/CASES/ATL_dmm14x1x56_sse2pABC_K.c

tune/blas/gemm/CASES/ATL_dmm14x1x56_sse2pABC_MN.c

tune/blas/gemm/CASES/ATL_dmm1x14x56_sse2pABC.c

tune/blas/gemm/CASES/ATL_dmm1x6x72_sse2.c

tune/blas/gemm/CASES/ATL_dmm2x1x24_5pABC.c

tune/blas/gemm/CASES/ATL_dmm2x1x40_5pABC.c

tune/blas/gemm/CASES/ATL_dmm2x2x128_sse2.c

tune/blas/gemm/CASES/ATL_dmm2x2x2_sse2.c

tune/blas/gemm/CASES/ATL_dmm4x1x44_4_sse2.c

tune/blas/gemm/CASES/ATL_dmm4x1x90_x87.c

tune/blas/gemm/CASES/ATL_dmm4x2x128_sse2.c

tune/blas/gemm/CASES/ATL_dmm4x2x4_avx.c

tune/blas/gemm/CASES/ATL_dmm4x4x16r8_US.c

tune/blas/gemm/CASES/ATL_dmm4x4x2_US.c

tune/blas/gemm/CASES/ATL_dmm4x4x2_mips.c

tune/blas/gemm/CASES/ATL_dmm4x4x2pf_av.c

tune/blas/gemm/CASES/ATL_dmm4x4x32_ppc.c

tune/blas/gemm/CASES/ATL_dmm4x4x80_ppc.c

tune/blas/gemm/CASES/ATL_dmm4x4x8_US.c

tune/blas/gemm/CASES/ATL_dmm4x4xUR2_mips.c

tune/blas/gemm/CASES/ATL_dmm4x4xUR3_mips.c

tune/blas/gemm/CASES/ATL_dmm4x4xURx_mips.c

tune/blas/gemm/CASES/ATL_dmm6x1x30_x87.c

tune/blas/gemm/CASES/ATL_dmm6x1x60_sse2.c

tune/blas/gemm/CASES/ATL_dmm6x1x60_sse2_32.c

tune/blas/gemm/CASES/ATL_dmm6x1x60pABC.c

tune/blas/gemm/CASES/ATL_dmm6x1x72_sse2.c

tune/blas/gemm/CASES/ATL_dmm6x1x72_sse2_K.c

tune/blas/gemm/CASES/ATL_dmm8x1x120_L1pf.c

tune/blas/gemm/CASES/ATL_dmm8x1x120_sse2.c

tune/blas/gemm/CASES/ATL_dmm_julian_gas_30.c

tune/blas/gemm/CASES/ATL_dmm_sse2_80.c

tune/blas/gemm/CASES/ATL_dmm_sse2_80M.c

tune/blas/gemm/CASES/ATL_dmm_sse2_80N.c

tune/blas/gemm/CASES/ATL_dmm_sse2_K.c

tune/blas/gemm/CASES/ATL_mm4x3x2p.c

tune/blas/gemm/CASES/ATL_mm4x3x8p.c

tune/blas/gemm/CASES/ATL_mm4x4x2US.c

tune/blas/gemm/CASES/ATL_mm4x4x2US_MN.c

tune/blas/gemm/CASES/ATL_mm4x4x2US_NB.c

tune/blas/gemm/CASES/ATL_mm4x4x2_1_pref.c

tune/blas/gemm/CASES/ATL_mm4x4x2_1_prefCU.c

tune/blas/gemm/CASES/ATL_mm4x4x2rp.c

tune/blas/gemm/CASES/ATL_mm4x4x4_av.c

tune/blas/gemm/CASES/ATL_mm4x4x56_av.c

tune/blas/gemm/CASES/ATL_mm4x4x8_av.c

tune/blas/gemm/CASES/ATL_mm4x4x8_bpfab.c

tune/blas/gemm/CASES/ATL_mm4x4x8_bpfabc.c

tune/blas/gemm/CASES/ATL_mm4x4x8p.c

tune/blas/gemm/CASES/ATL_mm6x8x8_1p.c

tune/blas/gemm/CASES/ATL_mm8x8x2.c

tune/blas/gemm/CASES/ATL_objdummy.c

tune/blas/gemm/CASES/ATL_smm10x1x120_sse.c

tune/blas/gemm/CASES/ATL_smm14x1x84_sse.c

tune/blas/gemm/CASES/ATL_smm14x1x84_sseCU.c

tune/blas/gemm/CASES/ATL_smm2x2x256_sse.c

tune/blas/gemm/CASES/ATL_smm4x1x256_sse.c

tune/blas/gemm/CASES/ATL_smm4x1x60_4_sse2.c

tune/blas/gemm/CASES/ATL_smm4x2x8_avx.c

tune/blas/gemm/CASES/ATL_smm4x4x128_av.c

tune/blas/gemm/CASES/ATL_smm4x4x16_US.c

tune/blas/gemm/CASES/ATL_smm4x4x16_av.c

tune/blas/gemm/CASES/ATL_smm4x4x2_US.c

tune/blas/gemm/CASES/ATL_smm4x4x4_av.c

tune/blas/gemm/CASES/ATL_smm4x4x72_US.c

tune/blas/gemm/CASES/ATL_smm4x4xURx_mips.c

tune/blas/gemm/CASES/ATL_smm6x1x120_sse.c

tune/blas/gemm/CASES/ATL_smm6x1x60_sse.c

tune/blas/gemm/CASES/ATL_smm6x1x60_x87.c

tune/blas/gemm/CASES/ATL_smm6x1x80_sse.c

tune/blas/gemm/CASES/ATL_smmMNCU_av.c

tune/blas/gemm/CASES/ATL_smm_3dnow_100.c

tune/blas/gemm/CASES/ATL_smm_3dnow_100M.c

tune/blas/gemm/CASES/ATL_smm_3dnow_100N.c

tune/blas/gemm/CASES/ATL_smm_3dnow_K.c

tune/blas/gemm/CASES/ATL_smm_sse1_56.c

tune/blas/gemm/CASES/ATL_smm_sse1_56M.c

tune/blas/gemm/CASES/ATL_smm_sse1_56N.c

tune/blas/gemm/CASES/ATL_smm_sse1_60.c

tune/blas/gemm/CASES/ATL_smm_sse1_60M.c

tune/blas/gemm/CASES/ATL_smm_sse1_60N.c

tune/blas/gemm/CASES/ATL_smm_sse1_64.c

tune/blas/gemm/CASES/ATL_smm_sse1_64M.c

tune/blas/gemm/CASES/ATL_smm_sse1_64N.c

tune/blas/gemm/CASES/ATL_smm_sse1_K.c

tune/blas/gemm/CASES/ATL_smm_sse2_112.c

tune/blas/gemm/CASES/ATL_smm_sse2_112M.c

tune/blas/gemm/CASES/ATL_smm_sse2_112N.c

tune/blas/gemm/CASES/ccases.SSE

tune/blas/gemm/CASES/ccases.flg

tune/blas/gemm/CASES/dcases.SSE

tune/blas/gemm/CASES/dcases.flg

tune/blas/gemm/CASES/objs/ATL_dJIK30x30x30TN30x30x0_a1.cfg

tune/blas/gemm/CASES/objs/ATL_dJIK30x30x30TN30x30x0_a1.mcr

tune/blas/gemm/CASES/objs/ATL_dJIK30x30x30TN30x30x0_a1_b0.asm

tune/blas/gemm/CASES/objs/ATL_dJIK30x30x30TN30x30x0_a1_b1.asm

tune/blas/gemm/CASES/objs/ATL_dJIK30x30x30TN30x30x0_a1_bX.asm

tune/blas/gemm/CASES/objs/ATL_sJIK48x48x48TN48x48x0_a1.cfg

tune/blas/gemm/CASES/objs/ATL_sJIK48x48x48TN48x48x0_a1.mcr

tune/blas/gemm/CASES/objs/ATL_sJIK48x48x48TN48x48x0_a1_b0.asm

tune/blas/gemm/CASES/objs/ATL_sJIK48x48x48TN48x48x0_a1_b1.asm

tune/blas/gemm/CASES/objs/ATL_sJIK48x48x48TN48x48x0_a1_bX.asm

tune/blas/gemm/CASES/objs/Make.ext

tune/blas/gemm/CASES/scases.SSE

tune/blas/gemm/CASES/scases.flg

tune/blas/gemm/CASES/zcases.SSE

tune/blas/gemm/CASES/zcases.flg

tune/blas/gemm/emit_mm.c

tune/blas/gemm/fc.c

tune/blas/gemm/findCE.c

tune/blas/gemm/hcsearch.c

tune/blas/gemm/mmsearch.c

tune/blas/gemm/mmtst.c

tune/blas/gemm/tfc.c

tune/blas/gemm/ummsearch.c

tune/blas/gemm/usercomb.c

tune/blas/gemm/userflag.c

tune/blas/gemm/userindex.c

tune/blas/level1/AXPY/zcases.dsc

tune/blas/level1/COPY/copy_std.c

tune/blas/level1/IAMAX/ccases.dsc

tune/blas/level1/IAMAX/iamax_sse.c

tune/blas/level1/NRM2/nrm21_x0.c

tune/blas/level1/NRM2/nrm21_x1.c

tune/blas/level1/NRM2/nrm24p120_x1.c

tune/blas/level1/SET/set_x86.c

tune/blas/level1/asumsrch.c

tune/blas/level1/asumtest.c

tune/blas/level1/asumtime.c

tune/blas/level1/axpbysrch.c

tune/blas/level1/axpbytest.c

tune/blas/level1/axpbytime.c

tune/blas/level1/axpysrch.c

tune/blas/level1/axpytest.c

tune/blas/level1/axpytime.c

tune/blas/level1/copysrch.c

tune/blas/level1/copytest.c

tune/blas/level1/copytime.c

tune/blas/level1/cpscsrch.c

tune/blas/level1/cpsctest.c

tune/blas/level1/cpsctime.c

tune/blas/level1/dotsrch.c

tune/blas/level1/dottest.c

tune/blas/level1/dottime.c

tune/blas/level1/iamaxsrch.c

tune/blas/level1/iamaxtest.c

tune/blas/level1/iamaxtime.c

tune/blas/level1/nrm2srch.c

tune/blas/level1/nrm2test.c

tune/blas/level1/nrm2time.c

tune/blas/level1/rotsrch.c

tune/blas/level1/rottest.c

tune/blas/level1/rottime.c

tune/blas/level1/scalsrch.c

tune/blas/level1/scaltest.c

tune/blas/level1/scaltime.c

tune/blas/level1/setsrch.c

tune/blas/level1/settest.c

tune/blas/level1/settime.c

tune/blas/level1/swapsrch.c

tune/blas/level1/swaptest.c

tune/blas/level1/swaptime.c

tune/blas/level3/ATL_trsm.c

tune/blas/level3/gen_trsmnb.c

tune/blas/level3/invtrsm.c

tune/blas/level3/tsmfc.c

tune/sysinfo/ATL_cputime.c

tune/sysinfo/ATL_walltime.c

tune/sysinfo/GetSysSum.c

tune/sysinfo/L1CacheSize.c

tune/sysinfo/emit_buildinfo.c

tune/sysinfo/emit_typ.c

Show diffs side-by-side

added added

removed removed

tune/blas/gemv/MVTCASES/ATL_sgemvT_8x4_neon.S

* Automatically Tuned Linear Algebra Software v3.10.1

* Redistribution and use in source and binary forms, with or without

* modification, are permitted provided that the following conditions

* are met:

* 1. Redistributions of source code must retain the above copyright

* notice, this list of conditions and the following disclaimer.

* 2. Redistributions in binary form must reproduce the above copyright

* notice, this list of conditions, and the following disclaimer in the

* documentation and/or other materials provided with the distribution.

* 3. The name of the ATLAS group or the names of its contributers may

* not be used to endorse or promote products derived from this

* software without specific written permission.

* THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS

* ``AS IS'' AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED

* TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR

* PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE ATLAS GROUP OR ITS CONTRIBUTORS

* BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR

* CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF

* SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS

* INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN

* CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE)

* ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE

* POSSIBILITY OF SUCH DAMAGE.

#ifndef ATL_GAS_ARM

#error "This routine requires GAS/ARM assembly"

#endif

#ifndef ATL_NEON

#error "This routine requires an ARM NEON SIMD unit!"

#endif

#ifndef ATL_NONIEEE

#error "This NEON routine requires turning off IEEE compliance!"

#endif

/* Written and Submitted by Md Majedul Haque Sujon */

/* Unroll and Scalar expansion:

* I have tried following unroll factors (MxN): 4x2, 4x4, 8x2, 8x4, 8x6

* I found better performance by using 8x4 (better than 8x6). In case of

* 8x6, I need to reuse fp registers which reduce the scalar expansion as

* well as increase the data dependency.

* Prefetch:

* I have tried prefetch with offset 128, 64, 32, 16. Surprisingly, I

* found little variation in performance with the parameter.

* Splitting clean up into 2 cases:

* I have splitted into two separate cases" TALL and FAT. I provided

* separate implementations for each case.

* --------------------------------

* | | |

* | |TALL |

* | |CASE |

* | | |

* |----------------------- |

* | FAT CASE | |

* | | |

* --------------------------------

* For cleanup, I first called TALL case and then FAT case which I beleive

* provide better performance. When lda is not very larger than M,prefetch

* helps TALL case.

* a) TALL case:

* For remaining N<4, TALL case will execute. To provie better

* performance, I want to use maximum the vector operations as much as

* possible. So, I implement 3 blocks: N==3, N==2 and N==1. Each block

* uses M unrolled by 8 (remaining M%8 elements will fall into scalar loop)

* b) FAT case:

* For remaining M < 8, the program will execute FAT cases. I use

* saxpy like implementation (loading X in outer loop and loading A and Yin

* innerloop) for this case for better performance. It provides decent

* performance in comparison with the scalar implementation.

* Yet, I want to maximumize the use of vector ops. So, I implemented 3

* blocks: for M==4, M==2, M==1 (where in M==4, I used unroll of 4 and

* M==2, I used unroll of 2). Any case with 1<=M<8 will execute like this:

* 7=4+2+1, 6=4+2, 5=4+1 ... ...

* Alignment:

* Here, A is the main bottle neck. So, aligning X or Y would not work. I

* beleive, striding access of A ( by lda*4 element) and aligning each

* stride of A would improve the performance. I have implemented code for

* strided access but can't complete the cleanup part.

* -----------------------------------------

* | | | | | | | | | |

* |A | | | |A2 | | | | A3 |

* | | | | | | | | | |

* | |A | | | |A2| | | |

* -----------------------------------------

100

101

* Future work:

102

* I will incorporate memory alignment optimization with this code.

103

104

105

106

/* KNOWN ISSUE:

107

* I found a strange problem with the vector operation. In my TALL case,

108

* When M is very large and N=odd like, 1,2,3 there is a floating point

109

* precision problem. ATLAS tester fails with diff=0.000001 ~ 0.000005.

110

* I have checked my code for errors but failed to find any. If I am right,

111

* there may be 2 sources : a) using VMLA instruction. b) using vector

112

* register as scalar (like: d1[0]) to store and load.

113

* I want to use VFMA(Vector Fused Multiply Accumulate) which would provide

114

* better precision but the tested hardware doesn't support this. Reference for

115

* VFMA:

116

* http://infocenter.arm.com/help/index.jsp?topic=/com.arm.doc.dui0489c/CIHEJBIE.html

117

118

* Please let me know if you find any problem in my code.

119

* RCW: caused by non-IEEE complaint arithmetic of NEON.

120

121

122

* -- Thanks,

123

* Md Majedul Haque Sujon.

124

125

126

127

128

#define M r0

129

#define N r1

130

#define A r2

131

#define lda r3

132

133

#define X r4

134

#define Y r5

135

136

#define A2 r6

137

#define A3 r7

138

#define A4 r8

139

140

#define lastX r9

141

#define lastY r10

142

143

/* mainly used for indexing, used as other purpose if needed*/

144

#define II r11

145

/* used mainly to check X addr or Y addr*/

146

#define CHKXY r12

147

148

/* mainly used for jump location, used for

149

*other purpose if regs are not available

150

151

152

#define JTARGCY r14

153

154

#define SP r13

155

156

#define FSIZE_X 100

157

#define FSIZE_Y 104

158

159

160

/* r0 r1 r2 r3

161

void ATL_UGEMV(const int M, const int N, const float *A, const int lda, const

162

1st overflow 2nd overflow arg

163

float *X ,float *Y)

164

165

166

.code 32

167

.fpu neon

168

.text

169

.align 2

170

/* .arm */

171

.globl ATL_asmdecor(ATL_UGEMV)

172

ATL_asmdecor(ATL_UGEMV):

173

.type ATL_asmdecor(ATL_UGEMV), %function

174

175

/* save regs */

176

177

push {r4-r11,r14}

178

vpush {q4-q7}

179

/* stmDB SP!, {r4-r11,r14} */

180

181

#################################

182

/* just for a test. ommited */

183

#################################

184

//fmrx lastX, FPSCR

185

//push {lastX} // need to add 4 to FSIZE_X, FSIZE_Y

186

//mvn II, #0xF

187

//and II, II, lastX /* zero exception bits*/

188

//bic II, II, #(1<<24) /* turn off flush-to-zero*/

189

//fmxr FPSCR, II

190

191

##############################

192

193

/* load parameter */

194

ldr X,[SP,#FSIZE_X]

195

ldr Y,[SP, #FSIZE_Y]

196

197

198

/* calculate end of X and Y adddress*/

199

add lastX, X, M, LSL #2

200

add lastY, Y, N, LSL #2

201

202

PLD [X]

203

PLD [A]

204

205

/* calculate address of As*/

206

add A2, A, lda, LSL #2

207

add A3, A2,lda, LSL #2

208

add A4, A3, lda, LSL #2

209

210

PLD [A2]

211

PLD [A3]

212

PLD [A4]

213

214

/* set jump location for TALL case*/

215

ldr JTARGCY, =DONE

216

217

/* N<4? goto TALL case directly */

218

cmp N, #4

219

BLT N_LESS_4

220

221

/* flag whether it is not only FAT case, need to track for BETA0 */

222

EOR JTARGCY, JTARGCY /* JTARGCY =0 */

223

224

/* M<8? goto FAT case directly*/

225

cmp M, #8

226

BLT M_LESS_8_N_GE_4

227

228

################################################

229

/* M >= 8 and N >= 4 */

230

/* M_GE8_NGE4: */

231

#################################################

232

233

234

/* M remaining (M/8)*8 */

235

mov II, M, LSR #3

236

LSL II, II, #3

237

/* CHKXY contains X address upto remainder*/

238

add CHKXY, X, II, LSL #2

239

240

/* here JTARGCY is used as end of rounded Y address*/

241

mov JTARGCY, N, LSR #2

242

LSL JTARGCY, JTARGCY, #2

243

add JTARGCY, Y, JTARGCY, LSL #2

244

245

/* calculate distance to point next A-s*/

246

LSL lda, lda, #2

247

sub lda, lda, II

248

LSL lda, lda, #2

249

250

/* no available int reg, but A is needed to be saved

251

* otherwise need to use complex calc with multplication

252

* so I saved it in stack. ....

253

254

push {A}

255

256

257

N4_LOOP:

258

259

/* to ommit the EOR in each N loop, I peel one iteration out, and multiply

260

* and save result to these regs. But the effect is so negligible that it

261

* doesn't improve the performance. For simplicity, I skipped those codes here.

262

263

264

/* clear reg */

265

VEOR q10, q10, q10

266

VEOR q11, q11, q11

267

VEOR q12, q12, q12

268

VEOR q13, q13, q13

269

270

M8_LOOP:

271

/* load x and all 4 A addr*/

272

VLD1.32 {d0,d1,d2,d3}, [X]! /* q0, q1 */

273

VLD1.32 {d4,d5,d6,d7},[A]! /* q2, q3 */

274

VLD1.32 {d8,d9,d10,d11},[A2]! /* q4, q5 */

275

VLD1.32 {d12,d13,d14,d15},[A3]! /* q6, q7 */

276

VLD1.32 {d16,d17,d18,d19},[A4]! /* q8, q9 */

277

278

/* prefetch*/

279

PLD [X, #64]

280

PLD [A, #64]

281

PLD [A2,#64]

282

283

VMLA.F32 q10, q2, q0

284

VMLA.F32 q11, q4, q0

285

VMLA.F32 q12, q6, q0

286

VMLA.F32 q13, q8, q0

287

288

PLD [A3, #64]

289

PLD [A4, #64]

290

291

VMLA.F32 q10, q3, q1

292

VMLA.F32 q11, q5, q1

293

VMLA.F32 q12, q7, q1

294

VMLA.F32 q13, q9, q1

295

296

cmp X, CHKXY

297

BNE M8_LOOP

298

299

/* horizontal pairwise add to add all the scalar expansion */

300

VPADD.F32 d28,d20,d21

301

VPADD.F32 d29,d22,d23

302

VPADD.F32 d30,d24,d25

303

VPADD.F32 d31,d26,d27

304

305

VPADD.F32 d20,d28,d29

306

VPADD.F32 d21,d30,d31

307

308

/* Store result*/

309

310

#ifdef BETA0

311

VST1.32 {d20-d21},[Y]!

312

#else

313

VLD1.32 {d22-d23},[Y]

314

VADD.F32 q10, q10, q11

315

VST1.32 {d20-d21},[Y]!

316

#endif

317

318

/* add (lda-M)*4 to A-s, here is the effective distanc here */

319

320

add A, A, lda

321

add A2,A2,lda

322

add A3,A3,lda

323

add A4,A4,lda

324

325

/* position X */

326

sub X, X, II, LSL#2

327

328

cmp Y, JTARGCY

329

BNE N4_LOOP

330

331

332

#############################################################

333

/* Now, there would be two remaining cases: TALL and FAT

334

* I will call TALL case first

335

336

337

* --------------------------------

338

* | | |

339

* | | |

340

* | |TALL |

341

* | |CASE |

342

* | | |

343

* |----------------------- |

344

* | FAT CASE | |

345

* | | |

346

* --------------------------------

347

348

349

350

351

/* what happens to the registers: */

352

353

/* Now, X == init X + {(M/8)*8}*4 , Y== init Y + ((N/4)*4)*4

354

* lda is changed.. need to restore

355

* M, N = unchanged

356

* A = changed...to next position

357

358

359

/* CALL the TALL case: set parameter*/

360

/* restore lda: lda = (lda + II*4 ) / 16 */

361

add lda, lda, II, LSL #2

362

LSR lda, lda, #4

363

364

/* X, Y is already set, M would be same, N need to set as remainder*/

365

subs N, lastY, JTARGCY

366

LSR N, N, #2

367

368

/* set A4 as the original A, as A4 is not used and we may need it in FAT case*/

369

pop {A4}

370

371

/* parameter for TALL call: */

372

373

/* Now, X == init X + {(M/8)*8}*4 , Y== init Y + ((N/4)*4)*4

374

* lastX, lastY = unchanged

375

* M, lda = original value

376

* N = N % 4

377

* A4 = original A

378

379

380

ldr JTARGCY, =FAT_REM

381

BNE N_LESS_4 /* N!=0, then goto TALL CASE*/

382

383

384

/* CALL the FAT case: */

385

386

FAT_REM:

387

388

/* First check whether there is any FAT case, if no.. no need to arrange param*/

389

390

/* M is unchanged from previous operation in TALL*/

391

mov II, M, LSR #3

392

subs M, M, II, LSL #3 /* M = remainder of M... set flags to check later*/

393

394

BEQ DONE /* M==0, no FAT case, goto done*/

395

396

/* arrange parameters */

397

398

/* Now, Y==lastY

399

* X == lastX or init X + {(M/8)*8}*4 depending upon the prev call !!!

400

* lastX, lastY = unchanged

401

* M = original M % 8

402

* lda is unchanged

403

* N = remainder,

404

* A = undef ... depend on condition... need to save before

405

* but A4 can be used to save A, as it is not used in TALL case

406

407

408

mov A, A4

409

410

/* parameter for FAT case should be:

411

* X = initial X + {(M/8)*8}*4

412

* Y = initial Y

413

* lda = original lda

414

* A, A2, A3, A4 = follow X

415

* lastX =original.. not changed

416

* lastY = Y + ((N/4)*4)*4

417

* M = original M % 8

418

* N = (original N/4)* 4

419

* Need to handle BETA0

420

421

422

ldr X,[SP, #FSIZE_X] /* load X again, as X is undefined */

423

ldr Y,[SP, #FSIZE_Y] /* load Y again as Y and N is changed */

424

425

426

add X, X, II, LSL #5 /* X = X + II* 32 */

427

add A, A, II, LSL #5 /* A = A + II* 32 */

428

429

add A2, A, lda, LSL #2

430

add A3, A2,lda, LSL #2

431

add A4, A3, lda, LSL #2

432

433

sub II, lastY, Y /* II = original N * 4 */

434

mov N, II, LSR #4 /* N = original N/4 */

435

LSL N, N, #2 /* N = (N/4)*4 */

436

437

add lastY, Y, N , LSL #2

438

439

440

/* flag for FAT cases to avoid to store for BETA0 */

441

mov JTARGCY, #1

442

B M_LESS_8_N_GE_4

443

444

###############################################################

445

446

DONE:

447

448

449

//pop {lastX}

450

//fmxr FPSCR, lastX

451

452

453

454

/* resotore regs */

455

vpop {q4-q7}

456

pop {r4-r11,r14}

457

458

/* ldmIA can be used instead of pop*/

459

/* ldmIA SP!, {r4-r11,r14} */

460

461

bx lr

462

463

464

###############################################################

465

/* Special case M>=8(currently M is multiple of 8) N<4 */

466

/* TALL A */

467

468

/* Handled each case separately: n=3,2,1*/

469

470

###############################################################

471

472

473

N_LESS_4:

474

475

/* A4 is not used in this case, I reuse it between two calls*/

476

477

/* M<8 ? goto scalar block*/

478

cmp M,#8

479

BLT M_LESS8_N_LESS4

480

481

/* II = (M/8)*8 */

482

mov II, M, LSR #3

483

LSL II, II, #3

484

485

/* CHKXY contains X address upto remainder*/

486

add CHKXY, X, II, LSL #2

487

488

489

/* N < 3? goto N<=2 test */

490

cmp N,#3

491

BLT N_LESS_3

492

493

######################################

494

/* N == 3 */

495

######################################

496

497

/* assuming lda, A, A2, A3 in correct position*/

498

/* lastX = last element*/

499

500

/* clear regs*/

501

VEOR q2, q2, q2

502

VEOR q3, q3, q3

503

VEOR q4, q4, q4

504

VEOR q5, q5, q5

505

VEOR q6, q6, q6

506

VEOR q7, q7, q7

507

508

M_N3_LOOP:

509

/* load x and all 4 A addr*/

510

VLD1.32 {d0,d1,d2,d3}, [X]! /* q0, q1 */

511

VLD1.32 {d16,d17,d18,d19},[A]! /* q8, q9 */

512

VLD1.32 {d20,d21,d22,d23},[A2]! /* q10, q11 */

513

VLD1.32 {d24,d25,d26,d27},[A3]! /* q12, q13 */

514

515

PLD [X, #32]

516

PLD [A, #32]

517

PLD [A2,#32]

518

PLD [A3,#32]

519

520

VMLA.F32 q2, q8, q0

521

VMLA.F32 q3, q9, q1

522

VMLA.F32 q4, q10, q0

523

VMLA.F32 q5, q11, q1

524

VMLA.F32 q6, q12, q0

525

VMLA.F32 q7, q13, q1

526

527

cmp X, CHKXY

528

BNE M_N3_LOOP

529

530

/*add up regs */

531

532

VADD.F32 q14,q2,q3

533

VADD.F32 q15,q4,q5

534

VADD.F32 q0,q6,q7

535

536

/* horizontal pairwise add to addup scalar expansion */

537

538

VPADD.F32 d20, d28, d29

539

VPADD.F32 d21, d30, d31

540

VPADD.F32 d23, d0, d1

541

542

VPADD.F32 d25, d20, d21

543

VPADD.F32 d26, d23, d24 /* d24 is garbase, not saved in Y*/

544

545

#ifdef BETA0

546

VST1.32 {d25},[Y]!

547

VST1.32 {d26[0]}, [Y]!

548

#else

549

VLD1.32 {d28},[Y]!

550

VLD1.32 {d29[0]}, [Y]!

551

552

VADD.F32 d28, d28, d25

553

VADD.F32 d29,d29,d26

554

sub Y, Y, #12 /* restore back the prev value*/

555

556

VST1.32 {d28}, [Y]!

557

VST1.32 {d29[0]}, [Y]!

558

#endif

559

560

cmp CHKXY,lastX

561

BxEQ JTARGCY

562

563

/* set Y to initial position*/

564

sub Y, Y, #12

565

566

/* set effective lda to move around A in loop*/

567

sub II, M, II /* number of remaining element*/

568

569

/* call clean up to complete */

570

B CLEANUP_M_LESS_8

571

572

573

N_LESS_3:

574

575

cmp N, #2

576

BLT N_EG_1

577

578

###################################################

579

/* N == 2 */

580

581

###################################################

582

583

/* assuming X, A, A2, in correct position*/

584

585

/* clear regs*/

586

VEOR q2, q2, q2

587

VEOR q3, q3, q3

588

VEOR q4, q4, q4

589

VEOR q5, q5, q5

590

591

592

M_N2_LOOP:

593

/* load x and all 4 A addr*/

594

VLD1.32 {d0,d1,d2,d3}, [X]! /* q0, q1 */

595

VLD1.32 {d18,d19,d20,d21},[A]! /* q9, q10 */

596

VLD1.32 {d22,d23,d24,d25},[A2]! /* q11, q12 */

597

598

PLD [X, #32]

599

PLD [A, #32]

600

PLD [A2,#32]

601

602

VMLA.F32 q2, q9, q0

603

VMLA.F32 q3, q10, q1

604

VMLA.F32 q4, q11, q0

605

VMLA.F32 q5, q12, q1

606

607

cmp X, CHKXY

608

BNE M_N2_LOOP

609

610

VADD.F32 q6, q2, q3

611

VADD.F32 q7, q4, q5

612

613

/* horizontal pairwise add using vpadd */

614

/* horizontal add, rd = d18*/

615

616

VPADD.F32 d17, d14, d15

617

VPADD.F32 d16, d12, d13

618

VPADD.F32 d18, d16, d17

619

620

621

#ifdef BETA0

622

VST1.32 {d18},[Y]!

623

#else

624

VLD1.32 {d4},[Y]

625

VADD.F32 d18, d18, d4

626

VST1.32 {d18},[Y]!

627

#endif

628

629

cmp CHKXY,lastX

630

BxEQ JTARGCY

631

632

/* set Y to initial position*/

633

sub Y, Y, #8

634

635

636

/* number of remaining element*/

637

sub II, M, II

638

639

/* goto cleanup*/

640

641

B CLEANUP_M_LESS_8

642

643

N_EG_1:

644

645

######################################################

646

/* N == 1 */

647

648

######################################################

649

650

/* assuming X, A, in correct position*/

651

652

653

VEOR q2, q2, q2

654

VEOR q3, q3, q3

655

656

M_N1_LOOP:

657

/* load x and all 4 A addr*/

658

VLD1.32 {d0,d1,d2,d3}, [X]! /* q0, q1 */

659

VLD1.32 {d18,d19,d20,d21},[A]! /* q9, q10 */

660

661

PLD [X, #32]

662

PLD [A, #32]

663

664

VMLA.F32 q2, q9, q0

665

VMLA.F32 q3, q10, q1

666

667

cmp X, CHKXY

668

BNE M_N1_LOOP

669

670

VADD.F32 q6, q2, q3

671

VADD.F32 d14,d12,d13

672

673

VPADD.F32 d16, d14, d13 /* d13 garbase but not used to save in Y*/

674

675

676

#ifdef BETA0

677

VST1.32 {d16[0]},[Y]!

678

#else

679

VLD1.32 {d17[0]},[Y]

680

VADD.F32 d18, d16, d17

681

682

VST1.32 {d18[0]},[Y]!

683

#endif

684

685

cmp CHKXY,lastX

686

BxEQ JTARGCY

687

688

/* set Y to initial position*/

689

sub Y, Y, #4

690

691

sub II, M, II /* number of remaining element*/

692

693

/* for BETA0, there may be 2 cases:

694

* 1. 1st case falls through from above cases: need to load Y even in BETA0

695

* 2. 2nd case occurs for the 1st time: no load of Y;

696

697

698

/* to reduce extra condition check and simplicity

699

* I separated out this two cases

700

701

702

CLEANUP_M_LESS_8:

703

704

/* II is the remainder for X */

705

706

/* use A2 to precalculate lda distance*/

707

sub A2, lda, II

708

LSL A2, A2, #2

709

710

CLEANUP_NL4_LOOP:

711

/* clear reg */

712

VEOR d2, d2, d2

713

714

CLEANUP_ML8_LOOP:

715

716

VLD1.32 {d0[0]},[X]!

717

VLD1.32 {d1[0]}, [A]!

718

VMLA.F32 d2, d1, d0

719

720

cmp X, lastX

721

BNE CLEANUP_ML8_LOOP

722

723

/* No need to use BETA0 macro as it's cleanup case */

724

725

VLD1.32 {d3[0]}, [Y]

726

727

VADD.F32 d3, d3, d2

728

VST1.32 {d3[0]},[Y]!

729

730

731

add A, A, A2

732

sub X, X, II, LSL #2

733

734

cmp Y, lastY

735

BNE CLEANUP_NL4_LOOP

736

737

Bx JTARGCY

738

739

740

###############################################

741

/* M<8 and N<4 and M_N_scalar loop*/

742

/* scaler implementation , not a fall through case*/

743

744

745

M_LESS8_N_LESS4:

746

747

/* calculate effective lda once before loop */

748

sub lda,lda,M

749

LSL lda,lda,#2

750

751

752

NL4_LOOP:

753

/* clear reg */

754

VEOR d2, d2, d2

755

ML8_LOOP:

756

VLD1.32 {d0[0]},[X]!

757

VLD1.32 {d1[0]}, [A]!

758

VMLA.F32 d2, d1, d0

759

cmp X, lastX

760

BNE ML8_LOOP

761

762

#ifdef BETA0

763

764

VST1.32 {d2[0]},[Y]!

765

766

#else

767

VLD1.32 {d3[0]}, [Y]

768

VADD.F32 d3, d3, d2

769

VST1.32 {d3[0]},[Y]!

770

771

#endif

772

773

add A, A, lda

774

sub X, X, M, LSL #2

775

776

cmp Y, lastY

777

BNE NL4_LOOP

778

779

B DONE

780

781

782

783

###############################################################

784

/* FAT CASE ........... M < 8 N>=4*/

785

###############################################################

786

787

788

/* All of the below implementation is like SAXPY calculation

789

* main idea: Load all the X at once, now in inner loop load Y,

790

* do computation and store back to Y....

791

* BETA0 need to be handled carefully

792

793

794

###############################################################

795

796

797

/* need to handle Y clean up for 4,2 case */

798

/* Special case M<8 and N>=4, saxpy like implementation*/

799

800

M_LESS_8_N_GE_4:

801

802

/* BETA0, then peel 1st iteration,

803

* for 1st iteration, we need to store without load

804

805

806

#ifdef BETA0

807

808

/* JTARGCY==1, it is not direct case, FAT is called for cleanup

809

* so, skipped it

810

811

812

cmp JTARGCY, #1

813

BEQ STR_SKIPPED

814

815

mov CHKXY, Y

816

mov II, A

817

818

VLD1.32 {d0[0]},[X]!

819

820

BETA0_M1_PEEL_LOOP:

821

822

VLD1.32 {d1[0]}, [A]

823

VMUL.F32 d2, d1, d0

824

VST1.32 {d2[0]},[Y]!

825

826

add A, A, lda, LSL #2

827

cmp Y, lastY

828

BNE BETA0_M1_PEEL_LOOP

829

830

/* restore Y */

831

mov Y, CHKXY

832

833

/* restore A,A2,A3,A4 to their updated position */

834

mov A, II

835

add A, A, #4

836

add A2, A2, #4

837

add A3, A3, #4

838

add A4, A4, #4

839

840

/* 1 M iteration is done*/

841

subs M, M, #1

842

BEQ DONE /* M==0, got to DONE */

843

844

STR_SKIPPED:

845

846

#endif

847

848

849

/* N remaining II= (N/4)*4 */

850

mov II, N, LSR #2

851

LSL II, II, #2

852

/* CHKXY contains Y address upto remainder*/

853

add CHKXY, Y, II, LSL #2

854

855

856

/* M < 4 ? goto M2 case*/

857

cmp M, #4

858

BLT M2_N_GE4

859

860

/* M >= 4*/

861

############################################################

862

863

M4_N_GE4:

864

865

/* M==4, this implementation is better than M4 x N4 unroll... 2 times better*/

866

867

mov JTARGCY, A /* save A in JTARGCY*/

868

869

870

/* load all X at once*/

871

VLD1.32 {d0-d1}, [X]!

872

873

874

M4_N_Y_LOOP:

875

VLD1.32 {d2-d3},[A]

876

VLD1.32 {d4-d5},[A2]

877

VLD1.32 {d6-d7},[A3]

878

VLD1.32 {d8-d9},[A4]

879

880

VLD1.32 {d10,d11},[Y]

881

PLD [Y, #32]

882

883

VMUL.F32 q1,q1,q0

884

VMUL.F32 q2,q2,q0

885

VMUL.F32 q3,q3,q0

886

VMUL.F32 q4,q4,q0

887

888

VADD.F32 d12,d2,d3

889

VADD.F32 d13,d4,d5

890

VADD.F32 d14,d6,d7

891

VADD.F32 d15,d8,d9

892

893

VPADD.F32 d16,d12,d13

894

VPADD.F32 d17,d14,d15

895

896

VADD.F32 q8,q8,q5

897

898

VST1.32 {d16,d17},[Y]!

899

900

901

add A, A, lda, LSL #4

902

add A2,A2,lda, LSL #4

903

add A3,A3,lda, LSL #4

904

add A4,A4,lda, LSL #4

905

906

cmp Y, CHKXY

907

BNE M4_N_Y_LOOP

908

909

910

/* no cleanup? goto M remaining check */

911

cmp Y,lastY

912

BEQ M4_M_REM_CHECK

913

914

/* cleanup for M4 case*/

915

916

/* Restore X to previous position*/

917

sub X,X, #16

918

919

VLD1.32 {d0-d1}, [X]!

920

M4_N1_Y_LOOP:

921

VLD1.32 {d2-d3},[A]

922

VMUL.F32 q1,q1,q0

923

924

VPADD.F32 d4,d2,d3

925

VPADD.F32 d6,d4,d5 /* d5 garbase, but not used for Y*/

926

927

VLD1.32 {d8[0]}, [Y]

928

VADD.F32 d6, d6, d8

929

VST1.32 {d6[0]},[Y]!

930

931

add A, A, lda, LSL #2

932

cmp Y, lastY

933

BNE M4_N1_Y_LOOP

934

935

936

937

M4_M_REM_CHECK:

938

939

/* restore Y and position A, A2.... */

940

941

sub Y, CHKXY, II, LSL#2

942

943

mov A, JTARGCY /* restore A*/

944

945

add A, A, #16

946

add A2, A, lda, LSL #2

947

948

/* find remaining element for X */

949

subs II, M, #4

950

BEQ DONE /* M==0, goto DONE*/

951

952

953

/* II<2? got to M==1 case*/

954

cmp II, #2

955

BLT M1_N_GE4

956

957

958

959

960

M2_N_GE4:

961

962

/* M<2? then goto SCALAR implementation*/

963

cmp M, #2

964

BLT M1_N_GE4

965

966

#################################################

967

/* case: for M = 7 (4+2+1), 6 (4+2), 2 and N>>4 */

968

/* CHKXY ----> has the addr multiple of 4 of Y */

969

970

/* A3, A4 is not used,

971

* A, Y can be stored in A3, A4

972

973

974

/* save A and Y*/

975

Mov A3, A

976

mov A4, Y

977

978

VLD1.32 {d0}, [X]!

979

980

/* X, A multiple of 2 floats*/

981

M2_N_Y_LOOP:

982

983

VLD1.32 {d2},[A]

984

VLD1.32 {d3},[A2]

985

986

VLD1.32 {d10},[Y]

987

988

PLD [Y, #32]

989

VMUL.F32 d4,d2,d0

990

VMUL.F32 d5,d3,d0

991

992

VPADD.F32 d6,d4,d5

993

VADD.F32 d6,d6,d10

994

VST1.32 {d6},[Y]!

995

996

add A, A, lda, LSL #3

997

add A2,A2,lda, LSL #3

998

999

cmp Y, CHKXY

1000

BNE M2_N_Y_LOOP

1001

1002

1003

/* cleanup for N

1004

1005

1006

/* check no cleanup for Y, goto M check*/

1007

cmp Y,lastY

1008

BEQ M2_M_REM_CHECK

1009

1010

1011

/* Restore X to previous position */

1012

sub X,X, #8

1013

1014

VLD1.32 {d0}, [X]!

1015

1016

M2_N1_Y_LOOP:

1017

VLD1.32 {d1},[A]

1018

VMUL.F32 d1,d1,d0

1019

1020

VPADD.F32 d3,d1,d2 // d2 garbase

1021

1022

VLD1.32 {d4[0]}, [Y]

1023

VADD.F32 d3, d3, d4

1024

VST1.32 {d3[0]},[Y]!

1025

1026

add A, A, lda, LSL #2

1027

cmp Y, lastY

1028

BNE M2_N1_Y_LOOP

1029

1030

/* remaining M check*/

1031

1032

M2_M_REM_CHECK:

1033

/* restote A and Y */

1034

/* mov A to appropriate position... A += 8*/

1035

mov A, A3

1036

add A, A, #8

1037

mov Y, A4

1038

1039

/* check whether M is done, if not goto SCALAR loops*/

1040

cmp lastX,X

1041

BNE M1_N_GE4

1042

1043

B DONE

1044

1045

############################################################

1046

/* Complete SCALAR implementation for saxpy like case*/

1047

/* needed for odd case of M*/

1048

1049

M1_N_GE4:

1050

1051

VLD1.32 {d0[0]},[X]!

1052

1053

NY_LOOP_SCALAR:

1054

1055

VLD1.32 {d1[0]}, [A]

1056

VMUL.F32 d2, d1, d0

1057

1058

VLD1.32 {d3[0]}, [Y]

1059

VADD.F32 d3, d3, d2

1060

VST1.32 {d3[0]},[Y]!

1061

1062

add A, A, lda, LSL #2

1063

cmp Y, lastY

1064

1065

BNE NY_LOOP_SCALAR

1066

1067

B DONE

1068

Older »