只需一步,快速开始
本次比赛并行计算部分主要优化尝试: 算法优化:winograd4x3-3D 指令级并行:循环展开,分支预测 数据级并行:AVX128,256,512 线程级并行:OPENMP 编译器:尝试gcc不同版本,对比llvm 内存排布:36*STRIDE 冒险尝试:merge_array Profiling:perf
举报
本版积分规则 发表回复 回帖后跳转到最后一页
Archiver|手机版|小黑屋|全球主机交流论坛
GMT+8, 2026-5-12 15:36 , Processed in 0.065015 second(s), 11 queries , Gzip On, MemCache On.
Powered by Discuz! X3.4
© 2001-2023 Discuz! Team.