由于相关内容保密,不对外公布在互联网上,因此这里就简单总结一下前几天培训的内容
- 天河新一代系统和MT体系架构简介。
- htheads编程介绍、hthreads常见报错、查看dsp状态工具介绍、调试工具介绍。
- 并行程序设计与典型优化介绍。
- 熟悉mt3000编程环境目录结构;熟悉dsp端makefile;使用查看mt模块状态;使用free查看可用内存;使用工具查看dsp状态;编写异构向量加,熟悉hthreads编程。
- MT-LIBVM库概况与使用方法。
- MT-BLAS库概况与使用方法。
- MT-FFT库概况与使用方法。
- 数学库的使用编程实践。
- 异构编程中Dma优化技术、汇编介绍、Intrinsic介绍、并行优化、双缓冲等。
- 向量加的多核并行化、intrinsic向量化、内联汇编、汇编函数实现、DMA编程实践。
- 矩阵乘优化工作介绍。
- 任意规模矩阵的转置函数编程实践。
- 单精度、半精度(fp16)程序优化实例1介绍。
- 单精度、半精度(fp16)程序优化实例2介绍。
- 单精度、半精度(fp16)上机实践。
- 通过具体编程需求,评估培训效果。