YDYの博客

一只有理想的菜鸟

Github

编写MT3000设备端代码

  • bsKernel.dev.cBlackScholesKernel函数进行优化
    1
    2
    3
    4
    5
    6
    7
    8
    9
    __global__
    void BlackScholesKernel(uint64_t optionCount, \
    float R, \
    float V, \
    float *d_Call, \
    float *d_Put, \
    float *d_S, \
    float *d_X, \
    float *d_T)
  • 使用多线程编程/AM缓存数据/向量Intrinsic编程/异步DMA 等手段进行性能优化(至少使用前面3种优化方法)
  • 使用MT-Libvm处理kernel函数中对超越函数的调用
  • 能通过预提供的CPU端程序的正确性校验
  • 至少获得较原始函数10x的性能提升
阅读全文 »