simple_cuda_examples 几个简单的cuda例子,用于熟悉cuda基本知识和编程练习 向量相加 矩阵相乘 使用共享内存矩阵相乘 卷积核和最大池化 每个例子下有Makefile,可以直接make,前提是cuda环境正确,然后运行生成的exe文件 学习参考资料 何琨老师的《人工智能高性能计算》课程 《GPU高性能编程CUDA实战》