漫游猫认证
GPU一般一个时钟周期可以操作64bit的数据,1个核心实现1个FMA。这个GPU的计算能力的单元是:64bit*1FMA*2M/A/64bit=2FLOPs/CycleGPU的计算能力也是一样和核心个数,核心频率,核心单时钟周期能力三个因素有关。