我们可以用 cudaDeviceProp() 来获取设备信息,例如最多支持的线程数量,这样,我们可以在代码里动态调整线程数量.