cudaMalloc()对同步 cuda 函数(例如,cudaBindTextureToArray()等)的调用是否会阻塞主机,直到设备上所有先前请求的任务都完成?或者它只会阻塞直到对该同步函数的调用完成?
换句话说,对同步 cuda 函数的调用是否与cudaDeviceSynchronize()?
cudaMalloc()对同步 cuda 函数(例如,cudaBindTextureToArray()等)的调用是否会阻塞主机,直到设备上所有先前请求的任务都完成?或者它只会阻塞直到对该同步函数的调用完成?
换句话说,对同步 cuda 函数的调用是否与cudaDeviceSynchronize()?