protect of device context

dcba416c · xiaotong · e083e9f2 · dcba416c · dcba416c · dcba416c
Commit dcba416c authored Jul 29, 2018 by xiaotong
--- a/source/tensor/core/movement/CopyBlocksInGrid.cu
+++ b/source/tensor/core/movement/CopyBlocksInGrid.cu
@@ -223,8 +223,11 @@ void _CudaCopyBlocksInGrid(void * source, int blockSize, int blockNum, int gridN
    int cudaGrids[3];
    int cudaBlocks[3];
    int threadNum = MIN(MAX(blockSize, blockNum), MAX_CUDA_THREAD_NUM_PER_BLOCK);
+    int devIDBackup;
+    ProtectCudaDev(myMem->devID, devIDBackup);
    GDevs.GetCudaThread2D(myMem->devID, threadNum, gridNum * blockNum, INT_MAX, cudaGrids, cudaBlocks);
    cudaBlocks[1] = 1;
@@ -270,6 +273,8 @@ void _CudaCopyBlocksInGrid(void * source, int blockSize, int blockNum, int gridN
        KernelCopyBlocksInGrid<int> << <dim3(cudaGrids[0], cudaGrids[1]), dim3(cudaBlocks[0], cudaBlocks[1]) >> >
                                      ((int*)source, blockSize, blockNum, gridNum, (int*)target, index);
    }
+    BacktoCudaDev(myMem->devID, devIDBackup);
 }
 #endif // USE_CUDA

--- a/source/tensor/core/movement/CopyBlocksOnSite.cu
+++ b/source/tensor/core/movement/CopyBlocksOnSite.cu
@@ -95,28 +95,33 @@ void _CudaCopyBlocks(void * source, int blockSize, int blockNum, void * target, 
    int cudaGrids[3];
    int cudaBlocks[3];
+    int devIDBackup;
+    ProtectCudaDev(devID, devIDBackup);
    if(blockSize % sizeof(double) == 0){
        int bSize = blockSize / sizeof(double);
-        //GDevs.GetCudaThread(devID, bSize * blockNum, cudaGrids, cudaBlocks);
+        GDevs.GetCudaThread(devID, bSize * blockNum, cudaGrids, cudaBlocks);
-        //KernelCopyBlocksV2<double> <<<dim3(cudaGrids[0]), dim3(cudaBlocks[0]) >>>
+        KernelCopyBlocksV2<double> <<<dim3(cudaGrids[0]), dim3(cudaBlocks[0]) >>>
-        //                            ((double*)source, bSize, blockNum, bSize * blockNum, (double*)target, targetBlocks);
+                                    ((double*)source, bSize, blockNum, bSize * blockNum, (double*)target, targetBlocks);
-        GDevs.GetCudaThread2D(devID, bSize, blockNum, MAX_INT, cudaGrids, cudaBlocks);
+        //GDevs.GetCudaThread2D(devID, bSize, blockNum, MAX_INT, cudaGrids, cudaBlocks);
-        KernelCopyBlocks<double> <<<dim3(cudaGrids[0], cudaGrids[1]), dim3(cudaBlocks[0], cudaBlocks[1]) >>>
+        //KernelCopyBlocks<double> <<<dim3(cudaGrids[0], cudaGrids[1]), dim3(cudaBlocks[0], cudaBlocks[1]) >>>
-                                    ((double*)source, bSize, blockNum, (double*)target, targetBlocks);
+        //                            ((double*)source, bSize, blockNum, (double*)target, targetBlocks);
    }
    else 
    if(blockSize % sizeof(float) == 0){
        int bSize = blockSize / sizeof(float);
-        //GDevs.GetCudaThread(devID, bSize * blockNum, cudaGrids, cudaBlocks);
+        GDevs.GetCudaThread(devID, bSize * blockNum, cudaGrids, cudaBlocks);
-        //KernelCopyBlocksV2<float> <<<dim3(cudaGrids[0]), dim3(cudaBlocks[0]) >>>
+        KernelCopyBlocksV2<float> <<<dim3(cudaGrids[0]), dim3(cudaBlocks[0]) >>>
-        //                           ((float*)source, bSize, blockNum, bSize * blockNum, (float*)target, targetBlocks);
+                                   ((float*)source, bSize, blockNum, bSize * blockNum, (float*)target, targetBlocks);
-        GDevs.GetCudaThread2D(devID, bSize, blockNum, MAX_INT, cudaGrids, cudaBlocks);
+        //GDevs.GetCudaThread2D(devID, bSize, blockNum, MAX_INT, cudaGrids, cudaBlocks);
-        KernelCopyBlocks<float> <<<dim3(cudaGrids[0], cudaGrids[1]), dim3(cudaBlocks[0], cudaBlocks[1]) >>>
+        //KernelCopyBlocks<float> <<<dim3(cudaGrids[0], cudaGrids[1]), dim3(cudaBlocks[0], cudaBlocks[1]) >>>
-                                 ((float*)source, bSize, blockNum, (float*)target, targetBlocks);
+        //                         ((float*)source, bSize, blockNum, (float*)target, targetBlocks);
    }
    else{
        ShowNTErrors("Unsupported block size!");
    }
+    BacktoCudaDev(devID, devIDBackup);
 }
 #endif // USE_CUDA

--- a/source/tensor/core/movement/CopyBlocksSelected.cu
+++ b/source/tensor/core/movement/CopyBlocksSelected.cu
@@ -75,6 +75,9 @@ void _CudaCopyBlocksSelected(void * source, int blockSize, int * sourceBlocks, i
    CheckNTErrors(devID >= 0, "Wrong device to run!");
    CheckNTErrors((blockSize % sizeof(DTYPE) == 0), "Unsupported block size!");
+    int devIDBackup;
+    ProtectCudaDev(devID, devIDBackup);
    /* copy the index to the GPU memory */
    int * sourceBlocksTMP = myMem != NULL ? (int*)myMem->AllocBuf(myMem->devID, blockNum * sizeof(int)) : (int *)XMemAlloc(devID, blockNum * sizeof(int));
    int * targetBlocksTMP = myMem != NULL ? (int*)myMem->AllocBuf(myMem->devID, blockNum * sizeof(int)) : (int *)XMemAlloc(devID, blockNum * sizeof(int));
@@ -97,6 +100,8 @@ void _CudaCopyBlocksSelected(void * source, int blockSize, int * sourceBlocks, i
        XMemFree(devID, sourceBlocksTMP);
        XMemFree(devID, targetBlocksTMP);
    }
+    BacktoCudaDev(devID, devIDBackup);
 }
 #endif // USE_CUDA