improve the code of _CudaBLASMatrixMULList

8f665e61 · xiaotong · ac620226 · 8f665e61
Commit 8f665e61 authored Nov 21, 2018 by xiaotong
--- a/source/tensor/core/arithmetic/XTensorBLAS.cu
+++ b/source/tensor/core/arithmetic/XTensorBLAS.cu
@@ -253,14 +253,14 @@ void _CudaBLASMatrixMULList(cublasHandle_t * handle,
    if (isUniform) {
        XMem * mem = a0->mem;
-        if (isStrided && a->count > 1) {
+        if (isStrided) {
            _CudaBLASMatrixMULBatchedStrided(handle,
-                                            a0->data, transposedA, a0->dataType, strideA / a0->unitSize,
+                                             a0->data, transposedA, a0->dataType, strideA / a0->unitSize,
-                                            b0->data, transposedB, b0->dataType, strideB / b0->unitSize,
+                                             b0->data, transposedB, b0->dataType, strideB / b0->unitSize,
-                                            c0->data, c0->dataType, strideC / c0->unitSize, a->count,
+                                             c0->data, c0->dataType, strideC / c0->unitSize, a->count,
-                                            a0->dimSize[0], a0->dimSize[1],
+                                             a0->dimSize[0], a0->dimSize[1],
-                                            b0->dimSize[0], b0->dimSize[1],
+                                             b0->dimSize[0], b0->dimSize[1],
-                                            c0->dimSize[0], c0->dimSize[1], alpha, beta);
+                                             c0->dimSize[0], c0->dimSize[1], alpha, beta);
        }
        else {
            DTYPE ** ap = new DTYPE*[a->count];
@@ -324,12 +324,12 @@ void _CudaBLASMatrixMULList(cublasHandle_t * handle,
            XTensor * ci = (XTensor*)c->GetItem(i);
            _CudaBLASMatrixMUL(handle,
-                              ai->data, transposedA, ai->dataType,
+                               ai->data, transposedA, ai->dataType,
-                              bi->data, transposedB, bi->dataType,
+                               bi->data, transposedB, bi->dataType,
-                              ci->data, ci->dataType,
+                               ci->data, ci->dataType,
-                              ai->dimSize[0], ai->dimSize[1],
+                               ai->dimSize[0], ai->dimSize[1],
-                              bi->dimSize[0], bi->dimSize[1],
+                               bi->dimSize[0], bi->dimSize[1],
-                              ci->dimSize[0], ci->dimSize[1], alpha, beta);
+                               ci->dimSize[0], ci->dimSize[1], alpha, beta);
        }
    }
 }