diff --git a/source/rotate_neon.cc b/source/rotate_neon.cc
index a6496d33b..f717c5847 100644
--- a/source/rotate_neon.cc
+++ b/source/rotate_neon.cc
@@ -159,7 +159,7 @@ void TransposeWx8_NEON(const uint8* src, int src_stride,
       "vst1.8      {d6}, [r9]\n"
 
       "add         %0, #8\n"              // src += 8
-      "add         %2, %3, lsl #3\n"      // dst += 8 * dst_stride
+      "add         %2, %2, %3, lsl #3\n"  // dst += 8 * dst_stride
       "subs        %4,  #8\n"             // w   -= 8
       "bge         1b\n"
 
@@ -209,7 +209,7 @@ void TransposeWx8_NEON(const uint8* src, int src_stride,
     "vst1.32     {d1[1]}, [r9]\n"
 
     "add         %0, #4\n"              // src += 4
-    "add         %2, %3, lsl #2\n"      // dst += 4 * dst_stride
+    "add         %2, %2, %3, lsl #2\n"  // dst += 4 * dst_stride
     "subs        %4,  #4\n"             // w   -= 4
     "beq         4f\n"
 
@@ -238,7 +238,7 @@ void TransposeWx8_NEON(const uint8* src, int src_stride,
     "vst1.64     {d1}, [r9]\n"
 
     "add         %0, #2\n"              // src += 2
-    "add         %2, %3, lsl #1\n"      // dst += 2 * dst_stride
+    "add         %2, %2, %3, lsl #1\n"  // dst += 2 * dst_stride
     "subs        %4,  #2\n"             // w   -= 2
     "beq         4f\n"
 
@@ -414,8 +414,8 @@ void TransposeUVWx8_NEON(const uint8* src, int src_stride,
       "vst1.8      {d21}, [r9]\n"
 
       "add         %0, #8*2\n"            // src   += 8*2
-      "add         %2, %3, lsl #3\n"      // dst_a += 8 * dst_stride_a
-      "add         %4, %5, lsl #3\n"      // dst_b += 8 * dst_stride_b
+      "add         %2, %2, %3, lsl #3\n"  // dst_a += 8 * dst_stride_a
+      "add         %4, %4, %5, lsl #3\n"  // dst_b += 8 * dst_stride_b
       "subs        %6,  #8\n"             // w     -= 8
       "bge         1b\n"
 
@@ -484,8 +484,8 @@ void TransposeUVWx8_NEON(const uint8* src, int src_stride,
     "vst1.32     {d23[1]},  [r9]\n"
 
     "add         %0, #4*2\n"            // src   += 4 * 2
-    "add         %2, %3, lsl #2\n"      // dst_a += 4 * dst_stride_a
-    "add         %4, %5, lsl #2\n"      // dst_b += 4 * dst_stride_b
+    "add         %2, %2, %3, lsl #2\n"  // dst_a += 4 * dst_stride_a
+    "add         %4, %4, %5, lsl #2\n"  // dst_b += 4 * dst_stride_b
     "subs        %6,  #4\n"             // w     -= 4
     "beq         4f\n"
 
@@ -520,8 +520,8 @@ void TransposeUVWx8_NEON(const uint8* src, int src_stride,
     "vst1.64     {d3}, [r9]\n"
 
     "add         %0, #2*2\n"            // src   += 2 * 2
-    "add         %2, %3, lsl #1\n"      // dst_a += 2 * dst_stride_a
-    "add         %4, %5, lsl #1\n"      // dst_b += 2 * dst_stride_b
+    "add         %2, %2, %3, lsl #1\n"  // dst_a += 2 * dst_stride_a
+    "add         %4, %4, %5, lsl #1\n"  // dst_b += 2 * dst_stride_b
     "subs        %6,  #2\n"             // w     -= 2
     "beq         4f\n"