Revert 374373: [Codegen] Alter the default promotion for saturating adds and subs

This commit is not extending the promoted integers as it should. Reverting whilst I look into the details. llvm-svn: 374592
author: David Green <david.green@arm.com> 2019-10-11 20:33:03 +0000
committer: David Green <david.green@arm.com> 2019-10-11 20:33:03 +0000
commit: 7c30af8e65904bc2eb7e8926c7d2a2ad68aeab4d (patch)
tree: ea2eca9816d1aac65ebc4fa6cdbe6195ff342231 /llvm/test/CodeGen/AArch64/ssub_sat_vec.ll
parent: Set GNUC version in the LLDB expression parser. (diff)
download: llvm-project-7c30af8e65904bc2eb7e8926c7d2a2ad68aeab4d.tar.gz
llvm-project-7c30af8e65904bc2eb7e8926c7d2a2ad68aeab4d.tar.bz2
llvm-project-7c30af8e65904bc2eb7e8926c7d2a2ad68aeab4d.zip
1 files changed, 72 insertions, 37 deletions
diff --git a/llvm/test/CodeGen/AArch64/ssub_sat_vec.ll b/llvm/test/CodeGen/AArch64/ssub_sat_vec.ll
index c33104da2aaa..664793bba277 100644
--- a/llvm/test/CodeGen/AArch64/ssub_sat_vec.ll
+++ b/llvm/test/CodeGen/AArch64/ssub_sat_vec.ll
@@ -237,23 +237,30 @@ define void @v4i8(<4 x i8>* %px, <4 x i8>* %py, <4 x i8>* %pz) nounwind {
 ; CHECK-NEXT:    ldrb w9, [x1]
 ; CHECK-NEXT:    ldrb w10, [x0, #1]
 ; CHECK-NEXT:    ldrb w11, [x1, #1]
+; CHECK-NEXT:    ldrb w12, [x0, #2]
 ; CHECK-NEXT:    fmov s0, w8
+; CHECK-NEXT:    ldrb w8, [x1, #2]
 ; CHECK-NEXT:    fmov s1, w9
-; CHECK-NEXT:    ldrb w8, [x0, #2]
-; CHECK-NEXT:    ldrb w9, [x1, #2]
 ; CHECK-NEXT:    mov v0.h[1], w10
+; CHECK-NEXT:    ldrb w9, [x0, #3]
+; CHECK-NEXT:    ldrb w10, [x1, #3]
 ; CHECK-NEXT:    mov v1.h[1], w11
-; CHECK-NEXT:    ldrb w10, [x0, #3]
-; CHECK-NEXT:    ldrb w11, [x1, #3]
-; CHECK-NEXT:    mov v0.h[2], w8
-; CHECK-NEXT:    mov v1.h[2], w9
-; CHECK-NEXT:    mov v0.h[3], w10
-; CHECK-NEXT:    mov v1.h[3], w11
-; CHECK-NEXT:    sub v0.4h, v0.4h, v1.4h
-; CHECK-NEXT:    movi v1.4h, #127
-; CHECK-NEXT:    smin v0.4h, v0.4h, v1.4h
-; CHECK-NEXT:    mvni v1.4h, #127
-; CHECK-NEXT:    smax v0.4h, v0.4h, v1.4h
+; CHECK-NEXT:    mov v0.h[2], w12
+; CHECK-NEXT:    mov v1.h[2], w8
+; CHECK-NEXT:    mov v0.h[3], w9
+; CHECK-NEXT:    mov v1.h[3], w10
+; CHECK-NEXT:    shl v1.4h, v1.4h, #8
+; CHECK-NEXT:    shl v0.4h, v0.4h, #8
+; CHECK-NEXT:    sub v3.4h, v0.4h, v1.4h
+; CHECK-NEXT:    cmlt v4.4h, v3.4h, #0
+; CHECK-NEXT:    mvni v2.4h, #128, lsl #8
+; CHECK-NEXT:    cmgt v1.4h, v1.4h, #0
+; CHECK-NEXT:    cmgt v0.4h, v0.4h, v3.4h
+; CHECK-NEXT:    mvn v5.8b, v4.8b
+; CHECK-NEXT:    bsl v2.8b, v4.8b, v5.8b
+; CHECK-NEXT:    eor v0.8b, v1.8b, v0.8b
+; CHECK-NEXT:    bsl v0.8b, v2.8b, v3.8b
+; CHECK-NEXT:    sshr v0.4h, v0.4h, #8
 ; CHECK-NEXT:    xtn v0.8b, v0.8h
 ; CHECK-NEXT:    str s0, [x2]
 ; CHECK-NEXT:    ret
@@ -272,14 +279,21 @@ define void @v2i8(<2 x i8>* %px, <2 x i8>* %py, <2 x i8>* %pz) nounwind {
 ; CHECK-NEXT:    ldrb w10, [x0, #1]
 ; CHECK-NEXT:    ldrb w11, [x1, #1]
 ; CHECK-NEXT:    fmov s0, w8
-; CHECK-NEXT:    fmov s1, w9
+; CHECK-NEXT:    fmov s2, w9
 ; CHECK-NEXT:    mov v0.s[1], w10
-; CHECK-NEXT:    mov v1.s[1], w11
-; CHECK-NEXT:    sub v0.2s, v0.2s, v1.2s
-; CHECK-NEXT:    movi v1.2s, #127
-; CHECK-NEXT:    smin v0.2s, v0.2s, v1.2s
-; CHECK-NEXT:    mvni v1.2s, #127
-; CHECK-NEXT:    smax v0.2s, v0.2s, v1.2s
+; CHECK-NEXT:    mov v2.s[1], w11
+; CHECK-NEXT:    shl v2.2s, v2.2s, #24
+; CHECK-NEXT:    shl v0.2s, v0.2s, #24
+; CHECK-NEXT:    sub v3.2s, v0.2s, v2.2s
+; CHECK-NEXT:    cmlt v4.2s, v3.2s, #0
+; CHECK-NEXT:    mvni v1.2s, #128, lsl #24
+; CHECK-NEXT:    cmgt v2.2s, v2.2s, #0
+; CHECK-NEXT:    cmgt v0.2s, v0.2s, v3.2s
+; CHECK-NEXT:    mvn v5.8b, v4.8b
+; CHECK-NEXT:    eor v0.8b, v2.8b, v0.8b
+; CHECK-NEXT:    bsl v1.8b, v4.8b, v5.8b
+; CHECK-NEXT:    bsl v0.8b, v1.8b, v3.8b
+; CHECK-NEXT:    ushr v0.2s, v0.2s, #24
 ; CHECK-NEXT:    mov w8, v0.s[1]
 ; CHECK-NEXT:    fmov w9, s0
 ; CHECK-NEXT:    strb w8, [x2, #1]
@@ -323,14 +337,21 @@ define void @v2i16(<2 x i16>* %px, <2 x i16>* %py, <2 x i16>* %pz) nounwind {
 ; CHECK-NEXT:    ldrh w10, [x0, #2]
 ; CHECK-NEXT:    ldrh w11, [x1, #2]
 ; CHECK-NEXT:    fmov s0, w8
-; CHECK-NEXT:    fmov s1, w9
+; CHECK-NEXT:    fmov s2, w9
 ; CHECK-NEXT:    mov v0.s[1], w10
-; CHECK-NEXT:    mov v1.s[1], w11
-; CHECK-NEXT:    sub v0.2s, v0.2s, v1.2s
-; CHECK-NEXT:    movi v1.2s, #127, msl #8
-; CHECK-NEXT:    smin v0.2s, v0.2s, v1.2s
-; CHECK-NEXT:    mvni v1.2s, #127, msl #8
-; CHECK-NEXT:    smax v0.2s, v0.2s, v1.2s
+; CHECK-NEXT:    mov v2.s[1], w11
+; CHECK-NEXT:    shl v2.2s, v2.2s, #16
+; CHECK-NEXT:    shl v0.2s, v0.2s, #16
+; CHECK-NEXT:    sub v3.2s, v0.2s, v2.2s
+; CHECK-NEXT:    cmlt v4.2s, v3.2s, #0
+; CHECK-NEXT:    mvni v1.2s, #128, lsl #24
+; CHECK-NEXT:    cmgt v2.2s, v2.2s, #0
+; CHECK-NEXT:    cmgt v0.2s, v0.2s, v3.2s
+; CHECK-NEXT:    mvn v5.8b, v4.8b
+; CHECK-NEXT:    eor v0.8b, v2.8b, v0.8b
+; CHECK-NEXT:    bsl v1.8b, v4.8b, v5.8b
+; CHECK-NEXT:    bsl v0.8b, v1.8b, v3.8b
+; CHECK-NEXT:    ushr v0.2s, v0.2s, #16
 ; CHECK-NEXT:    mov w8, v0.s[1]
 ; CHECK-NEXT:    fmov w9, s0
 ; CHECK-NEXT:    strh w8, [x2, #2]
@@ -442,11 +463,18 @@ define void @v1i16(<1 x i16>* %px, <1 x i16>* %py, <1 x i16>* %pz) nounwind {
 define <16 x i4> @v16i4(<16 x i4> %x, <16 x i4> %y) nounwind {
 ; CHECK-LABEL: v16i4:
 ; CHECK:       // %bb.0:
-; CHECK-NEXT:    sub v0.16b, v0.16b, v1.16b
-; CHECK-NEXT:    movi v1.16b, #7
-; CHECK-NEXT:    smin v0.16b, v0.16b, v1.16b
-; CHECK-NEXT:    movi v1.16b, #248
-; CHECK-NEXT:    smax v0.16b, v0.16b, v1.16b
+; CHECK-NEXT:    shl v1.16b, v1.16b, #4
+; CHECK-NEXT:    shl v0.16b, v0.16b, #4
+; CHECK-NEXT:    sub v3.16b, v0.16b, v1.16b
+; CHECK-NEXT:    cmlt v4.16b, v3.16b, #0
+; CHECK-NEXT:    movi v2.16b, #127
+; CHECK-NEXT:    cmgt v1.16b, v1.16b, #0
+; CHECK-NEXT:    cmgt v0.16b, v0.16b, v3.16b
+; CHECK-NEXT:    mvn v5.16b, v4.16b
+; CHECK-NEXT:    bsl v2.16b, v4.16b, v5.16b
+; CHECK-NEXT:    eor v0.16b, v1.16b, v0.16b
+; CHECK-NEXT:    bsl v0.16b, v2.16b, v3.16b
+; CHECK-NEXT:    sshr v0.16b, v0.16b, #4
 ; CHECK-NEXT:    ret
   %z = call <16 x i4> @llvm.ssub.sat.v16i4(<16 x i4> %x, <16 x i4> %y)
   ret <16 x i4> %z
@@ -455,11 +483,18 @@ define <16 x i4> @v16i4(<16 x i4> %x, <16 x i4> %y) nounwind {
 define <16 x i1> @v16i1(<16 x i1> %x, <16 x i1> %y) nounwind {
 ; CHECK-LABEL: v16i1:
 ; CHECK:       // %bb.0:
-; CHECK-NEXT:    sub v0.16b, v0.16b, v1.16b
-; CHECK-NEXT:    movi v1.2d, #0000000000000000
-; CHECK-NEXT:    smin v0.16b, v0.16b, v1.16b
-; CHECK-NEXT:    movi v1.2d, #0xffffffffffffffff
-; CHECK-NEXT:    smax v0.16b, v0.16b, v1.16b
+; CHECK-NEXT:    shl v1.16b, v1.16b, #7
+; CHECK-NEXT:    shl v0.16b, v0.16b, #7
+; CHECK-NEXT:    sub v3.16b, v0.16b, v1.16b
+; CHECK-NEXT:    cmlt v4.16b, v3.16b, #0
+; CHECK-NEXT:    movi v2.16b, #127
+; CHECK-NEXT:    cmgt v1.16b, v1.16b, #0
+; CHECK-NEXT:    cmgt v0.16b, v0.16b, v3.16b
+; CHECK-NEXT:    mvn v5.16b, v4.16b
+; CHECK-NEXT:    bsl v2.16b, v4.16b, v5.16b
+; CHECK-NEXT:    eor v0.16b, v1.16b, v0.16b
+; CHECK-NEXT:    bsl v0.16b, v2.16b, v3.16b
+; CHECK-NEXT:    sshr v0.16b, v0.16b, #7
 ; CHECK-NEXT:    ret
   %z = call <16 x i1> @llvm.ssub.sat.v16i1(<16 x i1> %x, <16 x i1> %y)
   ret <16 x i1> %z
author	David Green <david.green@arm.com>	2019-10-11 20:33:03 +0000
committer	David Green <david.green@arm.com>	2019-10-11 20:33:03 +0000
commit	7c30af8e65904bc2eb7e8926c7d2a2ad68aeab4d (patch)
tree	ea2eca9816d1aac65ebc4fa6cdbe6195ff342231 /llvm/test/CodeGen/AArch64/ssub_sat_vec.ll
parent	Set GNUC version in the LLDB expression parser. (diff)
download	llvm-project-7c30af8e65904bc2eb7e8926c7d2a2ad68aeab4d.tar.gz llvm-project-7c30af8e65904bc2eb7e8926c7d2a2ad68aeab4d.tar.bz2 llvm-project-7c30af8e65904bc2eb7e8926c7d2a2ad68aeab4d.zip