| // RUN: mlir-translate -mlir-to-llvmir -split-input-file %s | FileCheck %s |
| |
| module { |
| llvm.func @printf(!llvm.ptr, ...) -> i32 |
| llvm.mlir.global internal constant @str0("WG size of kernel = %d X %d\0A\00") |
| |
| llvm.func @main(%arg0: i32, %arg1: !llvm.ptr) -> i32 { |
| omp.parallel { |
| %0 = llvm.mlir.constant(1 : index) : i64 |
| %1 = llvm.mlir.constant(10 : index) : i64 |
| %2 = llvm.mlir.constant(0 : index) : i64 |
| %4 = llvm.mlir.constant(0 : i32) : i32 |
| %12 = llvm.alloca %0 x i64 : (i64) -> !llvm.ptr |
| omp.wsloop { |
| omp.loop_nest (%arg2) : i64 = (%2) to (%1) step (%0) { |
| omp.parallel { |
| omp.wsloop { |
| omp.loop_nest (%arg3) : i64 = (%2) to (%0) step (%0) { |
| llvm.store %2, %12 : i64, !llvm.ptr |
| omp.yield |
| } |
| omp.terminator |
| } |
| omp.terminator |
| } |
| %19 = llvm.load %12 : !llvm.ptr -> i64 |
| %20 = llvm.trunc %19 : i64 to i32 |
| %5 = llvm.mlir.addressof @str0 : !llvm.ptr |
| %6 = llvm.getelementptr %5[%4, %4] : (!llvm.ptr, i32, i32) -> !llvm.ptr, !llvm.array<29 x i8> |
| %21 = llvm.call @printf(%6, %20, %20) vararg(!llvm.func<i32 (ptr, ...)>): (!llvm.ptr, i32, i32) -> i32 |
| omp.yield |
| } |
| omp.terminator |
| } |
| omp.terminator |
| } |
| %a4 = llvm.mlir.constant(0 : i32) : i32 |
| llvm.return %a4 : i32 |
| } |
| |
| } |
| |
| // CHECK: call void (ptr, i32, ptr, ...) @__kmpc_fork_call(ptr @1, i32 0, ptr @[[inner1:.+]]) |
| |
| // CHECK: define internal void @[[inner1]] |
| // CHECK: %[[structArg:.+]] = alloca { ptr } |
| // CHECK: call void (ptr, i32, ptr, ...) @__kmpc_fork_call(ptr @1, i32 1, ptr @[[inner2:.+]], ptr %[[structArg]]) |