apache
diff --git a/‎benchmarks/sql_benchmarks/smj/benchmarks/q01.benchmark‎
Lines changed: 21 additions & 0 deletions b/‎benchmarks/sql_benchmarks/smj/benchmarks/q01.benchmark‎
Lines changed: 21 additions & 0 deletions
diff --git a/‎benchmarks/sql_benchmarks/smj/benchmarks/q02.benchmark‎
Lines changed: 25 additions & 0 deletions b/‎benchmarks/sql_benchmarks/smj/benchmarks/q02.benchmark‎
Lines changed: 25 additions & 0 deletions
diff --git a/‎benchmarks/sql_benchmarks/smj/benchmarks/q03.benchmark‎
Lines changed: 25 additions & 0 deletions b/‎benchmarks/sql_benchmarks/smj/benchmarks/q03.benchmark‎
Lines changed: 25 additions & 0 deletions
diff --git a/‎benchmarks/sql_benchmarks/smj/benchmarks/q04.benchmark‎
Lines changed: 26 additions & 0 deletions b/‎benchmarks/sql_benchmarks/smj/benchmarks/q04.benchmark‎
Lines changed: 26 additions & 0 deletions
diff --git a/‎benchmarks/sql_benchmarks/smj/benchmarks/q05.benchmark‎
Lines changed: 26 additions & 0 deletions b/‎benchmarks/sql_benchmarks/smj/benchmarks/q05.benchmark‎
Lines changed: 26 additions & 0 deletions
diff --git a/‎benchmarks/sql_benchmarks/smj/benchmarks/q06.benchmark‎
Lines changed: 25 additions & 0 deletions b/‎benchmarks/sql_benchmarks/smj/benchmarks/q06.benchmark‎
Lines changed: 25 additions & 0 deletions
diff --git a/‎benchmarks/sql_benchmarks/smj/benchmarks/q07.benchmark‎
Lines changed: 26 additions & 0 deletions b/‎benchmarks/sql_benchmarks/smj/benchmarks/q07.benchmark‎
Lines changed: 26 additions & 0 deletions
diff --git a/‎benchmarks/sql_benchmarks/smj/benchmarks/q08.benchmark‎
Lines changed: 26 additions & 0 deletions b/‎benchmarks/sql_benchmarks/smj/benchmarks/q08.benchmark‎
Lines changed: 26 additions & 0 deletions
diff --git a/‎benchmarks/sql_benchmarks/smj/benchmarks/q09.benchmark‎
Lines changed: 29 additions & 0 deletions b/‎benchmarks/sql_benchmarks/smj/benchmarks/q09.benchmark‎
Lines changed: 29 additions & 0 deletions
diff --git a/‎benchmarks/sql_benchmarks/smj/benchmarks/q10.benchmark‎
Lines changed: 29 additions & 0 deletions b/‎benchmarks/sql_benchmarks/smj/benchmarks/q10.benchmark‎
Lines changed: 29 additions & 0 deletions
@@ -0,0 +1,21 @@
+name Q01
+group smj
+
+init
+set datafusion.optimizer.prefer_hash_join=false;
+
+expect_plan SortMergeJoinExec
+
+run
+-- Q1: INNER 1M x 1M | 1:1
+WITH t1_sorted AS (
+    SELECT value as key FROM range(1000000) ORDER BY value
+    ),
+    t2_sorted AS (
+SELECT value as key FROM range(1000000) ORDER BY value
+    )
+SELECT t1_sorted.key as k1, t2_sorted.key as k2
+FROM t1_sorted JOIN t2_sorted ON t1_sorted.key = t2_sorted.key
+
+cleanup
+reset datafusion.optimizer.prefer_hash_join;
@@ -0,0 +1,25 @@
+name Q02
+group smj
+
+init
+set datafusion.optimizer.prefer_hash_join=false;
+
+expect_plan SortMergeJoinExec
+
+run
+-- Q2: INNER 1M x 10M | 1:10
+WITH t1_sorted AS (
+    SELECT value % 100000 as key, value as data
+FROM range(1000000)
+ORDER BY key, data
+    ),
+    t2_sorted AS (
+SELECT value % 100000 as key, value as data
+FROM range(10000000)
+ORDER BY key, data
+    )
+SELECT t1_sorted.key, t1_sorted.data as d1, t2_sorted.data as d2
+FROM t1_sorted JOIN t2_sorted ON t1_sorted.key = t2_sorted.key
+
+cleanup
+reset datafusion.optimizer.prefer_hash_join;
@@ -0,0 +1,25 @@
+name Q03
+group smj
+
+init
+set datafusion.optimizer.prefer_hash_join=false;
+
+expect_plan SortMergeJoinExec
+
+run
+-- Q3: INNER 1M x 1M | 1:100
+WITH t1_sorted AS (
+    SELECT value % 10000 as key, value as data
+FROM range(1000000)
+ORDER BY key, data
+    ),
+    t2_sorted AS (
+SELECT value % 10000 as key, value as data
+FROM range(1000000)
+ORDER BY key, data
+    )
+SELECT t1_sorted.key, t1_sorted.data as d1, t2_sorted.data as d2
+FROM t1_sorted JOIN t2_sorted ON t1_sorted.key = t2_sorted.key
+
+cleanup
+reset datafusion.optimizer.prefer_hash_join;
@@ -0,0 +1,26 @@
+name Q04
+group smj
+
+init
+set datafusion.optimizer.prefer_hash_join=false;
+
+expect_plan SortMergeJoinExec
+
+run
+-- Q4: INNER 1M x 10M | 1:10 | 1%
+WITH t1_sorted AS (
+    SELECT value % 100000 as key, value as data
+FROM range(1000000)
+ORDER BY key, data
+    ),
+    t2_sorted AS (
+SELECT value % 100000 as key, value as data
+FROM range(10000000)
+ORDER BY key, data
+    )
+SELECT t1_sorted.key, t1_sorted.data as d1, t2_sorted.data as d2
+FROM t1_sorted JOIN t2_sorted ON t1_sorted.key = t2_sorted.key
+WHERE t2_sorted.data % 100 = 0
+
+cleanup
+reset datafusion.optimizer.prefer_hash_join;
@@ -0,0 +1,26 @@
+name Q05
+group smj
+
+init
+set datafusion.optimizer.prefer_hash_join=false;
+
+expect_plan SortMergeJoinExec
+
+run
+-- Q5: INNER 1M x 1M | 1:100 | 10%
+WITH t1_sorted AS (
+    SELECT value % 10000 as key, value as data
+FROM range(1000000)
+ORDER BY key, data
+    ),
+    t2_sorted AS (
+SELECT value % 10000 as key, value as data
+FROM range(1000000)
+ORDER BY key, data
+    )
+SELECT t1_sorted.key, t1_sorted.data as d1, t2_sorted.data as d2
+FROM t1_sorted JOIN t2_sorted ON t1_sorted.key = t2_sorted.key
+WHERE t1_sorted.data <> t2_sorted.data AND t2_sorted.data % 10 = 0
+
+cleanup
+reset datafusion.optimizer.prefer_hash_join;
@@ -0,0 +1,25 @@
+name Q06
+group smj
+
+init
+set datafusion.optimizer.prefer_hash_join=false;
+
+expect_plan SortMergeJoinExec
+
+run
+-- Q6: LEFT 1M x 10M | 1:10
+WITH t1_sorted AS (
+    SELECT value % 105000 as key, value as data
+FROM range(1000000)
+ORDER BY key, data
+    ),
+    t2_sorted AS (
+SELECT value % 100000 as key, value as data
+FROM range(10000000)
+ORDER BY key, data
+    )
+SELECT t1_sorted.key, t1_sorted.data as d1, t2_sorted.data as d2
+FROM t1_sorted LEFT JOIN t2_sorted ON t1_sorted.key = t2_sorted.key
+
+cleanup
+reset datafusion.optimizer.prefer_hash_join;
@@ -0,0 +1,26 @@
+name Q07
+group smj
+
+init
+set datafusion.optimizer.prefer_hash_join=false;
+
+expect_plan SortMergeJoinExec
+
+run
+-- Q7: LEFT 1M x 10M | 1:10 | 50%
+WITH t1_sorted AS (
+    SELECT value % 100000 as key, value as data
+FROM range(1000000)
+ORDER BY key, data
+    ),
+    t2_sorted AS (
+SELECT value % 100000 as key, value as data
+FROM range(10000000)
+ORDER BY key, data
+    )
+SELECT t1_sorted.key, t1_sorted.data as d1, t2_sorted.data as d2
+FROM t1_sorted LEFT JOIN t2_sorted ON t1_sorted.key = t2_sorted.key
+WHERE t2_sorted.data IS NULL OR t2_sorted.data % 2 = 0
+
+cleanup
+reset datafusion.optimizer.prefer_hash_join;
@@ -0,0 +1,26 @@
+name Q08
+group smj
+
+init
+set datafusion.optimizer.prefer_hash_join=false;
+
+expect_plan SortMergeJoinExec
+
+run
+-- Q8: FULL 1M x 1M | 1:10
+WITH t1_sorted AS (
+    SELECT value % 100000 as key, value as data
+FROM range(1000000)
+ORDER BY key, data
+    ),
+    t2_sorted AS (
+SELECT value % 125000 as key, value as data
+FROM range(1000000)
+ORDER BY key, data
+    )
+SELECT t1_sorted.key as k1, t1_sorted.data as d1,
+       t2_sorted.key as k2, t2_sorted.data as d2
+FROM t1_sorted FULL JOIN t2_sorted ON t1_sorted.key = t2_sorted.key
+
+cleanup
+reset datafusion.optimizer.prefer_hash_join;
@@ -0,0 +1,29 @@
+name Q09
+group smj
+
+init
+set datafusion.optimizer.prefer_hash_join=false;
+
+expect_plan SortMergeJoinExec
+
+run
+-- Q9: FULL 1M x 10M | 1:10 | 10%
+WITH t1_sorted AS (
+    SELECT value % 100000 as key, value as data
+FROM range(1000000)
+ORDER BY key, data
+    ),
+    t2_sorted AS (
+SELECT value % 100000 as key, value as data
+FROM range(10000000)
+ORDER BY key, data
+    )
+SELECT t1_sorted.key as k1, t1_sorted.data as d1,
+       t2_sorted.key as k2, t2_sorted.data as d2
+FROM t1_sorted FULL JOIN t2_sorted ON t1_sorted.key = t2_sorted.key
+WHERE (t1_sorted.data IS NULL OR t2_sorted.data IS NULL
+    OR t1_sorted.data <> t2_sorted.data)
+  AND (t1_sorted.data IS NULL OR t1_sorted.data % 10 = 0)
+
+cleanup
+reset datafusion.optimizer.prefer_hash_join;
@@ -0,0 +1,29 @@
+name Q10
+group smj
+
+init
+set datafusion.optimizer.prefer_hash_join=false;
+
+expect_plan SortMergeJoinExec
+
+run
+-- Q10: LEFT SEMI 1M x 10M | 1:10
+WITH t1_sorted AS (
+    SELECT value % 100000 as key, value as data
+FROM range(1000000)
+ORDER BY key, data
+    ),
+    t2_sorted AS (
+SELECT value % 100000 as key
+FROM range(10000000)
+ORDER BY key
+    )
+SELECT t1_sorted.key, t1_sorted.data
+FROM t1_sorted
+WHERE EXISTS (
+    SELECT 1 FROM t2_sorted
+    WHERE t2_sorted.key = t1_sorted.key
+)
+
+cleanup
+reset datafusion.optimizer.prefer_hash_join;