scikit-learn-contrib · vene · Sep 12, 2016 · Sep 12, 2016 · Sep 15, 2016 · Sep 15, 2016
diff --git a/benchmarks/bench_20newsgroups.py b/benchmarks/bench_20newsgroups.py
@@ -16,43 +16,54 @@
 
 
 estimators = {
-    'fm-2': FactorizationMachineClassifier(n_components=30,
+    'fm-2': FactorizationMachineClassifier(beta=1e-15,
+                                           scale_regularization=True,
+                                           n_components=12,
                                            fit_linear=False,
                                            fit_lower=None,
                                            degree=2,
                                            random_state=0,
-                                           max_iter=10),
+                                           max_iter=100,
+                                           tol=1e-10),
 
-    'polynet-2': PolynomialNetworkClassifier(n_components=15, degree=2,
+    'polynet-2': PolynomialNetworkClassifier(beta=1e-15,
+                                             n_components=6,
+                                             degree=2,
                                              fit_lower=None,
-                                             max_iter=10,
-                                             random_state=0)
+                                             max_iter=100,
+                                             random_state=0,
+                                             tol=1e-10)
 }
 
 estimators['fm-3'] = clone(estimators['fm-2']).set_params(degree=3)
+estimators['fm-2-ada'] = clone(estimators['fm-2']).set_params(solver='adagrad')
+estimators['fm-3-ada'] = clone(estimators['fm-3']).set_params(solver='adagrad')
 estimators['polynet-3'] = (clone(estimators['polynet-2'])
-                           .set_params(degree=3, n_components=10))
+                           .set_params(degree=3, n_components=4))
 
 if __name__ == '__main__':
     data_train = fetch_20newsgroups_vectorized(subset="train")
     data_test = fetch_20newsgroups_vectorized(subset="test")
-    X_train = sp.csc_matrix(data_train.data)
-    X_test = sp.csc_matrix(data_test.data)
+    train_mask = np.in1d(data_train.target, [0, 15])  # atheism vs christianity
+    test_mask = np.in1d(data_test.target, [0, 15])  # atheism vs christianity
+    X_train_csc = sp.csc_matrix(data_train.data[train_mask])
+    X_test_csc = sp.csc_matrix(data_test.data[test_mask])
+    X_train_csr = sp.csr_matrix(data_train.data[train_mask])
+    X_test_csr = sp.csr_matrix(data_test.data[test_mask])
 
-    y_train = data_train.target == 0  # atheism vs rest
-    y_test = data_test.target == 0
+    y_train = data_train.target[train_mask] == 0  # atheism is positive
+    y_test = data_test.target[test_mask] == 0
 
     print("20 newsgroups")
     print("=============")
-    print("X_train.shape = {0}".format(X_train.shape))
-    print("X_train.format = {0}".format(X_train.format))
-    print("X_train.dtype = {0}".format(X_train.dtype))
+    print("X_train.shape = {0}".format(X_train_csr.shape))
+    print("X_train.dtype = {0}".format(X_train_csr.dtype))
     print("X_train density = {0}"
-          "".format(X_train.nnz / np.product(X_train.shape)))
+          "".format(X_train_csr.nnz / np.product(X_train_csr.shape)))
     print("y_train {0}".format(y_train.shape))
-    print("X_test {0}".format(X_test.shape))
-    print("X_test.format = {0}".format(X_test.format))
-    print("X_test.dtype = {0}".format(X_test.dtype))
+    print("Training class ratio: {0}".format(y_train.mean()))
+    print("X_test {0}".format(X_test_csr.shape))
+    print("X_test.dtype = {0}".format(X_test_csr.dtype))
     print("y_test {0}".format(y_test.shape))
     print()
 
@@ -62,6 +73,10 @@
 
     for name, clf in sorted(estimators.items()):
         print("Training %s ... " % name, end="")
+        if 'ada' in name:
+            X_train, X_test = X_train_csr, X_test_csr
+        else:
+            X_train, X_test = X_train_csc, X_test_csc
         t0 = time()
         clf.fit(X_train, y_train)
         train_time[name] = time() - t0
@@ -71,6 +86,10 @@
         accuracy[name] = accuracy_score(y_test, y_pred)
         f1[name] = f1_score(y_test, y_pred)
         print("done")
+        try:
+            print("||P|| =", np.linalg.norm(clf.P_))
+        except:
+            pass
 
     print("Classification performance:")
     print("===========================")