NAMD · flavioamieiro · Feb 19, 2013 · Feb 19, 2013
diff --git a/tests/test_worker_extractor.py b/tests/test_worker_extractor.py
@@ -60,7 +60,16 @@ def test_extraction_from_pdf_file(self):
                 'PDF version':    '1.4',
         }
         self.assertEqual(expected, result['text'])
-        self.assertEqual(metadata, metadata_expected)
+        # Check that the expected metadata is a subset of what
+        # our Extractor found (it may have found more details
+        # depending on the toolset used to extract metadata)
+        metadata_expected_set = set(metadata_expected.iteritems())
+        metadata_set = set(metadata.iteritems())
+        diff_set = metadata_expected_set - metadata_set
+        self.assertTrue(metadata_expected_set.issubset(metadata_set),
+                        ("Extracted metadata is not a subset of the expected metadata. "
+                         "Items missing or with different values: {}").format(
+                         u", ".join(unicode(item) for item in diff_set)))
 
     def test_extraction_from_html(self):
         contents = dedent('''