test_completion_cost_databricks_embedding

ishaan-jaff · ishaan-jaff · commit 214c10f6efb1 · 2025-10-25T11:47:03.000-07:00
diff --git a/tests/local_testing/test_async_fn.py b/tests/local_testing/test_async_fn.py
@@ -91,35 +91,6 @@ async def test_get_response():
 # test_async_response_openai()
 
 
-def test_async_response_azure():
-    import asyncio
-
-    litellm.set_verbose = True
-
-    async def test_get_response():
-        user_message = "What do you know?"
-        messages = [{"content": user_message, "role": "user"}]
-        try:
-            response = await acompletion(
-                model="azure/gpt-turbo",
-                messages=messages,
-                base_url=os.getenv("CLOUDFLARE_AZURE_BASE_URL"),
-                api_key=os.getenv("AZURE_FRANCE_API_KEY"),
-            )
-            print(f"response: {response}")
-        except litellm.Timeout as e:
-            pass
-        except litellm.InternalServerError:
-            pass
-        except Exception as e:
-            pytest.fail(f"An exception occurred: {e}")
-
-    asyncio.run(test_get_response())
-
-
-# test_async_response_azure()
-
-
 @pytest.mark.skip(reason="anyscale stopped serving public api endpoints")
 def test_async_anyscale_response():
     import asyncio
diff --git a/tests/local_testing/test_completion.py b/tests/local_testing/test_completion.py
@@ -3334,31 +3334,6 @@ def test_completion_anyscale_api():
         pytest.fail(f"Error occurred: {e}")
 
 
-# test_completion_anyscale_api()
-def test_azure_cloudflare_api():
-    litellm.set_verbose = True
-    try:
-        messages = [
-            {
-                "role": "user",
-                "content": "How do I output all files in a directory using Python?",
-            },
-        ]
-        response = completion(
-            model="azure/gpt-turbo",
-            messages=messages,
-            base_url=os.getenv("CLOUDFLARE_AZURE_BASE_URL"),
-            api_key=os.getenv("AZURE_FRANCE_API_KEY"),
-        )
-        print(f"response: {response}")
-    except Exception as e:
-        pytest.fail(f"Error occurred: {e}")
-        traceback.print_exc()
-        pass
-
-
-# test_azure_cloudflare_api()
-
 
 @pytest.mark.skip(reason="anyscale stopped serving public api endpoints")
 def test_completion_anyscale_2():
diff --git a/tests/local_testing/test_completion_cost.py b/tests/local_testing/test_completion_cost.py
@@ -24,6 +24,9 @@
     model_cost,
     open_ai_chat_completion_models,
 )
+from litellm.llms.custom_httpx.http_handler import HTTPHandler
+import json
+import httpx
 from litellm.types.utils import PromptTokensDetails
 from litellm.litellm_core_utils.litellm_logging import CustomLogger
 
@@ -1148,13 +1151,58 @@ def test_completion_cost_databricks(model):
         "databricks/databricks-gte-large-en",
     ],
 )
-def test_completion_cost_databricks_embedding(model):
+def test_completion_cost_databricks_embedding(model, monkeypatch):
+    """
+    Test completion cost calculation for Databricks embedding models using mocked HTTP responses.
+    """
+    base_url = "https://my.workspace.cloud.databricks.com/serving-endpoints"
+    api_key = "dapimykey"
+    monkeypatch.setenv("DATABRICKS_API_BASE", base_url)
+    monkeypatch.setenv("DATABRICKS_API_KEY", api_key)
+    
     os.environ["LITELLM_LOCAL_MODEL_COST_MAP"] = "True"
     litellm.model_cost = litellm.get_model_cost_map(url="")
-    resp = litellm.embedding(model=model, input=["hey, how's it going?"])  # works fine
+    
+    mock_response_data = {
+        "object": "list",
+        "model": model.split("/")[1],
+        "data": [
+            {
+                "index": 0,
+                "object": "embedding",
+                "embedding": [
+                    0.06768798828125,
+                    -0.01291656494140625,
+                    -0.0501708984375,
+                    0.0245361328125,
+                    -0.030364990234375,
+                ],
+            }
+        ],
+        "usage": {
+            "prompt_tokens": 8,
+            "total_tokens": 8,
+            "completion_tokens": 0,
+            "completion_tokens_details": None,
+            "prompt_tokens_details": None,
+        },
+    }
+    
+    mock_response = MagicMock(spec=httpx.Response)
+    mock_response.status_code = 200
+    mock_response.json.return_value = mock_response_data
+    
+    sync_handler = HTTPHandler()
+    
+    with patch.object(HTTPHandler, "post", return_value=mock_response):
+        resp = litellm.embedding(
+            model=model, 
+            input=["hey, how's it going?"],
+            client=sync_handler
+        )
 
-    print(resp)
-    cost = completion_cost(completion_response=resp)
+        print(resp)
+        cost = completion_cost(completion_response=resp)
 
 
 from litellm.llms.fireworks_ai.cost_calculator import get_base_model_for_pricing