feat(ai): Add prefer_in_cloud option for inference mode #9236

hsubox76 · 2025-09-02T18:07:11Z

Add prefer_in_cloud option - opposite of prefer_on_device.

Note: Used gemini-cli

Had it add tests to generative-model.test.ts instead of on generateContent/generateContentStream/countTokens for all 4 InferenceMode cases because I think the more of the pipeline it tests, the better it is - a lot of errors come from omitting or incorrectly passing params through multiple functions.

Had it extract the logic for on-device vs cloud into a helper function in helpers.ts even though it is only used in generate-content.ts for now, because we'll need to re-use the same logic for countTokens when we implement that (Chrome API should be ready now).

Docs review: Only need to review docs-devsite/ai.md.

This change introduces a new InferenceMode option, prefer_in_cloud. When this mode is selected, the SDK will attempt to use the cloud backend first. If the cloud call fails with a network-related error, it will fall back to the on-device model if available.

changeset-bot · 2025-09-02T18:07:15Z

🦋 Changeset detected

Latest commit: 337d34c

The changes in this PR will be included in the next version bump.

This PR includes changesets to release 2 packages

Name	Type
@firebase/ai	Minor
firebase	Minor

Not sure what this means? Click here to learn what changesets are.

Click here if you're a maintainer who wants to add another changeset to this PR

google-oss-bot · 2025-09-02T18:16:43Z

Size Report ¹

Affected Products

@firebase/ai
Type Base (a4848b4) Merge (3d413d7) Diff
browser 61.3 kB 62.2 kB +921 B (+1.5%)
main 64.8 kB 65.7 kB +921 B (+1.4%)
module 61.3 kB 62.2 kB +921 B (+1.5%)
firebase
Type Base (a4848b4) Merge (3d413d7) Diff
firebase-ai.js 48.4 kB 49.1 kB +674 B (+1.4%)

Test Logs

https://storage.googleapis.com/firebase-sdk-metric-reports/iAFF3hnDYw.html

google-oss-bot · 2025-09-02T18:35:42Z

Size Analysis Report ¹

Affected Products

`@firebase/ai`

AIError
Size
Type Base (a4848b4) Merge (3d413d7) Diff
size 6.54 kB 6.57 kB +34 B (+0.5%)
size-with-ext-deps 24.1 kB 24.1 kB +34 B (+0.1%)
AIErrorCode
Size
Type Base (a4848b4) Merge (3d413d7) Diff
size 6.54 kB 6.62 kB +76 B (+1.2%)
size-with-ext-deps 24.1 kB 24.2 kB +79 B (+0.3%)
AIModel
Size
Type Base (a4848b4) Merge (3d413d7) Diff
size 8.20 kB 8.24 kB +34 B (+0.4%)
size-with-ext-deps 25.8 kB 25.9 kB +34 B (+0.1%)
AnyOfSchema
Size
Type Base (a4848b4) Merge (3d413d7) Diff
size 8.86 kB 8.90 kB +34 B (+0.4%)
size-with-ext-deps 26.5 kB 26.5 kB +34 B (+0.1%)
ArraySchema
Size
Type Base (a4848b4) Merge (3d413d7) Diff
size 8.86 kB 8.90 kB +34 B (+0.4%)
size-with-ext-deps 26.5 kB 26.5 kB +34 B (+0.1%)
Backend
Size
Type Base (a4848b4) Merge (3d413d7) Diff
size 6.54 kB 6.57 kB +34 B (+0.5%)
size-with-ext-deps 24.1 kB 24.1 kB +34 B (+0.1%)
BackendType
Size
Type Base (a4848b4) Merge (3d413d7) Diff
size 6.54 kB 6.58 kB +34 B (+0.5%)
size-with-ext-deps 24.1 kB 24.1 kB +34 B (+0.1%)
BlockReason
Size
Type Base (a4848b4) Merge (3d413d7) Diff
size 6.65 kB 6.68 kB +34 B (+0.5%)
size-with-ext-deps 24.2 kB 24.3 kB +34 B (+0.1%)
BooleanSchema
Size
Type Base (a4848b4) Merge (3d413d7) Diff
size 8.87 kB 8.90 kB +34 B (+0.4%)
size-with-ext-deps 26.5 kB 26.5 kB +34 B (+0.1%)

`ChatSession`

Size

Type	Base (`a4848b4`)	Merge (`3d413d7`)	Diff
size	21.0 kB	21.6 kB	+551 B (+2.6%)
size-with-ext-deps	38.7 kB	39.3 kB	+563 B (+1.5%)

Dependency

Type Base (a4848b4) Merge (3d413d7) Diff

functions

33 dependencies

addHelpers
aggregateResponses
assignRoleToPartsAndValidateSendMessageRequest
chromeAdapterFactory
constructRequest
createEnhancedContentResponse
decodeInstanceIdentifier
factory
formatBlockErrorMessage
formatNewContent
generateContent
generateContentOnCloud
generateContentStream
generateContentStreamOnCloud
generateResponseSequence
getClientHeaders
getFunctionCalls
getHeaders
getInlineDataParts
getResponsePromise
getResponseStream
getText
hadBadFinishReason
hasValidCandidates
makeRequest
mapGenerateContentCandidates
mapGenerateContentRequest
mapGenerateContentResponse
mapPromptFeedback
processGenerateContentResponse
processStream
registerAI
validateChatHistory

34 dependencies

addHelpers
aggregateResponses
assignRoleToPartsAndValidateSendMessageRequest
callCloudOrDevice
chromeAdapterFactory
constructRequest
createEnhancedContentResponse
decodeInstanceIdentifier
factory
formatBlockErrorMessage
formatNewContent
generateContent
generateContentOnCloud
generateContentStream
generateContentStreamOnCloud
generateResponseSequence
getClientHeaders
getFunctionCalls
getHeaders
getInlineDataParts
getResponsePromise
getResponseStream
getText
hadBadFinishReason
hasValidCandidates
makeRequest
mapGenerateContentCandidates
mapGenerateContentRequest
mapGenerateContentResponse
mapPromptFeedback
processGenerateContentResponse
processStream
registerAI
validateChatHistory

+ callCloudOrDevice

variables

24 dependencies

AIErrorCode
AI_TYPE
Availability
BackendType
DEFAULT_API_VERSION
DEFAULT_DOMAIN
DEFAULT_FETCH_TIMEOUT_MS
DEFAULT_LOCATION
FinishReason
HarmSeverity
InferenceMode
LANGUAGE_TAG
PACKAGE_VERSION
POSSIBLE_ROLES
SILENT_ERROR
Task
VALID_PARTS_PER_ROLE
VALID_PART_FIELDS
VALID_PREVIOUS_CONTENT_ROLES
badFinishReasons
logger
name
responseLineRE
version

25 dependencies

AIErrorCode
AI_TYPE
Availability
BackendType
DEFAULT_API_VERSION
DEFAULT_DOMAIN
DEFAULT_FETCH_TIMEOUT_MS
DEFAULT_LOCATION
FinishReason
HarmSeverity
InferenceMode
LANGUAGE_TAG
PACKAGE_VERSION
POSSIBLE_ROLES
SILENT_ERROR
Task
VALID_PARTS_PER_ROLE
VALID_PART_FIELDS
VALID_PREVIOUS_CONTENT_ROLES
badFinishReasons
errorsCausingFallback
logger
name
responseLineRE
version

+ errorsCausingFallback

FinishReason
Size
Type Base (a4848b4) Merge (3d413d7) Diff
size 6.79 kB 6.83 kB +34 B (+0.5%)
size-with-ext-deps 24.4 kB 24.4 kB +34 B (+0.1%)
FunctionCallingMode
Size
Type Base (a4848b4) Merge (3d413d7) Diff
size 6.60 kB 6.63 kB +34 B (+0.5%)
size-with-ext-deps 24.2 kB 24.2 kB +34 B (+0.1%)

`GenerativeModel`

Size

Type	Base (`a4848b4`)	Merge (`3d413d7`)	Diff
size	24.7 kB	25.3 kB	+596 B (+2.4%)
size-with-ext-deps	42.5 kB	43.1 kB	+611 B (+1.4%)

Dependency

Type Base (a4848b4) Merge (3d413d7) Diff

functions

38 dependencies

addHelpers
aggregateResponses
assignRoleToPartsAndValidateSendMessageRequest
chromeAdapterFactory
constructRequest
countTokens
countTokensOnCloud
createEnhancedContentResponse
decodeInstanceIdentifier
factory
formatBlockErrorMessage
formatGenerateContentInput
formatNewContent
formatSystemInstruction
generateContent
generateContentOnCloud
generateContentStream
generateContentStreamOnCloud
generateResponseSequence
getClientHeaders
getFunctionCalls
getHeaders
getInlineDataParts
getResponsePromise
getResponseStream
getText
hadBadFinishReason
hasValidCandidates
makeRequest
mapCountTokensRequest
mapGenerateContentCandidates
mapGenerateContentRequest
mapGenerateContentResponse
mapPromptFeedback
processGenerateContentResponse
processStream
registerAI
validateChatHistory

39 dependencies

addHelpers
aggregateResponses
assignRoleToPartsAndValidateSendMessageRequest
callCloudOrDevice
chromeAdapterFactory
constructRequest
countTokens
countTokensOnCloud
createEnhancedContentResponse
decodeInstanceIdentifier
factory
formatBlockErrorMessage
formatGenerateContentInput
formatNewContent
formatSystemInstruction
generateContent
generateContentOnCloud
generateContentStream
generateContentStreamOnCloud
generateResponseSequence
getClientHeaders
getFunctionCalls
getHeaders
getInlineDataParts
getResponsePromise
getResponseStream
getText
hadBadFinishReason
hasValidCandidates
makeRequest
mapCountTokensRequest
mapGenerateContentCandidates
mapGenerateContentRequest
mapGenerateContentResponse
mapPromptFeedback
processGenerateContentResponse
processStream
registerAI
validateChatHistory

+ callCloudOrDevice

variables

24 dependencies

AIErrorCode
AI_TYPE
Availability
BackendType
DEFAULT_API_VERSION
DEFAULT_DOMAIN
DEFAULT_FETCH_TIMEOUT_MS
DEFAULT_LOCATION
FinishReason
HarmSeverity
InferenceMode
LANGUAGE_TAG
PACKAGE_VERSION
POSSIBLE_ROLES
SILENT_ERROR
Task
VALID_PARTS_PER_ROLE
VALID_PART_FIELDS
VALID_PREVIOUS_CONTENT_ROLES
badFinishReasons
logger
name
responseLineRE
version

25 dependencies

AIErrorCode
AI_TYPE
Availability
BackendType
DEFAULT_API_VERSION
DEFAULT_DOMAIN
DEFAULT_FETCH_TIMEOUT_MS
DEFAULT_LOCATION
FinishReason
HarmSeverity
InferenceMode
LANGUAGE_TAG
PACKAGE_VERSION
POSSIBLE_ROLES
SILENT_ERROR
Task
VALID_PARTS_PER_ROLE
VALID_PART_FIELDS
VALID_PREVIOUS_CONTENT_ROLES
badFinishReasons
errorsCausingFallback
logger
name
responseLineRE
version

+ errorsCausingFallback

GoogleAIBackend
Size
Type Base (a4848b4) Merge (3d413d7) Diff
size 6.55 kB 6.58 kB +34 B (+0.5%)
size-with-ext-deps 24.1 kB 24.2 kB +34 B (+0.1%)
HarmBlockMethod
Size
Type Base (a4848b4) Merge (3d413d7) Diff
size 6.60 kB 6.64 kB +34 B (+0.5%)
size-with-ext-deps 24.2 kB 24.2 kB +34 B (+0.1%)
HarmBlockThreshold
Size
Type Base (a4848b4) Merge (3d413d7) Diff
size 6.72 kB 6.75 kB +34 B (+0.5%)
size-with-ext-deps 24.3 kB 24.3 kB +34 B (+0.1%)
HarmCategory
Size
Type Base (a4848b4) Merge (3d413d7) Diff
size 6.79 kB 6.83 kB +34 B (+0.5%)
size-with-ext-deps 24.4 kB 24.4 kB +34 B (+0.1%)
HarmProbability
Size
Type Base (a4848b4) Merge (3d413d7) Diff
size 6.62 kB 6.65 kB +34 B (+0.5%)
size-with-ext-deps 24.2 kB 24.2 kB +34 B (+0.1%)
HarmSeverity
Size
Type Base (a4848b4) Merge (3d413d7) Diff
size 6.78 kB 6.82 kB +34 B (+0.5%)
size-with-ext-deps 24.4 kB 24.4 kB +34 B (+0.1%)
ImagenAspectRatio
Size
Type Base (a4848b4) Merge (3d413d7) Diff
size 6.66 kB 6.69 kB +34 B (+0.5%)
size-with-ext-deps 24.2 kB 24.3 kB +34 B (+0.1%)
ImagenImageFormat
Size
Type Base (a4848b4) Merge (3d413d7) Diff
size 6.82 kB 6.86 kB +34 B (+0.5%)
size-with-ext-deps 24.4 kB 24.4 kB +34 B (+0.1%)
ImagenModel
Size
Type Base (a4848b4) Merge (3d413d7) Diff
size 13.2 kB 13.2 kB +34 B (+0.3%)
size-with-ext-deps 30.8 kB 30.9 kB +34 B (+0.1%)
ImagenPersonFilterLevel
Size
Type Base (a4848b4) Merge (3d413d7) Diff
size 6.64 kB 6.67 kB +34 B (+0.5%)
size-with-ext-deps 24.2 kB 24.2 kB +34 B (+0.1%)
ImagenSafetyFilterLevel
Size
Type Base (a4848b4) Merge (3d413d7) Diff
size 6.71 kB 6.75 kB +34 B (+0.5%)
size-with-ext-deps 24.3 kB 24.3 kB +34 B (+0.1%)
InferenceMode
Size
Type Base (a4848b4) Merge (3d413d7) Diff
size 6.55 kB 6.58 kB +34 B (+0.5%)
size-with-ext-deps 24.1 kB 24.1 kB +34 B (+0.1%)
IntegerSchema
Size
Type Base (a4848b4) Merge (3d413d7) Diff
size 8.87 kB 8.90 kB +34 B (+0.4%)
size-with-ext-deps 26.5 kB 26.5 kB +34 B (+0.1%)
LiveGenerativeModel
Size
Type Base (a4848b4) Merge (3d413d7) Diff
size 12.6 kB 12.7 kB +34 B (+0.3%)
size-with-ext-deps 30.3 kB 30.3 kB +34 B (+0.1%)
LiveResponseType
Size
Type Base (a4848b4) Merge (3d413d7) Diff
size 6.66 kB 6.69 kB +34 B (+0.5%)
size-with-ext-deps 24.2 kB 24.3 kB +34 B (+0.1%)
LiveSession
Size
Type Base (a4848b4) Merge (3d413d7) Diff
size 9.05 kB 9.08 kB +34 B (+0.4%)
size-with-ext-deps 26.6 kB 26.7 kB +34 B (+0.1%)
Modality
Size
Type Base (a4848b4) Merge (3d413d7) Diff
size 6.67 kB 6.70 kB +34 B (+0.5%)
size-with-ext-deps 24.2 kB 24.3 kB +34 B (+0.1%)
NumberSchema
Size
Type Base (a4848b4) Merge (3d413d7) Diff
size 8.87 kB 8.90 kB +34 B (+0.4%)
size-with-ext-deps 26.5 kB 26.5 kB +34 B (+0.1%)
ObjectSchema
Size
Type Base (a4848b4) Merge (3d413d7) Diff
size 8.87 kB 8.90 kB +34 B (+0.4%)
size-with-ext-deps 26.5 kB 26.5 kB +34 B (+0.1%)
POSSIBLE_ROLES
Size
Type Base (a4848b4) Merge (3d413d7) Diff
size 6.59 kB 6.63 kB +34 B (+0.5%)
size-with-ext-deps 24.2 kB 24.2 kB +34 B (+0.1%)
ResponseModality
Size
Type Base (a4848b4) Merge (3d413d7) Diff
size 6.60 kB 6.63 kB +34 B (+0.5%)
size-with-ext-deps 24.2 kB 24.2 kB +34 B (+0.1%)
Schema
Size
Type Base (a4848b4) Merge (3d413d7) Diff
size 8.86 kB 8.89 kB +34 B (+0.4%)
size-with-ext-deps 26.5 kB 26.5 kB +34 B (+0.1%)
SchemaType
Size
Type Base (a4848b4) Merge (3d413d7) Diff
size 6.65 kB 6.69 kB +34 B (+0.5%)
size-with-ext-deps 24.2 kB 24.3 kB +34 B (+0.1%)
StringSchema
Size
Type Base (a4848b4) Merge (3d413d7) Diff
size 8.87 kB 8.90 kB +34 B (+0.4%)
size-with-ext-deps 26.5 kB 26.5 kB +34 B (+0.1%)
VertexAIBackend
Size
Type Base (a4848b4) Merge (3d413d7) Diff
size 6.55 kB 6.58 kB +34 B (+0.5%)
size-with-ext-deps 24.1 kB 24.2 kB +34 B (+0.1%)
getAI
Size
Type Base (a4848b4) Merge (3d413d7) Diff
size 7.00 kB 7.04 kB +34 B (+0.5%)
size-with-ext-deps 31.7 kB 31.7 kB +34 B (+0.1%)

`getGenerativeModel`

Size

Type	Base (`a4848b4`)	Merge (`3d413d7`)	Diff
size	25.1 kB	25.7 kB	+596 B (+2.4%)
size-with-ext-deps	42.8 kB	43.5 kB	+611 B (+1.4%)

Dependency

Type Base (a4848b4) Merge (3d413d7) Diff

functions

39 dependencies

addHelpers
aggregateResponses
assignRoleToPartsAndValidateSendMessageRequest
chromeAdapterFactory
constructRequest
countTokens
countTokensOnCloud
createEnhancedContentResponse
decodeInstanceIdentifier
factory
formatBlockErrorMessage
formatGenerateContentInput
formatNewContent
formatSystemInstruction
generateContent
generateContentOnCloud
generateContentStream
generateContentStreamOnCloud
generateResponseSequence
getClientHeaders
getFunctionCalls
getGenerativeModel
getHeaders
getInlineDataParts
getResponsePromise
getResponseStream
getText
hadBadFinishReason
hasValidCandidates
makeRequest
mapCountTokensRequest
mapGenerateContentCandidates
mapGenerateContentRequest
mapGenerateContentResponse
mapPromptFeedback
processGenerateContentResponse
processStream
registerAI
validateChatHistory

40 dependencies

addHelpers
aggregateResponses
assignRoleToPartsAndValidateSendMessageRequest
callCloudOrDevice
chromeAdapterFactory
constructRequest
countTokens
countTokensOnCloud
createEnhancedContentResponse
decodeInstanceIdentifier
factory
formatBlockErrorMessage
formatGenerateContentInput
formatNewContent
formatSystemInstruction
generateContent
generateContentOnCloud
generateContentStream
generateContentStreamOnCloud
generateResponseSequence
getClientHeaders
getFunctionCalls
getGenerativeModel
getHeaders
getInlineDataParts
getResponsePromise
getResponseStream
getText
hadBadFinishReason
hasValidCandidates
makeRequest
mapCountTokensRequest
mapGenerateContentCandidates
mapGenerateContentRequest
mapGenerateContentResponse
mapPromptFeedback
processGenerateContentResponse
processStream
registerAI
validateChatHistory

+ callCloudOrDevice

variables

25 dependencies

AIErrorCode
AI_TYPE
Availability
BackendType
DEFAULT_API_VERSION
DEFAULT_DOMAIN
DEFAULT_FETCH_TIMEOUT_MS
DEFAULT_HYBRID_IN_CLOUD_MODEL
DEFAULT_LOCATION
FinishReason
HarmSeverity
InferenceMode
LANGUAGE_TAG
PACKAGE_VERSION
POSSIBLE_ROLES
SILENT_ERROR
Task
VALID_PARTS_PER_ROLE
VALID_PART_FIELDS
VALID_PREVIOUS_CONTENT_ROLES
badFinishReasons
logger
name
responseLineRE
version

26 dependencies

AIErrorCode
AI_TYPE
Availability
BackendType
DEFAULT_API_VERSION
DEFAULT_DOMAIN
DEFAULT_FETCH_TIMEOUT_MS
DEFAULT_HYBRID_IN_CLOUD_MODEL
DEFAULT_LOCATION
FinishReason
HarmSeverity
InferenceMode
LANGUAGE_TAG
PACKAGE_VERSION
POSSIBLE_ROLES
SILENT_ERROR
Task
VALID_PARTS_PER_ROLE
VALID_PART_FIELDS
VALID_PREVIOUS_CONTENT_ROLES
badFinishReasons
errorsCausingFallback
logger
name
responseLineRE
version

+ errorsCausingFallback

getImagenModel
Size
Type Base (a4848b4) Merge (3d413d7) Diff
size 13.3 kB 13.3 kB +34 B (+0.3%)
size-with-ext-deps 31.0 kB 31.0 kB +34 B (+0.1%)
getLiveGenerativeModel
Size
Type Base (a4848b4) Merge (3d413d7) Diff
size 15.1 kB 15.1 kB +34 B (+0.2%)
size-with-ext-deps 32.8 kB 32.8 kB +34 B (+0.1%)
startAudioConversation
Size
Type Base (a4848b4) Merge (3d413d7) Diff
size 12.6 kB 12.7 kB +34 B (+0.3%)
size-with-ext-deps 30.5 kB 30.5 kB +34 B (+0.1%)

Test Logs

https://storage.googleapis.com/firebase-sdk-metric-reports/9azZ4SL09K.html

This commit adds a new test suite to verify that the GenerativeModel's methods correctly dispatch requests to either the on-device or cloud backends based on the selected InferenceMode. It covers generateContent, generateContentStream, and countTokens.

packages/ai/src/requests/hybrid-helpers.ts

.changeset/feat-prefer-in-cloud.md

packages/ai/src/types/enums.ts

Co-authored-by: Daniel La Rocque <[email protected]>

…rebase-js-sdk into feat/prefer-in-cloud

Co-authored-by: Daniel La Rocque <[email protected]>

…rebase-js-sdk into feat/prefer-in-cloud

.changeset/feat-prefer-in-cloud.md

rachelsaunders · 2025-09-08T19:40:32Z

docs-devsite/ai.md

@@ -624,13 +624,16 @@ ImagenSafetyFilterLevel: {

 <b>(EXPERIMENTAL)</b> Determines whether inference happens on-device or in-cloud.

+<b>PREFER\_ON\_DEVICE:</b> Attempt to make inference calls on-device. If on-device inference is not available, it will fall back to cloud. <br/> <b>ONLY\_ON\_DEVICE:</b> Only attempt to make inference calls on-device. It will not fall back to cloud. If on-device inference is not available, inference methods will throw. <br/> <b>ONLY\_IN\_CLOUD:</b> Only attempt to make inference calls to the cloud. It will not fall back to on-device. <br/> <b>PREFER\_IN\_CLOUD:</b> Attempt to make inference calls to the cloud. If not available, it will fall back to on-device.


Suggested change

PREFER\_ON\_DEVICE: Attempt to make inference calls on-device. If on-device inference is not available, it will fall back to cloud. ONLY\_ON\_DEVICE: Only attempt to make inference calls on-device. It will not fall back to cloud. If on-device inference is not available, inference methods will throw. ONLY\_IN\_CLOUD: Only attempt to make inference calls to the cloud. It will not fall back to on-device. PREFER\_IN\_CLOUD: Attempt to make inference calls to the cloud. If not available, it will fall back to on-device.

PREFER\_ON\_DEVICE: Attempt to make inference calls using an on-device model. If on-device inference is not available, the SDK will fall back to using a cloud-hosted model. ONLY\_ON\_DEVICE: Only attempt to make inference calls using an on-device model. The SDK will not fall back to a cloud-hosted model. If on-device inference is not available, inference methods will throw. ONLY\_IN\_CLOUD: Only attempt to make inference calls using a cloud-hosted model. The SDK will not fall back to an on-device model. PREFER\_IN\_CLOUD: Attempt to make inference calls to a cloud-hosted model. If not available, the SDK will fall back to an on-device model.

Addressed in source code comment and re-generated.

Co-authored-by: rachelsaunders <[email protected]>

…rebase-js-sdk into feat/prefer-in-cloud

hsubox76 added 5 commits September 2, 2025 13:59

fix tests

6619ed4

stop publicly exposing mode

cadfd09

fix ts errors

36deac4

format

0aadd2e

hsubox76 marked this pull request as ready for review September 3, 2025 16:36

hsubox76 requested review from a team as code owners September 3, 2025 16:36

hsubox76 added 2 commits September 3, 2025 09:37

undo grammar fix

f929d6c

fix prefer_on_cloud fallback criteria

8c9c1c2

dlarocque reviewed Sep 3, 2025

View reviewed changes

hsubox76 and others added 9 commits September 3, 2025 12:09

Apply suggestions from code review

34094c8

Co-authored-by: Daniel La Rocque <[email protected]>

Add doc comments on InferenceModes

7c4f837

Merge branch 'feat/prefer-in-cloud' of https://github.com/firebase/fi…

274e5e8

…rebase-js-sdk into feat/prefer-in-cloud

Update .changeset/feat-prefer-in-cloud.md

db53108

Co-authored-by: Daniel La Rocque <[email protected]>

fix ERROR casing and formatting

a1af166

Merge branch 'feat/prefer-in-cloud' of https://github.com/firebase/fi…

6f87cb4

…rebase-js-sdk into feat/prefer-in-cloud

fix expected error case in tests

7fd62c4

Move InferenceMode doc comment to be on top of type

d4e843e

move docs to where they will be seen

15908c7

rachelsaunders requested changes Sep 8, 2025

View reviewed changes

hsubox76 and others added 3 commits September 8, 2025 12:52

Update .changeset/feat-prefer-in-cloud.md

d165c42

Co-authored-by: rachelsaunders <[email protected]>

Address comment

4324ddd

Merge branch 'feat/prefer-in-cloud' of https://github.com/firebase/fi…

337d34c

…rebase-js-sdk into feat/prefer-in-cloud

rachelsaunders approved these changes Sep 8, 2025

View reviewed changes

dlarocque approved these changes Sep 9, 2025

View reviewed changes

hsubox76 merged commit 06ab5c4 into main Sep 9, 2025
37 of 38 checks passed

hsubox76 deleted the feat/prefer-in-cloud branch September 9, 2025 18:14

google-oss-bot mentioned this pull request Sep 17, 2025

Version Packages #9258

Open

		@@ -624,13 +624,16 @@ ImagenSafetyFilterLevel: {

		<b>(EXPERIMENTAL)</b> Determines whether inference happens on-device or in-cloud.

		<b>PREFER\_ON\_DEVICE:</b> Attempt to make inference calls on-device. If on-device inference is not available, it will fall back to cloud. <br/> <b>ONLY\_ON\_DEVICE:</b> Only attempt to make inference calls on-device. It will not fall back to cloud. If on-device inference is not available, inference methods will throw. <br/> <b>ONLY\_IN\_CLOUD:</b> Only attempt to make inference calls to the cloud. It will not fall back to on-device. <br/> <b>PREFER\_IN\_CLOUD:</b> Attempt to make inference calls to the cloud. If not available, it will fall back to on-device.

feat(ai): Add prefer_in_cloud option for inference mode #9236

feat(ai): Add prefer_in_cloud option for inference mode #9236

Uh oh!

Conversation

hsubox76 commented Sep 2, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

changeset-bot bot commented Sep 2, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

🦋 Changeset detected

Uh oh!

google-oss-bot commented Sep 2, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Size Report 1

Affected Products

@firebase/ai

firebase

Test Logs

Uh oh!

google-oss-bot commented Sep 2, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Size Analysis Report 1

Affected Products

@firebase/ai

AIError

AIErrorCode

AIModel

AnyOfSchema

ArraySchema

Backend

BackendType

BlockReason

BooleanSchema

ChatSession

FinishReason

FunctionCallingMode

GenerativeModel

GoogleAIBackend

HarmBlockMethod

HarmBlockThreshold

HarmCategory

HarmProbability

HarmSeverity

ImagenAspectRatio

ImagenImageFormat

ImagenModel

ImagenPersonFilterLevel

ImagenSafetyFilterLevel

InferenceMode

IntegerSchema

LiveGenerativeModel

LiveResponseType

LiveSession

Modality

NumberSchema

ObjectSchema

POSSIBLE_ROLES

ResponseModality

Schema

SchemaType

StringSchema

VertexAIBackend

getAI

getGenerativeModel

getImagenModel

getLiveGenerativeModel

startAudioConversation

Test Logs

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

rachelsaunders Sep 8, 2025

Choose a reason for hiding this comment

Uh oh!

hsubox76 Sep 8, 2025

Choose a reason for hiding this comment

hsubox76 commented Sep 2, 2025 •

edited

Loading

changeset-bot bot commented Sep 2, 2025 •

edited

Loading

google-oss-bot commented Sep 2, 2025 •

edited

Loading

Size Report ¹

`@firebase/ai`

`firebase`

google-oss-bot commented Sep 2, 2025 •

edited

Loading

Size Analysis Report ¹

`@firebase/ai`

`AIError`

`AIErrorCode`

`AIModel`

`AnyOfSchema`

`ArraySchema`

`Backend`

`BackendType`

`BlockReason`

`BooleanSchema`

`ChatSession`

`FinishReason`

`FunctionCallingMode`

`GenerativeModel`

`GoogleAIBackend`

`HarmBlockMethod`

`HarmBlockThreshold`

`HarmCategory`

`HarmProbability`

`HarmSeverity`

`ImagenAspectRatio`

`ImagenImageFormat`

`ImagenModel`

`ImagenPersonFilterLevel`

`ImagenSafetyFilterLevel`

`InferenceMode`

`IntegerSchema`

`LiveGenerativeModel`

`LiveResponseType`

`LiveSession`

`Modality`

`NumberSchema`

`ObjectSchema`

`POSSIBLE_ROLES`

`ResponseModality`

`Schema`

`SchemaType`

`StringSchema`

`VertexAIBackend`

`getAI`

`getGenerativeModel`

`getImagenModel`

`getLiveGenerativeModel`

`startAudioConversation`