[Frontend] Batch inference for llm.chat() API #15869

	name: mypy

	on:
	# Trigger the workflow on push or pull request,
	# but only for the main branch
	push:
	branches:
	- main
	pull_request:
	branches:
	- main

	jobs:
	ruff:
	runs-on: ubuntu-latest
	strategy:
	matrix:
	python-version: ["3.8", "3.9", "3.10", "3.11", "3.12"]
	steps:
	- uses: actions/checkout@v2
	- name: Set up Python ${{ matrix.python-version }}
	uses: actions/setup-python@v2
	with:
	python-version: ${{ matrix.python-version }}
	- name: Install dependencies
	run: \|
	python -m pip install --upgrade pip
	pip install mypy==1.11.1
	pip install types-setuptools
	pip install types-PyYAML
	pip install types-requests
	pip install types-setuptools
	- name: Mypy
	run: \|
	mypy
	mypy tests --follow-imports skip
	mypy vllm/attention --follow-imports skip
	mypy vllm/distributed --follow-imports skip
	mypy vllm/engine --follow-imports skip
	mypy vllm/executor --follow-imports skip
	mypy vllm/lora --follow-imports skip
	mypy vllm/model_executor --follow-imports skip
	mypy vllm/prompt_adapter --follow-imports skip
	mypy vllm/spec_decode --follow-imports skip
	mypy vllm/worker --follow-imports skip

Provide feedback