Restez organisé à l'aide des collections
Enregistrez et classez les contenus selon vos préférences.
Gemini 2.5 Flash-Lite est notre modèle Gemini le plus équilibré, optimisé pour les cas d'utilisation à faible latence. Il offre les mêmes fonctionnalités utiles que les autres modèles Gemini 2.5, comme la possibilité d'activer la réflexion à différents budgets, de se connecter à des outils tels que l'ancrage avec la recherche Google et l'exécution de code, l'entrée multimodale et une longueur de contexte d'un million de jetons.
Pour obtenir des informations techniques encore plus détaillées sur Gemini 2.5 Flash-Lite (comme les benchmarks de performances, des informations sur nos ensembles de données d'entraînement, nos efforts en matière de durabilité, l'utilisation prévue et les limites, ainsi que notre approche de l'éthique et de la sécurité), consultez notre rapport technique sur nos modèles Gemini 2.5.
Remarque : Pour utiliser la fonctionnalité "Déployer un exemple d'application", vous devez disposer d'un projet Google Cloud avec la facturation et l'API Vertex AI activées.
ID du modèle
gemini-2.5-flash-lite
Entrées et sorties acceptées
Entrées : texte, code, images, audio, vidéo
Sorties : texte
Limites de jetons
Nombre maximal de jetons d'entrée : 1 048 576
Nombre maximal de jetons de sortie : 65 536 (par défaut)
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/09/02 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Difficile à comprendre","hardToUnderstand","thumb-down"],["Informations ou exemple de code incorrects","incorrectInformationOrSampleCode","thumb-down"],["Il n'y a pas l'information/les exemples dont j'ai besoin","missingTheInformationSamplesINeed","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2025/09/02 (UTC)."],[],[],null,["# Gemini 2.5 Flash-Lite is our most balanced Gemini model,\noptimized for low latency use cases. It comes with the same capabilities that\nmake other Gemini 2.5 models helpful, such as the ability to turn\nthinking on at different budgets, connecting to tools like\nGrounding with Google Search and code execution, multimodal input, and\na 1 million-token context length.\n\nFor even more detailed technical information on Gemini 2.5 Flash-Lite (such as\nperformance benchmarks, information on our training datasets, efforts on\nsustainability, intended usage and limitations, and our approach to ethics and\nsafety), see our [technical\nreport](https://storage.googleapis.com/deepmind-media/gemini/gemini_v2_5_report.pdf)\non our Gemini 2.5 models.\n\n\n[Try in Vertex AI](https://console.cloud.google.com/vertex-ai/generative/multimodal/create/text?model=gemini-2.5-flash-lite) [(Preview) Deploy example app](https://console.cloud.google.com/vertex-ai/studio/multimodal?suggestedPrompt=How%20does%20AI%20work&deploy=true&model=gemini-2.5-flash-lite)\nNote: To use the \"Deploy example app\" feature, you need a Google Cloud project with billing and Vertex AI API enabled."]]