Skip to main content
Thomas Germain Thomas Germain
Aperçu

Step 3.5 Flash Free sur OpenRouter : Guide Complet pour Utiliser le Modèle Performant Sans Coût

10 février 2026
3 min de lecture

OpenRouter a rendu accessible gratuitement le modèle Step 3.5 Flash de StepFun (anciennement StepFun/Step-1). C’est une opportunité en or pour tester un modèle de qualité sans dépenser un sou. Mais attention : le gratuit a des limites. Voici comment l’utiliser efficacement.

Présentation de Step 3.5 Flash

Step 3.5 Flash est le modèle d’entrée de gamme de StepFun. Il offre :

  • Contexte de 16k tokens
  • Qualité correcte pour du chat, du code simple, des tâches générales
  • Latence très faible (optimisé pour la vitesse)
  • Compatible OpenAI API (via OpenRouter)

Le plus : Gratuit sur OpenRouter avec une limite de 1000 requêtes/jour par compte (à vérifier selon la période).

Configuration étape par étape

1. Créer un compte OpenRouter

Rendez-vous sur https://openrouter.ai et connectez-vous (Google/GitHub). Une fois connecté, tu as accès à une clé API gratuite.

2. Obtenir ta clé API

Dans ton dashboard OpenRouter → KeysCreate Key. Copie-la, elle ressemble à sk-or-v1-....

3. Installer le client OpenAI

Terminal window
pip install openai

4. Utilisation en Python

import os
from openai import OpenAI
# Configuration
client = OpenAI(
api_key=os.environ.get("OPENROUTER_API_KEY"), # ta clé
base_url="https://openrouter.ai/api/v1"
)
# Requête simple
response = client.chat.completions.create(
model="openrouter/stepfun/step-3.5-flash:free",
messages=[
{"role": "system", "content": "Tu es un assistant expert en Python."},
{"role": "user", "content": "Écris une fonction Python qui calcule la factorielle d'un nombre."}
],
temperature=0.7,
max_tokens=500
)
print(response.choices[0].message.content)

5. Gérer les headers (optionnel)

Pour identifier ton site/app avec OpenRouter :

response = client.chat.completions.create(
model="openrouter/stepfun/step-3.5-flash:free",
messages=[...],
extra_headers={
"HTTP-Referer": "https://ton-site.com", # optionnel
"X-Title": "Mon App" # optionnel
}
)

Limites gratuites à connaître

  • Quota : 1000 requêtes/jour (sujet à changement)
  • Débit : Rate limit de ~10 req/min en gratuit
  • Modèles : Seulement step-3.5-flash:free (pas le turbo payant)
  • Priorité : Les requêtes gratuites passent après les payantes (latence variable)

Comparaison rapide avec GPT-4o et Claude

ModèlePrix (entrée)Qualité reasoningCode
GPT-4o2.50$/M⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
Claude 3.5 Sonnet3.00$/M⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
Step 3.5 FlashGratuit⭐⭐⭐⭐⭐⭐⭐

Step 3.5 Flash est surprenant pour le code (il a été entraîné là-dessus). Mais pour le reasoning complexe, GPT-4o et Claude restent supérieurs.

Astuces pour optimiser l’usage gratuit

  1. Batch les requêtes si tu as plusieurs tâches similaires
  2. Limite le contexte à ce qui est nécessaire (moins de tokens = plus rapide)
  3. Utilise max_tokens pour éviter les réponses trop longues inutilement
  4. Gère les erreurs 429 avec un retry backoff :
import time
from openai import RateLimitError
try:
response = client.chat.completions.create(...)
except RateLimitError:
time.sleep(5)
# retry

Conclusion

Step 3.5 Flash Free est un excellent moyen de tester un modèle performant sans engagement financier. Idéal pour du prototypage, des bots simples, ou comme backup quand les modèles premiums sont indisponibles. Si ton usage devient intensif, passer à un modèle payant (Step 3.5 Turbo ou GPT-4o) sera nécessaire.


Tags : ia, code, productivite
ReadingTime : 5 min