OpenRouter a rendu accessible gratuitement le modèle Step 3.5 Flash de StepFun (anciennement StepFun/Step-1). C’est une opportunité en or pour tester un modèle de qualité sans dépenser un sou. Mais attention : le gratuit a des limites. Voici comment l’utiliser efficacement.
Présentation de Step 3.5 Flash
Step 3.5 Flash est le modèle d’entrée de gamme de StepFun. Il offre :
- Contexte de 16k tokens
- Qualité correcte pour du chat, du code simple, des tâches générales
- Latence très faible (optimisé pour la vitesse)
- Compatible OpenAI API (via OpenRouter)
Le plus : Gratuit sur OpenRouter avec une limite de 1000 requêtes/jour par compte (à vérifier selon la période).
Configuration étape par étape
1. Créer un compte OpenRouter
Rendez-vous sur https://openrouter.ai et connectez-vous (Google/GitHub). Une fois connecté, tu as accès à une clé API gratuite.
2. Obtenir ta clé API
Dans ton dashboard OpenRouter → Keys → Create Key. Copie-la, elle ressemble à sk-or-v1-....
3. Installer le client OpenAI
pip install openai4. Utilisation en Python
import osfrom openai import OpenAI
# Configurationclient = OpenAI( api_key=os.environ.get("OPENROUTER_API_KEY"), # ta clé base_url="https://openrouter.ai/api/v1")
# Requête simpleresponse = client.chat.completions.create( model="openrouter/stepfun/step-3.5-flash:free", messages=[ {"role": "system", "content": "Tu es un assistant expert en Python."}, {"role": "user", "content": "Écris une fonction Python qui calcule la factorielle d'un nombre."} ], temperature=0.7, max_tokens=500)
print(response.choices[0].message.content)5. Gérer les headers (optionnel)
Pour identifier ton site/app avec OpenRouter :
response = client.chat.completions.create( model="openrouter/stepfun/step-3.5-flash:free", messages=[...], extra_headers={ "HTTP-Referer": "https://ton-site.com", # optionnel "X-Title": "Mon App" # optionnel })Limites gratuites à connaître
- Quota : 1000 requêtes/jour (sujet à changement)
- Débit : Rate limit de ~10 req/min en gratuit
- Modèles : Seulement
step-3.5-flash:free(pas le turbo payant) - Priorité : Les requêtes gratuites passent après les payantes (latence variable)
Comparaison rapide avec GPT-4o et Claude
| Modèle | Prix (entrée) | Qualité reasoning | Code |
|---|---|---|---|
| GPT-4o | 2.50$/M | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
| Claude 3.5 Sonnet | 3.00$/M | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
| Step 3.5 Flash | Gratuit | ⭐⭐⭐ | ⭐⭐⭐⭐ |
Step 3.5 Flash est surprenant pour le code (il a été entraîné là-dessus). Mais pour le reasoning complexe, GPT-4o et Claude restent supérieurs.
Astuces pour optimiser l’usage gratuit
- Batch les requêtes si tu as plusieurs tâches similaires
- Limite le contexte à ce qui est nécessaire (moins de tokens = plus rapide)
- Utilise
max_tokenspour éviter les réponses trop longues inutilement - Gère les erreurs 429 avec un retry backoff :
import timefrom openai import RateLimitError
try: response = client.chat.completions.create(...)except RateLimitError: time.sleep(5) # retryConclusion
Step 3.5 Flash Free est un excellent moyen de tester un modèle performant sans engagement financier. Idéal pour du prototypage, des bots simples, ou comme backup quand les modèles premiums sont indisponibles. Si ton usage devient intensif, passer à un modèle payant (Step 3.5 Turbo ou GPT-4o) sera nécessaire.
Tags : ia, code, productivite
ReadingTime : 5 min