Le Raspberry Pi devient une plateforme crédible pour exécuter des modèles d’IA légers en local.
Des modèles réduits comme TinyLlama et Smollm tournent sur CPU, malgré une génération de jetons lente.
A retenir :
- Raspberry Pi 4 minimum 2 Go recommandé pour expérience décente
- Modèles TinyLlama 1,1B et Smollm 135M adaptés aux Pi
- Ollama comme voie simple d’installation et d’exécution locale
- Dataset YOLOv8 optimisé 640×640 et augmentation pour robustesse
Installer Ollama et lancer des modèles légers sur Raspberry Pi
Après avoir retenu les bases, l’installation d’Ollama est la première étape opérationnelle.
Sur un Raspberry Pi 4 avec 4 Go de RAM, la mise à jour des paquets est indispensable.
L’exécution du script d’installation officiel d’Ollama configure le service local pour exécuter les modèles sur CPU.
Lors de l’installation, un avertissement signale que l’exécution se fera sur le processeur et non sur un accélérateur dédié.
Cette approche permet de démarrer rapidement, puis d’évaluer les besoins en accélération matérielle Hailo ou Coral.
Selon la Fondation Raspberry Pi, le nouvel AI Hat+ complète l’offre matérielle sans la rendre indispensable pour tous les projets.
Selon GitHub, plusieurs dépôts partagent scripts et exemples pour automatiser l’installation et la gestion des modèles sur Pi.
Ces premiers tests servent à dimensionner la mémoire et à décider entre CPU pur ou accélérateurs externes.
Matériel et configuration recommandés :
- Raspberry Pi 4 avec 4 Go de RAM pour confort d’usage
- Carte microSD 32 Go rapide, idéalement UHS-1 ou supérieure
- Bloc d’alimentation stable 5V 3A pour éviter les coupures
- Connexion Ethernet pour transférer rapidement des modèles volumineux
Modèle
Paramètres
RAM utilisée
Recommandé pour
TinyLlama
1,1 milliard
≈638 Mo
Pi 4 / Pi 5
Smollm
135 millions
≈92 Mo
Pi Zero 2 W / Pi 4
Phi (Microsoft)
2,7 milliards
≈1,6 Go
Pi 5
Micro models
≈1 million
faible mémoire
Pi Zero 2 W possible
Préparation logicielle pour Ollama et dépendances
Cette étape rassemble les commandes et permissions nécessaires pour lancer Ollama.
Commencez par mettre à jour le système avec apt afin d’assurer des dépendances cohérentes.
L’exécution du script officiel installe les binaires et crée un service local pour les modèles.
Étapes d’installation rapides :
- sudo apt update && sudo apt upgrade pour synchroniser le système
- installer curl si absent pour récupérer le script d’installation
- exécuter le script officiel d’Ollama pour déployer le service local
- vérifier les logs et l’état du service après l’installation initiale
« J’ai installé Ollama sur un Pi4 et les premières réponses arrivaient en quelques secondes par token, lent mais fonctionnel. »
Frédéric J.
Tester un modèle TinyLlama en local
Le test d’un petit modèle valide la chaîne depuis l’installation jusqu’à l’exécution.
Après installation, la commande d’extraction du modèle permet de télécharger TinyLlama sur le Pi.
Ensuite, une invite simple suffit pour générer une réponse, en acceptant des latences notables.
Commandes d’exécution essentielles :
- curl pour récupérer le script d’installation d’Ollama
- ollama pull tinyllama pour télécharger le modèle 1,1B
- lancer une invite via ollama run pour tester la génération locale
- préférer Smollm 135M pour des tests rapides sur Pi peu puissant
Ces tests initiaux permettent ensuite d’aborder la création et l’optimisation du dataset pour l’entraînement.
Créer et augmenter un dataset YOLOv8 pour détection sur Raspberry Pi
Après la validation des modèles, la qualité du dataset devient le facteur déterminant pour la détection d’objets.
La structure YOLOv8 impose un data.yaml et des répertoires train, valid et test bien organisés.
Selon Roboflow, l’annotation et l’augmentation automatisée accélèrent la robustesse du modèle avant l’entraînement.
Pour les tests locaux, la conversion en images 640×640 et l’augmentation multiplient l’efficacité de l’entraînement.
Organisation du dataset :
- fichier data.yaml avec noms et nombre de classes
- arborescence train, valid, test avec images et labels séparés
- nommage identique entre .jpg et .txt pour lier image et annotation
- répartition typique 70/15/15 ou alternatives 70/20/10 selon besoin
Dataset
Train
Valid
Test
Total
Fred local initial (2 classes)
150
30
30
210
Fred après augmentation
18000
3600
3600
25200
Roboflow 4 shapes avant
276
80
40
396
Roboflow après augmentation
1380
80
40
1500
La conversion en 640×640 et l’augmentation via scripts permet d’atteindre des tailles exploitables pour YOLOv8.
Selon GitHub, des scripts Python automatisent le redimensionnement et la mise à jour des labels normalisés.
« J’ai annoté vingt-cinq mille images en local et le script d’augmentation a multiplié le dataset efficacement. »
Fred R.
La plateforme Roboflow offre un flux alternatif pour extraire images depuis vidéo et appliquer des versions augmentées.
Avec un dataset calibré et converti, la compilation pour un moteur Hailo devient l’étape suivante.
Déployer sur Raspberry Pi 5 avec module Hailo et tests terrain
Après compilation, la cible matérielle dicte les choix de compilation et d’optimisation pour l’inférence.
Le module Hailo du Raspberry Pi 5 permet des inférences temps réel pour la vision embarquée.
Selon la documentation Hailo partagée sur GitHub, la conversion YOLOv8 vers le format Hailo nécessite une étape de compilation dédiée.
Pour les projets alternatifs, Coral de Google et les accélérateurs USB restent des options courantes pour les Pi et Jetson Nano.
Outils de déploiement :
- Hailo pour Raspberry Pi 5, compilation spécifique requise
- Edge Impulse pour prototypage et déploiement sur edge
- TensorFlow Lite pour modèles quantifiés et runtime optimisé
- Coral de Google et USB accelerator pour accélérations externes
Au niveau logiciel, OpenCV facilite la capture et le prétraitement des images avant l’inférence du modèle.
La conversion du modèle depuis PyTorch vers TensorFlow Lite ou format Hailo exige des outils de conversion et des tests unitaires.
« Le dongle Android Auto sans fil est devenu plus réactif grâce au modèle embarqué sur Pi. »
Marc P.
« À mon avis, l’utilisation locale renforce la confidentialité des données et réduit les coûts récurrents cloud. »
Alex P.
Pour l’embarqué, Adafruit et Seeed Studio proposent des capteurs et modules complémentaires compatibles avec des prototypes Arduino et Raspberry Pi.
Enfin, la maintenance passe par des tests en conditions réelles, logs d’inférence et surveillance de la latence opérationnelle.
Ce passage vers le déploiement ouvre la voie à l’intégration continue et aux mises à jour sur le terrain.
