IA légère sur Raspberry Pi : premiers tests et découvertes

Le Raspberry Pi devient une plateforme crédible pour exécuter des modèles d’IA légers en local.

Des modèles réduits comme TinyLlama et Smollm tournent sur CPU, malgré une génération de jetons lente.

Sommaire

A retenir :

Raspberry Pi 4 minimum 2 Go recommandé pour expérience décente
Modèles TinyLlama 1,1B et Smollm 135M adaptés aux Pi
Ollama comme voie simple d’installation et d’exécution locale
Dataset YOLOv8 optimisé 640×640 et augmentation pour robustesse

Installer Ollama et lancer des modèles légers sur Raspberry Pi

Après avoir retenu les bases, l’installation d’Ollama est la première étape opérationnelle.

Sur un Raspberry Pi 4 avec 4 Go de RAM, la mise à jour des paquets est indispensable.

L’exécution du script d’installation officiel d’Ollama configure le service local pour exécuter les modèles sur CPU.

Lors de l’installation, un avertissement signale que l’exécution se fera sur le processeur et non sur un accélérateur dédié.

Cette approche permet de démarrer rapidement, puis d’évaluer les besoins en accélération matérielle Hailo ou Coral.

Selon la Fondation Raspberry Pi, le nouvel AI Hat+ complète l’offre matérielle sans la rendre indispensable pour tous les projets.

Selon GitHub, plusieurs dépôts partagent scripts et exemples pour automatiser l’installation et la gestion des modèles sur Pi.

Ces premiers tests servent à dimensionner la mémoire et à décider entre CPU pur ou accélérateurs externes.

A lire : Le Confort de lecture nocturne grandement amélioré par le mode sombre de la tablette.

Matériel et configuration recommandés :

Raspberry Pi 4 avec 4 Go de RAM pour confort d’usage
Carte microSD 32 Go rapide, idéalement UHS-1 ou supérieure
Bloc d’alimentation stable 5V 3A pour éviter les coupures
Connexion Ethernet pour transférer rapidement des modèles volumineux

Modèle	Paramètres	RAM utilisée	Recommandé pour
TinyLlama	1,1 milliard	≈638 Mo	Pi 4 / Pi 5
Smollm	135 millions	≈92 Mo	Pi Zero 2 W / Pi 4
Phi (Microsoft)	2,7 milliards	≈1,6 Go	Pi 5
Micro models	≈1 million	faible mémoire	Pi Zero 2 W possible

Préparation logicielle pour Ollama et dépendances

Cette étape rassemble les commandes et permissions nécessaires pour lancer Ollama.

Commencez par mettre à jour le système avec apt afin d’assurer des dépendances cohérentes.

L’exécution du script officiel installe les binaires et crée un service local pour les modèles.

Étapes d’installation rapides :

sudo apt update && sudo apt upgrade pour synchroniser le système
installer curl si absent pour récupérer le script d’installation
exécuter le script officiel d’Ollama pour déployer le service local
vérifier les logs et l’état du service après l’installation initiale

« J’ai installé Ollama sur un Pi4 et les premières réponses arrivaient en quelques secondes par token, lent mais fonctionnel. »

Frédéric J.

Tester un modèle TinyLlama en local

Le test d’un petit modèle valide la chaîne depuis l’installation jusqu’à l’exécution.

Après installation, la commande d’extraction du modèle permet de télécharger TinyLlama sur le Pi.

A lire : Tablette et PDF : taille d’écran idéale et gestion des fichiers

Ensuite, une invite simple suffit pour générer une réponse, en acceptant des latences notables.

Commandes d’exécution essentielles :

curl pour récupérer le script d’installation d’Ollama
ollama pull tinyllama pour télécharger le modèle 1,1B
lancer une invite via ollama run pour tester la génération locale
préférer Smollm 135M pour des tests rapides sur Pi peu puissant

Ces tests initiaux permettent ensuite d’aborder la création et l’optimisation du dataset pour l’entraînement.

Créer et augmenter un dataset YOLOv8 pour détection sur Raspberry Pi

Après la validation des modèles, la qualité du dataset devient le facteur déterminant pour la détection d’objets.

La structure YOLOv8 impose un data.yaml et des répertoires train, valid et test bien organisés.

Selon Roboflow, l’annotation et l’augmentation automatisée accélèrent la robustesse du modèle avant l’entraînement.

Pour les tests locaux, la conversion en images 640×640 et l’augmentation multiplient l’efficacité de l’entraînement.

Organisation du dataset :

fichier data.yaml avec noms et nombre de classes
arborescence train, valid, test avec images et labels séparés
nommage identique entre .jpg et .txt pour lier image et annotation
répartition typique 70/15/15 ou alternatives 70/20/10 selon besoin

Dataset	Train	Valid	Test	Total
Fred local initial (2 classes)	150	30	30	210
Fred après augmentation	18000	3600	3600	25200
Roboflow 4 shapes avant	276	80	40	396
Roboflow après augmentation	1380	80	40	1500

A lire : Raspberry Pi : utiliser Python pour vos projets de programmation

La conversion en 640×640 et l’augmentation via scripts permet d’atteindre des tailles exploitables pour YOLOv8.

Selon GitHub, des scripts Python automatisent le redimensionnement et la mise à jour des labels normalisés.

« J’ai annoté vingt-cinq mille images en local et le script d’augmentation a multiplié le dataset efficacement. »

Fred R.

La plateforme Roboflow offre un flux alternatif pour extraire images depuis vidéo et appliquer des versions augmentées.

Avec un dataset calibré et converti, la compilation pour un moteur Hailo devient l’étape suivante.

Déployer sur Raspberry Pi 5 avec module Hailo et tests terrain

Après compilation, la cible matérielle dicte les choix de compilation et d’optimisation pour l’inférence.

Le module Hailo du Raspberry Pi 5 permet des inférences temps réel pour la vision embarquée.

Selon la documentation Hailo partagée sur GitHub, la conversion YOLOv8 vers le format Hailo nécessite une étape de compilation dédiée.

Pour les projets alternatifs, Coral de Google et les accélérateurs USB restent des options courantes pour les Pi et Jetson Nano.

Outils de déploiement :

Hailo pour Raspberry Pi 5, compilation spécifique requise
Edge Impulse pour prototypage et déploiement sur edge
TensorFlow Lite pour modèles quantifiés et runtime optimisé
Coral de Google et USB accelerator pour accélérations externes

Au niveau logiciel, OpenCV facilite la capture et le prétraitement des images avant l’inférence du modèle.

La conversion du modèle depuis PyTorch vers TensorFlow Lite ou format Hailo exige des outils de conversion et des tests unitaires.

« Le dongle Android Auto sans fil est devenu plus réactif grâce au modèle embarqué sur Pi. »

Marc P.

« À mon avis, l’utilisation locale renforce la confidentialité des données et réduit les coûts récurrents cloud. »

Alex P.

Pour l’embarqué, Adafruit et Seeed Studio proposent des capteurs et modules complémentaires compatibles avec des prototypes Arduino et Raspberry Pi.

Enfin, la maintenance passe par des tests en conditions réelles, logs d’inférence et surveillance de la latence opérationnelle.

Ce passage vers le déploiement ouvre la voie à l’intégration continue et aux mises à jour sur le terrain.

Raspberry Pi et IA : tests avec modèles légers