Models All the Way Down
Qu'est-ce que je peux apprendre ?
Un récit visuel, du projet de recherche Knowing Machines, qui suit la construction de LAION-5B — le jeu de données fondation ouvert de 5,8 milliards de paires image-texte utilisé pour entraîner des modèles comme Stable Diffusion. L'enquête décortique ce que contient réellement un jeu de données trop vaste pour qu'un humain puisse l'examiner, et ce que cela implique.
Idée clé
L'IA générative, c'est « des modèles jusqu'au bout » : chaque modèle repose sur un jeu de données qui est lui-même le produit de modèles antérieurs, de choix de collecte et d'hypothèses. Les données d'entraînement ne sont pas une réalité brute mais un artefact construit, désordonné et lourd de conséquences.
Comment l'utiliser au quotidien
Une ressource visuelle et accessible pour comprendre d'où les générateurs d'images tirent leur matière et pourquoi cette origine façonne leurs sorties et leurs biais.
- Utilisez l'œuvre pour expliquer à un usager pourquoi un générateur d'images IA produit des résultats stéréotypés ou biaisés — il les a appris des données.
- Appuyez-vous sur l'échelle de LAION-5B pour faire comprendre pourquoi personne ne maîtrise ni n'inspecte entièrement ce que ces modèles ont vu.