Je pense que tout le monde s'accorde à dire que les données sont l'actif le plus essentiel pour l'IA. Récemment, j'ai suivi ce nouveau projet @vana, qui vient de lancer Vana Playground. J'ai jeté un œil et je trouve ça assez intéressant. En résumé, c'est comme une « plateforme en libre-service pour les données d'IA », où les développeurs d'IA peuvent : • Parcourir différents ensembles de données DataDAO • Voir les modèles de données, le nombre de contributeurs • Télécharger directement des échantillons de données pour des tests Vous pouvez essayer la démo sur le site officiel : Pourquoi est-ce important ? Parce qu'actuellement, ce qui manque à l'IA, ce ne sont pas les modèles, mais de vraies données au niveau utilisateur. • Collecte de données → les signaux sont très faibles • Des plateformes ouvertes comme Kaggle → qualité plutôt basse • Les grandes plateformes (Google, Meta) → ne s'ouvrent pas du tout Le Playground est la première fois que de vraies données humaines peuvent être directement utilisées par les développeurs d'IA, et c'est décentralisé + autorisé. Plus important encore, c'est entièrement en libre-service, sans avoir besoin de réseaux ou de recommandations. Si Vana Playground peut continuer à attirer des données, il pourrait devenir à l'avenir la plus grande plateforme de base de données publique décentralisée, et cet espace d'imagination est en fait très vaste.