Le plus grand moment de base de l'IA

Intermédiaire3/31/2025, 7:48:09 AM
Les monopoles de données sont arrivés et affament les petits. En même temps, la qualité du web ouvert est en chute libre - les informations sont délibérément empoisonnées et les bêtises générées par l'IA polluent le corpus.

Le plus grand obstacle de l'IA n'est pas la conception du modèle ou les GPU - c'est les données. Et en ce moment, ces données sont verrouillées et brouillées. Les grandes plateformes Web2 (Reddit, X, Google, etc.) gardent jalousement leurs informations derrière des murs payants ou des CGU strictes. Les monopoles de données sont arrivés, et ils affament les petits acteurs. En même temps, la qualité du web ouvert est en chute libre - les informations sont délibérément empoisonnées et les futilités générées par l'IA polluent le corpus. C'est la tempête parfaite: l'IA a besoin de données, mais le puits est gardé et contaminé.

*Voir la version complète de "Le plus grand moment de base de l'IA" surPortail de recherche des Quatre Piliers

1. Le pari contraire de Grass : décentraliser le grattoir, tokeniser le pipeline

Entrer @getgrass_io, un protocole de web scraping décentralisé qui renverse ce script. Pensez à des millions d'appareils quotidiens (PC maintenant, téléphones bientôt) agissant comme de mini-web crawlers, raclant l'internet 24/7 à la recherche de données publiques. Grass transforme le contenu web brut en ensembles de données structurées prêtes pour l'IA, et le fait via l'économie cryptographique : les utilisateurs gagnent des récompenses pour contribuer à la bande passante et au calcul. C'est comme un minage web participatif, mais pour l'information au lieu du Bitcoin.

2. La Swarm Is Already Alive

L’herbe est déjà en service à grande échelle. Plus de 3 millions de nœuds dans le monde sont connectés au réseau, et ils récupèrent collectivement plus de 1 500 To de données par jour. En utilisant d’innombrables adresses IP résidentielles, Grass peut collecter des données à partir de sites sans déclencher les alarmes anti-scraping habituelles (plus besoin d’être banni d’IP pour avoir trop exploré). Il s’agit essentiellement de remplacer les fermes de données centralisées géantes par un essaim d'« abeilles de données » individuelles – plus difficiles à balayer et faciles à mettre à l’échelle.

Pourquoi cela importe-t-il? Parce que cela ouvre les monopoles de données. Au lieu que quelques gros acteurs stockent des données ou facturent des frais absurdes, toute startup en IA ou chercheur peut accéder au flux de données de Grass. Imaginez extraire le contenu de Reddit ou Twitter pour votre modèle d'IA sans avoir à mendier un accès API ou à débourser des millions - Grass rend cela plausible. C'est l'alternative sans permission pour l'ère de l'IA: si les données sont le nouveau pétrole, Grass construit un réseau de plates-formes pétrolières décentralisées où tout le monde peut forer.

3. Vérification des données via des preuves ZK

Le contrôle de la qualité est l'autre moitié de l'équation, et Grass a une réponse astucieuse: des preuves de connaissance zéro et une vérification sur chaîne. Chaque donnée récupérée peut être estampillée d'une preuve cryptographique (un ZK-SNARK) attestant de son origine et de son intégrité, enregistrée sur la propre blockchain de Grass (un rollup souverain qu'ils construisent à cet effet). En termes simples: vous obtenez un reçu pour chaque extrait web indiquant "cela provient de la Source X à l'heure Y et n'a pas été altéré." C'est énorme pour lutter contre l'empoisonnement des données et les déchets. Lorsque le pipeline est vérifiable, vous pouvez filtrer les données suspectes ou corrompues - ou du moins retracer les problèmes après coup. Dans un monde où l'IA pourrait accidentellement s'entraîner sur des ordures générées par l'IA, disposer d'un tampon d'authenticité pour les données est un changement de jeu.

4. Mise à l'échelle vers des pétabits par jour et au-delà

Parlons de la pile technologique : Grass a commencé sur Solana (pour la vitesse), mais même Solana ne peut pas gérer le volume ici. Ainsi, l'équipe envisage de déployer un rollup souverain (pensez-y comme leur propre blockchain L2) pour gérer le débit important d'une chaîne principale, tout en ancrant toujours la confiance sur une couche de base.

Ils appellent la mise à niveau majeure actuelle Sion, et elle frappe déjà comme un train de marchandises. Grass gère maintenant plus de 1 500 To de données par jour - non pas comme un objectif, mais comme une mesure en direct. Sion (Phases 1 & 2) a suralimenté le réseau, débloquant un débit échelonné en pétaoctets et permettant le grattage multimodal en temps réel : pas seulement du texte, mais aussi des images et des vidéos, en streaming à grande échelle. Fondamentalement, Grass est passé d'un régime alimentaire textuel à un buffet à volonté de données web. Pour les experts en IA qui pensent au-delà du texte (bonjour les modèles de vision, GPT-4, etc.), c'est une grande affaire.

5. Comment $GRASS alimente le volant d'inertie

Maintenant, comment Grass incite-t-il ce réseau tentaculaire? Entrez dans l'économie des jetons. En ce moment, les utilisateurs gagnent des "points Grass" pour exécuter des nœuds - essentiellement un espace réservé pour la vraie chose. Un véritable $GRASSjeton est à l'horizon, et c'est là que la crypto rencontre l'économie de l'IA. L'utilité du jeton liera tout le système ensemble: les entreprises d'IA ou les chercheurs dépenseront$GRASSdemander des données (comme payer par appel API, mais décentralisé), et les opérateurs de noeuds gagneront$GRASSpour répondre à ces demandes (récupération et livraison de données). Les validateurs du réseau vont probablement miser des jetons pour garantir un comportement honnête et une livraison de données de haute qualité (les mauvais acteurs pourraient être réduits, les bons acteurs récompensés). En bref, $GRASSvas graisser les rouages, en alignant les incitations entre les consommateurs de données et les fournisseurs.

6. Infra décentralisée avec un vrai PMF

De manière cruciale, l'approche de Grass atténue quelques problèmes existentiels dans l'IA :

  • Inégalité d'accès aux données : Aujourd'hui, seuls les Googles et OpenAIs peuvent parcourir l'ensemble du web (et même eux se font poursuivre en justice ou bloquer). Grass niveau le terrain de jeu en rendant les données à l'échelle du web accessibles à quiconque peut payer un peu de jeton - une barrière beaucoup plus basse.
  • Qualité des données et empoisonnement : Grâce aux preuves on-chain et (éventuellement) à la validation communautaire, il est beaucoup plus difficile pour quelqu'un d'introduire des données toxiques dans un ensemble d'entraînement sans être remarqué. Grass peut signaler ou exclure du contenu qui ne correspond pas à son empreinte on-chain. Avec le temps, la nature distribuée du réseau pourrait même aider à identifier du contenu généré par l'IA et l'empêcher de renforcer la boucle (imaginez filtrer les articles d'actualité qui ne sont que des sorties de ChatGPT).
  • Résistance à la censure : parce que Gate fonctionne via des milliers de nœuds indépendants, aucun interrupteur unique ne peut couper le flux d'informations. C'est l'effet Streisand rencontre la blockchain - essayez de bloquer les données ici, et elles contournent simplement. Pour les développeurs IA, cela signifie des pipelines plus robustes.

7. Final Alpha: Ne construisez pas des boîtes noires, construisez une IA de base

Pour être clair, Grass en est encore à ses débuts. Il est en version bêta, certaines parties sont encore centralisées (il y a actuellement un coordinateur central, qui sera décentralisé plus tard), et le stockage/nettoyage des données est côté client pour le moment. Mais la trajectoire est définie. Le réseau explose en taille (atteignant des niveaux record en termes de nœuds et de volume de données cette année), et chaque mise à niveau (comme Sion) le rapproche d'un protocole pleinement opérationnel et autoportant.

La vision est audacieuse: Grass veut être la couche de données pour l'IA décentralisée. Imaginez un marché ouvert où n'importe qui peut obtenir des données d'entraînement de haute qualité à la demande, avec une confiance cryptographique intégrée. Pas de gardiens, pas de loyers géants payés à Reddit ou Google, et moins de soucis concernant l'effondrement des modèles à force de se mordre la queue. C'est un torrent de données pour l'IA détenu par la communauté et sécurisé par la cryptographie.

Dans un monde crypto avide de réelle utilité, Grass se démarque comme un projet fusionnant deux méga-tendances (IA & DePIN) avec un produit réel dans la nature. Il est conscient des memes par son nom mais sérieux dans son exécution. Si elle réussit, Grass pourrait transformer le paysage de l'IA - transformant le web lui-même en une source de données vivante et respirante ouverte à tous. Pour les VC, les constructeurs et les lurkers de Crypto Twitter, gardez un œil sur celui-ci. Ce n'est pas souvent que l'on voit une nouvelle couche d'infrastructure internet être construite en temps réel, alimentée par un jeton et un rêve d'information fluide.

Avertissement :

  1. Cet article est repris de [Ponyo : : FP]. Tous les droits d'auteur appartiennent à l'auteur original [Ponyo : : FP]. Si des objections sont soulevées concernant cette reproduction, veuillez contacter le Gate Learnéquipe, et ils s'en occuperont rapidement.
  2. Responsabilité de non-responsabilité : Les points de vue et opinions exprimés dans cet article sont uniquement ceux de l'auteur et ne constituent aucun conseil en investissement.
  3. L'équipe Gate Learn effectue des traductions de l'article dans d'autres langues. Copier, distribuer ou plagier les articles traduits est interdit sauf mention contraire.

Le plus grand moment de base de l'IA

Intermédiaire3/31/2025, 7:48:09 AM
Les monopoles de données sont arrivés et affament les petits. En même temps, la qualité du web ouvert est en chute libre - les informations sont délibérément empoisonnées et les bêtises générées par l'IA polluent le corpus.

Le plus grand obstacle de l'IA n'est pas la conception du modèle ou les GPU - c'est les données. Et en ce moment, ces données sont verrouillées et brouillées. Les grandes plateformes Web2 (Reddit, X, Google, etc.) gardent jalousement leurs informations derrière des murs payants ou des CGU strictes. Les monopoles de données sont arrivés, et ils affament les petits acteurs. En même temps, la qualité du web ouvert est en chute libre - les informations sont délibérément empoisonnées et les futilités générées par l'IA polluent le corpus. C'est la tempête parfaite: l'IA a besoin de données, mais le puits est gardé et contaminé.

*Voir la version complète de "Le plus grand moment de base de l'IA" surPortail de recherche des Quatre Piliers

1. Le pari contraire de Grass : décentraliser le grattoir, tokeniser le pipeline

Entrer @getgrass_io, un protocole de web scraping décentralisé qui renverse ce script. Pensez à des millions d'appareils quotidiens (PC maintenant, téléphones bientôt) agissant comme de mini-web crawlers, raclant l'internet 24/7 à la recherche de données publiques. Grass transforme le contenu web brut en ensembles de données structurées prêtes pour l'IA, et le fait via l'économie cryptographique : les utilisateurs gagnent des récompenses pour contribuer à la bande passante et au calcul. C'est comme un minage web participatif, mais pour l'information au lieu du Bitcoin.

2. La Swarm Is Already Alive

L’herbe est déjà en service à grande échelle. Plus de 3 millions de nœuds dans le monde sont connectés au réseau, et ils récupèrent collectivement plus de 1 500 To de données par jour. En utilisant d’innombrables adresses IP résidentielles, Grass peut collecter des données à partir de sites sans déclencher les alarmes anti-scraping habituelles (plus besoin d’être banni d’IP pour avoir trop exploré). Il s’agit essentiellement de remplacer les fermes de données centralisées géantes par un essaim d'« abeilles de données » individuelles – plus difficiles à balayer et faciles à mettre à l’échelle.

Pourquoi cela importe-t-il? Parce que cela ouvre les monopoles de données. Au lieu que quelques gros acteurs stockent des données ou facturent des frais absurdes, toute startup en IA ou chercheur peut accéder au flux de données de Grass. Imaginez extraire le contenu de Reddit ou Twitter pour votre modèle d'IA sans avoir à mendier un accès API ou à débourser des millions - Grass rend cela plausible. C'est l'alternative sans permission pour l'ère de l'IA: si les données sont le nouveau pétrole, Grass construit un réseau de plates-formes pétrolières décentralisées où tout le monde peut forer.

3. Vérification des données via des preuves ZK

Le contrôle de la qualité est l'autre moitié de l'équation, et Grass a une réponse astucieuse: des preuves de connaissance zéro et une vérification sur chaîne. Chaque donnée récupérée peut être estampillée d'une preuve cryptographique (un ZK-SNARK) attestant de son origine et de son intégrité, enregistrée sur la propre blockchain de Grass (un rollup souverain qu'ils construisent à cet effet). En termes simples: vous obtenez un reçu pour chaque extrait web indiquant "cela provient de la Source X à l'heure Y et n'a pas été altéré." C'est énorme pour lutter contre l'empoisonnement des données et les déchets. Lorsque le pipeline est vérifiable, vous pouvez filtrer les données suspectes ou corrompues - ou du moins retracer les problèmes après coup. Dans un monde où l'IA pourrait accidentellement s'entraîner sur des ordures générées par l'IA, disposer d'un tampon d'authenticité pour les données est un changement de jeu.

4. Mise à l'échelle vers des pétabits par jour et au-delà

Parlons de la pile technologique : Grass a commencé sur Solana (pour la vitesse), mais même Solana ne peut pas gérer le volume ici. Ainsi, l'équipe envisage de déployer un rollup souverain (pensez-y comme leur propre blockchain L2) pour gérer le débit important d'une chaîne principale, tout en ancrant toujours la confiance sur une couche de base.

Ils appellent la mise à niveau majeure actuelle Sion, et elle frappe déjà comme un train de marchandises. Grass gère maintenant plus de 1 500 To de données par jour - non pas comme un objectif, mais comme une mesure en direct. Sion (Phases 1 & 2) a suralimenté le réseau, débloquant un débit échelonné en pétaoctets et permettant le grattage multimodal en temps réel : pas seulement du texte, mais aussi des images et des vidéos, en streaming à grande échelle. Fondamentalement, Grass est passé d'un régime alimentaire textuel à un buffet à volonté de données web. Pour les experts en IA qui pensent au-delà du texte (bonjour les modèles de vision, GPT-4, etc.), c'est une grande affaire.

5. Comment $GRASS alimente le volant d'inertie

Maintenant, comment Grass incite-t-il ce réseau tentaculaire? Entrez dans l'économie des jetons. En ce moment, les utilisateurs gagnent des "points Grass" pour exécuter des nœuds - essentiellement un espace réservé pour la vraie chose. Un véritable $GRASSjeton est à l'horizon, et c'est là que la crypto rencontre l'économie de l'IA. L'utilité du jeton liera tout le système ensemble: les entreprises d'IA ou les chercheurs dépenseront$GRASSdemander des données (comme payer par appel API, mais décentralisé), et les opérateurs de noeuds gagneront$GRASSpour répondre à ces demandes (récupération et livraison de données). Les validateurs du réseau vont probablement miser des jetons pour garantir un comportement honnête et une livraison de données de haute qualité (les mauvais acteurs pourraient être réduits, les bons acteurs récompensés). En bref, $GRASSvas graisser les rouages, en alignant les incitations entre les consommateurs de données et les fournisseurs.

6. Infra décentralisée avec un vrai PMF

De manière cruciale, l'approche de Grass atténue quelques problèmes existentiels dans l'IA :

  • Inégalité d'accès aux données : Aujourd'hui, seuls les Googles et OpenAIs peuvent parcourir l'ensemble du web (et même eux se font poursuivre en justice ou bloquer). Grass niveau le terrain de jeu en rendant les données à l'échelle du web accessibles à quiconque peut payer un peu de jeton - une barrière beaucoup plus basse.
  • Qualité des données et empoisonnement : Grâce aux preuves on-chain et (éventuellement) à la validation communautaire, il est beaucoup plus difficile pour quelqu'un d'introduire des données toxiques dans un ensemble d'entraînement sans être remarqué. Grass peut signaler ou exclure du contenu qui ne correspond pas à son empreinte on-chain. Avec le temps, la nature distribuée du réseau pourrait même aider à identifier du contenu généré par l'IA et l'empêcher de renforcer la boucle (imaginez filtrer les articles d'actualité qui ne sont que des sorties de ChatGPT).
  • Résistance à la censure : parce que Gate fonctionne via des milliers de nœuds indépendants, aucun interrupteur unique ne peut couper le flux d'informations. C'est l'effet Streisand rencontre la blockchain - essayez de bloquer les données ici, et elles contournent simplement. Pour les développeurs IA, cela signifie des pipelines plus robustes.

7. Final Alpha: Ne construisez pas des boîtes noires, construisez une IA de base

Pour être clair, Grass en est encore à ses débuts. Il est en version bêta, certaines parties sont encore centralisées (il y a actuellement un coordinateur central, qui sera décentralisé plus tard), et le stockage/nettoyage des données est côté client pour le moment. Mais la trajectoire est définie. Le réseau explose en taille (atteignant des niveaux record en termes de nœuds et de volume de données cette année), et chaque mise à niveau (comme Sion) le rapproche d'un protocole pleinement opérationnel et autoportant.

La vision est audacieuse: Grass veut être la couche de données pour l'IA décentralisée. Imaginez un marché ouvert où n'importe qui peut obtenir des données d'entraînement de haute qualité à la demande, avec une confiance cryptographique intégrée. Pas de gardiens, pas de loyers géants payés à Reddit ou Google, et moins de soucis concernant l'effondrement des modèles à force de se mordre la queue. C'est un torrent de données pour l'IA détenu par la communauté et sécurisé par la cryptographie.

Dans un monde crypto avide de réelle utilité, Grass se démarque comme un projet fusionnant deux méga-tendances (IA & DePIN) avec un produit réel dans la nature. Il est conscient des memes par son nom mais sérieux dans son exécution. Si elle réussit, Grass pourrait transformer le paysage de l'IA - transformant le web lui-même en une source de données vivante et respirante ouverte à tous. Pour les VC, les constructeurs et les lurkers de Crypto Twitter, gardez un œil sur celui-ci. Ce n'est pas souvent que l'on voit une nouvelle couche d'infrastructure internet être construite en temps réel, alimentée par un jeton et un rêve d'information fluide.

Avertissement :

  1. Cet article est repris de [Ponyo : : FP]. Tous les droits d'auteur appartiennent à l'auteur original [Ponyo : : FP]. Si des objections sont soulevées concernant cette reproduction, veuillez contacter le Gate Learnéquipe, et ils s'en occuperont rapidement.
  2. Responsabilité de non-responsabilité : Les points de vue et opinions exprimés dans cet article sont uniquement ceux de l'auteur et ne constituent aucun conseil en investissement.
  3. L'équipe Gate Learn effectue des traductions de l'article dans d'autres langues. Copier, distribuer ou plagier les articles traduits est interdit sauf mention contraire.
即刻开始交易
注册并交易即可获得
$100
和价值
$5500
理财体验金奖励!