Hace un mes, YZi Labs anunció su inversión en Vana, con el fundador de Binance CZ uniéndose como asesor, solidificando la posición líder de Vana en el sector de datos de IA. Cuatro días después, durante una AMA con Vana, CZ afirmó que los datos son el combustible principal para la IA, los datos públicos se han agotado y los datos privados permanecen sin explotar. Expresó optimismo sobre el ajuste del producto-mercado (PMF) de Vana y el crecimiento de usuarios.
¿Por qué YZi Labs, Coinbase Ventures y Paradigm han invertido en Vana? ¿Por qué CZ está optimista sobre el desarrollo de Vana?
Este informe analiza sistemáticamente los desafíos de los datos de IA, la propuesta de valor principal de Vana, las aplicaciones prácticas y la trayectoria de crecimiento futuro, revelando cómo Vana se está convirtiendo en una infraestructura crítica para el ecosistema de IA.
Según los datos de PitchBook, la industria de la IA en los Estados Unidos atrajo casi 20 mil millones en inversiones en el primer trimestre de 2025. Para 2024, las startups de IA representaron un tercio del capital de riesgo global, totalizando 131.5 mil millones, con casi una cuarta parte de las nuevas empresas enfocadas en la IA. Los datos de Statista confirman aún más este crecimiento explosivo: la financiación de capital de riesgo para la IA y el aprendizaje automático se disparó de 670 millones en 2011 a 36 mil millones en 2020, un aumento de 50 veces. Esta tendencia indica claramente que la IA se ha convertido en la elección compartida del capital inteligente y los principales emprendedores.
Sin embargo, la arquitectura fundamental de la IA —“datos + modelos + cálculo”— enfrenta cuellos de botella estructurales. El impulsor principal del rendimiento del modelo de IA no es la potencia de cálculo ni los avances algorítmicos, sino la calidad y escala de los conjuntos de datos de entrenamiento. Los modelos de lenguaje grandes actuales están llegando a un punto crítico de agotamiento de datos. Llama 3 de Meta fue entrenado con aproximadamente 15 billones de tokens, agotando casi todos los datos de alta calidad de internet público. A pesar del gran volumen de datos de internet público, solo representa la punta del iceberg. Un hecho ampliamente pasado por alto es que los datos de alto valor están en su mayoría bloqueados detrás de sistemas propietarios que requieren acceso autorizado. Los datos de internet público representan menos del 0,1% de todos los datos. Este problema trasciende la capacidad de la industria de IA para resolverlo por sí sola y requiere que la tecnología blockchain redefina las relaciones de producción de datos, establezca nuevos mecanismos de incentivos y catalice la emergencia de datos de alta calidad a escala.
Por otro lado, hoy en día, la mayoría de los datos están controlados por empresas tecnológicas de la Web2 dentro de ecosistemas cerrados. El desarrollo de la IA enfrenta el desafío de las barreras de datos, una barrera que existe porque estas empresas reconocen el inmenso valor de los datos. Los modelos de IA de alta calidad generan retornos económicos significativos, por ejemplo, los ingresos anuales de OpenAI han alcanzado aproximadamente $3.4 mil millones. Construir modelos de IA superiores requiere vastas cantidades de datos, a menudo a altos costos de adquisición.
Por ejemplo, Reddit gana alrededor de $200 millones anualmente vendiendo datos, cobra entre US$1 y US$2 por imagen, y las transacciones de datos de noticias de Apple ascienden a US$50 millones. La propiedad de datos ha evolucionado desde una simple preferencia de privacidad hasta convertirse en un importante problema económico. En un mundo donde los modelos de IA impulsan gran parte de la economía, la propiedad de datos equivale a poseer acciones en futuros modelos de IA.
A medida que la comercialización de datos se vuelve más frecuente, acceder a los datos se vuelve cada vez más difícil. Muchas plataformas están ajustando sus términos de servicio y políticas de API para restringir el acceso de desarrolladores externos. Por ejemplo, Reddit y Stack Overflow han modificado las reglas de la API, lo que dificulta más la adquisición de datos. Esta tendencia se está expandiendo, con plataformas ricas en datos moviéndose hacia una mayor exclusividad.
Sin embargo, un grupo conserva libre acceso a estos datos: los propios usuarios. Muchas personas no son conscientes de que, legalmente, conservan la plena propiedad de sus datos. Así como estacionar un coche en un estacionamiento no otorga derechos sobre el vehículo, los datos de los usuarios almacenados en plataformas sociales siguen siendo su propiedad.
Al registrarse, los usuarios suelen marcar casillas que permiten a las plataformas 'utilizar sus datos', lo que otorga a las plataformas la autorización para operar servicios pero no ceder la propiedad. Los usuarios pueden solicitar sus datos en cualquier momento. Incluso si las plataformas restringen el acceso a la API para los desarrolladores, los usuarios individuales todavía pueden recuperar legalmente sus datos. Por ejemplo, Instagram permite a los usuarios exportar datos de la cuenta, incluidas fotos, comentarios e incluso etiquetas de marketing generadas por IA. En 23 and Me, los usuarios pueden solicitar sus datos genéticos, aunque el proceso puede no ser intuitivo.
Globalmente, las regulaciones están mejorando para garantizar que los usuarios puedan recuperar sus datos. A medida que el valor de los datos crece, los usuarios deben reconocer y ejercer sus derechos de propiedad.
Las empresas tecnológicas están construyendo sistemas cerrados para proteger sus valiosos activos de datos. La misión de VANA es desbloquear estos datos y devolver el control a los usuarios, permitiendo la soberanía de datos.
En otras palabras, los usuarios pueden extraer sus datos de diversas plataformas y crear conjuntos de datos superiores a las ofertas de cualquier plataforma existente.
El marco de VANA se basa en dos conceptos fundamentales:
Cuando los desarrolladores pagan para acceder a los datos, los contribuyentes reciben tokens de gobernanza proporcionales a su aportación. Esto permite a los contribuyentes ganar recompensas continuas y participar en la toma de decisiones, remodelando el precio y la eficiencia del mercado de datos.
DataDAO es un mercado de datos descentralizado dentro del ecosistema VANA, que permite a los usuarios contribuir, tokenizar y utilizar datos. Los usuarios pueden seleccionar piscinas de minería de datos adecuadas (por ejemplo, datos de fitness, datos de investigación) para contribuir con sus datos. Los datos contribuidos pasan por una validación a través del mecanismo de Prueba de Contribución de Vana, que evalúa su calidad y valor para garantizar una compensación justa para los contribuyentes.
Una vez verificados, los datos se tokenizan en activos digitales que pueden ser negociados o utilizados para el entrenamiento de IA, mientras los contribuyentes retienen el control sobre su uso. Cada vez que se utiliza los datos, los contribuyentes reciben recompensas en tokens y derechos de gobernanza, lo que les permite beneficiarse económicamente e influir en la dirección del grupo de datos. Al agregar conjuntos de datos diversos, DataDAO crea un mercado de datos líquidos, facilitando la circulación segura y eficiente de datos dentro del ecosistema VANA.
En el núcleo de DataDAO se encuentra el Data Liquidity Pool (DLP), una colección de conjuntos de datos validados vinculados a tokens. Los DLP son gestionados por miembros de DataDAO, que tienen derechos de gobernanza. Cada DLP define claramente su estructura de datos y sus estándares de contribución. Por ejemplo, Sleep.com, un DataDAO centrado en el sueño, ha establecido un esquema de datos bien definido para garantizar que todos los datos en cadena estén estructurados y sean utilizables. El valor de los datos no solo radica en su volumen, sino también en su estructura y accesibilidad.
DataDAO pone un fuerte énfasis en la autenticidad y validez de los datos. Actualmente, la mayoría de los DataDAOs utilizan Entornos de Ejecución Confiables (TEEs) para ejecutar scripts de Python para la validación de datos, asegurando la calidad y preservando la privacidad. Por ejemplo, Amazon DataDAO emplea extensiones de navegador para generar pruebas de calidad de datos. Todos los DataDAOs revelan públicamente sus mecanismos de Prueba de Contribución, lo que permite a los usuarios comprender cómo se asegura la calidad de los datos.
Los 16 principales DLP en el ecosistema de VANA reciben incentivos adicionales, lo que permite a los usuarios ganar recompensas contribuyendo datos de alta calidad. Las recompensas se distribuyen en función de métricas como la frecuencia de acceso a los datos, la calidad y la rentabilidad. Actualmente, Reddit DataDAO es el más grande, atrayendo a alrededor de 140,000 usuarios y capacitando con éxito un modelo de IA de propiedad comunitaria. El DataDAO de DLP Labs permite a los conductores conectar sus cuentas de DIMO_Network, compartir datos de vehículos para ganar recompensas y avanzar en la innovación de IA en el sector automotriz. Mientras tanto, 23andWE tiene como objetivo adquirir 23andMe para evitar que los datos genéticos sean explotados.
DataDAO representa un enfoque innovador para la gestión de datos, empoderando a individuos para tomar control de sus datos y monetizarlos a través de la tokenización. Este ecosistema en rápida evolución introduce más posibilidades abiertas y democráticas para la gobernanza de datos y el entrenamiento de IA.
Basándose en la base de los pools de liquidez de datos, DeFi se está aplicando gradualmente al ámbito de los tokens de datos. Los pools de liquidez de datos sirven como la capa fundamental de todo el ecosistema, sobre la cual se pueden construir diversas aplicaciones DeFi utilizando tokens de datos.
Actualmente, han surgido algunas aplicaciones tempranas en el ecosistema de Data DeFi. Por ejemplo, intercambios descentralizados como @VanaDataDexy@flur_protocolpermitir a los usuarios comerciar con tokens de datos y rastrear la dinámica del mercado para tokens de datos específicos. La emergencia de estas plataformas ha facilitado el libre flujo de activos de datos y ha revitalizado el mercado de datos.
Vale la pena señalar que la mayoría de los mecanismos de recompensa de DLP depositan principalmente las recompensas en el tesoro de DLP en lugar de quemar directamente los tokens de datos o afectar su oferta y demanda. Sin embargo, con la introducción de la actualización VRC-13, este mecanismo ha evolucionado. El nuevo modelo introduce un enfoque más impulsado por el mercado: mediante la incentivación de recompensas VANA para promover la tokenización de datos, que luego se inyectan en los pools de DEX para mejorar el comercio de tokens de datos y activar aún más el ecosistema DeFi.
Mirando hacia adelante, las funcionalidades actualmente alcanzables en el espacio DeFi, como préstamos, staking, minería de liquidez e incluso seguros, pueden ser introducidas en el mercado de tokens de datos, creando escenarios de aplicación completamente nuevos.
Desde la perspectiva de las industrias tradicionales de la Web2, al igual que las empresas compran futuros de petróleo para cubrirse contra las fluctuaciones de precios, el mercado de datos puede desarrollar futuros de datos, lo que permite a los usuarios fijar los precios futuros de los conjuntos de datos por adelantado y reducir la incertidumbre en los costos de adquisición.
Algunas firmas comerciales ya han comenzado a tratar los datos como una nueva clase de activos, investigando métodos de valoración como evaluar el valor de tokens de datos específicos, la probabilidad de uso en ventas y el análisis del ciclo de vida. Estos factores influyen directamente en el precio de los tokens de datos y la liquidez del mercado, dejando un amplio margen para la innovación.
Actualmente, acceder a conjuntos de datos en la mainnet sigue siendo relativamente engorroso. Los usuarios deben enviar solicitudes detalladas especificando sus necesidades, cantidades de pago y código de proyecto, y luego esperar la aprobación antes de obtener acceso. Si bien esto garantiza transparencia y estandarización, crea fricciones operativas.
Para mejorar la eficiencia, Vana está desarrollando métodos de acceso a datos más eficientes que permitan el acceso automatizado a la API y la recuperación directa de datos en varios DataDAOs. Por ejemplo, en el futuro, los usuarios podrían combinar datos de sueño con datos comerciales de Coinbase o Binance para analizar los patrones de sueño de los tenedores de tokens específicos y descubrir nuevas perspectivas de mercado.
Además, Vana está avanzando una nueva propuesta que implementa una relación estándar 80-20 para quemar tokens de datos y VANA a cambio de derechos de acceso a datos.
Vana también ha desarrollado una nueva interfaz de consulta de datos que simplifica significativamente el proceso de acceso a los datos. Los usuarios pueden autenticarse a través del inicio de sesión de la billetera y generar firmas digitales para verificar sus permisos de acceso. Dado que los grupos de liquidez de datos (DLP) registran formatos de datos, los usuarios pueden comprender claramente las estructuras de datos y recuperar la información necesaria mediante consultas SQL. Durante este proceso, los usuarios pueden recibir primero muestras de datos sintéticos para probar y verificar la precisión de las consultas. Cuando se trabaja con datos reales, todos los cálculos se realizan dentro de entornos de ejecución de confianza (TEE) para garantizar la seguridad de los datos. Este mecanismo previene eficazmente el "problema de los datos de doble uso" (en el que los usuarios pueden revender los datos comprados), protegiendo así el valor económico de los datos y garantizando el desarrollo sostenible del mercado de datos.
Los datos están emergiendo rápidamente como el activo central de la era digital. Si bien las tecnologías de recopilación y almacenamiento de datos han alcanzado una madurez considerable, el verdadero desafío radica en evaluar eficazmente la calidad de los datos, maximizar su valor y garantizar la protección de la privacidad. Vana aborda elegantemente este desafío a través de su innovador mecanismo de incentivos: los usuarios pueden apostar fichas VANA para apoyar DataDAOs de alto valor mientras ganan recompensas correspondientes, creando un ciclo virtuoso de creación de valor.
El desarrollo de la inteligencia artificial ha alcanzado la “muralla de datos” - los recursos de datos públicos de alta calidad están cerca de agotarse. Los futuros avances en IA dependerán inevitablemente de acceder y utilizar de manera efectiva datos privados de alto valor, como registros de salud personales, datos de uso de dispositivos inteligentes y videos de conducción de Tesla como recursos potenciales de entrenamiento.
Existe una paradoja en el valor de los datos: los datos mantienen su valor a través de la exclusividad, pero se convierten en mercancía y se deprecian una vez que están ampliamente disponibles. A medida que los modelos de IA se convierten en mercancía, la ventaja competitiva a largo plazo vendrá de controlar conjuntos de datos únicos que permitan un rendimiento superior en dominios especializados. Una vez que los datos se hacen públicos, la competencia de precios emerge casi inmediatamente, causando una rápida erosión del valor.
El DataDAO de Vana aprovecha los Entornos de Ejecución Confiables (TEEs) para permitir la transferencia de datos privados de alto valor mientras se preserva la privacidad. Este avance amplía el alcance de los activos de datos valiosos desde conjuntos de datos públicos limitados hasta el vasto mundo de los datos privados, abriendo nuevas posibilidades para el avance de la IA.
Los datos muestran una curva de valor distintiva: los puntos de datos individuales tienen un valor insignificante, pero cuando se agregan a una masa crítica, su valor crece exponencialmente. Esta característica presenta desafíos significativos para la monetización de datos, ya que los rendimientos sustanciales solo se materializan después de formar conjuntos de datos colectivos.
El mecanismo DataDAO de Vana proporciona una solución innovadora a este dilema. Al agrupar datos similares, los DataDAOs crean poder de negociación colectiva para los contribuyentes. Considere a los propietarios de Tesla: si todos los propietarios comparten colectivamente datos de conducción a través de un DataDAO, obtienen una fuerte influencia en los precios con cualquier comprador potencial. En contraste, si los propietarios intentan monetizar individualmente sus datos, inevitablemente conduce a una competencia de precios donde los compradores pueden simplemente adquirir suficientes muestras de los postores más bajos.
Los conjuntos de datos estructurados y verificados de alta calidad (como los datos de conducción de Tesla autenticados) tienen un valor de mercado premium, y el marco de Vana permite la plena realización de este valor.
El aspecto más poderoso de DataDAOs es su capacidad para lograr la agregación de datos entre plataformas, algo casi imposible en los ecosistemas de jardines amurallados de hoy en día. Imagina que los investigadores necesitan acceso a los mensajes combinados de Facebook de un usuario, el historial de iMessage y el contenido de Google Docs. El enfoque tradicional requeriría la cooperación entre Facebook, Apple y Google, plataformas que no tienen incentivos para integrar los datos de los usuarios (lo que debilitaría sus fosos de datos) ni la autorización regulatoria para hacerlo.
Los DataDAOs eluden elegantemente este obstáculo a través de la integración de datos liderada por el usuario, desbloqueando el valor de los datos entre plataformas y creando oportunidades sin precedentes para el entrenamiento e investigación de IA.
La visión de Vana se extiende mucho más allá de la mera innovación tecnológica; está abriendo camino a un paradigma completamente nuevo de participación económica. Bajo este modelo, los usuarios pueden participar en la economía digital sin los requisitos de capital tradicionales, ya que poseen el recurso más valioso: sus datos personales. Los usuarios no necesitan aportar capital financiero; compartir sus datos se convierte en su capital. Los DataDAOs proporcionan a los usuarios de Web3 flujos de ingresos pasivos derivados de sus datos personales únicos, lo que reduce significativamente la barrera de entrada para participar en la economía digital.
Este modelo podría reestructurar fundamentalmente cómo se distribuye el valor de los avances de la IA. En lugar de que los beneficios fluyan principalmente a las grandes corporaciones tecnológicas, la propiedad de datos y los mecanismos de gobernanza de Vana permiten una amplia participación en la economía de la IA. Los indicadores tempranos muestran una fuerte resonancia con este enfoque; más de 300 DataDAOs ya están en desarrollo en testnets.
Mirando hacia adelante 3-5 años, podríamos presenciar el surgimiento de modelos de IA totalmente gobernados por usuarios construidos por 100 millones de contribuyentes de datos, modelos que podrían superar a los principales sistemas de IA centralizados de hoy en día. Estos modelos de propiedad comunitaria crean un mayor compromiso y conexiones de los usuarios. La soberanía de los datos empodera a los usuarios para apoyar selectivamente el desarrollo ético de la IA mientras niegan el acceso a empresas no éticas.
La inteligencia artificial descentralizada proporciona un marco más democrático en el que la sociedad determina colectivamente lo que la IA debe aprender y creer, en lugar de dejar estas decisiones en manos de un puñado de corporaciones. La propiedad de los datos de los usuarios se traduce no solo en beneficios económicos, sino también en un control sustantivo sobre el comportamiento del modelo de IA, incluida la atención de problemas críticos como las políticas de moderación de contenido.
A nivel comercial, Vana se compromete a construir una cadena de valor de datos integral que abarca todo el proceso, desde la agregación de datos y el entrenamiento de modelos de IA hasta la venta de datos. Actualmente, el mercado de datos está monopolizado por un puñado de plataformas y corredores de datos. Vana tiene como objetivo abordar esta ineficiencia creando un ecosistema de comercio de datos más justo.
Vana es más que una nueva plataforma, representa un cambio fundamental en la propiedad de los datos y el desarrollo de la IA. Al permitir a los usuarios participar en la creación de valor colectivo manteniendo la soberanía sobre sus datos, Vana está sentando las bases para un futuro de IA más equitativo e innovador.
En el mercado actual de la IA, que está lleno de hype conceptual, Vana destaca con sus mecanismos innovadores que abordan directamente los desafíos fundamentales de la industria. Tiene el potencial de convertirse en una fuerza pivotal en la formación de la trayectoria futura de la IA.
Este artículo es reproducido de [ Biteye], el derecho de autor pertenece al autor original [Biteye], si tiene alguna objeción a la reimpresión, por favor póngase en contacto con el Gate Learnequipo, y el equipo lo manejará tan pronto como sea posible de acuerdo con los procedimientos relevantes.
Descargo de responsabilidad: Las opiniones expresadas en este artículo representan solo las opiniones personales del autor y no constituyen ningún consejo de inversión.
Otras versiones del artículo en otros idiomas son traducidas por el equipo de Gate Learn. El artículo traducido no puede ser copiado, distribuido o plagiado sin mencionar Gate.Gate.io.
Hace un mes, YZi Labs anunció su inversión en Vana, con el fundador de Binance CZ uniéndose como asesor, solidificando la posición líder de Vana en el sector de datos de IA. Cuatro días después, durante una AMA con Vana, CZ afirmó que los datos son el combustible principal para la IA, los datos públicos se han agotado y los datos privados permanecen sin explotar. Expresó optimismo sobre el ajuste del producto-mercado (PMF) de Vana y el crecimiento de usuarios.
¿Por qué YZi Labs, Coinbase Ventures y Paradigm han invertido en Vana? ¿Por qué CZ está optimista sobre el desarrollo de Vana?
Este informe analiza sistemáticamente los desafíos de los datos de IA, la propuesta de valor principal de Vana, las aplicaciones prácticas y la trayectoria de crecimiento futuro, revelando cómo Vana se está convirtiendo en una infraestructura crítica para el ecosistema de IA.
Según los datos de PitchBook, la industria de la IA en los Estados Unidos atrajo casi 20 mil millones en inversiones en el primer trimestre de 2025. Para 2024, las startups de IA representaron un tercio del capital de riesgo global, totalizando 131.5 mil millones, con casi una cuarta parte de las nuevas empresas enfocadas en la IA. Los datos de Statista confirman aún más este crecimiento explosivo: la financiación de capital de riesgo para la IA y el aprendizaje automático se disparó de 670 millones en 2011 a 36 mil millones en 2020, un aumento de 50 veces. Esta tendencia indica claramente que la IA se ha convertido en la elección compartida del capital inteligente y los principales emprendedores.
Sin embargo, la arquitectura fundamental de la IA —“datos + modelos + cálculo”— enfrenta cuellos de botella estructurales. El impulsor principal del rendimiento del modelo de IA no es la potencia de cálculo ni los avances algorítmicos, sino la calidad y escala de los conjuntos de datos de entrenamiento. Los modelos de lenguaje grandes actuales están llegando a un punto crítico de agotamiento de datos. Llama 3 de Meta fue entrenado con aproximadamente 15 billones de tokens, agotando casi todos los datos de alta calidad de internet público. A pesar del gran volumen de datos de internet público, solo representa la punta del iceberg. Un hecho ampliamente pasado por alto es que los datos de alto valor están en su mayoría bloqueados detrás de sistemas propietarios que requieren acceso autorizado. Los datos de internet público representan menos del 0,1% de todos los datos. Este problema trasciende la capacidad de la industria de IA para resolverlo por sí sola y requiere que la tecnología blockchain redefina las relaciones de producción de datos, establezca nuevos mecanismos de incentivos y catalice la emergencia de datos de alta calidad a escala.
Por otro lado, hoy en día, la mayoría de los datos están controlados por empresas tecnológicas de la Web2 dentro de ecosistemas cerrados. El desarrollo de la IA enfrenta el desafío de las barreras de datos, una barrera que existe porque estas empresas reconocen el inmenso valor de los datos. Los modelos de IA de alta calidad generan retornos económicos significativos, por ejemplo, los ingresos anuales de OpenAI han alcanzado aproximadamente $3.4 mil millones. Construir modelos de IA superiores requiere vastas cantidades de datos, a menudo a altos costos de adquisición.
Por ejemplo, Reddit gana alrededor de $200 millones anualmente vendiendo datos, cobra entre US$1 y US$2 por imagen, y las transacciones de datos de noticias de Apple ascienden a US$50 millones. La propiedad de datos ha evolucionado desde una simple preferencia de privacidad hasta convertirse en un importante problema económico. En un mundo donde los modelos de IA impulsan gran parte de la economía, la propiedad de datos equivale a poseer acciones en futuros modelos de IA.
A medida que la comercialización de datos se vuelve más frecuente, acceder a los datos se vuelve cada vez más difícil. Muchas plataformas están ajustando sus términos de servicio y políticas de API para restringir el acceso de desarrolladores externos. Por ejemplo, Reddit y Stack Overflow han modificado las reglas de la API, lo que dificulta más la adquisición de datos. Esta tendencia se está expandiendo, con plataformas ricas en datos moviéndose hacia una mayor exclusividad.
Sin embargo, un grupo conserva libre acceso a estos datos: los propios usuarios. Muchas personas no son conscientes de que, legalmente, conservan la plena propiedad de sus datos. Así como estacionar un coche en un estacionamiento no otorga derechos sobre el vehículo, los datos de los usuarios almacenados en plataformas sociales siguen siendo su propiedad.
Al registrarse, los usuarios suelen marcar casillas que permiten a las plataformas 'utilizar sus datos', lo que otorga a las plataformas la autorización para operar servicios pero no ceder la propiedad. Los usuarios pueden solicitar sus datos en cualquier momento. Incluso si las plataformas restringen el acceso a la API para los desarrolladores, los usuarios individuales todavía pueden recuperar legalmente sus datos. Por ejemplo, Instagram permite a los usuarios exportar datos de la cuenta, incluidas fotos, comentarios e incluso etiquetas de marketing generadas por IA. En 23 and Me, los usuarios pueden solicitar sus datos genéticos, aunque el proceso puede no ser intuitivo.
Globalmente, las regulaciones están mejorando para garantizar que los usuarios puedan recuperar sus datos. A medida que el valor de los datos crece, los usuarios deben reconocer y ejercer sus derechos de propiedad.
Las empresas tecnológicas están construyendo sistemas cerrados para proteger sus valiosos activos de datos. La misión de VANA es desbloquear estos datos y devolver el control a los usuarios, permitiendo la soberanía de datos.
En otras palabras, los usuarios pueden extraer sus datos de diversas plataformas y crear conjuntos de datos superiores a las ofertas de cualquier plataforma existente.
El marco de VANA se basa en dos conceptos fundamentales:
Cuando los desarrolladores pagan para acceder a los datos, los contribuyentes reciben tokens de gobernanza proporcionales a su aportación. Esto permite a los contribuyentes ganar recompensas continuas y participar en la toma de decisiones, remodelando el precio y la eficiencia del mercado de datos.
DataDAO es un mercado de datos descentralizado dentro del ecosistema VANA, que permite a los usuarios contribuir, tokenizar y utilizar datos. Los usuarios pueden seleccionar piscinas de minería de datos adecuadas (por ejemplo, datos de fitness, datos de investigación) para contribuir con sus datos. Los datos contribuidos pasan por una validación a través del mecanismo de Prueba de Contribución de Vana, que evalúa su calidad y valor para garantizar una compensación justa para los contribuyentes.
Una vez verificados, los datos se tokenizan en activos digitales que pueden ser negociados o utilizados para el entrenamiento de IA, mientras los contribuyentes retienen el control sobre su uso. Cada vez que se utiliza los datos, los contribuyentes reciben recompensas en tokens y derechos de gobernanza, lo que les permite beneficiarse económicamente e influir en la dirección del grupo de datos. Al agregar conjuntos de datos diversos, DataDAO crea un mercado de datos líquidos, facilitando la circulación segura y eficiente de datos dentro del ecosistema VANA.
En el núcleo de DataDAO se encuentra el Data Liquidity Pool (DLP), una colección de conjuntos de datos validados vinculados a tokens. Los DLP son gestionados por miembros de DataDAO, que tienen derechos de gobernanza. Cada DLP define claramente su estructura de datos y sus estándares de contribución. Por ejemplo, Sleep.com, un DataDAO centrado en el sueño, ha establecido un esquema de datos bien definido para garantizar que todos los datos en cadena estén estructurados y sean utilizables. El valor de los datos no solo radica en su volumen, sino también en su estructura y accesibilidad.
DataDAO pone un fuerte énfasis en la autenticidad y validez de los datos. Actualmente, la mayoría de los DataDAOs utilizan Entornos de Ejecución Confiables (TEEs) para ejecutar scripts de Python para la validación de datos, asegurando la calidad y preservando la privacidad. Por ejemplo, Amazon DataDAO emplea extensiones de navegador para generar pruebas de calidad de datos. Todos los DataDAOs revelan públicamente sus mecanismos de Prueba de Contribución, lo que permite a los usuarios comprender cómo se asegura la calidad de los datos.
Los 16 principales DLP en el ecosistema de VANA reciben incentivos adicionales, lo que permite a los usuarios ganar recompensas contribuyendo datos de alta calidad. Las recompensas se distribuyen en función de métricas como la frecuencia de acceso a los datos, la calidad y la rentabilidad. Actualmente, Reddit DataDAO es el más grande, atrayendo a alrededor de 140,000 usuarios y capacitando con éxito un modelo de IA de propiedad comunitaria. El DataDAO de DLP Labs permite a los conductores conectar sus cuentas de DIMO_Network, compartir datos de vehículos para ganar recompensas y avanzar en la innovación de IA en el sector automotriz. Mientras tanto, 23andWE tiene como objetivo adquirir 23andMe para evitar que los datos genéticos sean explotados.
DataDAO representa un enfoque innovador para la gestión de datos, empoderando a individuos para tomar control de sus datos y monetizarlos a través de la tokenización. Este ecosistema en rápida evolución introduce más posibilidades abiertas y democráticas para la gobernanza de datos y el entrenamiento de IA.
Basándose en la base de los pools de liquidez de datos, DeFi se está aplicando gradualmente al ámbito de los tokens de datos. Los pools de liquidez de datos sirven como la capa fundamental de todo el ecosistema, sobre la cual se pueden construir diversas aplicaciones DeFi utilizando tokens de datos.
Actualmente, han surgido algunas aplicaciones tempranas en el ecosistema de Data DeFi. Por ejemplo, intercambios descentralizados como @VanaDataDexy@flur_protocolpermitir a los usuarios comerciar con tokens de datos y rastrear la dinámica del mercado para tokens de datos específicos. La emergencia de estas plataformas ha facilitado el libre flujo de activos de datos y ha revitalizado el mercado de datos.
Vale la pena señalar que la mayoría de los mecanismos de recompensa de DLP depositan principalmente las recompensas en el tesoro de DLP en lugar de quemar directamente los tokens de datos o afectar su oferta y demanda. Sin embargo, con la introducción de la actualización VRC-13, este mecanismo ha evolucionado. El nuevo modelo introduce un enfoque más impulsado por el mercado: mediante la incentivación de recompensas VANA para promover la tokenización de datos, que luego se inyectan en los pools de DEX para mejorar el comercio de tokens de datos y activar aún más el ecosistema DeFi.
Mirando hacia adelante, las funcionalidades actualmente alcanzables en el espacio DeFi, como préstamos, staking, minería de liquidez e incluso seguros, pueden ser introducidas en el mercado de tokens de datos, creando escenarios de aplicación completamente nuevos.
Desde la perspectiva de las industrias tradicionales de la Web2, al igual que las empresas compran futuros de petróleo para cubrirse contra las fluctuaciones de precios, el mercado de datos puede desarrollar futuros de datos, lo que permite a los usuarios fijar los precios futuros de los conjuntos de datos por adelantado y reducir la incertidumbre en los costos de adquisición.
Algunas firmas comerciales ya han comenzado a tratar los datos como una nueva clase de activos, investigando métodos de valoración como evaluar el valor de tokens de datos específicos, la probabilidad de uso en ventas y el análisis del ciclo de vida. Estos factores influyen directamente en el precio de los tokens de datos y la liquidez del mercado, dejando un amplio margen para la innovación.
Actualmente, acceder a conjuntos de datos en la mainnet sigue siendo relativamente engorroso. Los usuarios deben enviar solicitudes detalladas especificando sus necesidades, cantidades de pago y código de proyecto, y luego esperar la aprobación antes de obtener acceso. Si bien esto garantiza transparencia y estandarización, crea fricciones operativas.
Para mejorar la eficiencia, Vana está desarrollando métodos de acceso a datos más eficientes que permitan el acceso automatizado a la API y la recuperación directa de datos en varios DataDAOs. Por ejemplo, en el futuro, los usuarios podrían combinar datos de sueño con datos comerciales de Coinbase o Binance para analizar los patrones de sueño de los tenedores de tokens específicos y descubrir nuevas perspectivas de mercado.
Además, Vana está avanzando una nueva propuesta que implementa una relación estándar 80-20 para quemar tokens de datos y VANA a cambio de derechos de acceso a datos.
Vana también ha desarrollado una nueva interfaz de consulta de datos que simplifica significativamente el proceso de acceso a los datos. Los usuarios pueden autenticarse a través del inicio de sesión de la billetera y generar firmas digitales para verificar sus permisos de acceso. Dado que los grupos de liquidez de datos (DLP) registran formatos de datos, los usuarios pueden comprender claramente las estructuras de datos y recuperar la información necesaria mediante consultas SQL. Durante este proceso, los usuarios pueden recibir primero muestras de datos sintéticos para probar y verificar la precisión de las consultas. Cuando se trabaja con datos reales, todos los cálculos se realizan dentro de entornos de ejecución de confianza (TEE) para garantizar la seguridad de los datos. Este mecanismo previene eficazmente el "problema de los datos de doble uso" (en el que los usuarios pueden revender los datos comprados), protegiendo así el valor económico de los datos y garantizando el desarrollo sostenible del mercado de datos.
Los datos están emergiendo rápidamente como el activo central de la era digital. Si bien las tecnologías de recopilación y almacenamiento de datos han alcanzado una madurez considerable, el verdadero desafío radica en evaluar eficazmente la calidad de los datos, maximizar su valor y garantizar la protección de la privacidad. Vana aborda elegantemente este desafío a través de su innovador mecanismo de incentivos: los usuarios pueden apostar fichas VANA para apoyar DataDAOs de alto valor mientras ganan recompensas correspondientes, creando un ciclo virtuoso de creación de valor.
El desarrollo de la inteligencia artificial ha alcanzado la “muralla de datos” - los recursos de datos públicos de alta calidad están cerca de agotarse. Los futuros avances en IA dependerán inevitablemente de acceder y utilizar de manera efectiva datos privados de alto valor, como registros de salud personales, datos de uso de dispositivos inteligentes y videos de conducción de Tesla como recursos potenciales de entrenamiento.
Existe una paradoja en el valor de los datos: los datos mantienen su valor a través de la exclusividad, pero se convierten en mercancía y se deprecian una vez que están ampliamente disponibles. A medida que los modelos de IA se convierten en mercancía, la ventaja competitiva a largo plazo vendrá de controlar conjuntos de datos únicos que permitan un rendimiento superior en dominios especializados. Una vez que los datos se hacen públicos, la competencia de precios emerge casi inmediatamente, causando una rápida erosión del valor.
El DataDAO de Vana aprovecha los Entornos de Ejecución Confiables (TEEs) para permitir la transferencia de datos privados de alto valor mientras se preserva la privacidad. Este avance amplía el alcance de los activos de datos valiosos desde conjuntos de datos públicos limitados hasta el vasto mundo de los datos privados, abriendo nuevas posibilidades para el avance de la IA.
Los datos muestran una curva de valor distintiva: los puntos de datos individuales tienen un valor insignificante, pero cuando se agregan a una masa crítica, su valor crece exponencialmente. Esta característica presenta desafíos significativos para la monetización de datos, ya que los rendimientos sustanciales solo se materializan después de formar conjuntos de datos colectivos.
El mecanismo DataDAO de Vana proporciona una solución innovadora a este dilema. Al agrupar datos similares, los DataDAOs crean poder de negociación colectiva para los contribuyentes. Considere a los propietarios de Tesla: si todos los propietarios comparten colectivamente datos de conducción a través de un DataDAO, obtienen una fuerte influencia en los precios con cualquier comprador potencial. En contraste, si los propietarios intentan monetizar individualmente sus datos, inevitablemente conduce a una competencia de precios donde los compradores pueden simplemente adquirir suficientes muestras de los postores más bajos.
Los conjuntos de datos estructurados y verificados de alta calidad (como los datos de conducción de Tesla autenticados) tienen un valor de mercado premium, y el marco de Vana permite la plena realización de este valor.
El aspecto más poderoso de DataDAOs es su capacidad para lograr la agregación de datos entre plataformas, algo casi imposible en los ecosistemas de jardines amurallados de hoy en día. Imagina que los investigadores necesitan acceso a los mensajes combinados de Facebook de un usuario, el historial de iMessage y el contenido de Google Docs. El enfoque tradicional requeriría la cooperación entre Facebook, Apple y Google, plataformas que no tienen incentivos para integrar los datos de los usuarios (lo que debilitaría sus fosos de datos) ni la autorización regulatoria para hacerlo.
Los DataDAOs eluden elegantemente este obstáculo a través de la integración de datos liderada por el usuario, desbloqueando el valor de los datos entre plataformas y creando oportunidades sin precedentes para el entrenamiento e investigación de IA.
La visión de Vana se extiende mucho más allá de la mera innovación tecnológica; está abriendo camino a un paradigma completamente nuevo de participación económica. Bajo este modelo, los usuarios pueden participar en la economía digital sin los requisitos de capital tradicionales, ya que poseen el recurso más valioso: sus datos personales. Los usuarios no necesitan aportar capital financiero; compartir sus datos se convierte en su capital. Los DataDAOs proporcionan a los usuarios de Web3 flujos de ingresos pasivos derivados de sus datos personales únicos, lo que reduce significativamente la barrera de entrada para participar en la economía digital.
Este modelo podría reestructurar fundamentalmente cómo se distribuye el valor de los avances de la IA. En lugar de que los beneficios fluyan principalmente a las grandes corporaciones tecnológicas, la propiedad de datos y los mecanismos de gobernanza de Vana permiten una amplia participación en la economía de la IA. Los indicadores tempranos muestran una fuerte resonancia con este enfoque; más de 300 DataDAOs ya están en desarrollo en testnets.
Mirando hacia adelante 3-5 años, podríamos presenciar el surgimiento de modelos de IA totalmente gobernados por usuarios construidos por 100 millones de contribuyentes de datos, modelos que podrían superar a los principales sistemas de IA centralizados de hoy en día. Estos modelos de propiedad comunitaria crean un mayor compromiso y conexiones de los usuarios. La soberanía de los datos empodera a los usuarios para apoyar selectivamente el desarrollo ético de la IA mientras niegan el acceso a empresas no éticas.
La inteligencia artificial descentralizada proporciona un marco más democrático en el que la sociedad determina colectivamente lo que la IA debe aprender y creer, en lugar de dejar estas decisiones en manos de un puñado de corporaciones. La propiedad de los datos de los usuarios se traduce no solo en beneficios económicos, sino también en un control sustantivo sobre el comportamiento del modelo de IA, incluida la atención de problemas críticos como las políticas de moderación de contenido.
A nivel comercial, Vana se compromete a construir una cadena de valor de datos integral que abarca todo el proceso, desde la agregación de datos y el entrenamiento de modelos de IA hasta la venta de datos. Actualmente, el mercado de datos está monopolizado por un puñado de plataformas y corredores de datos. Vana tiene como objetivo abordar esta ineficiencia creando un ecosistema de comercio de datos más justo.
Vana es más que una nueva plataforma, representa un cambio fundamental en la propiedad de los datos y el desarrollo de la IA. Al permitir a los usuarios participar en la creación de valor colectivo manteniendo la soberanía sobre sus datos, Vana está sentando las bases para un futuro de IA más equitativo e innovador.
En el mercado actual de la IA, que está lleno de hype conceptual, Vana destaca con sus mecanismos innovadores que abordan directamente los desafíos fundamentales de la industria. Tiene el potencial de convertirse en una fuerza pivotal en la formación de la trayectoria futura de la IA.
Este artículo es reproducido de [ Biteye], el derecho de autor pertenece al autor original [Biteye], si tiene alguna objeción a la reimpresión, por favor póngase en contacto con el Gate Learnequipo, y el equipo lo manejará tan pronto como sea posible de acuerdo con los procedimientos relevantes.
Descargo de responsabilidad: Las opiniones expresadas en este artículo representan solo las opiniones personales del autor y no constituyen ningún consejo de inversión.
Otras versiones del artículo en otros idiomas son traducidas por el equipo de Gate Learn. El artículo traducido no puede ser copiado, distribuido o plagiado sin mencionar Gate.Gate.io.