OpenAI ha publicado una prueba de referencia para contratos inteligentes; ¿qué significa esto?

Esto no es solo una evaluación de la capacidad de los contratos, sino también un examen de supervivencia en la cadena para el Agent.

gm me desperté y recibí un montón de mensajes privados, tanto que pensé que la AGI se había hecho realidad. Después de mirar de cerca, OpenAI ha publicado un benchmark de contratos inteligentes, así que hablaré brevemente sobre esto.

En resumen, la capacidad del Agent para comprender, reparar y utilizar contratos inteligentes no está destinada a robar el trabajo de las empresas de seguridad criptográfica. En mi opinión, estas capacidades apuntan a una cuestión más fundamental: si el Agent podrá realmente sobrevivir y actuar en el entorno criptográfico en el futuro. Y el evmbench publicado por OpenAI es la escala para medir esta capacidad de supervivencia.

Estuve fuera durante el Año Nuevo chino y no tuve tiempo de interpretar el informe en detalle, pero lo hojeé rápidamente y mi impresión inicial es: este es un benchmark innovador, pero en general todavía es bastante temprano y rudimentario. El benchmark utiliza 120 vulnerabilidades de alto riesgo que ocurrieron en 40 proyectos reales en el mundo real.

El examen se divide en tres materias: Materia 1: Encuentra las diferencias. Encontrar vulnerabilidades. Materia 2: Reparación. Se le da código con vulnerabilidades y se le pide que las repare. Materia 3: Ataque, la IA juega el papel de un hacker y realiza ataques operando una billetera criptográfica en un entorno construido localmente. No entraré en detalles sobre la capa más técnica. En comparación con la metodología de evmbench y los detalles del tema en sí, me interesa más por qué OpenAI publicaría esto.

En los últimos años, OpenAI no ha mostrado un interés particular en el campo de las criptomonedas. Obviamente, el VC criptográfico Paradigm está impulsando esta publicación. La motivación de Paradigm es naturalmente fácil de entender, pero el primer autor en firmar es OpenAI, lo que indica que OpenAI no solo está cooperando pasivamente, sino que tiene una voluntad proactiva.

Entonces, ¿de dónde viene esta voluntad? Una explicación directa es que esta es una extensión del Preparedness Framework interno de OpenAI, que evalúa los límites de la capacidad de los modelos de vanguardia en escenarios de alto riesgo, y la seguridad de los contratos inteligentes es solo una parte de ello. Pero obviamente esto no es todo.

El uso de redes criptográficas por parte de Agent no es solo una posibilidad, sino en cierto modo una necesidad. OpenAI ciertamente también puede ver esto. En el informe de lanzamiento, también se menciona explícitamente que «esperamos que los pagos de stablecoin agentic crezcan».

Pero creo que esta proposición no se limita solo al pago de Agent. La mayoría de los Agent de los que estamos hablando ahora todavía tienen atributos de herramienta. Las personas dan instrucciones, el Agent las ejecuta y los resultados se devuelven a las personas. Pero esta forma no será el final. Cuando la cantidad de Agent sea lo suficientemente grande y la capacidad lo suficientemente fuerte, obviamente comenzarán a colaborar directamente: un Agent contrata a otro Agent para completar subtareas, un Agent compra datos o poder de cómputo a otro Agent, un Agent representa a una organización y negocia, firma contratos y cumple con otro Agent de la organización.

Las personas se retiran del eslabón intermedio de la transacción. En este momento, surge un problema fundamental: cuando las personas ya no están en el centro, ¿cómo funciona este sistema económico?

La sociedad humana resuelve la confianza y la colaboración confiando en un sistema acumulado por miles de años de civilización basada en el carbono, leyes, reputación, garantías institucionales, etc. Pero la lógica subyacente de este sistema está diseñada para personas: las partes participantes tienen una identidad continua, consecuencias sociales y la posibilidad de ser responsabilizadas. Agent naturalmente no cumple con esta premisa. Puede iniciar miles de transacciones en un segundo, destruir y reconstruir identidades en cualquier momento e ignorar cualquier frontera judicial.

Algunas personas dirán, entonces vinculemos a Agent con la identidad humana por la fuerza y usemos la autorización humana como garantía. Pero esto equivale a poner un grillete diseñado para la vida basada en el carbono en una especie que opera a una velocidad y escala completamente diferentes, lo cual no solo es ineficiente, sino que malinterpreta fundamentalmente lo que es Agent. Además, la dirección de la evolución de Agent inevitablemente apunta a una mayor autonomía. Es muy probable que el Agent futuro no dependa de ningún individuo humano, no tenga «dueño», no tenga una identidad humana vinculable, es un actor independiente. Para entonces, esta lógica de vinculación ni siquiera podrá encontrar un punto de anclaje.

Poner la infraestructura de confianza humana en la sociedad Agent es como usar las reglas de la carretera de los carruajes para administrar los aviones. La sociedad Agent necesita su propia infraestructura.

Los contratos inteligentes ofrecen esta posibilidad. No depende de «crees que la otra parte cumplirá», sino que escribe las condiciones de cumplimiento en el código y la red las hace cumplir por la fuerza. No hay árbitro, no hay período de espera, las condiciones se activan y los resultados ocurren automáticamente.

Además, los contratos inteligentes pueden no ser solo herramientas de liquidación, sino la forma organizativa de Agent en sí misma: reglas de gobernanza, asignación de recursos, programación de tareas, todo definido en la cadena, la ejecución depende del código y no se requiere que nadie esté en el centro.

Y cuando una parte de Agent vive en la cadena, interactuar con varios contratos es todo su día a día. Cómo leer un contrato, cómo encontrar su lugar en un protocolo complejo, cómo identificar trampas, evitar riesgos y sobrevivir en este mundo sin servicio al cliente, sin apelaciones y sin teclas de deshacer. Todo esto depende de la comprensión y el uso de los contratos. La capacidad insuficiente es una pérdida real, y el juicio erróneo es permanente.

Entonces, mirando hacia atrás a EVMbench, la capacidad que mide, comprender contratos, encontrar vulnerabilidades, construir transacciones, ejecutar ataques, esencialmente está respondiendo a una pregunta: ¿Agent ya ha aprendido a sobrevivir en este nuevo mundo?

🔥 Oferta Exclusiva de Bitget: ¡Regístrate ahora para reclamar hasta 6,200 USDT en Bonos de Bienvenida! Además, disfruta de un 20% de Reembolso en Tarifas de por vida.
Empieza a Operar en Bitget

Es muy probable que OpenAI se haya dado cuenta de que quien Agent aprenda a sobrevivir de forma autónoma en el mundo de la cadena obtendrá el boleto de entrada para la siguiente etapa. Además, es posible que el agente futuro ya no pueda describirse como de quién. Tal vez sean individuos independientes.

Finalmente, diré algo irrelevante, todos me enviaron DM colectivamente porque hice un proyecto de interés CryptoBench hace un año y medio, gracias amigos por recordarlo. GitHub – xxcg322/CryptoBench

Este es el primer Benchmark que detecta la capacidad de la IA en el campo del cifrado, que incluye pruebas desde algoritmos criptográficos, la capa inferior de la cadena de bloques, contratos inteligentes, ecología, gobernanza de DAO y otros aspectos. La parte del contrato inteligente también incluye la detección y la reparación, y el conjunto de vulnerabilidades de referencia en sí es el mismo que el conjunto de vulnerabilidades de referencia de OpenAI esta vez.

Cuando se lanzó Benchmark, todavía recibió el apoyo y el aliento de muchos amigos. Pero en ese momento, mi sentimiento era que no había demasiados amigos que realmente lo entendieran. Aunque no he mencionado esta cosa en mucho tiempo, todavía estoy muy satisfecho y orgulloso de ella. En unos días hablaré sobre la historia detrás de esto, por qué creo que este tipo de benchmark es muy importante, qué aprendí del proceso y por qué no he mencionado este asunto en el último año.

Además, Benchmark en sí también es una dirección en la que estoy muy interesado en el campo de la IA. Recientemente realicé una investigación de datos sobre 22000 benchmarks de IA de varios tipos publicados entre 2019 y 2025, y también tuve muchos hallazgos interesantes. Cuando regrese, también los compartiré con todos.

[Wu Shuo]

Análisis exclusivo de RichSilo:

evmbench de OpenAI: Un Cambio de Paradigma en la Convergencia IA-Blockchain

El lanzamiento de evmbench por parte de OpenAI representa un momento decisivo en la intersección de la inteligencia artificial y la tecnología blockchain. Esto no es simplemente otra referencia en el saturado panorama de evaluación de IA; es un posicionamiento estratégico deliberado que señala el reconocimiento de OpenAI de que los entornos blockchain son terrenos de prueba críticos para las capacidades de agentes autónomos. Para los inversores experimentados en criptomonedas, este desarrollo exige atención inmediata, ya que está remodelando nuestra comprensión de dónde se acumulará el valor en la futura economía de agentes con IA.

La Signancia Estratégica

Lo que hace particularmente notable a evmbench es la mínima participación previa de OpenAI con el ecosistema cripto. La implicación de la firma de capital de riesgo cripto Paradigm sugiere una alineación estratégica, pero la autoría del informe por parte de OpenAI indica que esto es más que una colaboración pasiva; es una participación activa e intencionada. Esto posiciona a OpenAI como un potencial disruptor en el panorama de seguridad blockchain, un dominio tradicionalmente dominado por firmas especializadas y auditores.

La estructura de tres partes de la referencia —identificación de vulnerabilidades, corrección de código y ejecución de ataques— crea un marco integral para evaluar la competencia en cadena de un agente de IA. Extrayendo de 120 vulnerabilidades de alta gravedad en 40 proyectos del mundo real, evmbench establece una línea base que inevitablemente elevará el listón para las capacidades de IA en entornos blockchain.

Implicaciones del Mercado: La Economía de Supervivencia en Cadena

La tesis central del artículo —que esta referencia mide la capacidad de un agente para «supervivir» en entornos cripto— resuena profundamente con los inversores cripto. Estamos presenciando la aparición de lo que denomino la «economía de supervivencia en cadena», donde los agentes de IA necesitarán navegar de forma autónoma los protocolos blockchain, gestionar recursos, ejecutar transacciones y mitigar riesgos sin intervención humana.

Esto crea varias implicaciones de inversión inmediatas:

  1. Tokens de Integración IA-Blockchain: Los proyectos que permitan a los agentes de IA interactuar sin problemas con los protocolos blockchain probablemente verán una captura de valor desproporcionada. Busque tokens que faciliten transacciones agente a agente, compartir de recursos computacionales y despliegue de modelos de IA descentralizados.

  2. Evolución de la Seguridad de Contratos Inteligentes: Los modelos de seguridad tradicionales enfrentarán una disrupción. Veremos una bifurcación entre la auditoría centrada en humanos y el monitoreo continuado potenciado por IA, creando oportunidades para plataformas que puedan aprovechar la IA para detección y respuesta en tiempo real de vulnerabilidades.

  3. Infraestructura de Agentes: La necesidad de infraestructura específica para agentes —gestión de identidad, sistemas de reputación y mecanismos de incentivos— creará nuevos frentes de inversión. Los proyectos que resuelvan problemas de coordinación en economías de agentes estarán posicionados para un significativo potencial de crecimiento.

Riesgos y Desafíos

La convergencia de IA y blockchain no está exenta de riesgos sustanciales:

  • Evolución de Vectores de Ataque: A medida que los agentes se vuelven más sofisticados, pueden desarrollar patrones de ataque novedosos que los marcos de seguridad actuales no pueden anticipar. La sección «Ataque» de evmbench reconoce esta realidad, sugiriendo que estamos entrando en una era de amenazas de seguridad generadas por IA.

  • Incertidumbre Regulatoria: Los agentes autónomos que operan en redes blockchain existen en una zona gris regulatoria. A medida que estos sistemas adquieren más capacidad, el escrutinio regulatorio se intensificará, potencialmente creando obstáculos de cumplimiento para los proyectos que habilitan economías de agentes.

  • Brecha de Complejidad Técnica: Los modelos de IA actuales todavía luchan con la comprensión matizada requerida para contratos inteligentes complejos. La naturaleza «rudimentaria» de la referencia, como lo señala el autor, sugiere que todavía estamos en etapas iniciales, con significativos obstáculos técnicos por delante.

Análisis de Oportunidades

Para inversores sofisticados, surgen varias oportunidades estratégicas:

  1. Proyectos de Agentes de IA en Fase Inicial: Busque equipos que combinen profunda experiencia en IA con comprensión blockchain. El éxito de evmbench likely dará lugar a una nueva categoría de agentes de IA diseñados específicamente para entornos blockchain.

  2. Referencia como Servicio: La tendencia de referencia se expandirá más allá de la iniciativa de OpenAI, creando oportunidades para firmas especializadas que proporcionen servicios de evaluación para capacidades de IA blockchain.

  3. Innovación entre Protocolos: Los proyectos que permitan a los agentes de IA interactuar a través de múltiples protocolos blockchain ganarán importancia estratégica a medida que el ecosistema se vuelva más fragmentado.

  4. Redes de IA Descentralizadas: La perspicacia del autor sobre los agentes que potencialmente se convierten en «individuos independientes» sugiere que veremos la aparición de redes de IA verdaderamente descentralizadas, donde la propiedad y el control están distribuidos en lugar de centralizados.

Reflexión Personal: El Precedente de CryptoBench

La mención del autor de su proyecto anterior CryptoBench añade un contexto histórico importante. CryptoBench estaba por delante de su tiempo al reconocer la importancia de evaluar capacidades de IA específicamente en dominios cripto. El hecho de que algunas referencias de vulnerabilidad se superpongan con la última referencia de OpenAI valida la perspicacia del autor y sugiere que estamos entrando en una era donde la evaluación especializada de IA se volverá cada vez más importante.

Esta convergencia representa más que un progreso técnico —señala el comienzo de un nuevo paradigma económico donde los agentes autónomos operan, transaccionan y coordinan en redes blockchain. Para los inversores, comprender y posicionarse para este cambio será crítico para capturar la próxima ola de creación de valor en el ecosistema cripto.

La pregunta ya no es si la IA interactuará con blockchains, sino qué proyectos habilitarán esa interacción de manera más efectiva y segura. evmbench de OpenAI acaba de hacer esa pregunta más urgente —y más rica en oportunidades— que nunca.

🚀 Oferta Limitada de Bybit: ¡La plataforma #1 en liquidez global! Regístrate para obtener hasta 30,000 USDT en recompensas y activa automáticamente un 20% de Descuento de por vida.
Únete a Bybit Ahora