Home Presentado El nuevo Claude 3.5 Sonnet de Anthropic puede completar tareas en sus...

El nuevo Claude 3.5 Sonnet de Anthropic puede completar tareas en sus PC

5
0
El nuevo Claude 3.5 Sonnet de Anthropic puede completar tareas en sus PC


antrópico presentó el martes dos nuevos modelos de inteligencia artificial (IA) y una nueva capacidad de IA. La introducción más importante es una versión mejorada de Claude 3.5 Sonnet que, según se afirma, ofrece puntuaciones de referencia mejoradas en diferentes categorías. El nuevo Sonnet 3.5 también obtiene una nueva capacidad denominada Uso de Computadora, que le permitirá comprender e interactuar con las computadoras, permitiéndole esencialmente controlar y completar tareas en las PC. Además, la firma de inteligencia artificial también anunció Claude 3.5 Haiku, el sucesor de Claude 3 Haiku.

Se introduce Claude 3.5 Sonnet actualizado con uso de computadora

en una sala de redacción correoAnthropic anunció un Claude 3.5 Sonnet actualizado, que ofrece un rendimiento mejorado en comparación con el modelo de IA lanzado en junio. La firma de inteligencia artificial afirmó que el nuevo modelo supera a ChatGPT-4o y Gemini 1.5 Pro en puntos de referencia como Graduate-Level Google-Proof Q&A (GPQA), Massive Multitask Language Understanding (MMLU) Pro y HumanEval centrado en la codificación.

Sin embargo, las mejoras más significativas se han reclamado en dos puntos de referencia particulares: Software Engineering Benchmark (SWE-bench), que aumentó del 33,4 por ciento al 49 por ciento, y Tool-Agent-User (TAU-bench), que pasó del 62,6 por ciento al 49 por ciento. 69,2 por ciento. Ambos puntos de referencia se relacionan con el desempeño agente de la IA.

Esta capacidad agente de IA es relevante desde que Anthropic introdujo la nueva capacidad de uso de computadoras que permite a los modelos de IA controlar y completar tareas en las PC. Actualmente, esta capacidad está disponible a través de una interfaz de programación de aplicaciones (API) que solo se ejecuta en Claude 3.5 Sonnet.

Con el uso de la computadora, claudio está aprendiendo habilidades informáticas generales. Con software especializado, puede imitar pulsaciones de teclas, clics de botones y movimientos del cursor. Sumándolo a la capacidad de visión por computadora existente del modelo de IA, Claude 3.5 Sonnet puede ver lo que sucede en la pantalla y procesar la información para realizar tareas específicas. La función funcionará según las indicaciones proporcionadas a la IA.

Por ejemplo, los usuarios pueden solicitar al modelo de lenguaje grande (LLM) que reserve boletos en un sitio web, complete una solicitud o incluso descargue e instale una aplicación. Si bien ya existen herramientas especializadas que pueden automatizar ciertas tareas de la PC, una herramienta de propósito general que funciona con indicaciones de lenguaje natural es un hito importante para la tecnología de IA generativa.

Sin embargo, Anthropic admite que esta capacidad aún está en su etapa incipiente y existen ciertas limitaciones. “Algunas acciones que las personas realizan sin esfuerzo (desplazarse, arrastrar, hacer zoom) actualmente presentan desafíos para Claude”, destacó la empresa. Por ahora, se recomienda que los desarrolladores utilicen esta capacidad sólo para tareas de bajo riesgo.

Con capacidades de control informático automatizado, existe preocupación sobre si el modelo de IA puede diseñarse para realizar actividades dañinas e ilegales. La compañía no ha revelado ningún detalle sobre la seguridad del modelo de IA y la seguridad de los usuarios en este momento. En particular, el Claude 3.5 Sonnet actualizado está disponible para todos los usuarios y los desarrolladores pueden aprovechar esta capacidad a través de Anthropic API, Amazon Bedrock y Vertex AI de Google Cloud.

Se anuncia Claude 3.5 Haiku

Otro anuncio importante fue la presentación de Claude 3.5 Haiku. Por contexto, Haiku es la serie de modelos de IA más barata y rápida que ofrece Anthropic. La firma de inteligencia artificial ahora afirma que las capacidades del sucesor del Claude 3 Haiku superan al Claude 3 Opus, el modelo insignia anterior de la compañía. Esto significa que los usuarios ahora pueden acceder a un potente modelo de IA a un precio mucho más económico.

Claude 3.5 Haiku se lanzará a finales de este mes en varias plataformas, incluida la API de la compañía, Amazon Bedrock y Vertex AI de Google Cloud. Inicialmente estará disponible como modelo de solo texto y luego se actualizará para aceptar imágenes como entrada.



Source link

LEAVE A REPLY

Please enter your comment!
Please enter your name here