Agentes de Inteligencia Artificial: Los 5 Niveles que Marcan su Evolución
- George Márquez

- 31 ago
- 7 Min. de lectura
Actualizado: 8 sept
Los agentes de inteligencia artificial son entidades artificiales con la capacidad de percibir su entorno, tomar decisiones y tomar acciones utilizando las herramientas a su disposición. Este se pudiera decir es el nivel máximo del desarrollo de la IA, y precisamente dentro del nivel máximo hay 5 niveles internos que definen el avance más actual, veamos donde se encuentra AGI o si hay otros aún más desarrollados. Descubre los 5 niveles de los agentes de inteligencia artificial y cómo su evolución está redefiniendo el futuro de la automatización y la toma de decisiones.

Tenía muchas ganas de escribir sobre este tema, que realmente disfruté investigando. principalmente porque tenía la intención de desmitificar la noción de agentes y qué es exactamente un agente.
Los agentes de inteligencia artificial están presentes en casi todas las aplicaciones modernas que usamos, desde simples asistentes virtuales hasta sistemas complejos de toma de decisiones autónomas. En este artículo exploramos los cinco niveles de sofisticación que definen el progreso y la evolución de estos agentes inteligentes, claves en la revolución de la IA moderna.
Esta categoría es la que más me interesa porque exige considerar las herramientas de compilación disponibles, el costo, la latencia y las implicaciones prácticas y comerciales de implementaciones específicas de dominio. Todo lo que estoy tratando de abordar en este artículo de los agentes de Inteligencia Artificial y los 5 niveles.
Consideraciones de dominio
Acerca de la AGI o la Superinteligencia Artificial (ASI) y lo que las organizaciones están planeando, ha habido mucho revuelo, alarmismo y especulación. Cómo aprovechar el poder de los LLM y los agentes autónomos de IA para implementar dominios específicos en las organizaciones no es mi principal interés.
Las empresas de banca, comercio minorista, servicios financieros y más, que crean UI basadas en IA para que los usuarios interactúen con productos y servicios, son el principal impulsor comercial de las UI conversacionales.
Cualquier entidad que sea capaz de percibir su entorno y ejecutar acciones puede considerarse un agente.
¿En qué lugar nos encontramos en este momento?
Actualmente nos encontramos en el nivel dos y tres, y muy probablemente en el nivel 2.5, debido a implementaciones de dominio limitado.
Los marcos para el desarrollo de agentes han sido creados por LangChain DSPy en programación LLM y LLamaIndex utilizando su técnica de Agentes RAG.
Estos agentes representan entre el 50 % y el 90 % de los adultos capacitados que pueden automatizar tareas de manera estratégica. Los agentes pueden descomponer la descripción del usuario, planificar subtareas y ejecutarlas de manera ordenada para llegar a una conclusión según la entrada del usuario.
Estos agentes tienen la capacidad de iterar sobre tareas intermedias hasta llegar a una respuesta definitiva.

Ejemplo práctico
¿Considerando la siguiente pregunta?
¿Quién es considerado el padre del iPhone y cuál es la raíz cuadrada de su año de nacimiento?
Esta pregunta es bastante ambigua y complicada de responder y requiere una serie de pasos que deben seguirse para obtener una respuesta. Aunque hay una tarea matemática y un resultado, también es necesario adquirir los conocimientos necesarios para responder a la pregunta.
Para este ejemplo práctico, el agente tiene a su disposición algunas acciones:
Luego, considere el resultado de este agente basado en LangChain y observe cómo el agente pasa secuencialmente del pensamiento a la acción y a la observación hasta que llega a una respuesta final y la cadena finaliza.
A continuación se muestra una representación gráfica de la secuencia de eventos del agente.

Los agentes de nivel uno se basan en reglas, como se puede ver en la tabla que muestra los cinco niveles de agentes. Aunque pueden tener cierta autonomía, en la práctica, se componen de pasos predefinidos que se ejecutan en base a pasos predefinidos.
Un método más basado en reglas para crear agentes utiliza nodos de IA generativa se muestra en la siguiente imagen. En un siguiente artículo, discutiré por qué la automatización basada en reglas con autonomía medida es un método astuto para implementar negocios. en comparación con una estrategia de agente autónomo completo.

Estructura básica de los agentes de dominio limitado
Los agentes tienen un modelo de lenguaje sólido (LLM). Además, los agentes tienen acceso a una variedad de herramientas. Las herramientas pueden tener características particulares, como búsqueda web, API específicas, RAG y matemáticas, entre otras.
Para que el agente sepa qué herramienta usar en una etapa específica del proceso, las herramientas se describen en lenguaje natural. El poder del agente depende de la cantidad de herramientas y sus capacidades.
Consideraciones prácticas
Una vez más, hay algunas consideraciones prácticas a tener en cuenta al implementar Agentes de dominio limitado.
Sensorial
La mayoría de los agentes actuales son virtuales y se puede acceder a ellos mediante entradas de voz o texto. Estos agentes pueden responder en voz o texto después de razonar y llegar a conclusiones. Se pueden incluir elementos multimodales que permiten a los agentes recibir imágenes o videos como entrada o generar imágenes o videos como salida.
Sin embargo, los agentes generalmente carecen de otras habilidades sensoriales como el tacto, la visión o el movimiento. La incorporación de agentes con habilidades sensoriales y físicas marcará el inicio de una nueva era de robótica.
Columna vertebral del LLM
El agente tiene como base un LLM, o API LLM, como se mencionó anteriormente. Los agentes experimentan varias iteraciones y llamadas API. Hay una única dependencia que debe ser atendida, por lo que creo que cualquier redundancia de implementación del agente de producción debe integrarse en la red troncal del agente.
Los servidores de inferencia locales o los LLM "autohospedados" son las mejores opciones para garantizar tiempo de actividad.
Latencia
Los sistemas conversacionales requieren respuestas en menos de un segundo; cualquier sistema complejo, como los agentes que requieren múltiples pasos internos para cada turno de conversación, suma la latencia total que experimenta el usuario. Esto puede convertirse en un obstáculo a vencer.
Costo
El uso de las API comerciales de LLM será extremadamente costoso debido a que el LLM responde a cada pregunta planteada al agente en repetidas ocasiones. Imaginemos que miles de usuarios simplemente se preocuparían por los costos.
Costos y herramientas
Para realizar sus funciones, los agentes deben tener acceso a herramientas. Puede haber un mercado completo donde se puedan crear herramientas compartidas. donde los creadores pueden elegir una herramienta existente en lugar de crear una nueva.
Las herramientas pueden acceder a API que se cobran, pero pueden ser gratuitas o de pago.
No llegar a un acuerdo
Es importante señalar que actualmente hay casos en los que el agente no llega a una conclusión o llega a una conclusión demasiado pronto. Los pasos intermedios del razonamiento del agente pueden satisfacer las consultas del usuario si el usuario puede acceder y verlos. donde el usuario puede detener al agente y asegurarse de que se le ha proporcionado información adecuada.
El concepto de Agentes de Inteligencia Artificial y los 5 niveles
A medida que la IA ha avanzado, el término "agente" se ha utilizado para describir objetos con habilidades y comportamiento inteligente, como:
Autonomía
Reactividad
Proactividad
Interacciones sociales
La idea fundamental de la inteligencia artificial, la Prueba de Turing, fue presentada por Alan Turing en la década de 1950 y estaba destinada a determinar si las máquinas podrían mostrar comportamientos inteligentes similares a los humanos. Estas entidades de IA, conocidas como agentes, son componentes esenciales de los sistemas de IA.
El aprendizaje debe transferirse
El aprendizaje por transferencia significa aplicar el conocimiento de una tarea a otra. Este método generalmente se utiliza para los modelos básicos, en los que un modelo se entrena inicialmente en una tarea relacionada y luego se ajusta para la tarea posterior específica de interés.
El concepto de aprendizaje por transferencia es poderoso y aumenta la versatilidad de los modelos al permitir la realización de tareas nunca antes vistas basadas en aprendizajes previos.

Aunque actualmente parece ignorado, los agentes autónomos de IA son un avance tecnológico significativo.
Los agentes con IA pueden:
Operar de forma independiente
Tomar decisiones &
Tomar acciones sin intervención humana constante
En el futuro, los agentes autónomos de IA cambiarán la atención médica, las finanzas, la manufactura y el transporte.
Sin embargo, el sesgo, la ética, la responsabilidad, la rendición de cuentas y la transparencia son factores importantes en la toma de decisiones.
A pesar de estas dificultades, el futuro de los agentes autónomos de IA es muy prometedor. Estos agentes se integrarán cada vez más en nuestra vida diaria a medida que avanza la tecnología.
Servicios Profesionales
En JMC Studio somos una Agencia multidisciplinaria con gran talento creativo, desarrollamos todo tipo de proyectos, puede revisar todos nuestros servicios de tecnología, web e IA aquí.
Fuentes: BlogBoard, Infra Data, Docs kanaries, JMC Studio.


















Comentarios