• Crear 1
  • Posts
  • El Poder de la Visión y la IA

El Poder de la Visión y la IA

Crear1 por Ricardo Carreon

La mayor emoción que sentí de niño aun la recuerdo como si hubiera sido ayer.

Tendría alrededor de 5 años cuando por primera vez empecé a usar lentes, por causa de la miopía. Mi papá, que tenía una visión perfecta se había dado cuenta que no veía bien y allí estaba yo con ese par de lentes enormes. 🤓

Estaba saliendo de la escuela primaria, del turno vespertino. Mi escuela estaba justo en frente de la Alameda Zaragoza de Saltillo y de repente vi algo que no había visto nunca en mi vida al ver hacia la Alameda.

Vi por primera vez las hojas de los árboles.

Y me dio una gran emoción, porque hasta entonces los arboles antiguos de la alameda eran unos gigantes verdes sin mucho detalle.

Esa emoción me marco hasta el día de hoy, 50 años después. Por eso, creo que lo que está sucediendo con los modelos de IA que están adquiriendo la habilidad de ver cambia totalmente las reglas del juego. 👀

ChatGPT ahora puede ver, oír y hablar…

Y sin embargo lo que se ve en las redes sociales son prácticamente solo ejemplos de lo que puede lograr gracias al poder de la visión. Las personas que tienen acceso a esta funcionalidad, que estará en unas semanas disponible para todos los usuarios del ChatGPT Plus o Enterprise, están publicando muchos modelos de uso interesantes, habilitados por la capacidad de “ver” de ChatGPT.

Por ejemplo, ChatGPT puede ahora interpretar letreros urbanos complejos y confusos como este. En este ejemplo vemos muchos letreros de cuando se puede o no estacionarse en un determinado lugar. La complejidad de las reglas, dados los casos especiales, excepciones y horarios hace que la interpretación rápida de cuando se puede uno estacionar no sea nada simple, sin embargo, en el ejemplo vemos como ChatGPT en base a un prompt sencillo responde que sí, la persona puede estacionarse ahora en ese espacio.

Puedo estacionarme aqui? Si, puedes estacionarte por una hora empezando a las 4 PM

 

En este otro ejemplo, se le pregunta a ChatGPT si conoce la escena de la película en la imagen. ChatGPT responde que sí, que es de la película “Gladiator” de una escena en la que el actor Russell Crowe, que interpreta a un gladiador romano le grita al público “Are you entertained?” en una clara ironía, después de una lucha a vida o muerte en el Coliseo Romano. Lo interesante aquí es que ChatGPT no solo reconoce al actor, sino reconoce exactamente la escena y el dialogo de la misma solo con ver una foto fija de la misma.

De que pelicula es esta escena y que esta diciendo la persona?

 

Aplicaciones de la visión por parte de los modelos de IA hay muchas y quizá veamos muchas aplicaciones corporativas de las mismas pronto en uso. Por ejemplo, una aseguradora podría pedir a un asegurado que está reportando un siniestro que suba vía chat las fotos de los danos sufridos por su automóvil en un accidente. Es algo que ya hacen algunas aseguradoras, pero con la IA podría la aseguradora tener un estimado claro del daño y del costo de la reparación, aun antes de que el vehículo sea evaluado por un experto en un taller.

Del mismo modo aplicaciones industriales podrían rutinariamente captar imágenes de máquinas o de piezas de una fábrica y determinar cuándo programar el mantenimiento preventivo a las mismas. Las aplicaciones de tener un sistema de IA que pueda interpretar imágenes a detalle son muchas y de un gran impacto económico.

Tumor Cerebral detectado por IA

Seguramente, así como los ejemplos que estamos viendo en las redes sociales habrá un ejemplo de un caso de uso de la visión de los modelos fundacionales de IA que cambiará tu vida, como a mí me cambio la vida ver a los arboles de la Alameda.

 

Ideogram, ahora con lista de espera

Ideogram, la plataforma de generación de imágenes con IA que se hizo famosa por poder generar textos correctamente ha tenido un crecimiento espectacular en su número de usuarios. Primero vimos como Ideogram se volvió famoso muy rápidamente por sus capacidades de hacer textos, logos, nombre y letreros en estilos artísticos muy interesantes. Después vimos como en muchas horas del día era imposible generar imágenes, ya que, por saturación de la plataforma, la generación de imágenes estaba siendo restringida. Finalmente, lo que están haciendo el equipo de Ideogram para tratar de contener la gran demanda del servicio es poner una lista de espera para nuevos usuarios. Miembros de mi comunidad de IA reportan que la lista de espera no es rápida, así que, si te interesa Ideogram, te recomiendo que entres en la lista aquí.

 

Comunidad en WhatsApp

Ya somos más de 245 personas en mi comunidad de WhatsApp, si quieres estar informado diariamente de todo lo nuevo que está saliendo al mercado en este fascinante mundo de la IA no dudes en suscribirte gratuitamente a mi comunidad de IA en WhatsApp aquí.

Reply

or to participate.