Desde los primeros libros y películas de ciencia ficción, las computadoras dotadas de inteligencia artificial casi siempre han ido acompañadas de máquinas en movimiento igualmente inteligentes, como androides y otros robots. Sin embargo, en los últimos 15 años aproximadamente, los sistemas de inteligencia artificial que funcionan completamente en software se han vuelto mucho más sofisticados que sus contrapartes móviles.
Los robots pueden construir automóviles en fábricas y limpiar lo que ensuciamos en casa, pero son capaces de llevar a cabo una gama relativamente pequeña de tareas en comparación con la naturaleza cada vez más general de los chatbots.
Una startup llamada Physical Intelligence se ha propuesto cambiar esta situación. Formada este año por un equipo de expertos en robótica e inteligencia artificial, la compañía planea crear software que pueda añadir inteligencia de alto nivel a una amplia variedad de robots y máquinas. O, como dice Karol Hausman, cofundador y director ejecutivo, en la primera entrevista pública que concede Physical Intelligence desde que fundó la empresa: “Nuestro objetivo es llevar la IA al mundo físico con un modelo universal que pueda alimentar cualquier robot o dispositivo físico básicamente para cualquier aplicación”.
LEA TAMBIÉN: Ingeniero de Microsoft lanza dura advertencia sobre contenido dañino de IA
El auge de la IA de procesamiento del lenguaje creada por OpenAI, Google y otros ha sido posible gracias al enorme volumen de texto disponible en internet y en otros archivos. Las empresas pueden entrenar sus modelos de IA alimentándolos con miles de millones de ejemplos de cómo los humanos usan las palabras, un proceso que ha ayudado a las computadoras a “resolver” matemáticamente el lenguaje. Recopilar cantidades similares de datos del mundo físico ha resultado mucho más desafiante, lo que limita el progreso de la IA en el campo de la robótica.
La tesis de Physical Intelligence es que ha llegado el momento de dar un nuevo enfoque a la construcción de modelos de IA robótica. La empresa pretende fusionar las técnicas utilizadas para construir modelos lingüísticos con sus propias técnicas para controlar e instruir a las máquinas. El objetivo final sería crear una IA que funcione como un tipo de sistema robótico de uso general.
Hausman pasó los últimos años como científico trabajando en robótica en Google. Sus compañeros cofundadores son Sergey Levine, que ha realizado trabajos pioneros en robótica como profesor de la Universidad de California en Berkeley; Chelsea Finn, profesora de la Universidad de Stanford; Brian Ichter, antiguo científico investigador de Google; y Lachy Groom, antiguo ejecutivo de la empresa de pagos Stripe y destacado inversor tecnológico.
Su empresa ha recaudado US$ 70 millones de Thrive Capital, OpenAI, Sequoia Capital, Greenoaks Capital Partners, Lux Capital y Khosla Ventures, según una persona familiarizada con sus inversores que no estaba autorizada a hablar públicamente sobre la inversión.
Los esfuerzos para mejorar el software que impulsa a los robots se han realizado durante décadas. En particular, una empresa llamada Willow Garage, fundada en 2006, pasó varios años intentando crear un tipo de software de propósito general que pudiera compartirse entre robots para proporcionarles un conjunto unificado de funciones básicas.
Si bien su software fue adoptado por varias empresas y desarrolladores de robótica, el trabajo de Willow Garage no supuso un gran avance en la inteligencia robótica y la empresa cerró sus operaciones en 2014.
Otras empresas como Rethink Robotics intentaron construir sistemas que pudieran aprender a realizar trabajos copiando los movimientos que les mostraban los humanos. Varias startups han implantado recientemente IA que utiliza la repetición para enseñar a brazos robóticos a recoger objetos y realizar tareas similares a las que hacen los humanos en los almacenes.
Otras han empezado a construir androides diseñados para imitar los movimientos humanos. Una de estas startups, Figure AI Inc, acaba de recaudar US$ 675 millones de OpenAI, Nvidia, Jeff Bezos y Microsoft para ayudarla a construir robots que trabajen en instalaciones logísticas y de fabricación.
LEA TAMBIÉN: Musk anuncia que su chatbot Grok será de “código abierto”
En lugar de centrarse en tipos específicos de brazos robóticos o androides industriales, Physical Intelligence quiere desarrollar software que pueda aplicarse a muchos tipos de robótica. Para ello, se ha puesto manos a la obra para crear su propio modelo de IA, diseñado para llevar las capacidades humanas básicas a las máquinas.
“Creo que es genial lo que la gente está haciendo con los humanoides”, afirma Groom. “Pero lo que hace interesantes a los humanos es el cerebro, no el hardware. Somos los generalistas por excelencia”.
En los últimos años, los investigadores han publicado una serie de artículos que muestran cómo los robots ya están adquiriendo nuevos niveles de inteligencia a partir de modelos de inteligencia artificial de lenguaje e imagen. Si, por ejemplo, le dices a un brazo robótico que se ate un zapato, puede usar IA para encontrar los conceptos básicos de un zapato y los cordones de un zapato, e información sobre lo que normalmente implica atar un zapato.
Si bien este es un buen comienzo, el hardware robótico aún necesita cierto nivel de capacitación para realizar tareas físicas. Esto ha sido un gran desafío, porque hacer que los robots realicen tareas el tiempo suficiente para aprender cada nuevo trabajo requiere mucho tiempo y es costoso.
Physical Intelligence aún no ha revelado exactamente cómo piensa superar este problema. Los cofundadores de la empresa afirman que no construirán su propio hardware, sino que comprarán diversos robots y entrenarán sus modelos de IA con ese hardware. El objetivo es acumular el mayor corpus de datos robóticos creado hasta la fecha, según la empresa.
Physical Intelligence se enfrenta a la competencia de empresas como Figure AI y Tesla Inc. que están fabricando androides, así como de otras empresas que trabajan en software de robótica de uso general. A principios de esta semana, por ejemplo, la startup Covariant, de siete años de antigüedad, declaró que también ha estado desarrollando un nuevo tipo de modelo robótico que aprovecha los avances de la IA de lenguaje, imagen y vídeo para mejorar las capacidades de sus brazos robóticos.
Los cofundadores de Physical Intelligence sostienen que llevan años trabajando en los retos de la IA para la robótica y que han desarrollado enfoques novedosos para cuestiones que han frenado a otros en este campo.
“Siendo realistas, creo que vamos a necesitar un esfuerzo de investigación largo y muy serio para conseguirlo”, afirma Levine. “Pero hay suficientes indicios de que los mayores obstáculos para utilizar robots en el mundo real ya tienen solución”.
LEA TAMBIÉN: China emprende cruzada nacional por supremacía tecnológica frente a EE.UU.
Comienza a destacar en el mundo empresarial recibiendo las noticias más exclusivas del día en tu bandeja Aquí. Si aún no tienes una cuenta, Regístrate gratis y sé parte de nuestra comunidad.