En la pestaña “sentido” del nuevo generador de vídeo de Sora, OpenAI destaca una serie de clips de IA destacados. Un panda viaja en el metro, un extraño fuma un cigarrillo, un barco de papel navega en un mar tormentoso y una estatua dorada te guiña un ojo.
Los videos son los resultados sorprendentes de esta nueva y asombrosa tecnología, pero quién sabe qué están haciendo. Llamativos y creativos, pero de una calidad demasiado pobre para ser puestos en producción comercial, los clips de Sora existen en condiciones limitadas. Sí, el producto al menos entiende algo de física, y la IA de vídeo puede ser el avance tecnológico del año. Pero como muchos productos impulsados por IA, no está del todo claro qué se supone que debemos hacer con él.
La IA del video ciertamente mejorará, pero Sora y sus contrapartes parecen carecer de factor de enfriamiento y baja ganancia, al menos por ahora. Problema: No existe un usuario natural. Con ChatGPT, los codificadores y estudiantes vieron un valor inmediato y desde entonces la generación de texto con IA se ha expandido a más casos de uso. Los generadores de imágenes como Dall-E no han tenido el mismo éxito, aunque han tenido dificultades para encontrar aplicaciones naturales para sus formatos multimedia más ricos. Sora, de manera similar, no es lo suficientemente bueno para producir clips para largometrajes o incluso comerciales, y es un poco extremo para ser útil para la persona promedio. Por tanto, su caso de uso sigue siendo incierto.
en un publicación de blog Al anunciar el lanzamiento público de Sora esta semana, OpenAI dijo que espera “permitir que personas de todo el mundo exploren nuevas formas de creatividad, cuenten sus propias historias y superen los límites de lo que es posible con la narración en video”. Pero como alguien nuevo en la edición de videos, puedo dar fe de que trabajar con videos puede resultar difícil. Incluso con el increíble poder de Sora en manos de todos, es difícil imaginar cómo manejarlo. Regla 90-9-1 en internetdonde el 90% de las personas consume, el 9% comparte y el 1% crea.
Al revisar el “último” programa de Sora, muestra cierto interés, pero se pregunta qué hacer con el servicio. Uno de los usuarios puso un perro en el asiento del conductor, otro puso un gato con un sombrero de marinero, otro mostró un caballo paseando por un cementerio de noche. Hay muchos animales. Y se invitó a muchas mujeres, algunas con una cantidad de detalles terrible. Los videos parecen permitir a los usuarios escapar a otros mundos o “superar los límites”, como sugiere OpenAI. Pero cuando presenta la solicitud varias veces, se vuelve más difícil tener una buena razón para regresar y pagar. ¿Cuántos cachorros se necesitan para verlos conducir?
Sarah, por supuesto, encuentra algunos vínculos valiosos. Permite a los cineastas planificar escenas antes de filmar. Permite a las marcas de moda ver modelos luciendo su trabajo en la pasarela antes de realizarlo. Y ayuda a los gerentes de marca a preparar publicaciones interesantes para Instagram. Sí, estos videos de IA probablemente inundarán nuestras redes sociales. Camarones y Jesús ha llenado Facebook.
Pero Sora también llega en un momento en el que es más difícil que nunca definir qué es real, y el servicio y sus pares aumentarán la confusión. La semana pasada, descubrí que la historia del tiroteo en United Healthcare era más difícil que cualquier historia importante anterior. Había un Substack falso y mucha información falsa en Internet. Pero los vídeos del tirador falso fueron los más impactantes. Varios usuarios han generado vídeos falsos de IA del tirador a partir de vídeos de vigilancia. Y aunque algunos claramente dijo que es IAotros compartieron sus videos insistió no fueron Todo contribuye al sentimiento. indiferencia ante la realidaddonde es tan difícil distinguir la verdad de una mentira que simplemente te rindes.
Para crédito de OpenAI, las garantías de Sora son bastante buenas. El servicio no me permite crear videos a partir de imágenes de personas y bloqueó mis instrucciones después de que intenté subir videos de Trump bailando y del tirador de UHC en McDonald’s. OpenAI se negó a permitir que Sora fuera miembro del equipo para una entrevista.
Quizás al centrarme tanto en el aspecto de la producción de vídeo, me estoy perdiendo el punto. Sora puede hacer excelentes videos, pero el objetivo principal del producto es mejorar la comprensión del mundo real por parte de la inteligencia artificial más allá de lo que se describe en el texto. “Sora sirve como base para la IA que comprende y simula la realidad”, dijo OpenAI en su anuncio, “un paso importante hacia el desarrollo de modelos que puedan interactuar con el mundo físico”.
Esta interacción con el mundo real podría significar aplicar la inteligencia de Sora a la robótica, o quizás ayudar a modelos que comprendan el planeta. Si es así, podría ser sólo para Sora.
Este artículo es de Gran tecnologíaboletín de Alex Kantrowitz.