Un grupo de creadores de contenido accionaron contra la empresa por uso no autorizado de sus vídeos en el entrenamiento de IA, exigiendo compensaciones por derechos de autor.
OpenAI, la empresa detrás del popular modelo de inteligencia artificial ChatGPT, se enfrenta a una nueva controversia que podría tener implicaciones significativas para el futuro del entrenamiento de modelos de IA. David Millette, un creador de contenido en YouTube, presentó una demanda colectiva en California en nombre de todos los youtubers de Estados Unidos, alegando que la empresa ha utilizado sus vídeos sin autorización para entrenar su modelo de IA.
De acuerdo con Business Insider, la demanda surge en un contexto donde el uso de datos protegidos por derechos de autor para el entrenamiento de modelos de inteligencia artificial se ha convertido en una práctica común y controvertida. A medida que los modelos de IA se vuelven más avanzados, requieren cantidades masivas de datos para mejorar su precisión y capacidad de respuesta. Sin embargo, la cantidad de datos disponibles en dominios libres de derechos de autor es limitada, lo que lleva a las empresas a cruzar líneas éticas y legales.
En este caso, Millette y otros creadores de contenido argumentan que OpenAI ha utilizado sus vídeos de YouTube para entrenar su modelo, sin ofrecer compensación alguna. Esto podría ser una violación directa de las políticas de uso de la plataforma, las cuales estipulan que los creadores deben recibir compensación si sus vídeos, protegidos por derechos de autor, son utilizados de manera comercial.
La controversia se intensifica con la revelación de que Whisper, una herramienta de transcripción de audio a texto lanzada por la empresa en 2022, fue entrenada con 680.000 horas de vídeos. Sin embargo, las principales fuentes de contenido libre de derechos de autor, como VoxPopuli y Libriheavy, solo suman 450.000 horas, lo que sugiere que OpenAI podría haber recurrido a contenido protegido por derechos de autor para completar su entrenamiento.
A medida que más creadores de contenido se suman a la demanda, OpenAI enfrenta no solo la posibilidad de perder miles de millones de dólares, sino también una crisis de confianza en la comunidad tecnológica. Aunque la compañía ha negado repetidamente cualquier uso indebido de contenido protegido, la creciente presión legal y mediática podría obligarla a reconsiderar sus prácticas de entrenamiento de IA y a buscar acuerdos que respeten los derechos de los creadores.
El caso contra OpenAI no es un incidente aislado. En el último año, otras empresas tecnológicas también han sido acusadas de utilizar datos de usuarios sin su consentimiento para entrenar sus modelos de IA. Esta tendencia pone de manifiesto la necesidad urgente de establecer marcos legales claros que regulen el uso de datos en el desarrollo de dicha tecnología, garantizando que los derechos de los creadores de contenido sean respetados y protegidos en la era digital.
Comments