¿Cómo entrenamos los algoritmos?
Mi columna en Invertia esta semana se titula “Entrena el algoritmo» (pdf) y es un intento de explicar los diversos factores involucrados en el complejo proceso de adquisición de datos para algoritmos de entrenamiento. aprendizaje automático.
En los primeros días, antes de que algo como esto atrajera la atención (antes de que el primer Dall E, el primer algoritmo de generación de imágenes, hiciera su primer lanzamiento público en enero de 2021), las empresas dedicadas a desarrollarlo básicamente estaban haciendo lo que habían hecho. .
Amparado por el principio jurídico que establece que el raspado web Es legal, lo que significa que cualquiera puede ir a sitios públicos y copiar todo su contenido, se crearon con enormes colecciones de imágenes y texto etiquetados que consideraron razonablemente precisos, alimentando las bases de datos que necesitaban para entrenar sus productos. Los precedentes sobre el tema han sido confusos: LinkedIn había perdido varios casos en el cual trató de prevenir lo que otras empresas han hecho raspado web de los datos de su red, pero Facebook había ganado contra Power Venturesy Clearview había abusado de eso raspado web a tal punto que nadie dudaba de que debía ser condenada. La idea parecía clara, aunque sujeta a la interpretación relativa de los jueces: Él raspado web Fue una herramienta, no un crimen.y como con cualquier herramienta, hubo usos razonables e indebidos.
Así que compañías como OpenAI y otras como Getty Images saquearon bases de datos y se las llevaron con millones de imágenes etiquetadas. Todos tenían una marca de agua de Getty Images que solo podía eliminarse si pagabas por usar la foto, pero eso no importaba: la imagen era lo suficientemente visible y sus etiquetas permitían que el algoritmo la interpretara.
El tema empezó a llamar la atención cuando los usuarios de Dall·E y otros algoritmos como Stable Diffusion o Midjourney empezaron a perder el tiempo pidiendo imágenes con «estilo». La cosa parecía mágica: si inmediato Preguntaba por el estilo de un autor en particular, el algoritmo usaba las imágenes que tenía de ese autor, y el resultado era tan bueno en muchos casos que parecía hecho por el artista. Además, en muchos casos, algunos algoritmos han llegado al punto de poder reproducir las marcas de agua de Getty Images: el algoritmo había sido entrenado en tantas imágenes que llevaban la marca de agua que interpretaba que esa marca de agua debía aparecer como un elemento presente en sus creaciones. Empeoró aún más con las letras: los algoritmos más modernos como Claude pueden hacerlo Capture libros completos en segundospermitiéndoles comenzar a escribir inmediatamente, como lo haría su autor.
Para complicar más las cosas, surgió un tema que siempre complica todo: los derechos de autor. Básicamente, la doctrina establece que sólo las creaciones humanas deben ser protegidas por derechos de autor y tener los derechos correspondientes. El famoso caso de autofotos del monoen el que el juez dictaminó que no había protección de derechos de autor ya que el autor de la foto era el propio mono parecía dejar las cosas claras y aplicadas a los algoritmos: un algoritmo no es humano y por lo tanto sus creaciones no tienen por qué estar exentas de derechos de autor.
Sin embargo, las cosas tampoco son tan sencillas: al fin y al cabo, la interpretación del algoritmo como creador de una imagen es muy discutible, porque también podríamos interpretar que es la herramienta que utiliza un autor para obtenerla. En realidad, cuando una persona inexperta intenta conseguir una imagen como muchas de las que se ven en Internet utilizando Dall E, Midjourney o Stable Diffusion, suele obtener un resultado de mucha menor calidad: maneja el algoritmo, escribe en inmediato No es una tarea nada fácil diseñar y gestionar adecuadamente todas las interpretaciones que el algoritmo hace de él. En este sentido, no puede interpretarse que el autor de este artículo es la computadora en la que lo escribí, ni puede interpretarse que el autor de un dibujo creado por un algoritmo es el algoritmo, sino que la persona que lo creó lo logró.
La cuestión es compleja, pero no es en modo alguno una mera curiosidad jurídica: es la base de lo que podemos o no hacer con los algoritmos y, más importante aún, con la industria que se desarrolla en torno a ellos. Cuando las únicas empresas capaces de entrenar algoritmos son aquellas que pueden llegar a acuerdos con grandes repositorios de imágenes o noticias que complementen lo ya conocido LAION, pronto nos enfrentaremos a un escenario de concentración similar al de las redes sociales, en el que muy pocos actores dominan la escena y cometen todo tipo de abusos. Por el contrario, si facilitamos que las creaciones se utilicen para el entrenamiento de algoritmos, abrimos la puerta a que cualquiera pueda entrenarlos, y posiblemente también a un entorno menos concentrado, más diverso… pero seguro que tendremos problemas con los propietarios de estas imágenes y textos o con las agencias que los representan.
En el medio, la solución para que todos entrenen sus algoritmos con lo que puedan: cada empresa con los datos que generan sus actividades y transacciones. Limitado, vertical, pero potencialmente muy bueno y sin comprometer la seguridad de esos datos. Las empresas que saben convertir su actividad en un canal que genera datos constantemente pueden entrenar sus propios algoritmos y dependen menos de ellos Bigtech Capa. Pero para hacer algo, tienes que saber que quieres hacerlo, cuáles son las alternativas y cuáles son las consecuencias si no lo haces. Veremos si con el tiempo lo entendemos o si estamos condenados a la dominación implacable de unos pocos. Bigtech.