Es posible que haya oído hablar de GitHub Copilot AI que Microsoft agregó recientemente a GitHub en colaboración con OpenAI. Para empezar, básicamente le ayuda a escribir mejor código y lo hace sugiriendo algunas líneas de código o incluso las funciones completas a la vez.

Ahora, podrías estar pensando, “¡Woah! Genial. Esto me ayudará a convertirme en un mejor programador ”, pero ¿sabías que los desarrolladores ya lo odian? Porque esencialmente copia el código de otros repositorios y se lo sugiere. Porque fue entrenado de esa manera.


Copiloto de GitHub: ¿infracción de derechos de autor?

La respuesta corta es sí. Los desarrolladores intentaron comunicarse con el soporte de GitHub por correo electrónico, y dijeron que se utilizó todo el código público de GitHub para entrenar el modelo. Se vio a Copilot copiando y sugiriendo la popular función de raíz cuadrada inversa de Carmack.

Cuanto más grande es el conjunto de datos, más aprende la IA. En este caso, es decir, la famosa función de raíz cuadrada inversa, este fue probablemente el mejor de los casos, por lo que Copilot lo recomendó. Los resultados habrían sido muy diferentes si hubiera miles, si no millones, de funciones famosas de raíz cuadrada inversa.

Pero, ¿es realmente importante? Vayamos al grano aquí. La razón principal por la que los desarrolladores lo critican es la siguiente: Microsoft, al ser la empresa propietaria de GitHub, ahora tiene acceso a todos los repositorios. Entrenar un modelo de IA usando todos los repositorios públicos y, al final, cobrar una tarifa de suscripción para que otros lo usen beneficiará a Microsoft, pero ¿qué obtienen a cambio aquellos que contribuyeron con el código? Nada.

Entonces, Microsoft aprovechó la licencia GPL, que, para empezar, es una licencia para software de código abierto que permite el uso de software en otros proyectos sin restricciones de derechos de autor. Ahora que esto está sucediendo, casi parece que Microsoft adquirió GitHub únicamente para este propósito, pero esa es solo mi opinión al respecto.

Leyes, leyes y leyes

Y la comunidad de código abierto no puede quejarse ni demandar a Microsoft. ¿La razón? Porque no hay absolutamente ninguna regla o regulación sobre cómo los gigantes tecnológicos planean usar repositorios de código abierto. Incluso si la gente decide demandar a Microsoft, eso significaría que se podría imponer un nuevo conjunto de reglas sobre cómo se usa el software de código abierto. Esto, a su vez, cuestionaría el sentido de que el código abierto sea un código abierto.

Mucha gente piensa que GitHub Copilot no funciona como se anuncia. Una gran parte de los resultados de Copilot ya está llena de violaciones de derechos de autor / licencia, incluso sin extensiones.

Copiloto de GitHub: ¿Qué piensa la gente?

Otra pregunta que surge es: "Si está sugiriendo grandes trozos de código que son funciones que recopiló el modelo de entrenamiento, ¿qué se genera por computadora?" Así lo preguntó uno de los usuarios de Twitter, a lo que respondió en su propio hilo. “Si creo alguna base de datos que recopile funciones sueltas de repositorios disponibles públicamente (incluso con licencias permisivas) en todo el mundo, y luego creo algún software que pegue esta función si se hace referencia a ella o se empareja, ¿sería generada por computadora o no? Me gustaría escuchar lo que algún juez dirá a mi testimonio que "fue generado por computadora" si alguien me demanda por infracción de derechos de autor (con razón, en mi opinión). No creo que el juez diga: "Ah, si fue generado por computadora, entonces está bien".

A lo que agregó, “Ahora bien, ¿en qué se diferencia copiloto en esencia de tal base de datos? Podemos argumentar que el código generado por el copiloto está muy modificado y es fácilmente diferenciable de la pieza original, que es de esperar que no se pueda saber en qué fragmento se basó. Pero el problema es que, como se mencionó anteriormente, a veces no lo es. A veces es literalmente lo mismo, incluso hasta los famosos comentarios. Y lo peor es que no sabemos cuándo usarlo literalmente. Sé una cosa con certeza: no me gustaría que el oráculo me demandara porque encontraron parte de su código (de código abierto pero con licencia) en mi repositorio que fue "generado" por GitHub Copilot ".

¿A quién culpar aquí?

Según la situación, es realmente difícil responder a esta pregunta. Sí, Microsoft está usando los repositorios para su propio bien, pero no existen leyes basadas en las cuales las personas puedan demandar a los contribuyentes. Es por eso que la mayoría está moviendo su código desde GitHub.

Es una infracción de derechos de autor con seguridad, pero al final del día, nadie puede hacer nada al respecto. ¿Qué piensas? Háganos saber sus pensamientos y opiniones sobre el mismo en la sección de comentarios a continuación.