IA générative et Opensourcewashing
Si vous suivez l'actualité de l'IA générative, vous avez probablement entendu parler de la sortie récente de quelques modèles que l'on qualifie de "open source". 🔓
L'open source pour les logiciels, je connais un peu. J'en utilise et j'en produis depuis des années.
Pour les modèles d'IA, par contre, le concept peut surprendre.
Imaginons que je mette à disposition le code suivant avec un contrat d'utilisation "open source".
1.globl f
2f:
3 pushq %rbp
4 movq %rsp, %rbp
5 subq $16, %rsp
6 movl %edi, -4(%rbp)
7 cmpl $0, -4(%rbp)
8 je .L2
9 movl -4(%rbp), %eax
10 subl $1, %eax
11 movl %eax, %edi
12 call f
13 imull -4(%rbp), %eax
14 jmp .L4
15.L2:
16 movl $1, %eax
17.L4:
18 leave
19 ret
C'est du code source, certes d'assez bas niveau mais toujours du code source. Il vous sera peut être utile et vous aurez le droit de le modifier et de l'utiliser dans à peu près n'importe quelle situation. 👍
Bon courage. 💪
Maintenant, si je vous dis que, en fait, j'ai généré ce code source à partir de celui-là, que je n'ai pas mis à disposition, vous allez probablement penser que j'abuse un peu. 🤔
1int f(int n) {
2 return n == 0 ? 1 : n*f(n-1);
3}
Et vous aurez raison. J'abuse même beaucoup. L'Open Source Initiative a une définition très précise de ce qui est ou n'est pas open source. Et cette définition contient notamment la condition suivante.
The source code must be the preferred form in which a programmer would modify the program. Deliberately obfuscated source code is not allowed. Intermediate forms such as the output of a preprocessor or translator are not allowed.
Revenons à nos modèles d'IA générative. Quand on vous dit que tel modèle est "open source", c'est généralement faux car ce que l'on vous met à disposition n'est pas la forme sous laquelle les développeurs du modèle travaillent. Les poids du modèle sont issus d'un traitement qui n'est pas mis à disposition. 🚫
Et pourtant, tout le monde, y compris les plus grands spécialistes, parle d'open source.
On est ici dans un cas de sophisme par association : l'open source est vertueux, ce que je produis est un peu plus ouvert que mes concurrents et contient du code source, donc je suis vertueux. 🔀
Merci d'arrêter l'utilisation de "open source" pour ces modèles. Ils ne le sont pas. Tout comme diverses technologies ne sont pas "vertes" ou "respectueuses de l'environnement" malgré les affirmations de leurs promoteurs. 🌱
Parlez d'usage gratuit, parlez de "open weights". 🆓
Et revenez parler d'open source le jour où ça le sera réellement. 👴👵