# L'open source, dernière chance de l'Europe dans la guerre de l'IA ?
**Date de l'événement :** 29/04/2025
* Publié le 29/04/2025

**Vide :**
[Vidéo 1](https://www.youtube.com/watch?v=PPLCNM3K88Q&list=PL34uK2ASYXqHmc7Rxc_X2c6BGsIdxXSvv&index=11) 

## Description
🎥 Retour sur la MKIA, l’événement IA signé Maddyness  
  
📍 Le 29 avril, dans la salle Gaveau, Maddyness a rassemblé l’écosystème tech pour une journée unique autour de l’intelligence artificielle.  
  
Pour cette table ronde Xavier Fischer, de Quadrille Capital, Neil Zeghidour, de Kyutai, et Loubna Ben Allal de Hugging Face vont tenter de répondre à la question “l’open source, dernier rempart européen dans la guerre de l’IA ?”  
  
🚀 Pourquoi la MKIA ?  
À l’heure où l’IA suscite autant d’inquiétudes que de promesses, Maddyness a fait le choix d’un événement à contre-courant : pas de buzz, pas de peur, mais du concret, de l’analyse et surtout de l’action. Entrepreneurs, décideurs, scientifiques, artistes : ils étaient tous là pour partager leur vision et leurs projets.  
  
🔍 Pour aller plus loin :  
→ Tous nos contenus exclusifs sur https://www.maddyness.com  
→ Notre newsletter quotidienne à 20h avec l’offre spéciale Maddy+ ➡️ https://abonnement.maddyness.com/  
  
📌 Merci à toutes celles et ceux qui ont participé à faire de cette journée un moment fort de réflexion, de créativité et d’engagement autour de l’intelligence artificielle.  
  
0:00 Intro  
1:27 Définition de l'Open Source  
3:44 Open Source ou Open Science ?  
5:27 La majorité des startups françaises fait de l'Open Source  
7:30 Tous les modèles Open Source sont utilisés équitablement  
8:52 Risque d'uniformisation ?  
9:30 La guerre pour attirer des talents  
13:07 Pourquoi les investisseurs parieraient sur l'Open Source ?  
15:26 Quel est le business model de Hugging Face ?  
16:44 Les datacenters pour l'IA  
19:15 Que penser des annonces au Sommet de l'IA ?  
21:12 Faut-il craindre la concurrence chinoise ?  
24:43 Comment financer les laboratoires de recherche ?  
26:25 Les avantages de la France dans l'IA

### Date
29/04/2025

**Chaîne :** [Maddyness](https://www.youtube.com/channel/UC_QKonrSANHUcQz__ykt0MA)

### Thème(s)
`#Intelligence artificielle (AI & GenAI)` `#Numérique et technologie` 

### Format
`#Vidéo` 


---
### Média externe associé : https://www.youtube.com/watch?v=PPLCNM3K88Q&list=PL34uK2ASYXqHmc7Rxc_X2c6BGsIdxXSvv&index=11

#### Résumé du média
Voici les 5 sujets et insights les plus importants de la conférence, avec un paragraphe synthétique pour chacun :

**1. Définition et composantes de l'Open Source dans l'IA (Durée significative)**

L'open source dans l'IA diffère du développement informatique traditionnel. Il englobe non seulement le code, mais aussi les poids des modèles, les licences, les informations sur l'entraînement et, surtout, les données d'entraînement. Les poids doivent être publics (open weights), et les licences varient de permissives (MIT, Apache 2) à restrictives (non commerciales ou conditionnelles selon le revenu). La transparence sur les données d'entraînement est cruciale mais souvent gardée secrète pour maintenir un avantage compétitif et éviter des problèmes légaux. L'open science, un terme plus large, inclut les publications scientifiques, les résultats mathématiques et les algorithmes, permettant la réimplémentation du code. La qualité des données est un facteur déterminant dans la performance des modèles de langage, justifiant la nécessité d'une transparence accrue à ce niveau.

**2. L'Open Source comme moteur de l'innovation et de la collaboration (Durée significative)**

L'open source est un démultiplicateur d'impact, permettant une mutualisation et une coopération entre de nombreuses sociétés et laboratoires. Le partage des connaissances et des modèles accélère le développement de l'IA, évitant à chacun de réinventer les mêmes choses. L'open source n'est pas un acte altruiste, mais un choix rationnel qui favorise un développement rapide et mutualisé. Hugging Face illustre ce modèle en permettant le téléchargement et l'utilisation de divers modèles, favorisant ainsi l'innovation et la spécialisation. La diversité des modèles disponibles permet à des startups verticalisées de se spécialiser dans différents domaines.

**3. Attractivité de l'Open Source pour les talents (Durée significative)**

L'open source est un argument majeur pour attirer les talents dans le domaine de l'IA. Les chercheurs sont motivés par la publication de leurs travaux, qui accroît leur renommée et leur crédibilité. La possibilité de publier est un facteur déterminant pour les meilleurs talents, qui valorisent la reconnaissance de leurs contributions. Les grands laboratoires comme Facebook AI Research et Google ont attiré des chercheurs de renom en leur offrant la liberté de recherche et la possibilité de publier leurs découvertes. Renoncer à la publication serait un sacrifice inacceptable pour les meilleurs talents.

**4. Modèles économiques et financement de l'Open Source (Durée significative)**

La monétisation de l'open source est un défi complexe. Hugging Face propose des services payants autour de son hub gratuit, tels que l'Enterprise Hub et la version pro, offrant plus de contrôle, de sécurité et de fonctionnalités. L'inférence est un autre axe de monétisation, avec des solutions d'inférence et des partenariats avec des Influence Providers. Pour les entreprises développant des modèles de base (AI infra), l'open source peut être plus difficile à monétiser. Il est crucial de trouver des modèles capitalistiquement justes pour attirer les investissements nécessaires. La pérennisation du financement de l'open source à long terme reste une question fondamentale.

**5. Souveraineté, infrastructure et compétition internationale (Durée significative)**

La France et l'Europe doivent pousser l'open source pour rattraper leur retard dans le domaine du logiciel. Il est essentiel de créer des infrastructures financées par des capitaux étrangers et de développer une compétence européenne dans l'exploitation des data centers. La Chine est un acteur majeur de l'IA, publiant des recherches innovantes et adoptant une approche très transparente. L'Europe doit tirer parti de l'open source pour accélérer son développement et coopérer. Il est crucial de motiver les talents à créer des entreprises en France et de soutenir la recherche de pointe. Il faut aussi veiller à ce que les acteurs qui s'engagent dans l'open source ne soient pas pénalisés par une réglementation trop stricte.


#### Mots-clés du média
`open source` `close source` `intelligence artificielle` `IA` `modèles` `données` `algorithmes` `recherche` `financement` `data centers` `talents` `innovation` `Hugging Face` `Q-Ti` `licences`

#### Chapitres du média
- **Introduction à l'open source et au closed source dans l'IA** (7.982 - 93.811): Définition de l'open source et du closed source, notamment dans le contexte de l'intelligence artificielle. L'open source se démocratise, surtout dans l'IA.
    - (7.982): Présentation du panel sur l'open source, le close source et la souveraineté.
    - (7.982): Définition simple de l'open source : partager les lignes de code.
    - (7.982): Définition du close source : développement sans partage des algorithmes.
    - (7.982): L'open source explose et se démocratise, surtout dans l'IA.
- **Les différentes composantes de l'open source dans l'IA** (94.448 - 216.451): Explication des différentes échelles de l'open source dans l'IA : poids des modèles, licences (MIT, Apache 2, non commerciales, etc.), informations sur l'entraînement, et données d'entraînement. L'importance des données d'entraînement comme avantage compétitif.
    - (94.448): L'open source en IA diffère du développement informatique traditionnel en raison de multiples composantes (modèle, algorithme, données, licence).
    - (94.448): La première échelle de l'open source est la publication des poids du modèle (open weights).
    - (94.448): La licence des poids définit le spectre d'utilisation du modèle (licences permissives ou restrictives).
    - (94.448): Les informations sur l'entraînement du modèle (nombre de GPU, durée, algorithme) sont importantes.
    - (94.448): Les données d'entraînement sont cruciales et souvent gardées secrètes pour maintenir un avantage compétitif.
- **Open Science et transparence des données** (217.67 - 317.337): Discussion sur l'Open Science, qui inclut les publications scientifiques et les découvertes au-delà du code. Importance de la transparence sur la nature des données utilisées pour l'entraînement des modèles.
    - (217.67): En matière d'IA, on parle d'open science, pas seulement d'open source.
    - (217.67): L'open science inclut software, modèles et connaissance au-delà du code.
    - (217.67): Les données d'entraînement distinguent les générations de modèles de langue.
    - (217.67): La transparence des données est cruciale pour le progrès de l'IA.
- **L'open source comme standard historique dans la recherche en IA** (339.786 - 443.139): L'open source a toujours été le standard dans la recherche en IA, permettant un développement mutualisé et coopératif. ChatGPT a marqué un point d'inflexion, mais il est fondamental de rester fidèle à la culture open source pour un développement rapide.
    - (339.786): L'open source et la publication ouverte ont été le standard historique pour la recherche en IA.
    - (339.786): Le développement fulgurant de l'IA est dû à la mutualisation et à la coopération.
    - (339.786): Développer en close source ralentit la recherche car chacun doit réinventer les mêmes choses.
    - (339.786): ChatGPT a poussé certains à être plus protecteurs vis-à-vis de la propriété intellectuelle.
    - (339.786): Il est fondamental de rester fidèle à la culture open source de l'IA pour un développement rapide.
- **Impact de l'open source et diversité des modèles** (443.639 - 532.132): L'open source démultiplie l'impact, avec une grande diversité de modèles disponibles sur Hugging Face. Les modèles sont utilisés, développés et affinés, améliorant la visibilité et la confiance.
    - (443.639): L'open source est un démultiplicateur d'impact.
    - (443.639): Hugging Face permet de télécharger différents modèles pour développer des solutions.
    - (443.639): Il y a une grande diversité de modèles open source, sans leader dominant.
    - (443.639): Les modèles sont finetunés et dérivés, améliorant la visibilité et la confiance.
    - (443.639): La diversité des modèles favorise l'innovation et la spécialisation des startups.
- **Diversité vs. Uniformisation de l'innovation** (532.742 - 569.127): Il n'y a pas d'uniformisation de l'innovation grâce à la diversité des acteurs, des architectures, des langues et des spécialisations des modèles. L'adaptation des modèles à des cas d'usage spécifiques crée de nouveaux modèles.
    - (532.742): Le domaine des modèles est diversifié en raison du grand nombre d'acteurs, d'architectures, de langues et de spécialisations.
    - (532.742): L'adaptation des modèles à des langues ou des cas d'utilisation spécifiques contribue à cette diversité.
    - (532.742): C'est plus divers qu'uniforme.
- **L'open source et le recrutement des talents en IA** (570.33 - 691.391): L'open source est crucial pour attirer les talents en IA, car les chercheurs sont validés par leurs publications scientifiques. Permettre la publication est un argument fort pour le recrutement.
    - (570.33): L'IA est un secteur très concurrentiel pour les talents.
    - (570.33): Il est important que les acteurs de l'IA restent open source pour attirer les talents.
    - (570.33): La carrière des chercheurs est validée par leurs publications scientifiques.
    - (570.33): Les talents les plus demandés souhaitent partager leurs découvertes.
    - (570.33): Renoncer à la publication est un sacrifice pour les talents en IA.
    - (570.33): Les grands labos ont recruté en offrant la même liberté de recherche qu'en milieu académique.
    - (570.33): La recherche scientifique ouverte est fondamentale pour attirer les meilleurs talents.
- **Les défis financiers de l'open source** (706.868 - 776.321): Discussion sur la complexité de créer un modèle capitalistiquement juste pour l'open source. Nécessité d'avoir des capitaux pour soutenir l'impact de l'open source.
    - (706.868): Les grandes entreprises investissent massivement pour attirer les meilleurs talents dans une nouvelle économie.
    - (706.868): Il faut considérer le point de vue (états, employés, chercheurs) lorsqu'on parle d'open source.
    - (706.868): La France devrait pousser l'open source car elle est en retard sur les logiciels.
    - (706.868): Il faut créer un modèle capitalistiquement juste pour avoir un impact et attirer des capitaux.
    - (706.868): Comment monétiser un modèle qui n'est pas forcément le plus évident pour amener des milliards.
- **Le rôle des investisseurs dans l'open source** (776.782 - 851.067): Distinction entre l'IA infra et les applications verticales. L'open source est clé pour les applications horizontales, mais plus complexe pour les applications verticalisées.
    - (776.782): L'open source est important pour la recherche, les startups et les investisseurs.
    - (776.782): Il faut distinguer deux catégories dans l'IA : AI infra et applications verticales métiers.
    - (776.782): L'open source est clé pour les applications horizontales car il accélère le go-to-market.
    - (776.782): Les applications verticalisées utilisent souvent des produits open pour ne pas redévelopper les modèles.
    - (776.782): Il est plus compliqué pour les applications verticalisées de mettre des choses en open car le taux de rendement interne n'est pas évident.
- **Stratégies de monétisation de l'open source** (863.899 - 923.187): Exemples de MongoDB et Elastic qui ont réussi à monétiser des technologies open source. La stratégie de monétisation pour les entreprises sur la couche horizontale est complexe.
    - (863.899): L'open source permet d'attirer les utilisateurs vers des solutions SaaS.
    - (863.899): Les entreprises modifient leurs licences pour contrer les cloud providers.
    - (863.899): La monétisation est complexe pour les entreprises horizontales à cause des enjeux géopolitiques.
    - (863.899): Le prix des LLM pourrait tendre vers zéro à cause de la compétition en Asie.
- **Le modèle économique de Hugging Face** (923.909 - 1002.018): Le hub de Hugging Face est gratuit, mais des services payants comme Enterprise Hub et la version pro génèrent des revenus. L'inférence est également une source de revenus grâce à des solutions d'inférence et des partenariats.
    - (923.909): Le hub est central et gratuit pour les utilisateurs.
    - (923.909): Enterprise Hub offre plus de contrôle et de sécurité pour les entreprises.
    - (923.909): Version pro pour les individus offre plus de quotas pour l'utilisation des GPU.
    - (923.909): L'inférence est un axe important en raison de la taille des modèles.
    - (923.909): Partage de revenus via les Influence Providers pour l'inférence.
- **L'infrastructure et les data centers dans l'open source** (1002.999 - 1154.02): L'infrastructure représente une part importante des coûts dans l'IA. Les grands groupes américains financent l'infrastructure. Nécessité de créer des infrastructures en France et en Europe.
    - (1002.999): L'open source est une question d'infrastructure et de data center.
    - (1002.999): Plus de 50% des coûts des grandes entreprises vont vers l'infrastructure.
    - (1002.999): La clé est de financer l'infrastructure.
    - (1002.999): Créer des infrastructures en France et en Europe financées par des capitaux étrangers.
    - (1002.999): Uniformiser toutes les chips et vendre un ratio performance par dollar.
- **Investissements dans les data centers en France** (1155.024 - 1204.684): La question est de savoir qui va entraîner des modèles dans ces data centers et si ces investissements permettront aux laboratoires d'IA français et européens de se développer.
    - (1155.024): Annonces d'investissements importants pour des data centers en France pour l'IA.
    - (1155.024): L'impact dépend de qui entraînera les modèles dans ces data centers.
    - (1155.024): Enjeu : Bénéficier aux laboratoires d'IA français et européens ou servir des acteurs déjà établis.
    - (1155.024): Différence entre une offre de data center globale et une stratégie de développement de l'IA en France.
- **Compétences et indépendance européenne** (1206.172 - 1269.628): La France crée de l'électricité et forme des ingénieurs, mais l'exploitation des data centers est un défi. Nécessité de créer une compétence européenne d'exploitation des data centers.
    - (1206.172): La France excelle dans la production d'électricité et la formation d'ingénieurs.
    - (1206.172): La France ne fait pas l'exploitation des data centers.
    - (1206.172): Il faut créer la compétence en Europe d'exploitation des data centers pour gagner en indépendance.
    - (1206.172): Il est préférable de développer une couche logicielle pour orchestrer la demande vers les US ou l'Asie en fonction des enjeux géopolitiques.
- **La Chine et l'innovation en IA** (1271.773 - 1442.818): La Chine publie des articles de recherche innovants et a une culture open source. L'Europe doit adopter une stratégie open source pour rattraper son retard.
    - (1271.773): La Chine a prouvé qu'elle avait de l'innovation à revendre en matière d'IA.
    - (1271.773): La Chine publie des articles de recherche innovants et transparents sur l'entraînement des modèles.
    - (1271.773): L'open source facilite le rattrapage du retard pour l'Europe.
    - (1271.773): Meta a utilisé l'open source avec Lama pour fédérer la communauté et accélérer sa recherche.
    - (1271.773): Qtai a été créé pour éviter le dilemme entre open source et revenus.
    - (1271.773): Le financement à long terme de l'open source est une question fondamentale.
- **Financement de l'open source à long terme** (1445.552 - 1472.995): La question du financement de l'open source à long terme est fondamentale. Il faut trouver un moyen de faire en sorte qu'une partie de la valeur créée par l'open source puisse retourner dans son financement.
    - (1445.552): L'open source crée énormément de valeur.
    - (1445.552): Une entreprise peut utiliser l'open source pour une levée de fonds avec une valorisation de plusieurs milliards.
    - (1445.552): Comment réinjecter une partie de cette valeur dans le financement de l'open source ?
- **Le rôle des laboratoires de recherche** (1473.558 - 1569.775): Les modèles des chercheurs finissent toujours par être utilisés en production, soulignant l'importance de la recherche ouverte.
    - (1473.558): La recherche en laboratoire est essentielle pour les avancées.
    - (1473.558): Les Transformers, base des modèles de langue, ont été inventés chez Google Brain.
    - (1473.558): La recherche fondamentale permet de prendre des risques et de réinventer les algorithmes.
    - (1473.558): Les modèles des chercheurs finissent par être utilisés en production.
    - (1473.558): L'approche de la recherche ouverte finit par triompher.
- **Conclusion : Atouts de la France et de l'Europe** (1571.357 - 1605.98): L'open source est une nécessité dans la course à l'IA. La France a des atouts, notamment les talents, pour devenir un compétiteur mondial.
    - (1571.357): L'open source est une nécessité dans la course à l'IA.
    - (1571.357): La France a des atouts pour rester dans la course et devenir un compétiteur mondial.
    - (1571.357): La France a le talent et l'appétit pour la recherche pour réussir dans l'IA.
- **Opportunités et spécialisation des modèles** (1607.816 - 1677.63): L'open source est un levier pour réussir. Il faut se démarquer, construire au-dessus de ce qui existe déjà et innover. Opportunité dans les petits modèles et la spécialisation.
    - (1607.816): L'open source est un levier pour réussir, il faut construire sur l'existant et innover.
    - (1607.816): Les petits modèles offrent une opportunité car ils demandent moins de ressources et permettent d'innover.
    - (1607.816): Il faut arrêter de croire au modèle unique et se focaliser sur plusieurs intervalles.
    - (1607.816): Il faut rendre les modèles plus frugaux et trouver un compromis entre taille et performance.
    - (1607.816): Des entreprises comme OpenAI et DeepSea réduisent la taille de leurs modèles pour réduire les coûts.
- **Capital et talents en France** (1679.43 - 1739.225): Ce qui manque, ce sont les capitaux. Le talent est là à tous les niveaux. Il faut motiver les gens à créer des business en France et avoir les moyens de faire de la recherche de pointe.
    - (1679.43): Le manque de capitaux est un frein au développement malgré la présence de talents à tous les niveaux.
    - (1679.43): Il existe un vivier de talents important dans le domaine de l'intelligence artificielle.
    - (1679.43): La France a la capacité de maîtriser toute la chaîne de valeur de la recherche, de A à Z.
    - (1679.43): Il est nécessaire de motiver les talents à créer des entreprises en France et de financer la recherche de pointe.
- **Sécuriser l'infrastructure et les capitaux étrangers** (1740.506 - 1796.23): Sécuriser l'infrastructure, voir l'IA comme une nouvelle classe d'actifs et faire attention à ne pas pénaliser les ambassadeurs de l'open source.
    - (1740.506): Sécuriser l'infrastructure des data centers.
    - (1740.506): L'IA est une nouvelle classe d'actifs nécessitant un financement spécifique.
    - (1740.506): Ne pas pénaliser les pionniers qui mettent en œuvre des réglementations comme le RGPD.
    - (1740.506): L'importance de l'ouverture et de l'auditabilité pour démontrer la transparence.


---
### Navigation pour IA
- [Index de tous les contenus](https://weare.my-memory.io/llms.txt)
- [Plan du site (Sitemap)](https://weare.my-memory.io/sitemap.xml)
- [Retour à l'accueil](https://weare.my-memory.io/)