Niki Parmar et les architectes cachés : des femmes qui transforment l'IA dans l'ombre

Lorsqu’on évoque les avancées révolutionnaires qui ont façonné l’intelligence artificielle moderne, peu peuvent résister à mentionner Demis Hassabis, Sam Altman ou Elon Musk. Pourtant, pour chaque nom connu qui capte l’attention des médias, il existe des individus exceptionnellement discrets dont les contributions se sont avérées tout aussi—voire plus—fondamentales pour l’évolution du domaine. Parmi ces pionnières méconnues, plusieurs femmes remarquables dont le travail a littéralement réécrit ce qui est possible en IA. Niki Parmar en est un exemple emblématique : en tant que l’un des huit auteurs principaux de l’architecture Transformer, ses empreintes sont intégrées dans presque tous les grands modèles linguistiques actuels, de ChatGPT à GPT-4, pourtant son nom apparaît rarement dans les discussions technologiques grand public.

Ce schéma historique n’est pas nouveau. Ada Lovelace a écrit le premier programme informatique de l’histoire humaine, mais combien connaissent son nom ? Elaine Rich a rédigé le premier manuel sur l’intelligence artificielle, mais elle reste largement oubliée dans la conscience collective. L’« Effet Matilda »—la tendance systématique à créditer les réalisations scientifiques à des collègues masculins plutôt qu’aux chercheuses qui ont effectué le travail—continue de fausser notre compréhension de ceux qui ont façonné le progrès technologique. C’est précisément pourquoi reconnaître ces femmes est important.

ImageNet et l’aube du Deep Learning : la contribution fondamentale de Fei-Fei Li

La révolution moderne de l’IA trouve un moment fondateur clair : 2012, lorsque le réseau de deep learning appelé AlexNet a connu un succès sans précédent dans la reconnaissance d’images. Pourtant, peu retracent cette avancée à sa véritable origine. En 2009, Fei-Fei Li, alors assistante professorale à Princeton, a proposé ImageNet—une idée radicale qui allait transformer la façon dont les chercheurs abordaient l’apprentissage automatique. Plutôt que de coder manuellement des algorithmes spécifiques pour reconnaître chiens ou chats, elle a intuité que le goulot d’étranglement n’était pas la capacité algorithmique, mais les données.

Née à Pékin en 1976 et élevée à Chengdu, Fei-Fei Li a immigré aux États-Unis à 12 ans, parlant pratiquement pas anglais. En deux ans, elle maîtrisait la langue tout en démontrant un talent mathématique exceptionnel. Elle a intégré Princeton avec une bourse d’études et revenait presque chaque week-end aider à gérer l’entreprise de nettoyage à sec de sa famille. En 2007, malgré ces défis, elle était devenue assistante professorale.

Sa vision pour ImageNet était à la fois simple et audacieuse : créer une base de données massive, systématiquement étiquetée, d’images—finissant par atteindre 15 millions d’échantillons—qui permettrait aux chercheurs de comparer équitablement différentes approches algorithmiques. La mise en œuvre, cependant, nécessitait de l’innovation. Les premières initiatives de crowdsourcing souffraient de travailleurs cliquant au hasard sur les tâches. Fei-Fei a intégré des images de contrôle—comme des photos de golden retrievers pré-vérifiées—pour vérifier la précision des contributeurs. Ce mécanisme de contrôle de qualité a transformé le crowdsourcing brut en une production de données fiable.

L’impact ne peut être sous-estimé. La victoire d’AlexNet en 2012 au concours ImageNet n’a pas été le fruit du hasard ; elle a été rendue possible par l’infrastructure que Fei-Fei Li avait construite. Aujourd’hui, lorsque les chercheurs évoquent des moments clés en IA, ils parlent souvent de « l’instant ImageNet »—une expression devenue synonyme de jeux de données transformatifs. Véhicules autonomes, reconnaissance faciale, détection d’objets—tous puisent leur origine dans ce travail.

Niki Parmar : orchestrer la révolution Transformer

La vague des grands modèles linguistiques a semblé culminer avec l’émergence de ChatGPT, mais son véritable point de départ se trouve dans un seul article de 2017 : « Attention is All You Need », rédigé par huit ingénieurs de Google. L’architecture Transformer décrite dans cet article est devenue la base sur laquelle presque tous les systèmes d’IA contemporains sont construits. Pourtant, de manière remarquable, beaucoup ignorent qu’une des auteures principales de cet article est une femme : Niki Parmar.

Originaire d’Inde, Niki Parmar a étudié au College of Computer Technology de Pune avant de poursuivre un master en informatique à l’Université de Californie du Sud à partir de 2013. Pendant ses années de licence, elle a découvert sa passion grâce aux MOOCs révolutionnaires d’Andrew Ng et Peter Norvig sur l’apprentissage automatique et l’IA. « J’étais curieuse de la puissance combinée des données, de la reconnaissance de motifs et de l’optimisation », se souvient-elle plus tard. Cette curiosité intellectuelle a orienté sa carrière.

Après avoir obtenu son diplôme en 2015, Niki Parmar a rejoint la division recherche de Google, initialement pour relever des défis purement théoriques. En 2017, elle faisait partie des architectes clés qui ont redéfini la technologie fondamentale de l’IA. Sur sa méthode de recherche innovante, elle offre un aperçu précieux : « Au début, la quantité d’informations autour de moi m’écrasait. Se concentrer sur un problème précis et l’explorer en profondeur avec des pairs vous aide à poser les bonnes questions. » Cette philosophie—la profondeur plutôt que la largeur, la collaboration plutôt que l’isolement—a caractérisé ses projets ultérieurs.

L’article sur le Transformer n’a pas seulement représenté une réussite académique pour Niki Parmar ; il a été un tremplin entrepreneurial. Elle a cofondé Adept AI avec son collègue Ashish Vaswani, qui était le premier auteur de l’article. La société a levé 350 millions de dollars—un vote de confiance significatif dans leur vision. Reconnaissant ses propres axes de focus, Niki Parmar a également cofondé Essential AI, qu’elle gère comme son principal projet. Essential AI a levé 56,5 millions de dollars auprès de géants de la tech comme AMD, Google et Nvidia, validant la stratégie des fondateurs dans le domaine de l’infrastructure et de la recherche en IA.

Daniela Amodei : la cofondatrice d’Anthropic axée sur la sécurité

Si la couverture médiatique d’Anthropic insiste souvent sur le fait qu’elle a été fondée par « sept chercheurs ayant quitté OpenAI », cette formulation masque un fait crucial : Daniela Amodei, présidente et cofondatrice de l’entreprise, a été systématiquement sous-représentée, malgré son rôle déterminant dans la vision et la stratégie. En réalité, Anthropic a été fondée par deux frères et sœurs—Daniela et Dario Amodei—dont les compétences complémentaires ont créé une structure de leadership exceptionnellement équilibrée.

Le parcours professionnel de Daniela révèle une trajectoire atypique pour une dirigeante technologique. Elle a obtenu des licences en littérature anglaise, en politique et en littérature musicale—une formation humaniste qui a nourri son intérêt pour l’alignement des valeurs humaines en IA. Son début de carrière dans la politique et le secteur non lucratif a développé ses capacités stratégiques et organisationnelles. En 2013, alors que Stripe était encore une startup peu connue, elle y a rejoint en tant que première employée, contribuant à en faire une entreprise de plusieurs dizaines de milliards de dollars.

Chez Stripe, elle a occupé des rôles qui se sont avérés essentiels chez OpenAI et Anthropic : recrutement, gestion des risques et coordination interfonctionnelle. Elle a dirigé des équipes analysant plus de 7000 cas potentiels de fraude ou de violation de politique chaque année, réduisant les pertes de 72 %—atteignant ainsi un niveau historiquement bas. Cette excellence opérationnelle et cette discipline en matière de risques sont devenues sa marque de fabrique.

En 2018, elle a rejoint OpenAI en tant que vice-présidente de la sécurité et des politiques, supervisant non seulement les équipes de sécurité technique, mais aussi les ressources humaines, le recrutement, la formation et la diversité. En 2021, elle a cofondé Anthropic avec son frère, apportant cette philosophie de sécurité d’abord dans une organisation explicitement construite autour du principe que les systèmes d’IA doivent s’aligner sur les valeurs humaines.

Mira Murati : la leader discrète de la technologie chez OpenAI

Depuis 2022, Mira Murati occupe le poste de directrice technique d’OpenAI—une distinction dont beaucoup dans le monde de la tech ignorent l’existence. Elle a rejoint OpenAI en 2018, a été promue vice-présidente senior en 2020, supervisant la recherche, les produits et les partenariats, et a guidé le développement de ChatGPT, DALL-E et GPT-4.

Née en Albanie en 1988 et formée au Canada, le parcours de Mira est ancré dans l’ingénierie. À Dartmouth, elle s’est distinguée en construisant une voiture de course hybride dans le cadre d’un projet scolaire—un signe précoce de sa mentalité pratique et orientée résolution de problèmes. Après une brève expérience dans l’aérospatiale, elle a rejoint Tesla en tant que chef de produit senior pour Model X, où son exposition à Autopilot a éveillé un vif intérêt pour l’intelligence artificielle.

Sur sa motivation intellectuelle, elle a déclaré un jour : « L’ennui est un moteur puissant pour explorer et repousser les frontières de tout. » Cette philosophie a guidé sa trajectoire chez OpenAI, où elle reste profondément impliquée dans les projets les plus ambitieux. Le développement de ChatGPT, peut-être la réalisation la plus emblématique d’OpenAI, s’est effectué sous sa direction technique. En 2023, lorsque Microsoft a investi 13 milliards de dollars dans OpenAI—un partenariat négocié et géré par Murati—le PDG Satya Nadella a salué publiquement sa capacité à « rassembler une équipe dotée d’une expertise technique, d’un sens des affaires et d’une compréhension profonde de l’importance de la mission de l’IA. »

Son influence dépasse le développement produit. Lors de crises internes—y compris des conflits de leadership menaçant la stabilité de l’organisation—sa voix sur des questions cruciales a eu un poids considérable. Pourtant, contrairement à certains pairs marginalisés, Mira a conservé sa position au sein d’OpenAI, continuant à façonner la direction technique et stratégique de l’entreprise.

Timnit Gebru : l’éthicienne qui a refusé de rester silencieuse

La récente décision de Google de retirer son modèle Gemini de génération d’images à partir de texte, en raison de préoccupations éthiques liées à l’IA, fait écho à un conflit plus ancien et plus dramatique : la dispute de 2020 impliquant Timnit Gebru, alors chercheuse en IA chez Google, qui a publiquement critiqué l’entreprise pour ce qu’elle décrivait comme son licenciement en représailles à ses préoccupations sur les biais algorithmiques.

Née en 1983 en Érythrée et en Éthiopie, Timnit Gebru a obtenu son doctorat en génie électrique à Stanford en 2014, en se spécialisant dans la vision par ordinateur et l’apprentissage automatique. Plutôt que de suivre le chemin conventionnel de l’optimisation des performances des modèles, elle s’est consacrée à la recherche sur l’équité, la responsabilité, la transparence et l’éthique dans l’IA.

Son travail révolutionnaire a montré que les systèmes de reconnaissance faciale commerciaux avaient une précision nettement inférieure pour identifier les femmes et les personnes de couleur—une découverte aux implications profondes. Ses recherches ont directement influencé la décision d’Amazon de cesser son service de reconnaissance faciale Rekognition, illustrant comment une recherche éthique rigoureuse peut entraîner une responsabilisation concrète des entreprises.

En 2020, Gebru a coécrit un article critiquant l’impact environnemental des grands modèles linguistiques et leur manque de diversité dans leur développement. La direction de l’IA chez Google a rejeté la publication, affirmant qu’elle « ne répondait pas à nos standards de publication ». Lors d’un conflit ultérieur avec l’entreprise, son email professionnel a été désactivé alors qu’elle était en vacances—une mesure qui a déclenché une réaction mondiale. Plus de 1500 employés de Google ont signé une pétition en sa faveur, rejoints par plus de 2000 chercheurs, dirigeants d’ONG et pairs de l’industrie.

Malgré cette solidarité sans précédent, Gebru a finalement quitté Google. Plutôt que de disparaître des projecteurs, elle a créé DAIR (Distributed AI Research Institute), une organisation indépendante conçue explicitement pour contrer l’influence démesurée des grandes entreprises technologiques dans la recherche et le déploiement de l’IA. Sur sa mission, elle a déclaré simplement : « Je ne peux pas attendre que les grandes entreprises technologiques résolvent enfin les problèmes que pose l’IA. »

La vision d’ensemble : pourquoi la reconnaissance est essentielle

Les réalisations de ces cinq femmes—Fei-Fei Li, Niki Parmar, Daniela Amodei, Mira Murati et Timnit Gebru—représentent bien plus que des histoires de succès individuelles. Elles illustrent un schéma systémique : pour chaque technologue masculin acclamé et médiatisé à l’excès, de nombreuses femmes, tout aussi ou plus compétentes, œuvrent dans l’ombre, leurs contributions systématiquement sous-estimées et leurs voix souvent marginalisées.

Il existe une filiation entre ces figures. Timnit Gebru a travaillé sous la tutelle de Fei-Fei Li—un rappel que le progrès se construit souvent génération après génération, avec les pionnières plus anciennes ouvrant la voie à celles qui suivent. Pourtant, ce cycle reste fragile et insuffisant. Les barrières structurelles—investissements inégaux, formation mathématique insuffisante pour les filles, discrimination en milieu professionnel—continuent de freiner la talentueuse force féminine à grande échelle.

Aucun article unique ne peut démanteler ces inégalités systémiques. C’est précisément pourquoi la Journée internationale des femmes existe, et pourquoi les initiatives en faveur des femmes dans la technologie restent essentielles. Mais en ce jour, prenez un moment pour vous souvenir de ces architectes de l’IA. Reconnaissez leur mérite là où il est réellement dû.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler

Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)