L’intelligence artificielle (IA) continue de transformer le paysage technologique mondial, et la Suisse s’inscrit dans cette dynamique avec le lancement d’Apertus, son premier modèle de langage à grande échelle.
Développé par des institutions prestigieuses telles que l’EPFL et l’ETH Zurich, ce modèle se distingue par sa transparence et son accessibilité, répondant à une demande croissante pour des IA plus fiables et éthiques. Contrairement aux géants de la technologie qui dominent le marché avec des modèles souvent opaques, Apertus offre une alternative ouverte, destinée à favoriser l’innovation et la souveraineté numérique suisse.
Un modèle multilingue et ouvert pour la transparence
Conçu en collaboration avec le Swiss National Supercomputing Centre (CSCS), cette IA se démarque, et comme le relève Swissinfo, par sa capacité multilingue, intégrant plus de 1 000 langues, dont des langues minoritaires comme le suisse allemand et le romanche. Cette caractéristique unique vise à combler les lacunes des modèles de langage actuels qui négligent souvent ces langues.
L'essentiel Cybersécurité, IA & Tech
Rejoignez la communauté. 3 fois par semaine, recevez l'analyse des tendances par Marc Barbezat. Pas de spam, juste de l'info.
Le modèle a été entraîné sur 15 trillions de tokens, avec 40% des données non-anglophones, soulignant son engagement envers la diversité linguistique. La transparence est au cœur d’Apertus : son développement, ses paramètres et ses données d’entraînement sont entièrement documentés et accessibles, permettant aux chercheurs et développeurs d’explorer et d’adapter le modèle selon leurs besoins spécifiques.
Cette ouverture contraste avec les pratiques des grands acteurs technologiques, souvent critiquées pour leur manque de transparence. En rendant visibles tous les aspects de son processus de formation, Apertus établit une nouvelle norme en matière de confiance et de responsabilité dans l’IA. Le modèle est également conçu pour respecter les normes éthiques et légales, en conformité avec les lois suisses sur la protection des données et les obligations de transparence de l’UE. Comme le souligne ETH Zurich, cette initiative vise à fournir un cadre pour le développement d’IA souveraines et inclusives.
Un catalyseur d’innovation pour la Suisse
En plus de sa conception ouverte, Apertus se présente comme un moteur d’innovation pour la Suisse, renforçant son expertise en IA à travers la recherche, la société et l’industrie. Le modèle est disponible sous une licence open-source, permettant une utilisation libre dans les domaines éducatifs et commerciaux. Cette approche vise à stimuler la créativité et le développement de nouvelles applications, comme le détaille l’EPFL. Le modèle est disponible en deux tailles, avec 8 milliards et 70 milliards de paramètres, la version plus petite étant adaptée aux usages individuels.
Cette flexibilité permet aux développeurs de créer des outils personnalisés tels que des chatbots ou des systèmes de traduction, tout en bénéficiant de la robustesse d’un modèle soutenu par des institutions de renom. En outre, Swisscom, en tant que partenaire stratégique, facilite l’accès à Apertus via sa plateforme AI souveraine suisse, soulignant l’engagement du pays à façonner un écosystème IA sécurisé et responsable. Apertus est ainsi positionné comme une infrastructure publique, à l’instar des routes ou de l’électricité, démontrant que l’IA peut servir le bien commun.
Souveraineté technologique et avenir de l’IA
Le lancement d’Apertus s’inscrit dans un mouvement plus large de souveraineté technologique en Europe. Face à la domination des modèles IA de grandes entreprises américaines et chinoises, la Suisse prend position pour une IA plus conforme aux normes locales et moins soumise aux pressions réglementaires étrangères. Le modèle est soutenu par un financement gouvernemental et plus de 10 millions d’heures GPU sur l’infrastructure informatique suisse, ‘Alps’. Comme le rapporte Sifted, cette initiative vise à assurer une transparence totale et à offrir des avantages de conformité aux entreprises européennes.
Apertus n’est que le début d’un engagement à long terme pour des fondations IA ouvertes et souveraines. Les futures versions du modèle chercheront à élargir la famille de modèles, à améliorer l’efficacité et à explorer des adaptations spécifiques à certains domaines comme le droit, le climat, la santé et l’éducation. Cette démarche illustre la volonté de la Suisse de jouer un rôle de leader dans le développement d’IA éthique et transparente, tout en répondant aux besoins variés de la société moderne.
Une ouverture saluée mais aussi débattue
Depuis sa présentation officielle, Apertus suscite un large intérêt mais aussi quelques réserves au sein de la communauté scientifique. Selon Swissinfo, plusieurs observateurs rappellent que le modèle n’est pas destiné à concurrencer directement les outils conversationnels grand public tels que ChatGPT, mais à servir de socle pour des solutions spécialisées développées par des tiers. Une précision importante, tant certains utilisateurs avaient initialement interprété son lancement comme celui d’un assistant suisse autonome.
Les chercheurs de l’ETH Zurich précisent également que les premières versions d’Apertus montrent encore certaines limites, notamment en matière de cohérence contextuelle et de gestion des langues à faible représentation. Ces imperfections sont considérées comme normales à ce stade et devraient être corrigées à mesure que le modèle sera affiné grâce aux contributions de la communauté open-source.
Transparence et gouvernance éthique
L’un des points les plus commentés concerne la gouvernance du projet. Contrairement aux géants privés, le code, les poids et les données d’entraînement d’Apertus sont intégralement publiés. Cette transparence, que l’EPFL qualifie de « rupture méthodologique », permet aux chercheurs de comprendre les biais potentiels du modèle et d’y remédier collectivement. Le filtrage des données a par exemple entraîné la suppression de près de 8 % des tokens anglophones pour respecter les sites ayant exprimé un refus d’indexation. Une mesure saluée pour sa conformité éthique, mais qui réduit aussi la richesse du corpus linguistique.
L’ouverture complète du modèle pose également des questions de sécurité et de contrôle. Plusieurs experts interrogés soulignent que le libre accès à un modèle aussi puissant nécessite des mécanismes clairs de supervision, afin d’éviter les dérives d’usage, notamment la génération de contenus trompeurs ou la réutilisation non encadrée des poids du modèle.
Une infrastructure stratégique pour l’Europe
Sur le plan politique, Apertus marque une étape symbolique pour la souveraineté technologique européenne. Comme le détaille InfoWorld, son positionnement est stratégique : un modèle transparent, conforme au futur cadre du AI Act européen, offrant aux entreprises une alternative crédible aux solutions américaines et chinoises. Pour la Suisse, ce projet démontre qu’un petit pays peut jouer un rôle moteur dans la redéfinition de la gouvernance de l’IA.
L’initiative ouvre la voie à des coopérations régionales : l’EPFL a déjà annoncé que des laboratoires allemands et autrichiens participeraient aux prochaines phases d’entraînement, notamment pour élargir le spectre linguistique et thématique. De même, Swisscom prévoit d’intégrer Apertus à sa plateforme souveraine afin d’en faciliter l’accès à des partenaires publics et privés, tout en garantissant un hébergement sécurisé sur sol suisse.
Vers un modèle d’intérêt public
Plus qu’un projet de recherche, Apertus se veut une infrastructure publique de confiance. Comme le rappelle ETH Zurich, l’objectif n’est pas seulement de fournir un modèle performant, mais d’ancrer une philosophie : celle d’une IA au service du bien commun, ouverte, traçable et responsable. Les futures évolutions d’Apertus devraient intégrer des capacités de retrieval-augmented generation (RAG), permettant au modèle de s’appuyer sur des bases documentaires actualisées pour améliorer la pertinence de ses réponses
À travers cette approche, la Suisse affirme une vision singulière de l’intelligence artificielle : non pas celle d’une compétition de puissance, mais d’une gouvernance partagée et transparente. Un pari audacieux qui pourrait bien inspirer, au-delà des frontières, une nouvelle manière d’envisager la place de l’IA dans nos sociétés.
Qu’est-ce que le Retrieval-Augmented Generation (RAG) ?
Le Retrieval-Augmented Generation (RAG) est une approche d’intelligence artificielle qui combine deux capacités : la recherche d’informations et la génération de texte. Contrairement aux modèles de langage traditionnels, qui produisent leurs réponses uniquement à partir des données sur lesquelles ils ont été entraînés, un système RAG peut interroger en temps réel des sources externes — bases de données, documents, sites web ou dépôts internes — avant de formuler sa réponse.
Concrètement, le modèle commence par une phase de retrieval (recherche) pour identifier les passages les plus pertinents dans un ensemble de textes. Ces extraits sont ensuite injectés dans le processus de generation (rédaction), permettant au modèle de produire une réponse plus précise, contextualisée et actualisée.
Cette approche présente plusieurs avantages :
Réduction des hallucinations, car les réponses reposent sur des documents vérifiables ;
Mise à jour continue des connaissances sans nécessiter un nouvel entraînement complet du modèle ;
Traçabilité des sources utilisées, favorisant la transparence et la vérifiabilité des résultats.
Pour un modèle ouvert comme Apertus, l’intégration d’un système RAG constitue une fonctionnalité importante, lui permettant d’exploiter des corpus dynamiques — par exemple des textes juridiques, des données climatiques ou des documents éducatifs — tout en préservant les principes de transparence et de souveraineté des données.
Pour approfondir le sujet
Apertus, projet suisse majeur en IA, aura une nouvelle version au printemps – Le Temps
Le modèle de langage développé notamment par l’EPFL et l’EPFZ, critiqué à ses débuts pour la qualité de ses résultats, sera bientôt enrichi de nouvelles fonctions Lire la suite
Serveurs, API, temps de veille...
DCOD est indépendant et sans revenus. Soutenez le site pour l'aider à couvrir ses frais techniques.
