L’introduction de l’IA risque d’impacter et d’avoir de nombreuses conséquences au sein de toutes les entreprises. Les facteurs générateurs de risque : Qualité, quantité et pertinence des données utilisées notamment, mais aussi les faiblesses des IHM (Interface Homme Machine) des IA.
Rappel des différents types d’IA communément utilisées :
Machine learning (ML) : avec l’apprentissage automatique, les machines découvrent leurs propres algorithmes, ou modèles, sur la base de données qui leur permettent « d’apprendre » le problème qu’elles tentent de résoudre. Plus elles reçoivent de données, plus le potentiel des résultats est important. Au début, le processus d’apprentissage peut impliquer l’intervention d’humains qui vont « étiqueter » les résultats corrects. Au fil du temps, cet élément humain devient moins nécessaire, les résultats obtenus gagnant progressivement en précision.
Grand modèle de langage (LLM) : basés sur l’apprentissage profond – un sous-ensemble du ML, les LLM sont pré-entraînés. Ils s’appuient sur des réseaux neuronaux composés de dizaines de millions de paramètres pour traiter de grands volumes de données en parallèle. Qu’ils fonctionnent en mode d’apprentissage autosupervisé ou semi-supervisé, leur objectif n’est pas seulement d’obtenir des connaissances. Ils cherchent en effet à reproduire des facettes contextuelles de la connaissance : la syntaxe, la sémantique et d’autres traits ontologiques des êtres humains, comme nos façons de penser et de communiquer.
IA générative : technologie capable de générer des médias (texte, images, etc.) en réponse à une invite, ou « prompt », après avoir appris les structures de ses données d’entraînement. Sur la base des données fournies par les utilisateurs dans le prompt, l’IA applique des techniques de ML en traitant les données via des réseaux neuronaux. Le média qui en résulte peut être utilisé dans de multiples applications : création d’œuvres d’art inspirées, code pour la conception de logiciels, rédaction de documentations, d’articles et de rapports, enrichis de citations – et bien d’autres choses encore.
Quels sont les principaux risques avec la mise en place de l'IA ?
- Périmètre de données accessibles
La tentation est grande de donner accès à un maximum de données de l’entreprise, et de ce fait donner des droits d’accés qui ne seraient pas justifiés.
- Obsolescence et perte de ‘Ownership’ des données analysées
Les données analysées par l’IA doivent être de très grande qualité, leurs durées de vie bien maitrisées et leurs propriétaires clairement identifiés.
- Corruption des données d‘apprentissage
Les données d’apprentissages (apprentissage supervisé, apprentissage non supervisé et apprentissage par renforcement) sont déterminantes dans la production de résultats par l’IA. Mal protégées et corrompues elles donneront des résultats complètement imprévisibles.
- Fragilité de l’interface de IA (IHM)
Les IHM des IA sont encore très rudimentaires et facilement piratables. Ce qui permettrait à un hacker de faire travailler l’IA à des fins de piratages.
La solution digitale d’Oxial a été adaptée pour mieux appréhender ces nouveaux risques en maitrisant le périmètre de données accédées et en sécurisant les IHMs des IA et leurs conteneurs de données d’apprentissage.