Autor/in : Tony Franzky
Pour ce texte, vous disposez d'environ 4 minutes
Wqu'est-ce que les Deepfakes ?
Le terme "Deepfake" est une combinaison de Deeplearning et de Fake. Il s'agit de la manipulation, de la transformation ou de l'élaboration scientifique d'éléments multimédias à l'aide de l'intelligence artificielle (IA) ou d'algorithmes d'IA. Le concept des fiches n'est donc pas nouveau : Seien es Urkunden, Artefaktedes œuvres d'art, des livres de poche, des objets. La nouveauté réside également dans la technique utilisée. Lorsque l'on ne disposait pas auparavant de toutes les techniques de dessin à la main, ou que l'on a passé quelques heures à travailler sur Photoshop afin d'afficher son image sur un autre papier, on utilise une technologie qui permet d'obtenir des résultats très rapides et très faciles à obtenir. Les éléments qui ont été supprimés n'ont donc aucun effet négatif. Il peut s'agir de vidéos, de photos, d'expressions ou d'autres choses.
Comment les Deepfakes ont-ils été conçus ?
Les fondements techniques du Deepfake ont déjà été établis dans les années 90, mais ce n'est qu'avec l'augmentation massive de la capacité de traitement des données et de la technologie de récupération que le "Deepfaking" a commencé à être utilisé par une grande partie de la population. 2016 etwa stellte Adobe VoCo un logiciel de traitement de la parole qui, en tant que preuve de concept, n'a pas été intégré à Adobe CC, mais qui a été baptisé "Photoshop für Audioaufnahmen" (Photoshop pour les enregistrements audio).
L'un des phénomènes les plus connus dans le domaine du cinéma non-commercial est la manipulation visuelle de divers films, dans lesquels Nicolas Cage à l'aide du "FaceSwapping" (l'échange de visages) dans divers films et scènes a été manipulé à la hache.
Comme c'est souvent le cas avec les nouvelles technologies, l'utilisation à des fins érotiques et pornographiques[2] est également très évolutive. C'est ainsi que l'on trouve de plus en plus de films (noirs) dans lesquels on peut voir des personnes qui n'ont été manipulées qu'à l'aide du KI.
L'application "DeepNude" constitue un autre exemple. Cette application permet d'obtenir une application de type "rayons X" et, grâce à la technologie KI, de "cacher" les vêtements des personnes sur les photos. Il n'est pas surprenant que ce système n'ait été utilisé que pour le sexe féminin, ce qui a donné lieu à plus de 500 000 téléchargements, à un débat passionné et à une discussion animée sur l'utilisation de la technologie KI. hier et hier. Suite à cela, les utilisateurs ont abandonné l'application et l'ont transférée dans un autre site. message sur Twitter zu, dass die Welt wohl noch nicht bereit dafür ist. L'Internet n'étant pas encore disponible, il existe toujours des images et des sons inédits (notamment grâce à des logiciels d'aide) qui ne sont pas accessibles au public.
Et comment fonctionne un Deepfake ?
Non ja, depuis quelques temps, je me suis procuré pour le travail une machine à pop-corn. Peut-être aussi un Slushymaker et un Zuckerwattemaschine. En outre, j'ai acheté une boîte à gâteaux, une boîte à gâteaux très grande et un chariot élévateur. Comme il n'est pas si facile de programmer soi-même ces choses et de les utiliser ensuite avec un lecteur 3D, je dois aussi - de manière très moderne - exprimer les souhaits très exigeants que mon chef m'a adressés. Sa réponse a été... encore une fois, non.

Mais ce n'est pas un problème. Comme nous le savons tous, il est possible d'obtenir un grand nombre de résultats avec "Vektor et NLP". Les modèles de formation continue ne nécessitent qu'une petite période de temps de 5 semaines pour que les résultats soient déjà très satisfaisants.
L'un d'entre eux décrit Corentin Jemine dans son mémoire de maîtrise. mémoire de maîtrise et est déjà disponible sur GitHub[3] verfügbar.
L'installation est simple et, grâce à un fichier "requirements.txt", il ne faut que quelques minutes pour installer toutes les bibliothèques Python existantes. (Si l'on utilise des outils aussi performants pour des bibliothèques comme Tensorflow, cela peut devenir une entreprise nerveuse).

Une fois tout cela installé, l'utilisateur (surtout s'il n'a pas de connaissances en programmation) n'a besoin que d'une palette de mots et peut générer ses propres Deepfakes directement dans la fenêtre de commande ou dans une fenêtre graphique.

Je n'ai plus qu'à faire l'éloge de mon chef et à prendre une saucisse et le tour est joué !
L'original
La fausse Nachricht
Und der Unterschied ? Naja, man hört es schon, sodass ich etwas tricksen musste. Il s'agit en fait d'un modèle anglais de remplacement. Si je veux que ce soit encore mieux, il faut que je le fasse naturellement à la nuit tombée. Cela exige certes un peu plus de compétences, mais ce n'est pas un problème. Les bases du modèle sont donc constituées, dès le départ, d'exemples linguistiques en allemand, qui ont été annotés. La base du modèle de Corentine était essentiellement Librispeech. Il s'agit d'excellents disques durs de 1 To et d'une nouvelle carte graphique que l'on peut utiliser pour s'entraîner. Et si l'on veut faire soi-même ce que l'on veut ? Un échantillon audio permet d'obtenir rapidement des résultats si l'on dispose de quelques livres de poche et d'un livre en guise de transcription. Avec un peu d'effort et de travail, on peut en faire un outil de formation et ensuite réaliser une langue étrangère.
Et pourquoi tout cela ?
Jusqu'à présent, il existait déjà des outils qui permettaient d'utiliser Voiceclonig même en mode mixte. Etwa das aus dem obigen GitProjekt entstandene resemble.ai, Lyrebird ou Cereproc.
C'est très bien si l'on peut utiliser le système de navigation automatique pour trouver la voix de son ami ou si l'on peut tout simplement créer un livre avec la voix de Morgan Freeman. Cette technologie peut également être utilisée dans les films. des résultats impressionnants sont produites. Et même si, dans les films, les modèles en CGI peuvent être remplacés par des applications de gestion (ou de contrôle) plus performantes.
Cependant, cette technologie a encore beaucoup de chances d'être utilisée à mauvais escient. Dès le mois de septembre 2019, les entreprises ont reçu, par le biais d'un stimulus généralisé des PDG, une somme de 220 000 euros à débourser pour l'achat d'une voiture. Summe von umgerechnet 220.000 Euro zu erbeuten indem sie einen Telefonanruf fingierten.
Si l'on sait déjà qu'il existe des cartes de crédit avec authentification de la langue, les Deepfakes et surtout le Voicecloning ont désormais une autre dimension. C'est d'autant plus vrai que de nombreuses entreprises de petite taille n'ont toujours pas accès aux mécanismes de validation des données linguistiques et audio. Il en va de même pour l'enregistrement de vidéos (en temps réel), notamment par le biais de DeepFaceLab
Schluss und Anmerkungen (en anglais)
Nun, aus meinen Wünschen ist leider (noch) nichts geworden. D'autant plus que, comme le dit si bien un collège, tous les autres membres de mon grand livre d'or doivent être présents dans le serveur. Ce thème est donc passionnant, car il montre que les thèmes tels que la compétence en matière d'information, l'assistance technique et l'utilisation efficace des technologies modernes sont de plus en plus au centre de l'attention dans ce domaine.
-
[1]:Eine sehr gute bibliografische Sammlung zum Thema (Kunst-)Fälschungen findet sich bei der Uni Bibliothek Heidelbergqui, dans le cadre du projet DFG "arthistoricum.net - Fachinformationsdienst Kunst", est hébergée et exploitée.
[2]:Für weitere Informationen : https://scholarship.law.duke.edu
[3] : GitHub est l'un des principaux dépositaires de logiciels. Il s'agit d'un outil de gestion des versions pour les projets logiciels.