WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Quelles sont les applications de l'intelligence artificielle (ia) dans la production musicale ?


par Romain Hervy
ESRA Bretagne  - Bac+3 en technique du son 2023
  

Disponible en mode multipage

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

Romain Hervy ISTS 3 Musique 2022/2023

Quelles sont les applications de

l'intelligence artificielle (IA) dans la

production musicale ?

1 sur 51

Directeur de mémoire : Julien Henocq ESRA BRETAGNE

2 sur 51

Sommaire

Note d'intention. 3

Introduction. 4

I - L'intelligence et l'IA. 5

1) Qu'est-ce que l'intelligence ? 5

2) Qu'est-ce que l'intelligence artificielle ? 6

A) Le fonctionnement d'une intelligence artificielle. 9

B) Le Machine Learning (ou apprentissage automatique). 12

C) Le Deep Learning (ou apprentissage profond). 14

D) Réseaux de neurones. 17

II L'IA dans la production musicale. 20

Les plug-ins et les logiciels intelligent. 20

III Écoutes critiques. 33

Daddy's car (a song composed by Flow Machines) 33

SKYGGE feat. Kiesza « Hello Shadow » 35

Holly Herndon - PROTO 37

Travis Bott - Jack Park Canny Dope Man 39

Conclusion. 41

Annexes. 42

3 sur 51

Note d'intention.

« Les applications de l'intelligence artificielle (IA) dans la création

musicale. »

L'intelligence artificielle (IA) m'a toujours captivée, suscitant en moi un intérêt particulier quant à son fonctionnement. Parallèlement, la musique a toujours été une part intégrante de ma vie, tant par ma pratique artistique que par mon écoute quotidienne. Ainsi, il m'est apparu pertinent d'orienter mon mémoire vers l'intégration de l'intelligence artificielle dans le domaine de la production musicale.

Au cours des dernières années, nous avons assisté à des avancées significatives dans l'utilisation de l'IA dans le secteur musical. De nombreuses plateformes et logiciels ont émergé, offrant aux utilisateurs des outils basés sur l'intelligence artificielle pour créer, composer, produire et même analyser la musique. Les artistes, les producteurs et les auditeurs sont confrontés à de nouvelles opportunités et à de nouveaux défis, allant de la question de l'originalité artistique à l'impact sur l'emploi dans l'industrie musicale. Cette fusion entre l'IA et la musique offre de vastes possibilités et présente un potentiel créatif passionnant. C'est pourquoi ce sujet, en plus d'être d'une grande pertinence à mes yeux, revêt un intérêt particulier de par sa résonance avec l'actualité du moment.

Le but de mon mémoire est de fournir une vue d'ensemble des différentes applications de l'IA dans la production musicale, en explorant les avantages et les inconvénients de l'utilisation de ces technologies. J'entends examiner comment l'IA peut être utilisée pour générer automatiquement des compositions musicales, améliorer les performances d'enregistrement, faciliter le processus de mixage et de mastering, ou même créer de nouvelles sonorités innovantes. Je suis convaincu que cette recherche contribuera à enrichir les connaissances sur l'interaction entre l'intelligence artificielle et le monde de la musique, ouvrant ainsi de nouvelles voies pour l'innovation et la créativité artistique.

4 sur 51

Introduction.

Afin de mener à bien ces recherches, il convient tout d'abord de définir l'intelligence dans son sens le plus large, ainsi que l'intelligence artificielle à travers ses courants majeurs. Ensuite, nous nous concentrerons sur l'aspect technique de cette discipline en expliquant les concepts fondamentaux tels que le Machine Learning, le Deep Learning et le fonctionnement des réseaux neuronaux.

Dans un second temps, nous démontrerons la pertinence des intelligences artificielles dans les domaines de la composition, du mixage et du mastering, en mettant à l'épreuve différents plug-ins et logiciels intelligents. Nous procéderons à des tests concrets, en utilisant moi-même ces outils, afin d'évaluer leur efficacité.

Enfin, nous illustrerons nos propos en analysant des oeuvres créées à l'aide d'intelligence artificielle, telles que « Hello Shadow » et « Daddy's Car » de l'artiste SKYGGE, « PROTO » de Holly Herndon, ou encore « Jack Park Canny Dope Man » de Travis Bott.

En conclusion, nous identifierons les multiples applications et possibilités offertes par ces « intelligences artificielles » dans le domaine de musical. Nous chercherons à les tester, à les étudier et à comprendre en quoi elles sont véritablement des intelligences artificielles, en soulignant leurs atouts et leurs limites. Ainsi, la problématique proposée s'articulera autour des applications de l'intelligence artificielle dans la production musicale et permettra de répondre de manière approfondie à cette question essentielle.

5 sur 51

I - L'intelligence et l'IA .

1) Qu'est-ce que l'intelligence ?

Dans cette première partie, nous allons explorer les notions d'intelligence générale et d'intelligence artificielle, mettant en évidence leurs similitudes et leurs différences, tout en définissant ces deux concepts.

Pour commencer, il nous est essentiel de clarifier la notion d'intelligence au sens large du terme. L'intelligence désigne la capacité d'un être à comprendre, à apprendre, à résoudre des problèmes, à s'adapter à son environnement et à prendre des décisions de manière efficace. Elle englobe des facultés cognitives telles que la perception, l'apprentissage, le raisonnement, la créativité et l'adaptabilité.

Pour appuyer le concept d'intelligence, nous allons nous pencher sur les travaux de Howard Gardner, professeur à Harvard ayant basé ses recherches sur les enfants en échec scolaire, et ayant proposé la Théorie de l'Intelligence Multiple. Sur les neufs formes d'intelligence abordé par Howard Gardner, nous pouvons porter notre intérêt sur trois formes en particulier, car elles sont en liens avec celle que l'on peut retrouver dans les IA.

· L'intelligence logico-mathématique : elle représente la capacité à travailler à l'aide de chiffres, à analyser des situations, à mettre au point des raisonnements.

· L'intelligence verbo-linguistique : il s'agit de la capacité à comprendre et à énoncer des idées par le langage. Elle requiert une bonne connaissance et maîtrise du vocabulaire, ainsi que de la syntaxe et des figures de style.

· L'intelligence musicale : elle représente la capacité à reconnaître les mélodies, les notes et les harmonies, ou à les créer.

En conclusion, l'intelligence, dans son sens large, englobe la capacité d'un être à comprendre, apprendre, résoudre des problèmes, s'adapter à son environnement et prendre des décisions efficaces. Elle englobe des facultés cognitives telles que la perception, l'apprentissage, le raisonnement, la créativité et l'adaptabilité. Cette notion d'intelligence est soutenue par la théorie des intelligences multiples proposée par Howard Gardner, qui identifie différentes formes d'intelligence, dont certaines sont étroitement liées à celles que l'on peut retrouver dans les systèmes d'intelligence artificielle.

BIBLIOGRAPHIE

· L' Intelligence Artificielle pour les développeurs. Concepts et implémentations en C# (Virginie MATHIVET, 2014, page 21).

· Les formes de l'intelligence (Howard Gardner, 1983).

· Dictionnaire Le Robert (2023).

2) Qu'est-ce que l'intelligence artificielle ?

L'intelligence artificielle, quant à elle, est un domaine de recherche et de développement visant à créer des systèmes et des machines capables d'imiter certaines facettes de l'intelligence humaine. L'intelligence artificielle s'appuie sur des algorithmes, des modèles mathématiques et des techniques de traitement de l'information pour permettre aux machines d'accomplir des tâches qui nécessitent normalement l'intervention humaine. Tout système qui pourrait s'adapter pour donner une réponse adéquate à son environnement pourrait être considéré comme intelligent. On parle alors d'intelligence artificielle (I.A.), terme en créé en 1956 par John McCarthy, célèbre informaticien américain.

Cependant, toutes les facultés que l'on peut donner à un ordinateur ne sont pas considérées comme faisant partie de l'intelligence artificielle. Ainsi, un ordinateur qui peut résoudre des équations complexes dans un temps bien plus court que ce que pourrait faire un humain, n'est pas considéré comme intelligent.

Auparavant, l'évaluation de l'intelligence d'un système informatique était souvent associée au test de Turing, proposé en 1950 par Alan Turing, mathématicien et cryptologue britannique. Ce test consiste à faire communiquer un testeur humain avec deux écrans. Derrière l'un de ces écrans, se trouve un autre humain qui interagit avec le testeur, tandis que derrière le deuxième écran se trouve le programme d'intelligence artificielle (IA) testé. L'objectif du test est de parvenir à identifier quel interlocuteur est humain et lequel est une machine. Si le testeur ne parvient pas à différencier l'IA de l'humain, alors le test est considéré comme réussi.

6 sur 51

BIBLIOGRAPHIE

· L' Intelligence Artificielle pour les développeurs. Concepts et implémentations en C# (Virginie MATHIVET, 2014, page 24.).

· Dictionnaire Le Robert (2023).

· Computing machinery and intelligence, Mind, Oxford University Press, (Alan Turing, vol. 59, no 236, octobre 1950, p. 433-46.

7 sur 51

Nous pouvons alors, grâce à ce test de Turing effectué dans les année 1950, constater qu'il est parfois difficile de déterminer le type d'intelligence auquel nous sommes confronté. Après avoir analyser les résultats de ce test, nous pouvons voir que sur les 168 personnes participantes, 60,41% pensent être confronté à une I.A, 32,14% pensent avoir à faire à un humain et 7,14%, soit 12 personnes, sont incapables de donner de réponse.

(Document : Exemple de Test de Turing).

Il reste tout de même difficile de tester l'intelligence artificielle. En effet, ce programme test « l'intelligence » seulement grâce à la communication écrite, ce qui limite sa pertinence. De plus, un programme « non-intelligent » qui ne ferait que reprendre en partie les phrases dites sans les comprendre peut réussir ce test, comme c'est le cas d'ELIZA, programme informatique créé en 1966 par Joseph Weizenbaum.

SITOGRAPHIE

https://iatpe2015.wordpress.com/le-fonctionnement/le-test-de-turing/

De plus, le test de Turing ne vise pas à évaluer directement l'intelligence d'un ordinateur, mais plutôt à déterminer s'il peut se comporter de manière similaire à un être humain. Cependant, étant donné que l'intelligence et les comportements humains ne sont pas identiques, le test ne permet pas de mesurer précisément l'intelligence de deux manières distinctes.

· Certains comportements intelligents ne sont pas humains : le test de Turing ne vérifie pas la présence, ou l'absence, d'un comportement intelligent, tel que la capacité de résoudre des problèmes difficiles ou de trouver des idées originales. Elle exige expressément la tromperie de la part de la machine : si la machine est plus intelligente qu'un être humain, il lui faut délibérément éviter de paraître trop intelligente. Si elle était capable de résoudre un problème de calcul qui serait impossible pour un humain, alors l'interrogateur saurait que le programme n'est pas humain, et la machine ne satisferait pas au test.

· Certains comportements correspondant à une intelligence humaine ne sont pas parfaits ou rationnels. Le test de Turing exige que la machine puisse exécuter tous les comportements humains, incluant même des comportements que l'on peut considérer comme imparfaits ou irrationnels, tels que la susceptibilité à des insultes, la tentation de mentir ou, tout simplement, une fréquence élevée d'erreur de frappe. Si une machine ne peut imiter le comportement humain dans le détail, comme faire des erreurs de frappe, l'intelligence échoue au test, indépendamment de la façon dont elle peut être intelligente.

En conclusion, l'intelligence artificielle est un domaine de recherche et de développement qui vise à créer des systèmes et des machines capables d'imiter certaines facettes de l'intelligence humaine. Cela implique l'utilisation d'algorithmes, de modèles mathématiques et de techniques de traitement de l'information pour permettre aux machines d'accomplir des tâches qui nécessitent normalement l'intervention humaine. L'objectif ultime de l'intelligence artificielle est de créer des systèmes capables de s'adapter à leur environnement et de fournir des réponses adéquates. Cependant, toutes les capacités informatiques ne sont pas considérées comme faisant partie de l'intelligence artificielle, et l'évaluation de cette dernière peut être complexe.

8 sur 51

SITOGRAPHIE

· https://iatpe2015.wordpress.com/le-fonctionnement/le-test-de-turing/

A) Le fonctionnement d'une intelligence artificielle.

Dans un premier temps, nous allons aborder les courants importants de l'intelligence artificielle, puis nous montrerons les liens entres les différentes technologies pour expliquer son fonctionnement.

Pour commencer, nous allons nous pencher sur les courants majeurs de l'approche symbolique et de l'approche connexionniste.

· L'approche symbolique : L'approche symbolique repose sur la manipulation de symboles, c'est-à-dire la capacité d'un système informatique à représenter, manipuler et raisonner sur des symboles abstraits comme des concepts, des objets, des relations ou des règles logiques. Elle met l'accent sur la représentation explicite des connaissances et sur le raisonnement symbolique.

· L'approche connexionniste : Elle est inspirée par le fonctionnement du cerveau, se concentre sur les réseaux de neurones artificiels interconnectés (voir page 15). Ces réseaux sont capables d'apprendre à partir de données et d'ajuster leurs connexions pour effectuer des tâches spécifiques. L'approche connexionniste met l'accent sur l'apprentissage automatique et le traitement distribué de l'information.

Pour une meilleure appréhension de comment fonctionne une IA grâce à ces courants nous pouvons nous pencher sur les différentes technologies. « Deep Learning », un livre écrit par Ian Goodfellow (informaticien, ingénieur, cadre, et professeur d'université, connu pour ses travaux sur les réseaux de neurones artificiels et sur le Deep Learning), Yoshua Bengio (informaticien, chercheur et spécialiste en intelligence artificielle, et pionnier du Deep Learning) et Aaron Courville (enseignent à l'école de science informatique de l'université de Carnegie Mellon et à l'université de Toronto). Dans ce livre, les trois auteurs utilisent le diagramme de Venn pour expliquer le lien entre une IA et ses technologies.

9 sur 51

BIBLIOGRAPHIE

· L' Intelligence Artificielle pour les développeurs. Concepts et implémentations en C# (Virginie MATHIVET, 2014, page 26.)

· Deep Learning (Ian Goodfellow, Yoshua Bengio et Aaron Courville, 2015, page 9)

10 sur 51

(Document : Diagramme de Venn expliquant le lien entre une IA et ses technologies).

 
 

Ce diagramme montre comment le Deep Learning (voir page 14) est une forme de Machine Learning (voir page 12), utilisé pour de nombreuses approches de l'IA. Chaque section du diagramme de Venn comprend un exemple des différentes technologies au service du fonctionnement d'une IA.

Plus une intelligence artificielle à des couches de technologies, plus elle est complexe. Plus une IA est complexe, plus elle est performante.

Le Representation Learning est une technologie complexe utilisée dans le Machine Learning qu'il n'est pas nécessaire de développer pour comprendre le fonctionnement d'une IA.

 

Pour bien comprendre le schéma ci-dessus, nous allons nous pencher sur les termes qui y sont employés.

(Document : Schéma du perceptron multicouche).

 

Le MPLs (MultiLayer Perceptrons ou Perceptron Multicouche en français) est largement utilisée dans le domaine de l'apprentissage automatique et de l'intelligence artificielle. Il s'agit d'un type de réseau de neurones artificiels à propagation avant, c'est-à-dire que l'information circule de la couche d'entrée vers la couche de sortie sans boucle récurrente.

 

BIBLIOGRAPHIE

· L' Intelligence Artificielle pour les développeurs. Concepts et implémentations en C# (Virginie MATHIVET, 2014, page 26.)

· Deep Learning (Ian Goodfellow, Yoshua Bengio et Aaron Courville, 2015, page 9)

11 sur 51

Le Logistic regression (régression logistique en français) est un algorithme d'apprentissage supervisé utilisé pour la classification binaire ou la prédiction de probabilités. Contrairement à son nom, il ne s'agit pas d'une technique de régression classique, mais plutôt d'une méthode de classification.

Quant à la Knowledge bases (ou base de connaissances en français), c'est un modèle de gestion des connaissances qui joue un rôle de centralisation de l'information, pour la rendre facilement accessible. C'est un mécanisme efficace pour exploiter au mieux toutes les données disponibles d'un sytème intelligent.

En conclusion, nous pouvons dire que les intelligences artificielles fonctionnent grâce au Deep Learning qui est une approche spécifique du Machine Learning, utilisant des réseaux neuronaux (voir page 17) profonds pour extraire des représentations complexes des données et résoudre des tâches. Les réseaux neuronaux sont l'un des outils clés utilisés dans le Deep Learning pour modéliser et apprendre à partir des données.

Nous allons désormais expliquer et analyser le fonctionnement du Machines Learning, du Deep Learning et des réseaux de neurones.

B) Le Machine Learning (ou apprentissage automatique).

Le Machine Learning est un ensemble de techniques permettant aux machines d'apprendre automatiquement un ensemble de règles à partir de données, se distinguant ainsi de la programmation traditionnelle qui repose sur l'exécution de règles prédéterminées. Concrètement, il s'agit de logiciels ou d'algorithmes capables d'être entraînés pour effectuer des tâches complexes de traitement de données sans intervention humaine. Bien que le concept du Machine Learning ne soit pas récent, sa première définition formelle nous a été donnée par Arthur Samuel en 1959, considéré comme l'un des pionniers de l'intelligence artificielle. Selon lui, « L'apprentissage automatique est la discipline donnant aux ordinateurs la capacité d'apprendre sans qu'ils soient explicitement programmés.»

Cette notion englobe un large éventail de méthodes qui permettent de construire des modèles de la réalité à partir de données, que ce soit en les améliorant ou en les créant. Au coeur de cette technologie, nous trouvons le Data Mining (ou fouille de données en français), un concept qui englobe l'ensemble du processus d'extraction de connaissances à partir de grandes quantités de données. Le Data Mining est essentiel pour le Machine Learning, car il fournit les données nécessaires pour entraîner les modèles et générer des informations utiles.

Il est important de souligner que le Machine Learning repose sur l'utilisation de bases de données solides. En effet, sans une quantité suffisante de données pertinentes et de qualité, le processus d'apprentissage automatique ne peut pas atteindre son plein potentiel. Les données servent de matière première pour alimenter les modèles et leur permettre de généraliser à partir des exemples fournis. Ainsi, la qualité et la diversité des données jouent un rôle crucial dans la performance et la précision des modèles d'apprentissage automatique.

12 sur 51

BIBLIOGRAPHIE

Apprentissage artificiel. Concepts et algorithmes éditions 2 (Antoine Cornuéjols - Laurent Miclet EYROLLES, 2010, page 18).

Data science : fondamentaux et étude de cas, machine learning avec Python et R (Éric Biernat - Michel Lutz EYROLLES, page 10.

13 sur 51

En 1997, Tom Mitchell, auteur et professeur à l'université de Carnegie Mellon, propose une définition plus précise de ce même concept technologique. Dans son livre, Machine Learning, parut la même année, il cite, « On dit qu'un programme informatique apprend de l'expérience (E) par rapport à une classe de tâches (T) et à une mesure de performance (P), si sa performance aux tâches dans (T), mesurée par (P), s'améliore avec l'expérience (E). »

Tom Mitchell illustre ensuite cette définition par le tableau ci-dessous :

(Document : Exemple de Machine Learning proposé par Mitchell).

Cas d'application

Apprendre à jouer au Dames

Reconnaitre l'écriture manuscrite

Apprentissage de la conduite pour un robot

Tache (T)

Jouer au Dames

Reconnaître et classifier des mots écrits à la main dans des images.

Conduite sur les autoroutes publiques à quatre voies à l'aide de capteurs de vision

Mesure de la performance (P)

Pourcentage de matchs gagnés contre des adversaires

Pourcentage de mots classés correctement

Distance moyenne parcourue avant une erreur (évaluée par un surveillant humain)

Expérience de formation (E)

S'entrainer à jouer contre lui même

Une base de données de mots manuscrits avec les classifications données

Une séquence d'images et de commandes de direction enregistrées tout en observant un conducteur humain

 

En conclusion, le Machine Learning représente une avancée majeure dans le domaine de l'intelligence artificielle, offrant aux machines la capacité d'apprendre à partir de données et d'effectuer des tâches complexes sans une programmation explicite. En utilisant des techniques de Data Mining et en s'appuyant sur des bases de données solides, le Machine Learning peut générer des modèles précis et informatifs, ouvrant ainsi la voie à de nombreuses applications dans divers domaines.

Nous allons désormais expliquer ce qu'est le Deep Learning.

BIBLIOGRAPHIE

Machine Learning (Tom M. Mitchell, 1997)

C) Le Deep Learning (ou apprentissage profond).

Le deep Learning est un ensemble de techniques qui permettent à un ordinateur d'apprendre automatiquement la solution à partir de données. C'est une technique de Machine Learning reposant sur le modèle des réseaux neuronaux : des dizaines, voire des centaines de couches de neurones sont empilées pour apporter une plus grande complexité à l'établissement des règles. Le terme "apprentissage profond" possède plusieurs définitions en raison de la complexité de cette technologie.

Mélanie Mitchell (auteure et professeure en sciences informatiques à l'université de Portland) nous propose la définition suivante : « L'apprentissage profond désigne simplement des méthodes d'apprentissage destinées à des réseaux neuronaux profonds , expression qui désigne des réseaux neuronaux possédant plus d'une couche cachée. »

FranceTerme (base de données terminologiques de la délégation générale à la langue française et aux langues de France du ministère de la Culture français) nous propose une autre définition : « L'apprentissage profond (Deep Learning) est un modèle d'apprentissage automatique (Machine Learning), qui utilise un réseau de neurones artificiels composé d'un grand nombre de couches dont chacune correspond à un niveau croissant de complexité dans le traitement et l'interprétation des données. »

Concrètement une technologie utilisant le Deep Learning nous permettrait de demander à un ordinateur de classer des images ou des sons à partir d'une base de connaissances (Knowledge Bases), auquel il aurait accès. Cette base de connaissances est établie à partir de l'activité sur le web par les internautes. Nous pouvons prendre comme exemple très connu, le test de CAPTCHA.

Le CAPTCHA, acronyme de l'anglais « Completely Automated Public Turing test to tell Computers and Humans Apart », est une mesure de sécurité de type « authentification par question-réponse ».

(Documents : Exemple de test CAPTCHA).

 
 
 

14 sur 51

BIBLIOGRAPHIE ET SITOGRAPHIE

· (Melanie Mitchell, L'intelligence artificielle, éditions Dunod, 2021)

· https://www.culture.fr/franceterme

Le CAPTCHA est une famille de tests de Turing qui vise à différencier de manière automatisée un utilisateur humain d'un ordinateur. Ce test de défi-réponse est couramment utilisé en informatique pour vérifier que l'utilisateur n'est pas un robot. Cependant, le CAPTCHA présente un intérêt supplémentaire important.

En plus de sa fonction de vérification, il contribue activement à l'enrichissement des connaissances des intelligences artificielles et à l'amélioration de la technologie de l'apprentissage profond qu'elles utilisent. Cette technologie enregistre chaque choix effectué par l'internaute et stocke les images correspondantes dans une base de données. De plus, elle conserve en mémoire les caractères que les utilisateurs parviennent à décrypter avec succès.

Ainsi, le CAPTCHA joue un rôle essentiel dans l'acquisition de données et le perfectionnement des modèles d'apprentissage profond, contribuant ainsi à l'évolution et à l'amélioration continue des technologies d'intelligence artificielle.

Ces informations contribuent aux développements des technologies de Deep Learning utilisées par des entreprises telles que Tesla et Google. Les bases de données générées par les CAPTCHA permettent notamment d'améliorer les véhicules équipés de systèmes d'assistance à la conduite grâce aux images de feux tricolores ou de voitures. Pour Tesla, cela peut se traduire par une meilleure reconnaissance des signaux routiers et une prise de décision plus précise pour les fonctions de conduite autonome.

De même, Google exploite les informations typographiques fournies par les utilisateurs pour filtrer les e-mails et protéger les utilisateurs des courriers indésirables tels que les spams. Ces données permettent à Google de développer des modèles d'apprentissage profond capables d'identifier et de trier automatiquement les e-mails, améliorant ainsi l'expérience de ses utilisateurs en évitant les contenus malveillants ou non pertinents.

Ainsi, les informations collectées via les CAPTCHA jouent un rôle essentiel dans l'amélioration des technologies utilisées par ces entreprises leaders dans le domaine de l'intelligence artificielle et du Deep Learning.

15 sur 51

SITOGRAPHIE

support.google.com

En plus du CAPTCHA visuel, il existe également le CAPTCHA audio, qui se concentre sur le son. Ce test de sécurité demande à l'utilisateur de transcrire ce qu'il entend à partir d'un fichier audio contenant une chaîne de caractères parlés. Généralement, ces caractères sont masqués et déformés par un bruit de fond afin de rendre la tâche plus difficile pour les bots* et de s'assurer que la réponse provient d'un utilisateur réel. Le CAPTCHA audio est une autre méthode utilisée pour vérifier l'identité humaine et empêcher les activités automatisées indésirables.

(Document : Exemple de test CAPTCHA audio).

Ce test est conçu pour collecter des informations afin de permettre aux intelligences artificielles de développer leur base de données sur la lecture et la prononciation des mots. Par la suite, nous constaterons que grâce à ce type d'outil de collecte d'informations, l'apprentissage profond de certaines IA devient extrêmement performant, au point de pouvoir composer et interpréter des paroles de chansons. (voir III-Ecoutes Critiques)

En résumé, le Deep Learning est une technique de Machine Learning qui utilise des réseaux neuronaux profonds pour résoudre des problèmes complexes en apprenant automatiquement à partir de données. Il permet d'établir des règles complexes en empilant de nombreuses couches de neurones, offrant ainsi une grande capacité de traitement et d'interprétation des données.

Apres avoir abordé le fonctionnement du Machine Learning et du Deep Learning nous allons nous intéresser au réseaux de neurones, une technologie importante au fonctionnement d'une IA.

16 sur 51

*Bots : (abréviation de robot) est un logiciel qui exécute des tâches automatisées, répétitives et prédéfinies. Les bots imitent ou remplacent généralement le comportement des utilisateurs humains.

SITOGRAPHIE

· support.google.com

17 sur 51

D) Réseaux de neurones.

L'intelligence artificielle a longtemps eu pour but de simuler l'intelligence humaine, et d'obtenir un système artificiel capable de réflexion, de prise de décision et d'apprentissage. Les chercheurs se sont donc assez rapidement intéressés au fonctionnement du cerveau pour le reproduire. C'est ainsi que les premiers neurones artificiels ont été définis en 1943 par Mac Culloch, chercheur en neurologie, et Walter Pitts, scientifique étudiant la psychologie cognitive.

Le neurone artificiel, aussi appelé neurone formel, reprend le fonctionnement du neurone biologique. Il a des entrées de signal appelé dendrites et des sorties appelé Axone.

La définition d'un neurone formel est la suivante : Un neurone formel est une représentation mathématique et informatique d'un neurone biologique. Le neurone formel possède généralement plusieurs entrées et une sortie qui correspondent respectivement aux dendrites et au cône d'émergence du neurone biologique.

Le fonctionnement général d'un neurone artificiel repose sur plusieurs caractéristiques clés. Tout d'abord, le neurone reçoit des entrées provenant d'autres neurones ou de l'environnement. Chaque entrée est associée à un poids qui détermine son importance relative par rapport aux autres entrées. Ces poids permettent de moduler l'influence de chaque entrée sur la sortie du neurone.

Ensuite, le neurone utilise une fonction d'agrégation pour combiner les entrées pondérées et calculer une valeur unique. Cette fonction d'agrégation peut être une simple somme pondérée des entrées ou une opération plus complexe, selon le type de réseau de neurones utilisé.

Le neurone dispose également d'un seuil ou d'un biais, qui est utilisé pour indiquer le moment où le neurone doit être activé. Le seuil peut être considéré comme un seuil de sensibilité : lorsque la valeur agrégée dépasse ce seuil, le neurone est activé et fournit une sortie. Sinon, le neurone reste inactif.

Enfin, la fonction d'activation joue un rôle crucial dans le processus de sortie du neurone. Cette fonction associe à chaque valeur agrégée une unique valeur de sortie, qui dépend du seuil du neurone. Elle peut introduire une non-linéarité dans le modèle et permettre au neurone de représenter des relations plus complexes entre les entrées et les sorties.

En résumé, un neurone artificiel utilise des poids pour moduler l'importance des entrées, une fonction d'agrégation pour combiner ces entrées pondérées, un seuil pour décider de l'activation du neurone, et une fonction d'activation pour produire une sortie en fonction de la valeur agrégée et du seuil. Ces mécanismes sont essentiels dans la construction de réseaux de neurones artificiels.

BIBLIOGRAPHIE

· L' Intelligence Artificielle pour les développeurs. Concepts et implémentations en C#. (Virginie MATHIVET, 2014, page 429.

· A logical calculus of the Ideas Immanent in Nervous activity. (Mac CULLOCH, Walter PITTS, 1943)

18 sur 51

Le neurone formel peut donc se résumer sous la forme suivante : (Document : représentation d'un neurone artificielle).

Il est intéressant de comparer un neurone artificielle avec un neurone biologique. Les neurones communiquent entre eux par signaux électriques, appelés influx nerveux (ou potentiels d'action). Chaque neurone est constitué d'un corps cellulaire, de prolongements appelés dendrites et axones. Ces derniers émettent des connexions avec d'autres neurones par l'intermédiaire des synapses.

(Document : représentation d'un neurone biologique).

SITOGRAPHIE

· Article écrit par Ikram Chraibi Kaadoud | Comprendre la science tou-te-s ensemble, Sciences du Numérique 08.10.2018

Un neurone biologique reçoit des entrées ou signaux transmis par d'autres neurones (interaction dendrites- synapse). Au niveau du corps (soma), le neurone analyse et traite ces signaux en les sommant. Si le résultat obtenu est supérieur au seuil d'activation (ou d'excitabilité), il envoie une décharge alors nommé potentiel d'action le long de son axone vers d'autres neurones biologiques.

Un neurone formel est une représentation artificielle et schématique d'un neurone biologique.

(Document : Mise en correspondance d'un neurone biologique avec neurone artificiel).

Dans le domaine des réseaux de neurones, la fonction de transfert peut aussi porter le nom de fonction de combinaison, ou fonction de seuillage ou encore fonction d'activation. Biologiquement, l'idée d'une fonction de transfert vient de l'idée de mimer le fonctionnement d'un potentiel d'action d'un neurone biologique : si l'ensemble des stimuli en entrée d'un neurone atteignent son seuil d'excitabilité, alors ce neurone fournit une sortie autrement dit il décharge.

En conclusion, les neurones artificiels utilisent des poids, une fonction d'agrégation, un seuil et une fonction d'activation pour ajuster l'importance des entrées, combiner ces entrées pondérées, décider de l'activation du neurone et générer une sortie en fonction de la valeur agrégée et du seuil. Inspirés par les neurones biologiques, les neurones artificiels reproduisent de manière simplifiée la structure et le fonctionnement des neurones dans le cerveau. Cette convergence entre les neurones artificiels et biologiques reflète les efforts pour comprendre et reproduire les mécanismes de traitement de l'information du cerveau. Les réseaux de neurones artificiels, utilisés en intelligence artificielle, résolvent des problèmes complexes tels que la vision par ordinateur et la reconnaissance vocale, tandis que l'étude des neurones biologiques continue d'inspirer de nouvelles avancées pour concevoir des réseaux de neurones artificiels plus sophistiqués et performants.

BIBLIOGRAPHIE

· Les réseaux de neurones artificiels, introduction au connexionnisme, (Claude Touzet, juillet 1992, page 24)

19 sur 51

20 sur 51

II L'IA dans la production musicale.

Les plug-ins et les logiciels intelligent.

En orientant ma recherche de mémoire vers ce domaine spécifique, j'ai conçu l'idée d'explorer l'efficacité des outils et des applications intelligentes dans mes propres productions musicales, en vue d'analyser les résultats. Dans cette étude, je m'attacherai d'abord à effectuer des recherches approfondies afin de recenser des plug-ins exploitant des technologies d'intelligence artificielle. Je m'attacherai ensuite à expliquer leurs objectifs, leurs avantages et leur pertinence dans le domaine de la production musicale, que ce soit à des fins professionnelles ou amateurs. Je procéderai tout d'abord à une classification des différents types de plug-ins, en fonction de leur utilité respective. En effet, j'ai découvert qu'il existait quatre catégories d'outils distinctes :

- Les outils de démixage (ou séparation des sources)

- Les outils de restauration audios - Les outils d'aide au mixage

- Les outils d'aide à la composition

J'ai débuté en testant un site gratuit utilisant une technologie d'intelligence artificielle pour faire de la séparation de sources à partir d'un fichier stéréo. Le site que j'ai tester s'appelle « AUDIO STRIP ».

Pour mettre à l'épreuve ces outils d'intelligence artificielle, j'ai décidé de leur fournir l'une de mes propres compositions musicales afin de pouvoir comparer les résultats obtenus. J'avais plusieurs options à ma disposition, telles que l'isolement de la voix par rapport aux instruments ou encore l'isolement de la voix, de la batterie et de la basse. J'ai choisi d'isoler le plus grand nombre de sources possible.

Le site m'a ainsi fourni cinq pistes audio, dont une contenant uniquement ma voix. Il a également généré des pistes pour la batterie, la basse et le piano. Enfin, le site m'a fourni la piste originale. Il convient de noter que j'ai utilisé une version bêta qui n'était pas recommandée, mais qui permettait d'isoler plusieurs sources en un laps de temps estimé entre 2 et 15 minutes. Lors de mon test, j'ai attendu environ 10 minutes.

Le résultat s'est avéré étonnamment satisfaisant. Comme je m'y attendais, la voix et le piano étaient grandement détériorés, il était donc impossible de retrouver la qualité d'origine, laissant inévitablement un bruit résiduel. Cependant, les percussions étaient relativement fidèles, de même que la ligne de basse. Je suis surpris, car pour une attente de 10 minutes et en n'ayant rien d'autre à faire que d'importer ma musique sur le site, le résultat est correct pour un remix.

J'ai ensuite testé la version recommandée, qui permet simplement de séparer la voix de l'instrumental. Cette option est décrite comme offrant la meilleure qualité audio possible sur le site. J'ai délibérément choisi cette option plus complexe en premier, car elle était logiquement moins fidèle. Le temps d'attente était estimé entre 15 et 50 minutes, ce qui laissait entendre que l'IA travaillait de manière plus précise.

SITOGRAPHIE

· audiostrip.com

21 sur 51

Après une attente d'environ 35 minutes, j'ai pu récupérer les fichiers audio. Bien qu'il reste des bruits résiduels lors de l'écoute des pistes en solo, il suffit de recombiner les sources pour faire disparaître ces bruits. Cette version de meilleure qualité que la version bêta ouvre de larges possibilités d'exploitation des audios.

Ces types d'outils sont largement utilisés pour remixer d'anciens morceaux dont les sessions de travail ne sont pas récupérables. Ils sont également utiles pour doubler un film après sa sortie ou encore modifier les voix ou certaines ambiances. En effet, leur utilisation permet de séparer les différents éléments sonores d'une piste et de les retravailler individuellement.

Ces séparateurs de sources permettent de revisiter des enregistrements existants et de leur donner une nouvelle vie en modifiant leur composition, en ajoutant des éléments supplémentaires ou en créant des variations originales.

En résumé, l'utilisation de ces outils intelligents ouvre des horizons passionnants dans le domaine de la production musicale. Ils facilitent le processus de création, offrent de nouvelles possibilités de remixage et permettent d'explorer des voies artistiques inédites.

(Document : AudioStrip).

J'ai ensuite centré mes recherches sur les plug-in et j'ai trouver 6 qui sont vendu comme intelligent et donc intéressant pour mon sujet. Je savais que j'allais rencontrer des difficultés pour tester des plug-in : en effet comme je le pensais, tout les plug-in les plus poussés sont payant, et souvent très cher, je n'avais donc pas les moyens de les acheter pour juste en faire une analyse. J'ai du faire un choix, celui de prendre les offres gratuites, c'est à dire de pouvoir les tester pendant seulement quelques jours. Cette solution n'était pas optimal pour en faire une vrai analyse poussée. Pour avoir plus de donnés sur ces outils j'ai également fait un travail de recherche sur internet en lisant les modes d'emploie (voir Annexes) et des avis sur internet.

22 sur 51

Voici les 6 plug-in que j'ai analysé, ils sont classés dans l'ordre suivant : outil de démixage, outil de restauration audio, outil d'aide au mixage pour finir sur les outils d'aide à la composition.

- Hit'n'Mix Rip X (outil de séparation de source).

Parmi les fonctionnalités offertes par cet outil, il y en a une qui mérite une attention particulière : le DeepAudio. Cette fonctionnalité permet de récupérer chaque source audio à partir d'un son mixé et masterisé. Cela fonctionne sur le même principe que le site "AUDIO STRIP". Selon mes recherches, cet outil peut parfois donner des résultats très satisfaisants, mais cela dépend grandement de la qualité audio de base. Dans le monde professionnel, cette option est particulièrement pertinente, car même l'isolement des sources reste très précis. Il est fascinant d'explorer ces outils par simple curiosité, pour découvrir ce que les technologies utilisant l'intelligence artificielle peuvent accomplir aujourd'hui.

Il convient également de mentionner la sortie d'une version améliorée de cet outil, appelée DeepRemix, qui est cependant plus coûteuse. Cette version offre une fonctionnalité supplémentaire, celle de modifier les éléments de bruit environnants, ainsi qu'un outil d'édition complet. Cette seconde fonctionnalité est particulièrement intéressante, car elle permet d'avoir un contrôle total sur le processus d'édition. En plus de séparer les sources audio, il est possible de manipuler les bruits environnants pour obtenir un résultat encore plus personnalisé et adapté à ses besoins artistiques. Ces avancées technologiques dans le domaine de l'intelligence artificielle offrent des possibilités passionnantes pour les professionnels de l'industrie musicale. Elles permettent de repousser les limites de la créativité en offrant des outils de traitement sonore avancés.

(Document : Hit'n'Mix).

SITOGRAPHIE

· collective.focustrite.com

23 sur 51

- iZotope RX 9 (outil de restauration audio).

Cet outil utilise l'apprentissage automatique pour fournir des suggestions sur la façon de nettoyer et d'améliorer la qualité audio. Pour ceux d'entre nous qui travaillent dans l'audiovisuel, il est toujours intéressant de connaître ce type d'outil. Il s'avère pratique lorsqu'il s'agit d'améliorer la qualité sonore d'un enregistrement altéré ou d'une prise audio ratée. L'outil reconnaît automatiquement les problèmes spécifiques et propose de manière intelligente une chaîne de réparation.

Pour le tester, j'ai importé une interview d'une femme dans la rue. Le son de base était correct, mais les conditions d'enregistrement n'étaient pas optimales. L'enregistrement a été effectué sans bonnette dans un environnement venteux et bruyant. J'ai trouvé que iZotope RX 9 a réalisé un travail impressionnant en quelques secondes seulement. Il a agi immédiatement sur le vent et le bruit de fond. Concrètement, l'outil a compris quelle était la source principale à préserver en appliquant un filtre sur les fréquences indésirables. Le résultat est satisfaisant, bien que la différence entre le son altéré et le son amélioré soit perceptible. Cependant, ce plug-in est coûteux pour les résultats obtenus, avec un prix d'achat de 1200€.

Il reste pertinent pour un technicien du son travaillant dans le domaine de la télévision, par exemple, un métier où l'efficacité est primordiale dans toutes les circonstances. C'est un outil qui peut faire gagner du temps. En revanche, pour une production musicale amateur, il peut être difficile de rentabiliser un tel investissement. Je ne vois pas l'intérêt de cet outil dans le cadre d'une production musicale.

(Document : iZotope RX 9).

SITOGRAPHIE

· www.iZotope.com

24 sur 51

- Série Focusrite FAST (plug-in d'aide au mixage avec outil d'égalisation : Fast Equalizer, de compression : Fast Compressor, de réverbération : Fast Verb et d'atténuation spectral : Fast Limiter).

La gamme de plug-in récemment lancé par Focusrite est alimentée par la technologie des spécialiste de l'IA : Sonible (entreprise de création de logiciel). Cet outil a été lancé pour faciliter le travail de mixage en étant assisté par une IA.

« La gamme FAST a été conçue pour vous garder dans le flux créatif, afin que vous puissiez vous concentrer sur la création musicale. La puissante IA adaptera les paramètres à votre audio et à vos instruments afin que vous puissiez obtenir d'excellents résultats sonores, instantanément. »

L'entreprise met en avant l'idée qu'il est préférable de consacrer du temps à la réflexion créative de la musique plutôt qu'aux aspects techniques du mixage. Ces outils prétendent accomplir ce travail pour vous en quelques secondes, selon leur site web. Pour ma part, il est extrêmement difficile de confier cette tâche à un programme informatique. En effet, ces outils diffèrent de ceux mentionnés précédemment. Ici, l'intelligence artificielle travaille directement sur des aspects tels que l'égalisation, la compression, la réverbération, et même le mastering avec leur outil de limitation. L'entreprise avance que la création de cet outil vise à libérer davantage de temps pour l'artiste afin qu'il se concentre sur l'aspect purement artistique. Pour moi, c'est ironique, car les réglages des effets tels que la compression ou la réverbération jouent un rôle crucial dans l'aspect artistique final de la musique. La réverbération donne vie à la musique, et les choix de réglages sont extrêmement importants, représentant un véritable choix artistique.

J'ai du mal à croire qu'il puisse être pertinent de confier des choix artistiques à un algorithme, en particulier pour le mastering. Si ce plug-in nous offre des exemples de différentes sonorités possibles, je peux comprendre l'intérêt, car cela peut combler un certain manque d'inspiration. Cependant, personnellement, je n'utiliserais pas une IA pour mixer entièrement l'une de mes compositions musicales. Avec ce type d'outil qui fait son apparition sur le marché, j'ai peur de voir disparaître l'authenticité de la musique.

La création musicale est un art très personnel, offrant une infinité de choix artistiques pour créer une oeuvre. Ces outils, comme mentionné précédemment, fonctionnent grâce à une base de données. En d'autres termes, l'algorithme va s'appuyer sur les codes inscrits dans la société, il copie. Bien que le résultat puisse être plus que satisfaisant, avec un rendu propre et sans erreur de mixage, cela ne fait pas pour moi de cet outil un choix pertinent, car l'IA prend des décisions artistiques.

Sonible à d'ailleurs sortie son propre plug-in intelligent. D'après Alexander Wankhammer, CMO et co-fondateur de Sonible, l'entreprise a fait ses premiers pas éphémères dans l'IA en janvier 2015. « Notre premier logiciel « Frei:Raum » avait déjà la possibilité de corriger automatiquement les déficiences spectrales d'un signal en observant ses caractéristiques spectrales et temporelles. » Ils ont ensuite sortie Smart EQ 3 un très bon outil sur lequel je vais revenir. (voir page 26)

Exemple des plug-in FAST sur SoundCloud : Plug-in Fast (source : Interview Youtube du média Plugin Boutique) SITOGRAPHIE

collective.focustrite.com

 

(Document : FAST equalizer).

 
 

 

(Document : FAST compressor).

 

25 sur 51

(Document : FAST verb).

(Document : FAST limiter).

 
 

26 sur 51

- Smart EQ 3 by Sonible (outil d'égaliseur automatique).

Alexander explique comment les algorithmes d'apprentissage en profondeur de Smart EQ 3 sont réellement programmés.

« Smart : EQ 3 utilise un système qui est principalement entraîné par d'énormes quantités de données. Dans le cas de Smart: EQ 3, le système a appris à transformer les « mauvaises données » avec par exemple, les signaux présentant des déficiences spectrales, en « bonnes données » avec par exemple, les signaux avec un bon équilibre spectral. »

« Pour ce faire, nous avons utilisé le deep learning, dans notre cas une architecture de réseau de neurones convolutifs spécialisés, et présenté une représentation spectro-temporelle des mauvaises données à l'entrée du réseau. Nous avons ensuite défini les « bonnes données » comme la cible de la sortie du réseau. En faisant cela des milliers et des milliers de fois, le réseau a appris à corriger les problèmes dans les échantillons de données erronés. Une fois qu'un réseau a été formé, c'est essentiellement une boîte noire qui fait son travail. » (Source Interview Youtube du média Plugin Boutique).

Les fonctionnalités qui nous intéressent dans ce plug-in sont le filtre qui corrige automatiquement les déséquilibres tonals grâce à une IA et le traitement intelligent en inter-canal.

L'entreprise vend cette intelligence comme un moyen d'obtenir un équilibre spectral en quelques secondes, que ce soit sur une seule piste ou sur un mix entier. Au cours de mes recherches, j'ai découvert que ce plug-in était l'un des plus avancés sur le plan technique. Il est possible de l'utiliser sur 6 canaux différents, bien que je n'aie pas pu tester cette fonctionnalité, j'ai trouvé cela remarquable.

La force de cet outil réside dans le fait que l'on conserve un contrôle considérable sur l'IA. Il existe de nombreuses fonctionnalités que l'on peut modifier en fonction de nos inspirations, telles que :

· Sélectionner les plages de fréquences qui doivent être affectées.

· Modifier la forme de la courbe de pondération.

· Définir la durée du processus d'apprentissage de l'IA.

· Contrôler le niveau d'impact sur le traitement inter-canal intelligent.

Ainsi, on peut profiter des capacités des algorithmes intelligents tout en conservant le contrôle sur le résultat final.

SITOGRAPHIE

· sonible.com

Ce plug-in fonctionne remarquablement bien et est proposé à un prix raisonnable de 50. L'égaliseur alimenté par l'IA permet de nettoyer les résonances désagréables et les encoches indésirables. Le résultat sonore est convaincant. Je n'ai pas poussé les réglages au maximum, mais en laissant l'IA travailler, le son devient plus clair. Cependant, je pense que si l'on prend le temps de travailler l'égalisation manuellement, on peut obtenir un résultat encore meilleur.

Une fois de plus, il s'agit d'un outil qui permet de gagner du temps. Néanmoins, je considère qu'il reste pertinent grâce à la possibilité d'avoir un contrôle artistique sur l'IA, ce qui permet de préserver l'aspect créatif de l'outil.

(Document : Smart Eq 3).

27 sur 51

SITOGRAPHIE

· sonible.com

28 sur 51

- Playbeat audiomodern plug-in d'aide à la composition (boite à rythme).

Playbeat est un séquenceur innovant qui propose des sonorités en fonction des rythmes joués. Bien que je n'aie pas eu l'occasion de tester ce plug-in personnellement, d'après leur site web et les avis des utilisateurs, Playbeat prend en compte chaque instrument pour aider les musiciens à trouver de nouvelles mélodies. Ce séquenceur utilise des algorithmes avancés d'analyse sonore pour remixer automatiquement des échantillons originaux.

La force de ce logiciel réside dans le fait que plus on joue, plus il propose de combinaisons musicales. Je trouve ce type d'algorithme extrêmement intéressant pour la production musicale, car il offre une ressource d'inspiration considérable. L'idée derrière Playbeat est également ingénieuse, rappelant l'époque où l'on cherchait des échantillons et des sonorités dans des disques vinyles. Cependant, ce plug-in pousse cette approche encore plus loin, car il permet d'exporter directement les morceaux avec une pochette personnalisable. Cette facilité d'utilisation apparente fait de Playbeat un outil pertinent et pratique pour la production musicale.

(Document : Playbeat audiomodern).

SITOGRAPHIE

· audiomoderne.com

29 sur 51

- Algonaut Audio Atlas 2 (bibliothèque d'échantillons).

Algonaut Audio Atlas 2 est un outil puissant qui utilise l'intelligence artificielle pour trier automatiquement votre bibliothèque d'audio en fonction du type de son et de sa tonalité. Il s'agit essentiellement d'une IA spécialisée dans l'organisation et le classement des échantillons sonores.

Ce plug-in analyse les échantillons audio disponibles dans votre bibliothèque et les trie de manière intelligente en fonction de leurs caractéristiques sonores, tels que le type d'instrument, le genre musical, la tonalité, etc. Il vous permet ainsi de trouver rapidement les sons dont vous avez besoin pour votre projet musical.

L'avantage de cette approche est qu'elle vous permet d'économiser un temps précieux en évitant de rechercher manuellement dans des dossiers et des fichiers audio.s Cet outil est particulièrement utile pour les producteurs qui ont une grande bibliothèque d'échantillons et qui ont du mal à les organiser de manière efficace. Il facilite également le processus de découverte de nouveaux sons et d'exploration créative.

En somme, Algonaut Audio Atlas 2 est une application pertinente de l'intelligence artificielle dans le domaine de la production musicale, offrant un moyen pratique et efficace d'organiser et de trouver rapidement des échantillons sonores en fonction de vos critères de recherche.

(Document : Algonaut Audio Atlas 2).

SITOGRAPHIE

· algonaut.audio.com

- Flow Machine Professional - Sony CSL research Lab. (logiciel d'aide à la composition)

Flow Machines a été développé pour la première fois en 2012 dans le cadre de la recherche sur l'utilisation de l'IA dans la composition musicale par Sony CSL Paris et l'Université Pierre et Marie Curie, sous la direction de François Pachet (pionniers de la musique informatique, devient directeur de Spotify Creator Technology Research Lab. et membre de l'ECCAI* en 2014). C'est un projet de recherche scientifique qui a pour but de tester les limite de l'intelligence artificielle dans la production musical.

*L'ECCAI : European Coordinating Committee for Artificial Intelligence (Comité européen de coordination pour l'intelligence artificielle)

Aujourd'hui, Sony CSL est en collaboration avec Sony Music Entertainment Japan Inc. C'est maintenant cette entreprise qui poursuit ses études et ses applications. La partie principale du projet Flow Machines est Flow Machines Professional. Ce dernier est un système de composition musicale assistée par l'IA. Grâce à ce système, les créateurs peuvent composer des mélodies dans les différents styles qu'ils souhaitent. En se basant sur ses propres règles musicales créées à partir de diverses analyses musicales.

Les créateurs peuvent générer des mélodies, des accords et des bases en utilisant leurs base de données. De plus, leurs propres idées enrichie la base de donnée ce qui aide le logiciel à s'améliorer. À partir de là, le processus sera le même que celui de la production musicale classique. Il faut faire des arrangement dans le DAW, choisir les paroles, enregistrer, mixer et masteriser.

Ce logiciel est de loin le plus poussé. « Flow Machines est un projet de recherche, de développement et de mise en oeuvre sociale qui vise à développer la créativité des créateurs en musique. »

Elle fonctionne grâce une technologie de machine learning et de traitement du signal audio .

Sony travail avec des créateurs pour générer de la nouvelle musique à l'aide d'une technologie d'apprentissage automatique, je trouve que cette collaboration avec des artistes lui donne de la pertinence artistique. De plus ce logiciel à déjà été utiliser pour aider à la création d'un album « Hello World » par SKYGGE (Benoit carré) artiste français. On verra plus en détail cet album dans la partie suivante de ce mémoire. (cf. Ecoutes critiques)

Flow Machines Professional est donc un outil d'aide à la composition. Ils fonctionnent en analysant diverses composition ou musique et suggère par la suite une mélodie de 4 ou 8 mesures basée sur la construction musical donné. Le logiciel donne ensuite accès à la partition qu'il a crée pour pouvoir la sauvegarder ou la modifié comme on le souhaite.

Il y a plus de 100 préréglages de palette de styles musicaux, on peut donc nous suggérer un nombre infini de mélodies.

Dans les paramètre de composition il est possible de modifier l'harmonie de la mélodie et sa complexité. On peut modifier l'accord, la durée des notes.

Je vais ensuite montrer tout ce qu'il est possible de faire à partir d'une interview de BenoÎt Carré (directeur artistique de Flow Machines) posté sur la chaine YouTube de Sony CSL.

Dans cette video Benoît Carré veut nous montrer comment composer via Flow Composer, l'outil de composition de Flow Machines.

SITOGRAPHIE

· sonycsl.co.jp / flow-machines.com / vidéo YouTube Sony CSL)

30 sur 51

31 sur 51

Il commence par générer de nouvelles mélodies et de nouveaux accords à partir d'un songset appelé « American Songwrite » (un outil directement disponible dans le logiciel). Ici un songset c'est une de leur base de donnée qui sert à obtenir un certain style de musique, et c'est ce qui fait la

force du logiciel. En effet leur base de donnés est très grande. Cette base de donné à été établie par
l'entreprise en y ajoutant la discographie de compositeur américain des années 50 et 60, tel que Duke Ellington et Cole Porter en autre. En ayant ajouté les données musicale de ces artistes l'intelligence artificielle, cette dernière est capable de composer de la musique dans un corpus Jazz. En choisissant se songset le logiciel va analyser et générer à partir de 429 partitions. On obtient ensuite une partition original créée par l'IA.

C'est ensuite à l'humain de travailler. Benoît Carré va choisir des moments qu'il trouve intéressant dans cette partition. Il va ensuite chercher des accompagnement dans d'autre partitions proposer et c'est ainsi que l'on travail réellement sur ce logiciel : choisir un style musicale, trouver des sonorités souhaités, chercher les mélodies et accord intéressant qui sont générer automatiquement. C'est un travail « d'exploration sonore » d'après Benoît Carré.

Flow Machines à un outil pour générer des voix, c'est l'outil « Mashmelo ». Il permet d'utiliser des voix « a cappella » de vrai chanteur, qui ont été enregistrer et analyser par le logiciel. C'est une analyse évolué car l'IA va restituer le style, l'intention et les placements rythmiques du chanteur sur la nouvelle mélodies générée. Ensuite il ajoute une guitare, une basse et des percussions.

Il y a également l'outil Rechord qui peut générer une lignes de percussion. Mais il ne nous fait pas de démonstration dans la vidéo.

Pour conclure je dirais que ce logiciel est très poussé grâce à une grande base de donné accessible. Ils ont sortie une application qui n'est pas convaincante. Après l'avoir essayer moi même le rendu des compositions de l'IA est très monotone, voir beaucoup trop. Il est intéressent de voir que ce logiciel propose des mélodies juste musicalement mais très fade artistiquement. Il y a donc une gros travail de trie et de réajustement. En essayant plusieurs régalage différents j'ai compris qu'on pouvais créer un morceau qui avait de l'intérêt. Cependant l'application n'est pas très instinctif, et les premières mélodies que l'IA propose sont plus que médiocre.

Comme pour les autres outils que l'on a analysé précédemment je me rend compte que leur intérêt est souvent de gagner du temps ou d'aider un musiciens en manque d'inspiration.

Cependant Flow Machines Professional à des outils vraiment convaincant, comme le Mashmelo. Le fait de pouvoir restituer l'intention naturelle d'un chanteur sur n'importe qu'elle composition générer par l'IA donne une âme au morceau créé et donc un intérêt dans la production musicale. En 2017 leur plus grand succès était le morceau « Daddy's Car » une chanson inspiré des Beatles (cf Ecoute Critique).

D'autres logiciel du même type existent aujourd'hui, comme Google Magenta, Watson Beat, d'IBM ou encore Orb Composer, d'une startup française baptisée Hexachords. Mais Flow Machines reste sans doute celui dont les débouchés sont les plus probants.

SITOGRAPHIE

sonycsl.co.jp / flow-machines.com / vidéo YouTube Sony CSL)

32 sur 51

(Document : logiciel payant Flow Machines Professional).

(Document : application gratuite Flow Machines).

SITOGRAPHIE

sonycsl.co.jp / flow-machines.com / vidéo YouTube Sony CSL)

33 sur 51

III Écoutes critiques.

Dans cette dernière partie je vais analyser plusieurs musiques qui ont été créée avec l'aide d'intelligence artificielle et d'autre qui ont été presque entièrement composé par une IA.

La première écoute que je vais analyser est la première musique publié par l'équipe de Flow Machines : Daddy's car.

Daddy's car (a song composed by Flow Machines)

publiés le 19 septembre 2016

Document : pochette du Single Daddy's car

La chanson a été créée par des chercheurs de Sony, qui ont utilisé le logiciel Flow Machines de la société pour analyser une base de données de 13 000 lead sheets (partitions de base qui enregistrent la mélodie et l'harmonie des morceaux) de différents genres à travers le monde. Le logiciel écrit ses propres mélodies et un compositeur français, Benoît Carré, alias Skygge, membre de l'équipe et ancien du groupe Lilicub, a été recruté pour transformer le matériel en un morceau entièrement produit. Il a simplement saisi le style de musique souhaité (dans ce cas, Les Beatles ) et s'est mis au travail. Pour ça Benoît Carré à donner à l'IA toutes la discographie des Beatles et lui a demander de créer quelque chose de nouveau. L'IA lui donne ensuite accès à la partitions. A part les paroles qui on été écrite par le compositeur tout le reste de la musique proviens de l'intelligence artificielle. Le compositeur à cependant enregistré de vrai instrument sur la partitions donné par Flow Machines pour un rendu plus organique.

Le rendu de cette musique est correct, et l'on perçoit clairement l'inspiration des Beatles. Néanmoins, cette composition suscite une réflexion sur l'avenir de ces technologies. À l'heure actuelle, il est évident qu'un musicien talentueux est capable de créer de la musique avec bien plus d'âme et de profondeur. Il est important de souligner que cette musique n'est pas le résultat d'une machine seule, mais qu'il y a des musiciens qui jouent les partitions et un être humain qui écrit les paroles. C'est grâce à ces deux facteurs que cette musique peut être écoutée sans problème.

Il est essentiel de reconnaître que l'intervention humaine reste cruciale pour donner vie et sens à la musique. Les technologies telles que Flow Machines ne sont qu'un outil qui peut aider à générer des partitions remarquables, mais elles ne peuvent pas égaler la créativité, l'expression et l'émotion authentique d'un musicien talentueux. Les algorithmes peuvent fournir des motifs musicaux intéressants, mais c'est l'interprétation humaine et la capacité à transmettre des émotions qui font la véritable essence de la musique.

SITOGRAPHIE

· TheVerge.com

· SoundCloud.com

L'oeuvre créée par cette IA est une illustration intéressante de ce que les algorithmes peuvent accomplir, mais elle met également en lumière la valeur unique de la créativité humaine.

En tant que musiciens et auditeurs, il est important de continuer à célébrer et à encourager l'expression artistique humaine, tout en explorant les possibilités offertes par ces nouvelles technologies.

Le futur de ces technologies reste à définir, mais il est probable que l'intelligence artificielle continuera à évoluer et à avoir un impact sur la création musicale. Cependant, il est essentiel de maintenir un équilibre entre l'utilisation des outils technologiques et la préservation de l'authenticité et de l'âme de la musique.

34 sur 51

SITOGRAPHIE

· TheVerge.com

· SoundCloud.com

SKYGGE feat. Kiesza « Hello Shadow »

composed by Stromae with Flow Machines- publiée le 1 septembre 2017

(Document : Pochette de l'album Hello World ).

Un an après avoir mis en ligne un premier morceau Daddy's car, elle s'est donnée pour défi de créer un album entier et de le commercialiser. Pour Benoît Carré, "de la même manière que le synthétiseur a révolutionné la musique dans les années 80, l'utilisation de l'intelligence artificielle est la prochaine étape dans l'évolution des outils d'aide à la création musicale, et va produire des environnements très nouveaux et stimulants".

Pour cet album, Benoit Carré a choisi les artistes et collaboré à plusieurs des titres. L'album sera distribué sur les principales plateformes en ligne. Nous allons nous intéresser au morceau qui à le mieux marché de l'album : Hello Shadow.

C'est Stromae qui a composé ce morceau avec l'aide de Flow machines. Il est issue de l'album « Hello World » qui est le premier album musical composé avec une intelligence artificielle, par le musicien, compositeur et producteur français SKYGGE a.k.a Benoit Carré, qui s'est entouré d'artistes francophones et internationaux. Cet album est l'aboutissement de Flow Machines, qui est un projet de recherche scientifique.

Ici le compositeur utilise une IA comme un outil qui va générer des toplines*, des lead mélodiques, des harmonies, des voix É (source : interview du directeur du projet flow machine). Stromae va utiliser cet outil pour lui donne des idées, de l'inspiration.

« Elle est capable de repérer des régularités que même les êtres humains ne sont pas capables de voir », indique François Pachet. Elle génère des mélodies, des harmonies, ou des voix que l'artiste peut modifier, et même effacer, au fil de la collaboration. Elle ne remplace pas le compositeur, elle l'assiste. « Pour qu'il y ait une oeuvre d'art, il faut une intention, une envie, un moteur, c'est l'artiste qui fait ça, mais il va être aidé par la technologie », précise le scientifique à l'origine du projet.

35 sur 51

*Toplines : Selon l'artiste et toplineuse Meryl, une topline est un "yaourt (chanter en produisant des sons) organisé", qui concrètement permet donc de trouver une mélodie de voix sur une instrumentale. "Topliner" un morceau permet de le structurer ainsi que de lui donner une base très claire pour faciliter ensuite l'écriture des paroles

Lorsque l'on est familier avec les musiques de Stromae, on reconnaît immédiatement sa patte musicale dans ce morceau. Selon François Pachet, il est clairement inspiré de la Morna*. Ce morceau n'a rien à voir avec "Daddy's Car". En effet, on perçoit un intérêt artistique bien plus prononcé que dans le premier cas. Les artistes ont occupé une place bien plus importante dans cette production, en co-composant notamment. Les sonorités apportées par Stromae sont clairement audibles. De plus, il y a une véritable chanteuse (Kiesza) sur ce morceau, ce qui lui confère du rythme et de la vivacité, contrairement au premier morceau où des voix synthétiques ont été utilisées pour recréer l'ambiance des chansons des Beatles.

Cette comparaison met en évidence le rôle essentiel des artistes dans la création musicale. L'intelligence artificielle peut être un outil intéressant pour stimuler l'inspiration et générer des idées, mais c'est l'interprétation humaine, la créativité et l'expression artistique qui donnent véritablement vie à une oeuvre musicale. Lorsque les artistes s'impliquent activement dans le processus de création en utilisant ces technologies, ils peuvent apporter leur sensibilité, leur expérience et leur personnalité pour façonner une musique unique et captivante. Il est également important de souligner l'importance des voix humaines dans la musique. La présence d'une chanteuse réelle sur le deuxième morceau donne une dimension supplémentaire à l'oeuvre, en transmettant des émotions authentiques et en créant une connexion avec l'auditeur.

En conclusion, la présence et l'apport des artistes dans la co-création avec l'intelligence artificielle sont essentiels pour obtenir des résultats artistiquement intéressants. L'IA peut être une source d'inspiration et d'idées, mais elle ne peut pas remplacer l'expression humaine et l'interprétation artistique.

36 sur 51

*La Morna : style de musique typique du Cap-Vert, elle se caractérise par des rythmes lents et langoureux

Holly Herndon - PROTO

Album publié de 10 mai 2019

(Document : pochette de l'album PROTO).

Holly Herndon (artiste américaine) à mis au point avec son équipe une intelligence artificielle appelé « Spawn » . Pendant 2 ans il lui on fournit plusieurs voix de chanteur qu'elle interprète ensuite à sa façon.

Cet album qui est le troisième de la chanteuse qui est un projet conceptuelle

« Quand on fournit des sons à une IA on peut vraiment entendre la logique de son réseaux neuronals, la machine travail motif par motif, elle découpe le son samples par samples, elle assimile la logique de ma voix. Ce qui m'intéresse surtout c'est de savoir comment je peut utilisé cette technologie pour développer une nouvelle esthétique et de nouvelles possibilités . Comment en tant qu'être humain je peut apprendre de la machine ? »

Holly Herndon dans une video posté sur la chaine YouTube TRACKS / ARTE : un choeur et une intelligence artificielle.

Dans cet album, la compositrice américaine a utilisé une intelligence artificielle pour interagir avec le chant humain et mêler sa propre voix numérique aux voix physiques d'une chorale. Le résultat est véritablement fascinant et semble tout droit sorti de la science-fiction, comme en témoignent des titres originaux et organiques tels que « Alienation », « Eternal » et « Crawler » qui est terrifiant. Les voix humaines et cybernétiques s'entremêlent sur des influences qui oscillent entre folk et techno. Proto va au-delà de la simple musique, c'est une artiste qui cherche à insuffler la science dans sa création musicale. C'est un véritable travail de recherche scientifique.

37 sur 51

SITOGRAPHIE

· Article posté le 12 mai 2019 par Les oreilles curieuses.

· Video posté sur la chaine YouTube TRACKS / ARTE : un choeur et une intelligence artificielle.

· Rencontre Holly Herndon, pur esprit de synthèse (article écrit par Olivier Lamm dans le journal Libération, le 12 mai 2019).

«À travailler autour du sujet de l'intelligence artificielle, tu te retrouves à te poser des grandes questions : que signifie être humain, comment définir l'acte de création, quel rôle la musique a-t-elle joué dans l'évolution de notre espèce ? Rapidement, ça devient psychédélique : mon moi existe-t-il ou est-il seulement un modèle de soi, comme le théorise le philosophe allemand Thomas Metzinger, qui résume l'esprit à un capteur super complexe qui traiterait en permanence les informations pour constamment évoluer ? Tout ça est fascinant, et à ce titre tout à fait légitime à être mêlé à un processus de création musicale. Il existe tout un champ de la science qui étudie la manière dont la musique a accompagné l'évolution de l'intelligence humaine. En comparant différentes musiques traditionnelles de différentes civilisations à travers le monde, on peut retrouver des idées esthétiques similaires. J'entrevois qu'une réduction de ce socle commun pourrait participer à une définition de ce qui nous rend humain. Mais pour le distinguer, il faut le mettre en péril par l'inhumain. Ce n'est un secret pour personne que les robots nous ont beaucoup aidés à comprendre notre humanité.»

Holly Herndon dans une interview pour le journal Libération.

38 sur 51

SITOGRAPHIE

· Rencontre Holly Herndon, pur esprit de synthèse (article écrit par Olivier Lamm dans le journal Libération, le 12 mai 2019)

39 sur 51

Travis Bott - Jack Park Canny Dope Man

(Document : pochette du Single Jack Park Canny Dope Man).

Ce morceau à été créé par l'agence de production américaine Space 150. Cette entreprise à fait énormément parlé d'elle en sortant cette musique.

Travis Bott est un jeu de mot avec l'artiste et rappeur américain Travis Scott. Le mot Bott utilisé par l'agence veut en réalité dire « robot ». On pourrait traduire son nom par Travis le robot car c'est effectivement une IA qui a créée ce morceau. Pour en arrivé à ce résultat l'entreprise en donner toute la discographie du rappeur et elle a laissé deux semaine à l'intelligence artificielle pour créer un nouveau morceau de l'artiste. On lui a fournit des instrumentales qui ressemble beaucoup à celle que Travis Scott utilise, également des textes et des toplines similaire.

Les paroles et les mélodies ont été entièrement générées par un modèle d'apprentissage automatique formé sur la musique du rappeur.

SPACE150 (l'entreprise qui a conçu cette algorithme) nous dise qu'ils ont utilisé des réseaux de neurones artificielles pour produire la musique.

« Notre équipe a enseigné à la machine à la fois la grammaire et la cadence de rimes, en créant des flux de travail personnalisés pour faire correspondre les couplets de rimes et le nombre de syllabes dans chaque ligne. »

Il est fascinant d'écouter ce morceau, car le résultat est vraiment impressionnant. La qualité sonore est excellente, ce qui soulève des interrogations dans notre domaine. Si n'importe qui pouvait accéder à un outil permettant de créer et de mixer n'importe quelle musique avec un rendu satisfaisant, peu de personnes seraient motivées à payer pour des sessions de mixage.

Ce qui me fait particulièrement réfléchir, c'est l'écriture des paroles par un algorithme. Ecrivant moi-même des paroles de chanson, je suis étonné de constater à quel point les schémas de rimes sont respectés, même si de nombreuses phrases sont absurdes et dénuées de sens. Bien que ce morceau soit bien construit avec ses sonorités, son refrain et ses couplets, il est important de rappeler que la musique demeure et restera toujours une oeuvre d'art, et une oeuvre d'art est pertinente lorsqu'elle émane de l'esprit d'un être humain et non d'un algorithme.

SITOGRAPHIE

· space150.com

· genius.com

40 sur 51

L'équipe de Space 150 est bien conscient que l'algorithme est au limite de l'intelligence artificielle, en effet au début du clip il y a une citation du philosophe français Jean Baudrillard qui dit « La tristesse de l'intelligence artificielle est qu'elle est sans artifice, donc sans intelligence. » De Jean Baudrillard, Cool Memories - 1980-1985

Les créateurs de Travis Bott le dise eux même : « ce projet montre à quel point la technologie a besoin d'une importante supervision humaine pour développer des projets créatifs comme de la musique. L'intelligence artificielle n'est donc pas prête de remplacer nos artistes préférés. En revanche , elle change d'ores et déjà beaucoup de choses dans le monde de l'industrie musicale. » Ned Lampert, directeur exécutif de la création chez space150.

Il est fascinant d'analyser ce morceau, car il représente un exemple où l'humain a accordé une grande liberté à une intelligence artificielle pour créer de la musique. Ce qui est remarquable, c'est que cette composition a suscité en moi un réel intérêt artistique et que je l'ai moi-même écoutée pour le plaisir auditif alors qu'elle n'est pas pertinente. Cela soulève la question de la complexité des intelligences artificielles dans les domaines artistiques : comment une oeuvre d'art créée par une intelligence artificielle peut-elle avoir une valeur artistique ?

Cette grâce à cette expérience d'écoute que j'ai décidé de consacrer mon mémoire à l'intelligence artificielle dans la production musicale. Je me suis demandé comment il était possible d'obtenir un résultat d'une telle qualité, ce qui a éveillé ma curiosité à comprendre les rouages de ces nouvelles technologies. Il est indéniable que les avancées de l'intelligence artificielle dans le domaine de la création musicale suscitent des questions fondamentales sur la nature de l'art et de la créativité. Peut-on considérer une oeuvre créée par une intelligence artificielle comme une véritable expression artistique ? Est-ce que la créativité et l'émotion qui émanent d'une telle oeuvre sont authentiques ?

Ces interrogations sont légitimes et méritent d'être explorées davantage. Il est possible que les oeuvres produites par les intelligences artificielles soient considérées comme des expressions artistiques à part entière, car elles peuvent éveiller des émotions chez les auditeurs et susciter une appréciation esthétique. Toutefois, il est également important de reconnaître que l'intervention et l'interprétation humaines restent cruciales pour donner un sens et une signification à ces créations.

41 sur 51

Conclusion.

L'intelligence artificielle (IA) a apporté des avancés technologiques significatives dans la production musicale. Elle offre des opportunités intéressantes pour les artistes, les producteurs et les ingénieurs du son.

Nous avons démontrer un certains nombre d'applications possible des IA dans la production musical tel la reconnaissance musicale. Cette technologie analyse et reconnait des éléments audio tel que les instruments, les voix, les genres musicaux, les tempos ou encore les structures. Permettant de retoucher des vielles musiques ou des vieux films.

Les IA donne la possibilité d'améliorer la qualité audios avec des outils de restaurations. Cette applications de l'intelligence est très utilisé en audiovisuelle mais également en musique car elle peut analyser des enregistrements musicales et les améliorer en ajustant la tonalité, le timing, le rythme et même en corrigeant les erreurs. Cela permet d'obtenir des enregistrements plus précis et de haute qualité, en économisant du temps et des ressources.

Ces technologies sont également utilisées dans le mixage. L'IA peut être utilisée pour automatiser certaines tâches de production et de mixage, telles que l'équilibrage des niveaux sonores, le traitement des effets audio et l'optimisation de la spatialisation du son. Cela permet de gagner du temps et de rendre le processus de production plus efficace.

On peut ensuite appliquer les algorithmes d'IA dans la composition musicale, les intelligences artificielles peuvent générer de la musique originale en utilisant des modèles préexistants et des structures harmoniques. Comme nous l'avons vue avec l'outil Flow Machines. Ils peuvent créer de nouvelles mélodies, harmonies et arrangements, offrant ainsi aux compositeurs une source d'inspiration ou une base à développer.

Enfin nous avons vue que les IA peuvent être utilisé pour développer des interactions créatives, c'est comme ça que l'artiste Holly Herndon applique cette forme d'intelligence. L'interaction créatives permet aux musiciens de collaborer avec des machines et d'explorer de nouvelles idées musicales. L'application de cette IA permet de générer des réponses musicales en temps réel, s'adaptant aux improvisations des musiciens humains.

En conclusion, l'intelligence artificielle offre des avantages considérables dans le domaine de la production musicale. Elle élargit les possibilités créatives des artistes, augmente l'efficacité des processus de production et permet de créer des expériences musicales uniques. Cependant, il est important de souligner que l'IA ne remplace pas l'aspect humain de la musique, mais plutôt l'amplifie et le complète. L'alliance entre les capacités de l'IA et la créativité humaine offre un potentiel prometteur pour l'avenir de la production musicale, elle peut en même temps détruire des métiers artistiques ce qui fait poser beaucoup de questions sur l'avenir de nos métiers.

Il est possible d'ouvrir ce mémoire sur la problématique suivante : Qu'elles sont les applications de l'intelligence artificiel dans la création artistique ?

42 sur 51

Annexes.

Annexe 1 : Guide de prise en main Hit'n'Mix.

(c) Hit'n'Mix Ltd 2009-2021

RipX Manual

Much of RipX is described by the Interactive Help box which can be activated from the Help menu.

It is also a good idea to watch the walkthrough YouTube videos available from Help > YouTube Videos.

Contents

RipX: DeepPlayer, DeepRemix & DeepAudio

4

Opening, Ripping & Exporting Audio/Video

4

Opening & Ripping Audio

4

Preparing Rips for Editing

6

Exporting Audio

7

Video Import & Export (macOS only)

7

DeepRemix: The Cursor, Selections, Groups & Effects

9

The Cursor

9

Note & Time Selections

9

Groups

10

Applying Adjustments & Effects to Selections

10

DeepRemix: Essential Step-By-Step Editing Instructions

13

Pitch

13

Chromatically edit pitch

13

Edit pitch over a musical scale

13

Finely edit pitch

14

Quickly flatten, slide, or add constant vibrato to pitch

14

Rhythm

15

Edit rhythm by moving the starts of notes

15

Edit rhythm by adding/removing notes

15

Note Duration, Tempo & Time

16

Edit note duration

16

Edit tempo

16

Edit time

17

Volume & EQ

17

Unpitched Sound

18

DeepRemix: Playback, Loops, Randomize & Ripples

19

Playback

19

Loops

19

Randomize

20

Randomize Adjustments / Effects

20

1

Lien de téléchargement du manuel :

https://bestmusicsheet.com/wp-content/uploads/2022/02/RipX-Manual.pdf

Français

Guide de Prise en Main

43 sur 51

Annexe 2 : Guide de prise en main iZotope.

Lien de téléchargement du manuel :

M-AUDIO IZOTOPE RX QUICK START GUIDE: Télécharger le mode d'emploi au format PDF (378 Ko)

44 sur 51

Annexe 3 : Guide de prise en main FAST EQUALISER.

Manual

Lien de téléchargement du manuel :

https://collective.focusrite.com/documents/fast-equaliser.pdf

45 sur 51

Annexe 4 : Guide de prise en main FAST COMPRESSOR.

Manual

Lien de téléchargement du manuel :

https://collective.focusrite.com/documents/fast-compressor.pdf

46 sur 51

Annexe 5 : Guide de prise en main FAST VERB.

Manual

Lien de téléchargement du manuel :

https://collective.focusrite.com/documents/fast-verb.pdf

47 sur 51

Annexe 6 : Guide de prise en main FAST LIMITER.

Manual

Lien de téléchargement du manuel :

https://collective.focusrite.com/documents/fast-limiter.pdf

Annexe 7 : Guide de prise en main Smart Eq 3.

 
 

smart:EQ3

manual

 
 

smart:EQ 3

manual

The intelligent equalizerequalizer

48 sur 51

Lien de téléchargement du manuel :

https://www.sonible.com/wp-content/uploads/2021/05/manual-smartEQ3-1.pdf

49 sur 51

Annexe 8 : Guide de prise en main Playbeat audiomodern.

Windows, MacOS & iOS

Getting Started

Lien de téléchargement du manuel :

// www.mediafire.com/file/ivrkwp2xlo18kpu/Playbeat_3_User_Manual.pdf

50 sur 51

Annexe 9 : Guide de prise en main Algonaut Audio Atlas 2.

Lien de téléchargement du manuel :

https://algonaut.audio/manuals/atlas/2_0_2/index.html

51 sur 51

Annexe 10 : Article de recherche sur Flow Machines.

Assisted music creation with Flow Machines:
towards new categories of new

François Pachet, Pierre Roy, Benoit Carré
CTRL, Spotify francois@spotify.com

Abstract. This chapter reflects on about 10 years of research in AI-assisted music composition, in particular during the Flow Machines project. We reflect on the motivations for such a project, its background, its main results and impact, both technological and musical, several years after its completion. We conclude with a proposal for new categories of «new», created by the many uses of AI techniques to generate novel material.

Keywords: Machine-Learning· Markov chains · Applications · Music · global constraints

1 Background and Motivations

The dream of using machines to compose music automatically has long been a subject of investigation, by musicians and scientists.

Since the 60s, many researchers used virtually all existing artificial intelligence techniques at hand to solve music generation problems. However, little convincing music was produced with these technologies.

A landmark result in machine music generation is the Illiac suite, released to the public in 1956 [17]. The Illiac suite demonstrated that Markov chains of a rudimentary species (first order, augmented with basic generate-and-test methods) could be used to produce interesting music1.

However, the technology developed for that occasion lacked many fundamental features, to make it actually useable for concrete, professional musical projects. Notably, the experiment involved generate-and-test methods to satisfy various constraints imposed by the authors. Also, the low order of the Markov chain did not produce convincing style imitation. In spite of these many weaknesses, the Illiac suite remains today a remarkable music piece, that can still be listened to with interest.

The Flow Machines project (2012-2017) 2 aimed at addressing the core technical issues at stake when generating sequences in a given style. In some sense, it addressed the two main weaknesses of the Markov chains used in the Illiac suite:

1 we invite the reader to listen to the Illiac suite, composed more than 70 years ago, to appreciate its enduring innovative character https://www.youtube.com/watch? v=n0njBFLQSk8

2 funded by an ERC advanced grant, and conducted at Sony CSL and UniversitéPierre et Marie Curie, now Sorbonne Université.

Lien de téléchargement de l'article :

https://www.francoispachet.fr/wp-content/uploads/2020/05/FlowMachines.pdf






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Il ne faut pas de tout pour faire un monde. Il faut du bonheur et rien d'autre"   Paul Eluard