Romain Hervy ISTS 3 Musique 2022/2023
Quelles sont les applications de
l'intelligence artificielle (IA) dans la
production musicale ?
1 sur 51
Directeur de mémoire : Julien Henocq ESRA
BRETAGNE
2 sur 51
Sommaire
Note d'intention. 3
Introduction. 4
I - L'intelligence et l'IA. 5
1) Qu'est-ce que l'intelligence ? 5
2) Qu'est-ce que l'intelligence artificielle ? 6
A) Le fonctionnement d'une intelligence artificielle. 9
B) Le Machine Learning (ou apprentissage automatique). 12
C) Le Deep Learning (ou apprentissage profond). 14
D) Réseaux de neurones. 17
II L'IA dans la production musicale. 20
Les plug-ins et les logiciels intelligent. 20
III Écoutes critiques. 33
Daddy's car (a song composed by Flow Machines) 33
SKYGGE feat. Kiesza « Hello Shadow » 35
Holly Herndon - PROTO 37
Travis Bott - Jack Park Canny Dope Man 39
Conclusion. 41
Annexes. 42
3 sur 51
Note d'intention.
« Les applications de l'intelligence artificielle
(IA) dans la création
musicale. »
L'intelligence artificielle (IA) m'a toujours captivée,
suscitant en moi un intérêt particulier quant à son
fonctionnement. Parallèlement, la musique a toujours été
une part intégrante de ma vie, tant par ma pratique artistique que par
mon écoute quotidienne. Ainsi, il m'est apparu pertinent d'orienter mon
mémoire vers l'intégration de l'intelligence artificielle dans le
domaine de la production musicale.
Au cours des dernières années, nous avons
assisté à des avancées significatives dans l'utilisation
de l'IA dans le secteur musical. De nombreuses plateformes et logiciels ont
émergé, offrant aux utilisateurs des outils basés sur
l'intelligence artificielle pour créer, composer, produire et même
analyser la musique. Les artistes, les producteurs et les auditeurs sont
confrontés à de nouvelles opportunités et à de
nouveaux défis, allant de la question de l'originalité artistique
à l'impact sur l'emploi dans l'industrie musicale. Cette fusion entre
l'IA et la musique offre de vastes possibilités et présente un
potentiel créatif passionnant. C'est pourquoi ce sujet, en plus
d'être d'une grande pertinence à mes yeux, revêt un
intérêt particulier de par sa résonance avec
l'actualité du moment.
Le but de mon mémoire est de fournir une vue d'ensemble
des différentes applications de l'IA dans la production musicale, en
explorant les avantages et les inconvénients de l'utilisation de ces
technologies. J'entends examiner comment l'IA peut être utilisée
pour générer automatiquement des compositions musicales,
améliorer les performances d'enregistrement, faciliter le processus de
mixage et de mastering, ou même créer de nouvelles
sonorités innovantes. Je suis convaincu que cette recherche contribuera
à enrichir les connaissances sur l'interaction entre l'intelligence
artificielle et le monde de la musique, ouvrant ainsi de nouvelles voies pour
l'innovation et la créativité artistique.
4 sur 51
Introduction.
Afin de mener à bien ces recherches, il convient tout
d'abord de définir l'intelligence dans son sens le plus large, ainsi que
l'intelligence artificielle à travers ses courants majeurs. Ensuite,
nous nous concentrerons sur l'aspect technique de cette discipline en
expliquant les concepts fondamentaux tels que le Machine Learning, le Deep
Learning et le fonctionnement des réseaux neuronaux.
Dans un second temps, nous démontrerons la pertinence
des intelligences artificielles dans les domaines de la composition, du mixage
et du mastering, en mettant à l'épreuve différents
plug-ins et logiciels intelligents. Nous procéderons à des tests
concrets, en utilisant moi-même ces outils, afin d'évaluer leur
efficacité.
Enfin, nous illustrerons nos propos en analysant des oeuvres
créées à l'aide d'intelligence artificielle, telles que
« Hello Shadow » et « Daddy's Car » de
l'artiste SKYGGE, « PROTO » de Holly Herndon, ou encore
« Jack Park Canny Dope Man » de Travis Bott.
En conclusion, nous identifierons les multiples applications
et possibilités offertes par ces « intelligences artificielles
» dans le domaine de musical. Nous chercherons à les tester,
à les étudier et à comprendre en quoi elles sont
véritablement des intelligences artificielles, en soulignant leurs
atouts et leurs limites. Ainsi, la problématique proposée
s'articulera autour des applications de l'intelligence artificielle dans la
production musicale et permettra de répondre de manière
approfondie à cette question essentielle.
5 sur 51
I - L'intelligence et l'IA .
1) Qu'est-ce que l'intelligence ?
Dans cette première partie, nous allons explorer les
notions d'intelligence générale et d'intelligence artificielle,
mettant en évidence leurs similitudes et leurs différences, tout
en définissant ces deux concepts.
Pour commencer, il nous est essentiel de clarifier la notion
d'intelligence au sens large du terme. L'intelligence désigne la
capacité d'un être à comprendre, à apprendre,
à résoudre des problèmes, à s'adapter à son
environnement et à prendre des décisions de manière
efficace. Elle englobe des facultés cognitives telles que la perception,
l'apprentissage, le raisonnement, la créativité et
l'adaptabilité.
Pour appuyer le concept d'intelligence, nous allons nous
pencher sur les travaux de Howard Gardner, professeur à Harvard ayant
basé ses recherches sur les enfants en échec scolaire, et ayant
proposé la Théorie de l'Intelligence Multiple. Sur les neufs
formes d'intelligence abordé par Howard Gardner, nous pouvons porter
notre intérêt sur trois formes en particulier, car elles sont en
liens avec celle que l'on peut retrouver dans les IA.
· L'intelligence logico-mathématique :
elle représente la capacité à travailler à
l'aide de chiffres, à analyser des situations, à mettre au point
des raisonnements.
· L'intelligence verbo-linguistique :
il s'agit de la capacité à comprendre et à
énoncer des idées par le langage. Elle requiert une bonne
connaissance et maîtrise du vocabulaire, ainsi que de la syntaxe et des
figures de style.
· L'intelligence musicale : elle
représente la capacité à reconnaître les
mélodies, les notes et les harmonies, ou à les créer.
En conclusion, l'intelligence, dans son sens large, englobe
la capacité d'un être à comprendre, apprendre,
résoudre des problèmes, s'adapter à son environnement et
prendre des décisions efficaces. Elle englobe des facultés
cognitives telles que la perception, l'apprentissage, le raisonnement, la
créativité et l'adaptabilité. Cette notion d'intelligence
est soutenue par la théorie des intelligences multiples proposée
par Howard Gardner, qui identifie différentes formes d'intelligence,
dont certaines sont étroitement liées à celles que l'on
peut retrouver dans les systèmes d'intelligence artificielle.
BIBLIOGRAPHIE
· L' Intelligence Artificielle pour les
développeurs. Concepts et implémentations en C# (Virginie
MATHIVET, 2014, page 21).
· Les formes de l'intelligence (Howard Gardner,
1983).
· Dictionnaire Le Robert (2023).
2) Qu'est-ce que l'intelligence artificielle
?
L'intelligence artificielle, quant à elle, est un
domaine de recherche et de développement visant à créer
des systèmes et des machines capables d'imiter certaines facettes de
l'intelligence humaine. L'intelligence artificielle s'appuie sur des
algorithmes, des modèles mathématiques et des techniques de
traitement de l'information pour permettre aux machines d'accomplir des
tâches qui nécessitent normalement l'intervention humaine. Tout
système qui pourrait s'adapter pour donner une réponse
adéquate à son environnement pourrait être
considéré comme intelligent. On parle alors d'intelligence
artificielle (I.A.), terme en créé en 1956 par John McCarthy,
célèbre informaticien américain.
Cependant, toutes les facultés que l'on peut donner
à un ordinateur ne sont pas considérées comme faisant
partie de l'intelligence artificielle. Ainsi, un ordinateur qui peut
résoudre des équations complexes dans un temps bien plus court
que ce que pourrait faire un humain, n'est pas considéré comme
intelligent.
Auparavant, l'évaluation de l'intelligence d'un
système informatique était souvent associée au test de
Turing, proposé en 1950 par Alan Turing, mathématicien et
cryptologue britannique. Ce test consiste à faire communiquer un testeur
humain avec deux écrans. Derrière l'un de ces écrans, se
trouve un autre humain qui interagit avec le testeur, tandis que
derrière le deuxième écran se trouve le programme
d'intelligence artificielle (IA) testé. L'objectif du test est de
parvenir à identifier quel interlocuteur est humain et lequel est une
machine. Si le testeur ne parvient pas à différencier l'IA de
l'humain, alors le test est considéré comme réussi.
6 sur 51
BIBLIOGRAPHIE
· L' Intelligence Artificielle pour les
développeurs. Concepts et implémentations en C# (Virginie
MATHIVET, 2014, page 24.).
· Dictionnaire Le Robert (2023).
· Computing machinery and intelligence, Mind,
Oxford University Press, (Alan Turing, vol. 59, no 236, octobre
1950, p. 433-46.
7 sur 51
Nous pouvons alors, grâce à ce test de Turing
effectué dans les année 1950, constater qu'il est parfois
difficile de déterminer le type d'intelligence auquel nous sommes
confronté. Après avoir analyser les résultats de ce test,
nous pouvons voir que sur les 168 personnes participantes, 60,41% pensent
être confronté à une I.A, 32,14% pensent avoir à
faire à un humain et 7,14%, soit 12 personnes, sont incapables de donner
de réponse.
(Document : Exemple de Test de Turing).
Il reste tout de même difficile de tester
l'intelligence artificielle. En effet, ce programme test « l'intelligence
» seulement grâce à la communication écrite, ce qui
limite sa pertinence. De plus, un programme « non-intelligent » qui
ne ferait que reprendre en partie les phrases dites sans les comprendre peut
réussir ce test, comme c'est le cas d'ELIZA, programme informatique
créé en 1966 par Joseph Weizenbaum.
SITOGRAPHIE
https://iatpe2015.wordpress.com/le-fonctionnement/le-test-de-turing/
De plus, le test de Turing ne vise pas à
évaluer directement l'intelligence d'un ordinateur, mais plutôt
à déterminer s'il peut se comporter de manière similaire
à un être humain. Cependant, étant donné que
l'intelligence et les comportements humains ne sont pas identiques, le test ne
permet pas de mesurer précisément l'intelligence de deux
manières distinctes.
· Certains comportements intelligents ne sont pas
humains : le test de Turing ne vérifie pas la présence, ou
l'absence, d'un comportement intelligent, tel que la capacité de
résoudre des problèmes difficiles ou de trouver des idées
originales. Elle exige expressément la tromperie de la part de la
machine : si la machine est plus intelligente qu'un être humain, il lui
faut délibérément éviter de paraître trop
intelligente. Si elle était capable de résoudre un
problème de calcul qui serait impossible pour un humain, alors
l'interrogateur saurait que le programme n'est pas humain, et la machine ne
satisferait pas au test.
· Certains comportements correspondant à une
intelligence humaine ne sont pas parfaits ou rationnels. Le test de Turing
exige que la machine puisse exécuter tous les comportements humains,
incluant même des comportements que l'on peut considérer comme
imparfaits ou irrationnels, tels que la susceptibilité à des
insultes, la tentation de mentir ou, tout simplement, une fréquence
élevée d'erreur de frappe. Si une machine ne peut imiter le
comportement humain dans le détail, comme faire des erreurs de frappe,
l'intelligence échoue au test, indépendamment de la façon
dont elle peut être intelligente.
En conclusion, l'intelligence artificielle est un domaine de
recherche et de développement qui vise à créer des
systèmes et des machines capables d'imiter certaines facettes de
l'intelligence humaine. Cela implique l'utilisation d'algorithmes, de
modèles mathématiques et de techniques de traitement de
l'information pour permettre aux machines d'accomplir des tâches qui
nécessitent normalement l'intervention humaine. L'objectif ultime de
l'intelligence artificielle est de créer des systèmes capables de
s'adapter à leur environnement et de fournir des réponses
adéquates. Cependant, toutes les capacités informatiques ne sont
pas considérées comme faisant partie de l'intelligence
artificielle, et l'évaluation de cette dernière peut être
complexe.
8 sur 51
SITOGRAPHIE
·
https://iatpe2015.wordpress.com/le-fonctionnement/le-test-de-turing/
A) Le fonctionnement d'une intelligence
artificielle.
Dans un premier temps, nous allons aborder les courants
importants de l'intelligence artificielle, puis nous montrerons les liens
entres les différentes technologies pour expliquer son
fonctionnement.
Pour commencer, nous allons nous pencher sur les courants
majeurs de l'approche symbolique et de l'approche connexionniste.
· L'approche symbolique :
L'approche symbolique repose sur la manipulation de symboles,
c'est-à-dire la capacité d'un système informatique
à représenter, manipuler et raisonner sur des symboles abstraits
comme des concepts, des objets, des relations ou des règles logiques.
Elle met l'accent sur la représentation explicite des connaissances et
sur le raisonnement symbolique.
· L'approche connexionniste :
Elle est inspirée par le fonctionnement du cerveau, se concentre sur les
réseaux de neurones artificiels interconnectés (voir page
15). Ces réseaux sont capables d'apprendre à partir de
données et d'ajuster leurs connexions pour effectuer des tâches
spécifiques. L'approche connexionniste met l'accent sur l'apprentissage
automatique et le traitement distribué de l'information.
Pour une meilleure appréhension de comment fonctionne
une IA grâce à ces courants nous pouvons nous pencher sur les
différentes technologies. « Deep Learning », un livre
écrit par Ian Goodfellow (informaticien, ingénieur, cadre, et
professeur d'université, connu pour ses travaux sur les réseaux
de neurones artificiels et sur le Deep Learning), Yoshua Bengio (informaticien,
chercheur et spécialiste en intelligence artificielle, et pionnier du
Deep Learning) et Aaron Courville (enseignent à l'école de
science informatique de l'université de Carnegie Mellon et à
l'université de Toronto). Dans ce livre, les trois auteurs utilisent le
diagramme de Venn pour expliquer le lien entre une IA et ses technologies.
9 sur 51
BIBLIOGRAPHIE
· L' Intelligence Artificielle pour les
développeurs. Concepts et implémentations en C# (Virginie
MATHIVET, 2014, page 26.)
· Deep Learning (Ian Goodfellow, Yoshua Bengio
et Aaron Courville, 2015, page 9)
10 sur 51
(Document : Diagramme de Venn expliquant le lien entre une IA et
ses technologies).
|
|
Ce diagramme montre comment le Deep Learning (voir page
14) est une forme de Machine Learning (voir page 12),
utilisé pour de nombreuses approches de l'IA. Chaque section du
diagramme de Venn comprend un exemple des différentes technologies au
service du fonctionnement d'une IA.
Plus une intelligence artificielle à des couches de
technologies, plus elle est complexe. Plus une IA est complexe, plus elle est
performante.
Le Representation Learning est une technologie complexe
utilisée dans le Machine Learning qu'il n'est pas nécessaire de
développer pour comprendre le fonctionnement d'une IA.
|
|
Pour bien comprendre le schéma ci-dessus, nous allons
nous pencher sur les termes qui y sont employés.
(Document : Schéma du perceptron multicouche).
|
Le MPLs (MultiLayer Perceptrons ou Perceptron Multicouche en
français) est largement utilisée dans le domaine de
l'apprentissage automatique et de l'intelligence artificielle. Il s'agit d'un
type de réseau de neurones artificiels à propagation avant,
c'est-à-dire que l'information circule de la couche d'entrée vers
la couche de sortie sans boucle récurrente.
|
|
BIBLIOGRAPHIE
· L' Intelligence Artificielle pour les
développeurs. Concepts et implémentations en C# (Virginie
MATHIVET, 2014, page 26.)
· Deep Learning (Ian Goodfellow, Yoshua Bengio et
Aaron Courville, 2015, page 9)
11 sur 51
Le Logistic regression (régression logistique en
français) est un algorithme d'apprentissage supervisé
utilisé pour la classification binaire ou la prédiction de
probabilités. Contrairement à son nom, il ne s'agit pas d'une
technique de régression classique, mais plutôt d'une
méthode de classification.
Quant à la Knowledge bases (ou base de connaissances
en français), c'est un modèle de gestion des connaissances qui
joue un rôle de centralisation de l'information, pour la rendre
facilement accessible. C'est un mécanisme efficace pour exploiter au
mieux toutes les données disponibles d'un sytème intelligent.
En conclusion, nous pouvons dire que les intelligences
artificielles fonctionnent grâce au Deep Learning qui est une approche
spécifique du Machine Learning, utilisant des réseaux neuronaux
(voir page 17) profonds pour extraire des représentations
complexes des données et résoudre des tâches. Les
réseaux neuronaux sont l'un des outils clés utilisés dans
le Deep Learning pour modéliser et apprendre à partir des
données.
Nous allons désormais expliquer et analyser le
fonctionnement du Machines Learning, du Deep Learning et des réseaux de
neurones.
B) Le Machine Learning (ou apprentissage
automatique).
Le Machine Learning est un ensemble de techniques permettant
aux machines d'apprendre automatiquement un ensemble de règles à
partir de données, se distinguant ainsi de la programmation
traditionnelle qui repose sur l'exécution de règles
prédéterminées. Concrètement, il s'agit de
logiciels ou d'algorithmes capables d'être entraînés pour
effectuer des tâches complexes de traitement de données sans
intervention humaine. Bien que le concept du Machine Learning ne soit pas
récent, sa première définition formelle nous a
été donnée par Arthur Samuel en 1959,
considéré comme l'un des pionniers de l'intelligence
artificielle. Selon lui, « L'apprentissage automatique est la discipline
donnant aux ordinateurs la capacité d'apprendre sans qu'ils soient
explicitement programmés.»
Cette notion englobe un large éventail de
méthodes qui permettent de construire des modèles de la
réalité à partir de données, que ce soit en les
améliorant ou en les créant. Au coeur de cette technologie, nous
trouvons le Data Mining (ou fouille de données en français), un
concept qui englobe l'ensemble du processus d'extraction de connaissances
à partir de grandes quantités de données. Le Data Mining
est essentiel pour le Machine Learning, car il fournit les données
nécessaires pour entraîner les modèles et
générer des informations utiles.
Il est important de souligner que le Machine Learning repose
sur l'utilisation de bases de données solides. En effet, sans une
quantité suffisante de données pertinentes et de qualité,
le processus d'apprentissage automatique ne peut pas atteindre son plein
potentiel. Les données servent de matière première pour
alimenter les modèles et leur permettre de généraliser
à partir des exemples fournis. Ainsi, la qualité et la
diversité des données jouent un rôle crucial dans la
performance et la précision des modèles d'apprentissage
automatique.
12 sur 51
BIBLIOGRAPHIE
Apprentissage artificiel. Concepts et algorithmes
éditions 2 (Antoine Cornuéjols - Laurent Miclet EYROLLES,
2010, page 18).
Data science : fondamentaux et étude de cas, machine
learning avec Python et R (Éric Biernat - Michel Lutz EYROLLES,
page 10.
13 sur 51
En 1997, Tom Mitchell, auteur et professeur à
l'université de Carnegie Mellon, propose une définition plus
précise de ce même concept technologique. Dans son livre,
Machine Learning, parut la même année, il cite, « On
dit qu'un programme informatique apprend de l'expérience (E) par rapport
à une classe de tâches (T) et à une mesure de performance
(P), si sa performance aux tâches dans (T), mesurée par (P),
s'améliore avec l'expérience (E). »
Tom Mitchell illustre ensuite cette définition par le
tableau ci-dessous :
(Document : Exemple de Machine Learning proposé par
Mitchell).
Cas d'application
|
Apprendre à jouer au Dames
|
Reconnaitre l'écriture manuscrite
|
Apprentissage de la conduite pour un robot
|
Tache (T)
|
Jouer au Dames
|
Reconnaître et classifier des mots écrits à
la main dans des images.
|
Conduite sur les autoroutes publiques à quatre voies
à l'aide de capteurs de vision
|
Mesure de la performance (P)
|
Pourcentage de matchs gagnés contre des adversaires
|
Pourcentage de mots classés correctement
|
Distance moyenne parcourue avant une erreur
(évaluée par un surveillant humain)
|
Expérience de formation (E)
|
S'entrainer à jouer contre lui même
|
Une base de données de mots manuscrits avec les
classifications données
|
Une séquence d'images et de commandes de direction
enregistrées tout en observant un conducteur humain
|
|
En conclusion, le Machine Learning représente une
avancée majeure dans le domaine de l'intelligence artificielle, offrant
aux machines la capacité d'apprendre à partir de données
et d'effectuer des tâches complexes sans une programmation explicite. En
utilisant des techniques de Data Mining et en s'appuyant sur des bases de
données solides, le Machine Learning peut générer des
modèles précis et informatifs, ouvrant ainsi la voie à de
nombreuses applications dans divers domaines.
Nous allons désormais expliquer ce qu'est le Deep
Learning.
BIBLIOGRAPHIE
Machine Learning (Tom M. Mitchell, 1997)
C) Le Deep Learning (ou apprentissage
profond).
Le deep Learning est un ensemble de techniques qui permettent
à un ordinateur d'apprendre automatiquement la solution à partir
de données. C'est une technique de Machine Learning reposant sur le
modèle des réseaux neuronaux : des dizaines, voire des centaines
de couches de neurones sont empilées pour apporter une plus grande
complexité à l'établissement des règles. Le terme
"apprentissage profond" possède plusieurs définitions en raison
de la complexité de cette technologie.
Mélanie Mitchell (auteure et professeure en sciences
informatiques à l'université de Portland) nous propose la
définition suivante : « L'apprentissage profond désigne
simplement des méthodes d'apprentissage destinées à des
réseaux neuronaux profonds , expression qui désigne des
réseaux neuronaux possédant plus d'une couche cachée.
»
FranceTerme (base de données terminologiques de la
délégation générale à la langue
française et aux langues de France du ministère de la Culture
français) nous propose une autre définition : «
L'apprentissage profond (Deep Learning) est un modèle d'apprentissage
automatique (Machine Learning), qui utilise un réseau de neurones
artificiels composé d'un grand nombre de couches dont chacune correspond
à un niveau croissant de complexité dans le traitement et
l'interprétation des données. »
Concrètement une technologie utilisant le Deep
Learning nous permettrait de demander à un ordinateur de classer des
images ou des sons à partir d'une base de connaissances (Knowledge
Bases), auquel il aurait accès. Cette base de connaissances est
établie à partir de l'activité sur le web par les
internautes. Nous pouvons prendre comme exemple très connu, le test de
CAPTCHA.
Le CAPTCHA, acronyme de l'anglais « Completely Automated
Public Turing test to tell Computers and Humans Apart », est une mesure de
sécurité de type « authentification par
question-réponse ».
(Documents : Exemple de test CAPTCHA).
|
|
|
|
14 sur 51
BIBLIOGRAPHIE ET SITOGRAPHIE
· (Melanie Mitchell, L'intelligence artificielle,
éditions Dunod, 2021)
·
https://www.culture.fr/franceterme
Le CAPTCHA est une famille de tests de Turing qui vise
à différencier de manière automatisée un
utilisateur humain d'un ordinateur. Ce test de défi-réponse est
couramment utilisé en informatique pour vérifier que
l'utilisateur n'est pas un robot. Cependant, le CAPTCHA présente un
intérêt supplémentaire important.
En plus de sa fonction de vérification, il contribue
activement à l'enrichissement des connaissances des intelligences
artificielles et à l'amélioration de la technologie de
l'apprentissage profond qu'elles utilisent. Cette technologie enregistre chaque
choix effectué par l'internaute et stocke les images correspondantes
dans une base de données. De plus, elle conserve en mémoire les
caractères que les utilisateurs parviennent à décrypter
avec succès.
Ainsi, le CAPTCHA joue un rôle essentiel dans
l'acquisition de données et le perfectionnement des modèles
d'apprentissage profond, contribuant ainsi à l'évolution et
à l'amélioration continue des technologies d'intelligence
artificielle.
Ces informations contribuent aux développements des
technologies de Deep Learning utilisées par des entreprises telles que
Tesla et Google. Les bases de données générées par
les CAPTCHA permettent notamment d'améliorer les véhicules
équipés de systèmes d'assistance à la conduite
grâce aux images de feux tricolores ou de voitures. Pour Tesla, cela peut
se traduire par une meilleure reconnaissance des signaux routiers et une prise
de décision plus précise pour les fonctions de conduite
autonome.
De même, Google exploite les informations
typographiques fournies par les utilisateurs pour filtrer les e-mails et
protéger les utilisateurs des courriers indésirables tels que les
spams. Ces données permettent à Google de développer des
modèles d'apprentissage profond capables d'identifier et de trier
automatiquement les e-mails, améliorant ainsi l'expérience de ses
utilisateurs en évitant les contenus malveillants ou non pertinents.
Ainsi, les informations collectées via les CAPTCHA
jouent un rôle essentiel dans l'amélioration des technologies
utilisées par ces entreprises leaders dans le domaine de l'intelligence
artificielle et du Deep Learning.
15 sur 51
SITOGRAPHIE
support.google.com
En plus du CAPTCHA visuel, il existe également le
CAPTCHA audio, qui se concentre sur le son. Ce test de sécurité
demande à l'utilisateur de transcrire ce qu'il entend à partir
d'un fichier audio contenant une chaîne de caractères
parlés. Généralement, ces caractères sont
masqués et déformés par un bruit de fond afin de rendre la
tâche plus difficile pour les bots* et de s'assurer que la réponse
provient d'un utilisateur réel. Le CAPTCHA audio est une autre
méthode utilisée pour vérifier l'identité humaine
et empêcher les activités automatisées
indésirables.
(Document : Exemple de test CAPTCHA audio).
Ce test est conçu pour collecter des informations afin
de permettre aux intelligences artificielles de développer leur base de
données sur la lecture et la prononciation des mots. Par la suite, nous
constaterons que grâce à ce type d'outil de collecte
d'informations, l'apprentissage profond de certaines IA devient
extrêmement performant, au point de pouvoir composer et
interpréter des paroles de chansons. (voir III-Ecoutes
Critiques)
En résumé, le Deep Learning est une technique
de Machine Learning qui utilise des réseaux neuronaux profonds pour
résoudre des problèmes complexes en apprenant automatiquement
à partir de données. Il permet d'établir des règles
complexes en empilant de nombreuses couches de neurones, offrant ainsi une
grande capacité de traitement et d'interprétation des
données.
Apres avoir abordé le fonctionnement du Machine
Learning et du Deep Learning nous allons nous intéresser au
réseaux de neurones, une technologie importante au fonctionnement d'une
IA.
16 sur 51
*Bots : (abréviation de robot) est un logiciel qui
exécute des tâches automatisées, répétitives
et prédéfinies. Les bots imitent ou remplacent
généralement le comportement des utilisateurs humains.
SITOGRAPHIE
·
support.google.com
17 sur 51
D) Réseaux de neurones.
L'intelligence artificielle a longtemps eu pour but de
simuler l'intelligence humaine, et d'obtenir un système artificiel
capable de réflexion, de prise de décision et d'apprentissage.
Les chercheurs se sont donc assez rapidement intéressés au
fonctionnement du cerveau pour le reproduire. C'est ainsi que les premiers
neurones artificiels ont été définis en 1943 par Mac
Culloch, chercheur en neurologie, et Walter Pitts, scientifique étudiant
la psychologie cognitive.
Le neurone artificiel, aussi appelé neurone formel,
reprend le fonctionnement du neurone biologique. Il a des entrées de
signal appelé dendrites et des sorties appelé Axone.
La définition d'un neurone formel est la suivante : Un
neurone formel est une représentation mathématique et
informatique d'un neurone biologique. Le neurone formel possède
généralement plusieurs entrées et une sortie qui
correspondent respectivement aux dendrites et au cône d'émergence
du neurone biologique.
Le fonctionnement général d'un neurone
artificiel repose sur plusieurs caractéristiques clés. Tout
d'abord, le neurone reçoit des entrées provenant d'autres
neurones ou de l'environnement. Chaque entrée est associée
à un poids qui détermine son importance relative par rapport aux
autres entrées. Ces poids permettent de moduler l'influence de chaque
entrée sur la sortie du neurone.
Ensuite, le neurone utilise une fonction d'agrégation
pour combiner les entrées pondérées et calculer une valeur
unique. Cette fonction d'agrégation peut être une simple somme
pondérée des entrées ou une opération plus
complexe, selon le type de réseau de neurones utilisé.
Le neurone dispose également d'un seuil ou d'un biais,
qui est utilisé pour indiquer le moment où le neurone doit
être activé. Le seuil peut être considéré
comme un seuil de sensibilité : lorsque la valeur agrégée
dépasse ce seuil, le neurone est activé et fournit une sortie.
Sinon, le neurone reste inactif.
Enfin, la fonction d'activation joue un rôle crucial
dans le processus de sortie du neurone. Cette fonction associe à chaque
valeur agrégée une unique valeur de sortie, qui dépend du
seuil du neurone. Elle peut introduire une non-linéarité dans le
modèle et permettre au neurone de représenter des relations plus
complexes entre les entrées et les sorties.
En résumé, un neurone artificiel utilise des
poids pour moduler l'importance des entrées, une fonction
d'agrégation pour combiner ces entrées pondérées,
un seuil pour décider de l'activation du neurone, et une fonction
d'activation pour produire une sortie en fonction de la valeur
agrégée et du seuil. Ces mécanismes sont essentiels dans
la construction de réseaux de neurones artificiels.
BIBLIOGRAPHIE
· L' Intelligence Artificielle pour les
développeurs. Concepts et implémentations en C#. (Virginie
MATHIVET, 2014, page 429.
· A logical calculus of the Ideas Immanent in Nervous
activity. (Mac CULLOCH, Walter PITTS, 1943)
18 sur 51
Le neurone formel peut donc se résumer sous la forme
suivante : (Document : représentation d'un neurone artificielle).
Il est intéressant de comparer un neurone artificielle
avec un neurone biologique. Les neurones communiquent entre eux par signaux
électriques, appelés influx nerveux (ou potentiels d'action).
Chaque neurone est constitué d'un corps cellulaire, de prolongements
appelés dendrites et axones. Ces derniers émettent des connexions
avec d'autres neurones par l'intermédiaire des synapses.
(Document : représentation d'un neurone biologique).
SITOGRAPHIE
· Article écrit par Ikram Chraibi Kaadoud |
Comprendre la science tou-te-s ensemble, Sciences du Numérique
08.10.2018
Un neurone biologique reçoit des entrées ou
signaux transmis par d'autres neurones (interaction dendrites- synapse). Au
niveau du corps (soma), le neurone analyse et traite ces signaux en les
sommant. Si le résultat obtenu est supérieur au seuil
d'activation (ou d'excitabilité), il envoie une décharge alors
nommé potentiel d'action le long de son axone vers d'autres neurones
biologiques.
Un neurone formel est une représentation artificielle
et schématique d'un neurone biologique.
(Document : Mise en correspondance d'un neurone biologique avec
neurone artificiel).
Dans le domaine des réseaux de neurones, la fonction
de transfert peut aussi porter le nom de fonction de combinaison, ou fonction
de seuillage ou encore fonction d'activation. Biologiquement, l'idée
d'une fonction de transfert vient de l'idée de mimer le fonctionnement
d'un potentiel d'action d'un neurone biologique : si l'ensemble des stimuli en
entrée d'un neurone atteignent son seuil d'excitabilité, alors ce
neurone fournit une sortie autrement dit il décharge.
En conclusion, les neurones artificiels utilisent des poids,
une fonction d'agrégation, un seuil et une fonction d'activation pour
ajuster l'importance des entrées, combiner ces entrées
pondérées, décider de l'activation du neurone et
générer une sortie en fonction de la valeur agrégée
et du seuil. Inspirés par les neurones biologiques, les neurones
artificiels reproduisent de manière simplifiée la structure et le
fonctionnement des neurones dans le cerveau. Cette convergence entre les
neurones artificiels et biologiques reflète les efforts pour comprendre
et reproduire les mécanismes de traitement de l'information du cerveau.
Les réseaux de neurones artificiels, utilisés en intelligence
artificielle, résolvent des problèmes complexes tels que la
vision par ordinateur et la reconnaissance vocale, tandis que l'étude
des neurones biologiques continue d'inspirer de nouvelles avancées pour
concevoir des réseaux de neurones artificiels plus sophistiqués
et performants.
BIBLIOGRAPHIE
· Les réseaux de neurones artificiels,
introduction au connexionnisme, (Claude Touzet, juillet 1992, page 24)
19 sur 51
20 sur 51
II L'IA dans la production musicale.
Les plug-ins et les logiciels intelligent.
En orientant ma recherche de mémoire vers ce domaine
spécifique, j'ai conçu l'idée d'explorer
l'efficacité des outils et des applications intelligentes dans mes
propres productions musicales, en vue d'analyser les résultats. Dans
cette étude, je m'attacherai d'abord à effectuer des recherches
approfondies afin de recenser des plug-ins exploitant des technologies
d'intelligence artificielle. Je m'attacherai ensuite à expliquer leurs
objectifs, leurs avantages et leur pertinence dans le domaine de la production
musicale, que ce soit à des fins professionnelles ou amateurs. Je
procéderai tout d'abord à une classification des
différents types de plug-ins, en fonction de leur utilité
respective. En effet, j'ai découvert qu'il existait quatre
catégories d'outils distinctes :
- Les outils de démixage (ou séparation des
sources)
- Les outils de restauration audios - Les outils d'aide au
mixage
- Les outils d'aide à la composition
J'ai débuté en testant un site gratuit
utilisant une technologie d'intelligence artificielle pour faire de la
séparation de sources à partir d'un fichier stéréo.
Le site que j'ai tester s'appelle « AUDIO STRIP ».
Pour mettre à l'épreuve ces outils
d'intelligence artificielle, j'ai décidé de leur fournir l'une de
mes propres compositions musicales afin de pouvoir comparer les
résultats obtenus. J'avais plusieurs options à ma disposition,
telles que l'isolement de la voix par rapport aux instruments ou encore
l'isolement de la voix, de la batterie et de la basse. J'ai choisi d'isoler le
plus grand nombre de sources possible.
Le site m'a ainsi fourni cinq pistes audio, dont une
contenant uniquement ma voix. Il a également généré
des pistes pour la batterie, la basse et le piano. Enfin, le site m'a fourni la
piste originale. Il convient de noter que j'ai utilisé une version
bêta qui n'était pas recommandée, mais qui permettait
d'isoler plusieurs sources en un laps de temps estimé entre 2 et 15
minutes. Lors de mon test, j'ai attendu environ 10 minutes.
Le résultat s'est avéré
étonnamment satisfaisant. Comme je m'y attendais, la voix et le piano
étaient grandement détériorés, il était donc
impossible de retrouver la qualité d'origine, laissant
inévitablement un bruit résiduel. Cependant, les percussions
étaient relativement fidèles, de même que la ligne de
basse. Je suis surpris, car pour une attente de 10 minutes et en n'ayant rien
d'autre à faire que d'importer ma musique sur le site, le
résultat est correct pour un remix.
J'ai ensuite testé la version recommandée, qui
permet simplement de séparer la voix de l'instrumental. Cette option est
décrite comme offrant la meilleure qualité audio possible sur le
site. J'ai délibérément choisi cette option plus complexe
en premier, car elle était logiquement moins fidèle. Le temps
d'attente était estimé entre 15 et 50 minutes, ce qui laissait
entendre que l'IA travaillait de manière plus précise.
SITOGRAPHIE
·
audiostrip.com
21 sur 51
Après une attente d'environ 35 minutes, j'ai pu
récupérer les fichiers audio. Bien qu'il reste des bruits
résiduels lors de l'écoute des pistes en solo, il suffit de
recombiner les sources pour faire disparaître ces bruits. Cette version
de meilleure qualité que la version bêta ouvre de larges
possibilités d'exploitation des audios.
Ces types d'outils sont largement utilisés pour
remixer d'anciens morceaux dont les sessions de travail ne sont pas
récupérables. Ils sont également utiles pour doubler un
film après sa sortie ou encore modifier les voix ou certaines ambiances.
En effet, leur utilisation permet de séparer les différents
éléments sonores d'une piste et de les retravailler
individuellement.
Ces séparateurs de sources permettent de revisiter des
enregistrements existants et de leur donner une nouvelle vie en modifiant leur
composition, en ajoutant des éléments supplémentaires ou
en créant des variations originales.
En résumé, l'utilisation de ces outils
intelligents ouvre des horizons passionnants dans le domaine de la production
musicale. Ils facilitent le processus de création, offrent de nouvelles
possibilités de remixage et permettent d'explorer des voies artistiques
inédites.
(Document : AudioStrip).
J'ai ensuite centré mes recherches sur les plug-in et
j'ai trouver 6 qui sont vendu comme intelligent et donc intéressant pour
mon sujet. Je savais que j'allais rencontrer des
difficultés pour tester des plug-in : en effet comme je le pensais, tout
les plug-in les plus poussés sont payant, et souvent très cher,
je n'avais donc pas les moyens de les acheter pour juste en faire une analyse.
J'ai du faire un choix, celui de prendre les offres gratuites, c'est à
dire de pouvoir les tester pendant seulement quelques jours. Cette solution
n'était pas optimal pour en faire une vrai analyse poussée. Pour
avoir plus de donnés sur ces outils j'ai également fait un
travail de recherche sur internet en lisant les modes d'emploie (voir
Annexes) et des avis sur internet.
22 sur 51
Voici les 6 plug-in que j'ai analysé, ils sont
classés dans l'ordre suivant : outil de démixage, outil de
restauration audio, outil d'aide au mixage pour finir sur les outils d'aide
à la composition.
- Hit'n'Mix Rip X (outil de séparation
de source).
Parmi les fonctionnalités offertes par cet outil, il y
en a une qui mérite une attention particulière : le DeepAudio.
Cette fonctionnalité permet de récupérer chaque source
audio à partir d'un son mixé et masterisé. Cela fonctionne
sur le même principe que le site "AUDIO STRIP". Selon mes recherches, cet
outil peut parfois donner des résultats très satisfaisants, mais
cela dépend grandement de la qualité audio de base. Dans le monde
professionnel, cette option est particulièrement pertinente, car
même l'isolement des sources reste très précis. Il est
fascinant d'explorer ces outils par simple curiosité, pour
découvrir ce que les technologies utilisant l'intelligence artificielle
peuvent accomplir aujourd'hui.
Il convient également de mentionner la sortie d'une
version améliorée de cet outil, appelée DeepRemix, qui est
cependant plus coûteuse. Cette version offre une fonctionnalité
supplémentaire, celle de modifier les éléments de bruit
environnants, ainsi qu'un outil d'édition complet. Cette seconde
fonctionnalité est particulièrement intéressante, car elle
permet d'avoir un contrôle total sur le processus d'édition. En
plus de séparer les sources audio, il est possible de manipuler les
bruits environnants pour obtenir un résultat encore plus
personnalisé et adapté à ses besoins artistiques. Ces
avancées technologiques dans le domaine de l'intelligence artificielle
offrent des possibilités passionnantes pour les professionnels de
l'industrie musicale. Elles permettent de repousser les limites de la
créativité en offrant des outils de traitement sonore
avancés.
(Document : Hit'n'Mix).
SITOGRAPHIE
·
collective.focustrite.com
23 sur 51
- iZotope RX 9 (outil de restauration audio).
Cet outil utilise l'apprentissage automatique pour fournir
des suggestions sur la façon de nettoyer et d'améliorer la
qualité audio. Pour ceux d'entre nous qui travaillent dans
l'audiovisuel, il est toujours intéressant de connaître ce type
d'outil. Il s'avère pratique lorsqu'il s'agit d'améliorer la
qualité sonore d'un enregistrement altéré ou d'une prise
audio ratée. L'outil reconnaît automatiquement les
problèmes spécifiques et propose de manière intelligente
une chaîne de réparation.
Pour le tester, j'ai importé une interview d'une femme
dans la rue. Le son de base était correct, mais les conditions
d'enregistrement n'étaient pas optimales. L'enregistrement a
été effectué sans bonnette dans un environnement venteux
et bruyant. J'ai trouvé que iZotope RX 9 a réalisé un
travail impressionnant en quelques secondes seulement. Il a agi
immédiatement sur le vent et le bruit de fond. Concrètement,
l'outil a compris quelle était la source principale à
préserver en appliquant un filtre sur les fréquences
indésirables. Le résultat est satisfaisant, bien que la
différence entre le son altéré et le son
amélioré soit perceptible. Cependant, ce plug-in est
coûteux pour les résultats obtenus, avec un prix d'achat de
1200€.
Il reste pertinent pour un technicien du son travaillant dans
le domaine de la télévision, par exemple, un métier
où l'efficacité est primordiale dans toutes les circonstances.
C'est un outil qui peut faire gagner du temps. En revanche, pour une production
musicale amateur, il peut être difficile de rentabiliser un tel
investissement. Je ne vois pas l'intérêt de cet outil dans le
cadre d'une production musicale.
(Document : iZotope RX 9).
SITOGRAPHIE
·
www.iZotope.com
24 sur 51
- Série Focusrite FAST (plug-in d'aide
au mixage avec outil d'égalisation : Fast Equalizer, de compression :
Fast Compressor, de réverbération : Fast Verb et
d'atténuation spectral : Fast Limiter).
La gamme de plug-in récemment lancé par
Focusrite est alimentée par la technologie des spécialiste de
l'IA : Sonible (entreprise de création de logiciel). Cet outil a
été lancé pour faciliter le travail de mixage en
étant assisté par une IA.
« La gamme FAST a été conçue pour
vous garder dans le flux créatif, afin que vous puissiez vous concentrer
sur la création musicale. La puissante IA adaptera les paramètres
à votre audio et à vos instruments afin que vous puissiez obtenir
d'excellents résultats sonores, instantanément. »
L'entreprise met en avant l'idée qu'il est
préférable de consacrer du temps à la réflexion
créative de la musique plutôt qu'aux aspects techniques du mixage.
Ces outils prétendent accomplir ce travail pour vous en quelques
secondes, selon leur site web. Pour ma part, il est extrêmement difficile
de confier cette tâche à un programme informatique. En effet, ces
outils diffèrent de ceux mentionnés précédemment.
Ici, l'intelligence artificielle travaille directement sur des aspects tels que
l'égalisation, la compression, la réverbération, et
même le mastering avec leur outil de limitation. L'entreprise avance que
la création de cet outil vise à libérer davantage de temps
pour l'artiste afin qu'il se concentre sur l'aspect purement artistique. Pour
moi, c'est ironique, car les réglages des effets tels que la compression
ou la réverbération jouent un rôle crucial dans l'aspect
artistique final de la musique. La réverbération donne vie
à la musique, et les choix de réglages sont extrêmement
importants, représentant un véritable choix artistique.
J'ai du mal à croire qu'il puisse être pertinent
de confier des choix artistiques à un algorithme, en particulier pour le
mastering. Si ce plug-in nous offre des exemples de différentes
sonorités possibles, je peux comprendre l'intérêt, car cela
peut combler un certain manque d'inspiration. Cependant, personnellement, je
n'utiliserais pas une IA pour mixer entièrement l'une de mes
compositions musicales. Avec ce type d'outil qui fait son apparition sur le
marché, j'ai peur de voir disparaître l'authenticité de la
musique.
La création musicale est un art très personnel,
offrant une infinité de choix artistiques pour créer une oeuvre.
Ces outils, comme mentionné précédemment, fonctionnent
grâce à une base de données. En d'autres termes,
l'algorithme va s'appuyer sur les codes inscrits dans la société,
il copie. Bien que le résultat puisse être plus que satisfaisant,
avec un rendu propre et sans erreur de mixage, cela ne fait pas pour moi de cet
outil un choix pertinent, car l'IA prend des décisions artistiques.
Sonible à d'ailleurs sortie son propre plug-in
intelligent. D'après Alexander Wankhammer, CMO et co-fondateur de
Sonible, l'entreprise a fait ses premiers pas éphémères
dans l'IA en janvier 2015. « Notre premier logiciel « Frei:Raum
» avait déjà la possibilité de corriger
automatiquement les déficiences spectrales d'un signal en observant ses
caractéristiques spectrales et temporelles. » Ils ont ensuite
sortie Smart EQ 3 un très bon outil sur lequel je vais revenir.
(voir page 26)
Exemple des plug-in FAST sur SoundCloud : Plug-in Fast (source :
Interview Youtube du média Plugin Boutique)
SITOGRAPHIE
collective.focustrite.com
|
(Document : FAST equalizer).
|
|
|
|
(Document : FAST compressor).
|
|
25 sur 51
(Document : FAST verb).
(Document : FAST limiter).
|
|
|
26 sur 51
- Smart EQ 3 by Sonible (outil
d'égaliseur automatique).
Alexander explique comment les algorithmes d'apprentissage en
profondeur de Smart EQ 3 sont réellement programmés.
« Smart : EQ 3 utilise un système qui est
principalement entraîné par d'énormes quantités de
données. Dans le cas de Smart: EQ 3, le système a appris à
transformer les « mauvaises données » avec par exemple, les
signaux présentant des déficiences spectrales, en « bonnes
données » avec par exemple, les signaux avec un bon
équilibre spectral. »
« Pour ce faire, nous avons utilisé le deep
learning, dans notre cas une architecture de réseau de neurones
convolutifs spécialisés, et présenté une
représentation spectro-temporelle des mauvaises données à
l'entrée du réseau. Nous avons ensuite défini les «
bonnes données » comme la cible de la sortie du réseau. En
faisant cela des milliers et des milliers de fois, le réseau a appris
à corriger les problèmes dans les échantillons de
données erronés. Une fois qu'un réseau a été
formé, c'est essentiellement une boîte noire qui fait son travail.
» (Source Interview Youtube du média Plugin Boutique).
Les fonctionnalités qui nous intéressent dans
ce plug-in sont le filtre qui corrige automatiquement les
déséquilibres tonals grâce à une IA et le traitement
intelligent en inter-canal.
L'entreprise vend cette intelligence comme un moyen d'obtenir
un équilibre spectral en quelques secondes, que ce soit sur une seule
piste ou sur un mix entier. Au cours de mes recherches, j'ai découvert
que ce plug-in était l'un des plus avancés sur le plan technique.
Il est possible de l'utiliser sur 6 canaux différents, bien que je n'aie
pas pu tester cette fonctionnalité, j'ai trouvé cela
remarquable.
La force de cet outil réside dans le fait que l'on
conserve un contrôle considérable sur l'IA. Il existe de
nombreuses fonctionnalités que l'on peut modifier en fonction de nos
inspirations, telles que :
· Sélectionner les plages de fréquences qui
doivent être affectées.
· Modifier la forme de la courbe de pondération.
· Définir la durée du processus
d'apprentissage de l'IA.
· Contrôler le niveau d'impact sur le traitement
inter-canal intelligent.
Ainsi, on peut profiter des capacités des algorithmes
intelligents tout en conservant le contrôle sur le résultat
final.
SITOGRAPHIE
·
sonible.com
Ce plug-in fonctionne remarquablement bien et est
proposé à un prix raisonnable de 50€.
L'égaliseur alimenté par l'IA permet de nettoyer les
résonances désagréables et les encoches
indésirables. Le résultat sonore est convaincant. Je n'ai pas
poussé les réglages au maximum, mais en laissant l'IA travailler,
le son devient plus clair. Cependant, je pense que si l'on prend le temps de
travailler l'égalisation manuellement, on peut obtenir un
résultat encore meilleur.
Une fois de plus, il s'agit d'un outil qui permet de gagner
du temps. Néanmoins, je considère qu'il reste pertinent
grâce à la possibilité d'avoir un contrôle artistique
sur l'IA, ce qui permet de préserver l'aspect créatif de
l'outil.
(Document : Smart Eq 3).
27 sur 51
SITOGRAPHIE
·
sonible.com
28 sur 51
- Playbeat audiomodern plug-in d'aide à
la composition (boite à rythme).
Playbeat est un séquenceur innovant qui propose des
sonorités en fonction des rythmes joués. Bien que je n'aie pas eu
l'occasion de tester ce plug-in personnellement, d'après leur site web
et les avis des utilisateurs, Playbeat prend en compte chaque instrument pour
aider les musiciens à trouver de nouvelles mélodies. Ce
séquenceur utilise des algorithmes avancés d'analyse sonore pour
remixer automatiquement des échantillons originaux.
La force de ce logiciel réside dans le fait que plus
on joue, plus il propose de combinaisons musicales. Je trouve ce type
d'algorithme extrêmement intéressant pour la production musicale,
car il offre une ressource d'inspiration considérable. L'idée
derrière Playbeat est également ingénieuse, rappelant
l'époque où l'on cherchait des échantillons et des
sonorités dans des disques vinyles. Cependant, ce plug-in pousse cette
approche encore plus loin, car il permet d'exporter directement les morceaux
avec une pochette personnalisable. Cette facilité d'utilisation
apparente fait de Playbeat un outil pertinent et pratique pour la production
musicale.
(Document : Playbeat audiomodern).
SITOGRAPHIE
·
audiomoderne.com
29 sur 51
- Algonaut Audio Atlas 2 (bibliothèque
d'échantillons).
Algonaut Audio Atlas 2 est un outil puissant qui utilise
l'intelligence artificielle pour trier automatiquement votre
bibliothèque d'audio en fonction du type de son et de sa
tonalité. Il s'agit essentiellement d'une IA spécialisée
dans l'organisation et le classement des échantillons sonores.
Ce plug-in analyse les échantillons audio disponibles
dans votre bibliothèque et les trie de manière intelligente en
fonction de leurs caractéristiques sonores, tels que le type
d'instrument, le genre musical, la tonalité, etc. Il vous permet ainsi
de trouver rapidement les sons dont vous avez besoin pour votre projet
musical.
L'avantage de cette approche est qu'elle vous permet
d'économiser un temps précieux en évitant de rechercher
manuellement dans des dossiers et des fichiers audio.s Cet outil est
particulièrement utile pour les producteurs qui ont une grande
bibliothèque d'échantillons et qui ont du mal à les
organiser de manière efficace. Il facilite également le processus
de découverte de nouveaux sons et d'exploration créative.
En somme, Algonaut Audio Atlas 2 est une application
pertinente de l'intelligence artificielle dans le domaine de la production
musicale, offrant un moyen pratique et efficace d'organiser et de trouver
rapidement des échantillons sonores en fonction de vos critères
de recherche.
(Document : Algonaut Audio Atlas 2).
SITOGRAPHIE
·
algonaut.audio.com
- Flow Machine Professional - Sony CSL research
Lab. (logiciel d'aide à la composition)
Flow Machines a été développé
pour la première fois en 2012 dans le cadre de la recherche sur
l'utilisation de l'IA dans la composition musicale par Sony CSL Paris et
l'Université Pierre et Marie Curie, sous la direction de François
Pachet (pionniers de la musique informatique, devient directeur de Spotify
Creator Technology Research Lab. et membre de l'ECCAI* en 2014). C'est un
projet de recherche scientifique qui a pour but de tester les limite de
l'intelligence artificielle dans la production musical.
*L'ECCAI : European Coordinating Committee for
Artificial Intelligence (Comité européen de coordination pour
l'intelligence artificielle)
Aujourd'hui, Sony CSL est en collaboration avec Sony Music
Entertainment Japan Inc. C'est maintenant cette entreprise qui poursuit ses
études et ses applications. La partie principale du projet Flow Machines
est Flow Machines Professional. Ce dernier est un système de composition
musicale assistée par l'IA. Grâce à ce système, les
créateurs peuvent composer des mélodies dans les
différents styles qu'ils souhaitent. En se basant sur ses propres
règles musicales créées à partir de diverses
analyses musicales.
Les créateurs peuvent générer des
mélodies, des accords et des bases en utilisant leurs base de
données. De plus, leurs propres idées enrichie la base de
donnée ce qui aide le logiciel à s'améliorer. À
partir de là, le processus sera le même que celui de la production
musicale classique. Il faut faire des arrangement dans le DAW, choisir les
paroles, enregistrer, mixer et masteriser.
Ce logiciel est de loin le plus poussé. « Flow
Machines est un projet de recherche, de développement et de mise en
oeuvre sociale qui vise à développer la créativité
des créateurs en musique. »
Elle fonctionne grâce une technologie de machine learning
et de traitement du signal audio .
Sony travail avec des créateurs pour
générer de la nouvelle musique à l'aide d'une technologie
d'apprentissage automatique, je trouve que cette collaboration avec des
artistes lui donne de la pertinence artistique. De plus ce logiciel à
déjà été utiliser pour aider à la
création d'un album « Hello World » par SKYGGE (Benoit
carré) artiste français. On verra plus en détail cet album
dans la partie suivante de ce mémoire. (cf. Ecoutes critiques)
Flow Machines Professional est donc un outil d'aide à
la composition. Ils fonctionnent en analysant diverses composition ou musique
et suggère par la suite une mélodie de 4 ou 8 mesures
basée sur la construction musical donné. Le logiciel donne
ensuite accès à la partition qu'il a crée pour pouvoir la
sauvegarder ou la modifié comme on le souhaite.
Il y a plus de 100 préréglages de palette de
styles musicaux, on peut donc nous suggérer un nombre infini de
mélodies.
Dans les paramètre de composition il est possible de
modifier l'harmonie de la mélodie et sa complexité. On peut
modifier l'accord, la durée des notes.
Je vais ensuite montrer tout ce qu'il est possible de faire
à partir d'une interview de BenoÎt Carré (directeur
artistique de Flow Machines) posté sur la chaine YouTube de Sony CSL.
Dans cette video Benoît Carré veut nous montrer
comment composer via Flow Composer, l'outil de composition de Flow Machines.
SITOGRAPHIE
·
sonycsl.co.jp /
flow-machines.com / vidéo
YouTube Sony CSL)
30 sur 51
31 sur 51
Il commence par générer de nouvelles
mélodies et de nouveaux accords à partir d'un songset
appelé « American Songwrite » (un outil directement disponible
dans le logiciel). Ici un songset c'est une de leur base de donnée qui
sert à obtenir un certain style de musique, et c'est ce qui fait la
force du logiciel. En effet leur base de donnés est
très grande. Cette base de donné à été
établie par l'entreprise en y ajoutant la discographie de compositeur
américain des années 50 et 60, tel que Duke Ellington et Cole
Porter en autre. En ayant ajouté les données musicale de ces
artistes l'intelligence artificielle, cette dernière est capable de
composer de la musique dans un corpus Jazz. En choisissant se songset le
logiciel va analyser et générer à partir de 429
partitions. On obtient ensuite une partition original créée par
l'IA.
C'est ensuite à l'humain de travailler. Benoît
Carré va choisir des moments qu'il trouve intéressant dans cette
partition. Il va ensuite chercher des accompagnement dans d'autre partitions
proposer et c'est ainsi que l'on travail réellement sur ce logiciel :
choisir un style musicale, trouver des sonorités souhaités,
chercher les mélodies et accord intéressant qui sont
générer automatiquement. C'est un travail « d'exploration
sonore » d'après Benoît Carré.
Flow Machines à un outil pour générer
des voix, c'est l'outil « Mashmelo ». Il permet d'utiliser des voix
« a cappella » de vrai chanteur, qui ont été
enregistrer et analyser par le logiciel. C'est une analyse évolué
car l'IA va restituer le style, l'intention et les placements rythmiques du
chanteur sur la nouvelle mélodies générée. Ensuite
il ajoute une guitare, une basse et des percussions.
Il y a également l'outil Rechord qui peut
générer une lignes de percussion. Mais il ne nous fait pas de
démonstration dans la vidéo.
Pour conclure je dirais que ce logiciel est très
poussé grâce à une grande base de donné accessible.
Ils ont sortie une application qui n'est pas convaincante. Après l'avoir
essayer moi même le rendu des compositions de l'IA est très
monotone, voir beaucoup trop. Il est intéressent de voir que ce logiciel
propose des mélodies juste musicalement mais très fade
artistiquement. Il y a donc une gros travail de trie et de réajustement.
En essayant plusieurs régalage différents j'ai compris qu'on
pouvais créer un morceau qui avait de l'intérêt. Cependant
l'application n'est pas très instinctif, et les premières
mélodies que l'IA propose sont plus que médiocre.
Comme pour les autres outils que l'on a analysé
précédemment je me rend compte que leur intérêt est
souvent de gagner du temps ou d'aider un musiciens en manque d'inspiration.
Cependant Flow Machines Professional à des outils
vraiment convaincant, comme le Mashmelo. Le fait de pouvoir restituer
l'intention naturelle d'un chanteur sur n'importe qu'elle composition
générer par l'IA donne une âme au morceau
créé et donc un intérêt dans la production musicale.
En 2017 leur plus grand succès était le morceau « Daddy's
Car » une chanson inspiré des Beatles (cf Ecoute Critique).
D'autres logiciel du même type existent aujourd'hui,
comme Google Magenta, Watson Beat, d'IBM ou encore Orb Composer, d'une startup
française baptisée Hexachords. Mais Flow Machines reste sans
doute celui dont les débouchés sont les plus probants.
SITOGRAPHIE
sonycsl.co.jp /
flow-machines.com / vidéo
YouTube Sony CSL)
32 sur 51
(Document : logiciel payant Flow Machines Professional).
(Document : application gratuite Flow Machines).
SITOGRAPHIE
sonycsl.co.jp /
flow-machines.com / vidéo
YouTube Sony CSL)
33 sur 51
III Écoutes critiques.
Dans cette dernière partie je vais analyser plusieurs
musiques qui ont été créée avec l'aide
d'intelligence artificielle et d'autre qui ont été presque
entièrement composé par une IA.
La première écoute que je vais analyser est la
première musique publié par l'équipe de Flow Machines :
Daddy's car.
Daddy's car (a song composed by Flow
Machines)
publiés le 19 septembre 2016
Document : pochette du Single Daddy's car
La chanson a été créée par des
chercheurs de Sony, qui ont utilisé le logiciel Flow Machines de la
société pour analyser une base de données de 13 000 lead
sheets (partitions de base qui enregistrent la mélodie et l'harmonie des
morceaux) de différents genres à travers le monde. Le logiciel
écrit ses propres mélodies et un compositeur français,
Benoît Carré, alias Skygge, membre de l'équipe et ancien du
groupe Lilicub, a été recruté pour transformer le
matériel en un morceau entièrement produit. Il a simplement saisi
le style de musique souhaité (dans ce cas, Les Beatles ) et
s'est mis au travail. Pour ça Benoît Carré à donner
à l'IA toutes la discographie des Beatles et lui a demander de
créer quelque chose de nouveau. L'IA lui donne ensuite accès
à la partitions. A part les paroles qui on été
écrite par le compositeur tout le reste de la musique proviens de
l'intelligence artificielle. Le compositeur à cependant
enregistré de vrai instrument sur la partitions donné par Flow
Machines pour un rendu plus organique.
Le rendu de cette musique est correct, et l'on perçoit
clairement l'inspiration des Beatles. Néanmoins, cette composition
suscite une réflexion sur l'avenir de ces technologies. À l'heure
actuelle, il est évident qu'un musicien talentueux est capable de
créer de la musique avec bien plus d'âme et de profondeur. Il est
important de souligner que cette musique n'est pas le résultat d'une
machine seule, mais qu'il y a des musiciens qui jouent les partitions et un
être humain qui écrit les paroles. C'est grâce à ces
deux facteurs que cette musique peut être écoutée sans
problème.
Il est essentiel de reconnaître que l'intervention
humaine reste cruciale pour donner vie et sens à la musique. Les
technologies telles que Flow Machines ne sont qu'un outil qui peut aider
à générer des partitions remarquables, mais elles ne
peuvent pas égaler la créativité, l'expression et
l'émotion authentique d'un musicien talentueux. Les algorithmes peuvent
fournir des motifs musicaux intéressants, mais c'est
l'interprétation humaine et la capacité à transmettre des
émotions qui font la véritable essence de la musique.
SITOGRAPHIE
·
TheVerge.com
·
SoundCloud.com
L'oeuvre créée par cette IA est une
illustration intéressante de ce que les algorithmes peuvent accomplir,
mais elle met également en lumière la valeur unique de la
créativité humaine.
En tant que musiciens et auditeurs, il est important de
continuer à célébrer et à encourager l'expression
artistique humaine, tout en explorant les possibilités offertes par ces
nouvelles technologies.
Le futur de ces technologies reste à définir,
mais il est probable que l'intelligence artificielle continuera à
évoluer et à avoir un impact sur la création musicale.
Cependant, il est essentiel de maintenir un équilibre entre
l'utilisation des outils technologiques et la préservation de
l'authenticité et de l'âme de la musique.
34 sur 51
SITOGRAPHIE
·
TheVerge.com
·
SoundCloud.com
SKYGGE feat. Kiesza « Hello Shadow
»
composed by Stromae with Flow Machines- publiée le 1
septembre 2017
(Document : Pochette de l'album Hello World ).
Un an après avoir mis en ligne un premier morceau
Daddy's car, elle s'est donnée pour défi de créer un
album entier et de le commercialiser. Pour Benoît Carré, "de la
même manière que le synthétiseur a
révolutionné la musique dans les années 80, l'utilisation
de l'intelligence artificielle est la prochaine étape dans
l'évolution des outils d'aide à la création musicale, et
va produire des environnements très nouveaux et stimulants".
Pour cet album, Benoit Carré a choisi les artistes et
collaboré à plusieurs des titres. L'album sera distribué
sur les principales plateformes en ligne. Nous allons nous intéresser au
morceau qui à le mieux marché de l'album : Hello
Shadow.
C'est Stromae qui a composé ce morceau avec l'aide de
Flow machines. Il est issue de l'album « Hello World » qui est le
premier album musical composé avec une intelligence artificielle, par le
musicien, compositeur et producteur français SKYGGE a.k.a Benoit
Carré, qui s'est entouré d'artistes francophones et
internationaux. Cet album est l'aboutissement de Flow Machines, qui est un
projet de recherche scientifique.
Ici le compositeur utilise une IA comme un outil qui va
générer des toplines*, des lead mélodiques, des harmonies,
des voix É (source : interview du directeur du projet flow machine).
Stromae va utiliser cet outil pour lui donne des idées, de
l'inspiration.
« Elle est capable de repérer des
régularités que même les êtres humains ne sont pas
capables de voir », indique François Pachet. Elle
génère des mélodies, des harmonies, ou des voix que
l'artiste peut modifier, et même effacer, au fil de la collaboration.
Elle ne remplace pas le compositeur, elle l'assiste. « Pour qu'il y ait
une oeuvre d'art, il faut une intention, une envie, un moteur, c'est l'artiste
qui fait ça, mais il va être aidé par la technologie
», précise le scientifique à l'origine du projet.
35 sur 51
*Toplines : Selon l'artiste et toplineuse Meryl, une
topline est un "yaourt (chanter en produisant des sons) organisé", qui
concrètement permet donc de trouver une mélodie de voix sur une
instrumentale. "Topliner" un morceau permet de le structurer ainsi que de lui
donner une base très claire pour faciliter ensuite l'écriture des
paroles
Lorsque l'on est familier avec les musiques de Stromae, on
reconnaît immédiatement sa patte musicale dans ce morceau. Selon
François Pachet, il est clairement inspiré de la Morna*. Ce
morceau n'a rien à voir avec "Daddy's Car". En effet, on perçoit
un intérêt artistique bien plus prononcé que dans le
premier cas. Les artistes ont occupé une place bien plus importante dans
cette production, en co-composant notamment. Les sonorités
apportées par Stromae sont clairement audibles. De plus, il y a une
véritable chanteuse (Kiesza) sur ce morceau, ce qui lui confère
du rythme et de la vivacité, contrairement au premier morceau où
des voix synthétiques ont été utilisées pour
recréer l'ambiance des chansons des Beatles.
Cette comparaison met en évidence le rôle
essentiel des artistes dans la création musicale. L'intelligence
artificielle peut être un outil intéressant pour stimuler
l'inspiration et générer des idées, mais c'est
l'interprétation humaine, la créativité et l'expression
artistique qui donnent véritablement vie à une oeuvre musicale.
Lorsque les artistes s'impliquent activement dans le processus de
création en utilisant ces technologies, ils peuvent apporter leur
sensibilité, leur expérience et leur personnalité pour
façonner une musique unique et captivante. Il est également
important de souligner l'importance des voix humaines dans la musique. La
présence d'une chanteuse réelle sur le deuxième morceau
donne une dimension supplémentaire à l'oeuvre, en transmettant
des émotions authentiques et en créant une connexion avec
l'auditeur.
En conclusion, la présence et l'apport des artistes
dans la co-création avec l'intelligence artificielle sont essentiels
pour obtenir des résultats artistiquement intéressants. L'IA peut
être une source d'inspiration et d'idées, mais elle ne peut pas
remplacer l'expression humaine et l'interprétation artistique.
36 sur 51
*La Morna : style de musique typique du Cap-Vert, elle se
caractérise par des rythmes lents et langoureux
Holly Herndon - PROTO
Album publié de 10 mai 2019
(Document : pochette de l'album PROTO).
Holly Herndon (artiste américaine) à mis au point
avec son équipe une intelligence artificielle appelé « Spawn
» . Pendant 2 ans il lui on fournit plusieurs voix de chanteur qu'elle
interprète ensuite à sa façon.
Cet album qui est le troisième de la chanteuse qui est
un projet conceptuelle
« Quand on fournit des sons à une IA on peut
vraiment entendre la logique de son réseaux neuronals, la machine
travail motif par motif, elle découpe le son samples par samples, elle
assimile la logique de ma voix. Ce qui m'intéresse surtout c'est de
savoir comment je peut utilisé cette technologie pour développer
une nouvelle esthétique et de nouvelles possibilités . Comment en
tant qu'être humain je peut apprendre de la machine ? »
Holly Herndon dans une video posté sur la chaine
YouTube TRACKS / ARTE : un choeur et une intelligence artificielle.
Dans cet album, la compositrice américaine a
utilisé une intelligence artificielle pour interagir avec le chant
humain et mêler sa propre voix numérique aux voix physiques d'une
chorale. Le résultat est véritablement fascinant et semble tout
droit sorti de la science-fiction, comme en témoignent des titres
originaux et organiques tels que « Alienation », «
Eternal » et « Crawler » qui est terrifiant. Les
voix humaines et cybernétiques s'entremêlent sur des influences
qui oscillent entre folk et techno. Proto va au-delà de la simple
musique, c'est une artiste qui cherche à insuffler la science dans sa
création musicale. C'est un véritable travail de recherche
scientifique.
37 sur 51
SITOGRAPHIE
· Article posté le 12 mai 2019 par Les oreilles
curieuses.
· Video posté sur la chaine YouTube TRACKS / ARTE :
un choeur et une intelligence artificielle.
· Rencontre Holly Herndon, pur esprit de
synthèse (article écrit par Olivier Lamm dans le journal
Libération, le 12 mai 2019).
«À travailler autour du sujet de l'intelligence
artificielle, tu te retrouves à te poser des grandes questions : que
signifie être humain, comment définir l'acte de création,
quel rôle la musique a-t-elle joué dans l'évolution de
notre espèce ? Rapidement, ça devient psychédélique
: mon moi existe-t-il ou est-il seulement un modèle de soi, comme le
théorise le philosophe allemand Thomas Metzinger, qui résume
l'esprit à un capteur super complexe qui traiterait en permanence les
informations pour constamment évoluer ? Tout ça est fascinant, et
à ce titre tout à fait légitime à être
mêlé à un processus de création musicale. Il existe
tout un champ de la science qui étudie la manière dont la musique
a accompagné l'évolution de l'intelligence humaine. En comparant
différentes musiques traditionnelles de différentes civilisations
à travers le monde, on peut retrouver des idées
esthétiques similaires. J'entrevois qu'une réduction de ce socle
commun pourrait participer à une définition de ce qui nous rend
humain. Mais pour le distinguer, il faut le mettre en péril par
l'inhumain. Ce n'est un secret pour personne que les robots nous ont beaucoup
aidés à comprendre notre humanité.»
Holly Herndon dans une interview pour le journal
Libération.
38 sur 51
SITOGRAPHIE
· Rencontre Holly Herndon, pur esprit de
synthèse (article écrit par Olivier Lamm dans le journal
Libération, le 12 mai 2019)
39 sur 51
Travis Bott - Jack Park Canny Dope Man
(Document : pochette du Single Jack Park Canny Dope
Man).
Ce morceau à été créé par
l'agence de production américaine Space 150. Cette entreprise à
fait énormément parlé d'elle en sortant cette musique.
Travis Bott est un jeu de mot avec l'artiste et rappeur
américain Travis Scott. Le mot Bott utilisé par l'agence veut en
réalité dire « robot ». On pourrait traduire son nom
par Travis le robot car c'est effectivement une IA qui a créée ce
morceau. Pour en arrivé à ce résultat l'entreprise en
donner toute la discographie du rappeur et elle a laissé deux semaine
à l'intelligence artificielle pour créer un nouveau morceau de
l'artiste. On lui a fournit des instrumentales qui ressemble beaucoup à
celle que Travis Scott utilise, également des textes et des toplines
similaire.
Les paroles et les mélodies ont été
entièrement générées par un modèle
d'apprentissage automatique formé sur la musique du rappeur.
SPACE150 (l'entreprise qui a conçu cette algorithme)
nous dise qu'ils ont utilisé des réseaux de neurones
artificielles pour produire la musique.
« Notre équipe a enseigné à la
machine à la fois la grammaire et la cadence de rimes, en créant
des flux de travail personnalisés pour faire correspondre les couplets
de rimes et le nombre de syllabes dans chaque ligne. »
Il est fascinant d'écouter ce morceau, car le
résultat est vraiment impressionnant. La qualité sonore est
excellente, ce qui soulève des interrogations dans notre domaine. Si
n'importe qui pouvait accéder à un outil permettant de
créer et de mixer n'importe quelle musique avec un rendu satisfaisant,
peu de personnes seraient motivées à payer pour des sessions de
mixage.
Ce qui me fait particulièrement
réfléchir, c'est l'écriture des paroles par un algorithme.
Ecrivant moi-même des paroles de chanson, je suis étonné de
constater à quel point les schémas de rimes sont
respectés, même si de nombreuses phrases sont absurdes et
dénuées de sens. Bien que ce morceau soit bien construit avec ses
sonorités, son refrain et ses couplets, il est important de rappeler que
la musique demeure et restera toujours une oeuvre d'art, et une oeuvre d'art
est pertinente lorsqu'elle émane de l'esprit d'un être humain et
non d'un algorithme.
SITOGRAPHIE
·
space150.com
·
genius.com
40 sur 51
L'équipe de Space 150 est bien conscient que l'algorithme
est au limite de l'intelligence artificielle, en effet au début du clip
il y a une citation du philosophe français Jean Baudrillard qui dit
« La tristesse de l'intelligence artificielle est qu'elle est sans
artifice, donc sans intelligence. » De Jean Baudrillard, Cool
Memories - 1980-1985
Les créateurs de Travis Bott le dise eux même :
« ce projet montre à quel point la technologie a besoin d'une
importante supervision humaine pour développer des projets
créatifs comme de la musique. L'intelligence artificielle n'est donc pas
prête de remplacer nos artistes préférés. En
revanche , elle change d'ores et déjà beaucoup de choses dans le
monde de l'industrie musicale. » Ned Lampert, directeur
exécutif de la création chez space150.
Il est fascinant d'analyser ce morceau, car il
représente un exemple où l'humain a accordé une grande
liberté à une intelligence artificielle pour créer de la
musique. Ce qui est remarquable, c'est que cette composition a suscité
en moi un réel intérêt artistique et que je l'ai
moi-même écoutée pour le plaisir auditif alors qu'elle
n'est pas pertinente. Cela soulève la question de la complexité
des intelligences artificielles dans les domaines artistiques : comment une
oeuvre d'art créée par une intelligence artificielle peut-elle
avoir une valeur artistique ?
Cette grâce à cette expérience
d'écoute que j'ai décidé de consacrer mon mémoire
à l'intelligence artificielle dans la production musicale. Je me suis
demandé comment il était possible d'obtenir un résultat
d'une telle qualité, ce qui a éveillé ma curiosité
à comprendre les rouages de ces nouvelles technologies. Il est
indéniable que les avancées de l'intelligence artificielle dans
le domaine de la création musicale suscitent des questions fondamentales
sur la nature de l'art et de la créativité. Peut-on
considérer une oeuvre créée par une intelligence
artificielle comme une véritable expression artistique ? Est-ce que la
créativité et l'émotion qui émanent d'une telle
oeuvre sont authentiques ?
Ces interrogations sont légitimes et méritent
d'être explorées davantage. Il est possible que les oeuvres
produites par les intelligences artificielles soient considérées
comme des expressions artistiques à part entière, car elles
peuvent éveiller des émotions chez les auditeurs et susciter une
appréciation esthétique. Toutefois, il est également
important de reconnaître que l'intervention et l'interprétation
humaines restent cruciales pour donner un sens et une signification à
ces créations.
41 sur 51
Conclusion.
L'intelligence artificielle (IA) a apporté des
avancés technologiques significatives dans la production musicale. Elle
offre des opportunités intéressantes pour les artistes, les
producteurs et les ingénieurs du son.
Nous avons démontrer un certains nombre d'applications
possible des IA dans la production musical tel la reconnaissance musicale.
Cette technologie analyse et reconnait des éléments audio tel que
les instruments, les voix, les genres musicaux, les tempos ou encore les
structures. Permettant de retoucher des vielles musiques ou des vieux films.
Les IA donne la possibilité d'améliorer la
qualité audios avec des outils de restaurations. Cette applications de
l'intelligence est très utilisé en audiovisuelle mais
également en musique car elle peut analyser des enregistrements
musicales et les améliorer en ajustant la tonalité, le timing, le
rythme et même en corrigeant les erreurs. Cela permet d'obtenir des
enregistrements plus précis et de haute qualité, en
économisant du temps et des ressources.
Ces technologies sont également utilisées dans
le mixage. L'IA peut être utilisée pour automatiser certaines
tâches de production et de mixage, telles que l'équilibrage des
niveaux sonores, le traitement des effets audio et l'optimisation de la
spatialisation du son. Cela permet de gagner du temps et de rendre le processus
de production plus efficace.
On peut ensuite appliquer les algorithmes d'IA dans la
composition musicale, les intelligences artificielles peuvent
générer de la musique originale en utilisant des modèles
préexistants et des structures harmoniques. Comme nous l'avons vue avec
l'outil Flow Machines. Ils peuvent créer de nouvelles mélodies,
harmonies et arrangements, offrant ainsi aux compositeurs une source
d'inspiration ou une base à développer.
Enfin nous avons vue que les IA peuvent être
utilisé pour développer des interactions créatives, c'est
comme ça que l'artiste Holly Herndon applique cette forme
d'intelligence. L'interaction créatives permet aux musiciens de
collaborer avec des machines et d'explorer de nouvelles idées musicales.
L'application de cette IA permet de générer des réponses
musicales en temps réel, s'adaptant aux improvisations des musiciens
humains.
En conclusion, l'intelligence artificielle offre des avantages
considérables dans le domaine de la production musicale. Elle
élargit les possibilités créatives des artistes, augmente
l'efficacité des processus de production et permet de créer des
expériences musicales uniques. Cependant, il est important de souligner
que l'IA ne remplace pas l'aspect humain de la musique, mais plutôt
l'amplifie et le complète. L'alliance entre les capacités de l'IA
et la créativité humaine offre un potentiel prometteur pour
l'avenir de la production musicale, elle peut en même temps
détruire des métiers artistiques ce qui fait poser beaucoup de
questions sur l'avenir de nos métiers.
Il est possible d'ouvrir ce mémoire sur la
problématique suivante : Qu'elles sont les applications de
l'intelligence artificiel dans la création artistique ?
42 sur 51
Annexes.
Annexe 1 : Guide de prise en main Hit'n'Mix.
(c) Hit'n'Mix Ltd 2009-2021
RipX Manual
Much of RipX is described by the Interactive Help box
which can be activated from the Help menu.
It is also a good idea to watch the walkthrough YouTube videos
available from Help > YouTube Videos.
Contents
RipX: DeepPlayer, DeepRemix &
DeepAudio
|
4
|
Opening, Ripping & Exporting
Audio/Video
|
4
|
Opening & Ripping Audio
|
4
|
Preparing Rips for Editing
|
6
|
Exporting Audio
|
7
|
Video Import & Export (macOS only)
|
7
|
DeepRemix: The Cursor, Selections, Groups &
Effects
|
9
|
The Cursor
|
9
|
Note & Time Selections
|
9
|
Groups
|
10
|
Applying Adjustments & Effects to Selections
|
10
|
DeepRemix: Essential Step-By-Step Editing Instructions
|
13
|
Pitch
|
13
|
Chromatically edit pitch
|
13
|
Edit pitch over a musical scale
|
13
|
Finely edit pitch
|
14
|
Quickly flatten, slide, or add constant vibrato to pitch
|
14
|
Rhythm
|
15
|
Edit rhythm by moving the starts of notes
|
15
|
Edit rhythm by adding/removing notes
|
15
|
Note Duration, Tempo & Time
|
16
|
Edit note duration
|
16
|
Edit tempo
|
16
|
Edit time
|
17
|
Volume & EQ
|
17
|
Unpitched Sound
|
18
|
DeepRemix: Playback, Loops, Randomize &
Ripples
|
19
|
Playback
|
19
|
Loops
|
19
|
Randomize
|
20
|
Randomize Adjustments / Effects
|
20
|
1
Lien de téléchargement du manuel :
https://bestmusicsheet.com/wp-content/uploads/2022/02/RipX-Manual.pdf
Français
Guide de Prise en Main
43 sur 51
Annexe 2 : Guide de prise en main iZotope.
Lien de téléchargement du manuel :
M-AUDIO IZOTOPE RX QUICK START GUIDE:
Télécharger le mode d'emploi au format PDF (378 Ko)
44 sur 51
Annexe 3 : Guide de prise en main FAST
EQUALISER.
Manual
Lien de téléchargement du manuel :
https://collective.focusrite.com/documents/fast-equaliser.pdf
45 sur 51
Annexe 4 : Guide de prise en main FAST
COMPRESSOR.
Manual
Lien de téléchargement du manuel :
https://collective.focusrite.com/documents/fast-compressor.pdf
46 sur 51
Annexe 5 : Guide de prise en main FAST VERB.
Manual
Lien de téléchargement du manuel :
https://collective.focusrite.com/documents/fast-verb.pdf
47 sur 51
Annexe 6 : Guide de prise en main FAST
LIMITER.
Manual
Lien de téléchargement du manuel :
https://collective.focusrite.com/documents/fast-limiter.pdf
Annexe 7 : Guide de prise en main Smart Eq 3.
|
|
smart:EQ3
manual
|
|
|
smart:EQ 3
|
manual
|
The intelligent equalizerequalizer
|
48 sur 51
Lien de téléchargement du manuel :
https://www.sonible.com/wp-content/uploads/2021/05/manual-smartEQ3-1.pdf
49 sur 51
Annexe 8 : Guide de prise en main Playbeat
audiomodern.
Windows, MacOS & iOS
Getting Started
Lien de téléchargement du manuel :
//
www.mediafire.com/file/ivrkwp2xlo18kpu/Playbeat_3_User_Manual.pdf
50 sur 51
Annexe 9 : Guide de prise en main Algonaut Audio
Atlas 2.
Lien de téléchargement du manuel :
https://algonaut.audio/manuals/atlas/2_0_2/index.html
51 sur 51
Annexe 10 : Article de recherche sur Flow
Machines.
Assisted music creation with Flow Machines: towards
new categories of new
François Pachet, Pierre Roy, Benoit
Carré CTRL, Spotify
francois@spotify.com
Abstract. This chapter reflects on about 10
years of research in AI-assisted music composition, in particular during the
Flow Machines project. We reflect on the motivations for such a project, its
background, its main results and impact, both technological and musical,
several years after its completion. We conclude with a proposal for new
categories of «new», created by the many uses of AI techniques to
generate novel material.
Keywords: Machine-Learning· Markov chains ·
Applications · Music · global constraints
1 Background and Motivations
The dream of using machines to compose music automatically has
long been a subject of investigation, by musicians and scientists.
Since the 60s, many researchers used virtually all existing
artificial intelligence techniques at hand to solve music generation problems.
However, little convincing music was produced with these technologies.
A landmark result in machine music generation is the Illiac
suite, released to the public in 1956 [17]. The Illiac suite demonstrated that
Markov chains of a rudimentary species (first order, augmented with basic
generate-and-test methods) could be used to produce interesting
music1.
However, the technology developed for that occasion lacked
many fundamental features, to make it actually useable for concrete,
professional musical projects. Notably, the experiment involved
generate-and-test methods to satisfy various constraints imposed by the
authors. Also, the low order of the Markov chain did not produce convincing
style imitation. In spite of these many weaknesses, the Illiac suite remains
today a remarkable music piece, that can still be listened to with interest.
The Flow Machines project (2012-2017) 2 aimed at
addressing the core technical issues at stake when generating sequences in a
given style. In some sense, it addressed the two main weaknesses of the Markov
chains used in the Illiac suite:
1 we invite the reader to listen
to the Illiac suite, composed more than 70 years ago, to appreciate its
enduring innovative character
https://www.youtube.com/watch?
v=n0njBFLQSk8
2 funded by an ERC advanced grant,
and conducted at Sony CSL and UniversitéPierre et Marie Curie, now
Sorbonne Université.
Lien de téléchargement de l'article :
https://www.francoispachet.fr/wp-content/uploads/2020/05/FlowMachines.pdf
|