· La constitution du corpus
La constitution du corpus et la transcription intégrale de
son contenu dans un fichier de données intégrant les silences et
les hésitations. Une lecture « flottante » de
l'ensemble permet d'en avoir une idée générale et
d'envisager certaines hypothèses concernant sa constitution.
· La définition des unités d'analyse
La définition des unités d'analyse est la base du
décodage du matériel exploité. Le codage consiste à
transformer les données textuelles brutes en éléments
condensés résumant les caractéristiques pertinentes du
contenu analysé.
Les bases usuelles de ce décodage sont le mot, la phrase,
ou le thème, à partir desquels on peut définir :
- Des unités syntaxiques centrées sur les
caractéristiques grammaticales, par exemple : les verbes
différents de substantifs ;
- Des unités lexicales centrées sur le
vocabulaire, permettant, par exemple, des regroupements de synonymes ;
- Des unités thématiques centrées sur le
sens, permettant de distinguer par exemple « travail » et
« loisir », « douceur » et
« amertume », etc.
L'étude d'un même corpus peut être
effectuée en s'appuyant sur des unités d'analyse de type
différent selon l'objet de l'étude ou les hypothèses
formulées.
b. Phase de codification
Elle consiste à exploiter le texte en fonction des
règles définies ci-dessous :
|