Chapitre 0. CONCEPTS ET DEFINITIONS
I. Comptabilité nationale
Dans cette section il s'agit pour nous de circonscrire notre
thème dans un cadre comptable. Ce document ne se veut pas non plus un
guide pour l'apprentissage de la discipline. Nous ne donnerons que des
définitions et des éclaircissements sur des concepts que nous
estimons importants pour mener à bien notre étude.
1. Définition
La comptabilité nationale peut être
appréhendée comme un outil ou un instrument de mesure qui, au
moyen des techniques statistiques, économiques et comptables informe de
manière très précise et synthétique sur la
situation économique d'un pays. C'est donc un instrument de mesure
privilégié au service de la science économique, en ce sens
qu'elle permet d'introduire la quantification non seulement dans les analyses
mais aussi dans les modèles économiques proposés.
En tant que science, elle enseigne les techniques et les
méthodes permettant de retracer dans un cadre comptable toutes les
opérations qu'effectuent les agents économiques résidents
pendant une année. L'expression cadre comptable signifie que les comptes
de la nation ne constituent pas une véritable comptabilité qui
serait issue de la consolidation de la comptabilité de tous les agents
économiques.
2. Objet
Dans les années 1930, il est apparu nécessaire
voire indispensable de connaître avec la plus grande certitude possible
les grands agrégats caractérisant l'économie nationale
(PIB, revenu national, niveau de consommation, ...) ainsi que
l'évolution de ces agrégats. Ces agrégats,
élaborés à partir d'un système cohérent,
permettraient de quantifier les interventions du pouvoir public pour un
éventuel coup de main au lancement de l'emploi et de la production. Les
premiers travaux sur les agrégats ont été orientés
vers ce sens.
Cette demande est devenue plus pressante au lendemain de la
seconde guerre mondiale, nécessitant une normalisation des
systèmes d'élaboration et de suivi des comptes. Ce système
qui, plus tard, aboutira à l'adoption d'un système uniforme et
universel de la comptabilité nationale, est aujourd'hui adopté
par presque tout les pays pour l'établissement de leurs comptes
économiques. La version la plus recommandée de ce système
a été élaborée en commun accord de cinq structures,
et est présentée comme le système de comptabilité
nationale des nations unies.
Par ce système, la comptabilité nationale aura
permis une unification de langage économique, du moins en ce qui
concerne les données macroéconomiques, en dépit des
différences qui subsistent dans la théorie économique.
Ainsi, ses définitions sont sans ambiguïté. Elle
élabore des agrégats économiques qui pour la plupart
donnent lieu à l'établissement des modèles d'estimations
et de prévision à court et à moyen terme.
La comptabilité nationale a donc pour objet de
décrire (rendre compte, analyser, ....) l'ensemble des opérations
à caractère économique qui ont lieu sur le territoire
économique d'un pays ou d'un Etat. Pour ce faire, elle procède
à un regroupement des agents économiques en des
unités qui auraient des comportements analogues. Ces
unités, qui sont des centres élémentaires de
décision jouissant d'une certaine autonomie, forment ce que l'on peut
appeler les secteurs institutionnels. On distingue ainsi selon le
SCN19931, cinq secteurs institutionnels (les sociétés
non financières, les sociétés financières, les
administrations publiques, les institutions sans buts lucratifs et les
ménages) et mutuellement exclusifs. A ces secteurs on adjoint le reste
du monde qui n'est pas un secteur à part entière, il permet
toutefois de retracer les relations économiques que le pays entretient
avec l'extérieur, c'est-à-dire les relations qu'entretiennent les
unités résidentes2 avec celles non-résidentes
de l'économie.
Cette nomenclature de secteur institutionnel est propre
à la comptabilité nationale et s'écarte de celle
utilisée par d'autres spécialistes, comme les sociologues. Ainsi
un individu peut à la fois appartenir aux sociétés et
quasi-sociétés (secteur des sociétés non
financières) pour son activité de production, (entant qu'ouvrier
par exemple) et aux ménages pour son activité de consommation.
Les opérations de ces secteurs sont enregistrées en des
différents postes que l'on appelle les comptes.
3. Les comptes
La comptabilité nationale enregistre chaque
opération effectuée par un secteur institutionnel en plusieurs
postes d'enregistrements. Ces postes constituent ce que l'on appelle les
comptes institutionnels. Pour un agent, les opérations peuvent
être de nature financière ou porter sur les biens et services.
Pour des opérations de biens et services, on les enregistre dans l'un
des cinq comptes intégrés qui sont: comptes de production,
d'exploitation, de revenu, d'utilisation de revenu et de compte de capital.
Pour plus de clarté, on peut éclater le compte d'utilisation de
revenu en trois comptes à savoir les comptes d'affectation de revenu
primaire, les comptes de distribution secondaire de revenu et le compte
d'utilisation du revenu disponible. Les comptes sont liés les uns aux
autres par leur solde. On inscrit à la ressource du second le solde du
premier, celui du second à la ressource du troisième et ainsi de
suite. Le dernier solde est celui de capacité ou de besoin de
financement pour l'unité concernée. Il renseigne sur la situation
de trésorerie de l'agent économique concerné.
Les comptes financiers renseignent sur la manière dont
les agents en besoin de financement ont financé leur besoin et dont ceux
en capacité de financement ont utilisé leurs ressources
disponibles. Ils portent sur les opérations relatives à la
création et à la circulation des moyens de paiement et de
financement dont a besoin l'économie pour son fonctionnement.
II. Secteur moderne DSF et secteur moderne non
DSF
Les DSF (Déclaration Statistique et Fiscale) sont des
documents officiels que déposent les entreprises du secteur moderne
à la Direction Générale des Impôts (DGI) à la
fin de chaque exercice comptable. Ces documents contiennent la
quasi-totalité de comptabilité des entreprises
dépositaires. En ce sens, elles permettent d'évaluer leurs
productions, leurs Consommations Intermédiaires (CI)... Les entreprises
concernées par le dépôt de DSF sont celles du secteur
moderne. Car ces sont elles qui sont supposées détenir de
comptabilité qu'elles produisent annuellement. Le constat de la
réalité a permis au service de la comptabilité nationale
de scinder ce secteur en deux sous-secteurs. Ces sous-secteurs sont
élaborés à la fois en fonction de leurs chiffres
d'affaires et de leurs statuts. Le statut évoqué n'est autre que
l'appartenance ou non d'une
1 Système de comptabilité nationale des Nations
Unies version révisée en 1993.
2 La résidence n'est pas définie selon la
nationalité, est résident d'une économie toute personne
physique ou morale qui effectue une activité à caractère
économique sur un territoire ou a l'intention d'y effectuer cette
activité pour une durée au moins une année. La
résidence retenue est donc un concept lié au centre
d'intérêt économique
entreprise au secteur dit moderne. Cette classification
donnera les deux sous secteurs à savoir "secteur moderne DSF"
et "secteur moderne non DSF".
Le secteur marchand moderne DSF regroupe toutes les grosses
entreprises1 du secteur moderne qui produisent un document comptable
de façon périodique. Le secteur marchand moderne non DSF
regroupe, quant à lui, les entreprises du secteur moderne non retenues
dans le classement cité supra. Ce sont des entreprises dont les DSF sont
inexploitables ou pour lesquelles l'on ne dispose pas du tout de DSF. Les
comptes de ce secteur doivent donc être estimés.
III. Les sources de données
Comme toute science quantitative, la comptabilité
nationale utilise des sources statistiques pour l'élaboration des
comptes et pour l'analyse et la projection de ceux-ci. Ces sources statistiques
proviennent en partie des enquêtes qu'organisent les services en charge
de la collecte d'information. On peut aussi faire recours aux sources
administratives disponibles pour l'élaboration des comptes. Parmi ces
sources, on a les liasses fiscales des entreprises et les déclarations
statistiques et fiscales déposées par celles-ci.
L'utilisation d'une ou d'autres sources est fonction des
comptes que nous devons élaborer. Ainsi pour les comptes nationaux du
Burkina, on peut avoir recours à plusieurs sources. Pour les comptes du
secteur primaire (agriculture et élevage), les ministères de
l'agriculture et de l'élevage constituent les partenaires clés
pour les statistiques agricoles. Le Tableau des Opérations
Financières de l'Etat (TOFE), les documents comptables des organismes de
sécurité sociale et des autres organismes de l'Etat, les comptes
de gestion des collectivités locales (communes et provinces) et la
balance du trésor sont des sources importantes pour l'élaboration
des comptes de l'administration publique. En ce qui concerne le reste du monde,
la balance des paiements et les statistiques du commerce extérieur
constituent la source de première place.
Pour l'élaboration des comptes des
sociétés financières et non financières, on
utilisera comme sources de données de première importance les
documents comptables des institutions de crédit et des
sociétés d'assurance, le recensement à caractère
industriel et commercial et les déclarations statistiques et
fiscales.
Au Burkina, les entreprises sont tenues de faire une
déclaration auprès de services des impôts. Ces
déclarations concernent toutes les entreprises du secteur moderne. A
partir des statistiques disponibles couplées avec celles
collectées par le service de comptabilité nationale, on disposera
d'une base d'informations. Cette base constitue la boussole du service dans
l'élaboration des comptes nationaux. Le document qui contient ces
déclarations est appelé la DSF (Déclaration Statistique et
Fiscale) des entreprises. Mais en pratique, il n'est pas fréquent de
coupler les informations reçues par la direction générale
des impôts (liasses fiscales) avec les données de l'INSD.
Compte tenu de l'importance que peuvent avoir ces DSF et de
nombre pléthorique des entreprises du secteur moderne, il a
été prévu que chaque entreprise de ce secteur
prévoira un exemplaire de ses déclarations fiscales annuelles -
qu'elle dépose à la DGI - pour le besoin de statistiques. Mais
dans les faits, ce principe est loin d'être respecté. Car la DGI
ne met pas toujours des DSF à la disposition des comptables nationaux et
il existe des entreprises qui n'en produisent point, obligeant l'INSD à
entreprendre des travaux de collecte pour se procurer de maximum de
données sur l'existence et l'activité de ces unités
institutionnelles. En sus, la démographie instable des entreprises fait
que l'on ne peut pas se passer de collecter des informations chaque
année sur à la fois leur existence que sur leur niveau
d'activité entre autres la production, le salaire versé aux
employés, la consommation nécessaire pour le fonctionnement
1 Raisonnement en terme de chiffre d'affaires.
de processus de production et les impôts sur la
production. De plus, ces données sont très variables d'une
année à une autre, même pour les entreprises stables sur le
territoire économique, faisant de la collecte un des moyens le plus
sûr pour avoir les informations sur les unités opérant des
activités économiques sur le territoire nationale.
Chapitre 1. GENERALITES ET PROBLEMATIQUE DE
L'ETUDE
Toute étude scientifique doit se baser sur les
théories tout en ne perdant pas de vue l'aspect pratique. Ce chapitre
aborde le cadre théorique de notre étude après avoir
situé le contexte et la problématique du stage.
I. Contexte et problématique de
l'étude
La présente étude, portant sur le traitement
des entreprises du secteur moderne non DSF en vue de l'élaboration des
comptes des sociétés non financières, intervient dans le
cadre du stage de fin de cycle d'ingénieur des travaux statistiques.
Elle répond d'une part à une demande du service de
comptabilité nationale de l'INSD du Burkina Faso, et d'autre part au
besoin de mise en pratique des théories acquises au cours de la
formation.
Au sein du Service de la comptabilité nationale, nous
avions pour tâche de proposer une méthodologie pour le traitement
des entreprises du secteur moderne "non DSF" en vue de compléter
l'information disponible fournie par les entreprises du moderne DSF.
Pour l'élaboration des comptes nationaux, el service
en charge de la Comptabilité nationale doit collecter des informations
assez précises et exhaustives en vue de produire les agrégats et
les indicateurs macroéconomiques avec la plus grande certitude possible.
Pour ce faire, on cherche à détenir le maximum d'informations sur
toutes les unités institutionnelles qui prennent part à
l'activité économique nationale. Les sociétés et
quasi sociétés non financières constituent une source
importante de données dans la production de ces agrégats. Il est
donc nécessaire de rassembler le maximum d'information chiffrée
sur ces unités. Le support qui permet de disposer de cette information
est la DSF qui est un document comptable dont les entreprises ont obligation de
déposer des copies à la Direction Générale des
Impôts (DGI). L'INSD devrait pouvoir entrer en possession de ces
documents auprès de la DGI mais la collaboration avec cette structure
n'est pas toujours aisée. C'est pourquoi des collectes directes sont
organisées par le Service de la Comptabilité nationale en vue de
disposer des DSF, tout au moins pour les grandes entreprises. Pour les
entreprises dont on ne peut pas disposer des DSF (soit que le document est
inaccessible ou soit qu'il n'existe pas du tout), des estimations sont faites
pour approcher leurs agrégats (production, consommations
intermédiaires, rémunérations des salariés et
impôts sur la production).
La prise en compte des DSF manquantes permet de
remédier au problème de sous estimations des grandeurs dans
l'élaboration des comptes nationaux. Le traitement des DSF manquantes
consiste à estimer les comptes de production et d'exploitation des
entreprises pour lesquelles on n'a pas pu disposer de documents pour une
année donnée.
L'objectif premier de notre étude est donc de proposer
une méthodologie adaptée d'estimation, en vue de réduire
le biais introduit par la non disponibilité des DSF pour certaines
entreprises du secteur moderne non financier. Mais avant de proposer notre
méthode d'investigation pour réaliser cet objectif, nous allons
passer succinctement en revue les principales méthodes d'estimation des
données manquantes disponibles dans la littérature.
II. Cadre théorique
Dans cette section, il sera question pour nous de
présenter la littérature sur les différentes
théories concernant le traitement de données manquantes.
Dans l'application des techniques de collecte (sondage),
plusieurs problèmes peuvent se poser, parmi lesquels on compte la
difficulté pour choisir une technique de sondage particulière. A
cette difficulté conceptuelle s'ajoutent plusieurs autres
problèmes d'ordres pratiques entre autres : l'absence de certaines
unités au moment de l'enquête, le refus de répondre, la
perte des questionnaires ou l'illisibilité de certains questionnaires.
Ces problèmes mentionnés entraînent la non-réponse
totale ou partielle dont la non prise en compte est susceptible
d'entraîner un biais dans l'estimation des paramètres.
Peu importe la rigueur que l'on se fixe, il y aura toujours
des non-réponses (comme le soulignaient BRION P. et CLAIRIN Rémy
- 1997)1 et il faut faire avec en trouvant une méthode
robuste pour leur traitement. Ainsi dans toute enquête un certain
degré de non- réponse est inévitable. A cet effet, il
convient alors de connaître les méthodes qui réduisent et
affaiblissent leur effet sur le résultat. Avant de définir les
méthodes appropriées aux traitements de ce
phénomène, il nous paraît nécessaire de faire une
distinction entre les différentes formes de non-réponses. Quand
parle - t - on d'une non-réponse totale ou partielle ? Cette distinction
sera suivie par une description des types de mécanismes susceptibles de
faire apparaître de données manquantes.
On considère une variable Y dont on veut estimer la
moyenne, le total ou toute autre fonction sur une population donnée.
Soit Y = (yj)1=j=k, l'ensemble des
observations de la
variable Y sur un échantillon s de cette population.
On appelle ensemble de réponses associées à
la variable d'intérêt y l'ensemble
suivant :
r = i i ? s y ji .
j { / et observée }
Avec s désignant l'échantillon. On remarque que
les rj ne sont pas forcément identiques pour tout
les individus.
De façon générale, le statisticien
d'enquête distingue deux sortes de non-réponses : la
non-réponse totale et la non-réponse partielle.
1. Non-réponse totale
La non-réponse est dite totale lorsque l'on rencontre
des problèmes qui nous empêchent d'avoir le questionnaire pour
l'analyse, peu importe ce qui aurait occasionné la non
disponibilité du questionnaire. Cette non disponibilité peut
être due au refus de l'unité statistique (l'enquêté)
à prendre part à l'interview, à la perte du questionnaire,
à l'illisibilité du questionnaire rempli,... Ainsi, on parlera de
non-réponse totale pour l'élément i si le vecteur entier
des variables de l'étude est manquant (non observé). Soit
l'ensemble suivant :
k
r r r
= ? ?
t 1 2
|
... . Ainsi désigne l'ensemble de réponse
totale.
? =J
r r r
k i t
|
i=1
L'ensemble de non-réponse totale s'obtient par
différence entre l'échantillon et l'ensemble de réponse,
d'où l'équation suivante :
r t = s -rt.
Dans cette équation, rt désigne
l'ensemble de non-réponse totale.
1 BRION P. et CLAIRIN R. (1997) - Manuel de sondages :
Application aux pays en développement, INSEE et CPED, Paris.
2. Non-réponse partielle
On parle de non-réponse partielle lorsque pour une
raison ou pour une autre l'on n'est pas capable d'avoir l'information pour une
ou plusieurs des questions particulières de l'enquête. Il s'agit
donc de l'absence de la valeur observée pour l'unité. C'est
lorsqu'une ou plusieurs variables sont manquantes. L'ensemble des
réponses partielles est donnée par :
k
r r r r r
= n n n =I
...
p 1 2 k i
i=1
Ainsi le rp nous donne les
éléments qui ont répondu à toutes les questions et
r t - rp donne l'ensemble de non-réponse
partielle.
Toutefois, le manque de cette valeur n'implique pas
automatiquement une non- réponse partielle pour l'observation. La
carence d'information peut être due par exemple au fait que l'individu
statistique n'est pas concerné par la question qui lui est posée
(exemple : le niveau d'étude d'un enfant de moins de six ans dans un
pays où l'age officiel d'aller à l'école est de sept ans).
On parlera alors de "sans objet" au lieu de non-réponse.
La non-réponse partielle se présente dans l'un des
cas suivants :
y' L'enquêté ne connaît pas la réponse
à la question qui lui a été posée; y' Il ne
souhaite pas répondre à la question pour une raison
quelconque;
y' La suppression des valeurs aberrantes par l'enquêteur
ou par l'analyste.
On retient donc que dans les deux cas de non-réponses
les données peuvent exister et être hors de portée du
statisticien. Pour des raisons de secret professionnel, par exemple, les firmes
peuvent bloquer l'accès aux données.
3. Les mécanismes de génération
des données manquantes
Par mécanisme de génération, on entend le
phénomène susceptible d'entraîner la non- réponse
des unités statistiques ou encore type de données manquantes.
Dans la théorie statistique, on distingue en général trois
mécanismes, selon Little et Rubin (1987), qui peuvent décrire le
phénomène de données manquantes. Ces mécanismes
sont: réponse manquant entièrement au hasard (MCAR, Missing
Completely At Random), réponse manquant au hasard (MAR, Missing
At Random) et réponse ne manquant pas au hasard (NMAR, Non
Missing At Random).
Avant d'expliciter ces mécanismes nous jugeons
nécessaire de faire une définition des concepts et des notations
que nous utiliserons dans la définition des types de
non-réponse.
Soit X = (x ij ) une matrice de
données d'ordre (n× k) d'éléments
xij où n est le nombre d'observations de
la population cible U, k le nombre de variables et
xij est la valeur de la variable j pour
l'observation i, avec i =1,..., n, et j =1,...,
k. Soit A = (aij), une matrice dont
les éléments valent l'unité lorsque la
valeur de la variable de l'observation est absente et zéro sinon. Dit
autrement et de façon formelle, c'est une matrice indicatrice de
données
manquantes d'éléments aij
telle que aij = 1 si xij manque, et
aij = 0 sinon. La matrice A décrit donc la
structure des données manquantes. Il est utile de traiter A
comme une matrice stochastique. Soient , , et
X X
o no respectivement la partie observée
de données X, la partie
non observée et les paramètres caractérisant
le taux de réponse.
De façon non formelle, on dira qu'un processus de
génération de données manquantes est dû au hasard
(MAR) si la probabilité de réponse dépend de certaines
variables auxiliaires, mais non de la variable d'intérêt.
Autrement dit, si ( / , , )
P A X X
o no est la
distribution conditionnelle de A étant
donné X et ne dépend que de variables qui se retrouvent
dans la base, o
X . On dira ainsi que :
( / , , ) ( / , )
o no = P A X o no
P A X X ? X .
C'est donc un processus pour lequel la probabilité de
répondre à une variable d'intérêt dépend
uniquement des variables auxiliaires.
Pour le processus dont les données manquantes ne sont
pas dues au hasard, on parlera de mécanisme de type NMAR. La
probabilité de réponse dépend de la variable
d'intérêt et éventuellement d'autres variables explicatives
non observées.
Si ( / , , ) ( / , )
o no = P A Y X on dit que la distribution
conditionnelle de A
no
P A X X
sachant X ne dépend pas d'un
phénomène aléatoire mais plutôt de la nature de la
variable d'intérêt. Par exemple pour des raisons de
méfiance dans un pays en conflit la population n'aime pas
répondre à la question concernant la religion et l'ethnie. Tout
comme, l'entrepreneur ne souhaite pas toujours donner des informations sur son
chiffre d'affaires.
Quant au mécanisme de type MCAR, il concerne des
données manquantes qui sont complètement dues au hasard. Pour ce
mécanisme la probabilité de répondre ne dépend ni
de la variable d'intérêt ni des variables explicatives et elle est
identique pour toutes les unités.
Formellement, lorsque l'on considère que P
(A / X,) est la distribution conditionnelle de la
matrice indicatrice A. Lorsqu'on connaît la matrice de
données X, on dira qu'il s'agit de
MCAR siP(A/X,)=P(A/)
? X.
|