WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Le traitement des données manquantes pour l'établissement des comptes économiques du Burkina Faso

( Télécharger le fichier original )
par Lassana DOUCOURE
ENSEA Abidjan - Ingénieur Statistiques 2005
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

Chapitre 0. CONCEPTS ET DEFINITIONS

I. Comptabilité nationale

Dans cette section il s'agit pour nous de circonscrire notre thème dans un cadre comptable. Ce document ne se veut pas non plus un guide pour l'apprentissage de la discipline. Nous ne donnerons que des définitions et des éclaircissements sur des concepts que nous estimons importants pour mener à bien notre étude.

1. Définition

La comptabilité nationale peut être appréhendée comme un outil ou un instrument de mesure qui, au moyen des techniques statistiques, économiques et comptables informe de manière très précise et synthétique sur la situation économique d'un pays. C'est donc un instrument de mesure privilégié au service de la science économique, en ce sens qu'elle permet d'introduire la quantification non seulement dans les analyses mais aussi dans les modèles économiques proposés.

En tant que science, elle enseigne les techniques et les méthodes permettant de retracer dans un cadre comptable toutes les opérations qu'effectuent les agents économiques résidents pendant une année. L'expression cadre comptable signifie que les comptes de la nation ne constituent pas une véritable comptabilité qui serait issue de la consolidation de la comptabilité de tous les agents économiques.

2. Objet

Dans les années 1930, il est apparu nécessaire voire indispensable de connaître avec la plus grande certitude possible les grands agrégats caractérisant l'économie nationale (PIB, revenu national, niveau de consommation, ...) ainsi que l'évolution de ces agrégats. Ces agrégats, élaborés à partir d'un système cohérent, permettraient de quantifier les interventions du pouvoir public pour un éventuel coup de main au lancement de l'emploi et de la production. Les premiers travaux sur les agrégats ont été orientés vers ce sens.

Cette demande est devenue plus pressante au lendemain de la seconde guerre mondiale, nécessitant une normalisation des systèmes d'élaboration et de suivi des comptes. Ce système qui, plus tard, aboutira à l'adoption d'un système uniforme et universel de la comptabilité nationale, est aujourd'hui adopté par presque tout les pays pour l'établissement de leurs comptes économiques. La version la plus recommandée de ce système a été élaborée en commun accord de cinq structures, et est présentée comme le système de comptabilité nationale des nations unies.

Par ce système, la comptabilité nationale aura permis une unification de langage économique, du moins en ce qui concerne les données macroéconomiques, en dépit des différences qui subsistent dans la théorie économique. Ainsi, ses définitions sont sans ambiguïté. Elle élabore des agrégats économiques qui pour la plupart donnent lieu à l'établissement des modèles d'estimations et de prévision à court et à moyen terme.

La comptabilité nationale a donc pour objet de décrire (rendre compte, analyser, ....) l'ensemble des opérations à caractère économique qui ont lieu sur le territoire économique d'un pays ou d'un Etat. Pour ce faire, elle procède à un regroupement des agents économiques en des

unités qui auraient des comportements analogues. Ces unités, qui sont des centres élémentaires de décision jouissant d'une certaine autonomie, forment ce que l'on peut appeler les secteurs institutionnels. On distingue ainsi selon le SCN19931, cinq secteurs institutionnels (les sociétés non financières, les sociétés financières, les administrations publiques, les institutions sans buts lucratifs et les ménages) et mutuellement exclusifs. A ces secteurs on adjoint le reste du monde qui n'est pas un secteur à part entière, il permet toutefois de retracer les relations économiques que le pays entretient avec l'extérieur, c'est-à-dire les relations qu'entretiennent les unités résidentes2 avec celles non-résidentes de l'économie.

Cette nomenclature de secteur institutionnel est propre à la comptabilité nationale et s'écarte de celle utilisée par d'autres spécialistes, comme les sociologues. Ainsi un individu peut à la fois appartenir aux sociétés et quasi-sociétés (secteur des sociétés non financières) pour son activité de production, (entant qu'ouvrier par exemple) et aux ménages pour son activité de consommation. Les opérations de ces secteurs sont enregistrées en des différents postes que l'on appelle les comptes.

3. Les comptes

La comptabilité nationale enregistre chaque opération effectuée par un secteur institutionnel en plusieurs postes d'enregistrements. Ces postes constituent ce que l'on appelle les comptes institutionnels. Pour un agent, les opérations peuvent être de nature financière ou porter sur les biens et services. Pour des opérations de biens et services, on les enregistre dans l'un des cinq comptes intégrés qui sont: comptes de production, d'exploitation, de revenu, d'utilisation de revenu et de compte de capital. Pour plus de clarté, on peut éclater le compte d'utilisation de revenu en trois comptes à savoir les comptes d'affectation de revenu primaire, les comptes de distribution secondaire de revenu et le compte d'utilisation du revenu disponible. Les comptes sont liés les uns aux autres par leur solde. On inscrit à la ressource du second le solde du premier, celui du second à la ressource du troisième et ainsi de suite. Le dernier solde est celui de capacité ou de besoin de financement pour l'unité concernée. Il renseigne sur la situation de trésorerie de l'agent économique concerné.

Les comptes financiers renseignent sur la manière dont les agents en besoin de financement ont financé leur besoin et dont ceux en capacité de financement ont utilisé leurs ressources disponibles. Ils portent sur les opérations relatives à la création et à la circulation des moyens de paiement et de financement dont a besoin l'économie pour son fonctionnement.

II. Secteur moderne DSF et secteur moderne non DSF

Les DSF (Déclaration Statistique et Fiscale) sont des documents officiels que déposent les entreprises du secteur moderne à la Direction Générale des Impôts (DGI) à la fin de chaque exercice comptable. Ces documents contiennent la quasi-totalité de comptabilité des entreprises dépositaires. En ce sens, elles permettent d'évaluer leurs productions, leurs Consommations Intermédiaires (CI)... Les entreprises concernées par le dépôt de DSF sont celles du secteur moderne. Car ces sont elles qui sont supposées détenir de comptabilité qu'elles produisent annuellement. Le constat de la réalité a permis au service de la comptabilité nationale de scinder ce secteur en deux sous-secteurs. Ces sous-secteurs sont élaborés à la fois en fonction de leurs chiffres d'affaires et de leurs statuts. Le statut évoqué n'est autre que l'appartenance ou non d'une

1 Système de comptabilité nationale des Nations Unies version révisée en 1993.

2 La résidence n'est pas définie selon la nationalité, est résident d'une économie toute personne physique ou morale qui effectue une activité à caractère économique sur un territoire ou a l'intention d'y effectuer cette activité pour une durée au moins une année. La résidence retenue est donc un concept lié au centre d'intérêt économique

entreprise au secteur dit moderne. Cette classification donnera les deux sous secteurs à savoir "secteur moderne DSF" et "secteur moderne non DSF".

Le secteur marchand moderne DSF regroupe toutes les grosses entreprises1 du secteur moderne qui produisent un document comptable de façon périodique. Le secteur marchand moderne non DSF regroupe, quant à lui, les entreprises du secteur moderne non retenues dans le classement cité supra. Ce sont des entreprises dont les DSF sont inexploitables ou pour lesquelles l'on ne dispose pas du tout de DSF. Les comptes de ce secteur doivent donc être estimés.

III. Les sources de données

Comme toute science quantitative, la comptabilité nationale utilise des sources statistiques pour l'élaboration des comptes et pour l'analyse et la projection de ceux-ci. Ces sources statistiques proviennent en partie des enquêtes qu'organisent les services en charge de la collecte d'information. On peut aussi faire recours aux sources administratives disponibles pour l'élaboration des comptes. Parmi ces sources, on a les liasses fiscales des entreprises et les déclarations statistiques et fiscales déposées par celles-ci.

L'utilisation d'une ou d'autres sources est fonction des comptes que nous devons élaborer. Ainsi pour les comptes nationaux du Burkina, on peut avoir recours à plusieurs sources. Pour les comptes du secteur primaire (agriculture et élevage), les ministères de l'agriculture et de l'élevage constituent les partenaires clés pour les statistiques agricoles. Le Tableau des Opérations Financières de l'Etat (TOFE), les documents comptables des organismes de sécurité sociale et des autres organismes de l'Etat, les comptes de gestion des collectivités locales (communes et provinces) et la balance du trésor sont des sources importantes pour l'élaboration des comptes de l'administration publique. En ce qui concerne le reste du monde, la balance des paiements et les statistiques du commerce extérieur constituent la source de première place.

Pour l'élaboration des comptes des sociétés financières et non financières, on utilisera comme sources de données de première importance les documents comptables des institutions de crédit et des sociétés d'assurance, le recensement à caractère industriel et commercial et les déclarations statistiques et fiscales.

Au Burkina, les entreprises sont tenues de faire une déclaration auprès de services des impôts. Ces déclarations concernent toutes les entreprises du secteur moderne. A partir des statistiques disponibles couplées avec celles collectées par le service de comptabilité nationale, on disposera d'une base d'informations. Cette base constitue la boussole du service dans l'élaboration des comptes nationaux. Le document qui contient ces déclarations est appelé la DSF (Déclaration Statistique et Fiscale) des entreprises. Mais en pratique, il n'est pas fréquent de coupler les informations reçues par la direction générale des impôts (liasses fiscales) avec les données de l'INSD.

Compte tenu de l'importance que peuvent avoir ces DSF et de nombre pléthorique des entreprises du secteur moderne, il a été prévu que chaque entreprise de ce secteur prévoira un exemplaire de ses déclarations fiscales annuelles - qu'elle dépose à la DGI - pour le besoin de statistiques. Mais dans les faits, ce principe est loin d'être respecté. Car la DGI ne met pas toujours des DSF à la disposition des comptables nationaux et il existe des entreprises qui n'en produisent point, obligeant l'INSD à entreprendre des travaux de collecte pour se procurer de maximum de données sur l'existence et l'activité de ces unités institutionnelles. En sus, la démographie instable des entreprises fait que l'on ne peut pas se passer de collecter des informations chaque année sur à la fois leur existence que sur leur niveau d'activité entre autres la production, le salaire versé aux employés, la consommation nécessaire pour le fonctionnement

1 Raisonnement en terme de chiffre d'affaires.

de processus de production et les impôts sur la production. De plus, ces données sont très variables d'une année à une autre, même pour les entreprises stables sur le territoire économique, faisant de la collecte un des moyens le plus sûr pour avoir les informations sur les unités opérant des activités économiques sur le territoire nationale.

Chapitre 1. GENERALITES ET PROBLEMATIQUE DE L'ETUDE

Toute étude scientifique doit se baser sur les théories tout en ne perdant pas de vue l'aspect pratique. Ce chapitre aborde le cadre théorique de notre étude après avoir situé le contexte et la problématique du stage.

I. Contexte et problématique de l'étude

La présente étude, portant sur le traitement des entreprises du secteur moderne non DSF en vue de l'élaboration des comptes des sociétés non financières, intervient dans le cadre du stage de fin de cycle d'ingénieur des travaux statistiques. Elle répond d'une part à une demande du service de comptabilité nationale de l'INSD du Burkina Faso, et d'autre part au besoin de mise en pratique des théories acquises au cours de la formation.

Au sein du Service de la comptabilité nationale, nous avions pour tâche de proposer une méthodologie pour le traitement des entreprises du secteur moderne "non DSF" en vue de compléter l'information disponible fournie par les entreprises du moderne DSF.

Pour l'élaboration des comptes nationaux, el service en charge de la Comptabilité nationale doit collecter des informations assez précises et exhaustives en vue de produire les agrégats et les indicateurs macroéconomiques avec la plus grande certitude possible. Pour ce faire, on cherche à détenir le maximum d'informations sur toutes les unités institutionnelles qui prennent part à l'activité économique nationale. Les sociétés et quasi sociétés non financières constituent une source importante de données dans la production de ces agrégats. Il est donc nécessaire de rassembler le maximum d'information chiffrée sur ces unités. Le support qui permet de disposer de cette information est la DSF qui est un document comptable dont les entreprises ont obligation de déposer des copies à la Direction Générale des Impôts (DGI). L'INSD devrait pouvoir entrer en possession de ces documents auprès de la DGI mais la collaboration avec cette structure n'est pas toujours aisée. C'est pourquoi des collectes directes sont organisées par le Service de la Comptabilité nationale en vue de disposer des DSF, tout au moins pour les grandes entreprises. Pour les entreprises dont on ne peut pas disposer des DSF (soit que le document est inaccessible ou soit qu'il n'existe pas du tout), des estimations sont faites pour approcher leurs agrégats (production, consommations intermédiaires, rémunérations des salariés et impôts sur la production).

La prise en compte des DSF manquantes permet de remédier au problème de sous estimations des grandeurs dans l'élaboration des comptes nationaux. Le traitement des DSF manquantes consiste à estimer les comptes de production et d'exploitation des entreprises pour lesquelles on n'a pas pu disposer de documents pour une année donnée.

L'objectif premier de notre étude est donc de proposer une méthodologie adaptée d'estimation, en vue de réduire le biais introduit par la non disponibilité des DSF pour certaines entreprises du secteur moderne non financier. Mais avant de proposer notre méthode d'investigation pour réaliser cet objectif, nous allons passer succinctement en revue les principales méthodes d'estimation des données manquantes disponibles dans la littérature.

II. Cadre théorique

Dans cette section, il sera question pour nous de présenter la littérature sur les différentes théories concernant le traitement de données manquantes.

Dans l'application des techniques de collecte (sondage), plusieurs problèmes peuvent se poser, parmi lesquels on compte la difficulté pour choisir une technique de sondage particulière. A cette difficulté conceptuelle s'ajoutent plusieurs autres problèmes d'ordres pratiques entre autres : l'absence de certaines unités au moment de l'enquête, le refus de répondre, la perte des questionnaires ou l'illisibilité de certains questionnaires. Ces problèmes mentionnés entraînent la non-réponse totale ou partielle dont la non prise en compte est susceptible d'entraîner un biais dans l'estimation des paramètres.

Peu importe la rigueur que l'on se fixe, il y aura toujours des non-réponses (comme le soulignaient BRION P. et CLAIRIN Rémy - 1997)1 et il faut faire avec en trouvant une méthode robuste pour leur traitement. Ainsi dans toute enquête un certain degré de non- réponse est inévitable. A cet effet, il convient alors de connaître les méthodes qui réduisent et affaiblissent leur effet sur le résultat. Avant de définir les méthodes appropriées aux traitements de ce phénomène, il nous paraît nécessaire de faire une distinction entre les différentes formes de non-réponses. Quand parle - t - on d'une non-réponse totale ou partielle ? Cette distinction sera suivie par une description des types de mécanismes susceptibles de faire apparaître de données manquantes.

On considère une variable Y dont on veut estimer la moyenne, le total ou toute autre fonction sur une population donnée. Soit Y = (yj)1=j=k, l'ensemble des observations de la

variable Y sur un échantillon s de cette population.

On appelle ensemble de réponses associées à la variable d'intérêt y l'ensemble

suivant :

r = i i ? s y ji .

j { / et observée }

Avec s désignant l'échantillon. On remarque que les rj ne sont pas forcément identiques pour tout les individus.

De façon générale, le statisticien d'enquête distingue deux sortes de non-réponses : la non-réponse totale et la non-réponse partielle.

1. Non-réponse totale

La non-réponse est dite totale lorsque l'on rencontre des problèmes qui nous empêchent d'avoir le questionnaire pour l'analyse, peu importe ce qui aurait occasionné la non disponibilité du questionnaire. Cette non disponibilité peut être due au refus de l'unité statistique (l'enquêté) à prendre part à l'interview, à la perte du questionnaire, à l'illisibilité du questionnaire rempli,... Ainsi, on parlera de non-réponse totale pour l'élément i si le vecteur entier des variables de l'étude est manquant (non observé). Soit l'ensemble suivant :

k

r r r

= ? ?

t 1 2

... . Ainsi désigne l'ensemble de réponse totale.

? =J

r r r

k i t

i=1

L'ensemble de non-réponse totale s'obtient par différence entre l'échantillon et l'ensemble de réponse, d'où l'équation suivante :

r t = s -rt.

Dans cette équation, rt désigne l'ensemble de non-réponse totale.

1 BRION P. et CLAIRIN R. (1997) - Manuel de sondages : Application aux pays en développement, INSEE et CPED, Paris.

2. Non-réponse partielle

On parle de non-réponse partielle lorsque pour une raison ou pour une autre l'on n'est pas capable d'avoir l'information pour une ou plusieurs des questions particulières de l'enquête. Il s'agit donc de l'absence de la valeur observée pour l'unité. C'est lorsqu'une ou plusieurs variables sont manquantes. L'ensemble des réponses partielles est donnée par :

k

r r r r r

= n n n =I

...

p 1 2 k i

i=1

Ainsi le rp nous donne les éléments qui ont répondu à toutes les questions et r t - rp donne l'ensemble de non-réponse partielle.

Toutefois, le manque de cette valeur n'implique pas automatiquement une non- réponse partielle pour l'observation. La carence d'information peut être due par exemple au fait que l'individu statistique n'est pas concerné par la question qui lui est posée (exemple : le niveau d'étude d'un enfant de moins de six ans dans un pays où l'age officiel d'aller à l'école est de sept ans). On parlera alors de "sans objet" au lieu de non-réponse.

La non-réponse partielle se présente dans l'un des cas suivants :

y' L'enquêté ne connaît pas la réponse à la question qui lui a été posée; y' Il ne souhaite pas répondre à la question pour une raison quelconque;

y' La suppression des valeurs aberrantes par l'enquêteur ou par l'analyste.

On retient donc que dans les deux cas de non-réponses les données peuvent exister et être hors de portée du statisticien. Pour des raisons de secret professionnel, par exemple, les firmes peuvent bloquer l'accès aux données.

3. Les mécanismes de génération des données manquantes

Par mécanisme de génération, on entend le phénomène susceptible d'entraîner la non- réponse des unités statistiques ou encore type de données manquantes. Dans la théorie statistique, on distingue en général trois mécanismes, selon Little et Rubin (1987), qui peuvent décrire le phénomène de données manquantes. Ces mécanismes sont: réponse manquant entièrement au hasard (MCAR, Missing Completely At Random), réponse manquant au hasard (MAR, Missing At Random) et réponse ne manquant pas au hasard (NMAR, Non Missing At Random).

Avant d'expliciter ces mécanismes nous jugeons nécessaire de faire une définition des concepts et des notations que nous utiliserons dans la définition des types de non-réponse.

Soit X = (x ij ) une matrice de données d'ordre (n× k) d'éléments xijn est le nombre
d'observations de la population cible U, k le nombre de variables et xij est la valeur de la
variable j pour l'observation i, avec i =1,..., n, et j =1,..., k. Soit A = (aij), une matrice dont

les éléments valent l'unité lorsque la valeur de la variable de l'observation est absente et zéro
sinon. Dit autrement et de façon formelle, c'est une matrice indicatrice de données

manquantes d'éléments aij telle que aij = 1 si xij manque, et aij = 0 sinon. La matrice A décrit donc la structure des données manquantes. Il est utile de traiter A comme une matrice stochastique. Soient , , et

X X

o no respectivement la partie observée de données X, la partie

non observée et les paramètres caractérisant le taux de réponse.

De façon non formelle, on dira qu'un processus de génération de données manquantes est dû au hasard (MAR) si la probabilité de réponse dépend de certaines variables auxiliaires, mais non de la variable d'intérêt. Autrement dit, si ( / , , )

P A X X

o no est la

distribution conditionnelle de A étant donné X et ne dépend que de variables qui se retrouvent dans la base, o

X . On dira ainsi que :

( / , , ) ( / , )

o no = P A X o no

P A X X ? X .

C'est donc un processus pour lequel la probabilité de répondre à une variable d'intérêt dépend uniquement des variables auxiliaires.

Pour le processus dont les données manquantes ne sont pas dues au hasard, on parlera de mécanisme de type NMAR. La probabilité de réponse dépend de la variable d'intérêt et éventuellement d'autres variables explicatives non observées.

Si ( / , , ) ( / , )

o no = P A Y X on dit que la distribution conditionnelle de A

no

P A X X

sachant X ne dépend pas d'un phénomène aléatoire mais plutôt de la nature de la variable d'intérêt. Par exemple pour des raisons de méfiance dans un pays en conflit la population n'aime pas répondre à la question concernant la religion et l'ethnie. Tout comme, l'entrepreneur ne souhaite pas toujours donner des informations sur son chiffre d'affaires.

Quant au mécanisme de type MCAR, il concerne des données manquantes qui sont complètement dues au hasard. Pour ce mécanisme la probabilité de répondre ne dépend ni de la variable d'intérêt ni des variables explicatives et elle est identique pour toutes les unités.

Formellement, lorsque l'on considère que P (A / X,) est la distribution conditionnelle de la matrice indicatrice A. Lorsqu'on connaît la matrice de données X, on dira qu'il s'agit de

MCAR siP(A/X,)=P(A/) ? X.

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Il faut répondre au mal par la rectitude, au bien par le bien."   Confucius