*======================================================* METHODES QUALITATIVES Séance d'exercices n°1 : Importation, préparation des données, rapports et mise en forme *=======================================================; /* ------------------------------------------------------------------------------------------------------------- ETAPE 0 : Dans votre environnement de travail, créez un dossier QUALI-TP et 3 sous-dossiers : - FORMAT - DATA - RESULTS Télécharger la base de données ESS2012 en format SAS (subset pour la Belgique) dans votre sous-dossier DATA Indications : Allez sur le site de l'ESS --> Data and documentation --> online analysis --> ESS6-2012, ed.2.1 - Appliquer un subset sur la variable country = "BE"; - Effectuer un download des data en format SAS Extraire le programme sas et le fichier txt du zip et les enregistrer dans votre sous-dossier DATA. -------------------------------------------------------------------------------------------------------------*/ /* ----------------------------------------------------------------------------------------------------- ETAPE 1 : Créer le data set ESS6e02_1_F1 Pour ce faire, ouvrez le programme ESS6e02_1_F1.sas et ajoutez les 3 chemins nécessaires : - Vers votre sous-dossier FORMAT pour assigner la librairie LIBRARY - Vers votre sous-dossier DATA pour assigner la librairie OUT - Vers votre sous-dossier DATA dans l'instruction INFILE (enfroit où vous avez normalement enregistré le fichier txt contenant les données). Faites tourner le programme complet ----------------------------------------------------------------------------------------------------- */ *NB : Vérifiez que le dataset a bien été créé - via le log : NOTE: The data set OUT.ESS6E02_1_F1 has 1869 observations and 626 variables. - via la fenêtre Explorateur --> Bibliothèques --> OUT --> double-clic sur le dataset ESS6E02_1_F1 --> VIEWTABLE !!!! Veillez à toujours fermer la VIEWTABLE avant d'exécuter la suite du programme !!!!; /* -------------------------------------------------------------------------------------------------------------------------------- ETAPE 2 : Sélection des variables - Créez un nouveau dataset permanent "ess2012VF" (à stocker dans la librairie OUT)à partir du dataset ESS6E02_1_F1 - Conservez uniquement la liste de variables suivantes au moyen d'un KEEP statement : - Variable d'intérêt : DMCNTOV - Explicatives socio-démographiques : REGION EISCED HINCFEL AGEA - Explicatives "thématiques" : POLINTR BLGETMG PLINSOC /* --------------------------------------------------------------------------------------------------------------------------------*/ *NB : Vérifiez que le dataset a bien été créé - via le log : NOTE: The data set OUT.ESS2012VF has 1869 observations and 8 variables. - via la fenêtre Explorateur --> Bibliothèques --> OUT --> double-clic sur le dataset Ess2012vf --> VIEWTABLE !!!! Veillez à toujours fermer la VIEWTABLE avant d'exécuter la suite du programme !!!!; /* ------------------------------------------------------------------------------------- ETAPE 3 : Examiner les caractéristiques des variables retenues via la PROC CONTENTS Que constate-t-on? ------------------------------------------------------------------------------------- */ /* ----------------------------------------------------------------------------------------------------------------- ETAPE 4 : Créez un format "age" pour discrétiser la variable AGEA de la manière suivante à l'aide de PROC FORMAT <20 ; [20-30[; [30-40[; [40; 50[; [50-60[; [60-70[; [70-80[; >=80 Stocker le format dans la librairie LIBRARY ----------------------------------------------------------------------------------------------------------------- */ /* --------------------------------------------------------------------------------------------------------------------------------------- ETAPE 5 : Appliquer la PROC FREQ sur l'ensemble des variables Assigner le format age à la variable agea pour observer les effectifs par catégorie plutôt que pour chaque valeur spécifique de la variable continue (NB : l'assignation est temporaire dans un bloc PROC) Utiliser l'option NLEVELS pour afficher également la liste du nombre de niveaux. Dirigez les sorties vers un fichier pdf qui sera stocké dans le sous-dossier RESULTS que vous avez créé dans votre espace de travail. Pour ce faire, utilisez l'instruction ODS, appliquez le style "Journal", supprimez l'affichage de la date et donnez le titre suivant à votre rapport : 'Distribution des variables initiales'. --------------------------------------------------------------------------------------------------------------------------------------- */ /* --------------------------------------------------------------------------------------------------------------- ETAPE 6 : Créer de nouvelles variables pour recoder les variables initiales via des IF THEN ELSE statements. En tenant compte de la répartition des effectifs, regroupez les catégories de manière pertinente pour définir les nouvelles variables suivantes : 1. La variable d'intérêt doit être recatégorisé en 2 niveaux (EVALDEMO2) en 4 niveaux (EVALDEMO4) 2. POLINTR et HINCFEL doivent être recatégorisées en 2 niveaux au départ de 4 (POLINTR2 HINCFEL2) 3. EISCED doit être recodée en 3 niveaux (EDUC3 : "Low", "Middle", "High") 4. PLINSOC doit être recodée en 3 niveaux (PLINSOC3 : "Top", "Middle", "Bottom") 5. REGION doit être recodée en 3 niveaux (REG3 : "Bxl", "Fl", "Wal") Le nouveau dataset permanent doit s'appeler "datarecod". --------------------------------------------------------------------------------------------------------------- */ /* --------------------------------------------------------------------------------------------------------------- ETAPE 7 : Examiner les caractéristiques des nouvelles variables créées via la PROC CONTENTS Que constate-t-on? ---------------------------------------------------------------------------------------------------------------*/ /* --------------------------------------------------------------------------------------------------------------- ETAPE 8 : Attribuer des labels aux nouvelles variables au moyen du LABEL statement au sein d'un data step Le nouveau dataset permanent doit s'appeler "datarecod" Vérifier ensuite que les labels ont bien été stockés dans les métadonnées via la PROC CONTENTS ---------------------------------------------------------------------------------------------------------------*/ /* --------------------------------------------------------------------------------------------------------------- ETAPE 9 : Réaliser un second rapport en format pdf stocké dans le sous-dossier RESULTS. Cette fois, présentez les tables de contingence pour chaque croisement 2 à 2 entre les variables explicatives (recodées ou formatée pour AGEA) et la variable réponse (en 2 niveaux) : - variable explicative en ligne / variable réponse en colonne - conserver uniquement les fréquences et les pourcentages en lignes Donnez pour titre général au rapport "Evaluation de la démocratie en Belgique" Diviser ensuite la présentation des 7 tableaux en 2 parties, la 1ère ayant pour sous-titre "Variables explicatives socio-démographiques" et la seconde "Variables explicatives thématiques" Quelles sont les premières hypothèses qui se dégagent? ---------------------------------------------------------------------------------------------------------------*/ /* -------------------------------------------------------------------------------------------------------------------- ETAPE 10 : Créer un nouveau dataset temporaire reprenant les fréquences absolues de la variable réponse (4 niveaux) en fonction du niveau d'éducation (3 niveaux). Imprimez-le dans la fenêtre de sortie ------------------------------------------------------------------------------------------------------------------- */