Skip to content

Walidoux/data-analysis

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

87 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Note

Ce projet tente de traiter, nettoyer, structurer et analyser statistiquement une base de données issue d'un questionnaire rempli par des étudiants en troisiÚme année pré-master de l'ENCGD.

Un rapport final de ce projet est consultable via ce lien. Vous trouverez tout les détails et explications à la réalisation de ce projet.

Spécificités

Méthodes utilisées

  • RĂ©gression linĂ©aire : UtilisĂ© pour prĂ©dire et substituer les valeurs inconnues/invalides par des approximaions Ă©quivalentes
  • Tests statistiques : Test de Khi-Deux, test t pour Ă©chantillon unique/indĂ©pendant, ANOVA Ă  1 facteur
  • ReprĂ©sentations graphiques : Histogrammes, diagrammes, choroplĂšthe, boxplots, matrice de corrĂ©lation.

Détails

  • DĂ©but officiel du projet : 05 Mars 2025
  • Temps moyennement investi : +200h

Usage

Toutes contributions sont la bienvenues, vous devez en premier lieu :

Installation

Installer Python 3.13.x sur votre machine, si vous ĂȘtes sur Windows ou MacOS, redirigez-vous sur le site officiel, tĂ©lĂ©chargez le directement et exĂ©cuter le fichier .exe si Windows, sinon .pkg pour MacOS. Si vous ĂȘtes sous Linux, vous pouvez suivre la mĂȘme Ă©tape mais il est prĂ©fĂ©rable d'utiliser le gestionnaire de packets (packet manager) selon votre distribution :

# Debian/Ubuntu
sudo apt update
sudo apt install python3 python3-pip

# Fedora
sudo dnf install python3 python3-pip

# Arch Linux
sudo pacman -S python python-pip

Post-installation

Ce projet utilise des librairies externes que vous devez télécharger en exécutant la ligne de commande suivante selon votre systÚme d'exploitation :

# Windows
pip install -r requirements.txt

# Linux
python3 -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt

Exécution

Par défaut, ce programme génére trois documentations, DOCS.md avec une vue d'ensemble des variables de la base de donnée ainsi que des informations complémentaires. Il génére pour chaque variable des tableaux représentatifs des valeurs lors du traitement des données sur DATA.md. Il génére aussi pour chaque variable des statistiques descriptives sur STATS

Ce programme génére aussi des images pour visualiser les données traitées et référencées sur les documentations.

Voici la ligne de commande génératrice de tout ceci :

py.exe .\analysis.py # Windows
python3 ./analysis.py # Linux/MacOS

Arguments (paramĂštres)

  • --write="NONE" : Ajouter cet argument permet de spĂ©cifier sur quel type de fichier Ă©crire la documentation gĂ©nĂ©rĂ©e Ă  l'exĂ©cution du programme qui peut prend les valeurs correpondant aux noms des fichiers sur le dossier markdown ici. NONE veut dire aucune Ă©criture. Vous pouvez spĂ©cifier plusieurs types de fichiers en sĂ©parant par une virgule.

  • --skip-geolocation : Ignorer l'Ă©tape de gĂ©nĂ©naration de la carte choroplĂšthe. Le service externe de gĂ©olocalisation des villes prend beaucoup de temps Ă  s'exĂ©cuter.

  • --skip-visualization : Ignorer l'Ă©tape de gĂ©nĂ©ration des reprĂ©sentations graphiques.

About

📈 Projet universitaire d'analyse des donnĂ©es Ă  l'ENCG

Topics

Resources

Stars

Watchers

Forks

Packages

No packages published

Languages