Factorial Methods of Representation in R : PCA, CA, MCA, CAH
In this project, I performed multiple factorial methods of representation on a number of datasets, using multiple R libraries & functions.
Stochastic Modeling and Statistics
Skills : Python, R, SQL, SAS, SPSS and Tableau.
@Dahami
In this project, I performed multiple factorial methods of representation on a number of datasets, using multiple R libraries & functions.
La librairie dplyr en R est un ensemble d'outils conçus pour simplifier et accélérer la manipulation de données tabulaires.
La librairie ggplot2 est une puissante librairie de visualisation de données en R, développée par Hadley Wickham. Elle offre une approche basée sur la "grammaire des graphiques", ce qui permet aux utilisateurs de créer des graphiques complexes et esthétiquement plaisants à partir de données tabulaires.
On détaille quelques concepts statistiques fondamentaux (tests d'hypothèses inclus), illustrés avec les données des études d'imagerie cérébrale infantile, IBIS (Infant Brain Imaging Study).
Dans ce notebook on couvre : La régression linéaire multiple, ANOVA, ANCOVA, la régression logistique et les modèles mixtes.
Remarque : Ce notebook est en cours de développement et n'est pas encore terminé.
Dans ce notebook, on aborde les notions suivantes : tableaux, tableaux de contingence. Ensuite, on évalue l'association entre deux variables catégoriques en effectuant un test du khi-deux d'indépendance, ainsi qu'un test de Fischer.
We explored the utility of various loop functions and the split function commonly used in R programming, showcasing their respective strengths and use cases. Through practical examples and demonstrations, we illustrate how these functions can efficiently manipulate data structures and perform operations across different dimensions.