Analyse des ventes
Dans une entreprise commerciale, il est souvent pertinent de suivre la vente d’une catégorie particulière. Ici nous allons nous intéresser à la vente des boissons à 20%
Le modèle de données
Le fichier csv qui sert de support est comme suit : jour,date,total.TTC.10,total.TTC.20
Les dates sont au format JJ/MM/AAAA Exemple de données :
1 jour,date,total TTC 10 %,total TTC 20 %
2 samedi,01/04/17,"458,5","7,6"
3 dimanche,02/04/17,"323,35",
4 lundi,03/04/17,,
5 mardi,04/04/17,176,
6 mercredi,05/04/17,"289,6","6,8"
7 jeudi,06/04/17,"329,5",
Première étape : charger le fichier csv
|
|
On vérifie la qualité du chargement :
-
Les entêtes
1 2> names(Database) [1] "jour" "date" "total.TTC.10.." "total.TTC.20.." -
Le nombre de colonnes et le nombre de lignes :
1 2> dim(Database) [1] 365 4
On vérifie les premières lignes
|
|
Sélectionner que les mardis :
|
|
Passer la colonne date au format YYYY-MM-DD
- Pour changer le format de la date on a besoin du package lubridate
1 2 3install.packages('lubridate') library(lubridate) dmy(Database$date)
Regrouper les lignes pour n’avoir qu’un cumul par mardi
- On a besoin de 2 paquets supplémentaires
1 2 3 4install.packages("magrittr") # pour avoir accés à la fonction %>% library(magrittr) install.packages("dplyr") # pour avoir la fonction group_by library(dplyr)