Créa-blog

Ressources pour développeur web

Tutoriel : Les premiers pas avec R et RStudio

Accueil HTML5 Tutoriel : Les premiers pas avec R et RStudio

Dans ce chapitre, vous allez découvrir les concepts de base du langage R et RStudio, notamment sa syntaxe, les types de données, les opérations arithmétiques et logiques, ainsi que la manière de travailler avec des variables.

La syntaxe de base

R est un langage interprété, ce qui signifie que chaque ligne de code est exécutée directement dans une console ou un script. Voici quelques éléments essentiels de la syntaxe de base à connaître pour bien démarrer :

Les commentaires

Les commentaires sont des lignes de texte dans votre code qui ne sont pas exécutées. Ils sont utiles pour documenter le code. En R, les commentaires commencent par le symbole # :

# Ceci est un commentaire

Commandes et expressions

Chaque commande ou expression est évaluée lorsqu’elle est exécutée. Par exemple, pour effectuer une addition, vous pouvez entrer la commande suivante dans la console :

1 + 1

Les résultats des expressions sont immédiatement affichés dans la console.

Fonctions

R est un langage riche en fonctions. Une fonction est appelée en utilisant son nom, suivi de parenthèses contenant les arguments d’entrée :

print("Bonjour, R!")  # Affiche le texte dans la console

Séparateurs

En R, il n’est pas nécessaire d’ajouter un point-virgule à la fin de chaque ligne de code, bien qu’il soit toléré. Les lignes se terminent automatiquement par un retour à la ligne.

Les types de données en R

R offre plusieurs types de données pour représenter différentes sortes d’informations. Voici les types de base les plus couramment utilisés :

Numériques

Les valeurs numériques sont des nombres avec ou sans virgule. R supporte aussi bien les entiers que les nombres décimaux :

nombre_entier <- 42
nombre_decimal <- 3.14

Caractères (ou chaînes de caractères)

Les valeurs de type caractère sont des séquences de texte entourées de guillemets doubles " ou simples ' :

texte <- "Bonjour"

Booléens (logiques)

Les valeurs booléennes ne peuvent prendre que deux valeurs : TRUE ou FALSE (ou encore leurs abréviations T et F) :

valeur_vrai <- TRUE
valeur_faux <- FALSE

Facteurs

Les facteurs sont utilisés pour représenter des données catégorielles avec un nombre limité de niveaux ou de catégories :

jours <- factor(c("Lundi", "Mardi", "Mercredi"))

NA (Not Available)

NA représente des valeurs manquantes ou non disponibles en R. Cela peut être utile lors du traitement de données incomplètes :

valeur_inconnue <- NA

Les opérations arithmétiques et logiques

R permet d'effectuer des opérations arithmétiques et logiques sur des données numériques et booléennes.

Opérations arithmétiques

Voici les principales opérations arithmétiques en R :

  • Addition : +
  • Soustraction : -
  • Multiplication : *
  • Division : /
  • Puissance : ^
  • Modulo (reste de la division) : %%

Exemples :

addition <- 3 + 2       # 5
multiplication <- 4 * 5 # 20
puissance <- 2^3        # 8
modulo <- 7 %% 3        # 1

Opérations logiques

Les opérations logiques permettent de comparer des valeurs et renvoient des résultats booléens (TRUE ou FALSE). Voici les opérateurs logiques les plus courants :

  • Égalité : ==
  • Différence : !=
  • Supérieur à : >
  • Inférieur à : <
  • Supérieur ou égal à : >=
  • Inférieur ou égal à : <=
  • ET logique : &
  • OU logique : |
  • Négation : !

Exemples :

egalite <- 5 == 5      # TRUE
superieur <- 3 > 7     # FALSE
et_logique <- TRUE & FALSE  # FALSE
ou_logique <- TRUE | FALSE  # TRUE

Variables et assignation

Les variables permettent de stocker des valeurs qui peuvent être réutilisées ultérieurement dans un script ou un programme. En R, une variable est définie à l'aide de l'opérateur d'assignation <- ou =.

Assignation de valeurs à des variables

Pour assigner une valeur à une variable, on utilise l'opérateur <- :

x <- 10  # Assigne la valeur 10 à la variable x

L'opérateur = peut également être utilisé pour l'assignation, mais <- est la méthode préférée dans la communauté R :

x = 10  # Également valide, mais moins courant

Nommer les variables

Les noms de variables doivent respecter certaines règles :

  • Ils doivent commencer par une lettre.
  • Ils peuvent contenir des lettres, des chiffres et des underscores _.
  • Ils ne peuvent pas contenir d'espaces ou de caractères spéciaux (comme $, #).

Exemples de noms de variables valides :

ma_variable <- 5
age_utilisateur <- 30

Utilisation des variables

Une fois une variable assignée, vous pouvez l'utiliser dans des calculs ou des opérations :

x <- 8
y <- 3
resultat <- x + y  # 11

Mise à jour des variables

Vous pouvez réassigner une nouvelle valeur à une variable existante :

x <- 10
x <- x + 5  # Maintenant x vaut 15

Affichage des variables

Pour afficher la valeur d'une variable dans la console, il suffit de taper son nom, ou d'utiliser la fonction print() :

x <- 42
x        # Affiche 42
print(x) # Affiche 42

Ce chapitre vous a introduit aux bases de la syntaxe du langage R, aux types de données, aux opérations et à l'utilisation des variables. Dans les chapitres suivants, vous apprendrez à manipuler des structures de données plus complexes comme les vecteurs, les matrices et les data frames.

Chapitre 3 : Structures de données en R →