Le Web est aussi une source importante de données numériques
Peut on cependant utiliser les données "n'importe comment ?"
Pour permettre une meilleure utilisation des données un mouvement appelé "Open Data" a fait son apparition ces dernières années
Le terme "Open Data" fait référence à des données "numériques accessibles en ligne ". Il y a des lois qui encadrent l'utilisation de ces données. Elles ne doivent être ni personnelles, ni propriétaires et ni sensibles.
Aller voir les sites suivants , puis répondre aux questions de l'exercice 1
Nous allons nous intéresser aux données publiques fournies par Météo-France concernant les observations en mer faites par des balises Voir ici
Dans un premier temps nous allons faire connaissance avec le format de fichier .csv pour comma separated values.
Pour simplifier ce sont des données séparées par des séparateurs comme des point-virgules par exemple
Beaucoup d'administrations (par exemple celle du lycée) échangent leurs informations sous cette forme
On peut rechercher des informations intéressantes sur des fichiers .csv "volumineux" avec des algorithmes
Sur le site du ministère de l'intérieur on peut télécharger plusieurs fichiers .csv en rapport avec les accidents de la route ayant lieu en France en 2018
La structure de base est la liste ou tableau
Ci-dessous sont affichées les 5 premières listes du tableau à 2 dimensions créé à partir du fichier usagers-2018.csv
Allez sur le site pythontutor et cliquez sur "visualize your code ..."
Ensuite recopiez le code suivant et visualisez son exécution
liste = ['201800000001', '1', '1', '3', '1', '0', '11', '0', '0', '0', '1928', 'B01']
for element in liste:
print(element)
La boucle for nous permet de parcourir la liste du premier élément d'indice 0 au dernier d'indice 11, et on affiche chaque élément
Il y a 12 éléments dans chaque liste numérotés de 0 à 11
liste = ['201800000001', '1', '1', '3', '1', '0', '11', '0', '0', '0', '1928', 'B01']
for i in range(len(liste)):
print(liste[i])
La fonction len() comme length donne la longueur de la liste ou le nombre d'éléments de la liste
liste[i] donne la valeur de la liste à la position repérée par le nombre i
Une table est une liste de listes
Allez sur le site pythontutor et cliquez sur "visualize your code ..."
Ensuite recopiez le code suivant et visualisez son exécution
table = [['201800000001', '1', '1', '3', '1', '0', '11', '0', '0', '0', '1928', 'B01'],
['201800000001', '1', '1', '1', '1', '5', '11', '0', '0', '0', '1960', 'A01'],
['201800000002', '1', '1', '1', '1', '0', '11', '0', '0', '0', '1947', 'A01']]
for element in table:
print(element)
Ce code nous permet d'afficher chaque ligne ou liste de la table
Si on veut par exemple afficher uniquement les dates de naissance situées dans le champ numérotée par 10
table = [['201800000001', '1', '1', '3', '1', '0', '11', '0', '0', '0', '1928', 'B01'],
['201800000001', '1', '1', '1', '1', '5', '11', '0', '0', '0', '1960', 'A01'],
['201800000002', '1', '1', '1', '1', '0', '11', '0', '0', '0', '1947', 'A01']]
for i in range(len(table)):
print(table[i][10])