Une métadonnée est une "sous-donnée" d'une donnée principale.
Les métadonnées permettent de décrire plus précisément les données. Ce sont des données sur les données.
En utilisant les métadonnées on peut lancer une requête qui permet un tri des données. Par exemple trouver dans la base des données de mes photos personnelles toutes celles qui ont été prises un mois de Juillet ...
Les métadonnées sont souvent accessibles par manipulation et visualisation des propriétés d'un fichier.
On peut par exemple retrouver des informations précises sur une photo en accédant aux métadonnées listées dans les propriétés, comme le montre l'exemple ci-dessous:
télécharge la photo ci-dessous en cliquant droit, explore ses propriétés et indique ci-contre le code postal de la ville dans laquelle cette photo a été prise :
Une capture d'écran est à sauvegarder!!!
Rappelons que les données sont structurées lorsqu'elles sont organisées en tableaux.
Rappelons aussi que le format d'un fichier est indiqué sous la forme d'une extension à la suite du nom du fichier (exemple : chenille.jpg).
Un format de données est dit ouvert (ou libre) si son mode d'organisation a été rendu public par son auteur et qu'aucune entrave légale ne s'oppose à sa libre utilisation (droit d'auteur, copyright, brevet).
Les tableaux de données sont généralement transformés en des formats facilement utilisables par les programmes (et donc par tous les logiciels)
Voici différents types de formats à reconnaître comme étant des tableaux de données :
→ Le format .CSV (Comma Separated Values) est un format de texte très répandu où les valeurs des données sont listées et délimitées par un séparateur qui est ici une virgule:
→ Le format .XML (Extensible Markup Language) qui est un format utilisé pour l'échange automatisé entre systèmes d'informations....
→ le format .JSON (JavaScript Objet Notation) qui est un format de données textuelles dérivé du langage JavaScript.
ACTIVITE: CREATION D'UN FICHIER AU FORMAT CSV
Ouvrir le logiciel tableur Excel
Créer la table de données ci-dessous en respectant les intitulés des descripteurs:
Afin que le format de la date de naissance soit sous la forme jj/mm/aaaa, sélectionner les cellules, clic droit puis "Formater les cellules".
Ajouter des métadonnées à votre fichier : Sélectionner Fichier > Propriétés).
Enregistrer le fichier au format .xls pour excel dans le répertoire Thème1.
Enregistrer le fichier au format .CSV (Fichier > Enregistrer sous) dans le répertoire Thème1.
Ainsi vous avez 2 versions de votre fichier dans votre répertoire. Observez les extensions.
Fermer votre fichier.
Ouvrir votre fichier avec Notepad++ (clic droit sur le fichier > Edit with Notepad++)
Ajouter un objet de votre choix ayant les mêmes descripteurs.
Enregistrer et fermer votre fichier CSV.
Est-il possible d'ouvrir un fichier CSV avec le logiciel Excel et l'exploiter simplement ? Avec le tableur Libre Office?
ACTIVITE: FAIRE UN TRI DANS UNE TABLE DE DONNEES
Sur https://www.data.gouv.fr, télécharger le fichier de données ouvertes "ElecDom - Données de consommation annuelle" édité par l'ADEME au format .csv
(Ici il est demandé d'explorer en autonomie les possibilités de tri du tableur...)
L'éditer, trier et répondre à la question :
Une capture d'écran est à sauvegarder!!!
Les données structurées sont le pllus souvent téléchargeables dans un format permettant un échange facile. Les 3 formats à connaître sont :
Ces formats sont lisibles par les éditeurs de texte (Notepad++, Geany, Bloc-Notes ...)
Un format de données issues d'un tableur (ods, xls, xlsx...) ne sont elles pas lisibles par les éditeurs de texte
Le format CSV (Comma Separated Values, données avec des séparateurs) est à privilégier ; c'est le plus universel et le plus simple.
Tu dois obtenir le score maximal, recommence si nécessaire...
Sur le site data.gouv.fr, télécharge le fichiers des prénoms de 1900 à 2019 (France hors Mayotte) au format .csv
L'enregistrer dans le dossier Thème_1 et l'ouvrir avec le logiciel Notepad++ qui permet de gérer tout type de formats
Combien de lignes ce fichier contient-il? Inspecte la première ligne : que comporte cette ligne ?
Recherche le nombre de fois où ton prénom a été donné l'année de ta naissance : INSCRIS -LE AU TABLEAU
Avec cet éditeur, est - il facile de déterminer le nombre total de fois où ton prénom a été donné depuis 1900?
Ouvre le fichier avec excel
A l'aide de la formule SOMME (attention! une formule débute toujours par = ), détermine le nombre total de fois où ton prénom a été donné depuis 1900 : INSCRIS CE NOMBRE AU TABLEAU
Un filtrage s’effectue à partir de critères qui permettent de n’afficher que les informations y correspondant, en masquant les autres.
Sélectionne toutes les colonnes du document et active le filtrage (DONNEES - FILTRER)
Des « triangles » apparaissent dans la première ligne qui fera office de choix de descripteur.
En cliquant sur ces triangles on peut maintenant choisir un filtrage particulier :
En cliquant sur ces triangles on peut maintenant choisir un filtrage particulier :
Filtrer les prénoms pour les filles seulement en 1970 et Trier les nombres du plus grand au plus petit : quel est le prénom féminin le plus donné cette année-là?
A l'aide du bon filtre et du bon tri, répondre aux questions :
Quel est le prénom masculin le plus donnée en 1980 ?
Quel est le prénom féminin le plus donnée en 1990 ?
Ouvrir le fichier mars-2014-complete.csv présent dans le dossier Echanges
Grâce à un filtre/tri des données, répondre à la question : les deux voitures à moteur essence (code ES) commercialisées en France émettant le moins de CO2 dans l'atmosphère sont de quelle marque ?