Terminologie et Classification des Bases de données

Terminologie

Modèle de donnée

Le schéma ou modèle de données, est la description de l’organisation des données. Il se trouve à l’intérieur de la base de données, et renseigne sur les caractéristiques de chaque type de donnée et les relations entre les différentes données qui se trouvent dans la base de données. Il existe plusieurs types de modèles de données (relationnel, entité-association, objet, hiérarchique et réseau).

Modèle de données logique et physique

Le modèle de données logique – ou conceptuel – est la description des données telles qu’elles sont dans la pratique, tandis que le modèle de données physique est un modèle dérivé du modèle logique qui décrit comment les données seront techniquement stockées dans la base de données.

 

Entité

Une entité est un objet, un sujet, une notion en rapport avec le domaine d’activité pour lequel la base de données est utilisée, et concernant lequel des données sont enregistrées (exemple: des personnes, des produits, des commandes, des réservations, …).

 

Attribut

Un attribut est une caractéristique d’une entité susceptible d’être enregistrée dans la base de données. Par exemple une personne (entité), son nom et son adresse (des attributs). Les attributs sont également appelés des champs ou des colonnes4. Dans le schéma les entités sont décrites comme un lot d’attributs en rapport avec un sujet.

 

Enregistrement

Un enregistrement est une donnée composite qui comporte plusieurs champs dans chacun duquel est enregistrée une donnée. Cette notion a été introduite par le stockage dans des fichiers dans les années 1960.

 

Association

Les associations désignent les liens qui existent entre différentes entités, par exemple entre un vendeur, un client et un magasin.

Cardinalité

La cardinalité d’une association – d’un lien entre deux entités A et B – est le nombre de A pour lesquelles il existe un B et inversement. Celle-ci peut être un-a-un, un-a-plusieurs ou plusieurs-à-plusieurs. Par exemple un compte bancaire appartient à un seul client, et un client peut avoir plusieurs comptes bancaires (cardinalité un-a-plusieurs).

 

Modèle de données relationnel

C’est le type de modèle de données le plus couramment utilisé pour la réalisation d’une base de données. Selon ce type de modèle, la base de données est composée d’un ensemble de tables (les relations) dans lesquelles sont placées les données ainsi que les liens. Chaque ligne d’une table est un enregistrement. Ces modèles sont simples à mettre en œuvre, fondés sur les mathématiques (la théorie des ensembles), ils sont très populaires et fortement normalisés.

 

Base de données relationnelle

Base de données organisée selon un modèle de données de type relationnel, à l’aide d’un SGBD permettant ce type de modèle.

Modèle de données entité-association

Ce type de modèle est le plus couramment utilisé pour la conception de modèles de données logiques6. Selon ce type de modèle, Une base de données est un lot d’entités et d’associations. Une entité est un sujet concret, un objet, une idée, pour laquelle il existe des informations. Un attribut est un renseignement concernant ce sujet – exemple le nom d’une personne. À chaque attribut corresponds un domaine: un ensemble de valeurs possibles. Une association désigne un lien entre deux entités – par exemple un élève et une école.

 

Modèle de données objet

Ce type de modèle est fondé sur la notion d’objet de la programmation orientée objet. Selon ce type de modèle une base de données est un lot d´objets de différentes classes. Chaque objet possède des propriétés – des caractéristiques propres, et des méthodes qui sont des opérations en rapport avec l’objet. Une classe est une catégorie d’objets et reflète typiquement un sujet concret.

Modèle de données hiérarchique

Ce type de modèle de données a été créé dans les années 1960; c’est le plus ancien modèle de données. Selon ce type de modèle, les informations sont groupées dans des enregistrements, chaque enregistrement comporte des champs. Les enregistrements sont reliés entre eux de manière hiérarchique: à chaque enregistrement correspond un enregistrement parent.

 

 

Modèle de données réseau

Ce type de modèle de données est semblable au modèle hiérarchique. Les informations sont groupées dans des enregistrements, chaque enregistrement possède des champs. Les enregistrements sont reliés entre eux par des pointeurs. Contrairement aux modèles hiérarchiques, l’organisation des liens n’est pas obligatoirement hiérarchique, ce qui rend ces modèles plus polyvalents.

Nul

Dans les modèles de données relationnels, un attribut peut avoir une valeur nulle, indiquant que la donnée est absente, non disponible ou inapplicable.

Clé primaire

Dans les modèles de données relationnels, la clé primaire est un attribut dont le contenu est différent pour chaque enregistrement de la table, ce qui permet de retrouver un et un seul enregistrement.

Clé étrangère

Dans les modèles de données relationnels, une clé étrangère est un attribut qui contient une référence à une donnée connexe – dans les faits la valeur de la clé primaire de la donnée connexe.

Intégrité référentielle

Dans les modèles de données relationnels il y a situation d´intégrité référentielle lorsque toutes les données référencées par les clés étrangères sont présentes dans la base de données.

 

Classification

L’usage qui est fait des données diffère d’une base de données à l’autre. Les bases de données peuvent être classifiées en fonction du nombre d’usagers, du type de contenu, notamment s’il est faiblement ou fortement structuré, ainsi que selon l’usage qui est fait de la base de données, notamment l’utilisation opérationnelle ou à des fin d´analyse:

Les bases de données peuvent être classifiées en fonction du nombre d’usagers – un seul, un petit groupe, voire une entreprise. Une base de données de bureau est installée sur un ordinateur personnel au service d’un seul usager. Tandis qu’une base de données d´entreprise est installée sur un ordinateur puissant au service de centaines d’utilisateurs.

Une base de données centralisée est installée dans un emplacement unique, tandis qu’une base de données distribuée est répartie entre plusieurs emplacements.

La manière la plus populaire de classer les bases de données est selon l’usage qui en est fait, et l’aspect temporel du contenu:

  • Les bases de données dites opérationnelles ou OLTP de l’anglais online transaction processing) sont destinées à assister des usagers à tenir l’état d’activités quotidiennes. Elles permettent en particulier de stocker sur le champ les informations relatives à chaque opération effectuée dans le cadre de l’activité: achats, ventes, réservations, payements. Dans de telles applications l’accent est mis sur la vitesse de réponse et la capacité de traiter plusieurs opérations simultanément.
  • Les bases de données d’analyse dites aussi OLAP (de l’anglais online analytical processing), sont composées d’informations historiques telles que des mesures sur lesquelles sont effectuées des opérations massives en vue d’obtenir des statistiques et des prévisions. Les bases de données sont souvent des entrepôts de données (anglais datawarehouse): des bases de données utilisées pour collecter des énormes quantités de données historiques de manière quotidienne depuis une base de données opérationnelle. Le contenu de la base de données est utilisé pour effectuer des analyses d’évolution temporelle et des statistiques telles que celles utilisées en management. Dans de telles applications l’accent est mis sur la capacité d’effectuer des traitements très complexes et le logiciel moteur (le SGBD) est essentiellement un moteur d’analyse.

Les bases de données sont également parfois classifiées selon les caractéristiques du contenu: Des données non structurées sont stockées à l’état brut, et nécessitent d’être retraitées en vue de produire de l’information – de la connaissance. Des données structurées sont formatées en fonction de l’usage qui va en être fait, en vue de faciliter le stockage, l’utilisation et la production d’information finie. Par exemple un ensemble de factures peuvent être stockées brut sous forme d’images bitmap, ce qui ne permettra pas de calculer des totaux et des moyennes, ou alors chaque facture peut être décomposée sous forme d’un tableau de chiffres sur lesquels il est alors possible d’effectuer des calculs.

Aller à la barre d’outils