Une nouvelle ère a commencé : Enterprise Big Data !

Une nouvelle ère a commencé : Enterprise Big Data !

Les bases de données relationnelles SQL ont monopolisé pendant ces 15 dernières années le marché de stockage et de manipulation d’informations dans les entreprises. Une nouvelle ère semble entamée avec le phénomène Big Data.

Est-ce la fin de vie des SGBD et la prochaine révolution informatique annoncée ?

Big Data est une discipline apparue avec l’émergence de données trop volumineuses pour être manipulées à l’aide des techniques traditionnelles. Les premiers acteurs furent des entreprises de moteur de recherche web qui étaient confrontés à des problématiques de mauvaise structuration de grandes quantités de données donc d’intégration de très grandes agrégations de données distribuées. L’une des premières sociétés à avoir réagi pour adresser cette problématique de structure de données et de performances fut Google qui a développé MapReduce pour soutenir l’informatique distribuée sur de larges quantités de données sur des clusters de machines (ordinateurs).

Inspiré par le succès et la puissance de MapReduce ainsi que par Google File System (GFS), Doug CUTTING créa Hadoop (nom de l’éléphant en peluche de son fils) alors qu’il était salarié de Yahoo. Aujourd’hui, Hadoop est l’une des solutions les plus utilisées permettant d’adresser la problématique Big Data  : Yahoo, principal contributeur au projet, utilise Hadoop à grande échelle sur l’ensemble de son système comptant 38 000 nœuds.

Les caractéristiques Big Data

Très grandes agrégations de données distribuées peu structurées, souvent incomplètes et difficiles d’accès :

  • Petabytes / Exabytes de données,
  • Millions / milliards de personnes,
  • Milliards ou billions de dossiers,
  • Peu structurées avec des données souvent distribuées,
  • Schémas plats avec peu de relations complexes,
  • Impliquant souvent des événements horodatés,
  • Constituées souvent de données incomplètes,
  • Impliquent souvent des connexions entre les éléments de données qui doivent être déduites de manière probabiliste.

Les applications Big Data peuvent être :

  • Transactionnelles (par exemple, Facebook, PhotoBox),
  • Analytiques (par exemple, ClickFox, Applications Merced).

Aujourd’hui, les solutions Big Data sont utilisées aussi bien dans des multinationales que dans des PME.
Quelques solutions du marché permettant d’adresser la problématique Big data :

  • Commerciaux : Oracle avec Exadata, Software AG avec Terracotta*, IBM/Netezza, Teradata/Teradata, EMC/Greenplum …
  • Open source : Hadoop, CouchDB*, Cassendra, HBase, MongoDB, Noe4J …

Matinée Big Data / Netezza le 27 mars 2012

IBM et Soft Computing ont le plaisir de vous inviter le 27 mars 2012 à une matinée dédiée au secteur de la finance, autour de l’évolution et l’apport des nouvelles technologies face à l’explosion des données et son impact au niveau des stratégies IT et métiers. Cet événement aura lieu à l’IBM Forum Paris à Bois Colombes.

Pour en savoir plus rendez-vous sur la page Matinée Big Data / Netezza ou sur notre offre Big Data.

* Prochainement, nous allons publier un article sur la mise en œuvre d’une couche de manipulation de données à l’aide de Terracotta et de CouchDB.

Ecrire un commentaire

* Name, Email, Comment are Required