Big Data et Cisco en savoir plus

Continuons sur le Big Data suite à mon précédent post.   Après s’être intéréssé aux nouvelles sources d’informations quelques mots sur ce que fait Cisco autour du Big Data avec Hadoop et NoSQL :

  1. Hadoop fonctionne sur les commutateurs Nexus et UCS
  2. Le mois dernier nous avons publié un « solution brief » avec Oracle sur l’intérêt de Oracle NoSQL sur UCS
  3. Une architecture de référence  pour GreenPlum avec Vblock 700 intégrant UCS de Cisco , VMAX d’EMC et vSphere de VMware.
  4. Ce mois ci nous avons annoncé la certification d’une architecture UCS avec un cluster Nexus pour Cloudera et leur distribution d’Hadoop.
  5. Cette Semaine Jacob Rapp de Cisco interviendra à Hadoop World sur « Hadoop Network and Computing Architecture Considerations »
  6. Enfin un white paper intitulé « Big Data in Enterprise : Network Design » vient de paraitre

Vous pouvez également aller sur le site cisco.com/go/bigdata ou d’autres documents sur le bigdata viendront compléter le panorama en fonction des validations et des annonces.

Quelles sources d’informations pour le big data

Une des premières étapes du “Big Data” est de considérer les sources d’informations qui vont alimenter ce “Big Data”.

Il y plusieurs phénomènes à prendre en considération sans être exhaustif:

1- La part des données numériques dans les informations crées

2-La croissances des medias dits riches (audio, video) .  Il s’agit de pouvoir les analyser afin de pouvoir faire de la reconnaissance de formes et transcrire les propos. On disposera alors de contenus exploitables pouvant alimenter des big data.

3-L’importance des réseaux sociaux:  pouvoir analyser ce qui se passe sur Twitter ou Facebook, détécter des tendances ou des comportements ou encore surveiller la qualité de la marque de l’entreprise.

4-Les objets internets: en 2020 on estime qu’il y aura environ 50 milliards d’objets connectés à internet dont certains pourront communiquer entre eux (Machine To Machine). Auntant d’objets générateurs d’événements ou de données. Voir l’exemple d’Eco factor

Connecter ces sources d’informations avec un réseau “pervasif”, permettre la recherche sur les réseaux sociaux avec des produits tels que Socialminer ou Pulse analytic ou bien encore faciliter l’exploitation du contenu des videos avec des architectures Medianet sont autant d’exemples  ou Cisco intervient .

Solution Cisco pour le big data avec le NoSQL d’oracle

A l’occasion du récent OpenWorld d’Oracle 2011 , Cisco a annoncé une solution reposant sur UCS et Nexus pour les bases de données Oracle NoSQL. Cette solution permet aux organisations de déployer des solutions « Big Data » plus rapidement grâce à des configurations UCS qui évoluent facilement et qui s’adaptent aisément à des approches de type « on demand ».

Cisco UCS est désormais certifié pour « Oracle NoSQL Database ». Cette solution est intégralement testée, certifiée et conçue pour répondre aux besoins de scalabilité .

Oracle NoSQL Database est un nouveau produit Oracle –une plateforme distribuée, à haute disponibilité pour des applications, ou des services web, manipulant de gros volumes de données et sensibles à la latence. Ce produit est basé sur  « Oracle Berkeley DB Java Edition High Availability storage engine ».  Il peut fournir un stockage distribué rapide et  fiable aux applications qui doivent s’intégrer aux processus ETL (Extract,Tansfrom, load) .

La solution proposée repose sur une architecture Cisco  UCS C-series qui peut être déployée avec de l’UCS C200 M2 ou de l’ UCS C210 M2 selon les besoins. Les commutateurs Cisco Nexus  supportent les exigences de débits et de latence requis par les solutions Big Data.

5 étapes pour commencer avec le “BigData”

 Un nouveau terme est apparu récemment et a suscité pas mal de buzz : le «  Big  Data » ! On fait également référence à l’ère du “Zettabyte” , la quantité de données véhiculée sur les réseaux et stockée.  Le terme est aussi simple que le concept est complexe.

Tout part du fait que la quantité de données créée devient gigantesque  et sa croissance est phénoménale. Ces données ne sont plus cantonnées à des bases de données structurées mais proviennent de sources diverses et variées liées à la diversification des outils dont nous disposons aujourd’hui pour communiquer et créer de l’information. De plus ces informations peuvent être réparties mondialement et produites en temps réel.

voir  l’étude de MC Kinsey de mai 2011: “Big Data: The Next Frontier for Innovation, Competition, and Productivity”

voir également un document de juin 2011: “extracting Value from Chaos” d’IDC

Au moins deux questions se posent  :

- Quelle valeur peut-on tirer de cette profusion d’informations utile pour les entreprises et les institutions (comportement des consommateurs, études d’opinions, tendances industrielles, lutte contre la criminalité,  etc.) ? On retrouve là une évolution de ce que l’on connaissait à une époque sous le nom d’infocentre, puis de  datawarehouse… sauf que là il devient inimaginable d’utiliser une base de données traditionnelle.

- Comment capturer ces informations, les stocker, les analyser, les visualiser ? L’interprétation de ces données amènent de nombreuses réflexions qui touchent aussi bien à l’architecture de réseaux, qu’à la conception des bases de données et bien entendu aux méthodes d’interprétation des données

Quel écosystème pour le BigData ?

On voit d’ores et déjà , un peu comme pour le phénomène du cloud, que beaucoup de domaines d’expertise sont concernés et chaque acteur informatique  commence à développer une approche, pour ne pas dire un discours, sur le sujet du « Big Data ».

Dans le domaine de l’analyse des données il semble déjà que quelques outils ont pris un peu d’avance puisque dans chaque article sur le sujet on ne manque pas de les mentionner (et j’en fait autant) : MapReduce, développé par Google,  et  Hadoop destinés aux applications distribuées et à la gestion intensive des données.

Cisco et le BigData:

Bien sûr Cisco ne manque pas de  s’intéresser à ce sujet très prometteur en travaillant sur :

et sûrement d’autres sujets que je ne n’ai pas encore identifiés nécessitant sans doute des partenariats.

Pour le moment je vous propose de  regarder cette video  de Shaun Kirby Cisco qui propose une méthodologie en 5 points et qui fait allusion au développement de l’Internet Of Thing (IOT) ou en français  “internet des objets”.

A suivre le développement et l’interaction de écosystème autour du BigData !

Suivre

Get every new post delivered to your Inbox.

Joignez-vous à 266 followers