Cassandra

Résumé

Cassandra est une base de données distribuée NoSQL connue pour ses capacités à savoir gérer sans défaillance de très grosse quantité de données structurées, notamment utilisée à travers Spark dans les nouvelles architectures SMACK (Spark / Mesos / Akka / Cassandra / Kafka).


Cette formation Cassandra vous donnera les connaissances et l’expérimentation pratique pour mettre en œuvre et administrer Apache Cassandra au quotidien.
Comme toutes nos formations, celle-ci vous présentera la dernière version stable en date.

Contenu du cours

Introduction à CASSANDRA & NOSQL (Jour 1 - Matin)

  • Architecture : d’hier à aujourd’hui « BIG DATA » (‘SQL’ => ‘NOSQL’)

  • Polygloc Persistence*. Typical architecture (hier et aujourd’hui)

  • Introduction à Cassandra (Concepts, ACID => CAP)

  • Cassandra Architecture (Comprendre son fonctionnement pour bien l’exploiter : commit log, data stockage, services, flux)

  • Répartition & Distribution

  • Consistency & Réplication (Hint, Repair, Tombstones)

 

Data Modeling avec CASSANDRA : Become a super Modeler ! (Jour 1 - Après-midi)

  • Le keyspace

  • Big Table : Clé / Valeur, la clé est dans la key 

  • Le Relationel en NOSQL => La dé-normalisation

  • Don’t be afraid of writes !

  • Wide Row (Clustering columns)

  • Counters

  • Do you need a Transaction?

  • Options des tables (compactions, gc graces, ttl …)

  • Best practises : ce à quoi il faut penser (row size, partitions, clustering or not clustering columns)

  • TP (Use-cases & Discussions)

 

Monitoring : Quoi monitorer ? (Jour 2 - Matin)

  • Throughput, read and write requests

  • Latency, read and write latency

  • Disk usage, disk space on each node

  • Garbage collection frequency and duration

  • Errors and overruns, especially unavailable exceptions which indicate failed requests due to unavailability of nodes in the cluster

  • Outils (nodetool, JMX, Datastax OpsCenter (DSE) …

 

CASSANDRA Tuning (Jour 2 - Après-midi)

  • Cassandra pré-requis (hardware)

  • cassandra.yaml (propriétés)

  • Propriétés majeures (tuning)

  • JVM options (tuning)

  • Use-cases & Discussions

 

Best practises (Jour 3 - Matin)

  •  Java driver (description, configuration, instanciation …)

  • Writes: best practises

  • Reads: best practises

  • Gestion des erreurs (exception)

  • TP

  • Use-cases & Discussions

 

Administration (Jour 3 - Après-midi)

  • Object Mapping

  • Tests d’intégration (cassandra embedded)

  • TP

  • Administration (overview) d’un cluster cassandra: possibilité, les choses à faire, les choses à ne pas faire

  • Retours d’expérience, pour aller plus loin (associer d’autres technologies ?)

Durée 

3 jours soit 21 heures

Prix public

2.100 € HT

Dates à Paris

  • 3-5 juin

  • 23-25 septembre

Public concerné

Développeurs, Architectes, Administrateurs systèmes

Objectifs pédagogiques

  • Comprendre l’architecture et le fonctionnement du SGBD NoSQL Apache Cassandra

  • Installer et configurer un cluster Cassandra

  • Créer une base de données et manipuler ses objets

  • Découvrir les principes de l’optimisation et du développement

  • Se familiariser avec les outils d’administration/monitoring Cassandra

Pré requis

Connaissances de base d’un système Unix (Savoir se débrouiller dans un terminal) et dans le langage ava

Formations Editeurs

SARL DIG-IT

Simplifiez vous l'IT

 

Tél : +33 (0)6 09 52 48 96

Mail : sandra@formation-IT.org

Centre de Formation enregistré

sous la DA n° 93.06.07876.06

SIRET 822 060 372 00015 - APE 7022Z 

  • Twitter Classic
  • LinkedIn Social Icon
  • Facebook Social Icon