Master 2, Bases de données avancées, année 2022
Le cours se décompose en 6 séances de 4h réparties entre CM et TD/TP.
L’objectif du cours est de donner une vue d’ensemble théorique et pratiques des bases de données non relationnelle, de leur intérêt en particulier dans la modélisation et la distribution des données.
TPs
Les TD sont a déposer sur un git et a partager avec moi. Ce git sera utilisé pour la seconde chance. Seront évalué la régularité des comités et la qualité de la production.
Les travails collaboratifs sont autorisé mais doivent être indiqué clairement et chacun doit avoir un repo git séparé.
On utilise un seul repo git pour l’ensemble des TD.
Bibliographie et ressources
Le cours de Philippe Rigaux (version PDF), la documentation de PostgreSQL et de nombreux articles de Wikipédia.
Également quelques papiers de recherches (liste complétée durant le semestre):
- Le blog de Michael Whittaker
- David Karger, Eric Lehman, Tom Leighton, Rina Panigrahy, Matthew Levine, and Daniel Lewin. 1997. Consistent hashing and random trees: distributed caching protocols for relieving hot spots on the World Wide Web. In STOC ’97
- Seth Gilbert and Nancy Lynch. 2002. Brewer’s conjecture and the feasibility of consistent, available, partition-tolerant web services. SIGACT News 33, 2 (June 2002), 51–59. DOI
- Eric Brewer. 2012. CAP Twelve Years Later: How the “Rules” Have Changed.
Cours 1. Rappel sur les bases de données relationnelles
Contenu du cours
- Atomicité, Consistance, Isolation, Durabilité
- Les schéma relationnels
- Difficultés liées au modèle relationnel
- La distribution des BDD relationnelles
Objectifs du TP
- Rappel sur OpenStack.
- Installation de PostgreSQL
- Primary/replica
- Schéma distribué
Partie 2. Introduction aux bases de données non relationnelles (12h)
Notions couvertes:
- Distributed hashing
- Scaling (horizontal and vertical)
- Sharding
- Variation around consistency
- BASE https://dl.acm.org/doi/pdf/10.1145/1394127.1394128
- CAP Theorem
Cours 2. Les key/value stores (4h)
- Présentation du modèle de données
- Distributed hashing
- consistent hashing
- rendez-vous hashing
- A quick presentation of Redis.
TP
- The distributed Twitter Clone with Redis?
2. Les bases de données orientée documents (4h)
- Presentation du modèle de donnée
- Query languages and indexation
- Sharding and replicas
- Eventual consistency
- shared nothing (https://dsf.berkeley.edu/papers/hpts85-nothing.pdf)
TP
3. Les bases de données orientée Graphes (4h)
Remerciements
- Aux étudiants ayant corrigé les fôte d’ortograffe
- À Korentin Duquenne pour l’API java pour le microblog
- À Oliver Irwin (alias Le Vengeur Masqué)
Compiled the: mer. 04 sept. 2024 12:49:54 CEST