PostgreSQL La base de donnees la plus sophistiquee au monde.

Forums PostgreSQL.fr

Le forum officiel de la communauté francophone de PostgreSQL

Vous n'êtes pas identifié(e).

#1 29/10/2010 10:12:39

dhikra86
Membre

différence entre clustering et la replication

Bonjour,
Quelqu'un peut m'expliquer la différence entre le clustering et la réplication des serveurs. smile
J'ai lu beaucoup d'articles et je trouve pas de différence sad

Hors ligne

#2 29/10/2010 13:41:25

Marc Cousin
Membre

Re : différence entre clustering et la replication

En fait, c'est assez simple sur le papier. C'est en vrai que c'est compliqué à mettre en place :
- La réplication, c'est la capacité à recopier des données d'une machine (ou d'un environnement) à un autre. Elle peut être synchrone (la donnée n'est considérée comme réellement écrite dans l'environnement source que quand elle est écrite aussi dans l'environnement cible), ou asynchrone. Elle peut utiliser énormément de technologies différentes, suivant les besoins (depuis la 9.0, il y a une réplication 'intégrée' à PostgreSQL).
- Le clustering (cluster en anglais veut dire grappe), c'est le fait de regrouper plusieurs machines pour avoir des capacités qu'on n'a pas avec une seule machine. Il y a principalement deux formes de clustering :
  - Le HP(C): High Performance Clustering. Il s'agit avec plusieurs machines d'avoir plus de puissance de calcul qu'avec une seule. On pense aux clusters de calcul météo, nucléaire, etc…
  - Le HA(C): High Availability Clustering. Il s'agit, avec plusieurs machines d'avoir plus de disponibilité qu'avec une seule. Le but est ici de pouvoir survivre à la perte d'un disque, d'une alimentation, d'une machine, d'un lien réseau, etc…, choses pour lesquelles habituellement on ne peut avoir de solution si on n'a qu'une seule machine (ce qu'on appelle un Single Point Of Failure, ou SPOF).

Évidemment, la réplication est une des briques de bases utilisables pour le HA: si on perd une machine, il est évidemment plus simple de basculer les services sur une autre si celle ci a les données. Mais ce n'est qu'une partie de la solution. Il faut aussi être capable de basculer les ips, les services, etc… et surtout (et c'est souvent le plus compliqué) détecter de façon fiable que la machine qui devrait être en production est réellement hors service. On peut très bien imaginer que toute cette partie détection puis bascule soit manuelle, cela dépend des contraintes de production de l'environnement.

En espérant que ça aide à dégrossir l'ensemble. Mais comme dit dans l'autre post, c'est un domaine assez difficile. Ce n'est pas pour être vexant, c'est juste que c'est vraiment un domaine où on peut facilement se croire en sécurité parce qu'on pense avoir monté une infrastructure hautement disponible, alors que ce n'est pas le cas. Ça demande de connaître à la fois les applications à mettre en haute dispo, le réseau, le système, les outils de HA…

Dernière modification par Marc Cousin (29/10/2010 13:41:48)


Marc.

Hors ligne

Pied de page des forums