PostgreSQL La base de donnees la plus sophistiquee au monde.

Forums PostgreSQL.fr

Le forum officiel de la communauté francophone de PostgreSQL

Vous n'êtes pas identifié(e).

#1 Optimisation » Choix de l'index » 18/11/2018 20:05:58

ikit
Réponses : 2

Bonjour,

Je suis en train de concevoir une base de données qui va collecter des données génétiques, et je me demande quel index sera le plus efficace.

Le contexte: en génétique, on va analyser ce qu'on appelle les variants, c'est c'est à dire les parties du génome qui diffèrent par rapport à un autre génome de référence. En moyenne chacun de nous a son génome qui différent d'environ 1% par rapport à celui de référence, ce qui représente environs 1 million de variants par individu.
Un variant se représente sous la forme :
- chr : (chromosome) un entier entre 1 et 25
- pos : (position) un entier entre 1 et MAX_INT64
- ref : (référence) un varchar(32)
- alt : (alternative) un varchar(32)

ce sont ces 4 informations qui définissent de manière unique un variant. et donc c'est là dessus qu'il faut un index pour ensuite pouvoir faire des jointures avec les autres tables qui contiendrons des informations relatives à ces variants.

Qu'est-ce qui est le plus rapide pour chercher un variant : un index sur une nouvelle colonne "hash" qui serait une empreinte calculée avec les 4 autres ? ou bien un index composite sur chr, pos, ref, alt ?

Pied de page des forums

Propulsé par FluxBB