Messages de Christophe-LT

Christophe-LT · Optimisation

Après l'ajout d'un index sur credits_sauvegardes.code la requête passe de 7.45s à 16ms, que dire de plus?

Merci pour votre aide!

Christophe-LT · Optimisation

Tout d'abord toutes mes confuses, je pensais bien faire en ne créant pas de nouveau topic vu que les questions sont sur le même sujet.

Effectivement il n'y a pas d'index sur la colonne code de la table credits_sauvegardes.
Par contre credits.code et credits_sauvegardes.code sont tous deux de type character varying (les valeurs insérées sont alphanumériques), je ne comprends pas pourquoi le planificateur effectue une transformation de type.

Christophe-LT · Optimisation

Et bien ça avance!
Par contre je viens de découvrir deux nouvelles requêtes très lentes pour lesquelles je vais de nouveau avoir besoin de votre aide, ce sont les dernières, promis! Les voici :

select count(*) as total from credits a where iduser='2129' and date between '2012-02-21 12:18' and '2012-03-22 12:18' and not exists (select code from credits_sauvegardes where code=a.code limit 1)
EXPLAIN :

QUERY PLAN

Aggregate  (cost=97581.57..97581.58 rows=1 width=0) (actual time=6949.879..6949.879 rows=1 loops=1)

  ->  Index Scan using user_date_idx on credits a  (cost=0.00..97581.51 rows=23 width=0) (actual time=6949.868..6949.868 rows=0 loops=1)

        Index Cond: ((iduser = 2129) AND (date >= '2012-02-21 12:18:00'::timestamp without time zone) AND (date <= '2012-03-22 12:18:00'::timestamp without time zone))

        Filter: (NOT (subplan))

        SubPlan

          ->  Limit  (cost=0.00..2118.60 rows=1 width=17) (actual time=5.303..5.303 rows=1 loops=1310)

                ->  Seq Scan on credits_sauvegardes  (cost=0.00..2118.60 rows=1 width=17) (actual time=5.302..5.302 rows=1 loops=1310)

                      Filter: ((code)::text = ($0)::text)

Total runtime: 6949.969 ms

select regie, count(*) as total from credits a where date between '2012-02-21 12:18' and '2012-03-22 12:18' and iduser='2129' and not exists (select code from credits_sauvegardes where code=a.code limit 1) group by regie

QUERY PLAN

HashAggregate  (cost=97581.63..97581.64 rows=1 width=16) (actual time=7452.142..7452.142 rows=0 loops=1)

  ->  Index Scan using user_date_idx on credits a  (cost=0.00..97581.51 rows=23 width=16) (actual time=7452.139..7452.139 rows=0 loops=1)

        Index Cond: ((iduser = 2129) AND (date >= '2012-02-21 12:18:00'::timestamp without time zone) AND (date <= '2012-03-22 12:18:00'::timestamp without time zone))

        Filter: (NOT (subplan))

        SubPlan

          ->  Limit  (cost=0.00..2118.60 rows=1 width=17) (actual time=5.686..5.686 rows=1 loops=1310)

                ->  Seq Scan on credits_sauvegardes  (cost=0.00..2118.60 rows=1 width=17) (actual time=5.684..5.684 rows=1 loops=1310)

                      Filter: ((code)::text = ($0)::text)

Total runtime: 7452.317 ms

Merci à nouveau pour votre aide.

Christophe-LT · Optimisation

Bonjour,
Pour faire suite je viens de modifier la première base, la moins lourde : j'ai transformé toutes les clés étrangères en INTEGER puis effectué un Vacuum suivi d'un Reindex.

Voici les résultats avec un EXPLAIN :
Avant - http://explain.depesz.com/s/96r
Après - http://explain.depesz.com/s/6pn

Ces résultats vous semblent-ils corrects?
Merci une nouvelle fois de votre aide!

Christophe-LT · Optimisation

Effectivement les clés étrangères de la table "gagnants" sont de type VARCHAR.
En parcourant le champ "id_lot" je me suis aperçu qu'il y a des concaténations d'id avec des résultats comme ",53,53,4,1,,53,4,1,3,3,1,1,4,".
Je vais avoir pas mal de boulot pour démêler tout ça!

Quoi qu'il en soit je vous remercie pour votre aide, je vais corriger ces problèmes en espérant que cela résolve ces lenteurs.

Christophe-LT · Optimisation

Tout d'abord merci de votre intérêt.

Pour répondre à vos demandes :
- La colonne "nom_cadeau" appartient bien à la table "gagnants".
- Concernant les index, clés primaires et étrangères, je copie-colle ce qui se trouve dans l'onglet "index" de phpPgAdmin :

Table users (~13462 lignes) :
id_unique CREATE UNIQUE INDEX id_unique ON users USING btree (id) Clé unique
id_user_unique CREATE UNIQUE INDEX id_user_unique ON users USING btree (id) Clé unique

Table lots (~513 lignes) :
lots_pkey CREATE UNIQUE INDEX lots_pkey ON lots USING btree (id) Clé primaire

Table gagnants (~44118 lignes) :
date_idx CREATE INDEX date_idx ON gagnants USING btree (date)
etat_idx CREATE INDEX etat_idx ON gagnants USING btree (etat)
gagnants_pkey CREATE UNIQUE INDEX gagnants_pkey ON gagnants USING btree (id) Clé primaire
gagnats_id_user CREATE INDEX gagnats_id_user ON gagnants USING btree (id_user)
gagnats_idx CREATE INDEX gagnats_idx ON gagnants USING btree (id)
id_lot_idx CREATE INDEX id_lot_idx ON gagnants USING btree (id_lot)

Le nombre total de lignes contenant "retrait" dans la table "gagnants" est de 2349.

Après avoir discuté avec la personne administrant le serveur il n'y a pas eu de vacuum ni reindex ni quoi que ce soit depuis le changement de serveur (soit plus d'un an). Autovacuum, quant à lui, n'a jamais été activé.

Comme vous l'aurez compris je n'y connais pas grand chose en administration de base de données, de plus PostgreSQL est une nouveauté pour moi...
Quoi qu'il en soit je vous remercie une nouvelle fois de toute l'aide que vous pourrez m'apporter.

Christophe-LT · Optimisation

Bonjour,
Je viens de récupérer le développement pour un client et je suis confronté à des temps d’exécution extrêmement longs (parfois supérieurs à 100s) pour certaines requêtes.
J'ai très peu d'expérience avec PostgreSQL, je viens donc vous demander conseil.

Tout d'abord voici quelques infos sur le serveur :
- Intel XEON E5620 @ 2.40Ghz - 4 cœurs
- 24 Go de RAM - Disque dur de 2 To

- version PostgreSQL 8.2.20 on x86_64-unknown-linux-gnu, compiled by GCC gcc (Debian 4.3.2-1.1) 4.3.2
- autovacuum off
- client_encoding latin1
- lc_collate en_US.UTF-8
- lc_ctype en_US.UTF-8
- max_connections 200
- max_fsm_pages 153600
- max_stack_depth 2MB
- server_encoding LATIN1
- shared_buffers 24MB
- stats_row_level on
- stats_start_collector on
- TimeZone Europe/Paris

Sur ce serveur tournent 25 bases allant de quelques Mo à plus de 100 Go.
Les bases me posant problèmes font moins de 500 Mo.

Voici un exemple de requête :
SELECT a.*,member_with_pseudo(a.id_user) AS pseudo_name
FROM gagnants a JOIN users b ON b.id=a.id_user JOIN lots c ON a.id_lot=c.id
WHERE 1=1 and nom_cadeau LIKE '%retrait%'
ORDER BY a.date DESC LIMIT 20 offset 0
Cette requête s’exécute en 1.34s ce qui est, me semble t-il, plutôt lent.

Maintenant la même requête en changeant simplement l'offset :
SELECT a.*,member_with_pseudo(a.id_user) AS pseudo_name
FROM gagnants a JOIN users b ON b.id=a.id_user JOIN lots c ON a.id_lot=c.id
WHERE 1=1 and nom_cadeau LIKE '%retrait%'
ORDER BY a.date DESC LIMIT 20 offset 60
Temps d’exécution 82.87s.

Voici le résultat d'un EXPLAIN ANALYSE de cette même requête :

QUERY PLAN

Limit (cost=17261.28..17261.33 rows=20 width=329) (actual time=85083.418..85083.423 rows=20 loops=1)

-> Sort (cost=17261.13..17261.40 rows=105 width=329) (actual time=85083.405..85083.416 rows=80 loops=1)

Sort Key: a.date

-> Hash Join (cost=5526.89..17257.61 rows=105 width=329) (actual time=53.056..85021.846 rows=2254 loops=1)

Hash Cond: ((a.id_user)::text = (b.id)::text)

-> Nested Loop (cost=0.00..11719.30 rows=3 width=329) (actual time=6.148..63693.420 rows=2345 loops=1)

Join Filter: ((a.id_lot)::text = (c.id)::text)

-> Seq Scan on gagnants a (cost=0.00..4798.48 rows=1 width=329) (actual time=0.023..39.525 rows=2348 loops=1)

Filter: ((nom_cadeau)::text ~~ '%retrait%'::text)

-> Seq Scan on lots c (cost=0.00..6913.13 rows=513 width=4) (actual time=0.006..26.812 rows=451 loops=2348)

-> Hash (cost=5358.62..5358.62 rows=13462 width=4) (actual time=44.019..44.019 rows=13761 loops=1)

-> Seq Scan on users b (cost=0.00..5358.62 rows=13462 width=4) (actual time=0.014..33.138 rows=13761 loops=1)

Total runtime: 85083.955 ms

Je vous avoue que ça me parle très peu.
Plusieurs questions se posent : ces résultats vous semblent-ils normaux? Que puis-je faire pour améliorer au maximum ces temps?
Si besoin je peux fournir toutes informations manquantes.

Je vous remercie d'avance pour toute l'aide que vous pourrez m'apporter.

Forums PostgreSQL.fr

#1 Re : Optimisation » Lenteur d'execution - PostgreSQL 8.2 » 22/03/2012 16:52:17

#2 Re : Optimisation » Lenteur d'execution - PostgreSQL 8.2 » 22/03/2012 15:38:59

#3 Re : Optimisation » Lenteur d'execution - PostgreSQL 8.2 » 22/03/2012 13:46:11

#4 Re : Optimisation » Lenteur d'execution - PostgreSQL 8.2 » 22/03/2012 11:43:36

#5 Re : Optimisation » Lenteur d'execution - PostgreSQL 8.2 » 20/03/2012 21:26:33

#6 Re : Optimisation » Lenteur d'execution - PostgreSQL 8.2 » 20/03/2012 16:59:07

#7 Optimisation » Lenteur d'execution - PostgreSQL 8.2 » 20/03/2012 12:38:45

Pied de page des forums