Outils

Réindexer tous vos documents

En cas de problème ou suite à une modification de configuration, il peut être nécessaire de réindexer tous les documents de la base.

La méthode proposée n'est sans doute pas la meilleure, mais elle possède l'avantage d'être relativement simple, pour un coup de développement presque nul.

Pré-requis : le script de ré-indexation utilise « wget » et « awk ».

Réindexer vos documents, étape par étape :

  • Téléchargez cette archive et décompressez-la : vous y trouverez un répertoire « reindex » contenant les outils de ré-indexation.
  • Dans le répertoire « reindex/web », vous trouverez trois fichiers permettant d'ajouter à votre application SDX une page XSP de ré-indexation simplifiée. Copiez les trois fichiers dans l'arborescence des sources Cyberdocs comme indiqué ci-dessous :
    • reindex/web/rsimplechargement.xsp : placez ce fichier dans votre répertoire src/web/
    • reindex/web/xsl/rsimplechargement.xsl : placez ce fichier dans votre répertoire src/web/xsl/
    • reindex/web/habillages/pcd/xsl/rsimplechargement.xsl : placez ce fichier dans le répertoire xsl de votre habillage.
  • Exécutez à nouveau le script « installation-web » afin d'installer les nouveaux fichiers dans votre application SDX. Relancez Tomcat.
  • Si vous utilisez le module de gestion, copiez le fichier « index.dat » de votre institution (par exemple production/lyon2/index.dat) dans le répertoire « reindex »
  • Si vous n'utilisez pas le module de gestion, il vous faut créer un fichier texte « index.dat » contenant la liste de tous les espaces de document à ré-indexer, ayant pour chaque ligne le format suivant : « nom_repertoire_doc:annee_sur_4_chiffre: ». Par exemple : « grosjean_mf:2003: ».
  • Placez-vous dans le répertoire « réindex » et executez la commande « reindex.sh » comme indiqué ci-dessous, afin de fabriquer le fichier de commandes de ré-indexation globale :
./reindex.sh URL_APPLICATION_PCD CHEMIN_REPERTOIRE_PRODUCTION LANGUE ID_INSTUTION REPERTOIRE_TOMCAT REPERTOIRE_GESTION FICHIER_INDEX_DAT > reindex_all.sh

Par exemple, pour réindexer toute l'institution lyon2 :

./reindex.sh http://mon_server/sdx/pcd /data/pcd-install/produdction fr lyon2 /data/tomcat all index.dat > reindex_all.sh

Par exemple, pour réindexer uniquement les documents de l'institution lyon2 classés dans le répertoire « archive » du module de gestion :

./reindex.sh http://mon_server/sdx/pcd /data/pcd-install/produdction fr lyon2 /data/tomcat arch index.dat > reindex_all.sh
  • Vérifiez le fichier « reindex_all.sh » : il doit contenir des appels à « wget ».
  • Attribuez les droits en exécution à tous les fichiers « sh » du répertoire « reindex » et lancez « reindexall.sh » : ./reindexall.sh > resultat.txt &
  • Vous pouvez surveiller la ré-indexation en consultant le fichier resultat.txt (tail resultat.txt). Si des erreurs apparaissent, notez les espaces de document en question et traitez ces cas manuellement.

Important :

  • Tous les 50 chargements de documents, le server Tomcat est arrêté et relancé automatiquement.
  • Une fois les documents réindexés, pensez à supprimer les fichiers « rsimplechargement.xsl/xsp » : ils ne sont plus utiles.