Module de diffusion 3.x : développements en cours

Comme annoncé précédemment, la version 3 de Cyberdocs n'utilisera plus SDX pour l'indexation et la diffusion des documents. Son remplaçant sera l'application Pharos, actuellement en cours de finalisation par la société Silecs. Cette nouvelle application est basée sur Sphinx, un moteur de recherche en plein texte sous licence GPL v2. Le lien pointe vers la présentation générale, mais je vous invite également à parcourir la documentation complète.

Les objectifs de Pharos étant interopérabilité et modularité, l'architecture orientée services s'est donc imposée d'elle-même : il ne s'agit pas seulement de rechercher ou d'afficher des documents, mais d'en gérer la diffusion : droits d'auteurs, droits d'accès (utilisateurs, réseaux etc.), formats divers, historique, fiches auteurs, messageries etc. et bien d'autres besoins qui viendront s'ajouter avec le temps. Il s'agit donc de ne pas tout mélanger entre les couches applicatives.

Voici un schéma, présentant l'architecture globale et simplifiée du nouveau module de diffusion :

Pharos Architecture

Une documentation complète (en anglais) sera bien évidemment disponible et je ne fais ici que présenter l'architecture globale.

Pharos dispose de deux interfaces pour l'administration :

  • Pharos adminstration est une interface web de configuration complète des entrepôts : création, métadonnées, gestion des documents et des accès etc.
  • En ligne de commande, pour notamment des indexations en masse.

Au coeur de l'application Pharos, l'API serveur (en php) qui interface Sphinx pour l'indexation, les recherches, mais également la récupération des documents et les ressources associées.

A gauche, ce sont les fichiers de production issus de la chaine de conversion Cyberdocs (XML TEI-lite, xHTML, PDF, ressources liés) : seul le fichier XML TEI Lite est obligatoire pour un document, les autres fichiers sont facultatifs.

Les consultations (interrogations) s'effectuent via le service web :

  • Informations sur les entrepôts (champs de métadonnées, formats, statistiques etc.)
  • Informations sur un document (métadonnées, table des matières et illustrations etc.)
  • Interrogation sur l'ensemble des documents avec critères de recherche (métadonnées, plein texte etc.)
  • Interrogation sur un document avec critères de recherche (métadonnées, plein texte etc.)
  • Partie(s) de document (xHTML)
  • Ressources liés aux documents (Images, PDF, HTML statique, etc.)

Le site Internet de consultation s'occupe du rendu des documents, de la gestion des droits d'accès et n'est donc pas limité au niveau des fonctionnalités et de la présentation des documents. Je reviendrai bien sûr l'ensemble de ces fonctionnalités.

Une version bêta de Pharos devrait être disponible début février 2010.