[CPS-users-fr] Re: Indexation de documents excel

Olivier Grisel ogrisel at nuxeo.com
Sam 1 Juil 16:11:00 CEST 2006


MARFIL CEDRIC a écrit :
> Bonjour,
> 
> Est-ce que quelqu’un sait comment faire pour indexer fiablement un 
> document excel uploadé dans un document de type fichier ?
> 
> Je rencontre à priori des problèmes d’indexation inhérents à 
> l’indexation d’un fichier, converti correctement en html par xlHtml, 
> mais dont les balises TABLE, TD, TR… sont simplement supprimées avant de 
> lancer l’indexation, ce qui cause la concaténation des mots de début et 
> de fin de cellule lors de l’indexation.
> 
> Exemple :
> 
> | Contenu1 | Contenu 2 | Contenu3 | va être indexé de la sorte :
> 
> (u’Contenu1Contenu’ 1), (u’2Contenu3’ 1) …
> 
> Et ainsi de suite.
> 
> Avez-vous une idée de l’endroit où il faille regarder ?

Il faut regarder dans PortalTransforms la chaine qui est utilisée pour passer du 
xls au texte. Il est possible que ca passe par une etape intermediaire de html 
qui est possible d'améliorer si nécessaire.

-- 
Olivier



More information about the cps-users-fr mailing list

This list archive provided by Nuxeo, the leaders of open source ECM. Check out the Nuxeo 5 open source, standards-based ECM project.