[CPS-users-fr] pb d'indexation des documents word sous cps

Malika LBAOUCH misstie at gmail.com
Jeu 3 Jan 15:47:09 CET 2008


*Bonjour,

je rencontre un pb avec la recherche full texte dans les pieces attachées
word.

lorsque je crée un nouveau document contenant une pièce attachée word et que
je recherche un mot existant dans sa piece attachée, le moteur de recherche
ne le trouve pas.

en consultant les traces j'observe que le document word est bien converti en
texte en html.

c'est étrange comme comportement car c'est qqchose qui marchait jusqu'à
maintenant... on a 25000 documents dans le data.fs

Pour info dans portal_transform j'ai les converitisseurs word_to_html et
html_to_text

Voici les traces dans le event.log :

2008-01-03T11:40:51 INFO(0) PortalTransforms PATH FROM application/msword TO
text/plain : [<Transform instance at a4b0df80>, <Transform instance at
a4b22680>]

2008-01-03T11:40:52 DEBUG(-200) _convertFileToMimeType File is <File
instance at a48dd800>

2008-01-03T11:40:52 INFO(0) PortalTransforms PATH FROM application/msword TO
text/html : [<Transform instance at a4b0df80>]

--------------------------------

sous usr/local/bin j'ai testé l'utilitaire wvText sur un document word
j'obtiens un msg d'erreur :

[devweb at webint05 bin]$ ./wvText
../zope/zope274_instance_ib/import/testword.doc
../zope/zope274_instance_ib/import/res_doc

Configuration file /usr/local/lib/lynx.cfg is not available.

Could not convert into Text

[devweb at webint05 bin]$

contexte : Zope/(Zope 2.7.4-0, python 2.3.4, linux2) ZServer/1.1 CPS/3.2


*
-------------- section suivante --------------
Une pièce jointe HTML a été enlevée...
URL: http://lists.nuxeo.com/pipermail/cps-users-fr/attachments/20080103/79233ae6/attachment.htm


Plus d'informations sur la liste de diffusion cps-users-fr

This list archive provided by Nuxeo, the leaders of open source ECM. Check out the Nuxeo 5 open source, standards-based ECM project.