Bonjour à tous,

Voilà ma problématique :

Nous disposons d'un catalogue produit conséquent sous un logiciel de PAO (Quark Xpress), et nous souhaitons le proposer sur notre site web, sous forme d'un site e-commerce.

Le remplissage manuel de ce catalogue dans notre PIM sera long et fastidieux.

Aussi me pose-je la question de savoir s'il existe une solution OCR, à qui on pourrait apprendre que telle zone de catalogue (pdf) correspond au titre du produit, telle autre zone est le descriptif technique, et que ce visuel est la photo du produit...etc

L'idée serait donc de restituer le maximum d'informations (je me doute qu'une partie plus ou moins importante sera de toute manière à saisir manuellement) dans un tableau, ou BDD... de manière à pouvoir être réinjecté le plus simplement possible dans notre PIM.

Si vous avez des pistes, je suis preneur !

Merci ;)

solution ocr print to web numerisation
3
1

1 réponse

il y a 3 ans par PascalW
Bonsoir,

Dans la mesure où il existe des robots pour lire et trier le CV, cela doit être faisable.
En plus, si je comprend bien les champs sont formatés donc pour l'import ça devra aller assez vite.
Par contre, pour éviter un trop lourd développement (si aucun produit n'existe déjà, j'ai pas regardé en détail mais sur Sourcefourge, il y a des pages et des pages de choses intéressantes sur l'OCR/ICR) je te conseille de fiare en deux étapes:
- La transformation des tes fichiers PDF et fichier txt (dans un catalogue les données sont le plus souvent formatées)
- la mise en forme du fichier txt pour l'injecter dans la base de ton site.
Par contre, je ne connais pas Quark Xpress mais c'est un peu étonnant pour moi de pas avoir les données du catalogue. Dans mon esprit, je pensais que cela marchait comme un publipostage (on défini un modèle et on applique des données externe). Faudra que je regarde Quark si j'ai le temps un de ces jours.
2
il y a 3 ans par EmmanuelCharriere
Merci Pascal pour ton retour.
Je vais checker avec un export txt d'abord, mais j'ai peur de perdre des informations de mises en page importantes pour la reconnaissance des zones.
1

Vous aimez Skiller?

Rejoignez la communauté.