03 - Segmentation et analyse interactives de documents anciens imprimés

Show full item record

Files in this item

PDF 03•Ramel couleur.pdf 492.0Kb

Pour citer ce document :
URI: http://hdl.handle.net/2042/4392
Title: 03 - Segmentation et analyse interactives de documents anciens imprimés
Author: RAMEL, J.-Y.; LERICHE, S.
Abstract: Après avoir caractérisé les spécificités de mise en page dans les ouvrages imprimés anciens, nous montrons par une campagne d’expérimentations que les méthodes ascendantes et descendantes d’extraction de la structure physique apportent des informations différentes qu’il ne faut pas ignorer lorsque l’on désire segmenter de manière optimale des documents anciens. Les tests réalisés mettent également en évidence les sources d’erreurs des méthodes traditionnelles. Partant de ces constatations, notre proposition consiste à utiliser un algorithme de segmentation hybride basé sur la construction de deux représentations de l’image : une carte des formes qui se focalise sur les composantes connexes présentes dans l’image et une carte du fond qui fournit de l’information sur les espaces blancs séparant les blocs constituant la page. Ensuite, sur la base de la segmentation obtenue à l’aide de cette méthode, une classification des blocs extraits peut être réalisée selon des scénarios que l’utilisateur met en place en fonction de ses besoins. Ces scénarios sont définis simplement grâce à une phase d’interaction entre l’utilisateur et le système et permettent de concevoir des chaînes de traitements adaptées aux différents types d’images que l’on peut rencontrer.
Description: In this paper, we first precise the main error sources from classical methods of structural page layout analysis based on a study of the specificity of old printed books. We show that each type of methods (bottom-up and top-down) provides different kinds of information that should not be ignored to obtain both a generic method and good segmentation results. Then, we propose to use a hybrid segmentation algorithm. We build two maps : a shape map that focuses on connected components and a background map that provides information on white areas corresponding to block separation in the page. Then, using this first segmentation, a classification of the extracted blocks can be achieved according to scenarios built by the user. These scenarios are defined very simply during an interactive stage allowing the users to produce processing sequences adapted to the different kinds of images they can meet and to their needs. The method gives very good results while the setting of parameters is easy and not sensitive to low variations.
Subject: Analyse de la structure physique, segmentation, classification des blocs, documents anciens, stratégie d’analyse; Page layout analysis, segmentation, block classification, old documents, analysis strategy
Publisher: GRETSI, Saint Martin d'Hères, France
Date: 2005

This item appears in the following Collection(s)

Show full item record





Advanced Search