03 - Segmentation et analyse interactives de documents anciens imprimés

Show simple item record

dc.contributor.author RAMEL, J.-Y.
dc.contributor.author LERICHE, S.
dc.date.accessioned 2006-01-20T15:23:24Z
dc.date.available 2006-01-20T15:23:24Z
dc.date.issued 2005
dc.identifier.citation Traitement du Signal [ Trait. Sign.], 2005, Vol. 22, N° 3, p. 209-222 en
dc.identifier.issn 0765-0019
dc.identifier.uri http://hdl.handle.net/2042/4392
dc.description In this paper, we first precise the main error sources from classical methods of structural page layout analysis based on a study of the specificity of old printed books. We show that each type of methods (bottom-up and top-down) provides different kinds of information that should not be ignored to obtain both a generic method and good segmentation results. Then, we propose to use a hybrid segmentation algorithm. We build two maps : a shape map that focuses on connected components and a background map that provides information on white areas corresponding to block separation in the page. Then, using this first segmentation, a classification of the extracted blocks can be achieved according to scenarios built by the user. These scenarios are defined very simply during an interactive stage allowing the users to produce processing sequences adapted to the different kinds of images they can meet and to their needs. The method gives very good results while the setting of parameters is easy and not sensitive to low variations. en
dc.description.abstract Après avoir caractérisé les spécificités de mise en page dans les ouvrages imprimés anciens, nous montrons par une campagne d’expérimentations que les méthodes ascendantes et descendantes d’extraction de la structure physique apportent des informations différentes qu’il ne faut pas ignorer lorsque l’on désire segmenter de manière optimale des documents anciens. Les tests réalisés mettent également en évidence les sources d’erreurs des méthodes traditionnelles. Partant de ces constatations, notre proposition consiste à utiliser un algorithme de segmentation hybride basé sur la construction de deux représentations de l’image : une carte des formes qui se focalise sur les composantes connexes présentes dans l’image et une carte du fond qui fournit de l’information sur les espaces blancs séparant les blocs constituant la page. Ensuite, sur la base de la segmentation obtenue à l’aide de cette méthode, une classification des blocs extraits peut être réalisée selon des scénarios que l’utilisateur met en place en fonction de ses besoins. Ces scénarios sont définis simplement grâce à une phase d’interaction entre l’utilisateur et le système et permettent de concevoir des chaînes de traitements adaptées aux différents types d’images que l’on peut rencontrer. en
dc.format.extent 492064 bytes
dc.format.mimetype application/pdf
dc.language.iso fr en
dc.publisher GRETSI, Saint Martin d'Hères, France en
dc.relation.ispartofseries Traitement du Signal
dc.subject Analyse de la structure physique, segmentation, classification des blocs, documents anciens, stratégie d’analyse en
dc.subject Page layout analysis, segmentation, block classification, old documents, analysis strategy en
dc.title 03 - Segmentation et analyse interactives de documents anciens imprimés en
dc.title.alternative Interactive segmentation and analysis of historical printed documents en
dc.type Article en
dc.contributor.affiliation Lab. d’Informatique, École Polytechnique de l’Université de Tours, 64, avenue Jean Portalis 37200 Tours


Files in this item

PDF 03•Ramel couleur.pdf 492.0Kb

This item appears in the following Collection(s)

Show simple item record





Advanced Search