Classification d’images à grande échelle avec des SVM

Show full item record

Files in this item

PDF TraitSignal_2014_31_1_39_Doan.pdf 359.5Kb

Pour citer ce document :
URI: http://hdl.handle.net/2042/70246
Title: Classification d’images à grande échelle avec des SVM
Author: Doan, Thanh-Nghi; Do, Thanh-Nghi; Poulet, François
Abstract: Nous présentons des améliorations de l’algorithme de Power Mean SVM (PmSVM) pour la classification d’ensembles d’images tels qu’ImageNet (14 millions d’images et 21 000 classes) qui rendent l’apprentissage beaucoup plus complexe (temps et coût mémoire). Les SVM ne sachant traiter que deux classes, les approches les plus utilisées sont un contre un ou un contre le reste. Avec les grands ensembles de données, l’approche un contre le reste est préférée pour des raisons de coût, mais implique des problèmes de déséquilibre. Pour le déséquilibre, nous proposons un algorithme de bagging équilibré de SVM, parallélisé pour obtenir les résultats dans un temps raisonnable. Sur les 1 000 plus grandes classes d’ImageNet (ILSVRC 2010) il est 286 fois plus rapide que le PmSVM original et 1 434 fois plus rapide que LIBLINEAR avec une amélioration relative de plus de 20 % de la précision par rapport à ce dernier.We present some improvements of Power Mean SVM (PmSVM) for large scale image classification, with large number of images and classes. Usual SVM algorithms can only deal with two classes, for more than two classes, one can use one against one or one against all approaches. With large datasets, one against all is the most used because of computational cost but this implies very imbalanced classes. To deal with these imbalanced data, we present a parallel bagging of SVM algorithms to get results within reasonable time. For the classification of the 1000 largest classes of ImageNet dataset (900000 images, 12.5GB) our algorithm is 286 times faster than original PmSVM and 1434 times faster than state-of-the-art algorithms like LIBLINEAR with a relative increase of accuracy more than 20% compared to the latter one.
Subject: catégorisation d’images; large scale visual classification
Publisher: Lavoisier
Date: 2014

This item appears in the following Collection(s)

Show full item record





Advanced Search