Je me suis amusé à utiliser des logiciels d'OCR (reconnaissance de caractéres) et je n'ai pas trouvé LE logiciel correct.
Pour du texte en français, j'ai déjà utilisé SimpleOCR qui est pas mal car il propose un écran de correction avec source / traduction texte assez bien fait.
Pour des listings en ASM ou Basic, par contre là j'ai rien trouvé de vraiment probant...
Dans tous les cas les reconnaissances ne sont pas terrible.
Il y a de cela fort longtemps (du temsp de l'Atari ST ) l'OCR ne donnait pas de bon résultats, mais je me disais ... en 2011 il y aura surement des logicels qui reconnaitront sans fautes des pages (au moins typographiées, à défaut de manuscrite qui nécéssiteraient un apprentissage, naturellement). Si si je me disais tout cela en 89 (le 27 mars à 14h33 si ma mémoire est bonne... )
Bref si vous utilisez un bon OCR (gratuit...) pour nos bons vieux listing ce serait sympa de l'indiquer !
Logiciel OCR
Modérateurs : Papy.G, fneck, Carl
Re: Logiciel OCR
J'avais moi aussi essayé et les résultats étaient lamentable sur des listings... ou bien il faut investir dans un logiciel payant et passer beaucoup de temps dans une (longue) phase d'apprentissage.
En fait certains listings étaient pas trop mal passés, mais il reste toujours quelques erreurs... et comme il faut relire ça prend autant de temps que de taper le listing
Désolé je n'aide pas.
En fait certains listings étaient pas trop mal passés, mais il reste toujours quelques erreurs... et comme il faut relire ça prend autant de temps que de taper le listing
Désolé je n'aide pas.
Re: Logiciel OCR
J'ai essayé presque tous les OCR : gratuits, payants, en ligne...
Pour les listings de programmes et les documentations techniques j'ai abandonné. Il est plus rapide et plus fiable de tout retaper. En revanche on obtient de bons résultats avec des livres de littérature, si la police de caractères est classique et le scan de bonne qualité.
Il faut un peu tempérer ce jugement, car les meilleurs logiciels ont des processus d'apprentissage. Je n'ai jamais eu le courage de les mettre en oeuvre, il faudrait essayer. En particulier, pour un listing de programme Basic, définir chaque caractère de l'imprimante et constituer un dictionnaire avec tous les mots réservés. Le résultat sera probablement meilleur, mais les listings réalisés avec des imprimantes à aiguilles et des rubans usés resteront toujours difficiles à décoder.
Pour les listings de programmes et les documentations techniques j'ai abandonné. Il est plus rapide et plus fiable de tout retaper. En revanche on obtient de bons résultats avec des livres de littérature, si la police de caractères est classique et le scan de bonne qualité.
Il faut un peu tempérer ce jugement, car les meilleurs logiciels ont des processus d'apprentissage. Je n'ai jamais eu le courage de les mettre en oeuvre, il faudrait essayer. En particulier, pour un listing de programme Basic, définir chaque caractère de l'imprimante et constituer un dictionnaire avec tous les mots réservés. Le résultat sera probablement meilleur, mais les listings réalisés avec des imprimantes à aiguilles et des rubans usés resteront toujours difficiles à décoder.
Daniel
L'obstacle augmente mon ardeur.
L'obstacle augmente mon ardeur.
Re: Logiciel OCR
C'est bien ce que je craignais ... pas beaucoup d'espoir d'avoir une lecture automatique... peut-être en 2024
- Carl
- Modérateur
- Messages : 13301
- Inscription : 08 avr. 2007 13:21
- Localisation : http://www.doledujura.fr
- Contact :
Re: Logiciel OCR
si tu outrepasses l'apprentissage, tu vas passer autant de temps à corriger le document qu'à le saisir complétement...
carl
carl