Que ce soit au boulot ou chez soi, de plus en plus d’utilisateurs d’ordinateur disposent d’un scanner (ou scanneur ou numériseur).

Bien que très utile, cette outil révèle assez vite une frustration : impossible de récupérer du texte numérisé dans un traitement de texte. En effet, par défaut, le texte est considéré comme une image (une suite de points de noir & blanc ou de couleurs) et non comme une suite de caractères. Pour obtenir une suite de caractères, il faut un logiciel d’OCR pour optical character recognition, reconnaissance optique de caractères (ROC) en français. Ce logiciel va traduire en caractères les images de caractères, en tentant de reconstruire le texte de manière fidèle.

Souvent très cher, des solutions alternatives pour des usages occasionnels existent :

Je n’ai pas encore testé le second mais le premier donne des résultats encourageants, même s’il ne semble plus maintenu depuis 2006, y compris avec des caractères accentués propres au français, ce qui mérite d’être signalé.