Information sur la numérisation

• Accueil • Généalogie • Ébénisterie • Photos • Consommation • Carnet de liens • Plan du Site • nous joindre • Recherche •

 

Introduction:

Vous trouverez ici un certain nombre d'informations sur la numérisation de photos et de documents. Ces informations sont basées principalement sur l'expérience acquise lors de la numérisation des 2152 photos laissées par ma mère. 

Type de fichiers:

      Il existe plusieurs formats de fichiers utilisés dans le domaine des images et des photos. Nous pouvons les regrouper en deux grandes familles, soit les fichiers non comprimés et les fichiers comprimés.

      Dans le cas des types non comprimés, la qualité est conservée car toute l'information est codée et stockée dans le fichier. Par contre le fichier résultant est volumineux. Ça devient vite un problème, spécialement si nous conservons plusieurs versions d'un même document (original, amélioré, recadré etc…). Parmi les principaux  formats de fichiers non comprimés nous trouvons entre autre les fichiers:

            .BMP utilisés principalement dans le monde Windows (Microsoft)

            .TIF (non compressés) type très utilisé dans le domaine des images

      Pour leur part, les fichiers comprimés sont moins volumineux. Par contre, la qualité en est affectée. En effet, chaque fois que nous sauvegardons (comprimons) ce type d'image, nous perdons, de façon irrécupérable, une partie de l'information originale. Donc après quelques sauvegardes la qualité de la photo devient inacceptable (embrouillée, manque d'informations…). Il est recommandé de ne sauvegarder (comprimé) qu'une seule fois ce type de fichier. Parmi les principaux types nous avons:

      .GIF utilisés principalement sur le web

      .JPG type très utilisé dans le domaine des images

Mon approche personnelle

      Lors de la numérisation originale (avec le scanner) de mes documents je sauvegarde les fichiers sous forme .TIF pour garder le maximum d'information.

      Après l'amélioration de la photo (couleur, recadrage…) je sauvegarde le résultat final sous forme .JPG (avec une bonne qualité soit 10 ou 12).

      Si j'ai besoin d'une seconde version de la même image (cadrage différent ou autre) je repart avec l'image originale de forme .TIF et non du fichier .JPG.

Résolution:

      Une image numérique est représentée à l'aide d'une série de points d'informations (pixels)  donnant l'intensité des 3 couleurs de base (rouge – vert – bleu) pour chacun de ces points.

      La résolution d'une image est définie comme le nombre de ces points par unité de mesure. Elle s'exprime en DPI (dot per inch). Plus la résolution est élevée, plus on a de détails de la photo (mais jamais plus que l'originale)

      Par contre, plus la résolution sera élevée, plus le fichier sera volumineux (plus de points à stocker) et plus la numérisation à l'aide du scanner sera longue.

      De plus, passer un certain niveau, l'œil humain ne détecte plus la différence de résolution.  

      La résolution à choisir est donc fonction de l'utilisation que l'on prévoie faire de l'image (visualisation, courriel, impression…) et de l'agrandissement qui sera faite de l'image en question.

Mon approche personnelle

      Selon Jean Langlois (un de mes anciens confrères), pour garder une bonne qualité d'impression d'une photo en 8 X 10, celle-ci doit être conservée dans un format non compressé avec une résolution d'au moins 2500 pixels par 3500 pixels. Suite à mon expérimentation, j'adhère à ce principe.

      Dans mon cas, de façon générale je scanne mes photos à une résolution de 300dpi, ainsi le principe précédent est respecté sur une base de page et chaque photo à une bonne qualité relativement à ses dimensions originales. Mes diapositives sont  scannées à une résolution de 2400 dpi. Ainsi, leur agrandissement pour visualisation et impression est acceptable. Les textes écrits demandent souvent une résolution légèrement supérieure aux photos soit 400 ou 600 dpi suivant les cas.

Grosseur des fichiers:

      Dans le cas des fichiers non compressés, la grosseur d'un fichier photo peut être calculée par l'équation suivante:

Largeur (po) x résolution (dpi) x longueur (po) x résolution (dpi) x 3 (million couleur)

Donc dans le cas d'une photo de 8x10 ou d'une page d'album (plusieurs photos) numérisée à 300 dpi la grosseur sera de:

8 x 300 x 10 x 300 x 3 = 21.6 méga-octets

Pour une diapositive 35 mm numérisée à 2400 dpi la grosseur sera de:

0.86 x 2400 x 1.30 x 2400 x 3 =  19.3 méga-octets

      Dans le cas des fichiers compressés, la grosseur d'un fichier photo est fonction du contenu de la photo et de l'algorithme de compression. Il est donc impossible de calculer la grosseur du fichier généré. Par contre, basé sur un échantillon des mes diapositives (139 diapos) compressées avec une qualité 10 j'obtiens les résultats suivants:

Moyenne des fichiers .TIF                    24.67 mo

Moyenne des fichiers .JPG                    2.94 mo

Facteur de compression:                       8.39

Mon approche personnelle

      J'ai numérisé et sauvegardé l'ensemble de mes photos et de mes diapositives en utilisant les paramètres ci-haut. Ainsi, les 2152 photos de Cécile occupent l'espace suivant sur mon disque dur:

Fichiers des photos originales non traitées (.TIF)           16.6 giga-octets

Fichiers des photos améliorées (.JPG)                             2.3 giga-octets

Temps de numérisation:

      Le temps nécessaire pour numériser un document est fonction des caractéristiques de votre scanner, de la résolution choisie et des dimensions du document à scanner. Donc, suivant l'envergure de votre projet, et votre patience, la vitesse de votre numériseur peut devenir un facteur significatif dans le choix de celui-ci. Dans mon cas, j'obtiens les résultats suivants:

      Pour numériser une photo de 8½ x 11 ou une page d'album (plusieurs photos) à une résolution de 300 dpi le processus (aperçu et numériser) nécessite environ 45 secondes. Donc pour les 670 pages (2152 photos) de mon projet le temps total de numérisation a été de l'ordre de 8½ heures  Ce temps exclus le temps nécessaire pour l'amélioration et la documentation de chacune des photos.

      Pour numériser 4 diapositives à une résolution de 2400 dpi  le processus (aperçu et numériser) nécessite environ 11 minutes, soit 2¾ minutes par diapo. Donc pour mes 1548 diapositives le temps total de numérisation sera de l'ordre de 71 heures. Encore ici, les temps d'amélioration et de documentation sont exclus.

Numérisation - Quelques hints:

      Question d'efficacité (minimiser les manipulations et augmenter la vitesse globale) et question de minimiser la possibilité d'endommager les photos originales, j'ai numérisé les pages d'albums (non chaque photo individuellement). Dans le cas de photos individuelles, je remplie le plateau du numériseur. Ces photos originales sont sauvegardées sous forme .TIF. Par la suite, à l'aide de mon logiciel photo j'extrais et traite chacune des photos et les sauvegarde sous forme .jpg.

      De façon générale, lorsque je numérise mes photos, je n'utilise pas les fonctions d'améliorations de photo (restauration de couleur, luminosité etc…) de mon numériseur car mon logiciel photo est plus complet et plus flexible à ce niveau. Je préfère plutôt générer  une image originale le plus pure possible et la modifier par la suite. La seule exception dans mon cas est l'option "dépoussiérage" qui existe avec mon logiciel de numérisation et non avec mon logiciel photo.

      Je numérise mes photos noir et blanc (spécialement les vieilles photos jaunies) en utilisant l'option photo couleur de mon numériseur (et non l'option noir et blanc). J'aime mieux le résultat et cela me permet de mieux améliorer (enlever un peu de jaune…) les photos en question. Par la suite si je désire une photo réellement en noir et blanc pour impression ou visualisation je la convertis avec mon logiciel photo.

      Attention à la façon de placer les photos transparentes (diapositives, négatifs..) sur le plateau du numériseur car si elles sont placées dans le mauvais sens, la vue sera inversée (droite – gauche) et quelques fois des défauts (entre autre des lignes jaunes) seront introduits dans le fichier résultant. Le côté reluisant de la photo doit être sur le plateau du numériseur.

      Avant de débuter votre projet il est souhaitable de vous familiariser (lecture de la documentation et expérimentation) avec les logiciels que vous planifiez utiliser. Vous serez ainsi en mesure de faire une meilleur "job" la première fois.

Fichiers de travail et sauvegardes (backup):

      Question d'efficacité (vitesse d'opération) les fichiers de travail (utilisés lors de la numérisation, l'amélioration…) doivent être stockés sur un disque dur de votre ordinateur ou peut-être au minimum sur une clef USB. L'espace libre de votre disque dur actuel doit être suffisant pour votre projet (voir les chiffres ci-haut pour le calcul), sinon vous vous devrez d'en ajouter un nouveau.

      De plus, il est primordial de protéger les nombreuses heures de travail que vous consacrerez à votre projet par une bonne méthode de sauvegarde de vos fichiers. En effet, le ou les disques durs de votre ordinateur peuvent devenir inutilisable (informations perdues à tout jamais) suite à un bris mécanique, un bris électrique, ou encore suite à une infection par un virus particulièrement vicieux.

      Certains préconisent l'utilisation d'un second disque dur installé en permanence sur votre ordinateur comme média de sauvegarde, mais à mon avis cette méthode ne donne qu'une protection partielle. En effet, un bris électrique (bloc d'alimentation de votre ordinateur, fluctuation de votre fournisseur d'électricité, etc.), ou encore un virus peuvent endommager, d'un seul coup, plus d'un disque installé sur votre ordinateur.

      Il est donc souhaitable de faire vos backups sur un média amovible fiable. Parmi ceux-ci nous avons:

      Les CD: la capacité d'un CD est de 700 méga-octets, donc 28 photos originales (.TIF) ou encore 238 photos améliorées (.JPG), donc très peu pratique pour cette fonction.

      Les DVD: la capacité d'un DVD est de 4.7 giga-octets, donc 190 photos originales (.TIF) ou encore 1600 photos améliorées (.JPG). Compte tenu de la vitesse de ce type de média, il devient peu pratique pour les sauvegardes régulières. Par contre il peu être intéressant comme média d'archivage (à la fin du projet).

      Les clefs USB: l'achat d'une ou plusieurs clefs USB de 8 giga-octets ou plus (peu dispendieuses aujourd'hui, $50 ou moins) est une option intéressante.

      Les disques USB: c'est sans doute l'option la plus intéressante. On peut acheter un bon disque USB de 500 giga-octets pour aussi peu que $100. A mon avis, l'utilisation d'un disque USB externe avec sa propre alimentation électrique (vs l'alimentation via la connexion USB) est préférable, dans le but de minimiser les risques de dommages en cas de bris de l'ordinateur. La meilleure pratique est de fermer (désinstaller et mettre hors tension) ce disque entre les sauvegardes. Pour maximiser la protection, la connexion USB peut aussi être déconnecté.

      Finalement, dans le but de protéger votre travail (fichiers) contre un désastre majeur à votre résidence (incendie, vol…) il est souhaitable de posséder une copie de vos fichiers hors de celle-ci (par exemple chez un parent, un ami ou encore dans un coffret de sûreté d'une institution financière). Les DVD ou une clef USB peuvent être utilisés comme média pour ce type de sauvegarde. La fréquence de ces backups est fonction de la valeur (monétaire, sentimentale, quantité de travail impliqué, etc) des fichiers en question. 

Mon approche personnelle

      Au début de mon projet, j'avais sur mon ordinateur un seul disque dur de 80 giga-octets utilisé à ≈ 75%, donc insuffisant pour l'ensemble du projet.

      J'ai donc ajouté un second disque interne dédié principalement à cette tâche. A ce moment les capacités les plus populaires des disques étaient de 250 ou 500 giga-octets. J'ai donc acheté un disque de 250 go pour un peu moins de $100.

      Au début de mon projet, je faisait mes backups sur DVD une fois par semaine ou après une session intensive de travail. Plus tard dans le projet, question d'efficacité, de vitesse de sauvegarde et de coût de DVD, j'ai opté pour l'achat d'un disque dur externe de la compagnie Western Digital (type My Book) de 500 giga-octets au coût d'environ $100.

      Une fois par année (ou après plusieurs heures de travail) je fais un backup sur DVD que je confie à ma fille Anik (à l'extérieur de ma résidence).

Documentation & codification des documents:

      Selon mon expérience, les informations servant à documenter adéquatement chacune des photos sont entre autre:

      Identification unique de chacune des photos (parler un même langage)

      Référence à l'original (papier ou autre) de la photo concernée

      La date (exacte ou approximative) ou la photo a été prise

      Événement ou occasion (naissance, anniversaire, mariage, graduation etc.) relatif à la prise de la photo.

      Une courte description du contenu de la photo tel que: noms (au baptême) et prénom  de chacune des personnes présentes sur la photo, lieux d'intérêt représentés, description de la scène, etc. En fait, il faut inscrire ici tous les mots relatifs à une recherche ultérieure de la photo en question.

      Encore une fois, selon mon expérience, la codification de documents à contenu complexe tel qu'une photo pose un grand défi (quoi et comment coder). Peut-être qu'un bibliothécaire / archiviste d'expérience pourrait trouver une méthode adéquate. Pour ma part j'ai abandonné cette approche et j'ai plutôt opté pour une approche contemporaine basée sur la recherche, les tris, les filtres dans une base de donnée informatique simple. Dans un tel cas, la codification peut être aussi simple qu'un numéro séquentiel  ou tout autre identification unique.

Mon approche personnelle

      Pour ma part, j'ai choisi le champs " référence à l'original" comme indentification de mes photos donc de mes fichiers. Pour les photos, j'ai numéroté séquentiellement mes albums, et j'utilise l'identification "Album xx Page xx  suivi d'une lettre séquentielle (a, b, c…) pour chacune des photos d'une même page. J'ai fait de même pour mes diapositives en utilisant "Carousel xx Diapo xx". Ainsi, j'ai un nom unique simple pour mes photos et mes fichiers et du même coup une référence au document / photo original.

      J'ai utilisé un chiffrier électronique pour la documentation de mes photos (voir ci-bas). Dans le chiffrier, chaque photo occupe une ligne du classeur. Les colonnes du chiffrier  sont utilisée pour stockée les informations de la photo soit: la référence à l'original, la date (année), l'événement ou occasion et finalement la description du contenu de la photo.

      Pour trouver la ou les photos qui m'intéressent, j'utilise la fonction recherche du logiciel principalement sur la colonne "description". Ainsi, si je désire visualiser toutes les photos où apparaît un membre de la famille Vincent, je fais une recherche sur "Vincent" ; si je désire localiser les photos d'anniversaire d'Anik, je fais une recherche sur "anniversaire" et "Anik", ainsi de suite. Question de commodité, j'ai aussi développé un hyperlien entre l'identification de la photo et la photo en question. Ainsi si je veux voir la photo je "clic" sur son identification et la photo m'apparaît. Vous pouvez aussi vous servir des fonctions de tri (exemple, tri les photos par année) et des fonctions filtre (par exemple, toutes les photos prises en 1975).

Équipement logiciel:

      L'achat de mes différents logiciels est basé sur les principes suivants:

      Généralement, je n'utilise que des versions originales et valides de logiciel (vs pirater). J'utilise les logiciels fournis avec l'achat de matériel (scanner, imprimante…) ou simplement j'achète des logiciels vendus en magasin ou sur Internet. Ainsi, en plus de respecter les lois, je peux bénéficier des mises à jour et du support technique des fournisseurs (très bon chez certains, pourri chez d'autres).

      Je choisie un logiciel pour l'application pour laquelle il a été conçu. Je ne crois pas tellement aux logiciels universels qui remplissent adéquatement plusieurs fonctions différentes. J'utilise donc un logiciel pour numériser les photos, un second pour le traitement des photos (amélioration…), un troisième pour les sauvegardes etc.

      Certains logiciels génèrent des fichiers "propriétaire", fichiers non lisibles par d'autres applications. Personnellement je me tiens loin de ce type de logiciels car s'ils  disparaissent (fort probable à court ou moyen terme) il vous faudra refaire une seconde et peut être une troisième fois le même travail avec d'autres logiciels.

      Je base généralement mon choix sur les caractéristiques du logiciel versus mes besoins. Par contre, le critère qui prédomine est la popularité du logiciel. Le logiciel choisi doit être dans le peloton de tête des logiciels vendus pour l'application en question (premier, deuxième ou au maximum troisième). Normalement la vie des ces logiciels est plus longue, leur qualité supérieure et ils s'adaptent mieux aux différents besoins des usagés.

      Il est par contre nécessaire que votre ordinateur respecte la configuration minimale ou encore mieux souhaitable demandée par le logiciel en question. En effet, le meilleur logiciel fonctionnant trop lentement vous rendra la vie difficile ou pire encore il ne fonctionnera tout simplement pas.

      Il faut noter que certains fournisseurs de matériel offrent des logiciels complémentaires (exemple, un logiciel de traitement de photo avec un scanner). Très souvent ces logiciels sont des sous-produits (fonctions limitées) de produits originaux. Pour utiliser certaines fonctions vous serez invité à acheter la version complète.

Logiciels utilisés pour mon projet:

      Numérisation: De façon générale j'utilise les différents logiciels qui m'ont été fournis avec mon scanner pour numériser mes documents / photos. Le pilote, est le logiciel "TWAIN  Epson Scan". J'utilise aussi les logiciels "scan to files" (nommer le fichier et le sauvegarder sous différents types de fichiers…),  "scan to application" (Word, Excel…), "scan to E'mail" (votre logiciel de courriel), "Copy" (votre imprimante) et finalement "scan to OCR", un logiciel de reconnaissance de caractères développé par FineReader et fourni par Epson (logiciel générant un fichier texte éditable incluant les caractères accentués). Ces différents logiciels sont initiés via l'interface "Epson Smart Panel". Dans certains cas, je numérise directement de certaines applications telles que Photoshop Elements, Word, Excel, etc…

      Modification de photo: il existe une foule de logiciels (gratuit, peu dispendieux, dispendieux et même très dispendieux …) pour corriger et modifier les photos. Certains sont très simples tandis que d'autres très complexes. Pour ma part, basé sur mes critères de choix (ci-haut), j'ai acheté  le logiciel Adobe Photoshop Elements 3 (maintenant 7) au coût d'environ $80. C'est un logiciel quelque peu complexe d'utilisation (philosophie Adobe) offrant beaucoup de possibilités (sous-ensemble de Photoshop CS4). Votre goût pour la photographie et pour l'exploitation des possibilités informatiques, est sans doute un bon guide pour le choix de ce type de logiciel. Il est important d'expérimenter quelques peu certains logiciels avant de faire votre choix final. Le logiciel Microsoft Photo Editor (fourni gratuitement avec Office), le logiciel Adobe Photoshop Album Édition Découverte 3.2 (gratuit chez Adobe) ou tout autre logiciel gratuit sur Internet peuvent être des choix intéressants pour cela.

      Classement & Documentation: plusieurs logiciels gratuits ou très peu dispendieux ont été développés pour ce type d'application. De plus, plusieurs logiciels de modification de photo (entre autre Photoshop Elements) offrent la possibilité de documenter et de classer les photos. Par contre, la très grande majorité de ceux-ci génèrent des fichiers "propriétaires" (voir hints ci-haut). J'ai donc écarté cette option. J'ai plutôt opté pour Excel un logiciel de type plus général que je connais bien. Ce logiciel permet un classement simple (lignes et colonnes) et offre des fonctions élémentaires de base de donnée (tri, filtre, recherche…) et sa survie sera sans doute plus longue qu'un logiciel spécialisé.

      Visualisation des photos / documents: Encore là, il existe plusieurs logiciels pour visualiser vos images. Mon préféré demeure le logiciel "Aperçu des images et des télécopies Windows" fourni gratuitement avec Windows XP. Ce logiciel offre une navigation simple dans un même répertoire, les diaporamas, le zoom, la rotation, les annotations simples, l'impression, la conversion de format de fichiers, etc. Il est simple et efficace.

      Sauvegarde: L'utilitaire de sauvegarde fourni avec Windows peut sans doute être utilisé pour cette fonction. C'est un logiciel simple et efficace. Par contre, il génère des fichiers "propriétaires". C'est peut-être un peu moins risqué avec Microsoft même si j'ai déjà vu un cas d'incompatibilité entre 2 versions de leur logiciel de backup. Ça demeure quand même une solution intéressante. Pour ma part j'y préfère un logiciel de comparaison et de synchronisation de fichiers que je connais bien soit le logiciel Beyond Compare de la compagnie Scooter Software. Ce logiciel a l'avantage de créer et de maintenir une image miroir de vos fichiers (dans le même format, donc vous pouvez les accéder normalement sans logiciel particulier). Par contre, il coûte environ $30 et il est quelque peu complexe pour ce type d'application car à la base il a été conçu pour des informaticiens dans le but de comparer des fichiers. Si vous n'avez que ce travail de backup à faire, je ne vous recommanderais pas nécessairement ce logiciel mais plutôt l'utilisation du logiciel "Utilitaire de sauvegarde" fourni gratuitement avec Windows XP

Équipement matériel:

         Le numériseur (scanner)

      Celui-ci est au cœur de la numérisation de photos et de documents. Il existe deux grands types de scanner soit:

      les scanners de films qui sont conçu pour numériser de petits documents transparents tel que négatifs, diapos, etc. Ils sont plutôt de type professionnel, spécialisé, rapide et efficace. Par contre ils sont relativement dispendieux et ils ne remplacent pas un scanner de type conventionnel (flatbed). Si vous avez beaucoup de documents transparents (négatifs, diapos…) à numériser de façon ponctuelle, vous pouvez faire ce que certains font, c'est à dire acheter (neuf ou usagé) ce type de scanner et le revendre après votre projet. 

      les scanners de type "flatbed" sont les plus populaires. Ceux-ci sont conçu pour numériser les documents jusqu'à 8½" x 11" et même plus. De plus, certains modèles  offrent l'option de numériser les négatifs et les diapositives. Il est certain que les résultats sont moins bons qu'avec les scanners spécialisés, mais ils sont tout de même acceptables. Beaucoup de compagnies offrent ce type de scanner (flatbed) et cela à tous les prix (de $50 à plusieurs centaines de $). Parmi ces compagnies, certaines sont reconnues, sont sur le marché depuis plusieurs années et offrent de bons produits; nous avons entre autre Hewlett Parckard et  Epson.

Mon approche personnelle

      Pour ma part, en 2005, je me suis acheté un scanner Epson modèle perfection 4180. Je demeure convaincu que c'est un bon choix pour ce type de projet. Ce modèle n'est plus disponible aujourd'hui, mais le modèle contemporain équivalent est le perfection 4490. Vous trouverez ci bas les spécifications de ces deux scanners.

 

Epson 4180

Epson 4490

Type de scanner

Flatbed couleur

Flatbed couleur

Résolution optique

4800 dpi

4800 dpi

Résolution matérielle

4800 x 9600 dpi

4800 x 9600 dpi

Résolution max (logiciel)

12800 dpi

12800 dpi

Surface max de lecture

8,5 po x 11,7 po

8,5 po x 11,7 po

Interface

USB 1.1 / 2.0

USB 2.0

Vitesse de scan à 4800 dpi

17 msec / ligne

17 msec / ligne

Accessoires incluant lampe et supports pour scanner:

Diapositives 35 mm, négatifs et transparents de 2¼"

Diapositives 35 mm, négatifs et transparents de 2¼" et plus

Prix

$245 (en 2005)

$175 (en 2008)

      Finalement, vous trouverez ci-bas quelques informations pertinentes relatives à la configuration de l'ordinateur que j'ai utilisé pour mon projet. Ce système a bien fait la "job" par contre, je ne considère pas qu'il était surdimensionné.

 

  Ordinateur Intel Pentium 4
Carte maîtresse ASUSTek P4P800
  CPU Intel 2.40 GHz
  Mémoire Ram  1.5 Go dual channel
  Disques dur IDE WDC WD2500AAJB de 250 GO

 

Disque dur USB WD My Book de 500 Go
  Graveur / Lecteur DVD Lecteur LG, 16X (DVD) et 48X (CD)
Graveur LG, 6X / 16X (DVD) et 32X / 48X (CD)
  Scanner Epson Perfection 4180
  Ecran LG Flatron W2254TQ
  Imprimantes Brother HL 2140 (laser)
HP Photosmart 7150
  Système d'exploitation Windows XP professionnel 32 bit SP-3