Uit Hack42
Ga naar: navigatie, zoeken
Project: Boeken Scannen
Schroefje24.png
Schroefje24.png
Schroefje24.png
Schroefje24.png
Boeken Scannen Picture.jpg

Boeken Scannen

Naam Boeken Scannen
Door Allen
Status Uitvoer
Madskillz Yes
Doel / Omschrijving
Handleiding boeken scannen voor het Computermuseum
Alle Projecten - Project Toevoegen
File:Boeken Scannen_Picture.jpg noez


Project Boekenscannen

In het museum staat een tafel met een scanner, een laptop en een externe harddisk. Dit is om boeken te scannen voor het museum, zodat de disk uiteindelijk aan archive.org geleverd kan worden, en iedereen weer blij is met documentatie

Op dit moment wordt er gebruik gemaakt van een perl-script dat scanimage met de juiste argumenten aanroept. Deze argumenten worden bepaald door het soort scan wat gedaan moet worden.

Het script scan staat in het zoek-pad dus werkt als een simpel commando.

Gebruik scan als volgt:

scan <paginasoort>

Waarbij paginasoort gedefinieerd wordt in een bestand, scan.ini in de huidige directory of ergens in een paar niveaus hoger. Dat laatste is makkelijk bij het scannen van een serie van dezelfde soort boeken, dan hoeft het bestand niet zoveel heen en weer gekopieerd te worden.

Het resultaat van de scans, een hele verzameling TIFF files met elk één pagina, komt op de externa harddisk, in de directory scans/ (omdat deze drive gemount is, komt dat uit op /media/scan/INTENSO/scans/

Stappenplan

In eerste instantie alleen de losbladige boeken, die zijn het makkelijkste snel te verwerken.

  1. Ga achter de laptop in het museum zitten; gebruik het account SCAN (heeft geen wachtwoord).
  2. Pak een boek losbladige binder uit een van de sinaasappeldozen, en pak er een hoofdstuk (of deel er van, max. vijftig pagina's) uit. Ook tabbladen, schutbladen, etc. .
  3. Maak in /media/scan/INTENSO/scans/ een directory aan met de titel van het boek, of de binder (voorbeeld: "VMS System Management"). Gebruik zoveel mogelijk letterlijk de titel van het boek, met hoofd en kleine letters. Vervang dubbele punten en slashes en zo door min-tekens of vergelijkbare tekens zodat het er nog leesbaar uitziet.
    • maak subdirectories aan voor elk hoofdstuk, als het grote hoofdstukken betreft, of als er tabbladen tussen zitten die niet door de ADF (doorvoerscanner) heen kunnen.
  4. Maak in elke net gemaakte directory een tekstbestand scan.ini met daarin de opties voor het scannen van de verschillende soorten pagina's.
  5. Plaats de vellen papier in de scanner: een tabblad (indien aanwezig) op de scanner, de rest in de Automatic Document Feeder (ADF).
    • Op de flatbed scanner, plaats de pagina met de beeldzijde naar onder (duh), op zijn kop (met de bovenkant onder dus) op de glasplaat, tegen het driehoekje linksonder. Indien de pagina niet past, bijvoorbeeld met letter-size tabbladen, laat dan de perforatiezijde een beetje links uitsteken, als de rechterkant maar op de plaat ligt.
    • In de ADF, plaats een pak papier van maximaal ongeveer 50 pagina's op zijn kop, met de eerste pagina van je af, zodat je alleen de laatste pagina nog ziet
  6. Ga naar de betreffende directory en voer daar het commando scan paginasoort uit, met voor paginasoort de paginasoort uit scan.ini. Voorbeeld: scan front.
    Deze laatste stap moet vanuit een terminal sessie worden uitgevoerd.
  7. De scans worden automatisch genummerd, met doorlopende nummering als je het volgende stapeltje pagina's invoert.
  8. Doe de gescande pagina's terug in de binder, en doe deze na het scannen in de IKEA-bak 'verwerkt'

scan.ini

De scan.ini file is een standaard ini-file geformatteerd tekstbestand, met secties en daarin opties met parameters.

Voorbeeld:

[page]

source = adf
mode = color
size = letter

[front]

source = flatbed
mode = color
size = fullsize

Mogelijke parameters en hun waardes zijn:

  • size
    • a4: 21 x 29.7 mm (default)
    • letter: 8.5 x 11 in
    • fullsize: zo groot mogelijk, alleen op de flatbed
  • mode
    • blackwhite: zwart/wit (2) (default)
    • grayscale: grijstonen (256)
    • color: kleuren (256x256x256)
  • source
    • adf: in de sheetfeeder (dubbelzijdig) (default)
    • adf-ss: in de sheetfeeder (enkelzijdig)
    • flatbed: onder de klep

Op dit moment werkt de flatbed optie alleen nog maar met fullsize.

Er kunnen meerdere secties met verschillende namen in de scan.ini file worden gedefiniëerd, zoals in het voorbeeld.