Project: Boeken Scannen | |
---|---|
Naam | Boeken Scannen |
Door | Allen |
Status | Uitvoer |
Madskillz | Yes |
Doel / Omschrijving | |
Handleiding boeken scannen voor het Computermuseum | |
Alle Projecten - Project Toevoegen |
Project Boekenscannen
In het museum staat een tafel met een scanner, een laptop en een externe harddisk. Dit is om boeken te scannen voor het museum, zodat de disk uiteindelijk aan archive.org geleverd kan worden, en iedereen weer blij is met documentatie
Op dit moment wordt er gebruik gemaakt van een perl-script dat scanimage met de juiste argumenten aanroept. Deze argumenten worden bepaald door het soort scan wat gedaan moet worden.
Het script scan
staat in het zoek-pad dus werkt als een simpel commando.
Gebruik scan
als volgt:
scan <paginasoort>
Waarbij paginasoort gedefinieerd wordt in een bestand, scan.ini
in de huidige directory of in een van de bovenliggende directories. Dat laatste is makkelijk bij het scannen van een serie van dezelfde soort boeken, dan hoeft het bestand niet zoveel heen en weer gekopieerd te worden.
Het resultaat van de scans, een hele verzameling TIFF files met elk één pagina, komt op de externa harddisk, in de directory scans/
(omdat deze drive gemount is, komt dat uit op /media/scan/INTENSO/scans/
Stappen
Verwerk in eerste instantie de losbladige boeken/binders, die zijn het makkelijkste snel te verwerken.
- Ga achter de laptop in het museum zitten; gebruik het account SCAN (heeft geen wachtwoord).
- Pak een
boeklosbladige binder uit een van de sinaasappeldozen, en pak er een hoofdstuk (of deel er van, max. vijftig pagina's) uit. Ook tabbladen, schutbladen, etc. . - Maak in
/media/scan/INTENSO/scans/
een directory aan met de titel van het boek, of de binder (voorbeeld: "VMS System Management"). Gebruik zoveel mogelijk letterlijk de titel van het boek, met hoofd en kleine letters. Vervang dubbele punten en slashes en zo door min-tekens of underscores zodat het er nog leesbaar uitziet.- maak subdirectories aan voor elk hoofdstuk, als het grote hoofdstukken betreft, of als er tabbladen tussen zitten die niet door de ADF (doorvoerscanner) heen kunnen.
- Maak in elke net gemaakte directory een tekstbestand
scan.ini
met daarin de opties voor het scannen van de verschillende soorten pagina's. - Plaats de vellen papier in de scanner: een tabblad (indien aanwezig) op de scanner, de rest in de Automatic Document Feeder (ADF).
- Op de flatbed scanner, plaats de pagina met de beeldzijde naar onder (duh), op zijn kop (met de bovenkant onder dus) op de glasplaat, tegen het driehoekje linksonder. Indien de pagina niet past, bijvoorbeeld met letter-size tabbladen, laat dan de perforatiezijde een beetje links uitsteken, als de rechterkant maar op de plaat ligt.
- In de ADF, plaats een pak papier van maximaal ongeveer 50 pagina's op zijn kop, met de eerste pagina van je af, zodat je alleen de laatste pagina nog ziet
- Open een terminal, en ga naar de directory
/media/scan/INTENSO/scans/NaamVanHetBoek/ChapterZoveel
. Voer daar het commandoscan paginasoort
uit, met voor paginasoort de paginasoort uitscan.ini
. Voorbeeld:scan front
. - De scans worden automatisch genummerd, met doorlopende nummering als je het volgende stapeltje pagina's invoert.
- Doe de gescande pagina's terug in de binder, en doe deze na het scannen in de IKEA-bak 'verwerkt'
scan.ini
De scan.ini
file is een standaard ini-file geformatteerd tekstbestand, met secties en daarin opties met parameters.
Voorbeeld:
[page] source = adf mode = color size = letter [front] source = flatbed mode = color size = fullsize
Mogelijke parameters en hun waardes zijn:
- size
- a4: 21 x 29.7 mm (default)
- letter: 8.5 x 11 in
- fullsize: zo groot mogelijk, alleen op de flatbed
- mode
- blackwhite: zwart/wit (2) (default)
- grayscale: grijstonen (256)
- color: kleuren (256x256x256)
- source
- adf: in de sheetfeeder (dubbelzijdig) (default)
- adf-ss: in de sheetfeeder (enkelzijdig)
- flatbed: onder de klep
Op dit moment werkt de flatbed optie alleen nog maar met fullsize.
Er kunnen meerdere secties met verschillende namen in de scan.ini
file worden gedefiniëerd, zoals in het voorbeeld.