August 27th, 2013

HTScan: чемодан - предварительные данные

Дисклеймер: это предварительный отчёт по проекту обработки семейного фотоархива

Массив фотографий из чемодана был оцифрован с помощью высокопроизводительного сканера за время ~2 рабочих дня. Глубина оцифровки технически исчерпывающая - не были оцифрованы только материалы, к которым поточное сканирование не применимо: очень маленькие фотографии, приклеенные к картону фото и негативы на прозрачных плёнках. Проблема неполного охвата компенсируется тем, что все фиксированные фотографии были оцифрованы низкопроизводительным сканированием ранее, очень маленькие фотографии являются уменьшенными дубликатами, а число несканируемых плёнок исчисляется единицами.
Суммарно получено 3980 изображений на 5Гб, использовался 300 DPI (для обеспечения высокой производительности), двусторонний режим, цветное изображение с минимальными сжатием и кодирование алгоритмом JPEG.
Основные технические проблемы - необходимость ручного контроля подачи в случае жёсткой фотобумаги с механическими искривлениями (которой в старых фотоархивах очень много).
Следующим этапом будет предварительный процессинг изображений: удаление ложнопложительных пустых сканов, обрезка белых областей границ, поворот и контроль дубликатов.