?

Log in

No account? Create an account
Previous Entry Share Next Entry
Постановка задачи высокопроизводительного сканирования фотографий
evfratov
Дисклеймер: это просто чёткая формулировка стоящей задачи.

Классические (как чёрно-белые, так и цветные) фотографии накопились у многих и с наступлением "цифровой эры" стали некоторым архаизмом, и что делать ними сейчас - иногда вызывает вопросы. Но оставим лирику.

Фотографии должны быть оцифрованы с помощью сканеров (сканирование более специфических оптических носителей - плёнок и фотопластинок будет обсуждено отдельно), пусть и с некоторыми артефактами - в роде занижения динамического диапазона изображения. При небольшом количестве фотографий задача тривиально решается ручным сканированием на бытовом планшетном сканере и вопросов не возникает. Но при очень большом количестве фотографий, при осложнениях в виде разной копийности с разбросом качества, при нестандартных размерах и низкокачественной бумаге... объём работы, которая требуется для ручного сканирования, становится абсурдно огромным. Однотипная обработка большого набора однотипного чего-то - однозначный вариант для автоматизации, для высокопроизводительного автоматизированного рабочего процесса. И ответ есть - автоматические документные сканеры существуют, есть промышленные решения и целые сервисные комплексы, в общем это целая индустрия. Переходим к собственно case.

Имеется гора старых фотографий, точнее чемодан. Масса была оценена по порядку на 10кг, в приближении массы одной фотографии 4г (масса листа А4) число фотографий составляет 3-4 тысячи, размер подавляющего большинства менее листа А4. Для значительного числа фотографий имеются дупликации (для ряда фотографий повторяемость составляет много десятков), есть значительный разброс качества (как разрешающей способности, так общей интенсивности, так и захваченного динамического диапазона), причём в сериях дупликаций он может быть весьма силён (невысокая воспроизводимость при печати фотографий с негатива). Фотографии напечатаны на стандартной по толщине фотобумаге за редкими исключениями, механических искажений немного. Подписи на обратной стороне, требующие двустороннего сканирования, весьма редки.

Считая среднее время сканирования 40с (перекладывание фото и т.д. , что в экспериментальных прогонах было ещё дольше) для такого числа фото требует многих десятков часов ручной работы, что недопустимо, здесь однозначно необходим автоматизированный сканер - с автоподатчиком бумаги. Непосредственно разрешающая способность (по опыту и оценкам 600 dpi часто перекрывает размер зерна, 1200 dpi необходим только в редких случаях) и скорость сканирования вполне сопоставимы и достаточны (тонкости могут быть - но их надо уточнять у специалистов или опытных) для автоматизированных сканеров в пределах $500 (эта цифра является лимитом по задаче), что сводит основные критерии выбора машины к качеству работы механизма автоподачи и его ёмкости. Ёмкость - важный параметр, потому что чем выше ёмкость, тем меньше частота вмешательств оператора и выше степень автоматизации, для данного количества фотографий ёмкость должна быть порядка сотни фото (докладывать фото не более пары десятков раз, очевидно что с падением ёмкости частота подкладываний возрастает гиперболически, что быстро убивает смысл автоподатчика на небольшой его ёмкости).

Получения просто набора сканов фотографий недостаточно, даже без какой-либо цели необходима первичная обработка: из области скана должны быть удалены пустые зоны (где нет бумаги, если фото маленькое), фото должно быть правильно ориентировано (в смысле автоповорот при сканировании попавшего фото в сканер по диагонали, безотносительно самого изображения) и должна выполняться коррекция интенсивностей изображения.
Далее должны быть удалены (или учтены) дуплицированные фото, причём учёт дупликаций должен работать хорошо - реагировать на развёрнутые фото (контроль ориентации), на смещения, на фото с различающимся качеством (учёт качества), на дефекты.
После получения скорректировнаных (первиный этап) и очищенных от повторов (учёт дупликаций) данных получается уже сканированный фотоархив. Что-то data processing напоминает NGS...
Последующие этапы - или ручная обработка, или распознавание лиц и объектов с кластеризацией, тегированием и множественными сравнениями.

Остаётся выбрать наиболее подходящее решение.