Напишите нам

Откуда о нас узнали:

Тенденции развития качественного сканирования  

Тенденции развития качественного сканирования.

Napster, MP3, YouTube, iPhone and MySpace. Вы можете спросить себя, что общего между данными названиями и сканированием? В реальности не так уж много общего, кроме как большого размера файла. Однако мы попытаемся провести аналогию между крупными аудио файлами, которые можно найти на Napster, таких файлов как wav или mp3. Видео файлов, которые можно найти на YouTube и MySpace. Данные файлы вы можете легко использовать на своих мобильных устройствах, таких как iPhone, с помощью использования данного устройства, вы научитесь ценить проблему скорости передачи больших файлов. И конечно, просмотр изображений документов стало столь же важным, если не более важным с точки зрения бизнеса. Мы должны иметь четкое представление и понимание общих технологических тенденций обмена информацией, а также представление сканирования в более высоком качестве.
 
В идеальном мире технология сканирования должна быть такой, что кто-то бросает документ в сканер с автоматической подачей документов, сканируется страница и "вуаля", все жизненно важные бизнес -данные автоматически извлекаются и заносятся для немедленного использования в Enterprise Content management (ECM) систему, или для производства общего поиска по ключевым словам. Это похоже на использование поисковой системы поиска информации, которую мы ищем. Магия? Похоже на это, но главное в этом , то, что это всё возможно с помощью, использования существующих технологий. С технической точки зрения современной системы обработки форм, или способности выполнять сложные автоматические задачи, эта реальность доступна сегодня. «Магия» начинается с высокого качества сканирования изображений, которые наиболее близки к оригиналу. В автоматической обработке форм приложений, есть много того, что происходит за кулисами, где плохое или хорошее качество изображения определяет успех или неудачу, среди других связанных с ними процессов в схеме системы визуализации документов. Эти функции должны быть очень функциоанальным, точными и прозрачными для самих пользователей.
 
В недавнем исследовании пользователей сканеров, Сьюзен Мойс из консалтинговой фирмы «Moyse Technology» ,были подведены текущие тенденции: «Пользователи сканеров нуждаются в таком приложении, которое сделает процесс более автоматическим». Это подталкивает поставщиков поставлять более сложный по функциоальности продукт. Поэтому, чем меньше пользователи знают о базовых технологиях, тем лучше. Бизнес-пользователи хотят простое сканирование для решения своих проблем.
 
Традиционные препятствия рассматриваются Advanced Technology.
 
Расширенные возможности с той точки зрения , что пользовательские системы могут быть разработаны: системными интеграторами, реселлерами или профессиональными организациями услуг, с учетом всех ваших индивидуальных потребностей бизнеса. Эффективная система захвата документа представляет собой систему, где оператор не должен думать. Захват большего количества точек на дюйм в совокупности с меньшим временем сканирования даёт вашему решению наибольшие шансы на успех автоматизации. Скорее всего, ваше решение не будет абсолютно идеальным, тем не менее, давая вашему решению, наибольшие шансы на успех, благодаря хорошему качеству изображения, большему количеству точек на дюйм и большей работы с бумагой. Данные критерии могут значительно повысить уровень автоматического сканирования документов.
Есть передовые технологии, такие как автоматическая классификация докуметов и их разделение в свободной форме обработки, которое во многом зависет от компьютера, т.е его возможности считывать точки на отсканированных страницах, чтобы делать умные и сложные решения по этим изображениям. В конце концов, исключая весь мусор, документ, который находится у вас на рампе, превращается в бумагу с полезными электронными данными. Чаще всего вы получаете один шанс, чтобы запечатлеть документ, прежде чем он попадет в постоянный архив или будет выброшен.
 
Чтобы понять эти тенденции и развивать нашу гипотезу о будущем сканирования документов, мы должны оценить то, что препятствует обмену большими файлами в первые дни совместного использования файлов. В то же время способность разделения аудио, видео и изображений была ограничена общими факторами в течении долго времени. Взаимосвязь между всеми форматами файлов, они исторически были больших размеров и их использование в компьютерных сетях было затруднено. Давайте взглянем назад в нестоль отдаленное прошлое, и получим предаставление о том, что в конечном счете сделали YouTube, MySpace и Napster. И что из данных методов будет успешно стимулировать направление автоматического сканирования в высоком разрешении. Одним из самых очевидных недостатков обмена большими файлами являлось отсуствие пропускной способности. Обычно это был удаленный пользователь dial-up подключения или он работал в корпоративной сети, которая изначально не была запланирована для обмена большими файлами. Неудовлетворенность клиентов была высокой и люди не хотели использовать эти услуги из-за предстоящего разочарования ожидания долгого время загрузки. Кроме того обмен и заргрузка видео была очень долгой до недавнего времени. Однако времена меняются, а вместе с ней меняется и увеличение пропускной споособности. Поэтому мы должны обраться к истории, чтобы понять, что ограничивает скорость внедрения этих технологий.
 
Факторы, влияющие на развитие сканирования с более высоким разрешением.
 
Большинство ведущих автоматизированных компаний по разработке программного обеспечения для обработки изображений, рекомендуют сканировать при минимальном разрешении в 300 точек на дюйм для эффективного извлечения данных. Другими словами, на каждый квадратный дюйм бумаги сканер захватывает 300 точек по горизонтали и 300 точек по вертикали или 90.000 общих точек (300*300=90000 точек на квадратный дюйм). Такая автоматизация уменьшает ручной труд, такой как «ключевые значения идексов изображения», которые в свою очередь снижает затраты и повышает эффективность. Некоторые методы, с которыми вы можете быть знакомы, это оптическое распознование символов (OCR), интеллектуального распознования символов (ICR) и оптического распознования ошибок (OPM).
 
Допустим, мы остановились на сканировании 200 точек на дюйм.е мы захватили всего только 40.000 общих точек на дюйм по сравнению с 90000 точек на дюйм. Почему это важно? Ниже приведен пример, который демонстрирует, как постепенно растёт размер файла при более высоких разрешениях сканирования и использования цвета.Сканирование с повышенным разрешением автоматически влечет за собой увеличение точности.
«Точность системы распознавания резко сократилась, когда разрешение изображения было уменьшено с 300 до 200 точек на дюйм...»
 
Источник: Четвертый ежегодный тест по точности распознавания текста ( http://stephenvrice.com/images/AT-1995.pdf )
 
«Качество сканирования: Количество точек на дюйм может повлиять на четкость изображения и точность распознования. Недавние тесты показали, что снижение сканирования с 300 точек на дюйм до 200 точек на дюйм увеличит возможность возникновения ошибки на 75 процентов при распозновании текста... »
 
Источник:http://epe.lac-bac.gc.ca/100/202/301/netnotes/netnotes-h/notes37.htm
 
Так вот вопрос «почему бы всегда не сканировать документы на 300 точек на дюйм?». Традиционно было несколько законных вопросов, что же сделало непривлекательным сканирование с высоким разрешением для обычных пользователей и операторов.Во-первых это ограниченная пропускная способность (как в аудио, так и в видео файлах),потеря качества изображения при их сжатии, или сканеры могут сами замедлить скорость на две-трети или меньше из-за их номинальной скорости в 200 точек на дюйм. Ну и конечно, чем больше разрешение у изображения, тем больше размер файла. Теперь, благодаря передовым технологиям и инновациям, должны решится все эти трудности, поэтому скорость сканирования повысится, а разрешение сканирования будет высоким. Позвольте мне сказать конкретную информацию о каждой из них:
 
• Увеличение пропускной способности для удаленных пользователей, а также пользователей корпоративных сетей.
 
Для тех из вас, кто пытался отправить большой файл через вашу электронную почту, то вы можете легко понять, что такое низкая пропускная способность соединения. Теперь представим оператора обслуживающего клиентов, он получает сотни изображений в день , при его нормальном рабочем дне.Снижение затрат и улучшение скорости пропускной способности сети , предоставляет сетевым администраторам или удаленным пользователям , обновление до высокоскоростных сетей, таких как интернет-линии T1, DSL, Cable Modem, Gigabit-марщрутизаторы/кабели/опто-волоконные сети. Все это служит хорошим предзнаименованием для будущего обмена большими файлами , будь это аудио-видео файл или отсканированное изображение.
 
• Методы улучшение качества изображения при их сжатии.
 
Многие новые технологии сжатия изображений были введены недавно, и резко уменьшить размер файлов из цветных и черно-белых изображений без потери качества было практически невозможно. Ранее некоторые методы сжатия плохого по качеству изображения, резко уменьшали автоматическую обработку форм точности. Для улучшения изображения и их высокой степени сжатия, теперь существует такая технология, как автоматическое определение цвета, т.е теперь можно самому определить сохранять документ в черно-белых тонах или цветных, тем самым устраняя необходимость расположения документов в стеке би-тональных или цветных изображений.Это гораздо предпочтительнее, чем сжимать черно-белый рисунок.
 
• Сканирование в высоком разрешении при номинальной скорости.
 
Также, как и двигатель вашего автомобиля может разонаться только до определенной скорости, то также и обычный сканер. Некоторые сканеры в наше время разработаны специально для работы в номинальных скоростях во время сканирования в режимах высокого разрешения, тем самым избавляет от необходимости жертвовать точностью пропускной способности в автоматизированной обработки.
 
• Снижение затрат на хранение
 
Когда счет за мегабайт информации равен доллару или нескольким долларам, предприятия должны были сделать серьезное решение о выборе среде хранения данных. В то время это могли быть: low-capacity/high-availability жесткие диски, которые находились где-то в середине ценового диапозона, или ленточные накопители: high-capacity/slow-availability хотя были более доступными. Времена изменились с развитием CD-ROM, DVD и чрезвычайно высокой емкостью жестких дисков. Хранение данных достигало критической массы, там где производители использовали высокие технологии, для конкуренции на рынке. Однако на данный момент предприятия и частные лица покупают устройства хранения данных с большей скоростью, и к счастью, данная тенденция продолжает набирать обороты. Увеличение складских мощностей, снижение затрат, что ведет к хранению всё более больших файлов.
 
• Преимущества сканирования в высоком разрешении для автоматизации процесса.
 
Учтите то, что автоматизированная обработка форм использует компьютерный интеллект, где необходимо принимать важное решение, касающиеся отсканированных изображений. Например: классификация по типу документа, сколько всего страниц, совпадают ли символы с символами оригинала и т.д По сути сканирование достигло того уровня автоматизации, что позволяет решать сложные задачи, глубокая переработка изображений и извлечение важных данных из отсканированного изображения доступно уже сегодня. Но к сожалению, это возможно только при сканировании в высоком разрешении. Возможность расположения документа в автоподатчике сканера и автоматическое использование этих сложных задач стало реальностью, без привычной нам жертвы - в ущерб высокого разрешения сканирования.
 
Тенденция к всё более распределенному сканированию очевидна. И чем больше отсканированных документов найдут своё место на рабочем столе, тем будет больше спрос. Соотвественно технологии будут улучшаться, а проблемы с которыми сталкиваются пользователи постепенно решатся. Использование современных технологий, позволят пользователям заниматься своим делом и не тратить время на изучении всех сложностей и технологических аспектов сканирования. Чем больше будет захват точек на дюйм, тем с большим разрешением вы сможете сканировать.