Оцифровка это: Оцифровка — Википедия – Оцифровка — это… Что такое Оцифровка?

Содержание

Оцифровка — Википедия

Материал из Википедии — свободной энциклопедии

Текущая версия страницы пока не проверялась опытными участниками и может значительно отличаться от версии, проверенной 14 сентября 2015; проверки требуют 13 правок. Текущая версия страницы пока не проверялась опытными участниками и может значительно отличаться от версии, проверенной 14 сентября 2015; проверки требуют 13 правок.

Оцифро́вка (англ. digitization) — описание объекта, изображения или аудио- видеосигнала (в аналоговом виде) в виде набора дискретных цифровых замеров (выборок) этого сигнала/объекта, при помощи той или иной аппаратуры, т. е. перевод его в цифровой вид, пригодный для записи на электронные носители.

Для оцифровки объект подвергается дискретизации (в одном или нескольких измерениях, например, в одном измерении для звука, в двух для растрового изображения) и аналогово-цифровому преобразованию конечных уровней.

Полученный в результате оцифровки массив данных («цифровое представление» оригинального объекта) может использоваться компьютером для дальнейшей обработки, передачи по цифровым каналам, сохранению на цифровой носитель. Перед передачей или сохранением цифровое представление, как правило, подвергается фильтрации и кодированию для уменьшения объема.

Иногда термин «оцифровка» используется в переносном смысле, в качестве замены для соответствующего термина[уточнить], при переводе информации из аналогового вида в цифровой. Например:

Оцифровка данных производится на специальном оборудовании, позволяющем захватить аналоговый сигнал и преобразовать его в цифровой. Оцифровкой[2] занимаются специализированные профессиональные студии (ТВ- и звукозаписывающие) и частные компании.

При оцифровке сигнала привязанного ко времени, дискретизацию обычно характеризуют частотой дискретизации — частотой снятия замеров.

При сканировании изображения с физических объектов, дискретизация характеризуется количеством результирующих пикселов на единицу длины (например, количеством точек на дюйм — англ. dot per inch, DPI) по каждому из измерений.

В цифровой фотографии дискретизация характеризуется количеством пикселей на кадр.

Аналогово-цифровое преобразование характеризуется разрядностью преобразователя в битах.

Оцифровка — Википедия. Что такое Оцифровка

Оцифро́вка (англ. digitization) — описание объекта, изображения или аудио- видеосигнала (в аналоговом виде) в виде набора дискретных цифровых замеров (выборок) этого сигнала/объекта, при помощи той или иной аппаратуры, т. е. перевод его в цифровой вид, пригодный для записи на электронные носители.

Для оцифровки объект подвергается дискретизации (в одном или нескольких измерениях, например, в одном измерении для звука, в двух для растрового изображения) и аналогово-цифровому преобразованию конечных уровней.

Полученный в результате оцифровки массив данных («цифровое представление» оригинального объекта) может использоваться компьютером для дальнейшей обработки, передачи по цифровым каналам, сохранению на цифровой носитель. Перед передачей или сохранением цифровое представление, как правило, подвергается фильтрации и кодированию для уменьшения объема.

Иногда термин «оцифровка» используется в переносном смысле, в качестве замены для соответствующего термина[уточнить], при переводе информации из аналогового вида в цифровой. Например:

Оцифровка данных производится на специальном оборудовании, позволяющем захватить аналоговый сигнал и преобразовать его в цифровой. Оцифровкой[2] занимаются специализированные профессиональные студии (ТВ- и звукозаписывающие) и частные компании.

Дискретизация

При оцифровке сигнала привязанного ко времени, дискретизацию обычно характеризуют частотой дискретизации — частотой снятия замеров.

При сканировании изображения с физических объектов, дискретизация характеризуется количеством результирующих пикселов на единицу длины (например, количеством точек на дюйм — англ. dot per inch, DPI) по каждому из измерений.

В цифровой фотографии дискретизация характеризуется количеством пикселей на кадр.

Аналого-цифровое преобразование

Аналогово-цифровое преобразование характеризуется разрядностью преобразователя в битах.

Примечания

Ссылки

Литература

Что значит оцифровка | Оцифровка

Моя студия занимается оцифровкой почти всех существующих форматов, так что давайте разберемся что же это значит и зачем это нужно.

 

Оцифро́вка (англ. digitization) — описание объекта, изображения или аудио- видеосигнала (в аналоговом виде) в виде набора дискретных цифровых замеров (выборок) этого сигнала/объекта, при помощи той или иной аппаратуры, т. е. перевод его в цифровой вид, пригодный для записи на электронные носители. (©Википедия)

 

Проще говоря процесс оцифровки- это перевод какой-либо аналоговой величины в цифровую форму.
Полученный в результате оцифровки массив данных («цифровое представление» оригинального объекта) может использоваться компьютером для дальнейшей обработки, передачи по цифровым каналам, сохранению на цифровой носитель. Перед передачей или сохранением цифровое представление, как правило, подвергается фильтрации и кодированию для уменьшения объема.

Оцифровка бывает нескольких видов:
• Оцифровка звука;
• Оцифровка видео;
• Оцифровка киноплёнки;
• Оцифровка изображения;
• Оцифровка архивных документов — сканирование, каталогизацияи создание электронного архива
• Оцифровка книг — как сканирование, так и в дальнейшем распознавание;
• Оцифровка бумажных карт местности — означает сканирование и, как правило, последующую векторизацию (растрово-векторное преобразование, т. е. перевод в формат векторного описания).

Оцифровка данных производится на специальном оборудовании, позволяющем захватить аналоговый сигнал и преобразовать его в цифровой.

С тем что такое оцифровка мы разобрались, но зачем же она нужна?
А вот зачем. Информация представленная в аналоговой форме имеет свойство искажаться, портиться, а то и вовсе будет утеряна в результате старения носителя. Так, например, магнитные ленты в видеокассетах со временем размагничиваются, осыпаются, что несомненно отражается на качестве картинки, и спустя какое-то время видео может просто не поддаться восстановлению. В противовес аналоговому носителю возьмем цифровой DVD диск. Производители заявляют, что эксплуатационный срок диска составляет 100 лет. Так ли это? Возможно при правильном хранении, но в любом случае, срок хранения увеличивается в разы, а это десятки лет, да и цифровые данные всегда можно залить в интернет и на облако, где они уж точно будут храниться чуть ли не вечно. Однако срок хранения не единственное преимущество цифрового перед аналоговым, не менее важным фактором является то, что при копировании с цифры на цифру мы абсолютно не теряем качества, в то время как при перезаписи аналоговых данных с каждой новой копией теряется 15% и это число возрастает по экспоненте от копии к копии.

 

Подведем итоги, цифровая революция свершилась. Аналоговые носители перешли в разряд ретро и используются в основном энтузиастами и художниками. Для лучшего качества, удобного хранения и быстрого доступа к данным используйте цифровые форматы данных, а если у вас есть что-то старое нуждающееся в оцифровке, то приносите нам, мы знаем что делать!

Похожие статьи:

Поделитесь в соц.сетях:

Что такое оцифровка? — CNews

Существует несколько вариантов организации процессов оцифровки. Они могут производиться самостоятельно или с аутсорсингом услуг, с вывозом документов или выполнением работ на своей территории. При оцифровке могут применяться офисные, профессиональные документные или планетарные сканеры. Данные могут извлекаться в ручном, полуавтоматическом или автоматическом режимах, с проведением предварительной архивной обработки бумажных документов или классификацией информации уже в электронном виде и т.д.

Какой путь выбрать?

Решение зависит от конкретной задачи, потому что каждое из вышеупомянутых «или» определяет качество получаемого результата и стоимость работ. Например, извечен вопрос сшитых документов: выгодней медленно отсканировать в сшитом состоянии или потратиться на расшивку, зато быстро оцифровать на документных сканерах?

Самый простой способ выбрать наиболее подходящий для вас путь – обратиться за экспертизой к специализирующейся на оцифровке организации. Заинтересованные в работах, крупные компании проведут обследование бесплатно, и за вас определят оптимальный подход. Не пренебрегайте этой возможностью и не ждите склонения к заказу услуг: большинство этих компаний также заинтересованы в поставке оборудования и ПО для самостоятельной оцифровки.

Сколько документов нужно сканировать?

Определяющий параметр – объем документов.

Определяющий параметр – объем документов. Для ежедневного сканирования небольших пачек расшитых документов (например, первичной бухгалтерии) подойдет обычный офисный сканер, выдерживающий нагрузку в несколько тысяч страниц в день. Нужно лишь дополнить его удобной программой для индексирования.

Для регулярного сканирования больших объемов необходимо профессиональное оборудование. Это – промышленные сканеры, которые стоят немалых денег (подобное оборудование используют ФНС, ФТС, крупные банки). Поэтому менее дорогой альтернативой может стать рамочное соглашение на оказание периодических услуг оцифровки.

Перевод в электронный вид больших ретроспективных массивов своими силами экономически не обоснован: помимо закупки оборудования и обучения сотрудников, потребуются значительные трудовые и временные затраты. Однозначно эффективнее заказывать услугу, так как крупная компания может выделить большой штат и решить задачу оперативно. 

Где сканировать документы?

Определяющий параметр – востребованность сканируемых документов. Влияет ли на деятельность организации изъятие документов на время сканирования? Особенно это критично при оцифровке документов, к которым регулярно обращаются сотрудники, либо которые могут быть внезапно запрошены контролирующим органом, а также для устранения связанных с документами ЧП. Примеры: финансовые и кадровые документы, техническая и эксплуатационная документация, книги ЗАГС и другие отраслевые фонды.

Участок сканирования, организованный в помещениях компании-заказчика услуг.

Если необходимо оцифровать их достаточно быстро, то традиционным подходом является заказ услуг с выездом бригады сканирования на вашу территорию. Зачастую это оказывается дешевле, чем доставлять документы на производство исполнителя и обратно, но все определяет территориальная удаленность. Регламент выездных работ подразумевает сканирование выданного дела в течение одного-двух  рабочих дней, без длительного изъятия из рабочего процесса. 

Расшивать ли документы?

Определяющие параметры: состояние документов и возможность расшивки. Если есть такая возможность, и бумага пригодна для протяжки документным сканером, то следует расшивать. Дело в том, что сканирование сшитых документов на планетарном (книжном) сканере в несколько десятков раз медленнее потоковой оцифровки. Пропорционально увеличиваются время работ и стоимость труда. Сканирование на документных сканерах, даже с учетом расшивки, оперативнее и дешевле.

Расшивать можно самостоятельно, а можно доверить это исполнителю.

Расшивать можно самостоятельно, а можно доверить это исполнителю: если выбрана авторитетная компания, опасаться утраты документов не стоит. Наоборот, жесткая регламентация всех процессов и качественные материалы позволяют компаниям застраховаться от дополнительных финансовых потерь и ущерба имиджу. Этому подходу доверяют даже российские суды: при организации сканирования обычно внутренним приказом разрешается расшивка и последующая сшивка судебных дел.

К слову, крупные компании параллельно могут провести профессиональную архивную обработку: во-первых, часть работ итак выполняется при подготовке к сканированию, во-вторых, архивная обработка помогает выявить невостребованные документы и сократить объемы сканируемых массивов, что может снизить стоимость работ.

Какое качество выбрать?

Сегодня высококачественно можно отсканировать любой объект: от маленькой библиотечной карточки до карт формата 8А0 и театральных декораций.

Определяющие параметры: вид документа и объем получаемого ресурса в электронной форме. Сегодня сканирующее оборудование позволяет получать образы с разрешением от 200 до 1200 точек на дюйм (dpi). Для художественных произведений обычно применяется разрешение 400–600 dpi, позволяющее создавать высококачественные репродукции. Более высокое качество используется только при необходимости увеличения изображения и детализации мелких предметов, например, монет.

Детализированные и неконтрастные чертежи, часто выполненные на кальке и синьке, нуждаются в сканировании с разрешением 300-400 точек на дюйм и дополнительной обработке изображений в графических редакторах. Остальные документы обычно сканируются с разрешением 300 dpi, достаточным для распечатки копий без потери качества. Необходимая обрезка изображений, геометрическое исправление, цветокоррекция, конвертация в форматы pdf, tiff, jpegи др. может проводиться в полностью автоматическом режиме программами, встроенными в сканирующее оборудование или поставляемыми вместе с ним.

В большинстве случаев используется цветной режим съемки. Это нужно для всех документов, в которые вносились исправления или ставились печати поверх текста, для удостоверения того, что электронная копия снималась с оригинала документа с печатью и подписью, а также для читаемости угасающих текстов и передачи уникальных особенностей оригинала. Необходимость цветного сканирования художественных произведений не обсуждается. Режим «градации серого» применяется лишь в некоторых случаях: когда документы не содержат цветных атрибутов, либо когда необходимо сократить объем получаемого электронного ресурса.

Сканирование может осуществляться самостоятельно. Главной задачей становится обучение сотрудников правильной работе со сложной техникой, так как качество получаемых изображений важно для последующего индексирования: плохо отсканированный документ, тени, засветка и другие дефекты на электронном образе могут сделать нечитаемой важную информацию. Это не позволит применить технологии автоматического извлечения данных и может привести к ошибкам в индексировании. Загрузка ошибочных данных в некоторые системы (государственные реестры, бухгалтерские учетные системы) не позволительна.

Индексирование

Простое сканирование применяется редко, поскольку при последующей работе искать информацию в наборе графических файлов будет лишь немногим проще перелистывания бумаги. Для возможности поиска необходимо выделить в документе несколько атрибутов (индексных полей).

Сотрудники, задействованные в массовом индексировании документов методом ручного ввода.

Выделенные атрибуты можно внести в имя файла. Такая практика сложилась в российских судах: для того чтобы оператор сканирования не имел доступа к внутренним системам суда, при оцифровке все необходимые реквизиты вносятся в имя файла. В последующем эти реквизиты распознаются системой судопроизводства при загрузке каждого документа по отдельности.

Но обычно оцифрованные документы загружаются в информационную систему группой, что требует создания базы данных. Так, если необходимо прикрепить документ к уже существующей карточке в учетной системе, бывает достаточно извлечь пару однозначно определяющих его реквизитов – обычно номер и дату.

Если же нужно сформировать поисковую базу на основании самих документов, то объем извлекаемых данных определяется задачей: от пары реквизитов для поиска файла в электронном архиве до переноса всей значимой информации в аналитическую БД  (ФИО, адресов, ИНН, КПП, дат, номеров документов-приложений и т.д.).

Свои правила индексирования применяются в музеях, библиотеках и архивах при оцифровке единиц хранения и учетных документов. Отдельным направлением услуг также является векторизация, которая применяется, в частности, при оцифровке каротажных лент (автоматическая) и чертежей (ручная отрисовка в CAD-системах).

Сколько данных извлекать?Ответ на этот вопрос также лучше получить, воспользовавшись экспертизой, так как количество извлекаемых реквизитов зависит от функциональной задачи и в значительной мере определяет стоимость оцифровки. В некоторых случаях можно ограничиться подборками документов, когда электронные образы объединяются под эгидой основного документа (например, договора или реестра счетов). В других необходимо извлечение всех содержащихся в документе данных для заполнения карточки информационной системы.

Примеры извлекаемых данных

Анализ размещенных на портале zakupki.gov.ru заказов компаний с государственным участием и госучреждений (44-ФЗ, 223-ФЗ), показывает, что:

– Для привязки электронных копий ОРД к системе электронного документооборота достаточно номера, даты и типа документа.

– Сканирование финансовой документации часто сопровождается извлечением номера, даты, наименований и реквизитов плательщиков, сумм.

– Оцифровка архивных документов муниципалитетов (постановления администраций, горисполкомов, сельсоветов и т.д.) в целях оказания услуг и инвентаризации объектов земельно-имущественных отношений требует извлечения номера и даты документа, всех встречаемых ФИО и адресов. Причем адреса необходимо сопоставлять с текущими справочниками КЛАДР/ФИАС.

– Оцифровка документов Архивного фонда РФ сопровождается строгим заполнением НСА и описанием фондов в соответствии с архивным законодательством.

– Индексирование описей и реестров подразумевает распознаванием всех порядковых записей.

– Для работы с чертежами в электронном виде необходимо извлечь практически все поля штампа.

– Сканирование составных дел требует не только извлечения реквизита каждого документа, но и установления взаимосвязей. Наиболее сложен случай конструкторской документации, где формируемая база данных обладает многоуровневой иерархией и связями документов.

Источник: zakupki.gov.ru, 2015

Какие методы извлечения данных выбрать?

Определяющий параметр – качество текста. Применяемые технологии, скорость и стоимость формирования баз данных зависят от того, как написан и в каком состоянии находится текст документа.

Напечатанный на современном принтере текст может быть автоматически распознан, необходимые данные могут быть извлечены с использованием различных автоматизированных методов: применением шаблонов и автоэкстракцией индексов (алгоритмы определения ключевых слов, семантического анализа и т.д.). Эти методы быстрые, и в большинстве случаев их стоимость ниже цены ручного распознавания.

Напечатанные необычным шрифтом, в низком качестве или поврежденные тексты книг, газет, архивных документов распознаются не всегда или с недостаточной точностью. Поэтому в большинстве случаев требуется ручной ввод или, по крайней мере, ручная проверка сведений. Предварительно для каждого ресурса формируются или подключаются внешние справочники, которые помогают операторам индексирования и значительно ускоряют процесс.

Документы с рукописным текстом индексируются только вручную. Это гораздо более медленный и дорогой процесс. Поэтому крупные компании применяют уникальные технологии, служащие ускорению обработки и, соответственно, снижению цены без потери качества. Показателен пример официальной переписки: в этих документах традиционно реквизиты печатаются, а номер и дата проставляется вручную по факту, что делает невозможным полноценное программное индексирование.

Можно ли провести индексирование самостоятельно?

Альтернативой является технология извлечения данных с помощью анализа текста,  применимая для любых документов, в том числе неструктурированных. Этот метод зачастую более доступен по цене, но предлагается только парой крупных компаний, так как требует накопления серьезной семантическо-морфологической базы для каждой отрасли деятельности.

Самостоятельное индексирование возможно, причем как ручное, так и автоматизированное. Но есть ограничения. Программу распознавания текста приобрести легко. Настроить извлечение данных  сложнее: для формализованных (например, счет-фактура) и условно структурированных документов (например, договор) нужно программирование форм — мест и алгоритмов определения требуемых реквизитов. Однако программы стоят денег: распознавание текста обычно тарифицируется полистно (лицензия), а за создание шаблонов форм придется заплатить отдельно. Поэтому при оцифровке большого количества видов документов (около 40) стоимость этого метода сравнивается со стоимостью ручного индексирования.

Можно также вносить данные напрямую в информационную систему. Однако этот способ связан с высокой вероятностью ошибок, отследить которые в системе крайне сложно. При самостоятельном индексировании рекомендуется сначала создавать определенную базу данных, которую перед загрузкой можно проверить.

Именно так работают специализирующиеся на оцифровке компании: жесткая регламентация процесса, с протоколированием всех действий, и обязательная проверка сформированного массива ОКК позволяет минимизировать количество возможных ошибок. Например, корпорацией ЭЛАР в официальных договорах и контрактах используется стандартный критерий качества ≥99,8%. Теме выборы критериев качества будет посвящена одна из следующих статей.

Короткая ссылка на материал: //cnews.ru/link/a4262

Оцифровка книг — это… Что такое Оцифровка книг?

Сверхпроизводительный сканер APT BookScan

Оцифровка книг — это процесс перевода бумажных книг в электронный (цифровой) вид. Электронные копии книг могут образовывать электронные библиотеки и распространяться в Сети. Цифровые книги можно легко распространять, воспроизводить и читать на экране. Обычно оцифрованные книги сохраняют в форматах: DjVu, Portable Document Format (PDF), JPG или TIFF. Для преобразования исходного изображения используют оптическое распознавание символов (OCR), оно необходимо для включения страниц книги в цифровой формат, такой как ASCII или другой подобный формат, который уменьшает размер файла и позволяет работать с текстом. Сканирование изображений может происходить вручную или автоматически. В обычных сканерах книга располагается на стекле, на книгу падает свет, и оптический механизм сканирует книгу, двигаясь под стеклом. Другие книжные сканеры используют V-образную раму и фотографируют страницы сверху. Страницы могут переворачиваться вручную или с помощью автоматических устройств подачи бумаги. Специальное массивное стекло, как правило, прижимает страницы, чтобы сгладить недостатки сканирования. После сканирования программа корректирует изображение документа, выравнивая его, обрезая, редактируя и преобразовывая его в текст, и окончательную форму электронной книги. Люди обычно проверяют отсканированное изображение на наличие ошибок.

Сканирование 118 точек/см (300 точек на дюйм) является нормой для преобразования в цифровой вид текста, однако для редких и сложных книг необходимо использование более высокого разрешения. Высокотехнологичные сканеры способны сканировать около тысячи страниц в час, такие устройства могут стоить тысячи долларов. Но можно сделать сканер и самому, например, ручные книжные сканеры, способные оцифровывать около 1200 страниц в час, а стоимость построения около 300 долларов.

Методика оцифровки

В прошлом чаще применялся ручной набор текста книги.

Сегодня процесс оцифровки включает два подхода.

  1. Обязательный: получение копий страниц в виде графических (обычно растровых) изображений, осуществляемое путём сканирования или фотографирования с последующей обработкой и сохранением в одном из форматов графических файлов. В этом случае полностью сохраняется оригинальная вёрстка книги, и исключаются какие-либо ошибки, однако невозможен поиск или извлечение фрагментов текста для, например, целей цитирования.
  2. Опциональный: распознавание текста (технология «оптического распознавания символов» — OCR) с последующим сохранением распознанного текста в одном из форматов электронных книг. В этом случае становится возможен полнотекстовый поиск по книге и индексация больших массивов электронных книг, однако затрудняется воспроизведение оригинальной вёрстки, изображений, схем и формул, практически неизбежны становятся ошибки распознавания.

В последнее время (особенно с появлением форматов PDF и DjVu) всё чаще применяется смешанный подход: текст книги распознаётся в автоматическом режиме и подкладывается под оригинальные растровые изображения страниц, что позволяет совместить преимущества обоих подходов.

Книжные сканеры

К книжным сканерам относятся узкоспециализированные сканеры, предназначенные для максимально быстрого и/или удобного получения растровых копий страниц книги. Условно можно выделить три типа таких сканеров:

  • планшетные — сканеры, ориентированные на домашнего пользователя, но сконструированные именно для облегчения процесса сканирования книг (Plustek и другие)
  • планетарные — профессиональные высокопроизводительные сканеры
  • роботизированные (англ.) — промышленные сверхвысокопроизводительные сканеры, оборудованные устройствами различных конструкций для автоматического переворачивания страниц.

В двух последних типах сканеров обычно применяется не сканирующая линейка, а одна расположенная над сканируемым оригиналом цифровая камера высокого разрешения (30—140 Мпикс.). В некоторых моделях возможно использование двух камер, которые устанавливаются под углом друг относительно друга так, чтобы одновременно делать снимки всего разворота (при этом нет необходимости раскрывать книгу на 180°, что критично при оцифровке старых или находящихся в плохом состоянии оригиналов).

Планетарные и роботизированные сканеры позволяют достичь производительности 500—2000 страниц в час, у лучших моделей — до 2500—3000 страниц в час.

Профессиональные книжные сканеры

Эскиз V-формы книжного сканера ATIZ Эскиз типичного книжного сканера

Профессиональные книжные сканеры не просто обычные сканеры, это книжные сканеры, которые сканируют в высоком качестве с использованием цифровой камеры и источниками света по обе стороны от камеры, обеспечивающие легкий доступ к книге. Преимуществом таких сканеров является то, что это очень быстрые сканеры, по сравнению с производительностью планшетного сканера. Однако цены таких сканеров обычно начинаются с 10 000$..

Сканирование с обрезкой страниц

Для сканирования книг с низким бюджетом, наименее дорогим способом является сканирование книги или журнала с обрезкой страниц от корешка. Это превращает книгу или журнал в стопку документов, которые могут быть загружены в стандартное устройство автоматической подачи документов, Хотя, безусловно, это не является хорошим решением для очень старых и необычных книг, в особенности тогда, когда книга дорогая и коллекционная. В данном сканировании есть две трудности, обрезка страниц и само сканирование.

Обрезка страниц

Одним из способов резки страниц объемом от 500 до 1000 страниц за один раз, выполняется с помощью гильотины для бумаги. Эта конструкция представляет собой большой стальной стол с тисками для бумаги. Разрез выполняется большим заостренным стальным лезвием, которое движется прямо и режет по всей длине каждого листа сразу. Рычаг на лезвии позволяет прикладывать силу в несколько сотен фунтов, которая необходимо для разреза стопки бумаги. Чистый срез невозможно сделать традиционным серповидным ножом, так как он предназначен только для резки нескольких листов, где 10 листов является практически пределом. С течением времени при нарезке большой стопки бумаги, разрез становится все более неточным, а усилие которое нужно прикладывать для нарезки бумаги увеличивать. Процесс при резке гильотиной притупляет лезвие с течением времени, поэтому необходимо затачивать лезвие. Бумага с покрытием, притупляют лезвие быстрее, чем обычная бумага.

Сканирование

Когда бумага освобождена от корешка книги, то можно сканировать с помощью традиционного планшетного сканера или использовать сканер с автоматической подачей документов. Страницы с рифленой декоративной окантовкой или изогнутыми в дугу могут быть трудными для сканирования с помощью автоподатчика. Автоподатчик предназначен для сканирования страниц одинаковой формы и размера, поэтому разный размер или форма страниц может привести к неправильному сканированию. Бумага, которая используется в журналах и учебниках может плохо проходить в устройство автоматической подачи бумаги. Вообще наименьшие проблемы возникают с обычной бумагой. Липкий ролик, который захватывает бумагу, может со временем стереться, поэтому за его работоспособностью необходимо внимательно следить. Если в стопке бумаги находятся различные листы бумаги, например карты, то их необходимо удалить сразу перед сканированием.

Сканирование без вмешательства

Сканер на основе ЦФК. Сканер предназначен для оцифровки как сшитых, так и расшитых изданий. Подходит для оцифровки как относительно новых, так и ветхих изданий за счет специальной V-образной колыбели, позволяющей не раскрывать книгу полностью (на 180 градусов), что сводит к минимуму вредное воздействие на издание. Книга остается в одной и той же позиции. Скорость сканирования (цветной режим) около 500—700 страниц/час. Перелистывание страниц происходит вручную (существуют модели с автоматическим перелистыванием, однако ценные, ветхие книги, составляющие основу библиотечного фонда, не рекомендуется оцифровывать на таком оборудовании во избежание повреждений). Формат сканируемого документа А2-А4. Разрешение получаемых изображений 130—470 dpi (оптическое) . Сканеры подобного типа занимают много рабочего пространства, однако практически не подвержены поломкам, поскольку являются сканирующими платформами. Модернизируется за счет замены фотокамер на более профессиональные варианты. Запускается нажатием одной кнопки. Примером, таких сканеров могут являться сканеры, использующие цифровые фотокамеры.

Крупные проекты по оцифровке книг

В ходе масштабных проектов по оцифровке книг, как правило, обрабатываются книги, перешедшие в общественное достояние. Хотя Google оцифровывает вообще все книги, однако книги, защищённые авторским правом, предоставляет лишь в виде фрагментов. К крупным проектам по оцифровке на сегодня относятся:

Одной из основных проблем является большой объем книг, которые будут отсканированы. Десятки миллионов книг будут отсканированы, а затем должны находится в свободном доступе и поиске в интернете, в качестве универсальной библиотеки. В настоящее время крупные организации полагаются на аутсорсинг, сканирование дома, используя профессиональные книжные сканеры, и сканирование дома, используя роботизированные сканеры. Что касается аутсорсинга, то книги часто отправляются оцифровываться в Индию или Китай, за счет самых низких цен. Профессиональные сканеры используют цифровые камеры, что значительно ускоряет весь процесс. При использовании роботизированных сканеров традиционно необходимо отделять страницы от корешка книги, чтобы страницы могли автоматически подаваться. Как только страница сканируется, то данные вводятся вручную или с помощью OCR, что является еще одним критерием стоимости сканирования книги. В связи с вопросами авторского права, на большинство отсканированных книг не распространяется авторское право. Однако известно, что Google Book Search сканирует книги, которые защищены авторским правом и может убрать книгу из свободного доступа, только если только издатель специально исключит книгу из поиска.

Оцифровка по желанию

Ряд крупных библиотек предоставляют особые услуги по оцифровке публикаций из своих фондов по желанию читателей. Основные критерии: публикации должны находиться в общественном достоянии и должны быть в достаточной сохранности. Таким образом, появляется источник финансирования процесса оцифровки или же устанавливаются приоритеты при массовой оцифровке. Как правило, отметка о возможности сканирования интегрирована в библиотечный каталог, оцифрованная публикация размещается в электронной библиотеке для всеобщего доступа.

Существующие проекты

  • «Scan-on-demand» (Сканирование по требованию) — бесплатный проект от openlibrary.org, любой желающий может выбрать книгу из списка (фонды Бостонской общественной библиотеки), который содержит большое количество литературы XIX—XX веков на русском языке. Оцифровка проводится средствами некоммерческой организации Архив Интернета. Сроки работ заявлены как 5—8 рабочих дней. На сайте openlibrary.org собрано уже более миллиона оцифрованных публикаций.[1]
  • «DigiWunschbuch» — проект Центра оцифровки и Университетской государственной библиотеки Гёттингена (Германия), сканирование за плату (рассчитывается постранично) заказчик получает цифровую копию на CD-ROMе, кроме того, его имя будет размещено на шмуцтитуле цифровой копии размещённой в открытом доступе.[2]

См. также

Ссылки

Примечания

Зачем нужна оцифровка изображения? | fotoadvice.ru

Оцифровка изображения, что это такое и зачем она необходима? Очень интересный вопрос, который требует развернутого ответа. Любой фотограф должен знать как происходит оцифровка изображения, так как эти знания пригодятся в профессиональной деятельности.

Окружающий нас мир является аналоговым. Все звуки мира и его картины наш мозг воспринимает через органы чувств. Которые, в свою очередь, получают из окружающего мира информацию в виде звуковых или электромагнитных волн и преобразуют ее в импульсы, которые воспринимает мозг.

Информация, которая передается аналоговым способом очень легко может исказиться и для ее хранения требуются очень большие емкости, если ее использовать в таком виде в технике. Чтобы упростить процессы передачи и обработки информации был разработан метод оцифровки.

Оцифровка – это процесс преобразования аналоговой информации в цифровую. Техника, которая работает с цифровой информацией, стала называться цифровой.

Процесс оцифровки изображения или другой аналоговой информации проходит в два этапа. На первом этапе аналоговая информация дробится на равные части. На втором этапе происходит процесс кодирования информации специальными алгоритмами.

Если подходить с точки зрения получения аналоговой и цифровой информации применительно к фотографии, то можно сказать, что пленочный фотоаппарат является аналоговым устройством, так как изображение фиксируется на светочувствительном слое пленки с помощью объектива. А что происходит в цифровом фотоаппарате?

Процесс оцифровки изображения в цифровом фотоаппарате

В цифровом фотоаппарате вместо светочувствительного слоя находится матрица, которая выглядит как микросхема, но имеет огромное количество ячеек, которые чувствительны к свету.

оцифровка изображения

Рисунок 1. Так выглядит ПЗС — матрица на системной плате фотокамеры.

Свет, попадая на поверхность матрицы, распределяется по этим ячейкам. Каждая ячейка при попадании на нее света накапливает некоторую величину заряда, которая будет тем выше, чем выше интенсивность падающего на нее света. Это и есть первый этап оцифровки изображения.

Затем с каждой ячейки информация поступает в компьютер фотоаппарата. После обработки полученной информации формируется цифровое изображение. Стоит заметить, что конечное изображение все равно будет состоять из множества пикселей – небольших точек.

Каждый пиксель представляет собой кусочек информации об изображении, но сформированный только одной ячейкой матрицы. Нетрудно догадаться, что чем больше ячеек содержит матрица и чем меньше их размер, тем цифровое изображение будет больше похожим на аналоговое. И тем сложнее их будет различить.

Шифрование при оцифровке изображения

Общий принцип шифрования изображений одинаков, но есть варианты его применения. Рассмотрим самый простой, чтобы понять суть данного процесса. Возьмем некоторое изображение и попытаемся его зашифровать с помощью двух бит (два цвета – белый и черный). В результате получим картинку как на рисунке ниже.

оцифровка изображения

Рисунок 2. Двух цветное изображение. Глубина цвета 1 бит.

О таком изображении говорят, что оно имеет глубину цвета в один бит. В понятие цветовой глубины вкладывается количество бит, которые описывают состояние пиксела изображения при кодировании. В нашем примере ячейка матрицы либо уловила свет, либо нет. Но в реальности все гораздо сложнее.

Если возьмем изображение в градациях серого, то в нем глубина цвета увеличена до восьми бит на один пиксель. Это позволяет получить 256 комбинаций бит на канал, что будет соответствовать 256 оттенкам серого. Каждая ячейка матрицы при восприятии света будет накапливать заряд, который затем пропорционально переведется в один из оттенков серого при оцифровке изображения.

оцифровка изображения

Рисунок 3. Изображение, имеющее глубину цвета 8 бит.

В модели RGB на каждый пиксель выделяется 24 бита. Но каждый пиксель помимо этого содержит информацию о 3 каналах. На каждый из которых выделяются те же 8 бит, что и в градации серого. 24 бита берутся при сложении информации от всех трех каналов.

Таким образом, получаем, что модель RGB в состоянии отображать 16 млн. оттенков (2 в степени 24). Именно с моделью RGB и работают цифровые фотокамеры.

P. S. Если данная статья была полезна для вас, поделитесь ею со своими друзьями в социальных сетях! Для этого просто кликните по кнопкам ниже и оставьте свой комментарий!

С этой статьей так же читают:

оцифровать — Викисловарь

Морфологические и синтаксические свойства[править]

о·циф-ро-ва́ть

Глагол, совершенный вид, переходный, тип спряжения по классификации А. Зализняка — 2a. Соответствующий глагол несовершенного вида — оцифровывать.

Приставка: о-; корень: -цифр-; суффикс: -ова; глагольное окончание: -ть [Тихонов, 1996].

Произношение[править]

  • МФА: [ɐt͡sɨfrɐˈvatʲ]

Семантические свойства[править]

Значение[править]
  1. информ. преобразовать из аналоговой в цифровую форму, пригодную для автоматического считывания и обработки компьютерной техникой ◆ Чтобы оцифровать звуковой сигнал, в соответствии с теоремой Котельникова ― Найквиста необходимо периодически производить измерения его амплитуды, причём число отсчётов в единицу времени должно по крайней мере в два раза превышать частоту верхней гармоники сигнала. В. Хорт, «Информохранилища» // «Наука и жизнь», 2008 г. (цитата из Национального корпуса русского языка, см. Список литературы)
  2. спец. указать цифровые значения на шкале ◆ Спидометр оцифрован до 310 км/ч: после отметки «100» его правая часть размечена с укороченным шагом, по 30 км/ч вместо 20. Николай Качурин, Валерий Чусов, «Цеховики» // «Автопилот», 2002 г. (цитата из Национального корпуса русского языка, см. Список литературы)
Синонимы[править]
Антонимы[править]
Гиперонимы[править]
  1. преобразовать
Гипонимы[править]
  1. отсканировать

Родственные слова[править]

Этимология[править]

Происходит от ??

Фразеологизмы и устойчивые сочетания[править]

Перевод[править]

Библиография[править]

  • Новые слова и значения. Словарь-справочник по материалам прессы и литературы 70-х годов / Под ред. Н. З. Котеловой. — М. : Русский язык, 1984.
Interrobang.svg Для улучшения этой статьи желательно:
  • Добавить синонимы в секцию «Семантические свойства»
  • Добавить сведения об этимологии в секцию «Этимология»
  • Добавить хотя бы один перевод для каждого значения в секцию «Перевод»

Leave a comment