Сканированные древние книги. Полные скан-копии книг pdf, djvu серии серии fantasy («желтая серия», «полосочка», «рамки») и Science Fiction («дракончик», «стекляшка») издательства «Северо-Запад»)
Большой архив русской периодики 18 - нач. 20 вв. выложен на сайте "Старые книги". Сканированные древние книги
Электронные архивы, книги, ссылки - Катаклизмы и повседневность
Оригинал взят у ex_n1ck473 в Электронные архивыЧем занимаются современные библиотеки? В основном, прожиранием денег налогоплательщиков и заманиванием хипстеров бесплатным (оплаченным налогоплательщиками) вай-фаем. Бесплатный вайфай должен, видимо, сделать из тупеньких хипстеров людей, причащая их пыльной книге -- Источникуъ Знанийъ.Но есть библиотеки, в которых заняты делом. Там сканируют старые книги и выкладывают их в интернет.
Повторюсь: никакие сканы не заменят оригинала.
Если все старые книги будут отсканированы, а все новые -- оцифрованы, это вовсе не значит, что все люди перестанут читать печатные книги. Если текст книги хороший, то он будет прочитан. И читатель всегда предпочтет электронному тексту печатную книгу. Пластмассовым помидорам -- огурчики с дачи, порнухе -- бабу.Базы данных нужны для систематизации большого количества информации. Общедоступные базы данных позволяют делать выводы на основе этой информации каждому. Компьютер и интернет -- это статистические и социологические инструменты, а не место общения, работы и жительства.
Поэтому я рад представить те базы данных, где сам находил какие-нибудь полезные сканы старинных книг.
Псалтирь XV века
1. Собрание рукописных книг Свято-Троицкой Сергиевой ЛаврыПомимо рукописей, там есть какое-то количество старопечатных книг.
2. Всемирная цифровая библиотекаСкорее позитивно-познавательный проект для тупеньких хипстеров, чем серьезная база данных.
3. ГалликаОнлайн-библиотека Национальной библиотеки Франции.
4. ДокусфераНа первый взгляд детище криворуких государственных иванов, но, на удивление, что-то нашел там -- отсканированный (почему-то без обложки) "Супрематический сказ про два квадрата" Лисицкого, например.
5. Мюнхенский центр оцифровкиСканируют книги из Баварской государственной библиотеки и других мест. Самое большое собрание немецких инкунабул.
6. Сводный каталог инкунабулБаза данных по инкунабулам. Записи в том числе содержат и ссылки на сканы книг (если они существуют) в Мюнхенском центре оцифровки и на сайтах других европейских библиотек и университетов. Сделано все несколько головоломно, но кто ищет -- тот найдет. Благословляю. Сайт по-английски.
7. ЕвропеанаКакой-то проект от Евросоюза. "Цель — обеспечить доступ к отсканированным страницам книг, отражающих различные аспекты европейской культуры". На уровне наших госмастеров по откату.
8. Гугл букс
9. Краткий каталог инкунабулРаботает в связке с пунктами 5 и 6. Записи каталога так же содержат ссылки на сканы книг на других сайтах.
10. НормандияКривейший сайт, но тоже должен содержат что-то полезное. Я плохого не посоветую.
11. Открытая библиотекаРаботает в связке с известным Archive.org. Что есть там, то есть здесь.
12. Комната редкой книгиНасколько я понимаю, чей-то частный и коммерческий проект. Ребята пытаются продавать сканы этих книг в более лучшем качестве на дисках. Ну, удачи. Зато много действительно редкого и хорошего.
harmfulgrumpy.livejournal.com
Электронные архивы: bookdesign
Чем занимаются современные библиотеки? В основном, прожиранием денег налогоплательщиков и заманиванием хипстеров бесплатным (оплаченным налогоплательщиками) вай-фаем. Бесплатный вайфай должен, видимо, сделать из тупеньких хипстеров людей, причащая их пыльной книге -- Источникуъ Знанийъ.
Но есть библиотеки, в которых заняты делом. Там сканируют старые книги и выкладывают их в интернет.
Повторюсь: никакие сканы не заменят оригинала.
Если все старые книги будут отсканированы, а все новые -- оцифрованы, это вовсе не значит, что все люди перестанут читать печатные книги. Если текст книги хороший, то он будет прочитан. И читатель всегда предпочтет электронному тексту печатную книгу. Пластмассовым помидорам -- огурчики с дачи, порнухе -- бабу.
Базы данных нужны для систематизации большого количества информации. Общедоступные базы данных позволяют делать выводы на основе этой информации каждому. Компьютер и интернет -- это статистические и социологические инструменты, а не место общения, работы и жительства.
Поэтому я рад представить те базы данных, где сам находил какие-нибудь полезные сканы старинных книг.
Псалтирь XV века
1. Собрание рукописных книг Свято-Троицкой Сергиевой ЛаврыПомимо рукописей, там есть какое-то количество старопечатных книг.
2. Всемирная цифровая библиотекаСкорее позитивно-познавательный проект для тупеньких хипстеров, чем серьезная база данных.
3. ГалликаОнлайн-библиотека Национальной библиотеки Франции.
4. ДокусфераНа первый взгляд детище криворуких государственных иванов, но, на удивление, что-то нашел там -- отсканированный (почему-то без обложки) "Супрематический сказ про два квадрата" Лисицкого, например.
5. Мюнхенский центр оцифровкиСканируют книги из Баварской государственной библиотеки и других мест. Самое большое собрание немецких инкунабул.
6. Сводный каталог инкунабулБаза данных по инкунабулам. Записи в том числе содержат и ссылки на сканы книг (если они существуют) в Мюнхенском центре оцифровки и на сайтах других европейских библиотек и университетов. Сделано все несколько головоломно, но кто ищет -- тот найдет. Благословляю. Сайт по-английски.
7. ЕвропеанаКакой-то проект от Евросоюза. "Цель — обеспечить доступ к отсканированным страницам книг, отражающих различные аспекты европейской культуры". На уровне наших госмастеров по откату.
8. Гугл букс
9. Краткий каталог инкунабулРаботает в связке с пунктами 5 и 6. Записи каталога так же содержат ссылки на сканы книг на других сайтах.
10. НормандияКривейший сайт, но тоже должен содержат что-то полезное. Я плохого не посоветую.
11. Открытая библиотекаРаботает в связке с известным Archive.org. Что есть там, то есть здесь.
12. Комната редкой книгиНасколько я понимаю, чей-то частный и коммерческий проект. Ребята пытаются продавать сканы этих книг в более лучшем качестве на дисках. Ну, удачи. Зато много действительно редкого и хорошего.
Грамота от Жизномира к Микуле (дело о покупке краденой рабыни), XII век
13. Древнерусские берестяные грамотыОчень крутой сайт. Первые берестяные грамоты нашли только в 1951 году. С тех пор было раскопано больше тысячи грамот, все они были описаны, переписаны, сфотканы, облизаны и, по возможности, размещены на этом сайте. Стоит того, чтобы увидеть :). Обзорная статья о грамотах от специалиста.
bookdesign.livejournal.com
Большой архив русской периодики 18
На сайте "Старые книги" выложен большой архив русской периодики 18 - нач. 20 вв.. В числе доступных для чтения и скачивания изданий - журналы "Вестник Европы", "Отечественные записки", "Киевская старина", "Московский телеграф", "Русская мысль", "Русский архив", "Русский вестник" и многие другие. Как говорится в описании проекта: "Число книг на кириллице, которые уже перешли в общественное достояние, отсканированы и размещены в интернете, исчисляется многими десятками тысяч. Главная цель проекта - в едином каталоге собрать и упорядочить ссылки на электронные книги, которые могут быть интересны изучающим историю, географию, этнографию и другие смежные дисциплины.
Эти книги стали доступны прежде всего благодаря проекту Google Books Search, а также многим другим электронным библиотекам. Большинство книг мы размещаем (после описания и - при необходимости - преобразования) на альтернативных файлообменных сервисах, что помогает сделать эти книги более доступными для читателей. В России, скажем, доступны далеко не все книги, доступные американским пользователям сервиса Google Books Search, к тому же поиск русскоязычных книг подчас сложен из-за скверного описания; и далеко не все могут позволить себе скачивать чрезвычайно объемные файлы с сайта РГБ.
В каталог включены также книги, которые отсканированы и обработаны автором сайта. Основные тематические и хронологические рамки - история до конца XVIII века. Из XIX века выкладываются преимущественно книги по военной и морской тематике, некоторые по статистике, и описания неевропейских стран. Впрочем, эти ограничения достаточно условны, хотя бы потому, что даже исторические исследования зачастую захватывают разные эпохи, а этнография и филология к временным рамкам привязываются довольно условно.
Качество книг - "как есть" в первоисточнике. В некоторых книгах может не хватать страниц, или порядок страниц может быть перепутан. Для исправления подобных недостатков электронных копий книг часто нет ни возможностей, ни времени, хотя иногда все-таки что-то удается сделать. Отдельный вопрос, вызывающий постоянные нарекания - плохо отсканированные или вообще отсутствующие иллюстрации и карты: это неизбежное следствие машинного перелистывания при сканировании. Справедливости ради надо отметить, что качество книг с Google Books Search за последние два года сильно улучшилось".
Посмотреть архив изданий на сайте: http://starieknigi.info/index_zhurnaly.htm
Вы также можете подписаться на мои страницы:- в фейсбуке: https://www.facebook.com/podosokorskiy- в твиттере: https://twitter.com/podosokorsky- в контакте: http://vk.com/podosokorskiy- в инстаграм: https://www.instagram.com/podosokorsky/- в телеграм: http://telegram.me/podosokorsky- в одноклассниках: https://ok.ru/podosokorsky
philologist.livejournal.com
Оцифровка старых книг
Современное оборудование позволяет распознавать не только документы, но и целые книги, переводя их в электронный формат. И если эффективное и дорогостоящее оборудование для оцифровки книг имеется в распоряжении не у каждого предприятия и тем более частного лица, то оно есть в профессиональной компании.
По большому счету сканирование книг (старых и ветхих) зачастую являет собой проблему гораздо более сложную, чем кажется сначала. Истертая от времени бумага, плохой оттиск, мелкий шрифт, пометки карандашом на полях усложняют сканирование книги. Разрешение приходится увеличивать, постоянно сверяться с оригиналом, разбирая буквы и значки. Многие старые книги имеют большой формат, оригинальные иллюстрации, большинство из них находятся в плохом состоянии. Поскольку многостраничные, объемные, ветхие книги трудно отсканировать в домашних условиях, сканирование книг различной сложности в силу этого выполняется на профессиональных сканерах.
Сложности сканирования старых книг
Сканирование является лишь промежуточным этапом обработки старых книг: поскольку обработанные страницы — это, по сути, неизменяемые электронные фотографии, требуется еще и распознавание текста, для чего нужны навыки, в том числе работы с программным обеспечением. В нашем распоряжении современное оборудование, нужное программное обеспечение для сканирования книг, профессионалы, которые умеют работать с заказами любой сложности.
В процессе работы над заказом сканируется бумажный оригинал, распознается информация. Далее текст редактируется и форматируется в текстовом редакторе, готовится электронное содержание и ссылки. Затем готовый материал преобразуется в цифровой формат и осуществляется запись на носитель информации. Цена сканирования книг старых и ветхих всегда выше, чем обычных документов, и зависит от качества оригинала, объема работы, требований к заказу со стороны клиента, дополнительных услуг (например, выпуск мультимедиа диска с электронной книгой).
Преимущества сканирования книг, особенно старых и раритетных:
Оцифровка книг, брошюр, журналов позволяет сохранить старинные и редкие оригиналы в неизменном виде, работать с ними в электронном формате.
Сканированную книгу можно подарить в электронном формате и предложить многим друзьям и знакомым.
Можно держать редкую библиотеку на одном носителе информации, который помещается в кармане.
Благодаря сканированию книги редкие и раритетные не будут украдены, не потеряются, не испортятся от времени.
Форматы, в которые можно перевести старые и редкие книги: Acrobat Reader (PDF), mobi, Microsoft Word, epub, HTML.
Страница сгенерирована за 0.02 секунд !
redocs.ru
Полные скан-копии книг pdf, djvu серии серии fantasy («желтая серия», «полосочка», «рамки») и Science Fiction («дракончик», «стекляшка») издательства «Северо-Запад»)
Роберт Говард№27
Клинок судьбы
авторский сборник, 1998 год
Описание:
В данный том собрания сочинений Роберта Говарда вошли произведения о Соломоне Кейне, а также статья Ричарда Тугуда о хронологии этого цикла.В оформлении обложки использована работа Кена Келли.
#
Роберт Говард№31
Тень ястреба
авторский сборник, 1998 год
Описание:
В данный том собрания сочинений Роберта Говарда вошли произведения о Соломоне Кейне, которые были завершены другим автором, а также историко-приключенческие и юмористические повести и рассказы.В оформлении обложки использована работа Кена Келли.
#
Роберт Говард№33
Знак огня
авторский сборник, 1998 год
Описание:
В данный том собрания сочинений Роберта Говарда вошли произведения об Аль-Бораке и историко-приключенческий рассказ.Иллюстрация на обложке Кена Келли.
#
Роберт Говард№36
Брат бури
авторский сборник, 1999 год
Описание:
В данный том собрания сочинений Роберта Говарда вошли произведения о Брекенридже Элкинсе (сборник «Брат бури») и повесть из условного цикла о Катулосе.Сборник «Брат бури» представлен как роман, входящие в него рассказы представлены в качестве его глав.В оформлении обложки использована работа Кена Келли.
#
Роберт Говард№38
Коготь дракона
авторский сборник, 1999 год
Описание:
В данный том собрания сочинений Роберта Говарда вошли произведения из разных циклов автора и несколько внецикловых рассказов. Два произведения («Кольцо Сета» и «Коготь дракона») не принадлежат перу Роберта Говарда, а написаны Ричардом Тирни и Дэвидом Дрейком соответственно.В оформлении обложки использована работа Кена Келли.
#
szfan.ru
Бизнес на сканировании и оцифровке книг Бизнес идея. Сканирование книг
На сегодняшний день, во время всеобщей компьютеризации и развития большой популярностью пользуются электронные книги. В связи с этим услуга по сканированию и оцифровке книг является достаточно востребованной. Такая услуга заключается в переводе информации с бумажного носителя в электронный (цифровой) вид. Электронные книги позволяют получить пользователям доступ к редким книгам, оригиналы которых хранятся в музеях и частных коллекциях. Кроме того, в таком продукте заинтересованы библиотеки, архивные фонды, школы, университеты. Поэтому организация компании, специализирующейся на оцифровке бумажных книг является отличной идеей бизнеса. На сегодняшний день существуют два подхода к оцифровке книг. Первый заключается в фотографировании или сканировании книг и получение цифровых копий страниц, их последующей обработке и сохранении в формате графических файлов. При этом подходе остается оригинальная верстка книги, исключаются ошибки, возникающие при обработке первоисточника. Однако главным недостатком является невозможность поиска определенных фрагментов текста и его извлечения. Второй подход, опционный, заключается в распознавании текста и сохранении его в формате электронной книги. В этом случае возможен поиск по тексту и индексация больших массивов книг. В последние годы приобрел популярность метод, совмещающий преимущества вышеописанных методов. В этом случае распознавание осуществляется автоматически, после чего текст подкладывают под оригинальные растровые изображения текстовых страниц. Для работы понадобится персональный компьютер, сканер для сканирования книг и специальное программное обеспечение. Программа для сканирования книг, например, «DjVu Solo» позволяет распознавать отсканированный текст в автоматическом режиме. Данная программа проста в работе, научиться работать с данным приложением можно, используя различныеИнтернет-ресурсы, на которых даны подробные советы. Чтобы оптимизировать работу лучше всего приобрести узкоспециализированные книжные сканеры, которые позволяют получить растровые копии быстрым и удобным способом. Чтобы оптимизировать рабочий процесс следует знать особенности сканеров. Сканеры бывают трех видов: планшетные, планетарные и роботизированные. Планшетные сканеры ориентированы на домашнее использование, однако, они пригодны для сканирования именно книг. Планетарные и роботизированные сканеры являются профессиональными, характеризуются высокой производительностью. Эти два типа сканеров оснащены расположенной над сканируемым источником цифровой камерой с высоким разрешением. Также такой сканер может быть оснащен двумя камерами для получения снимка всего разворота книги, что особо важно при сканировании старых, ветхих книг. Рекламировать свой бизнес необходимо различными способами не только в Интернете, но и с помощью объявлений в газетах, расклейки их по городу. Также свои услуги можно предлагать непосредственно заведующему библиотекой. Подобные услуги по сканированию востребованы и со стороны правоохранительных органов. Например, в милиции и прокуратуре хранятся документы еще прошлого века, которые необходимо переводить в электронный вид.
Заработок на оцифровке книг
Данная идея подойдет абсолютно каждому человеку, желающему начать зарабатывать в интернете и даже создать собственный бизнес. Имеется в виду сканирование книг, документов, фотографий и других материалов, чтобы впоследствии перевести их в цифровые копии. Вы спросите, для чего это нужно, ведь сейчас в интернете и так полно различной информации, которую можно найти и скачать бесплатно, или купить. Но это в большей мере касается художественной литературы и современных справочников, а вот, например техническую литературу, изданную десятки лет назад, найти в интернете очень сложно, тем более в бесплатном доступе. Многим профессионалам инженерных специальностей, студентам и преподавателям хотелось бы иметь богатую электронную библиотеку, в которой бы находился любой необходимый им учебник, справочник и другая техническая литература. Что необходимо для старта? Для организации бизнеса по оцифровке бумажных изданий, вам не придется искать много денег. Необходимо иметь лишь компьютер и сканер, а такая техника имеется в доме практически каждого человека. Конечно, для ускорения процесса оцифровки, со временем можно приобрести хороший скоростной сканер. Хотелось бы вспомнить изобретение компании Google – сканер, который обрабатывает около одной тысячи страниц текста всего за полчаса. Уникальность этого устройства имеется в том, что после сканирования, книги сохраняют свой первоначальный вид. А вот японское оборудование в процессе работы разрезает книги на части, после чего их остается только выбросить. Работа с клиентами. Вам необходимо создать собственный сайт, на котором потенциальные заказчики смогут ознакомиться с условиями вашей работы, стоимостью сканирования книг и подать заявку на заказ услуги. Иногородние клиенты будут отправлять вам книги, которые нужно переснять, по почте, поэтому на своем сайте вы должны также указать адрес доставки. Решите для себя, будет ли доставка книг оплачиваться отдельно или это войдет в стоимость услуги. Предложите несколько удобных способ оплаты, чтобы клиент мог выбрать наиболее подходящий для себя: банковский перевод, Webmoney, наличными и т.д. Спрашивайте также клиентов, в каком формате им нужен оцифрованный текст – PDF, DOC, TXT или другой. Работа.
Определение оцифровки, причем, только бумажных книг, не совсем точное определение. Процесс предполагает носитель в качестве источника, а им не всегда является только бумага. В современном мире существует несколько типов носителей информации — бумажные книги, экран компьютера, графические файлы, сайты, мультимедийные издания и так далее.
Более точное определение процесса «оцифровки книг» — это создание или использование готовой графической копии страницы в одном из соответствующих форматов (например, TIFF, JPG, PDF, DJVU, PNG) с последующим (не всегда обязательным) распознаванием текста и перевод результата в электронную форму для дальнейшего копирования, тиражирования, хранения и в том числе перевод первичной копии в другие цифровые форматы необходимого для использования типа.
Самый популярный способ оцифровки — перевод растрового изображения в цифровой формат книг. Среди форматов могут быть графические — PDF, DJVU, форматы для комиксов — CBZ, CBR, текстовые — TXT, FB2, EPUB, PDF, HTML, DOC и так далее. Как правило, графические форматы не являются масштабируемыми. Они сохраняют пропорции и размер исходной страницы вместе с содержимым. В них и довольно часто, для компактности сокращают пустые поля страницы, чтобы текстовое окно, как образ книги, лучше вписывалось в экраны мобильных устройств.
Оцифровка книг — это еще один возможный источник получения электронного контента для чтения.
На историческом этапе оцифровка книг применяется для различных целей. От личного использования до профессиональных нужд. Как хобби и вид заработка. Для наполнения библиотек и магазинов контентом. Довольно закономерное правило — чем больше контента продается или распространяется бесплатно, тем меньше используется оцифровка для создания электронного контента. Этот вид деятельности переходит в узкоспециализированное русло для увлеченных людей и профессионалов. В то же время, наполнение библиотек происходит путем обмена, а не создания новых цифровых копий.
Магазины и музейные архивы активно оцифровывают книги по нескольким причинам, основной из которых является недоступность цифровой копии у правообладателя, ограниченное количество или старинные книги, исходный материал создавался не цифровым набором.
Владельцы копий узкоспециализированной литературы не стремятся создавать для массового потребителя контент, источником которого являются редкие книги. В этом случае цифровая копия создается для изучения книг без ущерба для первичного носителя, не только со стороны читателя, но и для исключения воздействия воздуха, света, различных газов, паразитов и так далее. Редкие цифровые копии книг и рукописей чаще всего находятся в рамках исторических архивов и библиотек.
Электронные книги, как файлы, создаются несколькими способами: прямая цифровая копия из подготовленной профессиональной или иной верстки, а также оцифровка бумажной книги или другого источника в электронную форму. Устаревшей формой оцифровки можно признать ручной набор текста и диктант.
Не всегда и везде оцифрованная книга должна и может содержать текст, который можно впоследствии масштабировать и даже редактировать, в том числе применять конвертацию в другие текстовые форматы электронных книг. Оцифрованные книги могут быть факсимильной копией, то есть графически точно отражать копию бумажной страницы.
Текстовые книги получаются с помощью распознавания текста. Применяется метод OCR (анг. optical character recognition) — оптическое распознавание символов. Страницы книги предварительно сканируются в графический формат, и впоследствии текст распознается с помощью специального программного обеспечения. Точность распознавания зависит от качества шрифта, контраста текста, наличия дефектов и графических иллюстраций. Финальное качество, в большинстве случаев, контролируется корректорами, которые сверяют текст между первоисточником и цифровой копией.
(Довольно много разногласий между специалистами OCR вызывает необходимость или возможность сохранения опечаток в цифровой копии, которые имели место в бумажной книге).
Подготовленная цифровая книга трансформируется в один из текстовых форматов. Впоследствии можно преобразовать готовую книгу в другие популярные форматы, с возможной потерей верстки, так как не все из них поддерживают совместимый набор разметки текста и иллюстраций. Первично выбранный формат зависит от предпочтений оцифровщика и использования технологической цепочки для последующей трансформации. Чаще выбирают форматы с развитой структурой разметки.
Графические книги создаются за счет точного образа страницы или факсимильной копии с помощью оптического прибора, чаще с помощью сканера, реже с помощью фотоаппарата. Метод выбирается за счет определения скорости преобразования, и вероятного вреда, который может быть нанесен первоисточнику внешним освещением, нагревом или физическими изломами оригинала.
Каждая страница отсканированного материала — это графический файл JPEG, TIFF или любой другой, в том числе контейнеры, которыми могут быть PDF и DJVU. Выбор формата зависит от дальнейшего преобразования множества файлов в один документ или наоборот, когда из одного файла создается множество промежуточных файлов, для координации профессиональной обработки.
Сканеры существуют нескольких типов — отличаются скоростью работы, встроенными средствами распознавания, конструкцией и конечно размерами. Немаловажная разница заключается в цене решения при эксплуатации того или иного типа сканера и сложности управления процессом.
Малораспространенный тип — это ручные компактные сканеры, которые не точны, имеют небольшую скорость работы, за один раз охватывают небольшую зону изображения и не имеют встроенных механизмов автоматизации процесса. Но за счет низкой стоимости, малого веса и компактности — применяются до сих пор. Удобны для отдельных рукописей и страниц.
Другие типы сканеров являются стационарными приборами. Они подразделяются на типовые, специализированные и профессиональные.
Типовые сканеры, они же массовый продукт, который существует в продаже, имеют компактные формы, тратят в рабочем режиме на одну страницу несколько секунд или минут. Точность и качество цифровой копии зависит в основном от качества прилегания исходной страницы на поверхности сканера. Для отдельных листов, существуют автоматические лотки для подачи бумаги, что увеличивает скорость работы сканера, так как фактически не тратится время на смену листов первоисточника или оно крайне мало.
«Специализированные» сканеры отличаются от «типовых» возможностью создания бестеневой копии с оригинала и они не всегда сканеры в привычном понимании. Позволяют «сканирование листа в край» даже для книг с корешком. Иногда имеют встроенное программное обеспечение для сбора отдельных копий в единый документ, хотя производители чаще прикладывают в комплекте со сканером программное обеспечение для PC и Mac. Такая работа более наглядна, происходит на большом экране компьютера.
Чаще всего, специализированные сканеры называют «книжными». Они относятся к планшетному типу. Наиболее доступными по цене и популярными среди потребителей можно признать продукцию компании Plustek. Модель OpticBook A300 позволяет сканировать не только в край, но и вплоть до A3 формата листа оригинала.
Профессиональные сканеры имеют большие габариты, скорость работы и отличаются методом сканирования.
«Планетарные сканеры» — это скорее оптическая копия с помощью одной или нескольких фотокамер. Называются так из-за расположения камеры, как спутника над планетой, которой является сканируемый оригинал. Некоторые модели сканеров могут использовать две камеры, чтобы одновременно делать копию разворота страниц.
Компания Atiz выпускает популярную серию сканеров BookDrive, которые похожи скорее на небольшую фотостудию. Отличаются размером основной площадки, на которую помещается оригинал. Можно оцифровать газету или книгу, которые располагаются на основе под углом 90° между листами, а камеры направлены перпендикулярно в сторону каждого раскрытого листа, чтобы сохранить геометрию страницы без искажений.
Серия планетарных сканеров Microbox book2net от компании Xerox имеют одну площадку, где издание одним листом располагается на основании, а оптический прибор фотографирует только одну страницу или разворот, при том, что он должен быть максимально плоским, чтобы избежать теней на корешке.
Роботизированные сканеры имеют крупные габариты, обычно это готовый набор в шкафу, в котором есть все необходимое для автоматического сканирования целого издания — свет, оптический сканер, система для перелистывания страниц, компьютер для управления и узкоспециализированные сервисные функции. Сканируемое издание располагается под меньшим углом. Для увеличения производительности производится съемка сразу двух страниц разворота.
Компания Treventus уже несколько лет выпускает роботизированные сканеры ScanRobot, которые за короткое время могут оцифровать целые библиотеки при минимальном участии человека. Лицевая часть сканера может закрываться во время работы, чтобы исключить паразитную засветку от внешних источников света.
Планетарные и роботизированные сканеры работают с производительностью от 500 страниц в час, а лучшие модели способны сканировать на скорости до 3000 страниц в час.
После сканирования изображения с оригинальной страницы необходимо распознать текст и иллюстрации. Для этой цели понадобится специальное программное обеспечение, способное оптически и логически распознавать объекты в изображении. Сложность распознавания заключается в форме букв оригинала, контрастности изображения, наличия цветовых подложек, рисунков или сложной структуры верстки. В момент распознавания происходят типовые проблемы и ошибки для конкретного оборудования и программного обеспечения, которые специалист по OCR попытается компенсировать с помощью скриптов и проверки орфографии.
Скрипты, обычно, это самодельная надстройка для исправления ошибок. Именно подобное отношение отличает разных специалистов по качеству распознавания текста. Скрипты создают специалисты OCR для личного использования, и они актуальны только для личного метода распознавания текста и используемого оборудования. Подчистка текста нужна не только для исправления вероятных грамматических ошибок, но и для задания тексту базовой типографики.
Для автоматизации первичной очистки текста, можно рекомендовать программу OCR Pad от Валерия Войцеховского.
Компьютерными технологиями не ограничивается точность распознавания. Очень важную роль играют корректоры, которые считывают текст и сверяют его с оригиналом. Это очень важно, особенно для технической литературы.
Для ускорения процесса редактирования текста используется «распределенный метод» — части документа распределяются между группой корректоров. Этот способ позволяет вычитать книгу полностью за несколько минут, но не всем под силу организация такого процесса. Обычно используется веб интерфейс, без необходимости устанавливать дополнительное программное обеспечение на множество компьютеров.
Для вычитки текста не обязательны профессиональные лингвисты. Обычно этим занимаются люди, наделенные вниманием и наблюдательностью. Важна не столько грамотность, сколько умение сравнивать печатный и электронный текст. Замечать разницу в технических опечатках, разницу между буквами и цифрами.
Художественная литература может считываться только для поиска орфографических ошибок.
В «OCR мастерских» небольшого размера «работают» парами. Обычно специалист по OCR является организатором процесса и сотрудничает с одним или группой корректоров. Группа существует на особом сочетании характеров и возможностей. При переходе к другому типу распространения готовых электронных книг, «мастерская» может распадаться, часть группы придерживается идеологических взглядов на свою деятельность.
В момент зарождения электронных книг, OCR-щики первыми протоптали дорожку для читателей к бесплатным библиотекам и собрали для них контент. Если библиотеки известны массовому читателю, то наполняли эти библиотеки не магазинные копии книг, а частные коллекции OCR.
Среди специалистов по распознаванию текста есть профессиональные объединения, свой кодекс, честь и прочее. Самой известной в отечественной истории была OCR-группа Вадима Ершова, которая располагалась по адресу publ.lib.ru и работала изначально только для библиотеки Мошкова, других просто не существовало. Впоследствии форум группы Ершова стал местом сбора и общения профессионалов в области OCR.
Время идет. Меняются приоритеты, интересы и источники оцифровки книг. Интерес к книжному распознаванию стал меньше и перешел в профессиональное русло. Доля собственной оцифровки в бесплатных библиотеках значительно ниже доли простого копирования готового материала. Поэтому, если кого-то интересует собственная оцифровка, то обычно это редкие и детские книги.
В последнее время часто оцифровывают с экрана компьютера, без использования сканера для бумажных книг. Таких любителей не много и пока это работает как «спортивный интерес» по взлому защищенных цифровых изданий.
Обычный читатель может самостоятельно оцифровать книгу, читать и вычитывать ее в электронном виде. Частной заинтересованности в этом мало, слишком трудоемко. Интерес быстро перерастает в «желание поделиться» оцифрованной книгой со всеми в Интернет. Так рождаются потоки новых книг и мелкие частные библиотеки. Хобби становится профессиональным занятием.
Оцифровка книг http://www.the-ebook.org/?p=17526
Оцифровка книг — это процесс перевода бумажных книг в электронный (цифровой) вид. Электронные копии книг могут образовыватьэлектронные библиотеки и распространяться в Сети. Цифровые книги можно легко распространять, воспроизводить и читать на экране. Обычно оцифрованные книги сохраняют в форматах: DjVu, Portable Document Format (PDF), JPG или TIFF. Для преобразования исходного изображения используют оптическое распознавание символов (OCR), оно необходимо для включения страниц книги в цифровой формат, такой, как ASCII, или другой подобный формат, который уменьшает размер файла и позволяет работать с текстом. Сканирование изображений может происходить вручную или автоматически. В обычных сканерах книга располагается на стекле, на книгу падает свет, и оптический механизм сканирует книгу, двигаясь под стеклом. Другие книжные сканеры используют V-образную раму и фотографируют страницы сверху. Страницы могут переворачиваться вручную или с помощью автоматических устройств подачи бумаги. Специальное массивное стекло, как правило, прижимает страницы, чтобы сгладить недостатки сканирования. После сканирования программа корректирует изображение документа, выравнивая его, обрезая, редактируя и преобразовывая его в текст, и окончательную форму электронной книги. Люди обычно проверяют отсканированное изображение на наличие ошибок.
Сканирование 118 точек/см (300 точек на дюйм) является нормой для преобразования в цифровой вид текста, однако для редких и сложных книг необходимо использование более высокого разрешения. Высокотехнологичные сканеры способны сканировать около тысячи страниц в час, такие устройства могут стоить тысячи долларов. Но можно сделать сканер и самому, например, ручные книжные сканеры, способные оцифровывать около 1200 страниц в час, а стоимость построения — около 300 долларов.
studfiles.net
Рукописные старинные книги
Старинные рукописные книги сейчас встречаются в основном религиозного содержания. Отличить их можно прежде всего по начертанию букв — отличить кириллические буквы очень просто.
Так как каждая рукопись создавалась вручную, оцениваться она должна индивидуально. Древние рукописи до 17-го века стоят дорого. Дешевле оцениваются рукописи 18-го века. Самые недорогие сейчас — рукописи 19-го — начала 20-го века. Большинство таких рукописей выполнялось весьма небрежно, что конечно же сказывается на цене.
Книги рукописные писались несколькими типами письма (почерка):
Устав XV-го века
Устав — красивый, но архаичный тип почерка. Книгу, написанную таким почерком непрофессионалу очень сложно бывает отличить от печатной. Таким почерком писали книги в глубокой древности. Книги написанные уставом встречаются редко. Ценятся такие книги очень дорого, особенно если рукописи лицевые (с иллюстрациями). Лучше всего не спешить с продажей таких книг и обратиться к серьезным специалистам.
Полуустав XVIII-го века
Полуустав — второй по времени тип почерка, похожий на устав. Большинство рукописных церковных книг написаны именно полууставом. Цена на книгу, написанную полууставом прежде всего зависит от времени создания книги, ее сохранности, наличия украшений, содержания. Цена рукописи зависит от содержания и времени ее создания, а также от наличия в тексте иллюстраций.
Скоропись XVII-го века
Скоропись — почерк, который чаще применялся в быту, нежели для написания книг. Чаще всего скоропись можно встретить в виде пометок на полях церковных книг. Цена на книгу, написанную скорописью также зависит от времени создания книги, ее сохранности, наличия украшений, содержания. Скорописные пометы на печатных церковных книгах чаще всего на цену практически не влияют.
Если Вам в наследство остались рукописные старинные книги, перед тем, как с ними расстаться, продав их, советуем Вам оценить эти книги у экспертов. Некоторые книги очень редки и оцениваются очень и очень дорого. Но платить за такие книги приличные деньги готовы далеко не все коллекционеры-библиофилы. Лучшим вариантом будет, после предварительной оценки, выставить книгу в продаже через Интернет по фиксированной начальной цене. Если в течение месяца интереса к Вашей старинной книге не будет, можно несколько снизить цену.