Как из электронной книги сделать телевизор

Содержание

Чтение — это модно. Не сегодня, не вчера, не год назад, а всегда. В метро и автобусах, в поездах и самолетах, дома в кресле или лежа на кровати — кто-то предпочитает бумажные книги, а другие читают с экрана гаджетов. Запах типографской печати или светящийся и мерцающий дисплей планшета?

В пользу первого — относительная безопасность для зрения, в пользу второго — возможность переносить «районную библиотеку» в компактном устройстве. А что, если взять и объединить положительные качества бумажных книг и чтения с дисплея планшета ? Именно по такому принципу и создавались электронные книги.

Что такое E-INK?

Если вы до сих пор считаете, что серьезной разницы между электронными книгами и планшетами нет, то забудьте об этом. Технология E-INK, на которой базируются все электронные книги, идеально имитирует лист бумаги. Первое, что говорят люди, когда держат в руках ридер (электронная книга) в первый раз: «Это же бумага!». Дисплей на E-INK действительно трудно отличить от бумажного листка.

DIY: Блокнот с тканевой обложкой своими руками | Скетчбук

Глаза не устанут: топ-8 оптимальных электронных книг с подсветкой и без

Почему так происходит? Во-первых, дисплей ридера совершенно не излучает свет, в то время как экран телефона работает исключительно за счет излучения света. Во-вторых, E-INK — это технология «электронных чернил», которая и была разработана с целью имитации листка бумаги. Как работают эти «чернила»? Понятное дело, что о фактических чернилах здесь речи нет.

Дисплей ридера наполнен миллионами микрокапсул, которые содержат в себе еще большее количество отрицательно и положительно заряженных микрогранул. Заряд со знаком «+» — белые гранулы, «-» — черные. Капсула заполнена прозрачной жидкостью, и, в зависимости от заряда воздействующего электрического поля, в ней поднимаются на поверхность либо белые, либо черные микрогранулы. Для тех, кто знаком с физикой, станет ясно, что технология E-INK построена на электрофорезе.

Отображение текста в ридерах не «бликует» и не затемняется, если на него попадает яркий свет. Поэтому удобно будет читать, как днем на улице, так и в условиях искусственного освещения.

Какие бывают дисплеи в электронных книгах?

На сегодня это две основные разновидности:

  • E-INK Carta
  • E-INK Kaleido

Carta — черно-белое изображение, Kaleido — цветное. Вторая технология, само собой, ставится в более дорогие модели ридеров. В то время как первая — абсолютный доминант на рынке. E-INK Carta оснащены многие бюджетные и средние по цене электронные книги.

Конечно, можно встретить и E-INK Pearl или даже VizPlex либо Flex . Особенно на вторичном рынке. Однако эти технологии сильно устарели и рассматривать такие электронные книги для покупки в 2023 году не стоит. Почему? Во-первых, изображение будет тусклым: черный цвет букв будет не таким уж и черным, а белый фон будет напоминать разбавленный серый. В то время как черно-белый дисплей E-INK Carta отображает целых 16 градаций серого: все цвета будут максимально приближены по насыщенности к реальным.

Разбираем электронную книгу texet

E-INK Kaleido — это цветной дисплей. Для тех, кто собрался читать комиксы с электронной книги, отлично подойдет. Ну, или изучать аналитические графики, научную литературу, загружать глянцевые журналы и карты местности. Цветной дисплей в электронной книге способен качественно отображать не только разноцветную картинку, но и выдавать черный с белым с максимальным соответствием.

К примеру, электронная книга PocketBook 740 Color с разрешением в 1872×1404 оснащена технологией E-INK Kaleido. Стоит она сегодня в районе 22 000 рублей . Такой ридер способен отображать 4096 цветов.

Какими бывают дисплеи электронных книг по диагонали?

Сегодня это 3 разновидности:

  • от 6 до 7 дюймов;
  • от 7 до 10 дюймов;
  • 10,3 дюйма.

Раньше экраны были и поменьше, но сегодня на рынке пользуются спросом эти 3 категории.

Для начала хотелось бы отметить, что чем больше дисплей, тем более громоздкая сама книга. К примеру, ридер с 10,3-дюймовым экраном компактным не назовешь и брать его с собой везде достаточно проблематично. Когда 6-дюймовый очень удобно помещается в дамскую сумку или небольшой мужской портфель. Также крупногабаритные электронные книги нелегко держать в одной руке: она быстро устает и чтение вне дома становится задачей не из простых.

5 непростительных ошибок при выборе смартфона

Если в ваших запросах — чтение только художественной литературы. Без ярких иллюстраций, графиков и таблиц, то 6-дюймового дисплея вам будет вполне достаточно. Если собираетесь читать журналы, серфить в браузере, читать бизнес-литературу, PDF-лекции и учебники, то выбирать стоит 7-8-дюймовый экран.

Именно такие дисплеи бывают цветными, поэтому выбор здесь невелик: хотите цветную электронную книгу — это только 7,8-дюймов. Моделей с цветным изображением сегодня не много на рынке. Выше мы упоминали PocketBook 740 Color, но еще можно купить ONYX BOOX NOVA 3 Color . Такая книга в 2 раза дороже представителя от PocketBook. Сильно ли она лучше? Только лишь объемом встроенной памяти.

Здесь ее 32 Гбайт, а в PocketBook 740 Color — 16 Гбайт. Для электронных книг это очень большая разница, и именно об этом нам и говорит цена. Купить ONYX BOOX NOVA 3 Color сегодня можно за сумму в районе 40 000 рублей .

Нужен ли Wi-Fi в электронной книге?

Сейчас, в основном, все ходовые модели ридеров комплектуются адаптером для беспроводного подключения к сети. Нужен Wi-Fi для того, чтобы загружать книги из интернета. Если спросить у нас, нужен ли он, то мы ответим: конечно, да. Почему?

  • Удобно пересылать книги с компьютера на электронную книгу: есть облачные сервисы либо же привязка к электронной почте — отправил письмо самому себе, зашел на почту с ридера и загрузил книгу.
  • Можно скачивать книги со специальных площадок: в каждом ридере предустановлен книжный магазин (там можно найти и бесплатные книги).
  • В большинстве электронных книг, оснащенных Wi-Fi, есть синхронизация — вы можете читать одну и ту же книгу с ридера, компьютера или телефона, так как процесс будет синхронизирован и каждое новое открытие книги будет начинаться оттуда, где вы остановились (вне зависимости от устройства).
  • В электронных книгах с Wi-Fi можно зайти в браузер, что уже огромный плюс (можно скачивать книги с интернета напрямую, обходя встроенный магазин).
  • Новая версия прошивки — это новые возможности ридера, улучшение производительности и исправление ошибок ОС (при помощи Wi-Fi устанавливать обновления намного легче).
Еще по теме:  Не работают HDMI на телевизоре Samsung

Электронные книги без адаптера беспроводной сети тоже имеют право на жизнь, ведь они несколько дешевле,а функционал остается прежним. Если вам нужен ридер исключительно для чтения и вы готовы загружать книги с компьютера через провод, то присмотритесь к модели PocketBook 606 . Она проста в управлении и, что самое главное, недорого стоит. Сегодня за такую просят в районе 8000 рублей .

Какая электронная книга лучше: кнопочная или с сенсорным экраном?

О таких субъективных вещах долго говорить не будем. Сенсорное управление сегодня — это нечто совершенно обыденное и привычное. Сводя большой и указательный пальцы или разводя их, мы увеличиваем либо уменьшаем масштаб объекта на экране. Точно так же и с электронными книгами: на сенсорном экране можно увеличивать изображение привычными действиями.

А в кнопочной «читалке» нам придется лезть в настройки и менять масштаб там. Также и с процессом перелистывания: мы привыкли свайпать вверх и вбок, поэтому будет очень удобно переходить на новую страницу простым движением пальца.

Электронные книги с сенсорным экраном стоят дороже кнопочных. Причем в сенсорных ридерах есть и кнопки. Используются они, как правило, для включения, навигации, изменения громкости (если предусмотрен аудиоразъем). Для людей постарше рекомендуем исключительно кнопочный вариант, так как с сенсорными экранами им легче всего будет все испортить одним неловким действием.

К примеру, модель Amazon Kindle PaperWhite 2018 пользуется большим спросом уже который год. Этот ридер относительно недорогой (около 11 000 рублей) , однако оснащен всеми функциями моделей подороже. Здесь есть и интернет, и сенсорный дисплей, и преобразователь текста в аудио (для прослушивания через гарнитуру).

Нужен ли в электронной книге разъем для наушников?

Если вы любите слушать аудиокниги, то, безусловно, да. Многие люди не способны воспринимать информацию на слух и предпочитают видеть ее своими глазами. Другие же просто засыпают, когда начинают слушать аудиокнигу.

Где смартфоны дешевле: сравниваем цены на онлайн-площадках

В большинстве современных моделей встроен аудиовыход на 3,5 мм. Это привычный jack.

Какие форматы книг или документов должна поддерживать электронная книга?

Чаще всего пользователи качают книги в расширениях:

Принципиального отличия между ними нет. Единственное, с чем могут возникнуть трудности, — очень большое количество современных ридеров не поддерживает популярный в России формат FB2. В остальном — разницы нет. Рекордсмен по количеству поддерживаемых форматов — PocketBook.

В этом и была маркетинговая “фишка” еще с момента появления бренда на рынке электронных книг. «Читалки» этого производителя поддерживают все возможные форматы текстовых документов. Именно поэтому PocketBook сегодня так популярен в РФ.

Нужна ли подсветка в электронной книге?

Нужна. Хорошее освещение — залог безопасности для зрения. Читать в темное время суток без подсветки трудно. Носить с собой везде настольную лампу у вас не получится. Встроенная подсветка вам реально пригодится.

Производители электронных книг очень удачно реализовали этот аспект, дабы и здесь обеспечить безопасность для глаз. Если свет от дисплея смартфона направлен вам прямо в глаза, то подсветка ридера направлена на экран устройства. С одного бока — в направлении другого.

И выглядит это в темноте примерно так:

Какой должна быть емкость аккумулятора электронной книги?

Если говорить об автономной работе ридеров, то счет идет на недели, а то и месяца. И не важно, 1500 mAh или 3000 mAh. Здесь все зависит от операционной системы. Как правило, книги на Linux работают дольше на одной зарядке аккумулятора, чем Android-представители.

Технология E-INK расходует заряд батареи только в процессе «перелистывания» страницы. Исключительно в этот момент создается электрическое поле для смены символов на экране. Дальше заряд аккумулятора тратится на подсветку и фоновую работу интернета (если книга параллельно загружает документы из сети).

Если читать в день по часа 3–4 с неяркой подсветкой, то автономной работы ридера хватит на несколько недель. Иногда хватает и на месяц. Чем чаще вы читаете в темноте, используя подсветку, тем быстрее придется ставить электронную книгу на зарядку.

Обычно производитель пишет, сколько «перелистываний» способен выдержать аккумулятор без подзарядки. Чаще всего этот показатель колеблется в районе 10 000 раз.

Нужна ли влагозащита электронной книге?

Здесь все, опять же, зависит от того, где вы любите читать. Если предпочитаете читать в ванной, то водостойкость книги вам, определенно, понадобится. Или же любите выйти и почитать под дождем на улице, или уронить ридер в лужу. Все зависит от того, насколько активно вы будете пользоваться книгой в повседневной жизни.

Водонепроницаемость будет не лишней, если вы везде планируете брать с собой «читалку». Ведь чем чаще книга будет оказываться вне дома, тем больше вероятность попасть с ней под дождь либо случайно пролить на нее что-нибудь. Модели Amazon Kindle PaperWhite 2021 и PocketBook 632 Aqua — самые популярные представители влагостойких ридеров. Цена на них примерно одинаковая — в районе 18 000 рублей . Если хотите купить электронную книгу с влагозащитой, то присмотритесь к этим 2 моделям.

На какие еще дополнительные характеристики стоит посмотреть при выборе электронной книги?

Объем памяти

Если планируете скопить на ридере книг как в Российской государственной бибилиотеке, то присмотритесь к вместительным устройствам. Объема в 32 Гбайт вам хватит для того, чтобы загрузить до 100 000 книг в формате FB2. Например, модель ONYX BOOX Leaf готова к подобным нагрузкам. Вышла она недавно и наделена всеми передовыми функциями, да и цена не сильно «кусается» (в районе 26 000 рублей) .

Конечно же, мы пошутили насчет такого количества книг. Во-первых, некоторое место занимает сама система (как правило, до 2 Гбайт). Во-вторых, книга может «весить» как 0,5 Мбайт, так и все 10 Мбайт — зависит от количества страниц, наличия иллюстраций и расширения. В-третьих, если скачивать аудиокниги («вес» которых может достигать 100 Мбайт), память быстро расходуется.

Оптимальный вариант — 16 Гбайт. Это не много, и не мало. Книги с таким объемом памяти не очень дорогие, и, в то же время, объем памяти будет достаточным.

Операционная система

Если вкратце, то особой разницы нет. Многие пользователи жалуются, что электронные книги на Android быстро разряжаются. Другие жалуются на интерфейс Linux, которая установлена в модели PocketBook. Здесь, опять же, дело вкуса. Если не особо разбираетесь в этом и никогда до этого не пользовались электронными книгами, то рекомендуем не обращать внимание на операционную систему.

Еще по теме:  Наруто по телевизору когда показывали

В каждой из них есть свой набор плюсов и минусов.

Где качать книги?

В каждом ридере установлен свой Store. Иногда там проходят акции со скидками. Также можно найти и бесплатную раздачу книг. В другом случае, если ридер поддерживает подключение к интернету, можно найти через браузер сайт, где собраны тысячи книг. С этим уж точно проблем не возникнет.

Если электронная книга не оснащена Wi-Fi-адаптером, то качать книги придется через провод с компьютера. Делается это очень просто: находите сайт, качаете все в одну папку, потом подключаете книгу и копируете файлы на внутренний носитель ридера. Далее электронная книга сама определит скачанные файлы и добавит их в электронную «полку».

Источник: dzen.ru

Как сделать электронную копию бумажной книги

Решили сделать копию бумажной книги в электронном формате DjVu или PDF? Узнайте, через какие трудности вам придется пройти и какой софт при этом пригодится.

Фото автора Пётр Глухов

Что для вас значит книга? Если это не просто увлекательный попутчик, но и мудрый наставник, то вы хоть раз задумывались о том, чтобы сберечь ее на будущее. Оцифровка бумажных книг имеет два несомненных преимущества: книга в электронном виде всегда под рукой, и ей очень легко делиться.

Из этого мануала вы узнаете об основных этапах создания удобной электронной версии бумажной книги с навигацией и возможностью копирования текста.

Вступление

Стоит оговориться, что в век бурной защиты авторских прав и легкой доступности литературы, изначально сверстанной в электронной форме, имеет смысл оцифровывать либо старые фундаментальные советские учебники, либо что-то действительно редкое и только для личного пользования.

Имея доступ к старым техническим справочникам, я иногда безвозмездно помогал тем незнакомым мне людям, которым так не хватало хороших источников знаний для обучения. И коль уж я подряжался, хотелось выполнить свою работу на достаточно высоком уровне, чтобы читателю книги было приятно в нее погружаться.

Этап 1. Копирование книги

Со временем многие процессы упрощаются. Если с пяток лет назад этот этап был крайне продолжительным (приходилось пользоваться сканером), то с улучшением камер мобильных телефонов затрачиваемое время существенно сократилось. Конечно, камера камере рознь, но, если подобрать приемлемые условия съемки, должен подойти любой более-менее современный телефон.

Разумеется, использование сканера все же более предпочтительно. Особенно если дело касается технической литературы, содержащей множество формул и чертежей.

Предвосхищая события, отмечу, что снимки впоследствии будут обработаны специальной программой. Но все же стоит добросовестно отнестись к самой съемке, дабы не ставить качество конечного продукта в зависимость лишь от постобработки.

Пример не самого хорошего снимка: освещение страдает, страницы до конца не выпрямлены. Все ради эксперимента

Поэтому постарайтесь максимально широко раскрывать страницы, чтобы изгибы у корешка книги были минимальны. Было бы здорово, если бы вам кто-то в этом помогал. Один человек держит телефон, а второй переворачивает и выпрямляет страницы. Ко всему прочему, студенты любят делать на библиотечных книгах пометки, и неплохо было бы их стереть.

Делаем серию снимков и перекидываем их на компьютер в отдельную папку. Пришла пора поработать неживому мозгу.

Этап 2. Обработка

Я сталкивался с двумя серьезными программами для обработки отсканированных (сфотографированных) книг: ScanTailor и ScanKromsator. Возможно, за годы моего инактива появились еще какие-то достойные альтернативы, но я сомневаюсь — уж очень мала и бедна пользовательская ниша. Самые прожженные книгоделы предпочитают ScanKromsator.

В нем предельно много настроек и возможностей, но разобраться и понять все предложенные навороты, видимо, не в состоянии и сам автор программы (шутка). Поэтому я рекомендую вам ScanTailor. Мне довелось следить за развитием этой утилиты с первых дней ее существования. Разработчик еще несколько лет назад прекратил поддержку проекта, но все-таки дал миру хороший инструмент для обработки сканов.

Начало работы

Работа в ScanTailor последовательна и проста. Все промежуточные действия отображены в левой части рабочей области, вы с легкостью вольетесь в процесс.

Выберите папку с исходниками, выходная папка будет создана автоматически. Для всех страниц установите максимально возможное DPI — 600 × 600. Мощности современных компьютеров позволяют достаточно быстро обрабатывать такие изображения.

Не жалейте DPI для своей книги

Шаг 1. Исправление ориентации

Самый простой и быстрый шаг. Скорее всего, вы изначально фотографировали страницы с верной ориентацией, потому и хлопот возникнуть не должно. Отмечу лишь, что изначально ScanTailor будет предлагать вам запустить пакетную обработку текущего действия (небольшой значок Play напротив шага) — обязательно им пользуйтесь, дабы не щелкать по каждому изображению отдельно.

На мой взгляд, ScanTailor может гордиться своим продуманным интерфейсом

Шаг 2. Разрезка страниц

Практически беспроблемный шаг. Я крайне редко встречал ошибки программы на этом этапе. Обязательно обратите внимание на обложку книги — именно здесь зачастую возникают нюансы.

Большей наглядности и придумать трудно

Шаг 3. Компенсация наклона

В подавляющем большинстве случаев алгоритм срабатывает корректно. Не ждите подвоха, переходите к следующему шагу.

К вашим услугам ручная настройка до долей градуса

Шаг 4. Полезная область

«Бракованная» полезная область будет видна при просмотре миниатюр страниц

Шаг 5. Поля

Размер полей — дело вкуса. Более важным моментом является возможность выравнивания размеров страниц. Не забудьте поставить эту галочку, чтобы не получить на выходе «пляшущие» страницы.

Обложку обычно приходится дорабатывать в графическом редакторе

Шаг 6. Выход

Последний бой — он трудный самый. Плюс самый ресурсоемкий для вашего компьютера и самый требовательный к вашему вниманию.

Необработанные страницы помечаются вопросительным знаком

Финишный отрезок знаменуется рядом важнейший действий. Прежде всего вы определяете выходной режим книги: черно-белый, цветной или смешанный. Затем страницы очищаются от мусора, искривленные строки выравниваются. Не буду вдаваться в подробности, но укажу вам на не самые заметные закладки, расположенные несколько нелогично и непривычно — между превью страницы и лентой миниатюр.

Каждая закладка отвечает за важную функцию ручной настройки получаемых изображений. Если вы найдете желание и время вникнуть в принцип их работы, ваши книги будут более высокого качества.

Страница до и после корректировки искажения строк

Итог

Стремясь к идеалу, на эту работу вы можете потратить не один час. Все зависит от вашей заинтересованности в конечном результате и качестве исходных снимков. Да, я еще раз возвращаюсь к этой теме. Чуть большие старания на этапе подготовки могут сэкономить огромное количество времени, которое уходит на приведение страниц в приличный вид.

Прошу не брать за образец приведенные скриншоты — на все про все у меня ушло не более пары минут. Я не сомневаюсь, что забыл указать вам на некоторые нюансы работы со ScanTailor — слишком давно я ничего не обрабатывал с его помощью.

В итоге вы получите набор разрозненных страниц в формате .tif. Пора сшиваться!

Этап 3. Создание djvu-файла

Если вы хотите быстро сварганить DjVu-файл, обратитесь за помощью к малюсенькой утилите DjVu Small. Есть и более серьезные программы, например DjVu Editor Pro. Конечно, предпочтительным видится применение второго инструмента. Но решать вам: установите обе программы и сравните их возможности.

Еще по теме:  Дутики которые рекламируют по телевизору

Что касается создания PDF — в Интернете есть вагон и маленькая тележка соответствующих программ и веб-сервисов.

Этап 4. Создание OCR-слоя

Одним из признанных мировых лидеров в распознавании текста несомненно является компания ABBYY с ее известным продуктом FineReader. Наверное, нет таких людей, которые не слышали об этой программе, поэтому и расписывать особо нечего. С недавнего времени FineReader умеет открывать и сохранять результаты работы прямиком в DjVu, что исключает необходимость использования промежуточного софта.

Этап 5. Создание оглавления

На просторах Сети довелось встречать положительные отзывы о программе Pdf https://lifehacker.ru/kak-sdelat-elektronnuyu-kopiyu-bumazhnoj-knigi/» target=»_blank»]lifehacker.ru[/mask_link]

oleg_nn

В современном мире, мире доступных знаний и относительно дешёвых книг, остаётся одна главная проблема: наличие времени на чтение. Желание читать предполагаем по-умолчанию.
Современные методики тайм-менеджмента, типа системы Дэвида Аллена под общепринятым названием «GTD» (Getting Things Done), или, если по-русски, «Как держать дела в порядке», позволяют проанализировать использование времени и выделить время почти на все интересующие дела, используя временные «дыры» — стояние в очереди, поездку в общественном транспорте, обед на работе и прочее подобное
Поэтому очень удобно иметь под рукой нужные книги в компактном устройстве, которое позволит читать во время таких перерывов. Но что делать, если книгу надо быстро прочитать, а в электронном виде её нет? Ответ прост – сделать её электронной!

Это не так сложно, как кажется

Ну, самый простой, который и способом-то назвать нельзя – это простое фотографирование на тот же смартфон отдельных глав книги, их проработка, и затем фотографирование следующих глав.

Для получения же полноценного файла в формате DOC, PDF или FB2, нам понадобится немного больше времени и используемых инструментов, среди которых:

1. Сканер
2. Программа анализа и распознавания отсканированных страниц — Abbyy FineReader или аналогичный софт
3. Текстовый редактор для подготовки итогового файла. Например, Microsoft Word, с которым удобно взаимодействует Abbyy Finereader. Так же новые версии Word позволяют сразу экспортировать получившийся документ в PDF.
4. Программы htmlDocs2fb2 и Fb2Fix для конвертации полученного документа формата DOC в формат FB2 для удобного чтения на практически любых устройствах.

Сначала мы просто сканируем книгу

Обычно, это один из самых времяёмких этапов создания электронной книги, но он же и самый простой и механистичный. Просто перелистывать страницы и сканировать. В зависимости от мощности компьютера и размера сканируемого изображения, количество времени на сканирование каждого разворота книги варьируется от нескольких десятков секунд до нескольких минут. Обычно же сканирование одного разворота занимает менее минуты.
Разрешение при сканировании ставлю не менее 300 DPI. Начиная с этого разрешения, распознавание происходит с минимальным числом ошибок.

Для книги я создаю отдельную папку, в которой накапливаются изображения. И через некоторое время, когда вся книга будет отсканирована, в этой папке будет множество изображений, с которых и будет происходить распознавание текста.

Для распознавания текста я использую программу Abbyy FineReader, которая не только хорошо распознаёт текст, но и предоставляет удобные инструменты для предварительной работы с изображениями.
Изначально в программе есть три базовых режима работы со вновь открываемыми изображениями, это:

-Открыть
-Открыть и распознать
-Открыть и проанализировать

«Открыть» — просто откроет изображение в программе, предоставляя пользователю самому решать, что делать дальше.

«Распознать» — программа сразу после открытия проанализирует файл на наличие текста, рисунков и таблиц, и распознает его, переведя текст в нормальный и привычный текст, доступный для редактирования, таблицы – сделает таблицами, а рисунки оставит рисунками.

«Анализировать» — программа «просмотрит» каждое изображение и пометит в нём блоки, которые «увидела» — в отдельную рамку одного цвета поместит текст, в рамку другого цвета поместит рисунки, и в рамку третьего цвета – таблицы. Затем эти блоки можно править и «показать» программе, какие блоки она должна считать текстом, а какие — рисунками или таблицами. Если некоторая зона на изображении не выделена никаким блоком – она не будет распознана совсем. Это очень удобно в случае большого количества исходных изображений (как в нашем случае, с целой книгой), позволит отсечь изначально ненужные данные (например, номера страниц, или «мусор», который программа ошибочно приняла за рисунки).

Таким образом, оптимальный вариант, который я использую в случае книги – это «Открыть и анализировать». Программа обработает все изображения и выделит в них блоки, но распознавать пока не будет. После того, как я вручную уберу ненужные для распознавания блоки и поправлю те блоки, которая программа выделила некорректно (например, пометила текст в качестве рисунка), то даю программе команду на распознавание.
Через некоторое время программа завершит обработку изображений, и полученный результат можно будет передать в MS Word для дальнейшей обработки. Есть несколько вариантов экспорта в Word, Abbyy FineReader способен сохранить исходное форматирование текста и создать оглавление. Но часто какие-то моменты в оформлении приходится править вручную, особенно в случае оглавления.

В принципе, начиная с этого этапа, мы уже работаем с обычным электронным текстом. Если в книге мало рисунков и таблиц, или они сразу встали на свои места, то можно приступать к чтению или конвертации в FB2. Но нередко Abbyy FineReader передаёт данные в Word в достаточно не эстетичном виде, с непонятно каким форматированием и оформлением. Поэтому, для начала, нужно поправить форматирование.

Иногда проще даже сбросить форматирование полностью и сделать его вручную, но обычно таких крайностей не нужно. Достаточно пробежаться по тексту, отметить заголовки и создать оглавление на первой странице.
Если же книга содержит ещё и таблицы с рисунками, то им надо уделить особое внимание, что бы они были на своём месте.

Такая связка из двух программ была найдена путём долгих экспериментов с различными конвертерами. А эксперименты были вызваны поиском решения проблемы отображения таблиц. При конвертации DOC в FB2, таблицы превращаются просто в текст, который уже невозможно читать таблицей. Ключевая особенность программы htmlDocs2fb2 в том, что она превращает таблицы в рисунки, и, тем самым, позволяет их просматривать в любой программе для чтения электронных книг формата FB2. Оглавление так же сохраняется и его можно вызвать через отдельное меню, предусмотренное в программах.

Чаще всего я не сканирую книги с нуля, а конвертирую найденный в Интернете файл формата DOC в FB2. Различные материалы по экономике, с множеством таблиц и графиков, вполне корректно конвертируются.

Вот такой небольшой практикум. Тема очень обширна, и если расписывать все тонкости, то уйдёт с десяток страниц. Так что если появились вопросы по теме – попробую ответить, задавайте:)

Источник: oleg-nn.livejournal.com

Оцените статью
Добавить комментарий