Для чего необходима оцифровка книг и как она организована в ОУНБ им. Н.В. Гоголя
На протяжении веков в мире погибло несколько сотен библиотек. Причины были разные: религиозные войны и вооруженные конфликты, стихийные бедствия и неосмотрительность людей.
Наибольшую роль в уничтожении научного и культурного наследия сыграли люди. Сожжение библиотек и разорение архивов чаще всего было следствием так называемого «культурного геноцида». Например, еще в 206 году до н. э. в результате вооруженного восстания был уничтожен исторический архив китайского города Сяньян. Книги из архива сжигались на дворцовой площади, а рядом с ними живьем закапывались ученые. Это привело к потере большого числа исторических рукописей, поэтических сборников и философских трактатов Китая.
В 47 г. до н. э. была уничтожена большая часть самой знаменитой библиотеки античного мира – Александрийской. По преданию, в ходе войны Юлий Цезарь оказался в осажденной Александрии. Чтобы выбраться из осады, он поджег свои корабли, и огонь с них перекинулся на библиотеку. Данные о количестве утерянных произведений сильно разнятся: одни историки заявляют о гибели 40 тысяч книг, другие – 400 тысяч. После этого библиотека была разрушена еще несколько раз: в 273 и в 391 году во время столкновения между язычниками и христианами.
Смерть Тамерлана, клад Чингисхана и подземная библиотека. Еще одна таинственная история - отрарская библиотека. По уверению приверженцев этой идеи, некогда собранное в древнем Отраре книгохранилище содержало тысячи томов начиная от клинописных табличек и папирусных свитков до средневековых книг европейского, арабского и китайского мира. Естественно, следы библиотеки теряются во время нашествия монголов.
Не пожалел книги и XXI век. Объекты культурного наследия все чаще становятся побочными жертвами природных катастроф и вооруженных конфликтов. В 2012-2013 гг. боевики исламистской группировки "Ансар ад-Дин" и "Движения за единство и джихад в Западной Африке" в ходе военного конфликта в Мали разграбили одну из библиотек Тимбукту, где хранились манускрипты. Покидая под натиском французских и малийских военных этот населенный пункт, исламисты подожгли хранилище рукописей.
В феврале 2015 года боевики международной террористической организации ДАИШ (запрещена в Казахстане) взорвали центральную библиотеку Мосула (Ирак), уничтожив от 8 до 10 тысяч книг, среди которых — древние труды по философии, истории, культуре. Во дворе библиотеки исламисты устроили костер из книг и рукописей.
В Караганде, в январе 2014 года пожарные боролись с пламенем больше пяти часов, чтобы спасти «читающие» машины и компьютеры, не имеющие аналогов в области. Во время пожара в спецбиблиотеке для незрячих и слабовидящих граждан сгорели – тифлооборудование, плоскопечатная литература, литература рельефно-точечного шрифта, озвученная литература, литература на электронных носителях и грампластинки – всего более 48 тысяч экземпляров.
Однако с начала нынешнего столетия мы имеем механизм, который может сохранить наше культурное наследие.
Рукописи горят. И не только рукописи — целые библиотеки. С ними вместе гибнут, портятся от копоти или сырости залитые при тушении книги, печатные издания, архивные документы, старинные манускрипты. Помимо огня фондам угрожают стихийные бедствия, социальные и техногенные катастрофы. Чтобы сохранить уникальные издания и сделать их доступными для читателей, во всем мире идут проекты по оцифровке.
Наша библиотека не исключение. В рамках государственной программы «Цифровой Казахстан» и согласно Концепции культурной политики с 2019 года идет создание «Цифрового архива печати Карагандинской области». В первую очередь, в цифровой формат переводятся газеты регионального значения «Советтік Қарағанды» (1949) и «Социалистическая Караганда» (1939), а также редкие издания книг. Для осуществления данного проекта библиотека приобрела аппаратно-программный комплекс «Элар», состоящий из 2-х планетарных сканеров формата А1 и А2, соответственно для сканирования книг и газет, сетевое хранилище данных, компьютерное и программное обеспечение, дополнительный сервер.
Как создают электронные копии?
Технология оцифровки зависит от издания и его состояния. Например, отсканировать одну страницу вновь поступившей литературы можно быстро; а оцифровка редкой книги намного сложнее.
Сканеры отличаются по сложности. Так, с 2002 года в библиотеке использовали планшетные сканеры, затем с 2011 – книжные сканеры BookScanA3, которые позволяют сканировать книги, не перегибая их переплет. При оцифровке изданий очень важно обеспечить сохранность оригинала, особенно когда речь идет о редких и уникальных изданиях. Для этого используется техника, обеспечивающая бесконтактную технологию сканирования, оберегающая книжные переплеты и исключающая вредное излучение и тепловое воздействие на оригинал. Поэтому с 2019 года цифровые копии в библиотеке создаются с помощью планетарных сканеров, которые сводят к минимуму воздействие на книгу, не требуя раскрывать ее на 180 градусов.
После сканирования начинается второй этап оцифровки книги — распознавание текста. Даже дорогостоящие программы по распознаванию пока не обеспечивают безошибочную точность передачи текста, поэтому необходимо вмешательство человека.
Количество погрешностей особенно увеличивается в тех случаях, когда речь идет о древних и рукописных текстах, где встречается много слов, неизвестных программе по распознаванию текстов. Если же речь идет об изданиях на казахском языке, то для их оцифровки нужен не просто редактор, но и носитель языка.
Цифровые копии бывают трех типов — они различаются между собой по объему информации в зависимости от назначения и особенностей использования.
Мастер-копия содержит максимально возможное количество информации, к ней не применяются алгоритмы сжатия. Она используется для восстановления объекта в случае его утраты, для некоторых видов исследований, для полиграфических целей, а также для изготовления других типов цифровых копий. Для защиты авторских прав доступ к мастер-копиям ограничен, и пользователям они предоставляются только в особых случаях.
Пользовательская копия — это электронное издание высокого или среднего разрешения, не допускающая полиграфическое воспроизведение объекта. Читатели могут работать с ним в электронной библиотеке или в базе данных. В отношении этого типа копий возможно применение алгоритмов сжатия, но текст должен остаться читаемым, а детали графических элементов — различимыми.
Наконец, служебная копия — это издание в низком разрешении, предназначенное для предварительного просмотра при поиске в Интернете, в базах данных и в электронных библиотеках. Служебные копии сжаты с потерями вплоть до уменьшения разрешения графического образа.
Хранение данных
Отдельная задача — хранение цифровых копий. В нашей библиотеке электронные документы хранятся на собственных серверах.
Серверное хранилище дает возможность управлять огромными объемами информации и организовать совместную работу сотрудников библиотеки с данными даже удаленно. В период пандемии сотрудники библиотеки работали дистанционно, подключаясь из дома к локальной сети библиотеки.
В настоящее время в числе приоритетных направлений деятельности библиотеки стоит задача создать цифровую платформу «Электронный архив печати Карагандинской области» для обслуживания, управления и хранения цифровых копий, которая будет доступна через Интернет.
По состоянию на март 2021 года, в цифровой коллекции библиотеки находится около 1 тысячи книг и более 5 тысяч выпусков газет.
Чен А.А., руководитель ОАБП