ОТЧЕТ О НАУЧНО-ИССЛЕДОВАТЕЛЬСКОЙ РАБОТЕ СОЗДАНИЕ БАЗЫ ДАННЫХ «ЭЛЕКТРОННЫЕ ОПИСИ АРХИВА РАН»
Директор Архива РАН, к.и.н. В.Ю.Афиани « » декабря 2013 г.
Директор Архива РАН, к.и.н.В.Ю.Афиани Руководитель темы руководитель центра, к.и.н.М.Ю.Киселев
Руководитель темы,руководитель центра, канд. ист.наукМ.Ю.Киселев(введение, основная часть, заключение) Исполнители темы: зам. директора, канд. ист.наукИ.Н.Ильина(сканирование и его контроль) руководитель центра, канд. ист.наукЕ.В.Косырева(сканирование и его контроль) ст. науч. сотр.В.Н.Загребаева(сканирование, конвертация в базу данных) ст. науч. сотр.Г.А.Савина(сканирование, конвертация в базу данных) программистА.В.Драчков(программное обеспечение) ст. лаборантИ.Б.Крамаренко(расшивка, сканирование,брошюровка) ст. лаборантМ.И.Положенко(расшивка, сканирование,брошюровка) оператор ЭВМО.В.Маркова(расшивка, сканирование,брошюровка) оператор ЭВМКолодина Н.В.(расшивка, сканирование,брошюровка)Отчет 107 с., 2 прил.
БАЗА ДАННЫХ, ЭЛЕКТРОННАЯ ОПИСЬ, АРХИВ, РОССИЙСКАЯ АКАДЕМИЯ НАУК
Объект исследования – архивная опись как основной справочник к документальным фондам и коллекциям Архива Российской академии наук.
Цель исследования – создание базы данных с электронным ресурсом оцифрованных описей фондов и коллекций Архива РАН.
В процессе работы проводилось изучение описей, их расшивка, сканирование, проверка результатов сканирования, брошюровка описей. База данных с графическими файлами описей была конвертирована в многофункциональную базу «Архив РАН».
Сотрудникам архива, исследователям читального зала и другим пользователям предоставлена возможность оперативного использования описей к документальному собранию Архива РАН как во внутренней версии информационно-поисковой системы архива (ИСАРАН) по локальной компьютерной сети, так и в глобальной сети Интернет.
Раздел 1 Внедрение информационных технологий в практику Архива РАН…………10-13
Раздел 2 База данных «Электронные описи» в Архиве РАН………………………….. 14-20
Архивы, как специальные «институты памяти», которые созданы человечеством для сохранения информации, всегда представляли собой особую информационную среду. А в условиях, когда стратегия развития общества ставит задачу обеспечивать равноправный доступ к информации и знаниям для всех, когда технологический прогресс стремительно преобразует любую среду и на первый план выходят принципы формирования глобального информационного пространства, архивные учреждения активно выступают в качестве субъектов этих процессов и становятся особо востребованными обществом. В современном электронном мире архивы пытаются использовать все возможности сделать доступными свои документальные сокровища с помощью сети Интернет.
Бывший (1999-2011) президент Федерального архива Германии (Bundesarchiv) доктор наук Хартмут Вебер (Dr. Hartmut Weber) о новых тенденциях однажды сказал: «Сегодня то, чего нет в Интернете, не воспринимают», он образно назвал современные электронные архивы, информация которых доступна в сети – «архивы без стен».
В настоящее время зарубежными архивами накоплен больший опыт в области организации поиска архивной информации и представления пользователям архивных документов в электронной форме в режиме удаленного доступа – через сайты и порталы. Наиболее успешные примеры решения проблем внедрения информационных технологий в свою деятельность демонстрируют такие зарубежные архивные учреждения, как: Федеральное агентство США «Национальный архив и управление документацией» – портал «NARA: National Archives and Records Administration» (www.nara.gov); Национальный архив Великобритании – сайт «The National Archives» (www.nationalarchives.gov.uk) и Национальный цифровой архив данных Великобритании – сайт «National Digital Archive of Dataset» (NDAD) (www.ndad.ulcc.ac.uk), Национальный архив Канады и Национальной библиотеки Канады – сайт «Library and Archives Canada» (www.archives.ca).
Особо хочется отметить опыт работы в этом направлении Федерального архива Германии – сайт «Das Bundesarchiv» (www.bundesarchiv.de). Архив принимает активное участие в работе по созданию Европейского архивного портала, который создается Советом руководителей Национальных архивов государств Европы (EBNA), а также является членом совета Европейской электронной библиотеки и вносит свои профессиональные интересы в ее построение. Все это позволяет утверждать, что такого рода проекты не только необходимы, но и уже в известной степени реализованы. Более того – люксембургский политик, комиссар Европейского союза по юстиции, фундаментальным правам и гражданству (с 2010 г.), а ранее — комиссар по вопросам информационного общества и средствам массовой информации Вивиан Рединг (Viviane Reding) объявила о вступлении в действие в 2010 г. первой версии Европейской электронной библиотеки, которая одним щелчком компьютерной мыши сделала доступными более шести миллионов книг, фотографий, фильмов, документов и других культурных свидетельств из библиотек, архивов и музеев Европы.
В России этот процесс также набирает темп. Анализ доступной информации, говорит о том, что попытки работы российских архивов в области внедрения информационных технологий имеют место, но масштабы этой работы пока не так велики, как у зарубежных коллег. Государственные архивы Российской Федерации ставят аналогичную задачу представления электронных архивных справочников (описей, путеводителей и др.) и документов пользователю, и уже несколько лет как решают ее.
С начала XXI века все федеральные, региональные и муниципальные архивы страны постепенно включались в общую работу по внедрении информационных технологий, предусмотренную Программой информатизации Федерального архивного агентства и подведомственных ему учреждений на 2011–2020 годы. Одним из главных направлений этой программы были сформулированы следующие задачи: предоставление государственных услуг по информационному обслуживанию населения в электронной форме; повышение открытости и эффективности работы федеральных архивов; получение гражданами и организациями преимуществ от применения информационных и телекоммуникационных технологий за счет обеспечения равного доступа к информационным ресурсам; развитие цифрового контента на основе современных технологий доступа к документам Архивного фонда Российской Федерации. Важнейшей составляющей в решении этой государственной задачи является массовый перевод традиционных архивных описей в электронный формат и появление новых ресурсов на сайтах федеральных, региональных, муниципальных архивов для всеобщего широкого использования. Программа также предусматривала солидное финансирование этого направления работы архивов для того, чтобы они могли воспользоваться методом поточного сканирования описей в формате аутсорсинга (привлекая к решению задачи сторонние организации, специализированные в данной области).
Наиболее продвинувшиеся вперед в применении информационных технологий в своей деятельности среди федеральных архивов: Государственный архив Российской Федерации (ГАРФ), Российский государственный исторический архив (РГИА), Российский государственный архив экономики (РГАЭ). Они принимали участие в аналогичном проекте под эгидой Федерального архивного агентства Министерства культуры Российской Федерации в рамках государственной программы «Архивы России». Корпорацией «Электронный архив» (компания, которая выиграла тендер на реализацию данного проекта) была разработана специальная технология – ретроспективная конверсия или ретроконверсия – промышленная технология перевода данных с графических образов, полученных после сканирования, в текстовый формат, формат баз данных или в мультистраничный графический. С помощью разработанной технологии (и при условии существенных материальных и людских ресурсов) были достигнуты впечатляющие результаты: сформированы базы данных и электронные каталоги архивных описей. Справедливости ради, необходимо указать на то, что не весь оцифрованный информационный ресурс описей при распознавании (как показало тестирование текстовых баз данных и сверка с первоисточником), однозначно влился в сформированные базы данных и в электронный каталог. Большую часть текстового ресурса приходилось дорабатывать в ручном режиме. Операции по доработке осуществляли операторы корпорации «Электронный архив» на своей производственной территории без участия профессиональных архивистов, что во многом, не способствовало улучшению качества распознанного текста.
Выполнение работ по переводу описей части фондов Государственного архива Российской Федерации и Российского государственного архива экономики в формат электронных баз данных, т.е. оцифровки описей и конвертации данных из базы данных «Электронные описи РГАЭ» в информационную систему «Читальный зал» РГАЭ и конвертацию в базу данных «Электронные описи ГАРФ» в специально созданное программное обеспечение, продолжается и в настоящее время, и финансируется за счет средств федерального бюджета, выделенных в рамках реализации федеральной целевой программы «Культура России» по теме – «Создание электронных каталогов и баз данных архивных описей».
Примером работы, близкой нам по принципам, подходам, методам и объемам исполнения, может быть Российский государственный архив литературы и искусства (РГАЛИ), который при финансовой поддержке Российского гуманитарного научного фонда (РГНФ) в 2007-2009 гг. осуществил оцифровку своих описей фондов. Для реализации проекта была привлечена компания «Издательство электронных информационных ресурсов РусАР» и ее оборудование.
Аналогичные проекты осуществляются и в регионах. Так, в 2010 г. в Татарстане началась масштабная работа по оцифровке особо ценных документов и описей фондов, хранящихся в архивах республики. Средства на подобный масштабный проект выделяются из бюджета республики. Технологическую поддержку проекта осуществлял Центр информационных технологий Республики Татарстан — некоммерческая организация, учрежденная Кабинетом Министров Республики Татарстан.
В 2005 г. стартовал крупномасштабный проект по созданию региональной системы Электронного архива Тюменской области, предусмотренный Региональной целевой программой «Электронная Тюменская область». По результатам открытого конкурса исполнителем работ по проекту стала уже называвшаяся корпорация «Электронный Архив». В решении такой масштабной задачи, как оцифровка 35 млн. листов документов и описей фондов (что составляет около 1,5 млн. дел) за 3 года, не обошлось без серьезных трудовых и технических ресурсов. На территории Государственного архива Тюменской области выездными бригадами из специалистов корпорации были развернуты производственные участки. В непрерывном производстве были задействованы 15 станций сканирования на основе промышленных планетарных сканеров ЭЛАР ПланСкан серии "А", которые выпускаются корпорацией. Работы по сканированию и обработке документов осуществляли одновременно 40 операторов.
Правовой статус Архива РАН, приравненного к научно-исследовательскому институту первой категории Российской академии наук, не предполагал возможности участия в программах Федерального архивного агентства и какого-либо целевого финансирования на эту работу. Только благодаря финансовой поддержке Российского научного гуманитарного фонды (РГНФ) по проекту № 11-01-12045в «Создание базы данных «Электронные описи Архива РАН» в период 2011-2013 гг. Архиву РАН удалось включиться в аналогичную работу и стать первым ведомственным архивом в стране, который силами собственных сотрудников решил важную задачу, поставленную государством перед архивной отраслью в полном объеме.
Участники проекта «Создание базы данных «Электронные описи Архива РАН» – высокопрофессиональные специалисты: научные сотрудники и лаборанты с высшим образованием с многолетним опытом работы с архивными документами, хорошо ориентирующиеся в составе документов Архива, обладающие знаниями по истории науки и истории Российской академии наук, убеждены, что исключение архивистов из технологической цепочки в реализации подобных проектов, недопустимо. В рамках настоящего проекта присутствие архивистов – научных сотрудников было на всех этапах создания электронного информационного ресурса, вплоть до оцифровки описей наиболее значимых фондов.
Архив Российской академии наук – старейший научный архив в России, предпринимает все возможные шаги в деле пропаганды своих документальных собраний, имеющих важную научную и социокультурную значимость.
В конце XIX века русский историк Иконников B.C. писал: «Академический Архив принадлежит к числу замечательнейших архивов России, представляя редкое по своей полноте собрание рукописей, служащих важнейшими и во многих случаях единственными источниками для истории науки и просвещения России в XVIII веке; кроме того, он заключает в себе много любопытных данных для характеристики быта и общественных нравов того времени».
Документы, хранящиеся в Архиве РАН, имеют непреходящую ценность для истории русской и мировой науки. Это документы, отложившиеся в результате научной, научно-организационной и административно-хозяйственной деятельности руководящих органов Академии наук, ее научных учреждений и организаций.
Особое место в Архиве РАН занимают личные фонды ученых, документы которых интересны, прежде всего, для развития той отрасли знаний, представителем которой является деятель науки, отражают его вклад в науку. Они также служат закреплению приоритета российских ученых в открытии и описании тех или иных явлений и закономерностей. Документы личных фондов ученых важны с точки зрения изучения истории науки как формы общественного сознания, истории накопления научных знаний, тенденций и направлений самой науки, необходимы при изучении биографий деятелей науки. Соединение биографического и исторического аспектов помогает проследить роль ученого на фоне общего пути развития научной мысли и его значения в культурной жизни общества.
Наряду с богатством архивных фондов важным показателем качества и эффективности работы архива является качество обслуживания. Оно в значительной мере определяется доступностью той или иной информации для лица, заинтересованного в ней, в нужное ему время и в удобном для него месте. Наибольшего эффекта здесь можно достичь с помощью сети Интернет. Тот архив, который не понимает и не принимает новых тенденций, теряет свои позиции.
Автократов В.Н. в своем основополагающем труде по теории науки об архивах «Теоретические проблемы отечественного архивоведения» писал следующее: «Обращенность к практике выражает главную прикладную черту архивоведения, причем самая богатая практика архивистов выступает необходимым источником теории, во многом определяет ее развитие и придает ей определенную самостоятельность – в пределах предмета и задач архивоведения»; он подчеркивал также, что «…внедренческий труд… заметно способствует росту научного потенциала архивов».
В век развития информационных технологий архивоведческие вопросы использования архивных документов выходят на иной уровень, круг которых можно объединить темой «архивы и интернет».
Любой крупный архив хранит свои собрания на сотнях (а то и тысячах) погонных метров стеллажей, заставленных коробками с архивными материалами, которые исчисляются миллионами дел и документов. Естественно, что для того, чтобы хотя бы представить возможности изучения тех или иных историко-научных тематик на базе архивных источников, нужен надежный навигатор, который приведет исследователя к тому необходимому комплексу документов, который позволит ему с наибольшей полнотой и достоверностью исследовать исторический сюжет. Поэтому неслучайно, архивы издавна придают огромное значение созданию и совершенствованию научно-справочного аппарата к своим документальным собраниям, публикуя путеводители и обозрения, на протяжении многих лет формируя различные (именные, систематические, предметные и др.) каталоги, а в последние годы, создавая информационно-поисковые системы, покрывающие своими возможностями все традиционные формы справочного аппарата.
Архив РАН ступил на стезю освоения информационных технологий в конце 1990-х годов. Сначала были созданы автономные тематические базы данных (БД) по отдельным фондам и коллекциям архива. В 2004-2006 гг. коллективом сотрудников Архива РАН при финансовой поддержке Российского гуманитарного научного фонда (РГНФ) в рамках проекта «Применение информационных технологий в освоении источниковой базы истории науки. (Разработка базы данных «Архив РАН» на платформе клиент-сервер)» была разработана многофункциональная база данных «Архив РАН». В результате реализации проекта были созданы специализированное программное обеспечение и технологическая среда, обеспечивающая доступ к архивным документам, разработана методика представления архивных информационных ресурсов пользователям.
Опись архивного фонда – это главный справочник по составу и содержанию документальных материалов, отложившихся в ходе деятельности учреждения или человека, систематизированных в структурированном порядке по определенной схеме классификации при приеме на государственное хранение. Научное описание каждой единицы хранения и расположение дел в определенном порядке внутри описи представляют собой важнейший элемент научно-справочного аппарата (НСА) любого архива, помогающего пользователю быстро и полно находить искомую информацию. Опись – это документ, необходимый как сотрудникам Архива РАН в их повседневной работе, так и широкому кругу исследователей при поиске информации в определенных предметных областях.
К 2011 г. в Архиве РАН сложилась достаточно непростая ситуация с описями к документальным фондам. Действующие «Правила организации хранения, комплектования, учета и использования документов Архивного фонда Российской Федерации и других архивных документов в государственных и муниципальных архивах, музеях и библиотеках, организациях Российской академии наук» требуют обязательного наличия трех экземпляров каждой описи к любому архивному фонду. Ввиду того, что в 1930-1960 гг. такого жесткого требования к описям не предъявлялось, многие фонды старой обработки не имели должного количества экземпляров описей. Как правило, первый экземпляр описей относится к страховому фонду и изымается из обращения. Второй экземпляр предназначен для служебного использования сотрудниками Архива РАН, третий – хранится в читальном зале для использования исследователями. В силу изложенных причин не все архивные фонды Архива РАН имели полную комплектность описей, необходимых для работы. Самым неполным был набор описей читального зала. Поэтому, при необходимости предоставить нужную опись исследователю читального зала, она на время изымалась из обращения сотрудников Архива РАН, для которых постоянный доступ к описям является необходимым условием оперативной и качественной работы. Естественно, что организационно решить проблему увеличения экземплярности описей можно было посредством ксерокопирования и переплета, чем была бы достигнута задача доведения количества каждой описи до трех экземпляров. Но такой путь был бы, с одной стороны, финансово затратным (полный реестр описей Архива РАН насчитывает 2646 описей), с другой стороны, несовременным и не имеющим перспектив широкого использования описей через Интернет. И, наконец, он был бы примером цифрового неравенства ведомственного Архива РАН в сравнении с федеральными архивами, получившими финансовую возможность поточного сканирования описей с привлечением сторонних фирм и отдельных профессионалов.
Заявка Архива РАН на проект оцифровки всего массива описей получила финансовую поддержку РГНФ сроком на три года, а Архив РАН благодаря реализации проекта не потерял своей репутации архивного учреждения, где успешно применяются современные технологий доступа к оцифрованным документам Архивного фонда РАН.
Благодаря финансовой поддержке негосударственных научных фондов и участию в целевых программах Отделения историко-филологических наук и Президиума Российской академии наук в Архиве РАН за последнее десятилетие удалось создать информационно-коммуникационную инфраструктуру, которая в 2007 г. была преобразована в Информационнау систему Архива РАН (ИСАРАН), состоящую из нескольких баз данных и программных приложений. В концепцию программного обеспечения ИСАРАН был заложен принцип постепенного наращивания функциональных возможностей. В настоящее время ИСАРАН – это комплекс из двенадцати взаимосвязанных баз данных и функциональных программных блоков, которые автоматизируют основные архивные виды деятельности: комплектование, описание, учет, хранение и использование архивной документации, интегрируют сведения научной и прикладной архивоведческой деятельности, обеспечивая решение основных информационных задач Архива РАН и контингента пользователей архивной информации за его пределами.
Попытка «открыть» в 2006 г. часть ресурса (электронный каталог) в сети Интернет на сайте «Архивы РАН» (www.arran.ru), показала высокую заинтересованность научного сообщества и пользователей в экстерриториальном потреблении информации БД «Учет и каталог» ИСАРАН. Важной организационной мерой было принятое в 2010 г. решение, перенести web-версию информационной системы «Архивы РАН» на отдельный специализированный сайт – www.isaran.ru.
Следует заметить, что в 2009 г. программное обеспечение в базовой комплектации «Учет и Каталог» было зарегистрировано в Федеральной службе по интеллектуальной собственности, патентам и товарным знакам в Реестре программ для ЭВМ (свидетельство № 2009617035), также как и многофункциональная база данных «Учет и Каталог» в Реестре баз данных (свидетельство № 2009620604).
В структуре базы данных «Учет и каталог» два условных раздела, которые обеспечивают поддержку главных архивных функций. В архитектуре базы данных на каждом описательном уровне (фонд – опись – дело – документ) сформирована своя таблица записей, которая отражает определенный аспект описания своего уровня: список фондов; список описей (реестр описей); список дел (опись дел); список документов. На каждом описательном уровне заложены карты (формы) с унифицированными формами метаданных – информационными полями, которые являются описательными элементами данного уровня.
Оцифрованный массив описей был конвертирован в структуру главной базы данных «Учет и катало», заняв несколько полей метаданных с графическими файлами, а web-версия ИСАРАН, представленная на сайте www. isaran.ru, позволяла вводить оцифрованные описи в научный оборот в режиме on-line согласно календарному плану работы по проекту.
Любая страница ИСАРАН, посвященная каждому архивному фонду документального собрания Архива РАН имеет опцию «Перечень описей», раскрыв которую можно видеть название, крайние хронологические даты и объем дел в каждой описи данного фонда. Выбрав необходимую для изучения опись, можно ее активировать путем нажатия курсора на запись, и открыть интерфейс опции «Оцифрованная опись фонда», где предоставляется возможность просмотра графических файлов описи двумя удобными способами. К стандартной возможности управления содержимым сайта на движке Drupal добавлена возможность просмотра изображений в специальной программе BookReader с еще более удобной системой навигации.
Подготовка метаданных (в архивоведческой теории и практике – вторичной информации) путем аналитико-синтетической переработки первичной информации, содержащейся в документах, и извлечения необходимых сведений из учетных и других документов архива, завершается созданием автоматизированного научно-справочного аппарата к документам для дальнейшего поиска и многоаспектного использования.
Информационное наполнение автоматизированного научно-справочного аппарата (АНСА) составляют описания документов на уровне фонда, описи, единицы хранения, документа, содержащиеся в информационной системе, а также полнотекстовые базы данных, содержащие цифровые копии документов.
АНСА реализует все функции традиционной системы научно-справочного аппарата архива и предоставляет по сравнению с традиционным НСА (на бумажном носителе) более широкие возможности оперативного и многоаспектного поиска архивных документов, представления его результатов (в том числе в режиме удаленного доступа). Обязательными элементами АНСА являются описи.
В первый год осуществления проекта (2011г.) были оцифрованы описи обработанных фондов личного происхождения. В начале коллективной работы были проанализированы научно-технологические процессы, связанные с созданием базы данных «Электронные описи Архива РАН». Проведены подбор, расшивка, сканирование 890 описей 425 личных фондов ученых (академиков и членов-корреспондентов Российской академии наук, выдающихся ученых прошлого и современности), проведена проверка результатов сканирования, брошюровка описей.
После обработки графических файлов, цифровой массив был конвертирован в специальный раздел базы данных «Учет и каталог» информационной системы «Архив РАН». Результатом заполнения поля с метаданными «Изображения» в разделе «Описи» в распределенной структуре базы данных «Учет и каталог» у сотрудников и исследователей читального зала архива появились принципиально новые возможности доступа к информации – осуществлять просмотр и чтение электронных копий описей в локальной сети архива в режиме реального времени. Одновременно массив с графическими образами описей фондов был размещен в разделе «Реестр описей» на сайте «ИСАРАН» www. isaran.ru в форме «превью» (preview — предварительный просмотр).
Во второй год реализации проекта (2012г.) была продолжена работа над созданием графических файлов описей. В течение года были отсканированы 1 632 описи 405 фондов учреждений и организаций РАН. Одновременно пользователи сайта получили возможность изучать полнотекстовые электронные копии описей фондов Архива в режиме on-line по мере их сканирования – http://isaran.ru/?q=ru/reestr.
В завершающий год работы над проектом (2013г.) были оцифрованы описи архивных коллекций (разрядов) и дополнения к описям фондов, поступившим в 2011-2013гг. Были подведены итоги пилотного проекта в рамках общей проблемы – перевода отдельных описей последних лет обработки из графического формата в полнотекстовый посредством специально разработанного для этих целей конвертора.
Началу работы по созданию базы данных описей фондов предшествовала разработка технологии и методики работы по переводу традиционной (на бумажном носителе) описи фонда в цифровой формат. В структуру данных базы данных «Учет и каталог» были включены карты – «Изображения» и «Иллюстрации» с полями метаданных и набором специализированного функционала, который поддерживает процесс сканирования документов в формате JPG, при условии, что к рабочей станции (компьютеру) пользователя, подключено сканирующее устройство. Функционал обеспечивает обработку и хранение цифровых образов документов. Программное обеспечение базы данных поддерживает графические изображения различных популярных стандартных форматов, а также мультимедийные файлы.
Методика работы по созданию, обработке, хранению и использованию графических файлов в программном обеспечении базы данных была зафиксирована в специальном разделе «Инструкции по формированию и ведению базы данных «Учет и каталог».
Таким образом, по результатам трех лет работы были оцифрованы все традиционные (на бумажном носителе) описи дел фондов, прошедшие научное описание в Архиве РАН. Была подготовлена база данных «Электронные описи», которая интегрирована в многофункциональную БД «Учет и каталог» Архива РАН информационной системы «Архивы РАН» и в формате web-версии в режиме реального времени доступна всем пользователям архивной информации на сайте «ИСАРАН - web».
Созданная за три года силами сотрудников Архива РАН база данных «Электронные описи» была интегрирована в информационный блок ИСАРАН «Учет и каталог». Она включает в себя информацию о 1737 описях дел по 428 фондам учреждений и коллекций с общим объемом 320778 единиц хранения, что составило 37821 файл/ 9000.3 Мб (Приложение А) и о 908 описях дел по 438 фондам личного происхождения с общим объёмом 181275 единиц хранения, что составило 29645 файлов / 25007.8 Мб (Приложение Б). Итого база данных содержит 67466 графических фалов (т.е. оцифрованных листов) объемом 34008,1 Мб по 2645 архивным справочникам (описям дел) на 866 фондов (502053 ед. хранения).
Полученный опыт в ходе выполнения проектных заданий, в настоящее время внедряется Архивом РАН в систему архивов Российской академии наук. Применение технологии и методики процесса подготовки базы данных электронных описей внедрены в архивах РАН: Научный архив Кольского научного центра РАН (НА КНЦ РАН) и Научный архив Карельского научного центра РАН. В этих архивах успешно применяется на практике технологические и научно-методические разработки Архива РАН. Результаты их работы представлены в сети на сайте ИСАРАН-web по электронным адресам: НА КарНЦ РАН - http://isaran.ru/?q=ru/funds; НА КНЦ РАН - http://isaran.ru/?q=ru/funds.
В рамках темы «Создание базы данных «Электронные описи Архива РАН» был осуществлен «пилотный» проект по разработке информационно-технологического процесса создания текстовой электронной базы данных архивных описей методом распознавания графических образов оцифрованных листов традиционной описи фондов и перевода данных в текстовой формат. Для этого были отобраны описи, наиболее приемлемые (с хорошим качеством машинописи) для подобных операций, которые были оцифрованы с применением популярного программного комплекса для распознавания отсканированного текста – ABBYY Fine Reader Home. Затем тексты были преобразованы (в ручном режиме) в необходимый шаблон, а затем с помощью специально разработанного конвертора загружены в программный модуль «Тайпер», интегрированный с ИСАРАН. В программном модуле в ручном режиме проводилось редактирование данных перед конвертацией их в электронный каталог ИСАРАН с одновременной сверкой научных описаний дел с первоисточником. Пилотный проект по конвертации графических файлов в полнотекстовые не принес желаемых результатов, так как в настоящий момент не существует эффективных технологий преобразования графических файлов ретроспективного текста в собственно текст. Дополнительной трудностью является невозможность преобразования графических файлов описей в текст априори, так как не позволяет обходиться без трудоемкой и неэффективной по затратам времени и труда «ручной доводки». По проведенному в процессе эксперимента хронометражу коллектив исполнителей пришел к выводу: рациональнее проводить комплекс работ по созданию текстовых баз данных традиционным способом: ручным набором текста в редакторе MS Word или при заполнении полей метаданных программного модуля «Typer».