ВДОВИЦЫН Владимир Трофимович - к.ф.-м.н., доцент, заведующий лабораторией
информационных компьютерных технологий Института прикладных математических
исследований Карельского научного центра Российской академии наук.
СОРОКИН Анатолий Дмитриевич - к.т.н., с.н.с., заместитель директора по
науке Института прикладных математических исследований Карельского научного
центра Российской академии наук.
ВОПРОСЫ ФОРМИРОВАНИЯ И ИСПОЛЬЗОВАНИЯ
ЭЛЕКТРОННЫХ НАУЧНЫХ ИНФОРМАЦИОННЫХ РЕСУРСОВ
Введение.
Создание электронных научных информационных ресурсов и их
эффективное использование для информационной поддержки образования, науки и
инновационной деятельности является актуальной и важной для развития нашей страны
задачей. В настоящее время в научных учреждениях и вузах России активно ведутся
работы по созданию электронных информационных ресурсов, в том числе и с
использованием Интернет-технологий. Для того чтобы придать этому процессу
системный характер, повысить качество и надежность электронных информационных
ресурсов необходимо, на наш взгляд, перейти к созданию интегрированных
информационных систем научных учреждений, построенных на основе согласованных
стандартов и с применением современных информационных технологий.
В статье представлен обзор отечественных и зарубежных
информационных систем для поддержки научных исследований и прикладных
разработок. Рассматриваются вопросы формирования электронных научных
информационных ресурсов и их использования для поддержки научных исследований,
образования и инновационной деятельности в рамках построения Единой
Информационной Системы Карельского научного центра Российской академии наук
(ЕИС КарНЦ РАН).
1. Информационные системы для поддержки научных
исследований и прикладных разработок.
1.1. Научные информационные системы.
Научные информационные системы (НИС, Current Research Information
Systems - CRIS) можно определить как информационные системы для доступа к научной
информации. Этот класс систем достаточно подробно описан в работах [1,2,3]. Здесь
приводится краткое изложение некоторых основных сведений об этих системах.
Основными категориями пользователей НИС являются [1]:
- УЧЕНЫЕ (доступ к актуальной научной информации, поиск
партнеров, финансирования, оборудования и вычислительных мощностей);
- ПРЕПОДАВАТЕЛИ И СТУДЕНТЫ (знакомство с достижениями
науки и техники и использование результатов научных исследований в образовательном
процессе);
- ИНВЕСТОРЫ И ПРОМЫШЛЕННОСТЬ (поиск перспективных
научных разработок и новых технологий, а также экспертов, способных оценить новые
научные результаты и технологии и способствовать их внедрению в производство);
- РУКОВОДИТЕЛИ ГОСУДАРСТВЕННЫХ ОРГАНОВ
УПРАВЛЕНИЯ (управление наукой, определение роли научных учреждений и ученых в
научном процессе);
- ГРАЖДАНЕ (знакомство с достижениями науки и техники).
С учетом информационных потребностей вышеперечисленных
категорий пользователей выделяют следующие основные виды информационных
ресурсов, с которыми работают НИС: информация об организациях, проектах и отчетах о
проделанной работе; персональная информация; публикации; описание научных
результатов, патентов, технологий и уникального научного оборудования; информация о
научных фондах, электронных библиотеках, базах данных и вычислительных ресурсах, а
также различная нормативно-справочная и библиографическая информация и другие
документы, относящиеся к научной и научно-организационной деятельности
учреждения.
Современные НИС должны удовлетворять следующим основным
требованиям [1, 2]. Во-первых, в этих системах необходимо организовать сбор
соответствующей информации и перевод ее в электронную форму. При этом выделяют
следующие процедуры ввода данных: интерактивный ввод данных пользователями; сбор
данных в сети посредством специализированных сетевых "пауков" (мигрирующих по
сети программ-агентов); путем обмена данными с другими НИС; интеграцией НИС с
другими информационными системами. Во-вторых, обеспечение релевантности
документов. Эта проблема обостряется при автоматическом сборе информации в сети
Internet сетевыми "пауками". Возможные способы обеспечения релевантности
документов решаются: точным указанием автоматическим поисковым средствам
пространства поиска информации и критериев качества собранной информации;
разделением всех информационных ресурсов на собранные экспертами и "пауком" с
указанием степени достоверности. В-третьих, обеспечение актуальности, полноты и
достоверности документов. При этом проблема достоверности информации решается:
для интерактивного ввода - ограничением ввода только аутентифицированными
пользователями; для автоматического сбора - ограничением области действия
собирающего информацию "паука"; при обмене информацией с другими НИС - путем
установления фильтров на импортируемые ресурсы. В-четвертых, наличие служб
обслуживания запросов пользователя, включающих поддержку поиска как по атрибутам,
так и обеспечение полнотекстового поиска и просмотра информационных ресурсов по
категориям. Кроме основных требований к НИС предъявляются и дополнительные
требования, связанные с поддержкой распределенной архитектуры, различных уровней
абстракции хранимой информации, возможности архивирования информации.
Некоторые специалисты отмечают важность свойства НИС выступать в качестве
научных порталов, например, система CORDIS [3], научный портал "Российская Научная
Сеть " (http://www.nature.ru/).
Среди проблем создания и использования НИС наиболее
существенными являются проблемы сбора необходимой информации, а также
привлечение пользователей к работе с системой. Возможные пути решения - оплата
информации, интеграция НИС с финансирующими научные исследования
организациями (научными фондами), организация сетей обмена информацией с другими
подобными системами на взаимовыгодной основе.
В качестве примеров российских информационных систем, которые
можно отнести к классу НИС, следует отметить:
- ИСИР РАН (http://isir.ras.ru/) - обеспечивает доступ к информации об
институтах, ученых, проектах и публикациях с организацией просмотра и поиска
необходимой информации по запросам;
- ИС СО РАН (http://www-sbras.nsc.ru/) - содержит информацию о
научной деятельности отделения, описание важнейших разработок, материалы научных
конференций и т.п.;
- сервер ГосНИИ информационных технологий и телекоммуникаций
(http://www.informika.ru/)- содержит ряд баз данных (БД) по организациям, ученым,
научным конференциям и т.п.
1.2. Единая среда распределенных ресурсов.
В настоящее время во многих странах мира активно разрабатывается
концепция создания единой среды распределенных ресурсов (ЕСР, GRID),
обеспечивающей глобальную интеграцию информационных и вычислительных ресурсов
на основе новых компьютерных технологий с целью информационного обеспечения
процессов принятия решений (более подробную информацию об этих системах можно
найти, например, в работах [4, 5]). Выделяют два основных направления в развитии
GRID систем: вычислительный (computational) GRID и информационный (data intensive)
GRID. При этом проекты создания вычислительных GRID - систем направлены на
создание распределенных компьютерных систем, обеспечивающих максимальную
скорость вычислений за счет глобального распараллеливания вычислений (например,
проект создания распределенного суперкомпьютера TeraGRID, http://www.teragrid.org).
Проекты информационных DataGRID-систем обеспечивают хранение, обработку и
анализ огромных массивов данных (сотни терабайт) с одновременным доступом к
информации тысяч пользователей по сети Internet. В качестве примера следует отметить
масштабный международный проект EU Data GRID (http://www.eu-datagrid.org),
направленный на создание глобальной инфраструктуры нового поколения для хранения
и обработки огромных массивов информации в области физики высоких энергий,
биологии и систем наблюдения за Землей. В качестве основы для разработки
промежуточного программного обеспечения (middleware) в проекте EU DataGRID
выбран набор инструментальных средств Globus (http://www.globus.org). Таким образом,
ЕСР-систему можно представить в виде огромного гипотетического метакомпьютера, к
которому могут обратиться пользователи по сети Internet по единому интерфейсу для
получения необходимых для принятия решений информационных и вычислительных
ресурсов .
1.3. Электронные библиотеки.
Электронная библиотека (ЭБ, Digital Library) - распределенная
информационная система, обеспечивающая формирование, хранение и эффективное
использование различного рода коллекций электронных информационных ресурсов и
представляющая доступ к ним в удобном для пользователя виде через глобальные сети
передачи данных - Internet. Коллекция электронных (цифровых) информационных
ресурсов (Information Resources Collection) - систематизированная совокупность
информационных ресурсов, объединенных по какому-либо критерию, например, по
общности содержания, источников, назначения, авторства, круга пользователей,
владельцев, способов доступа и т.п. [7,8].
Исследования и разработки в области создания и использования
электронных библиотек активно ведутся в различных странах мира. Регулярно
проводятся ежегодные научные конференции, например, европейская конференция
ECDL, а также объединенная конференция AСM/IEEE по электронным библиотекам -
JCDL. В России проведено пять научных конференций по электронным библиотекам.
Шестую конференцию планируется провести в сентябре 2004 г. в Пущино
(http://www.impb.ru/~rcdl2004/). Следует отметить, что в ряде публикаций отмечается
перспективность применения этой технологии при создании информационных систем в
научных учреждениях.
В работе [9] рассматриваются перспективы создания ЭБ в Российской
академии наук, которые потенциально могут стать универсальными хранилищами всей
информации, создаваемой учреждениями РАН. При этом ключевыми функциями таких
библиотек является обеспечение интеграции разнородных информационных ресурсов и
публикация всех видов научной информации, а также обеспечение ее доступности и
сохранности.
В работе [10] отмечаются особенности научных коллекций
электронных информационных ресурсов. Во-первых, научные коллекции различаются
масштабом круга пользователей. В научных электронных библиотеках могут
содержаться как коллекции, имеющие национальную и/или мировую значимость, так и
персональные коллекции ученых и исследовательских лабораторий. При этом
персональные коллекции со временем могут приобрести более высокий статус. Во-
вторых, научные коллекции более динамичны по структуре и составу информационных
ресурсов по сравнению, например, с музейными коллекциями. В-третьих,
информационные потребности исследователей более разнообразны чем, например,
относительно стабильные информационные потребности управленческих работников.
Поэтому, в научных ЭБ для доступа к коллекциям должны предусматриваться гибкие
пользовательские интерфейсы. В-четвертых, достоверность сведений в научных
коллекциях определяется достигнутым уровнем знаний в данной области науки. Также
отмечается присущая научным коллекциям неполнота и/или нечеткость представленных
ими сведений. При этом научные коллекции могут содержать сведения не только о
реальных процессах и явлениях, а также содержать данные компьютерного
моделирования с моделями исследуемых систем. Коллекции в различных областях науки
имеют свои специфические особенности. Так, например, в географии, экологии и
региональной экономике значительную часть информационных ресурсов составляют
картографические сведения, для работы с которыми используются ГИС-технологии. Во
всех областях научных исследований используются коллекции библиографических
данных, а также коллекции полнотекстовых научных публикаций.
В настоящее время у нас в стране и за рубежом накоплен значительный
опыт в создании электронных библиотек. Создан портал "Российские электронные
библиотеки" - http://www.elbib.ru, cледует отметить ЭБ РФФИ (http://elibrary.ru) и СО
РАН (http://www-sbras/nsc.ru/win/elbib), а также ряд зарубежных систем - The Historic
Pittsburgh Digital Library ( http://www.pitt.edu/~edwardg/histpitt/survey.html), The Alexandria
Digital Library ( http://www.alexandria.ucsb.edu/ ) и др. Реализация этих и других проектов
создания ЭБ показала практическую значимость и эффективность использования таких
информационных систем в первую очередь для поддержки человеческой деятельности в
различных областях науки, образования и культуры.
2. Необходимость создания ЕИС КарНЦ РАН.
Единую Информационную Систему Карельского научного центра РАН
определим как распределенную в компьютерной сети центра систему электронных
(цифровых) научных и административных информационных ресурсов и программных
средств, обеспечивающих процессы формирования, сохранения и многоцелевого
использования этих ресурсов для решения научных, научно-управленческих и
прикладных задач. Главной целью создания ЕИС КарНЦ РАН является повышение
уровня информационного обеспечения научных исследований и прикладных разработок,
а также организационно- управленческой деятельности институтов и Президиума центра.
В настоящее время Карельский научный центр РАН располагает
значительными техническими и информационными ресурсами и имеет опыт создания и
развития телекоммуникационных и информационных систем. В состав центра входит 7
научных институтов и централизованные службы аппарата Президиума (включая
научную библиотеку, редакционно-издательский отдел, патентную службу и отдел по
научно-техническим связям с зарубежными странами). В составе научных институтов 36
лабораторий, 6 секторов, 3 отдела и более 5 групп. Все эти подразделения географически
расположены в 4-х территориально удаленных корпусах. Инфраструктура ЕИС КарНЦ
РАН должна опираться на действующую телекоммуникационную структуру, которая
является основой для решения задач информационного обеспечения процессов
проведения фундаментальных исследований и прикладных разработок, а также
административной деятельности центра [11,12,13].
В институтах КарНЦ РАН ведутся работы по созданию и развитию
научных электронных информационных ресурсов в том числе и с использованием
Internet-технологий [13]. С 1997 года создан и функционирует официальный Web-сайт
центра (http://www.krc.karelia.ru), сайты институтов (http://biology.krc.karelia.ru,
http://geoserv.krc.karelia.ru, http://nwpi.krc.karelia.ru и др.), а также ряд тематических
предметно-ориентированных сайтов с интегрированными базами данных, например, в
области гуманитарных наук - http://phonogr.krc.karelia.ru, http://toris.krc.karelia.ru , в
биологии - http://biodiv.krc.karelia.ru и др. [14,15]. Большинство этих проектов
выполнялись в течение 1997-2001 г.г. при поддержке грантов РФФИ, РГНФ и ФЦП
"Интеграция". При этом использовались в основном традиционные Web-технологии и
свободно распространяемые СУБД - miniSQL и MySQL с организацией доступа к базам
данных по разработанным интерфейсным формам с применением технологии CGI-
скриптов. Также следует отметить электронный каталог Научной библиотеки КарНЦ
РАН (http://foliant.ru/catalog/knclibr/), работы по созданию электронной коллекции знаний
об Онежском и Ладожском озерах (Институт водных проблем Севера) [16, 17], а также
проекты в области создания ГИС (Институт геологии).
Состояние научного информационного пространства КарНЦ РАН во
многом совпадает с оценкой состояния научного информационного пространства РАН,
которое приведено в концепции создания ЕИС РАН
(http://uis.isir.ras.ru/win/htm/scientific_activity.html?p=5p0p0). Во-первых, институты
центра обладают значительными и постоянно возрастающими научными
информационными ресурсами, которые, как правило, слабо систематизированы и
разрознены. Во-вторых, научная информация слабо представлена для доступа по
телекоммуникационным каналам. В-третьих, отсутствует централизованная
специализированная система поиска научной информации и доступа к ней. В-четвертых,
практически отсутствуют для широкого доступа электронные версии изданий научных
трудов ученых центра, хотя авторы в основном предоставляют в издательство
электронные варианты публикаций. В-пятых, научная информация не имеет
стандартизованного электронного представления.
Необходимость создания ЕИС КарНЦ РАН так же во многом
перекликается с основными предпосылками информатизации РАН. Во-первых,
целесообразно упорядочить и стандартизовать доступ к результатам научной
деятельности КарНЦ РАН. Во-вторых, необходимо обеспечить создание и доступ по сети
Internet к электронным библиотекам научных информационных ресурсов, базам данных и
вычислительным ресурсам, а также организовать доступ к основным мировым и
отечественным электронным базам информационных ресурсов. В-третьих, целесообразно
организовать информационно-справочный сервис, осуществляющий накопление и
предоставление оперативной научной и хозяйственно-административной информации. В-
четвертых, необходимо расширить и реализовать на качественно новом уровне ряд
систем автоматизации научной, административной и хозяйственной деятельности центра,
а также организовать электронный обмен научной, хозяйственно-административной и
нормативно-правовой информацией между организациями РАН. В-пятых, необходимо
обеспечить создание и доступ по сети Интернет к электронным версиям научных
публикаций сотрудников центра.
3. Вопросы разработки ЕИС КарНЦ РАН.
3.1. Основные требования и первоочередные задачи.
ЕИС КарНЦ РАН должна иметь распределенную архитектуру -
состоять из множества серверов, рабочих станций, каналов связи и необходимого
телекоммуникационного оборудования, образующих единую интегрированную
информационно - телекоммуникационную среду центра. Основу системы должны
составить информационные системы Институтов и Президиума КарНЦ РАН.
Разработка и реализация ЕИС КарНЦ РАН должна проводиться с
учетом выполнения следующих основных требований:
- с учетом иерархической структуры РАН. При этом основным
учреждением, проводящим научные исследования, является институт, а основными
управляющими структурами (в нашем случае) являются: Президиум КарНЦ РАН,
отделения и Президиум РАН. Поэтому, основные информационные потоки должны
быть направлены как по цепочке "институт - отделение", так и по цепочке "институт
- Президиум КарНЦ РАН - Президиум РАН";
- с учетом тесной интеграции системы с ЕИС РАН. При этом, ЕИС
КарНЦ РАН должна разрабатываться и развиваться как самостоятельная
информационная система (в соответствии со своими целями и потребностями), а с
другой стороны ее разработка и развитие должны осуществляться в тесном
взаимодействии с создаваемой ЕИС РАН;
- система должна разрабатываться на основе согласованных стандартов
на интерфейсы и метаданные, иметь открытую архитектуру и быть масштабируемой;
- система должна разрабатываться и развиваться поэтапно с учетом
появления новых задач и изменения требований к существующим задачам;
- в системе должна быть предусмотрена функция обеспечения охраны
авторских прав ученых центра на научные открытия и изобретения;
- система должна иметь эффективный механизм разграничения прав
доступа пользователей к своим ресурсам и обладать надежной защитой
информационных ресурсов от несанкционированного доступа. При этом одна часть
информации должна быть представлена в открытом, а другая - в строго
контролируемом режиме (перечень открытой и информации ограниченного доступа
устанавливается на основании распоряжений Президиума РАН, отделений,
руководства центра и институтов).
Первоочередными задачами по созданию ЕИС КарНЦ РАН на
ближайшую перспективу являются, на наш взгляд, следующие задачи:
- Развитие и поддержка в актуальном состоянии официального Web-
сайта КарНЦ РАН (превращение его в научный портал) и сайтов институтов центра.
Стандартизация их структуры и информационного содержания с учетом фокусировки на
информационные потребности целевой аудитории (ученые, преподаватели, инвесторы и
т.п.). При этом следует стремиться к тому, чтобы официальный сайт и сайты институтов
центра в большей степени удовлетворяли требованиям современных НИС.
- Создание и развитие тематических (проблемно-ориентированных)
Web-сайтов с интегрированными базами данных и знаний, алгоритмическими и
вычислительными ресурсами и электронными публикациями по научной тематике,
исследования по которой проводятся специалистами центра. В перспективе, при
создании таких систем необходимо использовать достижения GRID-технологий.
- Создание инфраструктуры электронной библиотеки научных
информационных ресурсов КарНЦ РАН, предназначенной для поддержки процессов
публикации, поиска, сохранения и распространения научной информации по сети
Интернет.
- Создание и развитие электронных (цифровых) коллекций
документов по различным областям знаний, исследования по которым проводятся в
центре, и их интеграция в электронной библиотеке научных информационных ресурсов
КарНЦ РАН.
- Создание или освоение приобретенных программных комплексов
информационной поддержки организационно-управленческой деятельности руководства
институтов и Президиума КарНЦ РАН.
- Обеспечение защиты электронных информационных ресурсов
центра от несанкционированного доступа.
- Обеспечение интеграции ЕИС КарНЦ РАН с ЕИС РАН, а также
взаимодействие с российскими и зарубежными информационными системами - РФФИ,
РГНФ, ГСНТИ, Росинформресурс, Российских ВУЗов и др.
В настоящее время в рамках проводимых в центре работ по созданию
элементов ЕИС КарНЦ РАН реализуется ряд проектов, связанных с разработкой
информационных систем для поддержки научных исследований и прикладных
разработок. В качестве примера можно привести разработку информационной системы
по топонимии Европейского севера России, а также создание электронной библиотеки
научных информационных ресурсов КарНЦ РАН.
3.2. Информационная система по топонимии Европейского севера
России.
С целью содействия развитию российской топонимической науки,
координации теоретических и прикладных исследований российских ученых-
топонимистов в различных регионах страны нами разработан и развивается
тематический Web-сайт TORIS (http://toris.krc.karelia.ru), включающий [15]:
- базу данных о топонимах Европейского севера России;
- библиографическую базу данных о публикациях по прибалтийско-
финской и саамской топонимии;
- коллекцию электронных публикаций авторов проекта и ссылки на
Интернет-ресурсы по данной тематике;
- постоянно действующую на сайте тематическую телеконференцию
(форум).
Структура описания прибалтийско-финской и русской топонимии,
состоящая из 18 характеристик, учитывает грамматические признаки топонимов,
семантику их компонентов, экстралингвистические признаки обьектов, именуемых
данным топонимом, а также исторические сведения о топониме и другие данные. Это
дает возможность специалистам ставить и решать задачи, связанные с выявлением
субстратного слоя топонимии, его фонетических и морфологических особенностей,
исследовать ареалы смешения топонимии и т.п. В настоящее время БД содержит
информацию о свыше 1500 русских и карельских топонимах. Для отбора данных по
запросам пользователей разработаны специальные интерфейсные формы. Это дает
возможность осуществлять самые разнообразные выборки данных из БД для решения
задач исследования в области топонимики. При создании библиографической базы
данных учтены не только стандартные библиографические данные, описывающие
публикации по прибалтийско-финской и саамской топонимии, но и содержание
изданных работ (семантика топонимов, субстрат, этимологии, персоналии и т.п.). Для
оперативного обсуждения вопросов применения информационных технологий и
математических методов в исследовании топонимии на сайте создана постоянно
действующая телеконференция (форум), на которой размещены электронные публикации
по этим вопросам и предусмотрена возможность их обсуждения всем заинтересованным
пользователям системы посредством Интернет.
Для решения задач в области топонимики нами разработана
программная система DMiner, в основе которой лежит алгоритм поиска значимых
множеств - PrefixSpan. Для отобранного из БД исследуемого массива топонимов и по
заданным анализируемым характеристикам из описания топонимов система
автоматически генерирует ряд ассоциативных правил, описывающих логические
зависимости между этими характеристиками. Таким образом, эту систему можно
рассматривать как инструмент, с помощью которого специалисты могут находить новые
закономерности и проверять свои гипотезы и предположения, связанные с решением
задач в области топонимики [16].
Данный проект получил поддержку РГНФ (грант № 03-04-12033в).
3.3. Электронная библиотека КарНЦ РАН как основа для
интеграции электронных научных информационных ресурсов центра.
Создание электронной библиотеки научных электронных (цифровых)
информационных ресурсов необходимо для поддержки процессов проведения
фундаментальных исследований и прикладных разработок. Систематизация и
структуризация данных и знаний и их представление в виде электронных коллекций
документов, построенных по единым согласованным стандартам и технологиям, создает
основу для интеграции научных электронных информационных ресурсов центра,
позволит большему числу российских и зарубежных специалистов получить через
Интернет доступ к уникальной научной информации, а также будет способствовать
проведению комплексных исследований и решению прикладных задач.
Разработанная нами инфраструктура ЭБ научных информационных
ресурсов КарНЦ РАН включает следующие основные сервисы[19,20]:
- публикация новой коллекции документов в ЭБ и ее сопровождение
(пополнение документами, корректировка и удаление документов);
- поиск информации по запросам пользователя;
- управление доступом к сервисам ЭБ и защита информационных
ресурсов.
Структура документов каждой коллекции разрабатывается на основе
представленных специалистами-предметниками паспортов описаний изучаемых
объектов и реализуется с помощью языка XML (http://www.w3c.jrg/XML/overview.html).
Наиболее привлекательной особенностью XML (по сравнению с HTML) является, в
частности, возможность отделения данных от их визуального представления и
использование тегов разметки для определения логической структуры текста [18]. Для
описания общих свойств каждой коллекции применяется широко распространенный
стандарт Дублинского ядра (Dublin Сore, DC, http://purl.org/dc/documents/). На основе
атрибутов стандарта DC создан каталог коллекций, который используется для
организации поиска коллекции по запросу пользователя.
Основными функциями программного обеспечения, предназначенного
для поддержки процессов публикации и сопровождения документов в ЭБ КарНЦ РАН,
являются:
- помощь специалисту-предметнику в заполнении (корректировке)
полей документа коллекции в соответствии с разработанной структурой документа -
DTD (Document Type Definition) языка XML;
- автоматическое формирование корректного XML - документа
коллекции и его сохранение на сервере ЭБ;
- организация на форуме обсуждения экспертами содержания
вносимого в коллекцию документа.
Привлечение специалистов-предметников и экспертов к
непосредственному участию в процессе создания и сопровождения научной коллекции
способствует, на наш взгляд, улучшению качества и достоверности информационного
содержания документов и повышает их заинтересованность в конечном результате
работы. По существу, каждый документ коллекции можно рассматривать как
электронную публикацию, в которой в сжатой форме представлена обобщающая научная
информация по результатам многолетних исследований описываемого объекта
коллекции.
Процедура поиска информационных ресурсов в ЭБ КарНЦ РАН
включает два основных этапа - поиск искомой коллекции среди множества коллекций
электронной библиотеки и поиск документов в найденной коллекции по запросу
пользователя. Поиск искомой коллекции в ЭБ может быть осуществлен как при помощи
рубрикатора ГРНТИ, так и с помощью базы метаданных (каталога), описывающей
коллекции на основе атрибутов стандарта DC. Следует отметить, что в систему могут
быть интегрированы на уровне своих метаописаний в стандарте DC электронные
информационные ресурсы, разработанные по другим информационным технологиям
(реляционные базы данных, коллекции электронных карт и т.п.). В этом случае
разработанный поисковый сервис ЭБ выступает в качестве "точки входа" в электронное
информационное пространство центра. Запросы на поиск документов в выбранной
коллекции формируются пользователем с помощью специально разработанных
интерфейсных форм, специфичных для каждой коллекции.
В настоящее время разработана первая версия программного
обеспечения ЭБ КарНЦ РАН (http://dl.krc.karelia.ru). По разработанной технологии
созданы и пополняются новыми документами три коллекции научных информационных
ресурсов: "Аффилофороидные грибы Карелии" (коллекция содержит свыше 100
документов), "Виртуальная флора Карелии" (свыше 50 документов) и "Млекопитающие
Карелии" (свыше 20 документов). Основой создания этих электронных коллекций явился
большой объем научной информации, полученный сотрудниками институтов биологии и
леса Карельского научного центра РАН в результате многолетних исследований.
Данный проект поддержан РФФИ (грант № 02-07-90204).
Заключение.
Вопросы формирования и использования электронных научных
информационных ресурсов требуют решения целого ряда научно-методических,
организационных, финансовых и кадровых вопросов, от которых зависит эффективность
создания и функционирования информационной системы. Наиболее значительными из
них в нашем случае является разработка и принятие на Президиуме КарНЦ РАН
комплексной программы работ по созданию Единой Информационной Системы центра.
При этом разработка и выполнение мероприятий программы должны осуществляться в
тесной координации с разработчиками ЕИС РАН.
При разработке и реализации мероприятий программы необходимо
учесть проведение исследований с целью выбора методов организации метаданных,
интерфейсов, классификаторов и рубрикаторов, перспективных общесистемных
информационных технологий и программных средств, предназначенных для построения
отдельных информационных систем ЕИС центра. Также следует разработать технологии
администрирования системы, обеспечения информационной безопасности и
аутентификации, взаимодействия с управляющим ядром ЕИС РАН. Необходимо решить
вопросы защиты авторских и иных прав научных работников на создаваемые
электронные информационные ресурсы на основе существующего законодательства РФ.
Список литературы.
- Кулагин М.В., Лопатенко А.С. Научные информационные системы и
электронные библиотеки. Потребность в интеграции. // Сб. трудов Третьей Всеросс.
конф. по электронным библиотекам. RCDL'2001 Петрозаводск, 11-13 сентября 2001 г., с.
14-19.
- Лопатенко А.С. Научные информационные системы. Перспективы
использования. ( http://derpi.tuwien.ac.at/~andrei/CRIS_DOC.htm ).
- CERIF-2000 Guidelines, Final Report of the CERIF Revision Working
Group, Part 1, C. 3 User requirements, ( ftp://ftp.cordis.lu/pub/cerif/docs/cerif2000.htm ).
- Жучков А.В., Арнаутов С.А. Единая среда распределенных ресурсов
(GRID) и цифровые библиотеки. // Сб. трудов Третьей Всеросс. конф. по электронным
библиотекам. RCDL'2001. Петрозаводск, 11-13 сентября 2001 г. с. 46-50.
- Ильин В.А., Корежков В.В. Создание российского сегмента
европейской инфраструктуры ЕИ DATAGRID. // Труды Четвертой Всеросс. научной
конф. RCDL'2002 (Дубна, 15-17 октября 2002 г.): В 2 т. - Дубна: ОИ9И, 2002. - Т.1. с.
239-248.
- Вильям Армс. Электронные библиотеки. // Пер. с англ. 2001. ПИК
ВИНИТИ. 274 с.
- Когаловский М.Р. Энциклопедия технологий баз данных. - М.:
Финансы и статиститика, 2002.-800 с.
- Арнаутов С.А. Роль и место виртуальных цифровых библиотек в
Интернете. // Сб. трудов Третьей Всеросс. конф. RCDL'2001, Петрозаводск, 11-13
сентября 2001 г. - Карельский научный центр РАН, 2001. с. 20-25.
- Когаловский М.Р. Систематика коллекций информационных
ресурсов в электронных библиотеках. // Программирование. № 3, 2000 г., с. 31-52.
- Сорокин А.Д., Вдовицын В.Т. и др. Концепция развития системы
телекоммуникаций КарНЦ РАН. // Труды Института прикладных математических
исследований КарНЦ РАН. Методы математического моделирования и информационные
системы. Вып. 3. Петрозаводск 2002 г.
- Сорокин А.Д., Вдовицын В.Т., Бедорев А.А. Положение о
компьютерной сети КарНЦ РАН (http://www.krc.karelia.ru/cvemts).
- Сорокин А.Д., Вдовицын В.Т., Луговая Н.Б. Создание и развитие
электронных информационных ресурсов в КарНЦ РАН. // Сб. докл. Второй Всеросс.
научн. конф. "Электронные библиотеки: перспективные методы и технологии,
электронные коллекции". Протвино, 26-28 сентября 2002 г., с. 3-5.
- Вдовицын В.Т., Кузнецова В.П. и др. Создание электронной версии
архива фольклорной фонотеки ИЯЛИ КарНЦ РАН. // Сб. докл. Второй Всеросс. научн.
конф. "Электронные библиотеки: перспективные методы и технологии, электронные
коллекции". Протвино, 26-28 сентября 2002 г., с. 32-38.
- Вдовицын В.Т., Керт Г.М. и др. Электронная коллекция
информационных ресурсов по топонимии Европейского Севера России. // Сб. докладов
Третьей Всеросс. конф. "Электронные библиотеки: перспективные методы и технологии,
электронные коллекции". RCDL'2001, Петрозаводск, 11-13 сентября 2001 г., КарНЦ
РАН. - с. 199-201.
- В.Т. Вдовицын, Г.М. Керт, Н.Б. Луговая, Ю.В. Чуйко Применение
алгоритмов поиска логических зависимостей для решения задач в области топонимики.
Обозрение прикладной и промышленной математики. Том 10. Вып.2, 2003 г., с.387-388.
- Лебедев В.А., Старкова В.Г., Брагин С.В. Система доступа к
коллекции знаний по экологии региона. // Сб. докл. Второй Всеросс. научн. конф.
<Электронные библиотеки: перспективные методы и технологии, электронные
коллекции>. Протвино, 26-28 сентября 2002 г., с. 185-188.
- Филатов Н.Н., Лебедев В.А. Коллекция знаний об Онежском и
Ладожском озерах. // Сб. докладов Третьей Всеросс. конф. "Электронные библиотеки:
перспективные методы и технологии, электронные коллекции". RCDL'2001,
Петрозаводск, 11-13 сентября 2001 г., КарНЦ РАН. - с. 202-208.
- Когаловский М.Р. Стандарты платформы XML и базы данных. // Сб.
докладов Третьей Всеросс. конф. "Электронные библиотеки: перспективные методы и
технологии, электронные коллекции". RCDL"2001, Петрозаводск, 11-13 сентября 2001 г.,
КарНЦ РАН, - с.108-117
- Вдовицын В.Т., Сорокин А.Д. Вопросы построения электронной
библиотеки Карельского научного центра РАН. // Труды Четвертой Всеросс. конф.
"Электронные библиотеки: перспективные методы и технологии, электронные
коллекции" RCDL'2002. (Дубна, 15-17 октября 2002 г.): В 2 т. - Дубна: ОИЯИ, 2002. -
Т.1. с. 304-308.
- Вдовицын В.Т., Сорокин А.Д. Технология публикации и
сопровождения документов в коллекциях научных информационных ресурсов
электронной библиотеки КарНЦ РАН. // Труды Пятой Всеросс. научной конф.
"Электронные библиотеки: перспективные меттоды и технологии, электронные
коллекции" RCDL'2003. Санкт-Петербург, 29-31 октября 2003 г. с. 103-105.
|