Тематический web-сайт по топонимии Европейского Севера России
TORIS
Toponymic Research Information System
English versionНовостиБазы данныхПубликацииФорумСсылкиКонтактная информацияКарта сайта

ИНФОРМАЦИОННАЯ СИСТЕМА ДЛЯ ПОДДЕРЖКИ ИССЛЕДОВАНИЙ В ОБЛАСТИ ТОПОНИМИКИ.

Г.М. Керт, В.Т. Вдовицын
Институт языка, литературы и истории
Институт прикладных математических исследований
Карельского научного центра РАН
Петрозаводск

РОЛЬ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ В ИССЛЕДОВАНИИ ТОПОНИМИИ.

Топонимической науке в силу её специфики приходится оперировать огромным количеством исходного материала. Между тем, естественные возможности человека в осмыслении этого материала ограничены. В связи с этим назрела настоятельная необходимость использования современных информационных технологий и математических методов в топонимических исследованиях.

Технические возможности современных компьютеров позволяют обрабатывать огромное количество материала. Особенности структурной организации языкового материала, состав единиц и отношений между ними могут выявляться через категории качества и количества. Как пишет Л. Турыгина: "Научные результаты, получаемые на основе статистических методов, объективируют лингвистические выводы, повышая их достоверность" [1] .

Применение компьютерных технологий позволяет вовлекать в научный оборот всю имеющуюся в наличии топонимию, включая и субстратную (неэтимологизируемую). При точечной этимологии можно <<расшифровать" только отдельные топонимы по принципу сходства с фонетическим обликом имеющихся "живых" языков. Громадное большинство субстратных топонимов остается вне сферы исследователя.

Применение метода топонимических изоглосс, как наиболее результативного в топонимике, даст возможность вводить в научный оборот не только топонимию, где апеллятивная лексика хорошо просматривается, но и субстратную (неэтимологизируемую) топонимию. Такие общие фонетические комплексы (следы субстрата) можно просматривать на достаточно обширных территориях. Таким образом, в методике исследования топонимии достигается системность, позволяющая последовательно анализировать всю собранную топонимию региона и сравнивать ее с топонимией других регионов.

Работы по применению информационных технологий и математических методов в исследовании топонимии ведутся в тесном сотрудничестве в течении последних пяти лет сотрудниками Института языка, литературы и истории и Института прикладных математических исследований Карельского научного центра РАН. В1988 г. появилась первая публикация по проблемам применения компьютерных технологий в исследовании топонимии [2]. В апреле 1998 г. Г. Кертом, В. Вдовицыным и А. Веретиным на заседании Президиума Карельского научного центра РАН был зачитан доклад "Компьютерный банк топонимии Европейского Севера России: TORIS" [3]. В 2002 г. вышла из печати монография Г. Керта "Применение компьютерных технологий в исследовании топонимии (прибалтийско-финская, русская)" [4]. В целом по данной проблеме имеется свыше 15 совместных с математиками публикаций (статьи, тезисы и пр.). См.: Библиография работ Г. М. Керта. Прибалтийско-финское языкознание. Сб. статей, посвященных 80-летию Г. М. Керта. Петрозаводск. 2003 г. С. 7-21.

ОБЩИЕ ЗАДАЧИ ИССЛЕДОВАНИЯ.

Важнейшей задачей при создании компьютерной базы данных является сбор топонимии и, особенно, микротопонимии. Для сбора топонимии и ее компьютерной обработки нами предложена структура топонимной карточки, учитывающая специфику топонима и характерные признаки именуемого им объекта, а также разработаны структуры описания топонимии прибалтийско- финских и русского языков [3,4].

С помощью разработанной базы данных о топонимах можно решать, на наш взгляд, следующие основные задачи в области топонимики:

  1. Выявление субстратного слоя топонимии, его фонетических и морфологических особенностей, ареала распространения ядерных и периферийных зон, специфических особенностей субстратной топонимии. Установление степени однородности, повторяемости топонимов, их плотности на условной единице площади. Поскольку субстратные элементы проявляются как в заимствующем языке (т. н. субсубстрат), так и в языке у которого заимствуются эти элементы (субстрат), было бы чрезвычайно интересно выявить не только наиболее характерные повторяемые элементы заимствующего языка, но и особенности их "вхождения" в его структуру.
  2. Определение ареалов топонимии, этимологизируемой с помощью "живых языков", распространенных на территории Европейского Севера России, структурных типов топонимов и их семантики: 1) прибалтийско-финская, 2) саамская, 3) коми, 4) угорская, 5) самодийская, 6) русская (славянская). Как известно, территория, а также употребляемость национальной топонимии (карельская, финская, вепсская, саамская, коми, угорская, самодийская) на Европейском Севере России в силу исторических причин неуклонно сокращалась и сокращается. Поэтому фиксация этого материала крайне важна.
  3. Исследование ареалов смешения топонимии, зон топонимии двух и более живых языков, соотношения частот различных топонимов в разных ареалах. Выявляя принципы адаптации топонимии разносистемных языков, мы можем проследить исторические пути освоения этносом территории данного ареала.
  4. Определение абсолютных и относительных частот топонимов каждого языка на единицу площади.
  5. Определение топонимических изоглосс однотипных явлений в семантике и структуре.
  6. Выявление детерминантов и определений топонимов уральских языков.
  7. Чрезвычайно важным, по нашему мнению, является установление корреляции (соотношения) топонимной и апеллятивной лексики по ареалам. Существенную помощь могут оказать материалы Лингвистического атласа Европы (Atlas Linguarum Europeae - ALE) и Атлас прибалтийско-финских языков (Atlas Linguarum Fennicae).
  8. Исследование топонимии по семантическим классам (классификация по системе понятий Рудольфа Халлига и Вальтера фон Вартбурга).

В процессе исследования могут быть поставлены и другие задачи: принципы освоения субстратной топонимии русским языком, соотношение исконной и русской лексики в топонимии ареалов и регионов и др. Структура базы данных позволяет делать сопоставления "топоним - объект". Интересно, на наш взгляд, исследование принципов отбора объектов для номинации (т.е. мотивации) в зависимости от естественно-географических и культурно- исторических особенностей региона.

ИНФОРМАЦИОННАЯ СИСТЕМА TORIS.

С целью содействия развитию российской топонимической науки, координации теоретических и прикладных исследований российских топонимистов в различных регионах страны нами разработан и развивается тематический Web-сайт TORIS (http://toris.krc.karelia.ru ) с интегрированной базой данных о топонимах Европейского севера России, библиографической базой данных о публикациях по прибалтийско-финской и саамской топонимии, коллекцией электронных публикаций авторов проекта по данной тематике и постоянно действующей тематической телеконференцией [5]. Структура базы данных (БД) прибалтийско-финской и русской топонимии, включающая 18 характеристик, учитывает грамматические признаки топонимов, семантику их компонентов, физические особенности обьектов, именуемых данным топонимом, а также исторические сведения о топониме и другие данные. В настоящее время БД содержит информацию о свыше 1500 русских и карельских топонимах. Для отбора данных по запросам пользователей разработан удобный интерфейс, учитывающий специфику работы топонимистов. Это дает возможность осуществлять самые разнообразные выборки данных из БД для решения сформулированных выше задач исследования. При создании библиографической базы данных учтены не только стандартные библиографические данные, описывающие публикации по прибалтийско-финской и саамской топонимии, но и содержание изданных работ, семантика топонимов, субстрат, этимологии, персоналии и пр. Для оперативного обсуждения вопросов применения информационных технологий и математических методов в исследовании топонимии на сайте создана постоянно действующая телеконференция (форум), на которой размещены электронные публикации по этим вопросам и предусмотрена возможность всем заинтересованным пользователям системы в их обсуждении посредством Интернет.

В качестве одного из перспективных, на наш взгляд, подходов к решению задач в области топонимики является определение частотных характеристик топонимов и их компонентов, а также выявление характерных повторяющихся значений характеристик в описаниях топонимов. Подобные задачи могут быть решены с использованием алгоритмов поиска значимых множеств и ассоциативных правил [6].

Для поиска ассоциативных правил в БД нами разработана программная система DMiner, в основе которой лежит алгоритм поиска значимых множеств - PrefixSpan. Система также включает ряд сервисных функций, связанных с подготовкой исходных данных для их обработки и интерпретации полученных результатов. С помощью разработанной системы был проведен ряд вычислительных экспериментов с наборами топонимов из БД, в результате которых были получены ассоциативные правила, отражающие приоритеты в выборе компонентов в названиях географических объектов.

Таким образом, разработанная программная система DMiner является инструментом для ученого-топонимиста, с помощью которого можно находить новые закономерности и осуществлять проверку гипотез и предположений, связанных с решением задач в области топонимики. При этом достоверность выводов, получаемых на основании вычислительных расчетов, будет увеличиваться с ростом числа топонимов в БД информационной системы и качества их описания по предложенной структуре базы данных.

ЗАКЛЮЧЕНИЕ.

Информационные технологии открывают новые возможности перед исследователями топонимии. Предложенная структура описания базы данных топонимии по своей природе универсальна; она включает не только базисные данные о топониме (морфолого-синтаксическая структура топонима, семантика его компонентов, функционирование в речи и пр.), но и экстралингвистические сведения об объекте, именуемом топонимом (мотивация названия, причины возникновения, характерные особенности объекта, народная этимология и др.).

Применение языковых универсалий, строгая идентификация однотипных явлений в структуре описания топонимии позволяют, по нашему мнению, использовать предложенные технологии и в исследовании топонимии языков других семей, тем самым способствовать созданию единого компьютерного банка топонимии России.

Авторы статьи выражают свою благодарность Сорокину А.Д., Веретину А.Л., Луговой Н.Б., Чуйко Ю.В., Беляевой Н. А. и Бедореву А.А. за их вклад в разработку и реализацию программного обеспечения информационной системы, а также Агарковой С.А. и Кузьмину Д.В. за подготовку и ввод в базу данных информации о топонимах.

Данная работа поддержана грантом РГНФ № 03-04-12033в.

СПИСОК ЛИТЕРАТУРЫ.

  1. Турыгина Л. А. Моделирование языковых структур средствами вычислительной техники. М., 1988. 176 c.
  2. Керт Г. М, Лебедев В. А. Возможности применения ЭВМ при исследовании топонимии Севера Европейской части СССР, Петрозаводск.1988. 18 с.
  3. Керт Г., Вдовицын В., Веретин А. Компьютерный банк топонимии Европейского Севера России: TORIS, Препринт доклада на заседании Президиума Карельского научного центра 24 апреля 1998 г. Петрозаводск. 36 с.
  4. Керт Г. М. Применение компьютерных технологий в исследовании топонимии (прибалтийско-финская, русская). Петрозаводск. 2002. 187 с.
  5. Вдовицын В.Т., Керт Г.М. и др. Электронная коллекция информационных ресурсов по топонимии Европейского севера России // Сб. трудов Третьей научной конф. RCDL'2001. Петрозаводск, 11-13 сентября 2001 г. С. 199-201.
  6. Вдовицын В.Т., Керт Г.М. и др. Применение алгоритмов поиска логических зависимостей для решения задач в области топонимики. // Обозрение прикладной и промышленной математики. Том 10. Вып.2, 2003 г., С. 387-388.

Об авторах:

Керт Георгий Мартынович, Институт языка, литературы и истории Карельского научного центра РАН, ведущий научный сотрудник, доктор филологических наук. E-mail:kert@krc.karelia.ru

Вдовицын Владимир Трофимович, Институт прикладных математических исследований Карельского научного центра РАН, зав лабораторией информационных компьютерных технологий, кандидат физико- математических наук. E-mail: vdov@krc.karelia.ru

THE INFORMATION SYSTEM TO SUPPORT RESEARCH IN TOPONYMICS

G.M. Kert, V.T. Vdovitsyn
Institute of Linguistics, Literature and History
Institute of Applied Mathematical Research
Karelian Research Center RAS
Petrozavodsk

The authors discuss the problems of using information technologies and mathematical methods in toponymic research. The paper describes the developed information system to support research in toponymics - TORIS (http://toris.krc.karelia.ru). TORIS includes the following components: database of the European North of Russia toponyms; bibliographic database with publications on baltic finnish and saam toponymics; collection of the project authors' digital publications on topomymic research and on-line thematic forum. The paper contains the description of DMiner system intended for discovering new patterns and checking hypothesis in the field of toponymics.

About the authors:

Kert Georgy Martynovich, Institute of Linguistics, Literature and History of the Karelian Researh Centre RAS. Leading scientist, Doctor of philology. E-mail: kert@krc.karelia.ru

Vdovitsyn Vladimir Trofimovich, Institute of Applied Mathematical Research of the Karelian Research Centre RAS, the head of the laboratory of information computer technologies, Ph.D in Physics and Mathematics. E-mail: vdov@krc.karelia.ru.

Новости   Базы данных   Публикации   Форум   Ссылки   Контактная информация   Карта сайта
Публикации 

Последнее  изменение  26 июня 2012
webmaster@www.krc.karelia.ru