Русский язык: исторические судьбы
и современность. М., 2007. – С. 620-621.
О.Ю.
Крючкова, В.Е. Гольдин, И.А. Батраева
ПРИНЦИПЫ
ОРГАНИЗАЦИИ ЭЛЕКТРОННОЙ БАЗЫ ДИАЛЕКТНЫХ ТЕКСТОВ[1]
Саратовский
государственный университет
диалект, база
данных, текстовый корпус
The
paper deals with the principles of organization of the dialectical textual
corpus considered as the main source for studying cultural and communicative
specific of dialects.
Русская диалектология
Корпусы
диалектной речи, отражающие коммуникацию на диалекте в том или ином конкретном
населенном пункте и сохраняющие в машиннообрабатываемой
форме значительные массивы связной речи, являются основным источником изучения
коммуникативной специфики диалектов. Использование материалов таких корпусов
дает возможность не ограничиваться отдельными примерами, а переходить к
выявлению общих принципов, тенденций, действующих в диалектной коммуникации. Текстовый
диалектный корпус должен служить моделью традиционной сельской коммуникации на диалекте,
а если он включает текстовые материалы одного говора, то - моделью
коммуникации в конкретных условиях жизни данного речевого коллектива.
В
лингвистике уже разработаны принципы построения текстовых корпусов как
коммуникативных моделей (Британский национальный корпус, Национальный корпус
русского языка и др.). Электронные базы диалектных корпусов должны отличаться
от других корпусов вследствие специфики своих задач и материала.
Особенностями создаваемого в Саратовском государственном
университете диалектного текстового корпуса являются его ориентация на один конкретный говор –
говор с. Белогорное (бывш. Самодуровка) Вольского
района Саратовской области, решение задач не только собственно
лингвистического, но и социокультурного характера,
учет специфики диалектной коммуникации.
Единицей
хранения в корпусе текстов с. Белогорное является
«запись» – расшифровка магнитофонной фиксации непрерывного фрагмента общения
независимо от числа его участников и тематического варьирования. В корпус
включаются тексты, записанные начиная со 2-ой половины XXв. от лиц с различными
социолингвистическими характеристиками (возраст, пол, образование, род
деятельности, вероисповедание, место рождения и др.). Кроме записей от
постоянных жителей села, в корпус войдут и записи речи информантов, связанных с
изучаемым говором в детские и юношеские годы. Тексты представлены в упрощенной
транскрипции.
Говор
с. Белогорное расположен на территории позднего
заселения, сложился в результате взаимодействия речи различных групп поселенцев
и является вторичным. Считается, что основателями села были бежавшие из
центральных областей России старообрядцы. Поэтому социолингвистический параметр
«вероисповедание» имеет особую актуальность для создаваемого корпуса: в селе
традиционно существуют группы, принадлежащие различным конфессиям,
в том числе старообрядцы (брачники и безбрачники).
Наряду
с символьным представлением текстов корпус включает аудиозаписи, видеозаписи,
графические материалы (фотографии, схемы, карты), часть из которых соотнесена с
расшифровками текстов, другая часть образует отдельный подкорпус.
В корпусе используется многоаспектная метаразметка
записей: сведения об информантах (фамилия, имя, отчество, год рождения, место
рождения, родственные связи, образование, род занятий), сведения о времени,
месте записи, о конкретной ситуации общения, об адресатах речи, сведения о
тематике текста, его хронотопе, упоминаемых лицах и
событиях, о жанре и функциональных особенностях общения.
Схема базы диалектных текстов
Параметрами
собственно лингвистической разметки являются лемма, морфологическая
характеристика словоформы, контекстная
семантика, диалектная фонология.
Планируемый
корпус должен отразить особенности коммуникации на диалекте, современное
состояние изучаемого говора, характер и факторы варьирования диалектной речи
жителей с. Белогорное, основные прецедентные явления
и тексты, культурно-речевую специфику отдельных групп населения и своеобразие
картины мира носителей диалекта.
[1] Работа выполнена при поддержке Российского фонда фундаментальных исследований (РФФИ), проект № 06-06-80428-а