| |
Т. А. Самойлова
Информационная модель мотивного словаря
Для представления семантики предметной области была разработана инфологическая ER-модель базы данных вида "сущность-связь"[1]. В качестве сущностей выбраны отношения "Контекст", "Предложение", "Пропозиция","Модальность","Мотив", "Семантика". Граф связей между сущностями имеет вид

Рис1. Инфологическая модель мотивного словаря.
В представленной инфологической модели необязательность связи обозначается пустым кружочком на конце связи, а обязательность перпендикулярной линией, перечеркивающей связь. Тип связей - "один-ко-многим" и "один-к-одному". Сущность "Пропозиция" представляет собой супертип модели, на основании которого строятся подтипы "Субъект", "Предикат", "Объект", "Время", "Место". Все подтипы наследуют атрибут "Текст" супертипа. Сущность "Модальность" имеет подтипы "Объективная", "Субъективная", "Аллюзии" и "Интертекст" без наследования.
Даталогическое проектирование информационной модели выполнено в среде реляционной системы управления базами данных Microsoft Access[2 ]. Номенклатура отношений базы данных:
Контекст = (Имя произведения, Номер абзаца, Абзац)
Предложение = (Номер абзаца, Номер предложения, Предложение).
Пропозиция = (Номер предложения, Номер пропозиции, Пропозиция, Субъект, Субъект: выражение, Объект, Объект: выражение, Время, Время: выражение, Место, Место: выражение)
Модальность = (Номер предложения, Номер пропозиции, Объективная (индикатив): время, Выражение в тексте, Объективная (ирр): наклонение, Выражение в тексте, Источник высказывания, Выражение в тексте, Прямое/косвенное выражение, Сигнал в тексте, Интертекст: источник, Интертекст: сигнал, Аллюзии: источник, Аллюзии: доп. значение, Аллюзии: сигнал)
Мотив = (Номер пропозиции, Роль в фабуле, Тип мотива)
Семантика элементов = (Номер пропозиции, Семантика субъекта, Семантика объекта, Семантика предиката, Семантика места, Семантика времени).
Первичные ключи отношений выделены. Отношения находятся в третьей нормальной форме [3]. Схема связей реляционной модели представлена на рисунке 2.

Рис.2 Схема связей между отношениями базы данных.
Пользовательский интерфейс для ввода данных представлен экранными Access-формами, позволяющими редактировать как исходные тексты произведений, так и информацию, соответствующую пропозициям и модальности. Пример пользовательских форм для редактирования исходного текста и задания параметров пропозиций приведены на рисунках 3,4.

Рис.3. Экранная форма для редактирования текста произведения.

Рис.4. Экранная форма для описания структуры пропозиций.
Отбор и систематизация содержащейся в базе данных информации выполняется путем разработки запросов и соответствующих им отчетов. В компьютерной модели предусмотрены следующие виды запросов:
Раздел "Пропозиции и элементы":
- Получение списков пропозиций в порядке появления в тексте (с указанием номера абзаца и предложения), в алфавитном порядке и в соответствии с частотностью употребления.
- Установление функции (субъект, предикат, объект, время, место) любой выбранной исследователем словоформы.
- Получение конкордансов для любого из элементов пропозиции.
- Получение частотных списков для каждого из элементов пропозиции.
- Получение списков, показывающих порядок следования в тексте, для каждого из элементов пропозиции.
- Получение списков сочетаний нескольких элементов пропозиции. Например, субъектно-предикатных групп или списков типа "Субъект-элементы", "Предикат элементы". Список формируется в алфавитном порядке, согласно виду центрального выделенного элемента. Для субъектно-предикатных групп также предлагается частотный список.
Раздел "Модальность":
- Получение списков пропозиций по временной отнесенности предиката (диктум): прошедшее, настоящее, будущее.
- Получение списков пропозиций в соответствии с наклонением (диктум): сослагательное, повелительное.
- Получение списков пропозиций в зависимости от источника высказывания (модус): персонаж, повествователь, совмещенная точка зрения.
- Получение частотного списка "Источник высказывания".
- Получение списка интертекстуальных включений с указанием источника и сигнала в тексте.
- Получение списка аллюзий с указанием источника, дополнительного значения и сигнала в тексте.
Раздел "Свойства мотивов":
- Получение списка связанных мотивов, в том числе и с указанием наклонения и времени (индикатив).
- Получение списка связанных мотивов с учетом источника высказывания (точки зрения).
- Получение списка всех дисперсных мотивов текста.
- Получение списка мотивов по критерию "статические/динамические".
Раздел "Семантическая классификация мотивов":
- Список каждого из элементов пропозиции в зависимости от реализации в значении элемента одного из семантических примитивов.
- Сводная таблица, где перечислены все пропозиции, в семантике которых представлен конкретный семантический примитив (вне зависимости от того, в каком из элементов).
Раздел "Статистика":
- Указание количества абзацев, предложений, пропозиций в тексте.
- Таблица, показывающая структуру пропозиций текста.
- Указание статистики по элементам.
- Указание статистики по валентности пропозиций (в том числе в виде диаграммы).
- Указание статистики по объективной модальности (значение времени и наклонения).
- Указание статистики по источнику высказывания и способу его выражения (прямому/косвенному).
- Указание статистики по представленности в пропозициях и значении их элементов семантических примитивов.
- Данные о количестве статических/динамических, свободных/связанных мотивов в тексте.
Запросы реализованы с помощью SQL-конструктора среды Access. Пример SQL-оператора для получения списка пропозиций с элементами типа "субъект":
SELECT Пропозиции. [Субъект значение], Пропозиции. [Субъект выражение], Пропозиции. [Пропозиция], Пропозиции. [Номер предложения], Предложения. Предложение, Контекст. Абзац FROM Контекст INNER JOIN (Предложения INNER JOIN Пропозиции ON Предложения.[Номер предложения] = Пропозиции.[Номер предложения]) ON Контекст.[Номер абзаца] = Предложения.[Номер абзаца]
WHERE (((Пропозиции. [Субъект значение])<>""))
ORDER BY Пропозиции. [Субъект значение], Пропозиции. [Пропозиция].
SQL-оператор для реализации запроса сочетаемости элементов пропозиций видов "субъект" и "предикат":
SELECT Пропозиции. [Субъект значение], Пропозиции. [Предикат значение], Пропозиции.[Пропозиция], Пропозиции.[Номер предложения], Предложения.Предложение, Предложения.[Номер абзаца]
FROM Предложения INNER JOIN Пропозиции ON Предложения.[Номер предложения] = Пропозиции.[Номер предложения]
GROUP BY Пропозиции.[Субъект значение], Пропозиции.[Предикат значение], Пропозиции.[Пропозиция], Пропозиции.[Номер предложения], Предложения.Предложение, Предложения.[Номер абзаца]
HAVING (((Пропозиции.[Субъект значение])<>""))
ORDER BY Пропозиции.[Субъект значение], Пропозиции.[Предикат значение], Пропозиции.[Пропозиция]
Запрос определения частоты употребления в тексте пропозиций реализуется SQL- операторами вида:
SELECT Пропозиции.Время, Count(Пропозиции.Время) AS [Частота в тексте] FROM Пропозиции
GROUP BY Пропозиции.Время
ORDER BY Count(Пропозиции.Время) DESC
Представленный пример соответствует пропозициям, содержащим элементы типа "время". Фрагмент отчета, составленного запросу определения частоты для рассказа М.Булгакова "Пропавший глаз":
|
Время |
Частота в тексте |
|
год назад |
14 |
|
потом |
9 |
|
в светлом апреле |
6 |
|
за год |
4 |
|
вечер сегодня |
4 |
|
тогда |
4 |
|
сейчас |
4 |
|
наконец |
3 |
|
уже |
3 |
|
порою |
3 |
|
как-то |
2 |
|
всегда |
2 |
|
однажды в светлом |
2 |
|
обычно |
2 |
|
ныне |
2 |
|
никогда |
2 |
|
через каждые пять шагов |
2 |
|
во время работы |
2 |
|
в течение ночи |
1 |
|
навеки |
1 |
|
в течение жизни ЮВ |
1 |
Информационная модель мотивного словаря реализована в виде открытой системы, позволяющей обрабатывать тексты большого объема, добавлять и изменять структуру запросов на любом этапе компьютерного эксперимента.
Литература.
- Цикритзис Д., Лоховский Ф. Модели данных: Перевод с англ.. - м.: Финансы и статистика, 1985, - 344с.
- Microsoft Access для WINDOWS. / пер. с англ. - М.: Издательство ЭКОМ, 1998.-344 с.
- Codd E.F. Relational DataBase: A Practical Foundation for Productivity// Communications of ACM, 25(2), 1982.
|