Разделы
Рекомендуем
• Чего не стоит делать за рулем | Все про автомобили читаем тут: https://auto-magazine.net
Счетчики
Обработка морфологической и синтаксической синонимии и омонимии в семантической нейронной сети
Прогресс информационных технологий в немалой степени зависит от решения проблемы понимания текстов естественного языка. Структура системы, понимающей естественный язык, условно разбивается на уровни морфологического, синтаксического и семантического анализа. Обработка предложения на этих уровнях организована последовательно, уровень морфологического разбора готовит данные для уровня синтаксического разбора. Результаты работы уровней морфологического и синтаксического разбора используются уровнем семантического анализа. Следовательно, нельзя разрабатывать уровни морфологического и синтаксического разбора без определения к ним требований со стороны уровня семантического анализа. Задачей уровня семантического анализа является построение имитационной модели реальности, описываемой обрабатываемым текстом. Такая модель не может быть построена на данных, содержащихся только в анализируемом предложении.
Создание модели требует наличия в памяти системы модели реальности, в которой существует эта понимающая система. Уровень семантического анализа находит в памяти системы модели понятий и строит из них семантически связанную модель фрагмента реальности, описываемого анализируемым текстом. Выполнение этой задачи требует максимально полно идентифицировать каждый элемент анализируемого текста, не потеряв в процессах морфологического и синтаксического анализа любой, даже самой незначительной детали. Задачей уровней морфологического и синтаксического анализа является не уменьшение количества информации, ассоциированного с каждым элементом текста, а наоборот, максимальное увеличение этого количества. Уровни морфологического и синтаксического анализа должны сопоставить с каждым анализируемым элементом текста максимальное количество атрибутов этого элемента и передать их уровню семантического анализа.
Увеличение объемов пространства поиска в этом случае, является только кажущимся. На самом деле увеличение информации, сопоставляемой с каждым элементом анализируемого текста, позволяет на этапе семантического анализа более жестко построить критерии отбора моделей понятий, описываемых этими элементами и сократить количество понятий, удовлетворяющих условиям поиска. Морфологический разбор проводится путем выделения из текста отдельных слов и разбором выделенных слов на морфемы. Операция синтаксического разбора текста естественного языка представляет собой определение всех синтаксических признаков и синтаксических связей этих слов, необходимых для семантического разбора[3,5].
Для решения задач морфологического и синтаксического анализа текста, а так же задач анализа словоизменения применим семантическую нейронную сеть[1], близкую по свойствам формальной нейронной сети Маккаллока-Питтса[4]. В подсети извлечения смысла из текста, отдельный нейрон обозначает элементарное понятие, соответствующее этапу обработки, к которому относится данный подслой нейронной сети. Элементарными понятиями являются любые понятия естественного языка с законченным смыслом, такие как символ, слог, слово, словосочетание, предложение, абзац, весь текст. Различным этапам обработки соответствуют различные уровни агрегации элементарных понятий, например: символ, слог, слово, словосочетание. В качестве структуры семантической нейронной сети, выполняющей морфологический и синтаксический разбор, применим синхронизированное линейное дерево[2,3]. Линейное дерево состоит из слоев нейронов. Каждому слою соответствует фронт волны обработки.
Слой состоит из классифицирующего подслоя не синхронизированных дизъюнкторов и распознающего подслоя синхронизированных конъюнкторов[2,3]. Обработка слов естественного языка, обладающих синонимией или омонимией, производится естественными для семантической нейронной сети средствами. Благодаря параллелизму вычислений, омонимия представляется в нейронной сети как множество одновременно возбужденных нейронов, соответствующих концептам, присущим данному слову. Синонимия представляется как возбуждение одного и того же нейрона-концепта разными словами-синонимами. Совокупность возбужденных нейронов в каждый момент времени является результатом морфологического и синтаксического разбора, удовлетворяя требованиям, предъявляемым со стороны уровня семантического анализа, так как каждый возбужденный нейрон, соответствующий некоторому понятию, всего лишь дополняет картину разбора текста, не затеняя активности других нейронов.
Литература
- Семантическая нейронная сеть, как формальный язык описания и обработки смысла текстов на естественном языке /З.В.Дударь, Д.Е.Шуклин// Радиоэлектроника и информатика. Х.: Изд-во ХТУРЭ, 2000.- №. 3. С.72-76.
- Структура семантической нейронной сети извлекающей в реальном времени смысл из текста /Д.Е.Шуклин// Кибернетика и системный анализ. Киев. Изд-во Ин-та кибернетики, 2001.- № 2. С.43-48.
- Структура семантической нейронной сети реализующая морфологический и синтаксический разбор текста /Д.Е.Шуклин// Кибернетика и системный анализ. Киев. Изд-во Ин-та кибернетики, 2001.- № 5. C.177-184.
- Дж. фон Нейман Теория самовоспроизводящихся автоматов / закончено и отредактировано А. Бёрксом.- М.: "Мир", 1971. - 384 с. 5.Виноград Т. Программа, понимающая естественный язык. - М.: "Мир", 1976. - 296 с.
Источник:
Обработка морфологической и синтаксической синонимии и омонимии в семантической нейронной сети /Д.Е.Шуклин // 6-й Международный молодежный форум "Радиоэлектоника и молодежь в XXI веке": Сб. научных трудов. Ч. 2. - Харьков: ХНУРЭ. 2002. С.308-309
Дополнительно
Научный руководитель Шабанов-Кушнаренко С.Ю.
Харьковский Государственный Технический Университет Радиоэлектроники