Степанов П. А. Автоматизация обработки текстов естественного языка

АВТОМАТИЗАЦИЯ ОБРАБОТКИ ТЕКСТОВ ЕСТЕСТВЕННОГО ЯЗЫКА

Рассматривается вопрос об автоматизации обработки текстов на естественном языке. Описана проблема, связанная с взаимодействием между модулями автоматизированной системы анализа текста. На основе теории автоматов разработан формальный подход к описанию систем автоматизированной обработки текста. Предложено решение, использующее специальную структуру данных для хранения промежуточных результатов анализа. Разработанное решение было применено к задаче извлечения явных определений терминов из текстов естественного
языка.

Ключевые слова: обработка естественного языка, анализ текста, извлечение информации, извлечение определений терминов.

P. A. Stepanov
PROCESSING AUTOMATION OF NATURAL LANGUAGE TEXTS

That paper discusses processing automation of natural language texts. The paper describes a problem related to the interaction between the modules of automated text analysis systems. On the basis of the automata theory a formal approach to the description of an automated text processing systems has been developed. A solution was suggested that uses a special data structure to store the intermediate results of the analysis. The developed solution has been applied to the problem of extraction of implicit definitions of natural language texts.

Keywords: natural language processing; text analysis; information extraction; extracting definitions.

Вестник НГУ. Серия: Информационные технологии. 2013. Т. 11, вып. 2. С. 109–115.
http://www.nsu.ru/xmlui/handle/nsu/558