Перфильев А.А., Мурзин Ф.А., Шманина Т.В. "МЕТОДЫ СИНТАКСИЧЕСКОГО АНАЛИЗА И СОПОСТАВЛЕНИЯ КОНСТРУКЦИЙ ЕСТЕСТВЕННОГО ЯЗЫКА, ОРИЕНТИРОВАННЫЕ НА ПРИМЕНЕНИЕ В ИНФОРМАЦИОННО-ПОИСКОВЫХ СИСТЕМАХ"

МЕТОДЫ СИНТАКСИЧЕСКОГО АНАЛИЗА И СОПОСТАВЛЕНИЯ КОНСТРУКЦИЙ ЕСТЕСТВЕННОГО ЯЗЫКА, ОРИЕНТИРОВАННЫЕ
НА ПРИМЕНЕНИЕ В ИНФОРМАЦИОННО-ПОИСКОВЫХ СИСТЕМАХ

Работа посвящена проблеме релевантности информации искомой в сети Интернет. Предложенный метод ос-
новывается на использовании алгоритмов сравнения предложений, которые принимают во внимание схемы син-
таксического анализа, создаваемые программным приложением Link Grammar Parser. Основная идея состоит в
том, что синтаксические диаграммы дают примитивную структуру текста, и это позволяет выбрать фразы в тек-
сте, похожие на те, которые имеются в поисковом запросе. На базе этих идей была разработана информационно-
поисковая система (ИПС) iNetSearch. Исследования показали, что часто достаточно оставаться на уровне синтак-
сиса, чтобы получить хорошие результаты. Приведены результаты тестирования метода в рамках системы iNet-
Search.
Ключевые слова: информационно-поисковая система, Link Grammar Parser, синтаксический анализ, семанти-
ческое дерево, релевантность.

A. A. Perfiliev, F. A. Murzin, T. V. Shmanina
METHODS OF SYNTACTIC ANALYSIS AND COMPARISON OF CONSTRUCTIONS OF A NATURAL
LANGUAGE, FOCUSED ON APPLICATION IN INFORMATION RETRIEVAL SYSTEMS
This work is dedicated to an actual problem of efficient information search in the Internet. The work is based on the
algorithms of sentences comparison taking into account the schemes of syntactic analysis generated by Link Grammar
Parser software. The main idea is that syntactic diagrams give us a primitive structure of a text, which allows us to select
phrases in a text, which have a syntactic structure similar to that given in a request. According to these ideas, the Information
Retrieval System (IRS) iNetSearch was developed. Our study showed that it is often sufficient to remain on the syntactic
level and obtain rather good search results. The final part of the article represents the results of testing for the methods
implemented within iNetSearch.
Keywords: Information Retrieval System, Link Grammar Parser, syntactic analysis, semantic tree, relevance.

Страницы 50-59

Прикрепленный файлРазмер
06.pdf417.37 кб