Барахнин В.Б., Жижимов О.Л., Куперштох А.А., Скачков Д.М., Федотов А.М. "АЛГОРИТМ ИЗВЛЕЧЕНИЯ ИЗ ТЕКСТОВЫХ ДОКУМЕНТОВ ГЕОГРАФИЧЕСКИХ НАЗВАНИЙ, ОТРАЖАЮЩИХ СОДЕРЖАНИЕ"

АЛГОРИТМ ИЗВЛЕЧЕНИЯ ИЗ ТЕКСТОВЫХ ДОКУМЕНТОВ ГЕОГРАФИЧЕСКИХ НАЗВАНИЙ, ОТРАЖАЮЩИХ СОДЕРЖАНИЕ

В статье рассматривается алгоритм автоматизированного извлечения из текста документа географических на-
званий, отражающих его содержание. Обсуждаются вопросы непосредственного извлечения из текста документа
названий, входящих в соответствующий тезаурус, а также пополнения лексического словаря словоформами гео-
графических названий, выявления омонимов и определения названий, отражающих содержание документа.

Ключевые слова: геокодирование, автоматизированное извлечение географических метаданных документа.

V. B. Barakhnin, O. L. Zhizhimov, A. A. Kupershtokh, D. M. Skachkov, A. M. Fedotov
THE ALGORYTHM OF EXTRACTING PLACE NAMES REPRESENTING CONTENT FROM TEXT DOCUMENTS

The algorithm for automated extraction of geographical names representing content from text documents discussed in
article. Questions related with extraction names included in thesaurus from document, adding word forms of geographical
names to the lexical dictionary, homonyms detection, and retrieving names describing the content of document covered in
the article.

Keywords: geocoding, automated extraction of geographic metadata from document.

Вестник НГУ, серия "Информационные технологии", Том 10, Выпуск 1
Страницы 109-120