А. А. Князева "ПРИНЦИПЫ ИДЕНТИФИКАЦИИ ОБЪЕКТОВ В СТРУКТУРИРОВАННЫХ ДОКУМЕНТАХ"

ПРИНЦИПЫ ИДЕНТИФИКАЦИИ ОБЪЕКТОВ В СТРУКТУРИРОВАННЫХ ДОКУМЕНТАХ

Рассматривается задача идентификации объектов реального мира, упоминаемых в структурированных документах. Сформулированный подход позволяет учитывать различные признаки, по которым производится идентификация, и присваивать им различные веса в зависимости от их значимости. Рассматривается применение предлагаемой модели к задаче идентификации персон, выступающих в роли авторов публикаций, на основе данных электронного каталога библиотеки.

Ключевые слова: идентификация объектов, базы данных, структурированные документы, связывание записей.

A. A. Knyazeva

PRINCIPLES OF IDENTIFICATION OF OBJECTS IN STRUCTURED DOCUMENTS

The paper describes the problem of real word objects identification, which are mentioned in the structured documents. The approach takes into account different features for identification and its weights depending on its significance. The application of the proposed model to the problem of identification of persons that act as authors of publications based on data from the electronic library catalog is considered.

Keywords: identification of objects, databases, structured documents, record linkage.

Вестник НГУ. Серия: Информационные технологии. 2013. Т. 11, вып. 1. С. 58–67.