В. Б. Барахнин, Д. А. Ткачев "ОЦЕНКА ЭФФЕКТИВНОСТИ МЕТОДА ПАРАЛЛЕЛЬНОЙ РЕАЛИЗАЦИИ ПРОЦЕССА КЛАСТЕРИЗАЦИИ ТЕКСТОВЫХ ДОКУМЕНТОВ НА ОСНОВЕ АЛГОРИТМА FRIS-CLUSTER"

ОЦЕНКА ЭФФЕКТИВНОСТИ МЕТОДА ПАРАЛЛЕЛЬНОЙ РЕАЛИЗАЦИИ ПРОЦЕССА КЛАСТЕРИЗАЦИИ ТЕКСТОВЫХ ДОКУМЕНТОВ НА ОСНОВЕ АЛГОРИТМА FRIS-CLUSTER

Представлен вариант параллельного выполнения некоторых этапов кластеризации документов с использованием алгоритма FRiS-Cluster. Приведены количественные оценки времени выполнения процесса, наглядно демонстрирующие преимущества внедрения параллельной реализации на различных этапах обработки: при предварительном анализе документов, включающем вычисление мер сходства, а также частично при выполнении непосредственно процесса кластеризации.

Ключевые слова: кластеризация текстовых документов, параллельные алгоритмы.

V. B. Barakhnin, D. A. Tkachev
EVALUATING THE EFFECTIVENESS OF THE METHOD OF THE PARALLEL IMPLEMENTATION OF THE PROCESS OF CLUSTERING TEXT DOCUMENTS ON THE BASIS OF THE ALGORITHM FRIS-CLUSTER

This paper presents a variant of the parallel execution of certain phases of the clustering of documents using the algorithm FRiS-Cluster. We give quantitative values of time the process is to demonstrate the benefits of implementing the parallel implementation of the various stages of processing: a preliminary analysis of documents, which includes calculation of similarity measures, and partly in the performance of the clustering process itself.

Keywords: clustering text documents, parallel algorithms.

Вестник НГУ, серия "Информационные технологии", Том 10, Выпуск 4
Страницы 95-103
http://lib.nsu.ru:8080/xmlui/handle/nsu/259