Чеснавский А. А. "ПРАКТИЧЕСКОЕ ПРИМЕНЕНИЕ АЛГОРИТМА СЕМАНТИЧЕСКОГО АНАЛИЗА ИЗМЕНЕНИЙ В HTML-ДОКУМЕНТАХ"

ПРАКТИЧЕСКОЕ ПРИМЕНЕНИЕ АЛГОРИТМА СЕМАНТИЧЕСКОГО АНАЛИЗА ИЗМЕНЕНИЙ В HTML-ДОКУМЕНТАХ

В данной статье рассматривается алгоритм семантического отслеживания изменений (АСОИ), который позво-
ляет выявить изменения данных в теле HTML-документа, а не изменений разметки документа. Особенностью
данного алгоритма является, то что не требуется проводить предобработку документа и знать внутреннюю струк-
туру HTML-страницы. АСОИ может быть использован в различных практических задачах, где требуется манипу-
лировать данными, полученными с веб-сайтов. В качестве основных примеров можно привести семантический
веб-клиппинг, кэширование страниц, получение RDF-представление HTML-страниц.
Ключевые слова: семантический анализ изменений, веб-клиппинг, структура данных веб-страницы, HTML.

A. A. Tchesnavskij
Application of Semantic Change Detection of HTML-Documents Algorithm
That article is dedicated to describe semantic web-sites change detection algorithm. The main advantages of proposed
algorithm are detection of changes only in data of HTML-page, not presentation part; there is no need to know internal
structure of the page and have a preprocessing of HTML-pages. That algorithm could be used in many practical areas,
where there is a need to proceed data retrieved from web-sites. The main examples of applications are semantic webclipping,
web-pages caching, transforming HTML-pages in RDF form.
Keywords: semantic change detection, web-clippinng, web page data structure, HTML.

http://lib.nsu.ru:8080/jspui/handle/nsu/40