Выпуск 3

Пальчунов Д.Е., Ульянова Е.А. "МЕТОДЫ АВТОМАТИЧЕСКОГО ПОРОЖДЕНИЯ ПОИСКОВЫХ ЭВРИСТИК"

МЕТОДЫ АВТОМАТИЧЕСКОГО ПОРОЖДЕНИЯ ПОИСКОВЫХ ЭВРИСТИК

Статья посвящена разработке автоматических методов порождения поисковых эвристик для обеспечения релевантности работы виртуальных каталогов. Виртуальный каталог – это метапоисковая система, представляющая собой синтез Интернет-каталога и информационно-поисковой системы. Методы подбора поисковых эвристик для виртуальных каталогов основаны на использования формул пропозициональной логики специального вида – дизъюнктивных нормальных форм. Автоматизация порождения эвристик осуществляется за счёт извлечения информации из текстов естественного языка.

Ключевые слова: информационно-поисковые системы, виртуальный каталог, релевантность, пертинентность, онтология, эвристика.

METHODS FOR AUTHOMATIC GENERATION OF SEARCH HEURISTICS

The paper is devoted to development of automated methods of search heuristics generation for ensure the relevance of the virtual catalogue. The virtual catalogue is a metasearch system which is a synthesis of Internet catalogues and search engines. The methods of search heuristics creation for the virtual catalogue are based on use of propositional logic formulas of a special kind – Disjunctive Normal Form (DNF). Automation of heuristics generation is based on information retrieval from natural language texts.

Keywords: search engines, virtual catalog, relevance, pertinence, ontology, heuristics.

Страницы 5 - 12

Коротков Р.О. , Деменков П.С., Иванисенко В.А. "WEB-ОРИЕНТИРОВАННАЯ СИСТЕМА ПОСТРОЕНИЯ КОМПЛЕКСНЫХ ЗАПРОСОВ К РЕЛЯЦИОННЫМ ИСТОЧНИКАМ БИОЛОГИЧЕСКОЙ ИНФОРМАЦИИ НА ОСНОВЕ СЕМАНТИЧЕСКОЙ ФОРМАЛИЗАЦИИ СТРУКТУРЫ ДАННЫХ"

"Web-ориентированная система построения и исполнения комплексных запросов к реляционным источникам биологической информации на основе семантической формализации структуры данных"

В статье речь идёт о разработке системы, предоставляющей веб-интерфейс для построения и исполнения комплексных запросов к реляционным источникам биологических данных. Рассматривается архитектура масштабируемой системы обеспечивающей выполнение множественных запросов и представляющей результаты в виде таблиц или графиков. Предлагается метод трансляции формализованного семантического запроса в запрос к СУБД. Описывается интерфейс веб-приложения, реализованный на технологии Adobe Flex.

Ключевые слова: веб-ориентированная обработка данных, анализ данных, семантическая модель, биоинформатика.

WEB-ORIENTED SYSTEM FOR COMPLEX QUERYING BIOLOGICAL RELATIONAL DATA SOURCES BASED ON DATA STRUCTURE SEMANTIC MODEL

The paper describes the system developed for building and executing complex queries to relational data sources of biological information. Architecture of a scalable system designed to support execution of multiple queries and rendering table or chart representation for the results is discussed. We suggest a method of translating a query defined in semantic terms to an equal SQL query. The user interface of the web application implemented with Adobe Flex technology is described.
Keywords: web-based data processing, data mining, semantic model, bioinformatics.

Страницы 13 - 22

Власов Д.Ю., Пальчунов Д.Е., Степанов П.А. "АВТОМАТИЗАЦИЯ ИЗВЛЕЧЕНИЯ ОТНОШЕНИЙ МЕЖДУ ПОНЯТИЯМИ ИЗ ТЕКСТОВ ЕСТЕСТВЕННОГО ЯЗЫКА"

АВТОМАТИЗАЦИЯ ИЗВЛЕЧЕНИЯ ОТНОШЕНИЙ МЕЖДУ ПОНЯТИЯМИ ИЗ ТЕКСТОВ ЕСТЕСТВЕННОГО ЯЗЫКА

В статье исследована проблема автоматического извлечения отношений между понятиями из текстов на естественном языке. Предложен метод извлечения отношений между понятиями при помощи лингвистических шаблонов, позволяющих гибко и компактно выделять в тексте различные лингвистические структуры.

Ключевые слова: онтология, понятие, автоматическая обработка текстов.

AUTOMATION OF EXTRACTION OF RELATIONS BETWEEN CONCEPTS FROM THE NATURAL LANGUAGE TEXTS

The problem of automated extraction of relations between concepts from the natural language texts is observed in the paper. We propose the method of extraction of the relations between concepts based on the specialized language of linguistic templates, which makes it possible to highlight different linguistic structures from a text in a flexible and compact way.

Keywords: ontology, concept, natural language processing.

Страницы 23 - 33

Андрюшкевич С.К. "ПОСТРОЕНИЕ ИНФОРМАЦИОННОЙ МОДЕЛИ КРУПНОМАСШТАБНЫХ ОБЪЕКТОВ ТЕХНОЛОГИЧЕСКОГО УПРАВЛЕНИЯ C ПРИМЕНЕНИЕМ АСПЕКТНО-ОРИЕНТИРОВАННОГО ПОДХОДА"

ПОСТРОЕНИЕ ИНФОРМАЦИОННОЙ МОДЕЛИ КРУПНОМАСШТАБНЫХ ОБЪЕКТОВ ТЕХНОЛОГИЧЕСКОГО УПРАВЛЕНИЯ C ПРИМЕНЕНИЕМ АСПЕКТНО-ОРИЕНТИРОВАННОГО ПОДХОДА

Сложность построения информационной модели крупномасштабных распределенных систем технологического управления обусловлена наличием большого количества элементов и технологических процессов, тесно связанных между собой. В отличие от модульного подхода к декомпозиции аспектно-ориентированный подход ориентирован на выявление спутывающих элементов предметной области. В настоящей работе представлена информационная модель таких систем, построенная на базе аспектно-ориентированных принципов, определены её задачи и основные элементы.

Ключевые слова: Аспектно-ориентированное проектирование, крупномасштабные системы управления, информационная модель, автоматизация.

BUILDING INFORMATION MODEL OF LARGE-SCALE DISTRIBUTED CONTROL SYSTEMS USING ASPECT-ORIENTED APPROACH

The complexity of building information model of large-scale distributed control systems is due to the presence of a large number of elements and processes are closely intertwined. In contrast to the modular approach to the decomposition, the aspect-oriented approach focuses on the identification of confounding (crosscut) elements of the domain. This paper shows an information model of such systems, built on the basis of aspect-oriented principles, defines its objectives and main elements.

Keywords: aspect-oriented design, distributed plants, information model, automation.

Страницы 34 - 45

Тамбовцев Ю.А. "БЛИЗОСТЬ ЛИНГВИСТИЧЕСКИХ ОБЪЕКТОВ ПО КРИТЕРИЮ «ХИ-КВАДРАТ» "

БЛИЗОСТЬ ЛИНГВИСТИЧЕСКИХ ОБЪЕКТОВ ПО КРИТЕРИЮ «ХИ-КВАДРАТ»

Аннотация:
В статье предлагается метод исследования близости языков, основанный на применении информационных технологий и прикладных математических методов в языкознании. После обработки большого массива текстов на компьютере была вычислена схожесть лингвистических объектов с помощью методов математической статистики и распознавания образов. Анализируется типология строения звуковых цепочек в языках и их диалектах в качестве образа. На основании доминантных фонетических признаков звуковых картин построены типологические расстояния между лингвистическими объектами. Под обобщенным термином «лингвистический объект» подразумевается язык или диалекты. Для построения расстояний используются значения критерия «Хи-квадрат». На его базе вычисляется коэффициент ТМВ, детальное описание вычисления которого дается ниже. Самое главное для наших исследований является то, что коэффициент ТМВ служит показателем расстояния между лингвистическими объектами. В научной литературе по классификации языков, взятые нами лингвистические объекты зарегистрированы или как отдельные языки, или как диалекты каких-либо языков. С учетом порогового значения коэффициента ТМВ лингвистические объекты, которые взяты нами для анализа, классифицируются на диалекты и отдельные языки уже по новому, т.е. на основании величины показателей типологических расстояний. Таким образом, один язык может выступать как один лингвистический объект, если мы берем его в литературном варианте. Язык может выступать и как несколько лингвистических объектов, т.е. как класс объектов, если мы берем несколько его диалектов. Класс объектов может называться таксоном или образом. Следовательно, диалект — это единичный объект, а язык может быть классом объектов, т.е. образом или таксоном, если он имеет целый набор диалектов.

Ключевые слова: типология, звуковая цепочка, язык, диалект, звуковые расстояния, языковой таксон

Closeness of Linguistic Objects by the “Chi-square” Criterion

The article investigates the closeness of linguistic objects by the Chi-square criterion. Any dialect or language is considered to be a linguistic object. The Chi-square distance is based on the typology of the structure of the speech sound chains in languages and dialects. The typological distances between the linguistic objects have been built on the basis of threshold value of the TMB coefficient. It allows us to classify the linguistic object either as a dialect or as a separate language.

phono-typological closeness, linguistic objects, the Chi-square criterion, dialect, language, distance, typology, speech sound chains.

Страницы 46 - 54

Адаманский А.В. "ИНФОРМАЦИОННАЯ МОДЕЛЬ ВЫСШИМ УЧЕБНЫМ ЗАВЕДЕНИЕМ"

Информационная модель управления высшим учебным заведением

Аннотация:
В данной работе кратко рассмотрены основные элементы концептуальной модели вуза, которая рассматривается с точки зрения задачи автоматизации управления высшим учебным заведением. В работе приведен анализ предметной области основных задач, которые выполняются вузом, и в качестве результата построена концептуальная, а затем информационная модель деятельности вуза применимая к автоматизации учебного процесса с использованием автоматизированных систем управления (АСУ).

Ключевые слова: Вуз, АСУ, модель данных

Information model of higher education organizations

In this paper the basic elements of conceptual model of higher education organizations briefly described. Analized various aspects and elements of education ogranization object domain and as result produced the information model of edu ogranization operations in the case of using automatic management information systems.

Information model, object domain, management, education organization

Страницы 55 - 65

Казаков В.Г., Яценко А.С., Казаков В.В., Жакупов М.В. "ЗАДАЧА АВТОМАТИЧЕСКОГО ПОСТРОЕНИЯ ДИАГРАММ АТОМНЫХ СПЕКТОРОВ И ОПЫТ ЕЕ РЕШЕНИЯ В ИНФОРМАЦИОННОЙ СИСТЕМЕ «ЭЛЕКТРОННАЯ СТРУКТУРА АТОМОВ»

Задача автоматического построения диаграмм атомных спектров и опыт ее решения в информационной системе «Электронная структура атомов»

Аннотация. Описывается информационная система «Электронная структура атомов» по спектральным свойствам нейтральных атомов. База данных системы хранит около 150 000 записей об уровнях энергии и радиационных переходах всех элементов периодической таблицы и является одной из крупнейших в мире и России. Основными особенностями базы данных являются большая, по сравнению с аналогами, полнота представления трансурановых и редкоземельных элементов с большим числом Z, а также то, что все введенные в базу данных переходы классифицированы. Помимо стандартного представления спектральных данных в табличной форме, информационная система реализует уникальную возможность визуализации спектральных данных атомов в виде диаграмм Гротриана. Диаграммы строятся системой автоматически по информации базы данных для всех нейтральных атомов из таблицы Д. Менделеева. Впервые автоматическое построение диаграмм дополнено эффективным отбором переходов для размещения на диаграмме, что существенно повышает читаемость последних и приближает к диаграммам, построенным специалистами «вручную». Информационная система опубликована в открытом доступе в сети Интернет.

Ключевые слова: информационные системы, базы данных, атомная спектроскопия, визуализация, диаграммы Гротриана.

The Problem of Automatic Construction of Diagrams of Atomic Spectra and the Experience of Its Solutions in the Information System "Electronic Structure of Atoms."

Annotation

Information system of spectral atomic data called “Electronic atomic structure” is described. System’s database stores about 150 000 records of energy levels and radiation transitions for all elements of the periodic table. It is one of the biggest systems in the world. The main particularity of this database is completeness in presentation (compared with analogues) of transuranic and rare-earth elements with a high Z-number as well as classification of all inputted transitions. Besides of usual spectral data representation in the table form the system implements the unique opportunity of atomic visualization in the Grotrian diagrams form. The system diagrams automatically basing on the database information about all neutral atoms from the periodic table. For the first time the automatic diagramming is completed by the effective selection of transitions for their positioning on the diagram. This makes diagrams readability higher and brings them closer to the diagrams that were made manually. The information system is published for open access in the Internet.

Keywords

Information systems, databases, atomic spectroscopy, visualization, Grotrian diagrams

Страницы 66 - 78

RSS-материал