Тамбовцев Ю.А. "БЛИЗОСТЬ ЛИНГВИСТИЧЕСКИХ ОБЪЕКТОВ ПО КРИТЕРИЮ «ХИ-КВАДРАТ» "

БЛИЗОСТЬ ЛИНГВИСТИЧЕСКИХ ОБЪЕКТОВ ПО КРИТЕРИЮ «ХИ-КВАДРАТ»

Аннотация:
В статье предлагается метод исследования близости языков, основанный на применении информационных технологий и прикладных математических методов в языкознании. После обработки большого массива текстов на компьютере была вычислена схожесть лингвистических объектов с помощью методов математической статистики и распознавания образов. Анализируется типология строения звуковых цепочек в языках и их диалектах в качестве образа. На основании доминантных фонетических признаков звуковых картин построены типологические расстояния между лингвистическими объектами. Под обобщенным термином «лингвистический объект» подразумевается язык или диалекты. Для построения расстояний используются значения критерия «Хи-квадрат». На его базе вычисляется коэффициент ТМВ, детальное описание вычисления которого дается ниже. Самое главное для наших исследований является то, что коэффициент ТМВ служит показателем расстояния между лингвистическими объектами. В научной литературе по классификации языков, взятые нами лингвистические объекты зарегистрированы или как отдельные языки, или как диалекты каких-либо языков. С учетом порогового значения коэффициента ТМВ лингвистические объекты, которые взяты нами для анализа, классифицируются на диалекты и отдельные языки уже по новому, т.е. на основании величины показателей типологических расстояний. Таким образом, один язык может выступать как один лингвистический объект, если мы берем его в литературном варианте. Язык может выступать и как несколько лингвистических объектов, т.е. как класс объектов, если мы берем несколько его диалектов. Класс объектов может называться таксоном или образом. Следовательно, диалект — это единичный объект, а язык может быть классом объектов, т.е. образом или таксоном, если он имеет целый набор диалектов.

Ключевые слова: типология, звуковая цепочка, язык, диалект, звуковые расстояния, языковой таксон

Closeness of Linguistic Objects by the “Chi-square” Criterion

The article investigates the closeness of linguistic objects by the Chi-square criterion. Any dialect or language is considered to be a linguistic object. The Chi-square distance is based on the typology of the structure of the speech sound chains in languages and dialects. The typological distances between the linguistic objects have been built on the basis of threshold value of the TMB coefficient. It allows us to classify the linguistic object either as a dialect or as a separate language.

phono-typological closeness, linguistic objects, the Chi-square criterion, dialect, language, distance, typology, speech sound chains.

Страницы 46 - 54

Прикрепленный файлРазмер
05.pdf235.67 кб