Description:
Статтю присвячено статистичним критеріям аналізу синтаксичних фразеологізмів на матеріалі української мови. Синтаксичні фразеологізми розглянуто з позицій конструкційної граматики та інтерпретовано як один із типів некомпозиційних мовних знаків – конструкцій.
Проаналізовано основні показники асоціації: MI, t-score, log-likelihood, Dice, gmean. Обрано показник асоціації МІ як статистичний критерій, що дає змогу визначити коефіцієнт невипадковості поєднання двох і більше слів у тексті, враховує частоту конструкції, частоту її компонентів, розмір корпусу та має формулу в узагальненому вигляді для конструкцій з будь-якою кількістю компонентів.
Подано результати здійсненого статистичного аналізу моделей синтаксичних фразеологізмів української мови за даними Українського національного лінгвістичного корпусу. Зʼясовано, що всі обстежені за показником асоціації МІ моделі синтаксичних фразеологізмів мають високий (МІ >>3) ступінь невипадковості поєднання компонентів, що входять до складу незмінної частини речення, тобто характеризуються статистично доведеною звʼязаністю.