refik.in.ua 1

ЛИНГВОСТАТИСТИКА ЯК ЕКСПЕРЕМЕНТАЛЬНА ДИСЦИПЛІНА


З одного боку, сучасна лінгвістика, прагнучи всебічно охарактеризувати функції і будову мови, все більшу увагу приділяє її визначальній ролі у формуванні «внутрішньої картини світу» людини і наполегливо шукає відповідні цій ролі мовні механізми, які лежать в області семантики. Результат дії цих механізмів може виявляти тільки мовлення, яке піддається своїм специфічним методам обробки, аніж мова, в тому числі писемна. Статистика в лінгвістиці тісно пов’язана із семантикою, а ще тісніше із психолінгвістикою: це в більшості елементарний математичний апарат дослідження. У лінгвостатистиці поняття «статистика», крім традиційного позначення відповідного математичного апарату обробки кількісних спостережень, має й інше значення - позначає кількісний показник реалізації тих або тих мовних знаків у мові (тексті).

В експериментальній семантиці як лінгвостатистичні методики виділення семантичних зв'язків використовуються наступні:

- асоціативний експеримент, де мірою семантичної зв'язку пари об'єктів є схожість їх асоціацій;

- суб'єктивне шкалювання, де учасники роблять висновок про подібність кожної пари об'єктів за деякою градуйованою шкалою, зміст якої не вказано, тобто випробуваний сам домислює підстави класифікації;

- методика сортування, де семантична схожість пари об'єктів пропорційно кількості об'єднань їх у загальні класи при процедурі класифікації;

- метод підстановки, споріднений лінгвістичному методом дистрибутивного аналізу, де мірою подібності слів виступає кількість контекстів, в яких ці слова взаємозамінні;

- семантичний диференціал, де мірою подібності семантики вербальних об'єктів спочатку було схожість їхніх оцінок, даних за біполярним шкалами, що містить як полюси прикметники-антоніми.

ЛІНГВОСТАТИСТИКА ТЕКСТУ тепер є особливо перспективним способом психометричного дослідження значення слова і статистичного аналізу тексту. В центрі уваги - техніка психометричного масштабування і прийоми статистичної обробки експериментальних даних, а також об'єктивна якісна інтерпретація кількісно-статистичних особливостей тексту.


Семантичний диференціал

Найбільш відомий і простий варіант побудови семантичного простору - методика семантичного диференціала. Її в 1952 р. запропонував для вимірювання значень слів американський психолог Чарльз Осгуд. Осгуд допускає, що слова, зрозумілі як стимули, викликають різні реакції, що відрізняються один від одного двома параметрами: якістю та інтенсивністю його прояву (пор. відмінний - хороший - посередній - поганий). Значення слова, таким чином, може бути подано як деяка точка на шкалі, що задається двома полярними термінами (наприклад, відмінний - поганий).

Семантичний диференціал (СД) - це метод кількісного і якісного індексування значення з допомогою двухполюсных шкал, що задаються парою антонімічних прикметників, між якими дані градації ступеня входження того чи іншого слова в даний якість.

Градуйована вісь - власне осгудовский вид масштабування, він і отримав назву «Семантичний диференціал» (СД), іноді іменувався методом «семантично протилежних пар» (СПП). Суть його в наступному.

Випробовуваним роздавали спеціально розмічені картки:

ПАТРІОТ

слабкий × сильний

– 3 – 2 – 1 0 1 2 3

Спосіб присвоєння ознак дозволяє вимірювати групу слів у групі. Цей спосіб передбачає вербальну форму відповідей випробуваних; перекодування відповідей в числову форму здійснюється вже в процесі обробки даних самим експери-ментатором.

На чистому аркуші паперу випробувані записують у стовпчик перелік слів, які підлягають вимірюванню. Потім кожному з інформантів дається перелік ознак, за допомогою яких люди будуть здійснювати вимірювання (табл. 1).


хороший – поганий великий - маленький

ніжний - грубий жіночний - мужній

світлий - темний активний - пасивний

сильний – слабкий швидкий - повільний

красивий - потворний гладкий - шорсткий

легкий – важкий безпечний - страшний

величний - ниций яскравий - тьмяний

округлий - кутастий радісний - сумний

гучний - тихий добрий - злий

рухливий - повільний

Різноманітність мови та способи її обробки лінгвостатистикою.

Однією з головних комунікативних якостей мови справедливо визнається її багатство. Розрізняють два аспекти розгляду цієї категорії. З одного боку, цілком правомірна оцінка багатства змістовної боку мови, тобто аналіз її інформативно-логічного, семантичного аспекту. З іншого боку, можна і потрібно оцінювати характер використання залучених мовних одиниць, тобто зовнішню форму мови. Саме цей аспект і вивчається у лінгвостатистичному дослідженні тексту. В основі змісту поняття «багата мова» лежить думка про те, що мова тим багатше, ніж рідше повторюються в ній одні і ті ж знаки і ланцюжки знаків, способи внутрішньої організації цих послідовностей. Це означає, що мова тим багатше, ніж вона різноманітніше на всіх своїх мовних рівнях. Такий висновок дозволяє ототожнювати поняття «багатство» і «різноманіття» мови. Існуючі методи оцінки багатства (різноманітності) мовлення в межах того чи іншого її фрагмента, цілого тексту або їх сукупності спираються, як правило, на інтуїцію дослідника, що може призвести до суб'єктивізму цієї оцінки. Подолати цей недолік дозволяє застосування системи досить глибоких, але суворих і статистично виразних коефіцієнтів мовного розмаїття.

Проблеми фонетики у лінгвостатистиці, це, насамперед, - які одиниці фонетичного рівня володіють найбільшою психологічною впливовістю?(ПРИКЛАД із звуком [С]). Признакова змістовність звукової оболонки слова складається з символіки, що входять в її склад окремих «звукобукв» (або «графонів», як їх іноді називають).


Обчислення фонетичного значення слова здійснюється за формулою:де St - фонетичне значення слова;

i - індекс, який бігтиме, всі «звукобуквы» цього слова;

xi - середня оцінка фонетичного значення i-го звуку;

Pi - регулярна частотність i-го звуку;

Pmax - максимальна частотність звуку в цьому слові;

ki - поправочний коефіцієнт для i-го звуку;

k1 - поправочний коефіцієнт для першого звуку слова;

куд - поправочний коефіцієнт для ударної звуку слова;

Σ - знак суми.

Наприклад, фонетична форма слова лілія отримала такі характеристики: «хороший» (1,8), «ніжний» (2,0), «жіночний» (2,1), «світлий» (2,0), «гарний» (1,9), «гладкий» (2,1), «легкий» (2,4), «безпечний» (1,9), «яскравий» (2,3)», «округлий» (2,1), «добрий» (2,1), «слабкий» (3,5).

Лінгвостатистичні коефіцієнти різноманітності мови

Розрахунок коефіцієнта мовного розмаїття повинен припускати взаємозв'язок, як мінімум, двох параметрів: лексичного різноманітності і ступеня синтаксичної складності. На цих рівнях легко досягти формальної співвідношення коефіцієнтів.

Лексичне різноманітність

Коефіцієнт лексичного різноманітності мови формується з залучення числа лексем до загальної кількості слів тексту. Коефіцієнт синтаксичного різноманітності випливає з відношення числа пропозицій до числа слів даного тексту:

Завдання 1. Виконати на картках вимірювання значень слів (за способом Осгуда).

I варіант: вірність, сплеск, рило, пух, удар, дефіс, дума, фізіономія.

хороший


поганийсильний


слабкийхороший


поганийсильний


слабкийхороший


поганийсильний
слабкий

хороший


поганийсильний
слабкий

хороший


поганий

сильний


слабкий

хороший


поганий

сильний


слабкий

хороший


поганий

сильний


слабкий

хороший


поганий

сильний


слабкий