Критерії для ідентифікації користувачів в Інтернет-комунікаціях

Результати наших досліджень гендерних відмінностей в мові користувачів Веб-форумів представлені в Таблиці. Також, ми обчислити ймовірність появи кожної сформованої нами гендерних категорій стилю мови у дискусіях досліджуваних Веб-форумів.

Критерії для ідентифікації користувачів в Інтернет-комунікаціях

Тип аналізуХарактерні критерії ідентифікації автора повідомленняРFРM
На рівні частин мови, конкретних слів та фраз Велика кількість вибачень0,0240,024
Модальні конструкції0,02390,0088
Вказівні займенники – той, ті, того та ін.0,0250,042
Згадка про емоції та почуття0,0360,0013
Просторові посилання0,0030,0136
Ухиляння від відповіді0,0290,0021
Дієслівні фрази, які вказує на брак впевненості0,0440,006
Прикметники (особиста оцінка, а не опис почуттів, речей і т.д.)0,0620,0383
Прийменники, які вказують на час, місце розташування та ін.0,00740,0279
Географічні посилання0,00180,024
Стверджувальні фрази0,01030,0286
Слова розпоряджень0,00690,0284
Дієслова теперішнього часу0,0140,036
Довгі слова0,0060,0091
Використання ввічливих словоформ0,0520,019
Акцент на словах – "отже", "дуже", "досить" та ін.0,0360,0109
Лайливі та грубі форми слова0,00890,041
‘Порожні’ прикметники0,02610,0045
Спеціальна лексика (соціальні, родинні теми дискусій )0,03060,0046
Використання умовного способу0,0120,0035
Уникнення вульгарних і лайливих висловів0,0080,0033
Підсилювальні слова0,02240,0025
Вказівка на розташування об'єктів0,00990,048
Займенник першої особи однини (я, мене, моїх та ін.)0,0560,095
Особовий займенник “ми”0,0250,009
Пестливі слова0,0140,0054
Спеціальна лексика (спорт, технології, політика, гроші)0,0170,084
Посилання на кількість, величину (згадка суми, кількості)0,00810,035
Присяги і клятви0,000630,0149
Згадування минулих подій, які викликають негативні емоції0,0380,017
На рівні реченьЗгадування минулих подій по відношенню до теперішнього часу0,00210,039
Окличне речення0,0150,011
Вказівки0,0040,046
Речення, які служать для вираження підтримки0,03970,003
Протиставлені речення0,0090,0023
Речення, які служать для вираження згоди0,0490,065
Перефразування речень0,00120,0057
Непрямих команди і прохання0,00980,0047
Підрядні речення обставини0,0980,0063
Позначення вигуків0,00460,013
Безособові речення0,00970,025
Підрядні речення позбавлене смислу0,02710,0056
Підрядне речення, яке служить для уточнення0,10410,0102
Заперечні речення0,03610,013
Обговорення поточних проблем0,0120,044
Запитання (вказівки в питальній формі не беремо до уваги)0,04070,0037
Розділові речення0,01650,0056
Прямі цитування0,0050,0013
Еліптичні речення0,00910,0265
Спільні категорії для обох статей
На всіх рівняхВикористання жартів0,041*0,041*
Велика кількість слів для написання повідомлення0,0022*0,0022*
Інтимні теми розмови0,031*0,031*
Вираження гніву0,0188*0,0188*

РF – ймовірність появи критерію стилю мови жінки; РМ – ймовірність появи критерію стилю мови чоловіка; 0,0n – більша ймовірність появи даної категорії у повідомленні чоловіка (жінки); 0,0n* - однакова ймовірність появи даної категорії у повідомленнях обох статей.

Forums: 

Fields: 

Keywords: