Критерії для ідентифікації користувачів в Інтернет-комунікаціях

Розділ: 

Галузь: 

Ключові слова та терміни: 

Результати наших досліджень гендерних відмінностей в мові користувачів Веб-форумів представлені в Таблиці. Також, ми обчислити ймовірність появи кожної сформованої нами гендерних категорій стилю мови у дискусіях досліджуваних Веб-форумів.

Критерії для ідентифікації користувачів в Інтернет-комунікаціях

Тип аналізу Характерні  критерії ідентифікації автора повідомлення РF РM
На  рівні частин мови, конкретних слів та фраз Велика кількість  вибачень 0,024 0,024
Модальні конструкції 0,0239 0,0088
Вказівні займенники – той, ті, того та ін. 0,025 0,042
Згадка про емоції та почуття 0,036 0,0013
Просторові посилання 0,003 0,0136
Ухиляння від відповіді 0,029 0,0021
Дієслівні фрази, які вказує на брак впевненості 0,044 0,006
Прикметники (особиста оцінка, а не опис почуттів, речей і т.д.) 0,062 0,0383
Прийменники, які вказують на час, місце розташування та ін. 0,0074 0,0279
Географічні посилання 0,0018 0,024
Стверджувальні фрази 0,0103 0,0286
Слова розпоряджень 0,0069 0,0284
Дієслова теперішнього часу 0,014 0,036
Довгі слова 0,006 0,0091
Використання ввічливих словоформ 0,052 0,019
Акцент на словах – "отже", "дуже", "досить"  та ін. 0,036 0,0109
Лайливі та грубі форми слова 0,0089 0,041
‘Порожні’ прикметники 0,0261 0,0045
Спеціальна лексика (соціальні, родинні теми дискусій ) 0,0306 0,0046
Використання умовного способу 0,012 0,0035
Уникнення вульгарних і лайливих висловів 0,008 0,0033
Підсилювальні слова 0,0224 0,0025
Вказівка на розташування об'єктів 0,0099 0,048
Займенник першої особи однини (я, мене, моїх та ін.) 0,056 0,095
Особовий займенник “ми” 0,025 0,009
Пестливі слова 0,014 0,0054
Спеціальна лексика (спорт, технології, політика, гроші) 0,017 0,084
Посилання на кількість, величину (згадка суми, кількості) 0,0081 0,035
Присяги і клятви 0,00063 0,0149
Згадування минулих подій, які викликають негативні емоції 0,038 0,017
На  рівні речень Згадування  минулих подій по відношенню до теперішнього часу 0,0021 0,039
Окличне речення 0,015 0,011
Вказівки 0,004 0,046
Речення, які служать для вираження підтримки 0,0397 0,003
Протиставлені речення 0,009 0,0023
Речення, які служать для вираження згоди 0,049 0,065
Перефразування речень 0,0012 0,0057
Непрямих команди і прохання 0,0098 0,0047
Підрядні речення обставини 0,098 0,0063
Позначення вигуків 0,0046 0,013
Безособові речення 0,0097 0,025
Підрядні речення позбавлене смислу 0,0271 0,0056
Підрядне речення, яке служить для уточнення 0,1041 0,0102
Заперечні речення 0,0361 0,013
Обговорення поточних проблем 0,012 0,044
Запитання (вказівки в питальній формі не беремо до уваги) 0,0407 0,0037
Розділові речення 0,0165 0,0056
Прямі цитування 0,005 0,0013
Еліптичні речення 0,0091 0,0265
Спільні категорії для обох статей
На  всіх рівнях Використання  жартів 0,041* 0,041*
Велика кількість слів для написання повідомлення 0,0022* 0,0022*
Інтимні теми розмови 0,031* 0,031*

РF – ймовірність появи критерію стилю мови жінки;
РМ – ймовірність появи критерію стилю мови чоловіка;
0,0n – більша ймовірність появи даної категорії у повідомленні чоловіка (жінки);
0,0n* - однакова ймовірність появи даної категорії у повідомленнях обох статей.