статистика iLukmus 28.09.2011-20.01.2012

Это первая статистика iLukmus. Я рассчитаваю приводить такую статистическую информацию регулярно, так как считаю ее крайне интересной. Думается мне, что то что я тут напишу это срез современного молодежного рунета.

роботы

На 20 января 2012 года в система насчитывала 38 анкет роботов, которые общались хотя бы с одним человеком. Из них 30 женского пола и 8 мужского. Добавлялись они постепенно, последняя была добавлена 29.12.2011.

График добавления анкет в систему представлен ниже.

география

В 25 анкетах страна указана Россия, 13 анкет ботов граждане мира. С городами схожая ситуация: 13 ботов предпочли скрыть свой город, данные остальных в таблице ниже.

Город Количество ботов
Москва 9
Санкт-Петербург 4
Волгоград 2
Владивосток 1
Екатеринбург 1
Казань 1
Калининград 1
Краснодар 1
Нижний Новгород 1
Ростов-на-Дону 1
Хабаровск 1
Челябинск 1
Якутск 1

друзья

В сумме на 38 анкетах 16443 друзей, в среднем это получается 432 на анкету. Однако, эти числа нельзя считать объективно описывающими ситуацию т.к. большое количество друзей находиться в подписчиках т.к. боты еще не успели их принять в друзья. Среднее количество друзей на анкету тоже не следует серьезно воспринимать т.к. среди анкет имеются такие где друзей 9143, а есть где 20.
В таблице ниже показанны данные не по всем когда-либо существовавшим в системе анкетам, а только по тем, где удалось на данный момент получить данные.

Количество друзей Количество ботов
меньше 100 6
меньше 200 8
меньше 300 3
меньше 400 2
меньше 500 2
меньше 1000 3
больше 1000 2

Точный прирост друзей я назвать не могу т.к. с самого начала система не вела соответствующие записи (сейчас эта ошибка исправлена и следующая статистика точно назовет прирост), однако, приблизительно суммарный прирост друзей около 5000-6000.

диалоги

Всего количество диалогов составляет 7348. В среднем это получается по 193 на бота. Но также как и статистику по друзьям эти числа тоже нельзя считать объективной по тем же причинам.

Количество диалогов Количество ботов
меньше 100 19
меньше 200 3
меньше 300 5
меньше 400 1
меньше 500 2
меньше 600 3
больше 600 3

Минимум диалогов – 1 (Коля Покровский, Вова Українець), максимум – 836 (Наталья Кондрашина).

сообщения

Всего в системе было 241 708 сообщений, а так как робот отвечает на каждое сообщение человека, следовательно, боты отправили 120 854 сообщений. В среднем это 3 180 сообщений на бота.

Рекордсменом тут опять оказалась Наталья Кондрашина, она получила и отправила в сумме 29 886 сообщений.

люди

Всего в системе зарегистрировано 12 157 уникальных собеседников. Из них с ботами общались 6 594 человек.

Ниже представлены графики прироста собеседников соответственно всех и тех кто общался.

география

В таблице представлены данные по странам собеседников.

Страна Количество собеседников
AE 10
AF 2
AI 1
AL 3
AM 17
AT 3
AU 2
AZ 36
BE 7
BF 1
BO 1
BR 2
BS 2
BY 265
CA 6
CH 4
CI 2
CL 1
CN 8
CO 2
CR 1
CU 1
CY 10
CZ 1
DE 52
DK 3
DZ 3
EE 6
EG 25
EH 1
ES 29
F 22
FI 4
FJ 1
FR 22
GB 30
GE 13
GH 1
GR 14
HN 1
HR 1
IE 1
IL 14
IN 7
IQ 4
IR 2
IS 18
IT 73
JM 2
JO 10
JP 3
KG 3
KR 2
KW 1
KZ 64
LB 4
LT 2
LU 1
LV 5
LY 2
MA 5
MD 10
ME 1
MK 1
MM 1
MX 2
MY 1
NE 1
NG 1
NL 8
NO 2
PL 11
PS 1
PT 2
QA 2
RO 1
RS 5
RU 7771
SA 11
SE 3
SG 1
SJ 2
TH 1
TJ 5
TM 1
TN 5
TR 334
UA 1730
US 109
UY 1
UZ 5
VN 2
ZM 1

Остальные собеседники не определились со страной.

Все собеседники представляют более 1100 городов. Из-за того, что некоторые персонажи пишут свой город с ошибками или на разговорный манер точную группировку по городам представить нельзя. Полную таблицу я приводить не буду т.к. она уж слишком большая, ниже представлю данные только по наиболее значимым, на мой взгляд, городам.

Город Количество собеседников
Москва 1400
Санкт-Петербург 584
Минск 72
Киев 284
Астана 4
Волгоград 544
Владивосток 20
Екатеринбург 341
Казань 393
Калининград 235
Краснодар 354
Нижний Новгород 161
Ростов-на-Дону 562
Хабаровск 34
Челябинск 369
Якутск 71

полы

Женский пол Мужской пол Неопределились
Все собеседники 1188 10662 307
Собеседники, которые общались 417 6015 162

сообщения

Как я уже выше указывал, всего система насчитывает 241 708 сообщений, пополам роботам и людям. Самый длинный диалог составил 1345 сообщений на двоих: человек и робот.

Вообще, мониторя общение людей с роботами, я понил, что побольшей части мужская аудитория ВК это сексуально озабоченные онанисты,  параноики, хамоватые типы и прочая элита. В этом можно легко убедиться просто взглянув на аватарки собеседников.

Упоминание слова ‘секс’ в той или иной вариации было 1993 раза, а ‘sex’ 159. На мой взгляд самые популярные/интересные выражения и слова представлены в таблице ниже.

Слово/фраза Количество упоминаний
секс 1993
бог 205
как дела 1228
чем занимаешься 925
что делаешь 396
привет 11397
путин 7
хуй 583
бля 758
ты кто 304
сиськи 66
пизда / в пизду 115
do you speak english / english 164
сколько тебе лет 186
салам 78
водка 42
пиво 31
скайп / skype 1001
минет 81
я тебя люблю / я влюбился 128
пока 2576
увидимся 243
дай телефон / позвони / позвоню 1340
дура 344
умная / умный 745
нах 434
отсоси / отсосешь / отсос 852
ты бот 179
спам 310
я дрочу / я на тебя дрочу 45
как тебе мой член / зацени мой член 105

Я также принимаю вопросы, которые могут вас интересовать в комментариях к этому посту. По возможности посчитаю и выложу.
Надеюсь кому-то кроме меня эта статистика интересна.

3 Comments to “статистика iLukmus 28.09.2011-20.01.2012”

  1. Bo0oM пишет:

    Хорошее развитие)

  2. Anonymous пишет:

    На каком языке реализован бот? Буду благодарен, если вы подробней расскажете о части системы, которая отвечает за NLP; о литературе и других источниках, которыми вы пользовались при создании.

    Какую БД используете для хранения диалогов?

    Также интересна реализация взаимодействия со вконтактом. Чем парсите? Выполняете ли javascript’ы?

    • lukmus пишет:

      возможно я вас разочарую, но я не писал свою СИИ я взял уже готовую, которую писало несколько лет целое предприятие.
      БД – MySQL. Сайт написан на Ruby on Rails, соответственно и все парсеры и мои роботы также написаны на Ruby. JS где того требует ВК приходиться анализировать и выполнять.

Leave a Reply

(обязательно)

(обязательно)