Для создания программы ученые проанализировали 12 млн постов, написанных 2,4 млн пользователей Twitter.
Исследование проводилось в течении 19 дней и за это время из массива были исключены пользователи, не написавшие ни одного поста и спам-акаунты. В итоге осталось 350 тыс. пользователей, характеристики которых и были использованы для создания искусственного профиля. В процессе ученые выяснили, что время появления каждого нового поста, определяется логарифмически-нормальному распределению (вид распределения вероятностей случайных величин). Предполагается, что в будущем SONG будет помогать в исследованиях поведения людей в сети, в нестандартных ситуациях.
Напомним, в 2010 году количество акаунтов в Twitter выросло на 100 млн достигнув 175 млн. При этом общее количество твитов, опубликованных в прошлом году составило 25 млрд.