Подписчики - это деньги, говорил я в дискуссиях. Чем больше у вас подписчиков - тем больше будет лайков. Я решил посчитать, какая на самом деле за этим утверждением стоит математика (абстрагировавшись пока от того факта, что не все лайки одинаково дороги, это - в следующий раз).
Я взял все посты за 17 декабря, за которых был хотя бы один лайк. Почитал репутацию и число подписчиков автора на момент публикации. Убрал авторов с отрицательной репутацией (отрицательной в смысле числа, записанного блокчейне - я не очень понял, как оно получается, но не суть). Посчитал линейную регрессию зависимости лайков от других параметров.
- Если учитывать только подписчиков - среднее число лайков начинается с десяти лайков (если подписчиков вообще нет), и затем каждые три подписчика дают один голос. То есть, если у участника Голоса 22 подписчика (медианное значение три дня назад по авторам ненулевых постов), у постов в среднем можно ждать 17 лайков.
Больше - значит, автор белый и пушистый, рубрика популярная, пост интересный, время публикации удачное и т.д.
При моих 160 подписчиках, я могу ждать 63 лайка на пост безотносительно его темы. Ну да, как-то так и получается.
Я попробовал еще учесть в модели репутацию, и получилось было, что каждые сто подписчиков дают 29 лайков, плюс каждые
двеединицы репутации выше34-хдают еще лайк. То есть, если у вас 100 подписчиков и репутация 60, базовое число лайков будет как раз 42. При репутации ниже 60, модель из предыдущего пункта будет оптимистичной. Выше - пессимистичной. Репутация тут работает как способ оценки возраста экаунта (и, полагаю, интереса китов). Но потом я посчитал для проверки данные следующего дня. Зависимость от числа подписчиков осталась в силе. А дополнительная зависимость репутации - съехала, получилось не две репутации выше 34, а три выше 30. В общем, зависимость от репутации - не линейная и хитрее. Поэтому двоечку в выделении выше я зачеркнул.
Жду следующего раза )
Я уже несколько раз собирался подступиться к этой теме, но какая то она неподъемная...)
У меня пока просто проблемы с пониманием структуры данных в GolosSQL.