> Начерта точность до десятков юзеров?Не до десятков, а в разы, а может быть и на порядки. Я ставлю linux на четыре устройства дома, и все эти устройства ходят в интернет с одним ip адресом, за которым сидит неизвестное мне число других линуксоидов. Я даже не знаю как оценить это количество с точностью до порядка. Ну, можно попробовать оценить максимальное количество одновременных соединений с устройства, и поделить количество ip портов у NAT'а провайдера на это количство соединений, и предположить что это то самое число пользователей -- вероятно провайдер именно так и оптимизирует использование своих ip'шников, распределяя пользователей по ним.
То есть ты замучаешься определять количество установок оглядываясь исключительно на ip, с которых приходят запросы на обновление.
> Тенденцию и по IP адресам могут посмотреть.
Что эта тенденция отражает? Что процесс обновления системы часто стал фейлится, и поэтому множество повторых запусков пакетного менагера? Что мода держать локальные репы для скачанных пакетов подошла к концу, и теперь каждое устройство качает из интернета? Может провайдеры каким-то образом кешировали запросы, а теперь прекратили? Не, вероятно все эти вещи можно как-нибудь выудить из данных, если как следует подумать, нагенерировать гипотез, проверить их статистикой... просто прогнать данные через всякие хитрые алгоритмы, чтобы методом тыка поискать особенности... Можно, наверное, но data scientist сегодня -- это очень дорогое удовольствие, они нужны всем, специалистов на рынке недостаточно, поэтому зарплаты они требуют себе выше крыши. А это значит что их привлекают к тем задачам, которые дают действительно большой выхлоп по деньгам, а не всяким там подсчётам количества установок, которое, судя по всему, и до миллиона не дотягивает.