среда, 6 мая 2020 г.

Что за «индекс самоизоляции» от «Яндекса»?

1. Слово «индекс» означает, что речь идёт не про абсолютные величины. Это синтетическая сущность, которая нужна для сравнения. Т. е. сравнительно больше или меньше показатель в отдельном городе относительно другого. Или в тот или иной момент времени. Индекс не предназначен для расчётов всех бомжей на улице.


2. Это интегральный показатель. Это означает, что индекс рассчитывается из нескольких других. Несколько — это может быть много. Точно больше одного. Т. е. из нескольких источников, которые могут дополнять и подтверждать. А могут и не. Но несколько, конечно же, надёжнее одного показателя (например, количества бомжей на улице). Правда, «Яндекс», конечно же, мог бы и более подробно написать, что и как считают — это полезно. Вот тут написано слишком мало.

3. В социологии есть некоторая магия, которая для личностей «с гуманитарным складом ума» может показаться шокирующей. Ну, например, тот же Венедиктов склонен верить опросам «Левады» и ФОМ. А там совершенно точно не считают бомжей. Там, обычно, выборка — 1600 человек. На всю Россию. И ничего — верит. И даже хвастается рейтингами радио «Эхо Москвы» и ничего у него не свербит.

Суть магии довольно проста: если мы из мешка со перемешанным рисом (генеральная совокупность) будем случайно доставать рисинки, тщательно их разглядывать и подсчитывать, то по частоте попадания дикого и белого риса, в какой-то момент, мы сможем сказать, в какой пропорции они там перемешаны. Ну, примерно. Не точно, до числа рисинок, но достаточно, чтоб определить пропорцию. И чем больше достаём — тем точнее будет. В пределе, мы пересчитаем все рисинки, но для приблизительной пропорции нам будет достаточно нескольких сотен измерений.

Так вот, для расчёта «индекса самоизоляции» будет достаточно несколько тысяч раз спросить случайного человека: дома он или попёрся куда. У «Яндекса» такая возможность есть: он просто смотрит на активность в приложениях типа «Навигатор» или «Карты» (как реально сделано, «Я» не раскрывает, а зря).

А поскольку пользователей «Я.Карт» довольно много (миллионы), то, в теории, этим измерениям и расчётам из них можно доверять.

4. Мелкая деталь: индекс самоизоляции вычисляется в баллах — от ноля до 5 с одним десятичным знаком. То есть, шкала «от 0 до 50». Это означает, что точность индекса — плюс/минус 2% (одна пятидесятая = 2%). Что вполне себе соответствует и сильно точнее социологии методом опроса (там, как правило, доверительный интервал в 2,5% с вероятностью в 95%).

ЭРГО: «Яндексу» можно доверять ровно в той же мере, что любому другому исследователю. А математика и часть её теории вероятностей — полезна. Изучай математику — не будь как Венедиктов.

https://seoded.blogspot.com/2020/05/index-samoizolyacii.html

Интересное...




Другие посты по этой теме:



Комментариев нет: