От ефира на Тази сутрин по bTV ни дават нагледен урок за феномена data dredging – некоректно използване на статистически анализ за откриването на фалшиво положителни зависимости, които нямат никакво подлежащо значение и смисъл.
При обработването на голям обем от данни получаването на фалшиво положителни резултати е почти неизбежно. Често обяснявам този феномен на моите студенти и за много от тях заключението е неинтуитивно. Но хората, правещи статистически анализ, трябва да знаят по-добре…
Явно имам прекалено големи изисквания.
Тази година зодия стрелец е най-задлъжняла, през минали години са били други зодии.
Въпросът е защо въобще се изследва такава потенциална връзка? Наистина ли авторите на анализа смятат, че може да има връзка между зодиакалния знак и тегленето на заеми и кредити?
Защо се вкарват ненужни променливи (като зодия) и се докладват абсурдни зависимости?
Използвани ли са статистически методи за контролиране на фалшиво положителни резултати (напр. корекция на Бонферони)? Каква е статистическата значимост (p-value) на това „откритие“?
Защо ни пробутвате такива глупости в национален ефир и залъгвате хората, че зодиите имат значение за каквото и да е?