Цитаты из книги «Аналитика и Data Science. Для не-аналитиков и даже 100% гуманитариев…» Никиты Сергеева📚 — лучшие афоризмы, высказывания и крылатые фразы — MyBook. Страница 4
image
Массивом для последующей аналитической обработки является «плоская» таблица (не сведенный отчет).
12 сентября 2021

Поделиться

Массивом данных для пользователей как мы с Вами по большому счету является таблица, в которую внесены данные. Главное: в массиве все данные по той или иной переменной должны соотноситься с конкретным случаем, объектом, процессом, явлением. Строки таблицы – это случаи или объекты (например, ФИО, завод, филиал, клиент и т.д.). Колонки – это наши переменные, то есть характеристики этих случаев или объектов (доход, % брака, возраст, пол, страна и т.д.).
12 сентября 2021

Поделиться

нами объектов (люди, животные, товар, клиенты, организации и т.д.), которые могут принимать разные значения. Доход, пол, возраст, цвет и т. д. 4. В практике стоит различать три типа шкал для измерения переменных. Номинальная: шкала наименований – город, пол, профессия и т. д. Ординальная / порядковая: отражающая степень проявления какого-либо свойства, без точных измерений – высокий-низкий; больше-меньше; I – II – III место и т. д. Интервальная: отражает размерность или масштаб каждой переменной – доход, возраст в годах, расстояние и т. д. 5. Мы выдвигаем наши предположения / суждения (как в виде мнений или домыслов, так и опыта) в виде гипотез, которые потом проверяем цифрами и аналитикой. В статистике фигурируют две гипотезы. Нулевая гипотеза (H0), гласящая что закономерностей, взаимосвязей, различий в генеральной совокупности не существует – все что мы обнаружили всего лишь нелепая случайность в нашей выборке. И альтернативная (H1), которая гласит, что обнаруженные в выборке различия нельзя объяснить случайностью: они вероятнее всего имеют место и «материальны» в генеральной совокупности.
12 сентября 2021

Поделиться

1. Есть описательная и аналитическая статистика. Описательная статистика «ужимает» миллионы и миллиарды цифр к какому-то компактному числу, типичному для всего миллиона цифр. Аналитика позволяет находить скрытые закономерности, которые дают нам больше понимания о реальности и как она работает, а также строить прогнозы. 2. Выборка и генеральная совокупность. Генеральная совокупность – вся целиком популяция исследуемых объектов. Выборка – выбранные из этой популяции объекты (часть генеральной совокупности). Но выборка должна быть репрезентативной – т.е., отражать генеральную совокупность. 3. Переменные – это признаки / характеристики изучаемых
12 сентября 2021

Поделиться

Но тем не менее, в статистике перед исследованием важно понимать соответствует ли распределение наших данных по каждой переменной нормальному распределению.
12 сентября 2021

Поделиться

Колоколообразную кривую знают и наслышаны все (она же колокол Гаусса, гауссовское распределение – рис. 16).
12 сентября 2021

Поделиться

В книге ранее уже освещалось понятие нулевой (H – различий или взаимосвязей в генеральной совокупности не существует
18 апреля 2021

Поделиться

дихотомии – переменные с двумя значениями
23 февраля 2021

Поделиться

Мир изменился. Ускорился. Стал цифровым. Мы научились собирать в кучу неимоверные объемы данных. Эти данные стали живыми и идти целым постоянно изменяющимся потоком.
9 января 2021

Поделиться

значение по конкретной переменной, которое встречается / повторяется в массиве чаще всего. Это самое «модное» число по какой-то переменной ( ).
15 ноября 2020

Поделиться

1
...
...
8