Цитаты из книги «Аналитика и Data Science. Для не-аналитиков и даже 100% гуманитариев…» Никиты Сергеева📚 — лучшие афоризмы, высказывания и крылатые фразы — MyBook. Страница 5
image
Но удобнее всего вывести гистограмму с помощью надстройки «Анализ данных» – выбрать в ней гистограмму («Данные / Анализ данных / Гистограмма»). Понадобится только указать: 1. интервал значений (значения переменной в массиве) 2. интервал «карманов». Это те же отрезки-интервалы, что используются для = ЧАСТОТА или =ЕСЛИ: но их программа может подобрать
15 ноября 2020

Поделиться

А можно сразу же это сделать с помощью формулы =ЧАСТОТА, предварительно задав отрезки-интервалы. И далее получить гистограмму через меню «Вставка / Гистограмма».
15 ноября 2020

Поделиться

По сути, это известные большинству вещи (как минимум о них слышали): среднее значение, медиана, мода, минимум и максимум, квартили и процентили, частотное распределение, стандартное отклонение… – для дисперсии, стандартного отклонения, размахов между минимумом и максимумом или квартилями…
15 ноября 2020

Поделиться

Освоите эти нехитрые функции – считай весь Excel для бизнес-задач знаете. Захотите далее продвинуться – начинайте учить от разных функций, анализа типа «Что-Если» – и вплоть до макросов. Но это уже не даст настолько сравнительно огромного прироста к эффективности в части решения основной массы бизнес-задач, как в случае изучения «с нуля» вышеописанных функций.
15 ноября 2020

Поделиться

Есть еще всего массива – приведение всех переменных к % значениям или вычитанием среднего с последующим делением на стандартное отклонение – но в этих вычислениях Вас запутывать не буду.
15 ноября 2020

Поделиться

предмета, который Вы анализируете / исследуете. Обычно их либо выкидывают, либо заменяют средними значениями или модой. – преобразование данных. Это когда одни данные переводятся в другие. Это как перевести килограммы в граммы или вообще в категорийное понятие «большой / малый вес».
15 ноября 2020

Поделиться

типы данных и шкалы наших переменных. В Excel достаточно сделать все данные числовыми (кроме названий компаний, ФИО, случаев и т.д.). Когда Вы будете использовать другой продукт (SPSS, PSPP, OCA и т.д.), то там будут свои требования. Второе – проверяем корректность данных, путем использования фильтров или функционала сводной таблицы. Например, если у Вас переменная «Пол» принимает кроме значения 1 (мужчина) и 0 (женщина) еще какие-то числа – надо отобрать фильтром эти числа и понять откуда они «всплыли». Возможно, просто массив по конкретных строкам сместился в сторону, а возможно их надо удалить или запросить уточнение данных. – недостающие или пропущенные данные. Что с ними делать надо решать исходя из особенностей
15 ноября 2020

Поделиться

типы данных и шкалы наших переменных. В Excel достаточно сделать все данные числовыми (кроме названий компаний, ФИО, случаев и т.д.). Когда Вы будете использовать другой продукт (SPSS, PSPP, OCA и т.д.), то там будут свои требования.
15 ноября 2020

Поделиться

Также специализированные программы еще потребуют создания так называемого «паспорта» для переменных, в котором будет задано имя, шкала переменной и описание ее альтернатив / вариантов. Например, переменную «Пол» надо будет записать в паспорте «Пол», задать 2 альтернативы с кодами 0=М, 1=Ж. А приводимую в пример ранее частоту покупок шмоток надо будет закодиро
15 ноября 2020

Поделиться

Поэтому все значения переменных в массиве, по которым будут применяться методы анализа, надо оцифровать (записать цифрами).
15 ноября 2020

Поделиться

1
...
...
8