В книге приводятся практические приемы анализа данных. Рассказано, как исследовать и тестировать взаимосвязи между переменными в Excel и использовать его для статистики и анализа. Описан перенос данных из Excel в R, язык программирования с открытым исходным кодом, специально разработанный для выполнения статистического анализа. Отдельный раздел посвящен переносу данных из Excel в Python и выполнению полного анализа данных средствами этого языка. В результате читатель научится выполнять разведочный анализ данных (Exploratory Data Analysis, EDA) и проверку гипотез с использованием языков программирования Python и R.

Категориальные переменные.
Иногда эти переменные, называемые также качественными, описывают качество или характеристику наблюдения. Типичный вопрос, на который они отвечают: «Какого типа?» Категориальные переменные часто, хотя и не всегда, представляются нечисловыми значениями.
Пример категориальной переменной — страна происхождения. Как и любая другая переменная, она может принимать разные значения (США, Финляндия и т. д.), но выполнить качественное сравнение их между собой мы не можем (может ли кто-нибудь сказать, что такое «дважды Индонезия»?). Любое уникальное значение, которое принимает качественная переменная, называется уровнем этой переменной. Например, США, Финляндия или Индонезия могут быть тремя уровнями страны происхождения.
Поскольку качественные переменные описывают качество наблюдения, а не его количество, многие количественные операции над этими данными невозможны. Например, нельзя вычислить среднее значение страны происхождения, но можно рассчитать наиболее распространенную, или общую, частотность каждого уровня.
ОГЛАВЛЕНИЕ.
Предисловие.
Цель обучения.
Предварительные условия.
Технические требования.
Требования к предварительной подготовке.
Как я пришел к аналитике.
«Excel — плохо, программирование — хорошо».
Преимущества Excel при обучении аналитике.
Обзор книги.
Упражнения в конце глав.
Эта книга — не список готовых решений.
Без паники!.
Условные обозначения.
Использование примеров кода.
Контакты.
Благодарности.
ЧАСТЬ L ОСНОВЫ АНАЛИТИКИ В EXCEL.
Глава 1. Основы разведочного анализа данных.
Что такое разведочный анализ данных?.
Наблюдения.
Переменные.
Категориальные переменные.
Количественные переменные.
Закрепление материала: классификация переменных.
Резюме: типы переменных.
Исследование переменных в Excel.
Исследование категориальных переменных.
Исследование количественных переменных.
Заключение.
Упражнения.
Глава 2. Понятие вероятности.
Вероятность и случайность.
Вероятность и выборочное пространство.
Вероятность и эксперименты.
Безусловная и условная вероятность.
Распределение вероятностей.
Дискретное распределение вероятностей.
Непрерывное распределение вероятностей.
Заключение.
Упражнения.
Глава 3. Основы инференциальной статистики.
Базовые понятия статистического вывода.
Сбор данных для репрезентативной выборки.
Формулирование гипотез.
Разработка плана анализа.
Анализ данных.
Принятие решения.
Это ваш мир. данные только живут в нем.
Заключение.
Упражнения.
Глава 4. Корреляция и регрессия.
«Корреляция не подразумевает причинно-следственную связь».
Понятие корреляции.
От корреляции к регрессии.
Линейная регрессия в Excel.
Переосмысление результатов: ложные зависимости.
Заключение.
Переход к программированию.
Упражнения.
Глава 5. Стек анализа данных.
Статистика, аналитика и наука о данных.
Статистика.
Аналитика данных.
Бизнес-аналитика.
Наука о данных.
Машинное обучение.
Различия без взаимоисключения.
Значение стека анализа данных.
Электронные таблицы.
VBA.
Современный Excel.
Базы данных.
Платформы бизнес-аналитики (BI).
Языки программирования для анализа данных.
Заключение.
Что будет дальше.
Упражнения.
ЧАСТЬ II. ОТ EXCEL К R.
Глава 6. Первые шаги в R для пользователей Excel.
Загрузка R.
Начало работы с RStudio.
Пакеты в R.
Обновление R, RStudio и пакетов R.
Заключение.
Упражнения.
Глава 7. Структуры данных в R.
Векторы.
Индексирование и подмножества векторов.
От таблиц Excel к кадрам данных R.
Импорт данных в R.
Исследование кадра данных.
Индексирование и подмножества кадров данных.
Запись кадров данных.
Заключение.
Упражнения.
Глава 8. Обработка и визуализация данных в R.
Обработка данных с помощью пакета dplyr.
Постолбцовые операции.
Построчные операции.
Агрегирование и объединение данных.
dplyr и оператор pipe (%>%).
Преобразование данных с помощью tidyr.
Визуализация данных с помощью ggplot2.
Заключение.
Упражнения.
Глава 9. Кульминация: R для анализа данных.
Разведочный анализ данных.
Проверка гипотез.
t-тест для независимых выборок.
Линейная регрессия.
Разделение и проверка данных для обучения и тестирования.
Заключение.
Упражнения.
ЧАСТЬ III. ОТ EXCEL К PYTHON.
Глава 10. Первые шаги в Python для пользователей Excel.
Загрузка Python.
Начало работы с Jupyter.
Модули в Python.
Обновление Python, Anaconda и пакетов Python.
Заключение.
Упражнения.
Глава 11. Структуры данных в Python.
Массивы NumPy.
Индексирование и подмножества массивов NumPy.
Кадры данных Pandas.
Импорт данных в Python.
Исследование кадра данных.
Индексирование и подмножества кадров данных.
Запись кадров данных.
Заключение.
Упражнения.
Глава 12. Обработка и визуализация данных в Python.
Постолбцовые операции.
Построчные операции.
Агрегирование и объединение данных.
Преобразование данных.
Визуализация данных.
Заключение.
Упражнения.
Глава 13. Кульминация: Python для анализа данных.
Разведочный анализ данных.
Проверка гипотез.
t-тест для независимых выборок.
Линейная регрессия.
Разделение и проверка данных для обучения и тестирования.
Заключение.
Упражнения.
Глава 14. Заключение и дальнейшие шаги.
Дополнительные элементы стека анализа данных.
План исследований и бизнес-эксперименты.
Дополнительные статистические методы.
Наука о данных и машинное обучение.
Контроль версий.
Этика.
Двигайтесь вперед и выбирайте то, что нравится.
Напутствие.
Предметный указатель.
Об авторе.
Об изображении на обложке.
Бесплатно скачать электронную книгу в удобном формате, смотреть и читать:
Скачать книгу Погружение в аналитику данных, Маунт Дж., 2023 - fileskachat.com, быстрое и бесплатное скачивание.
Скачать pdf
Ниже можно купить эту книгу, если она есть в продаже, и похожие книги по лучшей цене со скидкой с доставкой по всей России.Купить книги
Скачать - pdf - Яндекс.Диск.
Дата публикации:
Теги: учебник по информатике :: информатика :: компьютеры :: Маунт
Смотрите также учебники, книги и учебные материалы:
Предыдущие статьи: