Учебное пособие представляет собой практический курс, состоящий из 13 занятий (12 из которых интерактивные — для среды JupyterLab). Курс содержит введение в основы языка Python с упором на аналитику данных (работа с наборами данных, статистика, язык SQL, метрики и машинное обучение). Приведен порядок выполнения занятий и архив необходимых файлов, а также дан список заданий для закрепления обучающимися изучаемого материала. Учебное пособие освещает вопросы применения ряда сквозных технологий, приведенных в Национальной программе «Цифровая экономика Российской Федерации», таких как «Технологии хранения и анализа больших данных», «Искусственный интеллект», «Машинное обучение».
Подготовлено в соответствии с Федеральным государственным образовательным стандартом высшего образования.
Предназначено для студентов технических направлений подготовки и специальностей, учебными планами которых предусмотрено изучение дисциплин «Искусственные нейронные сети», «Нейронные сети и нечеткая логика в задачах управления», «Интеллектуальные системы» и «Аналитика технологических данных», а также при реализации дополнительных образовательных программ с тематикой «Аналитика данных».

Взаимодействие с Python в Jupyter-notebook.
Jupyter-notebook — это среда разработки, где сразу можно видеть результат выполнения кода и его отдельных фрагментов. Отличие от традиционной среды разработки (например, PyCharm) в том, что код можно разбить на куски, выполнять их в произвольном порядке и оставлять отформатированные комментарии к коду.
В такой среде разработки можно, например, создать блок, содержащий «отрывок» исходного кода, и сразу проверить результат его работы (который выводится для каждого такого «куска» кода отдельно, сразу после него) без запуска программы целиком; можно очень просто и быстро изменять порядки блоков с кодом или добавлять форматированные блоки с текстовым описанием. Например, на рис. 3 приведены блок типа Markdown (это языктекстовой разметки) и один блок типа Code, содержащий Python-код, который будет выполняться.
ОГЛАВЛЕНИЕ.
ВВЕДЕНИЕ.
МОДУЛЬ 1. PYTHON ДЛЯ АНАЛИЗА ДАННЫХ. ОСНОВЫ И ИНСТРУМЕНТЫ.
ЗАНЯТИЕ 1. Базовые инструменты аналитики. Настройка окружения.
1.1. Работа с Jupyter и Anaconda Navigator.
1.2. Взаимодействие с Python в Jupyter-notebook.
1.3. Интерактивный режим интерпретатора Python.
1.4. Менеджеры пакетов pip и conda.
1.5. Работа в PyCharm.
1.6. Среда для выполнения занятий по данному курсу (JupyterLab).
Контрольные задания и вопросы.
ЗАНЯТИЕ 2. Синтаксис, типы, функции, цикл while и условные выражения.
2.1. Математика в Python.
2.2. Порядок операций.
2.3. Комментарии.
2.4. Переменные.
2.5. Строки.
2.6. Цикл while.
2.7. Логические (или булевы) выражения.
2.8. Условные инструкции.
2.9. else и elif-операторы «когда это не так».
2.10. Отступы.
2.11. Функции.
2.12. Параметры и возвращаемые значения — взаимодействие с функциями.
2.13. Лямбда-функции.
2.14. Программа «Калькулятор».
2.15. Пользовательские функции (свои собственные функции).
2.16. Передача параметров функциям.
2.17. Модернизация программы «Калькулятор».
2.18. Хитрые способы передачи параметров.
Контрольные задания и вопросы.
ЗАНЯТИЕ 3. Наборы данных, цикл for, объектно-ориентированное программирование, работа с файлами и исключения.
3.1. Кортежи, списки, словари и массивы.
3.2. Цикл for.
3.3. Функция range().
3.4. Пример. Создание функции «меню».
3.5. Наша первая «игра».
3.6. Улучшение игры.
3.7. Классы.
3.8. Файловый ввод-вывод.
3.9. Обработка исключений (ошибок).
Контрольные задания и вопросы.
ЗАНЯТИЕ 4. Стандартные библиотеки.
4.1. Интерфейс операционной системы.
4.2. Поиск файлов на основе подстановочных данных (Wildcards).
4.3. Аргументы командной строки.
4.4. Соответствие строковому шаблону (регулярные выражения).
4.5. Математика, случайные числа и статистика.
4.6. Доступ в Интернет.
4.7. Даты и время.
4.8. Сжатие данных.
4.9. Измерение производительности.
4.10. Контроль качества кода.
4.11. Многопоточность и многопроцессорность.
Контрольные задания и вопросы.
МОДУЛЬ 2. РАБОТА С МАССИВАМИ ДАННЫХ.
ЗАНЯТИЕ 5. Библиотека NumPy.
5.1. Создание массивов.
5.2. Структурированные массивы.
5.3. Печать массивов.
5.4. Базовые операции.
5.5. Индексы, срезы, итерации.
5.6. Манипуляции с формой.
5.7. Объединение массивов.
5.8. Разбиение массива.
5.9. Копии и представления.
5.10. Маскированные массивы.
Контрольные задания и вопросы.
ЗАНЯТИЕ 6. Библиотека pandas.
6.1. Введение.
6.2. Структура данных Series.
6.3. Структура данных DataFrame.
6.4. Доступ к данным в структурах pandas.
6.5. Pandas и отсутствующие данные.
Контрольные задания и вопросы.
МОДУЛЬ 3. СТАТИСТИКА В PYTHON.
ЗАНЯТИЕ 7. Статистика в NumPy и в Statistics. Введение в Scipy.Stats.
7.1. Статистические функции в NumPy.
7.2. Некоторые статистические функции из Statistics.
7.3. Статистика при помощи модуля Scipy.Stats.
Контрольные задания и вопросы.
ЗАНЯТИЕ 8. Scipy. Примеры статистики, z-статистика и p-value.
8.1. Генерация случайных чисел.
8.2. Проблема отсутствия явно указанных параметров формы.
8.3. Анализ принадлежности ряда значений к конкретному закону распределения.
8.4. Куртозис и сдвиг (моменты и прочие понятия статистики).
8.5. Диаграмма размаха.
8.6. Примеры статистики из жизни.
Контрольные задания и вопросы.
МОДУЛЬ 4. ВВЕДЕНИЕ В SQL И МЕТРИКИ ДАННЫХ.
ЗАНЯТИЕ 9. SQL — язык для работы с базами данных (на примере SQLite).
9.1. Введение.
9.2. SQLite.
9.3. Выполнение запросов к базе данных.
9.4. Курсор в базе данных.
9.5. Оператор CREATE TABLE и таблицы в базе данных.
9.6. Оператор INSERT.
9.7. Создание именованного датафрейма из таблицы SQLite.
9.8. Операторы и функции SQL (для аналитики данных и вычисления метрик).
9.9. Типы данных (полей) в SQLite.
Контрольные задания и вопросы.
ЗАНЯТИЕ 10. Метрики (на примере ключевых продуктовых метрик).
10.1. Введение.
10.2. Подключение библиотек, загрузка и предобработка данных.
10.3. Метрика «ежемесячный доход».
10.4. Метрика «ежемесячный темп роста дохода».
10.5. Метрика «ежемесячный доход по странам».
10.6. Метрика «ежемесячная активность клиентов».
10.7. Метрика «ежемесячное количество заказов».
10.8. Метрика «ежемесячный средний доход за заказ».
10.9. Метрика «коэффициент новых клиентов».
10.10. Метрика «ежемесячная ставка удержания».
10.11. Метрика «скорость оттока клиентов».
10.12. Метрика «коэффициент удержания когорт».
Контрольные задания и вопросы.
МОДУЛЬ 5. МАШИННОЕ ОБУЧЕНИЕ (АНАЛИТИКА БОЛЬШИХ ДАННЫХ).
ЗАНЯТИЕ 11. TensorFlow Keras. Решение математических задач.
11.1. Введение.
11.2. Пример 1. Y = 3X + 1 (основы работы с TensorFlow Keras: нейронные сети, их функции активации, веса, смещения и типы ошибок).
11.3. Пример 2. Y = 2X.
11.4. Пример 3. Y = sin(X).
11.5. Пример 4. Y = (K + X) × X.
11.6. Настройки оптимизатора.
Контрольные задания и вопросы.
ЗАНЯТИЕ 12. TensorFlow Keras. Классификация изображений.
12.1. Общая часть.
12.2. Подготовка и классификация пользовательской картинки.
12.3. Выводы.
Контрольные задания и вопросы.
ЗАНЯТИЕ 13. Библиотека Scikit-learn. Обучение с учителем и без учителя.
13.1. Введение.
13.2. Обучение с учителем.
13.3. Обучение без учителя.
13.4. Функциональность Scikit-learn.
13.5. Кластерный анализ (общий обзор, К-средних, линейная регрессия и деревья решений).
Контрольные задания и вопросы.
СПИСОК ИСТОЧНИКОВ И ЛИТЕРАТУРЫ.
Бесплатно скачать электронную книгу в удобном формате, смотреть и читать:
Скачать книгу Python для аналитики данных, Практический курс, Меликов П.И., 2023 - fileskachat.com, быстрое и бесплатное скачивание.
Скачать pdf
Ниже можно купить эту книгу, если она есть в продаже, и похожие книги по лучшей цене со скидкой с доставкой по всей России.Купить книги
Скачать - pdf - Яндекс.Диск.
Дата публикации:
Теги: учебник по программированию :: программирование :: Меликов :: аналитика данных
Смотрите также учебники, книги и учебные материалы:
Следующие учебники и книги:
Предыдущие статьи:












