Python, Pandas на практике, 200 упражнений по анализу данных с решениями и пояснениями, Реувен Л., 2025.
Сегодня трудно представить аналитика данных, не пользующегося библиотекой Pandas, но в тонкостях работы с ней немудрено запутаться. В этой книге собраны упражнения, основанные на многолетней преподавательской практике автора. Прочитав её, вы будете чувствовать себя уверенно при встрече с недостатками реальных данных в виде пропущенных значений, смешанных форматов и отсутствия чёткой структуры.
Книга предназначена начинающим аналитикам данных, изучающим Pandas, но будет полезна и опытным специалистам, стремящимся отточить свои навыки.

Типы данных dtype.
В языке Python мы все время используем встроенные типы данных,такие как int, float, str, list, tuple и dict. В Pandas мы применяем их в работе не так часто. Вместо них мы используем типы из библиотеки NumPy, которые представляют собой тонкий совместимый с Python слой, лежащий поверх значений, определенных в С.
У каждого объекта Series есть атрибут dtype, и вы всегда можете обратиться к нему, чтобы узнать тип содержимого. Каждое значение в объекте Series отвечает этому типу - в отличие от кортежей и списков в Python, в одном Series не могут содержаться значения разных типов. В то же время pandas позволяет определить dtype как object. В этом случае мы обычно можем предположить, что в объекте содержатся строки Python. Подробнее об этом мы поговорим в главе 9. Хранение нестроковых объектов - редкое явление, и его нужно всячески избегать, хотя иногда это может быть полезно. Также вы можете установить атрибуту dtype значение object, если собираетесь хранить в объекте Series значения разных типов.
Оглавление.
Предисловие.
Благодарности.
Об этой книге.
Об авторе.
О переводчике.
Об изображении на обложке.
Глава 1. Объект Series.
УПРАЖНЕНИЕ 1. Оценки за ежемесячные тесты.
УПРАЖНЕНИЕ 2. Масштабирование оценок.
УПРАЖНЕНИЕ 3. Считаем цифры разряда десятков.
УПРАЖНЕНИЕ 4. Описательная статистика.
УПРАЖНЕНИЕ 5. Температура по понедельникам.
УПРАЖНЕНИЕ 6. Пассажиропоток в такси.
УПРАЖНЕНИЕ 7. Длинные, средние и короткие поездки в такси.
Заключение.
Глава 2. Объект DataFrame.
УПРАЖНЕНИЕ 8. Чистый доход.
УПРАЖНЕНИЕ 9. Налоговое планирование.
УПРАЖНЕНИЕ 10. Добавление новых товаров.
УПРАЖНЕНИЕ 11. Лидеры продаж.
УПРАЖНЕНИЕ 12. Поиск выбросов.
УПРАЖНЕНИЕ 13. Интерполяция.
УПРАЖНЕНИЕ 14. Выборочное обновление.
Заключение.
Глава 3. Импорт и экспорт.
УПРАЖНЕНИЕ 15. Загадочные поездки на такси.
УПРАЖНЕНИЕ 16. Такси и пандемия.
УПРАЖНЕНИЕ 17. Установка типов данных для столбцов.
УПРАЖНЕНИЕ 18. Файл passwd в датафрейм.
УПРАЖНЕНИЕ 19. Курсы биткоина.
УПРАЖНЕНИЕ 20. Большие города.
Заключение.
Глава 4. Индексы.
УПРАЖНЕНИЕ 21. Парковочные талоны.
УПРАЖНЕНИЕ 22. Оценки за вступительные тесты.
УПРАЖНЕНИЕ 23. Олимпийские игры.
УПРАЖНЕНИЕ 24. Олимпийские сводные таблицы.
Заключение.
Глава 5. Очистка данных.
УПРАЖНЕНИЕ 25. Очистка данных о парковках.
УПРАЖНЕНИЕ 26. Уход знаменитостей.
УПРАЖНЕНИЕ 27. Титаник и интерполяция.
УПРАЖНЕНИЕ 28. Несогласованные данные.
Заключение.
Глава 6. Группировка, объединение и сортировка.
УПРАЖНЕНИЕ 29. Самые продолжительные поездки на такси.
УПРАЖНЕНИЕ 30. Сравним поездки на такси.
УПРАЖНЕНИЕ 31. Расходы туристов по странам.
Заключение.
Глава 7. Сложная группировка, объединение и сортировка.
УПРАЖНЕНИЕ 32. Температура в разных городах.
УПРАЖНЕНИЕ 33. Оценки за вступительные тесты, часть 2.
УПРАЖНЕНИЕ 34. Снежные и дождливые города.
УПРАЖНЕНИЕ 35. Вино и туризм….
Заключение.
Глава 8. Промежуточный проект.
Задача.
Заключение.
Глава 9. Строки.
УПРАЖНЕНИЕ 36. Анализируем Алису.
УПРАЖНЕНИЕ 37. Винные слова.
УПРАЖНЕНИЕ 38. Зарплата программистов.
Заключение.
Глава 10. Даты и время.
УПРАЖНЕНИЕ 39. Короткие, средние и длинные поездки на такси.
УПРАЖНЕНИЕ 40. Пишем и читаем даты.
УПРАЖНЕНИЕ 41. Цены на нефть.
УПРАЖНЕНИЕ 42. Чаевые за поездки на такси.
Заключение.
Глава 11. Визуализация.
УПРАЖНЕНИЕ 43. Города.
УПРАЖНЕНИЕ 44. Погода в ящиках с усами.
УПРАЖНЕНИЕ 45. Анализируем стоимость поездок на такси с помощью графиков.
УПРАЖНЕНИЕ 46. Машины, нефть и мороженое.
УПРАЖНЕНИЕ 47. Такси и визуализация в Seaborn.
Заключение.
Глава 12. Оптимизация.
УПРАЖНЕНИЕ 48. Категории.
УПРАЖНЕНИЕ 49. Быстрое чтение, быстрая запись.
УПРАЖНЕНИЕ 50. query и eval.
Заключение.
Глава 13. Итоговый проект.
Задача.
Столбцы и их описание.
Заключение.
Предметный указатель.
Купить .
Теги: учебник по программированию :: программирование :: Реувен :: Python












