Data Science, инсайдерская информация для новичков, включая язык R, О'Нил К., Шатт Р., 2019.
Data Science (исследование данных) — одна из самых востребованных специализаций нашего времени. Изучение данных позволяет преобразить любую традиционную или инновационную бизнес-модель. Эта книга основана на вводном курсе по Data Science из Колумбийского университета, и начинающему специалисту-аналитику она совершенно необходима. Эта книга увлекательно и доступно рассказывает о:
• байесовском методе;
• статистических алгоритмах;
• финансовом моделировании;
• рекомендательных движках;
• визуализации данных;
• MapReduce.
1 Введение: что такое наука о данных.
В последние несколько лет вокруг «науки о данных» или «больших данных» было много шумихи. Первая, вполне обоснованная, реакция на все это — смесь скептицизма и смущения. Действительно, наши реакции (Кэти и Рэйчел) были именно такими. И мы потакали своим заблуждениям. Сначала каждая сама по себе. А позже вместе, собираясь по средам за завтраком. Однако нас не покидало ощущение, будто в этом действительно есть нечто, возможно, глубокое и мудрое, представляющее новую парадигму мышления относительно сферы данных. Вероятно, появилось ощущение, что изменение парадигмы сделает нас сильнее. И вместо того, чтобы игнорировать все это, мы решили разобраться более тщательно. Но прежде, чем двигаться дальше, разберемся, что именно вызывает сомнения и недопонимание. Вероятно, у вас они тоже есть. Затем мы расскажем, каким образом пришли к заключениям, в результате которых Рэйчел составила курс по Data Science в Колумбийском университете, Кэти опубликовала его в своем блоге, а вы сейчас читаете эту книгу.
Оглавление.
Предисловие Рэйчел Шатт.
Благодарности.
Глава 1. Введение: что такое наука о данных.
Глава 2. Статистический анализ, разведочный анализ данных и процесс их научного исследования.
Глава 3. Алгоритмы.
Глава 4. Фильтры спама, наивный классификатор Байеса и перебор данных.
Глава 5. Логистическая регрессия.
Глава 6. Метки времени и финансовое моделирование.
Глава 7. Извлечение смысла из данных.
Глава 8. Рекомендательные механизмы: создание ориентированных на пользователя масштабируемых информационных продуктов.
Глава 9. Визуализация данных и выявление мошенничества.
Глава 10. Социальные сети и журналистика данных.
Глава 11. Причинность.
Глава 12. Эпидемиология.
Глава 13. Уроки, извлеченные из соревнований поданным: утечка данных и оценка моделей.
Глава 14. Проектирование данных: MapReduce, Pregel и Hadoop.
Глава 15. Мнения студентов.
Глава 16. Исследователи данных нового поколения, завышенная самооценка и этика.
Об авторах.
Об иллюстрации на обложке.
Купить .
Теги: О'Нил :: Шатт :: 2019 :: исследование :: данные :: data :: science
Смотрите также учебники, книги и учебные материалы:
- Linux на практике, Бреснахэн К., Блум Р., 2017
- Внутреннее устройство Linux, Уорд Б., 2016
- Kafka Streams в действии, приложения и микросервисы для работы в реальном времени, Беджек Б., 2019
- Алгоритмы интеллектуального Интернета, передовые методики сбора, анализа и обработки данных, Марманис X., Бабенко Д., 2011
- 25 советов выжившего на ИТ-проектах, Абазьева М., 2019
- Теория принятия решений, Задачи и методы исследования операций и принятия решений, Гольдштейн А.Л.
- AutoCAD 2009, Учебный курс, Соколова Т.Ю., 2009
- Инженерные расчеты в Mathcad, Учебный курс, Макаров Е.Г., 2005