Практикум по анализу данных на языках Python и R, Баюк О.А., Исаева М.Р., Самсонкин М.О., 2023.
Данное учебное пособие предназначено для студентов очного отделения, изучающих дисциплину «Анализ данных». Пособие написано в соответствии с программой дисциплины «Анализ данных». Оно предназначено для подготовки бакалавров по направлениям «Экономика» и «Бизнес-информатика» Финуниверситета. В пособии отражены темы: выборочный метод, точечные и интервальные оценки, проверка статистических гипотез, корреляционный анализ, дисперсионный анализ и анализ временных рядов. Пособие может быть использовано как для проведения семинарских занятий, так и для организации самостоятельной работы студентов.

Удаление выбросов логдоходностей акций.
Приступим к исследованию и удалению выбросов. Как известно, выбросы являются аномальными значениями, резко отличающимися от других наблюдаемых. Именно поэтому необходимо провести очистку данных от выбросов. Для начала выведем на экран основные статистические данные, такие как процентили, среднее значение, стандартное отклонение и прочие. С этим нам поможет справится атрибут describe().
С помощью описательной статистики мы можем изучить разрыв между средним и медианным значением (эта информация дает первичное представление и разбросе данных), а также проанализировать, каких значений достигает каждый показатель в точках минимума и максимума.
Кроме того, поближе познакомиться с распределением данных помогут гистограммы — специальные частотные графики, которые демонстрируют, сколько раз в выборке попадается то или иное значение. Как и в случае с диаграммой рассеивания, только лишь графика может быть недостаточно, нужно также рассчитать асимметрию данных и их эксцесс.
Оглавление.
Введение.
Глава 1. Выполнение расчетно-аналитической работы с помощью языка PYTHON.
1.1. Загрузка программы.
1.2. Загрузка исходных данных.
1.3. Оптимизация данных и вычисление дополнительных признаков для каждой компании.
1.4. Исследование изменения цен и проведение корреляционного анализа.
1.5. Исследование логарифмических доходностей акций.
1.6. Удаление выбросов логдоходностей акций.
1.7. Проверка гипотез о нормальности логдоходностей для каждой компании.
1.7.1. Проверка гипотезы по критерию Пирсона.
1.7.2. Проверка гипотезы по критерию Шапиро-Уилка.
1.7.3. Проверка гипотезы по критерию Колмогорова-Смирнова.
1.8. Интервальные оценки параметров логарифмических доходностей. Определение доверительного интервала.
1.9. Тест Левена для проверки гипотезы о равенстве дисперсий тикеров.
1.10. Проверка гипотезы о равенстве логдоходностей компаний с помощью Т-критерия Стьюдента.
1.11. Влияние пандемии на цены акций. Проверка гипотезы об изменении средней после пандемии с помощью Т-критерия Стьюдента.
1.12. Однофакторный дисперсионный анализ по периодам.
1.13. Исследование тесноты связи между логдоходностями компаний.
Глава 2. Выполнение расчетно-аналитической работы с помощью языка R.
2.1. Загрузка программы.
2.2. Загрузка исходных данных.
2.5. Исследование логарифмических доходностей акций.
2.6. Удаление выбросов логдоходностей акций.
2.7. Проверка гипотез о нормальности логдоходностей для каждой компании.
2.7.1. Проверка гипотезы по критерию Пирсона.
2.7.2. Проверка гипотезы по критерию Шапиро-Уилка.
2.7.3. Проверка гипотезы по критерию Колмогорова-Смирнова.
2.8. Интервальные оценки параметров логарифмических доходностей. Определение доверительного интервала.
2.9. Тест Фишера для проверки гипотезы о равенстве дисперсий тикеров.
2.10. Проверка гипотезы о равенстве логдоходностей компаний с помощью Т-критерия Стьюдента.
2.11. Влияние пандемии на цены акций. Проверка гипотезы об изменении средней после пандемии с помощью Т-критерия Стьюдента.
2.12. Однофакторный дисперсионный анализ по периодам.
Заключение.
Список литературы.
Купить .
Теги: учебник по программированию :: программирование :: Баюк :: Исаева :: Самсонкин