Обработка естественного языка в действии, Хобсон Л., Ханнес Х., Коул Х., 2020.
Последние достижения в области глубокого обучения позволяют создавать приложения, с исключительной точностью распознающие текст и речь. Что в результате? Появляются чат-боты, ведущие диалог не хуже реальных людей, программы, эффективно подбирающие резюме под заданную вакансию, развивается превосходный предиктивный поиск, автоматически генерируются аннотации документов. Благодаря новым приемам и инструментам, таким как Keras и Tensorflow, сегодня возможно как никогда просто реализовать качественную обработку естественного языка (NLP).
«Обработка естественного языка в действии» станет вашим руководством по созданию программ, способных распознавать и интерпретировать человеческий язык. В издании рассказано, как с помощью готовых пакетов на языке Python извлекать из текста смыслы и адекватно ими распоряжаться. В книге дается расширенная трактовка традиционных методов NLP. что позволит задействовать нейронные сети, современные алгоритмы глубокого обучения и генеративные приемы при решении реальных задач, таких как выявление дат и имен, составление текстов и ответов на неожиданные вопросы.
Естественный язык в сравнении с языком программирования.
Естественные языки отличаются от языков программирования. В первую очередь они не предназначены для перевода в конечный набор математических операций. Такие языки нужны для обмена информацией людьми друг с другом. Используя языки программирования, мы не рассказываем про свой день и не просим сходить в продуктовый магазин. Компьютерная программа на языке программирования четко инструктирует машину, что нужно делать, а в естественном английском и французском языках нет компиляторов или интерпретаторов.
Тем не менее данная глава демонстрирует способы обработки естественного языка. Этот процесс можно даже рассматривать как интерпретацию естественного языка, аналогичную работе интерпретатора языка Python. Когда разрабатываемая вами программа станет обрабатывать естественный язык, она сможет действовать в соответствии с его высказываниями и даже отвечать на них. Стоит отметить, что эти действия и ответы не являются четко определенными, что оставляет вам как разработчику конвейера NLP большую свободу действий.
Оглавление.
Предисловие.
Вступление.
Благодарности.
Об этой книге.
Часть I. Машины для обработки слов.
Глава 1. Знакомство с технологией NLP.
Глава 2. Составление словаря: токенизация слов.
Глава 3. Арифметика слов: векторы TF-IDF.
Глава 4. Поиск смысла слов по их частотностям: семантический анализ.
Часть II. Более глубокое обучение: нейронные сети.
Глава 5. Первые шаги в нейронных сетях: перцептроны и метод обратного распространения ошибки.
Глава 6. Умозаключения на основе векторов слов (Word2vec).
Глава 7. Сверточные нейронные сети.
Глава 8. Нейронные сети с обратной связью: рекуррентные нейронные сети.
Глава 9. Эффективное сохранение информации с помощью сетей с долгой краткосрочной памятью.
Глава 10. Модели sequence-to-sequence и механизм внимания.
Часть III. Поговорим серьезно. Реальные задачи NLP.
Глава 11. Выделение информации: выделение поименованных сущностей и формирование ответов на вопросы.
Глава 12. Начинаем общаться: диалоговые системы.
Глава 13. Масштабирование: оптимизация, распараллеливание и обработка по батчам.
Приложения.
Приложение A. Инструменты для работы с NLP.
Приложение Б. Эксперименты с Python и регулярные выражения.
Приложение В. Векторы и матрицы: базовые элементы линейной алгебры.
Приложение Г. Инструменты и методы машинного обучения.
Приложение Д. Настройка GPU на AWS.
Приложение Е. Хеширование с учетом локальности.
Источники информации.
Глоссарий.
Купить .
Теги: учебник по программированию :: программирование :: Хобсон :: Ханнес :: Коул
Смотрите также учебники, книги и учебные материалы:
- Проектирование и автоматизированное программирование современных технологий для станков с ЧПУ, Жовтобрюх В.А., Новиков Ф.В., 2019
- Командная строка Linux, Полное руководство, Шоттс У., 2020
- Чистый Agile, Основы гибкости, Мартин Р., 2020
- Golang для профи, Работа с сетью, многопоточность, структуры данных и машинное обучение с Go, Цукалос М., 2020
- Секреты Python Pro, Хиллард Д., 2021
- Android, Программирование для профессионалов, Филлипс Б., Стюарт К., Марсикано К., Гарднер Б., 2021
- C++, Практика многопоточного программирования, Уильямс Э., 2020
- Bash и кибербезопасность, Атака, защита и анализ из командной строки Linux, Тронкон П., Олбинг К., 2020