GPT-4, Руководство по использованию API Open AI, Аймен Эль Амри, 2024.
В книге рассказывается о том, как использовать генеративные текстовые модели поколений GPT-3.5 и GPT-4 для создания приложений различного назначения, в числе которых интерактивный психотерапевт, интеллектуальный голосовой помощник, система рекомендации товаров, генератор заметок в соцсетях, система распознавания речи и многие другие. Вы научитесь использовать векторные базы данных, узнаете, как управлять уровнем креативности моделей GPT, применять современные методы генерирования высококачественного текста, и даже организуете диалог между двумя чат-ботами. Примеры и практические упражнения помогут закрепить пройденный материал.
Издание предназначено для тех, кто владеет основами языка программирования Python и собирается использовать GPT в реальных сценариях для решения прикладных задач.

Какую модель лучше использовать?
На этот вопрос нет однозначного ответа. Выбор зависит от вашей задачи и типа приложения, которое вы создаете. Как правило, вам следует выбирать самую последнюю доступную модель. Например, с точки зрения функциональности, если вы создаете чат-бот, вам следует использовать модель GPT-3.5-Turbo-Instruct. Если вы создаете приложение, генерирующее изображения из текста, вам следует использовать модель DALL-E 3. Если вашему приложению требуются дополнительные возможности, вам следует использовать модель GPT-4.
Второй фактор, который следует учитывать, - это цена. Некоторые модели дороже других. Например, GPT-3.5-Turbo - самая экономичная модель серии GPT-3.5.
Еще одним важным фактором является контекстное окно. У некоторых моделей контекстное окно больше, чем у других. Например, модель GPT-4-32k имеет контекстное окно из 32 768 токенов (около 50 страниц англоязычного текста), а модель GPT-4-0613 имеет контекстное окно из 8192 токенов (около 12 страниц англоязычного текста). Это означает, что модель GPT-4-32k может обрабатывать больше текста, чем модель GPT-4-0613.
ОГЛАВЛЕНИЕ.
Предисловие от издательства.
Предисловие.
Об авторе.
История OpenAI и ChatGPT.
Об этой книге.
Оставайтесь на связи.
Как работает GPT?.
Подготовка среды разработки.
Важные примечания.
Установка Python, pip и виртуальной среды для разработки.
Получение ключа API OpenAI.
Установка официальных средств интеграции Python.
Тестирование ключей API.
Доступные модели и выбор оптимального варианта.
Модели OpenAI и важные соглашения.
Какую модель лучше использовать?.
Серии моделей OpenAI.
Серия GPT-4.
Серия GPT-3.5.
Серия InstructGPT-3.
Базовая серия GPT-3.
Серия Codex.
Content Filter.
Серия DALL-E.
Серия TTS.
Модель Whisper.
Модель встраивания.
Модели и цены OpenAI.
Что дальше?.
Использование функции завершения.
Вводный пример.
Роли system, user и assistant.
Роль system.
Роль user.
Роль assistant.
Завершение чата и обучение на нескольких примерах.
Форматирование вывода.
Ограничение количества выходных токенов.
Управление остановкой завершения.
Температура и галлюцинации.
Параметр top_p.
Что выбрать – temperature или top_p? В чем разница?.
Потоковая передача ответа API.
Управление повторяемостью: presence_penalty и frequency_penalty.
Что штрафовать – частоту или наличие?.
Управление количеством результатов через API.
Заключение.
Продвинутые примеры и разработка промптов.
Что такое разработка промптов?.
Обучение на нескольких примерах: основной метод разработки промптов.
Избыточная генерация и выбор лучшего варианта.
Генерация знаний по запросу: создание песни в стиле рэп.
Что такое Apple – фрукт или компания?.
Динамическое управление количеством токенов.
Создание интерактивного помощника в окне командной строки.
Что дальше?.
Встраивание.
Что такое встраивание?.
Варианты применения: от поисковых систем до беспилотных автомобилей.
Tesla: применение встраиваний в беспилотных автомобилях.
Kalendar AI: применение встраиваний в управлении продажами.
Notion: расширенные возможности поиска.
DALL-E 2: преобразование текста в изображение.
Изучаем встраивание текста.
Встраивания для нескольких входов.
Пример применения: семантический поиск.
Что такое косинусное подобие.
Семантический поиск и встраивание текста OpenAI.
За кулисами: как работает встраивание.
Продвинутые примеры встраивания.
Рекомендация подходящего сорта кофе.
Разработка более «нечеткого» поиска.
Прогнозирование категории новостей: классификация с помощью встраивания.
Оценка точности классификатора.
Точность приложений классификатора в различных сценариях.
Тонкая настройка и передовые методы работы.
Обучение на ограниченных примерах.
Улучшенное обучение на ограниченных примерах.
Практическое применение тонкой настройки.
Полезные приемы тонкой настройки.
Выбор модели.
Проверка набора данных.
Максимальное количество токенов.
Размер набора данных.
Тестирование и улучшение обучения (гиперпараметры).
Количество эпох.
Коэффициент скорости обучения.
Размер пакета.
Ориентировочная оценка затрат.
Качество набора данных.
Экспериментируйте и учитесь.
Используйте проверочные наборы данных.
Тестирование модели.
Анализ результатов.
Продвинутый пример тонкой настройки: виртуальный консультант.
Набор данных, используемый в примере.
Подготовка данных.
Проблемы использования модели в реальных приложениях.
Контекст и память: как сделать искусственный интеллект более реалистичным.
В чем проблема?.
Отсутствие контекста = хаос случайности.
История = контекст.
Недостатки переноса контекста через историю.
Память «последним вошел – первым вышел» (LIFO).
Проблема с памятью типа LIFO.
Избирательный контекст.
Применение векторной базы данных.
Введение.
Что такое векторная база данных?.
Пример 1. Использование Weaviate для повышения контекстной зависимости модели.
Пример 2. Семантический поиск с помощью Weaviate и OpenAI.
Пример 3. Генеративный поиск с помощью Weaviate и OpenAI.
Распознавание и перевод речи с Whisper.
Что такое Whisper?.
С чего начать?.
Распознавание и перевод речи.
Использование Whisper SDK в коде Python.
Использование API OpenAI для преобразования аудиозаписи в текст.
API распознавания.
API перевода.
Улучшение качества распознавания речи с Whisper.
Очистка аудиозаписи.
Использование подсказки.
Постобработка полученного текста.
Преобразование текста в речь.
Диалог между двумя ИИ на основе OpenAI и Weaviate.
Генерация аудиофайлов.
Использование аватаров модели.
Что дальше?.
Послесловие.
Предметный указатель.
Купить .
Теги: учебник по программированию :: программирование :: Аймен Эль Амри