Российский книжный рынок активно тестирует инструменты, основанные на технологиях искусственного интеллекта (ИИ).
Участники российского книжного рынка внедряют инструменты на основе ИИ и больших данных в рабочие процессы. Крупнейшая в России издательская группа «Эксмо-АСТ» уже использует их для прогнозирования тиража допечаток, рассказал совладелец группы Олег Новиков.
Новым направлением применения ИИ и больших данных для группы, по словам Олега Новикова, также стал анализ потенциала рукописи.
Третьим направлением, по его словам, является поиск востребованных ниш и авторов на основе данных запросов на маркетплейсах. Успешным референсом, по его словам, является SEO-издательство Callisto, которое анализирует данные продаж книг и выпускает книги на их основе и чей оборот ещё в 2015 году составил 10 млн $.
Издатели также всё чаще экспериментируют с ИИ-моделями при создании дизайна обложек новых книг. Один из недавних примеров — книга Эми Липтрот «Момент», выпущенная в этом году издательством Ad Marginem. Дизайнер Анна Сухова рассказывала в телеграм-канале издательства, что сгенерировала изображения для обложки с помощью нейросети, основываясь на цитатах из книги, где героиня проводит наибольшую часть своего времени в интернете.
В «Альпине» рассказали, что применяли ИИ для создания обложки книги «Форма жизни № 4» Евгения Черешнева, которая посвящена ИИ.
Также алгоритмы начинают широко использоваться для озвучивания аудиоверсий книг. За рубежом ИИ-озвучка аудиокниг близка к тому, чтобы стать обычной практикой. В начале года такая опция появилась в Apple Books. В компании отметили, что инновация позволяет значительно сократить затраты на создание аудиокниг, сделать их доступными даже самым небольшим издательствам.
Российские сервисы также начинают активно применять такие технологии. Как писал «Коммерсантъ» 23 марта, книжный сервис «Строки» (принадлежит МТС) в 2023 году планирует озвучить более 10 тыс. произведений с помощью ИИ разработки подразделения MTS AI, на первом этапе в работе уже находятся 600 произведений.
ГК «ЛитРес» также развивает озвучивание аудиокниг с помощью ИИ с 2022 года: группа использует технологию распознавания и синтеза речи SpeechKit, на которой работает голосовой помощник «Алиса».
В сервисах ранее уточняли, что студийная запись живым голосом занимает до нескольких дней с учётом технической обработки и монтажа, тогда как на подготовку первоначальной версии аудиокниг с помощью ИИ уходит только около 30–60 минут. Также за счёт ИИ сокращаются расходы на озвучивание одной единицы контента: по оценкам собеседников — минимум в десять раз. Сейчас более 90 % книг на российском рынке не имеют аудиоверсии, отмечали в МТС, а их трансформация в аудиоформат, по оценке компании, традиционным способом «заняла бы годы».
Некоторые издатели в то же время говорят, что пока массовое производство аудиоверсий с помощью ИИ они запускать не планируют, так как записанные с помощью ИИ аудиокниги всё ещё уступают по качеству озвученным людьми.
Кстати, минувшей зимой Союз дикторов просил Госдуму установить регулирование синтеза человеческого голоса с помощью ИИ. Дикторы утверждали, что сталкивались со случаями кражи их голосов (юридически голос никак не защищён от копирования) и говорили, что в целом опасаются снижения доходов на фоне распространения таких технологий.
Книги с ИИ в соавторах уже выходят в России: в конце мая в издательстве Individuum вышел сборник рассказов «Пытаясь проснуться», половина которых написана писателем и художником Павлом Пепперштейном, а другая половина — нейросетью ruGPT-3. В аннотации сообщается, что нейросеть оттачивала своё писательское мастерство, анализируя русскую классику.