На сегодняшний день практически все существующие синтезаторы речи имеют ярко выраженный машинный голос, который сложно с чем-то спутать. Происходит это из-за того, что для воспроизведения речи используются заранее записанные фразы, слова, звуки, интонации и так далее. Решить эту проблему смогла испанская компания Lyrebird, создав собственный синтезатор речи, который может воспроизводить голос любого человека.
Системе необходимо лишь несколько секунд прослушивания аудиозаписи голоса любого человека для его дальнейшего воспроизведения. Точное копирование голоса возможно за счет нейросетей на основе искусственного интеллекта. Технология работает по принципам, схожими с нейронными сетями человеческого мозга. Синтезатор способен точно распознавать особенности конкретного голоса и использовать их для синтеза искусственной речи. Стоит отметить, что на данном этапе технология не лишена недостатков: у системы еще присутствуют проблемы с распознаванием различных диалектов, акцентов и широкого спектра эмоций. Тем не менее уже сейчас можно сделать вывод, что разработчики двигаются в нужном направлении. В сети уже были продемонстрированы синтезированные речи Барака Обамы, Дональда Трампа и других политических деятелей. В связи с этим возникает логичный вопрос о безопасности, ведь подобная технология является угрозой для любой системы голосовой идентификации. Создатели проекта понимают все риски данного изобретения, но говорят, что это лишь временные беспокойства, аргументируя это тем, что то же самое люди думали, когда компания Adobe изобрела свой главный продукт — Photoshop, с помощью которого можно подделать различные снимки и изображения документов.