


ByteDance пусна своя най-нов модел за генериране на глас, Seeduplex, насочен към подобрения в синтеза на реч и взаимодействието в реално време.
Моделът се фокусира върху предоставянето на по-естествен разговорен изход, с подобрения в контрола на тона, емоционалното изразяване и многоезичните възможности. Той е предназначен за приложения като виртуални асистенти, създаване на съдържание и автоматизация на обслужването на клиенти.
Seeduplex поддържа реакция с ниска латентност и може да генерира реч в множество стилове, което го прави подходящ за интерактивни системи с изкуствен интелект. ByteDance има за цел да интегрира модела в своята по-широка AI екосистема, включително платформи за съдържание и корпоративни услуги.

Изданието идва на фона на нарастващата конкуренция в гласовите технологии, генерирани от AI, където компаниите се фокусират върху реализма и скалируемостта. Играчите в индустрията също проучват интеграцията с мултимодални системи, комбинирайки глас, текст и видео генериране.
ByteDance не разкри конкретни планове за комерсиализация, но посочи, че моделът постепенно ще бъде разгърнат в своите платформи.
Източник: AIOrang
Source link
Like this:
Like Loading…
Нашия източник е Българо-Китайска Търговско-промишлена палaта