TangoFlux: Super Fast and Faithful Text to Audio Generation with Flow Matching and Clap-Ranked Preference OptimizationГенератор звуковых эффектов. Речь и музыку не вывозит, проверил.
Зато выдает 44 КГц, до 30 секунд. На А40 на это уходит всего 3 секунды
КодДемо#text2audio #text2sfx #foley