6月7日

飞书用户2985

2024年6月6日修改

字节推出Seed-TTS文本到语音模型，可生成媲美人类的语音

字节跳动的团队最新提出了名为 Seed-TTS 的技术，这是一系列大规模自回归文本转语音 (TTS) 模型，能够生成几乎与人类语音无法区分的语音。Seed-TTS 是语音生成的基础模型，在语音上下文学习方面表现出色，在说话人相似性和自然度方面的表现与客观和主观评估中的真实人类语音相匹配。​

“中国版Sora”视频大模型Vidu重大更新

生数科技与清华大学联合发布的中国首个长时长、高一致性、高动态性视频大模型Vidu，近期完成三个最新、重大技术迭代，实现国内视频模型更大一步技术跨越。​

1、目前Vidu可以一键生成32s视频；

2、支持音视频合成，即Vidu视频生成有声音了（Text-2-Audio）

3、支持4D生成，可以从单一视频生成时空一致的4D内容。

Stable Audio Open 开源 AI 模型发布

Stability AI 立足 Stable Diffusion 文生图模型，进一步向音频领域拓展，推出了 Stable Audio Open，可以基于用户输入的提示词，生成高质量音频样本。​

Stable Audio Open 最长可以创建 47 秒的音乐，非常适合鼓点、乐器旋律、环境音和拟声音效，该开源模型基于 transforms 扩散模型（DiT），在自动编码器的潜在空间中操作，提高生成音频的质量和多样性。​

Adobe更新隐私条款意味着有权将用户作品用于训练AI

Adobe最近更新了隐私条款，引发用户关注和担忧。用户担心设计作品失去隐私，可能被用于训练人工智能或内容审查，可能导致设计师与客户信任破裂，影响职业发展。引发个人隐私权和知识产权保护讨论。​

这一变动引发了广泛的讨论和反对声音。许多用户对于他们的设计工作的隐私感到担忧，尤其是在设计师与客户之间的合同中通常都包括保密条款。这一条款的出现可能会导致设计师与客户之间的信任破裂，甚至影响到设计师的职业发展。​

6月7日​