新闻资讯-歌剧话剧

完爆ChatGPT!谷歌这招太狠:连你的“阴阳怪气”都能神还原

发布时间:2025-12-15 12:33:00  浏览量:20
新智元报道 编辑:YHluck 【新智元导读】谷歌发布Gemini 2.5 Flash原生音频模型,不仅能保留语调进行实时语音翻译,更让AI在复杂指令和连续对话中像真人一样自然流畅。这一更新标志着AI从简单的「文本转语音」跨越到了真正的「拟人化交互」时代。 想象这样一个场景: 你戴着耳机走在印度孟买喧闹的街头,周围是嘈杂的叫卖声和完全听不懂的印地语。 此时,一位当地大叔急匆匆地用印地语向你询问路线,他的语速很快,语气焦急。 若是以前,你可能得手忙脚乱地掏出手机,打开翻译App,按下按钮,尴尬地把手机递到他嘴边,然后听着手机里传出毫无感情的「机翻」电子音。 跟它说人话就行,它自动给你生成工具,所有数据都有据可查,绝不瞎编。 目前macOS版已经开放排队了,虽然还是早期实验版,但这绝对是把「浏览」变成了「创造」。 赶紧冲,这波未来感拉满了! One More Thing 技术进步的速度往往超乎我们的想象。 昨天我们还在嘲笑Siri听不懂人话,今天Gemini已经开始帮我们进行跨语言的情感交流了。 别光看着,Gemini 2.5 Flash Native Audio现在已经在Vertex AI上全面推出,Google AI Studio里也能试用了。 赶紧去体验一下吧! 或许在听到AI用你的语气说出第一句外语时,你会真切地感受到——未来已来。 参考资料: https://deepmind.google/blog/ https://x.com/GoogleAI/status/1999560839679082507?s=20 https://blog.google/technology/google-labs/gentabs-gemini-3/
标签: 谷歌 gemini chatgpt flash 跨语言
sitemap