今天必须给你们唠唠这个震撼科技圈的大新闻!要是有人跟你说,现在能和海豚聊天了,你是不是觉得他在天方夜谭?但谷歌最近就干了件看似“离谱”却真实发生的事,推出了一款叫DolphinGemma的AI模型,直接打破了人类和海豚之间的交流壁垒!
这可不是什么噱头,DolphinGemma是基于30年的海豚研究数据训练出来的,这些数据就像一把把钥匙,打开了海豚语言世界的大门。而且这个模型超轻量级,才400M参数,普通的Pixel手机就能轻松运行,揣着手机就能和海豚“对话”,简直不要太方便!
它的厉害之处还不止于此,不仅能精准识别出海豚声音里复杂的模式,还能像我们熟悉的大语言模型预测下一个词一样,预测海豚接下来要说啥。这就意味着,以后我们能知道海豚“哼哼唧唧”到底在表达什么,是饿了、开心了,还是在呼唤同伴。
再给大家讲讲它背后的原理,DolphinGemma用了谷歌特有的SoundStream分词器,能把海豚的声音快速转化成计算机能懂的信号,然后通过特殊的模型架构处理这些信号,一来二去,就把海豚的“外星语”翻译明白了 。
为了训练这个模型,谷歌和Wild Dolphin Project(WDP)合作。WDP从1985年就开始研究巴哈马的野生大西洋斑点海豚,积累了几十年的水下视频和音频,还有每只海豚详细的身份、生活史和行为记录,这些珍贵的数据就是DolphinGemma的“智慧源泉” 。
而且,研究人员还开发了CHAT水下应用,这就像是人和海豚交流的桥梁。CHAT会把合成哨声和海豚喜欢的东西联系起来,等海豚学会用这些哨声要东西,交流就开始了。未来,随着对海豚声音理解的加深,更多声音会被加入系统,交流也会越来越顺畅 。
想象一下,以后去海边,拿出手机打开DolphinGemma,就能和海里的海豚来一场跨物种的交流,问它们海洋深处有什么秘密,听它们分享自己的生活,这画面简直不要太科幻!说不定以后,我们真能和各种动物无障碍交流,到时候,世界可就热闹啦!