Bendi新闻
>
「汪汪」to Vector!密歇根博士生用AI解码狗的声音 | LREC 2024
「汪汪」to Vector!密歇根博士生用AI解码狗的声音 | LREC 2024
21天前
新智元报道
新智元报道
【新智元导读】近日,来自密歇根大学的研究人员,开发了一款人工智能工具,可以区分不同含义的狗叫声,并识别狗的年龄、性别和品种。
1. 完全用狗狗的声音数据从头训练模型; 2. 在人类语音预训练模型的基础上,使用狗狗声音数据进行微调。
「汪汪」to Vector
要理解动物的交流方式,需要解决三个主要问题:
(1)动物使用的语音和感知单位是什么?
(2)组合这些单位的规则是什么?
(3)这些单位是否有意义,如何将声音单位映射到具体含义?
数据准备
实验者反复按响家庭门铃并用力敲门;
实验者模拟对狗狗主人的攻击;
主人亲切地对狗说话;
主人使用狗通常玩的物品与狗玩耍;
主人执行散步前的正常例行程序;
主人用皮带将狗拴在树上,然后走出视线;
模型
分类任务
对陌生人非常具有攻击性的吠叫(LS2);
对陌生人正常吠叫(L-S1);
负面尖叫(在陌生人在场的情况下)(CH-N);
消极的咕噜声(在陌生人面前)(GR-N)。
微信扫码关注该文公众号作者
来源:新智元
相关新闻
可复用的“企业AI人才梯队搭建”方法论:《数智时代的AI人才粮仓模型解读白皮书(2024版)》发布!| 极客邦科技双数研究院"黑寡妇"斯嘉丽·约翰逊表示,OpenAI盗用了她的声音,制作了名为“Sky”的ChatGPT AI新声音!获刑35年!枪杀“情敌”的MIT华裔博士生当庭道歉并接受惩罚美国“最美星二代”出嫁,毕业密歇根大学的她,老爸比老公还帅……AI鲜测 | 又是字节跳动出品的爆款!人人都该用“扣子”建立一个自己的AI应用用胶水粘披萨、吃石头获取营养……谷歌的AI产品又“翻车”了,这次还很离谱!背后暴露的是AI行业的“致命”问题向用不起的AI宣战!宇视掀起“装备大模型化”变革“不会用AI工具的医生,真的会被淘汰!”AI保姆级攻略火爆学术圈……数十万字秒读,2分钟出PPT!李开复推荐的「万知」AI助手,小程序免费用AI时代的北大声音!北大126周年校庆500余校友共谋「人工智能+」美国博士小哥打败女友的AI男友!7页论文让LLM降智,训出「负分男友」成功挽回筷子界的“劳斯莱斯”,不发霉不生菌!用它吃饭,堪比住进豪华别墅紧急状态!猫狗双全、没生孩子的尹锡悦“催生”:再不生孩子韩国人要走向灭绝了75亿元!今年自动驾驶领域最大融资来了:90后剑桥博士带队,微软、英伟达为其站台,这家英国 AI 独角兽被首相视为“全村的希望”75亿元!今年自动驾驶领域最大融资来了:90后剑桥博士带队,微软、英伟达为其站台,这家英国AI独角兽被首相视为“全村的希望”AI生图、扩图、去水印……全免费!「Sora 平替」Viva 玩了把大的ICQ即将关闭,谷歌AI搜索翻车,魔兽回应改密短信,波音“星际客机”下月载人试飞,这就是今天的其他大新闻!“蚊子的克星”!用300只蚊子人肉亲测的驱蚊喷雾,一定要囤!国产GPTs要来了!字节的AI“扣子”上线!小白也能玩儿!“藏肚作弊器”!2024超火的「掐腰卫衣」,1s掐出蚂蚁腰!!读研新手指南:“被延毕”博士生的肺腑之言AI时代的“大脑健身房”!全球首款AI心灵疗愈平台来了!科技界的“AI月”即将开启!OpenAI、谷歌、微软等巨头将带来哪些颠覆性体验和期待?ICLR 2024|用巧妙的「传送」技巧,让神经网络的训练更加高效