Bendi新闻
>
LLM的“母语”是什么?
LLM的“母语”是什么?
6月前
网友:我早就发现了
有网友表示:恕我直言,不仅仅是羊驼系列,基本上所有LLM都是这样。
模型表达空间的探索
实验专注于Llama-2系列语言模型。Llama-2系列模型在多语言语料库上进行训练,语料库主要由英语主导(占89.70%)。
实验
实验的目标是探索Llama-2的内部状态,是否与特定的自然语言相对应,这需要从token分布映射到语言。
为了规避许多token在语言方面上模棱两可的问题,研究人员构造了特殊的提示,限制token输出的唯一性,并且可以明确地归因于某一种语言。
翻译任务
将前面的非英语(例如法语)单词翻译成中文,示例如下,向模型展示四个单词,并带有正确的翻译,后跟第五个没有翻译的单词,让模型预测下一个token:
8192D太空漫游
自回归Transformer是以增量方式求解的,每一层通过添加残差来修改前一层产生的潜在向量,这一过程在几何上可以描述为通过d维欧几里得空间的路径。
微信扫码关注该文公众号作者
来源:硅星人Pro
相关新闻
LLM的「母语」是什么?CES 2024:AI 硬件「狂欢」背后,真正的「希望」是什么?[干货] “皮蛋”的英语是什么?在加州买泡面等快餐,常见的“P65”警告是什么?“相爱的意义是什么?”什么是“看不见的大象”?如今世道,需要修炼“耐心资本”睥睨造车新势力,丰田的“杀手锏”是什么?美国建国时期的“国家”理念是什么?引爆A股的“低空经济”是什么?过年前烫头是一场巨大的豪赌……第一批受害人已经出现了!“烫头”的英文是什么?《禁止生物武器公约》第四条规定的“必要措施”是什么?“腊八粥”的英文是什么?深度分析:让休闲游戏玩家上头的“连胜机制”是什么?开云集团高管详解:Gucci 恢复“健康”增长的关键是什么?今年爆火的“冰冰裤”是什么鬼?清凉显瘦又百搭,洋气死了!什么是真正的“北欧风”?我在瑞典冰雪森林找到答案…老实怕事不敢反抗,养成孩子“懦弱”性格的原因是什么?你要知道拥有哆啦A梦的“神奇口袋”,是一种什么体验?火出圈的“新质生产力”是什么?市场摇摆不定,「牛灾」背后的原因是什么?|智氪超新奇!最近旧金山海滩上出现的大量「透明薯片」是什么?你知道过好一生最重要的两个“决定”是什么吗?CES 2024:AI硬件“狂欢”背后,真正的希望是什么?电动车“三轮”革命,最大的机会是什么?