据品玩 9 月 25 日报道,Arxiv 页面显示,约翰霍普金斯大学的研究者近日联手微软,推出了一款全新的大语言模型 ALMA,专注于翻译工作。ALMA 的全名是 Advanced Language Model-based trAnslator,基于 LLaMA-2 研发。该模型引入了一种新的微调方法,通过在单语数据上的初始微调,然后在一小部分高质量平行数据上的后续微调,消除了传统翻译模型通常依赖的大量平行数据的需求。实验结果显示,ALMA 在翻译工作中的表现优于传统模型。
原文链接
据品玩 9 月 25 日报道,Arxiv 页面显示,约翰霍普金斯大学的研究者近日联手微软,推出了一款全新的大语言模型 ALMA,专注于翻译工作。ALMA 的全名是 Advanced Language Model-based trAnslator,基于 LLaMA-2 研发。该模型引入了一种新的微调方法,通过在单语数据上的初始微调,然后在一小部分高质量平行数据上的后续微调,消除了传统翻译模型通常依赖的大量平行数据的需求。实验结果显示,ALMA 在翻译工作中的表现优于传统模型。
原文链接