Meta 宣布推出 data2vec,“第一个高性能的自我监督算法,在多种模式中以相同的方式学习,包括语音、视觉和文本。”
自我监督学习允许机器通过观察周围环境然后破译图像、语音或文本的结构来了解周围环境,这与大多数机器从标记数据中学习的方式相反。这种方法使机器更有效地导航新的复杂任务,例如理解更多口语的文本。
Meta的新闻稿称:
图像、语音、文本或其他形式的自监督学习算法以非常不同的方式发挥作用,这限制了研究人员更广泛地应用它们。由于为理解图像而设计的算法不能直接应用于阅读文本,因此很难以相同的速度推动几种模式。借助 data2vec,我们为模型开发了一种统一的方法来预测输入数据的自身表示,无论是语音、文本还是音频。通过关注这些表示,单个算法可以处理完全不同类型的输入。
Data2vec 将帮助生产能够在不依赖标记数据的情况下了解周围环境的机器。它还将允许创建“更具适应性的人工智能”,该人工智能将能够执行“超出当今可能的任务”。
有关 data2vec 的更多信息,请访问此处的专用网页。
原创文章,作者:校长,如若转载,请注明出处:https://www.yundongfang.com/Yun120438.html