要开发AI 人工智能演算法,必不可少的就是大量的数据库,例如OpenAI 旗下的GPT-4,可能就使用了数以兆计的文本来训练。另一方面,作为资讯提供方,如维基百科、网路学术文章、社交新闻平台等也受到重视,像是Reddit 近期就拟定要向AI 开发商收费。不过这种不断喂养AI 资料的做法并不会一直持续下去,OpenAI 执行长Sam Altman 就表示,此类制造大型AI 模型的时代已经结束。
这并不代表未来AI 就不必接收新知,然而,Wired援引Altman 的说法,解释要扩大AI 资料库,必会受到物理性限制,因为数据的上限取决于开发商能够盖出多大的数据中心,以及建造速度是否跟得上AI 进展。
另外Altman 也说到,扩大模型规模所获得的成效已不如以往,但究竟OpenAI 未来会以什么方式来继续训练AI 仍不得而知。Wired 推测他们可能会运用一种名为强化学习的方法,搭配人类的回馈,藉由人类决定AI 答案是否合宜的方式来提升模型品质。
原创文章,作者:校长,如若转载,请注明出处:https://www.yundongfang.com/Yun226587.html