多年来,人工智能领域一直专注于创建更好的模型,以推动企业应用和研究中提高性能以及提升更广泛的人工智能能力。
不过,清理和精炼用于这些复杂模型的大量关键数据可能是推动未来人工智能进步更重要的环节。
这是Landing AI的工程技术主管、MLPerf基准测试的创始合伙人和数据主席Greg Diamos在9月14日的虚拟人工智能硬件峰会上发表的演讲中传达的信息。
Diamos的演讲“从以模型为中心转向以数据为中心的AI”,重点讨论了这种方法的改变将会对如何构建AI系统带来积极的新影响。
“过去,我们专注于构建更大、更快的人工智能模型,可以在更多数据上进行训练。与此同时,还需要更大、更快的系统来帮助我们清理和改善数据。这就是从以模型为中心的方法向以数据为中心的系统的过渡的必要性,这是可以加速和提高人工智能建模的准确性的地方。”
从目前看,数据是瓶颈。通过先进的数据清理、数据增强、数据搜索和数据标记,消除或缓解这一瓶颈,才能提高人工智能解决方案的准确性和效率。但这需要对目前的方法进行重大改变,尤其是这需要人工智能从业者将注意力重心从模型和算法开发转移到生产和使用更好的数据作为首要任务上。
Diamos说:“我们在Landing AI上看到,对数据的关注使多个案例准确性得到了更大的提高。模型和算法已经足够先进,可以在生产中可靠地部署,现在大多数工作都花在创建和改进数据上。”
LandingAI是专门从事以数据为中心的计算机视觉MLOps研究的公司,通过提供软件工具和转换程序,使客户能够利用AI的商业价值。
“这并不意味着在模型和算法方面没有挑战,但数据往往是一个更大的问题,”他补充说。
那么,如何才能让更干净、更好的数据成为比目前关注模型本身更重要的答案呢?
Diamos说:“这是因为在更干净的数据上训练的模型需要更少的数据来达到同样的精度。干净的数据可以让资源较少的小公司建立精确的机器学习系统,而不需要高性能的训练系统和庞大的互联网规模数据抓取,从而使竞争环境更加公平。这也使得高性能训练系统更加高效。”
关于改变人工智能建模技术重点的见解是针对致力于人工智能框架、软件堆栈、编译器和加速器的系统构建者。他说:“以数据为中心的人工智能运动现在正在获得重视。”
Diamos说:“随着人工智能从业者将注意力从模型和算法开发转移到他们用来训练模型的数据质量上,这将为系统构建者创造支持数据创建和迭代的新需求。”
邮箱:15236061639@163.com
QQ:60298351
微信:a18137798589
2025 年 4 月 1 日,亚马逊正式发布通用型 AI 智能体 Nova Act,凭借 “操控浏览
1 序言制造业是国民经济的主体,是立国之本、兴国之器、强国之基,推进制造业做大做强是我国实现工业转型
智能制造典型场景是智能工厂的基本组成单元,为指导企业掌握工信部《智能工厂梯度培育行动》涉及的40个智