深刻解析工业大数据:创新应用的挑战不断
工业是国民经济不可或缺的一环,也是一个强大竞争力背后的力量支撑。我国工业位居,却大而不强。企业创新能力不足,高端和高价值产品欠缺,在产业分工中处于中低端状态,中国工业企业急需转型和升级。
我们正处于大数据和数字化转型的时代,数据无处不在,运用数据驱动的思想和策略在实践中逐渐成为共识。制造企业在利用大数据技术后,其生产成本能够10%—15%,大数据对于工业企业的重要性不言而喻。不同层面的制造企业在发展过程中,应该采取相应的大数据策略,才能离“工业4.0”、“工业互联网”和“中国制造2025”更近一步。
数从何处来?工业大数据溯源
工业大数据从哪里来?来源于产品生周期的各个环节,包括市场、设计、制造、服务、再利用各个环节,每个环节都会有大数据。“全”生周期汇合起来的数据更大。当然,企业外、产业链外的“跨界”数据也是工业大数据“不可忽视”的重要来源。
工业大数据的主要来源有三类:
类是生产经营相关业务数据。主要来自传统企业信息化范围,被收集存储在企业信息系统内部,包括传统工业设计和制造类软件、企业资源计划(ERP)、产品生周期管理(PLM)、供应链管理(SCM)、客户关系管理(CRM)和环境管理系统(EMS)等。通过这些企业信息系统已累计大量的产品研发数据、生产性数据、经营性数据、客户信息数据、物流供应数据及环境数据。
第二类是设备物联数据。主要指工业生产设备和目标产品在物联网运行模式下,实时产生收集的涵盖*作和运行情况、工况状态、环境参数等体现设备和产品运行状态的数据。此类数据是工业大数据新的、增长快的来源。狭义的工业大数据即指该类数据,即工业设备和产品快速产生的并且存在时间序列差异的大量数据。
第三类是外部数据。指与工业企业生产活动和产品相关的企业外部互联网来源数据,例如,评价企业环境绩效的环境法规、预测产品市场的宏观社会经济数据等。
工业大数据与互联网大数据的差异
工业大数据具有一般大数据的特征(海量性、多样性等),此基础上具有价值性、实时性、准确性、闭环性四个典型的特征。工业大数据与互联网大数据的区别在于工业大数据有*强的目的性,而互联网大数据更多的是一种关联的挖掘,是更加发散的一种分析。除此之外,两者在数据的特征和面临的问题方面也有不同。有别于互联网大数据,工业大数据的分析技术核心要解决"3B"问题:
1、BelowSurface——隐匿性,即需要洞悉背后的意义
工业环境中的大数据与互联网大数据相比,重要的不同在于对数据特征的提取上面,工业大数据注重特征背后的物理意义以及特征之间关联性的机理逻辑,而互联网大数据则倾向于仅仅依赖统计学工具挖掘属性之间的相关性。
2、Broken——碎片化,即需要避免断续、注重时效性
相对于互联网大数据的量,工业大数据更注重数据的全,即面向应用要求具有尽可能的使用样本,以覆盖工业过程中的各类变化条件、保障从数据中能够提取以反映对象真实状态的信息性。因此,工业大数据一方面需要在后端的分析方法上克服数据碎片化带来的困难,利用特征提取等手段将这些数据转化为有用的信息,另一方面,更是需要从数据获取的前端设计中以价值需求为导向制定数据标准,进而在数据与信息流通的平台中构建统一的数据环境。
3、BadQuality——低质性,即需要提高数据质量、满足低容错性
数据碎片化缺陷来源的另一方面也显示出对于数据质量的担忧,即数据的数量并无法保障数据的质量,这就可能导致数据的低可用率,因为低质量的数据可能直接影响到分析过程而导致结果无法利用,但互联网大数据则不同,其可以只针对数据本身做挖掘、关联而不考虑数据本身的意义,即挖掘到什么结果就是什么结果,典型的就是经过超市购物习惯的数据挖掘后啤酒货架就可以摆放在尿不湿货架的对面,而不用考虑他们之间有什么机理性的逻辑关系;换句话说,相比于互联网大数据通常并不要求有多么精准的结果推送,工业大数据对预测和分析结果的容错率远远比互联网大数据低的多。互联网大数据在进行预测和决策时,仅仅考虑的是两个属性之间的关联是否具有统计显著性,其中的噪声和个体之间的差异在样本量足够大时都可以被忽略,这样给出的预测结果的准确性就会大打折扣。比如当我觉得有70%的显著性应该给某个用户A类电影,即使用户并非真正喜欢这类电影也不会造成太严重的后果。但是在工业环境中,如果仅仅通过统计的显著性给出分析结果,哪怕仅仅一次的失误都可能造成严重的后果。
工业大数据面临的挑战
是数据搜集,要对来自网络包括物联网和机构信息系统的数据附上时空标签,去伪存真,尽可能收集异源甚是异构的数据,还可与历史数据对照,多角度检验数据的性和可信性。
第二是数据存储,要达到低成本、低能耗、高可靠性目标,要用到冗余配置,分布和云计算技术,存储时对数据进行分类,并加入便于检索的标签。
第三是数据处理,利用上下文关联进行语义分析,现在关于上下文这种关联,也是一个上比较热门的一个领域。
第四是可视化呈现,目前计算机智能化有了很大的进步和发展,但是谈不到深层次数据挖掘,现有数据挖掘算法在行业中难以应用,就是我们谈到的智能之路进步很大,但还很遥远。
应用工业大数据的考虑因素
在我国大数据采集技术和处理技术不断优化的今天,相关的大数据处理技术结合了物联网的实时采集能力已经在我国更多领域之中展现了非凡的科技效果,特别是在我国工业领域之中的工业大数据处理技术为我国现代化工厂的建设带来了更好的技术保障,而工业企业想要实现转型更好的应用工业大数据则必须综合考虑如下因素:
1、注意大数据计划的完善程度
众所周知大数据处理技术结合了众多的技术类型和设计层面,因此企业想要利用强大的工业大数据来实现转型和变革,则必须要建立完善的分析基础和应用环境,消费者在选用工业大数据之前必须要考虑企业实施的基础环境是否适宜,并且经过的工业大数据机构进行全方位的分析提供可靠的发展基础才能够确保这种优质技术获得*的落实。
2、注意分析应用后的实际效果
在应用大数据之前企业必须要对这种数据应用之后可能应对的情况和实际效果进行综合分析,通过品牌的工业大数据来确认数据采集和处理能够满足企业的实际需求,在应用该种工业大数据之后能够为企业带来的实际经济效益和实际效果尤为重要,因此企业也可以通过工业大数据机构来进行全方位的测评来确保为技术使用奠定良好的基础。
简言之应用工业大数据之前必须要进行基础环境和实际效果等多方面的考虑,分析工业大数据应用所能够带来的好处和困境才能够确保工业大数据的利用得以*实现,也可以经过的工业大数据机构来进行更好的辅导确保该种技术的应用之下能够为企业的现代化管理带来更好的帮助。
工业大数据应用案例
发展大数据是个过程,终目的是为了利用大数据,对工业企业起到作用。因此,企业需要冷静思考,坚持以业务应用为驱动,才能化实现数据价值。企业所积累的数据量以越来越快的速度在增加,很多企业也就顺势将大数据技术引入企业的生产经营中。大数据在工业企业的应用主要体现在三方面:
一是基于数据的产品价值挖掘,通过对产品及相关数据进行二次挖掘,创造新价值
在汽车行业,科研人员设计出一种新型座椅,能够通过分析相关数据识别主人,以此确保汽车的。这种座椅装有360个不同类型的感应器,可以收集并分析驾驶者的体重、压力值,甚坐到座椅上的方式等多种信息,并将它们与车载系统中内置的车主信息进行匹配,以此判断驾驶者是否为车主,从而决定是否开动汽车。实验数据显示,这种车座的识别准确率高达98%。
二是服务型生产
服务型生产就是增加服务在生产(产品)的价值比重。主要体现在两个方向。一是前向延伸,就是在售前阶段,通过用户参与、个性化设计的方式,吸引、引导和锁定用户。比如红领西服的服装定制,通过精准的量体裁衣,在其他成衣服装规模关店的市场下,能保持每年150%的收入和利润增长,每件衣服的成本仅比成衣高10%。
同时后向延伸,通过销售的产品建立客户和厂家的互动,产生持续性价值。苹果手机的硬件配置是标准的,但每个苹果手机用户安装的软件是个性化的,这里面的功劳是APPStore。苹果通过销售苹果终端产品只是开始,通过APPStore建立用户和厂商的连接,满足用户个性化需求,提供差异性服务,年创造收入在百亿美金。
三是创新商业模式
商业模式创新主要体现在两个方面,一是基于工业大数据,工业企业对外能提供什么样的创新性商业服务;二是在工业大数据背景下,能接受什么样的新型的商业服务。优的情况是,通过提供创新性商业模式能获得更多的客户,发掘更多的蓝海市场,赢取更多的利润;同时通过接受创新性的工业服务,了生产成本、经营风险。
由大数据驱动的制造业转型升级,是未来制造业生产效率、改进产品质量、节约资源消耗、保障生产、优化销售服务的必经之路,通过与工业互联网、人工智能、移动互联网、云计算等技术的协同发展,工业大数据驱动的的工业互联网必将深度融入实体经济,成为数字经济时代的新引擎。
21 世纪初,当技术还并无“维护”二字时,发动机、电梯等设备故障维修解决的是后果,而维护则是“事前诸葛”。有了预测,就可预防,维护优化工作才可真正实现提质增效降本减存。“直到 2000 年,我发现有些事情不是那么正确了,因为很多数据没有被高效地利用。”李杰教授在采访中说道。
为此,先后在美国自然科学基金会(NSF)、美国联合技术公司(UTRC)担任研发要职的李杰教授在 2000 年做出了一个重要决定——去大学任教并启动工业大数据的研发。在当时,这还是一个从未被挖掘过的领域。
那么,工业人工智能如何产业竞争力? 人工智能会造成大量失业吗?工业大数据和我们日常常说的互联网大数据究竟有什么关系?带着这些问题,小编此次采访到了身处工业自动化与机器人领域近 40 余年的科学家——李杰教授,这位为“工业大数据”名的科学家将向你讲述关于人工智能、工业大数据领域的那些事。
挖掘工业大数据的价值痛点
20 世纪 80 年代初,当美国汽车产业开始逐渐意识到与日本产业之间的竞争时,自动化、机器人视觉等技术相继获得重视,美国品质就此开始。在此期间,李杰教授先后在美国自然科学基金会(NSF)、美国联合技术公司(UTRC)担任研发要职,主持研发了普惠发动机、奥迪斯电梯等新一代产品和项目,并资助了包括增材制造(3D 打印)与纳米制造等多个项目。
众所周知,大数据的来源之广、历史背景之深共同组成了“大”的特性。但相比于互联网大数据,工业大数据来源于供应链和制造流程等众多环节,其特性更聚焦在问题点,而不是需要点。
“互联网大数据是从数据中找寻还未产生价值的东西,工业大数据则是从痛点中寻找怎么避免让你‘痛’的东西。”李杰教授解释道,工业大数据与互联网大数据的区别在于工业大数据有*强的目的性,而互联网大数据更多的是一种关联的挖掘,是更加发散的一种分析。
换句话说,相比于互联网大数据通常并不要求有多么精准的结果推送,工业大数据对预测和分析结果的容错率远远比互联网大数据低的多。互联网大数据在进行预测和决策时,仅仅考虑的是两个属性之间的关联是否具有统计显著性,其中的噪声和个体之间的差异在样本量足够大时都可以被忽略,这样给出的预测结果的准确性就会大打折扣。但是在工业环境中,如果仅仅通过统计的显著性给出分析结果,哪怕仅仅一次的失误都可能造成严重的后果。
李杰教授曾提出一个“煎蛋模型”,来阐述产品与服务价值之间的关系。蛋黄代表的是产品自身,其差异性程度并不*,例如一台电视机在挡住了 Logo 之后就很难被区分出来是哪家公司生产的。而蛋白所代表的价值却是差异化的重要体现,也是企业的品牌和可持续性价值的所在。而数据将成为挖掘这些价值的重要手段,其主要体现在:
1、利用数据挖掘在使用中获得新的知识和技术对现有产品进行改进;
2、利用数据去发现和定义用户未知的需求;
3、以数据为媒介向用户提供增值服务。
经验可以传承,但无法长久传承,但具有逻辑性的数据可以传承。煎蛋模型,就是从大问题导向到大价值导向。蛋黄是大问题,蛋白是大价值。数据是从大问题开始,但它不是目的,必须要做到大价值并发挥的作用。
就在不久前,由工业和信息化部指导,中国信息通信研究院、工业互联网产业联盟主办的第二届工业大数据创新竞赛决赛答辩正式落下帷幕 [注]。作为竞赛连续两年评审团的专家,李杰教授在倍感欣慰的同时也深有感触。高校参赛者的基础算法能力虽不容小觑,但是由于没有基础数据,项目构建过程中仍有很多问题。对此,李杰教授总结道,若要真正实现智能制造,我国仍需要一批工业大数据的年轻生力军,下到工厂,让算法的能力补偿有经验的专家,相互结合补充,共同助力工业智造高质量发展。
工业智造关键要素 ABCDE
传统人工智能概念始于上世纪 50 年代。半个多世纪以来,人类利用自然语言、神经辨识、神经网络或形象辨识等方法,让机器学习规律,进而提供广泛维度解决方案。相较于前者,工业人工智能隶属垂直领域,其属性聚焦于工业制造系统,涉及汽车、飞机、轮船等移动工具的性、节能性、耗油性,工业制造机器人的稳定性、精密性、风力发电的效益性、节能性等相关课题。
李杰教授在谈到工业人工智能的关键要素时说道,工业人工智能可以用“abcde”的特征进行分类,这些关键要素包含分析技术 (Analytics Technology),大数据技术 (Big Data Technology),云或网络技术 (Cloud or Cyber Technology),领域知识 (Domain Knowledge),证据 (Evidence)。
分析(A)是 AI 的核心,它只有在其他要素都存在时才能产生价值。大数据(B)与云(C)是提供数据来源和工业人工智能平台必不可少的两个要素。然而,领域知识(D)和证据(E)也是常常被忽略的两个重要因子。领域知识(D)是下列事项的关键要素:
1、了解问题并专注于利用工业人工智能去解决它;
2、理解系统以便于收集正确且高质量的数据;
3、了解参数的物理含义以及它们如何与系统或流程的物理特性相关联;
4、了解这些参数因机器而异。
证据(E)也是验证工业人工智能模型以及它们与累积学习能力相结合的重要要素。收集数据形态模式及与它相关联的证据,我们才能改进 AI 模型使之更加准确并且与时俱进。这也是当代人工智能、工业大数据领域从业者需要具备五个重要资质。
现如今,人工智能时代已悄然来临,机遇就在前方,发展就在脚下。但自 AI 热潮掀起以来,业界对于人工智能取代人类工作的讨论就没有停止过。对此,李杰教授表示人工智能并不是取代人,而是在做人类做的不好,或者人类不想做的事情。
早在上个世纪 80 年代的美国,人工智能就已应用在一些简单的控制领域,包括机器人,机器视觉,形象识别等技术。而机器人智能化并不是要取代人们工作,而是帮助人找到一个更高效、更灵活、更健康的环境。当业务的空间维度高,复杂性高,不确定性高的时候,人工智能就可发挥自身优势,协助人类进行工作。
[注]:2019 年 1 月 13 日,由工业和信息化部指导,中国信息通信研究院联合工业互联网产业联盟、华为、富士康、积微物联共同主办的第二届“中国工业大数据创新竞赛”决赛答辩会议在中国信息通信研究院隆重举行。
竞赛自 2018 年 11 月启动以来,吸引了来自海内外近 3000 名参赛选手。两道竞赛题目分别为“钢卷仓储吞吐量预测”和“刀具剩余寿预测”,由清华大学软件学院王建民院长和美国智能维护系统(IMS)主任、富士康工业互联网副董事长李杰教授分别担任专家组组长。联合主办方华为公司也为竞赛提供了云计算资源和华为云 EI 机器学习服务的支持,富士康和积微物联分别提供了真实数据资源和应用场景。同时,竞赛也得到了北京工业大数据创新、昆仑数据、天泽智云、美国仪器、ABB、蒂森克虏伯等国内外企业和研究机构的大力支持。
邮箱:15236061639@163.com
QQ:60298351
微信:a18137798589
各地积极推动人形机器人在工业制造、医疗健康、服务业等领域应用,加速产业转型升级。赛迪研究院认为,在政
在机器人自动化焊接时,相信大家都有碰到过焊缝出现气孔和气泡的情况,这是焊缝不合格的一种表现,会影响到
“大促狂欢启幕:物流企业如何高效管理仓储运营?” 大促如何打造高效仓库?电商大促期间爆仓、发货慢、错