工业大数据如何轻量化上云

工业大数据如何轻量化上云

[好文分享:www.ii77.com]

[好文分享:www.ii77.com]


导读

在越来越多的制造业把大数据放在云端进行处理的时候,在网络、存储和计算能力有效的情况下,采用对数据进行压缩和对数据特征进行选取的方法进行数据轻量化处理,以满足数据业务分析需求和处理效率的高效。


文/赵熙朝


01

业大数据的范畴


工业大数据包括制造企业信息化数据、工业物联网数据,以及外部跨界数据。信息化数据包括了ERP中的客户订单、生产计划等信息,工业物联网数据主要是从生产设备上采集到的各种产质耗数据和智能产品上获得的运维数据,而外部跨界数据包括环境数据、市场数据和竞品数据等,而其中从机器设备上得到的数据比重将越来越大。


工业大数据的特征除了大数据的4V(数据量大、类型多、价值密度低、速度快)以外,还有专业性、关联性、和时序性特征。工业大数据应该注意特征背后的物理意义以及特征之间关联性的机理逻辑,互联网上的大数据可以只针对数据本身进行挖掘和关联,而不考虑数据本身的意义,挖掘到什么结果就是什么结果。工业大数据的挖掘必须要有明确的挖掘目标,针对应用的功能在此基础上逐步扩展挖掘的方向。


02

为什么大数据上云要轻量化?


制造企业在构建大数据分析系统时,除了采用传统的自建数据中心架构以外,还可以采用数据存储和分析构建在公有云..,采用离线训练模型,结合边缘计算在生产现场利用实时数据和已经训练好的模型进行业务应用的两级架构。


工业大数据如何轻量化上云


两级架构的优点主要体现在以下四个方面:


1、降低存储成本:从设备传感器上采集的数据点往往是时序连续的过程量,随着采集频率的提高和周期延长,数据量是非常大的,如果考虑对海量的数据的存储、备份和还原全生命周期的管理,往往在公有云上成本更低。


2、提高弹性:在公有云上处理大数据,空间和时间灵活性约高,对数据存储和计算资源的要求会随着项目时间越来越长而要求越来越高,而公有云基本能做到想什么时候要就什么时候要,想要多少就要多少。


3、提高容灾性:传统的数据中心的容灾备份往往采用两地三中心的方式,为保证7*24的系统高可用性对系统的要求高,而公有云的IaaS和PaaS的容灾备份机制能实现低成本的低数据丢失率和更短恢复间隔。


4、数据共享更便利:企业应该把自身看成“大数据”价值链中的一部分,那么企业既是贡献者也是受益者,工业大数据的价值可以共享给企业上下游使用,采用统一的公有云..,促进数据资源的融会贯通,使得数据共享更方便。

大数据上云以后由于网络带宽的限制、对数据处理的时效性要求高、数据存储成本以及模型训练复杂程度多方面的原因,也要求在企业边缘层对原始数据进行一些轻量化处理,在不损失大数据价值性的基础上减少原始数据量。


03

轻量化的方法


轻量化是在不损失大数据价值性的基础上减少网络传输、存储和训练的数据量,并不是要剔除异常数据。在传统的仪表数据采集的时候都有一个过滤异常数据的操作,会设定一定的阈值去除仪表读数的异常跳变,而轻量化的方法不是采用这样的方法去除异常数据,因为异常的数据有可能对业务分析是有价值的。轻量化的方法是在业务分析人员以价值需求为导向去发现数据和提取数据,主要是通过采样中的特征选取和数据压缩两种方法。


特征选取是在可采集的样本特征集合中选择预测能力强的最佳子集,剔除重复,简化多个特征之间的相互关联。首先可以对多个特征做相关性分析,如果特征的相关性为1,表示两个特征的变化是完全相同的,通过找出两个特征的线性关系,能够通过一个特征还原另外一个特征,一个简单的例子如果产品的中文名称要求是唯一的,那么这个产品的中文名称和它的编码相关性就是1,不存在多个编码的产品取相同的名称,那么在做数据采集、传输、存储和训练的时候只需要保留产品编码,只需要在结果展示的时候通过对应表的方式找出产品名称。如果在训练样本的时候对特征维度有明确的要求,也可以采用PCA方法对特征进行降维,PCA把原先的n个特征用数目更少的m个特征取代,从旧特征到新特征的映射捕获数据中的固有变异性,尽量使新的m个特征互不相关。还有一些特征之间是有特殊规律可循,比如说某个机台生产的班次和班组的关系是完全按照四班三运转模式来排班,这个时候只需要确认班次就可以推导出执行班组信息,这样的规则如果是固定不变的话,可以在模型训练时候直接处理特征,而不需要另外做采集和储存。


工业大数据如何轻量化上云


采用压缩算法也是常用的轻量化手段,在带有时间戳的时序性连续变量采集中,随着采集频率的提高数据量也成级数上升,可以通过偏差检测处理和罗旋门压缩过滤,既能反映数据实际趋势,所需要采集、传输和保存的数据也显著减少。下面的三张图简单展示了数据压缩的过程。


工业大数据如何轻量化上云

工业大数据如何轻量化上云


而自编码神经网络是结合了以上两种方式,采用自编码神经网络既可以对特征维度进行降维,也会通过编码方式对数据进行压缩。自编码神经网络是一种无监督学习算法,它使用了反向传播算法,并让目标值等于输入值,可以通过设定神经网络的隐藏层节点数量来达到数据压缩的目的。比如我们有100个输入特征,可以设定隐藏层节点数量为50,最终输出层还是还原100个输入特征。模型训练完成后,我们可以用模型的输入层到隐藏层作为压缩算法,把模型的隐藏层到输出层作为解压算法,这样在边缘层进行模型部署进行压缩,在公有云利用模型进行解压。自编码神经网络相对PCA来说可以更好的处理特征之间的非线性关系。


04

结语


在越来越多的制造业把大数据放在云端进行处理的时候,在网络、存储和计算能力有效的情况下,采用对数据进行压缩和对数据特征进行选取的方法进行数据轻量化处理,以满足数据业务分析需求和处理效率的高效。


看完本文有任何观点想法,都可以在下方留言区畅所欲言!

工业大数据如何轻量化上云

别光看,

赶紧长按关注呀!

工业大数据如何轻量化上云

更多精彩请点击

BMW喷漆工艺! 视频告诉你为什么原厂漆面好! ! !

11项关键先进制造技术解读!

仅300员工却垄断全球,几亿一台还供不应求,又一项卡中国脖子的技术!

不谈智能-回归制造!

25个必备精益生产工具!

热门文章

自媒体 微信号:ii77 扫描二维码关注公众号
爱八卦,爱爆料。

小编推荐

  1. 1 最近“澳门赌场”又上线了!苹果正面回应!

    去年我们写过iPhone内置的iMessage经常被一些垃圾广告占领,在去年年底报道之后,这些“澳门赌场,涉黄”信息终于消停了一段时间。 但是最近这些垃圾广告又重现江湖,而且还有扩

  2. 2 睡梦中钱不翼而飞?“短信验证码”早已不安全

    近日,国内各地都陆续发生了一些利用短信验证码冒用身份、窃取银行账户、金融类 APP 财产的案件,受害者甚至莫名其妙“被网贷”,进而遭遇较大经济损失。 根据@江宁公安在线

  3. 3 【科技早报7点整】虎牙和斗鱼就“黑公关”事件互怼 谷歌与腾讯欲联手云业务……

    早上好,科技圈 【一度蜜科技早报】第 215 期 1.“虎牙斗鱼battle”引网友热议,双方就“黑公关”事件互怼 近日,一位自称是吃瓜群众的网友因为“一时好奇”,于是“冒充”虎牙的

  4. 4 VIPKID借力微软中国推进智能教育研发 惠及全球1亿少儿优质学习需求

    8月2日,全球最大的在线教育科技品牌VIPKID宣布与微软中国达成战略合作, 两大行业巨头拟在人工智能教育解决方案上,聚合各自领域优势,共同推进在产品、技术和市场相关合作,

  5. 5 比亚迪广告门新进展|诺基亚押注5G市场|iPhone销量不及Oppo和Vivo【Do说】

    比亚迪广告门最新进展:陈振宇已脱离嫌疑人身份 比 亚 迪 “ 广告门 ” 事件历时半个多月,随着关键人物李娟老公、陈振宇等人的发声,事件呈现出更多谜团和矛盾点。此前,一份

  6. 6 突发!台积电三大产线全部停摆

    最新消息,8月3日晚间接近午夜时分, 全球晶圆代工巨头台积电位于新竹科学园区的12英寸晶圆厂和营运总部,突然传出电脑遭病毒入侵且生产线全数停摆的消息。 几个小时之内,台

  7. 7 老龄化将催生百亿级市场,这些方面“钱途无量”

    导读:数据显示,老龄化将催生百亿级养老市场,其中最大的细分市场是远程监测。 2017年,位于波士顿的健康科技公司Pillo研发了一款针对老年人的家用机器人,她会坐在厨房的台面

  8. 8 装修:140㎡北欧风 满足你满满的少女心!|北欧风格

    今天推荐的是140㎡北欧风格装修,大面积的粉色调,让你邂逅少女心,我真的是很喜欢这种风格,感觉住在这里的人都会变得可爱又年轻。

  9. 9 夏秋季节开花灿烂的植物花卉,养在院子里就特别好

    春暖之后就可以在院子里开展园艺活动了,如果你想要栽种一些可以保持每年夏秋季节开花的植物,那下面这些植物就很符合你的要求,可以直接选择播种培育,或者是买植物的幼苗

  10. 10 区块链业界排头兵,三角形主机亮相CJ2018!

    区块链的兴起也预示着虚拟货币将在金融领域占有一席之地,合理分配资源能让主机有更高的效率,这三角形主机亮相CJ

本文内容来自网友供稿,如有信息侵犯了您的权益,请联系反馈核实

Copyright 2024.爱妻自媒体,让大家了解更多图文资讯!