您的位置首页  汽车新闻  汽车信息

上海市新能源汽车数据平台概况及分析应用

  截止到2018年上半年,上海市新能源汽车已超过18万,呈快速增长的态势,其中混合动力新能源汽车比较多。今年上半年有20000多新能源车出售,这个数字跟2016年相比有一定差距。这是由于常规上半年政策补贴发布的原因,往往到下半年最后一个季度会有个冲量的情况。

  2014年10月,在国标发布之前上海就发布了全国第一个数据采集标准。2017年以后,所有的数据标准都是按照国标采集。4年多左右的时间里,数据中心的接入量超过了18万8千(截止至2018年8月),超过90%的新能源车是接入到该数据中心。

  政府端数据中心会给政府做很多数据支撑,包括对一些新能源汽车补贴政策评估、行业标准还有节能减排的计算,每年会给政府一些定制化报告。

  另外还有安全监管,前段时间在上海有自燃情况,我们也想从数据角度来考虑是否能为上海市市民安全做一些贡献。现在国标中有对所有车辆报警的处理机制,尤其对核心参数报警有一个处理机制,一般会分为一级、二级、机制,对报警要求所有主机厂在15分钟内必须要有解决方案。今年政府发布了新能源车的事故安全处理机制,一旦发生事故后企业要第一时间到现场查看现场的情况,并另外要求其在7天内立刻提交车辆事故安全报告。对于数据中心来说,也会把车辆过去一段时间内的运营报告与企业的事故安全报告结合起来给到政府追查到底是什么原因导致的事故。

  企业端数据中心每年定时发布新能源汽车大数据产业链年报,还会对有一些协会出定制化报告,比如协会想了解某些企业不同的用户分类画像或者是新能源汽车用户行为分析,包括一些场景探索。这些数据能为分时租赁公司或是保险、金融企业提供价值。

  9月数据中心成立了上海新能源汽车开放创新数据实验室,主要为构建大数据开放平台。目前有18万数据,这些数据不光为我们所用,还可以给到社会中很多有想法并且有行业经验的人,把数据发挥更大的价值。有这个大数据开放平台以后,不管高校还是研究机构,都可以挖掘自己想要的信息。另外还可以聚焦创新的行业应用,如围绕新能源汽车保险或者电池健康等应用,对这些场景做转化和孵化。

  目前数据中心主要还是通过驻厂来提供服务。以上是数据中心开放的字段,所有提供的数据都是经过脱敏的。数据总量目前只提供1000个数据样本,以后随着模式成熟,会把开放度提高。近1年时间数据中心已经有一些合作项目,包括电池健康度、交通等特殊领域,已和有的单位在开展研究,并得出成果。

  数据指标体系主要是动态数据和静态数据。静态是指车辆出厂的数据;有一些动态数据是按照国标收集到的;对新车可以做一些试驾,用户试驾完对用户采集数据。

  数据治理体系前段时间国家发布了新能源汽车数据质量报告,报告中提到有60%以上的数据有错误,当然这个有夸大的可能,但数据质量问题依旧不容乐观。我们现在针对这个问题有一套数据管理规则

  数据标签体系给某类车上一些车辆标签,这其实也更方便后续分析时做定位,方便更快速找到车辆。标签分静态和动态。

  这是我们目前按照新能源汽车国标采集的一共60多项数据,包括整车发、发动电机还有一些材料数据。

  上文提到的动态标签分为人、车、时、空、情,通过很多不同的维度判断车的标签。如用户买车是上下班使用还是以后做滴滴司机;用户是每天充一次电还是两次电;用户日常行驶的范围等。

  我们根据所有上海市民每天的出行里程统计结果做了分布预测。分析所有新能源汽车行程里程及出行概率分布。结果发现出行概率与模型相对应,就是所谓的威布尔分布。

  我们发现70%的用户出行里程是58公里以下,50%的用户是在35公里以下。得出纯电动车行驶里程更能满足大多数消费者的日均出行。

  充电时长的分析统计主要是针对不同的4类车型,分析后发现,绝大部分车辆充电时长是4小时以内。以前很多调查问卷的结果显示,很多人印象中充电时长有6小时,但从后台数据来看,充电时间没有那么长。这里也说明私桩共享,我认为理论上来说可能,因为时间占用得非常短,而私桩来很大程度没有充分利用起来。当然实际情况会遇到物业管理,包括停车费的问题,但是我认为这个方向是非常值得挖掘的。

  这是我们接受到上海市交通总队的委托做的分析,由于不是所有新能源物流车都可以进市区,大概只有40%的物流车会发通行证。想了解这部分到底有没有做运营,或者说运营情况如何。

  样本数量是677辆,都是上海市做全市运营的车辆,可以看到绝大部分是集中在1吨到2吨的新能源汽车物流车。

  日均出行里程,我们发现每天平常是66公里,比私家车高一些,但是比出租车低很多。出行时间大概是三个半小时左右,还是跟我们传统的物流车差不多。

  再看工作日日均出行时刻分布,普通车有明显的上下班高峰,尤其是上午7点到9点有个高峰,下午5点到6点有个高峰。但是物流车就没有这样明显的高峰。下半张图是周末日均分布,基本差不多,但是晚上8点到10点以后私人出行占比更高一些。

  这是试验室跟合作伙伴的一个项目,是电池健康度的预测,这个问题不管是保险还是电池企业很重要,更对新能源汽车能否良好发展非常关键。我们从数据角度主要分析一下几个方面:

  把数据进行初步加工,筛选出一部分我们认为比较好的,充电过程相对比较稳定的,通过充电积分方式做一些分析,可以看到不同的电量之间的SOC关联性,然后通过一些机器模型训练,可以得到基础的SOC的初步结果。

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186