288563.com  > 林业科技

大数据掀起林业和草原统计新革命

设置字体大小:【 】 【打印】 【页面调色板  发布时间:2018-06-22


  当林业和草原遇上了大数据,一场林业和草原统计的新革命随之拉开序幕。 从资源监测到灾害监测,从要素市场到产品市场,从木材生产到生态服务等林业和草原统计工作的各个领域,都将因为大数据技术的出现而发生深刻改变。在信息全球化的背景下,有必要分析大数据对林业和草原统计工作的影响,开发应用案例,推动大数据在林业和草原统计工作中的运用,让大数据更好地推动林业和草原现代化建设。

  大数据深刻影响林业和草原统计工作

  长期以来,传统的林业和草原统计分属林业与农业两个部门,其调查基本方式是以统计基层调查对象报数为主,以林草调查员上门登记为辅。在这种统计模式下,林业和草原统计的付出精力与成本非常大。当前正处于大数据时代,本轮机构改革将林业和草原统计合二为一。林业和草原统计机构可以利用现代信息技术,对调查对象已有的各种印迹进行搜集、加工,从而获得各种数据,进而降低调查成本。当前,林业和草原统计渠道正经历依靠有目的的调查采集向利用大数据有目的的分析挖掘的转变,工作方式从以统计机构为中心向以需求价值的指标为中心的转变,统计制度以全面报表制度为特征向以"自动化、信息共享和网络化"为特征的转变。

  一是林业和草原统计渠道的转变。利用大数据技术,能够获得精确、实时的数据信息,拓展林业和草原部门统计获取数据信息的渠道,林业和草原统计数据更加全面、精准。"互联网+"、移动通信网与遥感等新技术的应用,不仅可以采集到林草产品分类更加翔实、具体的统计信息,时效更加快捷便利,而且可以规避统计采集过程中的一些人为干扰。比如,林草产品产量、价格、销售量、进出口贸易等统计指标,既可以通过利用有关商业单位的业务记录进行加工获取,也可以通过网络爬虫技术抓取网页数据。

  二是林业和草原统计工作方式的改变。传统林业和草原统计的工作方式是以统计机构为中心,通过纵向层层布置和加工汇总上报实现的,这种工作模式、工作方法导致传统统计工作得出的数据结论与实际情况存在偏差,导致统计结果公布后,引起社会各界的质疑,从而降低了统计部门工作的权威性,一定程度上也损害了政府的权威形象。其次,传统林业和草原部门统计服务产品单一,服务渠道狭窄,绝大多数服务对象基本上是面向宏观的政府或大型机构决策层面,与社会公众及一般性组织关联不够密切,统计信息的影响力大打折扣。当前形势下,林草产品市场对面向微观的社会公众、面向中观的市场主体经营者及面向专业化第三方服务机构的需求日渐旺盛,迫切需要开发出贴近市场不同层次、不同个体需要的多样化林业和草原统计服务产品,拓展服务渠道和手段,以最及时、便捷、准确的方式推送给具体需求者,巩固和增强统计信息的广泛影响力,在林业和草原宏观决策上占领制高点,树立林业和草原统计部门的权威影响力,在中观、微观上更加贴近林草产品市场所需。数据采集主体从以单一林业和草原统计机构向与社会上其他机构单位相互协作相辅的转变。大数据的统计处理方式,是通过运用"互联网+"、云计算与区块链等最新的网络技术获取海量的数据,利用复杂的数学建模、数据挖掘等进行数据分析,技术含量很高,处理方式与传统方式(比如采用Excel与Access软件对上报的数据进行简单统计分析)也完全不同。

  三是林业和草原统计制度的改变。利用大数据技术能够实现林业部门统计制度的创新。统计工作信息化、现代化,有利于解决现阶段林业和草原统计制度的不足,能够改变以往以全面报表制度为主,统计手工汇总的统计体制,实现"自动化、信息共享和网络化"。利用计算机综合数据信息,根据生产经营情况不断变化,随时提供有益的资料信息,为生产经营跟踪服务。将单调、枯燥、复杂的统计数据收集整理工作由计算机来处理,把分散在各个业务部门的信息收集起来,达到信息数据共享,加速数据流通,统计人员可拥有更多的时间从事调研、分析和预测等方面管理工作,更高层次地提高统计工作质量。强调林业和草原大数据应用技术标准的研制,及时将结构化、半结构化、非结构化整合进林草数据仓库。建立全国性的林业和草原信息网络,推动林草企业实施全面质量管理,加速林业和草原企业现代化进程。

  林业和草原统计各环节的大数据需求

  一是数据获取方面。数据获取是林业和草原统计工作的基础。数据的产生技术经历了被动、主动和自动的3个阶段,早期的林业和草原统计数据是人们基于分析特定问题的需求,采用普查或抽样等方法调查获取,被动产生数据;随着互联网与管理信息系统的发展,越来越多的人在网络上传递或发布信息,主动产生数据;而传感器技术的广泛应用使得利用传感器网络可以全天候自动获取数据。其中,自动、主动数据的大量涌现,成为林业和草原大数据的主要来源。随着物联网、3S和移动互联网等信息技术的演进与应用,林业和草原资源数据的来源与种类不断增多,除了传统的遥感、GIS和数字采集终端等数据源外,传感、多媒体、空间、地理位置服务数据已经成为林业和草原资源数据的新来源。

  二是数据处理方面。大数据需要充分、及时地从大量复杂的数据中获取有意义的相关性,找出规律,挖掘数据价值。数据处理的实时要求是大数据区别于传统数据处理技术的重要差别之一。一般而言,大数据领域相当大的一部分应用需要在1秒甚至瞬间得到结果,否则相关的处理结果就是过时的、无效的。实时性成为此类数据处理的关键。而数据规模巨大、种类繁多、结构复杂,使得大数据的实时处理极富挑战性。数据的实时处理要求实时获取数据,实时分析数据,实时绘制数据,任何一个环节慢都会影响系统的实时性。当前,互联网络以及各种传感器快速普及,实时获取数据难度不大,实时分析大规模复杂数据是林业和草原大数据领域亟待解决的核心问题。

  三是数据分析方面。大量的数据本身并没有实际价值,只有针对特定的林业和草原统计工作应用数据,使其转化有用的结果,海量的数据才能挖掘出价值。数据是广泛可用的,我们所缺乏的是从数据中提取知识的能力。当前,对非结构化数据难以得到有效的分析,林业和草原大数据发展取决于从大量未开发的林业和草原数据中提取价值。价值被隐藏起来的数据量和价值被真正挖掘出来的数据量之间的差距巨大,产生了大数据鸿沟,对多种数据类型构成的异构数据集进行交叉分析的技术,是大数据的核心技术之一。

  四是数据展示方面。对于传统的结构化数据,可以采用数据值直接显示、数据表显示或各种统计图表显示等形式来表示数据,而大数据处理的非结构化数据,种类繁多,关系复杂,传统的显示方法通常难以表现,大量的数据表、繁乱的关系图可能使用户感到迷茫,甚至可能误导用户。利用计算机图形学和图像处理的可视计算机技术成为大数据显示的重要手段之一,将数据转换成图形或图像,用三维立体图来表示复杂的信息,直接对具有形体的信息进行操作,更加直观,方便用户分析结果。

  通过上述研究,课题组发现,大数据在林业和草原统计工作中大有可为,但由于目前大数据在林业和草原统计中的应用基础研究处于起步期,研究进度滞后于现实需求,今后在较长时期内迫切需要加强林业和草原大数据理论与应用案例研究。(作者:中国林科院科信所林业和草原大数据课题组)

信息来源:中国绿色时报 | 责任编辑:288563.com管理员