基于网络数据的高新技术企业数据可视化

数媒竞赛获奖作品信息及简介
作品名称基于网络数据的高新技术企业数据可视化
参赛院校江西师范大学
指导老师王渊、王昌晶
团队成员武文杰、夏薇、罗斐、黄志鹏、龚雅玲
奖项等级三等奖
竞赛年份2021

       1:数据信息来源于网络,通过爬虫程序可以获取到高新技术企业认定管理工作网及省市官方网站的公开文件,经过数据处理后,对省内各市的高新技术企业数据进行了可视化展示,如:在主页面中呈现的是省内情况,包括省内近六年高新企业数变化,省内上市公司新增和总量的变化图,省内高新企业类型占比,高新企业数排名前五的市,各市六年的变化,各市高新技术企业占比等。在内页面中呈现的是各市的情况,如:注册资本排名前十的企业(官网,所属县,注册资本),上市的十家公司(官网,所属县,法人),市内高新技术企业六年变换情况,近六年高新企业数变化情况,高新技术企业类型占比图,市内所有高新企业名单等。 2:项目的构建是以公开的网络数据为基础,以Web可视化提供平台服务,旨在通过技术助力提升就业渠道品质服务以辅助大学生更好就业择业为导向,尤其是帮助大学生们在实习实训时找到专业相关的符合意向的高新技术企业,进而动态知悉企业的有关发展情况。在平台上借助ECharts.js等框架库技术,实现了学生们可以方便、快捷地查询省内各市高新技术企业情况,交互展示一目了然,界面呈现美观简洁。 3:项目功能分为数据爬虫系统和数据可视化展示系统,爬虫系统依托Python编程语言,采用Requests库、Urllib库、Re库、Socket库、Selenium库、BeautifulSoup框架、Scrapy框架等爬取公开的企业数据,主要包括企业基本属性数据、所属省市数据、所属行业分类数据及相关信息,然后采用Mongodb和MySQL数据库存储;数据可视化展示系统首先包括对数据的处理分析,通过聚类和关联,建立企业“高新技术企业”分析指标体系,实现对数据关系的建模,然后依托SpringBoot框架、Echarts.js库等,采用微服务模式基于地图开发实现查询和展示。