近些年随着大数据和云计算的兴起,数据科学的重要地位也日益显现。那么数据科学的整体工作流程是怎么的呢?数据分析在整个工作流程中占了怎样的位置和角色?如果想要入门做数据分析需要掌握什么语言使用哪些工具?
本课程将深入浅出一一解答以上问题,最后通过一个二手车数据分析的案例,逐步演示从数据导入到处理过滤,最后到数据可视化展现的完整操作流程。
适宜人群
本课程适合初学者快速入门,了解数据科学和数据分析到底是怎样的一个体系;
结合自身专业,学习的挑战在哪里,需要学习哪些内容;
实操部分将从代码实现逻辑去讲解,不会Python编程的同学也能听懂。
主讲大纲
1.大数据的来源和基本原理
——大数据从何而来,有哪些应用场景
2.数据科学及其完整的工作流程
——什么是数据科学?数据分析在其中占的位置
3.数据分析流程和常用工具
——包含编程语言、NumPy、Pandas等常用数据库
4.数据分析案例:如何分析二手车价格数据分布
——从数据导入到过滤、处理,最后可视化,包含完整的操作流程
老师介绍
孙逊 西安交通大学软件学院特聘专家
百度技术学院特约讲师
曾就职于中国普天,具有多年的软件开发、管理、教学和产品经验,先后参与并设计了多个政府、医疗、保险等行业的大型项目,得到了企业的广泛认可,在数据分析应用、软件工程等方面有深入的理解。
曾为北京航空航天大学、南京航空航天大学、西安交通大学、山东大学、贵州大学、南京大学、大连理工大学等多所”985”、“211”大学授课,为本科生、研究生讲授大数据、云计算相关专业的多门课程,总课时超过10000课时,并受到学生的一致好评。