DS是数据科学(Data Science)专业的简称,是近几年被独立分割出的新兴专业,是一门交叉的学科,涉及到很多的领域,包括统计学、数学、计算机、人工智能、机器学习、数据库、模式识别、可视化技术等多学科的知识。是目前美国留学的热门选择。
一、美国大学DS专业申请背景
数据科学是一门结合计算机科学+数理统计+具体领域应用的交叉学科。下图就很直观地表达了数据科学作为一门交叉学科的知识结构组成,也符合了大部分项目的课程设置。数据科学是在数据基础之上,运用计算机和数理统计的知识,在某一个具体领域(商业、IT、医疗等)解决具体问题。所以其主要申请者也是来自于这几个方向。
数学相关专业:
Data Science无法避免的就是算法,而算法的基础就是数学。因而数学系的同学如果申请 Data Science的话是非常有竞争力的,你的逻辑思维决定了你将会具备很好的处理大数据的能力。
计算机相关专业:
计算机在Data Science方向自然是最具竞争力的。但是,这个专业除了巩固自身的编程能力,更偏重了解更多的处理数据的方法。
经济学相关专业:
在大数据环境下,你有经济学基础,那么恭喜你,你一定比其他专业的同学们更懂得什么数据才是有利于预估经济发展行情的。因而,如果你有很好的逻辑能力的话,你完全可以学习一些基础的计算机知识和编程,这不但是适应社会发展的知识,也是能让你在今后就业方面如鱼得水的专业。
二、美国大学DS专业先修课背景
1. 数学 - 理论基础
微积分和线性代数:通过微积分,理解导数和极限的概念,常见函数的微分和积分,链式法则;通过线性代数,理解向量和线性映射的概念,矩阵空间的运算,以及特征值和特征向量的意义。
2. 计算机 - 应用基础
数据科学和数据分析的工作离不开编程来搭建各种算法产品。这个行业常用的编程语言以Python和R为主,以Python为例,数据科学家需要掌握的知识包括:
Python:基本语法及常用数据结构。除此之外,理解面向对象编程(Object-Oriented Programming)的概念对于从事偏开发类的工作也很关键。这里推荐一个Coursera上面的网课系列 (Fundamentals of Computing),很全面的介绍了如何培养自己的computational thinking以及计算机专业的基础知识和算法,数据结构等概念。
数据库 (SQL):数据分析的前期工作主要为提取和清洗数据,而大部分企业的数据都存储在SQL类的数据库中。SQL等数据库,以及Hadoop,Spark等并行计算的框架,是最近的热点,推荐学习。
数据结构:数据结构相关知识的掌握会让你编程更加顺手。
3. 统计及机器学习 - 专业基础
概率论与数理统计:机器学习和深度学习的核心思想是通过计算机从数据中挖掘总结有价值的信息,而在这个学科存在之前,统计学就是人类挖掘数据信息最有力的工具,后续的各种算法也都使用统计学定义的规则和理论,因此这方面的知识是入门数据科学最基本的前提条件。
线性回归模型:绝大部分基础的机器学习课程都会从线性模型开始讲授,因此有一个扎实的基础对于后续学习其他的算法很有帮助。
机器学习:对于想要从事数据科学工作的同学来说,对于机器学习算法的理论及应用的了解相当重要。推荐Coursera上面的Andrew Ng’s Machine Learning Collection课程。同时,在学习理论知识的同时,还需要结合课外的project或者作业来锻炼自己手动实现算法,建立机器学习训练workflow的能力。比如可以通过参加Kaggle比赛,积累实战经验。
以上就是美国大学DS专业申请背景的相关内容。如果您对美国留学感兴趣,欢迎您在线或者添加微信Tops6868咨询托普仕留学老师。托普仕留学专注美国TOP30名校申请,采用5v1服务模式,21步精细服务流程,硬性四维标准+六维背景提升等留学服务体系,为学生申请美国名校提供保障。