a
当前位置: 课程信息 >  信息安全

| 信息安全

[2017-12-26]

数据挖掘 课程教学大纲

Course Outline

课程基本信息(Course Information

课程代码

Course Code

IS303

*学时

Credit Hours

32

*学分

Credits

2.0

*课程名称

Course Title

(中文)数据挖掘

(英文)Data Mining

*课程性质

Course Type

选修

授课对象

Target Audience

本科三年级

*授课语言

(Language of Instruction)

中文

*开课院系

School

信息安全工程学院

先修课程

Prerequisite

数据库原理,算法设计

授课教师

Instructor

李斓

课程网址

(Course Webpage)

ftp://lanli:public@public.sjtu.edu.cn/
public-files/

 

*课程简介(Description

《数据挖掘》课程是信息技术方向的高级课程,主要介绍数据挖掘的基本原理、概念、方法和算法等,使得学生能了解数据挖掘的基本原理和方法,并在实际环境中进行应用,达到期望的数据分析目标。

本课程的主要教学内容包括:数据挖掘的基本概念和基本原理、数据探索、数据预处理、数据挖掘的核心任务(包括分类任务、聚类任务、关联分析任务、序列模式发现任务、异常数据检测任务等)的基本概念等,并着重介绍了完成数据挖掘核心任务的基础方法及高级方法,讨论了这些方法的优缺点及适用范围。

通过课程的学习,期望学生能学习到数据挖掘的基本原理,了解数据挖掘工作背后的理论基础,掌握数据挖掘几大核心任务的基础方法和部分高级方法,并能着手在实际数据环境中加以应用。

*课程简介(Description

This course is an advanced one for the students majoring in computer science, and mainly introduces the concepts, the theory, the methods and the algorithms of data mining. It is expected that the student would know the basic concepts and methods of data mining, and could apply the methods to the real information systems to achieve the data analysis goals.

The course introduces the basic concepts and theory of data mining, data exploration and data preprocess. Furthermore, the course describes the concepts of the core tasks, including classification, association analysis, clustering and anomaly detection, of data mining, focuses on the basic methods and advanced methods of these core tasks and discusses the advantages, shortcomings and application scopes of these methods.

Through studying this course, it is expected that the students would learn the basic concepts of data mining, know about the theory of data mining, understand the basic methods and advanced methods of the core data mining tasks, and apply these methods to the real information systems.

课程教学大纲(course syllabus

*学习目标(Learning Outcomes)

1.深刻了解数据挖掘的基本概念和基本原理;

2.掌握数据挖掘的核心任务的概念和方法;

3.了解可实现数据挖掘目标的实施过程;

4.能在实际环境中应用数据挖掘的原理和方法,对数据进行分析。

 

*教学内容、进度安排及要求

(Class Schedule

&Requirements)

教学内容

学时

教学方式

作业及要求

基本要求

考查方式

数据挖掘概念与核心任务介绍

2

授课

观看与大数据分析相关的记录片

能掌握数据挖掘的基本概念和现状

读后感

数据探索和预处理

4

授课

延伸阅读《数据仓库》

了解数据的特性和预处理的方法

课堂问答

分类

8

授课

分类课程实验

能掌握分类的基本概念,基本方法和高级方法

课程实验报告和代码

关联分析与序列模式

8

授课

巩固和学习关联分析与序列模式的相关知识

能掌握关联分析与序列模式的基本概念,基本方法和高级方法

课堂问答

聚类

8

授课

聚类课程实验

能掌握聚类的基本概念,基本方法和高级方法

课程实验报告和代码

异常检测及其他

1

授课

巩固和学习异常检测相关知识

能掌握异常检测的基本概念,基本方法和高级方法

课堂问答

MapReduceHadoop介绍

1

授课

Hadoop应用

了解MapReduce原理和Hadoop的基本

课堂问答

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

……

 

 

 

 

 

*考核方式

(Grading)

课堂表现10%,期中论文(读后感)10%,大作业一,40%,大作业二,40%

*教材或参考资料

(Textbooks & Other Materials)

1. 《数据挖掘导论》Pang-Ning Tan等著,范明等译,人民邮电出版社

2. 《数据挖掘导论》英文版(《Introduction to Data Mining》), Pang-Ning Tan等著,机械工业出版社

3. 《数据挖掘概念与技术》,韩家炜等著,范明等译,机械工业出版社

 

其它

More

 

备注

Notes

 

 

备注说明:

1.带*内容为必填项。

2.课程简介字数为300-500字;课程大纲以表述清楚教学安排为宜,字数不限。

访问数量:
 a