数据科学家需要掌握的特征工程原理和技术

出版日期:2016-6
ISBN:9781491953241
作者:Alice Zheng
页数:400页

内容概要

Alice是一家位于西雅图的提供可扩展数据分析工具的创业公司GraphLab的数据科学部门的负责人。Alice喜欢处理数据,以方便他人能够使用数据。她是一名在机器学习领域的工具开发者和专家。她的研究领域有软件诊断、计算机网络安全以及社会网络分析。在加入GraphLab之前,她作为一名研究院就职于在Redmond的微软研究院。她拥有数学专业的文学学士学位以及计算机科学的博士学位,两者皆获得与加州大学伯克利分校。

书籍目录

由于本书还没有正式出版,O'Reilly在官网放出的目录也显示可能会在最终版中有变动。
Chapter 1Introduction
Chapter 2Basic Feature Engineering for Text Data: Flatten and Filter
Chapter 3The Effects of Feature Scaling: From Bag-of-Words to Tf-Idf
Chapter 4Categorical data: Counting eggs in the age of robotic chickens
Chapter 5Sequences and Series: Dealing with Event Logs
Chapter 6Dimensionality Reduction: Squashing the Data Pancake with PCA
Chapter 7Turning images into features: Feature learning with deep learning
Chapter 8Metrics and metric learning
Chapter 9Miscellaneous but important
Appendix ALinear Modeling and Linear Algebra Basics

作者简介

特征工程对于应用机器学习来说是基础的,但是使用域知识来加强你的预测模型既困难成本又高。为了弥补特征工程现有资料的不足,本书将会为初中级数据科学家讲解如何处理这项广泛应用却鲜见讨论的技术。
作者Alic Zheng会讲解常用的练习和数学原理,以帮助工程师分析新数据和任务的特征。如果你理解基本的机器学习概念,如有监督学习和无监督学习,那么你已经准备好学习本书了。你不仅会学习到如何以一种系统化和原理化的方式部署特征工程,并且还会学习如何更好地实践数据科学。


 数据科学家需要掌握的特征工程原理和技术下载



发布书评

 
 


 

外国儿童文学,篆刻,百科,生物科学,科普,初中通用,育儿亲子,美容护肤PDF图书下载,。 零度图书网 

零度图书网 @ 2024