《数据之美》章节试读

当前位置:首页 > 计算机网络 > 计算机理论 > 数据之美章节试读

出版社:机械工业出版社
出版日期:2010年10月
ISBN:9787111315124
作者:Toby Segaran,Jeff Hammerbacher
页数:354页

《数据之美》的笔记-第215页

大规模地搜索没有因果关系的相关性属于偶然计算,不是科学。即使是所谓的大数据,科学依然是一个很强的由假设驱动的过程。

《数据之美》的笔记-第7页

your.flowingdata(YFD)
个人数据收集从用户角度,我们需要使得数据收集变得尽可能简单。它应该是无干扰的、直观的且易于访问的,这样数据收集才更有可能成为日常生活的一部分。

《数据之美》的笔记-第302页 - 数据浅析:探索形形色色的社会定型

第17章 数据浅析:探索形形色色的社会定型
通过日常生活的数据感知年龄、性别、智商和魅力每天我们都通过自己购买的东西、使用的Web站点、搜索的查询、发送的消息和去过的地方 方方面面地展现自己。
我们的日常生活无时无刻在产生大量混乱、无序、碎片化的信息,这些集合隐藏着关于我们的某种模式。

《数据之美》的笔记-第109页

一个组织最多只和它的所有成员的洞察力总和一样有智慧。
这句话类似于人不可能靠自己把自己提起来。人做的系统归根到底得人能理解才行,所以神经网络失败了。

《数据之美》的笔记-第10页

数据存储
PEIR采用了PostGIS,为PostgreSQL数据库增加地理对象的支持。
YFD 采用了Django,基于Python语言的MVC模式,支持敏捷高效开发。
PEIR:http://peir.cens.ucla.edu

《数据之美》的笔记-第26页

表单布局设计:
Web表单排版和可访问性;
给人们一些空间;
适应于不同的浏览器,并测试兼容性;
交互设计考虑:动态表单长度;
设计信任;
为精准的数据收集而设计;
动机;
报告即时数据结果;

《数据之美》的笔记-第12页

Mass Observation

《数据之美》的笔记-第21页 - 设计数据收集方法时牢记用户

第2章 设计数据收集方法时必须始终牢记受众的期望和需求
数据收集面临的挑战:可访问性、信任和用户动机
用户体验User Experience直接关乎主动数据收集的质量,多花点心思设计一个表单是值得的!考虑表单排版、兼容性、动态的交互和反馈、建立目标用户的心理信任和配合的兴趣。

《数据之美》的笔记-第9页

记下

《数据之美》的笔记-第128页

系统的实时处理能力意味着避免不必要的整体轮循,而只触发少数几个频繁更新的用户吗?

《数据之美》的笔记-第6页

“虽然搜集和返回的数据类型可能已经随时间变化,但是每个人的需求是不变的。也就是说,那些收集关于自己和他们周围数据的个人,他们还是会收集这些数据,以获得对流动的数据的信息更好的理解。绝大多数时候,我们不是追求数据本身;我们感兴趣的是数据的真正含义。这是个微小的差别,却是非常重要的一点。这个需求要求系统能够处理个人数据流,高效准确的处理这些数据,把这些信息通过易于理解且有用的方式发给非专业人员。我们想要的远远不只是一个电子表格的数据,我们想要的是隐含在这些数据中的故事。”
翻译都没有人是说中国话的么?理解这么一段话都要累死了有木有,这是逼得人非得看原文不可。。。。。

《数据之美》的笔记-第27页

制作数据地图
工具:Modest Maps + Open Street Map
1、贴图数据
2、选择颜色机制红色通常表示停止或者前方有危险,而绿色则意味着进展或者增长,尤其是站在环境的立场上看。3、考虑交互性
4、呈现
5、分享

《数据之美》的笔记-第26页

设计数据收集方案时要遵循的一些指南:
尊重用户
在整个设计过程中应该保持以人为本,需要了解考虑用户的情绪反应。
他们不是傻瓜,而是我们的潜在客户。
展现真是的人们
用角色替身来指导我们思考,包括年迈的父母、一些很了解其先前情况的商业伙伴。

《数据之美》的笔记-第5页

第一章,在数据中观察生活
定义 - 收集 - 存储 - 处理 - 可视化

《数据之美》的笔记-第6页

在数据中观察生活绝大多数时候,我们不是追求数据本身;我们感兴趣的是数据的真正含义。这个微小的区别,却是非常重要的一点。这个需求要求系统能够处理个人数据流,高效准确地处理这些数据,把这些信息通过易于理解且有用的方式分发给非专业人员。个人环境影响报告(Personal Environmental Impact Report, PEIR)我们重点利用日常的移动技术(如手机)来收集关于周围和自己的数据,因此人们可以对如何与身边的事物进行交互有更好的理解。例如:DietSense是一个在线服务,它允许人们自我监测饮食选择以及进一步向饮食专家咨询;Family Dynamics帮助家庭和生活教练记录一个家庭每日交互的关键特征,如户外驻扎和家庭聚餐;Walkability帮助居民和行人,提倡通过观察发表他们对于附近的步行适宜性和与公共交通的联系的看法。

《数据之美》的笔记-第1页 - 第1章 在数据中观察生活

第一章的作者介绍了两个他以及他参与的项目,个人环境影响报告(PEIR)和your.flowingdat(YFD),两个项目都是利用“移动”(智能手机,Twitter)大作文章。
PEIR似乎是测量个人的碳排放量,利用手机的GPS功能,每间隔几分钟定位来测算移动的速度,判断碳排放,还有和facebook上朋友分享以及比较碳排放的功能。可能个人比较愚钝,没太搞懂这个项目都要做什么,怎么做。
第二个项目YFD是作者自己的小玩意,利用twitter让用户发送自己的状态,比如吃的菜,在睡觉,开心的情绪,记录自己每天的生活。等到你想利用这些数据时,比如你想减肥,你的目标是“I want to fit into my pants - all of them”,你可以查看到你最近都吃了哪些菜,喝了些什么,你现在有多重?
总结来看,这两个项目都是对个人生活方式的一种数据化记录,并通过数据可视化技术来友好地把结果返回给用户,使其获益,以便于继续乐于提供自身数据信息来供人们研究生活方式。现代的个人数据收集方法要比Mass Observation方便多了!

《数据之美》的笔记-第122页

什么《数据发现数据》
这个垃圾文章
总是在说系统应该怎样、能够怎样
却对技术细节什么也不谈
这说明作者是个满嘴胡吹的家伙
另外
他所举例的用处不是为广大的用户带来利益
而是如何帮助赌场发现作弊行为
——这也tmd太恶心了

《数据之美》的笔记-第112页

并生成一条即时报警信息:5764号员工和4400321号被逮捕人有相同的电话号码!
这个场景很生动,经常在犯罪心理里看到,而且计算量也不大,我们的工作里也可以弄这么一套发现系统。

《数据之美》的笔记-第9页

异步数据收集
YFD 通过解析文本时间,解决不能及时上传数据的瓿
PEIR 通过缓存把数据存储在手机本地的内存,直到手机可以重新连上网络才上传数据,解决网络连接不可能100%存在的问题。
存在的问题是:期望人们在事件发生时收集数据是不合理的。人们会忘记或者不方便收集数据。因此,提供用户在后期也能够输入数据的功能是很重要的,这一点又反过来影响了数据流的下一步设计。

《数据之美》的笔记-第110页

数据发现数据
实时发现的好处
立足于“数据发现数据”的高级信息管理系统,不会依赖于用户向计算机凭空提出正确的、相关的和即时的问题。


 数据之美下载 更多精彩书评


 

外国儿童文学,篆刻,百科,生物科学,科普,初中通用,育儿亲子,美容护肤PDF图书下载,。 零度图书网 

零度图书网 @ 2024