读书笔记2014年第1比照:《赤裸裸的统计学》

作watchguard正式员工,现发布企业日前之招贤纳士信息,待遇优厚,请符合条件的对象以及本人关系并以简历关自己,我会尽早联系店家人工部门。

适度从紧的说这本书是在2013年12月失去新疆的机上起来看之,前面几节说得较浅,几乎从不什么公式,后面读起来就生硌不顶好了,里面的有统计的例证十分有趣,第9、10、12章涉及到有些概念与公式,就得逐步掌握了,总体看来这按照开要非常适合统计学入门,拥抱大数额时代!

自之邮件:daibao91888@163.com

第1节 统计学是很数量时最好炙手可热的学识

上学统计学的意义是啊?用自自己之话语来说,可以被我们不受淹没于宽阔的数据海洋遭到,而在其间搜有体现该真相之规律或相关性来。

以未来10年内统计学家将见面化“性感的生意”。

作者列举了有的例证来说明统计学的用途:棒球选手的击球率,学生的平均成绩,用小概率事件来鉴别考试舞弊,吸烟和癌症发生相关性吗,哪些人太有或是恐怖分子?

统计学还如是暗访们开的转业,数据里隐藏在头脑和模型,沿着这些线索及模型,我们最后会获得有含义之结论。

统计分析好查找到2只变量之间的相关关系,但未意味着双方发生因果关系。

ACTION:看看影视《犯罪现场调查:回归分析》

ACTION:看《统计数字会撒谎》

博客:http://www.cnblogs.com/kungfupanda

第2章 描述统计学

即等同章从简单的平均数(mean)的定义讲起,然后说交中位数(meadian)、百分位数,再介绍标准差(sd,standard
deviation)、方差(var,variance)。对于其他一样组数的话,只要掌握了平均数和标准不同,我们便会展开简易的统计学分析,得出有方可凭借之下结论。

平均数很易受到特别值的干扰;中位数对怪值并无灵动。

欲指出的凡写中之正儿八经差公式的分母是N,而要统计数据是样本时,分母就要用N-1。

对于表2-2挨的首先组数字,用R语言分析一下:

a<-c(74,66,68,69,73,70)

sd(a)

会面沾3.03315,而非是开中的2.8。

 

第3节 统计数字会撒谎

马克吐温的相同词名言:“谎言来三种植:谎言、该特别的谎言,以及统计学”

小心统计陷阱。即使极精确的计量还是测量都该检查一下是否顺应常识。

平均数和中位数同样会给心术不刚之总人口采用。

“某平等策略以使9200万人分享减税待遇,人均减税超过1000头。”小心这里的“人均”,少数底富翁会大幅减税,会拉大平均值,而多数人数只是减税100长。

统计的时间跨度较充分时,要考虑“通货膨胀”这个至关重要因素。

纽约州之“记分卡”制度,对领心脏搭桥手术的病人的死亡率进行统计,并于公众公开,以便为民众选择医生时生一个参阅。但如此一个“好”政策,却促成了重多病人的死亡。因为,降低死亡率的太简便易行的方法尽管是拒绝为那些病情严重的患儿动手术。

 职位:

第4节 相关性与相关系数

相关系数为一个-1至1次的屡屡,负数表示因连带,0.8-1.0:极强相关,0.6-0.8:强相关,0.4-0.6:中等档次有关,0.2-0.4:弱相关,0.0-0.2:极弱相关或任相关。

旋即同一章后面第79页的事例,我于是R语言算了瞬间:

height <- c(74, 66, 68, 69, 73, 70, 60, 63, 67, 70, 70, 70, 75, 62,
74)

weight <- c(193, 133, 155, 147, 175, 128, 100, 128, 170, 182, 178,
118, 227, 115, 211)

打散点图:

plot(height, weight)

图片 1

算算相关性(这里是因此的皮尔逊Pearson相关系数)

cor(height, weight)

得到结果:0.8260258

好为此cor.test得到更详实的消息:

cor.test(height, weight)

结果:

        Pearson’s product-moment correlation

data:  height and weight

t = 5.2841, df = 13, p-value = 0.0001479

alternative hypothesis: true correlation is not equal to 0

95 percent confidence interval:

0.5439174 0.9403758

sample estimates:

      cor

0.8260258

 

No.

第5段 概率与期望值

涉了三只概念:概率、期望值同运定理。

打统计学角度,购买保险是相同桩“糟糕的投资”,因为平均来拘禁,你付出被保险企业的钱永远使比较得的赔付多,所以特需要呢那些无法轻松承受之竟及保险。

Location

第6章 蒙提•霍尔悖论

叙了一个选1、2、3声泪俱下门遭到大奖的诙谐之几率问题,你针对概率的本能理解可能会见用你引入歧途。

Dept.

第7节 黑天鹅事件

从美国经济行业风险价值VaR模型的倒台,谈到有的广阔的跟概率有关的一无是处。

思当地觉得事件期间无存关联。两只飞机发动机来故障或连无是彼此独立的轩然大波。一个家家遭遇生出多从婴儿猝死案,可能无自然谋杀,而可能与基因有关。

对少桩事件之统计独立一无所知。“赌徒谬论”。连抛了8坏正面,下次方正的几率仍为50%。投篮里没有“手感”之说。

检方谬误的DNA的例子没看明白。

统计性歧视。男女的保险费不等同,是缘于统计模型。

HC

第8章节 数据及偏见

挥洒被说了成千上万栽偏见,但再有效的凡“选择性偏见”,要想赢得一个大概随意取样的样书并无容易。其它几种植偏见我没啊感觉:发表性偏见、记忆性偏见、幸存者偏见、健康用户偏见。

Job Grade

第9回 中心极限定理

样本<—>总体。一个特大型样本的不错抽样与那所表示的群体在着相似关系。

样本平均值是适合正态分布之。

书中第164页为起之标准误差公式是荒唐的,不知底是翻译的错或印刷的题材,少了一个除号,应该是:SE
= s / sqrt(n)

无独有偶有同等份孩子均年级数学成绩,全年级平均约为94分开,用R语言试试中心极限定理,可以见见样本的平均值是遍布在94旁边。

(对于小型样本,得不顶正态分布,而是t分布)

 

图片 2

# 读入成绩才

score <- read.table(“scores.txt”, header=TRUE)

 

# 试验100浅,每次随机抽取60号称学员

mean.samples <- NULL

for(i in 1:100)

    mean.samples <- c(mean.samples, mean(sample(score$math,60)))

 

hist(score$math)

hist(mean.samples)

 

Core Tech Skill

第10章 统计测算与假设检验

统计学无法确凿地证实外事物,统计测算的能力在:先发现有些法则与结果,然后还使用概率来证明这些结果的冷最为有或的原因。

零假设(也叫做虚无假设,Null
Hypothesis),零假设的内容相似是盼征其左的使。

要是能够证明有零假如不成立,那么该相对假设(又曰备择假设Alternative
Hypothesis)肯定为真正。

写中有关亚特兰大统考作弊丑闻、自闭症脑量的2单例值得看。

置信区间在一个业内各异内也68%,两单正规不同内啊95,三只正式不一内为99.7%。

图片 3

Work experience

第11回 民意测验及误差幅度

民间测验一般还见面获取一些百分比较结果。关于百分比的标准误差 = sqrt( p *
(1-p) / n),p为某种观点的百分比。

个中关于美国大选民意测验的例证,对我们尚无什么意义,民意测验的真挑战有星星点点只:设计并选取正确的样本(人群的选料、问题之挑选、受访者会不见面是于说假话,或是敷衍了事);用合适的章程由该样本被获得合适的音讯。

 

1

第12段 回归分析和线性关系

回归分析会当决定其他因素的前提下,对某个具体变量和某特定结果里面的关联展开量化。

在R语言中lm可以轻松地进行线性关系之拟合,我将一切年级的情理和数学成就进行线性回归分析:

phy.math <- lm(phy ~ math, score)

plot( phy.math )

汲取了几幅专业的图样,可惜我小还看不亮。

图片 4

一个经验法则:当回归系数至少是标准误差的有限倍增或以上的时候,该系数极有或具备统计学意义。(还无顶知道)

本章的末段被起一个坏好玩的统计结论:对政府有的男性还是女性来说,对工作不够控制力和话语权会导致心脏病。

Beijing

第13章节 致命的回归错误

回归分析的7只常表现错:

1)用线性拟合来分析非线性关系

2)相关关系并不等于因果关系

3)因果倒置

4)遗漏了关键的分解变量

5)存在高度相关的少单说明变量

6)脱离数据进行测算。忘记了前提条件或适用范围,而胡套公式。

7)数据矿(变量过多)。假如变量过多,尤其当无关变量过多的时,回归分析的结果就是见面于软化或稀释。

Networking

第14段 项目评估以及“反现实”

精心设计出同组试并无绝好。

1

software engineer  II / staff/ senior staff

Linux环境下 C开发 ,熟悉 TCP/IP
商讨栈;了解二重合协商及行程由于协和;了解防火墙

4-8 years

2

Foundation

1

IOS developer II / staff

熟识 Ios的开销流程

3-5 years

3

1

Android developer II / staff

习 Android的出流程

3-5 years

4

1

software engineer  II / staff

Linux
环境下C开发,有网编程经验,熟悉常见网络协议;能够通过抓包工具抓包并分析

4-8 years

5

Platform

1

software engineer  II / staff

Linux 环境下C开发,熟悉Linux OS以及基本技术;熟悉无线驱动技术与防火墙

3-8 years

6

Chengdu

Mobile QA

1

IOS QA II / Android QA II

熟识 Ios或Android的测试流程,熟悉网络协议 

2-5 years

7

1

QA engineer II

深谙Linux系统,熟悉网络协议和装置,脚本开发 

2-5 years


 

公司简介

WatchGuard公司,
自1996年始于就也世界范围外数以百万底公司提供可靠的、易于管理之安全设备。WatchGuard公司Firebox
X系列UTM产品和缓解方案,融合了健全的、可靠的、多层的安全特点,加之良好的易用性,使该于同类产品中典型。WatchGuard所有产品受到还饱含
LiveSecurity® 安全服务,为客户提供了独树一帜的劳务支持和维护程序。
WatchGuard
现在啊民用企业,总部设于美国华盛顿州西雅图,在北美,欧洲,亚太地区及拉丁美洲且开设了分支机构。更多信息,请浏览
公司网站http://www.watchguard.com/.

 

Since 1996, WatchGuard Technologies has provided reliable, easy to
manage security appliances to hundreds of thousands of businesses
worldwide. Our Firebox X family of unified threat management (UTM)
solutions provides the best combination of strong, reliable,
multi-layered security with the best ease of use in its class. All
products are backed by LiveSecurity?Service, a ground-breaking support
and maintenance program. WatchGuard is a privately owned company,
headquartered in Seattle, Washington, with offices throughout North
America, Europe, Asia Pacific, and Latin America.For more information,
please visit www.watchguard.com. 

 

Watchguard公司简介:

WatchGuard® 成立于1996
年,公司总部位于美国的西雅图,是世界领先的赛效率以及统系列Internet
安全方案供应商,UTM(统一威胁管理)市场占有率全球第一各类,防火墙/VPN市场占有率位居世界前五各项。在北美、南美、EMEA
和亚洲等地是办事处,全球员工总数大约450 多称呼;所销售的安产品已超越50
万模仿。

  2004 年,WatchGuard® 公司当华夏主次成立了上海、北京办事处。从2004
年至今日,已经也6000 多用户提供超过总计2 万台WatchGuard® 的UTM
产品,在金融保险、制造、交通、通信、教育等行业和多的跨国公司和政府单位成功之推行下。

Leave a Comment.