读完了今天的这篇文章,主页君不禁想起了那一年,自己告诉爸妈自己要出国的时候,高了好几倍的学费并没有让收入平常的爸妈犹豫,雅思也只是靠运气勉强上了7,出国前的机场看着妈妈红了眼眶话不多的老爸变得更沉默了。我却满心期待和憧憬,后来却只剩下了繁重的压力和对家的渴望。
接下来学霸君还会更加努力给大家带来考试干货、学霸技能、和备考经验的!快来点击标题下方的北美学霸君关注我,么么哒!
2月14日情人节听起来就是一个甜蜜的节日,但是对于美国佛罗里达州的人们来说,2018年2月14日却不是一个充满甜蜜和爱意的日子。
就在当地时间2018年2月14日下午,位于美国佛罗里达州东南部城市帕克兰的Marjory Stoneman Douglas High School,发生严重枪击事件。
被这所学校开除的「问题少年」尼古拉斯·克鲁兹携带枪支、烟雾弹等装备,闯进学校开枪射杀17人、致伤多人,逃跑后不到两小时被捕。
这是过去五年来美国发生的第10起大规模枪击案(大规模枪击事件通常被定义为至少有四人在一次事故中丧生)。消息一出,全球震惊。美国的民众在哀恸之余,关于美国枪支和校园安全的问题又一次被提上了议程,亟待解决。
一直以来,美国作为全球顶尖的教育大国,吸引了无数留学生前往。但是,当离开家乡踏上美利坚合众国的土地,人身安全才是最重要的。
通过智能摄像机扫描面部,利用基于AI的人脸识别技术进行预测分析,然后就可以帮助警察提前预测罪犯,这听起来有点耸人听闻,但这一切都在发生着。
2013 年,艾瑞克·卢米斯因为偷车被美国威斯康辛州的法院判处了 6 年的有期徒刑。
他偷来的车曾经参与过一场枪击案,车尾箱里还有枪。警方原本以为是人赃并获,结果查清楚是误判,卢米斯其实并没有参加持枪犯罪,只是刚好偷了一辆有过犯罪记录的车。如果只是犯了偷车,根据威斯康辛州的法律,刑期最多是入狱三年,然后还有三年是出狱监视。
但法院还是给卢米斯判了更重的刑罚。法庭的量刑参考的是一套名为 COMPAS 的人工智能算法。这个十分制的“打分”机制被美国司法部用于判断有过犯罪纪录的人未来犯罪的几率。
卢米斯在偷车之前,曾经因为性犯罪入狱。上次入狱的时候,COMPAS 算法当时给他打了一个高分。这次,这个分数被威斯康辛州法院当作参考数值了。
卢米斯提起上诉,要求公开算法是对他评分的机制,他认为评分细则里有性别等参考因素。
这个要求遭到了法院的拒绝:他们认为给罪犯做打分分析是自从 1923 年就开始有的事情,而且这个算法是开发方 Northpointe 公司的知识产权,所以不能公开。而对于卢米斯的考量除了算法还有别的机制,所以是公平公正的,就在今年 5 月 23 日,法庭驳回了上诉,维持原判。
去年,非盈利调查机构 ProPublica 从警方处拿到 1.8 万 COMPAS 评分数据,然后做了一份调查报告,追踪这些人在两年来的再犯罪的记录。
最后出来的结果是:
穷人更容易犯罪;
教育程度低的人更容易犯罪;
黑人更容易再犯罪;
男性更容易犯罪。
从统计数字看,这些可能都是事实。但这样的数据被反过来用在判断一个个体未来犯罪的可能性,并就此量刑的时候,就有问题了。
有一个关于科研的比喻,说科学家在研究新东西的时候容易过度分析自己已经有的信息,强行从中获得结论,进而忽视了未知因素的影响。
一个人在室外停车场丢了钥匙,他首先会去看路灯照耀下的路面。这不是因为钥匙更可能丢在路灯下,而是因为这里比较容易找。人工智能算法判断一个人的犯罪可能也差不多。
MIT 教授 Ethem Alpaydin 曾经这么解释现在最新的机器学习的原理:学习就是,现在计算机自己学会处理和识别这些数据,程序也是自己写的,然后导出你所需要的结果。要做一个判定谁是罪犯的系统。首先,是这个机器学习算法的在判断“什么样的人更容易犯罪?”然后再把不同原因分解开来,去搜集数据。一个人犯罪的可能性有千千万万,这就需要更多的数据集来补充。
在国内,一个科研团队用机器学习算法和图像识别技术扫描了 1856 张中国成年男子的身份证照片,让算法来判断这个人是不是罪犯,称成功率达到了 90%。
来自 Google 的研究者 Blaise Aguera y Arcas 解释,神经网络算法“判断”图片的方式跟人不太一样:给数百万个学习参数加不同的权重。比如让算法判断一张图片是来自什么年代,机器学习很可能学到了发现各种细微线索,从比较低层次的“胶片颗粒和色域”到衣服和发型,乃至车型和字体。
所以,人工智能、机器学习到底从这 1000 多张身份证照片中学到的规律是什么?
近期,我们联合了加利福尼亚大学洛杉矶分校的博士,推出了犯罪率的预测与地图可视化科研课题,本课题将着重探索机器学习在预测犯罪率分布中的应用。
通过整合海量的美国大城市历史犯罪数据,社区环境数据及人口数据,运用预测建模方法寻找地区犯罪率分布的规律,最终建立自动预测未来犯罪率趋势的模型,并且运用数据可视化方法制作互动式电子地图来呈现历史数据和预测结果。
科研课题:犯罪率的预测与地图可视化
Crime prediction and visualization in mapping
机器学习 概率 统计 编程 线性代数
人工智能 数据科学 大数据 数据可视化
导师:加利福尼亚大学洛杉矶分校 博士
UCLA 计量心理学Ph.D毕业,研究生毕业于UCLA计量心理学,本科毕业于北京大学心理学。
现任UCLA 健康政策研究中心首席统计师,钻研加州地区健康数据分析,并带领统计团队进行统计工作。
发表多篇SCI论文,并且担任SCI期刊Statistical Methods in Medical Research 的审稿人。
具有多年带教经历,曾任UCLA心理系Teaching Fellow,独立主持实验室和讨论课程。
课题研究方式
整个科研教学流程中,每一位学员都将有学术督导协助保障研究阶段性作业和论文的进度,确保取得研究成果。
科研课题报名须知
本项目课题研究仅限 2 个名额
注:本课程采取审核制招生,我们将通过两轮面试评估课程匹配度,最终确定入选的学生名单。
符合以下条件的学生皆可申请参与此项目:
就读 9-12 年级学生
有一定的英语阅读和写作能力
有较强的逻辑思维和抽象思维能力
专业领域的零基础学生,我们会提供相关的学术知识培训。
课题要求
英文:能够查找和阅读英文资料,如网上的编程教程、课件等
数学:
- 概率统计基础知识
- 线性回归、逻辑回归
计算机:
最好有一定的计算机基础,并最好项目开始前基本了解,开始后1-2周强化掌握以下编程技术:
- Python编程基础
- pandas库基础
- scikit-learn库基础
- R shiny程序包
- R tidyverse程序包
课程咨询
有方学者--最有价值的科研课题
ID:embarkchina
长按识别,咨询课题
点击阅读原文,立即报名
*市场推广
上一篇:如何一眼看出留学狗的专业?光看日常穿搭就够了,准确率99%
下一篇:3月10日托福考情回顾:史上最简单的一次,终于分手快乐!