公司新闻:
大数据新闻:
大数据预测的世界杯冠军就是这支球队! 你相信吗?
世界杯来了! 相信最近不少球迷都熬夜看球了。 就连小檀这样的伪球迷也被世界杯的氛围感染了。 今天我们就来说说本届世界杯的新玩意儿和新技术。 小谭将世界杯上的这些新技术分为两类:视觉辅助和数据驱动。 我们先来说说视觉辅助,然后是数据驱动,最后看看大数据喂养的机器学习的“神奇计算器”。 本届世界杯冠军由谁计算?
视觉助理裁判员
视频助理裁判(Video,简称VAR)可能是今年世界杯最精彩的部分! 今年的比赛将首次使用VAR作为裁判的额外助理。 VAR技术由一组位于远程视频室的助理组成,他们将使用视频技术帮助裁判做出决定。 说起这些视频助理裁判,可真是“大腕”。 它们仅在可能决定比赛结果的关键时刻使用,例如是否进球、是否需要红牌等等。 首先,裁判决定是否使用VAR。 如果裁判认为有必要使用VAR,VAR远程协助团队会在幕后播放视频,然后通过裁判佩戴的耳机将结果传输给裁判。 此时,裁判有两种选择:如果选择完全信任VAR,则裁判直接做出判定; 如果裁判仍有疑虑,可以在场边再次观看视频再做出决定。
观看场边VAR裁判发送的视频
本届世界杯,VAR备受瞩目,屡屡展现其威力。 尤其是在6月22日巴西与哥斯达黎加的比赛中,VAR对比赛的比分产生了决定性的影响:在裁判判罚点球后,根据观看VAR回放显示,裁判再次取消了点球——这是世界杯前所未有! 巴西著名球员内马尔当时正试图踩球。 在遇到哥斯达黎加中后卫冈萨雷斯的防守后,两人发生了身体接触。 内马尔惨叫一声,倒在禁区内动弹不得。 因此,主裁判第一时间判罚了点球。 不料哥斯达黎加球员强烈抗议,裁判只好到场边观看视频重播。 然后意想不到的一幕发生了:回到场上后,裁判宣布之前的点球取消! 这确实是人们所做的,VAR也在看着。 如果VAR早几十年出现,不知道1986年阿根廷对阵英格兰的“上帝之手”、2002年韩国世界杯韩国对阵西班牙等比赛的历史是否会被改写。
那么,VAR是如何获得这些图像的呢? 这要归功于分布在整个场上的33个摄像机:VAR的鹰眼系统是由英国Roke Manor开发的。 33个广播摄像机中,8个是慢动作摄像机,4个是超慢动作摄像机。 但事实上,我们观看的足球比赛直播,只是33个摄像机中的31个的镜头转播。 剩下的2个是VAR的专属摄像头,只有VAR才能看到里面的内容。 淘汰赛阶段,每个球门后面会再安装两个超级慢动作摄像机,只有VAR团队才能看到。
有趣的是,根据国际足联的规定,慢动作摄像机主要用于对客观事实情况的争议,比如手击球的位置; 以及主观判断——例如一个动作有多犯规,或者手球是否是故意的。 - 只能使用正常速度的摄像机。
说完视觉助手,现在我们来说说本届世界杯的另一个新趋势:数据驱动。
电子健身追踪器:电子健身追踪器,也称为EPTS(和)。 它可以跟踪每个球员的位置和足球的位置,还可以与加速度计和心跳监视器等微机电设备配合,尽可能全面地收集球员的身体信息。 收集到的信息通过专门的渠道和设备发送给各队的技术人员和队医进行决策。 放置此追踪器的最佳位置在哪里? 有三种选择,各有利弊: 将其安装在球场高处 | 优点是可以概览,不会影响玩家,收集的数据也很全面; 缺点是视野有时容易被障碍物遮挡,组装时间稍长; 紧邻球场| 例如,安装在球门附近或球场边缘白线附近。 这种方法采集的数据比较全面、准确,但缺点是位置固定,比较刚性。 安装在播放器上 | 或者可以将 GPS 芯片贴在球衣上。 这样做的好处是安装时间短,而且不像前两种方法需要专人操作,非常方便。 GPS芯片只能将收集到的数据发送给卫星。 缺点是可能会干扰玩家的游戏过程。 收集这些数据主要是为了分析球员的表现和身体素质。 有了这两个数据,教练和队医在做出“是否改变阵型”、“是否替换该换下并放在替补席上”等重要决定时,不再需要依靠猜测。 不仅如此,电子健身追踪器还可以提高效率,减少运动员因体力不足而可能遭受的伤害。 虽然美国国家队今年没有资格参加这项比赛,但美国足协已经开始备战2022年卡塔尔世界杯(巧合的是!我们中国男足也在备战2022年卡塔尔世界杯)。 美国足球协会最近与一家 GPS 跟踪设备公司签署了一项价值 15 亿美元的协议,以监控其 400 万注册足球运动员。 从青年联赛到国家队,这些球员都会使用APEX运动监测设备,该设备可以跟踪球员的各种数据:跑步距离、速度、加速度、减速度、负荷和心率等。
梅西穿着装备
美国可以在训练中使用这些装备,但不知道这对于那些怀揣足球梦想、在贫困地区尘土飞扬的小路上踢着矿泉水瓶的孩子们来说,或许不是什么好消息。 先进的装备固然可以极大地提高一支球队的成绩,但也可能让来自经济欠发达地区的球队更难出人头地。 毕竟,无论是更先进的VR技术,还是强大的数据分析,都需要经济和技术实力来支撑。 通过收集和分析某个球员的数据,我们可以对他的身体素质、技术等有更详细的了解。但说到数据的应用,相比只有教练和专业人士关心的技术分析,更重要的是令人兴奋的是预测比赛结果。 机器学习能否比章鱼更准确地预测比赛结果? 我们花了很多精力来预测比赛的结果。 章鱼保罗,正确预测了 14 场比赛中的 12 场:但归根结底,这些所谓的“预测”几乎只是猜测。 在机器学习技术飞速发展的今天,用机器学习来预测世界杯的结果会不会更准确呢?
《麻省理工科技评论》报道称,如果用近年来发展起来的机器学习技术来预测世界杯结果,很可能比主要依靠猜测的传统预测更加准确! 科学家们用来预测本届世界杯结果的方法被称为“随机森林法”( )。 就像一棵树从树干到最后的树枝一遍又一遍地一分为二,如果比赛的最终结果是树顶端的一根树枝,那么树的每一个分叉都对应一个关键节点(谁输了)并赢得比赛),并且通过参考一组训练数据,机器学习可以估计每个分支的潜在概率,从而“预测”本届世界杯最终获胜的球队。 大多数“决策树”后来都会因为太多不可靠的因素而影响决策模拟结果的准确性。 这些决策因不一致且分散的训练数据(data)而扭曲,这种现象称为“过度拟合”()。 “随机森林法”试图通过多次计算随机分支的结果来使结果尽可能准确。 “随机森林法”取多个随机决策树的平均值来绕过“过拟合”。 在这个研究“谁能获胜”的模型中,我们可以想到一些需要考虑的因素,比如球队的FIFA排名、球员的平均年龄、球队中有多少球员参加欧冠等等因素。 除了这些有助于预测结果的明显因素外,该模型还包括看似微不足道的因素,例如国家人口、国内生产总值,甚至教练的国籍。 该团队模拟了整整10万场足球比赛,并根据2002年至2014年所有比赛的结果使用了三种不同的建模方法(数据可以说是足够的)。
这样预测的本届世界杯冠军是……
西班牙!
根据预测结果,西班牙获胜的概率为17.8%。 如果这个概率不是很“有把握”的话,这个预测说西班牙进四强的概率要高很多,足足73%! 可以说是相当有信心了。 而这项研究对卫冕冠军德国队的预测是:“很难说能否小组出线,但如果小组赛不被淘汰,德国队进入半决赛的机会高达58%。” 这让小檀想起了一周前墨西哥1-0击败德国的时候,中外媒体几乎都用了“爆冷”这个词。 这一结果在一定程度上证明了本研究的准确性。 幸运的是,在今天凌晨的德国与瑞典的比赛中,德国坦克终于大显神威,2-1战胜了瑞典! 这就是德国坦克的精神! ! ! 德国球迷的情绪终于发生了变化。
不过,按照这种计算方法,中国男足来自人口大国(加分),中国GDP也是世界第二(加分),但连世界都摸不着杯赛……这个模式难道不适用于中国男足吗? 话虽如此,如果机器学习的预测方法在本届世界杯上被证明是准确的,恐怕会对博彩行业产生重大影响。 小谭奉劝大家:享受游戏,保管好钱包,赌博要小心……
当社交大数据遇上心理学,你能通过朋友圈了解你的心态吗?
社交媒体数据不仅有阴暗面,许多神经学和心理学研究也开始利用人工智能和社交媒体数据来利用机器来应对人性。
在人工智能的发展过程中,AI+全大数据似乎能够提高效率,获得理想的结果。 但只有一件事与人工智能结合时会造成很多负面影响,那就是社交媒体数据。
我们习惯于在社交媒体上表达情感、表达兴趣爱好,甚至不经意间泄露自己的个人信息。 作为普通人,即使知道这里是空地,也不会有数据泄露的印象。 毕竟,大多数社交媒体中信息展示的权重都是基于信息的受欢迎程度。 普通用户很难对他们的个人言论感到陌生。 人们故意看到。
但随着AI带来的超强算力和数据分析能力,一切都变得不一样了。 AI+社交媒体数据爬取数据后,不仅可以看到一个人对事物的反应、情绪、表情,还可以看到整个群体甚至整个族群的相关信息。 前段时间差点崩盘的信息泄露丑闻,一定程度上说明了大量零散的个人信息在人工智能面前可能带来的负面后果。
然而社交媒体数据不仅有阴暗的一面,许多神经学和心理学的研究已经开始利用人工智能和社交媒体数据来利用机器来应对人性。
推特大数据告诉你,半夜装模作样,全世界的人都是一样的。
近日,布里斯托大学利用机器学习分析了四年来来自英国 57 个城市的 8 亿条推文,得出了一个我们思考已久的结论——人类普遍早上情绪高涨,情绪低落。在深夜。
整个分析过程就是这样。 研究团队通过搜索 API 进行采样,收集了 8 亿条推文。 然后从中删除所有#、表情符号、节日问候等,并根据心理测量方法对单词进行标记。
有了这种严格基于心理学研究维度的机器学习模型,对社交媒体数据的研究将更加专业,而不是简单地依靠NLP来分析语言和文本中的情绪。
研究的最终结论是,一天24小时内,人的情绪不仅会发生变化,思维模式也会发生变化。
一天中的5点到6点,人们开始进入社交媒体上的表达高峰期,此时人们更加积极地表达自己的情绪,更加关注自己的个人状态。 随着时间从7点到9点,人们的情绪开始向愤怒倾斜,但如果是非工作日,这种积极、快乐的状态就会持续下去。
这时,人们的思维方式趋向于范畴思维,想法更加清晰、更加直接、更加符合逻辑。 与此同时,刻板印象也有出现的趋势。
深夜,人们的情绪表达会变得消极,焦点会从个人转向社会方面。 随着时间的推移,越接近第二天凌晨3-4点,人们的注意力就越集中在宗教上。 这一时期,人们的思维模式趋于存在主义,体现出一种迷茫、焦虑、非理性的状态,并且更愿意参与和分享。
说得更直白一点,一个人的一般状态就是早上醒来,充满热情和信心,像打了鸡血一样规划自己的人生。 到了晚上,他开始心情郁闷,胡言乱语,关注着世界各个角落正在发生的事情。 如果人们感到悲伤或被事情感动而深夜无法入睡,他们就会开始寻求宗教救赎。 你看,这个过程对于中国人和外国人来说是一样的吗?
当社交媒体成为心理研究助手时,仅凭一张自拍照就能诊断出疾病吗?
事实上,人类情绪的时间周期变化早已被证实。 由于神经疲劳、褪黑激素分泌等生理原因,我们的情绪在一天中会呈现出不同的状态。
虽然这项社交媒体大数据研究只是再次证实了这一变化,并没有揭示更多情绪变化的原因,但首次发现情绪周期与思维模式变化之间的联系。 事实上,关于社交媒体数据和心理学的研究还有很多,并从中挖掘出很多有趣的信息。
例如:去年,匹兹堡大学对抑郁症患者社交媒体的使用情况进行了一项调查。 结果发现,抑郁症患者使用社交媒体的平均时长远高于普通人。
哈佛大学的研究表明,抑郁症患者在社交媒体上发布照片时更有可能使用冷色、褪色或黑白滤镜。
牢不可破的道德壁垒
目前,社交媒体数据在心理学中的作用似乎仍停留在学术研究中。 我们能看到社交媒体数据在我们一生中的心理应用吗?
目前,社交媒体数据至少可以通过以下方式应用于心理学:
1.作为心理状态测量的辅助工具
除了那些直接导致幻听、失眠等的精神疾病外,还有很多类型或程度的精神疾病是很难客观感受的。 大多数时候,是通过面对面咨询或填写心理状态测量表来确认的。 然而,患者自行填写时可能无法直接表达自己的真实状态。 这时,社交媒体上透露的信息无疑可以起到支撑作用。
2、群体心理状态评估
与个人的心理问题相比,整个群体所经历的情况更为复杂。 例如:灾难和事故期间发生的精神状态变化。
例如:公司或学校员工/学生自杀,或者整个地区遭遇地震、台风等严重自然灾害。 这个时候我们往往没有精力为大家提供心理疏导,也没有办法评估整个群体的心理状况。 顶多可以通过集体课的形式给集体提供心理疏导。
这时,通过使用机器学习来研究社交媒体数据,就可以清楚地看到群体对事件的心理状态反应。 甚至对人们的心理状况进行长期跟踪,有选择性、有针对性地提供心理咨询。
哈尔滨工业大学曾提出一种通过建立分类器来研究大学生社交媒体数据来识别抑郁症概率的方法。
事实上,上述应用方法在技术上实现起来几乎不困难。 尽管结果可能并不绝对准确,但对于心理学这个劳动密集型行业来说,它能提供的价值是巨大的。
但最大的问题是道德。 公开发布的社交媒体数据是否应该被视为个人隐私? 从中提取的信息算不算个人隐私? 即使是精神疾病患者,公民也应该有不公开自己病情的权利。 是否严重侵犯了这项通过社交媒体数据发现公民心理健康状况的权利? 尤其是如果这项技术应用到大学群体中,一些人的心理状况会不会因为周围的老师和同学通过这种方式了解自己的心理状态而变得更糟?
其实,在某种程度上,我们有时会刻意选择低效的方式来解决问题,但却可以换来精神上的安全和自由。