2018-07-18 22:26 算法工程师

关注

笔记《数据算法Hadoop/Spark。。。》1.二次排序

二次排序问题是指在归约阶段对其中一个键关联的值排序。有时这也称为值键转换。利用二次排序技术，可以对传入各个归约器的值完成（升序或降序）排序。
首先，我们会重点介绍MapReduce/Hadoop解决方案：

    map（key1，value1）-----list（key2,value2)

    reduce(key2,list(value2))-----list(key3,value3)

首先，map（）函数接收一个键-值对输入（key1,value1).然后它会输出任意数目的键-值对（key2，value2）。接下来，reduce（）函数接收另一个键-值对（key2,list(value2))作为输入，并输出任意数目的键-值对（key3，value3）。
现在考虑下面的键-值对（key2,list（value2）），这会作为归约器的输入：

    list（value2）=（V1，V2，....,Vn)

这里，归约器值（V1，V2，...,Vn)是无序的。
二次排序模式的目标就是让归约器接收的值有一种顺序。这样一来，对MapReduce范式应用这种模式时，就可以得到：

    SORT（V1，V2，...,Vn)=(S1,S2,...,Sn)

    list(value2)=(S1,S2,...,Sn)

在这里：

    S1<S2<...<Sn(升序)，或

    S!>S2>...>Sn(降序)

二次排序问题解决方案：

1.使用值键转换模式：构造一个组合中间键（K,V1)，其中V1是次键。在这里，K称为自然键。要在归约器键中注入一个值（即V1），只需要创建一个组合键。
2.让MapReduce执行框架完成排序（而不是在内存中排序，要让框架使用集群节点来完成排序）。
3.保留多个键-值对的状态来完成处理，可以利用适当的映射器输出分区器来实现这一点。

实现细节

要实现二次排序特征，还需要另外一些Java插件类。我们要告诉MapReduce/Hadoop框架：
如何对归约器键排序
如何对传入归约器的键分区（定制分区器）。
如何对到达各个归约器的数据分组。

#笔记##读书笔记#

全部评论

推荐最新楼层

算法工程师

【求救】机器学习笔试题_技术交流_牛客网 https://www.nowcoder.com/discuss/87027

点赞回复

发布于 2018-07-19 14:06

章鱼哥爱吃蟹黄堡

昨天 20:56

已编辑

北京理工大学计算机类

找个小厂算法实习都好难啊

今天面了个游戏厂，除了深挖项目细节外，直接就是手撕MQA，GQA、旋转位置编码😂准备的还是不够充分啊，感觉已经凉了，小厂日常实习要求这么高么，还是太菜了。

实习工作，你找得还顺利吗？

点赞评论收藏

转发

04-29 20:05

已编辑

联想_Golang后端(准入职员工)

【联想暑期OC】绷紧的弦终于是松了~

腾讯面试最开始投递的是腾讯的实习基地项目，在寒假的时候就投了，但是在三月初的时候一直没有收到消息，以为是没戏了，并且当时还没有进入复习状态，就想着先放放松、旅旅游。但是，直到 3 月十几号的时候，鹅厂把我捞起来面试了，我的春招处女面就这样开始了：全程接近两个小时，深挖项目，三道编程题，心态小崩小鹅面试面完鹅厂之后，不出所料挂了，然后就是想着先学习沉淀一下。一直到三月末的时候，投递了联想，还有一些中小厂，后面在四月初的时候约到小鹅通的面试：一面是技术面，自我感觉回答的不错，hr 当天晚上就打电话来约第二天面试；二面是部门主管面，不算是技术面，更像是hr面，问了很多抽象问题，没有回答好，很...

投递联想等公司7个岗位 > 联想求职进展汇总第一次面试

点赞评论收藏

转发

图图图图图个钉

03-08 16:11

门头沟学院计算机类

刚聊几句就要免费帮我指导简历了，真没意思

点赞评论收藏

转发

努力了就不后悔

04-06 21:08

东南大学电子信息类

球球各位大佬帮忙批一下简历吧

26届研一，想找日常实习，没过六级，没竞赛，没论文，八股刚开始背，所以专业技能方面有点夸大，知道自己学的不好比较菜，求各位大佬指出简历中的问题，万分感谢。引流：腾讯、阿里、字节、美团、快手、华为、Java#腾讯##华为实习##Java学习##字节##美团##快手##阿里#

点赞评论收藏

转发

我会找到实习的

04-29 19:52

沈阳理工大学电子信息类

5月就剩国企实习了

近期国企实习大开，在急招，都是学历厂，友友们的实习机会终于来了

点赞评论收藏

转发

点赞 3 评论

招聘动态

滴滴

2025届秋招储备实习生招聘

全站热榜

正在热议

# 牛友的五一计划 #

26185次浏览 467人参与

# 市场营销面经 #

1709次浏览 79人参与

# 牛客帮帮团来啦！有问必答 #

416817次浏览 7998人参与

# 晒一晒我的offer #

2859465次浏览 50202人参与

# 互联网公司评价 #

63771次浏览 908人参与

# 提前批真的不会影响正式批吗 #

18255次浏览 230人参与

# 市场营销人求职交流聚集地 #

25494次浏览 577人参与

67141次浏览 1488人参与

# 我的上岸简历长这样 #

142803次浏览 2868人参与

# 如何看待offer收割机的行为 #

197897次浏览 3034人参与

# 国企和大厂硬件兄弟怎么选？ #

28695次浏览 553人参与

# 硬件人的春招flag #

14720次浏览 202人参与

# 简历中的项目经历要怎么写 #

383961次浏览 6439人参与

# 非技术岗薪资爆料 #

10565次浏览 206人参与

# 找工作，你会甘心进小厂还是猛冲大厂 #

25117次浏览 252人参与

# 实习想申请秋招offer，能不能argue薪资 #

4597次浏览 70人参与

# 产品实习，你更倾向大公司or小公司 #

31598次浏览 498人参与

# 在国企工作的人，躺平了吗？ #

74344次浏览 908人参与

# 浅聊一下我实习的辛苦费 #

71591次浏览 652人参与

# 没有实习经历，还有机会进大厂吗 #

261145次浏览 4915人参与

牛客网
牛客企业服务