导航菜单
首页 >  » 正文

Hadoop权威指南读后感10篇

  《Hadoop权威指南》是一本由Tom White著作,清华大学出版社出版的平装图书,本书定价:89.00元,页数:600,读好书吧小编精心整理的一些读者的读后感,希望对大家能有帮助。

  《Hadoop权威指南》读后感(一):shit

  之所以给这本书这个评价是针对英文版的,我现在才意识到原来看一些其他的图书的书评的时候有人会说最好是买一本英文的原著,这本书翻译的简直就跟一坨屎一样,不是错别字,就是翻译跟原著的意思完全相反,还有最不能忍受的是,有一些(这些只是我看到的地方,我能发现的,当然还有我不能发现的)在原著中的很重要的地方,突然间在译文中没有了,还有就是可能是被翻译的完全牛唇不对马嘴,而且是错的。我都要爆粗口了。holy shit,这些翻译图书的人是怎么交差的,还有负责审校的人,你是来打酱油的吗。最后附上自己充满怨气写的一些我发现的勘误,能力有限,可能只是所有错误中一部分,欢迎大家提供新的错误。http://blog.csdn.net/b321mw/article/details/8791464

  《Hadoop权威指南》读后感(二):我英语不好,我忍了。。。

  我英语不好,我忍了。。。我英语不好,我忍了。。。我英语不好,我忍了。。。我英语不好,我忍了。。。我英语不好,我忍了。。。我英语不好,我忍了。。。我英语不好,我忍了。。。我英语不好,我忍了。。。我英语不好,我忍了。。。我英语不好,我忍了。。。我英语不好,我忍了。。。我英语不好,我忍了。。。我英语不好,我忍了。。。我英语不好,我忍了。。。我英语不好,我忍了。。。我英语不好,我忍了。。。我英语不好,我忍了。。。我英语不好,我忍了。。。我英语不好,我忍了。。。我英语不好,我忍了。。。我英语不好,我忍了。。。我英语不好,我忍了。。。我英语不好,我忍了。。。我英语不好,我忍了。。。我英语不好,我忍了。。。我英语不好,我忍了。。。

  《Hadoop权威指南》读后感(三):三聚氰胺、瘦肉精和Hadoop

  买了第一版,时间太紧,没来得及看,后来出了个号称修订升级的第二版,毫不犹豫又买了,后来听说第二版比第一版翻译得好,心中窃喜,再后来看了第二版,我震惊了,我TM就是一傻子,放着好好的英文版不看,赶什么时髦买中文版呢。在这个神奇的国度,牛奶里放的是三聚氰胺,火腿肠里放的是瘦肉精,翻译的书里满篇放的都是火星文啊有木有。

  我就纳了闷了,出版社的编辑都瞎眼了吗,国内用Hadoop的公司也不少,随便找几个就能翻译得干干净净,清清爽爽,为什么找高校的来翻译?这本书的价值跟《High Performance MySQL》有一拼,翻译的糟烂也跟它有一拼。多的不说,仅举一例。

  英文版91页的“Text is replacement for the UTF8 class, which was deprecated because it didn't support strings whose encoding was over 32767 bytes, and because it used Java's modified UTF-8”被翻译成了书中91页的“Text替代了UTF-8,这并不是一个很好的替代,一者是因为不支持对字节数超过32767的字符串进行编码,二者因为它使用的是Java的UTF-8修订版”,“不是一个很好的替代”?不是你妹啊,你搞清楚了原文中的which, it指的是谁了吗?

  这就是一个号称“在288核上部署了Hadoop系统,完成了多项研究”的团队的翻译质量,这样的错误比比皆是,简直惨不忍睹。翻回译者序,华东师大的砖家谦虚地说“由于译者水平有限,一文中的不当之处也在所难免”,有限你妹啊,你这哪里是有限,你简直就是一门外汉。

  《Hadoop权威指南》读后感(四):对Hadoop的简单了解

  其实也不算全部读完了,读它主要是为了技术选型,考虑升级持久层架构、提高系统可扩展性,仔细研读了前几章,对Hadoop、MapReduce、HDFS的模型、机制、使用场景有了一定了解。后面几章及其生态圈内的其他项目抱着了解的心态简单浏览了一下。整体感觉还行,至少从我看过的章节来看,还是满足了我的需求,顺利完成任务了。

  第二版基于 0.20系列发行版本,新增了Hive(使用SQL做分析)和Sqoop(在RDBMS和Hadoop之间建立连接,做导入导出)等小部分内容。

  翻译质量:

  我一向对中译本技术书籍不报太大期望,所以看之前都会备好原版的PDF,但毕竟看中文的进度会快些嘛。整体来说,翻译的还可以,没查过一次英文原版,都能看明白说的是什么,只有为数不多的英文长句翻译的比较拗口(这是英文技术类文章翻译的普遍问题,可以理解)

  解决了看之前的几个问题,这里特别提出来,如果你也在技术选型,可以参考一下:

  0. 配置简单、扩展性强、容错性强、生态圈健全(搭配项目较多)、Apache顶级项目更新频繁有保障、等等优点;

  1. Hadoop是为大文件(百MB~百TB)设计的;

  2. 适合写入次数少但量大,读取次数多且量大(几乎全部数据集),所以是以高数据访问延迟换高数据吞吐量;

  3. 海量小文件不合适;

  4. 文件只能append,不支持多个写入者的操作;

  5. 以大数据块换最小化寻址开销;

  6. 不支持多数据中心(就是一定要在一个局域网中);

  7. 没必要再组RAID,硬件要求不高(但也要是商业级服务器)

  总体感觉,适合的应用场景:

  1. 为数据提供冗余备份,通过简单的增加设备满足扩展需求,且成本较低;

  2. 为搜索引擎做支撑

  2. 对已有海量数据做分析,机器学习,推荐算法,等等。

  《Hadoop权威指南》读后感(五):玩玩大象吧

  参加豆瓣China-pub抽奖,比较幸运的得到这本Hadoop权威指南中文第二版,拿来与第一版相比,发现新加入了Hive和Sqoop章节,译文质量也提高了不少,并且保留了英文索引。

  这本书对Hadoop的介绍还算全面,有实践冲动的朋友基本可以拿着书、配合Google百度马上实现梦想。个人感觉“第2章关于MapReduce”、“第6章MapReduce的工作原理”、“第9章构建Hadoop集群”写得不错。通过第2章一个MapReduce处理气象数据的实例,可以让大家深入浅出MapReduce,因为MapReduce原理简单,一下就可以深入了解,而例子简短,只作浅谈。第6章对MapReduce工作机制有系统介绍,正所谓了解它,才能信任它。第9章为搭建中小规模Hadoop集群提供一些指引,当然就算严格按照步骤也会出现各种异常、错误,我想这也正好应对了封面那句“谁说大象不跳舞”,可这可能也是每个程序员最喜欢的,昨天我们征服了水牛(O'Reilly C)、老虎(O'Reilly Java)、沈王爷(O'Reilly C#),今天面对大象的感觉是否不一样。

  在如今云计算大热的情形下,关注Hadoop的人也越来越多了,以至于关注到这本书。最近参加云计算会议上,谷歌、盛大云计算负责人曾说,Hadoop处理不了上规模的数据,在虚拟化、云存储上也难有表现,我想这也更好的让我们为Hadoop定位。

  《Hadoop权威指南》读后感(六):第二版的翻译质量还行

  -- china-pub 赠书活动 --

  http://www.douban.com/group/topic/20965935/

  一直比较忙,整本书还没读完,只是粗略翻了个大概,其中有两三章细读了一遍。先做个大体评价吧,有时间全部细读后再评论。

  从书的内容上来讲,大致上与网上该书的内容介绍一致。简单点概括:这本书对hadoop介绍得比较全面,但对某些相关子系统讲得倒不是太深入。具体来说,它对分布式文件系统以及MapReduce做了原理上和框架级介绍;在部署安装和IO文件格式以及特性参数方面做了比较详尽的说明;对涉及到的相关系统,做了粗略的介绍;有些地方还细化到代码层面;对分布式计算有一定概念的初学者或是学习过官方网站向导例程的开发者来说,阅读该书,能对分布式计算得到更多、更全面的认识。

  再说说翻译质量。我个人看翻译的书籍,一般都会先下载英文版电子书备查。本人的英文水平尚可,不过阅读自己的母语书籍,总比阅读英文版速度要快些,能够节约不少时间。读过不少翻译版书籍的同学都知道,你不能对中文翻译书籍期望太高。比如本书第一版的翻译,网上评价就很差劲。我没有读过中文第一版,但问过两个同事,得到的反馈是确实翻译质量比较差。所幸的是,第二版的翻译要好不少,尽管少数地方读起来会有点别扭,但也能够明白,有些英文从句确实不大好翻译成顺畅的中文。

  另外,内容方面,大家可以比较一下第二版和第一版的目录,后面增加的内容不多,不过也算比较新的了。更快更新的东西,大家还是去看相关文档吧。至于书中的代码,我建议大家去网上下载,那么多段的代码,印刷错误再所难免,当然,没有错误是最好的。反正我自己阅读书中代码时,大致上是看下框架和逻辑,要测试运行时还是找电子版或自己敲,毕竟代码是要在机器上运行的,在书上它跑不起来。还有一点说下,页边上如果能够把英文版页码标上就好了。便于阅读者对照英文书查看。毕竟目前IT技术书籍的翻译质量还是让人不大放心,有些地方需要查看原版来理解。

  目前市面上Hadoop的相关书籍不算多,中文版的尤其少。鉴于这本书第二版的翻译质量还不错,除了阅读源码及相关文档外,我个人推荐对hadoop有兴趣的同学看看这本书。

  《Hadoop权威指南》读后感(七):不太适合mapreduce入门

  大致翻了一遍,谈谈感受。

  写hadoop的书很多,不同的书,风格不一样。

  这本书就偏理论,实战的内容太少,讲的也不好。看完后能对hadoop有个比较深入的了解,但是让你写几个mapreduce程序,估计就只好默默的哭了。

  书中比较详细的介绍了API的作用和例子,这点是这本书和一般hadoop书的区别,也算是亮点吧。但是不能忍的是,这本书啥都讲了,就是对mapreduce编程遮遮掩掩的:刚刚介绍几个例子,又不给你讲编程模型,隔靴搔痒!

  对于快速入门的书,推荐hadoop in action。直接上来就告诉你编程模型:mapreduce编程模型就是这样,往里套就行,简单、直接、粗暴!

  最后说说翻译,我买的第三版,翻译的还行吧,估计是好多细节没细究,所以没发现什么翻译问题,英文底子不好的,还是中文为主,英文为辅吧