Hadoop综合大作业-白红宇

强烈建议你试试无所不能的chatGPT，快点击我

Hadoop综合大作业

阅读量：5069 次

发布时间：2019-06-12

本文共 368 字，大约阅读时间需要 1 分钟。

Hadoop综合大作业要求：

1.用Hive对爬虫大作业产生的文本文件（或者英文词频统计下载的英文长篇小说）进行词频统计。

启动hadoop

上创建文件夹并查看

上传下载的英文文章至hdfs

启动Hive

导入文件内容到表docs并查看

进行词频统计，并将结果放到表t_word_count

输出统计结果

2.用Hive对爬虫大作业产生的csv文件进行数据分析，写一篇博客描述你的分析过程和分析结果。

将csv文件上传到hdfs中的gigdatacase

显示数据库

创建初始表wandou_count

导入数据

显示前10行的数据

本次爬的是豌豆荚里面的排行比较前的软件，由此可以看出排行较前的一般是音频软件或者视频软件

转载于:https://www.cnblogs.com/bin763043666/p/9086880.html

你可能感兴趣的文章

App右上角数字

从.NET中委托写法的演变谈开去（上）：委托与匿名方法

201521123024 《java程序设计》第12周学习总结

贪吃蛇游戏改进

新作《ASP.NET MVC 5框架揭秘》正式出版

在WPF中使用Caliburn.Micro搭建MEF插件化开发框架

IdentityServer4-用EF配置Client（一）

WPF程序加入3D模型

WPF中实现多选ComboBox控件

读构建之法第四章第十七章有感

android访问链接时候报java.net.MalformedURLException: Protocol not found

Windows Phone开发（4）：框架和页转：http://blog.csdn.net/tcjiaan/article/details/7263146

Unity3D研究院之打开Activity与调用JAVA代码传递参数（十八）【转】

python asyncio 异步实现mongodb数据转xls文件

【ul开发攻略】HTML5/CSS3菜单代码阴影+发光+圆角

虚拟中没有eth0

[ZJOI2007]棋盘制作【最大同色矩形】

IOS-图片操作集合

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2024-11-15 18:38:17 当前IP: 3.147.48.186 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我