Cloudera的简介及安装部署

 简介        

        Cloudera是一家位于美国的软件公司,成立于2008年,专注于为企业客户提供基于Apache Hadoop的软件、支持、服务以及培训。Cloudera的开源Apache Hadoop发行版,即Cloudera Distribution including Apache Hadoop(CDH),是面向Hadoop企业级部署的。2018年10月,Cloudera与Hortonworks公司宣布以52亿美元的价格合并,这两家公司都是基于开源平台的。

        Cloudera提供的服务帮助企业管理和分析大量数据,以驱动价值和竞争差异化。它提供了一个混合数据平台,包括安全的数据管理和可移植的云原生数据分析。Cloudera的使命是使数据和分析对每个人都易于访问和使用,通过改善对技能、软件和指导的访问,增加技术领域的多样性,并推动全球经济的可持续性。

        此外,Cloudera还在全球范围内设有办事处,并在硅谷加利福尼亚州设有总部。它由来自硅谷领先公司的一些最聪明的头脑创立,包括Google、Yahoo!、Oracle和Facebook的前员工。2011年,来自Yahoo!原始Hadoop团队的24名工程师分拆出来成立了Hortonworks。这两家公司在2019年1月合并,它们都建立在开源、开放标准和开放市场最佳的信念之上。

安装部署 

在企业环境中安装和部署Cloudera平台,通常涉及以下几个步骤:

1. 环境准备:确保操作系统满足Cloudera平台的要求,如使用CentOS 7.x或Ubuntu 16.04等,并确保服务器能够访问外部网络以下载必要的软件包。

2. 系统配置:配置网络环境,确保所有主机之间网络全通,关闭防火墙,以及配置SELinux策略。

3. 内存和存储要求:保证每台设备的内存至少8G以上,以及/var目录和/usr目录的剩余空间在30G以上。

4. JDK安装:因为Cloudera Data Hub (CDH) 的运行依赖JDK1.8,所以安装CDH之前需要先安装JDK1.8,并配置好环境变量。

5. Cloudera Manager安装:Cloudera Manager是Cloudera提供的一个集群管理工具,它包括Cloudera Manager Server和Cloudera Manager Agent。Server负责整个集群的监控与管理,而Agent部署在每个需要监控和管理的设备上。

6. 数据库配置:Cloudera Manager使用关系型数据库存储集群数据,需要配置好数据库并确保Cloudera Manager可以连接。

7. 安装Cloudera Manager Server和Agent:在主服务器上安装Cloudera Manager Server,而在其他服务器上安装Cloudera Manager Agent。

8. 配置Cloudera Manager Service:安装并配置Cloudera Management Service,这是用于监控整个CDH集群的服务。

9. 部署CDH:通过Cloudera Manager的Web界面进行CDH的部署,包括选择版本、配置集群、分发软件包、配置服务和启动集群。

10. 验证安装:安装完成后,通过Cloudera Manager的Web界面检查集群状态,确保所有服务正常运行。

11. 解决常见问题:如果在安装过程中遇到问题,如依赖关系错误、无法连接到Web界面或集群启动失败,需要根据错误信息进行相应的排查和修复。

12. 扩展和优化:根据业务需求对集群进行扩展和优化,以满足更多的数据处理和分析需求。

在安装过程中,务必遵循Cloudera官方文档的指导,确保每一步操作正确无误。同时,注意安全设置,避免不必要的安全风险。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/688410.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AI赋能未来教育:中国教学科研新蓝图

设“人啊 前言 回顾过去,传统的教育模式以知识灌输和应试为主,虽培养出大量人才,但也存在着学生创新能力不足、实践经验缺乏等问题。随着时代的进步和科技的发展,传统教育模式已难以满足当今社会对人才的需求。然而,当…

阿里云和AWS负载均衡服务对比分析

在云计算时代,负载均衡作为一种关键的网络基础设施,承担着在多个服务器之间分发网络流量的重要任务。作为全球两大主要的云服务提供商,阿里云和Amazon Web Services(AWS)都提供了强大的负载均衡解决方案。本文将从性能、功能、可用性和成本等方面对两者进行对比分析。我们九河云…

Html + Express 实现大文件分片上传、断点续传、秒传

在日常的网页开发中,文件上传是一项常见操作。通过文件上传技术,用户可以将本地文件方便地传输到Web服务器上。这种功能在许多场景下都是必不可少的,比如上传文件到网盘或上传用户头像等。 然而,当需要上传大型文件时,…

不容错过的秘籍:JavaScript数组的创建和使用详解

在编程的世界里,数据是构建一切的基础。而在JavaScript中,有一种特殊且强大的数据结构,它就是——数组。 今天,我们就来一起探索数组的奥秘,从创建到使用,一步步掌握这个重要的工具。 一、什么是数组 数…

pycharm滚轮放大字体

进入settings,然后按从左到右的箭头顺序依次点击即可

Win10鼠标右键新增软件快速打开项

1、cmd 运行 regedit 2、找到该位置的shell文件夹 3、在shell文件夹下创建需要添加的软件名的文件夹,并修改相关信息 4、新建子文件夹command,并修改相关信息 5、效果

斯坦福李飞飞最新对话:AI不会对人类造成“灭绝性危机” | 最新快讯

美国斯坦福大学教授、美国国家工程院院士李飞飞(来源:斯坦福大学账号) 北京时间 5 月 10 日凌晨举行的 Bloomberg Tech 活动上,著名华人计算机科学家、美国斯坦福大学教授李飞飞(Fei-Fei Li)与彭博社 Emily…

【NodeMCU实时天气时钟温湿度项目 4】通过NTPClient库获取实时网络时间并显示在TFT屏幕上

今天是【实时天气时钟温湿度项目】第四专题,主要内容是:学习导入NTPClient库,通过这个库获取实时网络时间,显示在1.3寸TFT液晶屏幕上。此前三个专题,请选择查看以下链接。 第一专题内容,请参考 【N…

C语言神奇的经典程序

因为C语言语法格式的特殊性,还诞生了一个C语言乱码大赛,从1984年开始,一直办到现在。在它官网上能看到历年所有的参赛获奖的作品。 官网链接: https://www.ioccc.orghttps://github.com/ioccc-src/temp-test-ioccc 这个比赛的目…

美国政府发布新的国际网络空间和数字政策战略(上)

文章目录 前言一、战略内容介绍二、数字团结的含义三、如何建立数字团结前言 美国务院5月6日正式发布《美国国际网络空间和数字政策战略:迈向创新、安全和尊重权利的数字未来》,旨在指导国际社会参与技术外交并推动《美国国家安全战略》和《美国国家网络安全战略》。 美国务…

界面组件DevExpress Reporting中文教程 - 标记(可访问)PDF导出增强

DevExpress Reporting是.NET Framework下功能完善的报表平台,它附带了易于使用的Visual Studio报表设计器和丰富的报表控件集,包括数据透视表、图表,因此您可以构建无与伦比、信息清晰的报表。 可访问性支持在DevExpress这里仍然是一个高优先…

深入理解卷积函数torch.nn.Conv2d的各个参数以及计算公式(看完写模型就很简单了)

代码解释帮助理解: torch.randn(10, 3, 32, 32),初始数据:(10, 3, 32, 32)代表有10张图片,每张图片的像素点用三个数表示,每张图片大小为32x32。(重点理解这个下面就好理解了) nn.Conv2d(3, 64…

独家丨美团直播积极寻求MCN公司合作,却意外成商家刷单圣地?

图片|《扫黑决战》截图 ©自象限原创 作者丨薛黎 编辑丨程心 2023年4月18日,美团直播在“神券节”中正式上线。整整一年之后,美团直播又在持续加码。 据「自象限」独家获悉,在去年12月美团上线达人直播后,近期…

Verilog_学习路线(小白)

#前言: 自从专心学习专业课后,发现知识点得用,越用越熟练,工具也一样,高级工具的学习可帮助我们在工作中极大地提高效率,但这里要记住一点,任何工具都是为解决实际问题出现的,即落脚…

Spring Cloud Gateway 全局过滤器

系列文章目录 文章目录 系列文章目录前言 前言 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站,这篇文章男女通用,看懂了就去分享给你的码吧。 全局过滤器作用于所…

可以直接用的搭建训练一个气象深度学习模型全流程代码--part1 以预报预测为例

本期内容分享一套全流程搭建训练气象深度学习模型的代码,并考虑在基础的预报预测领域的应用。 本期内容的目标是:尽量让看过本文的读者,可以直接在本地一键跑通如SmaAtUNet、UNet等卷积网络,ConvLSTM、TrajGRU、PhyDNet、STPhy等…

Android Studio 读不到Android设备

Android Studio 读不到Android设备 在进行Android应用开发时,我们经常会遇到一种情况,就是Android Studio无法读取到连接在电脑上的Android设备。这个问题可能出现在不同的场景中,比如在运行应用程序时,设备列表中找不到连接的设…

CSS-背景属性

目录 背景属性 background-color (背景颜色 ) background-image (背景图片 ) background-repeat (背景图平铺方式 ) no-repeat 不平铺 repeat-x 水平方向平铺 repeat-y 垂直方向平铺 repeat 平铺 background-position (背景图位置) background-size (背景缩…

通过单总线实现单片机之间的数据传输

单总线、没有时钟线的通信时,不能使用简单的高低电平来通信,因为接收方不知道此时发送的数据是第几位数据,容易造成错乱。 因此在使用一根线对外传输数据时,需要自定义一个通信协议,它至少要包含格式头数据&#xff0c…

使用 AI Assistant for Observability 和组织的运行手册增强 SRE 故障排除

作者:Almudena Sanz Oliv, Katrin Freihofner, Tom Grabowski 通过本指南,你的 SRE 团队可以实现增强的警报修复和事件管理。 可观测性 AI 助手可帮助用户使用自然语言界面探索和分析可观测性数据,利用自动函数调用来请求、分析和可视化数据…