cloudera

无法在Linux命令行中的hadoop中使用正则表达式

我有一个文件夹,其中包含大量日期为2018年的子文件夹。在我的HDFS中,我创建了一个仅包含12月日期的文件夹,我需要删除21-25天。我将此文件夹从HDFS复制到docker容器中,并在其工作正常的文件夹中使用命令rm-r*[21-25]。但是,当我运行适用于hdfshdfsdfs–rm-r/home/cloudera/logs/2018-Dec/*[21-25]的相同命令时,它会给我一个错误“rm:`/home/cloudera/logs/2018Dec/*[21-25]':没有这样的文件或目录。”。

ubuntu安装cloudera-managera

第一步:准备3台虚拟机cloudera-scmserver内存分配4Gcloudera-scmagent内存分配2Gcloudera-scmagent内存分配2G分别修改虚拟的hostname和hosts文件指令:sudovim/etc/hosts指令:sudovim/etc/hostname分别修改3台虚拟机的主机名指令:sudoreboot重启虚拟机第二步:每台机器安装jdk环境并查看java

CentOS7.3下安装Cloudera Manager5.11.1

概述准备条件系统环境配置安装Java安装MysqL安装CMCM配置Q&A参考概述最近公司需要研究大数据方向的内容,经初步讨论,决定使用CDH版本的Hadoop,使用Cloudera生态下的ClouderaManager平台。这里采用的是rpm方式安装Java.CentOS7自带了OpenJDK,但并不适用ClouderaManager,所以首先检查安装的Java,卸载自带的OpenJDK。安装ClouderaManager1.来到了重头戏了,首先主节点上解压相应的文件cloudera-manager-ce

Centos7.2安装CDH5.7.2core steps

软件准备jdk-8u121-linux-x64.rpmcloudera-manager-centos7-cm5.7.2_x86_64.tar.gzCDH-5.7.2-1.cdh5.7.2.p0.18-el7.parcelCDH-5.7.2-1.cdh5.7.2.p0.18-el7.parcel.sha更改为sha后缀manifest.jsonMysqL57-community-release-el

CDH 5.9 CentOS 6.5 离线安装部署

CDH5.9离线安装部署手册站在巨人的肩膀上面继续前进,不断的踩坑与填坑,感谢破击手的参考指南。ntp与自身进行同步需要一小段时间,大约需要5分钟。使用命令ntpstat检查服务启动后自身是否同步完成,如出现以下信息则完成。我试安装时,这点遗漏了,导致安装CDH的时候一直刷不出5.9版本,通过日志发现,没有manifest.json就会去下载,不能访问外网就报错了,但不影响安装CDH,还是mv一下吧。

CDH在Centos 7离线安装

不过最近要求在Centos7上离线安装,有点坑,网上的很多都是抄来抄去,安装到一半可能就走不下去,这里是本人亲测,遇到的问题都一一说明并且解决掉。Centos7自带java,我们查看一下版本:Cloudera官方给出:所以我们需要卸载本机自带的openJDK,安装我们自己的JDK到/usr/java/目录下。

centos7.2下搭建CDH5.8.3

也就是主节点上面。--scm-hosthadoop1:CMS的主机,一般是和MysqL安装的主机是在同一个主机上。最后三个参数是:数据库名,数据库用户名,数据库密码。

CDH5在centOS下安装

》serviceiptablesstop》chkconfigiptablesoff》vi/etc/selinux/configSELINUX=disabled》vi/etc//sysconfig/network-scripts/ifcfg-eth0DEVICE=eth0HWADDR=08:00:27:31:53:F9TYPE=EthernetUUID=adca6150-dbc7-455f-baee