从windows上传日志到hdfs

来源:网络 责任编辑:栏目编辑 发表时间:2013-07-01 08:30 点击:

  windows操作系统:windows server2003
   对cygwin不熟,所幸我只是需要进行很简单的应用,在同事的帮助下完成了这个工作。这里大致说一下,给大家提供一个思路。
   1、安装JDK,并配置环境变量。要注意安装路径不要空格,不要安装到类似于program files这种目录,否则cygwin会出问题。
   2、部署hadoop。直接拉一个liux上部署的hadoop,并部署到本地。我把它放到了D盘的根目录下。
   3、安装cygwin。主要是几个组件,不必细说。我把它安装到了D盘的根目录下。
   4、创建windows用户cloud。这里创建的用户,必须与linux里运行hadoop的用户相同,否则在上传文件时会提示没有权限。
   5、创建一个供cloud用户调用的bat文件,写入:D:\cygwin\bin\bash --login -i D:\hadoop-0.20.2-CDH3B4\bin\hadoop -ls \
   上述脚本的目的是为了测试使用windows脚本通过cygwin调用hadoop命令是否成功。而以cloud用户的身份运行这个脚本后,cygwin会其安装目录下的home文件下创建一个cloud的用户目录!
   6、上述测试通过以后,则在cygwin中的cloud用户目录中创建一个sh文件,比如名为upload.sh的文件,写入:D:/ hadoop-0.20.2-CDH3B4/bin/hadoop fs -put $DIR/$FILES $HDFS。
   然后,重新编辑刚才的bat文件,把后面的命令更改为sh脚本名称:D:\cygwin\bin\bash --login -i \home\cloud\upload.sh
   7、其它的部分的修改,主要是hadoop配置文件,一般要把其中的JAVA环境变量注释掉,或者某些部分的斜杠要改成windows的习惯。  


作者“可苦可乐”

    相关新闻>>

      发表评论
      请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
      用户名: 验证码:点击我更换图片
      最新评论 更多>>

      推荐热点

      • dos命令原来也能这样用?允许查找未知子目录指定文件
      •  windows的磁盘操作之八——格式化分区的思考
      • windows篇-第三章 安装和配置DNS服务器
      • windows篇-第二章 安装和配置Web服务器
      • windows篇-第一章 windows server 2008安装和简单配置
      •  windows server 2003断开远程之后自动注销用户
      • Windows服务器下用IIS Rewrite组件为IIS设置伪静态方法
      • Windows 2008 R2 SP1部署WSUS 3.0 SP2
      • windows 2008 rodc扩展

      快速直达

      操作系统导航

      LinuxWindows虚拟机
      网站首页 - 友情链接 - 网站地图 - TAG标签 - RSS订阅 - 内容搜索
      Copyright © 2008-2015 计算机技术学习交流网. 版权所有

      豫ICP备11007008号-1