大数据技术炙手可热 专业人才短缺成发展掣肘

2023-11-16

大数据技术炙手可热 专业人才短缺成发展掣肘

2011-11-25 09:29 | 1765次阅读 | 【已有0条评论】发表评论

来源:CSDN编译 | 作者:李智 | 收藏到我的网摘

导读:尽管还存在安全等问题,但Hadoop已经为部署在大企业中的大型项目做好准备。Hadoop作为Apache的顶级开源项目,主要被应用于分析大数据集,现今已被包括eBay、Facebook、Yahoo、AOL和Twitter等互联网公司广泛采用。而就在上个月微软、IBM和甲骨文也都纷纷拥抱Hadoop。

越来越多的企业已经开始摸索Hadoop技术,目的就是为处理博客、点击所带来的数据流和社交媒体所带来的数据。Hadoop可以供存储和分析的能力,以便在大数据中为客户提升业务洞察力。

大数据在企业中迅速扩张 相关人才短缺

目前相关人才短缺的问题相当严重。来自JP摩根大通公司以及eBay的IT高管们在本月于纽约举行的Hadoop全球大会都表达了同样的观点。eBay公司搜索与平台部门副总裁Hugh Williams就在大会上表示目前他们正在诚招Hadoop专业人员。而JP摩根大通公司总经理Larry Feinsmith则半开玩笑的表示,他们不仅愿意聘用合格的专业人士,还会提供比eBay高出10%的优厚待遇。

Larry Feinsmith表示现今JP摩根大通仍然严重的依赖传统的关系数据库系统进行事务处理。但随着越来越多的欺诈检测以及IT风险管理和自我服务等,过去的系统已经不能满足现有的需求,而Hadoop技术的特性恰好能够适应当今企业的业务。

JP摩根大通现在拥有150PB在线存储的数据,30000个数据库。用户帐户记录的总金额达到350亿美元。这些数据充分说明了数据是JP摩根大通的命脉。Hadoop的优势就是适合存储海量的非结构数据,这使得企业能够有效收集和存储网络日志,以及交易数据和社交媒体的数据。Larry Feinsmith说到。

而eBay搜索和平台副总裁Hugh Williams表示eBay现在正在使用Hadoop技术和HBase数据库。以便进行实时的数据分析。同时还利用Hadoop技术为其网站构建了新的搜索引擎。据他透露eBay活跃买家和卖家超过了9700万,网站每天有接近20亿次的页面浏览量,同时带来每天2.5亿次的搜索或查询和数百亿的数据库调用。他还表示eBay现在有9PB的数据存储在Hadoop和Teradata集群之中,并且数据量还在迅速的增长。

Hadoop存在硬性标准 数据挖掘等领域人才为潜在对象

Forrester研究公司分析师James Kobielus认为在当今的企业中,Hadoop就是新一代的数据仓库,并应被看作是新的数据源。比起当今传统关系数据库管理系统,Hadoop使企业具有存储、管理海量结构化数据和非结构化数据卷的能力。

James Kobielus表示越来越多的企业对诸如Hadoop分析技术需求的增加导致Hadoop相关从业人员炙手可热。能够驾驭Hadoop的人对企业贡献极大,他们理应获取相应的薪酬。Hadoop需要从业者具备高级分析领域的相关工作经验,例如像具备使用MapReduce及R语言等新一代技术解决方案处理预测及统计建模的能力。而具备多元统计分析、数据挖掘、预测建模、自然语言处理、内容分析、文本分析及社交领域分析等领域技术背景的相关人员都是从事Hadoop的潜在对象。

Hadoop受到企业广泛关注的同时也带来了对Hadoop平台专业管理人员的硬性需求。他们的工作职责包括Hadoop集群、安全及管理,并对其进行优化以确保集群对企业的可用性。之前负责管理Teradata及Oracle Exadata的数据库管理员现在正试图向Hadoop集群管理的角色转变。他们会意识到这是一个全新的天地。同时,存储管理专业人员也是不可或缺,他们现在要做的就是帮助Hadoop环境与现有传统数据库技术相结合。

Hadoop专业人员主要分三类

Karmasphere公司总裁 Martin Hall表示目前对Hadoop专业人员的需求主要分三大类:数据分析师(又称数据科学家)、数据工程师以及IT数据管理专家。Karmasphere现主要经营项目正是为Hadoop环境开发软件产品。

Martin Hall认为,数据管理专家的职责在于选择、安装、管理、规范以及扩展大规模的Hadoop集群。这些专业人员决定了Hadoop是否应立足于云还是采取预置模式,包括供应商该如何选择以及使用那款Hadoop分布方案、集群规模以及被用于运行生产应用程序还是用于进行质量测试等。此职位应具备的技能与以往负责传统关系数据库与数据库环境类的任务颇为相似。

同时,Hadoop数据工程师还要负责创建数据处理工作以及建立分布式MapReduce算法,以便数据分析师使用。从事Java和C++等领域技能水平能力较为突出的专业人士更便于在企业大规模部署Hadoop的浪潮中得到更多的机会。

而第三类专业需求则是在SAS、SPSS以及以R语言为代表的编程语言等方面具备丰富经验的数据科学家。这些专业人士能够将建立、分析、共享以及智能整合加以集中,并存储于Hadoop环境中。

就目前来看,Hadoop领域的人才短缺意味着企业会更加依赖于服务供应商提供的部署技术。支撑这一论点的一大迹象是在专业的咨询及系统集成行业内,专攻Hadoop实际应用带来的收入要远远大于Hadoop产品销售所带来的收入。

如今Cloudera、MapR、Hortonworks以及IBM这样的企业如今已经在提供Hadoop的相关培训课程,人们应该充分利用这些资源,通过建立Hadoop卓越中心使自己的企业获得最大收益。


本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

大数据技术炙手可热 专业人才短缺成发展掣肘 的相关文章

  • Java Sqlite Gradle

    我对 gradle 和 java 还很陌生 我有一个使用 sqlite 的项目 它通过 intellij idea 运行良好 但我无法从终端运行它 它会抛出异常 java lang ClassNotFoundException org sq
  • Java - 从配置文件加密/解密用户名和密码

    我们正忙于为客户开发 Java Web 服务 有两种可能的选择 将加密的用户名 密码存储在Web服务客户端上 从配置中读取 文件在客户端 解密并发送 将加密的用户名 密码存储在 Web 服务器上 从配置中读取 Web 服务器上的文件 解密并
  • 重构——套接字中的良好实践——简单的服务器-客户端 Swing 应用程序

    我使用单例和观察者模式编写了一个带有 Swing 接口的简单服务器 客户端程序 每个客户端都连接到服务器并可以发送消息 服务器将其收到的消息转发给其余的客户端 客户端使用 GUI 允许它们随时连接和断开与服务器的连接 该程序运行得很好 因为
  • 如何降低圈复杂度?

    我正在开发一个将 RequestDTO 发送到 Web 服务的类 我需要在发送请求之前验证该请求 请求可以从 3 个不同的地方发送 并且每个 请求类型 有不同的验证规则 例如请求1必须有姓名和电话号码 请求2必须有地址等 我有一个 DTO
  • 如何在Mac上使用eclipse安装jetty

    我是一个新手 jetty 和 RESTful API 我想使用 Jetty 创建 REST 服务 并希望将嵌入式 jetty 与 eclipse 一起使用 任何人都可以建议我在 Mac OS 中使用 Eclipse 安装 Jetty Jet
  • java中队列的实现

    在 Java 中实现队列是一个非常常见的面试问题 我在网上冲浪 看到了许多实现 他们做了一些奇特的事情 比如实现队列接口和编写自己的addLast and removeFirst 方法 我的问题是我不能使用LinkedList 类并使用其预
  • 如果按下 Esc 则中断循环

    我用 JAVA 语言编写了一个程序 它使用 Scanner 类接受来自控制台的输入 现在我想将此功能添加到我的代码中 以便在用户按下 Esc 按钮时存在循环 while 到目前为止 我认为键盘类可以帮助我 但它就像扫描仪一样 我尝试使用事件
  • JAX-WS:有状态 WS 在独立进程中失败

    我在 Tomcat 上部署了一个有状态的 Web 服务 它由工厂服务和主要 API 服务组成 并且工作得很好 工厂服务将 W3CEndpointReference 返回到主 API 实例 客户端使用会话 现在 我尝试将相同的服务作为独立应用
  • 动画图像视图

    目前我正在开发一款游戏 这是我的游戏的详细信息 用户应选择正确的图像对象 我希望图像从左到右加速 当他们到达终点时 他们应该再次出现在活动中 这是我正在处理的屏幕截图 我有 5 个图像视图 它们应该会加速 您有此类动画的示例代码吗 非常感谢
  • 通过 JNI 从 Applet 调用 DLL

    我有一个 概念验证 的作品 它跨越了一些不熟悉的领域 我的任务是将 EFTPOS 机器连接到在内联网浏览器中作为小程序运行的应用程序 我暂时忽略了 EFTPOS dll 并用我选择的语言 Delphi 创建了一个简单的 JNI 修饰的 DL
  • 带有面板的 Java Swing JToolbar:外观和感觉

    我有一个JToolbar其中包含多个JPanels 需要 因为我希望每个都有特定的边界 不幸的是 外观管理器无法识别JPanels属于工具栏和JButtons因此 渲染器与普通按钮一样 即没有工具栏上的特殊鼠标悬停效果 更换JPanels
  • 如何使用 BufferedReader 对象从 Java 中的一行读取多个整数值?

    我正在使用 BufferedReader 类读取 Java 程序中的输入 我想读取用户的输入 该用户可以在带空格的单行中输入多个整数数据 我想读取整数数组中的所有这些数据 输入格式 用户首先输入他 她想要输入的数字数量 然后在下一行中使用多
  • 如何在命令提示符中检查 JAVA_OPTS 值?

    我们的应用程序部署 JBoss 服务器然后抛出错误 PermGen space 然后在 jboss bat 和配置文件中设置 permgen 变量中的 java OPTS JAVA OPTs 中是否有值 assige 如何检查 如何在命令提
  • Java 中 static 关键字如何工作?

    我正在阅读Java教程 http docs oracle com javase tutorial index html从一开始我就有一个问题static字段或变量上的关键字 作为Java said here http docs oracle
  • 为什么 RMI 注册表忽略 java.rmi.server.codebase 属性

    我正在运行 java RMI 的 Hello World 示例 1 我在空文件夹中运行注册表 motta motta laptop tmp rmiregistry 2 我启动 HTTP 服务器以在运行时检索类 下载文件夹包含客户端 服务器的
  • 无法仅在控制台中启动 androidstudio

    你好 我的问题是下一个 我下载了Android Studio如果我去 路径 android studio bin 我执行studio sh 我收到以下错误 No JDK found Please validate either STUDIO
  • 使用 Cucumber Scenario Outline 处理 Excel 电子表格

    如果可能的话 我试图找到一种更优雅的方法来处理从与 Excel 电子表格行 第 n 个 相关的 Cucumber Scenario Outline 中调用第 n 个数字 目前 我正在使用迭代编号来定义要从中提取数据的 Excel 电子表格的
  • 设计抽象类时是否应该考虑序列化问题?

    一般来说这个问题来自Eclipse建议在抽象类上添加串行版本UID 由于该类是抽象类 因此该类的实例永远不会存在 因此它们永远不会被序列化 只有派生类才会被序列化 所以我的问题是放置一个安全 SuppressWarnings serial
  • BoneCP 和 Derby - 如何正确关闭

    I have BoneCP CONNECTION POOL CONNECTION POOL getConfig setJdbcUrl jdbc derby database shutdown true Connection connecti
  • 当我在 Java 中输入 IP 时无法连接到我的服务器

    好的 我正在尝试学习 Java 客户端 服务器的内容 并且正在浏览教程代码 如下所示 当我将 localhost 更改为我的 IP 时 它会停止工作 请帮忙 编辑 127 0 0 1 似乎也可以工作 但不是我的真实IP Copyright

随机推荐

  • 论文阅读:BotFinder: A Novel Framework for Social Bots Detection in Online Social Networks Based

    目录 摘要 1 Introduction 3 Our Proposed Method BotFinder 3 1 Overview 3 2 Step1 Feature Engineering 3 3 Step2 Similarity Cal
  • 域名如何部署到正在使用的服务器

    阿里云申请的域名 PHP环境 宝塔工具 一 登录阿里云 对该域名进行解析 二 登录宝塔 添加站点 添加成功后 在改站点下上传你已经做好的页面即可 如果需要FTP操作的 就创建FTP账号密码 创建成功后 直接用FTP账号密码登录即可
  • FaceShifter:新的人脸交换模型

    点击上方 小白学视觉 选择加 星标 或 置顶 重磅干货 第一时间送达 如今 深度学习已近在图像合成 图像处理领域中取得惊人的成果 FaceShifter 1 便是其中之一 它是一种深度学习模型 可以非常先进的技术实现人脸交换 在本文中 我们
  • 【2022年高教杯数学建模】C题:古代玻璃制品的成分分析与鉴别方案及代码实现(一)

    1 问题1 对这些玻璃文物的表面风化与其玻璃类型 纹饰和颜色的关系进行分析 结合玻璃的类型 分析文物样品表面有无风化化学成分含量的统计规律 并根据风化点检测数据 预测风化前的化学成分含量 2 问题1的分析 首先需要对玻璃表面风化情况与玻璃类
  • 数据库应用:CentOS 7离线安装PostgreSQL

    目录 一 理论 1 PostgreSQL 2 PostgreSQL离线安装 3 PostgreSQL初始化 4 PostgreSQL登录操作 二 实验 1 CentOS 7离线安装PostgreSQL 2 登录PostgreSQL 3 Na
  • 1:pandas创建DataFrame对象

    实例代码 import pandas as pd df pd DataFrame age 1 2 name 李华 大刘 print df age 和name为列的标题 中括号的为列的内容 前面的这个为索引 如果想以age为索引可以这样写 i
  • myfile

    淄博市公共就业招聘云平台 个人用户使用指导说明 淄博市公共就业招聘云平台是依托Hiturn 海豚 人才网 通过互联网技术 对现场招聘会进行全真模拟 为企业单位用户 个人求职用户搭建 同时支持电脑端与手机端的使用 并可在线交流 信息展示 简历
  • conda的使用教程

    conda的介绍 简单来说 conda软件就是来管理包的软件 以Python为例 在实际生活中 我们要处理多个不同的项目 因此 要安装不同的项目所需要的包 为了管理方便 conda就是用来打理不同项目的包 为不同项目创建不同虚拟环境 把不同
  • 制作HTML5百科页面

    先建一个index html 首页 代码如下 p align center a href page01 html target self img src images index jpg alt 传智播客设计学院UI设计师 a p 首页的效
  • java学习之路——第一次java(java的入门)

    java学习之路 第一次java java的入门 一 什么是java java语言是一种强类型的语言 其中包含一套基本的符号 这些符号构成了java语言的表示符和关键字 是一个跨平台的面向对象的程序设计语言 由Sun Microsystem
  • 离散数学第一章总结

    离散数学第一章 1 公式类型 1 重言式 也是永真式 公式真值恒为1 2 矛盾式 永假式 真值恒为0 3 可满足式 不是矛盾式的就都是可满足式 重言式一定是可满足式 2 成真赋值与成假赋值 也叫成真指派与成假指派 一组原子的取值 真值指派
  • Tensorflow计算、数据和运行模型

    参考书籍 Tensorflow实战Google深度学习框架 郑泽宇等 Tensorflow是一款谷歌开源的深度学习工具 与其他深度学习工具 比如caffe Deeplearning4j等 相比 其受关注度和欢迎程度尤为突出 在谷歌内部 Te
  • 02-Node.js—Buffer(缓冲器)

    文章目录 1 概念 2 特点 3 创建Buffer 3 1 Buffer alloc 3 2 Buffer allocUnsafe 3 3 Buffer from 4 操作Buffer 4 1 Buffer 与字符串的转化 4 2 Buff
  • H264实时编码及NALU,RTP传输

    原文引用地址 http wmnmtm blog 163 com blog static 382457142011920102618122 fromdm fromSearch isFromSearchEngine yes H264实时编码及N
  • linux中find命令详解,Linux下的find指令详解

    在Linux下有很多查找指令 locate whereis which find 在这些查找指令中功能最强大的当属find指令了 find命令在目录结构中搜索文件 并执行指定的操作 Linux下find命令提供了相当多的查找条件 功能很强大
  • linux shell数据重定向(输入重定向与输出重定向)详细分析

    在了解重定向之前 我们先来看看linux 的文件描述符 linux文件描述符 可以理解为linux跟踪打开文件 而分配的一个数字 这个数字有点类似c语言操作文件时候的句柄 通过句柄就可以实现文件的读写操作 用户可以自定义文件描述符范围是 3
  • Vue计算属性:简化数据处理和视图更新的利器

    一 计算属性的基本使用 计算属性 一个特殊属性 值依赖于另外一些数据动态计算出来 计算属性特点 函数内使用的变量改变 重新计算结果返回 注意 计算属性必须定义在computed节点中 计算属性必须是一个function 计算属性必须有返回值
  • 基于STM32通过RTC唤醒低功耗模式

    一 低功耗模式 1 简介 通俗的来讲低功耗模式就是降低单片机的运行功耗 STM32F10xxx有三种低功耗模式 1 睡眠模式 Cortex M3 内核停止 所有外设包括 Cortex M3 核心的外设 如 NVIC 系统时 钟 SysTic
  • 解决Go-CQhttp无法登录(服务器如何登录)的问题

    既然你能看到这篇帖子 说明你一定对这个东西不陌生了 这是某讯的登录检查机制 解决方法 也很简单 保证手机与电脑处于同一wifi以内 那这时候有人叫要问了 可是我明明开了wifi 为什么还是登陆不了呢 麻烦你不要一边开wifi一边开数据 别问
  • 大数据技术炙手可热 专业人才短缺成发展掣肘

    大数据技术炙手可热 专业人才短缺成发展掣肘 2011 11 25 09 29 1765次阅读 已有0条评论 发表评论 来源 CSDN编译 作者 李智 收藏到我的网摘 导读 尽管还存在安全等问题 但Hadoop已经为部署在大企业中的大型项目做