blink使用java開發(fā)嗎,搞 Java 最重要的是什么?毫不夸張地說,掌握和了解學習大數(shù)據(jù)之前要打什么基礎???,基本就能走遍天下都不怕了!
1.學習大數(shù)據(jù)之前要打什么基礎?
一、學習大數(shù)據(jù)需要的基礎 1、java SE、EE(SSM) 90%的大數(shù)據(jù)框架都是Java寫的 2、MySQL SQL on Hadoop 3、Linux 大數(shù)據(jù)的框架安裝在Linux操作系統(tǒng)上 在有了上面的技術基礎支撐之后,便可以開始我們的大數(shù)據(jù)開發(fā)工程師的鍛造之旅了,可以根據(jù)以下三個大的方面進行學習,當然了,中間需要穿插一些項目練習,將理論和實戰(zhàn)相關聯(lián)才能成長的很快! 二、大數(shù)據(jù)技術需要學什么 1、大數(shù)據(jù)離線分析 一般處理T+1數(shù)據(jù)(T:可能是1天、一周、一個月、一年) a、Hadoop :一般不選用新版本,踩坑難解決 (common、HDES、MapReduce、YARN) 環(huán)境搭建、處理數(shù)據(jù)的思想 b、Hive:大數(shù)據(jù)的數(shù)據(jù)倉庫 經(jīng)過寫SQL對數(shù)據(jù)進行操作,類似于MySQL數(shù)據(jù)庫的sql c、HBase:基于HDFS的NOSQL數(shù)據(jù)庫 面向列存儲 d、協(xié)作框架: sqoop(橋梁:HDFS《==》RDBMS) flume:搜集日志文件中的信息 e、調(diào)度框架 anzkaban 了解:crotab(Linux自帶) zeus(Alibaba) Oozie(cloudera) f、前沿框架擴展: kylin、impala、(ES) 2、大數(shù)據(jù)實時分析 以spark框架為主 Scala:OOP(面向對象程序設計)+FP(函數(shù)是程序設計) sparkCore:類比MapReduce sparkSQL:類比hive :實時數(shù)據(jù)處理 kafka:消息隊列 前沿框架擴展:flink 阿里巴巴:blink 3、大數(shù)據(jù)機器學習 spark MLlib:機器學習庫 pyspark編程:Python和spark的結合 以上就是大數(shù)據(jù)的學習路線,有興趣的朋友,也可以了解下人工智能和物聯(lián)網(wǎng)。 在不久的將來,多智時代一定會徹底走入我們的生活,有興趣入行未來前沿產(chǎn)業(yè)的朋友,可以收藏多智時代,及時獲取人工智能、大數(shù)據(jù)、云計算和物聯(lián)網(wǎng)的前沿資訊和基礎知識,讓我們一起攜手,引領人工智能的未來
雖說掌握和了解了學習大數(shù)據(jù)之前要打什么基礎???,能走遍天下,但也要不斷去學習新的知識,更多的Java知識,請聯(lián)系客服獲取。