HDP Analyst: Data Science (Hadoop) Eğitimi

HDP Analyst: Data Science (Hadoop)

Hadoop, verileri depolamak ve donanım cluster’ları üzerinde uygulamaları çalıştırmak için açık kaynaklı bir yazılım çerçevesidir(framework). Her türlü veriyi, muazzam işleme gücü ve hemen hemen sınırsız eşzamanlı görevleri veya verileri işleme yeteneği ile büyük depolama alanı ve veri analizi imkanı sağlar.

Bu eğitim, özdevimli (makine) öğrenme ve doğal dil işleme dahil olarak, veri bilimi süreçleri ve uygulaması üzerine öğretim sunar. Dahil olanlar: araçlar ve programlama dilleri (Python, IPython, Mahout, Pig, NumPy, pandas, SciPy, Scikit-learn), the Natural Language Toolkit (NLTK) ve Spark MLlib.

 

Neler Öğreneceksiniz

  • Veri bilimi için kullanım durumlarını tanıma
  • Hadoop ve YARN mimarisini açıklama
  • Denetlenen ve denetlenmeyen öğrenme farklılıklarını açıklama
  • Altı makine öğrenme görevini listeleme
  • Hadoop üzerinde bir makine öğrenme algoritması çalıştırmak için Mahout kullanma
  • Veri bilimi yaşam döngüsünü tarif etme
  • Hadoop üzerinde veri dönüştürme ve hazırlama için Pig kullanma
  • Bir Phyton betiği yazma
  • Big data analiz etmek için NumPy kullanma
  • Pandas kütüphanesindeki veri yapısı sınıflarını kullanma
  • SciPy makine öğrenmeyi çalıştıran bir Python betiği yazma
  • Bir Hadoop kümesi üzerinde Python kodu çalıştırma seçeneklerini tarif etme
  • Python’da Pig Kullanıcı-Tanımlı Bir Fonksiyon Yazma
  • Bir Python betiği ile Pig streaming kullanma
  • Scikit-learn çağıran bir Python betiği yazma
  • Değerleri tahmin etmek için k-neartest komşu algoritması kullanma
  • Dağıtık bir takımda bir makine öğrenme algoritması kullanma
  • Natural Language Processing (NLP) için kullanım durumlarını tarif etme
  • Büyük bir metinde cümle segmentasyonu gerçekleştirme
  • Sözcük türü etiketleme gerçekleştirme
  • Natural Language Toolkit (NLTK) kullanma
  • Bir Spark uygulamasının bileşenlerini tarif etme
  • Python’da bir Spark uygulaması yazma
  • Spark MLlib kullanarak makine öğrenme çalıştırma
  • Veri bilimini üretime geçirme

 

Kimler Katılmalı

Mimarlar, yazılım geliştiricileri, analistler ve Hadoop üzerinde veri bilimi ve özdevinimli öğrenme uygulaması gereken veri bilim adamları.

 

Önkoşullar

Öğrenciler en az bir programlama dili veya betik dilinde tecrübe sahibi olmalı, istatistik ve/veya matematik konusunda bilgili olmalı ve big data ve Hadoop prensipleri hakkında temel bir kavrayışa sahip olmalıdırlar. Hadoop’ta yeni olan öğrenciler HDP Overview: Apache Hadoop Essentials dersine katılmaya teşvik edilir.

 

Eğitim İçeriği

  • Bir Geliştirme Ortamı Kurma
  • HDFS Komutlarını Kullanma
  • Makine Öğrenme için Mahout Kullanma
  • Pig’e Başlama
  • Pig ile Veri Keşfetme
  • IPython Notebook Kullanma
  • Python ile Veri Analizi
  • Veri Göstergeleri Aradeğerlemek
  • Python’da bir Pig UDF Tanımlama
  • Pig ile Python Stream Etme
  • K-Nearest NeighborveK-Means Kümeleme
  • Doğal Dil İşleme için NLTK kullanma
  • Naive Bayes kullanarak Metin Sınıflandırma
  • Spark ProgramlamaveSpark MLlib



Eğitim içeriğini PDF olarak indir

Diğer Hortonworks, Big Data Eğitimleri