HDP Analyst: Data Science (Hadoop) Eğitimi

Genel Bakış

Bu eğitim, özdevimli (makine) öğrenme ve doğal dil işleme dahil olarak, veri bilimi süreçleri ve uygulaması üzerine öğretim sunar. Dahil olanlar: araçlar ve programlama dilleri (Python, IPython, Mahout, Pig, NumPy, pandas, SciPy, Scikit-learn), the Natural Language Toolkit (NLTK) ve Spark MLlib.

 

Süre

3 gün

Önkoşullar

Öğrenciler en az bir programlama dili veya betik dilinde tecrübe sahibi olmalı, istatistik ve/veya matematik konusunda bilgili olmalı ve big data ve Hadoop prensipleri hakkında temel bir kavrayışa sahip olmalıdırlar. Hadoop’ta yeni olan öğrenciler HDP Overview: Apache Hadoop Essentials dersine katılmaya teşvik edilir.

Hedef Kitle

Mimarlar, yazılım geliştiricileri, analistler ve Hadoop üzerinde veri bilimi ve özdevinimli öğrenme uygulaması gereken veri bilim adamları.

Format

·         50% Anlatım/Tartışma

·         50% Uygulamalı Laboratuarlar

Ders Hedefleri

Eğitim sonunda, öğrenciler şunları yapabilecek: Veri bilim kullanım durumlarını tanıma, Hadoop ve YARN mimarisini tarif etme

 

·         Denetlenen ve denetlenmeyen öğrenme farklılıklarını açıklama

·         Altı makine öğrenme görevini listeleme

·         Hadoop üzerinde bir makine öğrenme algoritması çalıştırmak için Mahout kullanma

·         Veri bilimi yaşam döngüsünü tarif etme

·         Hadoop üzerinde veri dönüştürme ve hazırlama için Pig kullanma

·         Bir Phyton betiği yazma

·         Big data analiz etmek için NumPy kullanma

·         Pandas kütüphanesindeki veri yapısı sınıflarını kullanma

·         SciPy makine öğrenmeyi çalıştıran bir Python betiği yazma

·         Bir Hadoop kümesi üzerinde Python kodu çalıştırma seçeneklerini tarif etme

·         Python’da Pig Kullanıcı-Tanımlı Bir Fonksiyon Yazma

·         Bir Python betiği ile Pig streaming kullanma

·         Scikit-learn çağıran bir Python betiği yazma

·         Değerleri tahmin etmek için k-neartest komşu algoritması kullanma

·         Dağıtık bir takımda bir makine öğrenme algoritması kullanma

·         Natural Language Processing (NLP) için kullanım durumlarını tarif etme

·         Büyük bir metinde cümle segmentasyonu gerçekleştirme

·         Sözcük türü etiketleme gerçekleştirme

·         Natural Language Toolkit (NLTK) kullanma

·         Bir Spark uygulamasının bileşenlerini tarif etme

·         Python’da bir Spark uygulaması yazma

·         Spark MLlib kullanarak makine öğrenme çalıştırma

·         Veri bilimini üretime geçirme

 

Uygulamalı Laboratuarlar

 

·         Bir Geliştirme Ortamı Kurma

·         HDFS Komutlarını Kullanma

·         Makine Öğrenme için Mahout Kullanma

·         Pig’e Başlama

·         Pig ile Veri Keşfetme

·         IPython Notebook Kullanma

·         Python ile Veri Analizi

·         Veri Göstergeleri Aradeğerlemek

·         Python’da bir Pig UDF Tanımlama

·         Pig ile Python Stream Etme

·         K-Nearest Neighbor ve K-Means Kümeleme

·         Doğal Dil İşleme için NLTK kullanma

·         Naive Bayes kullanarak Metin Sınıflandırma

·         Spark Programlama ve Spark MLlib

 

Sertifikasyon

Hortonworks, Apache Hadoop’ta uzmanlaşmanızı sağlayacak kapsamlı bir sertifika programı sunuyor.

 

 

 



Eğitim içeriğini PDF olarak indir

Diğer Hortonworks, Big Data Eğitimleri