HDP Analyst: Data Science (Hadoop) Eğitimi

Ön Kayıt ve Fiyat Bilgi Formu



Tarih ve lokasyonlar


Bu eğitimi özel sınıf olarak kendi kurumunuzda talep edebilirsiniz.
Lütfen bizimle iletişime geçin:


info@bilginc.com

+90 212 282 7700

Talep Formu
Eğitim Tipi ve Süresi

2 Days ILT    

HDP Analyst: Data Science (Hadoop)

Hadoop, verileri depolamak ve donanım cluster’ları üzerinde uygulamaları çalıştırmak için açık kaynaklı bir yazılım çerçevesidir(framework). Her türlü veriyi, muazzam işleme gücü ve hemen hemen sınırsız eşzamanlı görevleri veya verileri işleme yeteneği ile büyük depolama alanı ve veri analizi imkanı sağlar.

Bu eğitim, özdevimli (makine) öğrenme ve doğal dil işleme dahil olarak, veri bilimi süreçleri ve uygulaması üzerine öğretim sunar. Dahil olanlar: araçlar ve programlama dilleri (Python, IPython, Mahout, Pig, NumPy, pandas, SciPy, Scikit-learn), the Natural Language Toolkit (NLTK) ve Spark MLlib.

 

Neler Öğreneceksiniz

  • Veri bilimi için kullanım durumlarını tanıma
  • Hadoop ve YARN mimarisini açıklama
  • Denetlenen ve denetlenmeyen öğrenme farklılıklarını açıklama
  • Altı makine öğrenme görevini listeleme
  • Hadoop üzerinde bir makine öğrenme algoritması çalıştırmak için Mahout kullanma
  • Veri bilimi yaşam döngüsünü tarif etme
  • Hadoop üzerinde veri dönüştürme ve hazırlama için Pig kullanma
  • Bir Phyton betiği yazma
  • Big data analiz etmek için NumPy kullanma
  • Pandas kütüphanesindeki veri yapısı sınıflarını kullanma
  • SciPy makine öğrenmeyi çalıştıran bir Python betiği yazma
  • Bir Hadoop kümesi üzerinde Python kodu çalıştırma seçeneklerini tarif etme
  • Python’da Pig Kullanıcı-Tanımlı Bir Fonksiyon Yazma
  • Bir Python betiği ile Pig streaming kullanma
  • Scikit-learn çağıran bir Python betiği yazma
  • Değerleri tahmin etmek için k-neartest komşu algoritması kullanma
  • Dağıtık bir takımda bir makine öğrenme algoritması kullanma
  • Natural Language Processing (NLP) için kullanım durumlarını tarif etme
  • Büyük bir metinde cümle segmentasyonu gerçekleştirme
  • Sözcük türü etiketleme gerçekleştirme
  • Natural Language Toolkit (NLTK) kullanma
  • Bir Spark uygulamasının bileşenlerini tarif etme
  • Python’da bir Spark uygulaması yazma
  • Spark MLlib kullanarak makine öğrenme çalıştırma
  • Veri bilimini üretime geçirme

 

Kimler Katılmalı

Mimarlar, yazılım geliştiricileri, analistler ve Hadoop üzerinde veri bilimi ve özdevinimli öğrenme uygulaması gereken veri bilim adamları.

 

Eğitim İçeriği

  • Bir Geliştirme Ortamı Kurma
  • HDFS Komutlarını Kullanma
  • Makine Öğrenme için Mahout Kullanma
  • Pig’e Başlama
  • Pig ile Veri Keşfetme
  • IPython Notebook Kullanma
  • Python ile Veri Analizi
  • Veri Göstergeleri Aradeğerlemek
  • Python’da bir Pig UDF Tanımlama
  • Pig ile Python Stream Etme
  • K-Nearest NeighborveK-Means Kümeleme
  • Doğal Dil İşleme için NLTK kullanma
  • Naive Bayes kullanarak Metin Sınıflandırma
  • Spark ProgramlamaveSpark MLlib



Eğitim içeriğini PDF olarak indir

Eğitim Sağlayıcı ve Kategori

Hortonworks  » Hortonworks Eğitimler
Hortonworks  » Data Analyst Eğitimler
Big Data  » Popular Courses Eğitimler
Hortonworks  » I’m a Data Analyst Eğitimler
Big Data  » I’m a Data Analyst Eğitimler
Hortonworks  » Popular Courses Eğitimler