Bilgisayar Mühendisliği Yüksek Lisans Programı

Veri Mühendisliği(INF 517)

Ders Kodu Dersin Adı Yarıyıl Teori Uygulama Lab Kredisi AKTS
INF 517 Veri Mühendisliği 2 3 0 0 3 6
Ön Koşul
Derse Kabul Koşulları
Dersin Dili İngilizce
Türü Seçmeli
Dersin Düzeyi Yüksek Lisans
Dersi Veren(ler) N. Sultan TURHAN sturhan@gsu.edu.tr (Email)
Dersin Yardımcıları
Dersin Amacı Veri mühendisliği, veri toplama, depolama, yönetim, güvenlik ve işleme için sistemlerin tasarımı ve analiz yöntemlerinin kullanımıyla ilgilenen bir disiplindir. İşlenebilir durumdaki büyük miktardaki "Büyük Veri"nin yönetimi için zengin veri yönetimi şemalarına ihtiyaç duyulmaktadır. Bu ders, Veri Mühendisliği prensipleri ve uygulamalarıyla ilgili temel bir kurs olacak ve aşağıdaki başlıklardan oluşacaktır:
I. Veri yaşam döngüsü
II. Veriyi düzenlemek ve yönetmek için veri modelleme teknikleri
III. Çoklu kaynak sistemlerinden veri toplamak, dönüştürmek, analiz etmek ve görselleştirmek için veri boruları oluşturma
IV. Farklı sorgu dilleriyle veriyi işleme
V. Veri analitiği uygulamaları ve algoritmaları
VI. Geleneksel olmayan veri türlerini yönetme
VII. Veri standartları ve veri kalitesi
İçerik 1. Veri Mühendisliğine Giriş: Genel Kavramlar
2. Veri Depolama Yöntemleri – 1: Veritabanları, Veri Ambarları ve Veri Gölü
3. Veri Depolama Yöntemleri - 2 Hadoop Mimarisi ve Ekosistem + NoSQL veri tabanı
4. Veri Mühendisliği ardışık düzenleri: ETL – ELT – Data Ingestion
5. Basit veri toplama yöntemleri - Web Scraping
6. Büyük Veri ekosisteminde veri aktarımında kullanılan veri modelleri
7. Data Ingestion – Toplu işleme
8. Data Ingestion – Akan veri
9. Bulutta Büyük Veri Analizi: Google Big Query
10. Veri mühendisliğinde yeni mimari paradigmalar 1 – Data Lakehouse
11. Veri mühendisliğinde yeni mimari paradigmalar 2 – Data Mesh
12. Veri Yönetişimi 1: Meta data yönetimi
13. Veri Yönetişimi 2: Veri Kalitesi ve Veri Kökeni
Dersin Öğrenme Çıktıları Bu dersi başarıyla tamamlayan öğrenci aşağıdaki becerilere sahip olacaktır:
- Veri Mühendiskliğini Veri Biliminden ayrıştırarak bir öğrenme disiplini olarak değerlendirir
- Veri yaşam döngüsünün bileşen adımlarını açıklar ve uygular
- Veri mühendisliği tekniklerini açıklar; çeşitli çok boyutlu veri türlerini içeren belirli bir görev için geniş ölçekli veri mühendisliği tekniklerini uygular ve belgeler
- Veri mühendisliği, depolama, erişim ve bakım ile ilgili teknik, etik ve toplumsal konuları açıklar ve uygular
- Büyük veri analitiği/algoritmalarının temel prensiplerini açıklar ve farklı alanlara uygular
- Veri mühendisliğindeki ilgili standartları ve en iyi uygulamaları açıklar, eksiklikleri analiz edip, bunları aşmak için olası stratejileri ve yaklaşımları belirler.

….
Öğretim Yöntemleri Teorik Ders, Anlatım, Tartışma, Vaka Çalışması, Ödevler, Proje, Uygulama
Kaynaklar Reis, J, Housley M, Fundamentals of Data Engineering: Plan and Build Robust Data Systems, 1st Edition, 2022, O’Reilly, 978-1098108304

Warren, J., & Marz, N. (2015). Big Data: Principles and best practices of scalable realtime data systems. Simon and Schuster.

Learning Spark: Lightning-Fast Big Data Analysis, by by Holden Karau, Andy Konwinski, Patrick Wendell, and Matei Zaharia. O'Reilly Media. Feb 2015

Hadoop: The Definitive Guide, by Tom White. O'Reilly Media. April 2015. (Fourth edition of the book at Amazon.com)

Gorelik, A. (2019). The enterprise big data lake: Delivering the promise of big data and data science. O'Reilly Media.
Ders İçeriğini Yazdır
Teori Konu Başlıkları
Hafta Konu Başlıkları
1 Veri Mühendisliğine Giriş: Genel Kavramlar
2 Veri Depolama Yöntemleri – 1: Veritabanları, Veri Ambarları ve Veri Gölü
3 Veri Depolama Yöntemleri - 2 Hadoop Mimarisi ve Ekosistem + NoSQL veri tabanı
4 Veri Mühendisliği ardışık düzenleri: ETL – ELT – Data Ingestion
5 Basit veri toplama yöntemleri - Web Scraping
6 Büyük Veri ekosisteminde veri aktarımında kullanılan veri modelleri
7 Data Ingestion – Toplu işleme
8 Data Ingestion – Akan veri
9 Google Big Query
10 Bilgi çıkarımı ve arama : Elastic Search
11 Veri mühendisliğinde yeni mimari paradigmalar 1 – Data Lakehouse
12 Veri mühendisliğinde yeni mimari paradigmalar 2 – Data Mesh
13 Veri Yönetişimi 1: Meta data yönetimi
14 Veri Yönetişimi 2: Veri Kalitesi ve Veri Kökeni
Uygulama Konu Başlıkları
Hafta Konu Başlıkları
Başarı Notuna Etki Oranları
  Sayı Katkı Payı
Yarıyıl içi çalışmaların başarı notuna katkısı 6 50
Yarıyıl sonu çalışmaların başarı notuna katkısı 1 50
Toplam 7 100
Yarıyıl İçi Çalışmaları
  Sayı Katkı Payı
Ödevler 5 20
Sunum 0 0
Arasınavlar (Hazırlık Süresi Dahil) 1 30
Proje 0 0
Laboratuar 0 0
Diğer Uygulamalar 0 0
Kısa Sınavlar 0 0
Dönem Ödevi / Projesi 0 0
Portfolyo Çalışmaları 0 0
Raporlar 0 0
Öğrenme Günlükleri 0 0
Bitirme Tezi/Projesi 0 0
Seminer 0 0
Diğer 0 0
Toplam 6 50
Numara Program Yeterlilikleri Puan
1 2 3 4 5
Etkinlikler Sayı Süre Toplam İş Yükü
Ders Süresi 14 3 42
Sınıf Dışı Çalışma Süresi 14 2 28
Ödevler 5 1 5
Sunum 0 0 0
Arasınavlar (Hazırlık Süresi Dahil) 1 5 5
Proje 0 0 0
Laboratuar 0 0 0
Diğer Uygulamalar 0 0 0
Yarıyıl Sonu Sınavı (Hazırlık Süresi Dahil) 1 5 5
Kısa Sınavlar 0 0 0
Dönem Ödevi / Projesi 0 0 0
Portfolyo Çalışmaları 0 0 0
Raporlar 0 0 0
Öğrenme Günlükleri 0 0 0
Bitirme Tezi/Projesi 0 0 0
Seminer 0 0 0
Diğer 0 0 0
Toplam İş Yükü 85
Toplam İş Yükü / 25 3,40
Dersin AKTS Kredisi 3
Scroll to Top