Pengenalan Data Analytics dan Spreadsheet

Aug 22, 2024

Catatan Mini-Course Week 1, Day 3

Selamat malam, Revoneers dan selamat datang di sesi mini-course hari ini. Kita akan membahas tentang data analytics dan penggunaan spreadsheet.

Agenda Sesi

  • Practical Simulation
  • Q&A Session

Pembicara kali ini adalah Kak Regita Hikmatus Zakia, seorang data analis expert dan instruktur di program full stack.

Materi yang Dipelajari

  • Penggunaan Spreadsheet
  • Data Cleaning
  • Data Visualization

Pengenalan Data dan Analytics

  • Data: Kumpulan nilai yang memberikan informasi jika dianalisis.
    • Contoh: Nilai matematika siswa, Consumer Price Index.
    • Data bisa berupa angka, teks, gambar, atau audio.
  • Analytics: Ilmu untuk mengambil informasi dari data dan menarik kesimpulan.
    • Contoh: Menganalisis nilai matematika untuk memahami kemampuan siswa.

Spreadsheet

  • Definisi: Worksheet digital yang menyimpan data.
    • Contoh tools: Microsoft Excel (offline) dan Google Sheets (online).
  • Komponen Spreadsheet:
    • Cell: Kotak kecil yang menyimpan data.
    • Row: Baris horizontal.
    • Column: Kolom vertikal.

Proses Data Analytics

  1. Data Requirement Gathering: Mengidentifikasi kebutuhan data.
  2. Data Collection: Mengumpulkan data yang diperlukan.
  3. Data Cleaning: Membersihkan data yang tidak akurat atau korup.
  4. Data Analysis: Melakukan analisis data.
  5. Data Interpretation & Visualization: Menginterpretasi dan memvisualisasikan hasil analisis.

Data Cleaning

  • Pentingnya Data Cleaning:
    • Data yang kotor dapat menghasilkan analisis yang salah.
    • Proses ini mencakup:
      • Menghapus data duplikat.
      • Mengatasi missing data.
      • Menangani irrelevant data.
      • Menghapus outliers (nilai ekstrim).

Hands-On Simulation

  • Langkah-langkah Praktis:
    1. Mengunduh dan Mengimpor Dataset.
    2. Mengecek dan Menghapus Duplikasi.
    3. Menangani Missing Values:
      • Hapus atau isi data kosong sesuai kebutuhan.
    4. Menangani Outliers:
      • Menggunakan rumus kuartil untuk menentukan batas outlier.

Visualisasi Data

  • Exploratory Data Analysis (EDA): Menjelajahi data untuk menemukan pola.
  • Jenis Visualisasi:
    • Comparison: Membandingkan data.
    • Distribution: Melihat sebaran data.
    • Composition: Melihat komposisi data.
    • Relationship: Melihat hubungan antar data.

Penutup

  • Tugas untuk minggu ini:
    • Certification Test: Wajib dikerjakan, deadline Jumat jam 12 malam.
    • Case Study: Optional, deadline Sabtu siang.
  • Pendaftaran Fullstack Data Analytics Program dibuka untuk yang tertarik melanjutkan.

Sesi Tanya Jawab

  • Pertanyaan seputar:
    • Memilih data yang tepat.
    • Mencari solusi bisnis berdasarkan data.
    • Cara scrapping data dari aplikasi.
    • Menangani data yang nul (kosong).
    • Perbandingan cleaning data di Excel dan Google Spreadsheet.
  • Tips dari Kak Regita:
    • Terus belajar dan jangan takut untuk berinvestasi dalam pengetahuan analytics.

Catatan: Pastikan untuk hadir di sesi berikutnya dan mengerjakan tugas untuk mendapatkan sertifikat.