การคิดแบบนักวิทยาศาสตร์ข้อมูล

Aug 18, 2024

บันทึกการบรรยาย: How to think like a Data Scientist

แนะนำ

  • บรรยายโดย พี่เมฆ จาก KPTG และ Data Science Thailand
  • วัตถุประสงค์: ทำความเข้าใจ Data Scientist และแนวทางในการทำงานในสาย Data Science

โครงสร้างของการบรรยาย

  1. Section 1: Concept และ Application ของ Data Science
    • เข้าใจข้อมูลและการวิเคราะห์ข้อมูล
    • สถานะการทำงานของ Data Scientist
    • การประยุกต์ใช้ในธุรกิจ
  2. Section 2: Workshop
    • ทำ Data Science Project ร่วมกัน
    • วางแผน Career Path

Section 1: Concept และ Application ของ Data Science

  • Data Science เป็นคำที่ถูกพูดถึงมาก แต่มีคนเข้าใจน้อย
  • Data คือข้อมูลที่มีการเพิ่มขึ้นอย่างมหาศาล
  • ข้อมูลในปี 2003 มี 5 Exabyte ปัจจุบันมีประมาณ 15 ล้าน Exabyte
    • การเพิ่มขึ้นของข้อมูล: Exponential Growth
  • ประเภทข้อมูล:
    • Structured Data
    • Unstructured Data
  • V ในธุรกิจ:
    • V-Value: คุณค่าของข้อมูลในการตัดสินใจ

การวิเคราะห์ข้อมูล

  • ระดับการวิเคราะห์ (Analytics):
    1. Descriptive Analytics: อธิบายสิ่งที่เกิดขึ้น
    2. Diagnostic Analytics: วิเคราะห์สาเหตุ
    3. Predictive Analytics: คาดการณ์อนาคต
    4. Prescriptive Analytics: แนะนำการกระทำ

Section 2: Workshop

Project: Predicting Happiness

  • ข้อมูลที่ใช้: HappyDB
  • วัตถุประสงค์: วิเคราะห์สาเหตุของความสุข
  • ขั้นตอนในการทำ:
    1. แยกประเภทข้อมูลตามสาเหตุ
    2. ทำความสะอาดข้อมูล (Data Cleaning)
    3. ตัดคำ (Tokenization)
    4. วิเคราะห์ข้อมูลและสร้างโมเดล
    5. ประเมินผลโมเดล (Model Evaluation)

ข้อแนะนำเพิ่มเติม

  • การพัฒนาทักษะ Data Science
    • ฝึกฝนด้วยตัวเองและในทีม
    • เรียนรู้และจัดการแข่งขัน
    • ค้นหาโอกาสในการทำงานในสาย Data Science

สรุป

  • Data Science เป็นทักษะที่ต้องฝึกฝนและพัฒนาอย่างต่อเนื่อง
  • การทำงานในสายนี้ต้องการการวิเคราะห์ที่ดี และการทำงานร่วมกับทีมเพื่อสร้างผลลัพธ์ที่มีคุณค่า