• Tidak ada hasil yang ditemukan

2020 Intro to DS Module 0 - Learning Objectives

N/A
N/A
melki husain

Academic year: 2022

Membagikan "2020 Intro to DS Module 0 - Learning Objectives"

Copied!
4
0
0

Teks penuh

(1)

COURSE FUNDAMENTALS BRIAN D’ALESSANDRO

Introduction to Data Science

Fine  Print:  these  slides  are,  and  always  will  be  a  work  in  progress.  The  material  presented  

herein  is  original,  inspired,  or  borrowed  from  others’  work.  Where  possible,  attribution  and  

acknowledgement  will  be  made  to  content’s  original  source.  Do  not  distribute,  except  for  as  

needed  as  a  pedagogical  tool  in  the  subject  of  Data  Science.

(2)

Copyright:   Brian  d’Alessandro,   all  rights  reserved

INSTRUCTOR

Brian  d’Alessandro Bio

Education:

Undergrad:  Rutgers,  Math Grad:  NYU   Stern,  Statistics

Professional  Experience Capital  One  (Credit/Risk) ZocDoc (Healthcare/Tech) Facebook  (Social/Tech) Dstillery  (Advertising/Tech) Meetup.com (Social/Tech)

American  Express  (Credit/Risk)

Affiliations/Publications ACM  KDD

Big  Data  Journal

Machine  Learning  Journal

SIAM  

(3)

Copyright:   Brian  d’Alessandro,   all  rights  reserved

LEARNING OBJECTIVES OF THIS SERIES

1. Constructing  meaningful  and  unbiased   labels  and  

2. Sampling  without  bias

3. Feature  Engineering,  Regularization  and   the  avoidance  of  leakage

4. Data  splitting  for  out-­of-­sample  valuation

Preparing   data  for  modeling Building  generalizable   models

Optimizing  Decision   Systems

1. Identifying  the  appropriate  set  of   algorithms  for  a  given  problem   statement  observing  problem   constraints

2. Finding  an  optimal  model  fit  by  tuning   hyper-­parameters  on  a  variety  of   classification  algorithms  

1. Setting  up  ML  research  experiments 2. Identifying  the  appropriate  evaluation  

metric  based  on  a  given  problem  goal   3. Designing  and  implementing  a  decision  

function  that  reflects  the  cost  of  

classification  errors  that  might  be  made 4. Bayesian  updating  and  experimentation

Design  effective  ML  solutions,  by…

(4)

Copyright:   Brian  d’Alessandro,   all  rights  reserved

WHAT IS NOT IN SCOPE

• This  is  not  a  math  or  ML  theory  course   (though  some  calculus,   linear  algebra  and   probability  are  used)

• This  is  not  a  programming   or  Python   course (refer  to  supplemental   learning   materials  for  this

• This  is  not  an  ML  system   deployment   course

Referensi

Dokumen terkait

Ketidaksertaan Mitra Keluarga dalam jaringan BPJS, bagi Ashraf adalah sebuah disintegrasi visi antara pemerintah dan pihak rumah sakit --terutama rumah sakit swasta-- dalam

Hal ini menunjukkan bahwa data produksi jagung manis dapat diterangkan dengan menggunakan model AMMI2, dimana pengaruh interaksi antara genotipe dan lokasi direduksi

Dengan jumlah sampel data dan waktu yang sama bagi pemutus-pemutus tenaga untuk memutus gangguan, hasil simulasi dengan menggunakan eksponen Lyapunov maksimum

Telah dilakukan penelitian yang bertujuan untuk mendeskripsikan kemampuan awal literasi sains siswa yang terdiri atas empat kategori yaitu nominal, fungsional, prosedural

normatif adalah suatu tahap perkembangan individu yang cenderung mengikuti pola-pola yang sudah umum sesuai dengan konsep perkembangan secara normal dan formalistik,

Penelitian dengan judul “ Peningkatan Profesionalisme Guru Matematika di SMA Negeri 1 Bandar, SMA Negeri 2 Bukit, dan SMK Negeri 2 Bener Meriah Melalui Pelatihan Penelitian Tindakan

deviasi 2,91% yang lebih besar daripada ratio Belanja Hibah daerah incumbent sebelum pelaksanaan pemilukada dengan rasio maksimun 9,66%, rata-rata 1,42%, dan standar

“Pendidikan nasional berfungsi mengembangkan kemampuan dan membentuk watak serta peradaban bangsa yang bermartabat dalam rangka mencerdaskan kehidupan bangsa,