Nama : Salsabila Ghaisani
NIM : 201931116
Machine Learning Kelas G
Data Science
Data science merupakan ilmu yang sedang naik daun saat ini yang dibangun berdasarkan disiplin ilmu matematika, statistik, dan komputer. Kombinasi disiplin ilmu tersebut membuat data science powerful untuk mengolah big data.
Selain itu, data science pun ikut menghubungkan berbagai bidang pekerjaan dengan tujuan melakukan proses perhitungan yang bertujuan untuk menerjemahkan data untuk pengambilan.
Contoh penerapan data science di bidang kesehatan yang paling relevan dengan kondisi sekarang ini adalah untuk mengetahui perkembangan Covid-19 di Indonesia. Dengan mengetahui perkembangannya, pemerintah akan lebih mudah dalam mengambil tindakan yang dapat menahan persebaran virus, memberikan wawasan kepada masyarakat khususnya wilayah yang sudah parah persebaran virusnya untuk lebih menjaga kesehatannya, dan sebagainya. Terdapat juga penelitian yang menggunakan data science untuk membantu pengobatan kanker. Adapun alat yang digunakan dalam data science yaitu machine learning, data mining, deep learning, dan artificial intelligence.
Regresi
Definisi regresi adalah metode statistik yang digunakan dalam keuangan, investasi, dan disiplin ilmu lain. Gunanya untuk mencoba menentukan kekuatan dan karakter hubungan antara satu variabel dependen (biasanya dilambangkan dengan Y) dan serangkaian variabel lain (dikenal sebagai variabel independen).
Regresi itu bisa membantu manajer investasi dan keuangan untuk menilai aset dan memahami hubungan antara variabel. Seperti harga komoditas dan saham bisnis yang berurusan dengan komoditas tersebut.
Regresi linier sederhana menggunakan satu variabel independen untuk menjelaskan atau memprediksi hasil dari variabel dependen Y, sedangkan regresi linier berganda menggunakan dua atau lebih variabel independen untuk memprediksi hasil.
Bentuk umum dari setiap jenis regresi adalah:
Regresi linier sederhana: Y = a + bX + u
Regresi linier berganda: Y = a + b1X1 + b2X2 + b3X3 + … + btXt + u
Di mana:
Y = variabel yang Anda coba prediksi (variabel dependen).
X = variabel yang Anda gunakan untuk memprediksi Y (variabel independen).
a = intersep.
b = variabel bebas.
u = sisa regresi.
REGRESI LINEAR SEDERHANA
Regresi linear sederhana adalah hubungan secara linear antara satu variabel independen (X) dengan variabel dependen (Y). Analisis ini digunakan untuk mengetahui arah hubungan antara variabel independen dengan variabel dependen apakah positif atau negatif serta untuk memprediksi nilai dari variabel dependen apabila nilai variabel independen mengalami kenaikan atau penurunan nilai. Data yang digunakan biasanya berskala interval atau rasio.
Rumus dari dari analisis regresi linear sederhana adalah sebagai berikut:
Y’ = a + bX
Keterangan:
Y= subyek dalam variabel dependen yang diprediksi
a = harga Y ketika harga X= 0 (harga konstan)
b = angka arah atau koefisien regresi, yang menunjukkan angka peningkatan ataupun penurunan variabel dependen yang didasarkan pada perubahan variabel independen. Bila (+) arah garis naik, dan bila (-) maka arah garis turun.
X = subyek pada variabel independen yang mempunyai nilai tertentu.
Secara teknik harga b merupakan tangent dari perbandingan antara panjang garis variabel dependen, setelah persamaan regresi ditemukan.
REGRESI LINEAR BERGANDA
Regresi linear berganda adalah hubungan secara linear antara dua atau lebih variabel independen (X1, X2, … Xn) dengan variabel dependen (Y). Analisis ini digunakan untuk mengetahui arah hubungan antara variabel independen dengan variabel dependen apakah masing-masing variabel independen berhubungan positif atau negatif dan untuk memprediksi nilai dari variabel dependen apabila nilai variabel independen mengalami kenaikan atau penurunan. Data yang digunakan biasanya berskala interval atau rasio.
Analisis regresi ganda digunakan oleh peneliti, bila peneliti bermaksud meramalkan bagaimana keadaan (naik turunnya) variabel independen (kriterium), bila dua atau lebih variabel independen sebagai faktor predictor dimanipulasi (dinaik turunkan nilainya). Jadi analisis regresi ganda akan dilakukan bila jumlah variabel independennya minimal 2.
Rumus dari analisis regresi linear berganda adalah sebagai berikut: