BASIS CYCLIC PENALIZED
SPLINE (CP)
Dalam mengestimasi kurva regresi dapat
didekati dengan dua pendekatan, yaitu pendekatan parametrik dan pendekatan
nonparametrik. Parametrik merupakan metode statistik yang digunakan untuk
mengetahui pola hubungan antar variabel prediktor dengan variabel respon,
dengan asumsi bahwa tidak diketahui bentuk dari fungsi regresinya.
Hubungan antara variabel respons dan
variabel prediktor dalam model dapat terjadi dengan fungsi linier maupun nonlinier
dalam parameter. Sedangkan Non parametrik merupakan metode statistik yang
digunakan untuk mengetahui pola hubungan antara variabel prediktor dan respon
apabila bentuk pola hubungan antara variabel respons dengan variabel prediktor
tidak diketahui bentuk fungsi regresinya. Dalam regresi nonparametrik kurva
regresi hanya diasumsikan mulus (smooth) dalam arti termuat dalam suatu
ruang fungsi tertentu sehingga mempunyai sifat fleksibilitas yang tinggi.
Perbedaan antara keduanya adalah
pendekatan parametrik estimasinya ditentukan dari percobaan, sedangkan
pendekatan nonparametrik hanya ditentukan dari data. Teknik estimasi dalam
regresi nonparametrik ada banyak, antara lain : estimator kernel, estimator
spline, histogram, estimator deret orthogonal maupun estimator wavelet. Salah
satu model nonparametrik dibangun dengan memilih ruang fungsi yang sesuai
dimana fungsi regresi diyakini termasuk didalamnya, sedangkan model spline
dibangun dari knot. Oleh karena itu penentukan jumlah dan posisi knot dalam
regresi spline memegang peran yang sangat penting.
Basis cyclic p-spline merupakan fungsi
basis dengan tipe yang baru pertama kali di publish oleh roth pata tahun 2009.
Basis ini dapat menjelaskan tentang kurva yang tertutup dengan menggunakan
titik kontrol tanpa redundansi, dengan keuntungan nilai dari fungsi C kontinue
pada semua titik kurva. Basis Cylic Penalized Spline merupakan bagian dari
basis P-Splines. Fungsi Basis Cyclic adalah fungsi basis yang dikembangkan dari
basis-basis yang lain. Ada beberapa basis yang langsung terbentuk dari
koefisien Penalized Spline, salah satunya yaitu basis Cyclic atau disbeut juga
sebagai pemulus dari penalized Spline.
Basis cyclic p-spilne dapat digunakan
untuk model periodik dan data musiman. Basis ini ditentukan dengan perkiraan
dari fungsi yang dihasilkan terus menerus hingga batas knot. Namun,
permasalahan pada fungsi ini tidak mengalami pemulusan akan tetapi dapat
diatasi dengan perbedaan cyclic penalty.
Pencocokan model
aditif tergeneralisasi menggunakan metode penghalusan berupa scatter plot
smoother untuk mengestimasi fungsi mulus, dan menggunakan algoritma penalized Iteratively
Re-Weighted Least Square (P-IRLS) untuk mengestimasi model. Adapun metode
penghalusan yang dapat memberikan suatu hasil analisis numerik yang lebih baik
adalah penghalus spline.
Pada regresi
semiparametrik, untuk memperoleh estimator spline pada dasarnya terdapat dua
pendekatan optimasi, yaitu estimator spline
yang diperoleh berdasarkan optimasi penalized
least square (PLS) dan estimator spline
yang diperoleh berdasarkan optimasi least
square (LS) dengan menggunakan fungsi yang memuat titik-titik knots.
Apabila estimator spline yang
diperoleh berdasarkan optimasi PLS, maka persoalan utama dalam estimator ini
adalah pemilihan parameter penghalus yang optimal. Sedangkan apabila estimator
spline yang diperoleh dengan optimasi LS, maka persoalan utama dalam estimator
ini adalah pemilihan titik-titik knot yang optimal. Estimator spline sendiri
merupakan estimator yang dapat memberikan fleksibilitas yang baik terhadap
karakteristik suatu fungsi atau data yang dapat menangani fungsi bersifat mulus
(smooth). Spline adalah potongan polinomial, yaitu polinomial yang memiliki
sifat tersegmen. Sifat tersegmen ini memberikan fleksibilitas lebih dari
polynomial biasa, sehingga memungkinkan untuk menyesuaikan diri secara lebih
efektif terhadap karakteristik dari suatu fungsi atau data.
Regresi spline memerlukan jumlah simpul (knot) yang relatif sedikit dan
dapat diduga dengan metode kuadrat terkecil. Pemulus spline memerlukan jumlah
simpul yang banyak dan kemulusan kurva ditentukan oleh parameter pemulus dan
fungsi penalti. Eilers dan Mark (1996) menggabungkan kedua pendekatan spline di
atas menjadi P-spline. Pendekatan yang sama juga dikemukakan Ruppert dan
Carroll (1997) dengan nama regresi spline terpenalti (penalized spline
regression) dan disebut juga dengan P-spline.
P-spline, adalah
regresi yang ditentukan dengan kuadrat terkecil dan penalti kekasaran. P-spline
dapat direpresentasikan dalam bentuk model linear campuran dengankomponen ragam
mengontrol tingkat ketidaklinearan dari penduga fungsi mulusnya. Pendugaan P-spline
dengan pendekatan model linear campuran mempunyai tiga keuntungan yaitu sebagai
berukut;
1. P-spline dapat diduga dengan metode
kemungkinan maksimum (ML) atau dengan metode kemungkinan maksimum berkendala
(REML).
2. Komputasi lebih cepat karena menggunakan
basis pemulus berdimensi rendah.
3. P-spline dapat dikembangkan untuk model
dengan peubah penjelas lebih dari satu.
Cara
mengestimasinya adalah sebagai berikut;
Misalkan terdapat n data berpasangan
{(x1,y1),( x2,y2),...,(xn,yn)}
mengikuti model regresi;
yi
= f
(xi) + ei,
i=1,2,...n
dimana :
f
= fungsi regresi yang belum diketahui bentuknya
yi
= Variabel respon ke-i
ei=
error random dengan mean 0 dan varians 𝜎2I
Hubungan antara spline dengan model linear
campuran yang menghubungkan antara
pemulus spline dengan peubah penjelas tak bias terbaik (BLUP) dari model linear
campuran. Hubungan pemulus spline dengan model linear campuran melalui
perluasan metode kemungkinan maksimum terampat (generalized maximum
likelihood) untuk data yang berkorelasi.
DAFTAR
PUSTAKA
Brechera, C., Langea, S., Merza, M., Niehausa, F.,
Wenzela, C., Winterschladena, M., Weck, M., 2006. NURBS based ultra-precision
free-form machining. CIRP Annals – Manufacturing Technology 55 (1), 547–550.
Herawati, N. 2011. Regresi Spline untuk Pemodelan
Bidang Kesehatan:
Studi
tentang Knot dan Selang Kepercayaan. Jurnal
ILMU DASAR, 12(2);152-160.
Hofner, dkk. 2014. A Unified Framework of Constrained
Regression. https://arxiv.org/pdf/1403.7118.pdf. 1-16.
Technical report.
Hofner, B. 2011. A framework for unbiased model
selection based on boosting. Journal of Computational and Graphical Statistics
20:956–971
Róth, Á, Juhász, I., Schicho, J., Hoffmann, M., 2009.
A cyclic basis for closed curve and surface modeling. Computer Aided Geometric
Design 27.179-201
Wigati,d. 2016. Pengembangan Model Aditif
Tergeneralisasi Dengan
Penghalus
Splines Berbasis WEB Interaktif Menggunakan R-Shiny. SKRIPSI. Jember