Minggu, 25 Desember 2022

Pendeteksi Kanker Payudara dengan Metode Probabilistic Neural Network


Pendahuluan

Kanker payudara adalah kanker yang paling sering didiagnosis pada wanita di seluruh dunia dan menjadi penyebab utama kematian wanita di seluruh dunia [1]. Kanker payudara menyumbang 23% dari total kasus kanker dan 14% dari kematian akibat kanker di negara maju dan berkembang. Diperkirakan lebih dari 1,6 juta kasus baru kanker payudara terjadi di kalangan wanita di seluruh dunia pada tahun 2010 [2]. 

Baca Juga : Belajar Artificial Neural Network

Kanker berasal tumor ganas yang dimulai dalam sel-sel payudara. Sebuah tumor ganas yaitu sekelompok sel kanker yang dapat tumbuh dan menyerang jaringan sekitarnya atau menyebar (metastasis) ke daerah yang jauh dari tubuh [3]. Tumor terbagi menjadi dua yaitu tumor jinak dan tumor ganas. Tumor jinak memiliki ciri-ciri yaitu tumbuh secara terbatas, memiliki selubung, tidak menyebar dan bila dioperasi dapat dikeluarkan secara utuh sehingga dapat sembuh sempurna, sedangkan tumor ganas memiliki ciri-ciri yaitu dapat menyusup ke jaringan sekitarnya,sel kanker dapat ditemukan pada pertumbuhan tumor tersebut [4]. Penyakit ini terjadi hampir seluruhnya pada wanita, namun pria bisa mendapatkannya juga [3]. 

Jaringan saraf tiruan telah banyak digunakan dengan sukses di banyak daerah di teknik biomedis. Hal ini jelas dari literatur bahwa para peneliti telah menggunakan jaringan saraf sebagai alat komputasi, alat-alat pemodelan serta alat meniru otak manusia. Seberapa potensi bidang teknik biomedis untuk jaringan saraf dapat diterapkan di masa depan adalah elektrofisiologi, biomaterial, bioteknologi, biosensor, pemodelan, instrumentasi, teknik rehabilitasi, medis analisis, prosthetic, informatika, pencitraan, dokter, biomekanik, perangkat komputer. [5] 

Sistem pendeteksi kanker payudara dengan menggunakan Probabilistic Neural Network (PNN) yang merupakan salah satu tipe dari Artificial Neural Network (ANN). Pendeteksian dilakukan dengan pengolahan citra yang kemudian hasil dari pengolahan citra diklasifikasikan. Hasil luaran dari proyek ini adalah apabila ada sel kanker dapat teridentifikasi jenisnya.

Data dan Metode




  • Training
    Proses pelatihan adalah suatu proses melatih suatu sistem untuk menciptakan suatu model otomatis pada komputer dari sekumpulan data yang ada. Dalam kasus ini training dilakukan dengan menginputkan sejumlah gambar dengan pengklasifian tertentu. Gambargambar tersebut kemudian diolah dan hasilnya disimpan pada sebuah database untuk dijadikan sebuah rujukan.

  • RGB2GRAY
    Proses pengolahan citra dimulai dari mengubah gambar masukan menjadi hitam putih dengan menggunakan fungsi rgb2gray pada matlab.


  • Adaptive Median Filter
    Adaptive Median Filter melakukan pemrosesan spasial untuk menentukan piksel mana dalam gambar yang telah dipengaruhi oleh noise impuls. Adaptive Median Filter mengklasifikasikan piksel sebagai noise dengan membandingkan setiap piksel pada gambar dengan piksel di sekitarnya. Gambar yang telah diubah menjadi hitam putih kemudian diubah ukurannya menjadi dua kalinya untuk menghilangkan noise dengan cara mengisinya dengan pixel hasil median filter.

  • Gaussian Mixture Model (GMM) Segmentation
    GMM adalah sebuah tipe density model yang terdiri dari komponen fungsi-fungsi Gaussian [6]. Komponen Fungsi ini terdiri dari Threshold yang berbeda untuk menghasilkan multi-model density. Pada penelitian ini, GMM digunakan untuk memodelkan warna-warna background dari tiap piksel. Hasil adaptasi terhadap perubahan yang terjadi dievaluasi melalui proses update parameter Weight, Standard Deviation, dan Means. Setiap piksel dikelompokkan berdasarkan distribusi yang dianggap paling efektif sebagai model latar belakang. Semakin besar nilai standar deviasi,semakin lebar distribusi kernel Gaussian maka, maka semakin kuat penghalusan yang terjadi pada citra.

    Setiap piksel memiliki GMM-nya sendiri dan data yang diolah adalah warna piksel yang didapat dari input. Model-model GMM terbentuk dari data warna piksel berdasarkan waktu [7]. Model yang terbentuk dibagi menjadi 2 bagian, model background dan non background. Dengan nilai Threshold dari Background yang sudah ditentukan.

    Terdapat beberapa tahapan dalam pemilihan distribusi background yaitu tahap pencocokkan input terhadap distribusi, dan tahap pemilihan distribusi yang mencerminkan background yang berada di atas rasio. Selain itu, akan dianggap sebagai foreground. Tahapan-tahapan tersebut dijelaskan sebagai berikut:

    a. Pencocokan input terhadap Distribusi
    Pada tahap ini input dicocokkan dengan semua distribusi sampai ditemukan distribusi yang paling cocok. Suatu piksel dikatakan masuk dalam suatu distribusi jika nilai piksel tersebut masuk dalam jarak 2.5 standar deviasi dari sebuah distribusi. Untuk pencocokkan input digunakan rumus: 
    Dimana 𝑋𝑑 adalah vektor dari warna piksel (RGB) (jacinto, Jorge, 2004) pada waktu t, ΞΌk adalah vektor nilai mean (RGB) dari Gaussian ke π‘˜ π‘‘β„Ž , dan πœŽπ‘˜ sebagai standar deviasi dari Gaussian ke π‘˜ π‘‘β„Ž [8].

    b. Update Parameter
    Pada tahap ini dilakukan update terhadap nilai dari parameter-parameter GMM yang nantinya digunakan untuk mengolah input selanjutnya. Nilai yang di-update terdiri dari weight, mean, dan varian. Nilai weight di-update tiap waktu. Untuk meng update nilai weight digunakan rumus [9]:
    Dimana πœ”π‘˜,𝑑 adalah weight dari Gaussian ke kth pada waktu t, Ξ± adalah learning rate dan nilai Mk,t adalah 1 untuk model yang cocok dan 0 untuk model lainnya. Setelah nilai weight diupdate dilakukan normalisasi sehingga total weight dari semua distribusi tidak lebih dari 1. Nilai standar deviasi dari suatu distribusi diupdate setiap ada nilai piksel yang cocok dengan distribusi tersebut. Untuk mengupdate nilai standar deviasi digunakan rumus [9]:

    c. Pemilihan Distribusi Background
    Pada tahap ini dipilih model-model yang mencerminkan background. Pertama model-model diurutkan berdasarkan Ο‰/Οƒ2 sehingga distribusi yang paling mencerminkan background tetap di atas dan yang tidak mencerminkan background ada di bawah yang nantinya digantikan oleh distribusi yang lain. Untuk memilih B distribusi pertama yang dijadikan distribusi background digunakan rumus:
    Dimana T adalah batas skala dengan proporsi terkecil dari data yang sebaiknya dihitung sebagai background [9].

    Gaussian Mixture Model juga merupakan fungsi dari k-means clustering yang digunakan untuk segmentasi gambar, algoritma ini termasuk dalam unsupervised learning. K Means clustering mengelompokkan data dalam beberapa kelompok dimana data dalam kelompok memiliki karakteristik yang sama dan memiliki karakteristik yang berbeda dari kelompok lain. GMM dilakukan dengan menggunakan HRMF (Hidden Markov Random Field) untuk menghasilkan pengelompokkan data yang tepat.

  • Klasifikasi
    Klasifikasi dilakukan dengan menggunakan PNN, PNN menggunakan masukan matriks data yang dipasangkan pada matriks klasifikasi untuk membuat probabilistic neural network baru. Probabilistic Neural Network (PNN) merupakan algoritma klasifikasi dan merupakan suatu algoritma NN yang menggunakan fungsi probabilistik, tidak membutuhkan set data yang besar dalam tahap pembelajarannya, serta memiliki kelebihan yaitu dapat mengatasi permasalahan yang ada pada Back-Propagation (BP) yaitu dapat mengatasi waktu pelatihan yang lama, terjebak pada global minimum, dan sulitnya perancangan arsitektur jaringan. PNN dapat digunakan untuk mengklasifikasikan secara akurat pada beberapa penelitian serta memiliki beberapa kelebihan dibandingkan dengan BP. Namun, PNN memiliki masalah pada penentuan parameter smoothing yang biasanya ditentukan dengan cara trial and error atau user defined. [10]

Hasil dan Pembahasan

Pada pengklasifikasian jenis kanker menggunakan PNN ini dilakukan dengan bantuan MATLAB. Awal nya dilakukan pelatihan dengan memasukan sejumlah gambar kanker yang telah diklasifikasikan sebelumnya. Ada 60 gambar dengan 3 klasifikasi yaitu beningn, malign, dan normal, masing-masing 20 sampel. 60 gambar sampel tersebut kemudian diolah dengan proses RGB2GRAY, adaptive median filter, dan GMM yang selanjutnya hasilnya akan disimpan pada database sebagai data rujukan.

Baca Juga : Belajar Secara Umum tentang Kecerdasan Buatan

Untuk memudahkan penggunaan atau pengujian dibuatlah sebuah GUI (Graphic User Interface). GUI yang dibuat berisi beberapa fitur, yaitu input gambar yang akan diuji, kemudian tombol untuk masing-masing proses, output gambar untuk masing-masing proses, dan yang terakhir akan menampilkan klasifikasi dari hasil pengujian gambar.

Berdasarkan hasil pengujian sistem yang dibuat sejauh ini menunjukkan hasil yang akurat. Ada dua macam pengujian yang dilakukan, yang pertama menguji dengan menggunakan data sampel, yang kedua menguji dengan menggunakan data baru.

Langkah pertama yang dilakukan adalah menjalankan program. Kemudian akan muncul GUI yang telah dibuat. Lalu klik ‘browse’ untuk menginput gambar yang akan diuji. Jika sudah maka akan muncul seperti gambar dibawah

Langkah selanjutnya adalah klik pada adaptive median filter untuk memperbaiki gambar yang diinputkan. Pada proses ini gambar output akan mengalami perubahan menjadi hitam putih, dan penghilangan sedikit noise yang ada. Pada kasus dibawah, dikarenakan gambar input sudah baik maka tidak terlihat begitu banyak perbedaan.

Langkah selanjutnya adalah segmentasi. Dengan mengklik pada tombol GMM segmentation maka gambar olahan sebelumnya akan diambil fitur-fitur gambar yang dibutuhkan untuk membedakan pengklasifikasian antara golongan 1 dengan golongan lainnya. 

Langkah yang terakhir adalah pengklasifikasian. Dengan mengklik pada tombol clasifier maka gambar yang telah diolah sebelumnya akan ditentukan termasuk pada golongan yang ditentukan dengan membandingkan hasilnya dengan database. Hasil dari pengklasifikasian ini berupad angka, dimana pendefinisian masing-masing angka tersebut adalah sebagai berikut,

1 untuk beningn, 2 untuk malign, dan 3 untuk normal. Hasil dari pengujian pada contoh ini menghasilkan bahwa gambar yang diinput tergolong pada beningn, dan ini telah sesuai dengan gambar yang diinputkan. 

Sedangkan untuk pengujian dengan data baru atau selain data sampel, hasilnya menunjukkan pengklasifikasian yang tepat terhadap database yang ada. Seperti yang ditunjukkan ada gambar berikut ini, 


Download Matlab Project : Matlab_Deteksi_Kanker_PNN


Referensi

1. Dheeba, J., Singh, N. A., & Selvi, S. T. (2014). Computer-aided detection of breast cancer on mammograms: A swarm intelligence optimized wavelet neural network approach. Journal of biomedical informatics, 49, 45-52. 
2. Jemal A, Bray F, Center MM, Ferlay J, Ward E, Forman D. (2011). Global cancer statistics. CA Cancer J Clin; 61(2):69–90. 
3. Sousa, A. C., & SimΓ΅es, A. C. (2005). [Breast self-examination]. Servir (Lisbon, Portugal), 53(6), 301–8. Retrieved from http://www.ncbi.nlm.nih.gov/pubmed/17282548 
4. Pusdatin. (2015). Situasi Penyakit Kanker. Retrieved from http://www.depkes.go.id/resources/download/pusdatin/infodatin/infodatin-kanker.pdf 
5. Supriyadi, S., Suhartono, V., & Supriyanto, C. (2015). PREDIKSI PENYAKIT KANKER PAYUDARA MENGGUNAKAN ARTIFICIAL NEURAL NETWORK. Cyberku Journal, 11(1), 1-12. 
6. Nicola G., A. Bernardino, L. Cecilia , D. Paolo, J. Santos-Victor. (2012). Fast Estimation of Gaussian Mixture Models for Image Segmentation. Italy. 
7. Triningtyas A, A. Afandi, Wirawan. Perancangan Sistem Pengenalan Obyek Visual Untuk Pengamanan dan Pemantauan Fasilitas PLTA. Surabaya. 
8. Christoper R.. Wren, A. Ali, D. Trevor, P.P. Alex. (1997). Pfinder:Real-Time Tracking of the Human Body. IEEE Transaction on Pattern Analysis and Machine Intelligence. 
9. Stauffer C., Grimson W.E.L. Grimson. (1999). Adaptive Background Mixture Models for Real-Time Tracking. 
10. Wicaksana, J A. 2016. PROBABILISTIC NEURAL NETWORK BERBASIS GUI MATLAB UNTUK KLASIFIKASI DATA REKAM MEDIS. JURNAL GAUSSIAN, Volume 5, Nomor 3, Tahun 2016, Halaman 427-436

1 komentar: