• Tidak ada hasil yang ditemukan

The Learning System of Infant Cry using Extreme Learning Machines

N/A
N/A
Nguyễn Gia Hào

Academic year: 2023

Membagikan "The Learning System of Infant Cry using Extreme Learning Machines"

Copied!
140
0
0

Teks penuh

Upon receiving the filter level, the appropriate frequency of the signal is extracted from the characteristics of the baby cry and the value will be the signal coefficient. The data classification accuracy will provide the correct value based on the Epoch number of learning about the validation and the performance of the model with the relationship of significance value.

ภูมิหลัง

Hariharan ใช้โครงข่ายประสาทเทียมแบบหลายชั้น Perceptron (MLP) และโครงข่ายประสาทเทียมแบบหน่วงเวลา (TDNN) เพื่อเปรียบเทียบกับการวิจัยในอดีตเพื่อจำแนกประเภท จำแนกเด็กที่กำลังร้องไห้ปรสิต [6] ในปี 2558 Alejandro ค้นคว้าแบบจำลองการจำแนกประเภทสำหรับ Classify Cries

ความมุ่งหมายของการวิจัย

ขอบเขตของการวิจัย

นิยามศัพท์เฉพาะ

ลักษณะเสียงร้องของเด็กทารก

การคัดแยกสกัดคุณลักษณะส าคัญของสัญญาณเสียง

ระบบการเรียนรู้ของโครงข่ายประสาทเทียม (Artificial neural network)

เครื่องจักรเรียนรู้แบบเอ็กซ์ตรีม (Extreme Learning Machine)

งานวิจัยที่เกี่ยวข้อง

28 การศึกษาการรับรู้รูปแบบการร้องไห้ของทารกเพื่อการระบุอาการหูหนวกในทารกแรกเกิดที่มีโครงข่ายประสาทเทียม [23] การรู้จำเสียงทารกแรกเกิดด้วย เครือข่ายฟังก์ชันพื้นฐานแนวรัศมีเชิงรัศมีสำหรับการจำแนกประเภทเสียงร้องของทารก [24] การใช้ฟังก์ชันพื้นฐานโครงข่ายประสาทเทียมสำหรับการจำแนกประเภทเสียงร้องของทารก งานวิจัยนี้เน้นที่โครงสร้างของฟังก์ชันพื้นฐานโครงข่ายประสาทเทียม (Radial Basic Function: RBF) เพื่อปรับพารามิเตอร์ของสัมประสิทธิ์ที่ได้จากเสียงร้องโดยใช้พื้นฐานทางสถิติของคณิตศาสตร์เครือข่าย โครงข่ายประสาทเทียม (ANN) แบ่งประเภทเสียงของทารกออกเป็น 2 กลุ่ม ได้แก่ ทารกที่ การจำแนกประเภทของเสียงร้องของทารกเพื่อระบุโรคในทารกแรกเกิดที่มี ANFIS [25] ปรับเปลี่ยนระบบการอนุมานแบบคลุมเครือของระบบประสาทแบบปรับตัว (ANFIS) งานวิจัยนี้ใช้เทคนิคในการดึงค่าสัมประสิทธิ์ของสัญญาณร้องไห้โดยใช้ Mel Frequency Cepstral Coefficients (MFCC) และใช้โครงข่ายประสาทเทียมแบบปรับตัว เปลี่ยนระบบ Fuzzy Inference เพื่อกำหนด Classify เสียงร้องของทารก โดยแบ่งออกเป็น 3 กลุ่ม คือ เสียงร้องของทารกปกติ

ประสิทธิภาพของเครื่องเวกเตอร์สนับสนุนแบบผสมผสานและการวิเคราะห์องค์ประกอบหลักในการจดจำเสียงร้องไห้ของทารกที่มีภาวะขาดอากาศหายใจ [28] คุณค่าของประสิทธิภาพการสนับสนุนเครื่องเวกเตอร์สนับสนุน (SVM) และการวิเคราะห์องค์ประกอบหลักในการจดจำเสียงร้องไห้ของทารกที่ขาดออกซิเจน การใช้ค่าสัมประสิทธิ์เซปสตรัลความถี่เมล (MFCC) มีเทคนิคการสกัด ค่าประสิทธิภาพการจำแนกจำแนกเสียงร้องไห้

สรุป

การรวบรวมข้อมูล

ขั้นตอนการท างานวิจัย

การเตรียมข้อมูลก่อนการประมวลผล

วิธีการที่ใช้ในงานวิจัย

อุปกรณ์และเครื่องมือที่ใช้ในการวิจัย

การคัดแยกสัญญาณเสียงด้วยการแปลงเวฟเล็ตแบบเต็มหน่วย

การออกแบบตัวแบบโครงข่ายประสาทเทียมเอ็กซ์ตรีม

อภิปรายผลการด าเนินงานวิจัย

66 จากรูปที่ 4.34 นี่เป็นสัญญาณรบกวนแบบจำลองของจำนวนเลเยอร์ที่ซ่อนอยู่ถูกตั้งค่าเป็น 20 โมเดลการฝึกจะถูกนำเสนอต่อเครือข่ายระหว่างการฝึก และเครือข่ายจะถูกปรับเปลี่ยนตามข้อผิดพลาด และเปรียบเทียบกับโมเดลที่ทดสอบ เครือข่ายทดสอบและหาค่าได้แม่นยำที่สุดโดยมีค่านัยสำคัญ ประสิทธิภาพของระบบอยู่ที่ 0.68879 และหยุดทำงานด้วยวงจรการเรียนรู้ที่เหมาะสมในรอบที่ 9 จากภาพประกอบในรูปที่ 4.35 เป็นโมเดลสัญญาณรบกวนต่ำของตัวเลข จำนวนที่ซ่อนอยู่ เลเยอร์ถูกตั้งค่าเป็น 40 โมเดลการฝึกจะถูกนำเสนอต่อเครือข่ายระหว่างการฝึก และเครือข่ายจะถูกปรับเปลี่ยนตามข้อผิดพลาด และเปรียบเทียบกับโมเดลที่ทดสอบ เครือข่ายทดสอบและหาค่าได้แม่นยำที่สุดโดยมีค่านัยสำคัญ ประสิทธิภาพของระบบอยู่ที่ 0.37887 และหยุดทำงานด้วยวงจรการเรียนรู้ที่เหมาะสมในรอบที่ 9 จากรูปที่ 4.36 นี่คือรูปแบบสัญญาณรบกวนต่ำของระบบ จำนวนเลเยอร์ที่ซ่อนอยู่ตั้งไว้ที่ 40 โมเดลการฝึกจะถูกนำเสนอต่อเครือข่ายระหว่างการฝึก และเครือข่ายจะถูกปรับเปลี่ยนตามข้อผิดพลาด และเปรียบเทียบกับโมเดลที่ทดสอบ เครือข่ายทดสอบและค้นหาค่าได้แม่นยำที่สุดโดยมีค่านัยสำคัญ จุดวิกฤตของการทดสอบ (Validation) คือประสิทธิภาพของระบบอยู่ที่ 0.66871 และหยุดด้วยวงจรการเรียนรู้ที่เหมาะสมในรอบที่ 13

จากภาพประกอบในรูปที่ 4.37 นี่คือสัญญาณเสียงเฮิ้งของโมเดล จำนวนเลเยอร์ที่ซ่อนอยู่ตั้งไว้ที่ 20 โมเดลการฝึกจะถูกนำเสนอต่อเครือข่ายระหว่างการฝึก และเครือข่ายจะถูกปรับเปลี่ยนตามข้อผิดพลาด และเปรียบเทียบกับโมเดลที่ทดสอบ เครือข่ายทดสอบและค้นหาค่าได้แม่นยำที่สุดโดยมีค่านัยสำคัญ จุดวิกฤตของการทดสอบ (Validation) คือประสิทธิภาพของระบบอยู่ที่ 0.045721 และหยุดทำงานด้วยวงจรการเรียนรู้ที่เหมาะสมในรอบที่ 5

สรุปและอภิปรายผลการทดลอง

สรุปและข้อเสนอแนะ

แสดงลักษณะสเปคโตรแกรมของเสียงเด็กทารกร้องไห้ในหลายโหมด

แสดงตัวอย่างสัญญาณเสียงร้องทารก

แสดงลักษณะของเวฟเล็ต

แผนภาพแสดงการกระจายสัญญาณแบบหลายระดับความละเอียด

การแยกสัญญาณด้วยตัวกรองแบบ 2 ช่องสัญญาณ

การแปลงกลับสัญญาณด้วยตัวกรองแบบ 2 ช่องสัญญาณ

แสดงการแยกองค์ประกอบด้วยเวฟเล็ตแบบเต็มหน่วย

แสดงการสร้างกลับจากองค์ประกอบด้วยเวฟเล็ตแบบเต็มหน่วย

เวฟเล็ตฟังก์ชันแบบ Haar

เวฟเล็ตฟังก์ชันและจ านวนสมาชิกแบบ Coiflets

เวฟเล็ตฟังก์ชันและจ านวนสมาชิกแบบ Symlets

เวฟเล็ตฟังก์ชันและจ านวนสมาชิกแบบ Daubechies

เวฟเล็ตฟังก์ชันและจ านวนสมาชิกแบบ Biorthogonal

แสดงโมเดลของประสาทในสมองมนุษย์

แสดงโมเดลของประสาทในคอมพิวเตอร์

แสดงโครงสร้างวงจรโครงข่ายประสาท

แสดงการเรียนรู้แบบมีการสอน

แสดงการเรียนรู้แบบไม่มีการสอน

โครงสร้าง SLNF

การจำแนกเสียงร้องของทารกที่เพดานปากแหว่งเพดานโหว่โดยใช้แบบจำลองมาร์คอฟซ่อนเร้นแบบขนาน [27] เปรียบเทียบการวิจัย แบบจำลองมาร์คอฟแบบขนาน (ตัวแยกประเภทตาม PHMM) ​​สำหรับการจำแนกเสียงร้องของทารกและตัวแยกประเภทแบบเบย์โดยใช้เทคนิคการสกัดแบบฟีเจอร์ ค่าสัมประสิทธิ์ช่องท้องความถี่เมล (MFCC) วัดประสิทธิภาพของการแยกเสียงร้องไห้ของทารกระหว่างทารกปกติและทารกที่มีเพดานโหว่

แสดงตัวอย่างสัญญาณกลุ่มเสียงเอียะ

แสดงตัวอย่างสัญญาณกลุ่มเสียงเอะ

แสดงตัวอย่างสัญญาณกลุ่มเสียงเฮะ

แสดงตัวอย่างสัญญาณกลุ่มเสียงเนะ

แสดงตัวอย่างสัญญาณกลุ่มเสียงอาว

แสดงแผนผังขั้นตอนการท างาน

ตัวอย่างโครงสร้างการออกแบบระดับตัวกรองสัญญาณความถี่

โครงสร้างการออกแบบระดับตัวกรองสัญญาณความถี่

แสดงภาพสีของค่าสัมประสิทธิ์ในแต่ละระดับตัวกรองความถี่

ตัวอย่างสัญญาณเสียงเอียะในส่วนความถี่ต่ าและส่วนความถี่สูงของเวฟเล็ตฟังก์ชัน

ตัวอย่างสัญญาณเสียงเอียะในส่วนความถี่ต่ าและส่วนความถี่สูงของเวฟเล็ตฟังก์ชัน

ตัวอย่างสัญญาณเสียงเอียะในส่วนความถี่ต่ าและส่วนความถี่สูงของเวฟเล็ตฟังก์ชัน

ตัวอย่างสัญญาณเสียงเอียะในส่วนความถี่ต่ าและส่วนความถี่สูงของเวฟเล็ตฟังก์ชัน

ตัวอย่างสัญญาณเสียงเอียะในส่วนความถี่ต่ าและส่วนความถี่สูงของเวฟเล็ตฟังก์ชัน

ตัวอย่างสัญญาณเสียงเอะในส่วนความถี่ต่ าและส่วนความถี่สูงของเวฟเล็ตฟังก์ชัน

ตัวอย่างสัญญาณเสียงเอะในส่วนความถี่ต่ าและส่วนความถี่สูงของเวฟเล็ตฟังก์ชัน

ตัวอย่างสัญญาณเสียงเอะในส่วนความถี่ต่ าและส่วนความถี่สูงของเวฟเล็ตฟังก์ชัน

ตัวอย่างสัญญาณเสียงเอะในส่วนความถี่ต่ าและส่วนความถี่สูงของเวฟเล็ตฟังก์ชัน

ตัวอย่างสัญญาณเสียงเอะในส่วนความถี่ต่ าและส่วนความถี่สูงของเวฟเล็ตฟังก์ชัน

ตัวอย่างสัญญาณเสียงอาวในส่วนความถี่ต่ าและส่วนความถี่สูงของเวฟเล็ต

ตัวแบบโครงข่ายประสาทเทียมเอ็กซ์ตรีมชั้นซ่อนจ านวน 10 โหนด

ตัวแบบโครงข่ายประสาทเทียมเอ็กซ์ตรีมชั้นซ่อนจ านวน 20 โหนด

ตัวแบบโครงข่ายประสาทเทียมเอ็กซ์ตรีมชั้นซ่อนจ านวน 30 โหนด

ตัวแบบโครงข่ายประสาทเทียมเอ็กซ์ตรีมชั้นซ่อนจ านวน 40 โหนด

ตัวแบบโครงข่ายประสาทเทียมเอ็กซ์ตรีมชั้นซ่อนจ านวน 50 โหนด

ประสิทธิภาพของแบบจำลองคือ 0.174 และจำนวนรอบการเรียนรู้แบบจำลองที่เหมาะสมคือ 8 รอบ แนะนำให้มีความแม่นยำร้อยละ 84.21 ประสิทธิภาพของแบบจำลองคือ 0.127 และจำนวนรอบการเรียนรู้คือ 8 รอบ จำนวนรอบการเรียนรู้แบบจำลองที่เหมาะสมคือ 4 รอบ เสียงให้ความแม่นยำร้อยละ 84.21 ประสิทธิภาพของแบบจำลอง 0.138 และจำนวนรอบการเรียนรู้แบบจำลองเท่ากับ 0.138

ผลการฝึกสอนตัวแบบด้วยฟังก์ชัน Haar

ผลการฝึกสอนตัวแบบด้วยฟังก์ชัน Db2

ผลการฝึกสอนตัวแบบด้วยฟังก์ชัน Sym2

ผลการฝึกสอนตัวแบบด้วยฟังก์ชัน Coif1

ผลการฝึกสอนตัวแบบด้วยฟังก์ชัน Bior3.1

Awang, Pathological analysis of infant crying using wavelet packet transform and probabilistic neural network, Expert Syst. Sindhu, Sazali Yaacob, Normal and hypoacoustic classification of infant cry signal using time-frequency analysis and general regression neural network, Computer Methods and Programs in Biomedicine, COMM- 3256; Page 11. Sindhu, Wan Khairunizam, Sazali Yaacob, Classification of infant cries to identify asphyxia using time-frequency analysis and radial-based neural networks, Expert Systems with Applications 39, p.

StellzigEisenhauer, On the use of hidden markov models in infant cry classification, in: 22nd Israel Electrical and Electronics Engineers Convention, IEEE, 2002, pp.350–352. Reyes-García, A study on the recognition of baby crying patterns for the identification of deafness in newborn infants with neural networks, in: A. Zabidi, Performance of combined support vector machine and principal component analysis in the recognition of the crying of the asphyxiated infant, in: 2010 Annual International Conference of the IEEE Engineering in Medicine and Biology Society (EMBC), IEEE, p.

Referensi

Dokumen terkait

นภชา สิงห์วีรธรรม ปริญญา สาธารณสุขศาสตรมหา บัณฑิต สาขาวิชา สาธารณสุขศาสตรมหาบัณฑิต มหาวิทยาลัย มหาวิทยาลัยมหาสารคาม ปีที่พิมพ์ 2563 บทคัดย่อ