Automatic musical instrument recogn

Automatic musical instrument recognition is an essential part of many tasks such as music indexing, automatic transcription, retrieval and audio database querying. The perception of timbre by humans has been widely studied over the past five decades, but there has been little work on musical instrument identification. Most of the recent works have focused on speech or speaker recognition problems. Automatic sound recognition has two subtasks. The first task is to find a group of features that represents the entire sound with minimum amount of parameters; the second one is to design a classifier that recognizes the sound by using these features. It is clear that, the performance is highly related to information carried by feature set. Hence, many of the recent works focused on to find better feature sets. On the other hand, the classifier part of the problem has not received as much as research interest as feature sets. Brown [1] has reported a system that is able to recognize four woodwind instruments with a performance comparable to human abilities. Eronen [2] classified 30 different instruments with an accuracy of 32% by using MFCC as feature. Eronen used a mixture of k-NN and GMM/HMMs in a hierarchical recognizer. In [3], Eronen reported 68% performance for 27 instruments. Fujinaga and MacMillan [4] classified 23 instruments with 63% accuracy by using genetic algorithm. Martin’s system recognized a wide set of instruments, although it did not perform as well as human subjects in a similar task [5]. In this paper, a new musical sound recognizing system was presented. Main goal of this paper is not to find better features, but develop a better classifier. Linear prediction (LPC) and melfrequency cepstral coefficients (MFCC) are used as feature sets. Both coefficients are well-known, easy to calculate and reported several times as better feature sets than the others [2, 6, 7]. Classifier used in this work is an active learning probabilistic neural network (PNN). In the active learning, the learner is not just a passive observer. The learner has the ability of selecting new instances, which are necessary to raise the generalization performance. Similarly, the learner can refuse the redundant instances from the training set [8]. By combining these two new abilities, the active learner can collect a better training set which is representing the entire sample space well.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

การรับรู้ดนตรีอัตโนมัติเป็นส่วนสำคัญของงานต่าง ๆ เช่นการทำดัชนี transcription โดยอัตโนมัติ การเรียก และการสอบถามฐานข้อมูลเสียงเพลงได้ การรับรู้ของ timbre โดยมนุษย์ได้รับการศึกษาอย่างกว้างขวางห้าทศวรรษผ่านมา แต่มีงานน้อยระบุเครื่องดนตรี ส่วนใหญ่ผลงานล่าสุดได้เน้นปัญหาการรู้จำเสียงหรือลำโพง การรู้จำเสียงอัตโนมัติมีงานย่อยสอง งานแรกจะพบกลุ่มของคุณลักษณะที่ใช้แทนเสียงทั้งหมด มีจำนวนเงินต่ำสุดของพารามิเตอร์ สองคือการ ออกแบบ classifier ที่รับรู้เสียง โดยการใช้คุณลักษณะเหล่านี้ มันเป็นล้างที่ ประสิทธิภาพสูงที่เกี่ยวข้องกับข้อมูลที่ดำเนินการ โดยชุดคุณลักษณะ ดังนั้น ผลงานล่าสุดมากมายมุ่งเน้นเพื่อค้นหาชุดคุณลักษณะดี บนมืออื่น ๆ ส่วน classifier ของปัญหาไม่มากเท่างานวิจัยที่สนใจเป็นชุดคุณลักษณะรับ สีน้ำตาล [1] มีรายงานระบบที่ 4 เครื่องเป่าลมไม้กับประสิทธิภาพที่เทียบได้กับความสามารถของมนุษย์ได้ Eronen [2] จัดเครื่องมือต่าง ๆ 30 แม่นยำ 32% โดยใช้ MFCC เป็นคุณลักษณะ Eronen ใช้เป็นส่วนผสมของเอ็นเอ็นเคและ GMM/HMMs ในการจำแนกลำดับชั้น ใน [3], Eronen รายงาน 68% ประสิทธิภาพสำหรับเครื่องมือ 27 Fujinaga และ MacMillan [4] จัดเครื่อง 23 63% แม่นยำ โดยใช้อัลกอริทึมทางพันธุกรรม ระบบของมาร์ตินรู้จักชุดหลากหลายของเครื่องมือ ถึงแม้ว่ามันไม่ได้ทำเรื่องมนุษย์เป็นเช่นในงานเหมือนกัน [5] ระบบจดจำเสียงดนตรีใหม่ถูกนำเสนอในเอกสารนี้ เป้าหมายหลักของเอกสารนี้คือการ ค้นหาคุณลักษณะที่ดีกว่า แต่พัฒนา classifier ดี ทำนายเชิงเส้น (LPC) และสัมประสิทธิ์ cepstral melfrequency (MFCC) ใช้เป็นชุดคุณลักษณะ สัมประสิทธิ์ทั้งสองเป็นที่รู้จัก ง่ายต่อการคำนวณ และรายงานหลายครั้งเป็นการตั้งค่าคุณลักษณะที่ดีกว่าคนอื่น ๆ [2, 6, 7] Classifier ที่ใช้ในการทำงานนี้เป็นการเรียนรู้งาน probabilistic โครงข่ายประสาท (PNN) เรียนรู้การใช้งาน เรียนได้เพียงนักการแฝง ผู้เรียนมีความสามารถในการเลือกอินสแตนซ์ใหม่ ซึ่งจำเป็นต้องเพิ่มประสิทธิภาพ generalization ในทำนองเดียวกัน ผู้เรียนสามารถปฏิเสธกรณีซ้ำซ้อนจากชุดฝึกอบรม [8] โดยการรวมความสามารถใหม่นี้สอง เรียนงานสามารถเก็บชุดฝึกอบรมดีซึ่งจะแสดงพื้นที่ทั้งหมดอย่างดีด้วย

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

การยอมรับเครื่องดนตรีอัตโนมัติเป็นส่วนสําคัญของงานหลายอย่าง เช่น การถอดความเพลงอัตโนมัติ , การดึงและเสียงสอบถามฐานข้อมูล . การรับรู้ของมนุษย์ที่เกี่ยวข้องโดยได้รับการศึกษาอย่างกว้างขวางในช่วง 5 ทศวรรษที่ผ่านมา แต่ได้มีงานเล็ก ๆน้อย ๆในการเรียบเรียงดนตรีที่สุดของผลงานล่าสุดได้เน้นการพูด หรือปัญหาการรู้จำผู้พูด การรู้จำเสียงอัตโนมัติ มี 2 งาน งานแรกคือการพบกลุ่มของลักษณะที่เป็นเสียงทั้งหมด ด้วยจำนวนเงินขั้นต่ำของพารามิเตอร์ตัวที่สอง คือ การออกแบบตัวที่จำเสียง โดยการใช้คุณสมบัติเหล่านี้ เป็นที่ชัดเจนว่าประสิทธิภาพสูงที่เกี่ยวข้องกับข้อมูลโดยนำคุณลักษณะชุด ดังนั้น มากมาย ผลงานล่าสุดที่มุ่งเน้นที่จะหาที่ดีกว่าคุณลักษณะชุด บนมืออื่น ๆ , ลักษณนามว่า ส่วนหนึ่งของปัญหายังไม่ได้รับความสนใจมากเท่าที่วิจัยเป็นชุดคุณลักษณะ สีน้ำตาล [ 1 ] มีรายงานว่าระบบที่สามารถจำสี่เครื่องเป่าลมไม้ที่มีประสิทธิภาพเทียบเท่ากับ ความสามารถของมนุษย์eronen [ 2 ] จัด 30 เครื่องมือต่าง ๆที่มีความถูกต้อง ร้อยละ 32 โดย ใช้ค่าเป็นคุณลักษณะ eronen ใช้ส่วนผสมของ k-nn และ GMM / hmms ใน recognizer ลำดับชั้น . ใน [ 3 ] eronen รายงานประสิทธิภาพ 68 % 27 เครื่องมือ และ fujinaga Macmillan [ 4 ] จัด 23 เครื่องมือที่มีความแม่นยำ 63 % โดยใช้เจเนติกอัลกอริทึม ระบบของมาร์ติน จำชุดกว้างของเครื่องมือแม้ว่าจะไม่ได้ปฏิบัติ ตลอดจนวิชามนุษย์ในที่คล้ายกันงาน [ 5 ] ในกระดาษนี้ ระบบเสียงดนตรีใหม่ซึ่งถูกเสนอ เป้าหมายหลักของบทความนี้คือไม่พบคุณสมบัติที่ดีกว่า แต่พัฒนาขึ้นลักษณนาม การทำนายเชิงเส้น ( LPC ) และค่าสัมประสิทธิ์ melfrequency สัญญาณเซปส์ตรัม ( ค่า ) จะถูกใช้เป็นชุดคุณลักษณะ 2 ) ที่รู้จักกันดีง่ายต่อการคำนวณและรายงานหลายครั้ง เช่น ดีกว่าชุดคุณลักษณะมากกว่าผู้อื่น [ 2 , 6 , 7 ] ลักษณนามที่ใช้ในงานนี้ คือ การเรียนรู้การใช้โครงข่ายประสาทเทียม ( pnn ) ในกิจกรรมการเรียนรู้ที่ผู้เรียนไม่ได้เป็นเพียงเรื่อยๆผู้สังเกตการณ์ ผู้เรียนมีความสามารถในการเลือกอินสแตนซ์ใหม่ ซึ่งจำเป็นในการเพิ่มประสิทธิภาพการ . ในทํานองเดียวกันผู้เรียนสามารถปฏิเสธกรณีซ้ำซ้อนจากชุดฝึกอบรม [ 8 ] โดยการรวมสองใหม่ความสามารถและใฝ่รู้สามารถเก็บดีกว่า ชุดฝึก ซึ่งเป็นตัวแทนของพื้นที่ตัวอย่างทั้งหมดดี

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.